• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.59.2019.tde-16082019-215233
Documento
Autor
Nome completo
George Narita Vilarinho
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
Ribeirão Preto, 2019
Orientador
Banca examinadora
Ruiz, Evandro Eduardo Seron (Presidente)
Coelho, Livy Maria Real
Liang, Zhao
Pardo, Thiago Alexandre Salgueiro
Título em português
SentiElection: análise de sentimento no twitter baseada em centralidade de palavras
Palavras-chave em português
Análise de sentimento no Twitter
Classicação binária
Grafo de palavras
Medidas de centralidade
Resumo em português
As redes sociais,a exemplo doTwitter,são um fenômeno que atraíram rapidamente milhões de usuários ativos. O uso destas redes permite que diariamente sejam trocadas milhões de postagens referentes a uma innidade de tópicos. Toda esta pletora de textos tem motivado várias pesquisas na área de Processamento de Língua Natural, principalmente no tópico de análise de sentimento (AS) que busca extrair, analisar e quanticar a opinião do usuário sobre um determinado assunto. Devido ao alto custo envolvido no processo de extração e análise manual desses dados, diversos estudos têm focado na busca de soluções para a automatização dessa tarefa. Esta pesquisa propõe uma nova metodologia de AS sobre tweets baseada na Teoria de Grafos chamada SentiElection. Nossa hipótese é que textos positivos e textos negativos guardam, entre si, semelhanças no encadeamento de palavras. Calculamos essa importância através do uso de medidas de centralidade de vértices em grafos de palavras, sendo assim, a classe a qual determinado texto obtiver o maior valor de importância corresponderá a seu sentimento. O SentiElection é uma medida composta pelas medidas de centralidade de autovetor, Katz e PageRank. Em nossos experimentos o SentiElection apresentou resultados competitivos em relação a métodos tradicionais de AS, atingindo valores de acurácia e medida-F superiores a 70%. Além disso, nesses mesmos experimentos, o método aqui proposto obteve desempenho superior à técnica que o inspirou, a qual também faz uso de similaridade de grafos para a classicação de sentimentos
Título em inglês
SentiElection: twitter sentiment analysis based on word's centrality
Palavras-chave em inglês
Binary classication
Centrality measures
Twitter sentiment analysis
Word graphs
Resumo em inglês
Social networks, like Twitter, are a phenomenon that has quickly attracted millions of active users. The use of these social networks allows millions of posts to be exchanged daily on a multitude of topics. This plethora of texts has motivated several research topics in the area of Natural Language Processing, mainly in the topic of sentiment analysis (SA). SA seeks to extract, analyze, and quantify the users opinion on a particular subject. Due to the high cost involved in the manual extraction and analysis of social network data, several studies have focused on nding solutions to automate this task. This research proposes a new SA methodology over tweets based on Graph Theory analysis called SentiElection. We hypothesize that positive and negative tweet texts are similar in their own class if these messages are compared based on the sequence of words in a sentence. Vertex centrality measures are applied to word graphs to measure how an incoming tweets relates either to a positive set of tweets or to a negative one. SentiElection is a compilation of centrality measures, such as, eigenvector, Katz similarity and PageRank. In our experiments, the SentiElection presented competitive results compared to traditional SA methods, reaching accuracy and F-measurement values higher than 70%. Moreover, in these same experiments, the method proposed here obtained superior performance to the technique that inspired it, which makes use of graph similarity for sentiment classication
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2019-10-29
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.