• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.100.2022.tde-07122022-220517
Document
Author
Full name
Guilherme Ramos Casimiro
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2022
Supervisor
Committee
Digiampietri, Luciano Antonio (President)
Horita, Flavio Eduardo Aoki
Ribeiro, Marcio Moretto
Title in Portuguese
Atribuição de autoria em dados temporais utilizando a rede social Reddit
Keywords in Portuguese
Análise de autoria
Dados Temporais
Mineração de texto
Redes sociais online
Abstract in Portuguese
A praticidade trazida pelo uso dos smartphones resultou, nos últimos anos, em uma maior interação através das redes sociais online. As redes sociais podem influenciar tanto positivamente quanto negativamente os usuários, sendo um dos impactos negativos a propagação de notícias falsas. Neste contexto, identificar a correta fonte de uma informação ou se a informação é verídica se tornam atividades extremamente relevantes. Desde 2009 o número de trabalhos envolvendo redes sociais online e análise de autoria tem aumentado. O presente projeto tem como objetivo utilizar os comentários da rede social Reddit, em conjunto com dados da data dos comentários, para propor uma abordagem de identificação do correto autor de um comentário ao se utilizar a rede neural LSTM para tratar a questão do aprendizado ao longo do tempo. Um estudo de caso foi realizado e publicado como artigo completo no SBSI 2020, contendo os resultados iniciais do projeto, os quais exploram diferentes técnicas de mineração de texto. Além disso, os resultados finais deste trabalho foram publicados como artigo completo no SBSI 2022, usando uma distribuição de dados próxima à realidade e obtendo, para 10 autores, uma acurácia na classificação entre 97% e 99,6% para todas as características e entre 100 autores todas as características atingiram mais de 70% de acurácia.
Title in English
Authorship Attribution on temporal data using Reddit social media
Keywords in English
Authorship analysis
Online social media
Temporal data
Text mining
Abstract in English
The practicality brought by the use of smartphones has resulted, in recent years, in greater interaction through online social networks. Social networks can influence users both positively and negatively, one of the negative impacts is the spread of fake news. In this context, identifying the correct source of information or whether the information is true becomes extremely relevant activities. Since 2009, the number of works involving online social networks and analysis of authorship has increased. This project aims to use the comments from the Reddit social network, together with date time data from the comments, to present a model that identifies the correct author of a comment using the neural network LSTM to address the learning over time. A case study was carried out and published as a full paper at SBSI 2020, containing the initial results of the project, which explored text mining techniques. Furthermore, the final results from this project was also published as a full paper at SBSI 2022, using a data distribution more close to reality, achieving among 10 authors more than 97% of accuracy with chars feature having more than 99.6% of accuracy, among 100 authors all features achieved more than 70% of accuracy.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2023-03-13
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.