• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.59.2020.tde-29062020-171001
Document
Author
Full name
Émerson Yoshiaki Okano
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
Ribeirão Preto, 2020
Supervisor
Committee
Ruiz, Evandro Eduardo Seron (President)
Ribeiro, Evandro Marcos Saidel
Vale, Oto Araujo
Title in Portuguese
Análise e caracterização de textos intencionalmente enganosos escritos em português usando métodos de processamento de textos
Keywords in Portuguese
Fake news
Fake reviews
Textos enganosos
Abstract in Portuguese
Atualmente a web é um ambiente em que pessoas postam e buscam informações sobre os mais diversos tópicos. No entanto, nem sempre uma informação encontrada na web é verdadeira já que alguns usuários maliciosos usam a web para disseminar informações falsas com o intuito de manipular ou enganar pessoas. Uma das maneiras de detectar estas informações falsas é através de processamento de textos. Atualmente há trabalhos direcionados à língua inglesa para identificação de textos enganosos, mas poucos trabalhos são voltados para a língua portuguesa. Neste trabalho, inicialmente foi criado um corpus paralelo de reviews de livros enganosos e foi feito um trabalho inicial de classificação automático do mesmo. Foi feito um estudo utilizando as research questions propostas por Hauch et al. para fazer uma análise psicolinguística do corpus de notícias falsas Fake.Br com o intuito de verificar as características mais relevantes para a classificação de fake news. Ainda utilizando o corpus Fake.Br treinamos algoritmos de aprendizagem de máquina supervisionados para fazer a classificação automática de fake news e utilizamos também um algoritmo de deep learning chamado Hierarchical attention network para verificar sua performance na detecção de fake news.
Title in English
Analysis and characterization of intentionally deceptive texts written in Portuguese using text processing methods
Keywords in English
Deceptive texts
Fake news
Fake reviews
Abstract in English
The web is an environment where people post and search any type of information on the most diverse topics. However, the information found on the web is not always truthful. There are malicious users who post deceptive information intending to manipulate or deceive people. One of the ways to detect false information is using text processing. Nowadays there are studies directed to the English language to identify deceptive texts, but there are few related works concerning the Portuguese language. In this work, initially, we created a parallel corpus of deceptive book reviews and used some machine learning algorithms to classify deceptive and truthful reviews. A study was made using the research questions proposed by Hauch et al. to do a psycholinguistic analysis of the fake news corpus Fake.Br to verify the most relevant features for fake news classification. Still using the Fake.Br corpus we trained supervised machine learning algorithms to automatically classify fake news and we also use a deep learning algorithm called Hierarchical attention network to verify its performance in fake news detection.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-07-14
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2020. All rights reserved.