• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.59.2020.tde-29062020-171001
Document
Auteur
Nom complet
Émerson Yoshiaki Okano
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
Ribeirão Preto, 2020
Directeur
Jury
Ruiz, Evandro Eduardo Seron (Président)
Ribeiro, Evandro Marcos Saidel
Vale, Oto Araujo
Titre en portugais
Análise e caracterização de textos intencionalmente enganosos escritos em português usando métodos de processamento de textos
Mots-clés en portugais
Fake news
Fake reviews
Textos enganosos
Resumé en portugais
Atualmente a web é um ambiente em que pessoas postam e buscam informações sobre os mais diversos tópicos. No entanto, nem sempre uma informação encontrada na web é verdadeira já que alguns usuários maliciosos usam a web para disseminar informações falsas com o intuito de manipular ou enganar pessoas. Uma das maneiras de detectar estas informações falsas é através de processamento de textos. Atualmente há trabalhos direcionados à língua inglesa para identificação de textos enganosos, mas poucos trabalhos são voltados para a língua portuguesa. Neste trabalho, inicialmente foi criado um corpus paralelo de reviews de livros enganosos e foi feito um trabalho inicial de classificação automático do mesmo. Foi feito um estudo utilizando as research questions propostas por Hauch et al. para fazer uma análise psicolinguística do corpus de notícias falsas Fake.Br com o intuito de verificar as características mais relevantes para a classificação de fake news. Ainda utilizando o corpus Fake.Br treinamos algoritmos de aprendizagem de máquina supervisionados para fazer a classificação automática de fake news e utilizamos também um algoritmo de deep learning chamado Hierarchical attention network para verificar sua performance na detecção de fake news.
Titre en anglais
Analysis and characterization of intentionally deceptive texts written in Portuguese using text processing methods
Mots-clés en anglais
Deceptive texts
Fake news
Fake reviews
Resumé en anglais
The web is an environment where people post and search any type of information on the most diverse topics. However, the information found on the web is not always truthful. There are malicious users who post deceptive information intending to manipulate or deceive people. One of the ways to detect false information is using text processing. Nowadays there are studies directed to the English language to identify deceptive texts, but there are few related works concerning the Portuguese language. In this work, initially, we created a parallel corpus of deceptive book reviews and used some machine learning algorithms to classify deceptive and truthful reviews. A study was made using the research questions proposed by Hauch et al. to do a psycholinguistic analysis of the fake news corpus Fake.Br to verify the most relevant features for fake news classification. Still using the Fake.Br corpus we trained supervised machine learning algorithms to automatically classify fake news and we also use a deep learning algorithm called Hierarchical attention network to verify its performance in fake news detection.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2020-07-14
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.