• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.100.2020.tde-06022020-120251
Documento
Autor
Nome completo
José Eleandro Custódio
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2020
Orientador
Banca examinadora
Paraboni, Ivandre (Presidente)
Fernandez Tuesta, Esteban
Rezende, Solange Oliveira
Título em português
Atribuição autoral de textos digitais
Palavras-chave em português
Part-of-speech. POS
Word embedding
Aprendizado de máquina
Atribuição autoral
Distorções textuais
Identificação autoral
PLN
Processamento de língua natural
Resumo em português
A atribuição autoral de textos digitais (AA) visa identificar quem é o autor de um determinado texto a partir de um conjunto de autores possíveis. Sua aplicação pode ajudar na solução de casos de escândalos de corrupção, na identificação de abusos na utilização da internet, na detecção de notícias falsas, na detecção de pseudônimos e outros. Esse trabalho apresenta um estudo que usou n-gramas de caracteres, de palavras, de anotações linguísticas (POS), modelos de representação distribuída (embeddings). Foram aplicados métodos de aprendizado de máquina e proposto um método para combinar diversos modelos. Os resultados foram avaliados nos domínios literatura, letras de músicas e mensagens de microblogs
Título em inglês
Authorship Attribution of digital texts
Palavras-chave em inglês
Author identification
Authorship attribuition
Embedding
Machine learning
Natural language processing
NLP
Part-of-speech. POS
Text distortion
Resumo em inglês
Authorship attribution (AA) of digital text is a computational task which aims to identify who is the author of a text given a set of candidate authors. Its application may help to solve corruption scandals, identification of abuses on internet usage, fake news detection or pseudonyms detection. Computational methods for AA includes multivariate statistics and machine learning. This work presents a study that used n-grams of characters, words, linguistic annotations (POS) and word embeddings models. Machine learning methods were applied and it was proposed a method to combine several models. Results were evaluated in literature, song lyrics and microblogging domains
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2020-03-24
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2021. Todos os direitos reservados.