Técnicas de classificação textual utilizando grafos

Silva, Allef Páblo Araújo da

doi:10.11606/D.59.2019.tde-13052019-153557

Inicío

Serviços

Trabalhos decorrentes

Como citar

Formato MARC

Formato OAI DC

Dissertação de Mestrado

DOI

https://doi.org/10.11606/D.59.2019.tde-13052019-153557

Documento

Dissertação de Mestrado

Autor

Silva, Allef Páblo Araújo da (Catálogo USP)

Nome completo

Allef Páblo Araújo da Silva

E-mail

Unidade da USP

Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto

Área do Conhecimento

Computação Aplicada

Data de Defesa

2019-03-15

Imprenta

Ribeirão Preto, 2019

Orientador

Martinez, Alexandre Souto (Catálogo USP)

Banca examinadora

Ruiz, Evandro Eduardo Seron (Presidente)
Bruno, Odemir Martinez
Comin, César Henrique
Ribeiro, Evandro Marcos Saidel

Título em português

Técnicas de classificação textual utilizando grafos

Palavras-chave em português

Classificação textual
Grafos
Redes complexas

Resumo em português

O grande volume de informação textual sendo gerado a todo momento torna necessário o aprimoramento constante de sistemas capazes de classificar textos em categorias específicas. Essa categorização visa, por exemplo, separar notícias indexadas por mecanismos de buscas, identificar a autoria de livros e cartas antigas ou detectar plágio em artigos científicos. As técnicas de classificação textual existentes, baseadas em conteúdo, apesar de conseguirem uma boa performance quantitativamente, ainda apresentam dificuldades em lidar com aspectos semânticos presentes nos textos escritos em língua natural. Neste sentido, abordagens alternativas vem sendo propostas, como as baseadas em redes complexas, que levam em consideração apenas o relacionamento entre as palavras. Neste estudo, aplicamos a modelagem de textos como redes complexas e utilizamos as métricas extraídas como atributos para classificação, utilizando um problema de reconhecimento de autoria para ilustrar a aplicação das técnicas descritas ao longo deste texto

Título em inglês

Text classification techniques using graphs

Palavras-chave em inglês

Complex networks
Graphs
Text categorization

Resumo em inglês

The large volume of textual information being generated at all times makes it necessary to constantly improve systems capable of classifying texts into specific categories. This categorization aims, for example, to separate news items indexed by search engines, identify authorship of old books and letters, or detect plagiarism in scientific articles. Existing textual classification techniques, based on content, despite achieving good quantitative performance, still present difficulties in dealing with semantic aspects present in texts written in natural language. In this sense, alternative approaches have been proposed, such as those based on complex networks, which take into account only the relationship between words. In this study, we applied text modeling as graphs and extracted metrics typically used in the study of complex networks to be used as classifier attributes. To illustrate these techniques, a problem of authorship recognition in small texts was chosen as an example

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

corrigida.pdf (1.89 Mbytes)

Data de Publicação

2019-07-01

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.