Resolução de correferência em múltiplos documentos utilizando aprendizado não supervisionado

Silva, Jefferson Fontinele da

doi:10.11606/D.55.2011.tde-19072011-144521

Inicío

Serviços

Trabalhos decorrentes

Como citar

Formato MARC

Formato OAI DC

Dissertação de Mestrado

DOI

https://doi.org/10.11606/D.55.2011.tde-19072011-144521

Documento

Dissertação de Mestrado

Autor

Silva, Jefferson Fontinele da (Catálogo USP)

Nome completo

Jefferson Fontinele da Silva

E-mail

Unidade da USP

Instituto de Ciências Matemáticas e de Computação

Área do Conhecimento

Ciências de Computação e Matemática Computacional

Data de Defesa

2011-05-05

Imprenta

São Carlos, 2011

Orientador

Rosa, João Luis Garcia (Catálogo USP)

Banca examinadora

Rosa, João Luis Garcia (Presidente)
Paraboni, Ivandre
Rino, Lucia Helena Machado

Título em português

Resolução de correferência em múltiplos documentos utilizando aprendizado não supervisionado

Palavras-chave em português

Aprendizado não supervisionado
Correferência
Múltiplos documentos
Processamento de línguas naturais

Resumo em português

Um dos problemas encontrados em sistemas de Processamento de Línguas Naturais (PLN) é a dificuldade de se identificar que elementos textuais referem-se à mesma entidade. Esse fenômeno, no qual o conjunto de elementos textuais remete a uma mesma entidade, é denominado de correferência. Sistemas de resolução de correferência podem melhorar o desempenho de diversas aplicações do PLN, como: sumarização, extração de informação, sistemas de perguntas e respostas. Recentemente, pesquisas em PLN têm explorado a possibilidade de identificar os elementos correferentes em múltiplos documentos. Neste contexto, este trabalho tem como foco o desenvolvimento de um método aprendizado não supervisionado para resolução de correferência em múltiplos documentos, utilizando como língua-alvo o português. Não se conhece, até o momento, nenhum sistema com essa finalidade para o português. Os resultados dos experimentos feitos com o sistema sugerem que o método desenvolvido é superior a métodos baseados em concordância de cadeias de caracteres

Título em inglês

Co-reference resolution in multiples documents through unsupervised learning

Palavras-chave em inglês

Coreference
Multiple documents
Natural language processing
Unsupervised learning

Resumo em inglês

One of the problems found in Natural Language Processing (NLP) systems is the difficulty of identifying textual elements that refer to the same entity. This phenomenon, in which the set of textual elements refers to a single entity, is called coreference. Coreference resolution systems can improve the performance of various NLP applications, such as automatic summarization, information extraction systems, question answering systems. Recently, research in NLP has explored the possibility of identifying the coreferent elements in multiple documents. In this context, this work focuses on the development of an unsupervised method for coreference resolution in multiple documents, using Portuguese as the target language. Until now, it is not known any system for this purpose for the Portuguese. The results of the experiments with the system suggest that the developed method is superior to methods based on string matching

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

final2.pdf (898.42 Kbytes)

Data de Publicação

2011-07-19

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.