Resolução de correferência em múltiplos documentos utilizando aprendizado não supervisionado

Silva, Jefferson Fontinele da

doi:10.11606/D.55.2011.tde-19072011-144521

Accueil

Services

Mémoire de Maîtrise

DOI

https://doi.org/10.11606/D.55.2011.tde-19072011-144521

Document

Mémoire de Maîtrise

Auteur

Silva, Jefferson Fontinele da (Catálogo USP)

Nom complet

Jefferson Fontinele da Silva

Adresse Mail

Unité de l'USP

Instituto de Ciências Matemáticas e de Computação

Domain de Connaissance

Informatique et Mathématique Computationnelle

Date de Soutenance

2011-05-05

Editeur

São Carlos, 2011

Directeur

Rosa, João Luis Garcia (Catálogo USP)

Jury

Rosa, João Luis Garcia (Président)
Paraboni, Ivandre
Rino, Lucia Helena Machado

Titre en portugais

Resolução de correferência em múltiplos documentos utilizando aprendizado não supervisionado

Mots-clés en portugais

Aprendizado não supervisionado
Correferência
Múltiplos documentos
Processamento de línguas naturais

Resumé en portugais

Um dos problemas encontrados em sistemas de Processamento de Línguas Naturais (PLN) é a dificuldade de se identificar que elementos textuais referem-se à mesma entidade. Esse fenômeno, no qual o conjunto de elementos textuais remete a uma mesma entidade, é denominado de correferência. Sistemas de resolução de correferência podem melhorar o desempenho de diversas aplicações do PLN, como: sumarização, extração de informação, sistemas de perguntas e respostas. Recentemente, pesquisas em PLN têm explorado a possibilidade de identificar os elementos correferentes em múltiplos documentos. Neste contexto, este trabalho tem como foco o desenvolvimento de um método aprendizado não supervisionado para resolução de correferência em múltiplos documentos, utilizando como língua-alvo o português. Não se conhece, até o momento, nenhum sistema com essa finalidade para o português. Os resultados dos experimentos feitos com o sistema sugerem que o método desenvolvido é superior a métodos baseados em concordância de cadeias de caracteres

Titre en anglais

Co-reference resolution in multiples documents through unsupervised learning

Mots-clés en anglais

Coreference
Multiple documents
Natural language processing
Unsupervised learning

Resumé en anglais

One of the problems found in Natural Language Processing (NLP) systems is the difficulty of identifying textual elements that refer to the same entity. This phenomenon, in which the set of textual elements refers to a single entity, is called coreference. Coreference resolution systems can improve the performance of various NLP applications, such as automatic summarization, information extraction systems, question answering systems. Recently, research in NLP has explored the possibility of identifying the coreferent elements in multiple documents. In this context, this work focuses on the development of an unsupervised method for coreference resolution in multiple documents, using Portuguese as the target language. Until now, it is not known any system for this purpose for the Portuguese. The results of the experiments with the system suggest that the developed method is superior to methods based on string matching

AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.

final2.pdf (898.42 Kbytes)

Date de Publication

2011-07-19

Œvres dérivées

AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.