• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.59.2021.tde-18102021-210029
Documento
Autor
Nombre completo
Paulo Berlanga Neto
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
Ribeirão Preto, 2021
Director
Tribunal
Ruiz, Evandro Eduardo Seron (Presidente)
Almeida, Tiago Agostinho de
Paraboni, Ivandre
Título en portugués
Simplificação automática de sentenças com ênfase no método split-and-rephrase
Palabras clave en portugués
Processamento de linguagem natural
Simplificação de sentenças
Split-and-rephrase
Resumen en portugués
Simplificação de texto (ST) é um processo de transformação da linguagem natural para redução de sua complexidade e aumento de sua compreensão. No cerne deste problema, está a necessidade de uma preservação semântica adequada em conjunto com a melhoria da inteligibilidade. No campo de processamento de linguagem natural, abordagens recentes para a tarefa de simplificação automática de textos têm visto este processo de maneira holística ou abrangente. Muitas das ideias aplicadas são emprestadas pela tarefa de tradução automática, considerando que a simplificação pode ser vista como uma ação de tradução monolíngue entre um texto complexo e simples. Ao ponderar ainda que textos considerados complexos podem conter uma parcela de sentenças simples em sua composição, estudos recentes têm endereçado aspectos específicos da linguagem no âmbito de sentenças. Nesta pesquisa, visitamos a tarefa de simplificação automática de sentenças, apresentando características de abordagens recentes e propondo a construção de um pipeline computacional próprio para o aprendizado artificial do método split-and-rephrase. Este método busca particionar uma sentença singular de entrada em duas ou mais sentenças reescritas de saída que juntas mantêm o significado equivalente, com a concepção de que sentenças mais curtas beneficiam a compreensão na leitura humana e aprimoram o desempenho de tarefas relacionadas em processamento de linguagem natural.
Título en inglés
Sentence simplification with emphasis on split-and-rephrase method
Palabras clave en inglés
Natural language processing
Sentence simplification
Split-and-rephrase
Resumen en inglés
Text Simplification (TS) is transforming natural language to reduce its complexity and improve its comprehension. At the heart of this problem is the need for adequate semantic preservation together with improved readability. In natural language processing, recent approaches to the automatic text simplification task have seen this process holistically. Many of the ideas applied are borrowed from the machine translation (MT) task since simplification can be considered a monolingual translation between complex and simple texts. Given that texts considered complex may contain a portion of simple sentences in their composition, recent studies have considered specific aspects of the language at the sentence level. In this research, we visited the sentence simplification task, presenting characteristics of recent approaches and proposing the construction of a computational pipeline to address the split-and-rephrase method. This method seeks to split one single input sentence into two or more output sentences that retain equivalent meaning, conceptualizing the notion that shorter sentences benefit human reading comprehension and improve the performance of natural language processing-related tasks.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2021-11-12
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.