• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tesis de Habilitación
DOI
https://doi.org/10.11606/T.100.2019.tde-27092018-151520
Documento
Autor
Nombre completo
Ivandre Paraboni
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2018
Tribunal
Peres, Sarajane Marques (Presidente)
Batista, Gustavo Enrique de Almeida Prado Alves
Digiampietri, Luciano Antonio
Pedrini, Hélio
Rosa, João Luis Garcia
Título en portugués
Em busca do plausível: desafios e contribuições da Geração Automática de Língua Natural
Palabras clave en portugués
Geração de língua natural, Seleção de conteúdo, Realização superficial,
Resumen en portugués
Sistemas de Geração de Língua Natural (GLN) - que tipicamente produzem descrições textuais a partir de uma entrada de dados não linguística - são empregados quando o uso de texto predefinido não é suficiente, ou seja, quando é necessária uma maior variação linguística ou estilística nos documentos gerados e/ou maior proximidade em relação ao desempenho humano. Esta monografia discute a geração de língua natural dita plausível sob duas perspectivas - aqui denominadas a perspectiva do locutor e a do ouvinte - através de uma série de exemplos de estudos que trataram de problemas computacionais como o de seleção de conteúdo, realização superficial e outras, e destacando seus desafios e suas contribuições científicas. Inicialmente, a discussão é baseada em exemplos de estudos que seguem uma definição mais convencional (ou talvez mais intuitiva) de plausibilidade baseada na perspectiva do locutor. A seguir, é destacado que estudos deste tipo tendem a apresentar necessidade constante de novos conjuntos de dados para que novas questões de pesquisa possam ser investigadas. Como alternativa a esta abordagem, são então apresentados exemplos de estudos que consideram a perspectiva do ouvinte, os quais apresentam grande potencial de reúso e, em certos casos, contribuições de outra forma difíceis de obter com base puramente em estudos baseados na perspectiva do locutor. Finalmente, a discussão sobre a plausibilidade na tarefa computacional de GLN é ampliada de modo a considerar a questão da variação humana na produção da língua, apresentando exemplos de estudos que consideram tanto modelos de locutores individuais como de grupos de indivíduos e, de modo especial, baseados em personalidade humana. Como resultado deste trabalho, espera-se que novos pesquisadores e estudantes (e.g., de Ciência da Computação e áreas relacionadas) sintam-se motivados a abordar o problema computacional de GLN de modo plausível - seja com base na perspectiva do ouvinte, do locutor, ou perfis destes - e a desenvolver suas próprias metodologias, auxiliando assim no crescimento da linha de pesquisa em GLN de modo geral, e de forma mais específica para o caso da geração de texto em português do Brasil.
Título en inglés
Searching for plausibility: challenges and contributions in Automatic Natural Language Generation
Palabras clave en inglés
Natural language generation, Content selection, Surface realisation
Resumen en inglés
Natural Language Generation (NLG) systems - which typically generate text descriptions from non-linguistic input data - are employed when canned text is not sufficient, that is, when greater linguistic or stylistic variation are expected in the output text, or when the application requires closer proximity to human performance. This work addresses the computational problem of plausible NLG based on two perspectives - hereby called the speaker's and the hearer's perspectives - by presenting a number of examples of studies on content selection, surface realisation and other NLG tasks, and by focusing on their research challenges and contributions. The initial discussion is based on examples of studies that follow a rather traditional (or perhaps more intuitive) view on plausibility based on the speaker's perspective. Next, it is argued that in speaker-oriented studies of this kind further research questions will generally require collecting new data. As an alternative to this view, examples of hearer-oriented studies are discussed, which may turn out to be highly reusable and, in some cases, provide contributions that are otherwise difficult to obtain by means of speaker-oriented studies. Finally, the speaker and hearer perspectives are generalised so as to cover the issue of human variation in language production by discussing examples of studies that taken into account models of individual speakers or groups and, in particular, using models of human personality. As a result, this text is expected to help motivate new researchers and students (e.g., in Computer Science and related fields) to address the computational problem of plausible natural language generation - either from a speaker's or hearer's perspective - and to develop their own methodologies, hence contributing to the expansion of the NLG research field in general, and particularly so for the case of the Brazilian Portuguese text generation.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
paraboni_ld.pdf (6.85 Mbytes)
Fecha de Publicación
2019-03-19
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.