• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.3.2023.tde-01032024-105105
Documento
Autor
Nombre completo
Marcos Menon José
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2023
Director
Tribunal
Cozman, Fabio Gagliardi (Presidente)
Barros, Leliane Nunes de
Carvalho, Aline Marins Paes
Título en portugués
Um sistema de perguntas e respostas com aprendizado por reforço profundo para perguntas complexas utilizando textos e tabelas.
Palabras clave en portugués
Aprendizado por reforço
Inteligência artificial
Redes neurais
Resumen en portugués
A geração de respostas a questões é um dos principais tópicos atuais em processamento de linguagem natural, podendo ser utilizado em diversas aplicações distintas. Este projeto propõe uma arquitetura original para resolver questões de domínio aberto e multi-hop entre textos e tabelas, utilizando o conjunto de dados OTT-QA para validação e treinamento. Para responder tais questões, é necessário buscar informações em um grande corpus percorrendo vários trechos e tabelas, pois a resposta não pode ser encontrada diretamente; é preciso raciocinar usando diferentes passagens. Uma das soluções mais comuns é recuperar as informações de forma sequencial, onde um texto encontrado ajuda na busca do próximo. Como diferentes modelos podem ter diferentes funções nessa busca iterativa de informações, um desafio é como coordená-los, visto que não há dados rotulados do caminho a ser seguido. Portanto, optou-se por utilizar um modelo treinado por meio de aprendizado por reforço para escolher entre diferentes ferramentas de última geração de forma sequencial até que, ao final, opte por chamar um bloco responsável pela geração da resposta. A nossa arquitetura atingiu F1-score de 19,03, um valor compatível com sistemas iterativos semelhantes da literatura.
Título en inglés
A deep reinforcement learning question answering system for complex questions using texts and tables.
Palabras clave en inglés
Artificial intelligence
Multi-hop
Question answering
Reinforcement learning
Transformer neural networks
Resumen en inglés
Question Answering is one of the main current topics in natural language processing, as it can be used in many different applications. This project proposes an original architecture to solve open domain and multi-hop questions between texts and tables, using the OTT-QA dataset for validation and training. To answer such questions, it is necessary to search for information in a large corpus by going through several excerpts and tables, as the answer may not be found directly; it is necessary to reason over multiple passages. One of the most common solutions is retrieving information sequentially, where a selected text helps search for the next. As different models can have different functions in this iterative information search, a challenge is how to coordinate them, given that there is no labeled data of the path to be followed. Our architecture uses a model trained through reinforcement learning to choose between different state-of-the-art tools sequentially until, in the end, a block is selected as responsible for generating the answer. Our system achieved an F1-score of 19.03, a value compatible with similar iterative systems in the literature.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2024-03-07
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.