Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante

Silva, Túlio Ferreira Leite da

doi:10.11606/D.8.2021.tde-18052021-175948

Inicío

Serviços

Trabalhos decorrentes

Como citar

Formato MARC

Formato OAI DC

Dissertação de Mestrado

DOI

https://doi.org/10.11606/D.8.2021.tde-18052021-175948

Documento

Dissertação de Mestrado

Autor

Silva, Túlio Ferreira Leite da (Catálogo USP)

Nome completo

Túlio Ferreira Leite da Silva

E-mail

Unidade da USP

Faculdade de Filosofia, Letras e Ciências Humanas

Área do Conhecimento

Semiótica e Lingüística Geral

Data de Defesa

2021-03-11

Imprenta

São Paulo, 2021

Orientador

Beividas, Waldir (Catálogo USP)

Banca examinadora

Beividas, Waldir (Presidente)
Albuquerque, Felipe Iszlaji de
Matte, Ana Cristina Fricke
Souza, Luiz Sergio de

Título em português

Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante

Palavras-chave em português

Análise de Sentimento
Aprendizado de Máquina
Gastronomia
Processamento de Linguagem Natural
Semiótica

Resumo em português

Uma realidade em que internet móvel 5G estará disponível em qualquer lugar do planeta bate à porta. Se a tecnologia anterior (4G) foi diretamente responsável pela possibilidade da revolução causada por Waze, Uber e iFood, ainda não somos capazes de prever o cenário dos próximos anos. A única certeza que temos: haverá muito texto para processar. Nossa contribuição com esta pesquisa, portanto, é a de fornecer atualização a uma proposta dos anos 1980 de utilização da semiótica como ferramenta de representação do conhecimento a ser utilizado por inteligências artificiais no processamento de linguagem natural (PLN). Assim, partimos das contribuições heurísticas fornecidas pela Escola de Paris e de novidades propostas pelo francês Claude Zilberberg, criador da hipótese tensiva. Por meio desse aparato teórico, apresentamos uma análise da estrutura das avaliações de restaurante na plataforma TripAdvisor e propomos um modelo de classificação para colaborar como pré-processamento para a análise de sentimentos. A partir de um corpus manualmente anotado com essa nova proposta, utilizamos elementos do estado da arte em inteligência artificial para PLN (deep learning) e implementamos um sistema automático de classificação. O modelo, desenvolvido para fazer as vezes de prova de conceito, alcança mais de 90% de acurácia. Entretanto, não são poucas as evidências de que esteja havendo sobreajuste (overfitting). Novas pesquisas estão em andamento para sanar este ponto, ainda assim, todo o aparato teórico não é afetado pelos problemas técnicos. Mais do que isso, ainda debatemos neste trabalho formas de vencer tais dificuldades por meio da classificação de mais corpus.

Título em inglês

Semiotic intelligence and TripAdvisor: deep learning and subjective quantifications in the discourse analysis of restaurants sanctions

Palavras-chave em inglês

Gastronomy
Machine Learning
Natural Language Processing
Semiotics
Sentiment Analysis

Resumo em inglês

Worldwide availability of 5G mobile internet is fast becoming a reality. If the previous technology (4G) was directly responsible for enabling the revolution of Waze, Uber and iFood, we still can't predict the next few years. The only certainty we have is that there'll be a whole lot of text to process. Our contribution with this research, therefore, is to update the 1980's proposal of using semiotics as a tool of knowledge representation to aid artificial intelligence in natural language processing (NLP). Thus, we start with the heuristical contributions provided by the School of Paris, and the new proposals from Claude Zilberberg, creator of the tensive hypothesis. By means of this theoretical apparatus, we present a structural analysis of restaurant reviews on the TripAdvisor platform, and we propose a classification model to colaborate with the pre-processing of sentiment analysis. From a corpus manually notated with this new proposal, we use state of the art elements in NLP artificial intelligence (deep learning) to implement an automatic classification system. The model, developed to stand as a proof of concept, reaches over 90% accuracy. However, there is no shortage of evidence of overfitting, which new ongoing research is working to remedy. Still, the theoretical apparatus remains unaffected by these technical issues. Beyond that, we debate in this paper manners of overcoming such difficulties through the classification of more texts.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

2021_TulioFerreiraLeiteDaSilva_VCorr.pdf (10.77 Mbytes)

2021_TulioFerreiraLeiteDaSilva_VSimpl.pdf (11.17 Mbytes)

Data de Publicação

2021-05-18

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.