• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.55.2023.tde-16012024-151720
Document
Author
Full name
Mateus Tarcinalli Machado
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2023
Supervisor
Committee
Pardo, Thiago Alexandre Salgueiro (President)
Caseli, Helena de Medeiros
Freitas, Larissa Astrogildo de
Nunes, Maria das Graças Volpe
Title in English
Methods for identifying aspects in opinion texts in Portuguese: the case of implicit aspects and their typological analysis
Keywords in English
Explicit aspects
Identification of aspects
Implicit aspects
Opinion mining
Abstract in English
This work has as object of study the methods for identifying aspects, which are applications derived from the aspect-based sentiment analysis, and the area of natural language processing. The aspect-based sentiment analysis is focused on analyzing opinionated texts (texts containing opinions) seeking to identify and relate feelings and aspects (characteristics) of a given entity (products, services, among others). This work is focused on the first stage, which is the identification of aspects, emphasizing the so-called implicit aspects, that is, those that are not explicitly mentioned in the texts. In the course of this work, we implemented, adapted, and improved several aspect extraction methods, including frequency-based, rule-based, hybrid, machine learning, pre-trained language models, and large language models. We also developed novel resources such as a corpus extension with annotation of implicit aspects, lexicons of nominal forms, and a typology of implicit aspects. The latter allowed a better understanding of the knowledge necessary to relate an implicit aspect clue with an aspect and its use allowed a clear view of the strengths and weaknesses of each implemented method in relation to the detection of implicit aspects.
Title in Portuguese
Métodos de identificação de aspectos em textos de opinião em português: o caso dos aspectos implícitos e sua análise tipológica
Keywords in Portuguese
Aspectos explícitos
Aspectos implícitos
Identificação de aspectos
Mineração de opinião
Abstract in Portuguese
Este trabalho tem como objeto de estudo os métodos para identificação de aspectos, que são aplicações derivadas da análise de sentimentos baseada em aspectos e da área de processamento de linguagem natural. A análise de sentimentos baseada em aspectos é focada em analisar textos avaliativos (textos contendo opiniões) buscando identificar e relacionar sentimentos e aspectos (características) de uma determinada entidade (produtos, serviços entre outros). Este trabalho está focado na primeira etapa, identificação de aspectos, dando ênfase aos chamados aspectos implícitos, ou seja, aqueles que não são mencionados explicitamente nos textos. No decorrer desse trabalho implementamos, adaptamos e melhoramos vários métodos de extração de aspectos, entres eles métodos baseados em frequências, baseados em regras, híbridos, aprendizado de máquina, modelos de linguagem pré-treinados e grandes modelos de linguagem. Também desenvolvemos novos recursos como uma extensão de corpus com anotação de aspectos implícitos, léxicos de formas nominais e uma tipologia de aspectos implícitos. Esta última permitiu um melhor entendimento dos conhecimentos necessários para relacionar uma pista de aspecto implícito com um aspecto e seu uso possibilitou uma visão clara dos pontos fortes e fracos de cada método implementado com relação à detecção de aspectos implícitos.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2024-01-16
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.