• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.55.2020.tde-04022020-154902
Document
Author
Full name
Raphael Rocha da Silva
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2019
Supervisor
Committee
Pardo, Thiago Alexandre Salgueiro (President)
Munari Junior, Pedro Augusto
Nunes, Maria das Graças Volpe
Ruiz, Evandro Eduardo Seron
Title in Portuguese
Sumarização contrastiva de opinião
Keywords in Portuguese
Processamento de linguagem natural
Sumarização Contrastiva de opinião
Abstract in Portuguese
Esta dissertação apresenta métodos que permitem comparar entidades por meio da geração de um resumo que realce diferenças entre elas a partir do processamento automático de textos opinativos. Métodos de sumarização contrastiva de opinião foram descritos e avaliados. Três métodos foram trazidos da literatura e um método foi criado. Os métodos foram testados em textos opinativos pré-anotados sobre eletrônicos de uso pessoal extraídos da Web. Embora existam alguns métodos publicados anteriormente, não houve um estudo que os compare: os métodos foram testados em conjuntos de dados diferentes e avaliados com métricas diferentes. Partindo da hipótese que os métodos gerarão sumários com características diferentes para um mesmo conjunto de dados, este trabalho busca suprir essa lacuna montando um conjunto de dados diversificado e definindo métricas padronizadas para testar características desejáveis dos sumários gerados por cada método. A importância da sumarização automática se dá porque ela permite o desenvolvimento de ferramentas que ajudam usuários a absorver melhor as informações de um conjunto de texto, especialmente se esse conjunto for muito grande, como ocorre com dados coletados em massa da Internet. A sumarização contrastiva de opinião toca uma parte mais específica do problema: o caso em que um usuário deseja comparar duas entidades a partir de um grande volume de textos opinativos. Esta pesquisa permite identificar quanto os resumos gerados por diferentes métodos são úteis para os usuários; conjectura-se que eles são mais eficazes do que resumos de opinião simples na tarefa de ajudar as pessoas a entender diferenças entre duas entidades. Isso pode ser benéfico para uma pessoa que quer comprar um produto e está em dúvida entre duas marcas ou dois modelos. Também pode ser útil para um fabricante entender como seus produtos se posicionam segundo a opinião popular em relação a seus concorrentes. Espera-se que esta pesquisa traga contribuições tanto no âmbito acadêmico quanto no contexto prático. Do ponto de vista prático, ela tem o potencial de permitir o desenvolvimento de ferramentas as quais empresas e usuários demandam. Na academia, ela se unirá às iniciativas recentes de pesquisa em Processamento de Linguagem Natural e Mineração de Opinião que têm ganhado destaque no Brasil, dando continuidade a seus trabalhos e somando a elas ideias novas que poderão ser futuramente utilizadas por outros pesquisadores.
Title in English
Contrastive Opinion Summarization
Keywords in English
Contrastive opinion Summarization
Natural language processing
Abstract in English
This theses presents automatic techniques for comparing opinions by generating summaries that highlight differences and similarities between two entities given a set of opinionated text. We describe and evaluate different methods for comparative opinion summarization. Three methods are brought from previous work and one is created. The input for tests consists of reviews about consumer electronic products written in Portuguese and extracted from the Web. Although there are some previously published methods, there was no study comparing them: the methods were tested on different datasets and evaluated with different metrics. Assuming that the methods will generate summaries with different characteristics for the same dataset, this paper fills this gap by building a diverse dataset and defining standardized metrics to test desirable characteristics of summaries generated by each method. Automatic summarization is important because it allows the development of tools that help users to better absorb information from a set of texts. This is especially useful if the set is too large, such as batch data collected from the Internet. Comparative opinion summarization reaches a more specific part of the problem: the case where a user wants to compare two entities based on a large volume of text that contains other peoples opinions. This research leads to a survey on how useful summaries generated by different methods are. We hypothesize that they are more effective than single-entity opinion summaries to help people understand differences between two entities. This can be beneficial for a person who wants to buy a product and is in doubt between two brands or two models. It can also be useful for a manufacturer to understand how their products rank in relation to their competitors according to popular opinion. We expect this research brings contributions both in the academic context and in the practical context. From the practical point of view, it has the potential to enable the development of tools that companies and users demand. In the academy, it will join recent research initiatives in Natural Language Processing and Opinion Mining that have gained prominence in Brazil; this project will proceed their work and bring new ideas that may be used in the future by other researchers.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-02-04
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.