• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.100.2022.tde-05052022-094458
Document
Auteur
Nom complet
Alex Gwo Jen Lan
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2022
Directeur
Jury
Paraboni, Ivandre (Président)
Pardo, Thiago Alexandre Salgueiro
Ruiz, Evandro Eduardo Seron
Titre en portugais
Classificação computacional de fundamentos morais a partir de texto
Mots-clés en portugais
Análise de Sentimentos
Caracterização Autoral
Classificação de texto
Fundamentos morais
Resumé en portugais
A identificação de valores morais em textos e discursos humanos contribui essencialmente para a compreensão de conflitos sociais motivados pelas diferenças de moralidade, além de comportamentos e posições ideológicas individuais. Em vista disso, muitas são as suas aplicações para a modelagem de problemas e eventos sociais, envolvendo análise de debates políticos, identificação de notícias falsas e a predição de eventos como protestos, campanhas eleitorais, por exemplo. O presente trabalho apresenta um estudo de classificação de categorias morais a partir de textos pautado sobre a Teoria dos Fundamentos Morais (TFM) com a utilização de métodos supervisionados de aprendizado de máquina. Estas categorias consistem em Cuidado, Justiça, Lealdade, Autoridade e Pureza. A tarefa é definida de duas formas sob a perspectiva do Processamento de Língua Natural (PLN). A primeira delas trata da classificação de fundamentos morais impessoais (CFMI), que é abordada de maneira similar às tarefas de análise de sentimentos, no sentido de que os fundamentos são referentes apenas ao significado expresso no texto. Por outro lado, a tarefa de classificação de fundamentos morais pessoais (CFMP), que é essencialmente inexplorada na literatura, define-se como uma instância de caracterização autoral, ou seja, considera a moralidade do autor do texto analisado, permitindo assim a captura de informação de classe não necessariamente explícita. Os trabalhos existentes são baseados em formas de representação textual mais tradicionais como Bag-Of-Words e word embeddings estáticos. Como forma de avançar o estado-da-arte nesses dois tipos de problema, este estudo propõe o desenvolvimento de modelos baseados em métodos de embeddings sensíveis ao contexto para as tarefas de CFMI e CFMP. De forma específica, foram conduzidos experimentos com estas duas tarefas nos idiomas em inglês, para CFMI, e português brasileiro, para CFMP, utilizando modelos como ELMo e BERT. Os resultados sugerem a eficácia no uso desses embeddings sensíveis ao contexto em CFMI e o potencial dos modelos de CFMP baseados em métodos como regressão logística com n-gramas de caracteres. Com isso, deixam-se oportunidades de futuros estudos na área, especialmente para PLN em português brasileiro
Titre en anglais
Computational classification of moral foundations from text
Mots-clés en anglais
Author Profiling
Moral Foundations
Sentiment Analysis
Text Classification
Resumé en anglais
The identification of moral values in human texts and speeches essentially contributes to the understanding of social conflicts motivated by differences in morality, in addition to individual behaviours and ideological positions. For this reason, there are many applications based on moral identification for modelling social problems and events, involving analysis of political debates, fake news identification and prediction of events such as protests, election campaigns, for example. This work presents a study of moral categories classification from text based on Moral Foundations Theory using machine learning supervised methods. These categories consist of Care, Fairness, Loyalty, Authority e Purity. The task is defined in two ways from the perspective of Natural Language Processing (NLP). The first one deals with the impersonal moral foundations classification (IMFC), which is approached in a similar fashion to the tasks of sentiment analysis, in the way that foundations refer only to the meaning expressed in the text. On the other hand, the personal moral foundations classification (PMFC) task, which is essentially unexplored in the literature, defines itself as an instance of author profiling, that is, it considers the morality of the author of the analysed text, thus allowing the capture of class information that is not necessarily explicit. Existing works are based on more traditional methods of textual representation such as Bag-Of-Words and static word embeddings. As a way to advance the state-of-the-art in these two types of problems, this study proposes the development of models based on contextual-sensitive embeddings methods for IMFC and PMFC. Specifically, experiments were conducted with these two tasks in English, for IMFC, and Brazilian Portuguese, for PMFC, using models such as ELMo and BERT. The results suggest the effectiveness of using these contextual-sensitive embeddings in IMFC and the potential of PMFC models based on methods such as logistic regression with character n-grams. This provides opportunities for future studies, especially for NLP in Brazilian Portuguese
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
AlexGwoJenLan.pdf (1.87 Mbytes)
Date de Publication
2022-10-11
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.