• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.100.2021.tde-06092021-142746
Document
Auteur
Nom complet
José Pereira Delmondes Neto
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2021
Directeur
Jury
Paraboni, Ivandre (Président)
Caseli, Helena de Medeiros
Pérez Alcazár, José de Jesus
Titre en portugais
Caracterização autoral interdomínio a partir de textos
Mots-clés en portugais
Caracterização Autoral Interdomínio
Processamento de Língua Natural
Redes Neurais Artificiais
Resumé en portugais
Na área de processamento de língua natural, entende-se por caracterização autoral uma tarefa computacional que tem por objetivo extrair informações sociais e psicológicas dos indivíduos, como gênero e faixa etária, por meio de suas produções textuais. Modelos computacionais de caracterização autoral são comumente empregados em áreas como marketing e segurança, dentre outras. Estes modelos geralmente são de domínio único, i.e., são treinados e validados no mesmo gênero textual, o que faz com que sua portabilidade para outros gêneros seja limitada. Em contrapartida aos modelos de domínio único, modelos interdomínio, que são validados em gêneros textuais diferentes dos que foram treinados, podem ser uma alternativa para casos em que não há dados suficientes para o treinamento de um modelo computacional. Um exemplo seria a utilização de dados do Twitter (domínio que dispõem de grande volume de dados) para o desenvolvimento de modelos de caracterização autoral a serem utilizados em e-mails, domínio onde é mais difícil obter um volume de dados suficiente para o treinamento dos modelos. O presente trabalho apresenta uma proposta de pesquisa em nível de mestrado na área de processamento de língua natural, com ênfase em caracterização autoral, com o objetivo geral de desenvolver modelos de aprendizagem de máquina supervisionada baseados em redes neurais artificiais para a tarefa de caracterização autoral interdomínio, de modo a se obter uma alternativa robusta aos modelos de domínio único, com perda de acurácia reduzida se comparada a modelos equivalentes baseados em domínio único
Titre en anglais
Cross domain author profiling from texts
Mots-clés en anglais
Artificial Neural Netwok
Cross-Genre Author Profiling
Natural Language Processing
Resumé en anglais
In the area of natural language processing, author profiling is a computational task that aims to extract social and psychological information from individuals, such as gender and age group, through their textual productions. Computational models of author profiling are commonly used in areas such as marketing and security, among others. These models are usually based on a single domain, i.e., they are trained and validated in the same domain, which makes their portability to other domains limited. In contrast to single domain models, cross-genre models, which are validated in different domains than those on which they were trained, may be an alternative for cases in which there is not enough data for training a computational model. An example would be the use of Twitter data (a domain that has a large amount of data) for the development of author profiling models to be used in e-mails, a domain in which it is more difficult to obtain a sufficient amount of data for the training of the models. The present work introduces a proposal for a MSc research in the area of natural language processing, focused on author profiling, with the general objective of developing supervised machine learning models based on artificial neural networks for the task of cross-genre author profiling, in order to obtain a robust alternative to single domain models, with reduced loss of precision compared to equivalent cross-genre models
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2022-05-16
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.