• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.104.2024.tde-03042024-080044
Document
Auteur
Nom complet
Robson Ortz Oliveira Cunha
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Carlos, 2024
Directeur
Jury
Stern, Rafael Bassi (Président)
Esteves, Luís Gustavo
Prates, Marcos Oliveira
Titre en portugais
Modelo Hierárquico Bayesiano Não Paramétrico Aplicado em Modelagem de Tópicos
Mots-clés en portugais
Jurimetria
Modelagem de tópicos textuais
Modelo não paramétrico Bayesiano
Processo hierárquico de Dirichlet
Resumé en portugais
Dada a crescente necessidade e importância da análise de dados textuais no ramo da inteligência artificial, modelos que possam compreender melhor a linguagem humana e lidar com dados não estruturados têm ganhado cada vez mais relevância. Neste trabalho, desenvolvemos um estudo sobre o Processo Hierárquico de Dirichlet (HDP) na modelagem de tópicos textuais explorando seus aspectos práticos ao aplicá-lo em um conjunto de dados (corpus) de processos jurídicos, compostos por três tipos de procedimentos distintos. Discorremos sobre as principais propriedades do HDP, sobre a ótica Bayesiana, assumindo que os dados sejam oriundos de uma distribuição de probabilidade Multinomial, baseados no modelo de representação textual de bag-of-words, comumente utilizado em processamento de linguagem natural. Procedemos ainda com algumas técnicas de pré-processamento textual, que resultaram em documentos (dados) mais parcimoniosos, e com estudo de simulação para verificar a performance do modelo. Ao fim do trabalho, apresentamos os resultados das aplicações realizadas e discutimos sobre a problemática da análise de dados em jurimetria.
Titre en anglais
Nonparametric Bayesian Hierarchical Model Applied to Topic Modeling
Mots-clés en anglais
Hierarchical Dirichlet process
Jurimetry
Non-parametric Bayesian model
Topic modeling
Resumé en anglais
Given the growing need and importance of analyzing textual data in the field of artificial intelligence, models that can better understand human language and deal with unstructured data are increasingly relevant gains. In this work, we developed a study on the Hierarchical Dirichlet Process (HDP) in modeling textual topics, exploring its practical aspects by applying it to a data set (corpus) of legal process, composed of three types of different procedures. We will discuss the main properties of HDP, from a Bayesian perspctive, assuming that the data comes from Multinomial probability distribution, based on the bag-of-words textual representation model, commonly used in natural language processing. We also proceeded with some textual pre-processing techniches, which resulted in more parsimonious documents (data), and with a simulation study to verify the model's performance. At the end of the work, we present the results of the applications carried out and discuss the issues of data analysis in jurimetry.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2024-04-03
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.