• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.55.2022.tde-01122022-114642
Document
Author
Full name
Rovilson de Freitas
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2022
Supervisor
Committee
Sousa, Elaine Parros Machado de (President)
Marcacini, Ricardo Marcondes
Razente, Humberto Luiz
Santos, Marilde Terezinha Prado
Title in Portuguese
Anotação semântica baseada em ontologia para análise de entrevistas dos atletas olímpicos brasileiros
Keywords in Portuguese
Anotação semântica
Mineração de textos
Ontologia de domínio
Abstract in Portuguese
Normalmente, pesquisas acadêmicas coletam um grande acervo de dados. Esses dados, ao longo do tempo, precisam ser acessados e manipulados pelos pesquisadores, de acordo com a natureza de sua investigação. É fundamental que esses dados estejam disponibilizados de maneira simples, com algum suporte computacional para facilitar o trabalho dos pesquisadores. A realidade da pesquisa, de maneira geral, corresponde a recursos escassos e, portanto, o tempo precisa ser otimizado. O presente trabalho propõe uma possível solução que apoie tarefas de análise e descoberta de conhecimento a partir do acervo do Grupo de Estudos Olímpicos da Universidade de São Paulo, utilizando estratégias de anotação semântica baseada em ontologia, aliada com técnicas de mineração de texto. Para isso, foi desenvolvida uma ontologia de domínio chamada OntOlympic, que serviu de base para o processo de anotação semântica. As entrevistas passaram por um processo de mineração de textos (agrupamentos), com e sem anotação semântica. Os resultados mostram que os grupos formados a partir das entrevistas anotadas tem uma tendência de serem melhores agrupamentos do que os grupos formados pelas entrevistas não anotadas. Os resultados, tanto do índice de avaliação (índice de Davies-Bouldin), quanto da análise dos grupos formados se demonstraram ligeiramente melhores. Como perspectiva futura, outros grupos que trabalham com a mesma dinâmica podem utilizar os processos desse trabalho, além de abrir perspectiva de outros testes na área de mineração de textos.
Title in English
Ontology-based semantic annotation for analysis of interviews with brazilian olympic athletes
Keywords in English
Domain ontology
Semantic annotation
Text mining
Abstract in English
Typically, academic research collects a large body of data. This data, over time, needs to be accessed and manipulated by researchers, according to the nature of their investigation. It is critical that these simple data be available in a computer-supported manner to facilitate the work of researchers. The reality, general, research, scarce resources and therefore time needs the optimization to be. The work proposed by the University of São Paulo is a possible solution and supports the tasks of analysis and knowledge discovery from text mining techniques. For this, an Olympic domain ontology was developed, which served as the basis for the semantic annotation process. The interviews interviewed by a mining mining process (clusters), with and without ananotics. The results show that the groups that form the annotated interviews tend to be better groups than the groups that form the unannotated interviews. The results of both the evaluation index (Davies-Buldin index) and the formed groups compare the best of the analysis. As a future perspective, other test groups that work with the same can use the processes of this work, in addition to opening perspective of other text mining groups.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2022-12-01
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.