• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
https://doi.org/10.11606/T.55.2020.tde-08062020-095905
Documento
Autor
Nome completo
Luzia de Menezes Romanetto
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Carlos, 2020
Orientador
Banca examinadora
Lopes, Alneu de Andrade (Presidente)
Júnior, João Roberto Bertini
Liang, Zhao
Macedo, Alessandra Alaniz
Título em português
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL
Palavras-chave em português
Classificação transdutiva
Divergência KL
Redes heterogêneas de informação
Resumo em português
A área de esquisa em Redes Heterogêneas de Informação (HIN) é um recente e proeminente tópico, especialmente quando consideramos que grande parte dos dados de mundo real possuem características heterogêneas. Tais dados, com topologias complexas como relações entre diferentes tipos de objetos, o que não é naturalmente representável pelas tradicionais redes homogêneas. Além disso, comparada com as pesquisas existentes em redes homogêneas ou mesmo em redes bipartidas, a área de pesquisa em HIN ainda permanece com diversos pontos inexplorados. Dentre estes, o desenvolvimento de métodos para a classificação transdutiva em HIN apresenta diversas possibilidades de desenvolvimento. Nesta tese foi proposto o método TCHN de classificação transdutiva de HIN. Tal método tem como diferencial a utilização da divergência KL como medida de similaridade para a regularização da propagação de informação pelos vetores de informação. Esta modelagem tem como motivação o fato de tal métrica ser mais apropriada para a regularização de distribuições de probabilidade, considerando que a distribuição de informação na rede tende a se comporta de tal maneira. Experimentos comprovam que o método TCHN produz resultados comparáveis ou até mesmo superiores aos métodos representativos da área, confirmando assim sua efetividade para a classificação em diversos cenários. Além disso, a complexidade do método TCHN para redes esparsas mostra-se bastante atrativa para a aplicação em dados de mundo real, que como já comentado possuem naturalmente características heterogêneas. Além do desenvolvimento do método TCHN, como parte das demandas da área que impactaram neste trabalho, foi desenvolvida uma ferramenta de geração de redes heterogêneas sintéticas, camada HNOC, em parceria com outros pesquisadores do grupo de pesquisa. Esta já se mostrou bastante útil para a validação do método TCHN, pois com seu uso, foi possível a comparação das técnicas em redes com diferentes características com um custo bastante reduzido se comparado com o possível custo de levantamento de redes semelhantes com base em dados reais.
Título em inglês
Transductive classification in heterogeneous information networks based on KL-divergence
Palavras-chave em inglês
Heterogeneous information networks
KL-divergence
Transductive classification
Resumo em inglês
Heterogeneous Information Networks (HIN) is a promising and recent research topic, specially considering that much real world data are heterogeneous. Those data, with complex topology such as relation among different types of objects, are not naturally represented by usual homogeneous networks. Moreover, compared to existing research on homogeneous networks, or even on bipartite networks, HIN research field still presents many unexplored points. Among these, the development of methods for transductive classification in HIN presents several development possibilities. In this thesis we propose a new transductive classification method on HIN called TCHN. This method has as a differential the use of KL divergence as a similarity measure to regularize the information propagation through information vectors. This modeling is motivated by the fact that such metric is more appropriate for the regularization of probability distributions, considering that the information distribution in the network tends to behave in such a way. Experiments show the TCHN method produces results comparable or even superior to representative methods of the area, thus confirming its effectiveness for classification in different scenarios. Moreover, the complexity of the TCHN method for sparse networks is attractive for application to real world data, which as already discussed naturally have heterogeneous characteristics. In addition to the development of the TCHN method, as part of the demands of the area that impacted this work, it was developed a tool for synthetic heterogeneous network generation, this development was made in partnership with other researchers of our group. HNOC has already proved to be very useful in the validation of the TCHN method, with its use it was possible to compare the techniques in networks with different characteristics at a very low cost compared to the possible cost of surveying similar networks based on real data.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2020-06-08
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.