• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
Documento
Autor
Nome completo
Thiago Christiano Silva
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Carlos, 2012
Orientador
Banca examinadora
Liang, Zhao (Presidente)
Costa, Luciano da Fontoura
Hruschka Júnior, Estevam Rafael
Rezende, Solange Oliveira
Vellasco, Marley Maria Bernardes Rebuzzi
Título em inglês
Machine learning in complex networks: modeling, analysis, and applications
Palavras-chave em inglês
Competitive learning
Complex networks
Data classification
Data clustering
High level classification
Particle competition
Random walks
Semisupervised learning
Supervised learning
Unsupervised learning
Resumo em inglês
Machine learning is evidenced as a research area with the main purpose of developing computational methods that are capable of learning with their previously acquired experiences. Although a large amount of machine learning techniques has been proposed and successfully applied in real systems, there are still many challenging issues, which need be addressed. In the last years, an increasing interest in techniques based on complex networks (large-scale graphs with nontrivial connection patterns) has been verified. This emergence is explained by the inherent advantages provided by the complex network representation, which is able to capture the spatial, topological and functional relations of the data. In this work, we investigate the new features and possible advantages offered by complex networks in the machine learning domain. In fact, we do show that the network-based approach really brings interesting features for supervised, semisupervised, and unsupervised learning. Specifically, we reformulate a previously proposed particle competition technique for both unsupervised and semisupervised learning using a stochastic nonlinear dynamical system. Moreover, an analytical analysis is supplied, which enables one to predict the behavior of the proposed technique. In addition to that, data reliability issues are explored in semisupervised learning. Such matter has practical importance and is found to be of little investigation in the literature. With the goal of validating these techniques for solving real problems, simulations on broadly accepted databases are conducted. Still in this work, we propose a hybrid supervised classification technique that combines both low and high orders of learning. The low level term can be implemented by any classification technique, while the high level term is realized by the extraction of features of the underlying network constructed from the input data. Thus, the former classifies the test instances by their physical features, while the latter measures the compliance of the test instances with the pattern formation of the data. Our study shows that the proposed technique not only can realize classification according to the semantic meaning of the data, but also is able to improve the performance of traditional classification techniques. Finally, it is expected that this study will contribute, in a relevant manner, to the machine learning area
Título em português
Aprendizado de máquina em redes complexas: modelagem, análise e aplicações
Palavras-chave em português
Aprendizado competitivo
Aprendizado não supervisionado
Aprendizado semissupervisionado
Aprendizado supervisionado Agrupamento de dados
Caminhadas aleatórias
Classificação de dados
Classificação em alto nível
Competição de partículas
Redes complexas
Resumo em português
Aprendizado de máquina figura-se como uma área de pesquisa que visa a desenvolver métodos computacionais capazes de aprender com a experiência. Embora uma grande quantidade de técnicas de aprendizado de máquina foi proposta e aplicada, com sucesso, em sistemas reais, existem ainda inúmeros problemas desafiantes que necessitam ser explorados. Nos últimos anos, um crescente interesse em técnicas baseadas em redes complexas (grafos de larga escala com padrões de conexão não triviais) foi verificado. Essa emergência é explicada pelas inerentes vantagens que a representação em redes complexas traz, sendo capazes de capturar as relações espaciais, topológicas e funcionais dos dados. Nesta tese, serão investigadas as possíveis vantagens oferecidas por redes complexas quando utilizadas no domínio de aprendizado de máquina. De fato, será mostrado que a abordagem por redes realmente proporciona melhorias nos aprendizados supervisionado, semissupervisionado e não supervisionado. Especificamente, será reformulada uma técnica de competição de partículas para o aprendizado não supervisionado e semissupervisionado por meio da utilização de um sistema dinâmico estocástico não linear. Em complemento, uma análise analítica de tal modelo será desenvolvida, permitindo o entendimento evolucional do modelo no tempo. Além disso, a questão de confiabilidade de dados será investigada no aprendizado semissupervisionado. Tal tópico tem importância prática e é pouco estudado na literatura. Com o objetivo de validar essas técnicas em problemas reais, simulações computacionais em bases de dados consagradas pela literatura serão conduzidas. Ainda nesse trabalho, será proposta uma técnica híbrica de classificação supervisionada que combina tanto o aprendizado de baixo como de alto nível. O termo de baixo nível pode ser implementado por qualquer técnica de classificação tradicional, enquanto que o termo de alto nível é realizado pela extração das características de uma rede construída a partir dos dados de entrada. Nesse contexto, aquele classifica as instâncias de teste segundo qualidades físicas, enquanto que esse estima a conformidade da instância de teste com a formação de padrões dos dados. Os estudos aqui desenvolvidos mostram que o método proposto pode melhorar o desempenho de técnicas tradicionais de classificação, além de permitir uma classificação de acordo com o significado semântico dos dados. Enfim, acredita-se que este estudo possa gerar contribuições relevantes para a área de aprendizado de máquina.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
thiagodefesa.pdf (45.08 Mbytes)
Data de Publicação
2013-04-19
 
AVISO: O material descrito abaixo refere-se a trabalhos decorrentes desta tese ou dissertação. O conteúdo desses trabalhos é de inteira responsabilidade do autor da tese ou dissertação.
  • CUPERTINO, Thiago Henrique, SILVA, Thiago Christiano, and ZHAO, Liang. Classification of multiple observation sets via network modularity [doi:10.1007/s00521-012-1115-y]. Neural Computing and Applications [online], 2013.
  • SILVA, Thiago Christiano, and AMANCIO, Diego Raphael. Discriminating word senses with tourist walks in complex networks [doi:10.1140/epjb/e2013-40025-4]. The European Physical Journal B [online], 2013, vol. 86, n. 7.
  • SILVA, Thiago Christiano, and AMANCIO, Diego Raphael. Word sense disambiguation via high order of learning in complex networks [doi:10.1209/0295-5075/98/58001]. EPL (Europhysics Letters) [online], 2012, vol. 98, n. 5, p. 58001.
  • SILVA, Thiago Christiano, and RAPHAEL AMANCIO, Diego. Network-based stochastic competitive learning approach to disambiguation in collaborative networks [doi:10.1063/1.4794795]. Chaos: An Interdisciplinary Journal of Nonlinear Science [online], 2013, vol. 23, n. 1, p. 013139.
  • SILVA, Thiago Christiano, and ZHAO, Liang. Detecting and preventing error propagation via competitive learning [doi:10.1016/j.neunet.2012.11.001]. Neural Networks [online], 2013, vol. 41, p. 70-84.
  • SILVA, Thiago Christiano, and ZHAO, Liang. Detecting and Preventing Error Propagation via Competitive Learning [doi:10.1016/j.procs.2012.09.128]. Procedia Computer Science [online], 2012, vol. 13, p. 192-197.
  • SILVA, Thiago Christiano, and ZHAO, Liang. Network-Based High Level Data Classification [doi:10.1109/TNNLS.2012.2195027]. IEEE Transactions on Neural Networks and Learning Systems [online], 2012, vol. 23, n. 6, p. 954-970.
  • SILVA, Thiago Christiano, and ZHAO, Liang. Network-Based Stochastic Semisupervised Learning [doi:10.1109/TNNLS.2011.2181413]. IEEE Transactions on Neural Networks and Learning Systems [online], 2012, vol. 23, n. 3, p. 451-466.
  • SILVA, Thiago Christiano, and ZHAO, Liang. Semi-supervised learning guided by the modularity measure in complex networks [doi:10.1016/j.neucom.2011.04.042]. Neurocomputing [online], 2012, vol. 78, n. 1, p. 30-37.
  • SILVA, Thiago Christiano, and ZHAO, Liang. Stochastic Competitive Learning in Complex Networks [doi:10.1109/TNNLS.2011.2181866]. IEEE Transactions on Neural Networks and Learning Systems [online], 2012, vol. 23, n. 3, p. 385-398.
  • SILVA, Thiago Christiano, and ZHAO, Liang. Uncovering overlapping cluster structures via stochastic competitive learning [doi:10.1016/j.ins.2013.06.024]. Information Sciences [online], 2013.
  • SILVA, Thiago Christiano, ZHAO, Liang, and CUPERTINO, Thiago H.. Handwritten Data Clustering Using Agents Competition in Networks [doi:10.1007/s10851-012-0353-z]. Journal of Mathematical Imaging and Vision [online], 2013, vol. 45, n. 3, p. 264-276.
  • SILVA, Thiago Christiano, and ZHAO, Liang. Network-based learning through particle competition for data clustering [doi:10.1109/IJCNN.2011.6033198]. In The 2011 International Joint Conference on Neural Networks [online], San Jose, CA, USA, 2011. San Jose, CA, USA : IEEE, 2011. p. 45-52. ISBN 978-1-4244-9635-8.
  • SILVA, Thiago Christiano, CUPERTINO, Thiago Henrique, and ZHAO, Liang. High Level Classification for Pattern Recognition [doi:10.1109/SIBGRAPI.2011.19]. In 2011 24th SIBGRAPI Conference on Graphics, Patterns and Images [online], Alagoas, MaceiA, Brazil, 2011. Alagoas, MaceiA, Brazil : IEEE, 2011. p. 344-351. ISBN 978-0-7695-4548-6.
  • SILVA, Thiago Christiano, CUPERTINO, Thiago Henrique, and ZHAO, Liang. Stochastic Competitive Learning Applied to Handwritten Digit and Letter Clustering [doi:10.1109/SIBGRAPI.2011.35]. In 2011 24th SIBGRAPI Conference on Graphics, Patterns and Images [online], Alagoas, MaceiA, Brazil, 2011. Alagoas, MaceiA, Brazil : IEEE, 2011. p. 313-320. ISBN 978-0-7695-4548-6.
Todos os direitos da tese/dissertação são de seus autores
Centro de Informática de São Carlos
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2014. Todos os direitos reservados.