• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Thèse de Doctorat
DOI
10.11606/T.11.2008.tde-15102008-082243
Document
Auteur
Nom complet
Cesar Augusto Taconeli
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
Piracicaba, 2008
Directeur
Jury
Zocchi, Silvio Sandoval (Président)
Barroso, Lucia Pereira
Dias, Carlos Tadeu dos Santos
Faria, José Claudio
Rosa, Joel Mauricio Correa da
Titre en portugais
Árvores de classificação multivariadas fundamentadas em coeficientes de dissimilaridade e entropia.
Mots-clés en portugais
Álcool
Análise multivariada
Entropia - Matemática aplicada
Fumo
Simulação - Estatística.
Resumé en portugais
A análise estatística de grandes bancos de dados requer a utilização de metodologias flexíveis, capazes de produzir resultados esclarecedores e facilmente compreensíveis frente a dificuldades como a presença de números elevados de variáveis, diferentes graus de associações entre as mesmas e dados ausentes. A construção de árvores de classificação e regressão proporciona a modelagem de uma variável resposta, categorizada ou numérica, com base em um conjunto de covariáveis, sem esbarrar nas dificuldades mencionadas. A extensão multivariada de técnicas de classificação e regressão por árvores visa permitir a análise conjunta de duas ou mais variáveis respostas. Embora seja objeto de estudos recentes, a proposição de técnicas multivariadas de classificação e regressão por árvores tem sido verificada de maneira mais acentuada para situações em que se dispõe de múltiplas variáveis respostas numéricas. Propõemse, neste trabalho, novas alternativas para a construção de árvores de classificação multivariadas, visando analisar múltiplas variáveis respostas categorizadas. Tais alternativas baseiam-se em medidas de dissimilaridade e entropia. Por meio de um estudo de simulação, verificou-se o efeito das correlações e entropias das variáveis no desempenho das metodologias propostas (os resultados são melhores quanto maiores as entropias e correlações das variáveis sob estudo). A análise de dados de consumo de álcool e fumo dos habitantes do município de Botucatu-SP complementa o presente estudo, evidenciando, dentre outras coisas, que fatores como o grau de escolaridade, a ocupação profissional e a possibilidade de compartilhar problemas com amigos têm influência sobre os consumos de álcool e fumo dos habitantes.
Titre en anglais
Multivariate classification trees based on dissimilarity and entropy coefficients
Mots-clés en anglais
Alcohol
Entropy - applied mathematics
Mltivariate analysis
Simulation - Statistics.
Smoke
Resumé en anglais
The statistical analysis of large datasets requires the use of flexible methodologies, that can provide insight and understanding even in the presence of difficulties such as large numbers of variables having variable levels of association between themselves, and missing data. The construction of classification and regression trees allows for modeling of a categorical or numerical response variable as a function a set of covariates, while bypassing many of the cited difficulties. Multivariate trees extend classification and regression techniques to allow for joint analysis of two or more response variables. In recent studies, application of multivariate classification and regression techniques has been most common in situations involving numerical response variables. In this work we propose alternatives for constructing multivariate classification trees for multiple categorized response variables. Such alternatives are based on dissimilarity and entropy measures. A simulation study was used to examine the effect of variable correlations and entropies on the performance of the proposed methodology (results are better for high correlations and entropies). Analysis of data on alcohol consumption and smoking among inhabitants from Botucatu (SP) complements the analysis by showing that factors as the education level, daily occupation and possibility of sharing problems with friends have an influence on the alcohol consumption and smoking.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Cesar_Taconeli.pdf (4.56 Mbytes)
Date de Publication
2008-10-16
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
Centro de Informática de São Carlos
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2021. Tous droits réservés.