• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.45.2020.tde-18042020-233747
Document
Auteur
Nom complet
Erick Pereira Santos
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2020
Directeur
Jury
Bevilacqua, Joyce da Silva (Président)
Roma Neto, Elias
Zampirolli, Francisco de Assis
Titre en portugais
Mineração de dados aplicada à tuberculose nos municípios do Estado de São Paulo
Mots-clés en portugais
Mineração de dados
Regras de associação
Tuberculose
Resumé en portugais
A tuberculose é uma doença que atinge cerca de 2 bilhões de pessoas em todo o mundo, com cerca de 10,4 milhões de novos casos a cada ano e 1,7 milhões de mortes. Apesar de ser uma doença que pode ser prevenida por vacina e curada através de tratamentos clínicos, sua taxa de incidência ainda é alta em alguns municípios do Brasil. Por ser uma doença de transmissão direta, é conhecida a influência de fatores socioeconômicos sobre a taxa de incidência. Motivados por esse panorama, o objetivo deste trabalho é propor uma metodologia para identificar e analisar relações entre dados socioeconômicos e de notificações da doença, utilizando técnicas de mineração de dados. Foram usados os bancos de dados da Fundação SEADE, IBGE e DATASUS relativos aos municípios do estado de São Paulo. Aos dados originais foram aplicados pré-processados com o uso de técnicas de imputação múltipla através do algoritmo Expectation Maximization com reamostragem; técnicas espaciais por meio do índice e o diagrama de Moran; discretização de valores contínuos e obtenção de padrões espaciais. Os municípios foram agrupados utilizando o algoritmo de agrupamento hierárquico exclusivo AGNES e os resultados validados com o uso do índice de Silhoutte e do coeficiente de correlação cophenético. Na etapa seguinte, o algoritmo APRIORI foi aplicado e extraídas regras de associações entre as variáveis. Os resultados obtidos por essa metodologia corroboram conhecimentos prévios sobre a doença e fatores socioeconômicos, tais como, IDHM, distância ao presídio, densidade de moradores por dormitório e despesas com saúde. No entanto, a análise espacial possibilitou a identificação de municípios que estão fora da lista de municípios de controle prioritário pelos órgãos de saúde, cujas taxas de incidência são crescentes assim como a de seus vizinhos. Esta pode ser uma indicação de um alerta para controles preventivos nessas localidades. A metodologia pode ser adaptada para inclusão ou substituição dos dados para tuberculose ou outra doença que tenha notificações no banco do DATASUS.
Titre en anglais
Mining applied to tuberculosis in São Paulo state municipalities
Mots-clés en anglais
Association rules
Data mining
Tuberculosis
Resumé en anglais
Tuberculosis is a disease that affects about 2 billion people worldwide, with about 10.4 million new cases each year and 1.7 million deaths. Despite being a disease that can be prevented by the vaccine and cured through clinical treatments, its incidence rate is still high in some municipalities in Brazil. As it is a disease of direct transmission, the influence of socioeconomic factors on the incidence rate is very well known. Motivated by this panorama, the objective of this work is to propose a methodology to identify and analyze relationships between socioeconomic data and disease reports, using data mining techniques. The SEADE, IBGE and DATASUS databases of the municipalities of the state of São Paulo were used. To the original data were applied pre-processing algorithms using multiple imputation techniques as the Expectation Maximization algorithm with boostrap; spatial techniques using the index and the Moran diagram; discretization of continuous values and identifications of spatial patterns. The municipalities were grouped using the exclusive hierarchical clustering algorithm AGNES and the results were validated using the Silhoutte index and the cophenetic correlation coeficient. In the next step, the APRIORI algorithm was applied and rules for associations between variables were extracted. The results obtained by this methodology corroborate previous knowledge about the disease and some socioeconomic factors, such as MHDI, distance to penitentiaries, density of residents per bedroom and health expenses. However, through spatial analysis, it has enabled the identification of municipalities that are outside the list of municipalities with priority control by health agencies, whose incidence rates are increasing as well as the incidences of their neighbors. This identification could anticipate preventive actions over these locations. The methodology can be adapted to include or replace data for tuberculosis or another disease that has been notified in the DATASUS database.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2020-04-28
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.