• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.45.2020.tde-18042020-233747
Document
Author
Full name
Erick Pereira Santos
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2020
Supervisor
Committee
Bevilacqua, Joyce da Silva (President)
Roma Neto, Elias
Zampirolli, Francisco de Assis
Title in Portuguese
Mineração de dados aplicada à tuberculose nos municípios do Estado de São Paulo
Keywords in Portuguese
Mineração de dados
Regras de associação
Tuberculose
Abstract in Portuguese
A tuberculose é uma doença que atinge cerca de 2 bilhões de pessoas em todo o mundo, com cerca de 10,4 milhões de novos casos a cada ano e 1,7 milhões de mortes. Apesar de ser uma doença que pode ser prevenida por vacina e curada através de tratamentos clínicos, sua taxa de incidência ainda é alta em alguns municípios do Brasil. Por ser uma doença de transmissão direta, é conhecida a influência de fatores socioeconômicos sobre a taxa de incidência. Motivados por esse panorama, o objetivo deste trabalho é propor uma metodologia para identificar e analisar relações entre dados socioeconômicos e de notificações da doença, utilizando técnicas de mineração de dados. Foram usados os bancos de dados da Fundação SEADE, IBGE e DATASUS relativos aos municípios do estado de São Paulo. Aos dados originais foram aplicados pré-processados com o uso de técnicas de imputação múltipla através do algoritmo Expectation Maximization com reamostragem; técnicas espaciais por meio do índice e o diagrama de Moran; discretização de valores contínuos e obtenção de padrões espaciais. Os municípios foram agrupados utilizando o algoritmo de agrupamento hierárquico exclusivo AGNES e os resultados validados com o uso do índice de Silhoutte e do coeficiente de correlação cophenético. Na etapa seguinte, o algoritmo APRIORI foi aplicado e extraídas regras de associações entre as variáveis. Os resultados obtidos por essa metodologia corroboram conhecimentos prévios sobre a doença e fatores socioeconômicos, tais como, IDHM, distância ao presídio, densidade de moradores por dormitório e despesas com saúde. No entanto, a análise espacial possibilitou a identificação de municípios que estão fora da lista de municípios de controle prioritário pelos órgãos de saúde, cujas taxas de incidência são crescentes assim como a de seus vizinhos. Esta pode ser uma indicação de um alerta para controles preventivos nessas localidades. A metodologia pode ser adaptada para inclusão ou substituição dos dados para tuberculose ou outra doença que tenha notificações no banco do DATASUS.
Title in English
Mining applied to tuberculosis in São Paulo state municipalities
Keywords in English
Association rules
Data mining
Tuberculosis
Abstract in English
Tuberculosis is a disease that affects about 2 billion people worldwide, with about 10.4 million new cases each year and 1.7 million deaths. Despite being a disease that can be prevented by the vaccine and cured through clinical treatments, its incidence rate is still high in some municipalities in Brazil. As it is a disease of direct transmission, the influence of socioeconomic factors on the incidence rate is very well known. Motivated by this panorama, the objective of this work is to propose a methodology to identify and analyze relationships between socioeconomic data and disease reports, using data mining techniques. The SEADE, IBGE and DATASUS databases of the municipalities of the state of São Paulo were used. To the original data were applied pre-processing algorithms using multiple imputation techniques as the Expectation Maximization algorithm with boostrap; spatial techniques using the index and the Moran diagram; discretization of continuous values and identifications of spatial patterns. The municipalities were grouped using the exclusive hierarchical clustering algorithm AGNES and the results were validated using the Silhoutte index and the cophenetic correlation coeficient. In the next step, the APRIORI algorithm was applied and rules for associations between variables were extracted. The results obtained by this methodology corroborate previous knowledge about the disease and some socioeconomic factors, such as MHDI, distance to penitentiaries, density of residents per bedroom and health expenses. However, through spatial analysis, it has enabled the identification of municipalities that are outside the list of municipalities with priority control by health agencies, whose incidence rates are increasing as well as the incidences of their neighbors. This identification could anticipate preventive actions over these locations. The methodology can be adapted to include or replace data for tuberculosis or another disease that has been notified in the DATASUS database.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-04-28
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.