• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.45.2020.tde-18042020-233747
Documento
Autor
Nombre completo
Erick Pereira Santos
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2020
Director
Tribunal
Bevilacqua, Joyce da Silva (Presidente)
Roma Neto, Elias
Zampirolli, Francisco de Assis
Título en portugués
Mineração de dados aplicada à tuberculose nos municípios do Estado de São Paulo
Palabras clave en portugués
Mineração de dados
Regras de associação
Tuberculose
Resumen en portugués
A tuberculose é uma doença que atinge cerca de 2 bilhões de pessoas em todo o mundo, com cerca de 10,4 milhões de novos casos a cada ano e 1,7 milhões de mortes. Apesar de ser uma doença que pode ser prevenida por vacina e curada através de tratamentos clínicos, sua taxa de incidência ainda é alta em alguns municípios do Brasil. Por ser uma doença de transmissão direta, é conhecida a influência de fatores socioeconômicos sobre a taxa de incidência. Motivados por esse panorama, o objetivo deste trabalho é propor uma metodologia para identificar e analisar relações entre dados socioeconômicos e de notificações da doença, utilizando técnicas de mineração de dados. Foram usados os bancos de dados da Fundação SEADE, IBGE e DATASUS relativos aos municípios do estado de São Paulo. Aos dados originais foram aplicados pré-processados com o uso de técnicas de imputação múltipla através do algoritmo Expectation Maximization com reamostragem; técnicas espaciais por meio do índice e o diagrama de Moran; discretização de valores contínuos e obtenção de padrões espaciais. Os municípios foram agrupados utilizando o algoritmo de agrupamento hierárquico exclusivo AGNES e os resultados validados com o uso do índice de Silhoutte e do coeficiente de correlação cophenético. Na etapa seguinte, o algoritmo APRIORI foi aplicado e extraídas regras de associações entre as variáveis. Os resultados obtidos por essa metodologia corroboram conhecimentos prévios sobre a doença e fatores socioeconômicos, tais como, IDHM, distância ao presídio, densidade de moradores por dormitório e despesas com saúde. No entanto, a análise espacial possibilitou a identificação de municípios que estão fora da lista de municípios de controle prioritário pelos órgãos de saúde, cujas taxas de incidência são crescentes assim como a de seus vizinhos. Esta pode ser uma indicação de um alerta para controles preventivos nessas localidades. A metodologia pode ser adaptada para inclusão ou substituição dos dados para tuberculose ou outra doença que tenha notificações no banco do DATASUS.
Título en inglés
Mining applied to tuberculosis in São Paulo state municipalities
Palabras clave en inglés
Association rules
Data mining
Tuberculosis
Resumen en inglés
Tuberculosis is a disease that affects about 2 billion people worldwide, with about 10.4 million new cases each year and 1.7 million deaths. Despite being a disease that can be prevented by the vaccine and cured through clinical treatments, its incidence rate is still high in some municipalities in Brazil. As it is a disease of direct transmission, the influence of socioeconomic factors on the incidence rate is very well known. Motivated by this panorama, the objective of this work is to propose a methodology to identify and analyze relationships between socioeconomic data and disease reports, using data mining techniques. The SEADE, IBGE and DATASUS databases of the municipalities of the state of São Paulo were used. To the original data were applied pre-processing algorithms using multiple imputation techniques as the Expectation Maximization algorithm with boostrap; spatial techniques using the index and the Moran diagram; discretization of continuous values and identifications of spatial patterns. The municipalities were grouped using the exclusive hierarchical clustering algorithm AGNES and the results were validated using the Silhoutte index and the cophenetic correlation coeficient. In the next step, the APRIORI algorithm was applied and rules for associations between variables were extracted. The results obtained by this methodology corroborate previous knowledge about the disease and some socioeconomic factors, such as MHDI, distance to penitentiaries, density of residents per bedroom and health expenses. However, through spatial analysis, it has enabled the identification of municipalities that are outside the list of municipalities with priority control by health agencies, whose incidence rates are increasing as well as the incidences of their neighbors. This identification could anticipate preventive actions over these locations. The methodology can be adapted to include or replace data for tuberculosis or another disease that has been notified in the DATASUS database.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2020-04-28
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2021. Todos los derechos reservados.