• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.45.2020.tde-18042020-233747
Documento
Autor
Nome completo
Erick Pereira Santos
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2020
Orientador
Banca examinadora
Bevilacqua, Joyce da Silva (Presidente)
Roma Neto, Elias
Zampirolli, Francisco de Assis
Título em português
Mineração de dados aplicada à tuberculose nos municípios do Estado de São Paulo
Palavras-chave em português
Mineração de dados
Regras de associação
Tuberculose
Resumo em português
A tuberculose é uma doença que atinge cerca de 2 bilhões de pessoas em todo o mundo, com cerca de 10,4 milhões de novos casos a cada ano e 1,7 milhões de mortes. Apesar de ser uma doença que pode ser prevenida por vacina e curada através de tratamentos clínicos, sua taxa de incidência ainda é alta em alguns municípios do Brasil. Por ser uma doença de transmissão direta, é conhecida a influência de fatores socioeconômicos sobre a taxa de incidência. Motivados por esse panorama, o objetivo deste trabalho é propor uma metodologia para identificar e analisar relações entre dados socioeconômicos e de notificações da doença, utilizando técnicas de mineração de dados. Foram usados os bancos de dados da Fundação SEADE, IBGE e DATASUS relativos aos municípios do estado de São Paulo. Aos dados originais foram aplicados pré-processados com o uso de técnicas de imputação múltipla através do algoritmo Expectation Maximization com reamostragem; técnicas espaciais por meio do índice e o diagrama de Moran; discretização de valores contínuos e obtenção de padrões espaciais. Os municípios foram agrupados utilizando o algoritmo de agrupamento hierárquico exclusivo AGNES e os resultados validados com o uso do índice de Silhoutte e do coeficiente de correlação cophenético. Na etapa seguinte, o algoritmo APRIORI foi aplicado e extraídas regras de associações entre as variáveis. Os resultados obtidos por essa metodologia corroboram conhecimentos prévios sobre a doença e fatores socioeconômicos, tais como, IDHM, distância ao presídio, densidade de moradores por dormitório e despesas com saúde. No entanto, a análise espacial possibilitou a identificação de municípios que estão fora da lista de municípios de controle prioritário pelos órgãos de saúde, cujas taxas de incidência são crescentes assim como a de seus vizinhos. Esta pode ser uma indicação de um alerta para controles preventivos nessas localidades. A metodologia pode ser adaptada para inclusão ou substituição dos dados para tuberculose ou outra doença que tenha notificações no banco do DATASUS.
Título em inglês
Mining applied to tuberculosis in São Paulo state municipalities
Palavras-chave em inglês
Association rules
Data mining
Tuberculosis
Resumo em inglês
Tuberculosis is a disease that affects about 2 billion people worldwide, with about 10.4 million new cases each year and 1.7 million deaths. Despite being a disease that can be prevented by the vaccine and cured through clinical treatments, its incidence rate is still high in some municipalities in Brazil. As it is a disease of direct transmission, the influence of socioeconomic factors on the incidence rate is very well known. Motivated by this panorama, the objective of this work is to propose a methodology to identify and analyze relationships between socioeconomic data and disease reports, using data mining techniques. The SEADE, IBGE and DATASUS databases of the municipalities of the state of São Paulo were used. To the original data were applied pre-processing algorithms using multiple imputation techniques as the Expectation Maximization algorithm with boostrap; spatial techniques using the index and the Moran diagram; discretization of continuous values and identifications of spatial patterns. The municipalities were grouped using the exclusive hierarchical clustering algorithm AGNES and the results were validated using the Silhoutte index and the cophenetic correlation coeficient. In the next step, the APRIORI algorithm was applied and rules for associations between variables were extracted. The results obtained by this methodology corroborate previous knowledge about the disease and some socioeconomic factors, such as MHDI, distance to penitentiaries, density of residents per bedroom and health expenses. However, through spatial analysis, it has enabled the identification of municipalities that are outside the list of municipalities with priority control by health agencies, whose incidence rates are increasing as well as the incidences of their neighbors. This identification could anticipate preventive actions over these locations. The methodology can be adapted to include or replace data for tuberculosis or another disease that has been notified in the DATASUS database.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2020-04-28
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.