• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.3.2023.tde-09112023-115721
Document
Author
Full name
Fernando Xavier
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2023
Supervisor
Committee
Saraiva, Antonio Mauro (President)
Almeida Junior, Jorge Rady de
Chiaravalloti Neto, Francisco
Silva, Juliana Saragiotto
Stoppe, Nancy de Castro
Title in Portuguese
Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
Keywords in Portuguese
Avaliações em saúde
Big Data
Ciência de dados
Dengue
Abstract in Portuguese
A dengue é uma doença que atinge milhões de pessoas anualmente no mundo. O Brasil, que tinha erradicado a doença, voltou a lidar com alto número de casos e epidemias sazonais. A despeito das ações executadas pelo poder público, não se observa uma evolução no programa de combate à dengue. A falta de compreensão das razões desse insucesso torna a dengue um problema de difícil solução. As avaliações em saúde normalmente utilizam-se de métodos que são de difícil aplicação em grande escala e nem sempre consideram fatores contextuais que podem ter influência decisiva nos resultados dos programas. Por outro lado, a era de Big Data tem apresentado oportunidades para avanço no conhecimento em áreas como a saúde. Nesse sentido, essa pesquisa de Doutorado teve como objetivo o desenvolvimento de uma metodologia com base em Big Data para avaliação do programa de combate à dengue. Nessa metodologia, buscou-se integrar fontes de dados relacionados à dengue em um repositório comum de dados, seguida da aplicação de técnicas de Ciência de Dados, como os algoritmos de aprendizado de máquina K-Means e Random Forest, além de análises estatísticas e visualização espacial. Inicialmente foi desenvolvida uma arquitetura de dados, usando conceitos de Big Data e Saúde Planetária, que foi utilizada como base para execução da avaliação do programa de combate à dengue de acordo com instrumento avaliativo desenvolvido nessa pesquisa. A solução proposta foi avaliada em um estudo de caso para os 645 municípios do Estado de São Paulo, em que foram desenvolvidos dois experimentos com utilização de técnicas de aprendizado de máquina e visualização de dados para extração de informação. Para ambos os experimentos, dados foram coletados de diversas fontes públicas e integrados em um data lake utilizando recursos de computação em nuvem. Além disso, foi desenvolvido um instrumento de avaliação considerando o modelo de Donabedian para avaliação de saúde que, em seguida, foi validado por especialistas de domínio. No primeiro experimento, aplicou-se o algoritmo K-Means para agrupar os municípios em quatro clusters de acordo com o contexto, como variáveis climáticas e socioeconômicas. Em seguida, foram realizadas avaliações dos indicadores dos componentes estrutura, processo e resultado do modelo Donabedian para identificar possíveis padrões. Nessas avaliações foram comparados os valores dos indicadores em municípios do mesmo cluster, assim como comparações dos indicadores entre clusters. Para monitoramento contínuo dos indicadores, foi desenvolvido no segundo experimento um painel de Business Intelligence através de uma ferramenta de visualização de dados. Os resultados dos experimentos revelaram importantes informações, como a insuficiência no número de agentes comunitários de saúde nos municípios com piores resultados. Ademais, foi observado que municípios com contextos mais favoráveis à disseminação da dengue tinham deficiências em relação à estrutura de saúde local. Os resultados mostraram que o uso de técnicas de Ciência de Dados para avaliação em saúde pode agregar diversos benefícios à gestão pública. Além da análise de fatores ambientais, a metodologia proposta nesta pesquisa possibilita que as avaliações possam ser realizadas em larga escala de forma mais eficiente, agregando valor ao processo de tomada de decisão na gestão pública.
Title in English
Untitled in english
Keywords in English
Big Data
Data Science
Dengue
Donabedian
Health assessments
Abstract in English
Dengue is a disease that affects millions of people annually worldwide. Brazil, which had eradicated the disease, has faced a high number of cases and seasonal epidemics again. Despite the public policies, there has been no improvement in the results of the dengue control program. The lack of understanding of the reasons for this failure makes dengue a problem that is difficult to solve. Health assessments typically use methods that are difficult to apply on a large scale and do not always consider contextual factors that may have a decisive influence on program results. On the other hand, the era of Big Data has presented opportunities for advances in knowledge in areas such as health. In this sense, this doctoral research aimed to develop a methodology based on Big Data for evaluating the dengue control program. In this methodology, we sought to integrate sources of data related to dengue into a common data repository, followed by the application of Data Science technique, such as K-Means and Random Forest machine learning algorithms, as well as statistical analysis and spatial visualization. Initially, a data architecture was developed, using concepts of Big Data and Planetary Health, which was used as a basis for carrying out the evaluation of the program to combat dengue according to the evaluation instrument developed in this research. The proposed solution was evaluated in a case study for the 645 municipalities in the State of São Paulo, in which two experiments were developed using machine learning techniques and data visualization for information extraction. For both experiments, data were collected from diverse public sources and integrated in a data lake using cloud computing resources. Additionally, an evaluation instrument was developed considering the Donabedian framework for health assessment and validate with domain experts. In the first experiment, the K-Means algorithm was applied to group the municipalities into four clusters according to the context, such as climate and socioeconomic variables. Then evaluations of the indicators of the structure, process, and result components of the Donabedian model were carried out to identify possible patterns. In these evaluations, the indicators values were compared in municipalities in the same cluster as well as comparisons of indicators between clusters. For continuous monitoring of indicators, a Business Intelligence panel was developed in the second experiment using a data visualization tool. The results of the experiments revealed important information, such as the insufficient number of community health agents in the municipalities with the worst results. Furthermore, it was observed that municipalities with contexts more favorable to the spread of dengue had deficiencies in relation to the local health structure. The results showed that the use of Data Science techniques for health assessment can add several benefits to public management. In addition to the analysis of context factors, the methodology proposed in this research allows assessments to be carried out on a large scale in a more efficient way, adding value to the decision-making process in public management.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2023-11-13
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.