• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tesis Doctoral
DOI
https://doi.org/10.11606/T.3.2023.tde-09112023-115721
Documento
Autor
Nombre completo
Fernando Xavier
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2023
Director
Tribunal
Saraiva, Antonio Mauro (Presidente)
Almeida Junior, Jorge Rady de
Chiaravalloti Neto, Francisco
Silva, Juliana Saragiotto
Stoppe, Nancy de Castro
Título en portugués
Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
Palabras clave en portugués
Avaliações em saúde
Big Data
Ciência de dados
Dengue
Resumen en portugués
A dengue é uma doença que atinge milhões de pessoas anualmente no mundo. O Brasil, que tinha erradicado a doença, voltou a lidar com alto número de casos e epidemias sazonais. A despeito das ações executadas pelo poder público, não se observa uma evolução no programa de combate à dengue. A falta de compreensão das razões desse insucesso torna a dengue um problema de difícil solução. As avaliações em saúde normalmente utilizam-se de métodos que são de difícil aplicação em grande escala e nem sempre consideram fatores contextuais que podem ter influência decisiva nos resultados dos programas. Por outro lado, a era de Big Data tem apresentado oportunidades para avanço no conhecimento em áreas como a saúde. Nesse sentido, essa pesquisa de Doutorado teve como objetivo o desenvolvimento de uma metodologia com base em Big Data para avaliação do programa de combate à dengue. Nessa metodologia, buscou-se integrar fontes de dados relacionados à dengue em um repositório comum de dados, seguida da aplicação de técnicas de Ciência de Dados, como os algoritmos de aprendizado de máquina K-Means e Random Forest, além de análises estatísticas e visualização espacial. Inicialmente foi desenvolvida uma arquitetura de dados, usando conceitos de Big Data e Saúde Planetária, que foi utilizada como base para execução da avaliação do programa de combate à dengue de acordo com instrumento avaliativo desenvolvido nessa pesquisa. A solução proposta foi avaliada em um estudo de caso para os 645 municípios do Estado de São Paulo, em que foram desenvolvidos dois experimentos com utilização de técnicas de aprendizado de máquina e visualização de dados para extração de informação. Para ambos os experimentos, dados foram coletados de diversas fontes públicas e integrados em um data lake utilizando recursos de computação em nuvem. Além disso, foi desenvolvido um instrumento de avaliação considerando o modelo de Donabedian para avaliação de saúde que, em seguida, foi validado por especialistas de domínio. No primeiro experimento, aplicou-se o algoritmo K-Means para agrupar os municípios em quatro clusters de acordo com o contexto, como variáveis climáticas e socioeconômicas. Em seguida, foram realizadas avaliações dos indicadores dos componentes estrutura, processo e resultado do modelo Donabedian para identificar possíveis padrões. Nessas avaliações foram comparados os valores dos indicadores em municípios do mesmo cluster, assim como comparações dos indicadores entre clusters. Para monitoramento contínuo dos indicadores, foi desenvolvido no segundo experimento um painel de Business Intelligence através de uma ferramenta de visualização de dados. Os resultados dos experimentos revelaram importantes informações, como a insuficiência no número de agentes comunitários de saúde nos municípios com piores resultados. Ademais, foi observado que municípios com contextos mais favoráveis à disseminação da dengue tinham deficiências em relação à estrutura de saúde local. Os resultados mostraram que o uso de técnicas de Ciência de Dados para avaliação em saúde pode agregar diversos benefícios à gestão pública. Além da análise de fatores ambientais, a metodologia proposta nesta pesquisa possibilita que as avaliações possam ser realizadas em larga escala de forma mais eficiente, agregando valor ao processo de tomada de decisão na gestão pública.
Título en inglés
Untitled in english
Palabras clave en inglés
Big Data
Data Science
Dengue
Donabedian
Health assessments
Resumen en inglés
Dengue is a disease that affects millions of people annually worldwide. Brazil, which had eradicated the disease, has faced a high number of cases and seasonal epidemics again. Despite the public policies, there has been no improvement in the results of the dengue control program. The lack of understanding of the reasons for this failure makes dengue a problem that is difficult to solve. Health assessments typically use methods that are difficult to apply on a large scale and do not always consider contextual factors that may have a decisive influence on program results. On the other hand, the era of Big Data has presented opportunities for advances in knowledge in areas such as health. In this sense, this doctoral research aimed to develop a methodology based on Big Data for evaluating the dengue control program. In this methodology, we sought to integrate sources of data related to dengue into a common data repository, followed by the application of Data Science technique, such as K-Means and Random Forest machine learning algorithms, as well as statistical analysis and spatial visualization. Initially, a data architecture was developed, using concepts of Big Data and Planetary Health, which was used as a basis for carrying out the evaluation of the program to combat dengue according to the evaluation instrument developed in this research. The proposed solution was evaluated in a case study for the 645 municipalities in the State of São Paulo, in which two experiments were developed using machine learning techniques and data visualization for information extraction. For both experiments, data were collected from diverse public sources and integrated in a data lake using cloud computing resources. Additionally, an evaluation instrument was developed considering the Donabedian framework for health assessment and validate with domain experts. In the first experiment, the K-Means algorithm was applied to group the municipalities into four clusters according to the context, such as climate and socioeconomic variables. Then evaluations of the indicators of the structure, process, and result components of the Donabedian model were carried out to identify possible patterns. In these evaluations, the indicators values were compared in municipalities in the same cluster as well as comparisons of indicators between clusters. For continuous monitoring of indicators, a Business Intelligence panel was developed in the second experiment using a data visualization tool. The results of the experiments revealed important information, such as the insufficient number of community health agents in the municipalities with the worst results. Furthermore, it was observed that municipalities with contexts more favorable to the spread of dengue had deficiencies in relation to the local health structure. The results showed that the use of Data Science techniques for health assessment can add several benefits to public management. In addition to the analysis of context factors, the methodology proposed in this research allows assessments to be carried out on a large scale in a more efficient way, adding value to the decision-making process in public management.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2023-11-13
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.