• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.17.2020.tde-07092020-102951
Documento
Autor
Nome completo
Gabriel Bazo
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
Ribeirão Preto, 2020
Orientador
Banca examinadora
Vencio, Ricardo Zorzetto Nicoliello (Presidente)
Alves, Domingos
Ferraro, Alexandre Archanjo
Título em português
Desenvolvimento e análise de modelos de estatística multivariada baseados em aprendizado de máquina: predição de partos pré-termo na coorte de nascimento BRISA em Ribeirão Preto
Palavras-chave em português
Aprendizado de máquina
Modelos de predição
Parto pré-termo
Políticas de saúde
Saúde perinatal
Resumo em português
Introdução: O nascimento pré-termo (PT) é um dos principais fatores que levam a morte e causa, a longo prazo, significativa perda de capacidade, tanto física quanto psicológica entre os sobreviventes. Objetivos: Desenvolver uma ferramenta computacional baseada em Aprendizado de Máquina capaz de predizer o nascimento PT em uma coorte de nascimentos brasileira. Métodos: Estudo transversal aninhado a coorte BRISA, que coletou informações sobre todos os nascimentos em 8 hospitais de Ribeirão Preto, Brasil, 2010. Foram aplicados questionários para a mãe. Nesta análise, apenas as informações maternas anteriores ao nascimento foram utilizadas. Usou-se características sociodemográficas, estilo de vida e acompanhamento pré-natal. Uma regressão foi utilizada para determinar as variáveis independentes e a variável dependente foi criada a partir da categorização da idade gestacional (<37s PT, ≥37s termo). Seis algoritmos de predição foram testados, Random Forest (RF), Support vector machines (SVM), Naive Bayes (NB), Decision Tree (DT), Linear discriminant analysis (LDA) e K-nearest neighbors (KNN). Resultados: 7699 gestantes participaram e 7651 atenderam todos os critérios de inclusão. A idade média foi de 27 anos (±6,25), 44,22% eram primíparas. A taxa total de PT foi de 12,7%. As variáveis com maior poder de predição para o parto PT, foram: ocorrência de um parto anterior PT, ameaça de parto PT na gestação atual, quantidade de consultas do pré-natal no segundo e terceiro trimestre da gestação, realização e tipo de serviço do pré-natal, número de fetos, hospitalização durante a gestação, ocorrência de doenças durante a gestação corrente, hipertensão gestacional, anemia e quantidade de filhos vivos. RF apresentou a maior acurácia (acc=0,913), sensibilidade (s=0,81) e área sob a curva (auc=0,842). KNN apresentou a maior especifidade (e=0,972). SVM o maior valor positivo preditivo (vpp=0,649). NB o maior valor preditivo negativo (vpn=0,984). Uma simulação computacional de um pré-natal, nas normas do Ministério da Saúde, em mães nas quais o modelo de predição (SVM) indicou a ocorrência de um possível parto PT, demonstrou uma redução de 3,9% no número de nascimentos PT (0,5 na porcentagem). Em âmbito nacional, no ano de 2017 seria possível uma redução de cerca de 12,7 mil partos PT, com economia média de 119 milhões de reais, para sistemas público e privado. Conclusão: Fatores como hospitalização durante a gravidez, hipertensão, tipo de serviço e características do pré-natal foram determinantes para a predição do parto PT. O estudo demonstrou ainda que, foi possível desenvolver modelos de predição para partos PT e sugere-se que esses modelos, adotados em nível nacional por meio de políticas públicas de saúde possam reduzir o número de partos PT, impactar o custo da saúde pública no pais e melhorar a qualidade de vida da mãe e seu recém-nascido.
Título em inglês
Development and analysis of multivariate statistical models based on machine learning: prediction of preterm births in the BRISA birth cohort in Ribeirão Preto
Palavras-chave em inglês
Health policies
Machine learning
Perinatal health
Prediction models
Preterm birth
Resumo em inglês
Introduction: Preterm birth (PB) is one of the main factors that lead to death and causes, in the long term, significant loss of capacity, both physical and psychological among survivors. Objectives: To develop a computational tool based on Machine Learning capable of predicting PB in a Brazilian birth cohort. Methods: This is a cross-sectional study, based on the BRISA cohort, which collected information on all births in 8 hospitals in Ribeirao Preto, Brazil in 2010. Questionnaires about the mother and the newborn were applied. In this analysis, only maternal information prior to birth was considered. Sociodemographic characteristics, lifestyle, characteristics of pregnancy and prenatal care were used. A non-parametric regression was used to determine the independent variables and the dependent variable was created from the categorization of gestational age (<37s PT, ≥37s term). Six prediction algorithms were tested, Random Forest (RF), Support vector machines (SVM), I Bayes (NB), Decision Tree (DT), Linear discriminant analysis (LDA) and K-nearest neighbors (KNN). Results: 7699 pregnant women participated and 7651 met all inclusion criteria. The average age was 27 years old (+/- 6,25), 44.22% were primiparous. The total PB rate was 12.7%. The variables with the greatest predictive power for PB delivery were: occurrence of a previous PB delivery, threat of PB delivery in the current pregnancy, number of prenatal consultations in the second and third trimester of pregnancy, performance and type of service of the PB prenatal care, number of fetuses, hospitalization during pregnancy, occurrence of diseases during current pregnancy, gestational hypertension, anemia and number of live children. RF showed the highest accuracy (acc = 0.913), the highest sensitivity (s = 0.81) and the largest area under the curve (auc = 0.842). KNN had the highest specificity (e = 0.972). SVM had the highest positive predictive value (vpp = 0.649). NB, in turn, obtained the highest negative predictive value (vpn = 0.984). The computer simulation of prenatal care, in the Ministry of Health standards, in mothers in whom the prediction model (SVM) indicated the occurrence of a possible PB, demonstrated a 3.9% reduction in the number of PB (0.5 in percentage). Therefore, at the national level, in the year 2017 a reduction of around 12.7 thousand PB births would be possible, an average saving of 119 million reais, for both public and private systems. Conclusion: Factors such as hospitalization during pregnancy, hypertension, type of service and characteristics of prenatal care were determinant for the prediction of PB delivery. The study also demonstrated that it is possible to develop prediction models based on Machine Learning for PB deliveries, and it is suggested that these models, adopted at national level through public health policies, can reduce the number of PB deliveries, impacting the cost of public health in the country, and much more, the quality of life of the mother and her newborn.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
GABRIELBAZOco.pdf (9.19 Mbytes)
Data de Publicação
2020-10-19
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2020. Todos os direitos reservados.