• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.5.2020.tde-29012021-143358
Document
Author
Full name
Leonardo Freitas Boaventura Rios
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2020
Supervisor
Committee
Moysés, Raquel Ajub (President)
Bessa Junior, José de
Castro Junior, Gilberto de
Kowalski, Luiz Paulo
Title in Portuguese
Modelos de predição de risco de morte para pacientes com carcinoma epidermoide de cabeça e pescoço
Keywords in Portuguese
Análise de sobrevida
Árvores de decisões
Mineração de dados
Modelos logísticos
Neoplasias de cabeça e pescoço
Predição
Prognóstico
Redes neurais
Abstract in Portuguese
INTRODUÇÃO: O carcinoma epidermóide de cabeça e pescoço (CECP) é uma das neoplasias malignas mais prevalentes no mundo. Assim como para diversas neoplasias, o Sistema TNM é a principal ferramenta para predição de sobrevida global em cinco anos e utiliza informações anatômicas, histopatológicas, funcionais e de infecção pelo Papilomavírus Humano (HPV). Contudo, a eficácia do TNM é questionada por categorizar pacientes em grupos de risco heterogêneos, além de não poder ser aplicado para predição de risco individualizado de morte. OBJETIVO: Criar uma ferramenta preditiva de mortalidade em cinco anos para pacientes com CECP para ser aplicada previamente ao tratamento, que fosse superior ao TNM, bem como avaliar a contribuição de dados sobre infecção pelo HPV nesta predição. MÉTODOS: estudo retrospectivo de dados prospectivamente coletados pelo grupo de pesquisa GENCAPO entre julho de 2000 e agosto de 2011. Todos os pacientes possuíam diagnóstico de carcinoma epidermoide da cavidade oral, orofaringe, hipofaringe e laringe, sem tratamento prévio e com ao menos cinco anos de seguimento. Os dados foram minerados utilizando Árvores de Classificação e Regressão, Florestas Aleatórias e Boosted and Regression Trees. Um modelo de regressão logística (RL) e outro com Redes Neurais (RN) foram criados para todos os sítios e para cada um dos sítios isoladamente. Métodos de validação interna, de discriminação por área sob a curva ROC (ASC) e calibração (Goodness of Fit) foram realizados. Amostras de tumor parafinadas de 692 pacientes foram testadas para o DNA do HPV por reação em cadeia de polimerase (PCR). O incremento preditivo do HPV foi analisado pelo coeficiente de determinação e pela ASC. RESULTADOS: A análise contou com 1811 pacientes e a taxa de positividade para o HPV foi de 8,7% para todos os sítios e 11,8% para orofaringe. Após a mineração de dados, 28 variáveis preditivas foram selecionadas. O modelo de RL para todos os sítios selecionou como variáveis significativas o volume clínico, sexo, idade e linfonodomegalia, com ASC=0,77. Já o modelo de RN obteve uma ASC=0,76. Os modelos de RL para cavidade oral e orofaringe selecionaram as mesmas variáveis que o modelo de todos os sítios, já o modelo de laringe excluiu sexo como variável, enquanto o modelo de hipofaringe selecionou apenas idade e linfonodomegalia. As medidas de ASC para cavidade oral foram: 0,78 (RL) e 0,74 (RN); para orofaringe de 0,72 (RL) e 0,65 (RN); para hipofaringe de 0,45 (RL) e 0,58 (RN); e para laringe de 0,71 (RL) e 0,76 (RN). Todos os modelos, exceto os criados para hipofaringe, apresentaram boa calibração. Comparando as curvas de sobrevida dos pacientes categorizados pelo risco calculado em quatro quartis (Q1<= 25%, 25 < Q2 <= 50%, 50 < Q3 <- 75% e Q4 > 75%), com as curvas geradas sistema TNM, as primeiras apresentaram visualmente melhor separação entre as diferentes categorias de risco. Não houve incremento preditivo ao adicionar o HPV a nenhum dos modelos. CONCLUSÃO: Foi possível criar modelos preditivos com boa performance, a partir de informações facilmente coletáveis e superior ao TNM para predição de morte em cinco anos para pacientes com CECP. Em nossa população, não houve incremento preditivo ao incluir nos modelos o status HPV
Title in English
Prediction models of death for patients with head and neck squamous cell carcinoma
Keywords in English
Data mining
Decision trees
Head and neck neoplasms
Logistic models
Neural networks
Prediction
Prognosis
Survival analyses
Abstract in English
INTRODUCTION: Head and neck squamous cell carcinoma (HNSCC) is among the most prevalent neoplasms in the world. Likewise in other malignancies, the TNM System is the main tool for the prediction of 5-year overall survival and is based on anatomical, histological, and clinical information, as well as data on Human Papillomavirus (HPV) infection. However, the efficacy of this system is criticized by joining patients into heterogeneous categories, as well as for not being able to predict individualized probabilities of death. OBJECTIVES: To create a 5-year mortality prediction model to be applied at the first presentation, that performs better than TNM, as well as to evaluate the incremental contribution of HPV status to this model. METHODS: a retrospective study of data prospectively collected between July 2000 and August 2011 by the GENCAPO study group. Data were mined using Classification and Regression Trees, Random Forests, and Boosted and Regression Trees. Logistic Regression (LR) and Artificial Neural Network (ANN) models were created for all tumor sites and for each site separately. Methods of internal validation, discrimination - by the area under the ROC curve (AUC) - and calibration - Goodness of Fit test - were performed. Paraffinembedded tumor samples from 692 patients were tested for HPV DNA by polymerase chain reactions (PCR). The contribution of HPV on model performance was analyzed by the coefficient of determination and the AUC. RESULTS: 1811 patients were analyzed, and HPV was positive in 8,7% of all tumors and in 11,8% of oropharyngeal tumors. After data mining the predictive variables, 28 were selected. The LR model for all sites selected tumor volume, sex, age, and lymph node enlargement as significant variables, with an AUC=0.77, while the ANN model obtained an AUC=0.76. The LR models for oral cavity and oropharynx tumors selected the same variables as the model for all sites, the LR model for larynx excluded sex as a significant variable, while the LR model for hypopharynx select only age and lymph node enlargement. The AUC for tumors of the oral cavity were 0.78 (LR) and 0.74 (ANN); for oropharynx were 0.72 (LR) and 0.65 (ANN); for hypopharynx were 0.45 (LR) and 0.58 (ANN); and for larynx were 0.71 (LR) and 0.76 (ANN). All models, except for the hypopharynx, presented good calibration. The survival curves according to the quartiles of predicted risk of death (Q1 <= 25%, 25 < Q2 <= 50%, 50 < Q3 <= 75% e Q4 >75%) and according to the TNM stage were compared. The quartile curves presented a better visual separation than the TNM stage curves. There was no prediction increment by adding HPV status to any of the models. CONCLUSION: It was possible to develop models with good performance to predict 5- year survival, with easy to retrieve information, that were superior to the TNM System. No prediction increment was obtained by adding HPV status to the models in our study population
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2021-02-03
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2022. All rights reserved.