Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.45.2023.tde-08022024-095259
Documento
Autor
Nome completo
Vinicius Santos Oliveira
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2023
Orientador
Banca examinadora
Lima, Antonio Carlos Pedroso de (Presidente)
Artes, Rinaldo
Ritter, Victor Silva
Título em português
Métodos de árvores de decisão em análise de sobrevivência: uma aplicação a dados de câncer
Palavras-chave em português
Análise de sobrevivência
Árvore de decisão
Árvore de sobrevivência
Ensembles
Predição
Resumo em português
A análise de sobrevivência é um conjunto de técnicas estatísticas amplamente utilizadas para analisar tempos até a ocorrência de um ou mais eventos. Dentre dos possíveis métodos de modelagem preditiva para dados de sobrevivência, as árvores de decisão têm destaque devido à sua capacidade de modelar relações complexas entre as covaríáveis e a ocorrência do evento de interesse. Neste trabalho, são estudadas técnicas de árvore de decisão para dados censurados, revisando suas metodologias, avaliando suas vantagens e desvantangens e apresentando extensões com uso de ensembles. Por fim, as diferentes técnicas são aplicadas ao conjunto de dados do ICESP e comparadas com a abordagem usual baseada no modelo de riscos proporcionais de Cox usando métricas de avaliação de performance e técnicas de validação cruzada.
Título em inglês
Decision tree methods in survival analysis: an application to cancer dataset
Palavras-chave em inglês
Decision tree
Ensembles
Prediction
Survival analysis
Survival tree
Resumo em inglês
Survival analysis is a set of statistical techniques widely used to analyze the time to the occurrence of one ore more events. Among the possible predictive modeling methods for survival data, decision trees stand out for their ability to model complex relationships between covariates and the occurrence of the event of interest. In this work, decision tree techniques for censored data are studied, their methods are reviewed, evaluating advantages and disadvantages, and their extensions using ensembles are presented. Finally, the different techniques are applied to the ICESP dataset and compared with the Cox proportional hazards model using predictive performance metrics and cross validation techniques.
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2024-03-01