• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.9.2023.tde-01112023-144151
Document
Author
Full name
Jeffersson Leandro Jimenez Restrepo
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2023
Supervisor
Committee
Nakaya, Helder Takashi Imoto (President)
Chammas, Roger
Martins, Mariana Lima Boroni
Reis, Eduardo Moraes Rego
Title in Portuguese
Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
Keywords in Portuguese
Câncer
Expressão gênica
Machine learning
RNA-seq
Sobrevida
Abstract in Portuguese
As técnicas de aprendizado de máquina têm se destacado na identificação de padrões em dados de RNA-seq, particularmente no reconhecimento de padrões de expressão gênica associados à sobrevivência em casos de câncer. No entanto, um desafio persistente é a validação destes padrões em novos conjuntos de amostras, visto que a acurácia frequentemente diminui. A razão primária para tal é que muitos desses modelos se baseiam em estruturas matemáticas, sem um embasamento biológico. Para contornar esta limitação, focamos em processos biológicos naturalmente associados com a sobrevida dos pacientes com câncer. Estudos recentes apontam para uma associação entre genes de reparo de DNA e a sobrevivência global em vários tipos de câncer. Com base nisso, nosso trabalho inicial visou criar e validar um score que levasse em conta a expressão destes genes em 32 coortes de pacientes com tumores primários do banco de dados TCGA. Em consequência, a estratégia simples de conformação de 7 scores de desregulação, composto com 10 genes de reparo ao DNA mostrou uma associação com a sobrevida em 31 coortes diferentes, englobando mais de 10,000 pacientes. Além disso, foi possível validar um destes score em dados scRNA-seq de células tumorais de amostras de pacientes com câncer de ovário. Os modelos de aprendizado de máquina na análise de sobrevivência mostraram-se bem ajustados aos conjuntos dados de expressão onde foram gerados. Identificamos nos dois algoritmos surv.blackboost e surv.ranger, junto ao método de composição, as melhores estratégias para a análise de sobrevivência. Em síntese, os scores de desregulação utilizando genes envolvidos nos mecanismos de reparo ao DNA estão associados com a sobrevida global em diferentes tipos de câncer enquanto os métodos de aprendizados tem um overfitting ao conjunto de genes analisados.
Title in English
Development and validation of a DNA repair pathway deregulation score in predicting prognosis in different types of cancer
Keywords in English
Cancer
Gene expression
Machine learning
RNA-seq
Survival
Abstract in English
Machine learning techniques have been prominent in identifying patterns in RNA-seq data, particularly in recognizing gene expression patterns associated with survival in cancer cases. However, a persistent challenge is the validation of these patterns in new sample sets, as accuracy often decreases. The primary reason for this is that many of these models rely on mathematical structures without a biological meaning. To address this limitation, we focused on biological processes naturally associated with the survival of cancer patients. Recent studies point to an association between DNA repair genes and overall survival in various types of cancer. Based on this, our initial work aimed to create and validate a score that took into account the expression of these genes in 32 cohorts of patients with primary tumors from the TCGA database. As a result, the simple strategy of conforming 7 deregulation scores, composed of 10 DNA repair genes, showed an association with survival in 31 different cohorts, encompassing over 10,000 patients. Furthermore, it was possible to validate one of these scores in scRNA-seq data from tumor cells from ovarian cancer patient samples. Machine learning models in survival analysis were well-suited to the expression data sets where they were generated. We identified in the two algorithms, surv.blackboost and surv.ranger, along with the composition method, the best strategies for survival analysis. In summary, the deregulation scores using genes involved in DNA repair mechanisms are associated with overall survival in different types of cancer, while learning methods are highly tailored to the algorithm and the set of genes analyzed.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2023-12-08
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.