• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
https://doi.org/10.11606/T.9.2023.tde-01112023-144151
Documento
Autor
Nome completo
Jeffersson Leandro Jimenez Restrepo
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2023
Orientador
Banca examinadora
Nakaya, Helder Takashi Imoto (Presidente)
Chammas, Roger
Martins, Mariana Lima Boroni
Reis, Eduardo Moraes Rego
Título em português
Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
Palavras-chave em português
Câncer
Expressão gênica
Machine learning
RNA-seq
Sobrevida
Resumo em português
As técnicas de aprendizado de máquina têm se destacado na identificação de padrões em dados de RNA-seq, particularmente no reconhecimento de padrões de expressão gênica associados à sobrevivência em casos de câncer. No entanto, um desafio persistente é a validação destes padrões em novos conjuntos de amostras, visto que a acurácia frequentemente diminui. A razão primária para tal é que muitos desses modelos se baseiam em estruturas matemáticas, sem um embasamento biológico. Para contornar esta limitação, focamos em processos biológicos naturalmente associados com a sobrevida dos pacientes com câncer. Estudos recentes apontam para uma associação entre genes de reparo de DNA e a sobrevivência global em vários tipos de câncer. Com base nisso, nosso trabalho inicial visou criar e validar um score que levasse em conta a expressão destes genes em 32 coortes de pacientes com tumores primários do banco de dados TCGA. Em consequência, a estratégia simples de conformação de 7 scores de desregulação, composto com 10 genes de reparo ao DNA mostrou uma associação com a sobrevida em 31 coortes diferentes, englobando mais de 10,000 pacientes. Além disso, foi possível validar um destes score em dados scRNA-seq de células tumorais de amostras de pacientes com câncer de ovário. Os modelos de aprendizado de máquina na análise de sobrevivência mostraram-se bem ajustados aos conjuntos dados de expressão onde foram gerados. Identificamos nos dois algoritmos surv.blackboost e surv.ranger, junto ao método de composição, as melhores estratégias para a análise de sobrevivência. Em síntese, os scores de desregulação utilizando genes envolvidos nos mecanismos de reparo ao DNA estão associados com a sobrevida global em diferentes tipos de câncer enquanto os métodos de aprendizados tem um overfitting ao conjunto de genes analisados.
Título em inglês
Development and validation of a DNA repair pathway deregulation score in predicting prognosis in different types of cancer
Palavras-chave em inglês
Cancer
Gene expression
Machine learning
RNA-seq
Survival
Resumo em inglês
Machine learning techniques have been prominent in identifying patterns in RNA-seq data, particularly in recognizing gene expression patterns associated with survival in cancer cases. However, a persistent challenge is the validation of these patterns in new sample sets, as accuracy often decreases. The primary reason for this is that many of these models rely on mathematical structures without a biological meaning. To address this limitation, we focused on biological processes naturally associated with the survival of cancer patients. Recent studies point to an association between DNA repair genes and overall survival in various types of cancer. Based on this, our initial work aimed to create and validate a score that took into account the expression of these genes in 32 cohorts of patients with primary tumors from the TCGA database. As a result, the simple strategy of conforming 7 deregulation scores, composed of 10 DNA repair genes, showed an association with survival in 31 different cohorts, encompassing over 10,000 patients. Furthermore, it was possible to validate one of these scores in scRNA-seq data from tumor cells from ovarian cancer patient samples. Machine learning models in survival analysis were well-suited to the expression data sets where they were generated. We identified in the two algorithms, surv.blackboost and surv.ranger, along with the composition method, the best strategies for survival analysis. In summary, the deregulation scores using genes involved in DNA repair mechanisms are associated with overall survival in different types of cancer, while learning methods are highly tailored to the algorithm and the set of genes analyzed.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2023-12-08
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.