Doctoral Thesis
DOI
https://doi.org/10.11606/T.55.2021.tde-18082021-100555
Document
Author
Full name
Jorge Francisco Cutigi
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2021
Supervisor
Committee
Simão, Adenilso da Silva (President)
Minardi, Raquel Cardoso de Melo
Paschoal, Alexandre Rossi
Rodrigues, Francisco Aparecido
Title in English
Computational approaches for the discovery of significant genes in cancer
Keywords in English
Cancer bioinformatics
Cancer genomics
Cancer mutation data
Computational approach
Gene interaction networks
Significant genes in cancer
Significant mutations in cancer
Abstract in English
Cancer is a complex disease caused by the accumulation of genetic alterations during the individuals life. These alterations are named genetic mutations, which may be divided into two groups: 1) Passenger mutations: mutations that do not change the behavior of the cell; 2) Driver mutations: significant mutations for cancer, that cause carcinogenesis. Cancer cells have a large number of mutations, in which the large majority of them are passenger, and few mutations are drivers. The identification of significant mutated genes, i.e., genes with driver mutations, is essential for the understanding of the mechanisms of cancer initiation and progression. Such a task is a key challenge in cancer genomics, since several studies have shown many significant genes are mutated at a very low frequency. With the next generation DNA sequencing, large and complex genomic datasets have been generated, creating the challenge of analyzing and interpreting this data. Towards uncovering infrequently mutated genes, gene interaction networks combined with mutation data have been explored. This research presents computational approaches for the discovery of reliable significant cancer genes. Such a genes are prioritized by a network-based method which combines weighted mutation frequency and network neighbors influence, and possible false-positives are detected by machine learning-based method which uses mutation data and gene interaction networks to induce predictive models. An experimental study conducted with six types of cancer revealed the potential of the approaches on the discovering of known and possible novel reliable significant cancer genes.
Title in Portuguese
Abordagens computacionais para a descoberta de genes significativos para o câncer
Keywords in Portuguese
Abordagem computacional
Bioinformática do câncer
Dados de mutação em câncer
Genes significativos para o câncer
Genômica do câncer
Mutações significativas para o câncer
Redes de interação gênica
Abstract in Portuguese
O câncer é uma doença complexa provocada por alterações genéticas que se acumulam por toda a vida do indivíduo. A essas alterações dá-se o nome de mutação genética, as quais podem ser divididas em dois grupos: 1) Passenger mutations: mutações que não alteram o comportamento da célula; 2) Driver mutations: mutações significativas para o câncer, ou seja, que provocam a carcinogênese na célula. Células de câncer possuem um elevado número de mutações, das quais a maioria delas são passenger mutations e um pequeno número delas são driver mutations. A identificação de genes significativamente mutados, isto é, genes com mutações significativas, é essencial para a compreensão dos mecanismos de iniciação e progressão do câncer. Essa tarefa é um desafio chave na genômica do câncer, uma vez que estudos mostram que genes significativos podem sofrer mutação em uma frequência muito baixa. Com o sequenciamento de nova geração, uma extensa quantidade de conjuntos de dados genômicos foram gerados, criando o desafio de analisar e interpretar esses dados. Para identificar genes relacionados ao câncer com taxa de mutação baixa, redes de interação gênica combinadas com dados de mutação têm sido exploradas. Neste contexto, esta pesquisa apresenta abordagens computacionais para a descoberta de genes significativos para o câncer. O genes são priorizados por um método baseado em redes que combina frequência de mutação ponderada e influência de vizinhos na rede, e possíveis falsos positivos são detectados por método baseado em aprendizado de máquina, o qual utiliza-se de dados de mutação e redes de interação gênica para induzir modelos preditivos. Um estudo experimental conduzido com seis tipos de câncer revelou o potencial das abordagens na descoberta de genes já conhecidos e de possíveis novos genes significativos para o câncer.
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2021-08-18