• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
https://doi.org/10.11606/T.95.2023.tde-17012024-115249
Documento
Autor
Nome completo
Helena Beatriz da Conceição
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2023
Orientador
Banca examinadora
Galante, Pedro Alexandre Favoretto (Presidente)
Massirer, Katlin Brauer
Paschoal, Alexandre Rossi
Torres, Tatiana Teixeira
Título em português
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
Palavras-chave em português
Bioinformática
Evolução
Funcionalidade
Identificação
Retrocópias
Resumo em português
Retrocópias (também nomeadas de pseudogenes processados) são cópias de genes codificadores originadas por meio do mecanismo de duplicação mediado por RNA e são caracterizadas pela conservação apenas dos exons de seus genes parentais, a ausência de íntrons, frequente presença de cauda poliA integrada ao genoma e ausência de regiões promotoras parentais. Essas características são utilizadas para identificar retrocópias desde a década de 1980, quando muitos genes retroduplicados humanos foram reportados pela primeira vez. No entanto, a busca sistemática por retrocópias tornou-se possível apenas após o sequenciamento e montagem completos do Genoma Humano, que possibilitou o desenvolvimento de tecnologias de sequenciamento mais avançadas, melhorias na anotação do transcriptoma e o surgimento de novas ferramentas computacionais. No início dos anos 2000, as primeiras análises abrangentes para identificar retrocópias no genoma humano e em outras espécies foram realizadas, seguidas por estudos adicionais que se estendem até hoje. No entanto, a literatura sobre identificação e análise funcional de retrocópias ainda carece de análises aprofundadas e abordagens mais abrangentes. Nesta tese apresentamos uma investigação sistemática e abrangente para a identificação de retrocópias em 44 espécies, de humanos a invertebrados. Primeiro, construímos uma pipeline para identificar, caracterizar, organizar e disponibilizar via web informações sobre as 219.948 retrocópias desses 44 organismos. Todas as informações sobre posição genômica, genes parentais, tamanho das retrocópias, expressão, conservação entre espécies, entre outras, foram organizadas em um banco de dados público, a RCPedia2.0. Em um estudo complementar, investigamos o impacto e potencial funcional das retrocópias transcritas no genoma humano. Para isso, realizamos análises complexas que combinaram dados de sequenciamento de RNA de múltiplos tecidos, dados epigenéticos, e de Ribosome Sequencing para, primeiro, elucidar a expressão de retrocópias e como elas podem ser reguladas e depois avaliar suas funcionalidades. Descobrimos que aproximadamente 50% (cerca de 4.000) das retrocópias presentes no genoma humano são expressas e apresentam seus níveis de expressão regulados em tecidos saudáveis. Cerca de 25% dessas retrocópias são expressas em apenas um tecido (principalmente nos testículos), enquanto que aproximadamente 15% delas são expressas em todos os tecidos humanos investigados. Nossos dados indicam que a força motriz para a expressão dessas retrocópias é a sua localização genômica próxima a genes codificadores de proteína ou a idade (mais antiga) de origem dessas retrocópias. Confirmamos ainda que um subconjunto de retrocópias é traduzido, enfatizando seu potencial funcional. Portanto, nesta tese, destacamos um segmento frequentemente ignorado no transcriptoma humano e de outras espécies: as retrocópias (ou pseudogenes processados). Não apenas revelamos o considerável potencial funcional delas e sua capacidade de gerar inovações genéticas por meio do mecanismo de retrotransposição de genes codificadores, mas também estabelecemos as bases para uma exploração abrangente e específica de cada uma dessas numerosas retrocópias.
Título em inglês
Origins andfunctional potential of retrocopies in the genome of humans and other animals: a large-scale approach to identify retrocopies in diverse animal genomes and study their expression pattern in normal human tissues.
Palavras-chave em inglês
Animals
Bioinformatics
Evolution
Expression
Functionality
Humans
Identification
Retrocopies
Resumo em inglês
Processed pseudogenes, also known as retrocopies, are copies of coding genes originating through the RNA-mediated duplication mechanism. They are characterized by the conservation of only the exons of their parental genes, the absence of introns, frequent presence of integrated poly-A tails into the genome, and the absence of parental promoter regions. These characteristics have been used to identify retrocopies since the 1980s when many human retroduplicated genes were first reported. However, the systematic search for retrocopies became possible only after the complete sequencing and assembly of the Human Genome, enabling the development of more advanced sequencing technologies, improvements in transcriptome annotation, and the emergence of new computational tools. In the early 2000s, the first comprehensive analyses to identify retrocopies in the human genome and other species were conducted, followed by additional studies that continue to this day. However, the literature on the identification and functional analysis of retrocopies still lacks in-depth analyses and more comprehensive approaches. In this thesis, we present a systematic and comprehensive investigation for the identification of retrocopies in 44 species, ranging from humans to invertebrates. First, we constructed a pipeline to identify, characterize, organize, and make information about the 219,948 retrocopies of these 44 organisms available via the web. All information, including genomic position, parental genes, retrocopy size, expression, conservation between species, among others, was organized in a public database, RCPedia 2.0. In a complementary study, we investigated the impact and functional potential of transcribed retrocopies in the human genome. For this, we conducted complex analyses combining RNA sequencing data from multiple tissues, epigenetic data, and Ribosome Sequencing to first elucidate retrocopy expression and how they may be regulated, and then evaluate their functionalities. We found that approximately 50% (around 4,000) of retrocopies in the human genome are expressed and have their expression levels regulated in healthy tissues. About 25% of these retrocopies are expressed in only one tissue (mainly in the testes), while approximately 15% of them are expressed in all investigated human tissues. Our data indicate that the driving force for the expression of these retrocopies is their genomic proximity to protein-coding genes or the (older) age of origin of these retrocopies. We further confirmed that a subset of retrocopies is translated, emphasizing their functional potential. Therefore, in this thesis, we highlight a frequently overlooked segment in the human and other species' transcriptome: retrocopies (or processed pseudogenes). We not only reveal their considerable functional potential and their ability to generate genetic innovations through the mechanism of retrotransposition of coding genes but also lay the groundwork for a comprehensive and specific exploration of each of these numerous retrocopies.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2024-01-18
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.