• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tesis Doctoral
DOI
https://doi.org/10.11606/T.17.2023.tde-05062023-114855
Documento
Autor
Nombre completo
Tamara Soledad Frontanilla Recalde
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
Ribeirão Preto, 2023
Director
Tribunal
Mendes Junior, Celso Teixeira (Presidente)
Carvalho, Elizeu Fagundes de
Marrero, Andrea Rita
Silva Junior, Ronaldo Carneiro da
Título en portugués
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
Palabras clave en portugués
Bioinformática
Genética forense
Microssatélites
Repetições curtas em tandem
Sequenciamento massivo em paralelo
Resumen en portugués
Os marcadores STRs compreendem cerca de 3% do genoma humano. Uma estratégia para compreender melhor a constituição genética de uma população é estimar a distribuição das frequências alélicas de marcadores STRs. A técnica de PCR junto com a eletroforese capilar são, até hoje, as técnicas de escolha para a genotipagem de marcadores STR. As tecnologias de NGS revolucionaram as ciências biológicas, permitindo o sequenciamento simultâneo de muitas amostras de DNA ou RNA em um curto período de tempo. Com os avanços tecnológicos e a utilização cada vez mais frequente das técnicas de NGS surge a necessidade de testar a efetividade dessa técnica na genotipagem de marcadores STRs. Algumas ferramentas foram desenvolvidas para analisar estes marcadores a partir de dados de NGS, tais como STRait Razor, toaSTR, e HipSTR, entre outras. Existem vários projetos colaborativos internacionais como o Projeto Genoma Humano, o projeto 1000 genomas, o Human Genome Diversity Project (HGDP) entre outros, que disponibilizaram os dados de sequência dos indivíduos analisados, permitindo que estes genomas possam ser estudados com diferentes abordagens voltadas para o estudo da variação genética entre populações diferentes ao redor do mundo. Esse trabalho tem como hipótese que conjuntos de marcadores STRs utilizados para identificação humana e genotipados a partir de genomas completos seriam adequados para estudos de diversidade genética e estimativas de ancestralidade populacional e individual. O objetivo geral foi avaliar os níveis de diversidade e a estrutura genética de populações humanas de diferentes regiões biogeográficas por meio de conjuntos de marcadores STR genotipados com tecnologia de sequenciamento de nova geração. Foram estudados 22 marcadores autossômicos (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX e vWA) em amostra populacional do Estado de São Paulo e em genomas sequenciados no âmbito dos projetos 1000 Genomes e HGDP, utilizando três programas: HipSTR, STRait Razor e toaSTR. Observou-se elevada consistência e acurácia quando comparados os resultados obtidos pela utilização destas três ferramentas. Entretanto, o uso de mais de um software contribui para aumentar a acurácia na inferência de genótipos, principalmente nos marcadores (D21S11, Penta D, Penta E) em que se observou maiores taxas de erros. Com os genótipos obtidos, foi avaliada a diversidade genética entre populações de diferentes regiões biogeográficas e foi estimada a ancestralidade populacional de populações miscigenadas. O conjunto de marcadores STR aqui utilizados mostrou ser efetivos para estimar a estrutura populacional e a ancestralidade em níveis populacional e individual. Apesar da menor diversidade interpopulacional característica destes marcadores, os resultados obtidos se mostraram perfeitamente alinhados ao conhecimento pré-existente relacionado à história demográfica das populações estudadas.
Título en inglés
Genetic diversity of global populations inferred by autosomal STRs used for human identification genotyped from complete genomes
Palabras clave en inglés
Bioinformatics
Forensic genetics
Massively parallel sequencing
Microsatellites
Short tandem repeats
Resumen en inglés
STR markers comprise about 3% of the human genome. One strategy to better understand the genetic make-up of a population is to estimate the distribution of allele frequencies of STR markers. The PCR technique together with capillary electrophoresis are, until today, the techniques of choice for genotyping STR markers. NGS technologies have revolutionized the biological sciences, allowing the simultaneous sequencing of many DNA or RNA samples in a short period of time. With technological advances and the increasingly frequent use of NGS techniques, there is a need to test the effectiveness of this technique in genotyping STR markers. Some tools have been developed to analyze these markers from NGS data, such as STRait Razor, toaSTR, and HipSTR, among others. There are several international collaborative projects such as the Human Genome Project, the 1000 Genomes Project, the Human Genome Diversity Project (HGDP) among others, which made available the sequence data of the analyzed individuals, allowing these genomes to be studied with different approaches aimed at studying the genetic variation among different populations around the world. The hypothesis of the present study is that sets of STR markers used for human identification and genotyped from complete genomes would be suitable for studies of genetic diversity and estimates of population and individual ancestry. The general objective was to evaluate the levels of diversity and the genetic structure of human populations from different biogeographical regions through sets of STR markers genotyped with next-generation sequencing technology. Twenty-two STR markers (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX, and vWA) were studied in a population sample from the State of São Paulo and in genomes sequenced within the scope of the 1000 Genomes and HGDP projects, using three programs: HipSTR, STRait Razor and toaSTR. High consistency and accuracy were observed when comparing the results obtained by using these three tools. However, the use of more than one software contributes to increase the accuracy in the inference of genotypes, mainly in the markers (D21S11, Penta D, Penta E) in which higher error rates were observed. With the genotypes obtained, the genetic diversity between populations from different biogeographical regions was evaluated and the population ancestry of mixed populations was estimated. The set of STR markers used here proved to be effective for estimating population structure and ancestry at population and individual levels. Despite the lower interpopulational diversity characteristic of these markers, the results obtained were perfectly aligned with the pre-existing knowledge related to the demographic history of the studied populations.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2023-06-12
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.