• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.59.2022.tde-22112022-161656
Documento
Autor
Nombre completo
Vítor Matheus Soares Moraes
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
Ribeirão Preto, 2022
Director
Tribunal
Mendes Junior, Celso Teixeira (Presidente)
Alho, Clarice Sampaio
Marrero, Andrea Rita
Título en portugués
Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
Palabras clave en portugués
Ancestralidade
Genética forense
Identificação humana
Imputação
Polimorfismos de nucleotídeo único
Resumen en portugués
A partir da introdução da PCR no final do século XX, tornou-se possível a análise dos Short Tandem Repeats, sendo até os dias de hoje o padrão para as análises periciais no âmbito de investigações policiais. Os marcadores mais abundantes no material genético humano são os polimorfismos de base única, chamados de SNPs, onde devido ao tamanho de seus amplicons, a possibilidade de trabalho com amostras degradadas demonstra uma vantagem em relação aos STRs. Porém, é necessária uma quantidade de aproximadamente 3 vezes mais marcadores, quando comparados aos microssatélites, para a obtenção de valores estatísticos viáveis para a utilização investigativa. Marcadores informativos de ancestralidade (AIMs) são polimorfismos que apresentam frequências alélicas elevadas em uma população e não em outras, sendo então utilizados para identificar as contribuições de ancestralidade genéticas individuais e populacionais de uma amostragem. São compostos por SNPs (AISNPs) em sua vasta maioria, podendo ser aplicados de maneira a identificar riscos epidemiológicos ou em investigações policiais. Apresentam também a possibilidade de uso para identificação humana em populações miscigenadas devido ao aumento da variabilidade genética. O objetivo do projeto é desenvolver dois painéis distintos que contenham entre 30-50 AIMs, para inferência de ancestralidade e para a identificação individual, para utilização na população brasileira e miscigenadas da américa latina utilizando 399 AIMs pertencentes aos painéis PIMA, SNPforID 34-plex, Kidd Lab set of 55 AISNPs, Seldin's 128 AIMs e Santos's 192 AIMs em amostra de 513 indivíduos da população de Ribeirão Preto - SP. As amostras foram sequenciadas a partir do sistema HaloPlex Enrichment System, e genotipados a partir do Infinium Multi-Ethnic Global-8 Array da Illumina. Posições que não estavam presentes em nenhum desses ensaios foram imputadas a partir de três ferramentas diferentes, o Sanger Imputation Server, o Michigan Imputation Server, e o Impute2, posteriormente mesclados a um único output. A inferência de ancestralidade foi realizada pra cada painel selecionado e para os dois painéis desenvolvidos e intitulados Painel Ancestralidade e Painel Identificação Humana, com as populações de referência europeias, africanas e asiáticas presentes no âmbito do 1000 Genomes Diversity Project (1KGEN) e do Human Genome Diversity Project (HGDP). As populações miscigenadas foram obtidas no âmbito do 1KGEN e as populações ameríndias no âmbito do HGDP. As inferências de ancestralidade foram realizadas a partir dos softwares Admix 95 e STRUCTURE. Os parâmetros forenses foram obtidos através do software STRAF e as estatísticas populacionais e genéticas a partir dos programas GenAlEx e Plink. As PCAs foram obtidas a partir da função prcomp nativa da linguagem R de programação. Apenas 3 posições não foram imputadas dos 399 selecionados, pertencentes ao painel de Seldin. Para as PCAs, observou-se que todos os painéis apresentaram poder para separação e de agrupamento de todas as populações referência analisadas, quando utilizadas as três primeiras componentes principais. As inferências de ancestralidade populacional para as populações miscigenadas no âmbito do 1KGEN demonstrou resultados muito semelhantes, independente do painel utilizado, e compatíveis com a referência obtidas a partir do GWAS em Martin et al. (2007). Para a população de Ribeirão Preto os resultados também se mostraram muito próximos da referência de Marcorin (2019), onde somente os painéis Kidd Lab set of 55 AISNPs e Ancestralidade superestimaram a ancestralidade AFR e subestimaram a ancestralidade EUR da amostragem, porém demonstrado como um desvio continuo a todas as amostras individuais pelo STRUCTURE. A amostra de Ribeirão Preto também se demonstrou melhor analisada quando a metodologia tetra-parental foi utilizada. O painel SNPforID 34-plex, quando utilizado em conjunto ao PIMA, e o Kidd Lab set of 55 AISNPs, demonstraram parâmetros forenses com informatividade próximas aos dos 13 STRs do CODIS e do SNPforID 52-plex, quando aplicados na amostra brasileira. O Painel Identificação Humana demonstrou resultados superiores a estes dois painéis, apresentando informatividade próxima a dos 20 STRs do CODIS. Ambos os painéis desenvolvidos neste projeto apresentaram viabilidade de utilização para inferência de ancestralidade e identificação humana na américa latina.
Título en inglés
Use of ancestry informative markers for the development of panels for ancestry inference and human identification in mixed populations
Palabras clave en inglés
Ancestry
Forensic genetics
Human identification
Imputation
Single nucleotide polymorphisms
Resumen en inglés
Since the introduction of PCR at the end of the 20th century, the analysis of Short Tandem Repeats became possible, which is still the standard for expert analysis in the context of police investigations. The most abundant markers in human genetic material are single-base polymorphisms, SNPs, where, due to the size of their amplicons, the possibility of working with degraded samples demonstrates an advantage over STRs. However, an amount of approximately 3 times more markers is required, when compared to microsatellites, to obtain viable statistical values for investigative use. Ancestry informational markers (AIMs) are polymorphisms that present high allele frequencies in one population and not in others, and are used to identify the individual and population genetic ancestry contributions of a sample. The vast majority are composed of SNPs (AISNPs) and can be applied in order to identify epidemiological risks or in police investigations. They also present the possibility of use for human identification in mixed populations due to the increase in genetic variability. The objective of the project is to develop two distinct panels ranging from 30 to 50 AIMs, to infer ancestry and for individual identification, which could be used in the Brazilian and admixed population of Latin America, using 399 AIMs belonging to the PIMA, SNPforID 34-plex, Kidd Lab set of 55 AISNPs, Seldin's 128 AIMs and Santos's 192 AIMs panels in a sample of 513 individuals from the population of Ribeirão Preto - SP. Samples were sequenced using the HaloPlex Enrichment System, and genotyped using the Illumina Infinium Multi-Ethnic Global-8 Array. Positions that were not present in any of these tests were imputed using three different tools, Sanger Imputation Server, Michigan Imputation Server, and Impute2, later merged into a single output. Ancestry inference was performed for each selected panel and for the two panels developed and entitled Painel Ancestralidade and Painel Identificação Humana, with European, African and Asian reference populations present within the scope of the 1000 Genome Diversity Project (1KGEN) and the Human Genome Diversity Project (HGDP). The admixed populations were obtained under the 1KGEN and the Amerindian populations under the HGDP. Ancestry inferences were performed using Admix 95 and STRUCTURE software. The forensic parameters were obtained through the STRAF software and the population and genetic statistics from the GenAlEx and Plink software. The PCAs were obtained from the prcomp function native to the R programming language. Only 3 positions were not assigned from the 399 selected, belonging to Seldin's panel. For PCAs, it was observed that all panels showed power for separation and grouping of all reference populations analyzed, when using the first three main components. Population ancestry inferences for mixed populations under 1KGEN showed very similar results, regardless of the panel used, and consistent with the reference obtained from the GWAS in Martin et al. (2007). For the population of Ribeirão Preto, the results were also very close to the reference by Marcorin (2019), where only the Kidd Lab set of 55 AISNPs and Painel Ancestralidade overestimated the AFR ancestry and underestimated the EUR ancestry of the sample, but demonstrated as a continue deviation to all individual samples by STRUCTURE. The sample from Ribeirão Preto was also better analyzed when the tetra-parental methodology was used. The SNPforID 34-plex panel, when used together with PIMA, and the Kidd Lab set of 55 AISNPs, demonstrated forensic parameters with informativeness close to those of the 13 CODIS STRs and the SNPforID 52-plex, when applied to the Brazilian sample. The Painel Identificação Humana showed superior results to these two panels, presenting informativity close to that of the 20 CODIS STRs. Both panels developed in this project showed feasibility of use for inference of ancestry and human identification in Latin America.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2022-11-24
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2022. Todos los derechos reservados.