Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.11.2021.tde-21052021-092517
Documento
Autor
Nome completo
Melina Prado
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
Piracicaba, 2021
Orientador
Banca examinadora
Pinheiro, Jose Baldin (Presidente)
Carvalho, Humberto Fanelli
Carvalho, Leonardo Castelo Branco
Garcia, Antonio Augusto Franco
Título em português
Modelos preditivos de seleção genômica para composição do óleo de soja utilizando diferentes métodos de genotipagem
Palavras-chave em português
Glycine max
Ácidos graxos
Genotipagem
Seleção genômica
Resumo em português
O óleo de soja se destina a vários objetivos, como óleo de cozinha, biodiesel, entre outros. A composição do óleo em relação aos ácidos graxos modifica o tempo de prateleira, a palatabilidade e o quanto esse óleo é saudável ou não para dieta humana. A seleção genômica utiliza de maneira conjunta o efeito de todos os marcadores ao mesmo tempo e relaciona esses efeitos aos fenótipos observados, aumentando o ganho genético no tempo. O objetivo do trabalho foi avaliar modelos de seleção genômica, utilizando duas formas de genotipagem, para a composição de ácidos graxos no óleo de soja, sendo esses os ácidos oleico, linoleico, linolênico, palmítico, esteárico e o óleo total. Os métodos de genotipagem que foram avaliados são o chip, ou arranjo de DNA, e o método de genotipagem por sequenciamento utilizando enzimas de restrição. Para comparar esses dois métodos o coeficiente de correlação de Pearson e uma análise de componentes principais foram calculados a partir das matrizes de parentesco geradas por esses dois métodos. A análise do coeficiente de Pearson foi utilizada para comparar dados com e sem filtragem e imputação de SNPs. As duas abordagens de genotipagem foram utilizadas nos modelos de predição, GBLUP e BayesB, a fim de comparação entre os métodos e genotipagens, e para uma avaliação da performance dessas combinações na seleção genômica para os caracteres avaliados. A população utilizada na análise era composta por dois grupos com aproximadamente 30% de cultivares e 70% de introdução de plantas. A análise de componentes principais a partir do chip de DNA separou de forma mais clara os dois grupos utilizados do que o método de genotipagem com enzimas de restrição. Os coeficientes de correlação de Pearson demonstraram que a plataforma de genotipagem por chip possui uma correlação maior entre dados filtrados e não filtrados. Isso acontece pois se trata de uma plataforma bem consolidada comercialmente com estudos nos polimorfismos mais informativos, mas que por conter um número limitado de polimorfismos a serem utilizados na análise não capta alelos raros que poderiam ser de grande utilidade a seleção. Enquanto a plataforma de genotipagem por sequenciamento pode captar esses alelos raros, mas possui menor confiança nos resultados e necessidade de uma análise mais robusta. De forma geral, a análise de acurácia preditiva e o erro médio quadrático de predição demonstraram que para população, espécie e caracteres avaliados o método 6K e o modelo GBLUP resultaram em melhores performances, com exceção de dois caracteres, o óleo total e o ácido esteárico, pois a melhor performance foi alcançada com a genotipagem por sequenciamento. Como o óleo de soja é utilizado para diversas funções e os perfis de ácido graxo são diferentes para cada objetivo, o trabalho constitui um importante estudo e direcionamento para o melhoramento da composição do óleo de soja.
Título em inglês
Genomic selection prediction models for soybean oil composition using different types of genotyping methods
Palavras-chave em inglês
Glycine max
Fatty acids
Genomic selection
Genotyping
Resumo em inglês
Soybean oil is used for several purposes, such as cooking oil, biodiesel and others. The composition of the oil in relation to fatty acids changes shelf life, palatability and how healthy or unhealthy this oil is for the human diet. Genomic selection uses together the effect of all markers at the same time and compare these effects to the observed phenotypes, increasing the genetic gain over time. The objective of the work was to evaluate models of genomic selection, using two forms of genotyping, for the composition of fatty acids, which are the oleic, linoleic, linolenic, palmitic and stearic acids in soybean oil and the total oil content. The genotyping methods that have been evaluated are DNA chip, or DNA array, and the genotyping method by sequencing using restriction enzymes. To compare these two methods, Pearson's correlation coefficient and a principal component analysis were calculated from the kinship matrices generated by these two methods. Pearson's coefficient analysis was used to compare data with and without filtering and imputation of SNPs. The two genotyping approaches were used in the prediction models, GBLUP and BayesB, in order to compare the methods and genotyping, and to evaluate the performance of these combinations in genomic selection. The population used in the analysis was composed of two groups with approximately 30% of cultivars and 70% of plant introduction. Principal component analysis from the DNA chip clearly separated the two groups used, while the restriction enzyme genotyping method did not. Pearson's correlation coefficients demonstrated that the chip genotyping platform has a greater correlation between filtered and unfiltered data. This happens because it is a well consolidated and commercial platform with studies in the most informative polymorphisms, but because of this it contains a limited number of polymorphisms to be used in the analysis and it could not capture rare alleles that could be of great use to selection. While the sequencing genotyping platform can capture these rare alleles, but it has less confidence in the results and the need for a more robust analysis. In general, the predictive accuracy analysis and the mean square error of prediction showed that for population, species and characters evaluated, the SNP array method and the GBLUP model resulted in better performances, with the exception of two characters, total oil and stearic acid. For these two traits, the best performance was achieved with genotyping-by-sequencing. As soybean oil is used for different functions and the fatty acid profiles are different for each objective, the work constitutes an important study and direction for improving the composition of soybean oil.
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2021-05-24