• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.11.2021.tde-11102021-124537
Document
Author
Full name
Giovanni Coelho Ladeira
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
Piracicaba, 2021
Supervisor
Committee
Mourão, Gerson Barreto (President)
Camargo, Gregorio Miguel Ferreira de
Pinto, Luís Fernando Batista
Title in Portuguese
Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
Keywords in Portuguese
Cordeiros
Habilidade de predição
Matriz de relacionamento genômico
Viés de predição
Abstract in Portuguese
Variações no número de cópias (CNV) são variações estruturais no DNA de no mínimo 1 kb e que diferem do genoma referência quanto ao número de cópias. O crescente número de estudos com CNV reportam sua associação com doenças em humanos e diversas características quantitativas em animais domésticos. Entretanto, não foram reportados estudos de associação genômica ampla baseados em CNV em ovinos Santa Inês, uma das raças mais importantes do Brasil e, ademais, informações sobre a inclusão de efeitos de CNV em modelos de predição de GEBV são escassos. Assim, os objetivos do presente estudo foram 1) identificar e quantificar CNVs em uma população de ovinos da raça Santa Inês, 2) verificar possíveis associações entre CNVs e características de interesse, 3) identificar possível sobreposição de segmentos de CNVs significativamente associados às características de interesse a QTLs e genes previamente conhecidos, e 4) avaliar possíveis ganhos em acurácia das predições dos GEBVs combinando informações de SNP e CNV (GBa + CNV) comparadas às predições dos GEBVs utilizando exclusivamente informações SNP (GBa). Dessa forma, foram utilizadas informações genômicas de 491 ovinos da raça Santa Inês (OvineSNP50 BeadChip). A identificação de CNVs foi realizada por meio do software PennCNV. As informações de CNVs foram utilizadas para a construção de uma matriz de relacionamento genômico fundamentada em CNVs que foi incorporada ao modelo misto utilizado para a predição dos GEBVs adicionalmente às tradicionais informações de SNP. Na sequência, a acurácia foi estimada pela correlação de Pearson entre os GEBVs preditos para a população de treinamento e o fenótipo corrigido para efeitos fixos na população de validação. Os GEBVs preditos foram utilizados nas análises de associação genômica ampla fundamentadas em CNVs, por meio do programa CNVRanger, para identificar regiões no genoma associadas às características de desempenho, eficiência e carcaça. Foram identificados 1.167 segmentos de CNV, entre eles segmentos significantes (p-valor<0,05) associados às características: rendimento de carcaça e consumo alimentar residual, adicionalmente, outros 5 segmentos de CNV foram considerados relevantes e indicados para estudos futuros. Os segmentos significativos foram sobrepostos a 4 QTLs e 8 genes, entre eles os genes SPAST, TGFA e ADGRL3 com funções relacionadas a diferenciação celular e metabolismo energético. A inclusão de CNV nas análises genéticas permitiram capturar maior variância genética, entretanto a proporção da variância genética capturada por CNVs varia entre as características e não necessariamente incrementam a acurácia de predição. Entre os modelos considerados, não houve incremento na habilidade preditiva ao inserir informações de CNV. Portanto, os resultados reportados no presente estudo indicam que a inclusão de informações de CNV em modelos para predição de GEBV não deve ser prioridade.
Title in English
Identification and use of CNV for genomic selection in Santa Inês sheep
Keywords in English
Genomic relationship matrix
Lambs
Prediction ability
Prediction bias
Abstract in English
Copy number variations (CNV) are structural variations in DNA of at least 1 kb that differ from the reference genome in copy number. The growing number of studies with CNV report its association with diseases in humans and several quantitative traits in livestock animals. However, CNV-based genome-wide association studies in Santa Inês sheep, one of the most important breeds in Brazil, have not been reported and, furthermore, information on the inclusion of CNV effects in GEBV prediction models is rare. Thus, the aims of the present study were 1) to identify and quantify CNVs in a population of Santa Inês sheep, 2) to verify possible associations between CNVs and characteristics of interest, 3) to identify possible overlapping of CNV segments significantly associated with the characteristics of interest to previously known QTLs and genes, and 4) to evaluate possible gains in accuracy in GEBV predictions by combining SNP and CNV information (GBa + CNV) compared to GEBV predictions using exclusively SNP information (GBa). Thus, genomic information from 491 Santa Inês sheep (OvineSNP50 BeadChip) was used. The identification of CNVs was performed using the PennCNV software. The CNV information was used to build a genomic relationship matrix based on CNVs, which was incorporated into the mixed model used for the prediction of GEBVs in addition to the traditional SNP information. Next, accuracy was estimated by Pearson's correlation between predicted GEBVs for training population and phenotype corrected for fixed effects in the validation population. Predicted GEBVs were used in CNV-based genome-wide association analyses, through the CNVRanger program, to identify regions in the genome associated with performance, efficiency and carcass traits. 1,167 CNV segments were identified, including significant segments (p-value<0.05) associated with traits: carcass yield and residual feed intake, in addition, another 5 CNV segments were considered relevant and indicated for future studies. The significant segments overlapped 4 QTLs and 8 genes, including the SPAST, TGFA and ADGRL3 genes with functions related to cell differentiation and energy metabolism. The inclusion of CNV in the genetic analysis allowed capturing greater genetic variance, however the proportion of genetic variance captured by CNVs varies among characteristics and does not necessarily increase the prediction accuracy. Among the models considered, there was no increase in predictive ability when entering CNV information. Therefore, the results reported in the present study indicate that the inclusion of CNV information in models to predict GEBV should not be a priority.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2021-10-13
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2021. All rights reserved.