• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  Bookmark and Share
Doctoral Thesis
Full name
José Felipe Gonzaga Sabadin
Knowledge Area
Date of Defense
Piracicaba, 2021
Fritsche Neto, Roberto (President)
Cândido, Bernardo Moreira
Santos, Mateus Figueirêdo
Title in English
Haploid maize seeds prediction using deep learning and using mock reference genomes for genomic prediction of hybrids
Keywords in English
Convolutional neural network
Doubled haploid
Genomic selection
Single nucleotide polymorphism
Abstract in English
Prediction is a key concept for animal and plant breeding. Accurate estimates of phenotypic and genetic values are crucial for the selection of the best genotypes. For this reason, several tools have been used to improve the accuracy of these estimates, from molecular markers, used to access genetic information, to high-throughput phenotyping, used to increase sample size and phenotypic precision. Here, we present two studies involving the use of different approaches and tools in the prediction process. First, we describe a study using deep learning and images for seed phenotyping. We built a convolutional neural network (CNN) model to classify images from putative and true haploid maize seeds based on the R1-nj phenotype. Our results reveal that the CNN model could classify putative haploid maize seeds with high accuracy (97%). However, the CNN model was unable to recognize true haploid seeds. Finally, we provide a highly accurate and trained CNN model to the scientific community to classify haploid maize seeds via R1-nj. In the latter, we studied using mock genomes to discover markers and their effect on estimates of genetic diversity and genomic prediction of hybrids. Moreover, we compared them with SNP markers from SNP-array and genotyping-by-sequencing (GBS) scored in the reference genome B73. Our results show that using mock genomes delivers estimates comparable to standard platforms when considering simple traits and additive effects. However, for complex traits and dominance effects, the estimates were slightly worse. We believe that these studies provide relevant knowledge for the phenotypic and genomic prediction applied to plant breeding.
Title in Portuguese
Predição de sementes haploides de milho usando aprendizado profundo e utilização de genomas mock para a predição genômica de híbridos
Keywords in Portuguese
Duplo haploide
Polimorfismo de nucleotídeo único
Rede neural convolucional
Seleção genômica
Abstract in Portuguese
A predição é um conceito chave para o melhoramento animal e de plantas. Estimativas acuradas dos valores fenotípicos e genéticos são fundamentais para a seleção dos melhores genótipos. Por isso, diversas ferramentas vêm sendo empregadas com o objetivo de melhorar a precisão dessas estimativas, desde marcadores moleculares, usados para acessar a informação genética, até a fenotipagem de alto rendimento, usada para aumentar o tamanho da amostra e a precisão fenotípica. Nesse trabalho, nós apresentamos dois estudos envolvendo o uso de diferentes abordagens e ferramentas no processo de predição. No primeiro capítulo, nós apresentamos um estudo envolvendo o uso de deep learning e imagens para a fenotipagem de sementes. Nele, nós construímos um modelo de rede neural convolucional (CNN) para classificar imagens de sementes haploides putativas e verdadeiras de milho baseadas no fenótipo R1-nj. Nossos resultados mostram que o modelo CNN foi capaz de classificar as sementes putativas com elevada acurácia (97%). No entanto, o modelo não conseguiu detectar as sementes haploides verdadeiras. Por fim, nós disponibilizamos à comunidade científica um modelo CNN treinado e com alta acurácia para classificar sementes haploides de milho. No último capítulo, nós estudamos a utilização de genomas mock para a descoberta de marcadores e o seu efeito sobre estimativas de diversidade genética e predição genômica de híbridos. Além disso, nós os comparamos com marcadores SNP oriundos de um SNP-array e genotyping-by-sequencing (GBS) ancorado no genoma de referência B73. Nossos resultados mostram que a utilização de genomas mock entrega estimativas comparáveis às plataformas padrão, quando consideramos caracteres simples e efeitos aditivos. No entanto, para caracteres complexos e para os efeitos de dominância as estimativas foram um pouco piores. Nós acreditamos que esses trabalhos adicionam conhecimento relevante para a predição fenotípica e genômica aplicado ao melhoramento vegetal.
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2022. All rights reserved.