• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
10.11606/D.11.2009.tde-11032009-150202
Documento
Autor
Nome completo
Sergio Arciniegas Alarcón
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
Piracicaba, 2008
Orientador
Banca examinadora
Dias, Carlos Tadeu dos Santos (Presidente)
Barbin, Decio
Govone, José Silvio
Título em português
Imputação de dados em experimentos com interação genótipo por ambiente: uma aplicação a dados de algodão
Palavras-chave em português
Algodão
Análise de dados
Análise de variância
Correlação genética e ambiental
Delineamento experimental
Genética estatística.
Resumo em português
Os experimentos multiambientes são um tipo especial dos experimentos bifatoriais, muito usados em melhoramento genético de plantas, nos quais algumas cultivares são avaliadas em diferentes locais. Geralmente nesses estudos se encontra uma resposta diferencial das cultivares em cada local que é chamada de interação genótipo x ambiente ou G x E, que é bem explicada por modelos de efeitos aditivos e interação multiplicativa (AMMI). Frequentemente os experimentos G x E podem ser desbalanceados e um ou vários genótipos não serem testados em alguns locais. Às vezes para o pesquisador recomendar os ambientes pode ser de interesse obter estimativas daquelas combinações genótipo ambiente que não foram testadas e tais estimativas podem ser calculadas explorando a informação inerente a aquelas combinações que foram atualmente obtidas. Além do interesse do pesquisador por essas estimativas, os da- dos ausentes podem causar alguma modificação na estimação tradicional dos parâmetros nos modelos AMMI, pois para estimar os parâmetros é necessário um processo sequencial fazendo uma análise de variância com uma posterior decomposição por valor singular da matriz de residuais, a qual não pode ser calculada se existir uma matriz de interação com dados faltantes. Para resolver esses problemas Bergamo (2007) e Bergamo et al. (2008) propuseram uma nova técnica através do uso de imputação múltipla livre de distribuição (IMLD) e é por essa razão que se decidiu avaliar o recente desenvolvimento comparando-o com algumas metodologias de imputação que têm sido usadas com sucesso nos experimentos G x E com dados ausentes como os mínimos quadrados alternados ALS(0), ALS(1) (CALINSKI et al., 1992) e estimativas robustas r-AMMI1 e r-AMMI2 (DENIS; BARIL, 1992). Assim, foi de- senvolvido um estudo de simulação baseado em uma matriz de dados reais genótipos (15) ambientes (27) do ensaio estadual de algodoeiro herbáceo 2000/01 (FARIAS, 2005), fazendo retiradas aleatórias de 10%, 20% e 30%, imputando os dados e comparando os métodos através da raiz quadrada da diferença preditiva média (RMSPD), a estatística de similari- dade de Procrustes e o coe…ciente de correlação não paramétrico de Spearman. Também foi feita uma análise sobre a escolha de componentes multiplicativos de um modelo AMMI quando se têm matrizes completadas (observados + imputados). Os resultados do estudo de simulação mostraram que segundo a distribuição da RMSPD padronizada, o método r- AMMI1 é o melhor, superando o IMLD. Entretanto, utilizando a estatística de Procrustes se encontrou que completando matrizes com ALS(0) se obtém a maior similaridade com relação à matriz de dados originais, também foi mostrado que os cinco métodos considerados têm uma alta correlação entre as imputações e os correspondentes dados reais. Finalmente, recomenda-se utilizar a imputação de dados para a estimação dos parâmetros de um modelo AMMI sob ocorrência de dados ausentes, mas para determinar o número de componentes multiplicativos é preferível tomar a decisão somente sobre a informação observada.
Título em inglês
Data imputation in trials with genotype by environment interaction: an application on cotton data
Palavras-chave em inglês
analysis of variance
Cotton
data analysis
experimental design
genetic and environmental correlation
statistical genetic.
Resumo em inglês
The multienvironment trials are a special type of the two-factor experiments, widely used in genetic improvement of plants, where some cultivars are assessed in diferent locations. Generally, in these studies there is a di¤erential response of cultivars in each location that is called genotype environment interaction, or G x E, which is well explained by the additive main e¤ects and multiplicative interaction models (AMMI). Often the experiments GE may be unbalanced and one or several genotypes were not tested in some locations. Sometimes for the environments recommendations, the researcher may be interested in obtain estimates of those combinations G x E that were not tested and such estimates can be calcu- lated using the information of those combinations that were actually obtained. Additionally to the interest of the researchers in these estimates, the missing data may cause some pro- blems in the classical estimation of parameters in the AMMI models, because the parameter estimation need of a sequential process doing an analysis of variance followed by a singular value decomposition, which can not be calculated if there is a matrix of interaction with missing data. To solve these problems Bergamo (2007) and Bergamo et al. (2008) proposed a new technique using the distribution free multiple imputation (IMLD), and for this reason was decided to evaluate the recent development through the comparison with some methods of imputation that have been used successfully in experiments GE with missing data like the AMMI estimates based on alternating least squares ALS(0), ALS(1) (CALINSKI et al. 1992) and AMMI estimates with robust sub-model r-AMMI1 and r-AMMI2 (DENIS; BARIL, 1992). Thus, was developed a simulation study based on a matrix of true data genotypes (15) environments (27) of the upland cotton variety trials (ensaio estadual de algodoeiro her- báceo) 2000/01 (FARIAS, 2005), doing missed random (10%, 20%, 30%), imputing the data and comparing the methods through the root mean square predictive di¤erence (RMSPD) of the true value, the Procrustes statistic and the Spearman´s ranks correlation coe¢ cient. Also was made an analysis on the choice of the multiplicative components of an AMMI model after imputation on the complete data sets (observed + imputed). The results of the simulation study has shown that according to the distribution of RMSPD standardized, the r-AMMI1 method is better than the IMLD. However, using the Procrustes statistic was found that imputing data matrix with ALS(0), is obtained the greatest similarity related to the true data matrix. The …ve methods considered show high correlation between the true and the imputed missing values. Finally, is recommended using the imputation data for the estimation of the parameters of an AMMI model under the presence of missing data, but for choosing the number of multiplicative terms is preferable take the decision only on the observed information.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Sergio_Alarcon.pdf (415.10 Kbytes)
Data de Publicação
2009-03-17
 
AVISO: O material descrito abaixo refere-se a trabalhos decorrentes desta tese ou dissertação. O conteúdo desses trabalhos é de inteira responsabilidade do autor da tese ou dissertação.
  • ARCINIEGAS-ALARCÓN, Sergio, et al. An alternative methodology for imputing missing data in trials with genotype-by-environment interaction. Biometrical Letters [online], 2010, vol. 47, n. 1, p. 1-14. [cited 2012-02-29]. Available from : <http://www.au.poznan.pl/biometrical.letters/index.php?p=abstract&a=2010.47.1.1>
  • ARCINIEGAS-ALARCÓN, Sergio, e DIAS, Carlos Tadeu dos Santos. AMMI analysis with imputed data in genotype x environment interaction experiments in cotton [doi:10.1590/S0100-204X2009001100004]. Pesquisa Agropecuária Brasileira [online], 2009, vol. 44, n. 11.
  • ARCINIEGAS-ALARCÓN, Sergio, e DIAS, Carlos Tadeu dos Santos. Data imputation in trials with genotype by environment interaction: An application on cotton data. Revista Brasileira de Biometria - RBB [online], 2009, vol. 27, n. 1, p. 125-138. [acesso 2012-05-13]. Disponível em : <http://jaguar.fcav.unesp.br/RME/fasciculos/v27/v27_n1/A9_Sergio.pdf>
  • ARCINIEGAS-ALARCÓN, Sergio, GARCÍA-PEÑA, Marisol, e DIAS, Carlos Tadeu dos Santos. Data imputation in trials with genotype×environment interaction. Interciencia [online], 2011, vol. 36, n. 6, p. 444-449. [acesso 2012-05-13]. Disponível em : <http://redalyc.uaemex.mx/src/inicio/ArtPdfRed.jsp?iCve=33919418008>
Todos os direitos da tese/dissertação são de seus autores
Centro de Informática de São Carlos
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2018. Todos os direitos reservados.