• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.11.2020.tde-13102020-095751
Documento
Autor
Nome completo
Isabella Theresa de Almeida Martins
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
Piracicaba, 2020
Orientador
Banca examinadora
Sentelhas, Paulo Cesar (Presidente)
Beruski, Gustavo Castilho
Camara, Gil Miguel de Sousa
Piedade, Sonia Maria de Stefano
Título em português
Qualidade da fibra de diferentes cultivares brasileiras de algodão e sua relação com as condições meteorológicas
Palavras-chave em português
Gossypium hirsutum L. raça latifolium Hutch
Micronaire
Random forest
Support vector machine
XGBoosting
Resumo em português
O algodoeiro (Gossypium hirsutum L. raça latifolium Hutch) é produzido por mais de 60 países e, apesar da qualidade e multiplicidade de uso de suas sementes, é cultivado essencialmente para a produção de fibras. A qualidade da fibra pode diferir entre os diferentes ambientes de produção, sendo fator chave para determinação do preço e qualidade do algodão destinado aos produtos têxteis. Essas diferenças de qualidade estão associadas principalmente às cultivares e às condições meteorológicas, as quais influenciam os parâmetros indicativos de qualidade de fibra. O conhecimento dos fatores que condicionam a qualidade da fibra de algodão é importante para a definição das regiões com potencial para produção de fibras de qualidade superior. Dessa forma, como maneira de subsidiar a produção de fibras de algodão de melhor qualidade, os objetivos do presente estudo foram identificar e ordenar os fatores que afetam a qualidade da fibra de algodão, de acordo com sua importância, bem como o desenvolvimento de modelos matemáticos de estimação para os índices de qualidade da fibra de algodão por meio de técnicas de mineração de dados (MD). Para tanto, dados das variáveis meteorológicas e de índices de qualidade da fibra de algodão de 32 cultivares brasileiras foram submetidos à análises de correlação de Pearson (para uma abordagem geral); à análise de agrupamento ("clusterização"); e à três técnicas de MD (Random Forest; XGBoosting; e Support Vector Machine). Para a MD, os dados foram separados em duas partes, sendo uma para o treinamento dos algoritmos e geração dos modelos (70%) e outra para a etapa de teste dos modelos gerados (30% dos dados restantes). A análise de desempenho dos modelos foi efetuada pela comparação entre os índices de qualidade da fibra estimados pelos modelos e os índices de qualidade observados por meio da análise de regressão. O desempenho dos modelos foi avaliado considerando os seguintes índices estatísticos: coeficiente de correlação (R); coeficiente de determinação (R2); índice de Willmott (D); índice de confiança de Camargo (C); erro absoluto médio (EAM); e raiz quadrada do erro médio (RMSE). Por fim, comparou-se os resultados obtidos pelos modelos gerados com as técnicas de mineração de dados com os obtidos pelas análises de correlação e agrupamento. De modo geral, os modelos gerados por meio do emprego de técnicas de MD tiveram desempenho melhor do que as análises de correlação feitas a nível de abordagem geral e a nível de agrupamento e o melhor desempenho dos modelos foi para a elongação e o pior para o comprimento da fibra de algodão, sendo que o modelo XGB se apresentou ligeiramente melhor que o RF e o SVM foi o pior para todas as variáveis. As variáveis preditoras que foram comuns às três técnicas para os índices de qualidade da fibra avaliados variaram da seguinte foram: para o micronaire as variáveis de mais importância foram a radiação solar (Qg), o número de dias com temperatura maior ou igual a 32°C (Tmax32) e o número de dias com temperatura mínima menores ou iguais a 20°C (Tmin20); para o comprimento foram Qg, Tmin20 e velocidade do vento (U2); para a resistência foram Qg, Tmax32, Tmin 20 e temperatura mínima (Tmin); para a uniformidade foram U2, excedente hídrico (∑EXC), déficit hídrico (∑DEF)(mm), Tmin20 e precipitação pluvial (P); para a elongação foram Qg, número de dias com excedente hídrico maior do que zero (EXC0); temperatura máxima (Tmax), número de dias com temperatura menor ou igual a 18°C (Tmin18) e P; e para o índice de fibras curtas (SFI) foram umidade relativa do ar (UR); Tmax; e P.
Título em inglês
Fiber quality of different Brazilian cotton cultivars and their relationship with weather conditions
Palavras-chave em inglês
Gossypium hirsutum L. race latifolium Hutch
Micronaire
Random forest
Support vector machine
XGBoosting
Resumo em inglês
Cotton (Gossypium hirsutum L. race latifolium Hutch) is produced by more than 60 countries and despite the quality and multiplicity of use of its seeds, it is grown mainly to produce fibers. The quality of the fiber can differ between different production environments, being a key factor in determining the price and quality of cotton destined for textile products. These differences in quality are mainly associated with cultivars and weather conditions, which influence the indicating parameters of fiber quality. The knowledge of the factors that affect the quality of the cotton fiber is important for the definition of the regions with potential to produce that with superior quality. Thus, as a way to subsidize the production of better quality cotton fibers, the objectives of the present study were to identify and classify the factors that affect the quality of the cotton fiber, according to its importance, as well as the development of mathematical models for estimating the indices of cotton fiber quality using data mining (DM) techniques. To accomplish this, data of meteorological variables, and indices of cotton fiber quality from 32 Brazilian cultivars, were submitted to Pearson's correlation analysis (for a general approach); cluster analysis ("clustering"); and three DM techniques (Random Forest; XGBoosting; and Support Vector Machine). For DM, the data were separated in two parts, one for training the algorithms and generating the models (70%), and the other for testing the generated models (30% of the remaining data). The performance analysis of the models was achieved by comparing the fiber quality indices estimated using the models with the quality indices observed through the regression analysis. The performance of the models was evaluated considering the following statistical indices: correlation coefficient (R); determination coefficient (R2); Willmott index (D); Camargo confidence index (C); mean absolute error (MAE); and root mean square error (RMSE). Finally, the results obtained by the models generated with data mining techniques were compared with those obtained by correlation and cluster analysis. In general, the models generated using DM performed better than the correlation analyzes made using both the general approach and the grouping. The best performance of the models was for elongation and the worst for the length of the cotton fiber. In addition, the XGB model showed slightly better results than the RF model, and the SVM model presented the worst results for all indices. The predictor variables that were common to the three DM techniques for the evaluated indices of fiber quality varied as follows: for micronaire, the most important variables were solar radiation (Qg), the number of days with temperature greater than or equal to 32°C (Tmax32), and the number of days with minimum temperature less than or equal to 20°C (Tmin20); for the length of the fibers, the variables with the greatest influence were Qg, Tmin20 and wind speed (U2); for fibers resistance the most important variables were Qg, Tmax32, Tmin 20, and minimum temperature (Tmin); for uniformity of the fibers these variables were U2, water surplus (∑EXC), water deficit (∑DEF), Tmin20, and rainfall (P); for fibers elongation these variables were Qg, number of days with water surplus greater than zero (EXC0), maximum temperature (Tmax), number of days with a temperature less than or equal to 18°C (Tmin18), and P; and for short fiber index (SFI) the most influencing variables were relative humidity (UR), Tmax, and P.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2020-10-13
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2021. Todos os direitos reservados.