• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.55.2020.tde-09062020-123106
Document
Author
Full name
Edson da Silva Guimarães
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2020
Supervisor
Committee
Boas, Paulino Ribeiro Villas (President)
Amancio, Diego Raphael
Ferreira, Ednaldo José
Rodrigues, Francisco Aparecido
Title in Portuguese
Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
Keywords in Portuguese
Big data
Ciências de dados
Extreme gradient boosting
MultiLayer perceptron
Previsão da produtividade
Randon forest
Redes neurais
Abstract in Portuguese
A previsão do rendimento das culturas durante o período de crescimento é útil para as práticas de planejamento e manejo agrícola, para companhias desenvolvedoras de sementes avaliar a performance de novas variedades, para a tomada de decisão dos produtores, para os serviços do governo que lidam com importação e exportação, para organizações internacionais responsáveis por monitorar a produção e o comércio mundial de alimentos, para os comerciantes de commodities, bem como para a elaboração de políticas alimentares. As abordagens comuns para a previsão de rendimento incluem o uso de pesquisas manuais caras ou dados de sensoriamento remoto. Técnicas de inteligência artificial e ciência de dados podem oferecer inúmeros benefícios tais como, permitir o desenvolvimento de modelos computacionais para tomada de decisões, ajudar a combater a escassez de alimentos e capacitar pequenos agricultores, gerenciamento de doenças e pragas nas culturas, investigação de nichos agrícolas, lidar com mudanças climáticas, dentre outros. Neste contexto onde envolve a comercialização, armazenamento e processamento de grãos, é comum deparar-se com cenários de incerteza, especialmente quando se deseja prever a produtividade da lavoura e avaliar riscos de perdas da produtividade. O objetivo deste trabalho consiste em desenvolver modelos de Machine Learning para realizar predições da produtividade da cultura da soja. Nesta análise foram avaliadas Redes Neurais Multilayer Perceptron, Random Forest e Extreme Gradient Boosting, posteriormente os modelos foram comparados entre si e com o modelo de estimativa de produtividade adotado pela FAO. Os dados referentes ao clima e características do solo foram adquiridos de estações meteorológicas no período entre 2010 e 2018 de 27 cidades, representando os três biomas do estado do Mato Grosso, enquanto que os dados da produtividade real foram coletados do sítio do IBGE. Os resultados foram avaliados através da métrica Mean Absolute Percentage Error (MAPE), que leva em consideração valores reais alimentados em modelos e valores ajustados a partir do modelo e calcula a diferença absoluta entre os dois como porcentagem do valor real, com base neste cálculo é possível obter a acurácia de cada modelo. O modelo baseado no Multilayer Perceptron apresentou acurácia de 95.20%, o modelo baseado em Random Forest apresentou acurácia de 95.03% e o modelo Extreme Gradient Boosting alcançou acurácia de 95.54% quando utilizados para fazer a predição do rendimento da soja para as 27 cidades no ano de 2018.
Title in English
Machine Learning applied to soybean crop yield prediction using climate and soil data
Keywords in English
Big data
Crop yield prediction
Data science
Extreme gradient boosting
Multilayer perceptron
Neural network
Random forest
Abstract in English
Crop yield forecasting during the growing season is useful for agricultural planning and management practices, for seed companies to evaluate new variety performance, for farmers decisionmaking, for import and export government services, for international organizations responsible for monitoring world food production and trade, for commodity traders, and for food policymaking. Common approaches to yield prediction include the use of expensive manual surveys or accessible remote sensing data. Artificial intelligence and data science techniques can offer numerous benefits such as allowing the development of computational models for decision making, helping fight food scarcity and empower small farmers, managing crop diseases and pests, investigating agricultural niches, to cope With climate change, among others . In this context where it involves the marketing, storage and processing of grain, it is common to come across uncertainty scenarios, especially when one wants to predict crop yield and assess risks of yield losses. The objective of this work is to develop Machine Learning models based on Neural Networks and Decision Tree to make predictions of soybean crop yield. In this analysis were evaluated Multilayer Perceptron Neural Networks, Random Forest and Extreme Gradient Boosting, later the models were compared with each other and with the productivity estimate model adopted by FAO. climate and soil data were obtained from weather stations between 2010 and 2018 from 27 cities, representing the three biomes of the state of Mato Grosso, while real productivity data were collected from the IBGE site. The results were evaluated using the Mean Absolute Percentage Error (MAPE) metric, which takes into account real values fed into models and values adjusted from the model and calculates the absolute difference between the two as a percentage of the real value, based on which calculation is possible. get the accuracy of each model. The Multilayer Perceptron based model was 95.20% accurate, the Random Forest based model was 95.03% accurate, and the Extreme Gradient Boosting model was declared winer with 95.54% accurate when used to predict soybean yield for the 27 cities in the year 2018.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-06-09
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2021. All rights reserved.