• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
Documento
Autor
Nombre completo
Alexandra Virginia Valente da Silva
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Carlos, 2019
Director
Tribunal
Vaz, Carlos Manoel Pedro (Presidente)
Batista Neto, João do Espírito Santo
Crestana, Silvio
Ferreira, Ednaldo José
Título en portugués
Classificação baseada em regras para estudo da produtividade do algodão no estado do Mato Grosso
Palabras clave en portugués
Classificação baseada em regras
Mineração de dados
Produtividade do algodão
Resumen en portugués
O Brasil tem grande experiência no desenvolvimento de tecnologias para a cadeia produtiva do algodão, sendo um player mundial importante nesse segmento atualmente. O avanço da cotonicultura no Cerrado brasileiro impulsionou e viabilizou uma produção altamente tecnificada, eficiente e lucrativa, elevando o país da condição de importador de fibra de algodão na década de 70 a um dos principais exportadores atualmente. Embora a cadeia do algodão tenha atingido um alto nível tecnológico, há ainda muitos desafios e problemas a serem vencidos, uma vez que nos últimos anos tem-se verificado uma estagnação na produtividade, apesar do aporte cada vez maior de tecnologias como cultivares transgênicas, máquinas, insumos e gestão de dados mais eficientes. Nesse contexto as técnicas de mineração de dados oferecem excelente oportunidade de se avaliar esse problema, uma vez os dados desse setor são bem organizados, como é o caso do Banco de Dados organizado pelo Instituto Matogrossense do Algodão (IMAmt) e que foi disponibilizado para esse estudo. Problema: O problema alvo desse trabalho é entender as causas da estagnação da produtividade do algodoeiro, os seja, dos fatores que estão influenciando negativamente na produção de algodão no cerrado no estado de Mato Grosso. Solução: A solução proposta é se utilizar técnicas de mineração de dados em um BD complexo, contendo informações da produtividade e fatores do sistema de produção que influenciam na produção, para a extração de conhecimento e geração de recomendações para os cotonicultores do Estado. Objetivo: Aplicar técnicas de Mineração de Dados, mais especificamente classificação baseada em regras em um BD de produção de algodão no estado de Mato Grosso para identificar os principais fatores, como as práticas de manejo, as variáveis do solo e a incidência de doenças, que estão afetando a produtividade do algodão e consequentemente limitando o aumento da produtividade. Estado-da-arte e Método proposto: Diferentemente de outros trabalhos baseados em classificação de regras de associação que tem foco no resultado preditivo (acurácia), nesse trabalho a ênfase é da extração de regras de associação que tenham relevância prática e que possam auxiliar o agricultor na tomada de decisão. Na etapa de pré-processamento realizou-se a seleção e transformação de atributos e identificação de outliers. Os atributos numéricos foram discretizados utilizando 4 métodos, sendo 3 automáticos (técnica de Kononenko, Better Encoding e a combinação das duas) e um manual. Na etapa de modelagem de classificação, os algoritmos de regras utilizados foram o PART e o JRip e a conversão binária de atributos foi também avaliada. O desempenho foi avaliado pela precisão, revocação, custo e a combinação delas no índice IFC (100*F/Log2 custo). Resultados: A avaliação das métricas indicou o melhor desempenho para o classificador PART, com a discretização pela técnica de Kononenko combinada com Better Encoding, seguida pela conversão binária. A análise das regras, com auxílio de especialistas da área, possibilitou a seleção daquelas mais relevantes e dos atributos que mais impactam na produtividade. Dentre esses atributos, destacam-se: a cultivar de algodão, o tempo da abertura e de início do cultivo de algodão na área, o sistema de plantio e de preparo do solo. Os principais atributos físico-químicos do solo foram os micronutrientes zinco, ferro e boro e os macronutrientes cálcio e magnésio e a resistência do solo à penetração. A ausência do fungo fusarium impactou positivamente na produtividade. Em geral, os atributos relacionados ao Manejo do algodoeiro apresentaram maior relevância na composição das regras de classificação, seguidos dos atributos Químicos e Físicos do Solo e dos atributos relacionados à doenças.
Título en inglés
Classification based on rules for the study of cotton productivity in the Mato Grosso State
Palabras clave en inglés
Classification based on rules
Cotton productivity
Data mining
Resumen en inglés
Brazil has great experience in developing technologies for the cotton sector, becoming an important world player presently. The cotton production has spread in the Brazilian cerrado stimulating and making viable a highly technical, efficient and profitable production, and leading the country from a condition of importer to a major exporter, currently. Although the cotton productive chain has reached a high technological level, there are many challenges and problems to be overcome, since the productivity is stagnant despite the use of more efficient transgenic cultivars, machines, agrochemicals and data management. In this context data mining offers excellent opportunities to evaluate this problem, since data in this sector is very well organized, as is the case of the Data Base (DB) of the Mato Grosso Cotton Institute, which is available for this study. Problem: The target problem of this study is to understand the causes of such productivity stagnation, that is, the factors influencing negatively the Mato Grosso cerrado cotton production. Solution: The proposed solution is to apply data mining to a complex DB, having productivity information and the factors that influences production, for extracting knowledge and generate recommendations for the cotton farmers in the State. Purpose: Apply data mining technique, more specifically the classification based on rules, in a DB of cotton production in the State of Mato Grosso to identify the main factors, as management practices, soil variables and diseases that are affecting cotton productivity and limiting the productivity increasing. State-of-Art and Proposed Method: Unlike other works based in classification based on rules with focus in prediction (accuracy) this work has emphasis in association rules with practical relevance to help farmers in decision-making. In the pre-processing step, it was performed selection, transformation and outliers identification. Numerical attributes were discretized using 4 methods, 3 automatic (techniques of Kononenko, Better Encoding and the combination of both) and one manual. In the classification step, the rule algorithms used were PART and JRip and binary split was also evaluated. The performance was evaluated by precision, recall, cost and the combination of them in an index called IFC (100*F/Log2 cost). Results: The evaluation of these metrics has indicated the best performance for the classifier PART, with discretization by the technique of Kononenko combined wit Better Encoding, and using binary split. The rules were analyzed with the aid of specialists for the selection of the most relevant ones and select the attributes that mostly impact the productivity. Among these attributes are: the cotton cultivar, time of opening the area and beginning of cotton cultivation, soil and growing system used. The main soil physico-chemical attributes were the micronutrients zinc, iron, bore, the macronutrients calcium and magnesium, and soil penetration resistance. The absence of the fungi fusarium has impacted positively in productivity. In general, attributes related to cotton management were more relevant in the classification rules composition, followed by soil Chemical and Physical attributes and lastly the ones related to diseases.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2019-08-23
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2019. Todos los derechos reservados.