• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.100.2021.tde-18112021-212329
Document
Author
Full name
Fernando Favoretti Vital do Prado
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2021
Supervisor
Committee
Digiampietri, Luciano Antonio (President)
Pérez Alcazár, José de Jesus
Silva, Flavio Soares Correa da
Title in Portuguese
Solução automatizada de engenharia de características para problemas de aprendizado de máquina
Keywords in Portuguese
Aprendizado de máquina
AutoML
Engenharia de Características
Abstract in Portuguese
Atualmente, o aprendizado de máquina vem sendo amplamente utilizado para auxiliar em diferentes atividades, desde a sugestão de vídeos ou séries até no auxílio ao diagnóstico médico. O desenvolvimento de soluções envolvendo aprendizado de máquina envolve uma série de tarefas que incluem entendimento do problema, entendimento dos dados, preparação dos dados, modelagem, avaliação e verificação dos resultados. A construção de modelos de aprendizado de máquina de alta qualidade é, tipicamente, interativo e complexo, exigindo conhecimento específico e um grande esforço do executor. O aprendizado de máquina automatizado AutoML procura automatizar partes desse processo. Uma etapa importante do desenvolvimento desse tipo de solução é a engenharia de características que aplica transformações nos dados originais, tornando-os mais representativos para o modelo final. O presente trabalho atua no escopo de apresentar uma solução que automatize o processo de engenharia de características. A estratégia resultante da aplicação de técnicas de geração e seleção automatizadas de características em um arcabouço único é capaz de propiciar melhoria no desempenho de diferentes algoritmos aplicados a problemas de classificação quando comparados a um baseline inicial frente a quatro diferentes métricas. A solução apresentada neste trabalho provê a opção de automatização do arcabouço completo de engenharia de características, para o contexto específico de problemas de aprendizado do tipo classificação que utilizam dados tabulares
Title in English
Automated feature engineering solution for machine learning problems
Keywords in English
AutoML
Feature engineering
Machine learning
Abstract in English
Nowadays, machine learning has been widely used to assist in different activities, from recommending videos or series to aiding in medical diagnosis. The development of solutions involving machine learning involves a series of tasks which include understanding the problem, understanding the data, preparing the data, modeling, evaluating, and verifying the results. Building high-quality machine learning models is iterative and complex, requiring specific knowledge and a great deal of effort from the performer. Automated machine learning (AutoML) seeks to automate parts of this process. An important step in the development of this type of solution is feature engineering that applies transformations to the original data, making them more representative for the final model. The present work presents an approach that automates the feature engineering process. The developed solution combines automated feature generation and selection techniques in a single framework. It was able to improve the performance of different algorithms applied to classification problems when compared with an initial baseline, considering four different metrics. The solution presented in this work provides the option of automating the complete feature engineering framework, for the specific context of classification problems that use tabular data
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2023-05-16
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.