• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tesis Doctoral
DOI
https://doi.org/10.11606/T.55.2021.tde-03032022-105725
Documento
Autor
Nombre completo
Mário Popolin Neto
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Carlos, 2021
Director
Tribunal
Paulovich, Fernando Vieira (Presidente)
Carvalho, André Carlos Ponce de Leon Ferreira de
Freitas, Carla Maria Dal Sasso
Marana, Aparecido Nilceu
Título en inglés
Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
Palabras clave en inglés
Classification Models Interpretability and Models and Multivariate Data Explanations
Logic Rules Visualization
Random Forest
Resumen en inglés
Classification models have immense potential and ubiquitous future, considering the vast number of prediction tasks in different domains where such models are applicable. Models interpretability may be just as important as performance, providing global and local explanations to interpret the acquired knowledge and audit decisions. In addition to the predictive ability, classification models can also be employed as descriptive tools, where interpretability involves data explanations. Logic rules have been widely used in interpretability solutions, and Decision Trees are well recognized for consistent logic rules generation. The Random Forest approach (Decision Trees ensemble) has been broadly adopted due to its ability to produce accurate results and deal with multivariate datasets. However, Random Forest models interpretability faces the challenge of handling a substantial number of logic rules. Based on logic rules visualization into a matrix-like visual metaphor, this doctoral thesis leads to Visual Analytics methods for Random Forest models interpretability, supporting models and data explanations covering predictive and descriptive purposes. For models (predictive) explanations, ExMatrix arranges logic rules towards global and local visual representations, providing overviews and decisions reasoning. Global explanations can unveil the knowledge learned by the model from a class-labeled dataset, whereas local explanations focus on a particular data instance classification. For data (descriptive) explanations, VAX handles logic rules, resulting in descriptive rules visualization for automated data insights. Data explanations support the identification and visual interpretation of patterns in multivariate datasets. Any problem denoted by a class-labeled dataset is a potential use case for the proposed methods. ExMatrix was applied in analytical chemistry, and VAX was used in real-world datasets for multivariate data analyses. The main contribution of this doctoral thesis lies in Visual Analytics methods supporting Random Forest interpretability for predictive and descriptive purposes in model and data explanations.
Título en portugués
Intepretabilidade de Random Forest - explicando modelos de classificação e dados multivariados por meio de visualizações de regras lógicas
Palabras clave en portugués
Intepretailidade de modelos de classificação e Explicações de modelos e de dados multivariados
Random forest
Visualização de regras lógicas
Resumen en portugués
Modelos de classificação possuem imenso potencial e futuro ubíquo, considerando o vasto número de tarefas preditivas em diferentes domínios onde estes modelos são aplicáveis. A interpretabilidade dos modelos pode ser tão importante quanto a performance, fornecendo explicações globais e locais para interpretar os conhecimentos adquiridos e auditar decisões. Além da capacidade preditiva, modelos de classificação podem ser aplicados como ferramentas descritivas, onde intepretabilidade envolve explicações de dados. Regras lógicas vêm sendo amplamente utilizadas em soluções para interpretabilidade e Decision Trees são reconhecidas pela geração de regras lógicas consistentes. A abordagem Random Forest conjunto de Decision Trees tem sido amplamente adotada devido a sua habilidade em produzir resultados precisos e manipular conjuntos de dados multivariados. Entretanto, a intepretabilidade de modelos Random Forest enfrenta o desafio de gerir um número considerável de regras. Baseado na visualização de regras lógicas em uma metáfora visual em formato de matriz, esta tese de doutorado resulta em métodos de Visual Analytics para a intepretabilidade de modelos Random Forest, suportando explicações de modelos e de dados cobrindo propósitos preditivos e descritivos. Para explicações de modelos (preditivo), ExMatrix dispõe regras lógicas a formar representações visuais globais e locais, fornecendo visões gerais e análises de decisões. Explicações globais podem revelar o conhecimento aprendido pelo modelo a partir de um conjunto de dados rotulados, enquanto explicações locais focam na classificação de uma instância de dados em particular. Para explicações de dados (descritivo), VAX processa regras lógicas resultando na visualização de regras descritivas para insights automáticos dos dados. Explicações de dados permitem a identificação e a interpretação visual de padrões em conjuntos de dados multivariados. Qualquer problema representado por um conjunto de dados rotulados é um potencial caso de uso para os métodos propostos. O método ExMatrix foi aplicado em química analítica e o método VAX empregado em conjuntos de dados reais para análises de dados multivariados. A principal contribuição desta tese de doutorado reside em métodos de Visual Analytics suportando a interpretabilidade de Random Forest para propósitos preditivos e descritivos em explicações de modelo e de dados.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2022-03-03
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.