• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.55.2020.tde-04022020-112230
Document
Author
Full name
Renan de Padua
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2019
Supervisor
Committee
Rezende, Solange Oliveira (President)
Marcacini, Ricardo Marcondes
Ribeiro, Marcela Xavier
Traina, Agma Juci Machado
Title in Portuguese
Redes de regras de associação
Keywords in Portuguese
Grafo
Pós-processamento
Rede
Regras de associação
Abstract in Portuguese
Regras de associação são amplamente utilizadas na literatura para extrair e explorar correlações dentro de bases de dados. As regras são extraídas por meio de uma análise combinatória de todos os possíveis valores de variáveis, com tamanho variando de 2 a N, sendo filtradas por medidas como suporte e confiança. O suporte aplica um filtro de ocorrência mínima, enquanto a confiança apresenta um filtro de probabilidade condicional mínima. Por esse motivo, as regras de associação tendem a apresentar 1 dos 2 problemas: (i) os valores de suporte e confiança são muito altos e somente regras óbvias são apresentadas ou (ii) os valores de suporte e confiança são muito baixos e o número de regras extraídas é extremamente alto. No caso (i), o conhecimento extraído provavelmente não é novidade para o especialista da área, o que torna todo o processo de mineração não produtivo. Já no caso (ii), há um conhecimento potencialmente útil extraído pelas regras; entretanto, devido ao alto número de padrões, esse conhecimento é difícil de ser encontrado. Visando auxiliar o problema descrito em (ii), foram propostos algumas abordagens de pós-processamento de regras de associação, entre elas a Association Rule Network (ARN). A ARN é capaz de explorar a base de regras de acordo com um item objetivo, focando toda a exploração em identificar quais itens da base estão correlacionados com o item escolhido. Ao modelar apenas um único item, a ARN mostrou-se incompleta, uma vez que itens dominantes podem se relacionar com vários itens de uma base de dados mas não ser importante para a ocorrência de nenhum deles. Neste doutorado foram propostas 2 abordagens capazes de explorar as regras geradas, focando a exploração em mais de um item objetivo. A exARN Convencional e a exARN Gulosa. Ao explorar as regras com mais de um item objetivo, as abordagens propostas são capazes de identificar itens dominantes, que são itens que se relacionam com vários itens objetivos, e itens determinantes, que se relacionam com apenas um único item objetivo. Os resultados para ambas as abordagens foram promissores. A exARN Convencional apresentou bons resultados em bases menos densas, na qual há menos relações existentes entre os itens. Já a exARN Gulosa apresentou bons resultados em bases extremamente densas, uma vez que o algoritmo guloso por trás da abordagem é capaz de reduzir drasticamente a quantidade de regras modeladas.
Title in English
Association Rule Network
Keywords in English
Association rule
Graph
Network
Post-processing
Abstract in English
Association rules are widely used in the literature to extract and explore correlations within databases. The rules are extracted through a combinatorial analysis of all possible variable values, ranging in size from 2 to N, and filtered by measures such as support and confidence. Support applies a minimum occurrence filter, while confidence has a minimum conditional probability filter. For this reason, association rules tend to present 1 of 2 problems: (i) the values of support and confidence are too high and only obvious rules are presented or (ii) the values of support and confidence are too low and the number of extracted rules is extremely high. In case (i), the extracted knowledge is probably not new to the area expert, which makes the entire mining process non-productive. In case (ii), there is potentially useful knowledge extracted by the rules; However, due to the high number of standards, this knowledge is difficult to find. In order to assist the problem described in (ii), some association rule postprocessing approaches have been proposed, among them the Association Rule Network (ARN). The ARN is able to explore the rule base according to an objective item, focusing all exploration on identifying which base items correlate with the chosen item. When modeling only a single item, the ARN proved incomplete, since dominant items can relate to multiple items in a database but are not important for any of them to occur. In this doctorate we proposed 2 approaches capable of exploring the generated rules, focusing the exploration on more than one objective item. The Conventional exARN and the Greedy exARN. By exploring rules with more than one objective item, the proposed approaches are able to identify dominant items, which are items that relate to multiple objective items, and determining items, which relate to only a single objective item. The results for both approaches were promising. The Conventional exARN performed well on a less dense bases, where there are fewer relationships between items. The Greedy exARN has performed well on extremely dense bases, since the greedy algorithm behind the approach is able to drastically reduce the amount of rules modeled.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-02-04
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2022. All rights reserved.