• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tesis Doctoral
DOI
https://doi.org/10.11606/T.55.2020.tde-04022020-112230
Documento
Autor
Nombre completo
Renan de Padua
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Carlos, 2019
Director
Tribunal
Rezende, Solange Oliveira (Presidente)
Marcacini, Ricardo Marcondes
Ribeiro, Marcela Xavier
Traina, Agma Juci Machado
Título en portugués
Redes de regras de associação
Palabras clave en portugués
Grafo
Pós-processamento
Rede
Regras de associação
Resumen en portugués
Regras de associação são amplamente utilizadas na literatura para extrair e explorar correlações dentro de bases de dados. As regras são extraídas por meio de uma análise combinatória de todos os possíveis valores de variáveis, com tamanho variando de 2 a N, sendo filtradas por medidas como suporte e confiança. O suporte aplica um filtro de ocorrência mínima, enquanto a confiança apresenta um filtro de probabilidade condicional mínima. Por esse motivo, as regras de associação tendem a apresentar 1 dos 2 problemas: (i) os valores de suporte e confiança são muito altos e somente regras óbvias são apresentadas ou (ii) os valores de suporte e confiança são muito baixos e o número de regras extraídas é extremamente alto. No caso (i), o conhecimento extraído provavelmente não é novidade para o especialista da área, o que torna todo o processo de mineração não produtivo. Já no caso (ii), há um conhecimento potencialmente útil extraído pelas regras; entretanto, devido ao alto número de padrões, esse conhecimento é difícil de ser encontrado. Visando auxiliar o problema descrito em (ii), foram propostos algumas abordagens de pós-processamento de regras de associação, entre elas a Association Rule Network (ARN). A ARN é capaz de explorar a base de regras de acordo com um item objetivo, focando toda a exploração em identificar quais itens da base estão correlacionados com o item escolhido. Ao modelar apenas um único item, a ARN mostrou-se incompleta, uma vez que itens dominantes podem se relacionar com vários itens de uma base de dados mas não ser importante para a ocorrência de nenhum deles. Neste doutorado foram propostas 2 abordagens capazes de explorar as regras geradas, focando a exploração em mais de um item objetivo. A exARN Convencional e a exARN Gulosa. Ao explorar as regras com mais de um item objetivo, as abordagens propostas são capazes de identificar itens dominantes, que são itens que se relacionam com vários itens objetivos, e itens determinantes, que se relacionam com apenas um único item objetivo. Os resultados para ambas as abordagens foram promissores. A exARN Convencional apresentou bons resultados em bases menos densas, na qual há menos relações existentes entre os itens. Já a exARN Gulosa apresentou bons resultados em bases extremamente densas, uma vez que o algoritmo guloso por trás da abordagem é capaz de reduzir drasticamente a quantidade de regras modeladas.
Título en inglés
Association Rule Network
Palabras clave en inglés
Association rule
Graph
Network
Post-processing
Resumen en inglés
Association rules are widely used in the literature to extract and explore correlations within databases. The rules are extracted through a combinatorial analysis of all possible variable values, ranging in size from 2 to N, and filtered by measures such as support and confidence. Support applies a minimum occurrence filter, while confidence has a minimum conditional probability filter. For this reason, association rules tend to present 1 of 2 problems: (i) the values of support and confidence are too high and only obvious rules are presented or (ii) the values of support and confidence are too low and the number of extracted rules is extremely high. In case (i), the extracted knowledge is probably not new to the area expert, which makes the entire mining process non-productive. In case (ii), there is potentially useful knowledge extracted by the rules; However, due to the high number of standards, this knowledge is difficult to find. In order to assist the problem described in (ii), some association rule postprocessing approaches have been proposed, among them the Association Rule Network (ARN). The ARN is able to explore the rule base according to an objective item, focusing all exploration on identifying which base items correlate with the chosen item. When modeling only a single item, the ARN proved incomplete, since dominant items can relate to multiple items in a database but are not important for any of them to occur. In this doctorate we proposed 2 approaches capable of exploring the generated rules, focusing the exploration on more than one objective item. The Conventional exARN and the Greedy exARN. By exploring rules with more than one objective item, the proposed approaches are able to identify dominant items, which are items that relate to multiple objective items, and determining items, which relate to only a single objective item. The results for both approaches were promising. The Conventional exARN performed well on a less dense bases, where there are fewer relationships between items. The Greedy exARN has performed well on extremely dense bases, since the greedy algorithm behind the approach is able to drastically reduce the amount of rules modeled.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2020-02-04
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2022. Todos los derechos reservados.