• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
https://doi.org/10.11606/T.55.2020.tde-04022020-112230
Documento
Autor
Nome completo
Renan de Padua
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Carlos, 2019
Orientador
Banca examinadora
Rezende, Solange Oliveira (Presidente)
Marcacini, Ricardo Marcondes
Ribeiro, Marcela Xavier
Traina, Agma Juci Machado
Título em português
Redes de regras de associação
Palavras-chave em português
Grafo
Pós-processamento
Rede
Regras de associação
Resumo em português
Regras de associação são amplamente utilizadas na literatura para extrair e explorar correlações dentro de bases de dados. As regras são extraídas por meio de uma análise combinatória de todos os possíveis valores de variáveis, com tamanho variando de 2 a N, sendo filtradas por medidas como suporte e confiança. O suporte aplica um filtro de ocorrência mínima, enquanto a confiança apresenta um filtro de probabilidade condicional mínima. Por esse motivo, as regras de associação tendem a apresentar 1 dos 2 problemas: (i) os valores de suporte e confiança são muito altos e somente regras óbvias são apresentadas ou (ii) os valores de suporte e confiança são muito baixos e o número de regras extraídas é extremamente alto. No caso (i), o conhecimento extraído provavelmente não é novidade para o especialista da área, o que torna todo o processo de mineração não produtivo. Já no caso (ii), há um conhecimento potencialmente útil extraído pelas regras; entretanto, devido ao alto número de padrões, esse conhecimento é difícil de ser encontrado. Visando auxiliar o problema descrito em (ii), foram propostos algumas abordagens de pós-processamento de regras de associação, entre elas a Association Rule Network (ARN). A ARN é capaz de explorar a base de regras de acordo com um item objetivo, focando toda a exploração em identificar quais itens da base estão correlacionados com o item escolhido. Ao modelar apenas um único item, a ARN mostrou-se incompleta, uma vez que itens dominantes podem se relacionar com vários itens de uma base de dados mas não ser importante para a ocorrência de nenhum deles. Neste doutorado foram propostas 2 abordagens capazes de explorar as regras geradas, focando a exploração em mais de um item objetivo. A exARN Convencional e a exARN Gulosa. Ao explorar as regras com mais de um item objetivo, as abordagens propostas são capazes de identificar itens dominantes, que são itens que se relacionam com vários itens objetivos, e itens determinantes, que se relacionam com apenas um único item objetivo. Os resultados para ambas as abordagens foram promissores. A exARN Convencional apresentou bons resultados em bases menos densas, na qual há menos relações existentes entre os itens. Já a exARN Gulosa apresentou bons resultados em bases extremamente densas, uma vez que o algoritmo guloso por trás da abordagem é capaz de reduzir drasticamente a quantidade de regras modeladas.
Título em inglês
Association Rule Network
Palavras-chave em inglês
Association rule
Graph
Network
Post-processing
Resumo em inglês
Association rules are widely used in the literature to extract and explore correlations within databases. The rules are extracted through a combinatorial analysis of all possible variable values, ranging in size from 2 to N, and filtered by measures such as support and confidence. Support applies a minimum occurrence filter, while confidence has a minimum conditional probability filter. For this reason, association rules tend to present 1 of 2 problems: (i) the values of support and confidence are too high and only obvious rules are presented or (ii) the values of support and confidence are too low and the number of extracted rules is extremely high. In case (i), the extracted knowledge is probably not new to the area expert, which makes the entire mining process non-productive. In case (ii), there is potentially useful knowledge extracted by the rules; However, due to the high number of standards, this knowledge is difficult to find. In order to assist the problem described in (ii), some association rule postprocessing approaches have been proposed, among them the Association Rule Network (ARN). The ARN is able to explore the rule base according to an objective item, focusing all exploration on identifying which base items correlate with the chosen item. When modeling only a single item, the ARN proved incomplete, since dominant items can relate to multiple items in a database but are not important for any of them to occur. In this doctorate we proposed 2 approaches capable of exploring the generated rules, focusing the exploration on more than one objective item. The Conventional exARN and the Greedy exARN. By exploring rules with more than one objective item, the proposed approaches are able to identify dominant items, which are items that relate to multiple objective items, and determining items, which relate to only a single objective item. The results for both approaches were promising. The Conventional exARN performed well on a less dense bases, where there are fewer relationships between items. The Greedy exARN has performed well on extremely dense bases, since the greedy algorithm behind the approach is able to drastically reduce the amount of rules modeled.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2020-02-04
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2022. Todos os direitos reservados.