• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.55.2021.tde-23062021-112356
Document
Author
Full name
Marcelo Miky Mine
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2021
Supervisor
Committee
Manzato, Marcelo Garcia (President)
Carvalho, André Carlos Ponce de Leon Ferreira de
Covões, Thiago Ferreira
Durão, Frederico Araújo
Title in Portuguese
Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento
Keywords in Portuguese
Aprendizado semissupervisionado
Co- treinamento
Esparsidade
Ranqueamento
Sistemas de recomendação
Abstract in Portuguese
A crescente oferta de produtos, serviços e informações na Web tem levado diversas aplicações a utilizar e desenvolver sistemas de recomendação para sugerir conteúdos de acordo com as preferências de cada usuário específico. Nesses sistemas, uma grande quantidade de dados rotulados deve estar disponível para obter boas previsões. No entanto, os dados rotulados são frequentemente limitados e caros de se obter, uma vez que a rotulagem geralmente requer tempo e conhecimento humano. Além disso, geralmente, os usuários estão interessados apenas nas recomendações com melhores posições, enquanto as sugestões com posições inferiores são ignoradas. Como faltam métodos que promovam o enriquecimento (rotulagem) com classificação, este trabalho propõe uma técnica que recomenda os top-n itens com base em dados enriquecidos. O enriquecimento é baseado em um método de co-treinamento, cuja aprendizagem usa múltiplas visualizações - dados divididos em dois subconjuntos separados - para diminuir a esparsidade dos dados. A escolha dos itens no enriquecimento é baseada em uma métrica de confiança, que busca itens mais relevantes para usuário. Então, esses dois subconjuntos enriquecidos são combinados com um método de ensemble. Na avaliação, utilizamos conjuntos de dados reais de domínios distintos e os experimentos mostram que o método proposto atinge melhores resultados, em comparação com o baseline, quando um algoritmo de recomendação é usado nestes dados enriquecidos combinados.
Title in English
Personalized Ranking Based On Enriched Data: A Co-Training Approach
Keywords in English
Co-training
Ranking
Recommender systems
Semi-supervised learning
Sparsity
Abstract in English
The growing supply of products, services and information on Web has led several applications to use and develop recommendation systems to suggest content according to each specific users preference. In these systems, a large amount of labeled data must be available to obtain good predictions. However, labeled data are often limited and expensive to obtain, since labelling usually requires time and human knowledge. Besides, usually, users are only interested in the best ranked recommendations, while lower-ranked suggestions are ignored. Since there is a lack of methods that promote enrichment (labelling) with ranking, this work proposes a technique that recommends top-n items based on enriched data. The enrichment is based on a co-training method, whose learning uses multiple views, data divided into two disjoint subsets, to decrease the data sparsity. The choice of items to enrich is based on a confidence metric, which seeks items that are more relevant to the user. Then, these two enriched subsets are combined with an ensemble method. In our evaluation, we used real data sets from distinct domains and experiments show that the proposed method achieves better results, compared to baseline, when a recommender algorithm is used in this enriched ensemble set.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2021-06-24
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.