• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tesis Doctoral
DOI
10.11606/T.55.2007.tde-07052007-155746
Documento
Autor
Nombre completo
Gisele Busichia Baioco
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Carlos, 2007
Director
Tribunal
Traina, Agma Juci Machado (Presidente)
Carvalho, André Carlos Ponce de Leon Ferreira de
Fortes, Renata Pontin de Mattos
Souza, Fernando da Fonseca de
Souza, Jano Moreira de
Título en portugués
Modelo de custo para consultas por similaridade em espaços métricos
Palabras clave en portugués
Consultas por similaridade
Estimativa de seletividade
Modelo de custo
Resumen en portugués
Esta tese apresenta um modelo de custo para estimar o número de acessos a disco (custo de I/O) e o número de cálculos de distância (custo de CPU) para consultas por similaridade executadas sobre métodos de acesso métricos dinâmicos. O objetivo da criação do modelo é a otimização de consultas por similaridade em Sistemas de Gerenciamento de Bases de Dados relacionais e objeto-relacionais. Foram considerados dois tipos de consultas por similaridade: consulta por abrangência e consulta aos k-vizinhos mais próximos. Como base para a criação do modelo de custo foi utilizado o método de acesso métrico dinâmico Slim-Tree. O modelo estima a dimensão intrínseca do conjunto de dados pela sua dimensão de correlação fractal. A validação do modelo é confirmada por experimentos com conjuntos de dados sintéticos e reais, de variados tamanhos e dimensões, que mostram que as estimativas obtidas em geral estão dentro da faixa de variação medida em consultas reais
Título en inglés
Cost model for similarity queries in metric spaces
Palabras clave en inglés
Cost model
Selectivity estimation
Similarity queries
Resumen en inglés
This thesis presents a cost model to estimate the number of disk accesses (I/O costs) and the number of distance calculations (CPU costs) to process similarity queries over data indexed by dynamic metric access methods. The goal of the model is to optimize similarity queries on relational and object-relational Database Management Systems. Two types of similarity queries were taken into consideration: range queries and k-nearest neighbor queries. The dynamic metric access method Slim-Tree was used as the basis for the creation of the cost model. The model takes advantage of the intrinsic dimension of the data set, estimated by its correlation fractal dimension. Experiments were performed on real and synthetic data sets, with different sizes and dimensions, in order to validate the proposed model. They confirmed that the estimations are accurate, being always within the range achieved executing real queries
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
tese_final.pdf (1.17 Mbytes)
significa que el fichero sólamente puede ser acceder dentro da la Universidad de São Paulo.
Fecha de Publicación
2007-05-08
 
ADVERTENCIA: El material descrito abajo se refiere a los trabajos derivados de esta tesis o disertación. El contenido de estos documentos es responsabilidad del autor de la tesis o disertación.
  • BAIOCO, G. B., TRAINA, A. J. M., and TRAINA JR, Caetano. An Effective Cost Model for Similarity Queries in Metric Spaces. In 22nd ACM Symposium on Applied Computing (SAC), Seul, 2007. Proceedings of the 22nd ACM SAC 2007.New York : ACM Press, 2007. Abstract.
  • BAIOCO, G. B., TRAINA, A. J. M., and TRAINA JR, Caetano. MAMCost: Global and Local Estimates leading to Robust Cost Estimation of Similarity Queries [doi:10.1109/ssdbm.2007.17]. In 19th International Conference on Scientific and Statistical Database Management (SSDBM 2007), Banff, 2007. Proceedings of the SSDBM 2007.Los Alamitos : IEEE Computer Society, 2007.
Todos los derechos de la tesis/disertación pertenecen a los autores
Centro de Informática de São Carlos
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2019. Todos los derechos reservados.