• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
10.11606/T.3.2012.tde-03072013-154035
Documento
Autor
Nome completo
Nicolau Leal Werneck
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2012
Orientador
Banca examinadora
Reali Costa, Anna Helena (Presidente)
Campos, Mário Fernando Montenegro
Hae, Yong Kim
Hashimoto, Ronaldo Fumio
Nakamura, Ricardo
Título em português
Estimação de orientação de câmera em ambientes antrópicos a partir de edgels.
Palavras-chave em português
Inteligência artificial
Processamento de imagens
Reconhecimento de padrões
Visão computacional
Resumo em português
Esta tese apresenta o Corisco, um método para estimar a orientação de uma câmera a partir de uma única imagem capturada de um ambiente antrópico. O Corisco foi desenvolvido com o objetivo de atender às necessidades de aplicações de Robótica Móvel e da análise de grandes conjuntos de imagens, o que significa que o método deve não só apresentar um bom desempenho computacional, mas também deve poder utilizar diferentes modelos de câmera, permitir realizar um comprometimento entre a velocidade de cálculo e acurácia dos resultados, e ainda deve poder tanto aproveitar estimativas iniciais da solução, quanto dispensá-las. O Corisco apresenta todas estas características. Os ambientes considerados possuem um sistema referencial natural com três eixos ortogonais, e contêm conjuntos de retas paralelas a estes eixos. A orientação estimada é uma rotação tridimensional entre o referencial natural e o sistema referencial da câmera. O Corisco requer o conhecimento do modelo de câmera, mas qualquer modelo de câmera pode ser utilizado. Corisco analisa imagens utilizando um processo de extração de edgels, que são pontos localizados nas projeções das retas do ambiente, associados à direção tangencial da projeção da reta naquele ponto. Esta extração de edgels utiliza uma máscara em forma de grade que permite sub-amostrar os dados, criando um comprometimento entre velocidade e precisão. A orientação é estimada através de um processo de otimização em dois passos que minimiza uma função objetivo definida pela técnica de M-estimação, com uma função de erro redescendente. Esta técnica é equivalente à aplicação de estimação MAP ou EM nos métodos similares existentes. O primeiro passo da otimização utiliza o algoritmo RANSAC, permitindo ao Corisco funcionar sem estimativas iniciais, e o segundo passo é um processo de otimização contínua com restrições que explora a parametrização da orientação por quaternos. O Corisco foi testado com diferentes modelos de câmera, incluindo a projeção perspectiva, um modelo com distorção radial, e duas projeções onidirecionais, a polar equidistante e a equiretangular. O tempo médio de cálculo pode ser controlado através de dois parâmetros, que podem também afetar a exatidão. A exatidão observada ao comparar as estimativas do Corisco com orientações de referência foi tipicamente próxima a 1 grau para tempos de execução acima de 20 segundos, e aproximadamente 4 graus para menos de dois segundos. Este desempenho alcançou os objetivos estabelecidos, e os resultados experimentais validaram o método para aplicações práticas.
Título em inglês
Camera orientation estimation in anthropic environments from edgels.
Palavras-chave em inglês
Artificial intelligence
Computer vision
Image processing
Pattern recognition
Resumo em inglês
This thesis presents Corisco, a method to estimate the orientation of a camera from a single image captured from an anthropic environment. Corisco was developed with the objective of answering the needs of Mobile Robotics applications, and of the analysis of large set of images, what means that the method should present not only a good computational performance, but it should also be able to use different camera models, allow to control the compromise between calculation speed and result precision, and must also be capable of both exploiting initial estimates of the result, and of operating without any initial estimates. Corisco presents all of these characteristics. The considered environments have a natural reference system with three orthogonal axes, and contain sets of lines parallel to these axes. The estimated orientation is a three-dimensional rotation between the natural reference frame and the camera frame. Corisco requires the knowledge of the camera model, but any camera model can be used. Corisco analyzes images using a process that extracts edgels, which are points located on the projections of the environment lines, associated with the tangential direction of the line projection at that point. This edgel extraction technique uses a grid mask that can sub-sample the data, creating a compromise between speed and precision. The orientation is estimated through a two-step optimization process that minimizes an objective function defined by the M-estimation technique, using a redescending error function. This technique is equivalent to the application of the MAP or the EM estimation in similar existing methods. The first optimization step uses the RANSAC algorithm, allowing Corisco to work without initial estimates, and the second step is a continuous and constrained optimization process that explores the orientation parametrization by quaternions. Corisco was tested with different camera models, including the perspective projection, a model with radial distortion, and two omnidirectional projections, the polar equidistant and the equirectangular. The mean calculation time can be controlled through a couple of parameters, which may also affect the accuracy. The accuracy observed by comparing the Corisco estimates with reference orientations was typically near 1 degree for execution times above 20 seconds, and approximately 4 degrees for less than two seconds. This performance attained the established objectives, and the experimental results validated the method for practical applications.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
TESE_NIC_repair.pdf (14.38 Mbytes)
Data de Publicação
2013-07-12
 
AVISO: O material descrito abaixo refere-se a trabalhos decorrentes desta tese ou dissertação. O conteúdo desses trabalhos é de inteira responsabilidade do autor da tese ou dissertação.
  • WERNECK, N. L., and COSTA, Anna Helena Reali. Mapping with Monocular Vision in Two Dimensions [doi:10.4018/jncr.2010100106]. International Journal of Natural Computing Research [online], 2010, vol. 1, p. 56-65.
  • TRUZZI, F. S., et al. Robust image segmentation applied to bee s fore wings. In X Encontro sobre Abelhas, Ribeirão Preto, 2012. Anais do X Encontro sobre Abelhas., 2012. Abstract.
  • TRUZZI, F. S., WERNECK, N. L., e COSTA, Anna Helena Reali. Rastreamento de pessoas em sequências de imagens capturadas por uma câmera estática. In VI Workshop de Visão Computacional, Presidente Prudente, 2010. Anais do VI WVC.Presidente Prudente : FCT Unesp, 2010. Dispon?vel em: http://iris.sel.eesc.usp.br/wvc/anais_WVC2010.
  • WERNECK, N. L., and COSTA, Anna Helena Reali. Monocular visual mapping with the fast Hough transform. In VI Workshop de Visão Computacional, Presidente Prudente, 2010. Anais do VI WVC.Presidente Prudente : FCT Unesp, 2010. Available from: http://iris.sel.eesc.usp.br/wvc/anais_WVC2010.
  • WERNECK, N. L., and COSTA, Anna Helena Reali. Speeding up probabilistic inference of camera orientation by function approximation and grid masking. In 19th. International Conference on Computer Graphics, Visualization and, Pilsen, Czech Republic, 2011. WSCG'2011 Proceedings.Pilsen, Czech Republic : Vaclav Skala Union Agency, 2011.
  • WERNECK, N. L., e COSTA, Anna Helena Reali. SLAM monocular com reconstrução de planos para ambientes internos. In WTDIA 2010 - V Workshop on MSc Dissertation and PhD Thesis in Artificial Intelligence, São Bernardo do Campo, 2010. Anais do WTDIA 2010 - V Workshop on MSc Dissertation and PhD Thesis in Artificial Intelligence. : SBC, 2010.
  • WERNECK, N. L., TRUZZI, F. S., e COSTA, Anna Helena Reali. Medição de distância e altura de bordas horizontais com visão monocular linear para robôs móveis. In WVC'2009 - V Workshop de Visão Computacional, São Paulo, 2009. Anais do V Workshop de Visão Computacional.São Paulo : Universidade Presbiteriana Mackenzie, 2009.
Todos os direitos da tese/dissertação são de seus autores
Centro de Informática de São Carlos
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2020. Todos os direitos reservados.