• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.45.2012.tde-19122012-153525
Document
Author
Full name
Giseli de Araujo Ramos
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2012
Supervisor
Committee
Cesar Junior, Roberto Marcondes (President)
Goldenstein, Siome Klein
Morimoto, Carlos Hitoshi
Title in Portuguese
Detecção e rastreamento de lábios em dispositivos móveis
Keywords in Portuguese
Acessibilidade
detecção de lábios
rastreamento
Abstract in Portuguese
A tecnologia tem estado presente cada vez mais no dia-a-dia e trouxe avanços notáveis para a área de visão computacional. Uma das áreas de visão, a detecção de características humanas, sempre foi importante para tarefas de reconhecimento, vigilância, controle e outras. Há um grande potencial de uso na área de acessibilidade, podendo ser benéfica para um grupo de pessoas com necessidades especiais, para proporcionar uma maior interação com o ambiente e com as pessoas. Uma dessas características, os lábios, é útil para o reconhecimento visual e/ou auditivo da fala e pode ser usada para aplicações em acessibilidade de deficientes auditivos e surdos, como por exemplo para a leitura labial. Com a crescente popularização dos dispositivos móveis e avanços no hardware, além do custo cada vez mais acessível, torna-se possível a implementação de métodos rápidos e eficientes para detecção e seu posterior rastreamento. Assim, é possível o uso em tempo real nos dispositivos móveis. Esta dissertação descreve um sistema desenvolvido para a detecção e rastreamento da região dos lábios nesse contexto. A detecção da região dos lábios é feita pelo algoritmo de Viola-Jones, com o diferencial do uso de conjuntos de imagens sintéticas para o treinamento e geração do detector proposto. O rastreamento é baseado no Camshift com modificações, um método de rastreamento de objeto por kernel. A implementação é descrita em detalhes e são mostrados resultados obtidos por sequências gravadas em um dispositivo móvel. As sequências são capturadas em uma configuração não frontal, o que pode ser útil em aplicações específicas. Métricas baseadas no número de acertos, de erros e de falsos positivos são usadas para avaliar os resultados, além da taxa de quadros por segundo.
Title in English
Lip detection and tracking in mobile devices
Keywords in English
accessibility
lip detection
tracking
Abstract in English
Technology has been increasingly present and brought remarkable advances in the computer vision area. One of such areas, the detection and analysis of human behaviour, has been important for tasks of recognition, surveillance, control, and others. There is great potential for use in the area of accessibility, and it may benefit a group of people with special needs, to provide greater interaction with the environment and with people. Facial feature detection plays a central role in this context. One of these features, the lips, is useful for speech recognition and can be used for applications in accessibility of deaf and hearing impaired, such as for lip reading. With the growing popularity of mobile devices and advances in hardware, as well as more affordable costs, it becomes possible to implement rapid and reliable methods for lip detection and subsequent tracking. So it is possible the real-time use of mobile devices. This thesis describes a system developed for the detection and tracking lips region in this context. The detection of the lips region is carried out by the Viola-Jones algorithm, but with the use of sets of synthetic images for the detector training and generation. Tracking is based on Camshift with modifications, a kernel-based object tracking method. The implementation is described in details and results are shown from sequences recorded on a mobile device. The sequences are not captured on a frontal configuration, which may be useful in specific applications. Performance assessment in terms of metrics based on number of hits, errors and false positives are used to evaluate the results, in addition to the frame rate per second.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2013-01-02
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.