• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.3.2018.tde-05032018-151842
Documento
Autor
Nombre completo
Rodolfo Valiente Romero
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2017
Director
Tribunal
Bressan, Graça (Presidente)
Potts, Alain Segundo
Silva, Flavio Soares Correa da
Título en portugués
Processo automático de reconhecimento de texto em imagens de documentos de identificação genéricos.
Palabras clave en portugués
Documentos de identificação
Reconhecimento de textos
Resumen en portugués
Existe uma busca crescente por métodos de extração de texto em imagens de documentos. O uso de imagens digitais tem se tornado cada vez mais frequente em diversas áreas. O mundo moderno está cheio de texto, que os seres humanos usam para identificar objetos, navegar e tomar decisões. Embora o problema do reconhecimento de texto tenha sido amplamente estudado dentro de determinados domínios, detectar e ler texto em documentos de identificação, continua sendo um desafio aberto. Apresenta-se uma arquitetura que integra os diferentes algoritmos de localização, extração e reconhecimento aplicados à extração de texto em documentos de identificação genéricos. O método de localização proposto usa o algoritmo MSER junto com uma melhoria do contraste e a informação das bordas dos objetos da imagem, para localizar os possíveis caracteres. A etapa de seleção desenvolveu-se mediante a busca de heurísticas, capazes de classificar as regiões localizadas como textuais e não-textuais. Na etapa de reconhecimento é proposto um método iterativo para melhorar o desempenho do OCR. O processo foi avaliado usando as métricas precisão e revocação e foi realizada uma prova de conceito do sistema em um ambiente real. A abordagem proposta é robusta na detecção de textos oriundos de imagens complexas com diferentes orientações, dimensões e cores. O sistema de reconhecimento de texto proposto apresenta resultados competitivos, tanto em precisão e taxa de reconhecimento, quando comparados com outros sistemas. Mostrando excelente desempenho e viabilidade de sua implementação em sistemas reais.
Título en inglés
Automatic text recognition process in identification document images.
Palabras clave en inglés
Identification documents
MSER
OCR
Text recognition
Resumen en inglés
The use of digital images has become more and more frequent in several areas. The modern world is full of text, which humans use to identify objects, navigate and make decisions. Although the problem of text recognition has been extensively studied within certain domains, detecting and recognizing text in identification documents remains an open challenge. We present an architecture that integrates the different localization, extraction and recognition algorithms applied to extracting text in generic identification documents. The proposed localization method uses the MSER algorithm together to contrast enhance and edge detection to find the possible characters. The selection stage was developed through the search for heuristics, capable of classifying the located regions in textual and non-textual. In the recognition step, an iterative method is proposed to improve OCR performance. The process was evaluated using the metrics precision and recall and a proof of concept of the system was performed in a real environment. The proposed approach is robust in detecting texts from complex images with different orientations, dimensions and colors. The text recognition system presents competitive results, both in accuracy and recognition rate, when compared with other systems in the current technical literature. Showing excellent performance and feasibility of its implementation in real systems.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2018-03-09
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.