• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.55.2018.tde-06032018-160704
Document
Auteur
Nom complet
Marcelo Alexandre Couto de Jesus
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Carlos, 1999
Directeur
Jury
Nunes, Maria das Graças Volpe (Président)
Aluisio, Sandra Maria
Carvalho, Ariadne Maria Brito Rizzoni
Titre en portugais
Representação de Léxicos Através de Autômatos Finitos
Mots-clés en portugais
Não disponível
Resumé en portugais
Aplicações de Processamento de Língua Natural (PLN), como revisores ortográficos, gramaticais e tradutores, geralmente precisam consultar extensos dicionários contendo, por exemplo, informações morfossintáticas de várias centenas de milhares de palavras de uma língua. Autômatos finitos, largamente utilizados na construção de eficientes analisadores léxicos para compiladores, apresentam-se como ótimos candidatos para o problema de representação desse tipo de léxico de língua natural. Este trabalho investigou os métodos de codificação de léxicos utilizando autômatos finitos, as técnicas de minimização de autômatos determinísticos acíclicos e as estruturas de dados necessárias para uma representação compacta, resultando em um sistema computacional eficiente e versátil de representação de grandes léxicos de língua natural. Um léxico de mais de 430.000 palavras da língua portuguesa pode ser convertido em um autômato de menos de 220Kb, em menos de 5 minutos usando um computador doméstico.
Titre en anglais
Not available
Mots-clés en anglais
Not available
Resumé en anglais
Natural Language Processing (NLP) applications, such as speller and grammar checkers and translation systems, need to search very larga dictionaries which contab.' morphosyntactical and/or semantic information of severa] hundreds of thousand words of a given language. Finite Automata are often used in efficient scanners for compilers and are also good candidates for representing dictionaries. This work has investigated methods for representing dictionaries using finite automata, techniques for minimizing acyclic deterministic finite automaton, and adequate data structures for a compact representation. The resulting system is able to represent a dictionary of 430,000 Brazilian Portuguese words in a 220Kb automaton, by using a standard home computer and spending less than five minutes.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2018-03-06
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.