Une approche formelle pour la génération d'analyseurs de langages naturels
Ver/ abrir
Use este enlace para citar
http://hdl.handle.net/2183/165Coleccións
Metadatos
Mostrar o rexistro completo do ítemTítulo
Une approche formelle pour la génération d'analyseurs de langages naturelsData
2005-11-21Cita bibliográfica
Blache, P. (ed.), Actes de Traitment Automatique des Langages Naturels (TALN-1995), Marseille (France), pp. 246-255
Resumo
[Abstract] Un processus d'analyse syntaxique et d'annotation efficace est déterminante dans l'élaboration de structures d'analyse de langages naturels. Ce papier introduit un environnement de programmation permettant l'implémentation du support formel des langages naturels depuis deux points de vue, analyse syntaxique et annotation. Le problème de l'analyse syntaxique se pose dans le domaine de l'analyse de grammaires algébriques sans restrictions, et celui de l'annotation dans le contexte des automates finis non déterministes.
L'analyseur syntaxique prends en entrée un texte arbitraire, suivant la structure désignée par une grammaire algébrique. La structure de la forêt partagée résultante est étudiée par rapport à l'optimisation du partage syntaxique, de façon à favoriser l'élimination des ambigüités pendant le processus sémantique. Les automates à états finis sont utilisés comme formalisme opérationnel pour annoter les corpora de façon efficace, spécialement pour les langages autres que l'Anglais, pour lesquels l'analyse morphologique a une relevance accrue. Les deux activités, analyse syntaxique et annotation, sont intégrées dans un même outil, qui a pour nom Galena (pour Generador de Analizadores para Lenguages Naturales), fournissant l'incrémentalité comme fonctionnalité favorisant la réutilisabilité des composantes d'un point de vue génie logiciel.
Palabras chave
Analyse syntaxique
Analyse morphologique
Automates à États Finis
Automates à piles
Forêt partagée
Annotation
Analyse morphologique
Automates à États Finis
Automates à piles
Forêt partagée
Annotation