Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Escola Internacional de Doutoramento (EIDUDC)
  • Teses de doutoramento
  • Ver ítem
  •   RUC
  • Escola Internacional de Doutoramento (EIDUDC)
  • Teses de doutoramento
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Aplicaciones del procesamiento del lenguaje natural en la recuperación de información en español

Thumbnail
Ver/abrir
VilaresFerro_Jesus_TD_2005.pdf (1.732Mb)
Use este enlace para citar
http://hdl.handle.net/2183/5682
Coleccións
  • Teses de doutoramento [2232]
Metadatos
Mostrar o rexistro completo do ítem
Título
Aplicaciones del procesamiento del lenguaje natural en la recuperación de información en español
Autor(es)
Vilares, Jesús
Director(es)
Alonso Pardo, Miguel
Freire Nistal, José Luis (1943-)
Data
2005
Centro/Dpto/Entidade
Universidade da Coruña. Departamento de Computación
Resumo
[Resumen] La relación entre Procesamiento del Lenguaje Natural y Recuperación de Información viene dada por la variación lingüística del idioma, es decir, cómo un mismo concepto se puede expresar de formas diferentes mediante modificaciones en la expresión, constituyendo el principal problema en el ámbito de la Recuperación de Información, El objetivo de esta tesis es el desarrollo de tecnología de base para el Procesamiento del Lenguaje Natural y el estudio de la viabilidad de su aplicación en sistemas de Recuperación de Información sobre documentos en español. Si bien existen estudios similares para otras lenguas, con un claro dominio del inglés, el español ha quedado relegado frecuentemente a un segundo plano. Además, su mayor complejidad lingüística no permite una extrapolación inmediata de los resultados obtenidos para el inglés, demandando la realización de experimentos específicos. Sin embargo, hemos tenido que hacer frente a la carencia de recursos lingüísticos libremente accesibles para el español. Para ello se ha debido restringir la complejidad de las soluciones propuestas, centrándose en la utilización de información léxica, de obtención más sencilla. Además, para minimizar el coste computacional de cara a la aplicación en entornos prácticos, se ha hecho amplio uso de tecnología de estado finito. En este contexto se ha desarrollado, en primer lugar, un preprocesador avanzado de base lingüística para la tokenización y segmentación de textos. A nivel flexivo, se ha estudiado la utilización de la lematización en la normalización de términos simples. A nivel derivativo, se ha desarrollado una herramienta de generación automática de familias morfológicas - conjuntos de palabras ligadas derivativamente y que comparten la misma raiz - para su empleo en la normalización de términos simples.
Palabras chave
Recuperación de la información
Procesamiento en lenguaje natural (Informática)
Information retrieval
Natural language processing
 
ISBN
978-84-693-3266-5

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións