Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas del RUC
    • FAQ
    • Derechos de autor
    • Más información en INFOguías UDC
  • Listar 
    • Comunidades
    • Buscar por:
    • Fecha de publicación
    • Autor
    • Título
    • Materia
  • Ayuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Español 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Escola Internacional de Doutoramento (EIDUDC)
  • Teses de doutoramento
  • Ver ítem
  •   RUC
  • Escola Internacional de Doutoramento (EIDUDC)
  • Teses de doutoramento
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Aplicaciones del procesamiento del lenguaje natural en la recuperación de información en español

Thumbnail
Ver/Abrir
VilaresFerro_Jesus_TD_2005.pdf (1.732Mb)
Use este enlace para citar
http://hdl.handle.net/2183/5682
Colecciones
  • Teses de doutoramento [2232]
Metadatos
Mostrar el registro completo del ítem
Título
Aplicaciones del procesamiento del lenguaje natural en la recuperación de información en español
Autor(es)
Vilares, Jesús
Directores
Alonso Pardo, Miguel
Freire Nistal, José Luis (1943-)
Fecha
2005
Centro/Dpto/Entidad
Universidade da Coruña. Departamento de Computación
Resumen
[Resumen] La relación entre Procesamiento del Lenguaje Natural y Recuperación de Información viene dada por la variación lingüística del idioma, es decir, cómo un mismo concepto se puede expresar de formas diferentes mediante modificaciones en la expresión, constituyendo el principal problema en el ámbito de la Recuperación de Información, El objetivo de esta tesis es el desarrollo de tecnología de base para el Procesamiento del Lenguaje Natural y el estudio de la viabilidad de su aplicación en sistemas de Recuperación de Información sobre documentos en español. Si bien existen estudios similares para otras lenguas, con un claro dominio del inglés, el español ha quedado relegado frecuentemente a un segundo plano. Además, su mayor complejidad lingüística no permite una extrapolación inmediata de los resultados obtenidos para el inglés, demandando la realización de experimentos específicos. Sin embargo, hemos tenido que hacer frente a la carencia de recursos lingüísticos libremente accesibles para el español. Para ello se ha debido restringir la complejidad de las soluciones propuestas, centrándose en la utilización de información léxica, de obtención más sencilla. Además, para minimizar el coste computacional de cara a la aplicación en entornos prácticos, se ha hecho amplio uso de tecnología de estado finito. En este contexto se ha desarrollado, en primer lugar, un preprocesador avanzado de base lingüística para la tokenización y segmentación de textos. A nivel flexivo, se ha estudiado la utilización de la lematización en la normalización de términos simples. A nivel derivativo, se ha desarrollado una herramienta de generación automática de familias morfológicas - conjuntos de palabras ligadas derivativamente y que comparten la misma raiz - para su empleo en la normalización de términos simples.
Palabras clave
Recuperación de la información
Procesamiento en lenguaje natural (Informática)
Information retrieval
Natural language processing
 
ISBN
978-84-693-3266-5

Listar

Todo RUCComunidades & ColeccionesPor fecha de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor fecha de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

Mi cuenta

AccederRegistro

Estadísticas

Ver Estadísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Sugerencias