Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas del RUC
    • FAQ
    • Derechos de autor
    • Más información en INFOguías UDC
  • Listar 
    • Comunidades
    • Buscar por:
    • Fecha de publicación
    • Autor
    • Título
    • Materia
  • Ayuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Español 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Filoloxía
  • Investigación (FFIL)
  • Ver ítem
  •   RUC
  • Facultade de Filoloxía
  • Investigación (FFIL)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego

Thumbnail
Ver/Abrir
Garcia_Marcos_2016_Creacion_de_un_treebank_de_dependencias_universales_mediante_recursos_existentes_para_lenguas_próximas_el_caso_del_gallego.pdf (252.9Kb)
Use este enlace para citar
http://hdl.handle.net/2183/19272
Colecciones
  • Investigación (FFIL) [885]
Metadatos
Mostrar el registro completo del ítem
Título
Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego
Autor(es)
García, Marcos
Gómez-Rodríguez, Carlos
Alonso, Miguel A.
Fecha
2016-09
Cita bibliográfica
García, Marcos; Gómez-Rodríguez, Carlos and Alonso Pardo, Miguel A. Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego, Procesamiento del Lenguaje Natural, 57:pp. 33-40, 2016.
Resumen
[Resumen] En este trabajo presentamos una nueva estrategia para crear treebanks de lenguas con pocos recursos para el análisis sintáctico. El método consiste en la adaptación y combinación de diferentes treebanks anotados con dependencias universales de variedades lingüísticas próximas, con el objetivo de entrenar un analizador sintáctico para la lengua elegida, en nuestro caso el gallego. Durante el proceso de selección y adaptación de los treebanks de origen, analizamos el impacto de propiedades de tres niveles diferentes: (i) la distancia entre las lenguas de origen y destino, (ii) la adaptación de características léxico-ortográficas, y (iii) las directrices de anotación entre los treebanks. Usando la estrategia propuesta, entrenamos un analizador sintáctico estadístico para etiquetar, con resultados prometedores y sin datos previos de gallego, un pequeño corpus de esta lengua. La corrección manual de este corpus, usado como gold-standard, nos permitió probar la eficacia del método propuesto.
Palabras clave
Análisis sintáctico
Treebank
Dependencias universales
Gallego (Lengua)
 
Versión del editor
http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5334
ISSN
1135-5948

Listar

Todo RUCComunidades & ColeccionesPor fecha de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor fecha de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

Mi cuenta

AccederRegistro

Estadísticas

Ver Estadísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Sugerencias