Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Filoloxía
  • Investigación (FFIL)
  • Ver ítem
  •   RUC
  • Facultade de Filoloxía
  • Investigación (FFIL)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego

Thumbnail
Ver/abrir
Garcia_Marcos_2016_Creacion_de_un_treebank_de_dependencias_universales_mediante_recursos_existentes_para_lenguas_próximas_el_caso_del_gallego.pdf (252.9Kb)
Use este enlace para citar
http://hdl.handle.net/2183/19272
Coleccións
  • Investigación (FFIL) [885]
Metadatos
Mostrar o rexistro completo do ítem
Título
Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego
Autor(es)
García, Marcos
Gómez-Rodríguez, Carlos
Alonso, Miguel A.
Data
2016-09
Cita bibliográfica
García, Marcos; Gómez-Rodríguez, Carlos and Alonso Pardo, Miguel A. Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego, Procesamiento del Lenguaje Natural, 57:pp. 33-40, 2016.
Resumo
[Resumen] En este trabajo presentamos una nueva estrategia para crear treebanks de lenguas con pocos recursos para el análisis sintáctico. El método consiste en la adaptación y combinación de diferentes treebanks anotados con dependencias universales de variedades lingüísticas próximas, con el objetivo de entrenar un analizador sintáctico para la lengua elegida, en nuestro caso el gallego. Durante el proceso de selección y adaptación de los treebanks de origen, analizamos el impacto de propiedades de tres niveles diferentes: (i) la distancia entre las lenguas de origen y destino, (ii) la adaptación de características léxico-ortográficas, y (iii) las directrices de anotación entre los treebanks. Usando la estrategia propuesta, entrenamos un analizador sintáctico estadístico para etiquetar, con resultados prometedores y sin datos previos de gallego, un pequeño corpus de esta lengua. La corrección manual de este corpus, usado como gold-standard, nos permitió probar la eficacia del método propuesto.
Palabras chave
Análisis sintáctico
Treebank
Dependencias universales
Gallego (Lengua)
 
Versión do editor
http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5334
ISSN
1135-5948

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións