Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego

García, Marcos; Gómez-Rodríguez, Carlos; Alonso, Miguel A.

Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego

UDC.coleccion	Investigación	es_ES
UDC.departamento	Letras	es_ES
UDC.endPage	40	es_ES
UDC.grupoInv	Lingua e Sociedade da Información (LYS)	es_ES
UDC.journalTitle	Procesamiento del Lenguaje Natural	es_ES
UDC.startPage	33	es_ES
UDC.volume	57	es_ES
dc.contributor.author	García, Marcos
dc.contributor.author	Gómez-Rodríguez, Carlos
dc.contributor.author	Alonso, Miguel A.
dc.date.accessioned	2017-07-13T11:27:37Z
dc.date.available	2017-07-13T11:27:37Z
dc.date.issued	2016-09
dc.description.abstract	[Resumen] En este trabajo presentamos una nueva estrategia para crear treebanks de lenguas con pocos recursos para el análisis sintáctico. El método consiste en la adaptación y combinación de diferentes treebanks anotados con dependencias universales de variedades lingüísticas próximas, con el objetivo de entrenar un analizador sintáctico para la lengua elegida, en nuestro caso el gallego. Durante el proceso de selección y adaptación de los treebanks de origen, analizamos el impacto de propiedades de tres niveles diferentes: (i) la distancia entre las lenguas de origen y destino, (ii) la adaptación de características léxico-ortográficas, y (iii) las directrices de anotación entre los treebanks. Usando la estrategia propuesta, entrenamos un analizador sintáctico estadístico para etiquetar, con resultados prometedores y sin datos previos de gallego, un pequeño corpus de esta lengua. La corrección manual de este corpus, usado como gold-standard, nos permitió probar la eficacia del método propuesto.	es_ES
dc.description.sponsorship	Ministerio de Economía y Competitividad; FFI2014-51978-C2-1-R	es_ES
dc.description.sponsorship	Ministerio de Economía y Competitividad; FJCI-2014-22853	es_ES
dc.description.sponsorship	Ministerio de Economía y Competitividad; FFI2014-51978-C2-2-R
dc.identifier.citation	García, Marcos; Gómez-Rodríguez, Carlos and Alonso Pardo, Miguel A. Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego, Procesamiento del Lenguaje Natural, 57:pp. 33-40, 2016.	es_ES
dc.identifier.issn	1135-5948
dc.identifier.uri	http://hdl.handle.net/2183/19272
dc.language.iso	spa	es_ES
dc.publisher	Sociedad Española para el Procesamiento del Lenguaje Natural	es_ES
dc.relation.uri	http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5334	es_ES
dc.rights.accessRights	open access	es_ES
dc.subject	Análisis sintáctico	es_ES
dc.subject	Treebank	es_ES
dc.subject	Dependencias universales	es_ES
dc.subject	Gallego (Lengua)	es_ES
dc.title	Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego	es_ES
dc.type	journal article	es_ES
dspace.entity.type	Publication
relation.isAuthorOfPublication	8da895e1-853a-406d-ad80-959c213445bf
relation.isAuthorOfPublication	e70a3969-39f6-4458-9339-3b71756fa56e
relation.isAuthorOfPublication	1318edb8-3967-465c-a267-146624c05837
relation.isAuthorOfPublication.latestForDiscovery	8da895e1-853a-406d-ad80-959c213445bf

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Garcia_Marcos_2016_Creacion_de_un_treebank_de_dependencias_universales_mediante_recursos_existentes_para_lenguas_próximas_el_caso_del_gallego.pdf
Size:: 252.97 KB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Investigación (FFIL)