Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego
| UDC.coleccion | Investigación | es_ES |
| UDC.departamento | Letras | es_ES |
| UDC.endPage | 40 | es_ES |
| UDC.grupoInv | Lingua e Sociedade da Información (LYS) | es_ES |
| UDC.journalTitle | Procesamiento del Lenguaje Natural | es_ES |
| UDC.startPage | 33 | es_ES |
| UDC.volume | 57 | es_ES |
| dc.contributor.author | García, Marcos | |
| dc.contributor.author | Gómez-Rodríguez, Carlos | |
| dc.contributor.author | Alonso, Miguel A. | |
| dc.date.accessioned | 2017-07-13T11:27:37Z | |
| dc.date.available | 2017-07-13T11:27:37Z | |
| dc.date.issued | 2016-09 | |
| dc.description.abstract | [Resumen] En este trabajo presentamos una nueva estrategia para crear treebanks de lenguas con pocos recursos para el análisis sintáctico. El método consiste en la adaptación y combinación de diferentes treebanks anotados con dependencias universales de variedades lingüísticas próximas, con el objetivo de entrenar un analizador sintáctico para la lengua elegida, en nuestro caso el gallego. Durante el proceso de selección y adaptación de los treebanks de origen, analizamos el impacto de propiedades de tres niveles diferentes: (i) la distancia entre las lenguas de origen y destino, (ii) la adaptación de características léxico-ortográficas, y (iii) las directrices de anotación entre los treebanks. Usando la estrategia propuesta, entrenamos un analizador sintáctico estadístico para etiquetar, con resultados prometedores y sin datos previos de gallego, un pequeño corpus de esta lengua. La corrección manual de este corpus, usado como gold-standard, nos permitió probar la eficacia del método propuesto. | es_ES |
| dc.description.sponsorship | Ministerio de Economía y Competitividad; FFI2014-51978-C2-1-R | es_ES |
| dc.description.sponsorship | Ministerio de Economía y Competitividad; FJCI-2014-22853 | es_ES |
| dc.description.sponsorship | Ministerio de Economía y Competitividad; FFI2014-51978-C2-2-R | |
| dc.identifier.citation | García, Marcos; Gómez-Rodríguez, Carlos and Alonso Pardo, Miguel A. Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego, Procesamiento del Lenguaje Natural, 57:pp. 33-40, 2016. | es_ES |
| dc.identifier.issn | 1135-5948 | |
| dc.identifier.uri | http://hdl.handle.net/2183/19272 | |
| dc.language.iso | spa | es_ES |
| dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | es_ES |
| dc.relation.uri | http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5334 | es_ES |
| dc.rights.accessRights | open access | es_ES |
| dc.subject | Análisis sintáctico | es_ES |
| dc.subject | Treebank | es_ES |
| dc.subject | Dependencias universales | es_ES |
| dc.subject | Gallego (Lengua) | es_ES |
| dc.title | Creación de un treebank de dependencias universales mediante recursos existentes para lenguas próximas: el caso del gallego | es_ES |
| dc.type | journal article | es_ES |
| dspace.entity.type | Publication | |
| relation.isAuthorOfPublication | 8da895e1-853a-406d-ad80-959c213445bf | |
| relation.isAuthorOfPublication | e70a3969-39f6-4458-9339-3b71756fa56e | |
| relation.isAuthorOfPublication | 1318edb8-3967-465c-a267-146624c05837 | |
| relation.isAuthorOfPublication.latestForDiscovery | 8da895e1-853a-406d-ad80-959c213445bf |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Garcia_Marcos_2016_Creacion_de_un_treebank_de_dependencias_universales_mediante_recursos_existentes_para_lenguas_próximas_el_caso_del_gallego.pdf
- Size:
- 252.97 KB
- Format:
- Adobe Portable Document Format
- Description:

