A comparison of statistical association measures for identifying dependency-based collocations in various languages
Use este enlace para citar
http://hdl.handle.net/2183/37283
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución 4.0 Internacional
Coleccións
Metadatos
Mostrar o rexistro completo do ítemTítulo
A comparison of statistical association measures for identifying dependency-based collocations in various languagesData
2019Cita bibliográfica
Marcos Garcia, Marcos García Salido, and Margarita Alonso-Ramos. 2019. A comparison of statistical association measures for identifying dependency-based collocations in various languages.. In Proceedings of the Joint Workshop on Multiword Expressions and WordNet (MWE-WN 2019), pages 49–59, Florence, Italy. Association for Computational Linguistics.
Resumo
[Abstract] This paper presents an exploration of different statistical association measures to automatically identify collocations from corpora
in English, Portuguese, and Spanish. To
evaluate the impact of the association measures we manually annotated corpora with
three different syntactic patterns of collocations (adjective-noun, verb-object and nominal compounds). We took advantage of the
PARSEME 1.1 Shared Task corpora by selecting a subset of 155k tokens in the three
referred languages, in which we annotated
1, 526 collocations with their Lexical Functions according to the Meaning-Text Theory.
Using the resulting gold-standard, we have
carried out a comparison between frequency
data and several well-known association measures, both symmetric and asymmetric. The
results show that the combination of dependency triples with raw frequency information is as powerful as the best association
measures in most syntactic patterns and languages. Furthermore, and despite the asymmetric behaviour of collocations, directional
approaches perform worse than the symmetric
ones in the extraction of these phraseological
combinations.
Palabras chave
Collocations
Statistical measures
Languages
Portuguese language
English language
Spanish language
Corpora
Statistical measures
Languages
Portuguese language
English language
Spanish language
Corpora
Versión do editor
Dereitos
Atribución 4.0 Internacional
ISBN
9781950737260
Ítems relacionados
Mostrando ítems relacionados por Título, autor ou materia.
-
Hacia una didáctica de la lengua minorizada en contextos de asimilación lingüística: algunas aportaciones desde la teoría
Campos, Iris Orosia (Universidade da Coruña, 2018)[Resumen] Actualmente, alrededor de 120 lenguas europeas son denominadas como regionales o minoritarias y solo el 10% de los idiomas del mundo están fuera de riesgo de desaparición. Uno de los principales campos para la ... -
O neofalantismo no ensino secundario: un espazo sen lexitimar
López Alonso, Luís (Universidade da Coruña - Servizo de Publicacións, 2020-12-31)[Resumo] Após de corenta anos de oficialización da lingua galega, os datos estatísticos evidencian que tanto o modelo educativo como os outros mecanismos de normalización lingüística fracasaron. A substitución lingüística ... -
Da narrativa de tradición oral ás aulas : una propuesta educativa intergeneracional para revitalizar el gallego, mejorar la competencia comunicativa del profesorado y valorar la literatura de tradición oral
Carballal Miñán, Patricia; Mosquera-Castro, Estefanía (Editorial Universidad de Sevilla, 2018-12-30)[Resumen] Este trabajo versa sobre una experiencia práctica que fue llevada a cabo en el curso 2016/2017 en el Grado de Educación Primaria de la Universidad de A Coruña, en dos asignaturas: “Lingua galega e ...