Mostrar o rexistro simple do ítem

dc.contributor.authorCanosa, Xavier
dc.contributor.authorGamallo, Pablo
dc.contributor.authorVarela, Xavier
dc.contributor.authorMartínez Lema, Paulo
dc.contributor.authorGarcía, Marcos
dc.contributor.authorTaboada, José Angel
dc.date.accessioned2019-09-16T10:34:27Z
dc.date.available2019-09-16T10:34:27Z
dc.date.issued2019
dc.identifier.citationCanosa, X., Gamallo, P., Varela, X., Taboada, J., Martínez Lema, P., & Garcia, M. (2019). Uma utilidade para o reconhecimento de topónimos em documentos medievais. Linguamática, 11(1), 3-15.es_ES
dc.identifier.issn1647-0818
dc.identifier.urihttp://hdl.handle.net/2183/23941
dc.description.abstract[Resumo] Este artigo apresenta o método de construçao duma ferramenta para a anotaçao de entidades geográficas mencionadas em textos medievais. A nova ferramenta foi desenvolvida a partir dos módulos de língua contemporanea do LinguaKit, pacote multilingue de ferramentas de PLN. Uma coleçao de corpora anotados manualmente serviu de recurso para elaborar uma lista de topónimos medievais (gazetteers) e observar padroes para a melhora e implementaçao de novas regras de reconhecimento dos nomes de lugar. Depois da lista de entidades geográficas, os ativadores contextuais (triggers) foram o recurso determinante na melhora da abrangencia. Para o produto final, fizeram-se também ajustes menores na procura de recolher os elementos mais comuns do léxico e os contextos gramaticais das entidades geográficas mencionadas. Ainda que muito trabalho fica por fazer na elaboraçao de listas para entidades nao geográficas, na construçao dum modelo de língua medieval e um lexicon específico, o novo módulo pode ser utilizado para anotar textos e mostra uma melhora significativa a respeito dos módulos previamente existentes.es_ES
dc.description.abstract[Abstract] This paper describes a method to build a tool aimed at recognizing geographical named entities in medieval texts. The new tool has been developed using the corresponding modules for contemporary languages contained in LinguaKit, a suite of NLP tools. A collection of manually annotated corpora served as a resource to build a gazetteer of medieval toponyms and find patterns to improve and implement new rules for the recognition of place names. In addition to the gazetteer, a list of triggers was the most determinant factor to improve recall. Final adjustments considered the most frequent terms of the lexicon and grammatical contexts for geographical named entities. In the process of building a model of medieval language and a specific lexicon, the available tool can already be used to annotate texts and shows a significant improvement when compared with previous modules. However, most work remains to be done in terms of adding specific gazetteers for entities other than geographical.es_ES
dc.description.sponsorshipXunta de Galicia; ED341DR2016/011
dc.language.isopores_ES
dc.publisherUniversidade do Minhoes_ES
dc.relation.urihttps://doi.org/10.21814/lm.11.1.291es_ES
dc.rightsCreative Commons Attribution 4.0 International License.es_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.subjectEntidades geográficas mencionadases_ES
dc.subjectNERCes_ES
dc.subjectToponímiaes_ES
dc.subjectGeographical named entitieses_ES
dc.subjectPlace nameses_ES
dc.titleUma Utilidade para o Reconhecimento de Topónimos em Documentos Medievaises_ES
dc.title.alternativeA Tool for Toponym Recognition in Medieval Documentses_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.rights.accessinfo:eu-repo/semantics/openAccesses_ES
UDC.journalTitleLinguamáticaes_ES
UDC.volume11es_ES
UDC.issue1es_ES
UDC.startPage3es_ES
UDC.endPage15es_ES


Ficheiros no ítem

Thumbnail
Thumbnail

Este ítem aparece na(s) seguinte(s) colección(s)

Mostrar o rexistro simple do ítem