On the impact of syntactic infusion for gender categorization across contextual dimensions
| UDC.coleccion | Investigación | es_ES |
| UDC.departamento | Ciencias da Computación e Tecnoloxías da Información | es_ES |
| UDC.endPage | 178 | es_ES |
| UDC.grupoInv | Lingua e Sociedade da Información (LYS) | es_ES |
| UDC.institutoCentro | CITIC - Centro de Investigación de Tecnoloxías da Información e da Comunicación | es_ES |
| UDC.issue | 74 | es_ES |
| UDC.journalTitle | Procesamiento del Lenguaje Natural | es_ES |
| UDC.startPage | 159 | es_ES |
| dc.contributor.author | Veiga Menéndez, Inés María | |
| dc.contributor.author | Muñoz-Ortiz, Alberto | |
| dc.contributor.author | Vilares, David | |
| dc.date.accessioned | 2025-05-20T16:56:45Z | |
| dc.date.available | 2025-05-20T16:56:45Z | |
| dc.date.issued | 2025-03 | |
| dc.description.abstract | [Abstract]: This paper investigates how incorporating syntactic information can enhance the categorization of text into multiple gender dimensions, defined by our own identity (as category), the person we are addressing (to category), or the individual we are discussing (about category). Specifically, we explore the use of dependency grammars to integrate explicit syntactic embeddings while leveraging the strengths of pre-trained masked language models (MLMs). Our goal is to determine if dependency grammars add value beyond the implicit syntactic understanding already captured by MLMs. We begin by establishing a baseline using standard MLMs. Next, we propose a neural architecture that explicitly integrates dependency-based structures into this baseline, enabling a comparative analysis of performance and variations. Finally, in addition to evaluating the results, we analyzed the training dynamics of the two proposed variants to provide additional insights into their behavior during the fine-tuning stage. Explicit syntactic information boosts performance in single-task setups, though its gains fade in multitask scenarios. | es_ES |
| dc.description.abstract | [Resumen]: Este artículo investiga cómo incorporar información sintáctica puede mejorar la clasificación de textos en múltiples dimensiones de género, definidas por nuestra propia identidad (categoría as), la persona a la que nos dirigimos (categoría to) o el individuo del que se habla (categoría about). En concreto, exploramos el uso de gramáticas de dependencias para integrar representaciones sintácticas explícitas, complementando las representaciones de modelos de lenguaje enmascarados preentrenados (MLMs). Nuestro objetivo es determinar si las gramáticas de dependencias aportan algo más allá de la comprensión sintáctica implícita ya capturada por los MLMs. Para ello, primero establecemos un modelo base usando un MLM estándar. A continuación, proponemos una arquitectura neuronal que integra en este modelo estructuras basadas en dependencias de forma explícita, permitiendo comparar el rendimiento y las variaciones. Finalmente, evaluamos los resultados y analizamos las dinámicas de entrenamiento de las dos variantes propuestas para ofrecer información adicional sobre su comportamiento durante la etapa de ajuste fino. La información sintáctica explícita mejora el rendimiento en configuraciones de tarea única, aunque sus beneficios disminuyen en escenarios multitarea. | es_ES |
| dc.description.sponsorship | This work was supported by GAP (PID2022-139308OA-I00) funded by MICIU/AEI/10.13039/501100011033/ and by ERDF, EU; SCANNER-UDC (PID2020-113230RB-C21) funded by MICIU/AEI/10.13039/501100011033; Xunta de Galicia (ED431C 2024/02); Grant PRE2021-097001 funded by MICIU/AEI/10.13039/501100011033 and by ESF+ (predoctoral training grant associated to project PID2020-113230RB-C21); LATCHING (PID2023- 147129OB-C21) funded by MICIU/AEI/10.13039/501100011033 and ERDF; and Centro de Investigación de Galicia “CITIC”, funded by the Xunta de Galicia through the collaboration agreement between the Consellería de Cultura, Educación, Formación Profesional e Universidades and the Galician universities for the reinforcement of the research centres of the Galician University System (CIGUS). | es_ES |
| dc.description.sponsorship | Xunta de Galicia; ED431C 2024/02 | es_ES |
| dc.identifier.citation | Veiga Menéndez, I., Muñoz-Ortiz, A., & Vilares, D. (2025). On the Impact of Syntactic Infusion for Gender Categorization Across Contextual Dimensions. Procesamiento del Lenguaje Natural, 74, 159-178. DOI 10.26342/2025-74-11 | es_ES |
| dc.identifier.doi | 10.26342/2025-74-11 | |
| dc.identifier.issn | 1135-5948 | |
| dc.identifier.issn | 1989-7553 | |
| dc.identifier.uri | http://hdl.handle.net/2183/42038 | |
| dc.language.iso | eng | es_ES |
| dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | es_ES |
| dc.relation.projectID | info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PID2022-139308OA-100/ES/REPRESENTACIONES ESTRUCTURADAS VERDES Y ENCHUFABLES | es_ES |
| dc.relation.projectID | info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/PID2020-113230RB-C21/ES/MODELOS MULTITAREA DE ETIQUETADO SECUENCIAL PARA EL RECONOCIMIENTO DE ENTIDADES ENRIQUECIDO CON INFORMACIÓN LINGÜÍSTICA: SINTAXIS E INTEGRACIÓN MULTITAREA (SCANNER-UDC) | es_ES |
| dc.relation.projectID | info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PID2023-147129OB-C21/ES/TECNOLOGÍAS DEL LENGUAJE DESDE UNA PERSPECTIVA VERDE (LATCHING): DOMINIOS CON ESCASOS RECURSOS | es_ES |
| dc.relation.projectID | info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/PRE2021-097001/ES/ | es_ES |
| dc.relation.uri | https://doi.org/10.26342/2025-74-11 | es_ES |
| dc.rights | ©2025 Sociedad Española para el Procesamiento del Lenguaje Natural | es_ES |
| dc.rights.accessRights | open access | es_ES |
| dc.subject | Gender classification | es_ES |
| dc.subject | Dependency grammars | es_ES |
| dc.subject | Training dynamics | es_ES |
| dc.subject | Clasificación de género | es_ES |
| dc.subject | Gramáticas de dependencias | es_ES |
| dc.subject | Dinámicas de entrenamiento | es_ES |
| dc.title | On the impact of syntactic infusion for gender categorization across contextual dimensions | es_ES |
| dc.title.alternative | Sobre el impacto de la integración sintáctica en la categorización de género a través de dimensiones contextuales | es_ES |
| dc.type | journal article | es_ES |
| dc.type.hasVersion | VoR | es_ES |
| dspace.entity.type | Publication | |
| relation.isAuthorOfPublication | edf1cde8-d272-4a73-bdd3-9be2361b7651 | |
| relation.isAuthorOfPublication | 37dabbe9-f54f-43bb-960e-0bf3ac7e54eb | |
| relation.isAuthorOfPublication.latestForDiscovery | edf1cde8-d272-4a73-bdd3-9be2361b7651 |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- MunozOrtiz_Alberto_2025_On_the_impact_of_syntactic_infusion_for_gender_categorization_across_contextual_dimensions.pdf
- Size:
- 2.82 MB
- Format:
- Adobe Portable Document Format
- Description:

