On the impact of syntactic infusion for gender categorization across contextual dimensions

UDC.coleccionInvestigaciónes_ES
UDC.departamentoCiencias da Computación e Tecnoloxías da Informaciónes_ES
UDC.endPage178es_ES
UDC.grupoInvLingua e Sociedade da Información (LYS)es_ES
UDC.institutoCentroCITIC - Centro de Investigación de Tecnoloxías da Información e da Comunicaciónes_ES
UDC.issue74es_ES
UDC.journalTitleProcesamiento del Lenguaje Naturales_ES
UDC.startPage159es_ES
dc.contributor.authorVeiga Menéndez, Inés María
dc.contributor.authorMuñoz-Ortiz, Alberto
dc.contributor.authorVilares, David
dc.date.accessioned2025-05-20T16:56:45Z
dc.date.available2025-05-20T16:56:45Z
dc.date.issued2025-03
dc.description.abstract[Abstract]: This paper investigates how incorporating syntactic information can enhance the categorization of text into multiple gender dimensions, defined by our own identity (as category), the person we are addressing (to category), or the individual we are discussing (about category). Specifically, we explore the use of dependency grammars to integrate explicit syntactic embeddings while leveraging the strengths of pre-trained masked language models (MLMs). Our goal is to determine if dependency grammars add value beyond the implicit syntactic understanding already captured by MLMs. We begin by establishing a baseline using standard MLMs. Next, we propose a neural architecture that explicitly integrates dependency-based structures into this baseline, enabling a comparative analysis of performance and variations. Finally, in addition to evaluating the results, we analyzed the training dynamics of the two proposed variants to provide additional insights into their behavior during the fine-tuning stage. Explicit syntactic information boosts performance in single-task setups, though its gains fade in multitask scenarios.es_ES
dc.description.abstract[Resumen]: Este artículo investiga cómo incorporar información sintáctica puede mejorar la clasificación de textos en múltiples dimensiones de género, definidas por nuestra propia identidad (categoría as), la persona a la que nos dirigimos (categoría to) o el individuo del que se habla (categoría about). En concreto, exploramos el uso de gramáticas de dependencias para integrar representaciones sintácticas explícitas, complementando las representaciones de modelos de lenguaje enmascarados preentrenados (MLMs). Nuestro objetivo es determinar si las gramáticas de dependencias aportan algo más allá de la comprensión sintáctica implícita ya capturada por los MLMs. Para ello, primero establecemos un modelo base usando un MLM estándar. A continuación, proponemos una arquitectura neuronal que integra en este modelo estructuras basadas en dependencias de forma explícita, permitiendo comparar el rendimiento y las variaciones. Finalmente, evaluamos los resultados y analizamos las dinámicas de entrenamiento de las dos variantes propuestas para ofrecer información adicional sobre su comportamiento durante la etapa de ajuste fino. La información sintáctica explícita mejora el rendimiento en configuraciones de tarea única, aunque sus beneficios disminuyen en escenarios multitarea.es_ES
dc.description.sponsorshipThis work was supported by GAP (PID2022-139308OA-I00) funded by MICIU/AEI/10.13039/501100011033/ and by ERDF, EU; SCANNER-UDC (PID2020-113230RB-C21) funded by MICIU/AEI/10.13039/501100011033; Xunta de Galicia (ED431C 2024/02); Grant PRE2021-097001 funded by MICIU/AEI/10.13039/501100011033 and by ESF+ (predoctoral training grant associated to project PID2020-113230RB-C21); LATCHING (PID2023- 147129OB-C21) funded by MICIU/AEI/10.13039/501100011033 and ERDF; and Centro de Investigación de Galicia “CITIC”, funded by the Xunta de Galicia through the collaboration agreement between the Consellería de Cultura, Educación, Formación Profesional e Universidades and the Galician universities for the reinforcement of the research centres of the Galician University System (CIGUS).es_ES
dc.description.sponsorshipXunta de Galicia; ED431C 2024/02es_ES
dc.identifier.citationVeiga Menéndez, I., Muñoz-Ortiz, A., & Vilares, D. (2025). On the Impact of Syntactic Infusion for Gender Categorization Across Contextual Dimensions. Procesamiento del Lenguaje Natural, 74, 159-178. DOI 10.26342/2025-74-11es_ES
dc.identifier.doi10.26342/2025-74-11
dc.identifier.issn1135-5948
dc.identifier.issn1989-7553
dc.identifier.urihttp://hdl.handle.net/2183/42038
dc.language.isoenges_ES
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PID2022-139308OA-100/ES/REPRESENTACIONES ESTRUCTURADAS VERDES Y ENCHUFABLESes_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/PID2020-113230RB-C21/ES/MODELOS MULTITAREA DE ETIQUETADO SECUENCIAL PARA EL RECONOCIMIENTO DE ENTIDADES ENRIQUECIDO CON INFORMACIÓN LINGÜÍSTICA: SINTAXIS E INTEGRACIÓN MULTITAREA (SCANNER-UDC)es_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PID2023-147129OB-C21/ES/TECNOLOGÍAS DEL LENGUAJE DESDE UNA PERSPECTIVA VERDE (LATCHING): DOMINIOS CON ESCASOS RECURSOSes_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/PRE2021-097001/ES/es_ES
dc.relation.urihttps://doi.org/10.26342/2025-74-11es_ES
dc.rights©2025 Sociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.rights.accessRightsopen accesses_ES
dc.subjectGender classificationes_ES
dc.subjectDependency grammarses_ES
dc.subjectTraining dynamicses_ES
dc.subjectClasificación de géneroes_ES
dc.subjectGramáticas de dependenciases_ES
dc.subjectDinámicas de entrenamientoes_ES
dc.titleOn the impact of syntactic infusion for gender categorization across contextual dimensionses_ES
dc.title.alternativeSobre el impacto de la integración sintáctica en la categorización de género a través de dimensiones contextualeses_ES
dc.typejournal articlees_ES
dc.type.hasVersionVoRes_ES
dspace.entity.typePublication
relation.isAuthorOfPublicationedf1cde8-d272-4a73-bdd3-9be2361b7651
relation.isAuthorOfPublication37dabbe9-f54f-43bb-960e-0bf3ac7e54eb
relation.isAuthorOfPublication.latestForDiscoveryedf1cde8-d272-4a73-bdd3-9be2361b7651

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
MunozOrtiz_Alberto_2025_On_the_impact_of_syntactic_infusion_for_gender_categorization_across_contextual_dimensions.pdf
Size:
2.82 MB
Format:
Adobe Portable Document Format
Description: