Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Informática
  • Traballos académicos (FIC)
  • Ver ítem
  •   RUC
  • Facultade de Informática
  • Traballos académicos (FIC)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Clasificación de género en espacios multi-dimensionales: modelos neuronales y la influencia de la información sintáctica

Thumbnail
Ver/abrir
VeigaMenendez_Ines_TFG_2023.pdf (22.43Mb)
Use este enlace para citar
http://hdl.handle.net/2183/33869
Atribución 3.0 España
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución 3.0 España
Coleccións
  • Traballos académicos (FIC) [715]
Metadatos
Mostrar o rexistro completo do ítem
Título
Clasificación de género en espacios multi-dimensionales: modelos neuronales y la influencia de la información sintáctica
Autor(es)
Veiga Menéndez, Inés María
Director(es)
Vilares Calvo, David
Data
2023
Centro/Dpto/Entidade
Universidade da Coruña. Facultade de Informática
Descrición
Traballo fin de grao (UDC.FIC). Ciencia e enxeñaría de datos. Curso 2022/2023
Resumo
[Resumen]: El lenguaje es utilizado por los humanos como herramienta de comunicación, pero también como vehículo para expresar sus emociones y reflejar su identidad. Diversos factores como la edad, el género o la cultura influyen sobre la forma de utilizar el lenguaje, determinando aspectos como el tono, la expresión o el vocabulario empleados. Este proyecto se inspira en trabajo previo donde se plantea que la expresión de género en el lenguaje se manifiesta a lo largo de tres dimensiones: género del hablante (as), género del receptor (to) y género del referente (about). Considerando esto, proponen una tarea de clasificación de textos en cada una de las dimensiones planteadas. La clasificación de textos es una tarea fundamental en el campo del Procesamiento del Lenguaje que consiste en asignarle una categoría predefinida a un texto. Con el creciente uso de datos extraídos de internet para realizar esta tarea, se ha observado un aumento de la presencia de sesgos de género en los datos. Al crear modelos que detecten el género en cada una de las dimensiones planteadas se busca analizar y ampliar el conocimiento sobre las diferencias que pueden darse en el lenguaje en función del género, ayudando así a crear tecnologías del lenguaje que consigan interpretar mejor la realidad de un proceso comunicativo. En el contexto de la tarea presentada, se plantea la cuestión de si la información sintáctica de una oración podría ser de utilidad para la clasificación del género en las dimensiones mencionadas. En este Trabajo de Fin de Grado se abordará el problema de la clasificación de texto en las dimensiones about (género de la persona sobre la que se habla), to (género de la persona a la que se le habla) y as (género de la persona que habla) mediante la implementación de un framework que contemple diversos modelos neuronales. Se llevará a cabo el desarrollo e implementación de distintos modelos neuronales que solo manejen la información sintáctica de forma implícita, estableciendo así la línea base del proyecto. Posteriormente, se obtendrá la información sintáctica mediante un análisis de dependencias y se integrará de forma explícita en las entradas de los modelos previamente establecidos en la línea base, buscando así analizar las variaciones que puedan surgir en los resultados. Como cierre del proyecto, se explorarán las técnicas de training dynamics y data mapping con el fin conocer y entender cómo se comportan los distintos modelos tratados durante el desarrollo.
 
[Abstract]: Language is used by humans as a tool for communication, but also as a vehicle to express their emotions and reflect their identity. Various factors such as age, gender or culture influence the way language is used, determining aspects such as the tone, expression or vocabulary used. This project follows previous work where it is proposed that gender expression in language manifests along three dimensions: gender of the speaker (as), gender of the receiver (to) and gender of the person being talked about (about). Taking this into account, a text classification task in the given three dimensions is proposed. Text classification is a fundamental task in the Natural Language Processing field that consist in assigning a predefined category to a text. With the increasing use of data extracted from the Internet, an increase of gender bias on data has been observed. By creating models that detect gender in each of the proposed dimensions, we seek to analyze and expand knowledge about the differences that can occur in language based on gender, thus helping to create language technologies that can better interpret the reality of a communicative process. In the context of the task presented, we question whether the syntactic information of a sentence could be useful for gender classification in the aforementioned dimensions. This Final Degree Project will address the problem of text classification into the dimensions about, to and as by implementing a framework that includes various neural models. The development and implementation of different neural models that only handle syntactic information implicitly will be carried out, thus establishing the baseline of the project. Subsequently, the syntactic information will be obtained through a dependency analysis and will be explicitly integrated into the inputs of the models previously established in the baseline, thus seeking to analyze the variations that may arise in the results. To close the project, the techniques of training dynamics and data mapping will be explored in order to know and understand how the different models treated during development behave.
 
Palabras chave
Procesamiento del lenguaje natural
Análisis de dependencias
Clasificación de textos
Sesgos de género
Modelos de lenguaje
Dinámicas de entrenamiento
Natural language processing
Dependency parsing
Text classification
Gender bias
Language models
Training dynamics
 
Dereitos
Atribución 3.0 España

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións