Ranking de usuarios de Reddit aplicando modelos lineales de relevancia para trastornos mentales

Non accesible ata 2025-04-03
Use este enlace para citar
http://hdl.handle.net/2183/39404
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución-NoComercial 3.0 España
Coleccións
Metadatos
Mostrar o rexistro completo do ítemTítulo
Ranking de usuarios de Reddit aplicando modelos lineales de relevancia para trastornos mentalesAutor(es)
Director(es)
Parapar, JavierPérez-Vila, Miguel Anxo
Data
2023-11Centro/Dpto/Entidade
Universidade da Coruña. Facultade de InformáticaDescrición
Traballo fin de grao (UDC.FIC). Enxeñeria informática. Curso 2023/2024Resumo
[Resumen]: Los trastornos mentales suponen un gran perjuicio para los individios y la sociedad. Confor-
man una de las enfermedades más comunes en todo el mundo. Existen numerosos estudios
que destacan la prevalencia y escalada de casos en enfermedades mentales en los últimos años.
El INE estima que en torno al 5% de población mayor de 16 años tiene al menos algún cuadro
de depresión.
Sabiendo que el lenguaje manifestado por las personas que sufren este tipo de enfermedades
puede mostrar evidencias de su salud mental, el objetivo de este proyecto es explotar las
posibilidades de los Modelos de Lenguaje basados en la Relevancia para ser aprovechados
de cara a una detección temprana.
Para ello, tomando como punto de partida la iniciativa eRisk, se tratará de ordenar
los usuarios de la plataforma Reddit a partir de textos escritos por los usurios, y establecer
una ordenación de los mismos en función del posible grado de depresión aplicando métodos
lineales de relevancia.
En concreto, se hará uso de un modelo conocido como LiMe, que servirá para construír una
martriz de términos que explotará las características del lenguaje de los usuarios.
El uso de esta herramienta, consiguió resultados muy satisfactorios, especialmente en la tarea
de ordenamiento.
Para la gestión del proyecto, se hizo empleo de una metodología ágil que fuese flexible dependiendo de los resultados de la experimentación. [Abstract]: Mental disorders pose great harm to individuals and society. They make up one of the most
common diseases in the world. There are numerous studies that highlight the prevalence and
escalation of cases of mental illness in recent years. The INE estimates that around 5% of the
population over 16 years of age has at least some symptoms of depression.
It is known that the language expressed by the people who suffer from this type of illness can
show evidence of their mental health, the objective of this project is to exploit the possibilities
of Language Models based on Relevance to be used for early detection.
To do this, taking the eRisk initiative as a starting point, we will try to organize the
users of the platform Reddit based on texts written by the users, and establish a classification
of them depending on the possible degree of depression applying linear methods of relevance.
Specifically, a model known as LiMe will be used, which will serve to build a matrix of terms
that will exploit the characteristics of the users’ language.The use of this tool achieved very satisfactory results, especially in the ranking task.
For project management, an agile methodology was used that was flexible depending on the
results of the experimentation.
Palabras chave
Recuperación de la Información
Modelos de relevancia
Modelos de lenguaje
LiMe
Depresión
CLEF eRisk
Reddit
Ordenación
Evaluación
Information Retrieval
Relevance Feedback models
Language models
Depressive disorders
Ranking
Evaluation
Modelos de relevancia
Modelos de lenguaje
LiMe
Depresión
CLEF eRisk
Ordenación
Evaluación
Information Retrieval
Relevance Feedback models
Language models
Depressive disorders
Ranking
Evaluation
Dereitos
Atribución-NoComercial 3.0 España