Ranking de usuarios de Reddit aplicando modelos lineales de relevancia para trastornos mentales

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

López Gude, Adrián

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumen]: Los trastornos mentales suponen un gran perjuicio para los individios y la sociedad. Confor- man una de las enfermedades más comunes en todo el mundo. Existen numerosos estudios que destacan la prevalencia y escalada de casos en enfermedades mentales en los últimos años. El INE estima que en torno al 5% de población mayor de 16 años tiene al menos algún cuadro de depresión. Sabiendo que el lenguaje manifestado por las personas que sufren este tipo de enfermedades puede mostrar evidencias de su salud mental, el objetivo de este proyecto es explotar las posibilidades de los Modelos de Lenguaje basados en la Relevancia para ser aprovechados de cara a una detección temprana. Para ello, tomando como punto de partida la iniciativa eRisk, se tratará de ordenar los usuarios de la plataforma Reddit a partir de textos escritos por los usuarios, y establecer una ordenación de los mismos en función del posible grado de depresión aplicando métodos lineales de relevancia. En concreto, se hará uso de un modelo conocido como LiMe, que servirá para construír una martriz de términos que explotará las características del lenguaje de los usuarios. El uso de esta herramienta, consiguió resultados muy satisfactorios, especialmente en la tarea de ordenamiento. Para la gestión del proyecto, se hizo empleo de una metodología ágil que fuese flexible dependiendo de los resultados de la experimentación.
[Abstract]: Mental disorders pose great harm to individuals and society. They make up one of the most common diseases in the world. There are numerous studies that highlight the prevalence and escalation of cases of mental illness in recent years. The INE estimates that around 5% of the population over 16 years of age has at least some symptoms of depression. It is known that the language expressed by the people who suffer from this type of illness can show evidence of their mental health, the objective of this project is to exploit the possibilities of Language Models based on Relevance to be used for early detection. To do this, taking the eRisk initiative as a starting point, we will try to organize the users of the platform Reddit based on texts written by the users, and establish a classification of them depending on the possible degree of depression applying linear methods of relevance. Specifically, a model known as LiMe will be used, which will serve to build a matrix of terms that will exploit the characteristics of the users’ language.The use of this tool achieved very satisfactory results, especially in the ranking task. For project management, an agile methodology was used that was flexible depending on the results of the experimentation.

Description

Editor version

Rights

Atribución-NoComercial 3.0 España
Atribución-NoComercial 3.0 España

Except where otherwise noted, this item's license is described as Atribución-NoComercial 3.0 España