Discovering Topics in Twitter About the COVID-19 Outbreak in Spain
| UDC.coleccion | Investigación | es_ES |
| UDC.departamento | Letras | es_ES |
| UDC.endPage | 190 | es_ES |
| UDC.grupoInv | Lingua e Sociedade da Información (LYS) | es_ES |
| UDC.journalTitle | Procesamiento del Lenguaje Natural | es_ES |
| UDC.startPage | 177 | es_ES |
| UDC.volume | 66 | es_ES |
| dc.contributor.author | Agüero-Torales, Marvin M. | |
| dc.contributor.author | Vilares, David | |
| dc.contributor.author | López-Herrera, Antonio G. | |
| dc.date.accessioned | 2021-04-07T10:44:31Z | |
| dc.date.available | 2021-04-07T10:44:31Z | |
| dc.date.issued | 2021 | |
| dc.description.abstract | [Resumen] En este trabajo, analizamos lo que los usuarios han estado discutiendo en Twitter durante el comienzo de la pandemia causada por el COVID-19. Concretamente, analizamos tres fases diferenciadas de la crisis del COVID-19 en España: el propio tiempo de pre-crisis, el estallido de la enfermedad y el confinamiento. Para llevar esto a cabo, primero recolectamos una gran cantidad de tuits que son preprocesados. A continuación, agrupamos los tuits en distintas temáticas usando un modelo de Latent Dirichlet Allocation, y definimos estrategias generativas y discriminativas para extraer las palabras clave y oraciones más representativas para cada tema. Finalmente, incluimos un exhaustivo análisis cualitativo sobre dichos temas, y cómo estos se corresponden con distintas problemáticas surgidas en España en distintos momentos de la crisis. | es_ES |
| dc.description.abstract | [Abstract] In this work, we apply topic modeling to study what users have been discussing in Twitter during the beginning of the COVID-19 pandemic. More particularly, we explore the period of time that includes three differentiated phases of the COVID-19 crisis in Spain: the pre-crisis time, the outbreak, and the beginning of the lockdown. To do so, we first collect a large corpus of Spanish tweets and clean them. Then, we cluster the tweets into topics using a Latent Dirichlet Allocation model, and define generative and discriminative routes to later extract the most relevant keywords and sentences for each topic. Finally, we provide an exhaustive qualitative analysis about how such topics correspond to the situation in Spain at different stages of the crisis. | es_ES |
| dc.description.sponsorship | MMAT has been partially funded by Barcelona Supercomputing Center (BSC) through the Spanish Plan for advancement of Language Technologies `Plan TL' and the Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA). DV is supported by MINECO (TIN2017-85160-C2-1-R), by Xunta de Galicia (ED431C 2020/11), by Centro de Investigación de Galicia `CITIC' (European Regional Development Fund-Galicia 2014-2020 Program, ED431G 2019/01), and by a 2020 Leonardo Grant for Researchers and Cultural Creators from the BBVA Foundation | es_ES |
| dc.description.sponsorship | Xunta de Galicia; ED431C 2020/11 | |
| dc.description.sponsorship | Xunta de Galicia; ED431G 2019/01 | |
| dc.identifier.citation | Agüero-Torales, M., Vilares, D., & López-Herrera, A. (2021). Discovering topics in Twitter about the COVID-19 outbreak in Spain. Procesamiento Del Lenguaje Natural, 66, 177-190. Disponible en: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6333/3762 | es_ES |
| dc.identifier.issn | 1989-7553 | |
| dc.identifier.uri | http://hdl.handle.net/2183/27683 | |
| dc.language.iso | eng | es_ES |
| dc.publisher | Sociedad Española de Procesamiento del Lenguaje Natural | es_ES |
| dc.relation.projectID | info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/TIN2017-85160-C2-1-R/ES/AVANCES EN NUEVOS SISTEMAS DE EXTRACCION DE RESPUESTAS CON ANALISIS SEMANTICO Y APRENDIZAJE PROFUNDO/ | |
| dc.relation.uri | http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6333 | es_ES |
| dc.rights | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | es_ES |
| dc.rights.accessRights | open access | es_ES |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/deed.es_ES | * |
| dc.subject | Natural language processing | es_ES |
| dc.subject | Topic modeling | es_ES |
| dc.subject | COVID-19 | es_ES |
| dc.subject | Social media analysis | es_ES |
| dc.subject | es_ES | |
| dc.subject | Social networks | es_ES |
| dc.title | Discovering Topics in Twitter About the COVID-19 Outbreak in Spain | es_ES |
| dc.title.alternative | Descubriendo temas en Twitter sobre el brote del COVID-19 en España | es_ES |
| dc.type | journal article | es_ES |
| dspace.entity.type | Publication | |
| relation.isAuthorOfPublication | 37dabbe9-f54f-43bb-960e-0bf3ac7e54eb | |
| relation.isAuthorOfPublication.latestForDiscovery | 37dabbe9-f54f-43bb-960e-0bf3ac7e54eb |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Aguero-Torales_Marvin_2021_Discovering_Topics_Twitter.pdf
- Size:
- 322.09 KB
- Format:
- Adobe Portable Document Format
- Description:

