Discovering Topics in Twitter About the COVID-19 Outbreak in Spain

UDC.coleccionInvestigaciónes_ES
UDC.departamentoLetrases_ES
UDC.endPage190es_ES
UDC.grupoInvLingua e Sociedade da Información (LYS)es_ES
UDC.journalTitleProcesamiento del Lenguaje Naturales_ES
UDC.startPage177es_ES
UDC.volume66es_ES
dc.contributor.authorAgüero-Torales, Marvin M.
dc.contributor.authorVilares, David
dc.contributor.authorLópez-Herrera, Antonio G.
dc.date.accessioned2021-04-07T10:44:31Z
dc.date.available2021-04-07T10:44:31Z
dc.date.issued2021
dc.description.abstract[Resumen] En este trabajo, analizamos lo que los usuarios han estado discutiendo en Twitter durante el comienzo de la pandemia causada por el COVID-19. Concretamente, analizamos tres fases diferenciadas de la crisis del COVID-19 en España: el propio tiempo de pre-crisis, el estallido de la enfermedad y el confinamiento. Para llevar esto a cabo, primero recolectamos una gran cantidad de tuits que son preprocesados. A continuación, agrupamos los tuits en distintas temáticas usando un modelo de Latent Dirichlet Allocation, y definimos estrategias generativas y discriminativas para extraer las palabras clave y oraciones más representativas para cada tema. Finalmente, incluimos un exhaustivo análisis cualitativo sobre dichos temas, y cómo estos se corresponden con distintas problemáticas surgidas en España en distintos momentos de la crisis.es_ES
dc.description.abstract[Abstract] In this work, we apply topic modeling to study what users have been discussing in Twitter during the beginning of the COVID-19 pandemic. More particularly, we explore the period of time that includes three differentiated phases of the COVID-19 crisis in Spain: the pre-crisis time, the outbreak, and the beginning of the lockdown. To do so, we first collect a large corpus of Spanish tweets and clean them. Then, we cluster the tweets into topics using a Latent Dirichlet Allocation model, and define generative and discriminative routes to later extract the most relevant keywords and sentences for each topic. Finally, we provide an exhaustive qualitative analysis about how such topics correspond to the situation in Spain at different stages of the crisis.es_ES
dc.description.sponsorshipMMAT has been partially funded by Barcelona Supercomputing Center (BSC) through the Spanish Plan for advancement of Language Technologies `Plan TL' and the Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA). DV is supported by MINECO (TIN2017-85160-C2-1-R), by Xunta de Galicia (ED431C 2020/11), by Centro de Investigación de Galicia `CITIC' (European Regional Development Fund-Galicia 2014-2020 Program, ED431G 2019/01), and by a 2020 Leonardo Grant for Researchers and Cultural Creators from the BBVA Foundationes_ES
dc.description.sponsorshipXunta de Galicia; ED431C 2020/11
dc.description.sponsorshipXunta de Galicia; ED431G 2019/01
dc.identifier.citationAgüero-Torales, M., Vilares, D., & López-Herrera, A. (2021). Discovering topics in Twitter about the COVID-19 outbreak in Spain. Procesamiento Del Lenguaje Natural, 66, 177-190. Disponible en: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6333/3762es_ES
dc.identifier.issn1989-7553
dc.identifier.urihttp://hdl.handle.net/2183/27683
dc.language.isoenges_ES
dc.publisherSociedad Española de Procesamiento del Lenguaje Naturales_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/TIN2017-85160-C2-1-R/ES/AVANCES EN NUEVOS SISTEMAS DE EXTRACCION DE RESPUESTAS CON ANALISIS SEMANTICO Y APRENDIZAJE PROFUNDO/
dc.relation.urihttp://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6333es_ES
dc.rightsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)es_ES
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/deed.es_ES*
dc.subjectNatural language processinges_ES
dc.subjectTopic modelinges_ES
dc.subjectCOVID-19es_ES
dc.subjectSocial media analysises_ES
dc.subjectTwitteres_ES
dc.subjectSocial networkses_ES
dc.titleDiscovering Topics in Twitter About the COVID-19 Outbreak in Spaines_ES
dc.title.alternativeDescubriendo temas en Twitter sobre el brote del COVID-19 en Españaes_ES
dc.typejournal articlees_ES
dspace.entity.typePublication
relation.isAuthorOfPublication37dabbe9-f54f-43bb-960e-0bf3ac7e54eb
relation.isAuthorOfPublication.latestForDiscovery37dabbe9-f54f-43bb-960e-0bf3ac7e54eb

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Aguero-Torales_Marvin_2021_Discovering_Topics_Twitter.pdf
Size:
322.09 KB
Format:
Adobe Portable Document Format
Description: