Detección de linguaxe misóxino e xenófobo en redes sociais mediante aprendizaxe máquina

UDC.coleccionTraballos académicoses_ES
UDC.tipotrabTFGes_ES
UDC.titulacionGrao en Enxeñaría Informáticaes_ES
dc.contributor.advisorCarneiro, Víctor
dc.contributor.advisorFernández, Diego
dc.contributor.authorRodríguez Fernández, Laura
dc.contributor.otherEnxeñaría informática, Grao enes_ES
dc.date.accessioned2021-02-02T15:52:47Z
dc.date.available2021-02-02T15:52:47Z
dc.date.issued2020-09
dc.description.abstract[Resumo] Co incremento do uso das redes sociais, xurde a necesidade de ter todo máis controlado para evitar casos de abuso verbal, discriminación, acoso… Twitter é unha rede social que funciona mediante o envío posts de usuarios, e na que xorden moitos debates e discusións, polo que é bastante habitual ver este tipo de problemáticas. O obxectivo principal deste traballo é a clasificación de posts de Twitter, para comprobar se conteñen linguaxe despectivo ou expresións de odio cara as mulleres e inmigrantes. Para isto empréganse técnicas de machine learning seguindo a metodoloxía CRISP-DM, a cal consta de 6 fases. Seguindo as fases desta metodoloxía, analízase e compréndese o dataset que contén os datos, para posteriormente poder obter as características que emprega o algoritmo de Random Forest para a creación do modelo. Para validar este modelo empréganse varios métodos de validación, co fin de obter o modelo que presente mellores resultados. Despois de todo este proceso e axustar o modelo o mellor posible, chegamos a unha das últimas fases, a avaliación, na cal se aplican distintas métricas para obter os resultados. Cabe destacar que o mellor resultado que se acada é un 78.16% para a métrica de precisión, mellorando ata un 13.16% as precisións obtidas no estado do arte.es_ES
dc.description.abstract[Abstract] With the increase in the use of social networks, the need airises to have everything more controlled to avoid cases of verbal abuse, discrimination, harassment… Twitter is a social network that works by sending user posts, and in which many debates an discussions, so it is quite common to see such problems. The main objective of this work is the classification of Twitter posts, to check if they contain derogatory language or expressions of hatred towards women and immigrants. For this, machine learning techniques are used following the CRISP-DM methodology, which consists of 6 phases. Following the phases of this methodology, the dataset containing the data is analyzed and understood, in order to subsequently be able to obtain the characteristics used by the Random Forest algorithm for the creation of the model. To validate this model several validation methods are used in order to obtain the model that presents better results. After all this process and adjusting the model as best as possible, we come to one of the last phases, the evaluation, in which different metrics are applied to get the results. It is worth noting that the best result is 78.16% for the precision metric, improving the accuracy obtained in the state of the art to 13.16%.es_ES
dc.description.traballosTraballo fin de grao (UDC.FIC). Enxeñaría informática. Curso 2019/2020es_ES
dc.identifier.urihttp://hdl.handle.net/2183/27273
dc.language.isoglges_ES
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 Españaes_ES
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectAprendizaxe máquinaes_ES
dc.subjectRandom forestes_ES
dc.subjectAlgoritmos de similitudees_ES
dc.subjectÁrbores de decisiónes_ES
dc.subjectClasificaciónes_ES
dc.subjectValidación cruzadaes_ES
dc.subjectMachine languagees_ES
dc.subjectSimilarity algorithmses_ES
dc.subjectDecision treeses_ES
dc.subjectClassificationes_ES
dc.subjectCross Validationes_ES
dc.titleDetección de linguaxe misóxino e xenófobo en redes sociais mediante aprendizaxe máquinaes_ES
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication652c136c-eea5-4a78-947c-538b1c99f81b
relation.isAdvisorOfPublication9b9fbda3-512a-4143-986b-c7b60305e041
relation.isAdvisorOfPublication.latestForDiscovery652c136c-eea5-4a78-947c-538b1c99f81b

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
L.Rodríguez_Fernández_2020_Detección_de_linguaxe_misóxino_e_xenófobo.pdf
Size:
1.75 MB
Format:
Adobe Portable Document Format
Description: