Análisis del impacto de las medidas de distancia en técnicas de reducción de la dimensionalidad

UDC.coleccionTraballos académicoses_ES
UDC.tipotrabTFGes_ES
UDC.titulacionGrao en Ciencia e Enxeñaría de Datoses_ES
dc.contributor.advisorBlanco-Mallo, Eva
dc.contributor.advisorBolón-Canedo, Verónica
dc.contributor.authorDorado Valín, Antía
dc.contributor.otherUniversidade da Coruña. Facultade de Informáticaes_ES
dc.date.accessioned2023-10-20T15:13:41Z
dc.date.available2023-10-20T15:13:41Z
dc.date.issued2023
dc.description.abstract[Resumen]: Debido a que la gran cantidad de datos generada por empresas, instituciones y usuarios es cada vez mayor, múltiples veces es necesario lidiar con conjuntos de datos con elevado número de características, lo que hace que las técnicas de reducción de la dimensión cobren cada vez mayor importancia. En este proyecto se va a analizar el rendimiento de diferentes medidas de distancia en técnicas de reducción de la dimensión, en concreto, en Principal Component Analysis (PCA), t-Distributed Stochastic Neighbor Embedding (t-SNE) y Uniform Manifold Approximation and Projection (UMAP). El objetivo es observar como afectan estas medidas de distancia tanto en la visualización como en la clasificación del conjunto de datos. Se va a establecer como baseline la distancia euclídea y se va a comparar con resultados obtenidos con otras métricas como Canberra, correlación, Minkowski o coseno.es_ES
dc.description.abstract[Abstract]:Due to the large amount of data generated by companies, institutions and users, it is often necessary to deal with data sets with a high number of features, which makes dimension reduction techniques increasingly important. In this project, the performance of different distance measures in dimension reduction techniques will be analyzed, specifically, in Principal Component Analysis (PCA), t-Distributed Stochastic Neighbor Embedding (t-SNE) and Uniform Manifold Approximation and Projection (UMAP). The objective is to observe how these distance measures affect both the visualization and the classification of the data set. The euclidean distance will be established as a baseline and it will be compared with results obtained with other metrics such as Canberra, correlation, Minkowski or cosine.es_ES
dc.description.traballosTraballo fin de grao (UDC.FIC). Ciencia e enxeñaría de datos. Curso 2022/2023es_ES
dc.identifier.urihttp://hdl.handle.net/2183/33866
dc.language.isospaes_ES
dc.rightsAtribución-CompartirIgual 3.0 Españaes_ES
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/es/*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/es/
dc.subjectReducción de la dimensionalidades_ES
dc.subjectPCAes_ES
dc.subjectUMAPes_ES
dc.subjectt-SNEes_ES
dc.subjectMedidas de distanciaes_ES
dc.subjectVisualizaciónes_ES
dc.subjectClasificaciónes_ES
dc.subjectDimensionality reductiones_ES
dc.subjectDistance measurementses_ES
dc.subjectVisualizationes_ES
dc.subjectClassificationes_ES
dc.titleAnálisis del impacto de las medidas de distancia en técnicas de reducción de la dimensionalidades_ES
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublicationc114dccd-76e4-4959-ba6b-7c7c055289b1
relation.isAdvisorOfPublication.latestForDiscoveryc114dccd-76e4-4959-ba6b-7c7c055289b1

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
DoradoValin_Antia_TFG_2023.pdf
Size:
8.78 MB
Format:
Adobe Portable Document Format
Description: