Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Informática
  • Traballos académicos (FIC)
  • Ver ítem
  •   RUC
  • Facultade de Informática
  • Traballos académicos (FIC)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Análisis del impacto de las medidas de distancia en técnicas de reducción de la dimensionalidad

Thumbnail
Ver/abrir
DoradoValin_Antia_TFG_2023.pdf (8.779Mb)
Use este enlace para citar
http://hdl.handle.net/2183/33866
Atribución-CompartirIgual 3.0 España
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución-CompartirIgual 3.0 España
Coleccións
  • Traballos académicos (FIC) [716]
Metadatos
Mostrar o rexistro completo do ítem
Título
Análisis del impacto de las medidas de distancia en técnicas de reducción de la dimensionalidad
Autor(es)
Dorado Valín, Antía
Director(es)
Blanco-Mallo, Eva
Bolón-Canedo, Verónica
Data
2023
Centro/Dpto/Entidade
Universidade da Coruña. Facultade de Informática
Descrición
Traballo fin de grao (UDC.FIC). Ciencia e enxeñaría de datos. Curso 2022/2023
Resumo
[Resumen]: Debido a que la gran cantidad de datos generada por empresas, instituciones y usuarios es cada vez mayor, múltiples veces es necesario lidiar con conjuntos de datos con elevado número de características, lo que hace que las técnicas de reducción de la dimensión cobren cada vez mayor importancia. En este proyecto se va a analizar el rendimiento de diferentes medidas de distancia en técnicas de reducción de la dimensión, en concreto, en Principal Component Analysis (PCA), t-Distributed Stochastic Neighbor Embedding (t-SNE) y Uniform Manifold Approximation and Projection (UMAP). El objetivo es observar como afectan estas medidas de distancia tanto en la visualización como en la clasificación del conjunto de datos. Se va a establecer como baseline la distancia euclídea y se va a comparar con resultados obtenidos con otras métricas como Canberra, correlación, Minkowski o coseno.
 
[Abstract]:Due to the large amount of data generated by companies, institutions and users, it is often necessary to deal with data sets with a high number of features, which makes dimension reduction techniques increasingly important. In this project, the performance of different distance measures in dimension reduction techniques will be analyzed, specifically, in Principal Component Analysis (PCA), t-Distributed Stochastic Neighbor Embedding (t-SNE) and Uniform Manifold Approximation and Projection (UMAP). The objective is to observe how these distance measures affect both the visualization and the classification of the data set. The euclidean distance will be established as a baseline and it will be compared with results obtained with other metrics such as Canberra, correlation, Minkowski or cosine.
 
Palabras chave
Reducción de la dimensionalidad
PCA
UMAP
t-SNE
Medidas de distancia
Visualización
Clasificación
Dimensionality reduction
Distance measurements
Visualization
Classification
 
Dereitos
Atribución-CompartirIgual 3.0 España

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións