Cluster difuso de series de tiempo: El papel clave de la métrica seleccionada

Montes Varela, Xoel

Use this link to cite:

https://hdl.handle.net/2183/46382

Cluster difuso de series de tiempo: El papel clave de la métrica seleccionada

Files

MontesVarela_Xoel_TFG_2024.pdf (3 MB)

Identifiers

URI: https://hdl.handle.net/2183/46382

Publication date

2024-11

Authors

Montes Varela, Xoel

Advisors

Vilar, José

Other responsabilities

Universidade da Coruña. Facultade de Informática

Type of academic work

TFG

Academic degree

Grao en Ciencia e Enxeñaría de Datos

Abstract

[Resumen]: El análisis de cluster, o clustering, de series temporales es un tema de gran interés con aplicaciones en muchas disciplinas. El carácter dinámico de las series añade complejidad al clustering, ya que no es trivial establecer un criterio de disimilitud entre series de tiempo. El presente proyecto pretende mostrar la importancia de usar una métrica adecuada para desarrollar clustering difuso, poniendo especial atención al problema de agrupar series estacionarias generadas por modelos estocásticos similares. En concreto, se analiza el comportamiento del algoritmo fuzzy C-medoids empleando un rango de métricas específicamente diseñadas para comparar realizaciones de series. El estudio proporciona una visión general del problema, destacando las dificultades inherentes al clustering de series y permitiendo concluir sobre las fortalezas y debilidades de las diferentes métricas examinadas mediante experimentos con datos simulados. El procedimiento de clustering se ejecuta también sobre conjuntos de datos reales para ilustrar su interés y aplicabilidad.
[Abstract]: The clustering of time series is a topic of great interest with applications in many disciplines. The dynamic nature of time series adds complexity to clustering, as establishing a dissimilarity criterion between time series is not trivial. This project aims to show the importance of using an appropriate metric to develop fuzzy clustering, with special attention to the problem of grouping stationary series generated by similar stochastic models. In particular, the behavior of the fuzzy C-medoids algorithm is analyzed using a range of metrics specifically designed to compare series realizations. The study provides an overview of the problem, highlighting the inherent difficulties in clustering series and allowing conclusions about the strengths and weaknesses of the different metrics examined through experiments with simulated data. The clustering procedure is also applied to real datasets to illustrate its interest and applicability.

Keywords

Análisis cluster Series temporales Clustering difuso Métricas de disimilitud Series Estacionarias Modelos Estocásticos Algoritmo fuzzy C-medoids Clustering Time series Fuzzy clustering Dissimilarity metrics Stationary Series Stochastic Models Fuzzy C-medoids algorithm

Rights

Attribution-NonCommercial-ShareAlike 4.0 International

Collections

Traballos académicos (FIC)

Full item page

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-ShareAlike 4.0 International

Cluster difuso de series de tiempo: El papel clave de la métrica seleccionada

Files

Identifiers

Publication date

Authors

Advisors

Other responsabilities

Journal Title

Bibliographic citation

Type of academic work

Academic degree

Abstract

Description

Keywords

Editor version

Rights

Collections