Cluster difuso de series de tiempo: El papel clave de la métrica seleccionada

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

Montes Varela, Xoel

Advisors

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumen]: El análisis de cluster, o clustering, de series temporales es un tema de gran interés con aplicaciones en muchas disciplinas. El carácter dinámico de las series añade complejidad al clustering, ya que no es trivial establecer un criterio de disimilitud entre series de tiempo. El presente proyecto pretende mostrar la importancia de usar una métrica adecuada para desarrollar clustering difuso, poniendo especial atención al problema de agrupar series estacionarias generadas por modelos estocásticos similares. En concreto, se analiza el comportamiento del algoritmo fuzzy C-medoids empleando un rango de métricas específicamente diseñadas para comparar realizaciones de series. El estudio proporciona una visión general del problema, destacando las dificultades inherentes al clustering de series y permitiendo concluir sobre las fortalezas y debilidades de las diferentes métricas examinadas mediante experimentos con datos simulados. El procedimiento de clustering se ejecuta también sobre conjuntos de datos reales para ilustrar su interés y aplicabilidad.
[Abstract]: The clustering of time series is a topic of great interest with applications in many disciplines. The dynamic nature of time series adds complexity to clustering, as establishing a dissimilarity criterion between time series is not trivial. This project aims to show the importance of using an appropriate metric to develop fuzzy clustering, with special attention to the problem of grouping stationary series generated by similar stochastic models. In particular, the behavior of the fuzzy C-medoids algorithm is analyzed using a range of metrics specifically designed to compare series realizations. The study provides an overview of the problem, highlighting the inherent difficulties in clustering series and allowing conclusions about the strengths and weaknesses of the different metrics examined through experiments with simulated data. The clustering procedure is also applied to real datasets to illustrate its interest and applicability.

Description

Editor version

Rights

Attribution-NonCommercial-ShareAlike 4.0 International
Attribution-NonCommercial-ShareAlike 4.0 International

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-ShareAlike 4.0 International