Análisis estadístico del data warehouse del R.C. Deportivo de La Coruña y uso de minería de datos aplicada al scouting

Use this link to cite
http://hdl.handle.net/2183/33272
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 3.0 España
Collections
Metadata
Show full item recordTitle
Análisis estadístico del data warehouse del R.C. Deportivo de La Coruña y uso de minería de datos aplicada al scoutingAuthor(s)
Directors
Cao, RicardoLourido Fuertes, Ignacio
Date
2023Center/Dept./Entity
Universidade da Coruña. Facultade de InformáticaDescription
Traballo fin de grao (UDC.FIC). Ciencia e enxeñaría de datos. Curso 2022/2023Abstract
[Resumen] En este Trabajo Fin de Grado, se investiga el uso del Big Data en el contexto del fútbol y su aplicación en la toma de decisiones relacionadas con la exploración y fichaje de jugadores. Se analiza el almacén de datos del R.C. Deportivo de La Coruña, que contiene una gran cantidad de información estadística recopilada sobre multitud de jugadores a nivel global y variables relacionadas con aspectos del juego durante los 90 minutos que dura un partido de fútbol. El estudio se enfoca en la aplicación de técnicas avanzadas de análisis estadístico y minería de datos para explorar los jugadores y evaluar su potencial para ser fichados por el club. Se emplean técnicas como PCA (análisis de componentes principales) y clustering para identificar patrones y agrupaciones de jugadores con características similares. Además, se utiliza el machine learning para llevar a cabo metodos de regresión y predecir el rendimiento futuro de los jugadores en función de distintas variables de interés, según la posición del jugador en el campo, como expectativa de tiros a puerta, media de pases exitosos por partido o número de interceptaciones exitosas. Los resultados obtenidos muestran la eficacia de estas técnicas para identificar jugadores con un alto potencial y contribuir a la toma de decisiones informadas en el proceso de fichaje. El uso del big data y la minería de datos en el fútbol demuestra su utilidad para optimizar la selección de jugadores y mejorar el rendimiento global del equipo. Este estudio destaca la importancia creciente del big data en el ámbito deportivo y ofrece una base sólida para futuras investigaciones en el uso de técnicas analíticas avanzadas para la toma de decisiones estratégicas en el fútbol. [Abstract] This Final Degree Project investigates the use of big data in the context of football and its application in decision making related to the scouting and signing of players. It analyses the data warehouse of R.C. Deportivo de La Coruña, which contains a large amount of statistical information on a multitude of players at a global level and variables related to aspects of the game during the 90 minutes of a football match. The study focuses on the application of advanced statistical analysis techniques and data mining to explore the players and evaluate their potential to be signed by the club. Techniques such as PCA (principal cmponent analysis) and clustering are used to identify patterns and groupings of players with similar characteristics. In addition, machine learning is used to carry out the regression analysis and predict the future performance of players based on different variables of interest according to the player’s position on the field, such as expected shots on goal, average number of successful passes per game or number of successful interceptions. The results obtained show the effectiveness of these techniques to identify players with high potential and contribute to making informed decisions in the signing process. The use of big data and data mining in football demonstrates its usefulness in optimising player selection and improving overall team performance. This study highlights the growing importance of big data in sports and provides a solid foundation for future research in the use of advanced analytical techniques for strategic decision making in football.
Keywords
Preprocesado de datos
Análisis de componentes principales
Clustering híbrido
Segmentación de jugadores
Similitud coseno
Machine learning
Regresión
Data preprocessing
Principal component analysis
Hybrid clustering
Player profile segmentation
Cosine similarity
Regression
Análisis de componentes principales
Clustering híbrido
Segmentación de jugadores
Similitud coseno
Machine learning
Regresión
Data preprocessing
Principal component analysis
Hybrid clustering
Player profile segmentation
Cosine similarity
Regression
Rights
Atribución-NoComercial-SinDerivadas 3.0 España