Organización y análisis de los datos de la Fundación ENKI para la aplicación de técnicas estadísticas

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

López Blanco, Cristina

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumen]: Este Trabajo de Fin de Grado se desarrolla en colaboración con la Fundación ENKI, una entidad dedicada a fomentar el ocio y el deporte entre personas con diversidad funcional. El objetivo principal es optimizar la gestión de la información y extraer conocimiento útil a partir de los datos disponibles, hasta ahora dispersos en distintos archivos y formatos. Para ello, se ha llevado a cabo la unificación y limpieza de los datos, así como el diseño e implementación de una base de datos estructurada. Posteriormente, se han realizado análisis descriptivos y visualizaciones, complementados con técnicas estadísticas avanzadas como clasificación supervisada y escalamiento multidimensional, orientadas a la detección patrones, tendencias y relaciones significativas. Asimismo, se desarrolló una página web que integra los procesos previos: la limpieza y carga de archivos, la generación automática de la base de datos y la visualización de resultados mediante representaciones gráficas. En el desarrollo se empleó PostgreSQL como sistema gestor de bases de datos, junto con los lenguajes de programación Python y R. La gestión del proyecto se llevó a cabo siguiendo la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining), ampliamente utilizada en ciencia de datos.
[Abstract]: This Final Degree Project was developed in collaboration with the ENKI Foundation, an organization dedicated to promoting leisure and sports among people with functional diversity. The main objective is to optimize information management and extract useful knowledge from the available data, which until now had been scattered across different files and formats. To achieve this, the data were unified and cleaned, followed by the design and implementation of a structured database. Subsequently, descriptive analyses and visualizations were performed, complemented with advanced statistical techniques such as supervised classification and multidimensional scaling, aimed at detecting identifying patterns, trends, and significant relationships. In addition, a webpage was developed to integrate the previous processes: file cleaning and loading, automatic database generation, and visualization of results through graphical representations. PostgreSQL was used as the database management system, along with the programming languages Python and R. The project was managed following the CRISP-DM (Cross-Industry Standard Process for Data Mining) methodology, widely used in data science.

Description

Editor version

Rights

Attribution 4.0 International
Attribution 4.0 International

Except where otherwise noted, this item's license is described as Attribution 4.0 International