Herramienta de análisis y explotación de datos turísticosAutor(es)
Cerdeira-Pena, AnaBernardo, Guillermo de
Universidade da Coruña. Facultade de InformáticaDescripción
Traballo fin de grao (UDC.FIC). Ciencia e enxeñaría de datos. Curso 2022/2023Resumen
[Resumen]: El objetivo de este trabajo de fin de grado es el desarrollo de procesos para la extracción y
exploración de datos procedentes de la plataforma Airbnb y del Instituto Nacional de Estadística
vinculados al sector del turismo en España, con especial atención al mercado de la oferta
vacacional, y la creación de dashboards interactivos para el posterior análisis y explotación de
los mismos, que permitan obtener conocimiento derivado de utilidad.
Para alcanzar dicho objetivo hemos dividido el desarrollo en fases. En la primera de ellas
definimos el alcance del proyecto y sus objetivos principales, seguido de un estudio de aplicaciones
y tecnologías que facilitasen su desarrollo. A continuación, se realizó un primer estudio
de los datos a tratar y se comenzó con el desarrollo iterativo del trabajo, incluyendo, entre
otros, procesos de extracción y limpieza, diseño de un almacén de datos, análisis, visualización
y extracción de conclusiones.
Para la realización de este trabajo se ha utilizado el lenguaje Python, junto con las librerías
BeautifulSoup y Selenium para la extracción de datos de la Web. Además, hemos hecho uso
de MySQL y DBeaver para la creación de un almacén de datos que cumpliese con nuestras
necesidades. Por último, para la creación de los diferentes dashboards y gráficas acudimos a
la herramienta de Power BI.
El proyecto se ha realizado siguiendo una metodología basada en iteraciones, estando en
constante contacto con los directores y llevando a cabo reuniones de seguimiento.
and exploration of data from the Airbnb platform and the National Institute of Statistics
linked to the tourism sector in Spain, with special attention to the market for vacation offers,
and the creation of interactive dashboards for subsequent analysis and exploitation of the
same, which allow obtaining knowledge derived from utility.
To achieve this objective we have divided the development into phases. In the first of them
we defined the scope of the project and its main objectives, followed by a study of applications
and technologies that would facilitate its development. Next, a first study of the data to be
processed was carried out and the iterative development of the work began, including, among
others, extraction and cleaning processes, design of a data warehouse, analysis, visualization
and drawing of conclusions.
During the execution of this work, the Python language was used along with the BeautifulSoup
and Selenium libraries to extract data from the Web. In addition, we have made use of MySQL and DBeaver to create a data warehouse that meets our needs. Finally, to create
the different dashboards and graphs we used the Power BI tool.
The project has been carried out following a methodology based on iterations, being in
constant contact with the directors and holding follow-up meetings.
Palabras clave
Almacén de datos
Data Warehouse
