Análisis y Diseño de un Sistema de Información Bibliométrico de Publicaciones Científicas
Use this link to cite
http://hdl.handle.net/2183/27771
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 3.0 España
Collections
Metadata
Show full item recordTitle
Análisis y Diseño de un Sistema de Información Bibliométrico de Publicaciones CientíficasAuthor(s)
Directors
López Taboada, GuillermoDate
2021-02Center/Dept./Entity
Enxeñaría informática, Grao enDescription
Traballo fin de grao (UDC.FIC). Enxeñaría informática. Curso 2020/2021Abstract
[Resumen]
En el presente proyecto, se lleva a cabo el análisis, diseño e implementación de un sistema de
información para el almacenamiento de datos bibliométricos y su posterior explotación en un
caso de uso concreto.
Para ello, se realizará un análisis de diversas bases de datos de publicaciones científicas,
Google Scholar, Scopus y Web of Science (WOS), seleccionando esta última debido a que combina
completitud, como Google Scholar, junto con un servicio vía API, como Scopus, permitiendo
el acceso a la información relevante de interés. Por lo cual, se ingestarán los datos desde
WOS al sistema desarrollado.
Posteriormente, se diseña el modelo de datos en base a los campos que se puedan extraer
de la fuente de información y pensando en almacenar la mayor cantidad de información posible.
Se ha tenido en cuenta la actualización parcial de los datos, y este motivo se recogerá
la información cambiante de forma periódica (cada dos semanas) y se reconstruirá la base
de datos anualmente. Adicionalmente, se han incorporado los datos de factores de impacto y
ránquines de revistas JCR (Journal Citation Reports) con el fin de combinar estas dos fuentes
y enriquecer los posteriores análisis a llevar a cabo.
Una vez diseñada, se implementa el sistema de información basado en la automatización
de la descarga/ingesta de los datos y la inclusión de los mismos en el sistema de información.
Asimismo, se realizará la planificación de las actualizaciones para disponer de un sistema de
información con información lo más actualizada posible.
Por último, se ha validado la corrección del sistema de información y sus capacidades para
el análisis de datos, tanto vía generación de informes como exploración de datos a través de
un caso de uso concreto, que ha consistido en reproducir el informe del IUNE para estimar
los resultados de la UDC para el 2021.
Este caso de uso, validado con el equipo de ránquines de la UDC, ha permitido certificar la
completitud del sistema de información, así como su validez y sus capacidades de aportación
de valor. Finalmente, este sistema de información va a ser incluido en la próxima versión del
paquete scimetr, el cual realiza análisis de datos sobre datos de WOS ingestados vía ficheros.
En la nueva versión mejorará sus capacidades, al ser mucho más rápida y completa la ingesta
de datos por medio del sistema de información desarrollado en el marco del presente TFG. [Abstract]
This project involves the analysis, design and implementation of an information system
for the storage of bibliometric data and its subsequent exploitation in a specific use case.
To this end, an analysis of various databases of scientific publications, Google Scholar,
Scopus and Web of Science (WOS) will be carried out, selecting the latter because it combines
completeness, such as Google Scholar, together with a service via API, such as Scopus, allowing
access to relevant information of interest. Therefore, data will be ingested from WOS to
the developed system.
Subsequently, the data model is designed based on the fields that can be extracted from
the information source and considering to store as much information as possible. The partial
updating of the data has been taken into account, and for this reason the changing information
will be collected periodically (every two weeks) and the database will be rebuilt annually.
Additionally, data on impact factors and JCR (Journal Citation Reports) rankings have been
incorporated in order to combine these two sources and enrich the subsequent analyses to be
carried out.
Once designed, the information system will be implemented based on the automation of
data downloading and their inclusion in the information system. Likewise, the planning of
updates will be carried out in order to have an information system with information that is
as up to date as possible.
Finally, the correctness of the information system and its data analysis capabilities have
been validated, both via report generation and data exploration through a specific use case,
which consisted of reproducing the IUNE report to estimate the results of the UDC for 2021.
This use case, validated with the UDC’s ranking team, has made it possible to certify the
completeness of the information system, as well as its validity and its ability to add value.
Finally, this information system will be included in the next version of the scimetr package,
which performs data analysis on WOS data ingested via files. The new version will improve
its capabilities, as the data ingestion through the information system developed within the
framework of this Final Degree Project will be much faster and more complete.
Keywords
Información Bibliométrica
Ranquin de Universidades
IUNE
UDC
WOS
Web of Science
Sistema de Información
Análisis Exploratorio de Datos
Bibliometric Data
University Rankings
Intormation System
Exploratory Data Analysis
Ranquin de Universidades
IUNE
UDC
WOS
Web of Science
Sistema de Información
Análisis Exploratorio de Datos
Bibliometric Data
University Rankings
Intormation System
Exploratory Data Analysis
Rights
Atribución-NoComercial-SinDerivadas 3.0 España