Sistema de recolección de información web pública para el análisis estadístico de capacidades de innovación TIC en empresas

UDC.coleccionTraballos académicoses_ES
UDC.tipotrabTFGes_ES
UDC.titulacionGrao en Enxeñaría Informáticaes_ES
dc.contributor.advisorGómez García, Ángel
dc.contributor.advisorDafonte, Carlos
dc.contributor.authorHermo García, Francisco
dc.contributor.otherUniversidade da Coruña. Facultade de Informáticaes_ES
dc.date.accessioned2024-10-09T13:08:24Z
dc.date.available2024-10-09T13:08:24Z
dc.date.issued2024-06
dc.description.abstract[Resumen]: Para muchas empresas las novedades tecnológicas y las mejoras en sus capacidades de innovación TIC son un factor imprescindible para competir en el mercado actual. En la mayoría de casos añadir a sus páginas web alguna de estas mejoras ayuda a las empresas a entender su situación en la red, mejorar la comunicación con sus clientes o ampliar los recursos que ofrecen para poder crecer en nuevos ámbitos. Algunos ejemplos de este tipo son la presencia de las empresas en las diferentes plataformas de redes sociales o la disponibilidad de aplicaciones móviles para los sistemas operativos más utilizados. La recopilación de este tipo de información pública de las empresas puede ser muy útil con fines analíticos o estadísticos, pero es una tarea que requiere una carga elevada, incluyendo la necesidad de cubrir formularios detallados y el posterior procesado de la información recibida. Este proyecto se centra en el desarrollo de un sistema que permita recolectar de forma automática la información sobre esas innovaciones tecnológicas que las empresas añaden a sus páginas web, en buscarlas, extraerlas y mostrar los datos obtenidos de manera cómoda y sencilla para el usuario. Para esto usaremos las técnicas conocidas como el Web Scrapping, o Web Harvesting, con las cuales se rastrean y se extraen los datos de los sitios web que nos interesen. La información extraída será exportada en un formato JSON que permita su explotación posterior. Para la visualización de los datos extraídos de las empresas, se ha desarrollado una aplicación web que se encarga de recopilar y mostrar la información, simplificando la búsqueda y el acceso a la ficha de cada empresa. es_ES
dc.description.abstract[Abstract]: For many companies, technological innovations and improvements in their ICT innovation capabilities are an essential factor to compete in the current market. In most cases, adding some of these improvements to their web pages helps companies understand their online situation, improve communication with their customers or expand the resources they offer to be able to grow in new areas. Some examples of this type are the presence of companies on different social media platforms or the availability of mobile applications for the most used operating systems. The collection of this type of public information from companies can be very useful for analytical or statistical purposes, but it is a task that requires a high burden, including the need to fill out detailed forms and the subsequent processing of the information received. This project focuses on the development of a system that allows the automatic collection of information on those technological innovations that companies add to their web pages, searching for them, extracting them and displaying the data obtained in a comfortable and simple way for the user. For this we will use techniques known as Web Scrapping, or Web Harvesting, with which data is tracked and extracted from the websites that interest us. The extracted information will be exported in a JSON format that allows its subsequent exploitation. To visualize the data extracted from the companies, a web application has been developed that is responsible for collecting and displaying the information, simplifying the search and access to the file of each company.es_ES
dc.description.traballosTraballo fin de grao (UDC.FIC). Enxeñeria informática. Curso 2023/2024es_ES
dc.identifier.urihttp://hdl.handle.net/2183/39527
dc.language.isospaes_ES
dc.rightsTodos os dereitos reservados. Todos los derechos reservados.es_ES
dc.rights.accessRightsopen accesses_ES
dc.subjectSistemas de recolección de información públicaes_ES
dc.subjectCapacidades de innovación TIC en empresases_ES
dc.subjectWeb scrappinges_ES
dc.subjectSeleniumes_ES
dc.subjectBeautiful Soupes_ES
dc.subjectPythones_ES
dc.subjectReactes_ES
dc.subjectPublic information collection systemses_ES
dc.subjectICT innovation capabilities in companieses_ES
dc.titleSistema de recolección de información web pública para el análisis estadístico de capacidades de innovación TIC en empresases_ES
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication29e6d257-7aab-4d8c-bf2d-007f2edffb9d
relation.isAdvisorOfPublicationc3c2021f-0b5d-408f-afff-ec09ab5eaeee
relation.isAdvisorOfPublication.latestForDiscovery29e6d257-7aab-4d8c-bf2d-007f2edffb9d

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
HermoGarcia_Francisco_TFG_2024.pdf
Size:
2.46 MB
Format:
Adobe Portable Document Format
Description:
TFG_EI_Computacion