Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Informática
  • Investigación (FIC)
  • Ver ítem
  •   RUC
  • Facultade de Informática
  • Investigación (FIC)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Distributed and Collaborative Web Change Detection System

Thumbnail
Ver/abrir
PrietoVictor_2015_Distributed_collaborative_web_change_detection_system.pdf (1.339Mb)
Use este enlace para citar
http://hdl.handle.net/2183/35047
Coleccións
  • Investigación (FIC) [1678]
Metadatos
Mostrar o rexistro completo do ítem
Título
Distributed and Collaborative Web Change Detection System
Autor(es)
Prieto Álvarez, Víctor Manuel
Álvarez Díaz, Manuel
Carneiro, Víctor
Cacheda, Fidel
Data
2015
Cita bibliográfica
V. M. Prieto, M. Alvarez, V. Carneiro, and F. Cacheda, “Distributed and collaborative web change detection system,” Computer Science and Information Systems, vol. 12, no. 1, pp. 91–114, 2015, Accessed: Jan. 22, 2024. [Online]. Available: DOI 10.2298/CSIS131120081P
Resumo
[Absctract]: Search engines use crawlers to traverse the Web in order to download web pages and build their indexes. Maintaining these indexes up-to-date is an essential task to ensure the quality of search results. However, changes in web pages are unpredictable. Identifying the moment when a web page changes as soon as possible and with minimal computational cost is a major challenge. In this article we present the Web Change Detection system that, in a best case scenario, is capable to detect, almost in real time, when a web page changes. In a worst case scenario, it will require, on average, 12 minutes to detect a change on a low PageRank web site and about one minute on a web site with high PageRank. Meanwhile, current search engines require more than a day, on average, to detect a modification in a web page (in both cases).
Palabras chave
Content refresh
Incremental crawling
Crawling systems and Search engines
 
Versión do editor
https://doi.org/10.2298/CSIS131120081P
ISSN
1820-0214
2406-1018
 

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións