Estudio del rendimiento de la recuperación documental con RAG y modelos de lenguaje de gran escala

Delgado Ferreiro, Santiago

Estudio del rendimiento de la recuperación documental con RAG y modelos de lenguaje de gran escala

UDC.coleccion	Traballos académicos
UDC.tipotrab	TFG
UDC.titulacion	Grao en Enxeñaría Informática
dc.contributor.advisor	Alonso, Miguel A.
dc.contributor.advisor	Vilares, Jesús
dc.contributor.advisor	Méndez Llatas, Pablo
dc.contributor.author	Delgado Ferreiro, Santiago
dc.contributor.other	Universidade da Coruña. Facultade de Informática
dc.date.accessioned	2025-08-07T08:57:16Z
dc.date.available	2025-08-07T08:57:16Z
dc.date.issued	2025-06
dc.description.abstract	[Resumen]: Este Trabajo de Fin de Grado desarrolla dos herramientas complementarias para mejorar la gestión y recuperación de información y evaluar el rendimiento de modelos de lenguaje de gran escala (LLM). La primera es un sistema de Recuperación Aumentada por Generación (RAG) accesible mediante una API REST. Los documentos se procesan con OCR, se segmentan en fragmentos de texto y se indexan en un almacén vectorial. En tiempo real, los fragmentos más relevantes se recuperan y se combinan en un prompt que alimenta un modelo de lenguaje, generando respuestas fundamentadas. Todo el flujo —desde la carga y extracción de texto hasta la consulta en lenguaje natural— se presenta al usuario mediante una interfaz web intuitiva. La segunda herramienta es un módulo de evaluación de rendimiento de LLMs basado en Locust. Mide métricas clave como latencia total, tokens por segundo y tiempo hasta el primer token mediante simulaciones de usuarios concurrentes. Los resultados se consolidan en informes comparativos que facilitan la identificación del modelo óptimo según el número de usuarios y la configuración de GPU. Este enfoque permite seleccionar la solución más eficiente para despliegues en entornos productivos.
dc.description.abstract	[Abstract]: This Final Degree Project develops two complementary tools to enhance information management and assess the performance of large language models (LLM). The first is a Retrieval-Augmented Generation (RAG) system exposed via a REST API. Documents are OCR-processed, split into text fragments, and indexed in a vector store. At query time, the most relevant fragments are retrieved and assembled into a prompt that drives a language model to produce evidence-based answers. The entire pipeline—from document ingestion and text extraction to natural language querying—is delivered through an intuitive web interface. The second tool is an LLM performance evaluation module built with Locust. By simulating concurrent users, it measures key metrics such as total latency, tokens per second, and time to first token. Results are aggregated into comparative reports that help identify the optimal model based on user load and GPU configuration. This approach guides the selection of the most efficient solution for production deployments.
dc.description.traballos	Traballo fin de grao (UDC.FIC). Enxeñaría Informática. Curso 2024/2025
dc.identifier.uri	https://hdl.handle.net/2183/45594
dc.language.iso	spa
dc.rights	Attribution 4.0 International	en
dc.rights.accessRights	open access
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/
dc.subject	Recuperación Aumentada por Generación (RAG)
dc.subject	Modelos de Lenguaje de Gran Escala (LLMs)
dc.subject	Gestión documental
dc.subject	Búsqueda semántica
dc.subject	Indexación y recuperación de documentos (Faiss, R2R)
dc.subject	OCR y fragmentación de texto
dc.subject	Arquitectura REST (FastAPI, PostgreSQL, MinIO, Kafka)
dc.subject	Pruebas de rendimiento y escalabilidad (Locust, TTFT)
dc.subject	Ética y regulación de IA generativa
dc.subject	Retrieval-Augmented Generation (RAG)
dc.subject	Large Language Models (LLMs)
dc.subject	Document management
dc.subject	Semantic search
dc.subject	Document indexing and retrieval (Faiss, R2R)
dc.subject	OCR and text chunking
dc.subject	REST architecture (FastAPI, PostgreSQL, MinIO, Kafka)
dc.subject	Performance and scalability testing (Locust, TTFT)
dc.subject	enerative AI ethics and regulation
dc.title	Estudio del rendimiento de la recuperación documental con RAG y modelos de lenguaje de gran escala
dc.type	bachelor thesis
dspace.entity.type	Publication
relation.isAdvisorOfPublication	1318edb8-3967-465c-a267-146624c05837
relation.isAdvisorOfPublication	3313b723-2288-4d9d-b0e7-32732c9c78d5
relation.isAdvisorOfPublication.latestForDiscovery	1318edb8-3967-465c-a267-146624c05837

Files

Original bundle

Now showing 1 - 1 of 1

Name:: DelgadoFerreiro_Santiago_TFG_2025.pdf
Size:: 846.27 KB
Format:: Adobe Portable Document Format

Download

Collections

Traballos académicos (FIC)