Estudio del rendimiento de la recuperación documental con RAG y modelos de lenguaje de gran escala

UDC.coleccionTraballos académicos
UDC.tipotrabTFG
UDC.titulacionGrao en Enxeñaría Informática
dc.contributor.advisorAlonso, Miguel A.
dc.contributor.advisorVilares, Jesús
dc.contributor.advisorMéndez Llatas, Pablo
dc.contributor.authorDelgado Ferreiro, Santiago
dc.contributor.otherUniversidade da Coruña. Facultade de Informática
dc.date.accessioned2025-08-07T08:57:16Z
dc.date.available2025-08-07T08:57:16Z
dc.date.issued2025-06
dc.description.abstract[Resumen]: Este Trabajo de Fin de Grado desarrolla dos herramientas complementarias para mejorar la gestión y recuperación de información y evaluar el rendimiento de modelos de lenguaje de gran escala (LLM). La primera es un sistema de Recuperación Aumentada por Generación (RAG) accesible mediante una API REST. Los documentos se procesan con OCR, se segmentan en fragmentos de texto y se indexan en un almacén vectorial. En tiempo real, los fragmentos más relevantes se recuperan y se combinan en un prompt que alimenta un modelo de lenguaje, generando respuestas fundamentadas. Todo el flujo —desde la carga y extracción de texto hasta la consulta en lenguaje natural— se presenta al usuario mediante una interfaz web intuitiva. La segunda herramienta es un módulo de evaluación de rendimiento de LLMs basado en Locust. Mide métricas clave como latencia total, tokens por segundo y tiempo hasta el primer token mediante simulaciones de usuarios concurrentes. Los resultados se consolidan en informes comparativos que facilitan la identificación del modelo óptimo según el número de usuarios y la configuración de GPU. Este enfoque permite seleccionar la solución más eficiente para despliegues en entornos productivos.
dc.description.abstract[Abstract]: This Final Degree Project develops two complementary tools to enhance information management and assess the performance of large language models (LLM). The first is a Retrieval-Augmented Generation (RAG) system exposed via a REST API. Documents are OCR-processed, split into text fragments, and indexed in a vector store. At query time, the most relevant fragments are retrieved and assembled into a prompt that drives a language model to produce evidence-based answers. The entire pipeline—from document ingestion and text extraction to natural language querying—is delivered through an intuitive web interface. The second tool is an LLM performance evaluation module built with Locust. By simulating concurrent users, it measures key metrics such as total latency, tokens per second, and time to first token. Results are aggregated into comparative reports that help identify the optimal model based on user load and GPU configuration. This approach guides the selection of the most efficient solution for production deployments.
dc.description.traballosTraballo fin de grao (UDC.FIC). Enxeñaría Informática. Curso 2024/2025
dc.identifier.urihttps://hdl.handle.net/2183/45594
dc.language.isospa
dc.rightsAttribution 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectRecuperación Aumentada por Generación (RAG)
dc.subjectModelos de Lenguaje de Gran Escala (LLMs)
dc.subjectGestión documental
dc.subjectBúsqueda semántica
dc.subjectIndexación y recuperación de documentos (Faiss, R2R)
dc.subjectOCR y fragmentación de texto
dc.subjectArquitectura REST (FastAPI, PostgreSQL, MinIO, Kafka)
dc.subjectPruebas de rendimiento y escalabilidad (Locust, TTFT)
dc.subjectÉtica y regulación de IA generativa
dc.subjectRetrieval-Augmented Generation (RAG)
dc.subjectLarge Language Models (LLMs)
dc.subjectDocument management
dc.subjectSemantic search
dc.subjectDocument indexing and retrieval (Faiss, R2R)
dc.subjectOCR and text chunking
dc.subjectREST architecture (FastAPI, PostgreSQL, MinIO, Kafka)
dc.subjectPerformance and scalability testing (Locust, TTFT)
dc.subjectenerative AI ethics and regulation
dc.titleEstudio del rendimiento de la recuperación documental con RAG y modelos de lenguaje de gran escala
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication1318edb8-3967-465c-a267-146624c05837
relation.isAdvisorOfPublication3313b723-2288-4d9d-b0e7-32732c9c78d5
relation.isAdvisorOfPublication.latestForDiscovery1318edb8-3967-465c-a267-146624c05837

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
DelgadoFerreiro_Santiago_TFG_2025.pdf
Size:
846.27 KB
Format:
Adobe Portable Document Format