Estudio del rendimiento de la recuperación documental con RAG y modelos de lenguaje de gran escala
| UDC.coleccion | Traballos académicos | |
| UDC.tipotrab | TFG | |
| UDC.titulacion | Grao en Enxeñaría Informática | |
| dc.contributor.advisor | Alonso, Miguel A. | |
| dc.contributor.advisor | Vilares, Jesús | |
| dc.contributor.advisor | Méndez Llatas, Pablo | |
| dc.contributor.author | Delgado Ferreiro, Santiago | |
| dc.contributor.other | Universidade da Coruña. Facultade de Informática | |
| dc.date.accessioned | 2025-08-07T08:57:16Z | |
| dc.date.available | 2025-08-07T08:57:16Z | |
| dc.date.issued | 2025-06 | |
| dc.description.abstract | [Resumen]: Este Trabajo de Fin de Grado desarrolla dos herramientas complementarias para mejorar la gestión y recuperación de información y evaluar el rendimiento de modelos de lenguaje de gran escala (LLM). La primera es un sistema de Recuperación Aumentada por Generación (RAG) accesible mediante una API REST. Los documentos se procesan con OCR, se segmentan en fragmentos de texto y se indexan en un almacén vectorial. En tiempo real, los fragmentos más relevantes se recuperan y se combinan en un prompt que alimenta un modelo de lenguaje, generando respuestas fundamentadas. Todo el flujo —desde la carga y extracción de texto hasta la consulta en lenguaje natural— se presenta al usuario mediante una interfaz web intuitiva. La segunda herramienta es un módulo de evaluación de rendimiento de LLMs basado en Locust. Mide métricas clave como latencia total, tokens por segundo y tiempo hasta el primer token mediante simulaciones de usuarios concurrentes. Los resultados se consolidan en informes comparativos que facilitan la identificación del modelo óptimo según el número de usuarios y la configuración de GPU. Este enfoque permite seleccionar la solución más eficiente para despliegues en entornos productivos. | |
| dc.description.abstract | [Abstract]: This Final Degree Project develops two complementary tools to enhance information management and assess the performance of large language models (LLM). The first is a Retrieval-Augmented Generation (RAG) system exposed via a REST API. Documents are OCR-processed, split into text fragments, and indexed in a vector store. At query time, the most relevant fragments are retrieved and assembled into a prompt that drives a language model to produce evidence-based answers. The entire pipeline—from document ingestion and text extraction to natural language querying—is delivered through an intuitive web interface. The second tool is an LLM performance evaluation module built with Locust. By simulating concurrent users, it measures key metrics such as total latency, tokens per second, and time to first token. Results are aggregated into comparative reports that help identify the optimal model based on user load and GPU configuration. This approach guides the selection of the most efficient solution for production deployments. | |
| dc.description.traballos | Traballo fin de grao (UDC.FIC). Enxeñaría Informática. Curso 2024/2025 | |
| dc.identifier.uri | https://hdl.handle.net/2183/45594 | |
| dc.language.iso | spa | |
| dc.rights | Attribution 4.0 International | en |
| dc.rights.accessRights | open access | |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Recuperación Aumentada por Generación (RAG) | |
| dc.subject | Modelos de Lenguaje de Gran Escala (LLMs) | |
| dc.subject | Gestión documental | |
| dc.subject | Búsqueda semántica | |
| dc.subject | Indexación y recuperación de documentos (Faiss, R2R) | |
| dc.subject | OCR y fragmentación de texto | |
| dc.subject | Arquitectura REST (FastAPI, PostgreSQL, MinIO, Kafka) | |
| dc.subject | Pruebas de rendimiento y escalabilidad (Locust, TTFT) | |
| dc.subject | Ética y regulación de IA generativa | |
| dc.subject | Retrieval-Augmented Generation (RAG) | |
| dc.subject | Large Language Models (LLMs) | |
| dc.subject | Document management | |
| dc.subject | Semantic search | |
| dc.subject | Document indexing and retrieval (Faiss, R2R) | |
| dc.subject | OCR and text chunking | |
| dc.subject | REST architecture (FastAPI, PostgreSQL, MinIO, Kafka) | |
| dc.subject | Performance and scalability testing (Locust, TTFT) | |
| dc.subject | enerative AI ethics and regulation | |
| dc.title | Estudio del rendimiento de la recuperación documental con RAG y modelos de lenguaje de gran escala | |
| dc.type | bachelor thesis | |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 1318edb8-3967-465c-a267-146624c05837 | |
| relation.isAdvisorOfPublication | 3313b723-2288-4d9d-b0e7-32732c9c78d5 | |
| relation.isAdvisorOfPublication.latestForDiscovery | 1318edb8-3967-465c-a267-146624c05837 |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- DelgadoFerreiro_Santiago_TFG_2025.pdf
- Size:
- 846.27 KB
- Format:
- Adobe Portable Document Format

