Docuchat: Implementación de un sistema de pregunta-respuesta basado en generación aumentada por recuperación y modelos de lenguaje
| UDC.coleccion | Traballos académicos | |
| UDC.tipotrab | TFG | |
| UDC.titulacion | Grao en Enxeñaría Informática | |
| dc.contributor.advisor | López Cabaleiros, Iván | |
| dc.contributor.advisor | Alonso, Miguel A. | |
| dc.contributor.advisor | Vilares, Jesús | |
| dc.contributor.author | Pajón Area, Pablo | |
| dc.contributor.other | Universidade da Coruña. Facultade de Informática | |
| dc.date.accessioned | 2025-11-06T16:00:20Z | |
| dc.date.available | 2025-11-06T16:00:20Z | |
| dc.date.issued | 2025-09 | |
| dc.description.abstract | [Resumen]: Este trabajo presenta un asistente conversacional basado en Generación Aumentada por Recuperación (RAG por sus siglas en inglés) para consultar repositorios documentales que combina búsqueda semántica con generación de respuestas en Grandes Modelos de Lenguaje (LLMs por sus siglas en inglés) locales. El sistema toma como entrada un repositorio de documentos (p. ej., PDF/MS Word), los divide en fragmentos, crea representaciones vectoriales y, ante cada pregunta del usuario, recupera los pasajes más relevantes para componer una respuesta fundamentada en el propio corpus. Además, desde el chat se pueden invocar utilidades externas para ampliar capacidades más allá de la lectura y resumen de documentos. Se ofrece un prototipo completo con despliegue automatizado en la nube y modos de acceso seguros, pensado para pasar de pruebas a demostraciones sin cambios de arquitectura. | |
| dc.description.abstract | [Abstract]: This work presents a conversational assistant based on Retrieval-Augmented Generation (RAG) for querying document repositories that combines semantic retrieval with answer generation using local Large Language Models (LLMs). The system takes as input a repository of documents (e.g., PDF/MS Word), segments them into chunks, builds vector representations, and, at query time, retrieves the most relevant passages to ground responses in the source corpus. From the chat, users can also invoke external utilities to extend capabilities beyond simple reading and summarization. We deliver a complete prototype with automated cloud deployment and secure access modes, designed to transition from testing to demonstrations without architectural changes. | |
| dc.description.traballos | Traballo fin de grao (UDC.FIC). Enxeñaría Informática. Curso 2024/2025 | |
| dc.identifier.uri | https://hdl.handle.net/2183/46325 | |
| dc.language.iso | spa | |
| dc.rights | Attribution 4.0 International | en |
| dc.rights.accessRights | open access | |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Generación Aumentada por Recuperación | |
| dc.subject | Búsqueda semántica | |
| dc.subject | Modelos de lenguaje de gran tamaño | |
| dc.subject | Bases de datos vectoriales | |
| dc.subject | MCP | |
| dc.subject | Retrieval-augmented generation | |
| dc.subject | Semantic search | |
| dc.subject | Large language models | |
| dc.subject | Vector databases | |
| dc.title | Docuchat: Implementación de un sistema de pregunta-respuesta basado en generación aumentada por recuperación y modelos de lenguaje | |
| dc.type | bachelor thesis | |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 1318edb8-3967-465c-a267-146624c05837 | |
| relation.isAdvisorOfPublication | 3313b723-2288-4d9d-b0e7-32732c9c78d5 | |
| relation.isAdvisorOfPublication.latestForDiscovery | 1318edb8-3967-465c-a267-146624c05837 |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- PajonArea_Pablo_TFG_2025.pdf
- Size:
- 2.2 MB
- Format:
- Adobe Portable Document Format

