Desenvolvemento dun sistema de consulta en linguaxe natural para a recuperación de documentación empresarial mediante IA xenerativa e técnicas RAG

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

Deus García, Samuel

Advisors

Gómez García, Ángel
Gómez García, Ángel::virtual::23::600
Rodríguez Redondo, Luis Manuel
Gómez García, Ángel

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumo]: As organizacións modernas xestionan grandes volumes de documentación interna que, malia estar dixitalizada, resulta difícil de localizar e consultar de forma eficiente. Esta dificultade repercute negativamente na produtividade e na toma de decisións, facendo necesaria a incorporación de solucións intelixentes que melloren o acceso á información corporativa. Este proxecto aborda esta problemática mediante o desenvolvemento dun asistente virtual baseado en Intelixencia Artificial (IA) xenerativa, capaz de responder a consultas en linguaxe natural sobre a documentación interna da empresa. Para iso, implementouse unha arquitectura baseada na técnica de Xeración aumentada de recuperación (RAG), que combina un motor de recuperación de información coa xeración de respostas contextuais a partir dos documentos da organización. A solución foi despregada utilizando servizos da nube de Microsoft Azure, como Document Intelligence para a extracción de contido, AI Search para a indexación semántica e OpenAI para a xeración de linguaxe. Ademais, integrouse nunha canle corporativa existente, Microsoft Teams, mediante o desenvolvemento dun chatbot, facilitando a adopción por parte dos usuarios e garantindo a seguridade e privacidade dos datos. O resultado é un sistema robusto, escalable e facilmente integrable no ecosistema tecnolóxico dunha organización, que mellora significativamente o acceso á información e optimiza os fluxos de traballo internos, permitindo aos usuarios realizar consultas en linguaxe natural sobre cuestións organizativas e obter respostas contextualizadas e precisas.
[Abstract]: Modern organizations manage large volumes of internal documentation which, despite being digitized, often remains difficult to locate and consult efficiently. This challenge negatively affects productivity and decision-making, highlighting the need for intelligent solutions to improve access to corporate information. This project addresses this issue by developing a virtual assistant based on generative Artificial Intelligence (AI), capable of responding to natural language queries about internal company documentation. To achieve this, a system architecture was implemented using the Retrieval Augmented Generation (RAG) technique, which combines an information retrieval engine with contextual response generation based on the organization’s documents. The solution was deployed using Microsoft Azure cloud services, including Document Intelligence for content extraction, AI Search for semantic indexing, and OpenAI for language generation. Furthermore, it was integrated into an existing corporate channel—Microsoft Teams—through the development of a chatbot, which facilitates adoption by users while ensuring data privacy and security. The result is a robust, scalable system that integrates seamlessly into an organization’s technological ecosystem. It significantly improves access to information and streamlines internal workflows by enabling users to perform natural language queries about organizational matters and receive contextualized, accurate answers.

Description

Editor version

Rights