Asistente virtual basado en grandes modelos de lenguaje para la interacción con bases de datos mediante lenguaje natural

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

Souto Prego, Borja

Advisors

Cabado Lousa, Bruno

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumen]: En el mundo actual, impulsado por los datos, la capacidad de acceder y comprender la información es fundamental para una toma de decisiones informada. Sin embargo, las complejidades técnicas de la gestión de bases de datos y los lenguajes de consulta a menudo crean barreras para las personas que no poseen conocimientos especializados. Como resultado, muchos profesionales, a pesar de su necesidad de interactuar con los datos, se encuentran limitados en su capacidad para extraer información útil directamente de las bases de datos. Este proyecto presenta un prototipo de chatbot basado en grandes modelos de lenguaje (LLMs) que pretende cerrar esta brecha. El chatbot está diseñado para interpretar y responder a preguntas en lenguaje natural sobre bases de datos estructuradas, haciendo que los datos sean más accesibles para los usuarios no técnicos. Utilizando modelos avanzados de lenguaje, el sistema convierte las consultas del usuario en sentencias SQL, recupera los datos relevantes y luego traduce los resultados estructurados de vuelta a un formato comprensible en lenguaje natural. Durante el desarrollo, se probaron cuatro LLMs diferentes para optimizar la traducción de los resultados SQL, evaluando su rendimiento mediante una evaluación humana en las siguientes métricas: Exactitud, Relevancia, Fluidez, Completitud, Coherencia y Naturalidad. El chatbot ofrece una interfaz intuitiva y fluida que permite a los usuarios obtener respuestas precisas de forma rápida. Esto no solo democratiza el acceso a los datos, sino que también reduce la carga de trabajo humana, permitiendo a los usuarios centrarse en tareas más estratégicas y creativas sin necesidad de lidiar con la complejidad de la gestión de bases de datos.
[Abstract]: In today’s data-driven world, the ability to access and understand data is essential for informed decision-making. Yet, the technical complexities of database management and query languages often create barriers for individuals without specialized knowledge. As a result, many professionals, despite their need to interact with data, find themselves limited in their ability to extract useful insights directly from databases. This project presents a chatbot prototype built using large language models (LLMs) that bridges this gap. The chatbot is designed to interpret and respond to natural language questions related to structured databases, making data more accessible to non-technical users. By leveraging advanced language models, the system can convert user queries into SQL statements, retrieve relevant data, and then translate the structured results back into a user-friendly natural language format. Throughout the development process, four different LLMs were tested to optimize the translation of SQL results, with a human evaluation scoring their performance across the following metrics: Accuracy, Relevance, Fluency, Completeness, Coherence, and Naturalness. The chatbot provides a seamless and intuitive interface, allowing users to receive accurate responses quickly. This not only democratizes data access but also reduces the human workload, enabling users to focus on more strategic and creative tasks without needing to delve into the complexities of database management.

Description

Editor version

Rights

Attribution-ShareAlike 4.0 International
Attribution-ShareAlike 4.0 International

Except where otherwise noted, this item's license is described as Attribution-ShareAlike 4.0 International