Desarrollo de un asistente de voz con reconocimiento de emociones

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

Ojea Couñago, Lucas

Advisors

Villegas Duque, Adrián

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumen]: Desarrollo de un asistente de voz inteligente capaz de reconocer las emociones en el habla del usuario y adaptar sus respuestas para lograr una interacción más empática y natural. El sistema permite incorporar el audio tanto mediante una grabación en tiempo real como a través de la subida de un archivo de audio. Con el fin de identificar de forma precisa las emociones, se emplean técnicas avanzadas de aprendizaje automático (machine learning) y procesamiento de lenguaje natural (NLP), combinando modelos que analizan las características del habla (tono, ritmo, entonación, etc.) con modelos lingüísticos basados en el contenido, consiguiendo de esta manera una predicción fiable de la emoción y de esta manera personalizar las respuestas del asistente correctamente. Por otra parte, se incluye una interfaz web tipo chat en la que se mostrará la transcripción del audio enviado por el usuario, así como la respuesta generada por el asistente, tanto en texto como en audio, dando así forma a la conversación.
[Abstract]: Development of an intelligent voice assistant capable of recognizing emotions in the user’s speech and adapting its responses to achieve a more empathetic and natural interaction. The system supports audio input either via real-time recording or by uploading an audio file. In order to accurately identify emotions, advanced machine learning and natural language processing (NLP) techniques are used, combining models that analyze the characteristics of speech (pitch, rhythm, intonation, etc.) with content-based language models. This enables a reliable prediction of the emotion and allows the assistant’s responses to be personalized accordingly. Additionally, a chat-type web interface is included in which the transcription of the audio sent by the user will be displayed, as well as the response generated by the assistant, both in text and audio, thus shaping the conversation.

Description

Editor version

Rights

Attribution-NonCommercial 4.0 International
Attribution-NonCommercial 4.0 International

Except where otherwise noted, this item's license is described as Attribution-NonCommercial 4.0 International