Mostrar o rexistro simple do ítem

dc.contributor.advisorRegueiro, Carlos V.
dc.contributor.advisorMartín Pernas, Juan Antonio
dc.contributor.advisorFigueira Muñiz, Sandra
dc.contributor.authorGil Mouzo, Antonio
dc.contributor.otherUniversidade da Coruña. Facultade de Informáticaes_ES
dc.date.accessioned2023-11-02T17:58:08Z
dc.date.available2023-11-02T17:58:08Z
dc.date.issued2023-06
dc.identifier.urihttp://hdl.handle.net/2183/34008
dc.description.abstract[Resumen]: Este proyecto se basa en desarrollar un prototipo acerca de un dispositivo de hardware abierto que permita la interacción con el servidor de SINVAD exclusivamente mediante la voz en modo de conversación continua. Con este fin, se ha llevado a cabo una investigación exhaustiva sobre las diversas alternativas de hardware y software de código abierto que posibiliten la creación de dicho prototipo. La aplicación final opera exclusivamente mediante comandos de voz, tanto para la entrada como para la salida. Está constituida por cinco componentes que se encargan, respectivamente, de detectar la entrada de audio y realizar una transcripción precisa del lenguaje natural a texto (Speech-To-Text); reiniciar, suspender o apagar el proceso al detectar una palabra o frase clave (despertador); enviar la transcripción al servidor SINVAD (comunicador); analizar la respuesta obtenida para decidir la contestación en forma de voz (mapeador) y emitir la respuesta correspondiente mediante comandos de voz (Text-To-Speech). La aplicación ha sido implementada utilizando Raspberry Pi OS, Python y Vosk en una Raspberry Pi 4B. El sistema final se ha sometido a un exhaustivo conjunto de pruebas en condiciones normales de operación, incluyendo diferentes distancias, ganancias del micrófono y niveles de ruido ambiente. Los resultados conseguidos confirman la calidad y el rendimiento del sistema desarrollado.es_ES
dc.description.abstract[Abstract]: This project is based on developing a prototype of an open hardware device that allows interaction with the SINVAD server exclusively through voice in continuous talk mode. For this, exhaustive research has been carried out on the diverse open source hardware and software alternatives that make it possible to create this prototype. The final application operates exclusively through voice commands, both for input and output. It is made up of five components that are in charge, respectively, of detecting the audio input and performing an accurate transcription from natural language to text; restarting, suspending or shutting down the process when detecting a key word or phrase; sending the transcription to the SINVAD server; analyzing the response obtained to decide the voice reply and emitting the corresponding response using voice commands. The application has been implemented using Raspberry Pi OS, Python and Vosk on a Raspberry Pi 4B. The final system has been put through a comprehensive set of tests under normal operating conditions, including different microphone distances, gains and levels of ambient noise. The results obtained confirm the quality and performance of the developed system.es_ES
dc.language.isospaes_ES
dc.rightsTodos os dereitos reservadoses_ES
dc.subjectRaspberry Pies_ES
dc.subjectReconocimiento de vozes_ES
dc.subjectConversación continuaes_ES
dc.subjectPythones_ES
dc.subjectSinvades_ES
dc.subjectHardware abiertoes_ES
dc.subjectSoftware librees_ES
dc.subjectSpeech recognitiones_ES
dc.subjectContinuous talkes_ES
dc.subjectOpen hardwarees_ES
dc.subjectFree softwarees_ES
dc.titleSistema de asistencia en procesos de empresa con dispositivo hardware abierto con modo de conversación continuaes_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.rights.accessinfo:eu-repo/semantics/openAccesses_ES
dc.description.traballosTraballo fin de grao (UDC.FIC). Enxeñaría informática. Curso 2022/2023es_ES


Ficheiros no ítem

Thumbnail

Este ítem aparece na(s) seguinte(s) colección(s)

Mostrar o rexistro simple do ítem