Sistemas de reconocimiento del habla automáticos para interfaces en aplicaciones y dispositivos

UDC.coleccionTraballos académicoses_ES
UDC.tipotrabTFGes_ES
UDC.titulacionGrao en Enxeñaría Informáticaes_ES
dc.contributor.advisorLópez-Riobóo Botana, Iñigo Luis
dc.contributor.advisorFernández-Caramés, Tiago M.
dc.contributor.authorGómez Antelo, Raquel
dc.contributor.otherUniversidade da Coruña. Facultade de Informáticaes_ES
dc.date.accessioned2024-10-03T18:40:51Z
dc.date.available2024-10-03T18:40:51Z
dc.date.issued2023-11
dc.description.abstract[Resumen]: Los sistemas de reconocimiento del habla, del inglés, Automatic Speech Recognition (ASR), son una herramienta de gran importancia que están presentes en muchas aplicaciones de uso diario, tales como asistentes virtuales, asistentes de navegación en coches, entre otros. La técnica de ASR se utiliza mucho junto a métodos de Procesamiento de Lenguaje Natural (PLN), existiendo una gran cantidad de modelos para lenguajes específicos e incluso modelos multilenguaje, capaces de entender varios idiomas a la vez. Sin embargo, existe dificultad a la hora de disponer de modelos en lenguas minoritarias, debido al escaso número de datos disponibles en internet. En este proyecto se proponen varios modelos de ASR entrenados en gallego, con el objetivo de integrarlos en una aplicación del Instituto Tecnológico de Galicia (ITG) que utiliza comandos por voz. Se exploran modelos pre-existentes, diferentes formas de entrenamiento, fases de experimentación y posterior integración de servicios. Esta colaboración con el ITG profundiza en el estudio de ASR en lenguas minoritarias así como en su desarrollo e integración en servicios NLP de aplicaciones propietarias de la empresa. es_ES
dc.description.abstract[Abstract]: Automatic Speech Recognition (ASR) systems are a tool of great importance in many applications of daily use such as virtual assitants, car navigation assistants, among others. The ASR technique is widely used together with Natural Language Processing (NLP), there being a great number of models for specific languages and even multilingual models, capable of understanding several languages at the same time. However, there is a difficulty when it comes to having models in minority languages, due to the limited number of data available on the internet. In this project, we propose several ASR models trained in Galician, aiming at their integration into an application of the Instituto Tecnológico de Galicia (ITG) that uses voice commands. We explore pre-existing models, different forms of training, experimentation phases and subsequent service integrations. This colaboration with ITG deepens the study of ASR in minority languages as well as its development and integration within NLP services from proprietary applications of the company.es_ES
dc.description.traballosTraballo fin de grao (UDC.FIC). Enxeñeria informática. Curso 2023/2024es_ES
dc.identifier.urihttp://hdl.handle.net/2183/39423
dc.language.isospaes_ES
dc.rightsAtribución 3.0 Españaes_ES
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/es/*
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/es/
dc.subjectReconocimiento automático del hablaes_ES
dc.subjectLenguas minoritariases_ES
dc.subjectAprendizaje federadoes_ES
dc.subjectProcesamiento del lenguaje naturales_ES
dc.subjectStreaming de audioes_ES
dc.subjectModelos transformeres_ES
dc.subjectRESTful APIes_ES
dc.subjectAutomatic Speech Recognitiones_ES
dc.subjectLow-resource languageses_ES
dc.subjectFederated learninges_ES
dc.subjectNatural language processinges_ES
dc.subjectAudio Streaminges_ES
dc.subjectTransformer modelses_ES
dc.titleSistemas de reconocimiento del habla automáticos para interfaces en aplicaciones y dispositivoses_ES
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication79dbfabd-7261-41ff-9667-2f774d5f341e
relation.isAdvisorOfPublication.latestForDiscovery79dbfabd-7261-41ff-9667-2f774d5f341e

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
GomezAntelo_Raquel_TFG_2023.pdf
Size:
1.69 MB
Format:
Adobe Portable Document Format
Description:
TFG_EI_Computacion