Síntesis de voz de alta calidad para el idioma gallego
| UDC.coleccion | Traballos académicos | |
| UDC.tipotrab | TFG | |
| UDC.titulacion | Grao en Enxeñaría Informática | |
| dc.contributor.advisor | Morales Ulloa, Andrés | |
| dc.contributor.advisor | Rivero, Daniel | |
| dc.contributor.author | Adega Fernández, Enrique | |
| dc.contributor.other | Universidade da Coruña. Facultade de Informática | |
| dc.date.accessioned | 2025-07-28T11:50:08Z | |
| dc.date.available | 2025-07-28T11:50:08Z | |
| dc.date.issued | 2025-06 | |
| dc.description.abstract | [Resumen]: La conversión de texto a voz (TTS, por sus siglas en inglés) ha experimentado notables avances en los últimos años, impulsada por el desarrollo de nuevas técnicas basadas en el aprendizaje profundo. Estos progresos han permitido la generación de voces sintéticas cada vez más naturales, expresivas y fieles a las características del habla humana. Sin embargo, la mayoría de estos desarrollos se centran en idiomas de amplia difusión, dejando de lado lenguas minoritarias que carecen de los recursos necesarios para entrenar modelos de última generación. En este contexto, el presente proyecto tiene como objetivo aplicar los avances más recientes en TTS al idioma gallego, facilitando la creación de voces de alta calidad que respeten la prosodia y sonoridad propias de la lengua. Asimismo, se exploran técnicas de clonación de voz que permiten reproducir con precisión las características individuales de hablantes concretos, incluso a partir de muestras limitadas. De este modo, se contribuye a enriquecer las herramientas tecnológicas disponibles para el gallego, fomentando su uso en aplicaciones de accesibilidad, educación, doblaje y generación de contenidos. A lo largo del proyecto se abordan tanto los fundamentos teóricos como los aspectos prácticos, describiendo los métodos y tecnologías empleados, su funcionamiento y las razones que justifican su elección. Además, se realiza un estudio de mercado con el objetivo de analizar la viabilidad de la librería desarrollada, así como un plan detallado del proyecto que incluye la estimación de costes y plazos de ejecución. Por último, las metodologías aplicadas en el desarrollo tanto del sistema inteligente como de la propia librería, junto con el proceso completo de diseño, experimentación, implementación y validación, se describen en los capítulos correspondientes. | |
| dc.description.abstract | [Abstract]: Text-to-speech conversion (TTS) has seen remarkable progress in recent years, driven by the development of new techniques based on deep learning. These advances have enabled the generation of synthetic voices that are increasingly natural, expressive, and faithful to the characteristics of human speech. However, most of these developments focus on widely spoken languages, leaving minority languages behind due to the lack of resources needed to train state-of-the-art models. In this context, the present project aims to apply the latest advances in TTS to the Galician language, facilitating the creation of high-quality voices that respect the language’s prosody and sound patterns. In addition, the project explores voice cloning techniques that can accurately reproduce the unique characteristics of individual speakers, even from limited samples. In this way, it contributes to enriching the technological tools available for Galician, promoting its use in applications such as accessibility, education, dubbing, and content generation. Throughout the project, both theoretical foundations and practical aspects are addressed, describing the methods and technologies used, how they work, and the rationale behind their selection. Furthermore, a market study is conducted to analyze the viability of the developed library, along with a detailed project plan that includes cost estimates and execution timelines. Finally, the methodologies applied in the development of both the intelligent system and the library itself, together with the complete process of design, experimentation, implementation, and validation, are described in the corresponding chapters. | |
| dc.description.traballos | Traballo fin de grao (UDC.FIC). Enxeñaría Informática. Curso 2024/2025 | |
| dc.identifier.uri | https://hdl.handle.net/2183/45570 | |
| dc.language.iso | spa | |
| dc.rights | Os titulares dos dereitos de autor autorizan a visualización do contido desta obra a través de Internet, así como a súa reprodución, gravación en soporte informático ou impresión para uso privado ou con fins de investigación. En ningún caso se permite o uso lucrativo deste documento. Estes dereitos afectan tanto ao resumo da obra como ao seu contido. Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de este trabajo a través de Internet, así como su reproducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen del trabajo como a su contenido. | |
| dc.rights | Attribution 4.0 International | en |
| dc.rights.accessRights | open access | |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Conversión de texto a voz | |
| dc.subject | Gallego | |
| dc.subject | Lenguas minoritarias | |
| dc.subject | Aprendizaje profundo | |
| dc.subject | Síntesis de voz | |
| dc.subject | Clonación de voz | |
| dc.subject | Zero-shot voice cloning | |
| dc.subject | XTTS | |
| dc.subject | SparkTTS | |
| dc.subject | Text-to-speech conversion | |
| dc.subject | Galician | |
| dc.subject | Minority languages | |
| dc.subject | Deep learning | |
| dc.subject | Speech synthesis | |
| dc.subject | Voice cloning | |
| dc.subject | Zero-shot voice cloning | |
| dc.title | Síntesis de voz de alta calidad para el idioma gallego | |
| dc.type | bachelor thesis | |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | d8e10433-ea19-4a35-8cc6-0c7b9f143a6d | |
| relation.isAdvisorOfPublication.latestForDiscovery | d8e10433-ea19-4a35-8cc6-0c7b9f143a6d |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- AdegaFernandez_Enrique_TFG_2025.pdf
- Size:
- 670.73 KB
- Format:
- Adobe Portable Document Format

