Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Informática
  • Investigación (FIC)
  • Ver ítem
  •   RUC
  • Facultade de Informática
  • Investigación (FIC)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR

Thumbnail
Ver/abrir
FernandezCarames_Tiago_2024_Evaluacion_Practica_de_las_APIs_de_Procesado_de_Audio_de_Microsoft_HoloLens2.pdf (1.920Mb)
Use este enlace para citar
http://hdl.handle.net/2183/41253
Atribución 3.0 España
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución 3.0 España
Coleccións
  • Investigación (FIC) [1728]
Metadatos
Mostrar o rexistro completo do ítem
Título
Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR
Autor(es)
Valladares Poncela, Antón
Fraga-Lamas, Paula
Fernández-Caramés, Tiago M.
Data
2024
Cita bibliográfica
A. Valladares Poncela, P. Fraga-Lamas, and T. M. Fernández-Caramés, "Tiago M."Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR", XXXIX Simposio Nacional de la Unión Científica Internacional de Radio, URSI 2024, Escuela Politécnica de Cuenca, Universidad de Castilla-La Mancha, 4 a 6 de septiembre de 2024.
Resumo
[Abstract]: Automatic Speech Recognition (ASR) is emerging as a crucial technology for voice recognition in future Extended Reality (XR) and Metaverse applications, enabling natural interactions with virtual and IoT objects. This paper evaluates the performance of Microsoft HoloLens 2 microphone APIs for sound acquisition, quality and noise cancellation in Mixed Reality (MR) scenarios. Three APIs are assessed focusing on sound quality, noise cancellation and speech filtering processes using ASR metrics like Character Error Rate (CER) and Word Error Rate (WER). The provided findings offer insights for MR developers, emphasizing the importance of selecting the right API to enhance sound quality and ASR model precision. This highlights the significance of proper API selection for optimizing MR applications.
Palabras chave
ASR
Mixed reality
Metaverse
 
Descrición
Presentado en: XXXIX Simposio Nacional de la Unión Científica Internacional de Radio, URSI 2024, Escuela Politécnica de Cuenca, Universidad de Castilla-La Mancha, 4 a 6 de septiembre de 2024.
Versión do editor
https://ursi.es/wp-content/uploads/2024/09/Libro-de-Actas-URSI-2024-Cuenca.pdf
Dereitos
Atribución 3.0 España
ISBN
978-84-09-62953-4

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións