Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR

Valladares Poncela, Antón; Fraga-Lamas, Paula; Fernández-Caramés, Tiago M.

Use this link to cite:

http://hdl.handle.net/2183/41253

Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR

Files

FernandezCarames_Tiago_2024_Evaluacion_Practica_de_las_APIs_de_Procesado_de_Audio_de_Microsoft_HoloLens2.pdf (1.92 MB)

Identifiers

URI: http://hdl.handle.net/2183/41253

Publication date

2024

Authors

Valladares Poncela, Antón

Fraga-Lamas, Paula

Fernández-Caramés, Tiago M.

Bibliographic citation

A. Valladares Poncela, P. Fraga-Lamas, and T. M. Fernández-Caramés, "Tiago M."Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR", XXXIX Simposio Nacional de la Unión Científica Internacional de Radio, URSI 2024, Escuela Politécnica de Cuenca, Universidad de Castilla-La Mancha, 4 a 6 de septiembre de 2024.

Abstract

[Abstract]: Automatic Speech Recognition (ASR) is emerging as a crucial technology for voice recognition in future Extended Reality (XR) and Metaverse applications, enabling natural interactions with virtual and IoT objects. This paper evaluates the performance of Microsoft HoloLens 2 microphone APIs for sound acquisition, quality and noise cancellation in Mixed Reality (MR) scenarios. Three APIs are assessed focusing on sound quality, noise cancellation and speech filtering processes using ASR metrics like Character Error Rate (CER) and Word Error Rate (WER). The provided findings offer insights for MR developers, emphasizing the importance of selecting the right API to enhance sound quality and ASR model precision. This highlights the significance of proper API selection for optimizing MR applications.

Description

Presentado en: XXXIX Simposio Nacional de la Unión Científica Internacional de Radio, URSI 2024, Escuela Politécnica de Cuenca, Universidad de Castilla-La Mancha, 4 a 6 de septiembre de 2024.

Keywords

ASR Mixed reality Metaverse

Editor version

https://ursi.es/wp-content/uploads/2024/09/Libro-de-Actas-URSI-2024-Cuenca.pdf

Rights

Atribución 3.0 España

Collections

Investigación (FIC)

Full item page

Except where otherwise noted, this item's license is described as Atribución 3.0 España

Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR

Files

Identifiers

Publication date

Authors

Advisors

Other responsabilities

Journal Title

Bibliographic citation

Type of academic work

Academic degree

Abstract

Description

Keywords

Editor version

Rights

Collections