Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR

UDC.coleccionInvestigaciónes_ES
UDC.conferenceTitleURSI 2024es_ES
UDC.departamentoEnxeñaría de Computadoreses_ES
UDC.grupoInvGrupo de Tecnoloxía Electrónica e Comunicacións (GTEC)es_ES
UDC.institutoCentroCITIC - Centro de Investigación de Tecnoloxías da Información e da Comunicaciónes_ES
dc.contributor.authorValladares Poncela, Antón
dc.contributor.authorFraga-Lamas, Paula
dc.contributor.authorFernández-Caramés, Tiago M.
dc.date.accessioned2025-02-24T13:51:45Z
dc.date.available2025-02-24T13:51:45Z
dc.date.issued2024
dc.descriptionPresentado en: XXXIX Simposio Nacional de la Unión Científica Internacional de Radio, URSI 2024, Escuela Politécnica de Cuenca, Universidad de Castilla-La Mancha, 4 a 6 de septiembre de 2024.es_ES
dc.description.abstract[Abstract]: Automatic Speech Recognition (ASR) is emerging as a crucial technology for voice recognition in future Extended Reality (XR) and Metaverse applications, enabling natural interactions with virtual and IoT objects. This paper evaluates the performance of Microsoft HoloLens 2 microphone APIs for sound acquisition, quality and noise cancellation in Mixed Reality (MR) scenarios. Three APIs are assessed focusing on sound quality, noise cancellation and speech filtering processes using ASR metrics like Character Error Rate (CER) and Word Error Rate (WER). The provided findings offer insights for MR developers, emphasizing the importance of selecting the right API to enhance sound quality and ASR model precision. This highlights the significance of proper API selection for optimizing MR applications.es_ES
dc.description.sponsorshipEsta publicación es parte del proyecto de I+D+i TED2021-129433A-C22 (HELENE), financiado por MCIN/AEI/10.13039/501100011033 y por la “Unió Europea NextGenerationEU/PRTR”. Los autores quieren también agradecer a Iván Froiz-Míguez su colaboración en el desarrollo de los modelos de ASR y a Aida Vidal-Balea su ayuda en el desarrollo del entorno de RM.es_ES
dc.identifier.citationA. Valladares Poncela, P. Fraga-Lamas, and T. M. Fernández-Caramés, "Tiago M."Evaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASR", XXXIX Simposio Nacional de la Unión Científica Internacional de Radio, URSI 2024, Escuela Politécnica de Cuenca, Universidad de Castilla-La Mancha, 4 a 6 de septiembre de 2024.es_ES
dc.identifier.isbn978-84-09-62953-4
dc.identifier.urihttp://hdl.handle.net/2183/41253
dc.language.isospaes_ES
dc.publisherComité Organizador y Científico XXXIX Simposio Nacional de la Unión Científica Internacional de Radio, URSI 2024; Universidad de Castilla-La Manchaes_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/TED2021-129433A-C22/ES/SISTEMA DE ALTA SEGURIDAD BASADO EN BLOCKCHAIN PARA LA GESTIÓN PRIVADA DE DATOS DE PACIENTES DE SERVICIOS DE SALUD DIGITALESes_ES
dc.relation.urihttps://ursi.es/wp-content/uploads/2024/09/Libro-de-Actas-URSI-2024-Cuenca.pdfes_ES
dc.rightsAtribución 3.0 Españaes_ES
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/es/*
dc.subjectASRes_ES
dc.subjectMixed realityes_ES
dc.subjectMetaversees_ES
dc.titleEvaluación Práctica de las APIs de Procesado de Audio de Microsoft HoloLens 2 para el Desarrollo de Aplicaciones de Realidad Mixta con ASRes_ES
dc.typeconference outputes_ES
dspace.entity.typePublication
relation.isAuthorOfPublicationcaa923d2-cf88-405e-9025-759d06cf3799
relation.isAuthorOfPublication79dbfabd-7261-41ff-9667-2f774d5f341e
relation.isAuthorOfPublication.latestForDiscoverycaa923d2-cf88-405e-9025-759d06cf3799

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
FernandezCarames_Tiago_2024_Evaluacion_Practica_de_las_APIs_de_Procesado_de_Audio_de_Microsoft_HoloLens2.pdf
Size:
1.92 MB
Format:
Adobe Portable Document Format
Description: