Re-identificación de personas mediante la distancia de Mahalanobis

Gómez-Silva, María José; Armingol, José María; Escalera, Arturo de la

Use this link to cite:

http://hdl.handle.net/2183/24875

Re-identificación de personas mediante la distancia de Mahalanobis

Files

2018_Gomez_Silva_Maria_Jose_Re-identificación-personas-mediante-distancia-Mahalanobis.pdf (687.35 KB)

Identifiers

URI: http://hdl.handle.net/2183/24875

DOI: https://doi.org/10.17979/spudc.9788497497565.0967

Publication date

2018

Authors

Gómez-Silva, María José

Armingol, José María

Escalera, Arturo de la

Bibliographic citation

Gómez Silva, M.J, Armingol, J.M., Escalera, A. Re-identificación de personas mediante la distancia de mahalanobis. En Actas de las XXXIX Jornadas de Automática, Badajoz, 5-7 de Septiembre de 2018 (pp.967-974). DOI capítulo: https://doi.org/10.17979/spudc.9788497497565.0967 DOI libro: https://doi.org/10.17979/spudc.9788497497565

Abstract

[Resumen] La re-identificación de una persona requiere del aprendizaje de una distancia métrica capaz de comparar dos imágenes y decidir si pertenecen o no a la misma persona. La automatización de esta tarea, para su aplicación en videovigilancia inteligente, plantea un gran reto debido a la presencia de personas con una apariencia similar. Por ello, es necesario el aprendizaje de características discriminativas, y de una métrica que las combine apropiadamente. Sin embargo, las variaciones de iluminación, perspectiva, fondo, resolución o escala entre dos imágenes de una misma persona, capturada desde vistas diferentes, hacen que su apariencia varíe, dificultando su re-identificación. Este artículo propone la codificación de las trasformaciones entre las vistas, en una matriz de Mahalanobis, cuya estimación ha sido integrada en el aprendizaje de las características discriminativas, de modo que estas últimas puedan reflejar las disimilitudes principalmente debidas a cambios de apariencia y no de punto de vista. Esta estimación ha sido implementada como una nueva capa de una red neuronal convolucional profunda, que ha sido entrenada y evaluada con la base de datos PRID2011
[Abstract] Person re-identification requires the learning of a distance metric able to compare two images and decide if they belong, or not, to the same person. The automation of this task, in order to be applied in intelligent video-surveillance, involves a great challenge, due to the presence of people with similar appearance. For that reason, it is necessary to learn discriminative features and a metric to properly combine them. However, the variations of illumination, perspective, background, resolution and scale between two images of the same person, which were captured from different views, make his or her apperance vary, hampering the re-identification. This paper proposes coding the view-to-view tranformations in a Mahalanobis matrix, whose estimation has been integrated into the discriminative features learning. In that way, these features can render the dissimilarity mainly due to appearance changes intead of the view changes. This estimation has been implemented as a new layer of a deep convolutional neural network, which has been trained and tested over the PRID2011 dataset