Análisis de técnicas de aumento de datos y entrenamiento en YOLOv3 para detección de objetos en imágenes RGB y TIR del UMA-SAR Dataset

Galán-Cuenca, Álvaro; Vázquez-Martín, Ricardo; Mandow, Anthony; Morales, Jesús; García-Cerezo, Alfonso

dc.contributor.author	Galán-Cuenca, Álvaro
dc.contributor.author	Vázquez-Martín, Ricardo
dc.contributor.author	Mandow, Anthony
dc.contributor.author	Morales, Jesús
dc.contributor.author	García-Cerezo, Alfonso
dc.date.accessioned	2021-08-26T09:59:32Z
dc.date.available	2021-08-26T09:59:32Z
dc.date.issued	2021
dc.identifier.citation	Galán-Cuenca, A., Vázquez-Martín, R., Mandow, A., Morales, J., García-Cerezo, A. Análisis de técnicas de aumento de datos y entrenamiento en YOLOv3 para detección de objetos en imágenes RGB y TIR del UMA-SAR Dataset. En XLII Jornadas de Automática: libro de actas. Castelló, 1-3 de septiembre de 2021 (pp. 686-694). DOI capítulo: https://doi.org/10.17979/spudc.9788497498043.686 DOI libro: https://doi.org/10.17979/spudc.9788497498043	es_ES
dc.identifier.isbn	978-84-9749-804-3
dc.identifier.uri	http://hdl.handle.net/2183/28378
dc.description.abstract	[Resumen] El uso de imágenes de los espectros visible (RGB) e infrarrojo térmico (TIR) para la detección de objetos puede resultar crucial en aplicaciones donde las condiciones de visibilidad están limitadas, como la robótica para búsqueda y rescate en catástrofes. Para ello resulta beneficioso analizar cómo las técnicas de aprendizaje profundo basadas en redes neuronales convolucionales (CNN) pueden aplicarse a ambas modalidades. En este artículo se analizan diferentes configuraciones y parámetros para el entrenamiento de CNN tanto para imágenes térmicas como para imágenes equivalentes del espectro visible. En concreto, se aborda el problema del sobre-entrenamiento para determinar una configuración eficaz de técnicas de aumento de datos y parada temprana. El caso de estudio se ha realizado con la red de código abierto YOLOv3, pre-entrenada con el dataset RGB COCO y optimizada (o re-entrenada) con el conjunto público de datos UMA-SAR dataset, que incluye pares de imágenes RGB y TIR obtenidas en ejercicios realistas de rescate.	es_ES
dc.description.abstract	[Abstract] The combination of imaging of visible (RGB) and thermal infrared (TIR) modalities can be crucial for object detection in applications where visibility conditions are limited, such as search and rescue robotics. For this, it is beneficial to analyze how deep learning techniques based on convolutional neural networks (CNN) can be applied to these modalities. This article discusses different settings and parameters for CNN training for two equivalent sets of thermal and RGB images. Specifically, we address the problem of overfitting and determine an effective configuration of data augmentation and early stop techniques. The case study has been carried out with the open source network YOLOv3, pre-trained with the RGB COCO dataset, and optimised with the UMA-SAR dataset, which includes pairs of RGB and TIR images obtained in realistic rescue exercises.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Universidade da Coruña, Servizo de Publicacións	es_ES
dc.relation.uri	https://doi.org/10.17979/spudc.9788497498043.686	es_ES
dc.rights	Atribución-NoComercial-CompartirIgual 4.0 Internacional https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/3.0/es/	*
dc.subject	Visión por computador	es_ES
dc.subject	Aprendizaje profundo	es_ES
dc.subject	Redes neuronales convolucionales	es_ES
dc.subject	YOLO	es_ES
dc.subject	Imágenes térmicas	es_ES
dc.subject	Computer vision	es_ES
dc.subject	Deep learning	es_ES
dc.subject	Convolutional neural networks	es_ES
dc.subject	Thermal imaging	es_ES
dc.title	Análisis de técnicas de aumento de datos y entrenamiento en YOLOv3 para detección de objetos en imágenes RGB y TIR del UMA-SAR Dataset	es_ES
dc.type	info:eu-repo/semantics/conferenceObject	es_ES
dc.rights.access	info:eu-repo/semantics/openAccess	es_ES
UDC.startPage	686	es_ES
UDC.endPage	694	es_ES
dc.identifier.doi	https://doi.org/10.17979/spudc.9788497498043.686
UDC.conferenceTitle	XLII Jornadas de Automática	es_ES

Ficheiros no ítem

Nome:: license_rdf
Tamaño:: 1.5Kb
Formato:: application/rdf+xml

Ver/abrir

Nome:: 2021_Galan-Cuenca_Analisis_de_ ...
Tamaño:: 1.711Mb
Formato:: PDF

Ver/abrir

Este ítem aparece na(s) seguinte(s) colección(s)

Jornadas de Automática (42ª. 2021. Castellón) [103]

Mostrar o rexistro simple do ítem