Generación de datos sintéticos con objetos de cocina para entrenar redes neuronales de convolución

Benages-Pardo, Luis; Sagüés-Tanco, Rubén; López-Nicolás, Gonzalo; Llorente, Sergio

Ver/abrir

2019_Benages-Pardo_Generacion-datos-sinteticos-objetos-cocina-redes-neuronales.pdf (12.89Mb)

Use este enlace para citar

http://hdl.handle.net/2183/23687

A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución-NoComercial-CompartirIgual 4.0

Coleccións

Jornadas de Automática (40ª. 2019. Ferrol) [114]

Metadatos

Mostrar o rexistro completo do ítem

Título

Generación de datos sintéticos con objetos de cocina para entrenar redes neuronales de convolución

Título(s) alternativo(s)

Dataset generation with kitchen objects with instance segmentation to train convolutional neural networks

Autor(es)

Benages-Pardo, Luis

Sagüés-Tanco, Rubén

López-Nicolás, Gonzalo

Llorente, Sergio

Data

2019

Cita bibliográfica

Benages-Pardo, L., Sagüés-Tanco, R., López-Nicolás, G., Llorente, S. (2019). Generación de datos sintéticos con objetos de cocina para entrenar redes neuronales de convolución. En XL Jornadas de Automática: libro de actas, Ferrol, 4-6 de septiembre de 2019 (pp. 170-177). DOI capítulo: https://doi.org/10.17979/spudc.9788497497169.170 DOI libro: https://doi.org/10.17979/spudc.9788497497169

Resumo

[Resumen] El reconocimiento de objetos ha sido un problema ampliamente analizado en el campo de la visión por computador desde hace muchos años. En este artículo utilizamos el modelo de red neuronal Mask R-CNN para detectar y segmentar algunos objetos de cocinas usando imágenes RGB. Existen algunas bases de datos públicas con los objetos segmentados y etiquetados por clases, para entrenar este tipo de redes pero normalmente no incluyen clases para aplicaciones concretas. Crear un conjunto de datos etiquetado a mano completamente es una tarea muy tediosa y larga. Proponemos un método eficiente para crear imágenes etiquetadas con poco esfuerzo combinando imágenes de fondos con objetos segmentados. Las imágenes se pueden crear manteniendo el realismo en cuanto a la posición y la escala de los objetos, o automáticamente mediante un posicionamiento aleatorio. Se presenta finalmente una comparación de los resultados obtenidos al entrenar la red con ambos conjuntos de datos creados de forma sintética.

[Abstract] Object recognition has been a wide investigated problem in computer vision for many years. In this paper, we use the Mask R-CNN neural model proposed in the state-of-the-art to detect and segment some classes of kitchen objects using RGB images. There are very few public datasets available with mask and class labels to train this kind of network, and they usually do not include classes needed for specific applications. Creating a handcraft labelled dataset with objects segmented is a very tedious and time consuming task. Thus, we propose an efficient method to generate labelled datasets with very low effort that adequately combines background images with segmented objects. The images can be created keeping the realism in the scales and positions of the objects, or they can be created automatically with the random positioning of the objects. We compare the performance of the models trained in both kinds of synthetic images.

Palabras chave

Segmentación de objetos
Mask R-CNN
Objetos de cocina
Datos sintéticos
Object segmentation
Kitchen objects
Synthetic dataset

Versión do editor

https://doi.org/10.17979/spudc.9788497497169.170

Dereitos

Atribución-NoComercial-CompartirIgual 4.0

ISBN

978-84-9749-716-9