Generación de datos sintéticos con objetos de cocina para entrenar redes neuronales de convolución
Ver/ abrir
Use este enlace para citar
http://hdl.handle.net/2183/23687
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución-NoComercial-CompartirIgual 4.0
Coleccións
Metadatos
Mostrar o rexistro completo do ítemTítulo
Generación de datos sintéticos con objetos de cocina para entrenar redes neuronales de convoluciónTítulo(s) alternativo(s)
Dataset generation with kitchen objects with instance segmentation to train convolutional neural networksData
2019Cita bibliográfica
Benages-Pardo, L., Sagüés-Tanco, R., López-Nicolás, G., Llorente, S. (2019). Generación de datos sintéticos con objetos de cocina para entrenar redes neuronales de convolución. En XL Jornadas de Automática: libro de actas, Ferrol, 4-6 de septiembre de 2019 (pp. 170-177). DOI capítulo: https://doi.org/10.17979/spudc.9788497497169.170 DOI libro: https://doi.org/10.17979/spudc.9788497497169
Resumo
[Resumen] El reconocimiento de objetos ha sido un problema ampliamente analizado en el campo de la visión por computador desde hace muchos años. En este artículo utilizamos el modelo de red neuronal Mask R-CNN para detectar y segmentar algunos objetos de cocinas usando imágenes RGB. Existen algunas bases de datos públicas con los objetos segmentados y etiquetados por clases, para entrenar este tipo de redes pero normalmente no incluyen clases para aplicaciones concretas. Crear un conjunto de datos etiquetado a mano completamente es una tarea muy tediosa y larga. Proponemos un método eficiente para crear imágenes etiquetadas con poco esfuerzo combinando imágenes de fondos con objetos segmentados. Las imágenes se pueden crear manteniendo el realismo en cuanto a la posición y la escala de los objetos, o automáticamente mediante un posicionamiento aleatorio. Se presenta finalmente una comparación de los resultados obtenidos al entrenar la red con ambos conjuntos de datos creados de forma sintética. [Abstract] Object recognition has been a wide investigated problem in computer vision for many years. In this paper, we use the Mask R-CNN neural model proposed in the state-of-the-art to detect and segment some classes of kitchen objects using RGB images. There are very few public datasets available with mask and class labels to train this kind of network, and they usually do not include classes needed for specific applications. Creating a handcraft labelled dataset with objects segmented is a very tedious and time consuming task. Thus, we propose an efficient method to generate labelled datasets with very low effort that adequately combines background images with segmented objects. The images can be created keeping the realism in the scales and positions of the objects, or they can be created automatically with the random positioning of the objects. We compare the performance of the models trained in both kinds of synthetic images.
Palabras chave
Segmentación de objetos
Mask R-CNN
Objetos de cocina
Datos sintéticos
Object segmentation
Kitchen objects
Synthetic dataset
Mask R-CNN
Objetos de cocina
Datos sintéticos
Object segmentation
Kitchen objects
Synthetic dataset
Versión do editor
Dereitos
Atribución-NoComercial-CompartirIgual 4.0
ISBN
978-84-9749-716-9