Estudio de funciones de pérdida centradas en la estructura local para el entrenamiento de redes de neuronas en tareas de regresión de imagen

UDC.coleccionTraballos académicos
UDC.tipotrabTFG
UDC.titulacionGrao en Enxeñaría Informática
dc.contributor.advisorS. Hervella, Álvaro
dc.contributor.advisorNovo Buján, Jorge
dc.contributor.advisorRouco, José
dc.contributor.authorIglesias Sánchez, Aldara
dc.date.accessioned2025-09-12T09:54:17Z
dc.date.available2025-09-12T09:54:17Z
dc.date.issued2025-06
dc.description.abstract[Resumen]: En el ámbito oftalmológico es común utilizar imágenes de fondo de ojo para apoyar el diagnóstico clínico. El análisis de estas imágenes permite detectar y monitorear enfermedades oculares y sistémicas que se manifiestan en forma de lesiones o alteraciones anatómicas en el fondo de ojo. Con el creciente volumen de imágenes generadas en clínicas y hospitales, y la necesidad de diagnósticos rápidos y precisos, se ha vuelto cada vez más importante aplicar métodos automáticos basados en inteligencia artificial para analizar imágenes del fondo de ojo. Estas técnicas se orientan principalmente a tareas de detección y segmentación precisa de las estructuras anatómicas y patológicas. Sin embargo, uno de los principales desafíos en este ámbito es la escasez de imágenes etiquetadas, especialmente cuando se requiere una delineación precisa de las estructuras, como es el caso en tareas de segmentación y detección. Esto ha motivado el desarrollo de tareas que puedan entrenarse sin etiquetas explícitas, pero que generen representaciones útiles para tareas clínicas posteriores mediante aprendizaje transferido. Aunque muchas tareas de preentrenamiento se enfocan en la interpretación global de la imagen, recientemente han ganado interés los modelos que se centran en información local. Estos modelos se centran en tareas de predicción densa (píxel a píxel) y ofrecen representaciones más adecuadas para segmentación y detección. Un ejemplo es la reconstrucción de imágenes de angiografía a partir de fotografías de fondo de ojo, lo cual implica generar imágenes sintéticas mediante el reconocimiento de patrones vasculares que indican por dónde circularía el marcador de fluoresceína inyectado, y predecir su apariencia de forma densa. Para este tipo de tareas de reconstrucción y síntesis de imagen, es habitual utilizar funciones de pérdida de regresión punto a punto. Sin embargo, estudios previos muestran que incluir información del contexto local y estructura de la imagen a la hora de entrenar - como en el caso de SSIM (Structural Similarity Index Measure) - mejora los resultados de reconstrucción. Este trabajo se centrará en desarrollar y analizar nuevas funciones de pérdida basadas en la estructura local de la imagen, con el objetivo de evaluar si su codificación y uso mejora la calidad de reconstrucción y si dichas mejoras pueden trasladarse a otras tareas mediante aprendizaje transferido.
dc.description.abstract[Abstract]: In the field of ophthalmology, fundus images are commonly used to support clinical diagnosis. The analysis of these images enables the detection and monitoring of ocular and systemic diseases that manifest as lesions or anatomical abnormalities in the fundus. With the increasing volume of images generated in clinics and hospitals, and the need for fast and accurate diagnoses, the application of automated methods based on artificial intelligence has become increasingly important for the analysis of fundus images. These techniques are primarily aimed at the accurate detection and segmentation of anatomical and pathological structures. However, one of the main challenges in this domain is the scarcity of labeled images, particularly when precise delineation of structures is required, as is the case in segmentation and detection tasks. This limitation has motivated the development of tasks that can be trained without explicit labels, but that generate useful representations for downstream clinical tasks through transfer learning. While many pretraining tasks focus on the global interpretation of the image, models that emphasize local information have recently attracted increasing interest. These models target dense prediction tasks (pixel-wise) and provide more suitable representations for segmentation and detection. One example is the reconstruction of angiography images from fundus photographs, which involves generating synthetic images by recognizing vascular patterns that indicate where the injected fluorescein marker would travel, and predicting its appearance in a dense manner. For this type of image reconstruction and synthesis task, point-wise regression loss functions are commonly used. However, previous studies have shown that incorporating local context and structural information into training—such as through the Structural Similarity Index Measure (SSIM)—can enhance reconstruction performance. This work will focus on the development and analysis of novel loss functions based on the local structure of the image, with the aim of evaluating whether their encoding and application improve reconstruction quality, and whether such improvements can be transferred to other tasks via transfer learning.
dc.description.traballosTraballo fin de grao (UDC.FIC). Enxeñaría Informática. Curso 2024/2025
dc.identifier.urihttps://hdl.handle.net/2183/45751
dc.language.isospa
dc.rightsAttribution 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectAprendizaje profundo
dc.subjectFunción de pérdida
dc.subjectFondo de ojo
dc.subjectImagen médica
dc.subjectDerivadas
dc.subjectEstructura local
dc.subjectRedes de neuronas convolucionales
dc.subjectAprendizaje transferido
dc.subjectDeep learning
dc.subjectLoss function
dc.subjectEye fundus
dc.subjectMedical imaging
dc.subjectDerivatives
dc.subjectLocal structure
dc.subjectConvolutional neural networks
dc.subjectTransfer learning
dc.titleEstudio de funciones de pérdida centradas en la estructura local para el entrenamiento de redes de neuronas en tareas de regresión de imagen
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublicationa75ad3bd-a726-4f2b-9b0b-fba6fef730b8
relation.isAdvisorOfPublication0fcd917d-245f-4650-8352-eb072b394df0
relation.isAdvisorOfPublicationf86fc496-ce29-415f-83eb-d14bcca42273
relation.isAdvisorOfPublication.latestForDiscoverya75ad3bd-a726-4f2b-9b0b-fba6fef730b8

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
IglesiasSanchez_Aldara_TFG_2025.pdf
Size:
1.92 MB
Format:
Adobe Portable Document Format