Desarrollo de una aplicación paralela para construcción de grafos de vecindad relativa en GPUs y OpenMP

Loading...
Thumbnail Image

Identifiers

Publication date

Authors

Mezrani, Firas

Other responsabilities

Universidade da Coruña. Facultade de Informática

Journal Title

Bibliographic citation

Type of academic work

Abstract

[Resumen]: En este trabajo se aborda la construcción eficiente del Grafo de Vecindad Relativa (RNG, por sus siglas en inglés) a partir de un conjunto de puntos en el plano, aprovechando la propiedad geométrica que establece que el RNG es un subgrafo de la Triangulación de Delaunay. A partir de esta relación, se diseña una canalización híbrida CPU–GPU en la que la triangulación se calcula en la CPU, mientras que la fase de validación de aristas se acelera en la GPU mediante código CUDA. El objetivo principal es reducir el coste computacional asociado a la construcción directa del RNG y analizar el impacto del paralelismo heterogéneo en términos de rendimiento, escalabilidad y uso de recursos. Para ello, se implementan distintas estrategias de paralelización y gestión de memoria y se evalúa su comportamiento sobre diferentes tamaños de problema. Los resultados experimentales muestran mejoras significativas de tiempo de ejecución frente a la ejecución puramente en CPU, especialmente en escenarios de alta densidad de puntos. Asimismo, se identifican los principales cuellos de botella del proceso y se discuten posibles líneas de optimización futura.
[Abstract]: This work addresses the efficient construction of the Relative Neighborhood Graph (RNG) from a set of planar points by exploiting the geometric property that the RNG is a subgraph of the Delaunay Triangulation. Based on this relationship, we design a hybrid CPU–GPU pipeline in which the triangulation is computed on the CPU, while the edge-validation stage is accelerated on the GPU using CUDA. The main goal is to reduce the computational cost of direct RNG construction and to analyze the impact of heterogeneous parallelism in terms of performance, scalability, and resource utilization. Several parallelization and memory-management strategies are implemented and evaluated across different problem sizes. Experimental results demonstrate significant execution-time improvements compared to CPU-only execution, particularly for large and dense point sets. In addition, the main bottlenecks of the pipeline are identified, and potential directions for further optimization are discussed.

Description

Editor version

Rights

Os titulares dos dereitos de autor autorizan a visualización do contido desta obra a través de Internet, así como a súa reprodución, gravación en soporte informático ou impresión para uso privado ou con fins de investigación. En ningún caso se permite o uso lucrativo deste documento. Estes dereitos afectan tanto ao resumo da obra como ao seu contido. Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de este trabajo a través de Internet, así como su reproducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen del trabajo como a su contenido.