Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Facultade de Informática
  • Investigación (FIC)
  • Ver ítem
  •   RUC
  • Facultade de Informática
  • Investigación (FIC)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

BPLG–BMCS: GPU-sorting algorithm using a tuning skeleton library

Thumbnail
Ver/abrir
A.P.Diéguez_BPLG-BMCS_GPU-Sorting_Algorithm_using_a_Tuning_Skeleton Library_2017.pdf (929.5Kb)
Use este enlace para citar
http://hdl.handle.net/2183/20960
Coleccións
  • Investigación (FIC) [1678]
Metadatos
Mostrar o rexistro completo do ítem
Título
BPLG–BMCS: GPU-sorting algorithm using a tuning skeleton library
Autor(es)
Pérez Diéguez, Adrián
Amor, Margarita
Doallo, Ramón
Data
2017
Cita bibliográfica
Diéguez, A.P., Amor, M. & Doallo, R. J Supercomput (2017) 73: 4. https://doi.org/10.1007/s11227-015-1591-9
Resumo
[Abstract] In this work, we present an efficient and portable sorting operator for GPUs. Specifically, we propose an algorithmic variant of the bitonic merge sort which reduces the number of processing stages and internal steps, increasing the workload per thread and focusing on a multi-batch execution for multiple problems of a small size. This proposal is well matched to current GPU architectures and we apply different CUDA optimizations to improve performance. For portability, we use a library based on tuning building blocks. Thanks to this parametrization, the library can easily be tuned for different CUDA GPU architectures. Our proposals obtain competitive performance on two recent NVIDIA GPU architectures, providing an improvement of up to 11,794 × over CUDPP and up to 6467 × over ModernGPU.
Palabras chave
GPUQ
CUDA
Tuning
Building blocks
Bitonic merge sort
 
Descrición
This is a post-peer-review, pre-copyedit version of an article published in Journal of Supercomputing. The final authenticated version is available online at: https://doi.org/10.1007/s11227-015-1591-9
Versión do editor
https://doi.org/10.1007/s11227-015-1591-9
ISSN
0920-8542
1573-0484
 

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións