Implementación en CUDA dun método para realizar a operación de convolución en lotes

Aguado Couselo, Sara

dc.contributor.advisor	Andrade Canosa, Diego
dc.contributor.author	Aguado Couselo, Sara
dc.contributor.other	Enxeñaría informática, Grao en	es_ES
dc.date.accessioned	2020-11-12T16:57:25Z
dc.date.available	2020-11-12T16:57:25Z
dc.date.issued	2020-09
dc.identifier.uri	http://hdl.handle.net/2183/26686
dc.description.abstract	[Resumo] Nos últimos anos, as plataformas heteroxéneas, tales como as tarxetas gráficas (GPU), tiveron un gran auxe na resolución de problemas en diversos ámbitos. A realización de operacións alxébricas por lotes xa foi explorada con éxito no pasado, como forma de mellorar o rendemento desta clase de operacións. Non obstante, existen diversas formas de realizalo. Algunhas intentan buscar un emprazamento óptimo das estruturas de datos en memoria, de forma que favoreza as características da plataforma na que o código será executado. Outras tratan de realizar un reparto do traballo que aumente a reutilización dos datos procesados por un mesmo fío. O proxecto explora todas estas estratexias, no marco dunha implementación que emprega CUDA para executar a operación de convolución por lotes. Esta operación alxébrica, ademais, é a que ocupa un maior tempo de execución no adestramento de redes de aprendizaxe profunda. Polo tanto, analizaremos o rendemento da implementación tanto de forma illada coma no contexto das redes de aprendizaxe profunda.	es_ES
dc.description.abstract	[Abstract] In recent years, heterogeneous platforms (e.g., Graphical Processing Units), had a great boom solving problems in different fields. Batch algebraic operations have been successfully explored in the past as a way to improve performance. However, there are several ways to approach it. Some of them try to find an optimal location of the data structures in memory, in a way that favors the characteristics of the platform where the code is going to be executed. Others try to make a division of work that increases the reuse of data processed by the same thread. This project explores all of these strategies, as part of an implementation using CUDA to run the batched convolution operation. This algebraic operation is also the longest running operation in deep learning network training. Therefore, we will analyze implementation performance both in isolation and in the context of deep learning networks.	es_ES
dc.language.iso	glg	es_ES
dc.rights	Atribución-NoComercial-SinDerivadas 3.0 España	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/	*
dc.subject	GPGPU (Computación de Propósito Xeral en Unidades de Procesamento Gráfico)	es_ES
dc.subject	NVIDIA CUDA®	es_ES
dc.subject	Convolución por lotes	es_ES
dc.subject	GPGPU (General-Purpose Computing on Graphics Processing Units)	es_ES
dc.subject	Batched Convolution	es_ES
dc.title	Implementación en CUDA dun método para realizar a operación de convolución en lotes	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
dc.rights.access	info:eu-repo/semantics/openAccess	es_ES
dc.description.traballos	Traballo fin de grao (UDC.FIC). Enxeñaría informática. Curso 2019/2020	es_ES

Ficheiros no ítem

Nome:: license_rdf
Tamaño:: 1.203Kb
Formato:: application/rdf+xml

Ver/abrir

Nome:: S.Aguado_Couselo_2020_Implemen ...
Tamaño:: 3.433Mb
Formato:: PDF

Ver/abrir

Este ítem aparece na(s) seguinte(s) colección(s)

Enxeñaría informática, Grao en [447]

Mostrar o rexistro simple do ítem