Arquitecturas eficientes para LLMs: estudo e implementación de Mixture of Experts en modelos Transformer

Gil Torres, Artur

Arquitecturas eficientes para LLMs: estudo e implementación de Mixture of Experts en modelos Transformer

UDC.coleccion	Traballos académicos
UDC.tipotrab	TFG
UDC.titulacion	Grao en Enxeñaría Informática
dc.contributor.advisor	Bolón-Canedo, Verónica
dc.contributor.advisor	Alonso-Betanzos, Amparo
dc.contributor.advisor	Cancela, Brais
dc.contributor.author	Gil Torres, Artur
dc.contributor.other	Universidade da Coruña. Facultade de Informática
dc.date.accessioned	2025-10-28T19:27:35Z
dc.date.available	2025-10-28T19:27:35Z
dc.date.issued	2025-09
dc.description.abstract	[Resumo]: A IA xa está consolidada como a tecnoloxía de vangarda desta década, e o uso de ferramentas de xeración de texto baseadas en LLMs está á orde do día. Porén, o seu elevado consumo enerxético e consecuente impacto medioambiental resaltan a necesidade de facelas máis eficientes. Nos últimos anos, a mellora deste tipo de modelos logrouse principalmente a través do escalado mediante hardware cada vez máis potente e capaz, pero na actualidade esta tendencia está a cambiar. O uso de técnicas de optimización por software, e en especial as técnicas de computación condicional, preséntase como unha alternativa para elevar os resultados de rendemento de maneira sostible. Neste traballo afondarase nunha destas técnicas, a Mistura de Expertos, que permite distribuír a carga computacional activando de maneira selectiva aquelas partes do modelo que mellor se adecuen a cada entrada. Analizarase o seu funcionamento teórico, implementaranse diferentes versións e realizaranse experimentos para avaliar as súas vantaxes e limitacións.
dc.description.abstract	[Abstract]: Artificial intelligence has already been established as the leading technology of this decade, and the use of text-generation tools based on LLMs is on the rise. However, their high energy consumption and the resulting environmental impact highlight the need to make them more efficient. In recent years, the improvement of these models has mainly been achieved through scaling with increasingly powerful hardware, but this trend is now changing. The use of software optimization techniques, especially conditional computation techniques, is emerging as a sustainable alternative to boost performance while reducing maintenance costs. This work will delve into one of these techniques, Mixture of Experts, which distributes the computational load by sparsely activating only those parts of the model that best fit each input. Its theoretical foundations will be analyzed, different implementations will be developed, and experiments will be conducted to evaluate its advantages and limitations.
dc.description.traballos	Traballo fin de grao (UDC.FIC). Enxeñaría Informática. Curso 2024/2025
dc.identifier.uri	https://hdl.handle.net/2183/46151
dc.language.iso	glg
dc.rights	Os titulares dos dereitos de autor autorizan a visualización do contido desta obra a través de Internet, así como a súa reprodución, gravación en soporte informático ou impresión para uso privado ou con fins de investigación. En ningún caso se permite o uso lucrativo deste documento. Estes dereitos afectan tanto ao resumo da obra como ao seu contido. Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de este trabajo a través de Internet, así como su reproducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen del trabajo como a su contenido.
dc.rights.accessRights	open access
dc.subject	Modelo de linguaxe de grande escala
dc.subject	IA Verde
dc.subject	Arquitectura Transformer
dc.subject	Mixture of Experts
dc.subject	Experto
dc.subject	Gate
dc.subject	Perda auxiliar
dc.subject	Enrutar
dc.subject	Large Language Model
dc.subject	Green AI
dc.subject	Transformer Architecture
dc.subject	Mixture of Experts
dc.subject	Expert
dc.subject	Auxiliary loss
dc.subject	Route
dc.title	Arquitecturas eficientes para LLMs: estudo e implementación de Mixture of Experts en modelos Transformer
dc.type	bachelor thesis
dspace.entity.type	Publication
relation.isAdvisorOfPublication	c114dccd-76e4-4959-ba6b-7c7c055289b1
relation.isAdvisorOfPublication	a89f1cad-dbc5-471f-986a-26c021ed4a95
relation.isAdvisorOfPublication	ba91aca1-bdb4-4be5-b686-463937924910
relation.isAdvisorOfPublication.latestForDiscovery	c114dccd-76e4-4959-ba6b-7c7c055289b1

Files

Original bundle

Now showing 1 - 1 of 1

Name:: GilTorres_Artur_TFG_2025.pdf
Size:: 2.14 MB
Format:: Adobe Portable Document Format

Download

Collections

Traballos académicos (FIC)