Arquitecturas eficientes para LLMs: estudo e implementación de Mixture of Experts en modelos Transformer

UDC.coleccionTraballos académicos
UDC.tipotrabTFG
UDC.titulacionGrao en Enxeñaría Informática
dc.contributor.advisorBolón-Canedo, Verónica
dc.contributor.advisorAlonso-Betanzos, Amparo
dc.contributor.advisorCancela, Brais
dc.contributor.authorGil Torres, Artur
dc.contributor.otherUniversidade da Coruña. Facultade de Informática
dc.date.accessioned2025-10-28T19:27:35Z
dc.date.available2025-10-28T19:27:35Z
dc.date.issued2025-09
dc.description.abstract[Resumo]: A IA xa está consolidada como a tecnoloxía de vangarda desta década, e o uso de ferramentas de xeración de texto baseadas en LLMs está á orde do día. Porén, o seu elevado consumo enerxético e consecuente impacto medioambiental resaltan a necesidade de facelas máis eficientes. Nos últimos anos, a mellora deste tipo de modelos logrouse principalmente a través do escalado mediante hardware cada vez máis potente e capaz, pero na actualidade esta tendencia está a cambiar. O uso de técnicas de optimización por software, e en especial as técnicas de computación condicional, preséntase como unha alternativa para elevar os resultados de rendemento de maneira sostible. Neste traballo afondarase nunha destas técnicas, a Mistura de Expertos, que permite distribuír a carga computacional activando de maneira selectiva aquelas partes do modelo que mellor se adecuen a cada entrada. Analizarase o seu funcionamento teórico, implementaranse diferentes versións e realizaranse experimentos para avaliar as súas vantaxes e limitacións.
dc.description.abstract[Abstract]: Artificial intelligence has already been established as the leading technology of this decade, and the use of text-generation tools based on LLMs is on the rise. However, their high energy consumption and the resulting environmental impact highlight the need to make them more efficient. In recent years, the improvement of these models has mainly been achieved through scaling with increasingly powerful hardware, but this trend is now changing. The use of software optimization techniques, especially conditional computation techniques, is emerging as a sustainable alternative to boost performance while reducing maintenance costs. This work will delve into one of these techniques, Mixture of Experts, which distributes the computational load by sparsely activating only those parts of the model that best fit each input. Its theoretical foundations will be analyzed, different implementations will be developed, and experiments will be conducted to evaluate its advantages and limitations.
dc.description.traballosTraballo fin de grao (UDC.FIC). Enxeñaría Informática. Curso 2024/2025
dc.identifier.urihttps://hdl.handle.net/2183/46151
dc.language.isoglg
dc.rightsOs titulares dos dereitos de autor autorizan a visualización do contido desta obra a través de Internet, así como a súa reprodución, gravación en soporte informático ou impresión para uso privado ou con fins de investigación. En ningún caso se permite o uso lucrativo deste documento. Estes dereitos afectan tanto ao resumo da obra como ao seu contido. Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de este trabajo a través de Internet, así como su reproducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen del trabajo como a su contenido.
dc.rights.accessRightsopen access
dc.subjectModelo de linguaxe de grande escala
dc.subjectIA Verde
dc.subjectArquitectura Transformer
dc.subjectMixture of Experts
dc.subjectExperto
dc.subjectGate
dc.subjectPerda auxiliar
dc.subjectEnrutar
dc.subjectLarge Language Model
dc.subjectGreen AI
dc.subjectTransformer Architecture
dc.subjectMixture of Experts
dc.subjectExpert
dc.subjectAuxiliary loss
dc.subjectRoute
dc.titleArquitecturas eficientes para LLMs: estudo e implementación de Mixture of Experts en modelos Transformer
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublicationc114dccd-76e4-4959-ba6b-7c7c055289b1
relation.isAdvisorOfPublicationa89f1cad-dbc5-471f-986a-26c021ed4a95
relation.isAdvisorOfPublicationba91aca1-bdb4-4be5-b686-463937924910
relation.isAdvisorOfPublication.latestForDiscoveryc114dccd-76e4-4959-ba6b-7c7c055289b1

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
GilTorres_Artur_TFG_2025.pdf
Size:
2.14 MB
Format:
Adobe Portable Document Format