Aplicación del aprendizaje activo con oráculos imperfectos en un contexto de juegos

UDC.coleccionTraballos académicoses_ES
UDC.tipotrabTFGes_ES
UDC.titulacionGrao en Enxeñaría Informáticaes_ES
dc.contributor.advisorHernández-Pereira, Elena
dc.contributor.advisorMosqueira-Rey, Eduardo
dc.contributor.authorCastro Alonso, Anxo
dc.contributor.otherUniversidade da Coruña. Facultade de Informáticaes_ES
dc.date.accessioned2024-10-08T17:46:23Z
dc.date.embargoEndDate2025-04-08es_ES
dc.date.embargoLift2025-04-08
dc.date.issued2024-06
dc.description.abstract[Resumen]: El Aprendizaje por Refuerzo es una técnica de Aprendizaje Automático en la que un agente aprende a tomar decisiones en base a la interacción con el entorno. El Aprendizaje Activo, por otro lado, es una técnica en la que se involucra a los humanos (oráculos) en el proceso de Aprendizaje Automático de un sistema, consultando al humano sobre aquellos casos donde el modelo tiene más incertidumbre en sus predicciones. En este proyecto, aplicamos técnicas de Aprendizaje por Refuerzo y Aprendizaje Activo en el contexto del juego 2048. El objetivo es investigar si la intervención humana puede mejorar el rendimiento del sistema. Para ello, desarrollamos un sistema de aprendizaje por refuerzo basado en Deep Q-Learning e integramos en él un sistema de Aprendizaje Activo donde un humano experto proporcionaba información al modelo para ayudarle en su proceso de apren- dizaje. Los resultados obtenidos demuestran como el uso de Aprendizaje Activo, incorporando a los humanos en el proceso de entrenamiento, pueden mejorar el rendimiento del sistema in- cluso cuando el dominio del problema a resolver presenta aleatoriedad o incertidumbre. es_ES
dc.description.abstract[Abstract]: Reinforcement Learning is a Machine Learning technique in which an agent learns to make decisions based on interaction with the environment. Active Learning, on the other hand, is a technique in which humans (oracles) are involved in the Machine Learning process, con- sulting the human on those cases where the model has more uncertainty in its predictions. In this project, we apply Reinforcement Learning and Active Learning techniques in the con- text of the 2048 game. The objective is to investigate whether human intervention can improve the performance of the system. For this purpose, we developed a reinforcement learning sys- tem based on Deep Q-Learning and integrated in it an Active Learning system where a human expert provided feedback to the model to help it in its learning process. The results obtained demonstrate how the use of Active Learning, incorporating humans in the training process, can improve the performance of the system even when the problem domain to be solved presents randomness or uncertainty.es_ES
dc.description.traballosTraballo fin de grao (UDC.FIC). Enxeñeria informática. Curso 2023/2024es_ES
dc.identifier.urihttp://hdl.handle.net/2183/39508
dc.language.isospaes_ES
dc.rightsAtribución-CompartirIgual 3.0 Españaes_ES
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/es/*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/es/
dc.subjectAprendizaje máquinaes_ES
dc.subjectAprendizaje por refuerzoes_ES
dc.subjectAprendizaje activoes_ES
dc.subjectInteligencia artificiales_ES
dc.subjectHumano en el buclees_ES
dc.subjectMachine learninges_ES
dc.subjectReinforcement learninges_ES
dc.subjectActive learninges_ES
dc.subjectArtificial intelligencees_ES
dc.subjectHuman-in-the-Loopes_ES
dc.titleAplicación del aprendizaje activo con oráculos imperfectos en un contexto de juegoses_ES
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublicationcb5a8279-4fbe-44ee-8cb4-26af62dae4f1
relation.isAdvisorOfPublication770502c4-505f-4b52-80e6-22359cb07b44
relation.isAdvisorOfPublication.latestForDiscoverycb5a8279-4fbe-44ee-8cb4-26af62dae4f1

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
CastroAlonso_Anxo_TFG_2024.pdf
Size:
2.77 MB
Format:
Adobe Portable Document Format
Description:
TFG_EI_Computacion