Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico
Use este enlace para citar
http://hdl.handle.net/2183/25746
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución-NoComercial-CompartirIgual 4.0 España
Coleccións
Metadatos
Mostrar o rexistro completo do ítemTítulo
Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánicoData
2017Cita bibliográfica
Díaz Iza, H., Armesto Angel, L., Sala, A. I Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico. En Actas de las XXXVIII Jornadas de Automática, Gijón, 6-8 de Septiembre de 2017 (pp.360-367). DOI capítulo: https://doi.org/10.17979/spudc.9788497497749.0360 DOI libro: : https://doi.org/10.17979/spudc.9788497497749
Versións
http://hdl.handle.net/10651/46515
Resumo
[Resumen] El aprendizaje por refuerzo es una técnica que se utiliza en la búsqueda de soluciones en sistemas de decisión secuencial. Una gran parte de los algoritmos usados en el aprendizaje por refuerzo se fundamentan en la programación dinámica, se considera que el aprendizaje por refuerzo es una extensión de la programación dinámica que proporciona soluciones sin la necesidad de conocer el modelo de comportamiento del sistema. Estas técnicas combinan algunas características del control óptimo y control adaptativo para el diseño de controladores realimentados. Se describen los algoritmos básicos del aprendizaje por refuerzo para la implementación de soluciones en sistemas discretos deterministas. Finalmente, se realizaron pruebas prácticas de la implementación del algoritmo de aprendizaje Q-learning en un péndulo de un grado de libertad, con el objetivo de verificar si el algoritmo de aprendizaje converge y proporciona un controlador estabilizante.
Palabras chave
Aprendizaje por refuerzo
QLearning
Control óptimo
Control adaptativo óptimo
Programación dinámica
QLearning
Control óptimo
Control adaptativo óptimo
Programación dinámica
Versión do editor
Dereitos
Atribución-NoComercial-CompartirIgual 4.0 España
ISBN
978-84-16664-74-0 (UOV) 978-84-9749-774-9 (UDC electrónico)