Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico

Use este enlace para citar
http://hdl.handle.net/2183/29659
Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-CompartirIgual 4.0 Internacional
Colecciones
Metadatos
Mostrar el registro completo del ítemTítulo
Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánicoFecha
2016Cita bibliográfica
Pastor, J.M., Díaz, H., Armesto, L., Sala, A. Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico. 7, 8 y 9 de septiembre de 2016, Madrid (pp. 710-717). DOI capítulo: https://doi.org/10.17979/spudc.9788497498081.0710 DOI libro: https://doi.org/10.17979/spudc.9788497498081
Resumen
[Resumen] La búsqueda de políticas (Policy Search) es un subcampo en el aprendizaje por refuerzo altamente extendido en el ámbito de la automática, ya que sus técnicas permiten trabajar con espacios de estados y acción de orden elevado. Este trabajo se centra en los algoritmos existentes de búsqueda de políticas con modelo-libre basados en métodos por gradiente, aplicándolos tanto en sistemas simulados lineales sencillos como a un sistema electromecánico real formado por un p endulo de 1DoF. El propósito de este estudio es analizar comparativamente sus principales características así como ventajas frente a otros, a la hora de ser aplicados en sistemas más complejos.
Palabras clave
Aprendizaje por refuerzo
Búsqueda de políticas
Control óptimo
Gradiente
Gradiente natural
Búsqueda de políticas
Control óptimo
Gradiente
Gradiente natural
Versión del editor
Derechos
Atribución-NoComercial-CompartirIgual 4.0 Internacional
ISBN
978-84-617-4298-1 (UCM) 978-84-9749-808-1 (UDC electrónico)