Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico

Díaz-Iza, Henry; Armesto, Leopoldo; Sala, Antonio

Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico

UDC.coleccion	Publicacións UDC	es_ES
UDC.conferenceTitle	XXXVIII Jornadas de Automática	es_ES
UDC.endPage	367	es_ES
UDC.startPage	360	es_ES
dc.contributor.author	Díaz-Iza, Henry
dc.contributor.author	Armesto, Leopoldo
dc.contributor.author	Sala, Antonio
dc.date.accessioned	2020-06-19T08:22:51Z
dc.date.available	2020-06-19T08:22:51Z
dc.date.issued	2017
dc.description.abstract	[Resumen] El aprendizaje por refuerzo es una técnica que se utiliza en la búsqueda de soluciones en sistemas de decisión secuencial. Una gran parte de los algoritmos usados en el aprendizaje por refuerzo se fundamentan en la programación dinámica, se considera que el aprendizaje por refuerzo es una extensión de la programación dinámica que proporciona soluciones sin la necesidad de conocer el modelo de comportamiento del sistema. Estas técnicas combinan algunas características del control óptimo y control adaptativo para el diseño de controladores realimentados. Se describen los algoritmos básicos del aprendizaje por refuerzo para la implementación de soluciones en sistemas discretos deterministas. Finalmente, se realizaron pruebas prácticas de la implementación del algoritmo de aprendizaje Q-learning en un péndulo de un grado de libertad, con el objetivo de verificar si el algoritmo de aprendizaje converge y proporciona un controlador estabilizante.	es_ES
dc.description.sponsorship	Ministero de Economía; DPI2016-81002-R	es_ES
dc.identifier.citation	Díaz Iza, H., Armesto Angel, L., Sala, A. I Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico. En Actas de las XXXVIII Jornadas de Automática, Gijón, 6-8 de Septiembre de 2017 (pp.360-367). DOI capítulo: https://doi.org/10.17979/spudc.9788497497749.0360 DOI libro: : https://doi.org/10.17979/spudc.9788497497749	es_ES
dc.identifier.isbn	978-84-16664-74-0 (UOV)
dc.identifier.isbn	978-84-9749-774-9 (UDC electrónico)
dc.identifier.uri	http://hdl.handle.net/2183/25746
dc.language.iso	spa	es_ES
dc.publisher	Servicio de Publicaciones de la Universidad de Oviedo	es_ES
dc.relation.hasversion	http://hdl.handle.net/10651/46515
dc.relation.uri	https://doi.org/10.17979/spudc.9788497497749.0360	es_ES
dc.rights	Atribución-NoComercial-CompartirIgual 4.0 España	es_ES
dc.rights.accessRights	open access	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/4.0/es/	*
dc.subject	Aprendizaje por refuerzo	es_ES
dc.subject	QLearning	es_ES
dc.subject	Control óptimo	es_ES
dc.subject	Control adaptativo óptimo	es_ES
dc.subject	Programación dinámica	es_ES
dc.title	Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico	es_ES
dc.type	conference output	es_ES
dspace.entity.type	Publication

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Diaz_Iza_Henry_2017_Aprendizaje_por_refuerzo_para_sistemas_lineales_discretos_con_dinamica_desconocida.pdf
Size:: 799.26 KB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Jornadas de Automática (38ª. 2017. Gijón)