Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico

Díaz-Iza, Henry; Armesto, Leopoldo; Sala, Antonio

dc.contributor.author	Díaz-Iza, Henry
dc.contributor.author	Armesto, Leopoldo
dc.contributor.author	Sala, Antonio
dc.date.accessioned	2020-06-19T08:22:51Z
dc.date.available	2020-06-19T08:22:51Z
dc.date.issued	2017
dc.identifier.citation	Díaz Iza, H., Armesto Angel, L., Sala, A. I Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico. En Actas de las XXXVIII Jornadas de Automática, Gijón, 6-8 de Septiembre de 2017 (pp.360-367). DOI capítulo: https://doi.org/10.17979/spudc.9788497497749.0360 DOI libro: : https://doi.org/10.17979/spudc.9788497497749	es_ES
dc.identifier.isbn	978-84-16664-74-0 (UOV)
dc.identifier.isbn	978-84-9749-774-9 (UDC electrónico)
dc.identifier.uri	http://hdl.handle.net/2183/25746
dc.description.abstract	[Resumen] El aprendizaje por refuerzo es una técnica que se utiliza en la búsqueda de soluciones en sistemas de decisión secuencial. Una gran parte de los algoritmos usados en el aprendizaje por refuerzo se fundamentan en la programación dinámica, se considera que el aprendizaje por refuerzo es una extensión de la programación dinámica que proporciona soluciones sin la necesidad de conocer el modelo de comportamiento del sistema. Estas técnicas combinan algunas características del control óptimo y control adaptativo para el diseño de controladores realimentados. Se describen los algoritmos básicos del aprendizaje por refuerzo para la implementación de soluciones en sistemas discretos deterministas. Finalmente, se realizaron pruebas prácticas de la implementación del algoritmo de aprendizaje Q-learning en un péndulo de un grado de libertad, con el objetivo de verificar si el algoritmo de aprendizaje converge y proporciona un controlador estabilizante.	es_ES
dc.description.sponsorship	Ministero de Economía; DPI2016-81002-R	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Servicio de Publicaciones de la Universidad de Oviedo	es_ES
dc.relation.hasversion	http://hdl.handle.net/10651/46515
dc.relation.uri	https://doi.org/10.17979/spudc.9788497497749.0360	es_ES
dc.rights	Atribución-NoComercial-CompartirIgual 4.0 España	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/4.0/es/	*
dc.subject	Aprendizaje por refuerzo	es_ES
dc.subject	QLearning	es_ES
dc.subject	Control óptimo	es_ES
dc.subject	Control adaptativo óptimo	es_ES
dc.subject	Programación dinámica	es_ES
dc.title	Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico	es_ES
dc.type	info:eu-repo/semantics/conferenceObject	es_ES
dc.type	info:eu-repo/semantics/conferenceObject	es_ES
dc.rights.access	info:eu-repo/semantics/openAccess	es_ES
UDC.startPage	360	es_ES
UDC.endPage	367	es_ES
UDC.conferenceTitle	XXXVIII Jornadas de Automática	es_ES

Ficheiros no ítem

Nome:: license_rdf
Tamaño:: 1.5Kb
Formato:: application/rdf+xml

Ver/abrir

Nome:: Diaz_Iza_Henry_2017_Aprendizaj ...
Tamaño:: 799.2Kb
Formato:: PDF

Ver/abrir

Este ítem aparece na(s) seguinte(s) colección(s)

Jornadas de Automática (38ª. 2017. Gijón) [144]

Mostrar o rexistro simple do ítem