Mostrar o rexistro simple do ítem

dc.contributor.authorDíaz-Iza, Henry
dc.contributor.authorArmesto, Leopoldo
dc.contributor.authorSala, Antonio
dc.date.accessioned2020-06-19T08:22:51Z
dc.date.available2020-06-19T08:22:51Z
dc.date.issued2017
dc.identifier.citationDíaz Iza, H., Armesto Angel, L., Sala, A. I Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico. En Actas de las XXXVIII Jornadas de Automática, Gijón, 6-8 de Septiembre de 2017 (pp.360-367). DOI capítulo: https://doi.org/10.17979/spudc.9788497497749.0360 DOI libro: : https://doi.org/10.17979/spudc.9788497497749es_ES
dc.identifier.isbn978-84-16664-74-0 (UOV)
dc.identifier.isbn978-84-9749-774-9 (UDC electrónico)
dc.identifier.urihttp://hdl.handle.net/2183/25746
dc.description.abstract[Resumen] El aprendizaje por refuerzo es una técnica que se utiliza en la búsqueda de soluciones en sistemas de decisión secuencial. Una gran parte de los algoritmos usados en el aprendizaje por refuerzo se fundamentan en la programación dinámica, se considera que el aprendizaje por refuerzo es una extensión de la programación dinámica que proporciona soluciones sin la necesidad de conocer el modelo de comportamiento del sistema. Estas técnicas combinan algunas características del control óptimo y control adaptativo para el diseño de controladores realimentados. Se describen los algoritmos básicos del aprendizaje por refuerzo para la implementación de soluciones en sistemas discretos deterministas. Finalmente, se realizaron pruebas prácticas de la implementación del algoritmo de aprendizaje Q-learning en un péndulo de un grado de libertad, con el objetivo de verificar si el algoritmo de aprendizaje converge y proporciona un controlador estabilizante.es_ES
dc.description.sponsorshipMinistero de Economía; DPI2016-81002-Res_ES
dc.language.isospaes_ES
dc.publisherServicio de Publicaciones de la Universidad de Oviedoes_ES
dc.relation.hasversionhttp://hdl.handle.net/10651/46515
dc.relation.urihttps://doi.org/10.17979/spudc.9788497497749.0360es_ES
dc.rightsAtribución-NoComercial-CompartirIgual 4.0 Españaes_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/es/*
dc.subjectAprendizaje por refuerzoes_ES
dc.subjectQLearninges_ES
dc.subjectControl óptimoes_ES
dc.subjectControl adaptativo óptimoes_ES
dc.subjectProgramación dinámicaes_ES
dc.titleAprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánicoes_ES
dc.typeinfo:eu-repo/semantics/conferenceObjectes_ES
dc.typeinfo:eu-repo/semantics/conferenceObjectes_ES
dc.rights.accessinfo:eu-repo/semantics/openAccesses_ES
UDC.startPage360es_ES
UDC.endPage367es_ES
UDC.conferenceTitleXXXVIII Jornadas de Automáticaes_ES


Ficheiros no ítem

Thumbnail
Thumbnail

Este ítem aparece na(s) seguinte(s) colección(s)

Mostrar o rexistro simple do ítem