Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico

Pastor, José Manuel; Díaz-Iza, Henry; Armesto, Leopoldo; Sala, Antonio

Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico

UDC.coleccion	Publicacións UDC	es_ES
UDC.conferenceTitle	XXXVII Jornadas de Automática	es_ES
UDC.endPage	717	es_ES
UDC.startPage	710	es_ES
dc.contributor.author	Pastor, José Manuel
dc.contributor.author	Díaz-Iza, Henry
dc.contributor.author	Armesto, Leopoldo
dc.contributor.author	Sala, Antonio
dc.date.accessioned	2022-02-07T10:40:37Z
dc.date.available	2022-02-07T10:40:37Z
dc.date.issued	2016
dc.description.abstract	[Resumen] La búsqueda de políticas (Policy Search) es un subcampo en el aprendizaje por refuerzo altamente extendido en el ámbito de la automática, ya que sus técnicas permiten trabajar con espacios de estados y acción de orden elevado. Este trabajo se centra en los algoritmos existentes de búsqueda de políticas con modelo-libre basados en métodos por gradiente, aplicándolos tanto en sistemas simulados lineales sencillos como a un sistema electromecánico real formado por un p endulo de 1DoF. El propósito de este estudio es analizar comparativamente sus principales características así como ventajas frente a otros, a la hora de ser aplicados en sistemas más complejos.	es_ES
dc.description.sponsorship	Los autores agradecen al Gobierno de España (DPI2011-27845-C02-01 y DPI2013-42302-R9), a la Generalitat Valenciana (PROMETEOII/2013/004) y al Gobierno de Ecuador (Beca SENESCYT) la financiación recibida para llevar a cabo la investigación aquí presentada	es_ES
dc.description.sponsorship	Generalitat Valenciana; PROMETEOII/2013/004	es_ES
dc.description.uri	https://doi.org/10.17979/spudc.9788497498081
dc.identifier.citation	Pastor, J.M., Díaz, H., Armesto, L., Sala, A. Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico. 7, 8 y 9 de septiembre de 2016, Madrid (pp. 710-717). DOI capítulo: https://doi.org/10.17979/spudc.9788497498081.0710 DOI libro: https://doi.org/10.17979/spudc.9788497498081	es_ES
dc.identifier.doi	10.17979/spudc.9788497498081.0710
dc.identifier.isbn	978-84-617-4298-1 (UCM)
dc.identifier.isbn	978-84-9749-808-1 (UDC electrónico)
dc.identifier.uri	http://hdl.handle.net/2183/29659
dc.language.iso	spa	es_ES
dc.publisher	Comité Español de Automática	es_ES
dc.relation.projectID	info:eu-repo/grantAgreement/MINECO/Plan Nacional de I+D+i 2008-2011/DPI2011-27845-C02-01/ES/ESTIMACION, OPTIMIZACION Y CONTROL MULTIVARIABLE EN SISTEMAS MULTI- MODELO/
dc.relation.projectID	info:eu-repo/grantAgreement/MINECO/Plan Estatal de Investigación Científica y Técnica y de Innovación 2013-2016/DPI2013-42302-R9/ES/SISTEMAS DE CONDUCCION SEGURA DE VEHICULOS DE TRANSPORTE DE PASAJEROS Y MATERIALES CON ASISTENCIA HAPTICA/AUDIOVISUAL E INTERFACES BIOMEDICAS/
dc.relation.uri	https://doi.org/10.17979/spudc.9788497498081.0710	es_ES
dc.rights	Atribución-NoComercial-CompartirIgual 4.0 Internacional	es_ES
dc.rights.accessRights	open access	es_ES
dc.rights.uri	https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es	*
dc.subject	Aprendizaje por refuerzo	es_ES
dc.subject	Búsqueda de políticas	es_ES
dc.subject	Control óptimo	es_ES
dc.subject	Gradiente	es_ES
dc.subject	Gradiente natural	es_ES
dc.title	Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico	es_ES
dc.type	conference output	es_ES
dspace.entity.type	Publication

Files

Original bundle

Now showing 1 - 1 of 1

Name:: 2016_Pastor_Jose_Manuel_Aprendizaje_por_refuerzo_con_busqueda_de_politicas.pdf
Size:: 1.8 MB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Jornadas de Automática (37ª. 2016. Madrid)