Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico

UDC.coleccionPublicacións UDCes_ES
UDC.conferenceTitleXXXVII Jornadas de Automáticaes_ES
UDC.endPage717es_ES
UDC.startPage710es_ES
dc.contributor.authorPastor, José Manuel
dc.contributor.authorDíaz-Iza, Henry
dc.contributor.authorArmesto, Leopoldo
dc.contributor.authorSala, Antonio
dc.date.accessioned2022-02-07T10:40:37Z
dc.date.available2022-02-07T10:40:37Z
dc.date.issued2016
dc.description.abstract[Resumen] La búsqueda de políticas (Policy Search) es un subcampo en el aprendizaje por refuerzo altamente extendido en el ámbito de la automática, ya que sus técnicas permiten trabajar con espacios de estados y acción de orden elevado. Este trabajo se centra en los algoritmos existentes de búsqueda de políticas con modelo-libre basados en métodos por gradiente, aplicándolos tanto en sistemas simulados lineales sencillos como a un sistema electromecánico real formado por un p endulo de 1DoF. El propósito de este estudio es analizar comparativamente sus principales características así como ventajas frente a otros, a la hora de ser aplicados en sistemas más complejos.es_ES
dc.description.sponsorshipLos autores agradecen al Gobierno de España (DPI2011-27845-C02-01 y DPI2013-42302-R9), a la Generalitat Valenciana (PROMETEOII/2013/004) y al Gobierno de Ecuador (Beca SENESCYT) la financiación recibida para llevar a cabo la investigación aquí presentadaes_ES
dc.description.sponsorshipGeneralitat Valenciana; PROMETEOII/2013/004es_ES
dc.description.urihttps://doi.org/10.17979/spudc.9788497498081
dc.identifier.citationPastor, J.M., Díaz, H., Armesto, L., Sala, A. Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico. 7, 8 y 9 de septiembre de 2016, Madrid (pp. 710-717). DOI capítulo: https://doi.org/10.17979/spudc.9788497498081.0710 DOI libro: https://doi.org/10.17979/spudc.9788497498081es_ES
dc.identifier.doi10.17979/spudc.9788497498081.0710
dc.identifier.isbn978-84-617-4298-1 (UCM)
dc.identifier.isbn978-84-9749-808-1 (UDC electrónico)
dc.identifier.urihttp://hdl.handle.net/2183/29659
dc.language.isospaes_ES
dc.publisherComité Español de Automáticaes_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/MINECO/Plan Nacional de I+D+i 2008-2011/DPI2011-27845-C02-01/ES/ESTIMACION, OPTIMIZACION Y CONTROL MULTIVARIABLE EN SISTEMAS MULTI- MODELO/
dc.relation.projectIDinfo:eu-repo/grantAgreement/MINECO/Plan Estatal de Investigación Científica y Técnica y de Innovación 2013-2016/DPI2013-42302-R9/ES/SISTEMAS DE CONDUCCION SEGURA DE VEHICULOS DE TRANSPORTE DE PASAJEROS Y MATERIALES CON ASISTENCIA HAPTICA/AUDIOVISUAL E INTERFACES BIOMEDICAS/
dc.relation.urihttps://doi.org/10.17979/spudc.9788497498081.0710es_ES
dc.rightsAtribución-NoComercial-CompartirIgual 4.0 Internacionales_ES
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/deed.es*
dc.subjectAprendizaje por refuerzoes_ES
dc.subjectBúsqueda de políticases_ES
dc.subjectControl óptimoes_ES
dc.subjectGradientees_ES
dc.subjectGradiente naturales_ES
dc.titleAprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánicoes_ES
dc.typeconference outputes_ES
dspace.entity.typePublication

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
2016_Pastor_Jose_Manuel_Aprendizaje_por_refuerzo_con_busqueda_de_politicas.pdf
Size:
1.8 MB
Format:
Adobe Portable Document Format
Description: