Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico
| UDC.coleccion | Publicacións UDC | es_ES |
| UDC.conferenceTitle | XXXVII Jornadas de Automática | es_ES |
| UDC.endPage | 717 | es_ES |
| UDC.startPage | 710 | es_ES |
| dc.contributor.author | Pastor, José Manuel | |
| dc.contributor.author | Díaz-Iza, Henry | |
| dc.contributor.author | Armesto, Leopoldo | |
| dc.contributor.author | Sala, Antonio | |
| dc.date.accessioned | 2022-02-07T10:40:37Z | |
| dc.date.available | 2022-02-07T10:40:37Z | |
| dc.date.issued | 2016 | |
| dc.description.abstract | [Resumen] La búsqueda de políticas (Policy Search) es un subcampo en el aprendizaje por refuerzo altamente extendido en el ámbito de la automática, ya que sus técnicas permiten trabajar con espacios de estados y acción de orden elevado. Este trabajo se centra en los algoritmos existentes de búsqueda de políticas con modelo-libre basados en métodos por gradiente, aplicándolos tanto en sistemas simulados lineales sencillos como a un sistema electromecánico real formado por un p endulo de 1DoF. El propósito de este estudio es analizar comparativamente sus principales características así como ventajas frente a otros, a la hora de ser aplicados en sistemas más complejos. | es_ES |
| dc.description.sponsorship | Los autores agradecen al Gobierno de España (DPI2011-27845-C02-01 y DPI2013-42302-R9), a la Generalitat Valenciana (PROMETEOII/2013/004) y al Gobierno de Ecuador (Beca SENESCYT) la financiación recibida para llevar a cabo la investigación aquí presentada | es_ES |
| dc.description.sponsorship | Generalitat Valenciana; PROMETEOII/2013/004 | es_ES |
| dc.description.uri | https://doi.org/10.17979/spudc.9788497498081 | |
| dc.identifier.citation | Pastor, J.M., Díaz, H., Armesto, L., Sala, A. Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico. 7, 8 y 9 de septiembre de 2016, Madrid (pp. 710-717). DOI capítulo: https://doi.org/10.17979/spudc.9788497498081.0710 DOI libro: https://doi.org/10.17979/spudc.9788497498081 | es_ES |
| dc.identifier.doi | 10.17979/spudc.9788497498081.0710 | |
| dc.identifier.isbn | 978-84-617-4298-1 (UCM) | |
| dc.identifier.isbn | 978-84-9749-808-1 (UDC electrónico) | |
| dc.identifier.uri | http://hdl.handle.net/2183/29659 | |
| dc.language.iso | spa | es_ES |
| dc.publisher | Comité Español de Automática | es_ES |
| dc.relation.projectID | info:eu-repo/grantAgreement/MINECO/Plan Nacional de I+D+i 2008-2011/DPI2011-27845-C02-01/ES/ESTIMACION, OPTIMIZACION Y CONTROL MULTIVARIABLE EN SISTEMAS MULTI- MODELO/ | |
| dc.relation.projectID | info:eu-repo/grantAgreement/MINECO/Plan Estatal de Investigación Científica y Técnica y de Innovación 2013-2016/DPI2013-42302-R9/ES/SISTEMAS DE CONDUCCION SEGURA DE VEHICULOS DE TRANSPORTE DE PASAJEROS Y MATERIALES CON ASISTENCIA HAPTICA/AUDIOVISUAL E INTERFACES BIOMEDICAS/ | |
| dc.relation.uri | https://doi.org/10.17979/spudc.9788497498081.0710 | es_ES |
| dc.rights | Atribución-NoComercial-CompartirIgual 4.0 Internacional | es_ES |
| dc.rights.accessRights | open access | es_ES |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es | * |
| dc.subject | Aprendizaje por refuerzo | es_ES |
| dc.subject | Búsqueda de políticas | es_ES |
| dc.subject | Control óptimo | es_ES |
| dc.subject | Gradiente | es_ES |
| dc.subject | Gradiente natural | es_ES |
| dc.title | Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico | es_ES |
| dc.type | conference output | es_ES |
| dspace.entity.type | Publication |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- 2016_Pastor_Jose_Manuel_Aprendizaje_por_refuerzo_con_busqueda_de_politicas.pdf
- Size:
- 1.8 MB
- Format:
- Adobe Portable Document Format
- Description:

