Skip navigation
  •  Inicio
  • UDC 
    • Cómo depositar
    • Políticas do RUC
    • FAQ
    • Dereitos de Autor
    • Máis información en INFOguías UDC
  • Percorrer 
    • Comunidades
    • Buscar por:
    • Data de publicación
    • Autor
    • Título
    • Materia
  • Axuda
    • español
    • Gallegan
    • English
  • Acceder
  •  Galego 
    • Español
    • Galego
    • English
  
Ver ítem 
  •   RUC
  • Publicacións UDC
  • Congresos e cursos UDC
  • Jornadas de Automática
  • Jornadas de Automática (37ª. 2016. Madrid)
  • Ver ítem
  •   RUC
  • Publicacións UDC
  • Congresos e cursos UDC
  • Jornadas de Automática
  • Jornadas de Automática (37ª. 2016. Madrid)
  • Ver ítem
JavaScript is disabled for your browser. Some features of this site may not work without it.

Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico

Thumbnail
Ver/abrir
2016_Pastor_Jose_Manuel_Aprendizaje_por_refuerzo_con_busqueda_de_politicas.pdf (1.800Mb)
Use este enlace para citar
http://hdl.handle.net/2183/29659
Atribución-NoComercial-CompartirIgual 4.0 Internacional
A non ser que se indique outra cousa, a licenza do ítem descríbese como Atribución-NoComercial-CompartirIgual 4.0 Internacional
Coleccións
  • Jornadas de Automática (37ª. 2016. Madrid) [173]
Metadatos
Mostrar o rexistro completo do ítem
Título
Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico
Autor(es)
Pastor, José Manuel
Díaz-Iza, Henry
Armesto, Leopoldo
Sala, Antonio
Data
2016
Cita bibliográfica
Pastor, J.M., Díaz, H., Armesto, L., Sala, A. Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico. 7, 8 y 9 de septiembre de 2016, Madrid (pp. 710-717). DOI capítulo: https://doi.org/10.17979/spudc.9788497498081.0710 DOI libro: https://doi.org/10.17979/spudc.9788497498081
Resumo
[Resumen] La búsqueda de políticas (Policy Search) es un subcampo en el aprendizaje por refuerzo altamente extendido en el ámbito de la automática, ya que sus técnicas permiten trabajar con espacios de estados y acción de orden elevado. Este trabajo se centra en los algoritmos existentes de búsqueda de políticas con modelo-libre basados en métodos por gradiente, aplicándolos tanto en sistemas simulados lineales sencillos como a un sistema electromecánico real formado por un p endulo de 1DoF. El propósito de este estudio es analizar comparativamente sus principales características así como ventajas frente a otros, a la hora de ser aplicados en sistemas más complejos.
Palabras chave
Aprendizaje por refuerzo
Búsqueda de políticas
Control óptimo
Gradiente
Gradiente natural
 
Versión do editor
https://doi.org/10.17979/spudc.9788497498081.0710
Dereitos
Atribución-NoComercial-CompartirIgual 4.0 Internacional
ISBN
978-84-617-4298-1 (UCM)
 
978-84-9749-808-1 (UDC electrónico)
 
Recurso relacionado
https://doi.org/10.17979/spudc.9788497498081

Listar

Todo RUCComunidades e colecciónsPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulaciónEsta colecciónPor data de publicaciónAutoresTítulosMateriasGrupo de InvestigaciónTitulación

A miña conta

AccederRexistro

Estatísticas

Ver Estatísticas de uso
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Suxestións