Mostrar o rexistro simple do ítem
Aprendizaje de comportamientos de navegación en planificadores RRT*
dc.contributor.author | Pérez-Higueras, Noé | |
dc.contributor.author | Merino, Luis | |
dc.contributor.author | Caballero, Fernando | |
dc.date.accessioned | 2022-02-07T10:42:41Z | |
dc.date.available | 2022-02-07T10:42:41Z | |
dc.date.issued | 2016 | |
dc.identifier.citation | Pérez-Higueras, H., Merino, L., Caballero, F. Aprendizaje de comportamientos de navegación en planificadores RRT*. 7, 8 y 9 de septiembre de 2016, Madrid (pp. 724-731). DOI capítulo: https://doi.org/10.17979/spudc.9788497498081.0724 DOI libro: https://doi.org/10.17979/spudc.9788497498081 | es_ES |
dc.identifier.isbn | 978-84-617-4298-1 (UCM) | |
dc.identifier.isbn | 978-84-9749-808-1 (UDC electrónico) | |
dc.identifier.uri | http://hdl.handle.net/2183/29661 | |
dc.description.abstract | [Resumen] Este trabajo presenta un algoritmo para el aprendizaje de comportamientos de navegación a partir de demostraciones usando árboles de exploración aleatoria óptimos (RRT*) como planificador de caminos. El algoritmo de aprendizaje combina las técnicas de Inverse Reinforcement Learning (IRL) y RRT* para aprender los pesos de la función de coste a partir de trayectorias de demostración. Esta función de coste puede ser usada más tarde en el algoritmo RRT* permitiendo al robot reproducir el comportamiento deseado en distintos escenarios. El método ha sido probado primero en simulación y luego usando trayectorias reales de un robot en el laboratorio. | es_ES |
dc.description.uri | https://doi.org/10.17979/spudc.9788497498081 | |
dc.language.iso | spa | es_ES |
dc.publisher | Comité Español de Automática | es_ES |
dc.relation.uri | https://doi.org/10.17979/spudc.9788497498081.0724 | es_ES |
dc.rights | Atribución-NoComercial-CompartirIgual 4.0 Internacional | es_ES |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es | * |
dc.subject | Comportamientos de navegación | es_ES |
dc.subject | Navegación social | es_ES |
dc.subject | Árboles de exploración aleatoria | es_ES |
dc.subject | Algoritmo RRT* | es_ES |
dc.subject | Inverse Reinforcement Learning | es_ES |
dc.subject | Planificación óptima de caminos | es_ES |
dc.title | Aprendizaje de comportamientos de navegación en planificadores RRT* | es_ES |
dc.type | info:eu-repo/semantics/conferenceObject | es_ES |
dc.rights.access | info:eu-repo/semantics/openAccess | es_ES |
UDC.startPage | 724 | es_ES |
UDC.endPage | 731 | es_ES |
dc.identifier.doi | 10.17979/spudc.9788497498081.0724 | |
UDC.conferenceTitle | XXXVII Jornadas de Automática | es_ES |