Aprendizaje de comportamientos de navegación en planificadores RRT*

Pérez-Higueras, NoéMerino, LuisCaballero, Fernando2022-02-072022-02-072016Pérez-Higueras, H., Merino, L., Caballero, F. Aprendizaje de comportamientos de navegación en planificadores RRT*. 7, 8 y 9 de septiembre de 2016, Madrid (pp. 724-731). DOI capítulo: https://doi.org/10.17979/spudc.9788497498081.0724 DOI libro: https://doi.org/10.17979/spudc.9788497498081978-84-617-4298-1 (UCM)978-84-9749-808-1 (UDC electrónico)http://hdl.handle.net/2183/29661[Resumen] Este trabajo presenta un algoritmo para el aprendizaje de comportamientos de navegación a partir de demostraciones usando árboles de exploración aleatoria óptimos (RRT*) como planificador de caminos. El algoritmo de aprendizaje combina las técnicas de Inverse Reinforcement Learning (IRL) y RRT* para aprender los pesos de la función de coste a partir de trayectorias de demostración. Esta función de coste puede ser usada más tarde en el algoritmo RRT* permitiendo al robot reproducir el comportamiento deseado en distintos escenarios. El método ha sido probado primero en simulación y luego usando trayectorias reales de un robot en el laboratorio.spaAtribución-NoComercial-CompartirIgual 4.0 Internacionalhttps://creativecommons.org/licenses/by-nc-sa/4.0/deed.esComportamientos de navegaciónNavegación socialÁrboles de exploración aleatoriaAlgoritmo RRT*Inverse reinforcement learningPlanificación óptima de caminosAprendizaje de comportamientos de navegación en planificadores RRT*conference outputopen access10.17979/spudc.9788497498081.0724