Skip navigation
  •  Home
  • UDC 
    • Getting started
    • RUC Policies
    • FAQ
    • FAQ on Copyright
    • More information at INFOguias UDC
  • Browse 
    • Communities
    • Browse by:
    • Issue Date
    • Author
    • Title
    • Subject
  • Help
    • español
    • Gallegan
    • English
  • Login
  •  English 
    • Español
    • Galego
    • English
  
View Item 
  •   DSpace Home
  • Escola Politécnica de Enxeñaría de Ferrol
  • Traballos académicos (EPEF)
  • View Item
  •   DSpace Home
  • Escola Politécnica de Enxeñaría de Ferrol
  • Traballos académicos (EPEF)
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Estudio del aprendizaje en tiempo real de modelos de utilidad en robótica cognitiva

Thumbnail
View/Open
FernandezdelaTorre_Alvaro_TFM_2019.pdf (2.289Mb)
Use this link to cite
http://hdl.handle.net/2183/24118
Collections
  • Traballos académicos (EPEF) [444]
Metadata
Show full item record
Title
Estudio del aprendizaje en tiempo real de modelos de utilidad en robótica cognitiva
Author(s)
Fernández de la Torre, Álvaro
Directors
Bellas, Francisco
Romero Montero, Alejandro
Date
2019
Center/Dept./Entity
Universidade da Coruña. Escola Politécnica Superior
Description
Traballo fin de mestrado (UDC.EPS). Enxeñaría industrial. Curso 2018/2019
Abstract
[Resumen] Este Trabajo Fin de Máster (TFM) se enmarca dentro del proyecto europeo de investigación DREAM que se lleva a cabo en el Grupo Integrado de Ingeniería (GII) de la UDC. En dicho proyecto, el objetivo es dotar a los robots autónomos de modelos cognitivos inspirados en el ser desarrollo intelectual de los humanos, de modo que puedan aprender por sí mismos en entornos reales a lo largo de grandes periodos de tiempo. Uno de los componentes fundamentales de este proyecto es el sistema de motivación de los robots, cuya principal función es la obtención automática de modelos de utilidad que permitan establecer las recompensas esperadas en los diferentes estados sensoriales. Hasta el momento, en el marco del DREAM [1] se ha abordado el aprendizaje de estos modelos utilizando representaciones unidimensionales (denominadas SURs) y multidimensionales (denominadas Value Functions, VF) de manera aislada, mostrando que cada una de ellas es adecuada para cierto tipo de problemas. En este TFM se busca desarrollar un esquema operativo de aprendizaje on-line que gestione el uso de estos dos tipos de modelos. Para ello, se utilizará un experimento representativo del campo de la robótica cognitiva en un entorno simulado.
 
[Resumo] Este Traballo Fin de Máster (TFM) enmarcase dentro do proxecto europeo de investigación DREAM que se leva a cabo no Grupo Integrado de Enxeñaría (GIE) de la UDC. En dito proxecto, obxectivo fundamental é dotar aos robots autónomos de modelos congnitivos inspirados no ser desenvolto intelectual dos humáns, de modo que poidan aprender por si mesmos en entornos reais ao longo de grandes periodos de tempo. Un dos compoñentes fundamentais de este proxecto é o sistema de motivación dos robots, cuxa principal función é a obtención automática de modelos de utilidade que permitan establecer as recompensas esperadas nos diferentes estados sensoriais. Ata o momento, no marco do DREAM abordáronse o aprendizaxe destes modelos utilizando representacións unidimensionais (denominadas SURs) e multidimensionais (denominadas Value Funtions, VF) de maneira illada, mostrando que cada unha de elas é adecuada para certo tipo de problemas. Neste TFM buscase desenvolver un esquema operativo de aprendizaxe on-line que xestione o uso destes dous tipos de modelos. Para isto, utilizarase un experimento representativo no campo da robótica cognitiva nunha contorna simulada.
 
[Abstract] This Master's Degree Project is part of the European project DREAM that is carried out in the Integrated Engineering Group for Engineering research of the UDC. In this project, the objective is to provide autonomous robots with cognitive models inspired by the intellectual development of humans, so they can learn for themselves in real environments over long periods of time. One of the fundamental components of this project is the robot motivation system, which main function is the automatic obtaining of utility models that allow to establish the expected rewards in the different sensory states. So far, within the framework of DREAM [1] the learning of these models has been approached using one-dimensional (called SURs) and multidimensional (called Value Functions, VF) representations in isolation, showing that each of them is suitable for a certain kind of problems This project aims to develop an operational on-line learning scheme that manages the use of these two types of models. To do this, a representative cognitive robotics experiment will be implemented and studied using a simulated environment.
 
Keywords
Robótica
Robots
 
Rights
Os titulares dos dereitos de propiedade intelectual autorizan a visualización do contido deste traballo a través de Internet, así como a súa reproducción, gravación en soporte informático ou impresión para o seu uso privado e/ou con fins de estudo e de investigación. En nengún caso se permite o uso lucrativo deste documento. Estos dereitos afectan tanto ó resumo do traballo como o seu contido Los titulares de los derechos de propiedad intelectual autorizan la visualización del contenido de este trabajo a través de Internet, así como su repoducción, grabación en soporte informático o impresión para su uso privado o con fines de investigación. En ningún caso se permite el uso lucrativo de este documento. Estos derechos afectan tanto al resumen del trabajo como a su contenido

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsResearch GroupAcademic DegreeThis CollectionBy Issue DateAuthorsTitlesSubjectsResearch GroupAcademic Degree

My Account

LoginRegister

Statistics

View Usage Statistics
Sherpa
OpenArchives
OAIster
Scholar Google
UNIVERSIDADE DA CORUÑA. Servizo de Biblioteca.    DSpace Software Copyright © 2002-2013 Duraspace - Send Feedback