VIDEO RELACIONADO: Perros robots detectan amenazas en la guerra - 00:50
Un experto en robótica de la Universidad Johns Hopkins decidió seguir la lógica usada con sus perros y optó por usar el refuerzo positivo en un robot, solo que en esta oportunidad no recibe golosinas por hacer la tarea encomendada.
Andrew Hundt junto a un equipo de científicos informáticos decidió aplicar una técnica de entrenamiento utilizada para enseñar a los perros a sentarse y quedarse, pero en esta oportunidad le mostraron a un robot llamado Spot cómo aprender nuevos trucos.
Lee también: Estos microrobots pueden viajar por el colon para administrar medicamentos
A Spot le ofrecen un incentivo que consiste en un sistema de puntuación. Es decir, lo premian con una serie de puntos numéricos según la correcta ejecución de una tarea asignada.
“La pregunta aquí era cómo conseguimos que el robot aprenda una habilidad (…) He tenido perros, así que sé que las recompensas funcionan y esa fue la inspiración de cómo diseñé el algoritmo de aprendizaje“, manifestó Hundt a través de un comunicado en el sitio web de la universidad.
Con este método, Spot aprendió en días lo que usualmente toma un mes. En este caso se le enseño a apilar bloques y rápidamente aprendió que los comportamientos correctos para apilar ganaban puntos altos, versus los incorrectos que no ganaban nada.
“El robot quiere la puntuación más alta (…) Aprende rápidamente el comportamiento correcto para obtener la mejor recompensa. De hecho, el robot solía necesitar un mes de práctica para lograr el 100% de precisión. Pudimos hacerlo en dos días”, añadió el experto.
Lee también: Crean delfines robots que reemplazarían a animales que se encuentran en parques acuáticos
El equipo espera que en el futuro los robots puedan realizar tareas complejas en el mundo real, tales como ayudar en el cuidado de los ancianos y en procedimientos médicos.
“Actualmente no sabemos cómo programar tareas como esa (…) Pero un trabajo como este nos muestra que es prometedora la idea de que los robots pueden aprender a realizar estas tareas del mundo real de forma segura y eficiente”, concluyó Gregory D. Hager, quien también participó de este estudio.
Deja tu comentario