Investigadores de Google Robotics desarrollan un robot capaz de aprender a caminar por si solo, el concepto de robots autónomos de aprendizaje podría estar más cerca de la realidad. El método implica construir sobre la base de la investigación previa realizada hace un año donde el equipo descubrió cómo hacer que un robot aprendiera en el mundo real.
Empleando el aprendizaje de refuerzo, un tipo de aprendizaje por máquina que toma prestados conceptos usados en psicología y evita la intervención humana innecesaria, lo cual es un sello distintivo de los algoritmos de aprendizaje de refuerzo existentes. El método de prueba y error requiere de la ayuda humana cada vez que se cae o sale de su entorno de entrenamiento.
El nuevo estudio tiene como objetivo abordar esta deficiencia. Los investigadores hicieron una innovación que permite al robot navegar sin ninguna ayuda externa. Un robot de cuatro patas es capaz de navegar hacia adelante, hacia atrás y hacia los lados empleando algoritmos de última generación ajustados.
¿Como le enseñaron a caminar al robot?
Por lo general, un especialista en robótica debe codificar cada paso robótico o construir un mundo simulado en el que el robot pueda completar su entrenamiento de prueba y error. Pero ambos métodos llevan mucho tiempo, por lo que los investigadores afiliados a Google utilizaron el aprendizaje por refuerzo para que el robot pudiera enseñarse por sí mismo a caminar en el mundo real. Esta rama del aprendizaje automático utiliza software para recopilar más información sobre su entorno a través de ensayos que se repiten continuamente y recompensas los intentos exitosos.
La simulación sigue siendo un ingrediente importante del aprendizaje por refuerzo, pero los investigadores estaban destinados a llevar ese tipo de pruebas al siguiente nivel. Esto significa que los investigadores dejaron que su robot Minotauro deambulara por un entorno físico antes de deambular por los diferentes terrenos de la prueba, como terreno plano, un colchón suave y un felpudo con grietas geométricas.
Sehoon Ha, profesor asistente en el Instituto de Tecnología de Georgia (parte de Google Robotics) y autor principal del estudio, dice que es difícil construir simulaciones rápidas y precisas para que un robot las explore. Puede modelar cada grieta individual en el asfalto, pero eso no ayuda mucho cuando el robot camina por un camino desconocido en el mundo real.
Creo que este trabajo es bastante emocionante. Sacar a la persona del proceso es realmente difícil. Al permitir que los robots aprendan de forma más autónoma, están más cerca de poder aprender en el mundo real en el que vivimos, que en un laboratorio, dijo Chelsea Finn, una profesora asistente en Stanford
OTROS ESTUDIOS
Por otro lado, tambien han existido otros estudios para enseñar a robots como caminar como el programa Paired Open-Ended Trailblazer (POET) este primero presenta un conjunto de terrenos únicos, cada uno habitado por un personaje controlado por computadora. Usando solo dos piernas y un telémetro similar a un láser, el personaje debe aprender a caminar por sí mismo. Después de un período de práctica, la inteligencia artificial cambia el desafío, a veces lo hace más fácil y a veces más difícil. Puede hacer que las trincheras sean más anchas, los tocones más altos o el suelo más desigual. De vez en cuando se cambia un caminante diferente para ver si las habilidades aprendidas en un terreno ayudarán en otro. Esta mutación e intercambio de pistas de obstáculos crea una serie impredecible de escalones en el camino hacia la agilidad.
Usando POET, los caminantes robot podrían eventualmente cubrir un terreno difícil que no se podría aprender sin los cursos anteriores. Además, POET funcionó mejor que un programa que simplemente aumentaba la dificultad del terreno con el tiempo, sin probar muchos caminos indirectos. Las tortuosas rutas de aprendizaje del POETA dieron sus frutos una y otra vez. En un ejemplo, un robot caminó agachado hasta que se encontró con un mundo con tocones y tuvo que aprender a caminar erguido; luego regresó a un mundo más plano y siguió caminando erguido, completando el recorrido más rápido que antes.
Contenido