IA Para Robótica

RoboCat: El Robot que Aprende y se Mejora a sí Mismo

0

Presentando a RoboCat

DeepMind ha anunciado la creación de un innovador modelo de inteligencia artificial llamado RoboCat. Se puede considerar a RoboCat como el robot que aprende solo. Este modelo está diseñado para aprender a resolver nuevas tareas en diferentes brazos robóticos con tan solo 100 demostraciones y mejorar sus habilidades a partir de datos de entrenamiento generados por sí mismo.

¿Te imaginas un mundo donde los robots aprendan rápidamente a adaptarse a nuevas situaciones y a mejorar sus capacidades de manera autónoma? RoboCat es un gran paso hacia ese futuro.

La clave del aprendizaje de RoboCat

El modelo de aprendizaje de RoboCat se basa en Gato (lo sabemos los invetigadores en machine learning y robótica tiene un don especial para bautizar modelos 😂), un modelo multimodal que puede procesar lenguaje, imágenes y acciones en entornos simulados y físicos.

La arquitectura de Gato se combina con un amplio conjunto de datos de entrenamiento que incluye secuencias de imágenes y acciones de varios brazos robóticos resolviendo cientos de tareas diferentes.

¿Cómo RoboCat se mejora a sí mismo?

El proceso de auto-mejora de RoboCat consiste en cinco pasos:

  1. Recolectar 100-1000 demostraciones de una nueva tarea o robot, utilizando un brazo robótico controlado por un humano.
  2. Ajustar RoboCat a esta nueva tarea/brazo, creando un agente especializado.
  3. El agente especializado practica la nueva tarea/brazo unas 10,000 veces, generando más datos de entrenamiento.
  4. Incorporar los datos de demostración y los datos generados por sí mismo en el conjunto de datos de entrenamiento existente de RoboCat.
  5. Entrenar una nueva versión de RoboCat en el nuevo conjunto de datos de entrenamiento.

Aprendiendo a operar nuevos brazos robóticos y resolver tareas más complejas

Gracias a su diverso entrenamiento, RoboCat puede aprender a operar diferentes brazos robóticos en pocas horas. Aunque fue entrenado con brazos que tienen pinzas de dos puntas, pudo adaptarse a un brazo más complejo con una pinza de tres dedos y el doble de entradas controlables. Después de observar 1000 demostraciones controladas por humanos, RoboCat pudo dirigir este nuevo brazo con la destreza suficiente para recoger engranajes con éxito en un 86% de las veces.

El generalista auto-mejorable

Imagina un círculo virtuoso de aprendizaje: cuanto más aprende RoboCat, mejor se vuelve aprendiendo nuevas tareas. La versión inicial de RoboCat tenía un índice de éxito del 36% en tareas nunca antes vistas después de aprender con 500 demostraciones por tarea. Sin embargo, la última versión de RoboCat, que se entrenó en una mayor diversidad de tareas, duplicó esta tasa de éxito en las mismas tareas.

El progreso de RoboCat se asemeja a cómo las personas desarrollan habilidades más diversas a medida que profundizan su aprendizaje en un dominio específico. La habilidad de RoboCat para aprender habilidades de forma independiente y mejorar rápidamente, especialmente cuando se aplica a diferentes dispositivos robóticos, nos acerca a una nueva generación de agentes robóticos más útiles y de propósito general.

DimensionIA

OrienterNet: Localización Visual y Realidad Aumentada como nunca antes

Previous article

MagicPony Predicción de Forma 3D de Objetos Articulados

Next article

Comentarios

Leave a reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Login/Sign up