Figure 01, el robot humanoide que entiende y actúa solo, impresiona al mundo
En un impresionante avance que ha dejado atónitos a expertos en robótica e inteligencia artificial, Figure, una startup fundada hace menos de dos años por veteranos de la industria, dio a conocer los frutos de su colaboración con OpenAI, creadores del revolucionario ChatGPT. El resultado: Figure 01, un robot humanoide que exhibe capacidades de interacción y razonamiento sin precedentes.
La startup de robótica Figure, valuada en 2.600 millones de dólares y fundada hace menos de dos años por ex empleados de Boston Dynamics, Tesla, Google DeepMind y Archer Aviation, mostró este miércoles los frutos de su primera colaboración con su nuevo inversor y socio OpenAI, creador del popular chatbot ChatGPT. En un video publicado en la plataforma social X, se puede apreciar a un robot humanoide de tamaño completo, el Figure 01 (pronunciado “Figure One”), interactuando de manera sorprendentemente fluida y natural con una persona y su entorno.
El video comienza con el humano preguntando: “Hey Figure One, ¿qué ves en este momento?”. El robot, que en lugar de una cara tiene una pantalla, responde: “Veo una manzana roja en un plato en el centro de la mesa, una rejilla para el secado con tazas y un plato, y tú parado cerca con tu mano sobre la mesa”. Cuando el humano le pide algo de comer, Figure 01 le entrega cuidadosamente la manzana, entendiendo que es el único objeto comestible frente a él. Al ser preguntado por qué eligió la manzana, el robot explica: “Te di la manzana porque es el único artículo comestible que puedo darte de la mesa”.
Según Brett Adcock, cofundador y CEO de Figure, las cámaras incorporadas de Figure 01 alimentan un gran modelo de visión y lenguaje (VLM por sus siglas en inglés) entrenado por OpenAI. “El video muestra redes neuronales de extremo a extremo. No hay teleoperación. Además, esto fue filmado a una velocidad de 1.0x y se grabó de forma continua”, enfatizó Adcock en un hilo en X. “Los modelos OpenAI proporcionan inteligencia visual y lingüística de alto nivel”, señala Figure, empresa que cuenta con inversiones de el fundador de Amazon Jeff Bezos, el gigante tecnológico Microsoft, el fabricante de chips Nvidia y OpenAI.
Este avance representa un salto significativo en las interacciones de robots humanoides de propósito general, mostrando un robot que puede seguir órdenes, intuir deseos y realizar tareas de manera mucho más fluida que ejemplos previos de otras compañías. Sin embargo, Adcock reconoce que aún queda mucho trabajo antes de que un robot así esté listo para su implementación comercial.
“Nuestro objetivo es entrenar un modelo del mundo para operar robots humanoides a nivel de miles de millones de unidades”, declaró Adcock. El “plan maestro” de Figure es “desarrollar humanoides de propósito general que tengan un impacto positivo en la humanidad y creen una vida mejor para las generaciones futuras”, eliminando “la necesidad de trabajos inseguros e indeseables”.
Figure 01 está pensado para ser usado en fábricas, almacenes y ventas minoristas, aunque también podría ser útil para el sector de la defensa. De momento, la empresa no ha anunciado contratos de este tipo. El equipo de Figure, formado por expertos en robótica de IA, señala en su web que su misión es “ampliar las capacidades humanas mediante la IA avanzada”.
El progreso mostrado por Figure y OpenAI probablemente ejercerá una presión mucho mayor sobre rivales en el espacio de la robótica humanoide, como Tesla con su proyecto Optimus y Agility Robotics, que trabaja con Amazon. También llega en un momento en que más empresas ingresan al sector, incluida Hugging Face, que acaba de contratar a un ex científico de Tesla Optimus para liderar su nuevo proyecto de robótica de código abierto, y el anuncio de ayer de una startup llamada Physical Intelligence.
A finales de febrero, OpenAI firmó un acuerdo de colaboración con Figure para “desarrollar modelos de IA de próxima generación” para los robots, ya que cree que pueden “ayudar en la vida cotidiana”. Con este impresionante avance, Figure y OpenAI parecen estar un paso más cerca de hacer realidad esa visión.