Après avoir abandonné l’intelligence artificielle d’OpenAI, Figure AI vient de dévoiler sa propre IA pour piloter ses robots humanoïdes. Baptisée Helix, elle a la capacité étonnante d’effectuer des tâches de manière autonome, et même de contrôler plusieurs robots simultanément.
Le plus important pour avoir des robots humanoïdesrobots humanoïdes capables d’effectuer des tâches ménagères n’est pas le robot en lui-même. C’est son cerveaucerveau. Chaque constructeur tente de développer une intelligence artificielle capable de piloter le robot pour qu’il puisse marcher, saisir des objets, et coordonner des actions pour accomplir une tâche.
Jusqu’à récemment, Figure AI travaillait en collaboration avec OpenAI pour le développement de son robot humanoïde Figure 02. Toutefois, en début du mois, ils ont annoncé y avoir mis un terme, suite à une « avancée majeure ». Après plusieurs semaines d’attente, la firme vient enfin de dévoiler cette avancée, qui se nomme Helix. Il s’agit d’un modèle vision-langage-action (VLA) généraliste qui pilote désormais Figure 02, capable de voir le monde autour, comprendre le langage naturel et interagir avec le monde réel. Il peut effectuer de nouvelles tâches de manière autonome, et même de faire collaborer deux robots.
Deux robots Figure 02, dotés du nouveau « cerveau » Helix, se coordonnent pour ranger des objets. © Figure AI
Des robots capables d’identifier de nouveaux objets et se coordonner
Dans une nouvelle vidéo, Figure AI montre à quel point cette avancée est importante. Quelqu’un leur demande à l’oral de ranger des objets, qu’ils n’ont jamais vus avant. Chacun est capable de saisir les différents objets, malgré des formes très variées, puis de les identifier afin de les placer au réfrigérateur, dans un placardplacard, ou dans la corbeille à fruits. Lorsqu’un robot tient un objet qu’il ne peut pas ranger, les deux se coordonnent pour se le passer et le ranger au bon endroit. Les robots utilisent un seul réseau neuronal pour apprendre toutes les tâches, et dans la vidéo, cet unique réseau Helix pilote les deux robots simultanément.
Chaque robot est doté en réalité de deux « cerveaux ». Le System 2 est un modèle vision-langage (VLM) qui fonctionne à 7-9 HzHz pour comprendre la scène et le langage. Le System 1 est un modèle de type transformeur, rapide et réactifréactif, qui fonctionne à 200 Hz et qui traduit les représentations sémantiques latentes du System 2 en actions.
Pour l’instant, Helix ne pilote que le haut du robot, et se limite à attraper et déplacer des objets. Mais il s’agit tout de même d’une avancée étonnante qui nous rapproche un peu plus d’un futur dans lequel les robots nous assisteront au quotidien.