Le RoboCat de DeepMind apprend à effectuer une série de tâches robotiques

Le RoboCat de DeepMind apprend à effectuer une série de tâches robotiques

DeepMind affirme avoir développé un modèle d’IA, appelé RoboCat, capable d’effectuer une série de tâches sur différents modèles de bras robotiques. En soi, ce n’est pas très nouveau. Mais DeepMind affirme que ce modèle est le premier à pouvoir résoudre et s’adapter à des tâches multiples et à le faire en utilisant différents robots du monde réel.

« Nous démontrons qu’un seul grand modèle peut résoudre un ensemble diversifié de tâches sur plusieurs incarnations robotiques réelles et peut s’adapter rapidement à de nouvelles tâches et incarnations », a déclaré Alex Lee, chercheur scientifique chez DeepMind et coauteur de l’équipe à l’origine de RoboCat, à TechCrunch lors d’une interview par courriel.

RoboCat – qui s’inspire de Gato, un modèle d’IA de DeepMind capable d’analyser et d’agir sur du texte, des images et des événements – a été entraîné sur des images et des données d’actions collectées auprès de robots, à la fois en simulation et dans la vie réelle. Les données, explique Lee, proviennent d’une combinaison d’autres modèles de contrôle de robots à l’intérieur d’environnements virtuels, d’humains contrôlant des robots et d’itérations précédentes de RoboCat lui-même.

Pour entraîner RoboCat, les chercheurs de DeepMind ont d’abord collecté entre 100 et 1 000 démonstrations d’une tâche ou d’un robot à l’aide d’un bras robotique contrôlé par un humain. (Pensez à demander à un bras robotique de ramasser des engrenages ou d’empiler des blocs). Ensuite, ils ont affiné RoboCat sur la tâche, en créant un modèle « dérivé » spécialisé qui s’est exercé à la tâche en moyenne 10 000 fois.

En exploitant les données générées par les modèles dérivés et les données de démonstration, les chercheurs ont continuellement augmenté l’ensemble de données d’entraînement de RoboCat – et ont entraîné de nouvelles versions de RoboCat.

DeepMind RoboCat

Crédits images : DeepMind

La version finale du modèle RoboCat a été entraînée sur un total de 253 tâches et évaluée sur un ensemble de 141 variations de ces tâches, à la fois en simulation et dans le monde réel. DeepMind affirme qu’après avoir observé 1 000 démonstrations contrôlées par des humains pendant plusieurs heures, RoboCat a appris à utiliser différents bras robotiques.

Alors que RoboCat avait été entraîné sur quatre types de robots dotés de bras à deux branches, le modèle a été capable de s’adapter à un bras plus complexe doté d’une pince à trois doigts et de deux fois plus d’entrées contrôlables.

Pour éviter que RoboCat ne soit considéré comme la référence en matière de modèles d’IA pour le contrôle des robots, son taux de réussite varie considérablement d’une tâche à l’autre lors des tests effectués par DeepMind, allant de 13 % à 99 %. Et ce, avec 1 000 démonstrations dans les données d’entraînement ; les réussites étaient, comme on pouvait s’y attendre, moins nombreuses avec un nombre de démonstrations deux fois moins élevé.

Néanmoins, dans certains scénarios, DeepMind affirme que RoboCat a été capable d’apprendre de nouvelles tâches avec seulement 100 démonstrations.

Lee estime que RoboCat pourrait annoncer un abaissement de la barrière à la résolution de nouvelles tâches en robotique.

« Avec un nombre limité de démonstrations pour une nouvelle tâche, RoboCat peut s’adapter aux nouvelles tâches et générer à son tour plus de données pour s’améliorer encore plus », a-t-il ajouté.

À l’avenir, l’équipe de recherche vise à réduire à moins de 10 le nombre de démonstrations nécessaires pour apprendre à RoboCat à accomplir une nouvelle tâche.

IA