Imbue lève 200 millions de dollars pour créer des modèles d’IA capables de « raisonner de manière robuste ».

Imbue lève 200 millions de dollars pour créer des modèles d’IA capables de « raisonner de manière robuste ».

Imbue, le laboratoire de recherche en IA anciennement connu sous le nom de Generally Intelligent, a levé 200 millions de dollars dans le cadre d’un tour de table de série B qui valorise l’entreprise à plus d’un milliard de dollars. Parmi les participants figurent l’Institut Astera, Nvidia, le PDG de Cruise Kyle Vogt et le cofondateur de Notion Simon Last.

Cette nouvelle tranche porte le total des fonds levés par Imbue à 220 millions de dollars, ce qui la place parmi les startups d’IA les mieux financées de ces derniers mois. Elle n’est que légèrement derrière AI21 Labs (283 millions de dollars), la société basée à Tel Aviv qui développe une gamme d’outils d’IA génératrice de texte, ainsi que des fournisseurs d’IA générative tels que Cohere (435 millions de dollars) et Adept (415 millions de dollars).

« Ce dernier financement accélérera notre développement de systèmes d’IA capables de raisonner et de coder, afin qu’ils puissent nous aider à atteindre des objectifs plus importants dans le monde », a écrit Imbue dans un billet de blog publié ce matin. « Notre objectif reste le même : construire des agents d’IA pratiques capables d’atteindre des objectifs plus importants et de travailler pour nous en toute sécurité dans le monde réel.

Imbue a été lancée en octobre dernier avec un objectif ambitieux : rechercher les fondements de l’intelligence humaine qui font actuellement défaut aux machines. Son plan, tel qu’il a été présenté à TechCrunch à l’époque, consistait à transformer les « fondamentaux » en un ensemble de tâches à résoudre, à concevoir différents modèles d’IA et à tester leur capacité à apprendre à résoudre ces tâches dans des mondes complexes en 3D construits par l’équipe d’Imbue.

L’approche de l’entreprise semble avoir quelque peu évolué depuis lors. Plutôt que de lancer l’IA dans des mondes en 3D, Imbue déclare qu’elle développe des modèles qu’elle trouve « utiles en interne » pour commencer, y compris des modèles qui peuvent coder (à la GitHub Copilot et Amazon CodeWhisperer).

De nombreux modèles peuvent coder. Mais ce qui distingue les modèles d’Imbue, c’est leur capacité à « raisonner de manière robuste », affirme l’entreprise.

« Nous pensons que le raisonnement est le principal obstacle à l’efficacité des agents d’IA », écrit Imbue dans son billet de blog. « Le raisonnement robuste est nécessaire pour une action efficace. Il implique la capacité de gérer l’incertitude, de savoir quand changer d’approche, de poser des questions et de recueillir de nouvelles informations, de jouer des scénarios et de prendre des décisions, d’émettre et d’écarter des hypothèses et, d’une manière générale, de gérer la nature compliquée et difficile à prévoir du monde réel. »

Imbue estime également que le code est un cas d’utilisation important qui va au-delà du fait de permettre à son équipe de créer des applications d’IA à grande échelle. Dans son billet de blog, l’entreprise explique que le code peut améliorer le raisonnement et constitue l’un des moyens les plus efficaces pour les modèles de prendre des mesures sur une machine.

« Un agent qui écrit une requête SQL pour extraire des informations d’une table a beaucoup plus de chances de satisfaire la demande d’un utilisateur qu’un agent qui essaie d’assembler ces mêmes informations sans utiliser de code », écrit l’entreprise. « En outre, la formation au code aide les modèles à apprendre à mieux raisonner ; la formation sans code semble donner lieu à des modèles qui raisonnent mal.

Cette philosophie n’est pas très éloignée de celle d’Adept, qui vise à construire une IA capable d’automatiser n’importe quel processus logiciel. Google DeepMind a également exploré des approches pour enseigner à l’IA à contrôler les ordinateurs, en demandant par exemple à une IA d’observer les commandes du clavier et de la souris de personnes effectuant des tâches informatiques « suivant des instructions », telles que la réservation d’un vol.

Imbue affirme que ses modèles sont « taillés sur mesure » pour le raisonnement dans le sens où ils sont formés sur des données pour « renforcer les bons modèles de raisonnement » et en utilisant des techniques qui passent « beaucoup plus de temps de calcul pendant le temps d’inférence » pour arriver à « des conclusions et des actions robustes ».

Plus précisément, Imbue forme de « très grands » modèles – des modèles comportant plus de 100 milliards de paramètres – optimisés pour obtenir de bons résultats sur ses critères de référence internes en matière de raisonnement. (Les « paramètres » sont les parties d’un modèle apprises à partir des données d’entraînement et définissent essentiellement les compétences du modèle sur un problème, comme la génération de texte ou de code). Cette formation est réalisée sur un cluster de calcul conçu par Nvidia, contenant 10 000 GPU de la série H100 de Nvidia.

Imbue investit également dans la construction de ses propres outils d’IA et d’apprentissage automatique, tels que des prototypes d’IA pour le débogage et des interfaces visuelles au-dessus des modèles d’IA. Elle mène également des recherches pour comprendre le processus d’apprentissage dans les grands modèles de langage.

Imbue n’a pas l’intention de produire une grande partie de ce sur quoi elle travaille actuellement. Elle considère plutôt ces outils et modèles comme un moyen d’améliorer l’IA future, plus générale, et de jeter les bases d’une plateforme que les gens pourront utiliser pour créer leurs propres modèles personnalisés.

« Lorsque nous construisons des agents d’IA, nous construisons en fait des ordinateurs capables de comprendre nos objectifs, de communiquer de manière proactive et de travailler pour nous en arrière-plan », poursuit M. Imbue dans le billet de blog. « À terme, nous espérons mettre sur le marché des systèmes permettant à chacun de construire des agents d’IA robustes et personnalisés qui mettent la puissance productive de l’IA à la portée de tous… Ce dernier financement permettra d’accélérer notre développement de systèmes d’IA capables de raisonner et de coder, afin qu’ils puissent nous aider à atteindre des objectifs plus importants dans le monde. »

IA