Modular obtient 100 millions de dollars pour construire des outils permettant d’optimiser et de créer des modèles d’IA

Modular obtient 100 millions de dollars pour construire des outils permettant d’optimiser et de créer des modèles d’IA

Modular, une startup qui crée une plateforme pour le développement et l’optimisation des systèmes d’IA, a levé 100 millions de dollars lors d’un tour de table mené par General Catalyst avec la participation de GV (Google Ventures), SV Angel, Greylock et Factory.

Portant le total des fonds levés par Modular à 130 millions de dollars, ces fonds seront consacrés à l’expansion des produits, au support matériel et à l’extension du langage de programmation de Modular, Mojo, explique Chris Lattner, PDG de Modular.

Lattner a déclaré dans une interview par e-mail à TechCrunch : « Parce que nous opérons dans un espace profondément technique qui nécessite une expertise hautement spécialisée, nous avons l’intention d’utiliser ce financement pour soutenir la croissance de notre équipe ». « Ce financement ne sera pas principalement consacré au calcul de l’IA, mais plutôt à l’amélioration de nos produits de base et à la mise à l’échelle pour répondre à l’incroyable demande de nos clients. »

Lattner, un ex-Googler, a cofondé Modular à Palo Alto en 2022 avec Tim Davis, un ancien collègue de Google au sein de la division de recherche Google Brain du géant de la technologie. Lattner et Davis estimaient tous deux que l’IA était freinée par une infrastructure technique trop compliquée et fragmentée, et ils ont fondé Modular dans le but d’éliminer la complexité de la construction et de la maintenance des systèmes d’IA à grande échelle.

Modular fournit un moteur qui tente d’améliorer les performances d’inférence des modèles d’IA sur les CPU – et à partir de cette année, sur les GPU – tout en réalisant des économies. Compatible avec les environnements cloud existants, les cadres d’apprentissage machine comme TensorFlow de Google et PyTorch de Meta et même d’autres moteurs d’accélération de l’IA, le moteur de Modular, actuellement en aperçu fermé, permet aux développeurs d’importer des modèles entraînés et de les exécuter jusqu’à 7,5 fois plus rapidement que sur leurs cadres natifs, affirme M. Lattner.

L’autre produit phare de Modular, Mojo, est un langage de programmation qui vise à combiner la convivialité de Python avec des fonctionnalités telles que la mise en cache, les techniques de compilation adaptative et la métaprogrammation. Actuellement disponible en avant-première pour des « centaines » d’utilisateurs précoces, Modular prévoit de lancer Mojo en disponibilité générale au début du mois prochain.

« Notre plateforme de développement permet à nos clients et aux développeurs du monde entier de défragmenter leurs piles de technologies d’IA, ce qui permet d’accélérer la mise en production de plus d’innovations et d’accroître la valeur de leur investissement dans l’IA », a déclaré M. Lattner. « Nous nous attaquons à la complexité qui ralentit aujourd’hui le développement de l’IA en résolvant les problèmes de fragmentation qui affectent la pile de l’IA, en commençant par le point de rencontre entre le logiciel et le matériel de l’IA. »

Ambitieux ? Peut-être. Mais rien de ce que propose Modular, qui emploie environ 70 personnes, n’est hors du champ des possibles.

Deci, soutenu par Intel, fait partie des startups qui proposent des technologies visant à rendre les modèles d’intelligence artificielle plus efficaces et performants. Une autre entreprise de cette catégorie est OctoML, qui optimise, évalue et conditionne automatiquement les modèles pour un ensemble de matériels différents.

Quoi qu’il en soit, pour reprendre les propos de Lattner, la demande d’IA s’approche rapidement des limites de la viabilité, ce qui rend extrêmement souhaitable toute technologie permettant de réduire ses besoins en calcul. Les modèles d’IA générative en vogue aujourd’hui sont 10 à 100 fois plus grands que les modèles d’IA plus anciens, comme le souligne un article récent du Wall Street Journal, et une grande partie de l’infrastructure du cloud public n’a pas été conçue pour faire fonctionner ces systèmes, du moins pas à cette échelle.

L’impact s’est déjà fait sentir. Microsoft est confronté à une pénurie de matériel serveur nécessaire à l’exécution de l’IA, si grave qu’elle pourrait entraîner des interruptions de service, a averti l’entreprise dans un rapport sur ses résultats. Dans le même temps, l’engouement pour le matériel d’inférence de l’IA – principalement les GPU – a fait grimper la capitalisation boursière du fournisseur de GPU Nvidia à 1 000 milliards de dollars. Mais Nvidia est victime de son propre succès : les puces d’IA les plus performantes de l’entreprise seraient épuisées jusqu’en 2024.

Pour ces raisons et d’autres encore, plus de la moitié des décideurs en matière d’IA dans les grandes entreprises déclarent rencontrer des obstacles au déploiement des derniers outils d’IA, selon un sondage réalisé en 2023 par S&P Global.

« La puissance de calcul nécessaire aux programmes d’IA d’aujourd’hui est massive et ne peut être maintenue dans le cadre du modèle actuel », a déclaré M. Lattner. « Nous voyons déjà des cas où la capacité de calcul n’est pas suffisante pour répondre à la demande. Les coûts montent en flèche et seules les grandes et puissantes entreprises technologiques disposent des ressources nécessaires pour construire ce type de solutions. La modularité résout ce problème et permettra d’alimenter les produits et services d’IA d’une manière beaucoup plus abordable, durable et accessible à toutes les entreprises. »

Modulaire

Le langage de programmation Mojo de Modular, un « surensemble rapide » de Python. Crédits images : Modulaire

C’est raisonnable. Mais je suis moins convaincu que Modular puisse favoriser l’adoption généralisée de son nouveau langage de programmation, Mojo, alors que Python est si bien ancré dans la communauté de l’apprentissage automatique. Selon une étude, en 2020, 87 % des scientifiques des données utilisaient régulièrement Python.

Mais Lattner affirme que les avantages de Mojo stimuleront sa croissance.

« Une chose qui est souvent mal comprise à propos des applications d’IA est qu’elles ne sont pas seulement un problème d’accélérateur à haute performance », a-t-il déclaré. « L’IA est aujourd’hui un problème de données de bout en bout, qui implique le chargement et la transformation des données, le prétraitement, le post-traitement et la mise en réseau. Ces tâches auxiliaires sont généralement effectuées en Python et en C++, et seule l’approche de Modular avec Mojo peut rassembler tous ces composants pour travailler dans une seule base technologique unifiée sans sacrifier les performances et l’évolutivité. »

Il pourrait bien avoir raison. La communauté Modular s’est élargie à plus de 120 000 développeurs au cours des quatre mois qui ont suivi la présentation du produit Modular au début du mois de mai, affirme Lattner, et des « entreprises technologiques de premier plan » utilisent déjà l’infrastructure de la startup, avec 30 000 sur la liste d’attente.

« L’ennemi le plus important de Modular est la complexité : complexité des couches logicielles qui ne fonctionnent que dans des cas particuliers, logiciels liés à un matériel spécifique et complexité induite par la nature de bas niveau des accélérateurs de haute performance », a-t-il déclaré. « C’est précisément ce qui fait de l’IA une technologie aussi puissante et transformatrice qui nécessite tant d’efforts pour atteindre l’échelle, tant de talents investis dans la construction de solutions sur mesure et tant de puissance de calcul pour fournir des résultats cohérents. Le moteur modulaire et Mojo permettent d’uniformiser les règles du jeu, et ce n’est qu’un début. »

Et – au moins du point de vue du financement – ce n’est qu’un début prometteur.

IA