Deepset obtient 30 millions de dollars pour développer ses offres de MLOps axées sur le LLM

Deepset obtient 30 millions de dollars pour développer ses offres de MLOps axées sur le LLM

Deepset, une plateforme permettant de créer des applications d’entreprise basées sur de grands modèles de langage tels que ChatGPT, a annoncé aujourd’hui avoir levé 30 millions de dollars lors d’un tour de table mené par Balderton Capital avec la participation de GV et Harpoon Ventures.

Les fonds récoltés serviront à développer les produits et services de Deepset et à faire passer son équipe d’une cinquantaine de personnes à 70 ou 75 d’ici la fin de l’année, selon Milos Rusic, cofondateur et PDG de l’entreprise.

« Dans de nombreuses organisations, les équipes de science des données sont encore l’option par défaut pour « tout ce qui concerne l’IA ». En réalité, de nombreuses équipes de science des données sont en train de se restructurer, de réapprendre et de remodeler leurs habitudes pour répondre aux demandes croissantes des équipes de produits et des utilisateurs finaux dans l’entreprise », a déclaré Rusic à TechCrunch lors d’une interview par e-mail. « L’industrie est en train de passer des laboratoires d’IA aux usines d’IA – il ne s’agit plus de bricoler, il s’agit d’expédier des produits réussis et de la valeur. »

Rusic n’a pas tort d’insinuer que les équipes de science des données sont surchargées de travail et de travail. Selon un récent sondage, la grande majorité des ingénieurs de données – les scientifiques qui préparent les données pour les outils d’analyse – souffrent d’épuisement professionnel, sont susceptibles de quitter leur entreprise actuelle pour une autre dans les 12 mois et envisagent d’abandonner complètement le secteur.

Cette situation regrettable contribue probablement aux défis que pose le développement de l’IA au sein des entreprises. Un sondage réalisé par Gartner en 2022 a révélé qu’environ la moitié seulement des projets d’IA passent du stade du projet pilote à celui de la production et que 53 % des modèles d’apprentissage automatique ne sont jamais déployés.

Rusic a co-lancé Deepset avec Malte Pietsch et Timo Möller en 2018, en démarrant l’entreprise en formant des modèles de traitement du langage naturel personnalisés pour les entreprises. Les trois cofondateurs ont suivi de près l’architecture de modèle d’IA Transformer développée par Google en 2017, qui allait constituer la base de LLM sophistiqués tels que ChatGPT et GPT-4.

En 2019, Rusic, Pietsch et Möller ont publié Haystack, un cadre open source pour construire des services back-end de NLP avec Transformers et d’autres architectures LLM. L’objectif était de fournir une collection d’outils aux ingénieurs logiciels pour créer rapidement des applications pilotées par LLM, explique Rusic – en particulier des applications couvrant un cas d’utilisation spécifique, comme aider les équipes juridiques à effectuer des recherches dans les dossiers.

Mais les ambitions de Deepset ont fini par dépasser Haystack.

L’année dernière, la startup a lancé Deepset Cloud, que Rusic décrit comme une « plateforme LLM d’entreprise pour les équipes d’IA ». Deepset Cloud étend Haystack en fournissant une plateforme où les clients peuvent essayer différents LLM, intégrer ces LLM dans des applications, déployer les applications et les LLM auprès des utilisateurs finaux et effectuer des analyses de la précision des LLM tout en surveillant continuellement leurs performances.

Deepset Cloud comprend également des composants permettant de mesurer et d’atténuer les problèmes courants liés aux LLM, tels que l’hallucination. L’hallucination, qui touche même les meilleurs LLM aujourd’hui, fait que les modèles inventent de fausses informations ou des faits qui ne sont pas basés sur des événements ou des données réels.

Deepset

Capture d’écran de Deepset Cloud, la nouvelle plateforme MLOps de Deepset. Crédits d’image : Nuage profond

« Deepset Cloud s’appuie fortement sur la technologie open source Haystack – l’architecture du pipeline, les composants de base, les entrepôts de données, les intégrations, etc. « Notre plateforme fournit tous les éléments de base pour éviter de faire du ‘heavy-lifting’ indifférencié et permet aux développeurs de se concentrer sur la livraison de services NLP back-end – pilotés par API, facilement composables, facilement intégrables et facilement contrôlables ».

Deepset, qui a levé un total de 46 millions de dollars de fonds à ce jour, considère les fournisseurs concurrents dans l’espace MLOps comme ses principaux rivaux. MLOps tente de rationaliser le processus de construction et de gestion des modèles d’apprentissage automatique en fournissant des outils pour chaque étape du cycle de vie d’un modèle.

Outre les opérateurs historiques tels qu’AWS, Azure et Google Cloud, un nombre croissant de startups fournissent des produits, des plateformes et des services MLOps aux entreprises clientes. Il y a Seldon, qui a récemment levé 20 millions de dollars, Galileo, Iguazio, propriété de McKinsey, Diveplane, Arize et Tecton, pour n’en citer que quelques-unes.

Allied Market Research prévoit que le secteur des MLOps atteindra 23,1 milliards de dollars d’ici 2031, contre environ 1 milliard de dollars en 2021. Il ne fait aucun doute que la taille du marché adressable continuera d’attirer de nouveaux entrants.

Mais M. Rusic souligne que l’expansion de Deepset prouve qu’elle se démarque de la masse. La startup a des « centaines » de pipelines clients fonctionnant sur sa plateforme, y compris des charges de travail pour Siemens et Airbus. La maison d’édition juridique Manz a fait appel à Deepset pour lancer un outil interne alimenté par l’IA qui aide à faire apparaître des documents judiciaires, des précédents connexes et plus encore. Airbus, quant à lui, utilise Haystack pour créer des applications qui recommandent des directives d’exploitation d’avions aux pilotes dans le cockpit.

« Il est souvent 10 fois plus rapide de créer des services NLP et LLM prêts à la production avec Deepset Cloud que d’embaucher, de former et de gérer une équipe dédiée au développement d’applications dorsales robustes », a déclaré M. Rusic. « Deepset Cloud permet aux clients d’utiliser simultanément différents LLM, en les combinant dans l’architecture de l’application pour éviter le verrouillage du fournisseur et atténuer les problèmes de confidentialité des données et de souveraineté des modèles. »

IA