L’IA et l’infrastructure de données stimulent la demande de startups open source

L’IA et l’infrastructure de données stimulent la demande de startups open source

Un nouveau rapport met en évidence la demande de startups construisant des outils et des technologies open source pour la révolution de l’IA qui fait boule de neige, avec la verticale de l’infrastructure de données adjacente qui se réchauffe également.

Runa Capital, une société de capital-risque qui a quitté la Silicon Valley pour installer son siège au Luxembourg en 2022, publie depuis quatre ans l’indice Runa Open Source Startup (ROSS), qui met en lumière les startups de logiciels commerciaux open source (COSS) à la croissance la plus rapide. L’entreprise publie des mises à jour trimestrielles, mais l’année dernière, elle a produit son premier rapport annuel, en adoptant une vue d’ensemble de 2022 – ce qu’elle répète maintenant pour 2023.

Tendances

Les données sont étroitement liées à l’IA, car l’IA s’appuie sur les données pour apprendre et faire des prédictions, ce qui nécessite une infrastructure pour gérer la collecte, le stockage et le traitement de ces données. Ces tendances tangentielles se sont rencontrées dans ce rapport.

L’année dernière, LangChain a atteint la première place de l’indice ROSS. Cette startup de deux ans, basée à San Francisco, a développé un cadre open source pour la création d’applications basées sur de grands modèles de langage (LLM). Le projet principal de l’entreprise a dépassé les 72 500 étoiles en 2023, et Sequoia a mené un tour de table de 25 millions de dollars en série A pour LangChain le mois dernier.

Les 10 premières startups COSS de l'indice ROSS pour 2023

Les 10 premières startups COSS dans l’indice ROSS pour 2023. Crédits images: Runa Capital

Dans le reste du top 10, on trouve Reflex, un cadre open source pour la création d’applications web en Python pur, la société à l’origine du produit ayant récemment obtenu un investissement d’amorçage de 5 millions de dollars ; AITable, un constructeur de chatbot d’IA basé sur des feuilles de calcul et quelque chose qui s’apparente à un concurrent d’Airtable en open source ; Sismo, une plateforme axée sur la protection de la vie privée qui permet aux utilisateurs de divulguer sélectivement des données personnelles aux applications ; HPC-AI, qui construit une plateforme distribuée de développement et de déploiement de l’IA dans le but de devenir une sorte d’OpenAI de l’Asie du Sud-Est ; et la base de données vectorielles open source Qdrant, qui a récemment obtenu 28 millions de dollars pour tirer parti de la révolution naissante de l’IA.

Un regard plus large sur les 50 startups open source les plus tendances de l’année dernière révèle que plus de la moitié d’entre elles (26) sont liées à l’IA et à l’infrastructure de données.

Les 50 premières startups COSS de l'indice ROSS pour 2023

Les 50 premières startups COSS dans l’indice ROSS pour 2023. Crédits images: Runa Capital

Il est difficile de comparer correctement l’indice 2023 avec l’année précédente d’un point de vue vertical, en grande partie parce que les entreprises pivotent souvent ou changent le positionnement de leurs produits pour s’adapter à ce qui est à la mode aujourd’hui. L’engouement pour le ChatGPT l’année dernière a peut-être conduit les startups plus anciennes à modifier leur orientation, voire à mettre davantage l’accent sur l’élément « IA » existant de leur produit.

Mais avec l’année de la percée de l’IA générative, il est facile de comprendre pourquoi la demande de composants open source pourrait monter en flèche, car les entreprises de toutes tailles cherchent à suivre le rythme des géants de l’IA propriétaire tels qu’OpenAI, Microsoft et Google.

Géographies

Les logiciels libres ont également toujours été très distribués, avec des développeurs du monde entier qui y contribuent. Cet état d’esprit se traduit souvent par des startups commerciales de logiciels libres qui n’ont pas nécessairement un centre de gravité traditionnel ancré dans un siège social en briques et mortier.

Cependant, l’indice ROSS contribue à intégrer la géographie dans le tableau, en indiquant que 26 entreprises de la liste ont un siège social aux États-Unis, bien que 10 d’entre elles soient nées ailleurs et aient encore des fondateurs ou des employés basés dans d’autres localités.

Au total, les 50 premières entreprises proviennent de 17 pays différents, 23 d’entre elles étant constituées en Europe, ce qui représente une augmentation de 20 % par rapport à l’indice de l’année précédente. La France compte le plus grand nombre de startups COSS avec sept, dont Sismo et Massa, qui figurent dans le top 10, tandis que le Royaume-Uni est passé d’une seule startup en 2022 à six en 2023, ce qui le place en deuxième position d’un point de vue européen.

D’autres éléments notables ressortent du rapport, notamment les langages de programmation – l’indice ROSS a enregistré 12 langages utilisés par les 50 premières entreprises l’année dernière, contre 10 en 2022. Mais TypeScript, un surensemble de JavaScript développé par Microsoft, est resté le plus populaire, utilisé par 38 % des 50 premières startups. Python et Rust ont gagné en popularité, tandis que Go et JavaScript ont chuté.

Index ROSS : Langages de programmation en vogue

Index ROSS : Langages de programmation en vogue. Crédits images: Runa Capital

Les 50 premiers participants à l’indice ROSS ont collectivement gagné 12 000 contributeurs en 2023, tandis que le nombre global d’étoiles sur GitHub a augmenté de près de 500 000. L’indice révèle également que le financement des 50 premières startups COSS a atteint 513 millions de dollars l’année dernière, soit une augmentation de 32 % par rapport à 2022 et de 145 % par rapport à 2021.

Indice ROSS : Contributeurs, stars et financement

Index ROSS : Contributeurs, vedettes et financement. Crédits images: Runa Capital

Méthodologie et contexte

Il est intéressant de se pencher sur la méthodologie qui sous-tend tout cela – quels sont les facteurs qui influencent le fait qu’une entreprise soit considérée comme « top trending » ? Pour commencer, toutes les entreprises incluses doivent avoir au moins 1 000 étoiles GitHub (une mesure GitHub similaire à un « like » dans les médias sociaux) pour être prises en compte. Mais le nombre d’étoiles à lui seul ne nous dit pas grand-chose sur ce qui est tendance, étant donné que les étoiles s’accumulent au fil du temps – ainsi, un projet qui est sur GitHub depuis 10 ans est susceptible d’avoir accumulé plus d’étoiles qu’un projet qui existe depuis 10 mois. Au lieu de cela, Runa mesure la croissance relative des étoiles sur une période donnée à l’aide d’un taux de croissance annualisé (AGR). Ce taux compare la valeur actuelle des étoiles à celle d’une période correspondante antérieure afin de déterminer ce qui a connu la croissance la plus impressionnante.

L’équipe d’investissement de Runa ne retient que les projets appartenant à une « organisation commerciale axée sur le produit », qui doit avoir été fondée il y a moins de 10 ans et disposer d’un financement connu inférieur à 100 millions de dollars.

Définir ce qui constitue une « source ouverte » présente également des difficultés inhérentes, étant donné qu’il existe un éventail de degrés d’ouverture d’une startup – certaines s’apparentent davantage à un « noyau ouvert », où la plupart de leurs principales fonctionnalités sont enfermées derrière un mur payant, et d’autres ont des licences plus restrictives que d’autres. Les conservateurs de Runa ont donc décidé que la startup devait simplement avoir un produit « raisonnablement lié à ses (dépôts de) logiciels libres », ce qui implique évidemment un certain degré de subjectivité lorsqu’il s’agit de décider quelles sont les startups retenues.

D’autres nuances entrent également en jeu. L’indice ROSS adopte une interprétation particulièrement libérale du terme « open source » – par exemple, Elastic et MongoDB ont abandonné leurs racines open source pour des licences « source available », afin de se protéger de l’exploitation par les principaux fournisseurs de cloud. Selon la méthodologie de l’indice ROSS, ces deux entreprises seraient considérées comme « open source », même si leurs licences ne sont pas officiellement approuvées en tant que telles par l’Open Source Initiative et que ces entreprises ne se qualifient plus d' »open source ».

Ainsi, selon sa méthodologie, Runa utilise ce qu’elle appelle la « perception commerciale de l’open source » pour son rapport, plutôt que la licence réelle que l’entreprise attache à son projet. Cela signifie que les licences restreintes disponibles à la source comme BSL (business source license) et SSPL (server side public license), que MongoDB a introduites dans le cadre de sa transition loin de l’open source en 2018, sont tout à fait au menu en ce qui concerne les entreprises commerciales de l’indice ROSS.

« De telles licences maintiennent l’esprit OSS – toutes ses libertés, à l’exception d’une redistribution légèrement limitée, qui n’affecte pas les développeurs mais accorde aux fournisseurs d’origine un avantage concurrentiel à long terme », a expliqué à TechCrunch Konstantin Vinogradov, associé général de Runa Capital basé à Londres. « Du point de vue du capital-risque, il s’agit simplement d’un manuel de jeu évolué pour le même type d’entreprises. La définition de l’open source s’applique aux produits logiciels, pas aux entreprises.

D’autres filtres importants sont également en place. Par exemple, les entreprises qui se concentrent principalement sur la fourniture de services professionnels, ou sur des projets secondaires avec un soutien actif limité ou sans élément commercial, ne sont pas incluses dans l’indice ROSS.

À des fins de comparaison, il existe d’autres indices et listes qui donnent une idée de ce qui se passe dans le paysage de l’open source. Une autre société de capital-risque, Two Sigma Ventures, gère par exemple l’Open Source Index, dont le concept est similaire à celui de Runa, à ceci près qu’il couvre toutes sortes de projets open source (et pas seulement les startups) et qu’il dispose de filtres supplémentaires, notamment la possibilité d’afficher la métrique « watchers » de GitHub, ce qui, selon certains, donne une image plus précise de la véritable popularité d’un projet.

GitHub publie également une page sur les dépôts en vogue qui, comme celle de Two Sigma Ventures, ne se concentre pas sur l’entreprise qui se trouve derrière le projet.

L’indice ROSS est donc devenu un outil complémentaire utile pour déterminer quelles sont les « startups » open source qui valent la peine d’être suivies.

IA