AssemblyAI obtient 50 millions de dollars pour construire et servir des modèles vocaux d’IA

AssemblyAI obtient 50 millions de dollars pour construire et servir des modèles vocaux d’IA

Les entreprises misent beaucoup sur l’IA générative pour acquérir un avantage concurrentiel. Mais les difficultés d’adoption demeurent. Selon une enquête récente d’EY, une grande partie des entreprises qui souhaitent adopter l’IA générative affirment que les progrès rapides dans ce domaine – et la multiplication des fournisseurs qui prétendent avoir une expertise en matière d’IA – compliquent leurs perspectives de déploiement.

On ne s’en rendrait pas compte à la lecture de leurs dépenses. Selon les prévisions d’IDC, les investissements mondiaux dans les systèmes « centrés sur l’IA » pourraient atteindre 154 milliards de dollars d’ici la fin de l’année. Un sondage du MIT Tech Review a révélé que 50 % des entreprises prévoient d’augmenter de plus de 25 % les budgets consacrés à l’infrastructure des données et à l’IA au cours de l’année à venir.

Ce boom profite à des startups comme AssemblyAI (dont TechCrunch a déjà parlé à trois reprises), une entreprise autoproclamée « d’IA appliquée » qui recherche, forme et déploie des modèles d’IA pour les développeurs et les équipes de produits afin qu’ils les intègrent dans leurs applications et leurs services.

AssemblyAI affirme que sa base de clients payants a augmenté de 200 % par rapport à l’année dernière pour atteindre 4 000 marques et que sa plateforme d’IA traite désormais environ 25 millions d’appels d’API par jour. En outre, plus de 200 000 développeurs construisent sur la plateforme, selon AssemblyAI, et l’utilisent pour traiter plus de 10 téraoctets de données par jour.

« Les modèles d’IA s’améliorent et évoluent rapidement », a déclaré Dylan Fox, cofondateur et PDG d’AssemblyAI, à TechCrunch lors d’un entretien par courriel. « Les entreprises qui exploitent la plateforme API d’AssemblyAI peuvent se concentrer sur la création de nouveaux produits, applications et flux de travail d’IA sans avoir à se préoccuper du développement de modèles, de l’entraînement et du suivi du rythme rapide de l’innovation des modèles. Elles n’ont pas non plus à se soucier de déployer elles-mêmes des modèles d’IA à l’échelle, ce qui est extrêmement difficile à faire à faible coût et avec une grande disponibilité. »

AssemblyAI

La plateforme de développement AssemblyAI.

Le succès d’AssemblyAI a attiré l’attention de grands investisseurs, dont certains ont récemment contribué à une nouvelle tranche de financement pour la startup. Accel a mené un tour de table de 50 millions de dollars dans AssemblyAI, annoncé aujourd’hui, avec la participation de l’ancien co-PDG de Salesforce Keith Block, de l’ex-PDG de GitHub Nat Friedman et Daniel Gross, d’Insight Partners et de Y Combinator. Le montant total des capitaux levés par AssemblyAI s’élève désormais à 115 millions de dollars.

Fox, ingénieur en apprentissage automatique de métier, a fondé AssemblyAI fin 2017. Il dit avoir été inspiré par l’Amazon Echo, qui, selon Fox, est l’un des premiers grands exemples de produits rendus possibles par de meilleurs systèmes d’IA pour la voix.

« Lorsque j’ai commencé à explorer la construction de mes propres produits avec divers modèles d’IA vocale disponibles à l’époque, j’ai été déçu de constater que la plupart des entreprises proposaient encore des modèles d’IA vocale hérités et imprécis par le biais de produits de développement difficiles à utiliser », a déclaré Fox. « C’est ce qui m’a incité à créer AssemblyAI, avec l’objectif de créer des modèles d’IA surhumains, disponibles sur une plateforme de développement facile à utiliser, qui permettraient de créer de toutes nouvelles catégories d’applications d’IA.

Aujourd’hui, AssemblyAI propose des modèles d’IA – en particulier des modèles axés sur la parole – conçus pour effectuer des tâches telles que la conversion de la parole en texte, l’identification des locuteurs, la modération du contenu et le résumé de la parole par l’intermédiaire d’une API. Des clients comme Fireflies, une application de transcription de réunions, font passer des contenus allant d’appels téléphoniques et de réunions Zoom à des podcasts et des vidéos par les modèles, explique M. Fox.

Les modèles vocaux ouverts et propriétaires ne manquent pas, qu’il s’agisse de startups concurrentes comme Deepgram, Rev et Speechmatics ou de géants de la technologie comme Google Cloud, Azure et AWS. Mais Fox affirme – à tort ou à raison – que les modèles d’AssemblyAI sont plus « avancés », « précis », « capables » et « riches en fonctionnalités » que ceux de la concurrence.

« Les grandes entreprises de l’informatique en nuage proposent des produits similaires[…]mais ils sont rarement mis à jour, moins précis, dotés de beaucoup moins de fonctionnalités et beaucoup plus difficiles à intégrer », poursuit-il.

Cela dit, AssemblyAI ne se repose pas sur ses lauriers. Une partie du nouveau financement sera consacrée à un modèle vocal « universel » que l’entreprise forme sur plus d’un pétaoctet de données vocales et qui devrait être lancé plus tard cette année », explique M. Fox. AssemblyAI est également en train d’augmenter ses effectifs, visant à accroître sa main-d’œuvre de 115 personnes de 50 % à 75 % l’année prochaine.

Nous travaillons à la construction du « Stripe pour les modèles d’IA », où les développeurs et les équipes de produits pourront facilement accéder à l’IA de pointe par le biais d’une simple API », a déclaré M. Fox. « En fournissant ces éléments aux clients, ils peuvent se concentrer sur la création d’applications plus verticales et de flux de travail internes qui exploitent nos données exclusives et les modèles d’IA vocale d’AssemblyAI qui s’améliorent sans cesse… Nous avons des années de marge de manœuvre grâce au nouveau cycle de financement, et nous constatons une demande incroyable et l’adoption de produits étant donné la poussée du grand public autour de l’IA. »

IA