Numbers Station permet aux utilisateurs professionnels de discuter avec leurs données

Numbers Station permet aux utilisateurs professionnels de discuter avec leurs données

Numbers Station, une startup qui utilise de grands modèles de langage (LLM) pour alimenter sa plateforme d’analyse de données, lance aujourd’hui son premier produit basé sur le cloud : le bien nommé Numbers Station Cloud, qui est maintenant en accès anticipé. Grâce à ce service, pratiquement tous les utilisateurs d’une entreprise peuvent analyser leurs données internes à l’aide de l’interface de chat de Numbers Station.

Plusieurs outils similaires se concentrent sur la traduction des requêtes en langage naturel dans un langage de base de données tel que SQL. Toutefois, l’équipe de Numbers Station estime que cette approche présente des limites, notamment parce que le LLM générique ne comprend pas le fonctionnement d’une entreprise donnée, la façon dont elle structure ses données et la manière dont les personnes au sein de l’entreprise se réfèrent à des objets de données spécifiques.

Crédits d’image : Station de numéros

Comme me l’a confié Chris Aberger, cofondateur et PDG de Numbers Station, il est quelque peu fatigué de parler de la façon dont le service permet aux utilisateurs de « discuter avec leurs données », parce qu’il y a beaucoup de bruit autour de cela. « Mais le niveau supérieur des cadres d’entreprise, des utilisateurs non techniques, qui ont des questions à poser et qui obtiennent des réponses par le biais de ces sources de données structurées classiques, c’est vraiment là que les choses ont évolué », m’a-t-il dit. « Il y a beaucoup de modélisation de données, de plomberie de données autour de ces modèles de base et de grands modèles de langage pour les faire fonctionner.

Pour Numbers Station, cela signifie qu’il a fallu consacrer beaucoup de ressources techniques à la construction de ce que la société appelle son catalogue sémantique. Ce catalogue est essentiellement une source de métriques et de définitions d’une entreprise, gérée automatiquement. Ce catalogue est propre à chaque entreprise (et n’est pas partagé entre elles). M. Aberger a décrit le catalogue comme « une bête de somme » qui, par exemple, garantit que la définition du « revenu récurrent » dans le modèle est alignée sur l’usage que l’entreprise fait de ce terme.

Bien que la plateforme de Numbers Station repose sur un ensemble de LLM et de modèles d’apprentissage automatique très spécialisés, c’est ce catalogue qui assure la cohésion de l’ensemble. Comme me l’a expliqué Ines Chami, cofondatrice et responsable scientifique de Numbers Station, l’équipe avait initialement sous-estimé le défi que représentait la mise en place de cette partie de la plateforme.

« Cela nous ramène à l’apprentissage automatique et à l’ingénierie des données classiques : comment créer une représentation des connaissances que le modèle peut utiliser pour répondre à ces questions », m’a-t-elle expliqué. « Car il est impossible qu’un modèle comprenne toutes ces mesures, toutes ces choses que les utilisateurs professionnels demandent. Après tout, même les humains ne comprennent pas immédiatement toutes les questions, et le modèle doit transformer ces questions vagues en requêtes très concrètes. Les recherches menées par Numbers Stations montrent que son approche permet d’améliorer considérablement la précision par rapport aux pipelines texte-SQL plus traditionnels.

Crédits image : Station de numéros

Bien que l’entreprise lance ce service de chat aujourd’hui, sa vision globale est beaucoup plus vaste.

« Ce que nous faisons, fondamentalement, c’est construire une plateforme d’IA pour l’analyse », a déclaré M. Aberger. « C’est l’une des applications (…). Il y a un jeu plus important et plus large sur lequel nous travaillons toujours en tant qu’entreprise, qui consiste à s’attaquer à un tas de problèmes de données différents qui se situent au-dessus d’ici, par exemple : comment puis-je enrichir mes données avec des sources de données tierces ? Comment utiliser certains des algorithmes les plus classiques, comme la correspondance floue, etc. Il existe un nombre presque infini de rayons que l’on peut construire à partir de cette plateforme ».

L’entreprise a déjà signé avec plusieurs clients du Fortune 500, dont la société mondiale de services immobiliers Jones Lang LaSalle. « Numbers Station est à la pointe de l’IA d’entreprise pour les données structurées », a déclaré Sharad Rastogi, PDG de Work Dynamics Technology de Jones Lang LaSalle. « Nous sommes impressionnés par la plateforme fiable et engageante de Numbers Station. Elle apprend en permanence au fur et à mesure que nous l’utilisons, ce qui permet à nos équipes de données de découvrir et de vérifier des hypothèses afin d’obtenir des résultats commerciaux significatifs. »

IA