Databricks acquiert la plateforme de gouvernance des données centrée sur l’IA Okera

Databricks acquiert la plateforme de gouvernance des données centrée sur l’IA Okera

Databricks a annoncé aujourd’hui l’acquisition d’Okera, une plateforme de gouvernance des données axée sur l’IA. Les deux entreprises n’ont pas divulgué le prix d’achat. Selon Crunchbase, Okera a déjà levé un peu moins de 30 millions de dollars. Parmi les investisseurs figurent Felicis, Bessemer Venture Partners, Cyber Mentor Fund, ClearSky et Emergent Ventures.

La gouvernance des données était déjà un sujet brûlant, mais l’accent mis récemment sur l’IA a mis en évidence certaines des lacunes de l’approche précédente, note Databricks dans l’annonce d’aujourd’hui. « Historiquement, les technologies de gouvernance des données, quelle que soit leur sophistication, s’appuient sur l’application d’un contrôle à une couche de taille étroite et exigent que les charges de travail s’intègrent dans le ‘jardin clos’ de cette couche », explique l’entreprise dans un billet de blog. Cette approche ne fonctionne plus à l’ère des grands modèles de langage (LLM), car le nombre d’actifs augmente trop rapidement (en partie parce qu’une grande partie est générée par des machines) et parce que le paysage global de l’IA évolue si rapidement que les contrôles d’accès standard ne sont pas en mesure de saisir ces changements assez rapidement.

Okera utilise ensuite un système alimenté par l’IA qui peut automatiquement découvrir et classer des informations personnellement identifiables, les étiqueter et leur appliquer des règles (en mettant l’accent sur les métadonnées), à l’aide d’une interface sans code.

Comme l’a souligné l’équipe de Databricks, c’est l’une des raisons pour lesquelles la société était intéressée par l’acquisition d’Okera, mais l’autre est la technologie d’isolation du service, qui peut appliquer un contrôle de gouvernance sur des charges de travail arbitraires sans frais généraux importants. Cette technologie est encore en avant-première privée, mais elle a probablement été l’une des principales raisons de l’acquisition de la société par Databricks.

Databricks, qui a lancé son propre LLM il y a quelques semaines, prévoit d’intégrer la technologie d’Okera dans son Unity Catalog, sa solution existante de gouvernance des données et des actifs d’IA. La société a également noté que l’acquisition permettra à Databricks d’exposer des API supplémentaires que ses propres partenaires de gouvernance des données pourront utiliser pour fournir des solutions à leurs clients.

Avec cette acquisition, Databricks intègre également le cofondateur et PDG d’Okera, Nong Li. Li a créé le format de stockage de données Apache Parquet et a été brièvement ingénieur chez Databricks entre son travail chez Cloudera et la création d’Okera, dont il a été le CTO fondateur et dont il est devenu le CEO en février 2022.

« Alors que les données continuent de croître en volume, en vitesse et en variété à travers différentes applications, les CIO, CDO et CEO doivent trouver un équilibre entre ces deux initiatives souvent contradictoires – sans oublier qu’historiquement, la gestion des politiques d’accès à travers de multiples clouds a été pénible et a pris beaucoup de temps », écrit Li dans l’annonce d’aujourd’hui. « De nombreuses organisations n’ont pas assez de talents techniques pour gérer les politiques d’accès à l’échelle, en particulier avec l’explosion des LLM. Ce dont elles ont besoin, c’est d’une solution de gouvernance moderne, centrée sur l’IA. Nous ne pourrions pas être plus enthousiastes à l’idée de rejoindre l’équipe de Databricks et d’apporter notre expertise dans la construction de solutions de gouvernance sécurisées, évolutives et simples pour certaines des entreprises les plus avant-gardistes au monde. »

Si vous en savez plus sur cette acquisition, vous pouvez contacter Frédéric sur Signal au (860) 208-3416 ou par email ([email protected]). Vous pouvez également nous contacter via SecureDrop.

IA