Spawning présente des plans pour permettre aux créateurs de se retirer de la formation à l’IA générative

Spawning présente des plans pour permettre aux créateurs de se retirer de la formation à l’IA générative

Les querelles juridiques entre les artistes et les entreprises qui entraînent l’IA sur leurs œuvres d’art ne semblent pas près de s’apaiser.

En l’espace de quelques mois, plusieurs actions en justice ont été intentées au sujet de la technologie d’IA générative d’entreprises telles qu’OpenAI et Stability AI, par des plaignants qui allèguent que des données protégées par le droit d’auteur – essentiellement des œuvres d’art – ont été utilisées sans leur autorisation pour entraîner les modèles génératifs. Les modèles d’IA générative « apprennent » à créer de l’art, du code et d’autres choses encore en s’entraînant sur des échantillons d’images et de textes, généralement récupérés sans discernement sur le web.

Jordan Meyer et Mathew Dryhurst ont cofondé la startup Spawning AI dans le but de permettre aux artistes de mieux contrôler la manière dont leurs œuvres sont utilisées et l’endroit où elles le sont. Spawning a créé HaveIBeenTrained, un site web qui permet aux créateurs de se retirer de l’ensemble de données d’entraînement d’un modèle d’IA générateur d’art, Stable Diffusion v3, dont la sortie est prévue dans les mois à venir.

En mars, les artistes avaient utilisé HaveIBeenTrained pour supprimer 80 millions d’œuvres d’art de l’ensemble de données d’entraînement de Stable Diffusion. Fin avril, ce chiffre avait dépassé le milliard.

La demande pour le service de Spawning augmentant, l’entreprise – qui était jusqu’alors entièrement financée par ses propres moyens – a cherché à obtenir un investissement extérieur. Et elle l’a obtenu. Spawning a annoncé aujourd’hui avoir levé 3 millions de dollars lors d’un tour de table mené par True Ventures avec la participation de Seed Club Ventures, Abhay Parasnis, Charles Songhurst, Balaji Srinivisan, Jacob.eth et Noise DAO..

S’adressant à TechCrunch par courriel, M. Meyer a déclaré que le financement permettra à Spawning de continuer à développer des « normes de propriété intellectuelle pour l’industrie de l’audiovisuel ». AI et d’établir des normes plus strictes en matière d’opt-out et d’opt-in.

« Nous sommes enthousiastes quant au potentiel de IA et de l’outillage. Nous avons développé une expertise dans ce domaine en nous passionnant pour les nouvelles opportunités. IA aux créateurs, mais nous pensons que le consentement est un élément fondamental pour que tout le monde se sente bien dans ces développements », a déclaré M. Meyer.

Les chiffres de Spawning parlent d’eux-mêmes. Il est clair que les artistes souhaitent avoir leur mot à dire sur la manière dont leurs œuvres sont utilisées (ou récupérées, selon le cas). Mais au-delà des partenariats avec des plateformes artistiques comme Shutterstock et ArtStation, Spawning n’a pas réussi à rallier l’industrie autour d’une norme commune de retrait ou de provenance.

Adobe, qui a récemment annoncé des outils d’IA générative, cherche à mettre en place ses propres mécanismes et outils d’exclusion. Il en va de même pour DeviantArt, qui a lancé en novembre une protection reposant sur des balises HTML pour interdire aux robots logiciels qui parcourent les pages à la recherche d’images de télécharger ces images pour en faire des ensembles d’entraînement. OpenAI, le géant de l’IA générative présent dans la salle, ne propose toujours pas d’outil d’opt-out – et n’a pas annoncé son intention de le faire prochainement.

Spawning a également été critiqué pour l’opacité – et le flou – de son processus de retrait. Comme l’a noté Ars Technica dans un article récent, le processus d’opt-out ne semble pas correspondre à la définition du consentement pour l’utilisation des données personnelles dans le Règlement général sur la protection des données de l’Europe, qui stipule que le consentement doit être activement donné, et non pas supposé par défaut. On ne sait pas non plus comment Spawning a l’intention de vérifier légalement l’identité des artistes qui font des demandes d’exclusion – ou même si elle a l’intention d’essayer de le faire.

La solution de Spawning comporte plusieurs volets. Tout d’abord, elle prévoit de faciliter la tâche des formateurs de modèles d’IA pour qu’ils honorent les demandes d’exclusion et simplifient le processus pour les créateurs. Ensuite, Spawning offrira davantage de services aux organisations qui cherchent à protéger le travail de leurs artistes, explique M. Meyer.

« Nous voulons construire la couche de consentement pour l’IA, qui, selon nous, sera un élément d’infrastructure fondamentalement utile à l’avenir », a-t-il ajouté. « Nous prévoyons de développer Le frai pour aborder les nombreux domaines différents touchés par la AI car chaque domaine a ses propres besoins ».

Dans une première étape vers cette vision ambitieuse, Spawning a activé en mars les « opt-outs de domaine », permettant aux créateurs et aux partenaires de contenu de retirer rapidement le contenu de sites web entiers. Spawning indique que 30 000 domaines ont été enregistrés à ce jour dans le système.

Avoir été formé

L’outil de Spawning permet aux artistes de se retirer de la formation générative de l’IA. Crédits images : La ponte

Le mois d’avril marquera la sortie d’une API et d’un paquetage Python open source qui élargira considérablement l’étendue du contenu touché par Spawning. Auparavant, les demandes d’exclusion par le biais de Spawning ne s’appliquaient qu’à l’ensemble de données LAION-5B – l’ensemble de données utilisé pour entraîner Stable Diffusion. À partir du mois d’avril, tout site web, application ou service pourra utiliser l’API de Spawning pour se conformer automatiquement aux demandes d’opt-out, non seulement pour les données image, mais aussi pour le texte, l’audio, les vidéos et bien plus encore.

Meyer explique que Spawning regroupera toutes les nouvelles méthodes d’opt-out (par exemple celles d’Adobe et de DeviantArt) dans son paquetage Python pour les formateurs de modèles, dans le but de réduire le nombre de comptes que les créateurs de modèles doivent gérer pour se conformer aux demandes d’opt-out.

Pour accroître la visibilité, Spawning s’associe à Hugging Face, l’une des plus grandes plateformes d’hébergement et d’exécution de modèles d’IA, pour ajouter une nouvelle boîte d’information sur Hugging Face qui alertera les utilisateurs sur la proportion de données « opt-out » dans les ensembles de données texte-image. Cet encadré renverra également à une page d’inscription à l’API Spawning qui permettra aux formateurs de modèles de supprimer les images exclues au moment de la formation.

« Nous pensons qu’une fois que les entreprises et les développeurs sauront qu’il est possible d’honorer les souhaits des créateurs, il y aura peu de raisons de ne pas le faire », a déclaré M. Meyer. « Nous sommes très enthousiastes quant à l’avenir de la technologie générative. AImais les créateurs et les organisations ont besoin de normes en place pour que leurs données jouent en leur faveur ».

À l’avenir, Spawning a l’intention de lancer une fonction de détection de « duplication exacte » pour faire correspondre les images exclues avec les copies que la plateforme trouve sur le Web, suivie d’une fonction de détection de « quasi-doublon » pour informer les artistes lorsque Spawning trouve des copies probables de leur travail qui ont été recadrées, compressées ou légèrement modifiées d’une autre manière.

En outre, une extension Chrome est prévue pour permettre aux créateurs de refuser de manière préventive que leurs œuvres soient affichées n’importe où sur le web, ainsi qu’une recherche de légendes sur le site HaveIBeenTrained pour rechercher directement des descriptions d’images. L’outil de recherche actuel du site n’utilise que des correspondances approximatives entre le texte et les images, ainsi que des recherches d’URL pour trouver des contenus hébergés sur des sites web spécifiques.

Spawning, qui est maintenant redevable à des investisseurs, prévoit de gagner de l’argent en construisant des services au-dessus de son infrastructure de contenu, bien que Meyer n’ait pas voulu divulguer grand-chose. Reste à savoir ce qu’en penseront les créateurs de contenu.

« Nous avons discuté avec un certain nombre d’organisations, mais beaucoup de conversations étaient trop prématurées pour être annoncées, et nous pensons que notre annonce de financement et notre visibilité accrue contribueront à garantir que ce que nous construisons est un standard robuste et fiable avec lequel travailler », a déclaré M. Meyer. « Une fois que nous aurons terminé ces fonctionnalités, nous commencerons à construire une infrastructure pour prendre en charge d’autres ensembles de données, y compris la musique, la vidéo et le texte.

IA