Les artistes devraient-ils être payés pour les données d’entraînement ? Le vice-président de l’OpenAI ne veut pas se prononcer

Les artistes devraient-ils être payés pour les données d’entraînement ? Le vice-président de l’OpenAI ne veut pas se prononcer

Les artistes dont les œuvres ont été utilisées pour entraîner l’IA générative comme ChatGPT devraient-ils être rémunérés pour leurs contributions ? Peter Deng, vice-président des produits grand public chez OpenAI – le fabricant de ChatGPT – n’a pas voulu répondre à la question qui lui a été posée sur la scène principale de SXSW cet après-midi.

« C’est une excellente question », a-t-il déclaré lorsque Josh Constine, partenaire de SignalFire (et ancien rédacteur de TechCrunch), qui a interviewé Deng dans le cadre d’un vaste débat, a posé la question. Dans la foule des spectateurs, certains ont crié « oui » en réponse, ce que M. Deng a reconnu. « Le public me dit que c’est le cas. J’entends le public dire que c’est le cas.

Le fait que M. Deng ait esquivé la question n’est pas surprenant. OpenAI se trouve dans une position juridique délicate en ce qui concerne la manière dont elle utilise les données pour former des systèmes d’IA générative tels que l’outil de création artistique DALL-E 3, qui est incorporé dans ChatGPT.

Les systèmes comme DALL-E 3 sont entraînés à partir d’un très grand nombre d’exemples – œuvres d’art, illustrations, photos et autres – provenant généralement de sites publics et d’ensembles de données sur le web. OpenAI et d’autres fournisseurs d’IA générative soutiennent que l’usage loyal, la doctrine juridique qui autorise l’utilisation d’œuvres protégées par le droit d’auteur pour réaliser une création secondaire à condition qu’elle soit transformative, protège leur pratique consistant à récupérer des données publiques et à les utiliser pour l’entraînement sans rémunérer ni même créditer les artistes.

OpenAI a d’ailleurs récemment affirmé qu’il serait impossible de créer des modèles d’IA utiles en l’absence de matériel protégé par le droit d’auteur. « L’entraînement de modèles d’IA à l’aide de matériel accessible au public sur l’internet est une utilisation équitable, comme le montrent des précédents de longue date et largement acceptés », écrit l’entreprise dans un billet de blog daté de janvier. « Nous considérons que ce principe est juste pour les créateurs, nécessaire pour les innovateurs et essentiel pour la compétitivité des États-Unis.

Les créateurs, sans surprise, ne sont pas d’accord.

Un recours collectif intenté par des artistes, dont Grzegorz Rutkowski, connu pour son travail sur Dungeons &amp ; Dragons et Magic : The Gathering, contre OpenAI et plusieurs de ses rivaux (Midjourney et DeviantArt) est en cours d’examen par les tribunaux. Les défendeurs font valoir que des outils tels que DALL-E 3 et Midjourney reproduisent les styles des artistes sans leur autorisation explicite, ce qui permet aux utilisateurs de générer de nouvelles œuvres ressemblant aux originaux des artistes, sans que ces derniers ne soient rémunérés.

OpenAI a conclu des accords de licence avec certains fournisseurs de contenu, comme Shutterstock, et permet aux webmasters d’empêcher son robot d’explorer leur site à la recherche de données d’apprentissage. En outre, comme certains de ses rivaux, OpenAI permet aux artistes de se retirer des ensembles de données que l’entreprise utilise pour entraîner ses modèles de génération d’images. (Certains artistes ont toutefois qualifié d’onéreux l’outil de retrait, qui exige de soumettre une copie individuelle de chaque image à retirer, accompagnée d’une description).

Deng a déclaré qu’il pensait que les artistes devraient devrait avoir plus de pouvoir dans la création et l’utilisation d’outils d’IA générative comme DALL-E, mais ne sait pas exactement quelle forme cela pourrait prendre.

« Les artistes doivent faire partie de l’écosystème autant que possible », a déclaré M. Deng. « Je pense que si nous pouvons trouver un moyen d’accélérer la création artistique, nous aiderons vraiment l’industrie… Dans un sens, chaque artiste a été inspiré par les artistes qui l’ont précédé, et je me demande dans quelle mesure cela sera accéléré par ce projet.

IA