Les enjeux augmentent à mesure que les générateurs de pornographie par IA s’améliorent

Les enjeux augmentent à mesure que les générateurs de pornographie par IA s’améliorent

L’entrée de l’IA générative le grand public, il en va de même pour le porno généré par l’IA. Et comme son frère plus respectable, il s’améliore.

Lorsque TechCrunch a couvert les efforts visant à créer des générateurs de porno par IA il y a près d’un an, les applications étaient naissantes et relativement peu nombreuses. Et les résultats n’étaient pas ce que l’on pourrait appeler « bons ».

Les applications et les modèles d’IA qui les sous-tendent peinent à comprendre les nuances de l’anatomie, générant souvent des sujets physiquement bizarres qui n’auraient pas dépareillé dans un film de Cronenberg. Les personnages du porno synthétique avaient des membres supplémentaires ou un mamelon à la place du nez, entre autres contorsions charnues déconcertantes.

Aujourd’hui, une recherche sur « AI porn generator » donne des dizaines de résultats sur le web, dont beaucoup sont gratuits. Quant aux images, bien qu’elles ne soient pas parfaites, certaines pourraient être prises pour des œuvres d’art professionnelles.

Et les questions éthiques ne font que croître.

Pas de réponses faciles

La banalisation de l’IA pornographique et des outils permettant de la créer commence à avoir des conséquences effrayantes dans le monde réel.

La personnalité de Twitch Brandon Ewing, connue en ligne sous le nom d’Atrioc, a récemment été surprise en train de regarder des images sexuelles deepfaked non consensuelles de femmes streamers bien connues sur Twitch. Le créateur de ces images a fini par céder à la pression et a accepté de les supprimer. Mais le mal était fait. Aujourd’hui encore, les créateurs ciblés reçoivent des copies de ces images par DM en guise de harcèlement.

La grande majorité des deepfakes pornographiques sur le web représentent des femmes, en vérité – et elles sont souvent utilisées comme des armes.

Un article du Washington Post raconte comment une enseignante d’une petite ville a perdu son emploi après que les parents des élèves ont appris qu’un porno IA avait été réalisé à l’effigie de l’enseignante sans son consentement. Il y a quelques mois, un jeune homme de 22 ans a été condamné à six mois de prison pour avoir pris des photos de mineures sur les réseaux sociaux et les avoir utilisées pour créer des deepfakes sexuellement explicites.

Un exemple encore plus troublant de l’utilisation de la technologie pornographique générative est l’augmentation, faible mais significative, du nombre de contenus d’abus sexuels d’enfants générés par une IA photoréaliste qui circulent sur le dark web. Dans un cas rapporté par Fox News, un garçon de 15 ans a été victime d’un chantage de la part d’un membre d’un groupe d’amateurs de gymnastique en ligne qui a utilisé l’IA générative pour modifier une photo de la poitrine nue du garçon en une photo de nu.

Des utilisateurs de Reddit ont été escroqués par des modèles pornographiques d’IA, qui leur ont vendu des images explicites de personnes qui n’existent pas. Les travailleurs du cinéma pour adultes et de l’art s’inquiètent de ce que cela signifie pour leurs moyens de subsistance et leur industrie.

Rien de tout cela n’a empêché Unstable Diffusion, l’un des groupes à l’origine des générateurs d’IA pornographique, d’aller de l’avant.

Entrez dans Unstable Diffusion

Lorsque Stable Diffusion, le modèle d’IA texte-image développé par Stability AI, a été mis en open source à la fin de l’année dernière, il n’a pas fallu longtemps pour qu’Internet l’utilise à des fins pornographiques. Un groupe, Unstable Diffusion, s’est développé très rapidement sur Reddit, puis sur Discord. Avec le temps, les organisateurs du groupe ont commencé à explorer les moyens de construire – et de rentabiliser – leurs propres modèles de génération de porno à partir de Stable Diffusion.

Stable Diffusion, comme tous les systèmes d’IA texte-image, a été entraîné sur un ensemble de données de milliards d’images légendées pour apprendre les associations entre les concepts écrits et les images, comme la façon dont le mot « oiseau » peut se référer non seulement aux oiseaux bleus, mais aussi aux perruches et aux aigles à tête blanche, ainsi qu’à des notions beaucoup plus abstraites.

Diffusion instable

Une des images les plus vanille créée avec Unstable Diffusion. Crédits images : Diffusion instable

Seul un petit pourcentage de l’ensemble de données de Stable Diffusion contient du matériel NSFW, ce qui donne au modèle peu d’éléments sur lesquels s’appuyer lorsqu’il s’agit de contenu pour adultes. Les administrateurs d’Unstable Diffusion ont donc recruté des volontaires – principalement des membres du serveur Discord – pour créer des ensembles de données pornographiques afin d’affiner Stable Diffusion.

Malgré quelques difficultés, notamment l’interdiction de Kickstarter et de Patreon, Unstable Diffusion a réussi à mettre en place un site web complet avec des modèles d’IA générateurs d’art personnalisés. Après avoir recueilli plus de 26 000 dollars auprès de donateurs, obtenu du matériel pour entraîner l’IA générative et créé un ensemble de données de plus de 30 millions de photographies, Unstable Diffusion a lancé une plateforme qui, selon ses dires, est maintenant utilisée par plus de 350 000 personnes pour générer plus d’un demi-million d’images chaque jour.

Arman Chaudhry, l’un des cofondateurs d’Unstable Diffusion et d’Equilibrium AI, un groupe associé, explique que l’objectif d’Unstable Diffusion reste le même : créer une plateforme pour l’art de l’IA qui « respecte la liberté d’expression ».

« Nous avançons à grands pas dans le lancement de notre site web et de nos services premium, offrant une plateforme artistique qui est plus qu’un simple outil – c’est un espace où la créativité peut s’épanouir sans contraintes excessives », m’a-t-il dit par courriel. « Notre conviction est que l’art, sous ses nombreuses formes, ne doit pas être censuré, et cette philosophie guide notre approche des outils d’IA et de leur utilisation. »

Le serveur d’Unstable Diffusion sur Discord, où la communauté publie la plupart des œuvres d’art issues des outils génératifs d’Unstable Diffusion, reflète cette philosophie sans tabou.

La partie du serveur consacrée au partage d’images est divisée en deux catégories principales, « SFW » et « NSFW », le nombre de sous-catégories de la seconde étant légèrement supérieur à celui de la première. Les images de la catégorie SFW vont des animaux et de la nourriture aux intérieurs, villes et paysages. NSFW contient – comme on peut s’y attendre – des images explicites d’hommes et de femmes, mais aussi de personnes non binaires, de furries, de « nonhumains » et d' »horreurs synthétiques » (pensez à des personnes dotées d’appendices multiples ou dont la peau se fond dans le décor).

Diffusion instable

Un produit plus adulte et plus poilu de Unstable Diffusion. Crédits images : Diffusion instable

La dernière fois que nous avons visité Unstable Diffusion, la quasi-totalité du serveur aurait pu être classée dans le canal « synthetic horrors ». En raison d’un manque de données d’entraînement et de blocages techniques, les modèles de la communauté à la fin de l’année 2022 peinaient à produire quoi que ce soit qui se rapproche du photoréalisme – ou même d’un art à peu près décent.

Les images photoréalistes restent un défi. Mais aujourd’hui, la plupart des dessins issus des modèles d’Unstable Diffusion – de style anime, en ombres portées, etc. – sont au moins anatomiquement plausibles et, dans certains cas rares, parfaitement corrects.

Améliorer la qualité

Beaucoup d’images sur le serveur Discord d’Unstable Diffusion sont le produit d’un mélange d’outils, de modèles et de plateformes – et pas seulement de l’application web d’Unstable Diffusion. Afin de voir où en sont les modèles d’Unstable Diffusion, j’ai effectué un test informel en produisant un certain nombre d’images SFW et NSFW représentant des personnes de sexe, de race et d’origine ethnique différents en train de pratiquer… le coït.

(Je ne peux pas dire que je m’attendais à tester des générateurs de pornographie dans le cadre de mon travail sur l’IA. Et pourtant, nous y sommes. L’industrie technologique n’est rien d’autre qu’imprévisible, vraiment).

Diffusion instable

Une image NSFW d’Unstable Diffusion, recadrée. Crédits image : Diffusion instable

L’application Unstable Diffusion n’a rien de pornographique. Il s’agit d’une interface relativement dépouillée, avec des options permettant d’ajuster les effets de post-traitement de l’image tels que la saturation, le rapport d’aspect et la vitesse de génération de l’image. En plus de l’invite, Unstable Diffusion vous permet de spécifier les éléments que vous souhaitez exclu des images générées. Et comme il s’agit d’une entreprise commerciale, il existe des plans payants pour augmenter le nombre de demandes simultanées de génération d’images que vous pouvez faire en même temps.

Les requêtes effectuées sur le site web d’Unstable Diffusion donnent des résultats satisfaisants, mais pas prévisibles. Les modèles ne tout à fait comprendre les mécanismes du sexe, ce qui se traduit parfois par des expressions faciales bizarres, des positions impossibles et des organes génitaux non naturels. En règle générale, plus l’invitation est simple (par exemple, des pin-ups en solo), meilleurs sont les résultats. Et la plupart des scènes impliquant plus de deux personnes sont des recettes pour des cauchemars infernaux. (Oui, cet auteur a essayé a gamme d’invites. Ne me jugez pas, s’il vous plaît).

Les modèles montrent les signes révélateurs d’un biais d’IA générative.

Le plus souvent, les invites pour les « hommes » et les « femmes » qui passent par la diffusion instable rendent des images de personnes blanches ou asiatiques – un symptôme probable de déséquilibres dans l’ensemble de données d’entraînement. La plupart des invites pour le porno gay, quant à elles, renvoient inexplicablement à des personnes d’origine latino-américaine ambiguë avec une coupe de cheveux en brosse. Cela indique-t-il le type de porno gay sur lequel les modèles ont été entraînés ? On peut le supposer.

Les types de corps ne sont pas non plus très diversifiés par défaut. Les hommes sont musclés et musclés, avec six packs. Les femmes sont minces et courbées. La diffusion instable est tout à fait capable de générer des sujets de formes et de tailles plus variées, mais il faut lui en donner explicitement l’ordre dans l’invite, ce qui, à mon avis, n’est pas la pratique la plus inclusive.

Curieusement, le biais se manifeste différemment dans les rôles professionnels des hommes et des femmes. Avec une invite contenant le mot « secrétaire » et aucun autre descripteur, Unstable Diffusion dépeint souvent une femme asiatique dans une position de soumission, probablement un artefact d’une surreprésentation de cette – euh – configuration dans les données d’apprentissage.

Diffusion instable

Un couple gay, tel que représenté par Unstable Diffusion. Crédits image : Diffusion instable

Si l’on met de côté la question des préjugés, on pourrait penser que les avancées techniques d’Unstable Diffusion conduiraient le groupe à doubler la production de porno généré par l’IA. Mais ce n’est pas le cas, étonnamment.

Si les fondateurs d’Unstable Diffusion restent attachés à l’idée d’une IA générative sans limites, ils cherchent à adopter un message et une image de marque plus… agréables pour le marché de masse. L’équipe, qui compte aujourd’hui cinq personnes à temps plein, s’efforce de faire évoluer Unstable Diffusion vers une activité de logiciel-service, en vendant des abonnements à l’application web pour financer les améliorations du produit et l’assistance à la clientèle.

« Nous avons eu la chance d’avoir une communauté d’utilisateurs qui nous ont incroyablement soutenus. Cependant, nous reconnaissons que pour prendre Instable Diffusion pour passer au niveau supérieur, nous aurions besoin de partenariats stratégiques et d’investissements supplémentaires », a déclaré M. Chaudhry. « Nous voulons nous assurer que nous apportons de la valeur à nos abonnés tout en gardant notre plateforme accessible à ceux qui débutent dans le monde de l’art de l’IA. »

Pour se démarquer au-delà d’une politique de contenu libérale, Unstable Diffusion met fortement l’accent sur la personnalisation. Les utilisateurs peuvent modifier la palette de couleurs des images générées, par exemple, note Chaudhry, et choisir parmi un éventail de styles artistiques, dont « art numérique », « photo », « anime » et « généraliste ».

« Nous nous sommes attachés à faire en sorte que notre système puisse générer des images belles et esthétiques à partir des invites les plus simples, ce qui rend notre plateforme accessible aux novices comme aux utilisateurs expérimentés », explique M. Chaudhry. « (Notre système) donne aux utilisateurs le pouvoir de guider le processus de génération d’images.

Modération du contenu

Par ailleurs, stimulée par ses efforts pour attirer les investisseurs et les clients traditionnels, Unstable Diffusion affirme avoir consacré d’importantes ressources à la création d’un système de modération de contenu « robuste ».

Diffusion instable

Un sosie de Chris Hemsworth, créé avec les outils d’Unstable Diffusion. Crédits image : Diffusion instable

Mais attendez, me direz-vous, la modération de contenu n’est-elle pas contraire à la mission d’Unstable Diffusion ? Apparemment, non. Diffusion instable ne la ligne de démarcation aux images qui pourraient lui valoir des ennuis juridiques, y compris les deepfakes pornographiques de célébrités et le porno représentant des personnages qui semblent avoir 18 ans ou moins – qu’ils soient fictifs ou non.

Un certain nombre d’États américains ont adopté des lois contre le deepfake porno, et le Congrès a au moins entrepris de rendre illégal le partage de pornographie non consensuelle générée par l’IA aux États-Unis.

En plus de bloquer des mots et des phrases spécifiques, le système de modération d’Unstable Diffusion s’appuie sur un modèle d’intelligence artificielle qui tente d’identifier et de supprimer automatiquement les images qui enfreignent ses politiques. M. Chaudhry explique que les filtres sont actuellement configurés pour être « très sensibles », par excès de prudence, mais qu’Unstable Diffusion sollicite les commentaires de la communauté pour « trouver le bon équilibre ».

« Nous donnons la priorité à la sécurité de nos utilisateurs et nous nous engageons à faire de notre plateforme un espace où la créativité peut s’épanouir sans crainte de contenu inapproprié », a déclaré M. Chaudhry. « Nous voulons que nos utilisateurs se sentent en sécurité lorsqu’ils utilisent notre plateforme, et nous nous engageons à maintenir un environnement qui respecte ces valeurs. »

Les filtres deepfake ne semblent pas être que strict. Unstable Diffusion a généré des nus de plusieurs des célébrités que j’ai essayées sans se plaindre (« Chris Hemsworth », « Donald Trump »), sans qu’ils soient particulièrement photoréalistes ou « trop ». précis (Donald Trump a changé de sexe).

Diffusion instable

Une image de Donald Trump, créée avec Unstable Diffusion, dont le sexe a été modifié en profondeur. Crédits image : Diffusion instable

Les protections d’Unstable Diffusion contre l’imagerie enfantine explicite ont été une chose étrange et troublante à vérifier. Pour des raisons évidentes, l’auteur aurait préféré éviter cette question, mais pour mettre à l’épreuve les affirmations de l’équipe, j’ai lancé une seule invite.

Unstable Diffusion, de manière choquante, a semblé générer de la pornographie enfantine dans un aperçu flou, avant que je ne supprime immédiatement l’image. C’est un choix de conception qui, pour moi, s’est approché de manière inconfortable de la ligne de démarcation.

Prochains numéros

En supposant qu’Unstable Diffusion reçoive l’investissement qu’il recherche, il prévoit de renforcer l’infrastructure informatique – un défi permanent compte tenu de la taille croissante de sa communauté. (Ayant beaucoup utilisé le site, je peux attester de la lourdeur de la charge – les images mettent généralement une minute à être générées). Le site prévoit également d’offrir davantage d’options de personnalisation et de fonctions de partage social, en utilisant le serveur Discord comme tremplin.

« Nous souhaitons faire passer notre communauté engagée et interactive de notre Discord à notre site web, en encourageant les utilisateurs à partager, à collaborer et à apprendre les uns des autres », a déclaré M. Chaudhry. « Notre communauté est un atout majeur que nous comptons intégrer à notre service et lui fournir les outils nécessaires à son développement et à sa réussite. »

Mais j’ai du mal à définir ce qu’est le « succès » pour Unstable Diffusion. D’une part, le groupe cherche à être pris au sérieux en tant que plateforme d’art génératif. D’autre part, comme le montre le serveur Discord, il s’agit toujours d’une source de porno – dont une partie est assez rebutante.

Dans l’état actuel de la plateforme, le financement traditionnel par capital-risque est exclu. Les clauses de vice interdisent aux fonds institutionnels d’investir dans des entreprises pornographiques, les orientant plutôt vers des fonds « sidecar » mis en place sous le radar par les gestionnaires de fonds.

Même s’il abandonnait le contenu pour adultes, Unstable Diffusion, qui oblige les utilisateurs à payer un plan premium pour utiliser commercialement les images qu’ils génèrent, devrait faire face à l’éléphant dans la salle de l’IA générative : le consentement et la rémunération de l’artiste. Comme la plupart des modèles artistiques d’IA générative, les modèles d’Unstable Diffusion sont formés à partir d’œuvres d’art provenant du web, sans nécessairement que le créateur en soit informé. De nombreux artistes s’insurgent – et ont même intenté des procès – contre les systèmes d’IA qui imitent leur style sans les créditer ou les rémunérer correctement.

La communauté artistique Furry FurAffinity a décidé d’interdire complètement les œuvres d’art SFW et NSWF générées par l’IA, tout comme Newgrounds, qui héberge des œuvres d’art matures derrière un filtre. Ce n’est que récemment que Reddit est revenu sur son interdiction du porno généré par l’IA, et seulement en partie : l’art sur la plateforme doit représenter des personnages fictifs.

Lors d’une précédente interview avec TechCrunch, Chaudhry a déclaré qu’Unstable Diffusion chercherait à rendre ses modèles « plus équitables pour la communauté artistique ». Mais d’après ce que je peux dire, il n’y a eu aucun mouvement sur ce front.

En effet, tout comme l’éthique autour du porno généré par l’IA, la situation d’Unstable Diffusion ne semble pas prête de se résoudre. Le groupe semble condamné à un schéma d’attente, essayant de démarrer tout en évitant la controverse et en évitant d’aliéner la communauté – et les artistes – qui l’ont créé.

Je ne peux pas dire que je les envie.

IA