La semaine de l’IA : l’IA générative envahit le web

La semaine de l’IA : l’IA générative envahit le web

Suivre l’évolution d’un secteur aussi rapide que l’IA n’est pas une mince affaire. En attendant qu’une IA puisse le faire à votre place, voici un récapitulatif pratique des événements récents dans le monde de l’apprentissage automatique, ainsi que des recherches et expériences notables que nous n’avons pas couvertes par elles-mêmes.

Cette semaine, SpeedyBrand, une entreprise qui utilise l’IA générative pour créer du contenu optimisé pour le référencement, est sortie de la clandestinité avec le soutien de Y Combinator. Elle n’a pas encore attiré beaucoup de fonds (2,5 millions de dollars) et sa base de clients est relativement petite (environ 50 marques). Mais cela m’a fait réfléchir à la manière dont l’IA générative commence à modifier la composition du web.

Comme l’a écrit James Vincent de The Verge dans un article récent, les modèles d’IA générative permettent de générer des contenus de moindre qualité à moindre coût et plus facilement. Newsguard, une société qui fournit des outils pour vérifier les sources d’information, a révélé des centaines de sites financés par la publicité avec des noms à consonance générique contenant des informations erronées créées à l’aide de l’IA générative.

Cela pose un problème aux annonceurs. De nombreux sites mis en lumière par Newsguard semblent avoir été conçus exclusivement pour abuser de la publicité programmatique, c’est-à-dire des systèmes automatisés permettant d’insérer des publicités sur des pages. Dans son rapport, Newsguard a trouvé près de 400 cas de publicités de 141 grandes marques apparaissant sur 55 des sites d’information indésirables.

Les annonceurs ne sont pas les seuls à s’inquiéter. Comme le souligne Kyle Barr de Gizmodo, il suffirait d’un seul article généré par l’IA pour susciter des montagnes d’engagement. Et même si chaque article généré par l’IA ne génère que quelques dollars, c’est moins que le coût de la génération du texte en premier lieu – et de l’argent publicitaire potentiel qui n’est pas envoyé à des sites légitimes.

Quelle est donc la solution ? Y en a-t-il une ? C’est une question qui m’empêche de dormir. M. Barr suggère qu’il incombe aux moteurs de recherche et aux plateformes publicitaires d’exercer une emprise plus stricte et de punir les mauvais acteurs qui adoptent l’IA générative. Mais compte tenu de la rapidité avec laquelle le domaine évolue – et de la nature infiniment évolutive de l’IA générative – je ne suis pas convaincu qu’ils puissent suivre le rythme.

Bien sûr, le contenu indésirable n’est pas un phénomène nouveau, et il y a déjà eu des vagues. Le web s’est adapté. Ce qui est différent cette fois-ci, c’est que la barrière à l’entrée est extrêmement faible, tant en termes de coût que de temps à investir.

Vincent adopte un ton optimiste, laissant entendre que si le web est un jour ou l’autre envahi de déchets d’IA, cela pourrait stimuler le développement de plates-formes mieux financées. Je n’en suis pas si sûr. Ce qui ne fait aucun doute, en revanche, c’est que nous sommes à un point d’inflexion et que les décisions prises aujourd’hui au sujet de l’IA générative et de ses résultats auront un impact sur la fonction du web pendant un certain temps encore.

Voici d’autres articles sur l’IA parus ces derniers jours :

OpenAI lance officiellement GPT-4 : OpenAI a annoncé cette semaine la disponibilité générale de GPT-4, son dernier modèle de génération de texte, via son API payante. GPT-4 peut générer du texte (y compris du code) et accepter des images et du texte – une amélioration par rapport à GPT-3.5, son prédécesseur, qui n’acceptait que du texte – et réalise des performances de « niveau humain » sur divers benchmarks professionnels et académiques. Mais il n’est pas parfait, comme nous l’avons indiqué dans notre précédent article. (Entre-temps, l’adoption de ChatGPT serait en baisse, mais nous verrons bien).

Maîtriser l’IA « superintelligente » : Dans d’autres nouvelles d’OpenAI, la société forme une nouvelle équipe dirigée par Ilya Sutskever, son scientifique en chef et l’un des cofondateurs d’OpenAI, pour développer des moyens de diriger et de contrôler des systèmes d’IA « superintelligents ».

Une loi contre les préjugés pour la ville de New York : Après des mois de retard, la ville de New York a commencé cette semaine à appliquer une loi qui oblige les employeurs utilisant des algorithmes pour recruter, embaucher ou promouvoir des employés à soumettre ces algorithmes à un audit indépendant – et à rendre les résultats publics.

Valve approuve tacitement les jeux générés par l’IA : Valve a fait une rare déclaration après avoir affirmé qu’il rejetait de sa boutique de jeux Steam les jeux contenant des éléments générés par l’IA. Le développeur, notoirement fermé, a déclaré que sa politique évoluait et qu’elle ne s’opposait pas à l’IA.

Humane dévoile l’Ai Pin : Humane, la startup lancée par Imran Chaudhri et Bethany Bongiorno, deux anciens ingénieurs et designers d’Apple, a dévoilé cette semaine les détails de son premier produit : L’Ai Pin. Il s’avère que le produit de Humane est un gadget portable doté d’un écran projeté et de fonctions alimentées par l’IA – comme un smartphone futuriste, mais dans un facteur de forme très différent.

Avertissements concernant la réglementation européenne sur l’IA : Des fondateurs, des PDG, des sociétés de capital-risque et des géants de l’industrie de toute l’Europe ont signé une lettre ouverte à la Commission européenne cette semaine, avertissant que l’Europe pourrait rater la révolution de l’IA générative si l’UE adopte des lois qui étouffent l’innovation.

L’escroquerie Deepfake fait le tour du monde : A vérifier ce clip du champion britannique du crédit à la consommation, Martin Lewis, qui semble vanter les mérites d’une opportunité d’investissement soutenue par Elon Musk. Cela semble normal, non ? Pas tout à fait. Il s’agit d’un deepfake généré par l’IA – et potentiellement d’un aperçu de la misère générée par l’IA qui s’accélère rapidement sur nos écrans.

Des jouets sexuels alimentés par l’IA : Lovense – peut-être plus connu pour ses sex toys télécommandables – a annoncé cette semaine son ChatGPT Pleasure Companion. Lancé en version bêta dans l’application de télécommande de la société, le « Advanced Lovense ChatGPT Pleasure Companion » vous invite à vous laisser aller à des histoires juteuses et érotiques que le compagnon crée sur la base du sujet que vous avez sélectionné.

Autres apprentissages automatiques

Notre tour d’horizon de la recherche commence avec deux projets très différents de l’ETH Zurich. Le premier est aiEndoscopic, une retombée de l’intubation intelligente. L’intubation est nécessaire à la survie d’un patient dans de nombreuses circonstances, mais il s’agit d’une procédure manuelle délicate généralement effectuée par des spécialistes. L’intuBot utilise la vision par ordinateur pour reconnaître et répondre à un flux en direct de la bouche et de la gorge, guidant et corrigeant la position de l’endoscope. Cela pourrait permettre aux gens d’intuber en toute sécurité lorsque c’est nécessaire plutôt que d’attendre le spécialiste, ce qui pourrait sauver des vies.

Voici une explication un peu plus détaillée :

Dans un tout autre domaine, les chercheurs de l’ETH Zurich ont également apporté leur contribution à un film de Pixar en mettant au point la technologie nécessaire pour animer la fumée et le feu sans tomber dans la complexité fractale de la dynamique des fluides. Leur approche a été remarquée et exploitée par Disney et Pixar pour le film Elemental. Il est intéressant de noter qu’il ne s’agit pas tant d’une solution de simulation que d’un transfert de style – un raccourci intelligent et apparemment très utile. (L’image du haut est tirée de ce document)

L’IA dans la nature est toujours intéressante, mais l’IA dans la nature appliquée à l’archéologie l’est encore plus. Des recherches menées par l’université de Yamagata visaient à identifier de nouvelles lignes de Nasca – les énormes « géoglyphes » du Pérou. On pourrait penser que, visibles depuis l’orbite, elles sont assez évidentes, mais l’érosion et le couvert végétal des millénaires écoulés depuis la création de ces mystérieuses formations signifient qu’un nombre inconnu d’entre elles se cachent juste à l’abri des regards. Après avoir été entraîné sur des images aériennes de géoglyphes connus et cachés, un modèle d’apprentissage profond a été libéré sur d’autres vues et, étonnamment, il a détecté au moins quatre nouveaux géoglyphes, comme vous pouvez le voir ci-dessous. Plutôt excitant !

Quatre géoglyphes de Nasca récemment découverts par un agent d’intelligence artificielle.

De manière plus immédiate, les technologies liées à l’IA trouvent toujours de nouvelles applications pour la détection et la prévision des catastrophes naturelles. Les ingénieurs de Stanford rassemblent des données pour entraîner les futurs modèles de prévision des incendies de forêt en effectuant des simulations de l’air chauffé au-dessus d’un couvert forestier dans un réservoir d’eau de 30 pieds. Si nous voulons modéliser la physique des flammes et des braises qui se déplacent en dehors des limites d’un incendie de forêt, nous devons mieux les comprendre, et cette équipe fait tout ce qu’elle peut pour s’en approcher.

À l’UCLA, on étudie comment prédire les glissements de terrain, qui sont de plus en plus fréquents à mesure que les incendies et d’autres facteurs environnementaux changent. Mais si l’IA a déjà été utilisée pour les prédire avec un certain succès, elle ne « montre pas son travail », ce qui signifie qu’une prédiction n’explique pas si elle est due à l’érosion, au déplacement d’une nappe phréatique ou à l’activité tectonique. Grâce à une nouvelle approche de « réseau neuronal superposable », les couches du réseau utilisent des données différentes mais fonctionnent en parallèle plutôt que toutes ensemble, ce qui permet d’obtenir des résultats un peu plus précis quant aux variables qui ont conduit à un risque accru. Cette approche est également beaucoup plus efficace.

Google se penche sur un défi intéressant : comment faire en sorte qu’un système d’apprentissage automatique apprenne à partir de connaissances dangereuses sans pour autant les propager ? Par exemple, si son ensemble d’apprentissage comprend la recette du napalm, vous ne voulez pas qu’il la répète – mais pour savoir qu’il ne la répète pas, il doit savoir ce qu’il ne répète pas. Un paradoxe ! Le géant de la technologie cherche donc une méthode de « désapprentissage de la machine » qui permette de réaliser ce genre d’exercice d’équilibre de manière sûre et fiable.

Si vous cherchez à comprendre pourquoi les gens semblent faire confiance aux modèles d’IA sans raison valable, ne cherchez pas plus loin que cet éditorial de Science par Celeste Kidd (UC Berkeley) et Abeba Birhane (Mozilla). Il aborde les fondements psychologiques de la confiance et de l’autorité et montre comment les agents d’IA actuels les utilisent essentiellement comme tremplins pour accroître leur propre valeur. C’est un article très intéressant si vous voulez avoir l’air intelligent ce week-end.

Bien que l’on entende souvent parler de l’infâme machine à jouer aux échecs Mechanical Turk, cette mascarade a inspiré des gens à créer ce qu’elle prétendait être. IEEE Spectrum raconte l’histoire fascinante du physicien et ingénieur espagnol Torres Quevedo, qui a créé un véritable joueur d’échecs mécanique. Ses capacités étaient limitées, mais c’est ainsi que l’on sait qu’il est réel. Certains avancent même que sa machine à jouer les échecs a été le premier « jeu d’ordinateur ». De quoi faire réfléchir.

IA