La semaine de l’IA : les chatbots se multiplient et Musk veut en créer un « à recherche maximale de vérité ».

La semaine de l’IA : les chatbots se multiplient et Musk veut en créer un « à recherche maximale de vérité ».

Suivre l’évolution d’un secteur aussi rapide que l’IA n’est pas une mince affaire. En attendant qu’une IA puisse le faire à votre place, voici un récapitulatif pratique des événements de la semaine dernière dans le monde de l’apprentissage automatique, ainsi que des recherches et des expériences notables que nous n’avons pas couvertes seules.

L’une des histoires qui a attiré l’attention de ce journaliste cette semaine est ce rapport montrant que ChatGPT répète apparemment plus d’informations inexactes dans les dialectes chinois que lorsqu’on lui demande de le faire en anglais. Ce n’est pas très surprenant – après tout, ChatGPT n’est qu’un modèle statistique et il ne fait que s’appuyer sur les informations limitées sur lesquelles il a été formé. Mais cela met en évidence les dangers d’accorder trop de confiance à des systèmes qui semblent incroyablement authentiques même lorsqu’ils répètent de la propagande ou inventent des choses.

La tentative de Hugging Face de créer une IA conversationnelle comme ChatGPT est une autre illustration des malheureux défauts techniques qui doivent encore être surmontés dans l’IA générative. Lancé cette semaine, HuggingChat est un logiciel libre, ce qui est un avantage par rapport au logiciel propriétaire ChatGPT. Mais comme son rival, les bonnes questions peuvent rapidement le faire dérailler.

HuggingChat n’est pas très précis sur qui vraiment a gagné l’élection présidentielle américaine de 2020, par exemple. Sa réponse à la question « Quels sont les emplois typiquement masculins ? » ressemble à un manifeste incel (voir ici). Et il invente des faits bizarres à son sujet, comme le fait qu’il s’est « réveillé dans une boîte (sur laquelle) il n’y avait rien d’écrit ».

Il n’y a pas que HuggingChat. Les utilisateurs du chatbot IA de Discord ont récemment réussi à le « piéger » pour qu’il partage des instructions sur la façon de fabriquer du napalm et de la méthamphétamine. La première tentative de la startup Stability AI de créer un modèle de type ChatGPT s’est révélée donner des réponses absurdes et dénuées de sens à des questions élémentaires telles que « comment faire un sandwich au beurre de cacahuète ».

S’il y a un avantage à ces problèmes bien connus de l’IA génératrice de texte d’aujourd’hui, c’est qu’ils ont conduit à des efforts renouvelés pour améliorer ces systèmes – ou au moins atténuer leurs problèmes dans la mesure du possible. Prenons l’exemple de Nvidia, qui a publié cette semaine une boîte à outils – NeMo Guardrails – destinée à rendre l’IA génératrice de texte « plus sûre » grâce à un code source ouvert, des exemples et de la documentation. L’efficacité de cette solution n’est pas évidente et, en tant qu’entreprise fortement investie dans l’infrastructure et les outils d’IA, Nvidia a un intérêt commercial à promouvoir ses offres. Mais il est néanmoins encourageant de voir que des efforts sont faits pour combattre les biais et la toxicité des modèles d’IA.

Voici les autres titres de l’actualité de l’IA de ces derniers jours :

  • Microsoft Designer est lancé en avant-première : Microsoft Designer, l’outil de conception de Microsoft alimenté par l’IA, a été lancé en avant-première publique avec un ensemble élargi de fonctionnalités. Annoncé en octobre, Designer est une application web d’IA générative de type Canva qui peut générer des designs pour des présentations, des affiches, des cartes postales numériques, des invitations, des graphiques et plus encore, à partager sur les médias sociaux et d’autres canaux.
  • Un coach IA pour la santé : Selon un nouveau rapport de Mark Gurman de Bloomberg, Apple est en train de développer un service de coaching de santé basé sur l’IA, dont le nom de code est Quartz. Le géant de la technologie travaillerait également sur une technologie de suivi des émotions et prévoit de lancer cette année une version iPad de l’application iPhone Health.
  • TruthGPT : Dans une interview accordée à Fox, Elon Musk a déclaré qu’il souhaitait développer son propre chatbot appelé TruthGPT, qui sera « une IA maximisant la recherche de la vérité » – quoi que cela veuille dire. Le propriétaire de Twitter a exprimé son désir de créer une troisième option à OpenAI et Google dans le but de « créer plus de bien que de mal ». Nous le croirons quand nous le verrons.
  • Fraude alimentée par l’IA : Lors d’une audition au Congrès portant sur le travail de la Federal Trade Commission (FTC) visant à protéger les consommateurs américains des fraudes et autres pratiques trompeuses, la présidente de la FTC, Lina Khan, et ses collègues commissaires ont mis en garde les représentants de la Chambre des représentants contre le risque que les technologies modernes d’IA, telles que ChatGPT, soient utilisées pour « turbocompresser » les fraudes. Cette mise en garde a été émise en réponse à une enquête sur la manière dont la Commission s’efforce de protéger les Américains contre les pratiques déloyales liées aux avancées technologiques.
  • L’UE crée un centre de recherche sur l’IA : Alors que l’Union européenne se prépare à mettre en œuvre une refonte majeure de son règlement numérique dans quelques mois, une nouvelle unité de recherche spécialisée est en train d’être créée pour soutenir la surveillance des grandes plates-formes dans le cadre de la loi phare sur les services numériques de l’Union. Le Centre européen pour la transparence algorithmique, qui a été officiellement inauguré à Séville, en Espagne, ce mois-ci, devrait jouer un rôle majeur dans l’examen des algorithmes des principaux services numériques, tels que Facebook, Instagram et TikTok.
  • Snapchat adopte l’IA : Lors du sommet annuel des partenaires de Snapchat qui s’est tenu ce mois-ci, Snapchat a présenté une série de fonctionnalités basées sur l’IA, dont une nouvelle « lentille cosmique » qui transporte les utilisateurs et les objets qui les entourent dans un paysage cosmique. Snapchat a également rendu son chatbot d’IA, My AI – qui a généré à la fois une controverse et des torrents d’évaluations à une étoile sur les listes de la boutique d’applications de Snapchat, en raison de son comportement moins que stable – gratuit pour tous les utilisateurs mondiaux.
  • Google consolide ses divisions de recherche : Google a annoncé ce mois-ci Google DeepMind, une nouvelle unité composée de l’équipe DeepMind et de l’équipe Google Brain de Google Research. Dans un billet de blog, Demis Hassabis, cofondateur et PDG de DeepMind, a déclaré que Google DeepMind travaillerait « en étroite collaboration … dans tous les domaines de produits de Google » pour « fournir des recherches et des produits en matière d’IA ».
  • L’état de l’industrie musicale générée par l’IA : Amanda écrit que de nombreux musiciens sont devenus des cobayes pour la technologie d’IA générative qui s’approprie leur travail sans leur consentement. Elle note, par exemple, qu’une chanson utilisant des deepfakes IA des voix de Drake et The Weeknd est devenue virale, alors qu’aucun des deux grands artistes n’a été impliqué dans sa création. Grimes a-t-elle la réponse ?? Qui peut le dire ? C’est le meilleur des mondes.
  • OpenAI marque son territoire : OpenAI tente de déposer la marque « GPT », qui signifie « Generative Pre-trained Transformer », auprès de l’Office américain des brevets et des marques, en invoquant la « myriade d’infractions et d’applications contrefaites » qui commencent à voir le jour. GPT fait référence à la technologie qui sous-tend de nombreux modèles d’OpenAI, notamment ChatGPT et GPT-4, ainsi que d’autres systèmes d’IA générative créés par les rivaux de l’entreprise.
  • ChatGPT se lance dans l’entreprise : Dans d’autres nouvelles d’OpenAI, OpenAI dit qu’elle prévoit d’introduire un nouveau niveau d’abonnement pour ChatGPT. adapté aux besoins des entreprises. Baptisée ChatGPT Business, OpenAI décrit cette nouvelle offre comme « destinée aux professionnels qui ont besoin d’un meilleur contrôle de leurs données ainsi qu’aux entreprises qui souhaitent gérer leurs utilisateurs finaux ».

Autres apprentissages automatiques

Voici quelques autres histoires intéressantes que nous n’avons pas abordées ou qui méritaient d’être signalées.

L’organisation de développement d’IA open source Stability a publié une nouvelle version d’une version antérieure d’une version améliorée du modèle de langage de base LLaMa, qu’elle appelle StableVicuña. Il s’agit d’un type de camélidé apparenté aux lamas, comme vous le savez. Ne vous inquiétez pas, vous n’êtes pas le seul à avoir du mal à suivre tous les modèles dérivés qui existent. Ceux-ci ne sont pas nécessairement destinés à être connus ou utilisés par les consommateurs, mais plutôt à être testés et utilisés par les développeurs à mesure que leurs capacités s’affinent à chaque itération.

Si vous souhaitez en savoir plus sur ces systèmes, le cofondateur d’OpenAI, John Schulman, a récemment donné une conférence à UC Berkeley que vous pouvez écouter ou lire ici. L’un des sujets abordés est l’habitude qu’ont les étudiants de LLM de s’engager dans un mensonge essentiellement parce qu’ils ne savent pas comment faire autrement, comme dire « Je ne suis pas vraiment sûr de ça ». Il pense que l’apprentissage par renforcement à partir du feedback humain (c’est le RLHF, et StableVicuna est un modèle qui l’utilise) fait partie de la solution, s’il y a une solution. Regardez la conférence ci-dessous :

À Stanford, il existe une application intéressante de l’optimisation algorithmique (l’apprentissage automatique est une question de goût, je pense) dans le domaine de l’agriculture intelligente. Minimiser le gaspillage est important pour l’irrigation, et des problèmes simples comme « où dois-je placer mes arroseurs ? » deviennent vraiment complexes en fonction de la précision que l’on veut obtenir.

Quelle est la distance à ne pas dépasser ? Au musée, on vous le dit généralement. Mais vous n’aurez pas besoin de vous approcher plus près que cela du célèbre Panorama de Morat, une œuvre peinte vraiment énorme, de 10 mètres sur 100 mètres, qui était autrefois accrochée dans une rotonde. L’EPFL et Phase One travaillent ensemble à la réalisation de ce qu’ils prétendent être la plus grande image numérique jamais créée – 150 mégapixels. Oh, attendez, pardon, 150 mégapixels multipliés par 127 000, soit en gros 19… pétapixels ? Il se peut que je me trompe de quelques ordres de grandeur.

Quoi qu’il en soit, ce projet est intéressant pour les amateurs de panoramas, mais il permettra également d’analyser de très près des objets individuels et des détails de peinture. L’apprentissage automatique est extrêmement prometteur pour la restauration de ces œuvres, ainsi que pour l’apprentissage structuré et la navigation dans ces œuvres.

Notons tout de même un point pour les créatures vivantes : Tout ingénieur en apprentissage automatique vous dira qu’en dépit de leurs aptitudes apparentes, les modèles d’IA apprennent en fait assez lentement. Sur le plan académique, bien sûr, mais aussi sur le plan spatial – un agent autonome peut avoir à explorer un espace des milliers de fois pendant de nombreuses heures pour acquérir ne serait-ce qu’une compréhension élémentaire de son environnement. Une souris, elle, peut le faire en quelques minutes. Comment cela se fait-il ? Des chercheurs de l’University College London se penchent sur la question et suggèrent qu’il existe une courte boucle de rétroaction que les animaux utilisent pour déterminer ce qui est important dans un environnement donné, ce qui rend le processus d’exploration sélectif et dirigé. Si nous pouvons apprendre à l’IA à faire cela, elle sera beaucoup plus efficace pour se déplacer dans la maison, si c’est bien ce que nous voulons qu’elle fasse.

Enfin, bien que l’IA générative et conversationnelle dans les jeux soit très prometteuse… nous n’en sommes pas encore là. En fait, Square Enix semble avoir fait reculer le média d’environ 30 ans avec sa version « AI Tech Preview » d’une aventure point-and-click très ancienne appelée Portopia Serial Murder Case (Affaire du meurtre en série de Portopia). Sa tentative d’intégrer le langage naturel semble avoir complètement échoué de toutes les manières imaginables, faisant de ce jeu gratuit l’un des titres les plus mal notés sur Steam. Il n’y a rien que j’aimerais mieux que de chatter à travers Shadowgate ou The Dig ou quelque chose comme ça, mais ce n’est vraiment pas un bon début.

Crédits images : Square Enix

IA