Les premières impressions sur Gemini de Google ne sont pas très bonnes

Cette semaine, Google a dévoilé Gemini, son nouveau modèle phare d’IA générative destiné à alimenter une série de produits et de services, dont Bard, le concurrent de ChatGPT de Google. Dans des articles de blog et des documents de presse, Google a vanté l’architecture et les capacités supérieures de Gemini, affirmant que le modèle atteint ou dépasse les performances d’autres modèles d’IA générative de premier plan tels que le GPT-4 d’OpenAI.

Mais les preuves anecdotiques suggèrent le contraire.

Une version « allégée » de Gemini, Gemini Pro, a commencé à être déployée sur Bard hier, et les utilisateurs n’ont pas tardé à exprimer leurs frustrations sur X (anciennement Twitter).

Le modèle ne tient pas compte des données de base, comme les lauréats des Oscars 2023 :

Je suis extrêmement déçu par Gemini Pro sur Bard. Il donne toujours de très, très mauvais résultats à des questions qui ne devraient plus être difficiles avec RAG.

Une question simple comme celle-ci avec une réponse simple comme celle-ci, et il se trompe encore. pic.twitter.com/5GowXtscRU

– Vitor de Lucca 🏳️‍🌈 / threads.net/@vitor_dlucca (@vitor_dlucca) 7 décembre 2023

Notez que Gemini Pro affirme à tort que Brendan Gleeson a remporté le prix du meilleur acteur l’année dernière, et non Brendan Fraser, le véritable lauréat.

J’ai essayé de poser la même question au modèle et, bizarrement, il a donné une réponse erronée différente :

Crédits d’image : Google

« Navalny », et non « All the Beauty and the Bloodshed », a remporté le prix du meilleur documentaire l’année dernière ; « All Quiet on the Western Front » a remporté le prix du meilleur film international ; « Women Talking » a remporté le prix du meilleur scénario adapté ; et « Pinocchio » a remporté le prix du meilleur film d’animation. Cela fait beaucoup d’erreurs.

L’auteur de science-fiction Charlie Stross a trouvé de nombreux autres exemples de confabulation dans un récent billet de blog. (Entre autres faussetés, Gemini Pro affirme que Stross a contribué au noyau Linux, ce qu’il n’a jamais fait).

La traduction ne semble pas non plus être le point fort de Gemini Pro. Il peine à donner un mot de six lettres en français :

Lorsque j’ai soumis la même question à Bard (« Pouvez-vous me donner un mot de 6 lettres en français ? »), Gemini Pro a répondu par un sept-ce qui donne un peu de crédit aux rapports sur les faibles performances multilingues de Gemini.

Crédits d’image : Google

Qu’en est-il du résumé de l’actualité ? Gemini Pro, avec Google Search et Google News à sa disposition, peut sûrement donner un résumé d’un sujet d’actualité ? Pas nécessairement.

Il semble que Gemini Pro répugne à commenter des sujets d’actualité potentiellement controversés, préférant dire aux utilisateurs de… chercher eux-mêmes.

J’ai essayé le même message et j’ai obtenu une réponse très similaire. ChatGPT, en revanche, fournit un résumé sous forme de liste à puces avec des citations d’articles de presse :

Crédits d’image : OpenAI

Il est intéressant de noter que Gemini Pro a a fourni un résumé des mises à jour sur la guerre en Ukraine lorsque je le lui ai demandé. Toutefois, les informations étaient périmées depuis plus d’un mois :

Crédits d’image : Google

Google a souligné l’amélioration des compétences de Gemini en matière de codage lors d’une réunion d’information en début de semaine. Il est possible qu’il se soit réellement amélioré dans certains domaines – des messages sur X le suggèrent. Mais il apparaît également que Gemini Pro a des difficultés avec les fonctions de codage de base comme celle-ci en Python :

J’ai essayé Gemini based Bard, et bien, il ne peut toujours pas écrire l’intersection de deux polygones. C’est une de ces rares fonctions relativement simples à exprimer qui n’a jamais été implémentée en Python, il n’y a pas de post de stack overflow, et tous ces modèles échouent dessus. pic.twitter.com/RKjmkEw2Qr

– Filip Piekniewski🌻 🐘:@[email protected] (@filippie509) 6 décembre 2023

Et ceux-ci :

Essai de Gemini Pro : il est assez décevant pour mon exemple. Je lui ai demandé de faire une horloge analogique en HTML comme celle que ChatGPT a faite. Il peut citer du code de Github mais il est décalé de quelques ms… pic.twitter.com/neb42Vzm3m

– Mohsen Azimi (@mohsen____) 7 décembre 2023

GPT 4 toujours plus performant que Gemini Pro. Création d’un jeu de Tic Tac Toe avec ChatGPT et Bard (sur Gemini Pro)

Voir la vidéo pour le résultat. ChatGPT a écrit le code au premier essai (première vidéo). Bard à 3 essais (deuxième vidéo). pic.twitter.com/cYd9hepcgT

– Edison Ade (@buzzedison) 6 décembre 2023

Et, comme tous les modèles d’IA générative, Gemini Pro n’est pas à l’abri des « jailbreaks », c’est-à-dire des invites qui contournent les filtres de sécurité mis en place pour tenter de l’empêcher d’aborder des sujets controversés.

En utilisant une méthode automatisée pour modifier algorithmiquement le contexte des invites jusqu’à ce que les garde-fous de Gemini Pro échouent, les chercheurs en sécurité de l’IA de Robust Intelligence, une startup qui vend des outils d’audit de modèles, ont réussi à faire en sorte que Gemini Pro suggère des moyens de voler une organisation caritative et d’assassiner une personne très en vue (bien qu’avec des « nanobots » – il est vrai que ce n’est pas l’arme de choix la plus réaliste).

Crédits d’image : Google

Gemini Pro n’est pas la version la plus performante de Gemini – ce modèle, Gemini Ultra, devrait être lancé dans le courant de l’année prochaine dans Bard et dans d’autres produits. Google a comparé les performances de Gemini Pro à celles du prédécesseur de GPT-4, GPT-3.5, un modèle vieux d’environ un an.

Google a néanmoins promis des améliorations en matière de raisonnement, de planification et de compréhension avec Gemini Pro par rapport au modèle précédent qui alimente Bard, affirmant que Gemini Pro était meilleur pour résumer un contenu, faire un brainstorming et écrire. Il est clair qu’il y a du travail à faire dans ces domaines.

Breaking News

Trouvez le meilleur casino en ligne avec retrait rapide pour Juillet 2023

Le guide ultime pour découvrir les casinos en ligne France Gratuit 2023

Site de casino en ligne : une expérience de jeu exceptionnelle

Toute L'actu

Les premières impressions sur Gemini de Google ne sont pas très bonnes