Cette semaine dans l’IA : Le boom de l’IA générative stimule la demande de puces personnalisées

Cette semaine dans l’IA : Le boom de l’IA générative stimule la demande de puces personnalisées

Suivre l’évolution d’un secteur aussi rapide que l’IA n’est pas une mince affaire. En attendant qu’une IA puisse le faire à votre place, voici un récapitulatif pratique des événements récents dans le monde de l’apprentissage automatique, ainsi que des recherches et des expériences notables que nous n’avons pas couvertes par elles-mêmes.

Cette semaine, d-Matrix, une startup spécialisée dans les puces d’IA, a levé 110 millions de dollars pour commercialiser ce qu’elle décrit comme une plateforme de calcul d’inférence « unique en son genre ». D-Matrix affirme que sa technologie permet l’inférence – c’est-à-dire l’exécution de modèles d’IA – à un coût de propriété inférieur à celui des alternatives basées sur le GPU.

« D-Matrix est la société qui rendra l’IA générative commercialement viable », a déclaré Sasha Ostojic, partenaire de Playground Global, qui soutient d-Matrix.

La question de savoir si d-Matrix tient ses promesses reste ouverte. Mais l’enthousiasme qu’il suscite, ainsi que les startups qui lui ressemblent (NeuReality, Tenstorrent, etc.), montre que les acteurs de l’industrie technologique sont de plus en plus conscients de la gravité de la pénurie de matériel d’IA. Alors que l’adoption de l’IA générative s’accélère, les fournisseurs de puces qui font fonctionner ces modèles, comme Nvidia, ont du mal à répondre à la demande.

Récemment, Microsoft a mis en garde ses actionnaires contre d’éventuelles interruptions du service Azure AI s’il ne peut pas obtenir suffisamment de puces d’IA – en particulier des GPU – pour ses centres de données. Les meilleures puces d’IA de Nvidia seraient épuisées jusqu’en 2024, en partie à cause de la forte demande des géants technologiques étrangers, notamment Baidu, ByteDance, Tencent et Alibaba.

Il n’est pas étonnant que Microsoft, Amazon et Meta, entre autres, investissent dans le développement en interne de puces de nouvelle génération pour l’inférence de l’IA. Mais pour les entreprises qui n’ont pas les ressources nécessaires pour suivre cette ligne de conduite radicale, le matériel de startups comme d-Matrix pourrait être la meilleure solution.

Dans le scénario le plus optimiste, d-Matrix et ses semblables agiront comme une force égalisatrice, mettant sur un pied d’égalité les startups dans l’espace de l’IA générative – et de l’IA en général, d’ailleurs. Une analyse récente de la société de recherche en IA SemiAnalysis révèle comment la dépendance de l’industrie de l’IA à l’égard des GPU divise le monde de la technologie en « riches en GPU » et « pauvres en GPU », le premier groupe étant peuplé d’opérateurs historiques tels que Google OpenAI et le second comprenant principalement des startups européennes et des supercalculateurs soutenus par le gouvernement tels que le Jules Verne français.

L’inégalité sévit dans l’industrie de l’IA, depuis les annotateurs qui étiquettent les données utilisées pour former les modèles génératifs d’IA jusqu’aux préjugés nuisibles qui émergent souvent dans ces modèles formés. Le matériel informatique risque d’en être un nouvel exemple. Cela ne veut pas dire que tous les espoirs reposent sur des startups comme d-Matrix – de nouvelles techniques et architectures d’IA pourraient également contribuer à remédier à ce déséquilibre. Mais des puces d’inférence d’IA moins chères et disponibles dans le commerce promettent d’être une pièce importante du puzzle.

Voici d’autres articles sur l’IA parus ces derniers jours :

  • Imbue lève 200 millions de dollars : Imbue, le laboratoire de recherche en IA anciennement connu sous le nom de Generally Intelligent, a levé 200 millions de dollars dans le cadre d’un tour de table de série B qui valorise l’entreprise à plus d’un milliard de dollars. Imbue est sorti de la clandestinité en octobre dernier avec un objectif ambitieux : rechercher les fondements de l’intelligence humaine qui font actuellement défaut aux machines. La nouvelle tranche de financement servira à financer les efforts de la startup pour atteindre cet objectif.
  • eBay génère des annonces à partir de photos : eBay déploie un nouvel outil d’intelligence artificielle pour les vendeurs de la place de marché qui peut générer une liste de produits à partir d’une simple photo. Il s’agit d’un gain de temps considérable. Mais comme certains utilisateurs l’ont découvert, les outils d’IA générative d’eBay ont jusqu’à présent eu tendance à ne pas être à la hauteur en termes de qualité.
  • Anthropic lance une offre payante : Anthropic, la startup d’IA cofondée par d’anciens employés d’OpenAI, a annoncé le lancement de sa première formule d’abonnement premium, Claude Pro, pour Claude 2 – le chatbot d’Anthropic basé sur l’IA et l’analyse de texte.
  • OpenAI lance une conférence de développement : OpenAI organisera une conférence de développeurs – sa toute première – le 6 novembre, a annoncé la société cette semaine. Lors de cet événement d’une journée, OpenAI DevDay, qui comprendra un discours d’ouverture et des sessions en petits groupes dirigées par des membres de l’équipe technique d’OpenAI, OpenAI a indiqué dans un billet de blog qu’elle présenterait en avant-première « de nouveaux outils et échangerait des idées » – mais a laissé le reste à l’imagination.
  • Zoom rebaptise ses outils d’IA – et en introduit de nouveaux : Pour rester compétitif sur le marché encombré de la vidéoconférence, Zoom met à jour et donne un nouveau nom à plusieurs de ses fonctions basées sur l’IA, y compris l’assistant génératif d’IA anciennement connu sous le nom de Zoom IQ.
  • Les modèles d’IA sont-ils condamnés à halluciner ? Les grands modèles de langage comme le ChatGPT d’OpenAI souffrent tous du même problème : ils inventent des choses. Mais cela sera-t-il toujours le cas ? Nous demandons à des experts de nous donner leur avis.
  • Les procureurs luttent contre l’exploitation des enfants par l’IA : Les procureurs généraux des 50 États américains et de quatre territoires ont signé une lettre appelant le Congrès à prendre des mesures contre les contenus pédopornographiques utilisant l’IA. L’IA générative est généralement inoffensive dans le domaine de la pédopornographie. Mais dans le pire des cas, comme le soulignent les procureurs généraux, elle peut être utilisée pour faciliter les abus.
  • Artisse génère des photos de vous : Un nouvel outil, Artisse, permet aux utilisateurs de générer des photos d’eux-mêmes à l’aide de l’IA en téléchargeant d’abord une série de selfies. Ce n’est pas une grande nouveauté : d’autres outils font de même. Mais Artisee prétend améliorer la gamme actuelle d’applications photo IA en offrant un plus large éventail de capacités d’entrée et de sortie et plus de réalisme dans les photos résultantes, même si elles se déroulent dans des domaines fantastiques.

Plus d’informations sur l’apprentissage automatique

Une longue exposition de drones passant à travers des portes dans un entrepôt.

Crédits image : UZH / Leonard Bauersfeld

En première place, littéralement, nous avons ce drone à grande vitesse piloté par l’IA, qui a réussi à battre les champions du monde humains de ce sport, dans lequel les pilotes guident leurs drones à des vitesses allant jusqu’à 100 km/h à travers une série de portes. Un modèle d’IA a été entraîné dans un simulateur, ce qui « a permis d’éviter la destruction de plusieurs drones au début de l’apprentissage », et a effectué tous ses calculs en temps réel, réalisant le meilleur tour de piste avec une demi-seconde d’avance. Les humains réagissent encore mieux aux conditions changeantes, comme la lumière et les changements de parcours, mais ce n’est peut-être qu’une question de temps avant que l’IA ne les rattrape dans ce domaine également.

Les modèles d’apprentissage automatique progressent également dans d’autres domaines inattendus : Osmo, qui vise à « donner aux ordinateurs un sens de l’odorat », a publié un article dans Science montrant que l’odeur peut en fait être quantifiée et cartographiée de manière fiable. « Le RVB est une carte tridimensionnelle de toutes les couleurs… Nous considérons notre découverte de la carte des odeurs principales (POM) comme la version olfactive du RVB. Le modèle a réussi à prédire les caractéristiques de senteurs qu’il n’avait jamais rencontrées auparavant, ce qui confirme la validité de la POM. Le premier marché de la société semble être la rationalisation de la synthèse des parfums. Cet article a fait l’objet d’une préimpression l’année dernière, mais il est désormais publié dans Science, ce qui signifie qu’il compte vraiment.

La carte des odeurs principales ou, comme je l’appelle, l’espace des odeurs. Crédits images : Osmo

Il ne serait pas exact de dire que l’IA est également douée pour l’audition dans cette autre étude, mais il est tout à fait approprié d’ajouter un autre sens au mélange. Des biologistes de l’Imperial College London ont enregistré près de 36 000 heures d’enregistrements audio sur plus de 300 sites au Costa Rica, afin de pouvoir y suivre la faune et la flore. Il aurait fallu 20 ans, ou 20 étudiants diplômés pendant un an, pour tout écouter, mais les modèles d’apprentissage automatique sont excellents pour extraire le signal du bruit, de sorte qu’ils ont analysé le tout en deux mois. Il s’avère que les hurleurs du Costa Rica n’aiment pas les endroits où le couvert végétal est inférieur à 80 % et qu’ils sont plus sensibles à la présence humaine que ceux du Mexique.

Le laboratoire de recherche AI for Good de Microsoft mène quelques projets dans le même sens, que Juan Lavista Ferres aborde dans ce billet. Et ici, en espagnol. Fondamentalement, il s’agit du même problème : trop de données et pas assez de temps ou de personnes pour les étudier. Grâce à des modèles spécialement entraînés, ils peuvent toutefois analyser des centaines de milliers de photos, d’images satellite et d’autres données déclenchées par le mouvement. En quantifiant des éléments tels que l’étendue et les effets secondaires de la déforestation, les projets de ce type apportent un soutien empirique solide aux efforts et aux lois en matière de conservation.

Aucun tour d’horizon n’est complet sans une nouvelle application médicale. À Yale, on a découvert que les ultrasons du cœur peuvent être analysés par un modèle d’apprentissage automatique pour détecter une sténose aortique sévère, une forme de maladie cardiaque. Un tel diagnostic, plus rapide et plus facile, peut sauver des vies et, même s’il n’est pas sûr à 100 %, il peut indiquer à un prestataire de soins non spécialisé qu’il faudrait peut-être consulter un médecin.

Enfin, les journalistes de ChinaTalk ont analysé le dernier LLM de Baidu, Ernie, et l’ont soumis à rude épreuve. L’article est principalement rédigé en chinois, il s’agit donc d’une information de seconde main, mais l’essentiel est conforme à ce que l’on peut attendre des réglementations restrictives du pays en matière d’IA. Les sujets « épicés » comme la souveraineté de Taïwan sont rejetés, et il a fait des « affirmations morales et même des propositions politiques » qui reflètent parfois le régime actuel, et sont parfois un peu bizarres. Il aime Richard Nixon, par exemple. Mais il fait ce que certains LLM semblent incapables de faire : se taire lorsqu’il pense entrer en territoire dangereux. Si seulement nous pouvions tous faire preuve d’une discrétion aussi admirable.

IA