La semaine de l’IA : Apple se lance dans l’apprentissage automatique

La semaine de l’IA : Apple se lance dans l’apprentissage automatique

Suivre l’évolution d’un secteur aussi rapide que l’IA n’est pas une mince affaire. En attendant qu’une IA puisse le faire à votre place, voici un récapitulatif pratique des événements de la semaine dernière dans le monde de l’apprentissage automatique, ainsi que des recherches et des expériences notables que nous n’avons pas couvertes seules.

On peut dire que la semaine dernière, Apple a visiblement et intentionnellement jeté son dévolu sur la course ultra-compétitive à l’IA. Ce n’est pas que l’entreprise n’ait pas signalé ses investissements dans l’IA – et la priorité qu’elle lui accorde – auparavant. Mais lors de son événement WWDC, Apple a clairement indiqué que l’IA était à l’origine de nombreuses fonctionnalités de son matériel et de ses logiciels à venir.

Par exemple, iOS 17, qui devrait arriver dans le courant de l’année, peut suggérer des recettes pour des plats similaires à partir d’une photo d’iPhone grâce à la vision artificielle. L’IA est également à l’origine de Journal, un nouvel agenda interactif qui fait des suggestions personnalisées en fonction des activités réalisées dans d’autres applications.

iOS 17 sera également doté d’un correcteur automatique amélioré, alimenté par un modèle d’IA capable de prédire avec plus de précision les prochains mots et expressions qu’un utilisateur est susceptible d’utiliser. Au fil du temps, il s’adaptera et apprendra les mots les plus fréquemment utilisés par l’utilisateur, y compris les gros mots, pour le plus grand plaisir de tous.

L’IA est également au cœur du casque de réalité augmentée Vision Pro d’Apple, et plus particulièrement de FaceTime sur le Vision Pro. Grâce à l’apprentissage automatique, le Vision Pro peut créer un avatar virtuel de la personne qui le porte, en interpolant une gamme complète de contorsions faciales – jusqu’à la tension de la peau et le travail des muscles.

scan du visage pour le personnage numérique du Vision Pro

Crédits d’image : Pomme

Il ne s’agit peut-être pas d’IA générative, qui est sans aucun doute la sous-catégorie de l’IA la plus en vogue aujourd’hui. Mais l’intention d’Apple, me semble-t-il, était de faire une sorte de retour sur le devant de la scène, de montrer qu’il ne faut pas la sous-estimer après des années de projets d’apprentissage automatique qui n’ont pas abouti, depuis le peu convaincant Siri jusqu’à la voiture autonome dont la production est en train de s’effondrer.

Projeter la force n’est pas seulement un stratagème marketing. La sous-performance historique d’Apple dans le domaine de l’IA a conduit à une fuite des cerveaux, selon The Information, qui rapporte que des scientifiques talentueux dans le domaine de l’apprentissage automatique – y compris une équipe qui travaillait sur le type de technologie qui sous-tend le ChatGPT d’OpenAI – ont quitté Apple pour des pâturages plus cléments.

Montrer que l’on prend l’IA au sérieux en s’y mettant réellement expédition La livraison de produits dotés d’une intelligence artificielle semble être une étape nécessaire – et un point de référence que certains concurrents d’Apple n’ont pas réussi à atteindre dans un passé récent (nous vous regardons, Meta). (Selon toute apparence, Apple a fait des progrès la semaine dernière, même si elle ne l’a pas fait de manière particulièrement bruyante.

Voici les autres titres sur l’IA de ces derniers jours :

  • Meta crée un générateur de musique : Pour ne pas être en reste par Google, Meta a lancé son propre générateur de musique basé sur l’intelligence artificielle et, contrairement à Google, l’a mis en open source. Baptisé MusicGen, l’outil de génération de musique de Meta peut transformer une description textuelle en environ 12 secondes de son.
  • Les régulateurs examinent la sécurité de l’IA : À la suite de l’annonce faite la semaine dernière par le gouvernement britannique qu’il prévoyait d’organiser un sommet « mondial » sur la sécurité de l’IA cet automne, OpenAI, Google DeepMind et Anthropic se sont engagés à fournir un « accès anticipé ou prioritaire » à leurs modèles d’IA afin de soutenir la recherche en matière d’évaluation et de sécurité.
  • L’IA et le cloud : Salesforce lance une nouvelle suite de produits visant à renforcer sa position dans l’espace ultra-concurrentiel de l’IA. Baptisée AI Cloud, cette suite, qui comprend des outils conçus pour fournir une IA  » prête pour l’entreprise « , est la dernière tentative transversale de Salesforce pour enrichir son portefeuille de produits avec des capacités d’IA.
  • Test de l’IA texte-vidéo : TechCrunch a testé Gen-2, l’IA de Runway qui génère de courts clips vidéo à partir de texte. Le verdict ? Il reste encore beaucoup de chemin à parcourir avant que la technologie ne soit en mesure de générer des séquences de qualité cinématographique.
  • Plus d’argent pour l’IA d’entreprise : Signe qu’il y a beaucoup d’argent à distribuer aux startups d’IA générative, Coherequi développe un écosystème de modèles d’IA pour les entreprises, a annoncé la semaine dernière qu’elle avait levé 270 millions de dollars dans le cadre de son tour de table de série C.
  • Pas de GPT-5 pour vous : Le PDG d’OpenAI, Sam Altman, a déclaré lors d’une récente conférence organisée par Economic Times qu’OpenAI n’est toujours pas en train de former le GPT-5, plusieurs mois après que la startup soutenue par Microsoft se soit engagée à ne pas travailler sur le successeur du GPT-4 « pendant un certain temps » après que de nombreux cadres de l’industrie et des universitaires aient exprimé leurs inquiétudes. au sujet de la rapidité des progrès réalisés par les grands modèles linguistiques d’Altman.
  • Assistant d’écriture AI pour WordPress : AutomatticAutomattic, la société derrière WordPress.com et le principal contributeur au projet WordPress open source, a lancé mardi dernier un assistant d’intelligence artificielle pour le populaire système de gestion de contenu.
  • Instagram se dote d’un chatbot : Instagram pourrait être en train de travailler sur un chatbot d’IA, selon des images. fuitée par Alessandro Paluzzi, chercheur en applications. Selon ces fuites, qui reflètent des développements d’applications en cours, susceptibles ou non d’être commercialisées, ces agents IA peuvent répondre à des questions ou donner des conseils.

Autres méthodes d’apprentissage automatique

Si vous êtes curieux de savoir comment l’IA pourrait affecter la science et la recherche au cours des prochaines années, une équipe de six laboratoires nationaux a rédigé un rapport, basé sur des ateliers organisés l’année dernière, à ce sujet. On pourrait être tenté de dire qu’étant basé sur les tendances de l’année dernière et non sur celles de cette année, où les choses ont progressé si rapidement, le rapport est peut-être déjà obsolète. Mais si le ChatGPT a fait d’énormes vagues dans le domaine de la technologie et de la sensibilisation des consommateurs, la vérité est qu’il n’est pas particulièrement pertinent pour une recherche sérieuse. Les tendances à plus grande échelle le sont, et elles évoluent à un rythme différent. Le rapport de 200 pages n’est certainement pas une lecture légère, mais chaque section est utilement divisée en morceaux digestes.

Ailleurs dans l’écosystème des laboratoires nationaux, les chercheurs de Los Alamos travaillent d’arrache-pied pour faire progresser le domaine des memristors, qui combinent le stockage et le traitement des données, à l’instar de nos propres neurones. Il s’agit d’une approche fondamentalement différente de l’informatique, qui n’a pas encore porté ses fruits en dehors du laboratoire, mais cette nouvelle approche semble au moins faire avancer les choses.

La facilité de l’IA à analyser le langage est mise en évidence dans ce rapport sur les interactions entre la police et les personnes qu’elle a interpellées. Le traitement du langage naturel a été utilisé comme l’un des facteurs permettant d’identifier les schémas linguistiques qui prédisent l’escalade des interpellations, en particulier dans le cas des hommes noirs. Les méthodes d’apprentissage humain et automatique se renforcent mutuellement. (Lire l’article ici.)

Crédits image : Cyrille Verdon / Renaud Defrancesco BUREAU 141 / EPFL

DeepBreath est un modèle entraîné à partir d’enregistrements de la respiration de patients en Suisse et au Brésil. Ses créateurs à l’EPFL affirment qu’il peut aider à identifier les affections respiratoires à un stade précoce. L’objectif est de l’intégrer dans un appareil appelé Pneumoscope, sous l’égide de l’entreprise spinout Onescope. Nous prendrons probablement contact avec eux pour obtenir plus d’informations sur les activités de l’entreprise.

Une autre avancée en matière d’IA dans le domaine de la santé nous vient de Purdue, où des chercheurs ont créé un logiciel qui se rapproche de l’imagerie hyperspectrale avec l’appareil photo d’un smartphone, permettant de suivre avec succès le taux d’hémoglobine dans le sang et d’autres paramètres. Il s’agit d’une technique intéressante : en utilisant le mode super slow-mo du téléphone, elle permet d’obtenir beaucoup d’informations sur chaque pixel de l’image, ce qui donne à un modèle suffisamment de données pour extrapoler. Il pourrait s’agir d’un excellent moyen d’obtenir ce type d’informations sur la santé sans matériel spécial.

Crédits image : MIT

Je ne ferais pas encore confiance à un pilote automatique pour effectuer des manœuvres d’évitement, mais le MIT se rapproche de cette technologie grâce à des recherches qui aident l’IA à éviter les obstacles tout en maintenant une trajectoire de vol souhaitable. N’importe quel vieil algorithme peut proposer des changements de direction radicaux pour ne pas s’écraser, mais il est plus difficile de le faire en maintenant la stabilité et en ne détruisant rien à l’intérieur de l’avion. L’équipe a réussi à faire effectuer à un avion à réaction simulé des manœuvres semblables à celles de Top Gun, de manière autonome et sans perdre sa stabilité. C’est plus difficile qu’il n’y paraît.

Enfin, Disney Research, sur lequel on peut toujours compter pour présenter quelque chose d’intéressant qui s’applique également à la réalisation de films ou à l’exploitation de parcs à thème, est le dernier de la semaine. Lors de la CVPR, ils ont présenté un « réseau de détection de repères faciaux » puissant et polyvalent, capable de suivre les mouvements du visage en continu et en utilisant des points de référence plus arbitraires. La capture de mouvements fonctionne déjà sans les petits points de capture, mais ce réseau devrait permettre d’améliorer encore la qualité et la dignité des acteurs.

IA