Spotify pourrait utiliser l’IA pour créer des publicités podcast lues par des hôtes qui ressemblent à de vraies personnes.

Spotify pourrait utiliser l’IA pour créer des publicités podcast lues par des hôtes qui ressemblent à de vraies personnes.

Avec l’AI DJ de Spotify, la société a formé une IA à la voix d’une personne réelle – celle de son responsable des partenariats culturels et animateur de podcasts, Xavier « X » Jernigan. Aujourd’hui, il semblerait que le diffuseur de musique en continu puisse utiliser cette même technologie à des fins publicitaires. Selon les déclarations du fondateur de The Ringer, Bill Simmons, le service de streaming développe une technologie d’IA capable d’utiliser la voix d’un animateur de podcast pour créer des publicités lues par l’animateur, sans que ce dernier n’ait à lire et à enregistrer le texte publicitaire.

Simmons a fait ces déclarations lors d’un récent épisode du Bill Simmons Podcast, en déclarant : « Il y aura un moyen d’utiliser ma voix pour les publicités. Vous devez évidemment donner votre accord pour la voix, mais cela ouvre, d’un point de vue publicitaire, toutes sortes de grandes possibilités pour vous ».

Selon lui, ces publicités pourraient ouvrir de nouvelles perspectives aux podcasteurs, car ils pourraient cibler géographiquement les publicités – comme des billets pour un événement local dans la ville de l’auditeur – ou même créer des publicités dans différentes langues, avec l’autorisation de l’animateur.

Ses commentaires ont été rapportés par Semafor.

The Ringer a été racheté par Spotify en 2020, mais il n’est pas certain que Simmons soit autorisé à parler des projets du streamer dans ce domaine, puisqu’il a commencé par dire « Je ne pense pas que Spotify va s’énerver contre moi pour ça… » avant de partager l’information.

Contacté pour un commentaire, Spotify n’a pas voulu confirmer ou infirmer directement le développement de cette fonctionnalité.

« Nous travaillons toujours à améliorer l’expérience Spotify et à tester de nouvelles offres qui profitent aux créateurs, aux annonceurs et aux utilisateurs », a déclaré un porte-parole de Spotify à TechCrunch. « Le paysage de l’IA évolue rapidement et Spotify, qui a une longue histoire d’innovation, explore un large éventail d’applications, y compris notre très populaire fonction AI DJ. Il y a eu une augmentation de 500 du nombre d’épisodes de podcasts quotidiens traitant de l’IA au cours du dernier mois, y compris la conversation entre Derek Thompson et Bill Simmons. La publicité représente un terrain d’exploration intéressant, mais nous n’avons rien à annoncer pour l’instant ».

Le sous-texte de ce commentaire indique que les déclarations de Simmons étaient peut-être quelque peu prématurées.

Cela dit, Spotify a déjà laissé entendre que le DJ IA dans l’application aujourd’hui ne serait pas la seule voix IA que les utilisateurs rencontreraient à l’avenir. Lorsque Jernigan a été récemment interrogé sur les plans de Spotify pour travailler avec d’autres modèles vocaux à l’avenir, il a dit « Restez à l’écoute ».

Le streamer a également investi discrètement dans le développement et la recherche en matière d’IA, avec une équipe de quelques centaines de personnes travaillant sur des domaines tels que la personnalisation et l’apprentissage automatique. De plus, l’équipe utilise le modèle OpenAI et étudie les possibilités offertes par les grands modèles de langage, la voix générative, etc.

La capacité de Spotify à créer des voix IA s’appuie spécifiquement sur la propriété intellectuelle issue de l’acquisition de Sonantic par Spotify en 2022, combinée à la technologie OpenAI. Spotify pourrait choisir d’utiliser sa propre technologie d’IA à l’avenir, comme nous l’a récemment indiqué la société.

Pour créer AI DJ, Spotify a demandé à Jernigan d’aller dans un studio pour produire des enregistrements de haute qualité, y compris ceux où il lisait des lignes avec différentes cadences et émotions. Il a conservé ses pauses et respirations naturelles dans les enregistrements et s’est assuré d’utiliser le langage qu’il utilise déjà – comme « tunes » ou « bangers » au lieu de « songs ». Tous ces éléments sont ensuite intégrés au modèle d’IA, qui crée ensuite la voix d’IA.

L’entreprise a expliqué qu’elle ne détaillait pas le processus et qu’elle ne disait pas combien de temps il lui avait fallu pour transformer les enregistrements de Jernigan en DJ IA. Mais, étant donné son intérêt éventuel pour la transformation de ses animateurs de podcasts en modèles vocaux d’IA, elle doit être en train de développer un processus assez efficace – et qui pourrait éventuellement exploiter les enregistrements existants d’un podcasteur.

Si les voix d’IA ne sont pas nouvelles, la capacité à les faire ressembler à de vraies personnes est plus récente. Il y a quelques années, Google a épaté le monde avec Duplex, une IA à consonance humaine capable d’appeler des restaurants pour faire des réservations. Mais cette technologie a d’abord été critiquée pour son manque de transparence. Ce mois-ci, Apple a introduit une fonction d’accessibilité, Personal Voice, capable d’imiter la voix de l’utilisateur après que celui-ci a entraîné le modèle en passant 15 minutes à lire des invites choisies au hasard et traitées localement sur son appareil.

IA