Découvrez le générateur de musique alimenté par l’IA de Google

Découvrez le générateur de musique alimenté par l’IA de Google

L’IA peut-elle travailler à rebours à partir d’une description textuelle pour générer une chanson cohérente ? C’est le principe de MusicLM, l’outil de création musicale basé sur l’IA que Google a présenté hier lors du coup d’envoi de sa conférence I/O.

MusicLM, qui a été entraîné sur des centaines de milliers d’heures d’audio pour apprendre à créer de la nouvelle musique dans une gamme de styles, est disponible en avant-première via l’application AI Test Kitchen de Google. Je l’utilise depuis quelques jours, tout comme certains de mes collègues.

Le verdict ? Disons simplement que MusicLM n’est pas près de prendre le travail des musiciens.

L’utilisation de MusicLM dans la cuisine d’essai est assez simple. Une fois l’accès approuvé, vous êtes accueilli par une zone de texte dans laquelle vous pouvez saisir une description de la chanson – aussi détaillée que vous le souhaitez – et demander au système de générer deux versions de la chanson. Les deux versions peuvent être téléchargées pour une écoute hors ligne, mais Google vous encourage à donner un « coup de pouce » à l’une des pistes afin d’améliorer les performances de l’IA.

MusicLM

Crédits images : Google

Lorsque j’ai parlé pour la première fois de MusicLM en janvier, avant sa sortie, j’ai écrit que les chansons du système ressemblaient à ce qu’un artiste humain pourrait composer, même si elles n’étaient pas nécessairement aussi inventives ou cohérentes sur le plan musical. Aujourd’hui, je ne peux pas dire que je maintiens entièrement ces propos, car il semble évident que des échantillons prélevés plus tôt dans l’année ont été sérieusement sélectionnés.

A lire aussi  L'application de numérisation 3D Polycam reçoit le soutien du cofondateur de YouTube

La plupart des chansons que j’ai générées avec MusicLM sonnent au mieux de manière passable – et au pire comme un enfant de quatre ans lâché sur un DAW. Je me suis surtout cantonné à l’EDM, en essayant de produire quelque chose avec une structure et une mélodie discernable (et agréable, idéalement). Mais même si les débuts des chansons de MusicLM sont corrects – voire bons ! – le début des chansons de MusicLM sonne, il arrive un moment où elles s’effondrent d’une manière très évidente et musicalement désagréable.

Prenons par exemple cet échantillon, généré à partir de l’invite « chanson EDM dans un style léger, entraînant et aérien, bon pour la danse ». Le début est prometteur, avec une ligne de base qui fait danser la tête et des éléments d’un single classique de Daft Punk. Mais vers le milieu de la piste, il s’écarte complètement de sa trajectoire et change pratiquement de genre.


Voici un solo de piano à partir d’une demande plus simple – « musique romantique et émotionnelle pour piano ». Les parties, vous le remarquerez, sonnent bien et bien – exceptionnelles même, du moins en ce qui concerne le travail des doigts. Mais ensuite, c’est comme si le pianiste était possédé par la manie. Quelques notes mélangées plus tard, la chanson prend une direction radicalement différente, comme si elle provenait d’une nouvelle partition – bien que dans la lignée de l’original.

J’ai essayé MusicLM avec des chiptunes pour le plaisir, pensant que l’IA aurait plus de facilité avec des chansons plus basiques. Pas de chance. Le résultat (ci-dessous), bien qu’accrocheur par endroits, est tout aussi aléatoire que les autres échantillons.

A lire aussi  CertifID, qui développe des produits pour prévenir la fraude électronique, lève 20 millions de dollars

D’un point de vue positif, MusicLM, dans l’ensemble, fait un bien meilleur travail que Jukebox, la tentative d’OpenAI, il y a plusieurs années, de créer un générateur de musique par l’IA. Contrairement à MusicLM, les chansons produites par Jukebox manquaient d’éléments musicaux typiques, comme des refrains qui se répètent, et contenaient souvent des paroles absurdes. Les chansons produites par MusicLM contiennent également moins d’artefacts et donnent généralement l’impression d’avoir progressé en matière de fidélité.

L’émergence de Dance Diffusion intervient plusieurs années après qu’OpenAI, le laboratoire de San Francisco à l’origine de DALL-E 2, a présenté sa grande expérience de génération de musique, baptisée Jukebox. À partir d’un genre, d’un artiste et d’un extrait de paroles, Jukebox pouvait générer une musique relativement cohérente avec des voix. Mais les chansons produites par Jukebox manquaient de structures musicales plus larges, comme des refrains qui se répètent, et contenaient souvent des paroles absurdes.

L’utilité de MusicLM est d’ailleurs un peu limitée, en raison de limitations artificielles au niveau de l’incitation. Il ne génère pas de musique avec des artistes ou des voix, même pas dans le format style de certains musiciens. Essayez de taper une invite telle que « dans la lignée de Barry Manilow » et vous n’obtiendrez rien d’autre qu’un message d’erreur.

MusicLM

Crédits images : Google

La raison est probablement d’ordre juridique. La musique « deepfaked » se trouve sur un terrain juridique obscur, après tout, certains membres de l’industrie musicale affirmant que les générateurs de musique par IA comme MusicLM violent les droits d’auteur sur la musique. Il ne faudra peut-être pas attendre longtemps avant que la situation ne s’éclaircisse – plusieurs procès en cours devant les tribunaux auront probablement une incidence sur l’IA génératrice de musique, notamment sur les droits des artistes dont les œuvres sont utilisées pour former des systèmes d’IA sans qu’ils le sachent ou y consentent. L’avenir nous le dira.

Pour l’instant, je dirais que les artistes n’ont pas beaucoup de raisons de s’inquiéter. MusicLM, comme les autres générateurs de musique par IA qui ont été lancés récemment, sert avant tout à illustrer le chemin qu’il reste à parcourir en matière de technologie.

En savoir plus sur Google I/O 2023 sur TechCrunch

A lire aussi  Fabric présente un espace de travail alimenté par l'IA et une maison pour toutes vos informations
IA