Google lance les outils GenAI pour la création musicale

Google lance les outils GenAI pour la création musicale

Alors que les outils GenAI commencent à transformer l’industrie musicale de manière incroyable – et dans certains cas problématique d’un point de vue éthique – Google accroît ses investissements dans la technologie de l’IA pour créer de nouvelles chansons et de nouvelles paroles.

Le géant de la recherche a dévoilé aujourd’hui MusicFX, une mise à jour de MusicLM, l’outil de création musicale que Google a lancé l’année dernière. MusicFX peut créer des chansonnettes d’une durée maximale de 70 secondes et des boucles musicales, ce qui, selon Google, permet de générer de la musique « de meilleure qualité » et « plus rapidement ».

MusicFX est disponible dans l’AI Test Kitchen de Google, une application qui permet aux utilisateurs d’essayer des systèmes expérimentaux alimentés par l’IA et issus des laboratoires de l’entreprise. Techniquement, MusicFX a été lancé en décembre pour une sélection d’utilisateurs, mais il est désormais disponible pour tous.

Google MusicFX

Crédits d’image : Google

Et ce n’est pas terrible, je dois dire.

Comme son prédécesseur, MusicFX permet à l’utilisateur de saisir un texte (« deux guitares à cordes de nylon jouant dans un style flamenco ») pour décrire la chanson qu’il souhaite créer. L’outil génère par défaut deux versions de 30 secondes, avec des options permettant d’allonger les pistes (jusqu’à 50 ou 70 secondes) ou d’assembler automatiquement le début et la fin pour les mettre en boucle.

L’outil propose également des suggestions de mots descriptifs alternatifs dans les messages-guides. Par exemple, si vous tapez « style country », vous verrez peut-être apparaître une liste déroulante de genres tels que « style rockabilly » et « style bluegrass ». Pour le mot « accrocheur », la liste déroulante pourrait contenir « chill » et « mélodique ».

Google MusicFX

Crédits d’image : Google

Sous le champ de l’invite, MusicFX fournit un nuage de mots avec des recommandations supplémentaires pour des descriptions, des instruments et des tempos pertinents à ajouter (par exemple, « avant garde », « rapide », « excitant », « 808 drums »).

Alors, comment ça sonne ? Lors de mes brefs essais, les échantillons de MusicFX étaient… bons ? À vrai dire, les outils de génération de musique en sont arrivés à un point où il est difficile pour cet auteur de faire la distinction entre les sorties. L’état de l’art actuel produit des pistes d’une propreté et d’une netteté impressionnantes, mais des pistes qui tendent vers l’ennui, le manque d’inspiration et de concentration mélodique.

A lire aussi  Le dernier modèle anthropique peut prendre "The Great Gatsby" en entrée

C’est peut-être la dépression qui m’atteint, mais l’une des propositions que j’ai faites était « une chanson de musique house avec des rythmes funky, qui soit dansante et entraînante, avec des vibrations estivales sur les toits ». MusicFX a répondu à l’appel, et les morceaux n’étaient pas mauvais – mais je ne peux pas dire qu’ils se rapprochent des meilleurs DJ sets que j’ai entendus récemment.

Écoutez par vous-même :


Tout ce qui contient des instruments à cordes sonne moins bien, comme un échantillon MIDI bon marché – ce qui est peut-être le reflet du jeu d’entraînement limité de MusicFX. Voici deux pistes générées avec l’invite « une mélodie pleine d’âme jouée sur des instruments à cordes, orchestrale, avec un noyau mélodique fort » :

Et pour changer de rythme, voici l’interprétation de MusicFX d’une « chanson larmoyante à la guitare, mélancolique, au tempo lent, par une nuit au clair de lune (sic) ». (Pardonnez la faute d’orthographe.)

Il y a certaines choses que MusicFX ne et qui ne peuvent pas être supprimées des pistes générées. Pour éviter de se heurter aux droits d’auteur, Google filtre les invites qui mentionnent des artistes spécifiques ou incluent des voix. Il utilise également SynthID, une technologie de filigrane inaudible mise au point par sa division DeepMind, pour indiquer clairement quelles pistes proviennent de MusicFX.

Je ne sais pas quelle sorte de liste maîtresse Google utilise pour filtrer les noms d’artistes et de chansons, mais je n’ai pas eu beaucoup de mal à la vaincre. Si MusicFX a refusé de générer des chansons dans le style de SZA et des Beatles, il a accepté avec plaisir un message faisant référence à Lake Street Dive – même si les morceaux n’étaient pas très convaincants, je dois l’avouer.

Génération de paroles

Google a publié un nouvel outil de génération de paroles, TextFX, dans AI Test Kitchen, qui se veut une sorte de compagnon de MusicFX. Comme MusicFX, TextFX est disponible depuis un certain temps pour une petite cohorte d’utilisateurs, mais il est désormais plus largement disponible et amélioré en termes d' »expérience utilisateur et de navigation », selon Google.

Comme l’explique Google dans l’application AI Test Kitchen, TextFX a été créé en collaboration avec Lupe Fiasco, artiste rap et producteur de disques. Il est alimenté par PaLM 2, l’un des modèles d’IA générateurs de texte de Google, et « (s’inspire) des techniques lyriques et linguistiques que (Fiasco) a développées tout au long de sa carrière ».

Google TextFX

Crédits d’image : Google

Ce journaliste s’attendait à ce que TextFX soit un générateur de paroles plus ou moins automatisé. Mais c’est certainement pas que cela. TextFX est plutôt une suite de modules conçus pour faciliter le processus d’écriture des paroles, y compris un module qui trouve des mots dans une catégorie commençant par une lettre choisie et un module qui trouve des similitudes entre deux choses qui n’ont rien à voir.

Google TextFX

Crédits d’image : Google

TextFX demande un certain temps pour être pris en main. Mais je le vois devenir une ressource utile pour les paroliers – et les écrivains en général, franchement.

Il convient toutefois d’examiner attentivement les résultats obtenus. Google avertit que TextFX « peut afficher des informations inexactes, y compris sur des personnes », et j’ai en effet réussi à lui faire dire que le changement climatique « est un canular perpétré par le gouvernement chinois pour nuire aux entreprises américaines ». A suivre…

Google TextFX

Crédits d’image : Google

Des questions subsistent

Avec MusicFX et TextFX, Google indique qu’il est fortement investi dans la technologie musicale GenAI. Mais je me demande si son souci de rester dans la course plutôt que de répondre aux questions difficiles qui entourent la musique GenAI ne lui servira pas à la fin.

A lire aussi  Meta nous rapproche des films générés par l'IA

De plus en plus, des morceaux faits maison qui utilisent la GenAI pour évoquer des sons et des voix familiers pouvant être considérés comme authentiques, ou du moins assez proches, sont devenus viraux. Les labels musicaux se sont empressés de signaler les morceaux générés par l’IA à des partenaires de diffusion en continu tels que Spotify et SoundCloud, en invoquant des problèmes de propriété intellectuelle. Ils ont généralement eu gain de cause. Mais il n’est toujours pas clair si la musique « deepfake » viole les droits d’auteur des artistes, des labels et des autres détenteurs de droits.

Un juge fédéral a statué en août que l’art généré par l’IA ne pouvait être protégé par le droit d’auteur. Toutefois, l’Office américain du droit d’auteur n’a pas encore pris position et n’a commencé que récemment à solliciter l’avis du public sur les questions de droit d’auteur liées à l’IA. On ne sait pas non plus si les utilisateurs pourraient se retrouver en situation de violation du droit d’auteur s’ils tentent de commercialiser de la musique générée dans le style d’un autre artiste.

Google tente de se frayer un chemin prudent vers le déploiement des outils musicaux GenAI sur YouTube, qui teste des modèles d’IA créés par DeepMind en partenariat avec des artistes comme Alec Benjamin, Charlie Puth, Charli XCX, Demi Lovato, John Legend, Sia et T-Pain. C’est plus que ce que l’on peut dire de certains concurrents de GenAI du géant de la technologie, comme Stability AI, qui estime que l' »utilisation équitable » justifie l’entraînement sur du contenu sans la permission du créateur.

Mais avec les labels qui poursuivent les fournisseurs de GenAI pour des paroles protégées par le droit d’auteur dans les données d’entraînement et les artistes qui manifestent leur mécontentement, Google a du pain sur la planche – et il ne se laisse pas ralentir par ce fait gênant.

IA