Google condamné à une amende de 270 millions de dollars en France après que les autorités ont constaté que les données des éditeurs de presse ont été utilisées pour Gemini

Google condamné à une amende de 270 millions de dollars en France après que les autorités ont constaté que les données des éditeurs de presse ont été utilisées pour Gemini

Dans le cadre d’une saga sans fin entre Google et l’autorité française de la concurrence sur la protection des droits d’auteur pour les extraits de nouvelles, l’autorité française de la concurrence a décidé d’imposer une amende de 70 millions d’euros à Google. Autorité de la Concurrence a annoncé mercredi une amende de 250 millions d’euros contre le géant technologique (environ 270 millions de dollars au taux de change actuel).

Selon le gendarme de la concurrence, Google n’a pas respecté certains de ses engagements antérieurs avec les éditeurs de presse. Mais la décision est particulièrement remarquable parce qu’elle laisse tomber quelque chose d’autre qui est tout à fait d’actualité – en s’accrochant à l’utilisation par Google du contenu des éditeurs de presse pour entraîner son modèle d’IA générative Bard/Gemini.

L’autorité de la concurrence a reproché à Google de ne pas avoir informé les éditeurs de presse de l’utilisation par GenAI de leurs contenus protégés par le droit d’auteur. Ceci à la lumière des engagements pris précédemment par Google qui visent à s’assurer qu’il entreprend des négociations de paiement équitable avec les éditeurs sur la réutilisation de leur contenu.

Droits d’auteur et atteintes à la concurrence

En 2019, l’Union européenne a adopté une réforme paneuropéenne du droit d’auteur numérique qui a étendu la protection du droit d’auteur aux titres et aux extraits de nouvelles. Les agrégateurs d’actualités, tels que Google News, Discover et la boîte de fonctionnalité « Top Stories » sur les pages de résultats de recherche, avaient auparavant récupéré et affiché ces articles d’actualité sur leurs produits sans aucune compensation financière.

Google a d’abord cherché à se soustraire à la loi en désactivant Google Actualités en France. Mais l’autorité de la concurrence est rapidement intervenue, estimant que cette action unilatérale constituait un abus de position dominante qui risquait de porter préjudice aux éditeurs. L’intervention a essentiellement contraint Google à conclure des accords avec les éditeurs locaux sur la réutilisation des contenus. En 2021, Google s’est vu infliger une amende de 592 millions de dollars après que l’autorité de la concurrence a constaté des manquements majeurs dans ses négociations avec les éditeurs et les agences locales.

Le géant de la technologie a qualifié la sanction de « disproportionnée » et a déclaré qu’il ferait appel. Mais il a ensuite cherché à régler le différend en offrant une série d’engagements et en retirant son appel. Les engagements, qui ont été acceptés par les autorités françaises Autorité, Les règles de l’Autorité comprennent la transmission d’informations clés aux éditeurs et la négociation équitable.

Google a signé des accords sur les droits d’auteur avec des centaines d’éditeurs en France, qui relèvent de son accord avec la Commission européenne. Autorité. Ses activités dans ce domaine sont donc très étroitement réglementées.

Pas d’appel

Google a accepté de ne pas contester la de l’Autorité en échange d’une procédure accélérée et d’un versement d’argent.

Cependant, Sulina Connal, directrice générale des partenariats pour l’information et l’édition, a adopté un ton irrité en écrivant dans un long billet de blog que « l’amende n’est pas proportionnelle aux questions soulevées » par l’autorité.

Le billet de blog suggère que Google veut vraiment tirer un trait sur la saga cette fois-ci, Connal écrivant également : « Nous avons conclu un accord parce qu’il est temps de passer à autre chose et, comme le montrent nos nombreux accords avec les éditeurs, nous voulons nous concentrer sur l’objectif plus large d’approches durables pour connecter les gens à un contenu de qualité et travailler de manière constructive avec les éditeurs français.

Avec l’IA générative dans le cadre et la course à la concurrence pour lancer des outils, le calcul de Google sur l’approche de la question de la réutilisation du contenu semble différent.

La formation à l’IA générative en ligne de mire

L’application de la loi par l’autorité française de la concurrence montre qu’elle s’est concentrée sur l’utilisation par Google de contenus provenant d’éditeurs de presse et d’agences à des fins de formation pour son modèle de base d’IA et son service connexe de chatbot d’IA, Bard (désormais appelé Gemini).

L’autorité a constaté que Google a utilisé des contenus provenant d’éditeurs et d’agences de presse pour former Bard, son outil d’IA générative lancé en juillet 2023,  » sans notifier les titulaires de droits d’auteur ou l’Autorité « , selon son communiqué de presse.

Sur ce point, la défense de Google est double. Dans son billet de blog, il écrit que l’autorité de la concurrence « ne remet pas en cause la façon dont le contenu web est utilisé pour améliorer des produits plus récents comme l’IA générative, ce qui est déjà abordé dans l’article 4 de l’EUCD » (directive européenne sur le droit d’auteur).

L’article 4 de la directive sur le droit d’auteur prévoit une « exception ou limitation pour l’exploration de textes et de données », en particulier pour les « reproductions et extractions d’œuvres légalement accessibles et d’autres objets protégés à des fins d’exploration de textes et de données ».

Cependant, dans son communiqué de presse, le L’Autorité affirme qu’il n’a pas encore été déterminé si l’exemption s’applique dans ce cas. (Il convient de noter que la clause en question fait référence aux « œuvres légalement accessibles » – alors que Google est tenu par un engagement juridiquement contraignant envers l’autorité de la concurrence d’informer les détenteurs de droits d’auteur de l’utilisation de leurs œuvres protégées et n’a apparemment pas respecté cet engagement dans ce cas).

« Lorsqu’il s’agit de déterminer si l’utilisation de contenus d’actualité pour former un service d’intelligence artificielle relève des droits voisins et de la protection, cette question n’a pas encore trouvé de réponse », a écrit l’autorité de la concurrence. « Toutefois, la L’Autorité considère que Google a manqué à son engagement n°1 en n’informant pas les éditeurs que leur contenu avait été utilisé pour entraîner Bard ».

Le billet de Google mentionne également en passant la loi européenne sur l’IA, ce qui laisse supposer qu’elle est pertinente. Cependant, la législation n’est pas encore en vigueur car elle est en attente de l’adoption finale par le Conseil européen.

La future législation sur l’IA stipulera également que les développeurs doivent respecter les règles de l’Union européenne en matière de droits d’auteur. C’est dans cette optique qu’elle introduit des exigences de transparence, les obligeant à mettre en place une politique de respect de la législation européenne en matière de droits d’auteur et à rendre public un « résumé suffisamment détaillé » du contenu utilisé pour la formation des modèles d’IA à usage général (tels que Gemini/Bard).

Cette nouvelle obligation pour les fabricants de modèles de publier un résumé des données d’entraînement pourrait, à l’avenir, permettre aux éditeurs de presse dont le contenu protégé a été ingéré pour l’entraînement à la GenAI d’obtenir plus facilement une rémunération équitable en vertu de la législation européenne sur le droit d’auteur.

Pas d’opt-out technique

Le Autorité souligne également que Google n’a pas fourni, au moins jusqu’au 28 septembre 2023, une solution technique permettant aux éditeurs et aux agences de presse de refuser que leurs contenus soient utilisés pour former Bard sans que cette décision n’affecte l’affichage de leurs contenus sur les autres services de Google.

« Jusqu’à cette date, les éditeurs et les agences de presse qui souhaitaient renoncer à ce cas d’utilisation devaient insérer une instruction qui bloquait toute indexation du contenu par Google, y compris pour les services Search, Discover et Google News. Ces services font spécifiquement partie de la négociation des revenus liés aux droits voisins », écrit-elle, ajoutant : « À l’avenir, le L’Autorité examinera attentivement l’efficacité de la stratégie de Google en matière de sécurité. opt-out . »

En termes plus techniques, entre juillet et septembre 2023, les éditeurs de presse pouvaient insérer une balise « noindex » dans le fichier robots.txt pour s’assurer que leur contenu n’était pas utilisé pour entraîner le modèle d’IA de Google. Ce fichier robots.txt est placé dans le dossier racine des serveurs web et contient diverses instructions à l’intention des moteurs de recherche. Le robot d’exploration de Google consulte les instructions contenues dans ces fichiers pour indexer les sites web.

Mais une balise « noindex » signifie que votre site web disparaît complètement de Google. En septembre 2023, Google a ajouté plus de granularité et a créé une règle « Google-Extended » qui est différente de la règle « noindex ». En refusant de suivre les instructions de Google-Extended, les éditeurs de sites web indiquent qu’ils ne veulent pas contribuer à l’amélioration des modèles actuels et futurs de Gemini.

Autres lacunes

Le Autorité sanctionne également Google pour une série d’autres problèmes liés à la manière dont il négocie avec les éditeurs de presse français, estimant qu’il ne leur a pas fourni toutes les informations nécessaires pour garantir une négociation équitable de la rémunération de leur contenu.

Dans son communiqué de presse, elle écrit que les informations fournies par Google aux éditeurs sur sa méthode de calcul du montant de leur rémunération étaient « particulièrement opaques ».

Elle a également constaté que Google ne respectait pas les critères de non-discrimination visant à garantir l’égalité de traitement des éditeurs. Elle a également critiqué la décision de Google d’imposer un « seuil minimum » de rémunération – c’est-à-dire un seuil en deçà duquel aucun paiement ne serait effectué aux éditeurs – avec la Autorité décrivant cette situation comme introduisant une discrimination entre éditeurs « dans son principe même ». En dessous d’un certain seuil, tous les éditeurs se voient « arbitrairement attribuer une rémunération nulle, quelle que soit leur situation respective », note également son communiqué de presse.

En outre, le Autorité a critiqué les calculs de Google concernant les « revenus indirects », affirmant que le « paquet » proposé n’était pas conforme aux décisions antérieures ou à l’arrêt d’appel de la Cour de justice d’octobre 2020.

La Commission a également déclaré que Google n’avait pas donné suite à son engagement de mettre à jour les contrats de rémunération conformément à ses promesses.

IA