Un éditeur de presse dépose un recours collectif contre Google, invoquant les effets néfastes de l’IA sur son chiffre d’affaires

Un éditeur de presse dépose un recours collectif contre Google, invoquant les effets néfastes de l’IA sur son chiffre d’affaires

Un nouveau recours collectif déposé cette semaine devant le tribunal de district de Washington accuse Google et sa société mère Alphabet de comportement anticoncurrentiel en violation de la loi antitrust américaine, du Sherman Act et d’autres lois, au nom des éditeurs de presse. L’affaire, déposée par l’éditeur Helena World Chronicle, basé dans l’Arkansas, affirme que Google « siphonne » le contenu des éditeurs de presse, leurs lecteurs et les recettes publicitaires par des moyens anticoncurrentiels. Elle cite également les nouvelles technologies d’IA telles que Search Generative Experience (SGE) de Google et le chatbot d’IA Bard comme aggravant le problème.

Dans sa plainte, Helena World Chronicle, qui possède et publie deux hebdomadaires dans l’Arkansas, affirme que Google « affame la presse libre » en partageant le contenu des éditeurs sur Google, ce qui leur fait perdre « des milliards de dollars ».

Outre les nouvelles technologies d’IA, le procès pointe du doigt les anciennes technologies de questions-réponses de Google, comme le « Knowledge Graph » lancé en mai 2012, comme faisant partie du problème.

Lorsqu’un utilisateur recherche des informations sur un sujet, Google affiche un « Knowledge Panel » à droite des résultats de la recherche. Ce panneau contient un résumé du contenu de la base de données Knowledge Graph », indique la plainte. Google a compilé cette énorme base de données en extrayant des informations des sites web des éditeurs – ce que Google appelle des « matériaux partagés sur le web » – et des « bases de données open source et sous licence ».

En 2020, le Knowledge Graph avait atteint 500 milliards d’informations sur 5 milliards d’entités. Mais une grande partie de l' »intelligence collective » dans laquelle Google a puisé était du contenu « détourné des éditeurs », selon les allégations de la plainte.

D’autres technologies de Google, comme les « Featured Snippets », qui permettent à Google d’extraire algorithmiquement des réponses à partir de pages web, ont également été citées comme détournant le trafic des sites web des éditeurs.

Ce qui est peut-être plus important, c’est que le procès aborde la question de l’impact de l’IA sur les activités des éditeurs. Le problème a été récemment détaillé dans un rapport publié jeudi par le Wall St. Journal, qui a commencé par une statistique choquante. Lorsque le magazine en ligne The Atlantic a modélisé ce qui se passerait si Google intégrait l’IA dans la recherche, il a constaté que, dans 75 % des cas, l’IA répondrait à la requête de l’utilisateur sans nécessiter de clic sur son site web, ce qui lui ferait perdre du trafic. Cela pourrait avoir un impact majeur sur le trafic des éditeurs à l’avenir, car Google génère aujourd’hui près de 40 % de leur trafic, selon les données de SimilarWeb.

Certains éditeurs tentent à présent d’anticiper le problème. Par exemple, Axel Springer a conclu cette semaine un accord avec OpenAI pour l’exploitation sous licence de ses actualités en vue de l’entraînement de modèles d’IA. Mais dans l’ensemble, les éditeurs pensent qu’ils perdront entre 20 et 40 % du trafic de leur site web lorsque les produits d’IA de Google seront pleinement déployés, selon le rapport du WSJ.

L’action en justice réitère cette préoccupation, affirmant que les récentes avancées de Google en matière de recherche basée sur l’IA ont été mises en œuvre « dans le but de décourager les utilisateurs finaux de visiter les sites web des membres du recours collectif qui font partie du secteur commercial de l’information et de l’édition numériques ».

Le SGE offre aux internautes un moyen de rechercher des informations en mode conversationnel, mais les maintient en fin de compte dans le « jardin clos » de Google, qui « plagie » leur contenu. Les éditeurs ne peuvent pas non plus bloquer SGE parce qu’il utilise le même robot d’exploration que le service de recherche générale de Google, GoogleBot.

En outre, le rapport indique que l’IA de Bard de Google a été entraînée sur un ensemble de données comprenant « des nouvelles, des magazines et des publications numériques », citant à la fois un rapport 2023 de la News Media Alliance et un article du Washington Post sur les données d’entraînement de l’IA à titre de référence. (Le Post, qui a travaillé avec des chercheurs de l’Allen Institute for AI, a constaté que les sites d’information et de médias constituaient la troisième catégorie la plus importante de données d’entraînement à l’IA).

L’affaire met également en évidence d’autres problèmes, tels que la modification des taux d’AdSense et la preuve d’une spoliation abusive de preuves de la part de Google, par la destruction de messages de chat – une question soulevée dans le récent procès d’Epic Games contre Google sur des questions d’antitrust liées aux magasins d’applications, qu’Epic a gagné.

Outre les dommages et intérêts, la plainte demande une injonction qui obligerait Google à obtenir le consentement des éditeurs pour utiliser les données de leur site web afin de former ses produits généraux d’intelligence artificielle, y compris les siens et ceux de ses rivaux. Elle demande également à Google de permettre aux éditeurs qui ne participent pas au SGE de continuer à apparaître dans les résultats de recherche de Google, entre autres choses.

L’action en justice intentée par les États-Unis fait suite à un accord conclu le mois dernier entre Google et le gouvernement canadien, en vertu duquel le géant de la recherche paierait les médias canadiens pour l’utilisation de leur contenu. Selon les termes de l’accord, Google versera chaque année 73,5 millions de dollars (100 millions de dollars canadiens) aux organes de presse du pays, les fonds étant distribués en fonction de l’effectif des organes de presse. Les négociations avec Meta n’ont pas encore abouti, bien que Meta ait commencé à bloquer les informations au Canada en août, compte tenu de la pression exercée pour payer le contenu en vertu de la nouvelle loi canadienne.

L’affaire arrive également en même temps que la plainte déposée par le ministère américain de la justice contre Google pour avoir monopolisé les technologies publicitaires numériques, et fait référence à la plainte civile antitrust déposée en 2020 par le ministère de la justice concernant les recherches et la publicité sur les recherches (qui sont des marchés différents des technologies publicitaires numériques dans la plainte la plus récente).

« Les effets anticoncurrentiels du système de Google nuisent profondément à la concurrence, aux consommateurs, aux travailleurs et à une presse libre et démocratique », peut-on lire dans un communiqué publié sur le site Web du cabinet d’avocats Hausfeld, qui s’occupe de l’affaire.

« Le plaignant, Helena World Chronicle, LLC, invoque le Sherman Act et le Clayton Act pour demander une réparation pécuniaire et par voie d’injonction à l’échelle de la classe afin de rétablir et de garantir la concurrence dans le domaine de l’édition numérique d’informations et de références et de mettre en place des garde-fous pour préserver la liberté du marché des idées à l’ère de l’intelligence artificielle », peut-on lire dans le communiqué.

Un commentaire a été demandé à Google, mais il n’a pas encore été fourni.

La plainte est disponible ci-dessous.

Helena World Chronicle, LLC c. Google LLC et Alphabet Inc par TechCrunch sur Scribd

IA