OpenAI conclut un accord avec Axel Springer sur l’octroi de licences pour l’entraînement de modèles

OpenAI conclut un accord avec Axel Springer sur l’octroi de licences pour l’entraînement de modèles

De nombreux fournisseurs de technologies d’IA générative, si ce n’est la plupart, affirment que l’utilisation équitable leur permet d’entraîner des modèles d’IA sur du matériel protégé par le droit d’auteur récupéré sur l’internet – même s’ils n’obtiennent pas l’autorisation des détenteurs des droits. Mais certains fournisseurs, tels qu’OpenAI, font des paris prudents, peut-être parce qu’ils se méfient de l’issue des procès en cours dans ce domaine.

OpenAI a annoncé aujourd’hui avoir conclu un accord avec Axel Springer, le propriétaire berlinois de publications telles que Business Insider et Politico, afin d’entraîner ses modèles d’IA générative sur le contenu de l’éditeur et d’ajouter des articles récents publiés par Axel Springer au chatbot viral d’OpenAI, ChatGPT, alimenté par l’IA.

C’est la deuxième fois qu’OpenAI conclut un accord de ce type avec un organe de presse, après que la startup a déclaré qu’elle accorderait une licence sur certaines archives de l’Associated Press pour l’entraînement de ses modèles.

À l’avenir, les utilisateurs de ChatGPT recevront des résumés d’articles « sélectionnés » dans les publications d’Axel Springer, y compris des articles normalement protégés par un mur payant. Les extraits seront accompagnés d’une attribution et de liens vers les articles complets.

En retour, Axel Springer recevra des paiements d’un montant et d’une fréquence non précisés de la part d’OpenAI. L’accord est valable pour plusieurs années et, bien qu’il n’engage aucune des parties à l’exclusivité, Axel Springer affirme qu’il soutiendra les projets existants de la maison d’édition axés sur l’IA « qui s’appuient sur la technologie d’OpenAI ».

« Nous sommes ravis d’avoir mis en place ce partenariat mondial entre Axel Springer et OpenAI, le premier du genre », a déclaré Mathias Döpfner, PDG d’Axel Springer, dans un communiqué. « Nous voulons explorer les possibilités offertes par le journalisme assisté par l’IA, afin d’améliorer la qualité, la pertinence sociétale et le modèle économique du journalisme. »

A lire aussi  TextQL vise à ajouter une intelligence alimentée par l'IA aux données d'entreprise

En dehors des éditeurs qui utilisent l’IA générative pour des stratégies de contenu douteuses, les éditeurs et les fournisseurs d’IA générative entretiennent des relations tendues, les premiers alléguant des violations de droits d’auteur et s’inquiétant de plus en plus de la cannibalisation du trafic par les modèles génératifs. Par exemple, la nouvelle expérience de recherche de Google alimentée par l’IA générative, appelée SGE, a repoussé les liens qui apparaissent dans la recherche traditionnelle plus bas dans les pages de résultats de recherche – réduisant potentiellement le trafic vers ces liens de 40 %.

Les éditeurs s’opposent également à ce que les fournisseurs entraînent leurs modèles sur le contenu sans avoir conclu d’accords de compensation, en particulier à la lumière des rapports selon lesquels les géants de la technologie, y compris Google, expérimentent des outils d’IA pour résumer les nouvelles. Selon une enquête récente, des centaines d’organismes de presse utilisent désormais un code pour empêcher OpenAI, Google et d’autres de scanner leurs sites web à la recherche de données d’entraînement.

En août, plusieurs organisations de médias, dont Getty Images, The Associated Press, la National Press Photographers Association et The Authors Guild, ont publié une lettre ouverte appelant à une plus grande transparence et à une meilleure protection des droits d’auteur dans le domaine de l’IA. Dans cette lettre, les signataires demandent instamment aux décideurs politiques d’envisager des réglementations exigeant la transparence des ensembles de données d’entraînement et permettant à l’IA d’être protégée par le droit d’auteur. aux entreprises de médias de négocier avec les opérateurs de modèles d’IA, entre autres suggestions.

A lire aussi  La startup d'IA Cohere, évaluée à plus de 2,1 milliards de dollars, lève 270 millions de dollars

« Les pratiques actuelles portent atteinte aux modèles économiques fondamentaux de l’industrie des médias, qui reposent sur le lectorat et l’audience (comme les abonnements), les licences et la publicité », peut-on lire dans la lettre. « En plus de violer la loi sur le droit d’auteur, ces pratiques ont pour effet de réduire considérablement la diversité des médias et de compromettre la viabilité financière des entreprises qui investissent dans la couverture médiatique, ce qui réduit encore l’accès du public à des informations de qualité et fiables.

IA