Dans une décision première de son genre, une entreprise d'IA remporte un procès pour violation du droit d'auteur intenté par les auteurs

Les sociétés d'IA pourraient avoir le droit légal de former leurs modèles de langue importants sur les œuvres protégées par le droit d'auteur – tant qu'elles obtiennent des copies de ces travaux légalement.

C'est le résultat d'une première décision de son genre par un juge fédéral à San Francisco lundi dans une affaire de violation du droit d'auteur en cours qui oppose un groupe d'auteurs contre une grande entreprise d'IA.

La décision est importante car elle représente la première décision de fond sur la façon dont l'utilisation équitable s'applique aux systèmes d'IA génératifs.

La doctrine de l'utilisation équitable permet d'utiliser des œuvres protégées par le droit d'auteur par des tiers sans le consentement du titulaire du droit d'auteur dans certaines circonstances telles que l'illustration d'un point dans un article de presse. Les allégations d'utilisation équitable sont généralement invoquées par les sociétés d'IA essayant de plaider en faveur de l'utilisation des travaux protégés par le droit d'auteur pour former leurs modèles d'IA génératifs. Mais les auteurs et autres plaignants de l'industrie créative ont repoussé avec une série de poursuites.

Les auteurs affrontent l'anthropique

Dans leur recours collectif en 2024, les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson ont allégué anthropique Ai a utilisé le contenu de millions de livres protégés par le droit d'auteur pour former les modèles de grande langue derrière leur chatbot, Claude, y compris au moins deux œuvres de chaque demandeur. La société a également acheté des livres papier et les a scannés avant de les ingérer dans son modèle.

« Plutôt que d'obtenir l'autorisation et de payer un prix équitable pour les créations qu'il exploite, les anthropes les piraient », indique la plainte des auteurs.

Dans l'ordonnance de lundi, le juge principal de district américain William Alsup a soutenu l'argument d'Anthropic, déclarant que l'utilisation des livres par les plaignants par les plaignants par l'entreprise pour former leur modèle d'IA était acceptable.

« L'utilisation de la formation était une utilisation équitable », a-t-il écrit. « L'utilisation des livres en cause pour former Claude et ses précurseurs était extrêmement transformateur. »

Le juge a déclaré que la numérisation des livres achetés sous forme imprimée par Anthropic pourrait également être considéré comme une utilisation équitable, « parce que tout ce que Anthropic a fait était de remplacer les copies imprimées qu'elle avait achetées pour sa bibliothèque centrale par des copies numériques plus pratiques et consultables pour sa bibliothèque centrale – sans ajouter de nouvelles copies, créant de nouvelles œuvres ou des copies existantes. »

Cependant, Alsup a également reconnu que tous les livres n'avaient pas été payés. Il a écrit anthropic « téléchargé gratuitement des millions de livres protégés par le droit d'auteur sous forme numérique à partir de sites de pirate sur Internet » dans le cadre de ses efforts « pour amasser une bibliothèque centrale de » tous les livres du monde « pour conserver » Forever « . » »

Alsup n'a pas approuvé le point de vue d'Anthropic « selon lequel les copies de la bibliothèque piratée doivent être traitées comme des copies de formation » et permettent à la plainte du piratage des auteurs pour procéder au procès.

« Nous aurons un essai sur les copies piratées utilisées pour créer la bibliothèque centrale d'Anthropic et les dommages qui en résultent, réels ou statutaires (y compris pour la volonté) », a déclaré Alsup.

Réponses bifurquées

La décision bifurquée d'Alsup a conduit à des réponses de la même manière des personnes impliquées dans l'affaire et les parties prenantes de l'industrie.

Dans une déclaration à NPR, anthropique a salué la reconnaissance du juge que l'utilisation d'œuvres pour former des modèles de langue importante était «transformatrice – spectaculairement ainsi». La société a ajouté: « Conformément à l'objectif du droit d'auteur pour permettre la créativité et favoriser les progrès scientifiques, les grands modèles de langue d'Anthropic sont formés sur les œuvres de ne pas courir à l'avance et de les reproduire ou de les supplanter, mais pour tourner un coin dur et créer quelque chose de différent. »

Cependant, Anthropic a également déclaré qu'il était en désaccord avec la décision du tribunal de procéder à un procès.

« Nous pensons qu'il est clair que nous avons acquis des livres à un seul but – construire des modèles de grosses langues – et le tribunal a clairement jugé que l'utilisation était juste », a déclaré la société.

Un membre de l'équipe juridique des plaignants a refusé de parler publiquement de la décision.

La Guilde des auteurs, un grand groupe de défense des rédacteurs professionnels, a partagé une déclaration: « Nous ne sommes pas d'accord avec la décision que l'utilisation de livres piratés ou numérisés pour la formation de modèles de grande langue est une utilisation équitable », indique le communiqué.

Dans une interview avec NPR, le PDG de la Guilde, Mary Rasenberger, a ajouté que les auteurs n'ont pas besoin d'être trop préoccupés par la décision.

« L'impact de cette décision pour les auteurs de livres est en fait assez bon », a déclaré Rasenberger. « Le juge a compris le piratage scandaleux. Et cela vient avec des dommages-intérêts statutaires pour violation du droit d'auteur intentionnel, qui sont assez élevés par livre. »

Selon la Copyright Alliance, la loi sur le droit d'auteur américain déclare que la violation du droit d'auteur peut entraîner des dommages-intérêts légaux allant jusqu'à 150 000 $ par travail violé. La décision déclare anthropique piratée plus de 7 millions d'exemplaires de livres. Les dommages résultant donc du prochain procès pourraient être énormes.

La partie de l'affaire axée sur la responsabilité d'Anthropic pour l'utilisation de travaux piratés devrait être jugé en décembre.

Autres cas et une nouvelle décision

Des poursuites similaires ont été intentées par d'autres auteurs de premier plan. Ta-Nehisi Coates, Michael Chabon, Junot Díaz et la comédienne Sarah Silverman sont impliqués dans des cas en cours contre les joueurs de l'IA.

Mercredi, le juge de district américain Vince Chhabria a statué en faveur de Meta dans l'une de ces affaires. Un procès pour violation du droit d'auteur a été intenté par 13 auteurs, dont Richard Kadrey et Silverman. Ils ont poursuivi Meta pour avoir prétendument utilisé des copies piratées de leurs romans pour former Llama. Meta a revendiqué une utilisation équitable et a gagné parce que les auteurs n'ont pas présenté la preuve que l'utilisation de Meta de leurs livres a eu un impact sur le marché pour leur travail d'origine. Cependant, le juge a déclaré que la décision ne s'applique qu'aux travaux spécifiques inclus dans le procès et que dans les cas futurs, les auteurs faisant des réclamations similaires pourraient gagner s'ils plaident plus fort.

« Ces décisions vont aider les entreprises technologiques et les titulaires de droits d'auteur pour voir où les juges et les tribunaux sont susceptibles d'aller à l'avenir », a déclaré Ray Seilie, avocat basé à Los Angeles avec le cabinet Kinsella Holley Iser Kump Steinsapir, qui se concentre sur l'IA et la créativité. Il n'est pas impliqué dans ce cas particulier.

« Je pense qu'ils peuvent être considérés comme une victoire pour le bref de la communauté d'IA, car ils créent un précédent suggérant que les entreprises d'IA peuvent utiliser du matériel obtenu légalement pour former leurs modèles », a déclaré Seilie.

Mais il a dit que cela ne signifie pas que les entreprises d'IA peuvent immédiatement sortir et scanner les livres qu'ils achètent en toute impunité, car les décisions sont susceptibles d'être en appel et les affaires pourraient potentiellement se terminer devant la Cour suprême.

« Tout pourrait changer », a déclaré Seilie.