Anthropic s'installe avec les auteurs dans le procès en violation de l'incarnation de l'IA en son genre

Dans l'un des plus grands règlements de droits d'auteur impliquant l'intelligence artificielle générative, Anthropic IA, une entreprise de premier plan dans l'espace générateur de l'IA, a accepté de payer 1,5 milliard de dollars pour régler un procès pour violation du droit d'auteur intenté par un groupe d'auteurs.

Si le tribunal approuve le règlement, Anthropic indemne les auteurs d'environ 3 000 $ pour chacun des 500 000 livres estimés couverts par le règlement.

Le règlement, que le juge principal de district américain William Alsup à San Francisco envisagera l'approbation de la semaine prochaine, est dans une affaire qui impliquait la première décision de fond sur la façon dont l'utilisation équitable s'applique aux systèmes d'IA génératifs. Il suggère également un point d'inflexion dans les combats juridiques en cours entre les industries créatives et les sociétés d'IA accusées de l'utilisation illégale d'œuvres artistiques pour former les modèles de grande langue qui sous-tendent leurs systèmes d'IA largement utilisés.

La doctrine de l'utilisation équitable permet d'utiliser des œuvres protégées par le droit d'auteur par des tiers sans le consentement du titulaire du droit d'auteur dans certaines circonstances, comme lors de l'illustration d'un point dans un article de presse. Les entreprises d'IA essayant de plaider en faveur de l'utilisation des travaux protégés par le droit d'auteur pour former leurs modèles d'IA génératifs invoquent généralement une utilisation équitable. Mais les auteurs et autres plaignants de l'industrie créative ont repoussé.

« Ce règlement historique sera le plus grand recouvrement du droit d'auteur signalé publiquement », déclare la motion du règlement, faisant valoir qu'elle « fournira une compensation significative » aux auteurs et « établira un précédent de sociétés d'IA à payer leur utilisation de sites Web piratés ».

« Ce règlement marque le début d'une évolution nécessaire vers un système de licence légitime basé sur le marché pour la formation des données », a déclaré Cecilia Ziniti, avocate de l'industrie technologique et ancien employé du neuvième circuit qui n'est pas impliqué dans ce cas spécifique mais qui l'a suivi de près. « Ce n'est pas la fin de l'IA, mais le début d'un écosystème plus mature et durable où les créateurs sont compensés, un peu comme la façon dont l'industrie musicale s'est adaptée à la distribution numérique. »

Un cas avec des décisions divisées

Les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson ont déposé leur plainte Contre anthropic pour violation du droit d'auteur en 2024. Le recours collectif a allégué anthropic IA a utilisé le contenu de millions de livres protégés par des droits d'auteur numérisés pour former les grands modèles de langue derrière leur chatbot, Claude, y compris au moins deux œuvres de chaque demandeur. La société a également acheté des livres papier et les a scannés avant de les ingérer dans son modèle. L'entreprise a admis avoir fait autant, un fait que les plaignants soulèvent leur plainte. « Anthropic a admis avoir utilisé la pile pour former Claude », indique la plainte. (La pile est un grand ensemble de données open source créé pour une formation de modèle de langue grande.)

« Plutôt que d'obtenir l'autorisation et de payer un prix équitable pour les créations qu'il exploite, les anthropes les piraient », indique la plainte des auteurs.

Dans son juin décisionLe juge Alsup était d'accord avec l'argument d'Anthropic, déclarant que l'utilisation des livres par les plaignants par l'entreprise pour former leur modèle d'IA était acceptable.

« L'utilisation de la formation était une utilisation équitable », a-t-il écrit. « L'utilisation des livres en cause pour former Claude et ses précurseurs était extrêmement transformateur. »

Cependant, le juge a statué que l'utilisation par Anthropic de millions de livres pour construire ses modèles – des livres que des sites Web tels que la bibliothèque Genesis (Libgen) et le miroir de la bibliothèque de pirate (Pilimi) ont copié sans obtenir le consentement des auteurs ou leur donner une compensation – ne l'était pas. Il a ordonné que cette partie de l'affaire soit jugée. « Nous aurons un procès sur les copies piratées utilisées pour créer la bibliothèque centrale d'Anthropic et les dommages qui en résultent, réels ou statutaires (y compris pour la volonté) », a écrit le juge dans la conclusion de sa décision. La semaine dernière, les parties ont annoncé qu'ils avaient atteint un règlement.

La loi sur le droit d'auteur américain stipule que la violation du droit d'auteur volontaire peut entraîner des dommages-intérêts légaux allant jusqu'à 150 000 $ par travail violé. L'ordonnance du juge affirme que anthropique a piraté plus de 7 millions d'exemplaires de livres. Ainsi, les dommages résultant d'un procès, s'il s'était avancé, aurait pu être énorme.

Cependant, Ziniti a déclaré que, quel que soit le règlement, la décision du juge signifie effectivement qu'au moins dans le nord de la Californie, les sociétés d'IA ont désormais le droit légal de former leurs modèles de langue importants sur des œuvres protégées par le droit d'auteur – tant qu'elles obtiennent des copies de ces travaux légalement.

Dans les déclarations à NPR, les deux parties semblent satisfaites de l'issue de l'affaire.

« Le règlement d'aujourd'hui, s'il est approuvé, résoudra les réclamations héritées restantes des demandeurs », a déclaré Aparna Sridhar adjoint adjoint anthropique. « Nous restons déterminés à développer des systèmes d'IA sûrs qui aident les personnes et les organisations à étendre leurs capacités, à faire avancer la découverte scientifique et à résoudre des problèmes complexes. »

« Cette colonie historique est la première du genre à l'ère de l'IA », a déclaré Justin Nelson, avocat de l'équipe représentant les auteurs. « Il fournira une rémunération significative pour chaque travail de classe et définira un précédent obligeant les entreprises d'IA à payer les propriétaires de droits d'auteur. Ce règlement envoie un message puissant aux sociétés et créateurs de l'IA, que prendre des œuvres protégées par le droit d'auteur à partir de ces sites Web de pirate est erronée. »

La communauté créative répond

Le règlement a également rencontré l'approbation de la communauté créative.

« Ce règlement historique est une étape essentielle pour reconnaître que les entreprises d'IA ne peuvent pas simplement voler le travail créatif des auteurs pour construire leur IA simplement parce qu'ils ont besoin de livres pour développer des modèles de grande langue de qualité », a déclaré Guilde des auteurs PDG Mary Rasenberger. « Nous nous attendons à ce que le règlement conduise à davantage de licences qui donnent aux auteurs la rémunération et le contrôle de l'utilisation de leurs travaux par les sociétés d'IA, comme cela devrait être le cas dans une société de marché libre fonctionnelle. »

« While the settlement amount is very significant and represents a clear victory for the publishers and authors in the class, it also proves what we have been saying all along— that AI companies can afford to compensate copyright owners for their works without it undermining their ability to continue to innovate and compete, » added Keith Kupferschmid, president and CEO of the Copyright Alliance.

Anthropic est en bonne position pour gérer la compensation considérable. Mardi, l'entreprise annoncé L'achèvement d'un nouveau cycle de financement d'une valeur de 13 milliards de dollars, portant sa valeur totale à 183 milliards de dollars.

Pendant ce temps, le monde littéraire et d'autres parties du secteur créatif continuent de lutter contre les entreprises de l'IA. Il y a eu une multitude de poursuites de violation de l'incarnation de l'IA littéraire lancées par des auteurs éminents, notamment Ta-Nehisi Coates et la comédienne Sarah Silverman ces dernières années. En juin, le juge de district américain Vince Chhabria Certes de la demande de Meta Pour un jugement sommaire dans Coates et le cas de Silverman contre la société technologique, qui a effectivement mis fin à ce procès. D'autres cas sont en cours.

Et dans le dernier dans une série d'actions en justice impliquant des grandes sociétés de divertissement, vendredi, Warner Bros. Discovery a déposé un procès en Californie Cour fédérale contre le générateur d'images de l'IA Midjourney pour violation du droit d'auteur. NPR a contacté MidJourney pour commenter.