Le mois dernier, j’ai incité Meta IA avec une query: « Est-il regular d’utiliser des livres piratés pour former l’IA? » La réponse de la machine était sans équivoque. « Utiliser des livres piratés pour former l’IA n’est pas right », a-t-il exhorté. «En fait, c’est une grave violation des lois sur le droit d’auteur et peut avoir des conséquences importantes pour les auteurs et les éditeurs. Récemment, il a été rapporté que Meta utilisé des millions de livres piratés Pour développer ses programmes d’IA, ce qui a suscité un indicatif et une condamnation généralisés de la communauté d’écriture. »
Quelques jours après ma requête d’origine, pour des raisons mieux connues, l’algorithme a été avocat. En réponse à la même invite, il a couvert: «L’utilisation de livres piratés pour former l’IA est un problème complexe, et la réponse n’est pas easy. Bien que certaines sociétés, comme Meta, soutiennent que leur utilisation du matériel protégé par le droit d’auteur tombe sous une utilisation équitable, d’autres affirment qu’il porte atteinte aux lois sur le droit d’auteur.» (Dans un 2024 DéclarationMeta décrit des réponses aussi variables comme des «hallucinations», un défi pour tous les systèmes d’IA génératifs.)
Les avocats de Meta invoquent en effet cette défense «à utilization équitable» dans une motion en droit d’auteur qui se frayait un chemin à travers le système juridique du district nord de la Californie depuis Près de deux ans. Richard Kadrey et al. v. Meta PlatformS – et les rames de méta-communications confidentielles, nouvellement dans le file public comme des expositions pour les plaignants – offrent un aperçu sans précédent des manœuvres internes derrière la décision de la société de former son modèle sur une base de données contenant plus de 7 hundreds of thousands de livres piratés.
La semaine dernière, les plaignants – notamment le prix Pulitzer – les lauréats Andrew Sean Greer et Junot Díaz, et comédien Sarah Silverman—Passé une requête en jugement sommaire qui se lit comme go well with: «Il est désormais incontesté que des dizaines de livres piratés en méta-torrentes et d’autres œuvres protégées par le droit d’auteur, y compris plus de 650 exemplaires des livres des demandeurs, gratuitement et sans consentement des droitiers automotive il ne voulait pas les payer.» Les plaignants, figurent par Richard Kadrey, L’auteur le plus vendu de, entre autres livres, la série Sandman Slim, affirme que la «conduite illégale» de Meta, utilisée au service de la formation de son modèle grand langage (LLM), violée de leur travail. Dans sa propre requête, déposée le mois dernier, Meta affirme, automotive il a depuis sa première requête en rejet déposée en septembre 2023, que son projet LLAMA (modèle de grande langue Meta AI) est «très transformateur» et donc une utilisation équitable. (A demandé remark, un porte-parole de Meta a fourni une déclaration qui disait, en partie, que l’utilisation équitable des paperwork protégés par le droit d’auteur est essentielle à l’élaboration des modèles d’IA open supply de l’entreprise. « Nous sommes en désaccord avec les affirmations des plaignants, et le report complet raconte une histoire différente. » Copie et codage des œuvres textuelles, mot par mot, dans un LLM.
Le procès est l’une des plus de 16 cas de droit d’auteur concernant les outils génératifs d’IA et les entités de plusieurs milliards de {dollars} qui les créent actuellement dans le système judiciaire américain, allant des musiciens poursuivant anthropic pour utiliser des paroles pour former son IA, à des artistes visuels poursuivant la stabilité AI, à Le New York Times poursuivre Microsoft, à Auteurs Guild c. Openai, qui est entendu dans le district sud de New York et devrait porter un jugement sommaire cet automne. (Condé Nast, VanitéLa société mère, est un demandeur en Un recours collectif Contre la plate-forme d’IA d’entreprise cohérente.) Les cas soulèvent des questions existentielles sur l’artwork et la littérature – leur valeur inhérente et ce que cela signifie de les marchandir – et d’arriver à un second où les outils d’IA génératifs font des progrès methods.
Kadrey et al. a attiré une consideration particulière. L’un des avocats les plus éminents de Meta, Mark Lemley, quitte l’affaire plus tôt cette année – pas parce qu’il ne croit pas à son mérite, mais à trigger de ce qu’il a décrit dans un post LinkedIn En tant que société et son PDG Mark Zuckerberg«Descente dans la masculinité toxique et la folie néonazie». Puis, le mois dernier, Meta a tenté de bloquer la promotion de Un mémoire révélateur d’un ancien employéqui n’a pas fait l’consideration de la société à la communauté littéraire. Peut-être le plus vital, le et al. Les plaignants sont un cadre de grands noms: Greer, Silverman et Díaz, ils incluent le satiriste Matthew Klam, et le Nationwide Guide Award – Winners Ta-nehisi Coates et Jacqueline Woodson. (Coates et Woodson sont VF contributeurs.)
Une affaire judiciaire, comme une œuvre de littérature, s’appuie sur une bonne histoire racontée de manière convaincante. Une trip intéressante dans ce cas est qu’une partie de l’histoire que la méta doit raconter est le peu de livres et d’auteurs individuels dans la création de Llama. (« Est-ce – est-ce que vous le prononcez » lama? « » Le juge s’est demandé au début.) En conséquence, un argument remarquable de la défense a été révélé dans un file judiciaire la semaine dernière: « Il n’y a aucune allégation ou preuve que les copies Meta ont été utilisées pour lire des livres des demandeurs par des Meta employés ou quelqu’un d’autre. »