Meta e Zuckerberg nella Bufera: Editori e Scrittori Fanno Causa per una "Pirateria di Massa" nell'Addestramento dell'IA Llama

Davide contro Golia: Il Mondo dell'Editoria Sfida il Gigante Tecnologico

Immaginate una biblioteca vasta come il mondo, piena di romanzi, saggi, articoli scientifici e manuali. Ora immaginate che qualcuno entri, fotocopi tutto senza chiedere il permesso e usi questa immensa conoscenza per creare una macchina in grado di scrivere, riassumere e persino imitare lo stile degli autori originali. È questa, in sintesi, la scena del crimine descritta nella clamorosa azione legale intentata contro Meta Platforms Inc. e il suo fondatore, Mark Zuckerberg.

A lanciare il guanto di sfida sono cinque tra le più importanti case editrici al mondo: Hachette, Macmillan, McGraw Hill, Elsevier e Cengage. Al loro fianco, un nome che gli amanti del legal thriller conoscono bene: Scott Turow, l'autore di best seller come "Presunto Innocente". Insieme, hanno depositato una causa presso la corte federale del Distretto Sud di New York, accusando il colosso dei social media di aver orchestrato "una delle più massicce violazioni di materiali protetti da copyright nella storia".

Le Accuse: Libri Piratati per Nutrire l'Intelligenza Artificiale

Il cuore della disputa è Llama, il modello linguistico di grandi dimensioni (LLM) sviluppato da Meta. Secondo l'accusa, per "addestrare" questa intelligenza artificiale, ovvero per fornirle l'enorme quantità di dati testuali necessari per imparare a generare risposte coerenti e complesse, gli ingegneri di Meta non si sarebbero fatti scrupoli. Anziché percorrere la via legale, negoziando licenze con autori ed editori, avrebbero attinto a piene mani da "famigerati siti pirata".

Nella denuncia si fanno nomi e cognomi di queste "biblioteche ombra": siti come Anna's Archive, LibGen e Sci-Hub, noti per essere motori di ricerca che indicizzano milioni di libri e pubblicazioni accademiche piratate. L'accusa sostiene che Meta abbia scaricato illegalmente tramite torrent milioni di opere, per un volume di dati che, secondo alcune stime emerse in precedenti contenziosi, potrebbe arrivare a centinaia di terabyte. Per dare un'idea, si parla di una quantità di informazioni "molte volte superiore all'intera collezione a stampa della Biblioteca del Congresso" degli Stati Uniti.

Ma non è tutto. I querelanti sostengono anche che Meta abbia deliberatamente rimosso le informazioni sulla gestione del copyright dai file utilizzati, come i nomi degli autori, gli editori e i numeri ISBN, nel tentativo di nascondere l'infrazione.

Il Ruolo di Zuckerberg: "Personalmente Autorizzato e Incoraggiato"

Un elemento che rende questa causa particolarmente esplosiva è il coinvolgimento diretto di Mark Zuckerberg. La denuncia non lo vede come una figura di sfondo, ma come il promotore principale di questa strategia. Secondo i documenti legali, Zuckerberg avrebbe "personalmente autorizzato e attivamente incoraggiato la violazione". Si sostiene che la decisione di non cercare accordi di licenza con gli editori sia stata "escalata" fino a lui, che avrebbe poi dato istruzioni verbali per interrompere i negoziati e procedere con l'utilizzo di materiale piratato, per poter poi sostenere più agevolmente la tesi del "fair use".

La Difesa di Meta: Innovazione e "Fair Use"

Dal canto suo, Meta ha già annunciato che combatterà la causa "con determinazione". Un portavoce dell'azienda ha dichiarato che l'intelligenza artificiale sta alimentando innovazioni rivoluzionarie e che i tribunali hanno già stabilito in passato che l'addestramento dell'IA su materiale protetto da copyright può rientrare nel concetto di "fair use". Il "fair use" è una dottrina del diritto d'autore statunitense che consente l'uso limitato di materiale protetto senza autorizzazione per scopi come la critica, il commento, l'insegnamento e la ricerca. Meta sostiene che l'uso dei libri per addestrare un modello IA sia "trasformativo", in quanto lo scopo non è riprodurre l'opera originale, ma estrarre dati statistici per creare uno strumento completamente nuovo.

Tuttavia, i querelanti ribattono che questa difesa non regge, specialmente quando la fonte del materiale è palesemente illegale. Inoltre, evidenziano un danno concreto e imminente.

La Minaccia Esistenziale per Autori ed Editori

Perché questa battaglia è così importante per il mondo del libro? I querelanti vedono nell'approccio di Meta una minaccia diretta alla loro sopravvivenza. Le ragioni sono molteplici:

Sostituzione del prodotto: Un'IA come Llama può generare riassunti così dettagliati di un libro da rendere superfluo l'acquisto dell'originale.
Clonazione e imitazione: La tecnologia può essere usata per creare opere "nello stile di" un certo autore, diluendo il suo marchio e creando una concorrenza sleale.
Inondazione del mercato: Il mercato, in particolare quello degli ebook su piattaforme come Amazon, rischia di essere invaso da libri di bassa qualità generati dall'IA, che sottraggono visibilità e vendite agli autori umani.
Svalutazione del lavoro creativo: Se le grandi aziende tech possono attingere gratuitamente al lavoro di scrittori ed editori, viene meno l'incentivo economico a creare nuove opere di qualità.

Scott Turow ha espresso la sua frustrazione dicendo: "Trovo angosciante e irritante che una delle dieci aziende più ricche del mondo abbia usato consapevolmente copie piratate dei miei libri, e di migliaia di altri autori, per addestrare Llama".

Un Conflitto Già in Atto

Questa non è la prima volta che il mondo della creatività si scontra con i giganti dell'IA. Azioni legali simili sono state intentate da autori, artisti e testate giornalistiche contro aziende come OpenAI (creatrice di ChatGPT), Google e Anthropic. I risultati, finora, sono stati altalenanti. In un caso precedente che vedeva coinvolta Meta e un gruppo di autori tra cui la comica Sarah Silverman, un giudice si era pronunciato a favore di Meta, pur sottolineando che la sua decisione era legata alle specifiche prove presentate in quel caso e non rappresentava un via libera generalizzato.

La nuova causa intentata dagli editori, però, sembra essere costruita su basi più solide, puntando non solo sulla violazione del copyright in sé, ma sulla scelta deliberata e documentata di usare fonti pirata, con il presunto avallo del vertice aziendale.

Conclusione: Un Bivio per il Futuro della Creatività

Ci troviamo di fronte a un momento cruciale, un vero e proprio bivio. Da un lato, c'è la promessa di un'innovazione tecnologica senza precedenti, capace di accelerare la ricerca, la produttività e persino la creatività. Dall'altro, c'è il rischio concreto di erodere le fondamenta economiche e legali su cui si basa la produzione culturale. La questione non è "IA sì o IA no", ma "quale IA vogliamo?". Vogliamo un'intelligenza artificiale che si sviluppa in una sorta di "far west" digitale, dove chi ha più potere tecnologico ed economico può saccheggiare impunemente il patrimonio intellettuale collettivo? Oppure vogliamo un'innovazione che rispetti le regole, che riconosca il valore del lavoro creativo e che costruisca il futuro attraverso collaborazioni eque anziché tramite la pirateria su vasta scala? La sentenza che uscirà dal tribunale di New York non darà solo una risposta a Meta e agli editori, ma invierà un segnale potentissimo a tutta l'industria tecnologica, definendo i confini etici e legali entro cui l'intelligenza artificiale potrà crescere nei prossimi anni.