Guerra all'Intelligenza Artificiale: Editori e Autori contro Meta per Llama

Elsevier, il colosso dell'editoria scientifica, si è unito a una class action contro Meta e Mark Zuckerberg. L'accusa? Aver "dato in pasto" al modello di IA Llama milioni di articoli e libri protetti da copyright senza permesso. Una battaglia legale che potrebbe ridisegnare il futuro dell'IA.
La notizia

Immagina un super-cervellone digitale, capace di leggere e imparare da una quantità infinita di testi per poi conversare, scrivere e creare. Fantastico, no? Questo, in parole povere, è quello che fanno i modelli linguistici di grandi dimensioni (LLM) come Llama di Meta. Ma c'è un "piccolo" dettaglio che sta scatenando una vera e propria bufera legale: da dove arriva tutto questo sapere? Secondo alcuni dei più grandi nomi dell'editoria mondiale, la risposta è semplice: dal furto.

Un Fronte Compatto contro il Gigante dei Social

La notizia ha fatto il giro del mondo: il gigante dell'editoria scientifica Elsevier si è unito a una cordata di colossi del settore, tra cui figurano nomi come Hachette, Macmillan, Cengage e McGraw Hill, in una class action contro Meta Platforms. Non sono soli: al loro fianco si è schierato anche lo scrittore di bestseller Scott Turow. L'accusa, depositata presso un tribunale federale di Manhattan, è pesantissima: Meta avrebbe deliberatamente utilizzato milioni di opere protette da copyright – libri, articoli scientifici, romanzi – per addestrare il suo modello di intelligenza artificiale, Llama, senza chiedere il permesso e, soprattutto, senza pagare un centesimo. Una mossa che i querelanti definiscono "una delle più massicce violazioni di materiale protetto da copyright nella storia".

Ma come avrebbe fatto Meta a mettere le mani su questa enorme mole di dati? L'atto d'accusa punta il dito su due fonti principali, entrambe tutt'altro che limpide.

  • Common Crawl: un'organizzazione no-profit che crea un archivio pubblico del web scansionando miliardi di pagine. Il problema è che, in questo mare magnum di dati, finiscono inevitabilmente anche copie non autorizzate di opere protette.
  • Biblioteche ombra: siti pirata come LibGen e Sci-Hub, veri e propri archivi illegali che offrono accesso gratuito a milioni di libri e articoli scientifici. Gli editori sostengono che Meta abbia attinto a piene mani da queste fonti, scaricando e utilizzando materiale che avrebbe dovuto essere acquistato o concesso in licenza.

La denuncia sostiene addirittura che lo stesso Mark Zuckerberg abbia personalmente bloccato le trattative per ottenere le licenze dagli editori nell'aprile del 2023, preferendo la via della presunta violazione.

La Difesa di Meta: "È un Uso Lecito!"

Dal canto suo, Meta non ci sta a passare per il cattivo della storia e ha promesso di "combattere questa causa in modo aggressivo". La linea difensiva si basa su un concetto chiave del diritto d'autore statunitense: il "fair use", o "uso lecito". Secondo i legali di Meta, utilizzare materiale protetto da copyright per addestrare un'IA non è come fare una fotocopia e rivenderla. Si tratta, a loro dire, di un uso "trasformativo": l'IA non riproduce le opere originali, ma le "studia" per imparare modelli statistici del linguaggio. Un portavoce dell'azienda ha dichiarato: "L'IA sta alimentando innovazioni rivoluzionarie... e i tribunali hanno giustamente stabilito che addestrarla su materiale protetto da copyright può essere considerato un uso lecito".

In effetti, finora diversi tribunali statunitensi hanno dato ragione alle aziende tecnologiche su questo punto, come nel caso Kadrey v. Meta. Tuttavia, la situazione non è così semplice. In alcune sentenze più recenti, i giudici hanno iniziato a porre dei paletti, suggerendo che l'argomento del "fair use" potrebbe vacillare se i detentori dei diritti dimostrassero un danno concreto al mercato delle loro opere. Ed è proprio questo il punto su cui battono gli editori: se un'IA può generare riassunti, analisi o addirittura opere "ispirate" ai loro libri, chi comprerà più gli originali? Llama viene descritto nell'atto di accusa come una "macchina di sostituzione infinita" che minaccia di diluire il mercato e danneggiare le vendite.

Cosa C'è in Gioco? Il Futuro della Creatività (e del Business)

Questa battaglia legale va ben oltre una semplice disputa economica. L'esito di questo processo potrebbe creare un precedente fondamentale per l'intero settore dell'intelligenza artificiale generativa. Se i giudici daranno ragione agli editori, le aziende come Meta potrebbero essere costrette a:

  1. Pagare danni miliardari: i querelanti chiedono il massimo dei danni previsti dalla legge.
  2. Distruggere i modelli attuali: potrebbe essere ordinato a Meta di eliminare tutte le copie "illegali" e i modelli addestrati con esse.
  3. Rivedere completamente le loro pratiche: le aziende dovrebbero implementare sistemi rigorosi per tracciare le fonti dei loro dati e negoziare costose licenze con i creatori di contenuti.

Maria Pallante, presidente dell'Associazione degli Editori Americani, ha riassunto perfettamente la posta in gioco: "La violazione su vasta scala di Meta non è progresso pubblico, e l'IA non sarà mai realizzata correttamente se le aziende tecnologiche daranno la priorità ai siti pirata rispetto alla cultura e all'immaginazione".

Conclusione: Un Bivio per l'Innovazione

Ci troviamo di fronte a un bivio fondamentale. Da un lato, c'è la spinta inarrestabile verso l'innovazione tecnologica, con l'intelligenza artificiale che promette di rivoluzionare ogni aspetto della nostra vita. Dall'altro, c'è il sacrosanto diritto di autori, scienziati ed editori di veder protetto e remunerato il proprio lavoro intellettuale. Trovare un equilibrio non sarà facile. Questa causa non è un processo alla tecnologia, ma al modo in cui essa viene sviluppata e implementata. È inaccettabile che, nel nome del "muoversi velocemente e rompere le cose" (motto storico di Facebook), si pensi di poter ignorare decenni di leggi sul diritto d'autore. L'innovazione non può e non deve basarsi sul saccheggio. Sarà affascinante vedere come la giustizia traccerà la linea tra l'ispirazione e il furto nell'era digitale, una linea che determinerà non solo il futuro di Meta, ma quello dell'intera economia creativa.