Le email di Meta rivelano il Torrenting di libri piratati per l’addestramento dell’IA

Image by Nokia621, from Wiki Commons

Le email di Meta rivelano il Torrenting di libri piratati per l’addestramento dell’IA

Tempo di lettura: 4 Min.

Nuove email svelate sono emerse come quello che gli autori di libri chiamano la “prova più dannosa” contro Meta in una causa di copyright in corso, come riportato per la prima volta da Ars Technica.

In fretta? Ecco i fatti salienti!

  • Meta ha scaricato via torrent 81,7 terabyte di libri piratati da biblioteche ombra come LibGen e Z-Library.
  • Email interne mostrano che i dipendenti di Meta hanno sollevato preoccupazioni legali riguardo al torrenting e alla distribuzione di materiale protetto da copyright.
  • Meta avrebbe presuntamente nascosto il torrenting evitando i server di Facebook e minimizzando l’attività di seeding.

Ars Technica riporta che gli autori sostengono che Meta abbia addestrato illegalmente i suoi modelli di intelligenza artificiale su libri piratati, e le email rivelano preoccupazioni interne riguardo alla legalità del torrenting e della diffusione di materiale protetto da copyright.

Il mese scorso, Meta ha ammesso di aver scaricato tramite torrent un controverso dataset conosciuto come LibGen, che contiene decine di milioni di libri piratati.

Tuttavia, i dettagli sono rimasti poco chiari fino a quando le email non censurate sono state rese pubbliche.

Secondo la richiesta presentata in tribunale dagli autori, Meta ha scaricato tramite torrent “almeno 81,7 terabyte di dati attraverso molteplici librerie ombra tramite il sito Anna’s Archive, inclusi almeno 35,7 terabyte di dati provenienti da Z-Library e LibGen.” Inoltre, “Meta aveva precedentemente scaricato tramite torrent 80,6 terabyte di dati da LibGen.”

“La portata dello schema illecito di torrenting di Meta è stupefacente”, hanno affermato gli autori nel loro atto, sottolineando che perfino “atti di pirateria di dati molto più piccoli, solo lo 0,008 percento della quantità di opere protette da copyright piratate da Meta, hanno portato i giudici a segnalare il comportamento all’ufficio degli avvocati degli Stati Uniti per un’indagine penale.”

Ars Technica sottolinea che le email rivelano anche un malcontento interno tra i dipendenti di Meta. Nel aprile 2023, l’ingegnere di ricerca Nikolay Bashlykov scrisse: “Scaricare torrent da un laptop aziendale non sembra corretto”, aggiungendo una emoji sorridente.

Ha espresso preoccupazione sull’uso degli indirizzi IP di Meta “per caricare contenuti pirata attraverso torrent”. Entro settembre 2023, Bashlykov aveva abbandonato l’umorismo, consultando il team legale di Meta e avvertendo che “l’uso dei torrent comporterebbe il ‘seeding’ dei file, cioè, la condivisione del contenuto all’esterno, ciò potrebbe non essere legalmente accettabile”.

Nonostante questi avvertimenti, gli autori sostengono che Meta abbia continuato a scaricare e a condividere contenuti piratati, cercando persino di nascondere le sue attività.

Ars Technica riporta che messaggi interni mostrano che Meta ha evitato di utilizzare i server di Facebook per scaricare il dataset per “evitare” il “rischio” che qualcuno potesse “risalire al seeder/downloader,” come descritto dal ricercatore Frank Zhang.

Michael Clark, un dirigente di Meta, ha ammesso in una deposizione che le impostazioni sono state modificate “in modo che potesse avvenire la minima quantità possibile di seeding”.

Gli autori ora sostengono che il personale di Meta coinvolto nella decisione sul torrenting debba essere nuovamente interrogato, poiché le nuove prove presumibilmente “contraddicono le testimonianze precedenti date in deposizione”.

Ad esempio, mentre l’amministratore delegato Mark Zuckerberg ha affermato di non aver partecipato all’utilizzo di LibGen per l’addestramento dell’IA, messaggi non censurati suggeriscono che la “decisione di utilizzare LibGen è avvenuta” dopo “un’escalation precedente a MZ.”

Ars Technica riporta che Meta ha sostenuto che il suo addestramento dell’IA su LibGen costituisce un “uso lecito” e ha negato qualsiasi distribuzione illegale delle opere degli autori. Tuttavia, le rivelazioni sul torrenting hanno complicato la sua difesa, permettendo agli autori di ampliare le loro accuse di violazione diretta del copyright.

Mentre il caso procede, Meta si trova sotto un crescente scrutinio per il suo trattamento del materiale protetto da copyright, con gli autori determinati a rendere responsabile il gigante tecnologico per quello che descrivono come un “massiccio schema illegale di torrenting”.

Hai apprezzato questo articolo?
Valutalo!
L'ho odiato Non mi è piaciuto Non male Molto bene! L'ho amato!

Siamo felici che ti sia piaciuto il nostro lavoro!

In qualità di stimato lettore, ti dispiacerebbe lasciare una recensione su Trustpilot? Richiede poco tempo e significa tantissimo per noi. Grazie mille!

Valutaci su Trustpilot
0 Votato da 0 utenti
Titolo
Commento
Grazie per la tua opinione!
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Lascia un commento

Loader
Loader Mostra di più...