Nowe dowody e-mailowe mogą wywrócić obronę Meta opartą na „dozwolonym użytku” do góry nogami. Grupa autorów pozwała Meta, twierdząc, że firma używała nieautoryzowanych kopii ich książek do trenowania swoich generatywnych modeli AI.
Chociaż Meta zaprzeczała jakimkolwiek wykroczeniom, nowo ujawnione wiadomości sugerują, że kierownictwo i inżynierowie byli dobrze świadomi swoich działań — i że naruszali prawo autorskie.
Pozew złożony przez Sarah Silverman, Richarda Kadrey i innych pisarzy oraz posiadaczy praw przeciwko Meta może wchodzić w swoją najważniejszą fazę. Autorzy uzyskali wewnętrzne e-maile firmy, w których pracownicy Meta otwarcie dyskutowali o „torrentowaniu” znanych archiwów pirackiej treści w celu trenowania bardziej zaawansowanych modeli AI.
Meta pozyskiwała treści do szkoleń AI bez zgody autorów
Meta wcześniej przyznała się do używania pewnych kontrowersyjnych zbiorów danych, argumentując, że takie praktyki powinny być uznawane za dozwolony użytek. Firma również przyznała się do pobierania ogromnego zbioru danych znanego jako „LibGen”, który zawiera miliony pirackich książek. Jednak nowo ujawnione e-maile ujawniają głębsze obawy w Meta dotyczące pozyskiwania i dystrybucji tych danych przez sieć BitTorrent.
Według e-maili Meta pobrała i udostępniła co najmniej 81,7 terabajtów danych z różnych kontrowersyjnych zbiorów danych, w tym 35,7 terabajtów z archiwów Z-Library i LibGen. Powodowie twierdzą, że Meta zaangażowała się w „zdumiewający” schemat torrentowania, dystrybuując pirackie książki na niespotykaną skalę.
W wiadomości z kwietnia 2023 r. badacz Meta Nikolay Bashlykov napisał, że „torrentowanie z firmowego laptopa nie wydaje się właściwe”. Wiadomość zakończyła się uśmiechniętą emotikoną, ale kilka miesięcy później jego ton znacznie się zmienił.
Sprawdź też: Rząd Wielkiej Brytanii nakazał Apple stworzenie backdooru do wszystkich zaszyfrowanych kont iCloud
Meta nie widzi problemu
We wrześniu 2023 roku Bashlykov stwierdził, że konsultuje się z zespołem prawnym Meta, ponieważ używanie torrentów — a tym samym „seedowanie” terabajtów pirackich danych — jest wyraźnie „nie w porządku” z prawnego punktu widzenia.
Meta najwyraźniej była świadoma, że jej inżynierowie angażowali się w nielegalne torrentowanie w celu trenowania modeli AI, a sam Mark Zuckerberg był podobno świadomy sytuacji z LibGen. Aby ukryć tę działalność, firma próbowała maskować swoje torrentowanie i seedowanie, używając serwerów poza główną siecią Facebooka.
W innej wewnętrznej wiadomości pracownik Meta Frank Zhang określił to podejście jako „tryb ukryty”.
Podobnie jak inne duże firmy technologiczne, Meta inwestuje ogromne sumy pieniędzy w rozwój AI i usługi generatywne AI. Firma, która dąży do zapełnienia swoich starzejących się sieci społecznościowych personami i botami generowanymi przez AI, niedawno złożyła wniosek o oddalenie pozwu prowadzonego przez Silverman i innych autorów. Jednak nowo ujawnione e-maile szczegółowo opisujące zaangażowanie Meta w torrentowanie i dystrybucję pirackich książek mogą znacznie skomplikować jej obronę prawną.
Czytaj też: