NVIDIA, jeden z największych graczy świata półprzewodników i sztucznej inteligencji, właśnie została oskarżona o piractwo.
Nowe dokumenty sądowe złożone w USA sugerują, że firma miała świadomie korzystać z ogromnych zbiorów pirackich książek do trenowania swoich modeli językowych. Sprawa może mieć daleko idące konsekwencje dla całej branży AI.
„Szybki dostęp” do cienia internetu
Rozszerzony pozew zbiorowy, złożony przez grupę autorów, wskazuje na wewnętrzne dokumenty NVIDII, które mają dowodzić, że kierownictwo firmy zatwierdziło wykorzystanie danych pochodzących z tzw. shadow libraries. Chodzi przede wszystkim o Anna’s Archive, czyli jedną z największych nieoficjalnych bibliotek w sieci, gromadzącą miliony książek objętych prawami autorskimi.
Według pozwu pracownicy Zielonych mieli bezpośrednio kontaktować się z administratorami serwisu, poszukując „wysokoprzepustowego dostępu” do danych, które miały zostać włączone do procesu wstępnego trenowania dużych modeli językowych (LLM).
Rozszerzony pozew zbiorowy, złożony przez grupę autorów, wskazuje na wewnętrzne dokumenty NVIDII, które mają dowodzić, że kierownictwo firmy zatwierdziło wykorzystanie danych pochodzących z tzw. shadow libraries.

Ostrzeżenie było, zgoda też
Co szczególnie obciąża firmę, to fakt, że Anna’s Archive miała wprost ostrzec NVIDIĘ o nielegalnym pochodzeniu zbiorów. Serwis miał zapytać, czy korporacja posiada odpowiednie zgody, po wcześniejszych doświadczeniach z innymi firmami AI. Mimo to, jak twierdzą autorzy pozwu, zarząd firmy miał dać „zielone światło” zaledwie kilka dni po otrzymaniu ostrzeżenia. W grę wchodziły dane o ogromnej skali. Mowa nawet o 500 terabajtach materiałów, w tym milionach książek znanych z systemu cyfrowego wypożyczania Internet Archive, który sam był już przedmiotem sporów sądowych.
Nie tylko jedna biblioteka
Pozew nie ogranicza się wyłącznie do Anna’s Archive. Autorzy oskarżają NVIDIĘ także o korzystanie z innych znanych źródeł pirackich treści, takich jak LibGen, Sci-Hub, Z-Library czy baza Books3. Co więcej, firma miała udostępniać skrypty i narzędzia pozwalające klientom korporacyjnym automatycznie pobierać dane z zestawu The Pile, zawierającego właśnie Books3.
Ironia sytuacji polega na tym, że miało to być rozwiązanie „enterprise”, czyli klasy korporacyjnej, tyle że z automatyzacją potencjalnych problemów praw autorskich.
AI kontra prawa autorskie
Nie wiadomo, czy NVIDIA zapłaciła za dostęp do danych, choć według pozwu mówiono o kwotach rzędu dziesiątek tysięcy dolarów za szybki transfer. Sprawa po raz kolejny pokazuje rozwój sztucznej inteligencji a ochroną własności intelektualnej często nie idzie w parze, a duże firmy niewiele robią sobie z praw autorskich w tym kontekście. Jeśli zarzuty się potwierdzą, może to być jeden z najpoważniejszych ciosów w wizerunek firmy i kolejny sygnał, że era „trenujemy na wszystkim, co jest w sieci” dobiega końca.
Spodobało Ci się? Podziel się ze znajomymi!
Pokaż / Dodaj komentarze do:
NVIDIA została piratem? Mocny pozew o nielegalne wykorzystywanie treści