Miliony książek zniszczone dla sztucznej inteligencji. Kontrowersyjne kulisy szkolenia Claude AI

Miliony książek zniszczone dla sztucznej inteligencji. Kontrowersyjne kulisy szkolenia Claude AI

Generatywna sztuczna inteligencja od dawna budzi kontrowersje – od fałszywych odpowiedzi i olbrzymiego zużycia energii po oskarżenia o bezprawne wykorzystywanie treści chronionych prawem autorskim. Teraz do listy zarzutów dochodzi kolejna, szokująca praktyka: masowe niszczenie fizycznych książek w imię rozwoju technologii.  Niedawna sprawa sądowa ujawnia, że firma Anthropic, twórca konkurenta ChatGPT o nazwie Claude, zniszczyła miliony tomów, by wyszkolić swojego językowego asystenta.

Jak wynika z ujawnionych dokumentów sądowych, Anthropic zakupił miliony książek, usunął z nich oprawy, zeskanował strony i wyrzucił pozostałości, nie pozostawiając śladu po oryginalnych egzemplarzach. Wszystko po to, by stworzyć cyfrową bazę danych, niezbędną do szkolenia swojego dużego modelu językowego.

To, co może brzmieć jak scena z dystopijnej powieści, miało miejsce w rzeczywistości – i zostało oficjalnie uznane przez sąd. Co więcej, sędzia rozpatrujący sprawę stwierdził, że sam fakt zniszczenia fizycznych książek i nieudostępnienia ich cyfrowych kopii publicznie przyczynił się do uznania działań firmy za „transformacyjne” i mieszczące się w granicach dozwolonego użytku.

Szkolenie na granicy prawa

Sprawa Anthropic to kolejny przykład, jak branża generatywnej AI balansuje na cienkiej linii prawa autorskiego. Z jednej strony firmy, takie jak Anthropic, Google czy OpenAI, przekonują, że szkolenie modeli na publicznie dostępnych lub zakupionych treściach jest legalne. Z drugiej – autorzy i wydawcy alarmują, że ich prace są wykorzystywane bez zgody i bez rekompensaty.

Choć Anthropic w tej sprawie wygrał częściowo – sąd uznał digitalizację książek za legalną – to firma nadal musi się zmierzyć z zarzutami dotyczącymi wykorzystania pirackich kopii książek, pobranych z nielegalnych bibliotek internetowych. Proces w tej sprawie ma rozpocząć się w grudniu, a firma może zostać zobowiązana do zapłaty nawet 150 tysięcy dolarów za każdą naruszoną pozycję.

Bez praw autorskich AI nie przetrwa?

W branży coraz częściej słychać głosy, że bez dostępu do ogromnych zbiorów danych – w tym chronionych książek, artykułów i dzieł wizualnych – rozwój dużych modeli językowych byłby praktycznie niemożliwy. Jak stwierdził były dyrektor Metal, „gdyby AI musiała przestrzegać prawa autorskiego, umarłaby z dnia na dzień”.

To kontrowersyjne stanowisko staje się coraz powszechniejsze wśród twórców generatywnej AI. Jednak rosnąca liczba pozwów sugeruje, że społeczna i prawna cierpliwość się kończy. Przykładem jest niedawna sprawa Disneya przeciwko Midjourney – firmie oferującej generator obrazów – gdzie wykazano, że narzędzie może dokładnie odtworzyć treści chronione prawem autorskim. Z kolei Getty Images przyznało, że nie jest w stanie pozywać każdego podmiotu naruszającego ich prawa w kontekście AI.

Transformacja czy kradzież?

Decyzja sądu w sprawie Anthropic może stworzyć niebezpieczny precedens. Choć sędzia orzekł, że zniszczenie fizycznych książek i stworzenie z nich niedostępnej cyfrowej bazy danych było działaniem transformacyjnym, krytycy zwracają uwagę na fakt, że modele AI potrafią odtwarzać całe fragmenty tekstów niemal słowo w słowo. W takich przypadkach trudno mówić o „nowym dziele” – a tym bardziej o dozwolonym użytku.

Organizacje zrzeszające twórców już zapowiadają dalsze kroki prawne. W międzyczasie firmy rozwijające sztuczną inteligencję zyskują coraz większą swobodę działania, choć ryzyko wielomilionowych odszkodowań nadal wisi nad branżą niczym miecz Damoklesa.

Obserwuj nas w Google News

Pokaż / Dodaj komentarze do: Miliony książek zniszczone dla sztucznej inteligencji. Kontrowersyjne kulisy szkolenia Claude AI

 0
Kolejny proponowany artykuł
Kolejny proponowany artykuł
Kolejny proponowany artykuł
Kolejny proponowany artykuł