Meta piraciła książki do trenowania sztucznej inteligencji

Aktualności Pozostałe

Marcin Jeżewski
14 stycznia 2024

Źródło: gizchina

Meta piraciła książki do trenowania sztucznej inteligencji

Piractwo stanowi poważny problem dla twórców treści. Nie często się jednak zdarza, żeby piracił gigant mediów społecznościowych, w tym przypadku Meta odpowiadająca za Facebooka oraz Instagrama.

W ostatnich latach wykorzystanie sztucznej inteligencji staj się coraz bardziej powszechne. Programiści rozwijają tę technologię za sprawą różnych narzędzi i to, że robi to także Meta Platforms nie stanowi zaskoczenia. Szkoda jedynie, że do tego celu miała wykorzystać... pirackie treści. Sprawa pewnie nie wyszłaby na jaw, albo dopiero po latach, gdyby nie pozew jaki przeciwko firmie Marka Zuckerberga złożyła grupa autorów książek, które umieszczono w bazie Books3. To właśnie ona posłużyła Meta do trenowania sztucznej inteligencji.

Meta została pozwana za piracenie książek do trenowania AI. Firma nie widzi jednak niczego złego w swoim działaniu.

Books3 jest doskonale znanym zbiorem zawierającym 195 000 książek o łącznej pojemności blisko 37 GB. Został stworzony przez badacza sztucznej inteligencji Shawna Pressera w 2020 roku, aby zapewnić lepsze źródło danych do ulepszania algorytmów uczenia maszynowego. Jednak zbiór danych Books3 to zbiór pirackich e-booków, z których większość została opublikowana w ciągu ostatnich 20 lat.

Była to część większego projektu o nazwie The Pile, którego celem było dostarczenie danych typu open source do modeli językowych. Zbiór danych został udostępniony publicznie i był używany przez różne firmy. Kilku autorów zgłosiło, że ich książki zostały uwzględnione w zbiorze danych Books3 bez ich zgody. Do znanych autorów, którzy wypowiadali się na ten temat, należą Conor Kostick, Bart King, Lauren Groff, Bianca Turetsky i T. Greenwood.

Przytoczone osoby oczywiście nie były zadowolone, iż książki są wykorzystywane bez ich zgody. Część zagroziła nawet podjęciem kroków prawnych, do czego jak widać ostatecznie doszło. Nieuprawnione użycie zbioru Books3 doprowadziło do kilku procesów sądowych, podczas których autorzy żądali odszkodowania i odpowiedniej ochrony treści.

Warto wspomnieć, że jakiś czas temu New York Times pozwał Microsoft i OpenAI za rzekome wykorzystanie milionów artykułów do ulepszenia ChatGPT.

OpenAI twierdzi, że szkolenie sztucznej inteligencji bez zastosowania materiałów chronionych prawem autorskim pozostaje niemożliwe dlatego apelowała do sądu o oddalenie pozwu. Identyczne stanowisko przyjęła Meta, która nie widzi niczego złego w swoim działaniu. Meta przyznała od tego czasu, że używa go do uczenia własnego modelu LLAM i stoi na stanowisku, iż użycie przez nią dzieł do szkolenia LLM "nie wymagało zgody, uznania ani rekompensaty".

Marcin Jeżewski Newsman

Zgłoś autorowi błąd na stronie

Meta piraciła książki do trenowania sztucznej inteligencji

Meta piraciła książki do trenowania sztucznej inteligencji

Komputery

Mobile

Gaming

Rankingi