ChatGPT mógł być szkolony na pirackich treściach. Do sądu trafił pozew zbiorowy

Aktualności Pozostałe

Paweł Czajkowski
13 września 2023

ChatGPT mógł być szkolony na pirackich treściach. Do sądu trafił pozew zbiorowy

Amerykański laureat nagrody Pulitzera, pisarz Michael Chabon i grupa innych autorów, złożyli pozew zbiorowy przeciwko OpenAI, oskarżając organizację o naruszenie praw autorskich poprzez wykorzystanie ich prac do szkolenia modeli AI, takich jak ChatGPT.

W pozwie zarzuca się OpenAI, że przeprowadziło szeroko zakrojone operacje w internetowej przestrzeni w celu pozyskania jak najobszerniejszego zestawu treści, co miało służyć lepszemu szkoleniu modeli GPT. Oskarża się organizację o rzekome „nieuchronne” przechwytywanie, pobieranie i kopiowanie prac pisanych, dzieł sztuki oraz gier objętych prawem autorskim. Jednym z najbardziej intrygujących aspektów pozwu jest zarzut, że działalność związana ze sztuczną inteligencją bazuje na „dwóch internetowych zbiorach książek”, które OpenAI nazywa po prostu „Books 1” i „Books 2”.

Pozew oskarża OpenAI o wykorzystywanie zbiorów Projektu Gutenberg oraz pirackich bibliotek "shadow library", takich jak Library Genesis ("LibGen"), Z-Library, Sci-Hub i Bibliotik do szkolenia ChatGPT. System został "nakarmiony" treściami bez zgody twórców.

Oskarżenie opiera się na tym, że w lipcu 2020 roku OpenAI ujawniło, że 16 procent zbioru danych szkoleniowych GPT-3 pochodziło z „Books 1” i „Books 2”, oprócz zbiorów danych stron internetowych „Common Crawl” i „WebText”. Autorzy pozwu twierdzą, że tylko kilka miejsc w publicznym internecie zawiera tak znaczącą ilość materiałów, oskarżając OpenAI, że zbiór danych „OpenAI Books1” opiera się na Projekcie Gutenberg, a „OpenAI Books2” pozyskuje z innych źródeł, jak "niesławne strony internetowe typu "shadow library", takie jak Library Genesis ("LibGen"), Z-Library, Sci-Hub i Bibliotik, na których znajdują się ogromne zbiory pirackich książek, prac naukowych i innych materiałów tekstowych. Materiały gromadzone przez te witryny były również dostępne masowo za pośrednictwem sieci torrent".

Prawnicy pisarzy twierdzą również, że poproszony o napisanie akapitu w stylu Niesamowitych przygód Kavaliera i Claya , książki, która przyniosła amerykańskiemu pisarzowi Chabonowi nagrodę Pulitzera, ChatGPT wygenerował fragment naśladujący jego styl pisania i zawierający odniesienia do postaci zajmujących się z „ciężarem świata w stanie wojny”.

OpenAI stoi w obliczu wielu procesów sądowych dotyczących praw autorskich – w tym dwóch w San Francisco złożonych przez pisarzy Paula Tremblaya i Monę Awad oraz oddzielnie komika Sarę Silverman oraz powieściopisarzy Christophera Golden i Richarda Kadreya.

Ciekawostki

Paweł Czajkowski Newsman / Zastępca kierownika działu News

Zgłoś autorowi błąd na stronie

ChatGPT mógł być szkolony na pirackich treściach. Do sądu trafił pozew zbiorowy

ChatGPT mógł być szkolony na pirackich treściach. Do sądu trafił pozew zbiorowy

Komputery

Mobile

Gaming

Rankingi