Amerykański laureat nagrody Pulitzera, pisarz Michael Chabon i grupa innych autorów, złożyli pozew zbiorowy przeciwko OpenAI, oskarżając organizację o naruszenie praw autorskich poprzez wykorzystanie ich prac do szkolenia modeli AI, takich jak ChatGPT.
W pozwie zarzuca się OpenAI, że przeprowadziło szeroko zakrojone operacje w internetowej przestrzeni w celu pozyskania jak najobszerniejszego zestawu treści, co miało służyć lepszemu szkoleniu modeli GPT. Oskarża się organizację o rzekome „nieuchronne” przechwytywanie, pobieranie i kopiowanie prac pisanych, dzieł sztuki oraz gier objętych prawem autorskim. Jednym z najbardziej intrygujących aspektów pozwu jest zarzut, że działalność związana ze sztuczną inteligencją bazuje na „dwóch internetowych zbiorach książek”, które OpenAI nazywa po prostu „Books 1” i „Books 2”.
Pozew oskarża OpenAI o wykorzystywanie zbiorów Projektu Gutenberg oraz pirackich bibliotek "shadow library", takich jak Library Genesis ("LibGen"), Z-Library, Sci-Hub i Bibliotik do szkolenia ChatGPT. System został "nakarmiony" treściami bez zgody twórców.
Oskarżenie opiera się na tym, że w lipcu 2020 roku OpenAI ujawniło, że 16 procent zbioru danych szkoleniowych GPT-3 pochodziło z „Books 1” i „Books 2”, oprócz zbiorów danych stron internetowych „Common Crawl” i „WebText”. Autorzy pozwu twierdzą, że tylko kilka miejsc w publicznym internecie zawiera tak znaczącą ilość materiałów, oskarżając OpenAI, że zbiór danych „OpenAI Books1” opiera się na Projekcie Gutenberg, a „OpenAI Books2” pozyskuje z innych źródeł, jak "niesławne strony internetowe typu "shadow library", takie jak Library Genesis ("LibGen"), Z-Library, Sci-Hub i Bibliotik, na których znajdują się ogromne zbiory pirackich książek, prac naukowych i innych materiałów tekstowych. Materiały gromadzone przez te witryny były również dostępne masowo za pośrednictwem sieci torrent".
Prawnicy pisarzy twierdzą również, że poproszony o napisanie akapitu w stylu Niesamowitych przygód Kavaliera i Claya , książki, która przyniosła amerykańskiemu pisarzowi Chabonowi nagrodę Pulitzera, ChatGPT wygenerował fragment naśladujący jego styl pisania i zawierający odniesienia do postaci zajmujących się z „ciężarem świata w stanie wojny”.
OpenAI stoi w obliczu wielu procesów sądowych dotyczących praw autorskich – w tym dwóch w San Francisco złożonych przez pisarzy Paula Tremblaya i Monę Awad oraz oddzielnie komika Sarę Silverman oraz powieściopisarzy Christophera Golden i Richarda Kadreya.
Pokaż / Dodaj komentarze do: ChatGPT mógł być szkolony na pirackich treściach. Do sądu trafił pozew zbiorowy