Elon Musk ogłosił, że ludzkość stanęła przed problemem wyczerpania dostępnych zasobów wiedzy i danych, które mogą być wykorzystane do szkolenia modeli sztucznej inteligencji (AI). Według Muska, do końca 2025 roku technologia AI może przewyższyć możliwości ludzkie, a dalszy rozwój tej dziedziny będzie wymagał wykorzystania treści generowanych przez samą AI.
Musk, znany z wizjonerskich prognoz dotyczących technologii, podkreślił, że świat już w 2024 roku osiągnął granicę dostępnych danych ludzkich do szkolenia sieci neuronowych. Według niego, przyszłość AI leży w danych syntetycznych – specjalnych informacjach generowanych przez sztuczną inteligencję podczas procesu uczenia.
Jak informuje TechCrunch, Musk uważa, że dane syntetyczne pozwolą sieciom neuronowym na przejście do samouczenia, czyli etapu, w którym AI sama ocenia i modyfikuje swoje modele. Ta zmiana ma otworzyć drogę do stworzenia ogólnej sztucznej inteligencji (AGI), która mogłaby osiągnąć poziom ludzkiej inteligencji lub nawet ją przewyższyć.
AI przyszłości – przełom w 2025 roku?
Według prognoz ekspertów, w 2025 roku może nastąpić przełom dzięki premierze modelu GPT-5, który jest określany jako potencjalnie pierwszy pełnoprawny AGI. Musk przewiduje, że do końca tego roku sztuczna inteligencja będzie „mądrzejsza niż ktokolwiek inny”, a do 2030 roku może przewyższyć łączną inteligencję wszystkich ludzi.
Jednak brak danych to nie tylko problem techniczny, ale także finansowy. Jak zauważyli twórcy startupu AI Writer, szkolenie na danych syntetycznych jest tańsze niż na danych ludzkich. Opracowanie modelu Palmyra X 004 kosztowało 700 tys. dolarów, podczas gdy porównywalny model OpenAI wymagał nakładów rzędu 4,6 mln dolarów.
Problem wyczerpania danych
Nowoczesne modele AI, w tym duże modele językowe (LLM), opierają się na gigantycznych ilościach danych tekstowych i wizualnych. Do 2015 roku głównym wyzwaniem dla rozwoju AI była moc obliczeniowa, ale w ostatnich latach problemem stał się niedobór wysokiej jakości danych.
Badania przeprowadzone przez Uniwersytet Stanforda wskazują, że publiczne dane tekstowe mogą wyczerpać się w latach 2026–2032. Dane wizualne, takie jak obrazy i filmy, mogą być dostępne do treningu AI nieco dłużej – do 2046 roku.
W tej sytuacji giganci technologiczni, tacy jak OpenAI i Microsoft, coraz częściej sięgają po dane syntetyczne. Szacuje się, że obecnie aż 60% danych wykorzystywanych przez sieci neuronowe pochodzi z tego źródła. Jednak takie podejście niesie ryzyko powstawania bardziej stronniczych i ograniczonych modeli, ponieważ treści tworzone na potrzeby szkoleń bazują na istniejących materiałach, a nie na nowych odkryciach.
Pomimo potencjalnych korzyści z wykorzystania danych syntetycznych, wyzwania etyczne i techniczne pozostają. Ilya Sutskever, były główny naukowiec OpenAI, zauważył, że przyszłe systemy AI będą musiały rozwiązywać problemy w sposób bardziej przypominający ludzkie rozumowanie. Tymczasem Jack Clark, współzałożyciel startupu Anthropic, ostrzega, że szkolenie AI na ograniczonych zasobach ludzkich danych prowadzi do nasycenia rynku, co może spowolnić rozwój technologii.
Jednocześnie rosną obawy o wykorzystanie danych z nieautoryzowanych źródeł. OpenAI, twórca ChatGPT, zmaga się z licznymi oskarżeniami o naruszenia praw autorskich, co zmusza firmę do zwiększania zespołów prawników.
Pokaż / Dodaj komentarze do: Elon Musk: Ludzkość nauczyła już wszystkiego AI. Przyszłość to dane syntetyczne