Choć duże modele językowe (LLM) uznawane są za krok milowy w rozwoju sztucznej inteligencji, jeden weekendowy eksperyment inżyniera z Citrix pokazał, jak bardzo daleko im jeszcze do prawdziwego zrozumienia, nie mówiąc już o... grze w szachy.
Mimo mocy obliczeniowej współczesnych centrów danych, ChatGPT został pokonany przez ośmiobitowy silnik szachowy działający na emulowanym procesorze Atari 2600, którego taktowanie wynosi zaledwie 1,19 MHz.
ChatGPT nie umie grać w szachy
Robert Jr. Caruso, inżynier oprogramowania z Citrix, postanowił sprawdzić, jak nowoczesny chatbot poradzi sobie w starciu z prehistoryczną technologią. Pomysł zrodził się w trakcie rozmowy z samym ChatGPT na temat historii sztucznej inteligencji i gier planszowych. Gdy bot zaproponował wspólną rozgrywkę w „Atari Chess”, Caruso uznał, że musi chodzić o Video Chess — jedyną grę szachową wydaną na Atari 2600.
Eksperyment, przeprowadzony przy użyciu dokładnej emulacji konsoli za pomocą programu Stella, przekształcił się w spektakularną porażkę nowoczesnej AI. ChatGPT miał zapewniony dostęp do uproszczonego układu szachownicy i legendy opisującej figury, jednak nie potrafił poprawnie interpretować pozycji ani reguł gry. Mylił wieże z gońcami, ignorował oczywiste zagrożenia i wykonywał ruchy, które nawet początkujący szachista uznałby za irracjonalne.
„Przez 90 minut musiałem powstrzymywać go przed wykonywaniem katastrofalnych ruchów i korygować jego rozumienie planszy kilka razy na turę” – relacjonuje Caruso. „To było trochę jak granie z dzieckiem, które dopiero co nauczyło się, że szachy mają figury o różnych nazwach”.
Przegrany się tłumaczy
W pewnym momencie chatbot próbował zrzucić winę za swoje błędy na „niewystarczająco jednoznaczną symbolikę” używaną przez Video Chess. Mimo wielokrotnych prób „resetowania gry” w celu poprawy swojego działania, ChatGPT nie był w stanie sprostać nawet najprostszym strategiom przeciwnika.
To właśnie ten kontrast jest szczególnie wymowny. ChatGPT działa dzięki gigantycznej infrastrukturze serwerowej opartej na tysiącach energochłonnych procesorów graficznych. Tymczasem Atari 2600, zaprojektowane w latach 70., korzystało z prymitywnego, jednozadaniowego układu 6507. A jednak to właśnie ta technologiczna skamielina bez problemu pokonała współczesnego cyfrowego giganta.
Eksperyment Caruso stanowi interesujące przypomnienie o fundamentalnych ograniczeniach dużych modeli językowych. Mimo że są potężne w przetwarzaniu tekstu i generowaniu złożonych odpowiedzi, ich funkcjonowanie to wciąż statystyczna zabawa w przewidywanie kolejnych słów – bez faktycznego rozumienia, świadomości kontekstu czy zdolności logicznego wnioskowania.
„To nie jest inteligencja”
„To nie jest inteligencja” – podkreśla Caruso. – „To wyrafinowany system heurystyczny zaprojektowany tak, by dostarczać przekonujące odpowiedzi. Ale w konfrontacji z prostą, jasno zdefiniowaną logiką gry w szachy – ponosi klęskę”.
Na koniec inżynier z uśmiechem zapowiedział kolejną próbę: tym razem ChatGPT zmierzy się z Battle Chess na emulowanej wersji jego pierwszego komputera: IBM PC z procesorem 80286, pracującym z „oszałamiającą” częstotliwością 16 MHz.

Pokaż / Dodaj komentarze do: Procesor z lat 70. upokorzył ChatGPT. Wpadka roku