Chińska firma Zhipu AI, działająca obecnie pod marką Z.ai, ogłosiła stworzenie nowego zaawansowanego modelu sztucznej inteligencji wytrenowanego w całości na krajowym sprzęcie. Według deklaracji spółki, po raz pierwszy udało się zbudować nowoczesny model generatywny bez udziału zachodnich akceleratorów obliczeniowych, opierając cały proces na platformach firmy Huawei.
GLM-Image został zaprezentowany jako model łączący generowanie języka i obrazu w jednym systemie. Firma opisuje jego konstrukcję jako hybrydę podejścia autoregresyjnego i dyfuzyjnego, pozwalającą na tworzenie wizualnych treści przy jednoczesnym zachowaniu spójności semantycznej z opisem tekstowym. W porównaniu z wcześniejszymi narzędziami obrazowymi rozwijanymi przez Zhipu, nowy model ma oferować wyraźnie wyższą jakość i lepszą kontrolę nad detalami. GLM-Image został udostępniony jako projekt open source, co oznacza swobodny dostęp do modelu dla użytkowników na całym świecie.
Architektura GLM-Image składa się z dwóch głównych komponentów. Pierwszym jest generator autoregresyjny oparty na modelu GLM-4-9B, rozszerzony o słownik uwzględniający tokeny wizualne. W początkowej fazie tworzy on zwarte reprezentacje, które następnie rozwijane są do form umożliwiających generowanie obrazów o wysokiej rozdzielczości. Drugim elementem jest dekoder dyfuzyjny wykorzystujący architekturę DiT, odpowiedzialny za rekonstrukcję obrazu w przestrzeni utajonej, wzbogacony o moduł poprawiający odwzorowanie tekstu w grafice.
Trening wyłącznie na platformach Huawei
Zhipu podkreśla, że cały proces, od przygotowania danych po trening na dużą skalę, został przeprowadzony z użyciem serwerów Huawei Ascend Atlas 800T A2. Platforma ta obsługuje procesory Kunpeng 920 oparte na rdzeniach ARM własnego projektu Huawei oraz akceleratory AI Ascend 910. Firma zaznacza, że nie korzystała z żadnych zachodnich układów GPU ani zewnętrznych platform obliczeniowych.
Huawei promuje obecnie najnowszą wersję swoich akceleratorów, Ascend 910C, jako rozwiązanie zdolne osiągać wydajność zbliżoną do kart Nvidia H100. Według deklaracji producenta, pojedyncza karta ma oferować moc obliczeniową sięgającą 800 TFLOPS przy precyzji FP16. Choć liczby te robią wrażenie, Zhipu nie ujawniło, ile serwerów wykorzystano ani jak długo trwał proces treningu modelu.
Sukces symboliczny czy realna alternatywa
Brak szczegółowych danych dotyczących skali infrastruktury i kosztów pozostawia istotne pytania bez odpowiedzi. Nie wiadomo, czy platforma Huawei pozwala na trenowanie modeli w tempie i budżecie porównywalnym z rozwiązaniami zachodnich producentów. Zhipu może więc ogłaszać technologiczny sukces, jednak bez twardych metryk trudno ocenić jego praktyczne znaczenie dla globalnego rynku.
Mimo to sam fakt uruchomienia zaawansowanego modelu generatywnego w oparciu o krajowy stos technologiczny pozostaje wydarzeniem nie bez znaczenia. W obliczu prognoz zakładających, że przyszłość sztucznej inteligencji będzie należeć do mniejszych modeli tworzonych pod konkretne zastosowania, zdolność Chin do rozwijania takich systemów bez dostępu do zachodnich GPU może zmienić układ sił w branży.
Konsekwencje dla Nvidii i AMD
Jeżeli chińskie firmy rzeczywiście osiągnęły punkt, w którym są w stanie budować i wdrażać nowoczesne modele AI bez udziału Nvidii czy AMD, perspektywa długoterminowych przychodów tych firm na rynku chińskim staje się coraz mniej pewna. Dodatkowym czynnikiem są pojawiające się i znikające co chwila obostrzenia eksportowe wprowadzone przez administrację USA, które przewidują indywidualną ocenę wniosków dotyczących sprzedaży zaawansowanych układów GPU do Chin, a także blokady importu ze strony Chin.
Spodobało Ci się? Podziel się ze znajomymi!
Pokaż / Dodaj komentarze do:
Chiński model AI bez Zachodu. Przełom oparty wyłącznie na sprzęcie Huawei