Huawei może nie mieć dostępu do najnowocześniejszych procesów litograficznych, ale właśnie udowodnił, że potrafi skutecznie konkurować z amerykańskim gigantem w dziedzinie sztucznej inteligencji. Najnowszy dokument techniczny, opublikowany wspólnie z chińskim startupem SiliconFlow, ujawnia, że klaster CloudMatrix 384 zbudowany na układach Ascend 910C przewyższył wydajność chipu Nvidia H800 w uruchamianiu potężnego modelu językowego R1 firmy DeepSeek.
Huawei nie ukrywa, że ich podejście do budowy superklastrów AI jest bezkompromisowo proste: więcej chipów, więcej mocy. W przypadku CloudMatrix 384 oznacza to 384 dwuchipletowe procesory neuronowe (NPU) HiSilicon Ascend 910C połączone z 192 procesorami CPU, rozlokowane w 16 szafach serwerowych. Wszystko spięte w jedną, błyskawicznie komunikującą się całość dzięki wewnętrznym i międzyserwerowym łączeniom optycznym.
Klaster został zaprojektowany w odpowiedzi na ograniczenia eksportowe, które odcięły Chiny od najnowszych układów Nvidii, w tym H100 i jego okrojonej eksportowej wersji – H800. Co ciekawe, CloudMatrix nie tylko dogonił te układy, ale w określonym scenariuszu – uruchamiania modelu R1 o 671 miliardach parametrów – po prostu je przegonił.
Surowa moc: Huawei zaskakuje liczbami
Z danych technicznych wynika, że CloudMatrix 384 dostarcza aż 300 PFLOPS mocy obliczeniowej BF16, czyli znacznie więcej niż 180 PFLOPS oferowane przez flagowy system Nvidii – GB200 NVL72. Równie imponująco wygląda wydajność samego oprogramowania Huawei:
-
4,45 tokena na sekundę na TFLOPS przy wstępnym generowaniu zapytań,
-
1,29 tokena na sekundę na TFLOPS przy generowaniu odpowiedzi.
To więcej niż osiągi rozwiązania SGLang – autorskiego systemu Nvidii do inferencji LLM.
Energetyczna cena mocy
Sukces Huawei nie jest jednak pozbawiony kosztów. CloudMatrix 384 zużywa czterokrotnie więcej energii niż NVL72, potrzebując aż 559 kW mocy przy maksymalnym obciążeniu, w porównaniu do 145 kW systemu Nvidii. To oznacza, że mimo przewagi w mocy obliczeniowej, klaster Huawei jest około 2,3 razy mniej wydajny energetycznie.
Ale w realiach Chin kontynentalnych, gdzie dostępność energii elektrycznej nie stanowi problemu, a jej ceny w ciągu ostatnich trzech lat spadły o niemal 40%, nie jest to przeszkoda nie do pokonania. Tym bardziej, że dostęp do rozwiązań Nvidii w Chinach jest drastycznie ograniczony.
Huawei buduje zaufanie w lokalny ekosystem
Jak zaznaczają autorzy dokumentu, celem projektu CloudMatrix 384 było nie tylko osiągnięcie wysokiej wydajności, ale także "przekształcenie fundamentów infrastruktury AI w Chinach". Huawei i jego partnerzy chcą zbudować zaufanie do krajowych rozwiązań technologicznych, udowadniając, że nawet bez zaawansowanych narzędzi z Zachodu można tworzyć konkurencyjne superkomputery AI.
Wewnątrz Huawei panuje przekonanie, że ten projekt ma strategiczne znaczenie. Jeden z badaczy firmy podkreślił, że publikacja wyników miała na celu pobudzenie chińskiego ekosystemu technologicznego do większej niezależności i innowacyjności.
Nvidia odpowiada: to jeszcze nie nasz koniec
Na rosnącą presję ze strony Huawei zareagował również CEO Nvidii, Jensen Huang, który podczas konferencji VivaTech we Francji przyznał, że Huawei robi postępy, ale podkreślił, że „nasza technologia wciąż wyprzedza ich o całą generację”. Huang nie krył jednak świadomości, że AI to problem równoległy, a przewaga nie zawsze zależy od pojedynczego chipu: „Jeśli każdy z komputerów nie jest wystarczająco mocny… po prostu dodaj więcej komputerów” – powiedział.
Przyszłość w 16 szafach
CloudMatrix 384 to ogromne, 16-szafowe „serce AI” o potężnych możliwościach. Mimo wysokiego poboru mocy i ograniczonej efektywności energetycznej, klaster oferuje szybkość, skalowalność i niezależność od zachodnich technologii – cechy nie do przecenienia w dzisiejszej sytuacji geopolitycznej i technologicznej.
Dla chińskich instytucji publicznych, firm AI i rządowych projektów badawczych CloudMatrix może być nie tylko alternatywą dla Nvidii, ale również fundamentem suwerenności technologicznej w erze sztucznej inteligencji.

Pokaż / Dodaj komentarze do: Superkomputer Huawei deklasuje konkurencję. Nawet NVIDIA musi to przyznać