NVIDIA po raz kolejny udowadnia swoją dominację w segmencie GPU dzięki nowej architekturze Blackwell, która oferuje ogromny wzrost wydajności w porównaniu z poprzednią generacją Hopper. Najnowsze wyniki testów MLPerf Training v4.1, potwierdzone przez organizację MLCommons, pokazują, że platforma HGX B200 Blackwell osiągnęła do 2,2 razy lepszą wydajność na GPU w porównaniu z platformą HGX H200 Hopper. To duży krok naprzód w treningu modeli językowych na skalę przemysłową.
Nowa architektura i technologia
Architektura Blackwell wprowadza kilka kluczowych nowości, które przekładają się na lepszą wydajność. GPU z serii Blackwell są wyposażone w pamięć HBM3e o wysokiej przepustowości oraz piątą generację technologii łączności NVLink, co umożliwia znacznie szybsze przesyłanie danych między jednostkami. Dzięki tym ulepszeniom, NVIDIA udało się podwoić wydajność treningu modeli, takich jak GPT-3, oraz uzyskać 2,2-krotny wzrost wydajności podczas fine-tuningu modelu Llama 2 70B w porównaniu do poprzedniej generacji Hopper.
Platforma HGX B200 Blackwell osiągnęła do 2,2 razy lepszą wydajność na GPU w porównaniu z platformą HGX H200 Hopper.
Platforma Blackwell wykorzystuje również nowoczesną infrastrukturę sieciową, w tym SuperNIC ConnectX-7 oraz przełączniki Quantum-2 InfiniBand, co pozwala na szybkie przesyłanie danych między węzłami podczas rozproszonych obliczeń. Takie podejście umożliwia efektywne wykorzystanie mocy obliczeniowej systemu i znacząco skraca czas treningu dużych modeli językowych.
Efektywność systemowa
W testach wykorzystano systemy zawierające osiem GPU Blackwell, działające przy maksymalnym TDP wynoszącym 1000 W, połączone za pomocą NVLink Switch, co umożliwia skalowanie systemu. Warto zaznaczyć, że architektura Blackwell nie tylko zwiększyła wydajność na poziomie pojedynczego GPU, ale także znacznie zredukowała liczbę wymaganych GPU w porównaniu do Hopper. Przykładowo, podczas treningu modelu GPT-3 175B, system Hopper wymagał 256 GPU, podczas gdy Blackwell osiągnął te same wyniki przy użyciu zaledwie 64 GPU. Jest to zasługa większej pojemności pamięci HBM3e oraz zwiększonej przepustowości.
Co przyniesie przyszłość? GB200 NVL72
NVIDIA już teraz zapowiada kolejne usprawnienia dzięki nadchodzącej platformie GB200 NVL72, która obiecuje jeszcze większe zyski wydajnościowe. Nowy system wprowadzi rozszerzone domeny NVLink, większą przepustowość pamięci oraz ścisłą integrację z procesorami NVIDIA Grace, a także ulepszone technologie sieciowe, takie jak ConnectX-8 SuperNIC i Quantum-X800 Switch. Dzięki szybszym przełącznikom oraz lepszym możliwościom przesyłania danych, możemy spodziewać się jeszcze większych optymalizacji w oprogramowaniu, co dodatkowo zwiększy wydajność systemów opartych na Grace-Blackwell.
Pokaż / Dodaj komentarze do: Nvidia Blackwell dominuje. Osiąga 2,2 razy wyższą wydajność od poprzednika