NVIDIA nie zwalnia tempa. GPU Rubin w 2026, Rubin Ultra w 2027, Feynman następny w kolejce

Aktualności Karty graficzne

Daniel Górecki
19 marca 2025

Źródło: NVIDIA

NVIDIA nie zwalnia tempa. GPU Rubin w 2026, Rubin Ultra w 2027, Feynman następny w kolejce

Podczas konferencji GTC 2025, NVIDIA zaprezentowała zaktualizowany harmonogram swoich rozwiązań dla centrów danych, ujawniając szczegóły dotyczące nadchodzących architektur Rubin i Rubin Ultra, planowanych odpowiednio na 2026 i 2027 rok.

Choć firma dopiero co wprowadziła do pełnej produkcji układy Blackwell B200, a premiera Blackwell B300 przewidziana jest na drugą połowę 2025 roku, NVIDIA nie zwalnia tempa i już teraz przygotowuje partnerów na kolejne wielkie zmiany.

Rubin, nazwany na cześć astronomki Very Rubin, zapowiada ogromny skok technologiczny.

Rubin – nowa generacja wydajności i efektywności

Rubin, nazwany na cześć astronomki Very Rubin, zapowiada ogromny skok technologiczny. W porównaniu z obecnymi rozwiązaniami Blackwell B300, Rubin ma zaoferować 3,3-krotnie wyższą wydajność obliczeniową.

Rubin NVL144 zapewni 3,6 PFLOPS mocy w obliczeniach dense FP4, przy 144 rdzeniach GPU (dokładnie tyle samo, co w Blackwell NVL72, ale z dwukrotnie większą skalą topologii NVLink). W treningu AI w precyzji FP8, GPU na bazie tej architektury osiągną 1,2 ExaFLOPS, czyli ponad trzykrotnie więcej niż B300 (0,36 ExaFLOPS).

HBM4, szybszy NVLink i CPU Vera

Nowa generacja Rubin wprowadzi pamięć HBM4, a Rubin Ultra – HBM4e. Pojemność pamięci dla GPU pozostanie na poziomie 288 GB, jednak przepustowość wzrośnie z 8 TB/s (Blackwell B300) do 13 TB/s. Systemy Rubin będą również korzystać z nowej wersji NVLink, który podwoi przepustowość do 260 TB/s. Dodatkowo pojawi się nowy link CX9, umożliwiający komunikację między szafami rack z szybkością 28,8 TB/s – dwa razy więcej niż w przypadku B300 i CX8.

Integralną częścią rodziny Rubin będzie również nowy procesor Vera CPU, zastępujący obecnie stosowane układy Grace. Vera ma oferować 88 rdzeni ARM i 176 wątków oraz interfejs NVLink o przepustowości 1,8 TB/s, bezpośrednio łączący CPU z Rubin GPU.

Rubin Ultra – gigantyczny skok w 2027 roku

Druga połowa 2027 roku przyniesie jeszcze większą rewolucję: Rubin Ultra NVL576. To rozwiązanie ma podnieść poprzeczkę w centrach danych na niespotykany dotąd poziom.

576 GPU w jednym racku, każdy z czterema rdzeniami GPU. Moc obliczeniowa w inferencji FP4 sięgnie tu, według zapowiedzi Zielonych, 15 ExaFLOPS, a w treningu FP8 – 5 ExaFLOPS. Rubin Ultra zaoferuje także 365 TB "szybkiej pamięci" na rack (dla CPU i GPU), a przepustowość pamięci HBM4e sięgnie 4,6 PB/s. To oznacza około 8 TB/s na GPU, co wydaje się mniej niż w Rubin NVL144 – być może jest to efektem łączenia czterech rdzeni GPU w jednym pakiecie.

System Rubin Ultra będzie korzystać z NVLink7, oferującego 6-krotnie wyższą przepustowość względem Rubin, czyli aż 1,5 PB/s. Łącza CX9 między rackami również doczekają się usprawnień – przepustowość wzrośnie czterokrotnie, do 115,2 TB/s, co prawdopodobnie wynika z czterokrotnego zwiększenia liczby połączeń.

Na horyzoncie Feynman

Po Rubinie, następna architektura centrum danych NVIDII będzie nosić nazwę po teoretycznym fizyku Richardzie Feynmanie. Prawdopodobnie oznacza to, że otrzymamy procesory Richard z procesorami graficznymi Feynman, jeśli firma utrzyma obecny wzorzec nazewnictwa swoich architektur.