Zapowiedź pierwszej karty w architekturze Volta – 5120 procesorów CUDA

Zapowiedź pierwszej karty w architekturze Volta – 5120 procesorów CUDA

Nvidia zapowiedziała właśnie akcelerator obliczeń Tesla V100. To pierwszy ujawniony produkt w mikroarchitekturze Volta, który jest zarazem implementacją topowego chipu.

Tesla V100 bazuje na rdzeniu Volta GV100, produkowanym przez tajwańskie fabryki TSMC w procesie technologicznym 12 nm FinFET. Układ ten składa się z 21 miliardów tranzystorów, które upakowano na powierzchni 815 mm2. Jak podaje Nvidia, w strukturze znajdziemy 5120 procesorów strumieniowych, a ponadto 16 MB pamięci podręcznej oraz 20 MB SM RF. Do tego dochodzi jeszcze łącze NVLink o przepustowości 300 GB/s, umożliwiające połączenie wielu akceleratorów w klaster, a także 16 GB pamięci HBM2 w czterech stosach, gwarantujące szybkość przesyłu danych na poziomie 900 GB/s. Jako iż produkty z tej linii produktowej są de facto koprocesorami, wspierającymi obliczenia naukowe, Tesla V100 nie ma żadnych złącz obrazu. Daje ona jednak dobry pogląd na kolejne modele w mikroarchitekturze Volta, potwierdzono bowiem m.in. wykorzystanie 12-nanometrowej litografii. Będącej, nawiasem mówiąc, litografią 16 nm FinFET, ale po usprawnieniach.

Tesla V100 jest układem stricte naukowo-inżynieryjnym, ale daje dobry pogląd na nadchodzące modele w nowej mikroarchitekturze Zielonych.

Teoretyczna wydajność Tesli V100 w obliczeniach pojedynczej precyzji to 15 TFLOPS, a w podwójnej - 7,5 TFLOPS. Jest to ponad 40-procentowy przyrost względem aktualnego modelu Tesla P100, który dysponuje 3584 procesorami strumieniowymi CUDA FP32 zrealizowanymi według założeń mikroarchitektury Pascal, czyli tak samo jak Titan X (Pascal) oraz GeForce GTX 1080 Ti. Czy taki wzrost ma szanse przełożyć się na sektor konsumencki? Możliwe. Trzeba pamiętać, że układ Pascal GP102 wykorzystywany w topowych kartach "gamingowych" z rodziny Pascal jest w istocie układem Pascal GP100 ze wspomnianej Tesli P100, ale pozbawionym zasobów wykonawczych dedykowanych podwójnej precyzji, jak również pamięci HBM2. Nic nie stoi na przeszkodzie, by hipotetyczna Volta GV102 powstała wskutek identycznych modyfikacji, zyskując jednocześnie pamięci GDDR6, które przy 384-bitowej magistrali mogą mieć przepustowość równą aż 768 GB/s, co dystansuje je od używanych obecnie w topowych modelach Nvidii modułów GDDR5X. 

Pokaż / Dodaj komentarze do: Zapowiedź pierwszej karty w architekturze Volta – 5120 procesorów CUDA

 0