Nvidia Volta GV100 – diagram rdzenia

Nvidia Volta GV100 – diagram rdzenia

Nvidia opublikowała diagram rdzenia Volta GV100, który stanowi podstawę topowego akceleratora obliczeń Tesla V100, będąc jednocześnie topowym chipem w mikroarchitekturze Volta. Materiał pozwala zapoznać się dokładnie z budową jednostki.

Volta GV100 na pierwszy rzut oka przypomina obecnego flagowca, chip Pascal GP100, ale posiada zdecydowanie więcej zasobów wykonawczych, a ponadto kilka usprawnień. Ale po kolei. Układ składa się z 80 bloków SM, każdy po 64 procesory strumieniowe pojedynczej i 32 podwójnej precyzji. Co istotne, jednostki dedykowane operacjom na liczbach zmiennoprzecinkowych mogą wykonywać również prostsze kalkulacje na 32, 16, a nawet 8 bitach. Tym samym są zdatne do wykorzystania również przy obliczeniach o pojedynczej precyzji. Sumarycznie w rdzeniu Volta GV100 znajdziemy 5120 CUDA FP32 oraz 2560 CUDA FP64. Dodatkowo, Nvidia wprowadza 640 wyspecjalizowane rdzenie Tensor, zoptymalizowane pod kątem uczenia maszynowego i budowania sieci neuronowych. Najprawdopodobniej zarówno CUDA FP64, jak i rdzeni Tensor zabraknie w modelach na rynek konsumencki. Całości dopełnia 320 jednostek mapowania tekstur. Jeśli wierzyć producentowi, taktowanie w trybie GPU Boost wynosi 1455 MHz.

Rdzeń Volta GV100 ma 640 nieznanych dotąd, wyspecjalizowanych rdzeni Tensor, przeznaczonych do uczenia maszynowego i budowy sieci neuronowych.

W odróżnieniu od poprzednika zastosowano litografię 12 nm FinFET. Nie jest to jednak prawdziwie 12-nanometrowy proces, a wyłącznie model rozwojowy dla używanego aktualnie 16 nm FinFET. Tak czy inaczej, zbudowano największy układ graficzny w historii, liczący 21,1 miliarda tranzystorów i zajmujący powierzchnię 815 mm2. Dla porównania, Pascal GP100 legitymuje się odpowiednio wartościami 15,3 miliarda oraz 610 mm2. Kontroler pamięci umożliwia obsługę czterech 32-gigabitowych stosów HBM2. Oznacza to, że Volta GV100 może pojawić się w towarzystwie 16 GB pamięci o przepustowości do 1 TB/s. Niemniej Nvidia podaje oficjalnie wartość 900 GB/s, co wynika z zastosowania nieco niższego taktowania niż przewiduje specyfikacja HBM2 - 900 MHz zamiast 1 GHz. Na podobny krok zdecydowano się już w obecnej generacji, serwując ostatecznie przepustowość 732 GB/s. Oczywiście dla sektora "gamingowego" nie ma to większego znaczenia. I tak otrzymamy zapewne tańsze GDDR6.

Pokaż / Dodaj komentarze do: Nvidia Volta GV100 – diagram rdzenia

 0