Nvidia wprowadzi pamięci HBM2 szybciej od AMD. Zapowiedź Tesla P100

Nvidia wprowadzi pamięci HBM2 szybciej od AMD. Zapowiedź Tesla P100

Choć to AMD brało udział w projektowaniu pamięci o wysokiej przepustowości, wprowadzając ją ostatecznie w kartach z serii R9 Fury, to jednak Nvidia jako pierwsza udostępnia użytkownikom najnowszą wersję rzeczonego standardu, HBM2. 

Zieloni poinformowali właśnie o wprowadzeniu modelu Tesla P100, czyli wysokowydajnego akceleratora obliczeniowego, bazującego na rdzeniu Pascal GP100. Niniejszy układ wykonany jest w procesie technologicznym 16 nm FinFET, podobnie jak każdy inny rdzeń w mikroarchitekturze Pascal, ale w jego skład wchodzi aż 15,3 mld tranzystorów. Dla odniesienia - Pascal GP102-450, stanowiący podstawę m.in dla nowego Titan Xp, ma "tylko" 12 mld tranzystorów. Ostatecznie Tesla P100 może poszczycić się 6 klastrami GPC, 56 blokami SM oraz 28 TPC. Ponadto, w akceleratorze zainstalowano 4096-bitową magistralę pamięci. Budowa bloków SM różni się jednak znacząco względem kart konsumenckich, tj. GeForce oraz Titan. Zamiast 128 procesorów strumieniowych każdy SM oferuje 64 jednostki FP32 oraz 32 dedykowane jednostki FP64. Do tego dochodzi 16 GB bardzo szybkiej pamięci HBM2 w czterech stosach. 

Ciekawostka: Akceleratory z linii Tesla nie mają ani złącz obrazu, ani rasteryzatorów. Tym samym nie mogą samodzielnie wyświetlić obrazu.

Co ciekawe, użyty chip nie występuje tutaj w pełnej konfiguracji blokowej. Nominalnie Pascal GP100 posiada bowiem 60 bloków SM, ale część wyłączono zapewne wskutek problemów z uzyskiem. Teoretyczna wydajność w pojedynczej precyzji wynosi 10,6 TFLOPS, a w podwójnej - 5,3 TFLOPS. Oczywiście moc tę można jeszcze zwiększyć poprzez łączenie wielu jednostek. Jak twierdzi producent, nowa generacja łącza NVLink pozwala na połączenie do ośmiu kart Tesla P100 przy przepustowości pięciokrotnie przewyższającej możliwości PCIe. Liczbowo, ogromne wrażenie robi także przepustowość interfejsu pamięci HBM2, ustalona na 732 GB/s. Zanim jednak podekscytujecie się wyczekując kolejnych GeForce'ów, musicie wiedzieć, że Tesla P100 została od podszewki przygotowana z myślą o segmencie roboczym. Konsumencka implementacja układu Pascal GP100 to po prostu Pascal GP102, który w pojedynczej precyzji jest równie wydajny, ale nie posiada dedykowanych zasobów pod precyzję podwójną, ponieważ ich nie potrzebuje.

Obserwuj nas w Google News

Pokaż / Dodaj komentarze do: Nvidia wprowadzi pamięci HBM2 szybciej od AMD. Zapowiedź Tesla P100

 0