Znajdujesz się w sekcji Blogosfera. Zamieszczone tutaj materiały zostały opracowane przez użytkowników serwisu, bądź są owocem samodzielnej pracy redaktorów. Redakcja ITHardware nie ponosi odpowiedzialności za treść poniższej publikacji.

Specyfikacja NVIDIA GeForce 11 (GTX 1180, 1170, 1160) wg szklanej kuli

Specyfikacja NVIDIA GeForce 11 (GTX 1180, 1170, 1160) wg szklanej kuli

Wprawdzie tarota układać nie umiem, a jeśli chodzi o cyganów, to kojarzę tylko Jacka, i to też piąte przez dziesiąte, ale dokumentację techniczną chipu Volta GV100 mam niejako w jednym palcu. Wiem zarazem, że wspomniany układ jest bezpośrednim następcą rdzenia Pascal GP100, a ten z kolei stanowi punkt wyjścia dla typowo konsumenckich konstrukcji pokroju GP104-400 czy GP106-400, które to znajdują swe miejsce, odpowiednio, w kartach GeForce GTX 1080 oraz GTX 1060. A gdyby tak pobawić się trochę w, eufemistycznie rzecz ujmując, romskiego wróżbitę i wydedukować specyfikacje nadchodzących akceleratorów GeForce serii 11? No dobra, prawdę mówiąc, nie chodzi tu o typowe lanie wody, ale wyciągnięcie wniosków z dotychczasowych ruchów NVIDII. Jeśli jeszcze nie rozumiecie, o co chodzi, tłumaczę. Zieloni, projektując konsumenckie modele kart wciąż aktualnej generacji, podjęli pewne ściśle określone decyzje. Wszystkie je można przełożyć na realia Volty GV100, a przez to określić przybliżoną specyfikację nadchodzących GPU. Także do dzieła.

Na początek jednak, zanim na piedestał trafią same rdzenie graficzne, warto pokłonić się przez chwilę nad kwestią nazewnictwa. Jak wiadomo, o nadchodzących kartach raczej nie mówi się per Volta. Plotki wskazują na nazwę Ampere lub Turing. Ale, wbrew pozorom, nie robi to żadnej różnicy. Pascal GP100 pod wieloma względami odbiega od uboższych pobratymców, a mianowicie ma m.in. kontroler pamięci HBM2 i dedykowane jednostki do obliczeń podwójnej precyzji. Wszystko to pozwala zaklasyfikować go jako inną architekturę, w odniesieniu do kart konsumenckich. NVIDIA postanowiła jednak umownie trzymać się kryptonimu Pascal, który w takim wypadku wyznacza bardziej generację czy linię produktową, niż właściwą architekturę. Mimo to, również umownie, wszyscy mówią o jednej spójnej architekturze Pascal, a to po prostu nie jest prawdą, patrząc z technicznego punktu widzenia Przy czym Volta legitymuje się jeszcze większą liczbą cech zarezerwowanych wyłącznie dla sektora profesjonalnego. Stąd zapewne, wziąwszy pod uwagę ogromne natężenie różnic, o czym za moment, producent postanowił tym razem nadać kartom dla graczy inny przydomek.

Specyfikacja NVIDIA GeForce 11 (GTX 1180, 1170, 1160) wg szklanej kuli

Schemat rdzenia Volta GV100

Kiedy nomenklatura jest jasna, nadchodzi czas, by wziąć się wreszcie za same rdzenie. Oba najnowsze rdzenie NVIDII klasy hi-end, czy to GP100 czy GV100, składają się z sześciu klastrów przetwarzania grafiki (Graphics Processing Cluster – GPC), w których skrywa się określona liczba klastrów przetwarzania tekstur (Texture Processing Cluster – TPC), a przez to też multiprocesorów strumieniujących (Streaming Multiprocessor – SM). Do tego, w telegraficznym skrócie, dochodzi pewna pula pamięci L2, kontrolery HBM2 oraz High-Speed Hub dla łącz NVLink. Pascal GP104-400, czyli GeForce GTX 1080, został ograniczony do czterech GPC, Pascal GP106-400 aka GeForce GTX 1060 zaś - dwóch. Jednocześnie kontrolery HBM2 wymieniono na GDDR5(X), a NVLink - całkowicie wyeliminowano, bo w komputerach domowych łącza tego typu zwyczajnie się nie stosuje. Na tej podstawie można wnioskować, że potencjalny GeForce GTX 1180 oraz GTX 1160 zostaną wykreowane na podobnej zasadzie. Otrzymają, odpowiednio, cztery oraz dwa klastry GPC z Volty GV100. Z tym że Pascal w obrębie jednego GPC mieści pięć TPC (SM: 10), natomiast Volta - siedem (SM: 14), przez co ogólna ilość zasobów wykonawczych powinna widocznie wzrosnąć, względem aktualnej generacji kart graficznych.

Każdy blok SM w kartach klasy profesjonalnej składa się z: 64 rdzeni FP32 i takiej samej liczby rdzeni INT32, 32 rdzeni FP64 oraz, wyłącznie w przypadku GV100, ośmiu rdzeni Tensor, które służą, nawiasem mówiąc, do wspierania obliczeń związanych z uczeniem maszynowym. Tymczasem wszystkie konsumenckie Pascale mają, w obrębie pojedynczego SM, dokładnie 128 rdzeni ogólnego przeznaczenia, nazywanych rdzeniami CUDA. (są to tak naprawdę jednostki FP32, które mogą prowadzić jednocześnie obliczenia INT32). Z tym że stosunek TPC do SM wynosi 1:1. Trudno oczekiwać, aby w przypadku nowości miało być inaczej. Rozbicie rdzeni FP32 i INT32 na osobne jednostki pozwala wykonać równolegle operację stałoprzecinkową i zmiennoprzecinkową pojedynczej precyzji z pełną przepustowością, ale w grach jest to kompletnie zbędne (a nawet może wydajność ograniczyć), podobnie zresztą jak podwójna precyzja i akceleracja uczenia maszynowego. I właśnie dlatego z dużą dozą prawdopodobieństwa można założyć, że NVIDIA w przypadku Ampere / Turinga postąpi dokładnie tak samo.

Specyfikacja NVIDIA GeForce 11 (GTX 1180, 1170, 1160) wg szklanej kuli

Jeśli tak, to, powtórzę, zastosowane zostanie 128 rdzeni FP32 / INT32 na multiprocesor strumieniujący, co z kolei prowadzi do następujących wniosków:

  • GeForce GTX 1180 = 4 GPC * 7 SM * 128 CUDA = 3584 CUDA (TMU: 224)
  • GeForce GTX 1170 = 3 GPC * 7 SM * 128 CUDA = 2688 CUDA (TMU: 168)
  • GeForce GTX 1160 = 2 GPC * 7 SM * 128 CUDA = 1792 CUDA (TMU: 112)

Co oczywiste, nawet te obliczenia, zakładając ich pełne przełożenie na rzeczywistość, nie dają nam wszystkich informacji. Nie wiadomo choćby tego, jakie pamięci zastosuje firma z Santa Clara, GDDR6 czy GDDR5(X), a także jaka będzie szerokość magistrali w poszczególnych modelach. Niejasna pozostaje ponadto kwestia liczby jednostek renderujących, bo ta zależy poniekąd od kontrolerów pamięci. Tu można już naprawdę jedynie domniemywać. Tak samo zresztą jak w przypadku częstotliwości zegara taktującego, która, nie da się ukryć, we współczesnych kartach graficznych bardzo mocno warunkuje wydajność. Jak będzie, zobaczymy. Na ten moment zostawiam Was z niniejszym zestawem przemyśleń...

Komentarze do: Specyfikacja NVIDIA GeForce 11 (GTX 1180, 1170, 1160) wg szklanej kuli