Przetestowano opóźnienia pamięci GPU AMD RDNA 2 i NVIDIA Ampere

Aktualności Karty graficzne

Daniel Górecki
20 kwietnia 2021

Źródło: Chips and Cheese

Przetestowano opóźnienia pamięci GPU AMD RDNA 2 i NVIDIA Ampere

Współczesne karty graficzne od popularnych producentów zawierają wielopoziomowe hierarchie pamięci podręcznej. Te poziomy pamięci podręcznej zostały zaprojektowane w celu wypełnienia luki między pamięcią a obliczeniami, co stanowi rosnący problem, który paraliżuje wydajność procesorów graficznych w wielu aplikacjach. Różni producenci GPU, tacy jak AMD i NVIDIA, w zależności od architektury oferują różne rozmiary plików rejestrów, pamięci podręcznych L1 i L2,. Na przykład ilość pamięci podręcznej L2 na GPU A100 od NVIDII wynosi 40 MB, czyli jest siedmiokrotnie większa w porównaniu z poprzednią generacją, czyli układem V100. To tylko pokazuje, jak rosną potrzeby nowoczesnych aplikacji co do rozmiaru pamięci podręcznej, która musi stale się rozrastać, by zaspokoić te wymagania.

Chips and Cheese zdecydowało się zmierzyć opóźnienie pamięci GPU najnowszej generacji kart graficznych, czyli AMD RDNA 2 i NVIDIA Ampere.

W sieci opublikowano właśnie ciekawy artykuł autorstwa Chips and Cheese. Witryna zdecydowała się zmierzyć opóźnienie pamięci GPU najnowszej generacji kart graficznych, czyli AMD RDNA 2 i NVIDIA Ampere. Korzystając z prostych testów ścigania wskaźnika w OpenCL, udało się uzyskać interesujące wyniki. Pamięć podręczna RDNA 2 jest szybka i pojemna. W porównaniu do Ampere, opóźnienie pamięci podręcznej jest znacznie niższe, podczas gdy opóźnienie pamięci VRAM jest mniej więcej takie samo. NVIDIA używa dwupoziomowego systemu pamięci podręcznej składającego się z L1 i L2, co jak wynika z testów, wydaje się dość powolnym rozwiązaniem. W tym przypadku przejście z bloku SM zawierającego pamięć L1 do zewnętrznej warstwy L2 zajmuje ponad 100 ns opóźnienia.

AMD z drugiej strony ma trójpoziomowy system pamięci podręcznej. W ramach architektury RDNA 2 znajdziemy cache L0, L1 i L2. Opóźnienie między L0 i L2, nawet uwzględniając L1 między nimi, wynosi zaledwie 66 ns. Infinity Cache, która zasadniczo jest pamięcią podręczną trzeciego poziomu (L3), dodaje tylko dodatkowe 20 ns opóźnienia, dzięki czemu jest jeszcze szybsze w porównaniu z rozwiązaniami pamięci podręcznej NVIDII. Masywne GPU GA102 Zielonych wydaje się stanowić duży problem dla pamięci podręcznej L2, gdyż aby je obejść, potrzeba zrealizowania wielu cykli. Jeśli chcecie dowiedzieć się więcej na ten temat, to odsyłamy do źródła, w TYM miejscu.

Daniel Górecki Redaktor działu peryferii/ Kierownik działu NEWS

Facebook LinkedIn

Zgłoś autorowi błąd na stronie

Przetestowano opóźnienia pamięci GPU AMD RDNA 2 i NVIDIA Ampere

Przetestowano opóźnienia pamięci GPU AMD RDNA 2 i NVIDIA Ampere

Komputery

Mobile

Gaming

Rankingi