Wpływ szybkości Infinity Fabric na wydajność - test
Jednym z najciekawszych zagadnień związanych z procesorami bazującymi na architekturze AMD Zen, a więc tymi reprezentującymi rodzinę Ryzen, jest niewątpliwie wpływ taktowania Infinity Fabric (w skrócie IF) na ich wydajność i właśnie tą kwestią będę się zajmował w niniejszym teście. Jednocześnie trzeba jasno powiedzieć, że jest to temat, co do którego jest wyjątkowo dużo wątpliwości oraz sprzecznych ze sobą teorii. Wszystko zaczęło się w momencie premiery pierwszych procesorów Ryzen, które początkowo miały spore problemy z osiąganiem wysokich zegarów pamięci RAM, w przypadku, gdy wykorzystany zestaw bazował na kościach innych niż Samsung B-Die. Jednocześnie pojawiła się duża presja tzw. społeczności, która próbowała wymusić na testerach przeprowadzanie pomiarów właśnie z wykorzystaniem drogich pamięci, tak aby nowe jednostki od AMD mogły pokazać pełnię potencjału. I właśnie w tym momencie do akcji wkracza Infinity Fabric, które zdaniem wielu jest bezpośrednią przyczyną dużych wzrostów w wyniku podkręcania RAM, jako że taktowanie IF jest równe rzeczywistemu zegarowi kości. Niektórzy posuwają się w swoich dywagacjach tak daleko, że wręcz sugerują możliwość skalowania z częstotliwością pamięci lepszego niż liniowe (sic!). Inni za to uważają, że taktowanie Infinity Fabric nie ma zbyt dużego znaczenia w kontekście osiągów. Do premiery architektury Zen 2 pozostało jeszcze trochę czasu, tak więc to idealny moment, aby wreszcie sprawdzić, jak jest naprawdę. Do dzieła!
W dzisiejszym teście zobaczycie, jak taktowanie Infinity Fabric wpływa na wydajność procesorów AMD Ryzen. Przekonajmy się, jak blisko prawdy są krążące w sieci teorie.
Źródło: https://fuse.wikichip.org/news/1064/isscc-2018-amds-zeppelin-multi-chip-routing-and-packaging/
Phenom II vs Bulldozer vs Zen - test zegar w zegar i porównanie CMT/SMT
Infinity Fabric - budowa, zasada działania
Zanim przejdziemy dalej, wypadałoby pokrótce przybliżyć budowę procesorów bazujących na architekturze Zen, której bardzo ważnym składnikiem jest właśnie Infinity Fabric, w ramach którego możemy wyodrębnić dwa niezależne od siebie podsystemy komunikacyjne - Scalable Control Fabric (SCF) oraz Scalable Data Fabric (SDF). Jako, że za przesyłanie danych odpowiada ten drugi, to właśnie SDF jest tą częścią IF, która będzie nas szczególnie interesować. Scalable Data Fabric odpowiada za komunikację między poszczególnymi blokami jądra Zeppelin. Wśród tych ostatnich wymienić należy: dwa moduły CCX, gdzie w skład każdego w nich wchodzą cztery rdzenie oraz 8 MB współdzielonej pamięci podręcznej trzeciego poziomu, dwa 64-bitowe kontrolery pamięci DDR4, a także tzw. I/O Hub, zapewniający wsparcie na poziomie procesora m.in. dla PCI Express (PCIe), SATA czy USB, dzięki stosownym kontrolerom umieszczonym w jego obrębie. Rzecz jasna nieco inaczej wygląda to dla APU Raven Ridge, gdzie CCX jest tylko jeden, a także pojawia się zintegrowana grafika Radeon RX Vega. Ponadto SDF umożliwia łączenie większej liczby Zeppelinów, co ma miejsce w przypadku procesorów EPYC oraz Threadripper i jest możliwe dzięki Infinity Fabric On-Package (IFOP), a także realizację w serwerach konfiguracji wieloprocesorowych, z wykorzystaniem Infinity Fabric InterSocket (IFIS). Tak jak pisałem wcześniej, taktowanie SDF jest ściśle powiązane z zegarem pamięci RAM i nie może być regulowane niezależnie.
Podkręcanie AMD Athlon 200GE na płycie MSI B350M MORTAR - test
Zasady przeprowadzania testu
Procesor wykorzystany na potrzeby testów to AMD Ryzen 7 1700X, a więc jednostka zapewniająca wystarczającą elastyczność, aby móc przeprowadzić na niej komplet pomiarów. Żeby nie wprowadzać dodatkowych anomalii, SMT było przez cały czas wyłączone. Pierwsze podejście miało na celu zbadanie wpływu taktowania Infinity Fabric na wydajność podsystemu pamięci. W tym celu przygotowałem dwie konfiguracje, korzystając z właściwości trybu Dual Channel (DC), który - w porównaniu do Single Channel (SC) - z grubsza dwukrotnie podnosi przepustowość, pozostawiając opóźnienia na niezmienionym poziomie. I tak pierwsza z nich to DC DDR4-1600 MHz CL 9-8-8-21 1T, podczas gdy druga SC DDR4-3200 MHz CL 18-16-16-42 1T (oczywiście timingi dalszych rzędów również zostały dostosowane, ale nie będę ich wymieniał). W obu przypadkach aktywny był tylko jeden CCX (cztery rdzenie), gdyż tym zagadnieniem zajmiemy się dopiero później. Innymi słowy, są to ustawienia w teorii równoważne, jednak to o wyższym taktowaniu ma przewagę szybszego IF, co przekłada się na dysproporcję w czasie dostępu na poziomie ~81 ns do ~96 ns (wg AIDA64). Natomiast przepustowość, zgodnie z oczekiwaniami, stała na zbliżonym poziomie. Pozostaje tylko pytanie, jak różnica latencji wpłynie na rzeczywiste osiągi.
Radeon RX Vega 56 vs GeForce RTX 2060 - test po podkręceniu kart
Żonglerka modułami CCX
Drugie podejście związane jest natomiast z modułami CCX, które również komunikują się między z sobą z wykorzystaniem IF. Tym razem przeprowadziłem pomiary zarówno przy aktywnym jednym CCX, jak i dwóch sztukach (w obu przypadkach cztery rdzenie), przy pamięciach ustawionych na DDR4-2133 MHz CL 14-15-15-35 1T oraz DDR4-3200 MHz CL 14-15-15-35 1T (zatem łącznie mamy cztery konfiguracje, wszystkie typu DC). Zamysł był dość prosty - bez względu na liczbę modułów, podnosząc zegar RAM o 50% przyspieszamy rzeczony podsystem w takim samym stopniu. Zatem jeśli przy dwóch CCX skalowanie okaże się lepsze, będzie to wynikać ze sprawniejszej komunikacji między tymi blokami. Dodatkowo zobaczymy, jak obie możliwości mają się do siebie w poszczególnych testach. Przy czym dość istotnym elementem układanki jest tutaj dyspozytor zadań (ang. scheduler) systemu operacyjnego, który może wprowadzać dodatkowe, niepotrzebne zamieszanie, negatywnie wpływając na wyniki z dwoma aktywnymi CCX. Dlatego też, oprócz Windowsa 10 w tej części testów rozważana jest również starsza Siódemka, co do której z doświadczenia mogę powiedzieć, że często radzi sobie lepiej (choć teoretycznie powinno być odwrotnie). Tego, czy skorzystanie z niej było konieczne, dowiecie się z kolejnych stron publikacji.
Pokaż / Dodaj komentarze do: Test wpływu taktowania Infinity Fabric na wydajność procesorów AMD Ryzen