Test wpływu szybkości Infinity Fabric na wydajność: konkluzje
Podsumowanie pozwolę sobie rozpocząć od kilku słów na temat wpływu taktowania Infinity Fabric, a konkretniej SDF, na funkcjonowanie podsystemu pamięci operacyjnej, gdyż - jakby na sprawę nie spojrzeć - to właśnie na tej płaszczyźnie można było się spodziewać największych różnic. I w istocie mamy pewne dysproporcje w testach rzeczywistych, chociaż od razu trzeba powiedzieć, że nie są one stałe, mocno zmieniając się w zależności od konkretnej gry. W efekcie, na jednym biegunie mamy produkcje, którym dwukrotna przewaga w zegarze IF (1600 MHz kontra 800 MHz), którą dysponowała konfiguracja Single Channel, nie zrobiła praktycznie żadnej różnicy. Do grupy tej należą Battlefield 1, Hitman, Project CARS oraz Watch Dogs 2. Gdzieś pośrodku wylądowały za to tytuły, w których co prawda pojawiła się już przewaga wynikająca z szybszego Infinity Fabric, ale w dalszym ciągu nie była piorunująca, maksymalnie sięgając około 2%. Mowa o Battlefield 4, Crysis 3 (na mapie trawkowej), Dying Light, Rise of the Tomb Raider, a także Wiedźminie 3: Dziki Gon. Na deser pozostały zaś gry, gdzie dwukrotne podbicie częstotliwości IF przyniosło wymierne korzyści. Konkretniej rzecz ujmując, mam na myśli alternatywną lokację w Crysis 3 (~5,9%), Counter-Strike: Global Offensive (~6,1%), Far Cry Primal (4%) oraz Sniper: Ghost Warrior 3 (~5,7%). Zatem chociaż trudno zaprzeczyć, że w niektórych przypadkach udało się zanotować konkretne wzrosty osiągów, to jednak w ogólnym rozrachunku szału nie ma - przewaga Single Channel nad Dual Channel to zaledwie około 2,28%. A przecież dwukrotne przyspieszenie Infinity Fabric trudno uznać za wykonalne - jeśli wychodzimy od zegara RAM na poziomie 2133 MHz, to realnie możemy myśleć o wyciągnięciu mniej więcej dodatkowych 50%, czyli wartość tę należałoby jeszcze podzielić przez dwa.
Przeprowadzone testy nie potwierdzają doniesień o magicznym wpływie taktowania Infinity Fabric na wydajność procesorów AMD Ryzen. Różnica po uśrednieniu okazała się minimalna.
Radeon RX Vega 56 vs GeForce RTX 2060 - test po podkręceniu kart
Infinity Fabric od strony komunikacji między modułami CCX
Przechodząc do eksperymentów z liczbą modułów CCX, od razu zaznaczam, że wykres zaprezentowany powyżej prezentuje tylko i wyłącznie skalowanie obu możliwości z częstotliwością RAM, a więc i szybszym Infinity Fabric, co oznacza, że nie należy się nim posiłkować do celów porównywania wydajności w zależności od tego, w jaki sposób osiągamy tę samą liczbę rdzeni (o tym będzie później). Jak widać, uśredniony zysk z taktowania pamięci podwyższonego o circa 50% (3200 MHz vs 2133 MHz) jest zbliżony, sięgając 14,66% dla pojedynczego CCX oraz 15,17% dla dwóch sztuk. Nietrudno więc wywnioskować, że sprawniej działające IF przyniosło marginalną korzyść od strony komunikacji między modułami, przyczyniając się do dodatkowego wzrostu w wysokości zaledwie około 0,4%. Jak na tak dużą dysproporcję w zegarze, wartość ta jest wręcz śmiesznie mała. Ponownie pojawiają się jednak przypadki, w których różnica była marginalnie większa, wahając się w zakresie ~1-1,7%, co obserwujemy w Battlefield 4, Crysis 3, Dying Light, a także Sniper: Ghost Warrior 3. Innymi słowy, w żadnym wypadku nie jest tak, że posiadając procesor z jednym modułem CCX, a więc APU z rodziny Raven Ridge, nie opłaca się podkręcać pamięci, jeśli nie korzystamy ze zintegrowanej grafiki. Opłaca się dokładnie tak samo jak w przypadku pozostałych jednostek bazujących na architekturze Zen. Wracając jeszcze do procentów, przyrost mocy wynikający z samego przyspieszenia Infinity Fabric okazał się być bardzo niewielką składową łącznego skoku osiągów, po uśrednieniu wynosząc ~1,14/1,59%, odpowiednio dla CPU z jednym CCX oraz dwiema sztukami, podczas gdy ta druga wartość to przytoczone wcześniej ~14,7/15,2%, tak więc zdecydowanie jest to przysłowiowa "mniejsza połowa" (dużo mniejsza).
Podkręcanie AMD Athlon 200GE na płycie MSI B350M MORTAR - test
Jeden CCX czy dwa CCX, oto jest pytanie
Na deser zostało nam jeszcze zestawienie rezultatów dla konfiguracji 2+2 (dwa aktywne CCX) oraz 4+0 (jedna sztuka), które w gruncie rzeczy okazały się dość zbliżone. W ogólnym rozrachunku druga z wymienionych możliwości zdołała wyprzedzić alternatywną opcję o ~1,3/0,9%, odpowiednio dla taktowania pamięci operacyjnej wynoszącego 2133 MHz oraz 3200 MHz, a więc minimalnie. Bardziej interesująco sprawa wygląda jednak, jeśli porównamy wyniki w poszczególnych testach. Co ciekawe, w niektórych grach zanotowałem większą liczbę FPS przy dwóch modułach CCX. Taka sytuacja miała miejsce w Far Cry Primal, Project CARS oraz Wiedźminie 3: Dziki Gon. Zasadniczo nie ma w tym niczego dziwnego, bowiem w skład każdego CCX wchodzi 8 MB współdzielonej pamięci podręcznej L3, zatem rozkładając rdzenie na dwa bloki jednocześnie dwukrotnie zwiększamy pojemność cache trzeciego poziomu i wedle wszelkiego prawdopodobieństwa to właśnie ten fakt przesądził o ostatecznym rozstrzygnięciu. Z kolei w pozostałych produkcjach mieliśmy albo naprawdę wyrównaną stawkę, albo niewielką przewagę konfiguracji 4+0. Jeżeli o ten ostatni wariant chodzi, to różnice typowo nie przekraczały 3-4%, jednak nieco większą dysproporcję zanotowałem w Sniper: Ghost Warrior 3, gdzie sięgała ona 4-5% (zależnie od częstotliwości RAM/IF). Trzeba więc jasno powiedzieć, że chociaż podział na moduły CCX istotnie nieco obniża wydajność, to różnice nie są na tyle duże, by dramatyzować z tego powodu.
Phenom II vs Bulldozer vs Zen - test zegar w zegar i porównanie CMT/SMT
Windows 10 nie zawsze taki pomocny
Powoli już kończąc, jedynym zgrzytem w tej części testów było zachowanie Windowsa 10 w Crysis 3, gdzie przy dwóch CCX osiągi były strasznie słabe, podczas gdy starsza Siódemka poradziła sobie bezproblemowo (i to właśnie te rezultaty weszły do średniej, gdyż nieuczciwym byłoby brać wyniki z oczywistą anomalią). Jest to tym ciekawsze, że tuż po premierze Ryzenów samo AMD mówiło o konieczności poprawek schedulera, by potem wycofać się z tych słów z podkulonym ogonem, co wyglądało co najmniej dziwnie. Reasumując, przeprowadzone testy nie potwierdzają krążących po sieci doniesień o magicznym wpływie taktowania Infnity Fabric na wydajność. Procesory na architekturze Zen zyskują z tytułu szybszej pamięci z tego samego powodu jak wszystkie inne - dlatego, że podnosimy częstotliwość, poprawiając przepustowość, oraz optymalizujemy timingi, redukując opóźnienia. Rzecz jasna pomiary wykazały pewien zastrzyk osiągów w wyniku przyspieszenia IF samego w sobie, jednak w ogólnym rozrachunku są to niewielkie wartości, niebędące istotną częścią łącznego zysku z tytułu podkręcania RAM. Jednocześnie oznacza to, że jeżeli ktoś podaje wyniki mające świadczyć o skalowaniu lepszym niż liniowe, to po prostu test został przeprowadzony w sposób nieprawidłowy (różne warunki, kiepska powtarzalność, itd.). Ode mnie to już wszystko, ale tradycyjnie zapraszam do dyskusji w komentarzach, gdzie możecie podzielić się swoimi spostrzeżeniami.
Pokaż / Dodaj komentarze do: Test wpływu taktowania Infinity Fabric na wydajność procesorów AMD Ryzen