AMD Ryzen Threadripper 1950X / 1920X review: AMD terug in de lead!

AMD's nieuwe 12- en 16-core processors vergeleken met Intel Skylake-X

Door


Benchmarks: Creator mode versus Game mode, DDR4-2667 versus DDR4-3200

Op pagina vier van dit artikel deden we al uitgebreid uit de doeken dat Threadripper bestaat uit twee chips met elk 8 cores en twee geheugenkanalen en die die twee chips communiceren via Infinity Fabric. De communicatie tussen beide chips zorgt hoe je het ook wendt of keert voor extra latency wanneer een core uit chip één data nodig heeft uit een L3-cache segment in chip 2 of een geheugenmodule verbonden aan chip 2. 

Op pagina vijf beschreven we dat je via de Ryzen Master software de Threadripper CPU's kunt omzetten van Creator mode naar Game mode, waarbij het geheugen primair lokaal wordt aangesproken en de cores van één van beide chips worden uitgeschakeld. De Game Mode zorgt voor compatibiliteit bij applicaties die zich verslikken in grote aantallen virtuele cores en voor in potentie betere prestaties bij workloads die meer schakelen bij lage latencies voor het verkrijgen van data dan bij meer cores of hogere geheugen bandbreedte. Hét voorbeeld van dergelijke workloads is games, vandaar ook de naam Game Mode.

We weten dat de Infinity Fabric werkt op de geheugenklokfrequentie en dat het plaatsen van sneller geheugen dus als bijeffect heeft dat de verschillende processoronderdelen ook sneller met elkaar kunnen communiceren. Net als bij Ryzen is het plaatsen van sneller geheugen bij Threadripper op z'n minst op papier een methode om de prestaties te laten toenemen.

Om de proef op de som te nemen of de Game Mode voor games écht een effect bewerkstelligt, hebben we de game benchmarks nog eens gedraaid in Game Mode en daarnaast ook met een hogere snelheid geheugen (DDR4-3200) in zowel Creator als Game mode. Voordat we naar die resultaten gaan kijken, eerst een aantal andere tests, die inzichtelijk maken wat het effect is van de Game Mode en het snellere geheugen.

In onderstaande tabel zie je allereerst de Cinebench 15 score. Bij de Game Mode wordt de score bijna gehalveerd; nogal wiedes, de helft van de cores wordt uitgeschakeld. Echter; het feit dat de uiteindelijke score 55% in plaats van 50% van de standaard score is, bewijst dat de multi-core schaling over twee dies niet perfect is. Bij een workload als Cinebench hebben de verschillende threads geen data nodig van andere threads en werken ze puur in hun eigen geheugensegment en past de benodigde data (grotendeels) in een eigen L3-segment. Het maakt dat sneller geheugen en daarmee een snellere Infinity Fabric bus eigenlijk geen effect heeft op de score.

Met SiSoft Sandra hebben we de geheugenbandbreedte gemeten en je ziet dat die in Game Mode ook vrijwel door tweeën gaat, aangezien de data van programmathreads zo veel en goed mogelijk puur op de eigen die aangesloten geheugenmodules wordt geplaatst, waardoor je de facto dual-channel in plaats van quad-channel DDR4 geheugenprestaties hebt. De CPU-prestaties en de geheugenbandbreedte gaan dus ruwweg door twee, maar de wachttijd bij het opvragen van nieuwe data wordt duidelijk korter.

Sandra kan de latencies keurig meten over verschillende ranges van datagroottes, waardoor we de latency van de L1-cache, de L2-cache, de eigen L3-cache, de L3-cache in een andere CCX, de L3-cache in een andere die en het geheugen los van elkaar inzichtelijk kunnen maken.

De latency van het ophalen van data in de eigen L1 en L2 cache van core verandert uiteraard niet met de verschillende instellingen. Ook data ophalen in het gedeelte van de L3-cache van de CCX zou in theorie even snel moeten gaan, aangezien hier de nog relatief lange Infinity Fabric databus bij komt kijken, maar we meten bij de game mode een te verwaarlozen verschil. Het halen van data uit de L3-cache van de andere CCX uit dezelfde die (waarbij data dus over Infinity Fabric binnen dezelfde chip gaat), gaat in Game Mode iets sneller. De verklaring die wij ervoor hebben is dat je bij het opvragen van data uit L3 altijd moet opvragen of alle cores binnen het systeem niet toevallig een nieuwe versie van diezelfde data in hun lokale L1- of L2-cache hebben (zogenaamde snooping) en met de helft van de cores uitgeschakeld gaat dat wat sneller. Het snellere geheugen (DDR4-3200) zorgt voor een duidelijke prestatiewinst op deze L3 latency, van 20,9 ns naar 18,8 ns, simpelweg dus omdat de Infinity Fabric bus sneller werkt.

In de 16 tot 32 MB range wordt het interessant, daar wordt immers data opgehaald uit de L3-cache die in de tweede die is geplaatst. We zien dat in Creator Mode deze latency zo'n vier keer zo hoog is als de lokale L3-cache. Dat is een aanzienlijk verschil en bewijst dat in workloads waar de cores niet met hun eigen ding bezig zijn, maar onderling data moeten uitwisselen, Threadripper in potentie minder schaalt dan een CPU waar alle cores in één chip zitten (zoals de Intel Skylake-X CPU's). Bij de Game Mode wordt samen met de helft van de cores ook de helft van de L3-cache uitgeschakeld en is er dus geen "ver" L3-cache geheugen. De latency in het 16 tot 32 MB segment is hier dus de facto het eerste gedeelte van het geheugen.

De geheugen latency blijkt identiek aan de latency voor L3-segment in de andere die. Hieruit mogen we wel afleiden dat qua latency in beide gevallen de Infinity Fabric but tussen de chips de bottleneck is. Dat wordt nog extra duidelijk als we de resultaten met DDR4-3200 en dus een snellere Infinity Fabric bus ernaast leggen; zowel in Creator Mode als in Game Mode wordt de latency voor ver L3-cache en geheugen zo'n 12% lager. Hier zien we wel hét effect van de Game Mode: de geheugen latency gaat terug van zo'n 80 ns naar 60 ns, een kwart minder dus. 

Modus / Geheugen Creator
2666C14
Game
2666C14
Creator
3200C14
Game
3200C14
Cinebench 15 score 3020 1678 3016 1689
SiSoft Sandra - Memory Bandwidth 54,5 GB/s 31,6 GB/s 62,8 GB/s 36,8 GB/s
SiSoft Sandra - Latency 0 - 32 kB (L1) 1,0 ns 1,0 ns 1,0 ns 1,0 ns
SiSoft Sandra - Latency 32 - 512 kB (L2) 3,0 ns 3,1 ns 3,1 ns 3,1 ns
SiSoft Sandra - Latency 512 kB - 8 MB (L3, eigen CCX) 7,9 ns 8,0 ns 7,9 ns 8,1 ns
SiSoft Sandra - Latency 8 - 16 MB (L3, andere CCX zelfde die) 20,9 ns 19,5 ns 18,8 ns 18,1 ns
SiSoft Sandra - Latency 16 - 32 MB (L3, andere die) 81,3 ns 58,8 ns 71,5 ns 52,2 ns
SiSoft Sandra - Latency 32 MB - 1 GB (RAM geheugen) 81,8 ns 59,4 ns 71,9 ns 53,1 ns

Wat betekent dit nu allemaal voor games? Onderstaande tabel toont de resultaten. Nu moet gezegd worden, dat onze selectie games primair moderne spellen zijn, terwijl de Game Modus juist bij oudere spellen problemen kan oplossen. Nieuwe spellen zijn simpelweg al geschikter voor processors met extreem veel cores als AMD Threadripper. Maar goed, spellen uit 2013 had je maar in 2013 moeten spelen, zullen we maar zeggen. ;)

In Prey zien we dat de Game mode een negatief effect heeft op de prestaties. Sneller geheugen zorgt voor meetbaar betere prestaties. In The Witcher 3 is Creator versus Game mode lood om oud ijzer en doet ook sneller geheugen niet veel. In GTA V is de Game Mode wél sneller, maar het verschil is zo klein dat het ons het opnieuw opstarten van je PC niet waard zou zijn. Sneller geheugen levert overigens meer prestatiewinst op dan de Game Mode. Bij Battlefield 1 zijn beide modi lood om oud ijzer, maar heeft sneller geheugen wel effect. Bij Doom scoort alles 199,9 fps; deze CPU is in alle standen snel genoeg voor deze game. In Rise of the Tomb Raider, ook een moderne DX12 game, zien we dat er opnieuw vrijwel geen verschil zit tussen de modi en zorgt sneller geheugen voor een duidelijk meetbare prestatiewinst. In Hitman presteert Game Mode zelfs slechter. Opnieuw zorgt sneller geheugen voor betere prestaties.

Modus / Geheugen Creator
2666C14
Game
2666C14
Creator
3200C14
Game
3200C14
Game benchmarks    
Prey - 1920x1080 - Medium 221,8 fps 180,2 fps 228,1 fps 184,2 fps
Prey - 1920x1080 - Ultra 207,6 fps 182,4 fps 218,0 fps 180,5 fps
The Witcher 3 - 1920x1080 - Medium 245,3 fps 243,9 fps 245,6 fps 248,6 fps
The Witcher 3 - 1920x1080 - Ultra 135,8 fps 133,7 fps 135,1 fps 135,1 fps
GTA V - 1920x1080 - Medium 113,6 fps 118,6 fps 120,0 fps 122,7 fps
GTA V - 1920x1080 - Ultra (2x MSAA, 0x Refl. MSAA) 60,9 fps 61,3 fps 61,5 fps 63,2 fps
Battlefield 1 (DX12) - 1920x1080 - Medium 129,2 fps 130,9 fps 133,5 fps 148,4 fps
Battlefield 1 (DX12) - 1920x1080 - Ultra 108,8 fps 108,7 fps 115,9 fps 120,6 fps
Doom (Vulkan) - 1920x1080 - Medium 199,9 fps 199,9 fps 199,9 fps 200,0 fps
Doom (Vulkan) - 1920x1080 - Ultra 199,9 fps 199,9 fps 199,9 fps 200,0 fps
Rise of the Tombraider (DX12) - 1920x1080 - Medium 161,2 fps 163,6 fps 172,2 fps 178,5 fps
Rise of the Tombraider (DX12) - 1920x1080 - Ultra 144,2 fps 141,0 fps 152,3 fps 150,4 fps
Hitman (DX12) - 1920x1080 - Medium 117,3 fps 114,3 fps 133,6 fps 124,9 fps
Hitman (DX12) - 1920x1080 - Ultra 108,1 fps 106,1 fps 123,4 fps 115,7 fps
Game benchmarks (frame times)    
Prey - 1920x1080 - Medium 124,2 fps 121,5 fps 125,8 fps 122,9 fps
Prey - 1920x1080 - Ultra 114,5 fps 121,2 fps 124,4 fps 121,1 fps
The Witcher 3 - 1920x1080 - Medium 184,2 fps 180,5 fps 188,3 fps 196,1 fps
The Witcher 3 - 1920x1080 - Ultra 107,5 fps 105,4 fps 107,1 fps 105,9 fps
GTA V - 1920x1080 - Medium 83,3 fps 83,3 fps 90,9 fps 90,9 fps
GTA V - 1920x1080 - Ultra (2x MSAA, 0x Refl. MSAA) 47,6 fps 43,5 fps 45,5 fps 41,7 fps
Battlefield 1 (DX12) - 1920x1080 - Medium 78,7 fps 81,3 fps 82,6 fps 94,3 fps
Battlefield 1 (DX12) - 1920x1080 - Ultra 71,4 fps 69,0 fps 75,2 fps 78,7 fps
Doom (Vulkan) - 1920x1080 - Medium 172,4 fps 172,4 fps 172,4 fps 175,4 fps
Doom (Vulkan) - 1920x1080 - Ultra 169,5 fps 169,5 fps 169,5 fps 172,4 fps

In onderstaande tabel zie je het gemiddelde effect wanneer we alle hierboven getoonde games/settings meenemen. We zien dat de Game Mode in onze test gemiddeld een prestatie-afname in plaats van -toename realiseert, van gemiddeld 3,1%. Bij oudere games zal het wellicht andersom zijn. Het advies van AMD zouden wij graag willen herhalen: laat je Threadripper systeem lekker in Creator Mode staan en gebruik die Game Mode alleen als je een oude game hebt die echt niet werkt.

Het effect van sneller geheugen is duidelijk meetbaar, gemiddeld 4,1%. Maar goed, ook dit is een theoretisch voordeel te noemen. Menig wetenschappelijk studie heeft aangetoond dat een prestatieverschil minimaal 10% moet zijn wil je het daadwerkelijk kunnen merken in plaats van meten. Als je dan ook nog bedenkt dat 64 GB (geen gekke hoeveelheid voor een high-end desktop systeem) DDR4-3200 al snel zo'n 100 à 150 euro duurder is (zie hier bijvoorbeeld het prijsverschil voor Corsair Vengeance LPX kits), dan mag je concluderen dat je het verschil tussen DDR4-2667 en DDR4-3200 vermoedelijk voornamelijk in je portemonnee merkt.

Pretatieverschil bij games 
Effect Game Mode 
Game Mode (DDR4-2667) versus Creator Mode (DDR4-2667) -3,2%
Game Mode (DDR4-3200) versus Creator Mode (DDR4-3200) -3,0%
Gemiddeld -3,1%
Effect Sneller Geheugen 
DDR4-3200 versus DDR4-2667 (Creator Mode) 4,0%
DDR4-3200 versus DDR4-2667 (Game Mode) 4,2%
Gemiddeld 4,1%
Effect combinatie 
Game Mode (DDR4-3200) versus Creator Mode (DDR4-2667) 0,9%

Dossier

Lees ook deze processor artikelen op Hardware.Info

Vond je deze review nuttig?

Lees dan voortaan onze uitgebreidste reviews als eerste én steun deze site, met een abonnement op Hardware.Info Magazine - nu ook alleen digitaal beschikbaar!

Hardware.Info is volledig onafhankelijk. Onze reviews zijn puur gebaseerd op objectieve testresultaten en onze eigen ervaring met de producten. Deze reviews kan je hier gratis lezen, maar dat is alleen mogelijk dankzij de steun van onze trouwe lezers. Met een abonnement op Hardware.Info Magazine steun je deze site en lees je de uitgebreidste 100% hardware reviews als eerste. Neem dus nu een abonnement, je hebt er al een voor 26,50 euro!

Neem nu een abonnement en steun Hardware.Info

Hardware.Info maakt gebruik van cookies.
*