Intel Core i9 7980XE / 7960X review: Intel met 18 cores terug aan kop

Nieuwe Skylake-X processors nemen het op tegen AMD Threadripper

Door


Skylake in 18-core variant

De architectuur van de high-end Skylake-processors hebben we al uitgebreid uit de doeken gedaan in onze Intel Core i9 7900X review als ook in onze Intel Xeon Platinum 8180 review. Het gaat wat ver om alle ins en outs van de architectuur opnieuw te herhalen, dus mocht je het niet gedaan hebben, lees de gelinkte reviews zeker even terug.

Het belangrijkste verschil met de bestaande Skylake-X modellen is zoals geschreven dat Intel voor de Core i9 7920X tot 7980XE gebruik maakt van de HCC-variant van de Skylake-SP chips. Zoals je al kon lezen is Intel bij de nieuwe high-end CPU's overgestapt van een ringbus indeling naar een mesh architectuur, waarbij alle cores in een matrix, in feite een soort schaakbord-indeling aan elkaar zijn geplakt. Horizontaal en verticaal zijn er communicatielijnen waarmee de cores in verbinding staan met de caches gekoppeld aan andere cores en gedeelde chiponderdelen als de geheugen- en PCI-Express controllers. Bij de 10-core LCC-chip zitten de cores in een 4x3 matrix, waarbij twee spots worden opgenomen door de geheugencontroller. Bij de 18-core HCC-chip zitten de cores in een 4x5 matrix. Alle Skylake-X chips zijn gebaseerd op één van deze twee chiptypes, waar bij modellen met minder cores er een aantal cores is uitgeschakeld. 

In het onderstaande schema zie je overigens in totaal zes geheugenkanalen. In de Xeon-processors waarin deze chips gebruikt worden zijn die allemaal beschikbaar, bij de Socket 2066 Skylake-X desktop processors zijn "slechts" vier geheugenkanalen beschikbaar. Iets dergelijks geldt ook bij de PCI-Express 3.0 controller: er zijn 48 lanes in de chip beschikbaar, maar bij Skylake-X kunnen er daarvan 44 gebruikt worden.

Meer L2 cache en AVX512

Zoals je in onze eerdere reviews al kon lezen zijn de cores binnen de Skylake-X / Skylake-SP processors gebaseerd op de cores die we al geruime tijd kennen van de "normale" Skylake processors, beter bekend als de 6e generatie Core Socket 1151 CPU's. Aan die cores zijn echter twee belangrijke zaken toegevoegd. Allereerst meer cache-geheugen: waar Intel cores traditioneel 256 kB eigen L2-cache hebben, is dat bij Skylake-X verhoogd tot 1 MB. Daarnaast is de instructieset uitgebreid met AVX-512, waardoor bepaalde instructies op 512 bits tegelijkertijd kunnen worden uitgevoerd. Hiertoe kunnen twee bestaande 256-bit floating point execution units gecombineerd worden en is er een extra 512-bit execution unit toegevoegd. Let wel, om van AVX-512 te profiteren moet software daardoor geschikt gemaakt zijn en zodra er AVX-512 instructies in programmacode voorbij komen gaat de CPU vanwege het hiermee gepaard gaande hoge stroomverbruik op een wat lagere klokfrequentie werken. Op het moment van schrijven is ons nog geen AVX-512 consumentensoftware bekend, maar dat is vermoedelijk een kwestie van tijd. Meer over AVX-512 lees je in onze Xeon review.

Van inclusive naar exclusive

Ook belangrijk om nogmaals bij stil te staan is de aangepaste cache-indeling bij Skylake-X / Skylake-SP, waar we op de vorige pagina ook al kort aan refereerden. Traditiegetrouw hadden de Xeon-processors, en daarmee de afgeleide high-end desktop CPU's, per core 256 kB eigen L2-cache en 2,5 MB gedeelde L3-cache. De L2-cache per core is verviervoudigd van 256 kB naar 1 MB per core. Daar staat tegenover dat de gedeelde L3-cache is ingeperkt tot 1,375 MB per core. 

Deze L3-cache was tot aan de vorige generatie inclusive, wat betekent dat alle data die in de per core specifieke L2-cache werd geplaatst, ook in L3 moest staan. Het voordeel van die opzet is dat wanneer core A data nodig heeft van core B, deze altijd direct is terug te vinden in de gedeelde cache. Er hoeft dus niet eerst een verzoek te worden doorgestuurd om de data van de eigen L2-cache naar de gedeelde L3-cache te kopiëren. Een ander voordeel is dat het coherent houden van caches eenvoudig is. Wanneer meerdere cores werken aan dezelfde data en één ervan doet een aanpassing, wordt die direct in L3 verwerkt. Op basis daarvan kunnen de andere cores heel snel bepalen of zij wellicht data in hun eigen L2-cache hebben staan die niet meer up-to-date is. Een nadeel van een inclusive cache is echter dat de totale hoeveelheid data die gecached kan worden kleiner is: van de 25 MB L3-cache bij het 19-core topmodel Core i7 6950X processor was altijd 2,5 MB een kopie van de data in de 10 256 kB L2-cache segmenten. Bij Skylake is de cache echter niet langer inclusive, zodat niet langer een gedeelte verloren gaat aan het opslaan van een kopie van alle data in L2-caches. Dat betekent dat de volle 13,75 MB gebruikt kan worden voor data uitwisseling tussen cores, met als prijs dat de caching-algoritmes door de exclusive opzet wel een stuk ingewikkelder zijn geworden.

Laat wel duidelijk zijn; deze nieuwe cache-indeling is primair bedacht voor servers. Een van de achterliggende gedachten is vermoedelijk dat krachtige Xeon CPU’s meer en meer voor virtualisatie worden toegepast, waarbij er meerdere software-installaties op één CPU draaien, die elk gebruik maken van enkele ‘eigen’ cores. Het uitwisselen van data tussen cores is in een dergelijke situatie minder van belang, terwijl het versnellen van single-core performance een flink voordeel kan bieden. Dat laatste is natuurlijk ook een voordeel op de desktop, al kan de nieuwe opzet in bepaalde workloads ook weer een nadeel hebben. In onze Core i9 7900X zagen we al workloads die beter en slechter dan verwacht schaalden, vermoedelijk als gevolg van deze aanpassingen.

Turbo Boost 3.0

Ten slotte nog van belang om te herhalen is Turbo Boost 3.0, wat we al kennen van de Broadwell-E high-end desktop CPU’s. Na productie bepaalt Intel met interne tests voor iedere Skylake-X CPU die van de band rolt wat de twee “beste” cores zijn. Wanneer slechts een of twee cores in gebruik zijn, zal de CPU altijd proberen de workload naar die twee cores te verplaatsen, waarna de maximale turbo-klokfrequentie verder verhoogd wordt. De nieuwe 12- tot 18-core varianten hebben voor willekeurige cores bij single- en dual-threaded applicaties een maximale turbo-klokfrequentie van 4,2 GHz. Dankzij Turbo Boost 3.0 wordt dat verhoogd naar 4,4 GHz wanneer de workload op de juiste cores zit. Een extra driver is niet meer nodig, sinds de Windows 10 Anniversary Edition zit ondersteuning voor Turbo Boost 3.0 in Windows 10 ingebakken.

Onderstaande tabel toont alle Turbo-klokfrequenties voor de Skylake-X en Kaby Lake-X processors. We zien dat de 7980XE met één of twee actieve cores op 4,2 GHz werkt (4,4 GHz met Turbo Boost 3.0), met 3 of meer cores actief op 4,0 GHz, met 5 of meer cores actief op 3,9 GHz, met 13 of meer cores actief op 3,5 GHz en met 17 of 18 cores actief op 3,4 GHz. Bij de 7960X variëren de Turbo-waardes van 4,2 GHz tot 3,6 GHz.  


Lees ook deze processor artikelen op Hardware.Info

Vond je deze review nuttig?

Lees dan voortaan onze uitgebreidste reviews als eerste én steun deze site, met een abonnement op Hardware.Info Magazine - nu ook alleen digitaal beschikbaar!

Hardware.Info maakt gebruik van cookies.
*