AMD Zen CPU preview: "net zo snel als Broadwell-E"

200 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. De Zen architectuur
  3. 3. 14nm: zelfde productieprocedé als Polaris
  4. 4. De belofte: 40% betere IPC
  5. 5. De eerste Zen-CPU: 8-core Summit Ridge voor desktops vergeleken met Broadwell-E
  6. 6. 32-core Napels server-chip ook gedemonstreerd
  7. 7. Wanneer op de markt?
  8. 8. Reacties

Inleiding

AMD heeft gisteravond tijdens het Intel Developer Forum voor een selecte groep techjournalisten een presentatie gegeven over de toekomstige Zen-processor. Onderdeel daarvan was een live demonstratie waarbij men aantoonde dat Zen met hetzelfde aantal cores en dezelfde klokfrequentie net wat sneller is dan Intels eerder dit jaar geïntroduceerde Broadwell-E processor. Hardware.Info was erbij en doet verslag.

Niet alleen loyale fans kijken al jaren uit naar de nieuwe Zen-architectuur, maar de hele markt lijkt te hopen op eindelijk weer wat concurrentie voor Intel op het vlak van CPU’s voor laptops, desktops en servers. Tijdens de presentatie, die werd gegeven door AMD’s CEO Lisa Su, AMD’s CTO Mark Papermaster en de Senior Vice President en manager van de Computing en Graphics divisie Jim Anderson werd wel duidelijk dat AMD vol goede moed naar 2017 kijkt.

Zen is een volledig nieuwe processorarchitectuur. De afgelopen jaren zat AMD vast aan opeenvolgende iteraties van de, laten we het vriendelijk zeggen, niet bepaald succesvolle Bulldozer architectuur. Met de introductie van Zen zal AMD dit duistere hoofdstuk uit haar bestaan achter zich laten. Zen is volgens AMD ontwikkeld om gebruikt te worden in meerdere markten, van laptops tot servers. Zoals al eerder aangekondigd zijn high-end desktops eerst aan de beurt in de vorm van de Summit Ridge processor die volgens de informatie die we vandaag kregen heel misschien nog voor het eind van het jaar komt, maar anders sowieso in het eerste kwartaal van 2017. Servers, mainstream desktops en laptops volgen later.

Tijdens de presentatie gaf AMD voor het eerst meer informatie over de eigenschappen van Zen. Met een demonstratie toonde men aan dat het uiteindelijke doel, namelijk weer een echte concurrent voor Intel worden, haalbaar moet zijn.


AMD's CTO Mark Papermaster doet de architectuur van Zen uit de doeken


AMD's CEO Lisa Su tijdens de Zen presentatie

De Zen architectuur

De Zen architectuur is dus van de grond af aan opnieuw ontwikkeld. “Uiteraard hebben we al onze kennis en ervaring die we hebben opgedaan bij eerdere architecturen meegenomen,” aldus CTO Mark Papermaster in een interview dat we na de presentatie hadden, “maar alle onderdelen van de chip zijn geheel opnieuw ontworpen.”

AMD’s doelstelling bij de ontwikkeling van Zen was een gebalanceerde architectuur die gebruikt kan worden binnen chips voor laptops, desktops en servers. Niet alleen op het vlak van ruwe prestaties, maar ook op het vlak van efficiëntie had AMD zich tot doel gesteld flinke stappen te maken. En dat is naar eigen zeggen goed gelukt.

Kijken we naar een high-level blokkenschema van de Zen core dan zien we een duidelijk andere opbouw dan bij Bulldozer en de afgeleiden daarvan. Bij Bulldozer maakte AMD de achteraf onverstandige beslissing om te werken met een soort hybride single/dual-core modules met twee integer cores en één gedeelde floating point core. Zen is in principe een meer traditioneel ontwerp, maar wel een stuk breder en geavanceerder. Iedere Zen-core bevat een zestal integer rekeneenheden, waarvan vier geschikt voor berekeningen (ALU’s) en twee voor geheugenoperaties (AGU’s). Het floating point gedeelte heeft een viertal execution units, twee geschikt voor optellingen en twee voor vermenigvuldigen. De Zen floating point unit is geschikt voor alle SSE-varianten en 128-bit AVX. In vergelijking met de meest recente Bulldozer-afgeleide, Excavator, is het aantal execution units en het aantal instructies en de breedte van de pipeline met 50% toegenomen. Het aantal instructies dat tegelijkertijd door de pipeline verwerkt kan worden, is zelfs met 75% toegenomen.

Maar ook in de front-end van de CPU zien we flink verbeteringen. Volgens AMD is de branch predictor, het onderdeel van de CPU dat vooraf inschat welke vertakkingen in code worden genomen om op die manier voldoende instructies parallel te kunnen uitvoeren, flink verbeterd. Ook heeft de nieuwe architectuur net als we kennen van Intel een micro-op cache. Dat maakt dat wanneer de complexe x86-instructies worden vertaald naar kleinere micro-ops die daadwerkelijk door de execution units uitgevoerd kunnen worden, deze vertalingen worden gecached, zodat code met veel identieke instructies wordt versneld. Al met al zou de opbouw volgens AMD ook juist single-threaded applicaties moeten versnellen, een tak van sport waar de huidige AMD architectuur juist niet goed in is.

Ook op het vlak van caches zijn er flinke verbeteringen gemaakt. Allereerst heeft AMD de data pre-fetchers naar eigen zeggen flink verbeterd. Deze voorspellen welke data op korte termijn door instructies benodigd is en haalt die al op uit het relatief langzame RAM-geheugen. Hoe beter de pre-fetchers, hoe minder vaak de CPU-cores zonder werk zitten omdat ze moeten wachten op data. Zoals gebruikelijk binnen x86-processors bevatten de Zen cores losse L1-caches voor instructies en data met een extreem lage latency. De L2-cache is geschikt voor beide soorten data. De eerste Zen varianten krijgen verder 8MB gedeelde L3-caches. Opvallend is de grootte van de L2-cache: 512 kB per core, dubbel zoveel als bij Intels recente architecturen. De combinatie van alle verbeteringen aan de caches moet er voor zorgen dat de bandbreedte richting de cores gemiddeld zo’n 5x hoger is dan voorheen.

Zen is AMD’s eerste processorarchitectuur die geschikt is voor simultaneous multi-threading, een technologie die we bij Intel kennen als HyperThreading. Deze technologie zorgt ervoor dat een enkele CPU-core tegelijkertijd instructies van twee programma’s of programmathreads kan uitvoeren. Zoals we weten van HyperThreading kan dit de prestaties van een CPU flink verbeteren, aangezien de kans dat er voldoende variatie aan instructies is om zoveel mogelijk execution units bezig te houden bij het verwerken van twee threads natuurlijk groter is. Een 8-core Zen CPU is binnen een besturingssysteem als Windows dus een 16-core processor. Om SMT op een goede manier te implementeren hebben de Zen-cores een dubbele set registers voor twee threads, waarna vanaf de scheduler instructies voor twee threads gecombineerd worden.

14nm: zelfde productieprocedé als Polaris

De laatste jaren had AMD in de strijd met Intel in feite twee grote nadelen. De Bulldozer architectuur was bij lange na niet zo potent als de recente architecturen van Intel en daarnaast had men ook op het vlak van productieprocedés een flinke achterstand, met daardoor direct een groot nadeel qua efficiëntie. In het high-end desktop segment, voor zover AMD daar de laatste jaren überhaupt nog een rol van betekenis heeft gespeeld, moest men proberen te concurreren met op 32nm geproduceerde AMD FX processors, terwijl Intel sinds 2014 met Broadwell en later Skylake al op een 14nm procedé zit. Kleinere transistors betekent in de regel een lager stroomverbruik en de mogelijkheid om meer prestaties te creëren met eenzelfde chipoppervlak.

Die achterstand is op zijn minst grotendeels opgelost. De eerste Zen-processors worden geproduceerd middels hetzelfde 14nm FinFET productieprocedé van Global Foundries waarmee AMD ook de Polaris GPU’s op de markt heeft gebracht. Volgens AMD is de Summit Ridge chip, de Zen variant die men rond de jaarwisseling voor desktops op de markt wil brengen, de vijfde 14nm chip die uit de fabrieken komt gerold. Tegen die tijd moet het procedé geoptimaliseerd zijn. En hoewel procedés van verschillende chipfabrikanten in principe niet één-op-één te vergelijken zijn – 14nm bij Intel en 14nm bij Global Foundries betekent niet dat transistors fysiek even groot zijn – mogen we toch op z’n minst concluderen dat AMD hiermee een flink stap neemt en dat er meer een level playing field ontstaat.

Volgens AMD zorgt alleen het productieprocedé er al voor dat Zen CPU’s met een identiek stroomverbruik op hogere klokfrequentie kunnen werken dan voorheen of juist zuiniger zijn op identieke klokfrequentie. De verbeteringen in architectuur komen daar nog bovenop.

Het 14nm procedé moet de Zen CPU’s dus een stuk zuiniger maken dan wat we tot nu toe gewend zijn van AMD, maar binnen de architectuur zijn ook op alle vlakken keuzes gemaakt om het ontwerp zo efficiënt mogelijk te maken. Zen moet de komende jaren natuurlijk ook de basis zijn voor AMD’s processors voor laptops.

Allereerst is het volgens AMD binnen de Zen-architectuur mogelijk om verschillende onderdelen van de chip uit te schakelen wanneer deze niet gebruikt worden. Maar zaken als de grotere micro-op cache, een write-back L1-cache (waarbij data niet per definitie direct doorgeschoven hoeft te worden naar L2) en vele andere zaken moeten bijdragen aan de efficiëntie.

De belofte: 40% betere IPC

Eerder al had AMD een belofte gedaan dat Zen-cores een 40% betere IPC zouden krijgen dan de laatste generatie van de Bulldozer-architectuur, Excavator. IPC is een maat voor het gemiddeld aantal instructies dat een core per klokslag kan afronden. In principe betekent de belofte dus dat Zen op dezelfde klokfrequentie 40% sneller moet zijn dan Excavator.

Nu de ontwikkeling van de nieuwe generatie CPU’s langzaam op zijn eind loopt, gaf AMD tijdens de presentatie verheugd aan dat het doel gelukt is. Zowel voor integer als voor floating-point instructies mogen we in de regel een IPC-verbetering van minimaal 40% verwachten. Het is een gigantische stap vooruit in vergelijking met de incrementele verbeteringen die we de afgelopen jaren hebben gezien bij achtereenvolgens Piledriver, Steamroller en Excavator.

Maar nu breidt AMD die belofte nog uit: het prestatieniveau moet dus 40% hoger zijn Excavator, terwijl het stroomverbruik gelijk blijft. Dat is erg ambitieus, want juist bij Excavator heeft AMD recent flinke stappen gemaakt qua efficiëntie. Niet alleen de prestaties, maar ook de prestaties-per-watt zouden zo’n 40% beter moeten zijn dan die van de huidige generatie!

En daar blijft het niet bij, want AMD gaat de Zen-architectuur uiteraard doorontwikkelen in de komende jaren. Dat betekent dat we één of twee jaar na de eerste generatie alweer een tweede generatie Zen-processors mogen verwachten, nu nog “Zen+” genaamd met opnieuw een verbeterd prestatieniveau.

 

De eerste Zen-CPU: 8-core Summit Ridge voor desktops vergeleken met Broadwell-E

De eerste Zen processor die AMD op de markt zal brengen is een product dat gericht zal worden op high-end desktops. De chip draagt nu nog de codenaam Summit Ridge. Het wordt een 8-core processor (16 virtuele cores) met ondersteuning voor dual-channel DDR4 en bevat verder een PCI-Express 3.0 controller.

De processor zal gebruikmaken van de Socket AM4 processorvoet, maar zal niet de eerste AM4 CPU zijn. De komende maanden zal AMD de op Excavator-cores gebaseerde Bristol Ridge processors introduceren die gebruikmaken van dezelfde processorvoet. Deze chips hebben dus nog niet de nieuwe processorarchitectuur, maar door deze eerste op de markt te brengen, weet AMD in ieder geval zeker dat het AM4 platform volledig up and running is voor de lancering van Summit Ridge. Dit AM4 platform krijgt volgens AMD sowieso ondersteuning voor USB 3.1 Gen. 2 en NVMe SSD’s en is daarmee helemaal bij de tijd.

AMD toonde direct enkele demo’s van een Summit Ridge systeem, waarbij de processor z’n werk deed op 3 GHz. AMD gaf hierbij aan dat dit puur de klokfrequentie is van de engineering samples en dat de uiteindelijke klokfrequenties waarop de CPU’s geïntroduceerd zullen worden hoger is.

De game Deus Ex: Mankind Divided werd soepel draaiend in 4K resolutie met ultra settings getoond, op een combinatie van de Summit Ridge processor en een AMD Fury X videokaart. De game draaide soepel, maar op basis van die demo is er op zich nog weinig te zeggen over de CPU-prestaties.


Een van de getoonde testsystemen met AMD Zen "Summit Ridge" processor

De tweede demo was echter een stuk overtuigender en toonde aan dat Zen vermoedelijk tot meer in staat dan menigeen zou verwachten. Men toonde een head-to-head benchmark van de 8-core 3GHz Summit Ridge ten opzichte van een 8-core Intel Core i7 6900K Broadwell-E processor. De Intel CPU was ook geklokt op 3 GHz, omdat AMD een presentatie wou geven met identiek aantal cores en identieke klokfrequentie. Standaard werkt de 6900K op 3,2 GHz, dus een kleine 10% sneller. De getoonde benchmark was het renderen van een 3D-afbeelding van een Zen-processor in de veel gebruikte 3D-renderingsoftware Blender. Uit de demonstratie bleek dat de AMD CPU het werk een fractie sneller voltooide dan Intel. Dat hadden wij en de meeste andere aanwezige journalisten eerlijk gezegd niet verwacht. Voor zover wij weten maakt Blender trouwens primair gebruik van floating-point instructie, dus juist datgene waar de vorige generatie AMD processor slecht in was.

Onderstaande video toont de demonstratie:

32-core Napels server-chip ook gedemonstreerd

Naast een demonstratie van de 8-core Summit Ridge chip bleef het niet. Tijdens de presentatie toonde AMD ook al direct de 32-core (64 threads) Napels chip die men voorbereidt voor 2P-servers. Hoewel er geen benchmarks werden gedraaid, werd er wel een prototype 2P-server werkend getoond onder Windows.

Napels komt wat later op de markt dan Summit Ridge, maar is voor AMD vermoedelijk een nog veel belangrijker product. In de servermarkt is namelijk het echte geld te verdienen en in het 2P-segment, dat zo’n 80% van de servermarkt beslaat, heeft Intel op dit moment in principe vrijwel 100% marktaandeel. De sprekers van AMD waren vastberaden om met goede prestaties en competitieve prijzen ook hier eindelijk weer een antwoord op Intel te hebben.


Het testbord met twee 32-core AMD Zen "Napels" CPU's aan boord. Het werd ook werkend getoond in een testserver.

Wanneer op de markt?

Dat Zen geen architectuur zou worden waar AMD haar grote concurrent mee voorbij zou gaan streven was wel bekend en gezien de beperkte slagkracht van AMD op het vlak van R&D ook niet te verwachten. Dat men desalniettemin een architectuur heeft weten te ontwikkelen die zich qua IPC kan meten met Broadwell is echter knap. Het betekent een verbetering op de huidige situatie, waarin Intel de facto geheel geen concurrentie heeft. Laten we ook niet vergeten dat AMD in het high-end desktop segment, of we het nu hebben over chips als de 6700K of de Broadwell-E processors, vooralsnog makkelijk op prijs moet kunnen concurreren. Je hoeft geen glazen bol te hebben om te voorspellen dat de Summit Ridge processors goedkoper zullen worden dan de € 1000 kostende Core i7 6900K waarmee AMD de toekomstige processor tijdens de presentatie vergeleek.

Deze wat diepere duik in de architectuur en eerste publieke benchmark van Zen smaakt naar meer. Wel moeten we vaststellen dat er nog veel vragen onbeantwoord zijn. Prijs, stroomverbruik, prestaties bij een grotere set workloads: het zijn op dit moment allemaal nog vraagtekens. De voortekenen zijn in elk geval goed.

Laten we hopen dat AMD deze keer niet in de bekende val loopt van te veel beloven en te weinig waarmaken, en dat het niet in de laatste fase van de ontwikkeling nog tegen problemen aanloopt. Want of Zen nu vrijwel gelijk, net wat langzamer of net wat sneller blijkt dan de courante chips van Intel: het is hoe dan ook goed nieuws dat we in 2017 eindelijk weer concurrentie mogen verwachten op de markt voor processors. Dat is voor de consument uiteindelijk alleen maar goed nieuws.

Ten slotte: volgende week is in Amerika de HotChips conventie. AMD heeft aangegeven daar nog wat meer details van Zen bekend te zullen maken. Blijf Hardware.Info dus in de gaten houden!


Een mooie afsluiter van het event: "The best is yet to come".

0
*