Intel Core M "Broadwell-Y" preview: serieuze rekenkracht voor tablets

8 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. 14nm procedé: kleiner en zuiniger
  3. 3. Broadwell core: beperkte optimalisaties
  4. 4. GPU
  5. 5. De Broadwell-Y chip: Focus op tablets
  6. 6. Conclusie
  7. 7. Reacties

Inleiding

Een echte Intel Core-processor, maar dan in tablets van minder dan 9 mm dik, zonder actieve koeling. Dat is de belofte die Intel doet voor haar volgende generatie processorarchitectuur, codenaam Broadwell. Een formele introductie zal vermoedelijk tijdens de IFA-beurs in september plaatsvinden en de eerste tablets liggen vermoedelijk pas rond de jaarwisseling in de winkel. Afgelopen week gaf Intel echter al wat meer informatie vrij over de toekomstige CPU’s.

Broadwell is de volgende stap in Intels bekende tick tock-strategie, waarbij het om en om een nieuwe CPU-architectuur en een nieuw productieprocedé introduceert. De laatste stap, Haswell, was een zogenaamde tock, een nieuwe architectuur geproduceerd middels Intels 22nm procedé, dat het met de vorige generatie (Ivy Bridge) introduceerde. Broadwell is dus een tick: de toekomstige CPU’s maken gebruik van een geoptimaliseerde variant van de Haswell-architectuur, maar dan met een nieuw, state of the art 14nm productieprocedé.


Broadwell is de volgende stap in Intels tick-tock strategie.

Traditiegetrouw gebruikt Intel haar "Core" CPU-architecturen voor alles van extreem zuinige laptops tot juist zeer krachtige servers. De laatste jaren is het punt waar Intel de meeste optimalisaties voor uitvoert steeds verder verschoven naar mobiele devices. Het is duidelijk dat bij de ontwikkeling van de Haswell-architectuur laptops (en met name Ultrabooks) Intels belangrijkste focus waren, terwijl desktops en servers op de tweede plek kwamen.

Bij Broadwell gaat Intel nog een stap verder: de nieuwe generatie CPU’s is nu ook primair geoptimaliseerd voor chips met een gemiddeld stroomverbruik in de ordegrootte van 5 watt. Daarmee wil men een belangrijke slag gaan slaan in de markt voor tablets en 2-in-1-apparaten, waar voor Intel nog steeds voldoende groeimogelijkheden zijn.

Binnen de huidige Haswell-reeks heeft Intel ook al diverse zéér zuinige varianten, te herkennen aan modelnummers eindigend op een Y. Deze CPU’s, ook wel bekend onder codenaam Haswell-ULX, hebben een TDP van 11,5W en een gemiddeld verbruik dat nog een stuk lager ligt. Bij de komende generatie gaat dat verbruik nog een stuk omlaag, waardoor de Core-architectuur eindelijk geschikt wordt voor zeer dunne, lichte en bovenal passief gekoelde tablets. Intel gaat flink inzetten op deze nieuwe chips en gaat ze daarom ook voorzien van een eigen merknaam. De Broadwell Y-processors zullen zodoende niet door het leven gaan als Core i3 5xxxY, i5 5xxxY en i7 5xxxY, maar zullen aangeduid worden als Intel Core M CPU’s. De snellere varianten met een hogere TDP zullen naar verwachting wel gewoon de Core i3/i5/i7 benaming houden. 


De Broadwell-Y processors zullen als Core M door het leven gaan.

Tijdens Computex kregen we al een klein voorproefje van wat de Core M CPU’s mogelijk moeten maken, in de vorm van de aankondiging van de ASUS Transformer T300 Chi. De tablet van deze 2-in-1 machine is slechts 7,9 mm dik. Vergelijkbaar met een iPad Air dus, maar dan met een Intel Core-processor en niet een Intel Atom of ARM chip. Eveneens tijdens Computex toont Intel al haar eigen referentie Core M tablet, codenaam Llama Mountain, welke eveneens nog geen 8mm dik is. Vermoedelijk zullen we de komende tijd nog wel meer aankondigingen van T300-achtige machines krijgen.


De tijdens Computex aangekondigde ASUS Transformer Book T300 Chi maakt gebruik van de op Broadwell-Y gebaseerde Core M processors.


De tablet van de T300 Chi is slechts 7,9mm dik.

14nm procedé: kleiner en zuiniger

Het belangrijkste nieuws bij Broadwell is natuurlijk de overstap naar een nieuw 14nm productie procedé. Vier Intel-fabrieken, waaronder één in Ierland, worden op dit moment gereed gemaakt voor massaproductie van 14nm wafers. Pas in de eerste helft van 2015 verwacht Intel op groot volume te kunnen produceren, maar werkende chips rollen al sinds enige tijd van de band, waardoor partijen als ASUS dus inmiddels al flink in de weer zijn met de ontwikkeling van op Broadwell gebaseerde producten.

Tijdens de presentatie die we vorig week van Intel kregen, maakte het bedrijf nog eens expliciet duidelijk dat de naam van het productieprocedé tegenwoordig geen relatie meer heeft tot de daadwerkelijke grootte van transistors. Feitelijk gaat het om het kleinste onderdeel van het product, niet per se om de transistors zelf. Dat geldt overigens voor alle chipfabrikanten. 14nm is de naam van de generatie, niet de daadwerkelijke afmeting van de transistors. Je kunt dus niet zeggen dat de chips gebruikmaken van "14 nm transistors", maar wel van "14 nm generatie transistors". Het is een semantische fout die we de afgelopen jaren bij Hardware.Info ook geregeld gemaakt hebben, maar waar we de komende tijd meer op zullen letten.


Met ieder nieuw productieprocedé kunnen prestaties toenemen, neemt het stroomverbruik af en stijgt zodoende de efficiënte van processors.

Hoe het ook zij: net als bij voorgaande introducties naar een nieuwe productieprocedé zijn alle dimensies met circa een factor 0,7x afgenomen. Om een aantal voorbeelden te noemen: de afstand tussen twee vinnen van de transistors is afgenomen van 60nm naar 42nm (0,7x), de afstand tussen de twee gates van 90nm naar 70nm (0,78x) en de minimale afstand tussen metalen verbindingen van 80nm naar 52nm (0,65x).

Het maakt dat Intel met het nieuwe procedé voor dezelfde zaken opnieuw een veel kleine chipoppervlak nodig heeft. Een enkele SRAM-geheugencel, bestaande uit zes transistors, neemt in het bestaande 22nm procedé bijvoorbeeld 0,108 µm² in beslag, bij het 14nm procedé is het slechts 0,0588 µm².


Het 14nm procedé maakt gebruik van kleinere, tweede generatie FinFET transistors.


Een SRAM cell is dankzij het 14nm procedé bijna de helft kleiner dan in Intels 22nm procedé.

Intel geeft aan dat wanneer men de Haswell CPU-core ongewijzigd op het 14nm procedé zou fabriceren, deze slechts 51% van het bestaande chipoppervlak zou innemen. Met de optimalisaties die aan de core zijn toegevoegd, waarover meer op de volgende pagina, komt het nog altijd uit op 63%.

Een kleiner chipoppervlak betekent uiteraard dat er meer chips op één wafer passen en dus dat de productiekosten per chip lager uitvallen. Nu nemen de productiekosten per wafer echter per generatie toe: hoe kleiner de transistors, hoe groter de investeringen in onderzoek en machines om e.e.a. daadwerkelijk voor elkaar te krijgen. Intel geeft aan dat bij deze generatie de kosten per wafer harder zijn gegroeid dan voorheen, maar aangezien men tegelijkertijd een meer dan gebruikelijke beperking van chipoppervlak kon bewerkstelligen, is de totale kostenreductie per chip vergelijkbaar met de stappen die men bij vorige generaties maakte.

Het 14nm procedé maakt gebruik van een tweede generatie van Intels tri-gate FinFET transistors. Deze nieuwe transistors zijn, met Broadwell-Y en toekomstige SoC’s in het achterhoofd, speciaal geoptimaliseerd om goed te kunnen schakelen op zeer lage voltages.


De kosten voor wafers nemen bij 14nm meer dan gebruikelijk toe, maar doordat het gemiddelde oppervlakte per transistors juist meer dan gebruikelijk afneemt, is er ook bij dit procedé een gebruikelijke afname van de kosten per transistor.

Broadwell core: beperkte optimalisaties

Broadwell is een tick, wat betekent dat de CPU’s gebruikmaken van een nieuw productieprocedé, maar wel een al bestaande architectuur. Toch zijn er zowel bij de CPU- als GPU-cores van Broadwell verschillende optimalisaties doorgevoerd.

Intel geeft aan de IPC (Instructions per clock, ofwel het gemiddelde aantal instructies dat per klokslag wordt voltooid) bij Broadwell zo’n 5% hoger ligt dan bij Haswell. Op dezelfde klokfrequentie en met hetzelfde aantal cores zal een Broadwell CPU gemiddeld 5% sneller zijn dan een Haswell CPU. Dit is redelijk vergelijkbaar met wat we zagen bij eerdere ticks. Het is een bekend verhaal: wie puur op zoek is naar rauwe prestatiewinsten is bij ticks aan het verkeerde adres.

De 5% wordt bewerkstelligd door verschillende zaken, zoals een grotere out-of-order scheduler (waardoor een groter aantal instructies in geoptimaliseerde volgorde kan worden uitgevoerd), snellere verwerking van vermenigvuldigingen, betere voorspelling van geheugenadressen bij vertakkingen in software en andere kleine zaken. Verder krijgt Broadwell een handvol nieuwe instructies, voornamelijk om encryptie-algoritmes te versnellen. Het aantal nieuwe instructies is dusdanig beperkt, dat Intel er geen overkoepelende nieuwe naam aan geeft.


Een combinatie van verschillende kleine optimalisaties zorgt ervoor dat de IPC van Broadwell zo’n 5% hoger is dan bij Haswell.

Een belangrijk gegeven is dat Intel bij de Broadwell-generatie haar ontwerpers voor het eerst een 1:2-verhouding voor stroomverbruik versus prestaties heeft opgelegd. Dat betekent dat wanneer een verbetering aan de architectuur 1% meer stroom verbruikt, deze minimaal 2% betere prestaties oplevert. Of andersom: een verbetering die voor 1% betere prestaties zorgt, mag maximaal 0,5% meer stroom verbruiken.

Bij de afgelopen paar generaties werd een minimum verhouding van 1:1 aangehouden, het minimum dat nodig is om de efficiëntie (de prestaties per watt) te verbeteren. Vroeger, in de Pentium 4 tijd bijvoorbeeld, waren verhoudingen van in de richting van 10:1 zelfs nog toegestaan (10% meer stroomverbruik voor 1% betere prestaties).

Extra power gating (de mogelijkheid om niet gebruikte onderdelen helemaal uit te schakelen) en andere optimalisaties moeten er verder voor zorgen dat het Broadwell CPU-core ontwerp duidelijk efficiënter is dan dat van Haswell, nog bovenop de voordelen van de nieuwe, zuiniger transistors.

GPU

Ook de GPU in Broadwell is licht op de schop genomen. Waar de geïntegreerde GPU van de standaard Haswell-varianten 20 execution units aan boord heeft (verdeeld in twee zogenaamde slices van 10), is dat bij Broadwell opgevoerd tot 24 EU’s, onderverdeeld in drie slices van 8 EU’s. Buiten het feit dat 20% meer EU’s op zich natuurlijk al voor betere GPU-prestaties moet zorgen, zorgt de andere indeling er ook voor dat de GPU iets meer geschikt is voor het gelijktijdig uitvoeren van verschillende berekeningen.

De nieuwe GPU is compatible met DirectX 11.2, OpenGL 4.3 en OpenCL 2.0. De Quick Sync video encoder is naar verluidt verder versneld en ook kwalitatief beter gemaakt. Een H.265 (HEVC) decoder heeft de Broadwell GPU nog niet, maar Intel belooft een “hybride” decoder, die gedeeltelijk gebruikmaakt van de CPU en gedeeltelijk van GPGPU algoritmes.

Verder ondersteunen alle varianten van de GPU in Broadwell processors Ultra HD-schermen. Bij Haswell ontbreekt die ondersteuning bij de Y- en U-varianten.


Broadwell-Y’s GPU bevat 24 execution units, verdeeld in drie zogenaamde slices.

De Broadwell-Y chip: Focus op tablets

De chip waar Intel vorige week meer informatie over heeft vrijgegeven is de Broadwell-variant die gebruikt zal worden voor de Core M chips, gericht op tablets. De interne codenaam hiervoor is zoals al geschreven Broadwell-Y. Broadwell-Y wordt net als zijn Haswell-voorloper een MCP ofwel multi-chip package. Een processor en een PCH-chip met chipset functionaliteit worden in één module gecombineerd.

De processor krijgt twee Broadwell cores, een GPU met 24 execution units, 4 MB L3-cache (2MB per core) en een verder nog niet gespecificeerde geheugencontroller (vermoedelijk dual-channel DDR3L). De chip meet 82 mm², minder dan de helft van de afmeting van de CPU gebruikt in de Haswell Y-varianten.

Een exacte TDP-waarde heeft Intel nog niet opgegeven, maar men geeft aan dat deze circa de helft bedraagt van de voorloper. De Haswell Y-varianten hebben een TDP van 11,5 watt en een gemiddeld verbruik van circa 9 watt. Op basis daarvan mogen we dus een verbruik van rond de 5 watt voor de nieuwe chips verwachten. Het idle-verbruik van de Broadwell-Y MCP is naar verluidt 60% lager dan dat van de voorloper.

De CPU heeft een tweede generatie geïntegreerde voltage controller en een geavanceerder Turbo-modus. Allereerst kunnen Broadwell-Y chips gedurende zeer korte tijd (milliseconden) verder Turbo’en dan hun voorlopers. Verder kunnen CPU en GPU cores ook op lagere klokfrequenties werken dan hun voorlopers, zij het virtueel. Bij de huidige CPU’s is de laagste klokfrequentie circa 1 GHz; op een lagere klokfrequentie gaan de chips juist minder efficiënt werken. Bij Broadwell-Y kan een lagere klokfrequentie (en dito stroomverbruik) gesimuleerd worden door de CPU en/of GPU een gedeelte van de tijd uit te schakelen. Er zijn verschillende verhoudingen mogelijk tussen tijd dat de cores zijn in- en uitgeschakeld.

Intel heeft verder de afmetingen flink teruggebracht. Waar de Haswell Y variant nog 40 bij 24 mm groot was, is dat bij Broadwell Y nog maar 30 bij 16,5 mm. Ook de hoogte van de chip is gereduceerd, één van de redenen waardoor dunnere tablets mogelijk zijn. Stak Haswell Y nog 1,5 mm boven de PCB uit, bij Broadwell Y is dat nog maar 1,04 mm.


Broadwell-Y (rechts) is een stuk kleiner dan Haswell-Y

Daarvoor gebruikt Intel een slimme truc: de normaal gesproken in de processor aanwezige spoelen (die nodig zijn voor de stroomvoorziening) zijn nu los gemaakt en hangen als het ware onder de CPU. In het moederbord waarop de CPU geplaatst moet worden moet op die plek een gat gemaakt worden, waar de CPU als het ware in valt. Deze technologie noemt Intel 3DL. De verdere reductie van de dikte heeft Intel bereikt door de die minder dik te maken.


De spoelen zijn verwerkt op een losse module die in een gat in de moederbord-PCB valt. Hierdoor wordt de CPU minder hoog.

De PCH-chip binnen de processor is net als bij Haswell Y geproduceerd middels het 32nm procedé, maar is wel een nieuw ontwerp, waarbij het stroomverbruik verder is gereduceerd tot "een paar honderd milliwatt". Actief zou de PCH zo’n 20% zuiniger moeten zijn dan z’n voorloper, idle zelfs zo’n 25%.

Conclusie

Met de op de Broadwell-Y chip gebaseerd Core M processors opent Intel de weg naar zeer dunne en passief gekoelde tablets en hybride notebooks met een prestatieniveau dat minimaal op het niveau van de huidige Haswell-Y processors ligt. De op Computex getoonde ASUS Transformer T300 Chi en Intel Llama Mountain apparaten geven een mooie blik in de toekomst: volwaardige PC-technologie in een apparaat dat zich qua dikte kan meten met een iPad Air. Het zou wel eens dé doorbraak van 2-in-1 apparaten kunnen zijn.

De Y-klasse processors blijkt de primaire focus voor Intel bij de Broadwell-generatie, al zullen de nieuwe cores en het nieuwe productieprocedé op een later moment ook voor conventionele laptop-, desktop- en serverprocessors gebruikt worden. Zoals gebruikelijk bij een tick hoeven we qua presentaties geen wonderen te verwachten: op dezelfde klokfrequentie is Broadwell zo’n 5% sneller dan Haswell volgens de ontwerpers. Maar waar Broadwell in het tablet-landschap voor dunne en passief gekoelde modellen met Core-prestatieniveau zorgt, zal de nieuwe generatie naar verwachting ook in de andere marktgebieden voor een aanzienlijke stijging van de prestaties per watt gaan zorgen.

Hoewel Intel er nog geen concrete mededelingen over heeft gedaan – wellicht zal dat tijdens de Intel keynote op de IFA-beurs veranderen – gaan we ervan uit dat de eerste Core M apparaten rond de jaarwisseling op de markt gaan komen. Wanneer er Broadwell gebaseerde Core i3/i5/i7 processors voor laptops en desktops komen blijft nog gissen, maar dat zal vermoedelijk pas halverwege volgend jaar zijn, met wellicht een aankondiging op Computex 2015 in juni.

Het belangrijkste nieuws vanuit technologisch oogpunt is dat de 14nm generatie CPU’s er nu echt aan zitten te komen. Dat het wat later is dan op basis van oudere Intel roadmaps te verwachten was, zien we graag door de vingers gezien het feit hoeveel moeite andere chipfabrikanten als TSMC en Global Foundries hebben om een 20-22 nm procedé werkend te krijgen. Vooralsnog lijkt het er op dat Intel de voorsprong van minimaal één à twee procedéstappen (en de bijbehorende kostenvoordelen) op haar concurrenten weet vast te houden.

Uiteraard moeten wij ook terugdenken aan de tijd dat Intel naast de Pentium-processorlijn de op een geheel andere architectuur gebaseerde Pentium M processors introduceerde, die uiteindelijk ten grondslag lagen aan de huidige Core-architectuur. Zou de geschiedenis zich gaan herhalen?

Intels LLama Mountain referentie tablet, zoals getoond tijdens Computex.

0
*