Intel Core i7 Uitgediept

47 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Terug van weggeweest
  3. 3. Aan of uit?
  4. 4. Gaming
  5. 5. Resultaten
  6. 6. Conclusie
  7. 7. Besproken producten
  8. 8. Reacties

Inleiding

Begin november introduceerde Intel officieel de Core i7 processor en sinds 17 november zijn de felbegeerde chips daadwerkelijk te koop. Eerder deden we al uitgebreid verslag van de mogelijkheden en prestaties van de nieuwe processor. Voor het Hardware.Info testlab echter geen reden om te stoppen met testen; er blijkt nog voldoende te onderzoeken.

Met de introductie van de Core 2 Duo eind 2006 en later de Core 2 Quad heeft Intel de afgelopen twee jaar een flinke voorsprong op AMD opgebouwd. Wie kost-wat-kost op zoek was naar een zo snel mogelijke basis voor een nieuwe PC had de afgelopen tijd eigenlijk maar één keuze. Gelukkig blijkt Intel slim genoeg om in een succesvolle periode niet op haar lauweren te gaan rusten. Keurig volgens het zelf opgelegde Tick-Tock dogma introduceerde het eind 2007 een nieuw 45 nm productieprocedé en eind 2008 een volledig nieuwe architectuur. Onze test (klik hier om deze terug te lezen) bewees dat Intel zichzelf opnieuw heeft overtroffen: dankzij de zogenaamde Nehalem architectuur wisten de nieuwe Core i7 processors in vrijwel al onze benchmarks nieuwe records te vestigen.

Techniek

Intel heeft uiteenlopende verbeteringen in haar architectuur aangebracht om ervoor te zorgen dat de Core i7 processors op dezelfde klokfrequentie veel beter presteren dan hun voorlopers. We zullen de belangrijkste vernieuwingen nog eens kort de revue laten passeren. Allereerst zijn de Core i7's in tegenstelling tot de Core 2 Quad CPU's zogenaamd native quad-core, wat betekent dat de vier rekenkernen daadwerkelijk op één chip zijn ondergebracht. Dat betekent dat de verschillende cores beter kunnen samenwxerken met instructies die van invloed zijn op dezelfde of verwante. Om onderlinge communicatie tussen de cores te verbeteren heeft Intel ook haar cache-architectuur op de schop genomen; binnen Core i7 hebben alle cores 512 kB eigen cache en daarnaast nog eens gedeelde L3-cache. De terugkeer van de HyperThreading technologie uit het Pentium 4 tijdperk zorgt ervoor dat iedere core (semi) tegelijkertijd kan werken aan instructies van twee programmathreads.

Verreweg het grootste gedeelte van de prestatiewinst is te verklaren door het feit dat Intel de geheugencontroller heeft verplaatst van de moederbord chipset naar de processor. Dit zorgt ervoor dat de rekenkernen met een veel lagere vertraging (latency) data uit het geheugen kunnen ophalen of juist data kunnen wegschrijven. Om ook de doorvoersnelheid flink te verhogen heeft Intel direct de overstap naar triple-channel geheugen gemaakt; er worden dus drie modules tegelijkertijd aangesproken, met als resultaat een 50% hogere doorvoersnelheid dan bij tot nu toe gebruikelijke dual-channel systemen.

Een speciale turbo modus zorgt er verder voor één of meerdere cores bij single-threaded applicaties worden uitgeschakeld en de overgebleven cores daarna direct op hogere snelheid gaan werken. De toevoeging van een aantal nieuwe SSE4.2 instructies maakt de lijst met aan het oppervlak direct zichtbare verbeteringen compleet. Intern binnen de architectuur zijn er echter nog voldoende extra optimalisaties die elk een gedeelte van de prestatiewinst voor hun rekening nemen. De belangrijkste hebben we eerder al beschreven in een artikel dat je hier kunt teruglezen.

Terug van weggeweest

Een aspect dat we in onze uitgebreide online Core i7 review niet uitvoerig hebben onderzocht is HyperThreading. Deze technologie stamt zoals gezegd uit het Pentium 4 tijdperk, maar was bij de Core 2 processors niet meer aanwezig. Dat HyperThreading nu weer terug van weggeweest is, mag niet toevallig heten. De Netburst-architectuur van de Pentium 4 was een product van Intels Amerikaanse processor ontwerpteam. Tegelijkertijd had men in Israel een tweede team aan het werk gezet om een energiezuinige architectuur voor notebookprocessors te ontwerpen. Toen deze in maart 2003 in de vorm van de Pentium M op de markt kwam, werd al direct duidelijk dat de gekozen weg ook voor deskops en servers uiteindelijk voor betere resultaten zou zorgen dan de toekomstplannen van de Pentium 4 ontwerpers in Amerika. Afdeling Israel kreeg de opdracht om hun levenswerk verder door te ontwikkelen en geschikt te maken voor al marktgebieden waar Intel vertegenwoordigd is. Zodoende kwam men eind 2006 als opvolger van de Pentium M en Core Duo met de Core architectuur op de proppen, de basis voor de Core 2 Duo, Core 2 Quad en Intels huidige Xeon-processors.

Het ontwerpteam in Amerika op hun beurt mocht afscheid nemen van alle processors die ze volgens hun eigen roadmap in de planning hadden staan, kreeg vermoedelijk een paar weken vakantie om deze klap te verwerken en daarna de opdracht op basis van het werk van hun Israelische collega's te gaan werken aan de Nehalem architectuur als opvolger van de Core architectuur. Geen wonder dat we in Nehalem een aantal van de slimmere ideeën van de Pentium 4 grondleggers terugvinden, waarvan HyperThreading het beste voorbeeld is. Om het geschiedenis verhaal nog even compleet te maken: team Israel werkt alweer enige jaren met man en macht aan de architectuur die in 2010 Nehalem zal gaan opvolgen.

Schizofreen

HyperThreading is zoals gezegd een technologie waardoor cores zich tenopzichte van de software kunnen voordoen als zijnde twee cores. Een quad-core Core i7 wordt zodoende in Windows op andere besturingssystemen herkend als zijnde acht processor. Iedere core kan zodoende tegelijkertijd instructies van de twee verschillende programmathreads in behandeling nemen. HyperThreading zorgt er niet voor dat er meer rekenkracht binnen een processorcore aanwezig is, maar wel dat de aanwezige rekenkracht beter benut kan worden. Dat de technologie een meer dan subtiel verschil kan maken is simpel te begrijpen als we de werking van een processorcore wat nader inspecteren.

Bekijken we opbouw van de cores van Intels Core i7 dan blijkt dat in iedere core een zestal daadwerkelijke rekeneenheden (execution units in jargon) verstopt zitten. Deze eenheden kunnen allen parallel verschillende instructies uitvoeren, maar hebben elk hun eigen vaardigheden. Zo zijn drie van de zes rekeneenheden puur geschikt voor instructies die met het transporteren van data van en naar het geheugen van doen hebben. Drie eenheden kunnen daadwerkelijk berekeningen uitvoeren, maar ook dan nog zijn er verschillen. Elk van deze drie is geheel geschikt voor integer berekeningen (gehele getallen), maar zodra er instructies met floating point getallen zijn, kan slechts één eenheid vermenigvuldigen en delen, één eenheid optellen en aftrekken en één eenheid shuffle- en branch-instructies uitvoeren.  Vergelijk het met de verschillende stukken van een schaakspel die elk hun eigen expertise hebben en niet de werking van een ander stuk kunnen overnemen.

Om een processor optimaal te laten presteren, zou eigenlijk op ieder moment elk van de zes execution units met een zinnige berekening bezig moeten zijn. Dat is echter een utopie; geen enkel programma is zo gemaakt dat op ieder moment er drie geheugeninstructie en drie integer of juist drie compleet verschillende floatingpoint instructies voorhanden zijn. Door het omhusselen van de volgorde waarin instructies worden uitgevoerd doet de processor er zelf al alles aan om de verschillende execution units het grootste gedeelte van de tijd zinnig werk te laten uitvoeren. Maar als er domweg geen geschikte instructies voorhanden zijn, komt het in de praktijk maar wat vaak voor dat één of meerdere rekeneenheden uit hun spreekwoordelijke neus aan het eten zijn.

Hier komt HyperThreading om de hoek kijken; door tegelijkertijd de instructies van twee programmathreads in behandeling te nemen is de kans groter dat daadwerkelijk alle rekeneenheden aan het werk gehouden kunnen worden. Door de verschillende eenheden op meer momenten instructies te kunnen toevoeren wordt het aantal instructies dat een processorcore gemiddeld per kloktik kan uitvoeren (IPC in jargon: instruction per clock) vergroot. In normale mensentaal; de aanwezige rekenkracht wordt beter benut en de algehele prestaties zullen stijgen.


Dankzij HyperThreading kunnen de execution units binnen een processor instructie van twee programmathreads tegelijk verwerken. (Afbeelding afkomstig van Wikipedia)

Aan of uit?

HyperThreading deed bij de Pentium 4 processors al wonderen, maar werd ook door menigeen in de BIOS uitgeschakeld omdat de technologie in sommige gevallen ook juist voor lagere prestaties zorgde. Om te achterhalen op dat bij Core i7 ook het geval is, hebben we op onze complete processorbenchmark set een tweede keer op de Core i7 920 uitgevoerd, maar nu met HyperThreading uitgeschakeld. De resultaten vind je in onderstaande tabel. Gemiddeld blijkt het inschakelen van HyperThreading een prestatiewinst van 9,3% te bewerkstelligen bij onze benchmarks. Er zijn een paar zeer positieve uitschieters: de 3DMark Vantage CPU-test stijgt maar liefst 32,6%, PovRay 3D-rendering gaat 24,8% sneller, DivX 6.8 encoding gaat 19,7% sneller en Cinebench 10 produceert een 15,4 hogere score. Er zijn echter ook voldoende applicaties waar HyperThreading totaal geen nut heeft, voornamelijk omdat deze applicaties (bijna) niet multi-threaded zijn. Zo zijn de verschillen in score bij onze drie gamebenchmarks miniscuul en ook 7Zip compressie duurt exact even lang.

Onze test bewijst verder ook dat HyperThreading zeker niet altijd zaligmakend is. In een aantal gevallen (ondermeer bij twee games) is er een miniem prestatieverlies en bij Windows Media 9 encoding nemen we prestaties zelfs een duikeling van 27,2%.

Desalniettemin mogen we concluderen dat HyperThreading een prima toevoeging voor Nehalem is. Zeker met in het achterhoofd de gedachte dat in de toekomst nog veel meer software multi-threaded zal zijn dan nu het geval is, mogen we concluderen dat HyperThreading een flinke bijdrage levert aan de prestatiewinst bij Core i7.

Core i7 920 HyperThreading Geen HyperThreading Verschil
3DMark Vantage - CPU Score 17263 13022 32,6%
Unreal Tournament 3 - Serenity - 1280x1024 (fps) 120 123 -2,4%
World in Conflict - 1280x1024 - Medium (fps) 76 77 -1,3%
Crysis Warhead - Airfield - 1024x768 Low (fps) 74 73 1,4%
DivX 6.8 (SSE4) / Procoder encoding - 60 sec. 1080p (sec.) 61 73 19,7%
H.264 / Procoder encoding - 60 sec. 1080p (sec.) 128 142 10,9%
Windows Media 9 encoding - 60 sec. 1080p (sec.) 416 303 -27,2%
60 min. WAVE naar MP3 (4x LAME 3.97) (sec.) 44 43 -2,3%
Cinebench 10 16244 14077 15,4%
PovRay 3.7b29 - Chess2 1024x768 (sec.) 42,8 53,4 24,8%
7Zip - 350 MB TIFF's (sec.) 69 69 0,0%
Adobe Photoshop CS3 - Retouch Artists benchmark (sec.) 18 20 11,1%
Microsoft Excel 2007 - Big Number Crunch (sec.) 4,9 5,8 18,4%
Microsoft Excel 2007 - Black Scholes (sec.) 16,1 20,7 28,6%
Gemiddeld 9,3%

Gaming

Één van de meest aanhoudende geruchten die vóór de introductie van Core i7 de ronde deed, was dat de nieuwe architectuur geen voordelen voor gamers zou bieden. Met onze oorspronkelijk test bewezen we al dat dit zeker niet het geval is. In onze game benchmarks presteerden de Core i7 chips duidelijk beter dan hun voorlopers.

Wij voeren bij processortests de game benchmarks echter op zeer lage resolutie met beperkte effecten uit, om op die manier te voorkomen dat de videokaart enige bottleneck vormt en je zodoende daadwerkelijk prestatieverschillen tussen processors aan het licht kunt brengen. Een terechte kritiek van veel Hardware.Info lezers was echter dat iemand die een Core i7 systeem koopt niet gaat gamen in 1024x768 met slechts beperkte effecten en dat zodoende de benchmarks dan wel aantonen wat het verschil tussen de oude en de nieuwe architectuur is, maar niet welke prestaties je als gamer in de praktijk mag verwachten. Reden voor ons om de testsystemen wat extra overuren te laten draaien...

Multi GPU

Waar je bij game benchmarks al snel tegenaanloopt is dat de videokaart veel vaker de bottleneck voor de prestaties vormt dan de processor. Wat we altijd al prediken bleek opnieuw uit onze benchmarks; wanneer je slechts een enkele videokaart gebruikt, kun je veel gevallen net zo goed een Core 2 Duo E8600 achtige CPU als een Core i7 gebruiken. De vraag is echter wat er gebeurt wanneer je van twee of meer videokaarten gebruik gaat maken en de processor ineens wél de bottleneck vormt.

Om een en ander in kaart te brengen hebben we een flinke kruistest op poten gezet. We gingen aan de slag met een viertal benchmarks; allereerste 3DMark Vantage en daarnaast drie games - Far Cry 2, Crysis Warhead en World in Conflict - met instellingen zoals je die als liefhebber en koper van een high-end PC wél zou gebruiken: 1920x1200 met 4x AA, 16x AF en de effectinstellingen op High. We hebben de benchmarks uitgevoerd op combinaties van vijf processors (Core i7 965 en 920, Core 2 Quad QX9650 en Q8200 en Core 2 Duo E8600) en zeven verschillende videokaart combinaties: 1/2/3 keer GeForce GTX 280, 1/2 keer Radeon HD 4870 en 1/2 keer Radeon HD 4870 X2. Voor de Core i7's gebruikten MSI's Eclipse moederbord en de Core 2 processors mochten hun kunsten vertonen op een Gigabyte X48T-DQ6 (Crossfire) of een MSI P7N2 Diamond (SLI).

Resultaten

In onderstaande tabellen vind je alle resultaten en om het intepreteren van een hele berg cijfers makkelijker te maken hebben we in de laatste twee kolommen het percentuele verschil tussen de scores van de Core i7 965 en enerzijds de Core 2 Extreme QX9650 en anderzijds de Core 2 Duo E8600 geplaatst.

Kijken we naar de resultaten bij een enkele videokaat (Radeon HD 4870 of GeForce GTX 280) dan blijken er bij de games inderdaad geen schokkende verschillen te bestaan tussen de bestaande Core 2 processor en Intels nieuwe vlaggenschip. Alleen 3DMark Vantage schaalt als benchmark altijd bij een processor of videokaart upgrade.

Hoe anders is dat aan het andere kant van het spectrum, wanneer we kijken naar de resultaten bij Quad-Crossfire (2x Radeon HD 4870 X2) of Triple-SLI (3x GeForce GTX 280)! Om met Quad-Crossfire te beginnen; in 3DMark Vantage en World in Conflict is een Core i7 965 ruim twee keer sneller dan een E8600. In FarCry 2 is het verschil een duizelingwekkende 52,8%. Ofwel; met een E8600 kun je overduidelijk niet de volledige kracht van twee van deze kaarten benutten. Zelfs het verschil met Intels voormalige topmodel, de Core 2 Extreme QX9650 is schokkend: 81% in World in Conflict, 41% in 3DMark Vantage en ruim 30% in FarCry 2!

Bij Triple SLI zijn de resultaten niet minder schokkend. Vergelijken we de Core i7 965 en met de Core 2 Duo E8600 dan zien we bij FarCry 2 en 3DMark Vantage een ruime verdubbeling van de scores. Maar ook in World in Conflict en Crysis Warhead zet de nieuwe processors ruim 74% hogere framerates neer. En zelfs in vergelijk in met de QX9650 is het resultaat zo klaar als een klontje; in alle gevallen is de Core i7 minstens de helft sneller.

FarCry 2 - 1920x1200 4x AA 16x AF High Core i7 965 Core i7 920 Core 2 Quad QX9650 Core 2 Quad Q8200 Core 2 Duo E8600 i7 965 vx QX9650 i7 965 vs E8600
2x Radeon HD 4870 X2 84,3 67,6 64,6 51,4 55,2 30,5% 52,8%
1x Radeon HD 4870 X2 72,6 68,0 64,1 50,1 54,3 13,3% 33,7%
2x Radeon HD 4870 56,5 52,9 44,5 39,0 46,6 26,9% 21,2%
1x Radeon HD 4870 31,1 27,3 26,7 26,7 30,7 16,5% 1,4%
3x GeForce GTX 280 118,5 79,3 72,2 67,1 58,3 64,1% 103,0%
2x GeForce GTX 280 89,6 79,9 78,2 66,8 58,1 14,5% 54,2%
1x GeForce GTX 280 54,6 52,6 61,7 59,7 55,1 -11,5% -0,8%
Crysis Warhead - Airfield - 1920x1200 4x AA 16x AF High Core i7 965 Core i7 920 Core 2 Quad QX9650 Core 2 Quad Q8200 Core 2 Duo E8600 i7 965 vx QX9650 i7 965 vs E8600
2x Radeon HD 4870 X2 33 30 29 24 28 13,8% 17,9%
1x Radeon HD 4870 X2 32 31 30 25 29 6,7% 10,3%
2x Radeon HD 4870 16 15 12 11 12 33,3% 33,3%
1x Radeon HD 4870 10 11 11 9 11 -9,1% -9,1%
3x GeForce GTX 280 54 47 33 29 31 63,6% 74,2%
2x GeForce GTX 280 53 48 31 29 31 71,0% 71,0%
1x GeForce GTX 280 31 31 26 25 27 19,2% 14,8%
World in Conflict - 1920x1200 4x AA 16x AF High Core i7 965 Core i7 920 Core 2 Quad QX9650 Core 2 Quad Q8200 Core 2 Duo E8600 i7 965 vx QX9650 i7 965 vs E8600
2x Radeon HD 4870 X2 76 48 42 34 35 81,0% 117,1%
1x Radeon HD 4870 X2 62 47 41 32 35 51,2% 77,1%
2x Radeon HD 4870 52 47 42 32 35 23,8% 48,6%
1x Radeon HD 4870 33 32 33 29 30 0,0% 10,0%
3x GeForce GTX 280 75 60 48 43 43 56,3% 74,4%
2x GeForce GTX 280 74 62 47 42 40 57,4% 85,0%
1x GeForce GTX 280 41 43 38 36 36 7,9% 13,9%
3DMark Vantage Core i7 965 Core i7 920 Core 2 Quad QX9650 Core 2 Quad Q8200 Core 2 Duo E8600 i7 965 vx QX9650 i7 965 vs E8600
2x Radeon HD 4870 X2 22591 19578 16015 14569 10802 41,1% 109,1%
1x Radeon HD 4870 X2 13295 12953 12353 10035 9161 7,6% 45,1%
2x Radeon HD 4870 13226 12579 13168 10285 8497 0,4% 55,7%
1x Radeon HD 4870 9908 9614 9204 8628 7393 7,6% 34,0%
3x GeForce GTX 280 23826 18355 15528 13487 10565 53,4% 125,5%
2x GeForce GTX 280 21105 18728 15349 12908 10563 37,5% 99,8%
1x GeForce GTX 280 13318 12752 11460 10387 8715 16,2% 52,8%

Conclusie

Onze extra tests leveren twee interessante conclusies op. Allereerst dat HyperThreading een duidelijk positieve invloed op de prestaties van Core i7 heeft: gemiddeld komen we op 9,3%, met uitschieters tot boven de 30%! Onze andere test bewijst dat, wanneer je gebruik wil maken van twee of drie videokaarten, je eigenlijk niet om Core i7 heen kunt. Zelfs met een Core 2 Quad QX9650 worden Crossfire en SLI configuraties overduidelijk beperkt in hun prestaties. Core i7 neemt de processor bottleneck weg en zorgt ervoor dat je de volledige 3D-power van de videokaarten kunt benutten. En dat betekent prestatiewinsten van vele tientallen procenten!


Besproken producten

Vergelijk alle producten

Vergelijk  

Product

Prijs

Intel Core i7 920 Boxed

Intel Core i7 920 Boxed

  • Socket 1366
  • 2.67 GHz
  • 4 cores
  • 130 W
  • 45 nm
Niet verkrijgbaar
Intel Core i7 940

Intel Core i7 940

  • Socket 1366
  • 2.93 GHz
  • 4 cores
  • 130 W
  • 45 nm
Niet verkrijgbaar
Intel Core i7 965 Extreme Edition

Intel Core i7 965 Extreme Edition

  • Socket 1366
  • 3.2 GHz
  • 4 cores
  • 130 W
  • 45 nm
Niet verkrijgbaar
0
*