Intel Xeon X5570 'Nehalem' test

18 reacties
13 besproken producten
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Native quad-core
  3. 3. HyperThreading
  4. 4. Geïntegreerde geheugencontroller
  5. 5. QuickPath
  6. 6. Power controller
  7. 7. Turbo modus
  8. 8. Diepere duik in de architectuur
  9. 9. Branch prediction en execution units
  10. 10. Geheugenmanagement
  11. 11. Virtualisatie
  12. 12. Modellen
  13. 13. ASUS platform
  14. 14. Benchmarks
  15. 15. Benchmarks: HPC
  16. 16. Benchmarks: HPC (2)
  17. 17. Bechmarks: 3D-rendering
  18. 18. Benchmarks: MySQL
  19. 19. Benchmarks: Geheugen
  20. 20. Stroomverbruik
  21. 21. Performance per Watt
  22. 22. Toekomst
  23. 23. Conclusie
  24. 13 besproken producten
  25. 18 reacties

Diepere duik in de architectuur

Tot zover de meest in het oog springende vernieuwingen in de Nehalem gebaseerde Xeon 5500 processors. Om de dieper verscholen verschillen tussen Penryn en Nehalem boven water te krijgen, werpen we een blik op het blokdiagram van de nieuwe architectuur. Het blok linksboven zorgt voor het ophalen, queuen en decoderen van alle binnenkomende instructies. De Rename/Allocate en Reservation Station blokken daaronder passen de volgorde van de instructies daarna zo aan, dat deze op een zo efficiënt mogelijke volgorde kunnen worden uitgevoerd. De daadwerkelijke berekeningen worden uitgevoerd door de execution units. Zoals op het schema te zien, is de weg van het bovenste blok tot en met het reservation station zogenaamd 4-wide, wat betekent dat er telkens vier instructies per klokslag doorgevoerd kunnen worden. Naar de execution units kunnen zelfs zes instructies per klokslag worden doorgestuurd, wat één van de eerste architecturale verbeteringen ten opzichte van Penryn is. Hier komen we later op terug. 

In het blokschema zien we verder dat de instructie fetchers zijn verbonden met 32 kB L1 instructiecache en verbonden aan de executions units zien we juist 32 kB L1 datacache. Beide caches staan weer in verbinding met 256 kB L2-cache die iedere core exclusief tot zijn beschikking heeft. Die L2-cache dient weer als buffer voor de onder alles cores gedeelde L3-cache. 


Het blokschema van de pipeline van de Nehalem chip.

Slimmer omgaan met instructies

Een van de nieuwe eigenschappen van de Core architectuur was de komst van macrofusion, het samensmelten van twee of meer x86 instructies tot één complexere instructie, waardoor deze in één klap kunnen worden uitgevoerd. Zo kan de core architectuur bijvoorbeeld een compare en branch instructie laten samensmelten, zonder dat de programmeur of compiler daar iets voor hoeft te doen. Het is bewezen dat dit in veel gevallen voor een aardige prestatiewinst kan zorgen.

Er kleefde één groot nadeel aan de macrofusion in de Core architectuur van de bestaande Intel Xeon processors: deze blijkt alleen maar te werken als de processor in 32-bit modus werkt. Zodra de overstap gemaakt wordt naar een 64-bit OS - eerder regel dan uitzondering in de server wereld - werkt sommige software op bestaande Intel processors ineens een aantal procenten langzamer. Bij de Nehalem architectuur werkt de macrofusion echter ook probleemloos in 64-bit modus.

Een andere flinke verbetering ten opzichte van de Core architectuur zit hem in de zogenaamde Loop Stream Detector. Ook dit is een technologie die bij de Core architectuur voor het eerst werd geïntroduceerd. De courante Intel processors kunnen loops in programmacode van maximaal 18 instructies herkennen. Zodra zo'n loop is gedetecteerd, worden de instructies niet telkens opnieuw uit de cache of geheugen opgehaald, maar worden ze direct van een loop buffer aan de decoder doorgevoerd, zoals te zien in onderstaande afbeelding.


De loop stream detector van de huidige generatie Xeons.

Bij Nehalem zit die loop detector een stuk slimmer in elkaar, zoals te zien in de tweede afbeelding. Hij heeft immers een plek áchter de instructiedecoder gekregen. Loops worden zodoende nu herkend op micro-op niveau. Dat betekent dat de instructies niet telkens opnieuw hoeven te worden gedecodeerd wanneer een processor met een programmaloop bezig is, wat heel wat overhead weghaalt en daardoor voor een aardige prestatiewinst kan zorgen. Daarnaast herkent de nieuwe loop detector series tot maximaal 28 micro-ops. Aangezien in de praktijk in de meeste gevallen iedere x86-instructie (macro-op) wordt omgezet naar één micro-op, mag je met een schuin oog dit getal vergelijken met het bovengenoemde aantal van de Core architectuur. Ofwel, de nieuwe loop detecter haalt niet alleen een extra stuk overhead weg, maar werkt ook met langere stukken code. Opnieuw werkt deze optimalisatie onafhankelijk van de compiler.


De loop stream detector van de Nehalem architectuur zit verder in de pipeline.


13 besproken producten

Vergelijk   Product Prijs
Asus Z8NA-D6

Asus Z8NA-D6

  • ATX
  • Socket 1366
  • Intel 5500
  • DDR3
Niet verkrijgbaar
Intel Xeon E5502 Boxed

Intel Xeon E5502 Boxed

  • Socket 1366
  • 1.86 GHz
  • 2 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5504 Boxed

Intel Xeon E5504 Boxed

  • Socket 1366
  • 2 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5506 Boxed

Intel Xeon E5506 Boxed

  • Socket 1366
  • 2.13 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5520 Boxed

Intel Xeon E5520 Boxed

  • Socket 1366
  • 2.26 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5530 Boxed

Intel Xeon E5530 Boxed

  • Socket 1366
  • 2.4 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5540 Boxed

Intel Xeon E5540 Boxed

  • Socket 1366
  • 2.53 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon L5506 Boxed

Intel Xeon L5506 Boxed

  • Socket 1366
  • 2.13 GHz
  • 4 cores
  • 60 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon L5520 Boxed

Intel Xeon L5520 Boxed

  • Socket 1366
  • 2.26 GHz
  • 4 cores
  • 60 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon W5580

Intel Xeon W5580

  • Socket 1366
  • 3.2 GHz
  • 4 cores
  • 130 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon X5550 Boxed

Intel Xeon X5550 Boxed

  • Socket 1366
  • 2.66 GHz
  • 4 cores
  • 95 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon X5560 Boxed

Intel Xeon X5560 Boxed

  • Socket 1366
  • 2.8 GHz
  • 4 cores
  • 95 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon X5570

Intel Xeon X5570

  • Socket 1366
  • 2.93 GHz
  • 4 cores
  • 95 W
  • 45 nm
Niet verkrijgbaar
0
*