Intel Xeon X5570 'Nehalem' test

18 reacties
13 besproken producten
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Native quad-core
  3. 3. HyperThreading
  4. 4. Geïntegreerde geheugencontroller
  5. 5. QuickPath
  6. 6. Power controller
  7. 7. Turbo modus
  8. 8. Diepere duik in de architectuur
  9. 9. Branch prediction en execution units
  10. 10. Geheugenmanagement
  11. 11. Virtualisatie
  12. 12. Modellen
  13. 13. ASUS platform
  14. 14. Benchmarks
  15. 15. Benchmarks: HPC
  16. 16. Benchmarks: HPC (2)
  17. 17. Bechmarks: 3D-rendering
  18. 18. Benchmarks: MySQL
  19. 19. Benchmarks: Geheugen
  20. 20. Stroomverbruik
  21. 21. Performance per Watt
  22. 22. Toekomst
  23. 23. Conclusie
  24. 13 besproken producten
  25. 18 reacties

Geheugenmanagement

Ook op het vlak van geheugenmanagement zijn er flinke verbeteringen. Een enigszins verborgen verbetering ten opzichte van Penryn, die we kunnen zien in het eerder getoonde blokschema is een tweede TLB (Translation Lookaside Buffer). Zo'n TLB wordt gebruikt om eenvoudig een omrekening te kunnen maken tussen de geheugenadressen waar een programma mee werkt, naar daadwerkelijk fysieke adressen in het RAM-geheugen van de PC. De tweede TLB is nieuw in Nehalem. Deze is weliswaar iets langzamer, maar ook een stuk groter dan de primaire TLB. Wanneer een benodigd geheugenadres niet in de standaard TLB aanwezig is, is de kans bij Nehalem aanzienlijk dat de CPU dit wel snel in de tweede TLB kan opvragen. Zodoende hoeft in minder gevallen een tijdrovende en daarmee prestaties beperkende berekening te worden uitgevoerd.

De tweede verbetering op het vlak van geheugenmanagement is wat complexer. Binnen x86 zijn er twee manieren om meerdere stukken data uit het geheugen op te vragen, aligned en non aligned. Aligned wil in dit geval zeggen dat de gewenste data fysiek achter elkaar in het geheugen terug te vinden is. 

Wanneer de compiler 100% zeker weet dat dit bij een bepaalde operatie altijd het geval is, kan er gebruik gemaakt worden van aligned load-operaties. Wanneer die zekerheid er niet is, moet er worden gekozen voor de unaligned variant, die een stuk langer duurt en daarna implicaties heeft op de prestaties. Helaas nemen deze unaligned functies ook meer tijd in beslag wanneer de data uiteindelijk toch in de juiste volgorde in het geheugen blijkt te staan. Dát is bij Nehalem verleden tijd. Het gebruik van een unaligned instructie op data die toch aligned is, duurt exact even lang als wanneer er van een aligned instructie gebruik wordt gemaakt. Deze potentiële bottleneck is dus helemaal weggenomen. Ondermeer de nieuwste Intel compilers houden hier nu al rekening mee voor Nehalem.

Prefetchers

Een van de eigenschappen die ervoor zorgden dat de op Core-architectuur gebaseerde Xeon processors veel sneller waren dan hun voorlopers, is de implementatie van hardware prefetchers. Deze voorspellen welke data de processor in de nabije toekomst nodig heeft en kopiëren die alvast van het relatief langzame RAM-geheugen naar het cache geheugen van de processor. In sommige gevallen wisten hardware prefetchers op zichzelf al zo'n 20 tot 30 procent prestatieverbetering te bewerkstelligen bij server workloads ten opzichte van de voorgaande Xeon generatie. 

Een nadeel van de hardware prefetchers is dat ze bij veel software telkens de mist in gaan door steeds de verkeerde data naar de cache halen. In dergelijke gevallen hebben ze juist een negatieve invloed op de prestaties. Hoewel het om uitzonderingsgevallen gaat, is er juist bij server toepassingen een aantal applicaties aan te wijzen waar de technologie roet in het eten gooit. Vandaar dat veel systeembeheerders bij hun servers de hardware prefetching min of meer gedwongen uitzetten. Met als onvermijdelijk gevolg dat potentiële prestatiewinst gemist wordt bij software waar de techniek wél goed werkt.

Ook hier heeft Intel wat op bedacht. De vernieuwde prefetchers in de Nehalem architectuur controleren de hele tijd hoe goed de resultaten zijn die ze afleveren. Wanneer blijkt dat ze het bij een bepaalde programmathread continu mis hebben, wordt de werking van de prefetchers op een lager pitje gezet. Ofwel, de prefetchers zijn zelfregulerend en zetten zichzelf uit wanneer ze slecht werk afleveren. Op die manier wordt het potentieel van flinke prestatieverbeteringen behouden, terwijl het risico op een beperking van de prestaties aanzienlijk beperkt is.


13 besproken producten

Vergelijk   Product Prijs
Asus Z8NA-D6

Asus Z8NA-D6

  • ATX
  • Socket 1366
  • Intel 5500
  • DDR3
Niet verkrijgbaar
Intel Xeon E5502 Boxed

Intel Xeon E5502 Boxed

  • Socket 1366
  • 1.86 GHz
  • 2 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5504 Boxed

Intel Xeon E5504 Boxed

  • Socket 1366
  • 2 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5506 Boxed

Intel Xeon E5506 Boxed

  • Socket 1366
  • 2.13 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5520 Boxed

Intel Xeon E5520 Boxed

  • Socket 1366
  • 2.26 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5530 Boxed

Intel Xeon E5530 Boxed

  • Socket 1366
  • 2.4 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E5540 Boxed

Intel Xeon E5540 Boxed

  • Socket 1366
  • 2.53 GHz
  • 4 cores
  • 80 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon L5506 Boxed

Intel Xeon L5506 Boxed

  • Socket 1366
  • 2.13 GHz
  • 4 cores
  • 60 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon L5520 Boxed

Intel Xeon L5520 Boxed

  • Socket 1366
  • 2.26 GHz
  • 4 cores
  • 60 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon W5580

Intel Xeon W5580

  • Socket 1366
  • 3.2 GHz
  • 4 cores
  • 130 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon X5550 Boxed

Intel Xeon X5550 Boxed

  • Socket 1366
  • 2.66 GHz
  • 4 cores
  • 95 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon X5560 Boxed

Intel Xeon X5560 Boxed

  • Socket 1366
  • 2.8 GHz
  • 4 cores
  • 95 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon X5570

Intel Xeon X5570

  • Socket 1366
  • 2.93 GHz
  • 4 cores
  • 95 W
  • 45 nm
Niet verkrijgbaar
0
*