Achtergrond: nVidia GF100 GPU

14 reacties
14 besproken producten
Inhoudsopgave
  1. 1. Inleiding
  2. 2. GF100
  3. 3. Streaming Multiprocessors
  4. 4. DirectX 11 en Tesselation
  5. 5. Tesselation demo's
  6. 6. PhysX
  7. 7. GPGPU
  8. 8. 3D Vision Surround
  9. 9. Conclusie
  10. 14 besproken producten
  11. 14 reacties

Streaming Multiprocessors

De GF100 chip is zoals gezien opgebouwd uit een 16-tal Streaming Multiprocessors, die elk bestaan uit 32 cores. Overigens zijn in de praktijk niet al deze zestien SM's actief: bij de GeForce GTX 480 zijn er 15 ingeschakeld (480 cores) en bij de GeForce GTX 470 zijn er 14 ingeschakeld (448 cores). Zoals geschreven voeren alle cores binnen een Streaming Multiprocessor op ieder moment in tijd een identieke bewerking uit, zij het op verschillende stukken data. In onderstaande afbeelding zien we hoe zo'n SM is opgebouwd.

Bovenin de Streaming Multiprocessor vinden we de Instruction Cache, de vergaarbak waarin alle door de betreffende SM uit te voeren instructies worden verzameld. Deze instructies worden zoals besproken centraal aangevoerd vanuit de Gigathread Engine. Alle taken worden in een tweetal Warp Schedulers verdeeld in zogenaamde Warps, combinaties van telkens maximaal 32 identieke instructies, die door de onderliggende cores gelijktijdig kunnen worden uitgevoerd.

Elke Streaming Multiprocessor bevat zoals besproken 32 shader units ofwel Cuda cores. Al deze mini cores bestaan uit een volledige integer en floating point rekeneenheid. Elke core kan per klokslag een 32-bit (single precision) floating-point berekening afronden. Voor 64-bit (double precision) instructies heeft een core een tweetal klokslagen nodig, bij de GT200 waren er dat nog 8. Naast de cores bevat iedere SM een 16-tal Load/Store Units die instructies met betrekking tot het ophalen van data uit het geheugen of juist het wegschrijven van data kunnen uitvoeren. Verder is er een viertal Special Function Units (SFU) die speciale bewerkingen als sinus-, cosinus- en wortelberekeningen kunnen uitvoeren. Elke SFU kan één instructie per klokslag verwerken. Het voltooien van een warp instructies door de SFU's duurt zodoende 8 klokslagen.

Onder de verschillende verwerkingseenheden vinden we in iedere SM een viertal Texture Units, die zorg dragen voor het op een juiste manier verwerken van texture-afbeeldingen die op driehoeken worden geplakt. Aangezien er zich zestien Streaming Multiprocessor blokken bevinden binnen de GF100 chip, bedraagt het totaal aantal texture units 64. De oplettende lezer zal opmerken dat dit er minder zijn dan de 80 stuks in de GT 200 chip. Volgens nVidia is er echter geen reden tot paniek: de texture units in de GF100 hebben heel wat optimalisaties achter de rug, waardoor ze betere prestaties leveren dan hun soortgenoten in de GT200. De winst is te danken aan een efficiënter gebruik van het cache geheugen en een hogere kloksnelheid. De texture units werken voortaan op de helft van de shader snelheid. In de GT200 chip werken de eenheden op dezelfde snelheid als die van de GPU-core zelf, welke in de regel veel minder dan de helft van de shader klokfrequentie bedraagt.

Tussen de cores en de texture units vinden we 64 kB geheugen. Dit geheugen kan geschakeld worden tussen 16 kB L1-cache + 48 kB shared memory of 48 kB L1-cache + 16 kB shared memory. De GT200 had op deze plek alleen 16 kB shared memory. Onderin de SM's vinden we zogenaamde PolyMorph engine, die ondermeer zorg draagt voor tesselation, waarover meer op de volgende pagina.

Advertentie

14 besproken producten

Vergelijk   Product Prijs
Asus ENGTX470/2DI/12GD5

Asus ENGTX470/2DI/12GD5

  • Nvidia GeForce GTX 470
  • 1280 MB
Niet verkrijgbaar
Asus ENGTX480/2DI/15GD5

Asus ENGTX480/2DI/15GD5

  • Nvidia GeForce GTX 480
  • 1536 MB
Niet verkrijgbaar
EVGA GeForce GTX 470 1280MB

EVGA GeForce GTX 470 1280MB

  • Nvidia GeForce GTX 470
  • 1280 MB
Niet verkrijgbaar
EVGA GeForce GTX 480 1536MB

EVGA GeForce GTX 480 1536MB

  • Nvidia GeForce GTX 480
  • 1536 MB
Niet verkrijgbaar
Gainward GeForce GTX 470 1280MB

Gainward GeForce GTX 470 1280MB

  • Nvidia GeForce GTX 470
  • 1280 MB
Niet verkrijgbaar
Gainward GeForce GTX 480 1536MB

Gainward GeForce GTX 480 1536MB

  • Nvidia GeForce GTX 480
  • 1536 MB
Niet verkrijgbaar
Gigabyte GV-N470D5-13I-B

Gigabyte GV-N470D5-13I-B

  • Nvidia GeForce GTX 470
  • 1280 MB
Niet verkrijgbaar
Gigabyte GV-N480D5-15I-B

Gigabyte GV-N480D5-15I-B

  • Nvidia GeForce GTX 480
  • 1536 MB
Niet verkrijgbaar
MSI N470GTX-M2D12

MSI N470GTX-M2D12

  • Nvidia GeForce GTX 470
  • 1280 MB
Niet verkrijgbaar
MSI N480GTX-M2D15

MSI N480GTX-M2D15

  • Nvidia GeForce GTX 480
  • 1536 MB
Niet verkrijgbaar
Nvidia GeForce GTX 470

Nvidia GeForce GTX 470

  • GF100
  • 448 cores
  • 607 MHz
  • 1280 MB
  • 320 bit
  • DirectX 12 fl 11_0
  • PCI-Express x16
Niet verkrijgbaar
Nvidia GeForce GTX 480

Nvidia GeForce GTX 480

  • GF100
  • 480 cores
  • 700 MHz
  • 1536 MB
  • 384 bit
  • DirectX 12 fl 11_0
  • PCI-Express 2.0 x16
Niet verkrijgbaar
Point of View GeForce GTX 470 1280MB

Point of View GeForce GTX 470 1280MB

  • Nvidia GeForce GTX 470
  • 1280 MB
Niet verkrijgbaar
Point of View GeForce GTX 480 1536MB

Point of View GeForce GTX 480 1536MB

  • Nvidia GeForce GTX 480
  • 1536 MB
Niet verkrijgbaar
0

Hardware Info maakt gebruik van cookies

Hardware Info plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Hardware Info relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie.

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Hardware Info contextuele advertenties te tonen op basis van pagina's die je hebt bezocht.

    janee

    Hardware Info genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Hardware Info gevolgd worden. Deze data wordt maximaal 2 weken bewaard. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden.

    janee