Nvidia GeForce GTX 750 / 750 Ti review: eerste Maxwell GPU's

Zelfde productieprocedé, maar toch veel zuiniger

Door


Maxwell

We schreven het al: bij Maxwell heeft Nvidia zich tot doel gesteld om de efficiëntie van haar GPU's - de prestaties afgezet tegen het stroomverbruik dus - zo ver mogelijk op te voeren. Wat dat betreft zien we een gelijke trend als bij Intel voor CPU's: in een tijd dat laptops en small form factor PC's voor het merendeel van de markt belangrijker zijn dan grote desktops, is het juist het terugdringen van stroomverbruik waar de ingenieurs zich op focussen.

In de basis lijkt het ontwerp van Maxwell erg op dat van de voorgaande GPU's. Dat is op zich ook niet gek: in feite zijn moderne GPU's grote, universele processors geworden met een hele batterij aan floating point rekeneenheden. Van de hele 3D-workflow is steeds minder fixed function, waardoor er ook steeds minder variatie in chipontwerp bestaat.

Desalniettemin is er een aantal noemenswaardige verschillen. Zoals je onder meer nog kun teruglezen in onze GeForce GTX 680 review bestaan Kepler GPU's uit één of meerdere zogenaamde SMX units (Streaming Multiprocessors) die elk uit 192 shader units (ofwel Cuda cores in Nvidia-jargon) beslaan. Elk van de cores binnen zo'n Streaming Multiprocessor voert op ieder moment in feite dezelfde instructie uit, maar dan op andere data. 

De verhouding tussen texture units en cores is  verlaagd van 1:12 naar 1:16.

Maxwell is opgebouwd uit een nieuwe implementatie van de streaming multiprocessors, die Nvidia nu SMM noemt. De nieuwe varianten bestaan uit vier partities van elk 32 Cuda cores, 128 in totaal dus. Iedere SMM bevat verder onder meer een zogenaamde Polymorph Engine (die onder andere tessellation verzorgt) en acht texture units. Bij de Kepler-architectuur waren er 16 texture units per SMX. De verhouding tussen texture units en cores is dus verlaagd van 1:12 naar 1:16. Vermoedelijk heeft Nvidia dit gedaan omdat bij moderne workloads de bottleneck veel meer bij de rekenkracht van de Cuda-cores ligt.

Het terugbrengen van het aantal cores per Streaming Multiprocessor van 192 naar 128 maakt dat Nvidia een stuk flexibeler kan zijn met de scheduling van instructies. Immers: als een kleiner aantal core dezelfde instructie moet uitvoeren, is het eenvoudiger om zo veel mogelijk cores binnen een GPU daadwerkelijk aan het werk te houden.

GM107 chip

De GM107 chip die de basis vormt voor de GTX 750 en 750 Ti bevat vijf van deze SMM-units en daarmee in totaal dus 5 x 128 = 640 Cuda cores en 5 x 8 = 40 Texture units. De vijf SMM-units vormen bij elkaar één zogenaamde GPC (Graphics Processing Cluster) waaraan 16 render engines (ROPs) zijn gekoppeld. Deze ROPs zorgen uiteindelijk voor de verwerking van alle berekende data naar daadwerkelijke pixels.

Nvidia GeForce GTX 750 Ti
De GM107 bestaat uit vijf SMM units van elk 128 Cuda cores.

Nvidia GeForce GTX 750 Ti
Iedere SMM is onderverdeeld in vier groepen van 32 cores met elk een eigen scheduler.

Een grote vooruitgang is de hoeveelheid gedeelde L2-cache binnen de chip: dat is maar liefst 2 MB bij de GM107, waar Kepler-chips in dit segment het met 256 kB of 384 kB moesten doen. Dankzij de extra L2-cache kunnen de Cores efficiënter werken en wordt de geheugenbus veel minder belast. Zeker ook met de sterke opkomst van GPGPU-software is de keuze voor relatief meer L2-cache binnen de chip goed te verklaren.

Eén van de redenen waarom de GM107 volgens Nvidia efficiënter kan werken is dat een gedeelte van de scheduling niet meer in hardware wordt gedaan, maar in software, op driverniveau. Dat bespaart uiteraard transistors, maar maakt nVidia ook flexibeler. In feite zou je kunnen zeggen dat de scheduling van de chip nu softwarematig te "upgraden" is. Tegelijkertijd wordt hiervoor nu wel rekenkracht van de CPU gebruikt, al is dat volgens Nvidia nooit meer dan 1%. Ook het hardware gedeelte van de scheduler is geheel opnieuw ontworpen. Mede hierdoor zouden de prestaties per Cuda core met 35% moeten kunnen toenemen bij shader-limited applicaties.

De GM107 heeft een 128-bit geheugencontroller, die is opgebouwd uit twee 64-bit segmenten. Uiteraard biedt de geheugencontroller ondersteuning voor GDDR5.

Nvidia ziet de GM107 als logische opvolger van de GK107, de GPU die we kennen van de GeForce GTX 650. In vergelijking met deze CPU heeft de GM107 67% meer cores, terwijl het chipoppervlak slechts 25% is toegenomen. Opvallend is wel dat het aantal ROP's identiek is: 16 stuks. Bij de nieuwste AMD GPU's zagen we als gevolg van de trend naar hogere resoluties dat de verhouding tussen het aantal ROP's en aantal cores juist kleiner wordt (lees: relatief méér ROP's). Klaarblijkelijk heeft Nvidia die keuze bij Maxwell niet gemaakt, althans niet voor het segment waar de GM107 wordt gepositioneerd.

Een vergelijking met de GK106, bekend van de GeForce GTX 660 en 650 Ti (Boost) is dan ook op z'n plaats, aangezien de GTX 750 en GTX 750 Ti juist in de plaats van de 650 Ti kaarten komen. In vergelijking met de GK106 is het aantal cores als ook het aantal texture units aanzienlijk minder (960 vs. 640 en 80 vs. 40), maar de efficiëntere werking zou dat voor een gedeelte moeten kunnen compenseren. Het scheelt sowieso flink qua chipoppervlak: de GM107 is een stuk kleiner dan de GK106, wat voor Nvidia direct een groot voordeel qua productiekosten betekent.

GPU GK107 Kepler GK106 Kepler GM107 Maxwell
Cuda Cores 384 960 640
Texture units 32 80 40
ROPs 16 24 16
TUs:Cores 1:12 1:12 1:16
ROPs:Cores 1:24 1:40 1:40
L2-cache 256 kB 384 kB 2048 kB
Transistors 1,3 miljard 2,54 miljard 1,87 miljard
Chipgrootte 118 mm² 214 mm² 148 mm²
Procedé 28 nm 28 nm 28 nm
Geheugenbus 128-bit 192-bit 128-bit

Vergelijken

In deze review besproken twee producten

  Product Laagste prijs

Nvidia GeForce GTX 750

GM107, 512 cores, 1020 MHz, 1024 MB, 128 bit, DirectX 12 fl 11_0, PCI-Express 3.0 x16

Specificaties Testresultaten Reviews

Nvidia GeForce GTX 750 Ti

GM107, 640 cores, 1020 MHz, 2048 MB, 128 bit, DirectX 12 fl 11_0, PCI-Express 3.0 x16

Specificaties Testresultaten Reviews

Lees ook deze 3d-chip artikelen op Hardware.Info

Vond je deze review nuttig?

Lees dan voortaan onze uitgebreidste reviews als eerste én steun deze site, met een abonnement op Hardware.Info Magazine - nu ook alleen digitaal beschikbaar!

Hardware.Info maakt gebruik van cookies.
*