NVIDIA Maxwell Next Gen: GeForce GTX 970 und GTX 980 im Test

Grafikkarten | HT4U.net | Seite 7

NVIDIA GeForce GTX 900


Technische Betrachtung



Vorab gilt es vielleicht erst einmal festzuhalten, dass die Vorstellung einer neuen GPU-Architektur in der Vergangenheit auch immer mit einem geschrumpften Fertigungsprozess einhergegangen ist. Und sicherlich hätte NVIDIA es sich gewünscht, die neue Familie in einem 20- oder auch 22-nm-Fertigungsprozess vorstellen zu können, doch ganz offensichtlich ist der Auftragsfertiger TSMC noch nicht so weit, weshalb NVIDIA auch die neuen Maxwell-Ableger im bislang typischen 28-nm-Fertigungsprozess vorstellt.

Bild: NVIDIA Maxwell Next Gen: GeForce GTX 970 und GTX 980 im Test


Doch offensichtlich sind die in der Architektur vorgenommenen Optimierungen hinreichend groß, so dass man eine höhere Leistung und eine gesunkene Leistungsaufnahme ausrufen kann. Gleichzeitig wählte man eine neue Nomenklatur. Die neuen GM-Chips hören nun auf den Namen GeForce GTX 900. Erwartet hatte man eigentlich die GeForce-GTX-800-Reihe.

NVIDIA erklärte dazu, dass man Verwirrungen vermeiden wollte, denn die Bezeichnung GTX 800 habe man bereits im mobilen Grafikchipsegment für Notebooks verwendet, so dass man nun eben die nächste Stufe für diese Desktop-Grafikkarten verwendet.

Eckdaten GeForce GTX 980 GeForce GTX 970 GeForce GTX 750 Ti GeForce GTX 780 Ti GeForce GTX 780 GeForce GTX 680
Codename GM204 (Maxwell) GM204 (Maxwell) GM107 (Maxwell) GK110 (Kepler) GK110 (Kepler) GK104 (Kepler)
Fertigung 28 nm 28 nm 28 nm 28 nm 28 nm 28 nm
Transistoren 5,2 Mrd 5,2 Mrd 1,87 Mrd 7,1 Mrd 7,1 Mrd 3,54 Mrd.
Taktrate Chip 1.126 MHz 1.050 MHz 1.020 MHz 875 MHz 863 MHz 1.006 MHz
Taktrate Shader 1.126 MHz 1.050 MHz 1.020 MHz 875 MHz 863 MHz 1.006 MHz
Taktrate Speicher (MHz) 1.750 MHz 1.750 MHz 1.350 MHz 1.752 MHz 1.502 MHz 1.502 MHz
Taktrate Speicher (Mbps) 7.000 Mbps 7.000 Mbps 5.400 Mbps 7.010 Mbps 6.008 Mbps 6.008 Mbps
Speicherart GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Typische Speichergröße 4096 MB 4096 MB 2048 MB 3072 MB 3072 MB 2048 MB
Speicheranbindung 256 bit 256 bit 128 bit 384 bit 384 bit 256 bit
Shader-Recheneinheiten 2.048 1.664 640 2.880 2.304 1.536
Befehlsarchitektur Skalar Skalar Skalar Skalar Skalar Skalar
Fähigkeiten pro Shader-Einheit MADD MADD MADD MADD MADD MADD
Double-Precision-Unterstützung Ja – 1/32 SP-Leistung Ja – 1/32 SP-Leistung Ja – 1/32 SP-Leistung Ja – 1/24 SP-Leistung Ja – 1/24 SP-Leistung Ja – 1/24 SP-Leistung
Textur-Einheiten (TMUs) 128 104 40 240 192 128
Raster-Operation-Einheiten (ROP) 64 64 16 48 48 32
Shader-Model-Version 5.0 5.0 5.0 5.0 5.0 5.0
DirectX-Version DirectX 11 DirectX 11 DirectX 11 DirectX 11 DirectX 11 DirectX 11
Audio-Controller 7.1 (HD-Bitstream) 7.1 (HD-Bitstream) 7.1 (HD-Bitstream) 7.1 (HD-Bitstream) 7.1 (HD-Bitstream) 7.1 (HD-Bitstream)
Videoprozessor VP5 VP5 VP5 VP5 VP5 VP5
Typische Leistungsaufnahme (Herstellerangabe) 165 W 145 W - ? ? 170 W
Maximale Leistungsaufnahme (Herstellerangabe) 180 W ? 60 W 250 W 250 W 195 W


Der GM204 basiert auf der Maxwell-Architektur, welche NVIDIA mit der GTX 750 Ti (GM107) eingeführt hat. Allerdings hat NVIDIA beim GM204 die Anzahl der Funktionseinheiten stark erhöht, weshalb der Chip mit 5,2 Mrd. Transistoren auch deutlich größer als der GM107 mit 1,87 Mrd. Transistoren ist.

Bild: NVIDIA Maxwell Next Gen: GeForce GTX 970 und GTX 980 im Test
Bild: NVIDIA Maxwell Next Gen: GeForce GTX 970 und GTX 980 im Test


Der GM204 ist in vier Graphic Processing Cluster (GPC) gegliedert. Jeder GPC verfügt über ebenfalls vier Streaming-Multiprocessors (SMM), deren Aufbau wir bereits detailliert im Artikel zur GTX 750 Ti beschrieben haben. Bei 8 Vec16-Rechenwerken und 8 Texturierungseinheiten (TMU) pro SMM kommt der GM204 somit auf insgesamt 128 TMUs und 128 Vec16-Recheneinheiten, was den von NVIDIA propagierten 2048 Cuda Cores (128 Einheiten mit je 16 Slots) entspricht.

Die Speicheranbindung fällt mit vier 64-Bit-Controllern (256 Bit Gesamtbreite) doppelt so breit aus wie im Falle der GTX 750 Ti. Der GTX 780 Ti kann das Modell im Hinblick auf die Speicherbandbreite jedoch nicht das Wasser reichen, denn diese verfügt bei nahezu identischem Takt über ein 384-Bit-Interface und hat somit eine 50 Prozent höhere Speicherbandbreite. Enttäuschend für Anhänger von wissenschaftlichen GPGPU-Anwendungen dürfte die Beschränkung der Double-Precision-Performance auf 1/32 der Single-Precision-Leistung sein, wie bereits von der GTX 750 Ti bekannt.

Während die GeForce GTX 980 einen GM204 darstellt, sind im Falle der GTX 970 drei SMM deaktiviert. Durch die Deaktivierung kommt die GTX 970 auf insgesamt 13 SMMs und somit 1664 Cuda Cores und 104 TMUs. Rein von den theoretischen Eckdaten her erreicht die GTX 980 in den relevanten Disziplinen Rechenleistung, Texturierungsleistung und Speicherbandbreite hiermit nicht ganz das Niveau einer GTX 780 Ti. Jedoch arbeitet die neue Maxwell-Architektur laut NVIDIA deutlich effizienter als die ältere Kepler-Architektur. Man darf gespannt sein auf die Praxisauswirkungen, welche wir in unserem Benchmark-Parcours aufzeigen werden.

GeForce GTX 980 GeForce GTX 750 Ti GeForce GTX 780 Ti GeForce GTX 780 GeForce GTX 680
Rechenleistung – SP (MADD) 4.612 GFLOPs 1.306 GFLOPs 5.040 GFLOPs 3.977 GFLOPs 3.090 GFLOPs
Rechenleistung – DP (MADD) 144 GFLOPs 41 GFLOPs 210 GFLOPs 166 GFLOPs 129 GFLOPs
Texturierungsleistung (INT8 bilinear) 144,1 GTex/s 40,8 GTex/s 210,0 GTex/s 165,7 GTex/s 128,8 GTex/s
Pixelfüllrate 72,1 GPix/s 16,3 GPix/s 42,0 GPix/s 41,4 GPix/s 32,2 GPix/s
Speicherbandbreite 224,0 GB/s 86,4 GB/s 336,4 GB/s 288,4 GB/s 192,3 GB/s


    Update 27. Januar 2015:
    Wie sich zwischenzeitlich heraus gestellt hat, sind NVIDIAs Informationen zu den Eckdaten der GeForce GTX 970 so nicht korrekt!

    Nach derzeitigen Informationen handelt es sich nicht um 64 ROPs, sondern lediglich 56 Raster Operations Einheiten, wovon 52 in voller Geschwindigkeit genutzt werden können. Der vier Gigabyte Große Hauptspeicher ist dabei in zwei Bereiche unterteilt, wobei 3,5 GByte mit voller Performance angesprochen werden können – allerdings nur mit einer Speicheranbindung von 224 bit – und die verbleibenden 512 MByte Hauptspeicher sind mit langsamer 32 bit-Breite angebunden.

    NVIDIA arbeitet über seine Treiber daran, dass dieser langsamere Speicherbereich möglichst nicht oder nur wenig verwendet wird. Zudem sorgen die Beschränkungen dafür, dass der GTX 970 nicht die vollen 2 MByte Level2-Cache zur Verfügung stehen, sondern lediglich runde 1,8 MByte.

    Geforce GTX 980 Geforce GTX 970 (bisher) Geforce GTX 970 (neu)
    GPCs 4 4 4
    SMMs 16 13 13
    Shader-Einheiten 2.048 1.664 1.664
    Texturierungs-Einheiten 128 104 104
    Raster-Operations-Einheiten 64 64 56
    Level2-Cache 2.048 KByte 2.048 KByte 1.792 KByte
    Speicherinterface 256 Bit 256 Bit 224 + 32 bit
    Speichertakt GDDR5 1752 MHz 1752 MHz 1752 MHz
    Speichermenge 4.096 MByte 4.096 MByte 3.5 GByte + 512 MByte


 

Inhalt dieses Testberichtes