NVIDIA Pascal-Architektur: GeForce GTX 1060, 1070 und 1080 im Test

Grafikkarten | HT4U.net | Seite 6

NVIDIA-Pascal-Architektur


Technische Betrachtung



Mit der Einführung der GeForce GTX 1080 bringt NVIDIA eine neuen Marketing-Namen ins Spiel und spricht von der sogenannten Pascal-Architektur. Auch wenn sich die Änderungen hinsichtlich der Architektur selbst in Grenzen halten, wollen wir an dieser Stelle dem NVIDIA-Jargon folgen und Pascal als Basis der in diesem Test vorgestellten Modelle GeForce GTX 1080, GTX 1070 und GTX 1060 vorstellen.

Eckdaten GeForce GTX 1080 GeForce GTX 1070 GeForce GTX 1060 GeForce GTX Titan X GeForce GTX 980 GeForce GTX 960
Codename GP104 (Pascal) GP104 (Pascal) GP106 (Pascal) GM200 (Maxwell) GM204 (Maxwell) GM206 (Maxwell)
Fertigung 16 nm (FinFET) 16 nm (FinFET) 16 nm (FinFET) 28 nm 28 nm 28 nm
Chipgröße 314 mm² 314 mm² 200 mm² 601 mm² 398 mm² 227 mm²
Transistoren 7,2 Mrd. 7,2 Mrd. 4,4 Mrd. 8 Mrd. 5,2 Mrd. 2,94 Mrd
Taktrate Chip (Basis) 1.607 MHz 1.506 MHz 1.506 MHz 1.000 MHz 1.126 MHz 1.126 MHz
Taktrate Chip (gemittelter Boost) 1.733 MHz 1.683 MHz 1.708 MHz 1.075 MHz 1.216 MHz 1.126 MHz
Taktrate Speicher (MHz) 1.250 MHz 2.000 MHz 2.000 MHz 1.750 MHz 1.750 MHz 1.750 MHz
Datenrate Speicher (Mbps) 10.000 Mbps 8.000 Mbps 8.000 Mbps 7.000 Mbps 7.000 Mbps 7.000 Mbps
Speicherart GDDR5X GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Typische Speichergröße 8.192 MB 8.192 MB 6.144 MB 12.288 MB 4.096 MB 2.048 MB
Speicheranbindung 256 Bit 256 Bit 192 Bit 384 Bit 256 Bit 128 Bit
Shader-Recheneinheiten 2.560 1.920 1.280 3.072 2.048 1.024
Double-Precision-Unterstützung Ja – 1/32 SP-Leistung Ja – 1/32 SP-Leistung Ja – 1/32 SP-Leistung Ja – 1/32 SP-Leistung Ja – 1/32 SP-Leistung Ja – 1/32 SP-Leistung
L1-Cache 960 KB 720 KB 480 KB 1.248 KB 768 KB 384 KB
L2-Cache 2.048 KB 2.048 KB 1.536 KB 3.072 KB 2.048 KB 1.024 KB
Textur-Einheiten (TMUs) 160 120 80 192 128 64
Raster-Operation-Einheiten (ROP) 64 64 48 96 64 32
DirectX-Version DirectX 12 DirectX 12 DirectX 12 DirectX 11 DirectX 11 DirectX 11
Typische Leistungsaufnahme (Herstellerangabe) N/A N/A N/A N/A 165 W N/A
Maximale Leistungsaufnahme (Herstellerangabe) 180 W 150 W 120 W 250 180 W 120 W


Fertigungsprozess 16 nm FinFet



Bild: NVIDIA Pascal-Architektur: GeForce GTX 1060, 1070 und 1080 im Test
Die GeForce GTX 1080 basiert auf einer GPU mit dem Codenamen GP104, welche über 7,2 Milliarden Transistoren verfügt. Beim Fertigungsprozess gibt es gegenüber den Vorgängerversionen auch die größte Neuerung zu vermelden, denn der Chip wird im 16-nm-FinFet-Prozess hergestellt. Im PC-Bereich ist die FinFET-Technologie bereits seit geraumer Zeit vertreten und erhielt größere Bekanntheit als 3D-Transistor, den Intel mit Ivy Bridge im Jahre 2012 vorstellte. Wie mit jeder Umstellung des Fertigungsprozesses verspricht sich natürlich auch NVIDIA hierdurch ein besseres Verlustleistungsverhalten und langfristig eine günstigere Herstellung.


Pascal-Architektur: Maxwell Reloaded



Aus Architektursicht basiert der GP104 im Wesentlichen auf der Maxwell-Architektur, die NVIDIA mit der GeForce GTX 750 Ti (GM107) vor rund zweieinhalb Jahren im Februar 2014 einführte. Zwar spricht NVIDIA wie bereits angedeutet von der Pascal-Architektur, der grundsätzliche Aufbau ist jedoch identisch zur Maxwell-Architektur. Der GP104 ist hierbei in vier Graphic-Processing-Clusters (GPC) gegliedert, wobei jeder GPC mit je fünf Streaming-Multiprocessors (SM) ausgestattet ist, was summa summarum 40 SMs ergibt. Bei acht Vec16-Rechenwerken und acht Texturierungseinheiten (TMU) pro SM kommt der GP104 auf insgesamt 160 TMUs und 160 Vec16-Recheneinheiten. Letzteres entspricht der NVIDIA-Angabe von 2.560 Cuda-Cores (160 Recheneinheiten multipliziert mit 16 Slots).

Bild: NVIDIA Pascal-Architektur: GeForce GTX 1060, 1070 und 1080 im Test

Im direkten Vergleich zur GeForce GTX Titan X mit GM200-GPU, die mit 3.072 CUDA-Cores und 192 TMUs antritt, sind das erst einmal keine erstaunlichen Werte. Dafür hat NVIDIA massiv an der GPU-Taktschraube gedreht und taktet den GP104-Chip bei der GTX 1080 mit einem Basistakt von 1.607 MHz deutlich höher als die GeForce GTX Titan X mit deren 1.000 MHz. Und auch beim Speicher hat NVIDIA Neuigkeiten im Gepäck, namentlich GDDR5X. Zusätzlich gibt es Verbesserungen bei der Speicherkompression zu vermelden. Hierbei wurden die 2:1-Delta-Colour-Kompression überarbeitet und zwei neue Modi (4:1 und 8:1) hinzugefügt, wodurch sich laut NVIDIA-Aussage eine effektive Bandbreitensteigerung von bis zu 20 Prozent ergeben soll.

GDDR5X-Speicher



Bild: NVIDIA Pascal-Architektur: GeForce GTX 1060, 1070 und 1080 im Test
Der Speicher des GP104 ist über acht 32-Bit-Controller und somit insgesamt mit einem 256 Bit breiten Interface an die GPU angebunden. Wirklich neu ist die Speicherart, die NVIDIA erstmals verwendet: GDDR5X-Speicher. Anders als gewöhnlicher GDDR5-Speicher, arbeitet die X-Variante mit einem 16-fach-Prefetch, anstelle eines 8-fach-Prefetches. Dies bedeutet, dass bei einem Zugriff gleich 16 Datenwörter gelesen werden. Zwar arbeitet der interne Speichertakt nach wie vor mit der gleichen Frequenz wie bei GDDR5-Speicher, jedoch wurde der IO-Takt ein weiteres Mal verdoppelt. Taktnormiert ergibt sich hierdurch zumindest auf dem Papier eine Verdoppelung der Speicherbandbreite. Jedoch taktet der GDDR5X-Speicher der GTX 1080 mit intern 1.250 MHz deutlich langsamer als der GDDR5-Speicher der GTX 1070, welcher mit 2.000 MHz taktet. Auf dem Papier bleibt nichtsdestoweniger ein Bandbreitenplus von 25 % für den GDDR5X-Speicher.

Neue Video-Engine



Einen weiteren Fortschritt gibt es bezüglich der Video-Engine zu vermelden. Diese ist nun in der Lage, HEVC- (10 und 12 Bit) sowie VP9-Material in Hardware zu dekodieren und HEVC in 10 Bit zu kodieren. Nachfolgend eine Gegenüberstellung von GTX 1080 und GTX 980 hinsichtlich deren Videofunktionalitäten. Zudem spricht NVIDIA davon, dass der DisplayPort für die Versionen 1.3 und 1.4 vorbereitet ist.


Material GeForce GTX 980 GeForce GTX 1080
H.264 Encode Ja Ja (2 x 4K @ 60 Hz)
HEVC Encode Ja Ja (2 x 4K @ 60 Hz)
10-Bit-HEVC-Encode Nein Ja
H.264-Decode Ja Ja (4K @ 120 Hz bis zu 240 Mbps)
HEVC-Decode Nein Ja (4K @ 120 Hz/8K @ 30 Hz bis zu 320 Mbps)
VP9-Decode Nein ja (4K @ 120 Hz bis zu 320 Mbps)
MPEG2-Decode Ja Ja
10-Bit-HEVC-Decode Nein Ja
12-Bit-HEVC-Decode Nein Ja



GeForce GTX 1070

Die GTX 1070 nutzt ebenfalls den GP104-Chip, jedoch wurde in diesem Fall ein kompletter Graphic-Processing-Cluster (GPC) deaktiviert. Bei drei GPCs mit je fünf Streaming-Multiprocessors (SM) kommt die GTX 1070 auf nunmehr 15 SMs, anstelle deren 20 SMs bei der GTX 1080. Da jeder SM über acht TMUs und acht Vec16-Recheneinheiten verfügt, schafft es die GTX 1070 auf 120 TMUs und 1.920 CUDA-Cores (120 Vec16-Einheiten).

Das Speicher-Interface lässt NVIDIA unangetastet im Vergleich zur GTX 1080. Über acht 32-Bit-Controller (entspricht 256 Bit) ist der Speicher angebunden. Allerdings verzichtet NVIDIA bei der günstigeren GTX 1070 auf den neuartigen GDDR5X-Speicher, stattdessen kommt GDDR5-Speicher zum Einsatz, der durch seinen sehr hohen Takt der nachteiligen Technologie entgegenwirkt.

GeForce GTX 1060

Bild: NVIDIA Pascal-Architektur: GeForce GTX 1060, 1070 und 1080 im Test
Anders als die GTX 1080 und GTX 1070 setzt die GTX1060 auf den GP106-Chip. Der GP106-Chip verfügt über nur noch zwei Graphic-Processing-Cluster (GPC), die jedoch identisch zum großen Bruder aufgebaut sind. Hierdurch kommt der GP106 auf eine deutlich geringere Transistoranzahl von 4,4 Milliarden im direkten Vergleich zu den 7,2 Milliarden des GP104.

Durch den Einsatz von zwei GPCs verfügt die GTX 1060 über zehn Streaming-Multiprocessors (wieder mit je acht TMUs und Vec16-Einheiten). Somit stehen der GTX 1060 80 TMUs und 80 Vec16-Recheneinheiten (1.280 CUDA-Cores) zur Verfügung. Wie im Falle der GTX 1070 findet auch bei der GTX 1060 schneller GDDR5-Speicher Verwendung. Allerdings ist dieser auf der GTX 1060 nur über sechs 32-Bit-Speichercontroller und somit insgesamt 192 Bit an den Grafikchip angebunden.

 

Inhalt dieses Testberichtes

 
 



Jetzt kostenlosen HT4U.net-Newsletter abonnieren

* indicates required