NVIDIA GeForce GTX 580: Runderneuerung ermöglicht Fermi im Vollausbau

Grafikkarten | HT4U.net | Seite 2

Technik GF110 – GeForce GTX 580



Technik



Eckdaten GeForce GTX 580 GeForce GTX 480 GeForce GTX 470 GeForce GTX 460 – 1024 MB Radeon HD 6870 Radeon HD 5870
Codename GF110 GF100 GF100 GF104 Barts RV870
Fertigung 40 nm 40 nm 40 nm 40 nm 40 nm 40 nm
Transistoren ca. 3 Mrd. ca. 3 Mrd. ca. 3 Mrd. 1950 Mio. 1700 Mio. 2150 Mio.
Taktrate Chip 772 MHz 700 MHz 607 MHz 675 MHz 900 MHz 850 MHz
Taktrate Shader 1544 MHz 1401 MHz 1215 MHz 1350 MHz 900 MHz 850 MHz
Taktrate Speicher (MHz) 1000 MHz 924 MHz 837 MHz 900 MHz 1050 MHz 1200 MHz
Taktrate Speicher (Mbps) 4000 Mbps 3696 Mbps 3348 Mbps 3600 Mbps 4200 Mbps 4800 Gbps
Speicherart GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
typische Speichergröße 1536 MB 1536 MB 1280 MB 1024 MB 1024 MB 1024 MB
Speicheranbindung 384 bit 384 bit 320 bit 256 bit 256 bit 256 bit
Shader Recheneinheiten 512 480 448 336 1120 (224xVec5) 1600 (320xVec5)
Typ Shadereinheiten Skalar-Prozessoren Skalar-Prozessoren Skalar-Prozessoren Skalar-Prozessoren Vec5 (Co Issue 1:1:1:1:1) Vec5 (Co Issue 1:1:1:1:1)
Fähigkeiten pro Shadereinheit MADD MADD MADD MADD MADD MADD
Double Precision Unterstützung Ja – 1/8 SP-Leistung Ja – 1/8 SP-Leistung Ja – 1/8 SP-Leistung Ja – 1/12 SP-Leistung Nein Ja – 1/5 SP-Leistung
Textur-Einheiten (TMUs) 64 60 56 56 56 80
Raster-Operation-Einheiten (ROP) 48 48 40 32 32 32
Shader-Model-Version 5.0 5.0 5.0 5.0 5.0 5.0
DirectX-Version DirectX 11 DirectX 11 DirectX 11 DirectX 11 DirectX 11 DirectX 11
Audio-Controller 7.1 (LPCM, 48kHz, 16bit) 7.1 (LPCM, 48kHz, 16bit) 7.1 (LPCM, 48kHz, 16bit) 7.1 (HD-Bitstream) 7.1 (HD-Bitstream) 7.1 (HD-Bitstream)
Video-Prozessor VP4 VP4 VP4 VP4 UVD3 UVD2
TDP 244 W 250 W 215 W 160 W 151 W 188 W


Die NVIDIA GeForce GTX 580 basiert auf dem GF110-Chip. Dieser ist im Wesentlichen ein Fermi (GF100) im Vollausbau. Zur Erinnerung: Fermi wurde in seiner maximalen Ausbaustufe im Desktop-Bereich nie eingesetzt. Das höchste der Gefühle ist in Form der GeForce GTX 480 gegeben, bei welcher ein Shader-Cluster deaktiviert wurde. Der GF110 stellt nun in seinen Grundzügen einen GF100 dar, welche in einigen Details überarbeitet wurde.

Bild: NVIDIA GeForce GTX 580: Runderneuerung ermöglicht Fermi im Vollausbau


Somit ist der GF110 ebenfalls in vier Graphics Processing Cluster (GPC) unterteilt. Jeder dieser Cluster verfügt hierbei über je vier Streaming Multiprocessors (SM) und einen Rasterizer. Die Streaming Multiprozessors beherbergen die Shader-Prozessoren (Cuda-Cores), in Form von zwei Vec16-Rechenwerken. Dies entspricht 32 Cuda Cores (2 x Vec16). Insgesamt stehen dem GF110 – wie auch schon dem GF100 – 16 Streaming Multrpocessors (4 GPCs à 4 SMs) und somit 512 Cuda Cores (16 SMs à 32 Cuda Cores) zur Verfügung. Anders als bei der GeForce GTX 480 nutzt die GTX 580 nun allerdings sämtliche vorhandenen Einheiten.

Ermöglicht wurde dies laut NVIDIA durch eine Überarbeitung der Architektur auf Transistor-Ebene. Auf diese Weise konnte der Hersteller – trotz der größeren Anzahl an Einheiten und höherem Takt bei gleichbleibendem Fertigungsprozesses – die TDP des GF110 gegenüber dem Vorgänger um 6 Watt senken. Dazu erklärte NVIDIA, dass man den gesamten Chipaufbau noch einmal komplett durchgegangen sie. Dort wo man langsamere Transistoren mit geringerem Leckstrom einsetzen konnte, habe man dies getan. An anderen stellen, wo man schnellere Transistoren mit höheren Leckströmen für notwendig erachtet hat, seien solche zum Einsatz gekommen. Im Ergebnis habe man aus Herstellersicht dann den richtigen Mittelweg gefunden.

Bild: NVIDIA GeForce GTX 580: Runderneuerung ermöglicht Fermi im Vollausbau

Verbesserungen hinsichtlich der Architektur gibt es hinsichtlich der TMUs zu vermelden. Wie bereits beim GF104 (GeForce GTX 460) ist nun auch der GF110 in der Lage FP16-Texturen bei höchster Geschwindigkeit filtern, was einem bilinearen FP16-Texel pro Takt entspricht. Beim GF100 halbierte sich beim Einsatz von FP16-Texturen die Geschwindigkeit im Vergleich zu normalen INT8-Texturen. Weitere Verbesserungen verspricht NVIDIA durch einen verbesserten Z-Culling-Mechanismus, ohne jedoch diesbezüglich genauere Details zu verraten.

Merkmal GTX 580 GTX 480 GTX 470 HD 5870 HD 5850
Rechenleistung (MADD) 1581 1345 GFLOPs 1089 GFLOPs 2720 GFLOP/s 2088 GFLOP/s
Texturierungsleistung (FP16 bilinear) 49,4 GTex/s 21,0 GTex/s 17,0 GTex/s 34,0 GTex/s 21,1 GTex/s
Texturierungsleistung (INT8 bilinear) 49,4 GTex/s 42,0 GTex/s 34,0 GTex/s 68,0 GTex/s 52,2 GTex/s
Pixelfüllrate 37,1 GPix/s 33,6 GPix/s 24,3 GPix/s 27,2 GPix/s 23,2 GPix/s
Speicherbandbreite 192,0 GB/s 177,4 GB/s 133,9 GB/s 153,6 GB/s 128,0 GB/s


Ein Blick auf die theoretischen Eckdaten zeigt, dass die Rechenleistung und Textuierungsleistung (bei INT8) der NVIDIA GeForce GTX 580 im Vergleich zur GTX 480 um rund 18 Prozent gesteigert werden konnte. Durch die Verbesserungen bei FP16-Filterung kann der GF110 in dieser Disziplin ein mehr als deutliches Plus erzielen. In der Praxis spielt dies jedoch eine eher untergeordnete Rolle, da FP16-Texturen derzeit nur selten zum Einsatz kommen. Hinsichtlich der Pixelfüllrate gibt es eine Steigerung von ca. 10 Prozent und bei der Speicherbandbreite ein Plus von ca. 8 Prozent im Vergleich zum Vorgänger zu vermelden.

Im unmittelbaren Vergleich zur GeForce GTX 480 sieht NVIDIA ihre erreichten Performance-Vorteile im Detail wie auf folgendem Bild umgesetzt:

Bild: NVIDIA GeForce GTX 580: Runderneuerung ermöglicht Fermi im Vollausbau

Taktnormiert: GTX 580 vs. GTX 480



Performance-Index
Auflösungen: 1280x1024, 1680x1050, 1920x1200
AA-Modi: 0xAA, 4xAA, 8xAA
AF-Modi: 0xAF, 16xAF
NVIDIA GeForce GTX 580
100
NVIDIA GeForce GTX 580 @ GTX 480 Takt
93
NVIDIA GeForce GTX 480
88
Prozent
Ranking-Basis
Anno 1404 (Savegame)
Battleforge (integrated Benchmark) DirectX 11
Call of Duty: World at War (Multiplayer – Savegame)
Call of Juarez – Bound in Blood (Savegame)
Colin McRae: Dirt 2 – DirectX 11
Colin McRae: Dirt 2 – DirectX 9
Crysis Warhead 1.1 (Frost Flythrough – Enthusiast)
Far Cry 2 (Small Ranch – Ultra High)
Stalker – Call of Pripyat – DirectX 10
Stalker – Call of Pripyat – DirectX 11
The Chronicals of Riddick: Assault on Dark Athena (Savegame – OpenGL)
World in Conflict: Soviet Assault

Detail-Ansicht


Das Mittel unserer Benchmarks zeigt die Vorteile der höheren Rechenwerke und Chipüberarbeitungen bei runden fünf Prozent – das deckt sich Recht gut mit NVIDIAs eigener Prognose.

Kein HDA-Bitstreaming



Anders als man es von den letzten NVIDIA-Grafik-Chips (z. B. GF104 und GF106) gewohnt war, unterstützt die NVIDIA GeForce GTX 580 kein Bitstreaming von HD-Audio-Formaten. Dolby True HD und DTS-HD Master Audio können "lediglich" verlustfrei als LPCM übetragen werden, jedoch nicht als Bitstrom. Nachdem dies bei den letzten Chips schon praktisch als gesetzter Standard unterstellt werden konnte, überraschte uns die Information dann doch, dass GF110 kein HDA-Bitstreaming beherrscht.

Als Begründung hierfür erklärte NVIDIA uns gegenüber, dass man derartige Umstrukturierungen im Vergleich zum GF100 im Hinblick auf die kurze Zeitspanne vermeiden wollte. Das zusätzliche Risiko für eine Verzögerung durch eine weitere potentielle Fehlerquelle wollte der man nicht eingehen. Zudem schätzte man die Nachfrage nach diesem Feature bei einem Enthusiasten-Produkt als gering ein.