NVIDIA GeForce GTX 460 - Der Jäger stellt sich vor

Grafikkarten | HT4U.net | Seite 3

Technik: NVIDIA GeForce GTX 460



Wie bereits im vorangegangen Kapitel angemerkt, kommt bei der NVIDIA GeForce GTX 460 kein GF104-Chip im Vollausbau zum Einsatz. Stattdessen ist bei der GeForce GTX 460 generell ein Streaming Multiprocessor (SM) deaktiviert. Leider wollte sich NVIDIA nicht dazu äußern, ob und wann zukünftige Modelle mit einem GF104 im Vollausbau geplant sind. Das nachfolgende Blockdiagramm zeigt eine GeForce GXT 460 in der 1024-MB-Version mit teildeaktviertem GF104-Chip mit 7 Streaming Multiprocessors.

Bild: NVIDIA GeForce GTX 460 – Der Jäger stellt sich vor
Blockschaltbild NVIDIA GeForce GTX 460 1024 MB


Im direkten Vergleich kann sich die GeForce GTX 465 bei der Anzahl von SMs (11 Stück) recht deutlich von der GTX 460 (7 Stück) absetzen. Wie zuvor beschrieben, sind die SMs der GTX 465 jedoch nur mit 32 Cuda-Cores und lediglich 4 TMUs ausgestattet, anstelle der 48 Cuda-Cores und 8 TMUs bei der GTX 460. Insgesamt gesehen verfügen beide Modelle über eine ähnliche Anzahl an Shader Einheiten (GTX 465: 352, GTX 460: 336 Cuda Cores). Dafür kann die GTX 460 mit 56 TMUs aufwarten, und stellt die GTX 465 (32 TMUs) in dieser Hinsicht mehr als deutlich in den Schatten.

Allerdings kann die GTX 465 beim DirectX-11-Steckenpferd – der Tesselation – deutlich punkten. Da jeder SM über eine Polymorph-Engine (mit je einem Teselator) verfügt, kann GTX 465 auf 11 und die GTX 460 nur auf 7 Polymorph-Engines und die gleiche Anzahl an Tesselatoren zurückblicken. Der etwas höhrere Takt (+11 %), kann die deutlich geringere Anzahl (-37 %) an Einheiten hierbei bei weitem nicht egalisieren. Ob die niedrigere Tesselations-Performance überhaupt einen Flaschenhals darstellt, werden wir im folgenden Kapitel mit einer gesonderten Benchmark-Reihe untersuchen.

Zwei verschiedene Varianten



Neben der gezeigten Variante mit 1024 MB, schickt NVIDIA mit dem heutigen Tag auch eine Version mit 768 MB Grafikspeicher ins Rennen. Zwar tragen beide den gleichen Namen, allerdings ergeben sich durch die Reduzierung der Speichergröße zwei weitere gravierende Einschränkungen beim kleineren Modell. Während die 1024-MB-Version mit dem vollen Speicherinterface mit 256 bit Breite und allen 32 ROPs ausgestattet ist, kann die 768-MB-Variante lediglich mit einem 192-bit-Speicherinterface und 24 ROPs aufwarten.

Die Ursache dessen liegt darin begründet, dass bei aktuellen NVIDIA-Architekturen jede ROP-Partition (bestehend aus 8 ROPs beim GF104) fest mit einem 64 bit Speichercontroller gekoppelt ist. Jeder Speichercontroller ist hierbei wiederum mit zwei Speicherchips verbunden. Der GF104 verfügt über insgesamt 4 ROP-Partitionen und dazugehörend 4 Speichercontroller, was in einem 256 bit Speicherinterface (4 Speichercontroller à 64 bit) und 32 ROPs (4 Partionen à 8 ROPs) resultiert.

Die 1024-MB-Version nutzt alle vorhanden Speichercontroller. Jeder Speichercontroller ist hierbei mit zwei Specherchips mit einer Kapazität von 1024 MBit (128 MB) verbunden. Unter dem Strich kommt die Karte somit auf die genannte 1024 MB Grafikspeicher (4 Controler à 2 Chips à 128 MB). Für kleinere Speichergrößen kommen für NVIDIA lediglich zwei Vorgehensweisen in Frage. Entweder man nutzt a) kleinere Speicherchips, oder b) weniger Chips.

Bild: NVIDIA GeForce GTX 460 – Der Jäger stellt sich vor
Fehlende Speicherchips auf der GTX 460 768 MB


Da es keine Zwischengrößen gibt, käme für Variante a) nur Speicherchips mit 512 MBit in Frage. Unter dem Strich hätte eine solche Karte ein 256 bit Speicherinterface aber nur 512 MB Speicher. Letzteres scheint NVIDIA für aktuelle Mainstream-Karten zu wenig gewesen zu sein, weshalb man sich für Variante b) entschieden hat. Die Karte wird einfach mit nur 3 aktiven Speichercontrollern, und somit lediglich 6 Speicherchips, ausgeliefert. Dies resultiert in einem 192 bit breitem Speicherinterface (3 Controller à 64 bit), und bei der Verwendung von 1024-Mbit-Chips in den angestrebten 768 MB.

Bild: NVIDIA GeForce GTX 460 – Der Jäger stellt sich vor
Blockschaltbild GeForce GTX 460 768 MB


Unter dem Strich bleibt also festzuhalten, dass sich die beiden Speicher-Varianten weitaus mehr als nur im Speicher unterscheiden. Gerade das kleinere Speicherinterface kostet der 768-MB-Variante zusätzliche Performance. An dieser Stelle hätten wir uns eine andere Namensgebung gewünscht, welche diesen Umstand deutlicher kennzeichnet. Aus den beschriebenen Konstellationen ergeben sich die folgenden theoretischen Eckdaten:

Merkmal GTX 480 GTX 465 GTX 460 1024 MB GTX 460 768 MB
Rechenleistung – SP (MADD) 1345 GFLOPs 855 GFLOPs 907,2 GFLOPs 907,2 GFLOPs
Rechenleistung – DP (MADD) 168,1 GFLOPs 106,9 GFLOPs 75,6 GFLOPs 75,6 GFLOPs
Texturierungsleistung (FP16 bilinear) 42,0 GTex/s 26,7 GTex/s 37,8 GTex/s 37,8 GTex/s
Pixelfüllrate 33,6 GPix/s 19,4 GPix/s 21,6 GPix/s 16,2 GPix/s
Speicherbandbreite 177,4 GB/s 102,6 GB/s 115,2 GB/s 86,4 GB/s


Die NVIDIA GeForce GTX 460 1024 MB kann sich hinsichtlich der – für den Spielemarkt ausschließlich relevanten – Rechenleistung bei Single-Precision (+6%), Pixelfüllrate (+11%) und Speicherbandbreite (+12%) leicht vor die GTX 465 setzen. Beide befinden sich allerdings in diesen Disziplinen auf einem ähnlichen Niveau. Hinsichtlich zusätzlicher Texturierungsleistung kann die GeForce GTX 460 den "großen" Bruder allerdings mit einem Plus von satten 42% regelrecht erschlagen.

Wirklich punkten kann die GTX 465 eigentlich nur noch durch die höheren Leistung beim Triangle-Setup in Folge der größeren Anzahl an Raster-Engines (3 ggü. 2 bei der GTX 460) und der massiv höheren Tessselationsleistung (ca. +40%). Die höhere Leistung im Bereich Tesselation ist dann eben auch NVIDIAs Begründung für die Berechtigung der Namensgebung der GeForce GTX 465. Wie sich die Karten dann tatsächlich in der Spiele-Umgebung schlagen, wird unser Benchmark-Parcours zeigen.

HDA-Bitstreaming auch bei NVIDIA


Abschließend noch eine freudige Botschaft für sämtliche HTPC-Anhänger mit Vorliebe zum digitalen Surround-Sound. Nachdem die Radeon Modelle seit der HD-5000-Serie DTS-HD und Dolby-TrueHD per Bitstream übertragen können, zieht nun auch NVIDIA mit der GTX 460 in dieser Hinsicht nach. Die Bezeichnung des Video-Prozessors lautet jedoch weiterhin auf VP4, wie bei den anderen Modellen der GTX-400-Serie, welche dieses Feature nicht unterstützen.

 

Inhalt dieses Testberichtes