EVGA GTX 660 Ti SC 3GB und 660-Ti-Referenzkarte im Test

Grafikkarten | HT4U.net | Seite 4

Technische Betrachtungen


2 GByte vs. 3 GByte- Theorien und Praxis



Wir wollen an dieser Stelle keinesfalls die GeForce-GTX-660-Ti-Daten erneut aufgreifen. Ein technische Betrachtung dessen hatten wir bereits in unserem Launch-Artikel vorgenommen. Allerdings wollen wir noch wenige Worte zur technischen Speicheranbindung der 2- und 3-GByte-Varianten verlieren um dann gleich in die Praxis zu schreiten.

Vergleicht man eine GeForce GTX 670 mit einer GeForce GTX 660 Ti, so scheinen die Unterschiede auf den ersten Blick marginal, denn in beiden Fällen attestiert NVIDIA den beiden Modellen einen identischen Takt für Speicher und GPU und auch die Shader-Recheneinheiten blieben gleich. Beschnitten hat man dabei allerdings die Speicheranbindung. War diese bei der GTX 670 noch mit einer Breite von 256 bit umgesetzt, kommt die GTX 660 Ti lediglich noch mit einer 192-bit-Anbindung daher.

Dieser Änderung fiel sowohl einer von vier 64-bit-Speichercontrollern zum Opfer, als auch 8 Raster-Operations-Einheiten (eine ROP-Partition). Den verbleibenden drei Speichercontroller stellt NVIDIA typische 2 GByte, in manchen Fällen auch 3 GByte, GDDR5-Speicher zur Seite. Bei einem standardmäßigen Speicher-Design sind in der Regel an jedem Speichercontroller zwei identische GDDR5-Chips im x32-Modus angebunden. Allerdings haben die größten derzeit verfügbaren GDDR5-Chips lediglich eine Kapazität von 2 Gbit (256 MByte). Bei sechs Speicherchips (aufgrund der drei 64-bit-Controller mit je zwei Chips) würde dies für die GTX 660 Ti eine Gesamtkapazität von maximal 1536 MB (6 x 256 MB) bedeuten.

Den Weg den NVIDIA bei der GeForce GTX 550 Ti beschritten hatte, ist somit bei der GTX 660 Ti nicht realisierbar um einen 2 GByte Hauptspeicher zu realisieren. Dort hatte NVIDIA schlicht mit Speicherchips unterschiedlicher Speicherdichte gearbeitet um den 1 GByte Speicher umzusetzen. Mangels GDDR5-Chips mit 4 Gbit Kapazität, ist dieser Weg nicht möglich um die gewünschten 2 GByte Speicher zu realisieren.

Bild: EVGA GTX 660 Ti SC 3GB und 660-Ti-Referenzkarte im Test
Gegenüberstellung x16- (Clamshell) und x32-Modus. Quelle: Qimonda.


Aus diesem Grund nutzt NVIDIA für beide Speicher-Varianten den sogenannten Clamshell-Modus. Ganz allgemein beschrieben, werden im Clamshell-Modus (x16-Modus) zwei Speicherchips parallel mit jeweils einem 16 bit breitem Datenbus angesteuert. Laut dem Speicherhersteller Elpida ist die Verwendung des Clamshell-Modus mit keinerlei Performance-Einbußen verbunden. Die vorstehende Abbildung zeigt eine Gegenüberstellung der beiden Betiebsmodi x32 und x16 bei GDDR5-Speicher.

Dies bedeutet im Falle von NVIDIA, dass bei Nutzung des Clamshell-Modus an einem 64-bit-Speichercontroller vier GDDR5-Chips angebunden sind. Für die 3-Gigabyte-Variante kann NVIDIA bei der Nutzung des x16-Modus somit zwölf 2-Gbit-Chips anbinden, was in einer Gesamtkapazität von 3096 MB resultiert.

Bild: EVGA GTX 660 Ti SC 3GB und 660-Ti-Referenzkarte im Test


Im Falle der 2-GByte-Variante setzt NVIDIA auf eine Kombination von x16-Modus (Clamshell) und x32-Modus. Ein Speichercontroller wird im Clamshell-Modus betrieben und steuert vier 2-Gbit-Chips an, während die anderen beiden Controller im x32-Modus arbeiten und über je zwei 2-Gbit-Chips verfügen. Im Gesamten resultiert dies in 8 Speicherchips mit je 2 Gbit Kapazität (256 MB), was in einer Gesamtkapazität von 2048 MB resultiert.

Bild: EVGA GTX 660 Ti SC 3GB und 660-Ti-Referenzkarte im Test


Dies ist der aktuell einzig logische und gangbare Weg, insbesondere auch um eine 3-GByte-Version mit 12 2-Gbit-Chips bieten zu können.

Update 06.09.2012:

Nach Rücksprache mit NVIDIA bestätigt uns der Hersteller die Korrekte Darstellung unserer vorstehenden Informationen und unserer Bilder zur Speicheranbindung. Gleichzeitig gab man uns folgendes Statement:
    The memory controller logic divides the GTX 660’s eight memory modules as follows:
  • Memory Controller 1: 4 pcs: 128M x 16 GDDR5 (1GB, 16-bit mode)
  • Memory Controller 2: 2 pcs: 64M x 32 GDDR5 (512MB, 32-bit mode)
  • Memory Controller 3: 2 pcs: 64M x 32 GDDR5 (512MB, 32-bit mode)

  • The three memory controllers segment the memory into equal size fragments of 512MB each to create a frame buffer size of 1.5GB and 192-bit interface. The remaining 512MB of memory is accessed in an additional memory transaction by memory controller 1 with a 64-bit width. This gives the GPU access to a full 2GB of video memory with minimal latency.

    For competitive purposes we aren’t providing further specifics on our mixed density memory implementation at this time.

Daraus lässt sich ableiten, dass die weiteren 512 MByte Speicher, angeschlossen an den Speichercontroller 3 (gem. unserem Schaubild), in der Praxis etwas langsamer arbeiten dürften. Unsere nachfolgenden Benchmarks sollen zeigen, ob sich in der Praxis Auswirkungen feststellen lassen.