AMD Radeon HD 4850 im Test

Grafikkarten | HT4U.net | Seite 2


Technik



Eckdaten AMD Radeon HD 4870 AMD Radeon HD 4850 AMD Radeon HD3870 NVIDIA GeForce GTX 280 NVIDIA GeForce GTX 260
Codename RV770 RV770 RV670 GTX 280 GTX 260
Fertigung 55 nm 55 nm 55 nm 65 nm 65 nm
Transistoren 965 Mio. 965 Mio. 666 Mio. 1,4 Mrd. 1,4 Mrd.
Taktrate Chip 750 MHz 625 MHz 775 MHz 602 MHz 576 MHz
Taktrate Shader 750 MHz 625 MHz 775 MHz 1296 MHz 1242 MHz
Taktrate Speicher (MHz) 900 MHz 1000 MHz 1125 MHz 1107 MHz 999 MHz
Taktrate Speicher (Mbps) 3600 Mbps 2000 Mbps 2250 Mbps 2214 Mbps 1998 Mbps
Speicherart GDDR5 GDDR3 GDDR4 GDDR3 GDDR3
typische Speichergröße 512 MB 512 MB 512 MB 1024 MB 896 MB
Speicheranbindung 256 bit 256 bit 256 bit 512 bit 448 bit
Shader Recheneinheiten 800 (160xVec5) unified Shader 800 (160xVec5) unified Shader 320 (64x Vec5) unified Shader 240 unified Shader 192 unified Shader
Typ Shadereinheiten Vec5 (Co Issue 1:1:1:1:1) Vec5 (Co Issue 1:1:1:1:1) Vec5 (Co Issue 1:1:1:1:1) Skalarprozessoren (1 Komponente) Skalarprozessoren (1 Komponente)
Fähigkeiten pro Shadereinheit MADD MADD MADD 1 MADD + 1 MUL 1 MADD + 1 MUL
Textur-Einheiten (TMUs) 40 40 16 80 64
Raster-Operation-Einheiten (ROP) 16 16 16 32 28
Shader-Model-Version 4.1 4.1 4.1 4.0 4.0
DirectX-Version DirectX 10.1 DirectX 10.1 DirectX 10.1 DirectX 10 DirectX 10


Das Augenscheinlichste, was der obigen Tabelle zu entnehmen ist, dürfte wohl die drastische Erhöhung der Anzahl der Shader-Einheiten beim RV770 gegenüber dem Vorgänger sein. Konnte der RV670 (R600) auf 320 Recheneinheiten zurückgreifen, stehen dem neuen AMD-Flaggschiff nun 800 Shader-Einheiten (+150%) zur Verfügung. Dies schlägt sich natürlich auch in der Zahl der Transistoren nieder, welche mit fast einer Milliarde Schaltwerke gegenüber dem Vorgänger um ca. 45% gestiegen ist – jedoch weiterhin deutlich hinter dem Transistor-Monster GTX 280 von NVIDIA liegt. Bezüglich des Fertigungsprozesses setzt AMD erneut auf eine Strukturbreite von 55 nm. Nachfolgend ein Überblick über den grundlegenden Aufbau des RV770.

Bild: AMD Radeon HD 4850 im Test

Wie bereits beim RV670 (Radeon HD 3850) bildet auch beim RV770 erneut die Architektur des R600-Chip die Basis, welche wir bei dessen Vorstellung im Mai 2007 bereits ausführlich behandelt haben. Im Wesentlichen verfügt der Chip über 10 Shader-Cluster, die sozusagen das Herzstück der GPU darstellen, und für Farbberechnungen (Shading) sowie Texturierung zuständig sind. Die Erhöhung von 4 Shader-Clustern (RV670) auf 10 Shader-Cluster (RV770) stellt dementsprechend auch die gravierendste Änderung des neuen AMD-Flaggschiffs dar.

Bild: AMD Radeon HD 4850 im Test

Jeder Shader-Cluster verfügt über 16 Vec5-Recheneinheiten. Eine Vec5-ALU führt hierbei eine Operation gleichzeitig auf fünf verschiedene Daten aus. Verwendet man AMD-Marketing-Begriffe könnte man also von 80 Stream Processing Units (16*5=80) pro Shader-Cluster sprechen. Im Gesamten kommt man somit auf die 800 SPUs (10*16*5=800) beim RV770 bzw. deren 320 (4*16*5=320) bei 4 Shader Clustern beim RV670. Jeder Shader-Cluster wird von eigener Kontrolllogik und eigenem lokalem Speicher (16 KB) komplettiert und stellt somit quasi ein selbständiges Rechenwerk dar. Der Datenaustausch zwischen den einzelnen Shader-Clustern erfolgt über einen globalen Speicher (ebenfalls 16 KB).

Bild: AMD Radeon HD 4850 im Test

Wie auch beim RV670 findet sich pro Shader-Cluster zudem ein Verbund von vier Texturierungseinheiten (TMUs) oder anders ausgedrückt eine Quad-TMU wieder. Bei 10 Shader Clustern verfügt der RV770 somit über 40 TMUs bzw. 10 Quad-TMUs. Jede TMU liefert hierbei pro Takt ein bilininear gefiltertes Pixel pro Takt (FP16). Die Anzahl von 4 ROPs (Raster Operation Units) am Ende der „Pipeline“ hat sich gegenüber dem RV670 nicht geändert, jedoch konnte die Füllrate bei MSAA (bei 64 bit Farbtiefe auch ohne AA) sowie die Depth/Stencil-Test um den Faktor 2 beschleunigt wurde. Über jede ROP-Partition wird Speicher mit je 64 bit angebunden, woraus schlussendliche ein 256 bit Speicherinterface resultiert.