AMD Kaveri APUs im Test

Prozessoren | HT4U.net | Seite 9

Architektur GCN: Compute Unit



Die Compute-Units stellen das Herzstück der GCN-Architektur dar, denn hier findet der Großteil der Berechnungen für die 3D- oder GPGPU-Anwendungen statt. Wie bereits im vorherigen Kapitel aufgezeigt, verlässt AMD für seine Rechenwerke die VLIW-Architektur und setzt stattdessen auf Einzel-Instruktionen für seine Recheneinheiten. Wichtigster Bestandteil jeder Compute Unit sind hierbei die vier 16-fach-SIMD-Einheiten (Vec16) die mit vier unabhängigen Befehlen von einem dedizierten Scheduler gefüttert werden. Jedem Vec16-Rechenwerk steht hierbei ein 64 KB Register-File zur Seite. Jede Vec16-Einheit kann pro Takt 16 FP-MAD-Operationen bei Single Precision (32-Bit) beziehungsweise 4 FP-MAD-Operationen bei Double Precision (64-Bit) beisteuern.

Bild: AMD Radeon HD 7970 im Test

Blockschaltbild einer Compute Unit


Für den 3D-Spiele-Bereich von essentieller Bedeutung sind zudem die Textureinheiten (TMUs). Von diesen verfügt jede Compute-Unit über deren vier Einheiten mit 16 Texture-Fetch-Units. Des Weiteren findet sich auch eine Scalar-Unit in der Compute-Unit wieder, welche ganzzahlige 32- und 64-Bit-Werte verarbeiten kann. Die Skalar-Unit dient laut AMD neben dem Management des Kontrollflusses auch Adressberechnungen und Spezialfunktionen wie dem Auslesen eines 64-Bit-Hardware-Timers.

Bild: AMD Radeon HD 7970 im Test

Cache-Hierarchie innerhalb der GCN-Architektur


Zum internen Datenaustausch innerhalb einer Compute-Unit verfügt diese über einen Local Data Share (LDS) mit 64 KB Größe. Für die Synchronisation über die einzelnen Compute-Units hinweg kann hingegen der Global Data Share (GDS) genutzt werden. Hinsichtlich der Cache-Hierarchie verfügt jede Compute-Unit über einen 16 KB großen L1-Cache. Zudem liegt je Speicher-Controller noch ein 128 KB großer L2-Cache vor, was bei sechs Speicher-Controllern in einer Gesamtgröße von 768 KB resultiert.