AMD FX-8150 - Bulldozer im ausführlichen Test

Prozessoren | HT4U.net | Seite 13

Cache-Latenzen


AMD hat sowohl den L3-Cache als auch den L2-Cache gegenüber der Vorgängergeneration mit Bulldozer deutlich vergrößert. Im Gegenzug schrumpft der L1-Daten-Cache auf mickrige 16 KByte. Da Größenänderungen in aller Regel auch Anpassungen bei den Zugriffslatenzen nach sich ziehen, waren wir auf die Werte für Bulldozer sehr gespannt. Ein Vergleich mit diversen anderen CPUs findet sich dazu in der nachfolgenden Tabelle.

ArchitekturModellL1-CacheL2-CacheL3-Cache
GrößeLatenzGrößeLatenzGrößeLatenz
AMD BulldozerFX-815016 KByte4 Zyklen2048 KByte21 Zyklen8 MByte69 Zyklen
Intel Sandy BridgeCore i7 2600K32 KByte4 Zyklen256 KByte11 Zyklen8 MByte26 Zyklen
Intel WestmereCore i7 980X32 KByte4 Zyklen256 KByte11 Zyklen8 MByte43 Zyklen
Intel WestmereCore i5 66132 KByte4 Zyklen256 KByte11 Zyklen4 MByte39 Zyklen
Intel NehalemCore i7 87032 KByte4 Zyklen256 KByte11 Zyklen8 MByte39 Zyklen
Intel NehalemCore i7 96532 KByte4 Zyklen256 KByte11 Zyklen8 MByte36 Zyklen
Intel PenrynCore 2 Quad QX965032 KByte3 Zyklen2x 6144 KByte15 Zyklen--
Intel PineviewAtom D52524 KByte3 Zyklen512 KByte20 Zyklen--
AMD LlanoA8-385064 KByte3 Zyklen1024 KByte21 Zyklen--
AMD BobcatE-35032 KByte3 Zyklen512 KByte24 Zyklen--
AMD ThubanPhenom II X6 1100T64 KByte4 Zyklen512 KByte10 Zyklen6 MByte54 Zyklen
AMD DenebPhenom II X4 97064 KByte4 Zyklen512 KByte10 Zyklen6 MByte58 Zyklen
AMD DenebAhtlon II X4 64564 KByte3 Zyklen512 KByte15 Zyklen--
AMD DenebAthlon II X2 240e64 KByte3 Zyklen1024 KByte15 Zyklen--
AMD BrisbaneAthlon 64 X2 5000+64 KByte3 Zyklen512 KByte20 Zyklen--
Größe und Latenz der Caches einiger Prozessorfamilien


Sehr eindrucksvoll sieht man, dass AMD mit Bulldozer in Sachen Cache-Latenzen nicht sonderlich gut abschneidet. Der kleine L1-Cache braucht weiterhin 4 Zyklen, der große L2-Cache ist mit 21 Zyklen ebenfalls nicht sonderlich flott und der L3-Cache ist mit 69 Zyklen (19 ns) gerade zu lahm. Zum Vergleich: Ein Core i7 2600K besitzt eine Zugriffsdauer von weniger als der Hälfte (28 Zyklen oder 8 ns) und ein Phenom II X6 1100T ist mit (54 Zyklen und 15 ns) ebenfalls schneller. Offenbar hat man die Caches für einen zu hohen Takt ausgelegt, der nun nicht erreicht werden kann.


Cache-Bandbreite


Doch nicht nur die Cache-Latenzen haben einen maßgeblichen Einfluss auf die Leistung sondern auch die zur Verfügung stehende Bandbreite bei lesenden und schreibenden Zugriffen. Wie wir gesehen haben, besitzt das neue Cache-System der Bulldozer-Prozessoren einige Eigenheiten, so dass ein Blick auf die Cache-Bandbreiten auf jeden Fall lohnenswert ist.

ArchitekturModellL1-CacheL2-CacheL3-Cache
LesenSchreibenLesenSchreibenLesenSchreiben
AMD BulldozerFX-81501142338202411
Intel Sandy BridgeCore i7 2600K1105561323123
Intel WestmereCore i7 980X55553733138
Intel WestmereCore i5 661454530272117
Intel NehalemCore i7 870474731282316
Intel NehalemCore i7 965555537331714
Intel PenrynCore 2 Quad QX965046462216--
AMD LlanoA8-385092462318--
AMD ThubanPhenom II X6 1100T11859302399
AMD DenebPhenom II X4 970112562822810
Bandbreite der Caches einiger Prozessorfamilien


Bei Bulldozer ergeben sich signifikante Unterschiede gegenüber anderen Prozessor-Architekturen. Zunächst einmal ist die wahrlich schlechte Bandbreite des L1-Daten-Caches bei schreibenden Zugriffen zu nennen. Wie schon im Theoriekapitel zu diesem Cache dargelegt, handelt es sich um einen Write-Through-Cache, d. h. die Daten werden mehr oder weniger direkt in den L2-Cache geschrieben, so dass dessen Bandbreite bei schreibenden Zugriffen auch beim L1-Cache ausschlaggebend ist.

Auch die L2-Cache-Bandbreite ist in unserem Augen für die doch sehr kleinen L1-Caches recht gering. Ob diese zusammen mit den Prefetchern um Daten noch bevor sie benötigt werden ausreicht um die Größe des L1-Daten-Caches zu kompensieren, werden wir später noch sehen.


 

Inhalt dieses Testberichtes