Nehalem für alle - Intel Core i5 und Core i7 auf Sockel 1156 im Test

Prozessoren | HT4U.net | Seite 6

Der Core-Bereich: Hyperthreading



Wie bereits gerade erwähnt, hielt mit der Nehalem-Architektur die Hyperthreading-Technologie wieder Einzug in die Welt der Desktop-Rechner nachdem Intel die bereits mit dem Pentium 4 eingeführte Technik mit dem Start der Core-Prozessoren erst einmal beerdigte.

Das Ziel von Hyperthreading (HTT) – auch als Simultaneous Multithreading (SMT) bekannt – ist dabei nach wie vor das Gleiche wie vor 5 Jahren, nämlich eine bessere Auslastung der Recheneinheiten um deren Effizienz zu steigern, indem mehrere Befehlsstränge (Threads) zeitgleich abgearbeitet werden können. Bei HTT handelt es sich dabei um zwei Fäden die gleichzeitig durch den Prozessor laufen. Damit das Betriebssystem, welches letztendlich die Threads verwaltet, davon auch etwas mitbekommt, gaukelt jeder Prozessorkern der Software vor, dass es sich um zwei Kerne handeln würde. Im Falle eines Core i7-860 oder i7-870 Lynnfield-Prozessors erkennt das Betriebssystem also acht Kerne.

Bild: Nehalem für alle - Intel Core i5 und Core i7 auf Sockel 1156 im Test
Bild: Nehalem für alle - Intel Core i5 und Core i7 auf Sockel 1156 im Test
ohne HTTmit HTT

Neben der Effizienzsteigerung der Ausführungseinheiten hat Hyperthreading noch einen weiteren positiven Effekt. So kann dadurch eine gut parallelisierte Anwendung durchaus beschleunigt werden. Auch im Falle von vielen gleichzeitig ausgeführten Programmen profitiert der Anwender von der gesteigerten Performance. Dies rührt daher, dass die verschiedenen Aufgaben nun parallel statt sequentiell bearbeitet werden können.

Was jetzt erst einmal sehr positiv klingt, muss natürlich immer im richtigen Kontext gesehen werden. Für den geringen Kostenaufwand den Hyperthreading mitbringt, ist der Leistungsvorteil je nach Anwendung durchaus als sehr gut zu bezeichnen, doch an einen zweiten physikalischen Kern reicht der Leistungszuwachs in der Regel nicht heran. Dafür kostet die letztgenannte Variante jedoch auch in etwa doppelt so viel.

Bild: Nehalem für alle - Intel Core i5 und Core i7 auf Sockel 1156 im Test
Bild: Nehalem für alle - Intel Core i5 und Core i7 auf Sockel 1156 im Test
Mehrkern-ProzessorHyperthreading-Prozessor

Für Hyperthreading müssen hingegen lediglich ein paar Register doppelt angelegt sein und benötigen damit extra Fläche. Intel kalkulierte einst beim Pentium 4 mit rund fünf Prozent zusätzlicher Fläche. Beim Lynnfield dürfte es weit weniger sein. Andere Ressourcen wie die im Core-Kapitel angesprochenen TLBs werden einfach von beiden Threads genutzt. Der Reorder Buffer, welcher sich bei einem Out-of-Order-Design, bei dem die Befehle nicht zwingend in der ursprünglichen Programmreihenfolge ausgeführt werden, um die Wiederherstellung der ursprünglichen Befehlsreihenfolge kümmert, teilt ebenfalls seine 128 Einträge statisch zu je 64 Einträgen auf die beiden Threads auf. Selbiges gilt für die Lade- und Speicherpuffer. Die Reservation Station, die für die Zuteilung der Rechenaufgaben auf die einzelnen Ausführungseinheiten verantwortlich ist, kann hingegen die 36 Einträge dynamisch auf die beiden Befehlsfäden verteilen.

Der geringe zusätzliche Aufwand ist allerdings auch ein Grund, warum bei aktiviertem Hyperthreading die ein oder andere Anwendung sogar langsamer wird. Dies kann zum Beispiel dann passieren, wenn die zwei in Bearbeitung befindlichen Threads die gleichen Ausführungseinheiten benötigen und sich somit gegenseitig ausbremsen. Dem kann man dann eben wiederum nur mit einem "echten" zweiten Kern entgegenwirken.