Mehrkernprozessor
Der Begriff Multicore-Prozessor (auch: Mehrkernprozessor oder Multikernprozessor) bezeichnet einen Mikroprozessor mit mehr als einem vollständigen Hauptprozessor oder genauer Haupt-CPU auf einem einzigen Chip. Sämtliche Ressourcen mit Ausnahme des Bus und eventuell einiger Caches sind repliziert. Es handelt sich also um mehrere vollständige, weitgehend voneinander unabhängige Prozessoren inklusive eigener ALU, Registersätze und, sofern überhaupt vorhanden, FPU.
Als Dual-Core-Prozessor (Doppelkernprozessor) bezeichnet man einen Multicore-Prozessor mit zwei Hauptprozessoren. Mikroprozessoren mit einem Hauptprozessor bezeichnet man zur Abgrenzung als Single-Core (Einzelkernprozessor). Diese Terminologie lässt sich entsprechend fortsetzen. So spricht man bei vier Kernen von einem Quad-Core-Prozessor usw., wobei ein Quad-Core-Prozessor üblicherweise aus zwei Dual-Core-Prozessoren besteht.
Hyper-Threading-CPUs sind mehrfädige (engl. multithreading) Single-Core-Prozessoren mit mehreren Programmzählern und Registersätzen, die sich gegenüber dem System aber als Multicore-Prozessor melden. Es handelt sich bei Hyper-Threading-CPUs also nicht um echte Multicore-Prozessoren.
Multicore-Prozessoren wurden entwickelt, weil die Kosten für den Einsatz eines einzelnen Chips mit mehreren Ressourcen häufig geringer sind als bei mehreren einzelnen Chips. Anders betrachtet kann mit der gleichen Anzahl an Chip-Sockeln und Chips theoretisch die n-fache Rechenleistung erzielt werden (mit n = 2 bei Dual-Core). Die Praxis erweist, dass ein Dual-Core-Prozessor je nach Anwendung die 1,3- bis 1,7-fache Leistung erbringt.
Inzwischen ist aber die von den Prozessoren produzierte Abwärme eine weitere Triebkraft bei der Prozessor-Entwicklung. Die AMD Opteron Dual-Core Prozessoren produzieren nur unwesentlich mehr Abwärme als ein AMD Opteron mit nur einem Prozessorkern. Damit wurde z.B. die Prozessor-Abwärmeleistung für ein Mehrprozessorsystem halbiert. Dies ist für HPC-Cluster aber vor allem für die Blade-Center wesentlich, da hier auf engstem Raum eine Vielzahl von Prozessoreinheiten (Blades) verbaut sind und somit ein 19-Zoll Industrieschrank eine Abwärmeleistung von über 20 kW produzieren kann. Diese ist in der Regel durch konvektive Kühlung nicht mehr abführbar.
Sinn und Zweck von Multicore-Prozessoren
Multicore-Prozessoren stellen neben einer Erhöhung der Taktfrequenz und dem Pipelining eine von vielen Möglichkeiten dar, die Leistung von Mikroprozessoren zu erhöhen. Die reine theoretische Leistungssteigerung ist vergleichsweise effizient und beträgt maximal 100% (gegenüber einem einzelnen Kern) pro zusätzlichem Kern. In der Praxis hängt die Leistungssteigerung aber stark von dem Parallelisierungsgrad des ausgeführten Programms und des verwendeten Betriebssystems ab. Unix, der smp-Linux-Kernel und Windows XP unterstützen Multicore-Prozessoren. Dabei verteilt das Betriebssystem Prozesse und Anwendungen auf die einzelnen Prozessoren, die diese dann unabhängig parallel ausführen. Wird hingegen nur eine Anwendung ausgeführt, so muss diese für die mehreren Prozessoren parallelisiert werden. Das bedeutet, die Anwendung wird so modifiziert, dass sie komplett oder auch nur Fragmente davon gleichzeitig auf mehreren Prozessoren als Threads ausgeführt werden. Dazu gibt es grundsätzlich zwei Parallelisierungsstrategien: SMP (Shared-Memory-Programmierung) und MPI (Message-Passing-Interface-Programmierung).
So unterscheiden sich verschiedene Architekturen. Während manche Architekturen performancesteigernde Komponenten wie z.B. einen Shared Cache auf dem Chip unterbringen (z.B. IBMs POWER4 und folgende), bestehen bei anderen Architekturen die Änderungen lediglich darin, mehrere Cores auf einem Chip unterzubringen, um in der Argumentation um Softwarelizenzen eine geringere CPU-Zahl ausweisen zu können. (z.B. Suns Ultra SPARC IV). Prozessorbasiert lizenzierende Softwareunternehmen haben verschiedene Konzepte entwickelt, um auf diese Entwicklungen zu reagieren. So zählt z.B. Oracle jeden Prozessorkern auf einem Chip mit einer Anzahl <1, Microsoft hat angekündigt, nicht mehr die Kerne, sondern die Chips als Basis für die Lizenzierung heranzuziehen. (Sprich ein Multikernprozessor = 1 Lizenz).
Shared-Memory-Programmierung
Die Parallelisierung erfolgt bei OpenMP entweder automatisch durch Compiler-Optionen oder direkt mit Parallelisierungs-Direktiven bzw. mit Verwendung von parallelen mathematischen Bibliotheken in der Anwendung. OpenMP-Programme haben in der Regel eine wesentlich bessere parallele Effizienz, als mit MPI parallelisierte Programme, da die Prozessor-Kommunikation direkt über einen schnellen breitbandigen Datenbus geht. Nachteil ist, dass große Shared-Memory-Parallelrechner relativ teuer sind und die Prozessoranzahl begrenzt ist. Klassisches SMP-System ist die SGI Origin von Silicon Graphics.
Message-Passing-Programmierung
Das Rechengebiet (Domain) wird dabei zerlegt und auf alle Prozessoren verteilt (Domain-Decomposition). Jeder Prozessor rechnet lokal und kommuniziert über optimierte MPI-Funktionen mit den anderen Prozessoren. Programmbibliotheken sind beispielsweise MPI, PVM oder SHMEM. Vorteil ist die extrem kostengünstige Hardware, sogenannte commodity-systeme. Das bedeutet solche Rechner können aus standard PC Komponenten gebaut werden, wie sie bei jedem PC-Händler zu finden sind. Sie sind theoretisch unendlich skalierbar, d.h. es können nahezu unendlich viele Prozessoren zusammengeschlossen werden. Diese kommunizieren dann in der Regel über IP (Ethernet, Fast Ethernet, Gigabit Ethernet, Myrinet-2000, Infiniband, Quadrics). In der Regel fällt aber die Effizienz mit der Anzahl der Prozessoren, da die Interprozessorkommunikation zu stark zunimmt. Es gibt aber auch Anwendungen die umgekehrt skalieren, da hier Effekte des Domain-Decomposition einen effizienteren Umgang mit dem Speicher ermöglichen.
Varianten
Symmetrische Mehrkernprozessoren
In symmetrischen Mehrkernprozessoren sind die einzelnen Kerne gleich. Ein für diesen Prozessor übersetztes Programm kann auf jedem beliebigen seiner Kerne ausgeführt werden. Bei dieser Art von Mehrkernprozessoren handelt es sich um SMP-Systeme.
Da es sich bei Multicore-Prozessoren um eine Variante des SMP handelt, ist der Sinn und Zweck eines Multicore-Prozessors der, SMP Platz sparend umzusetzen.
Asymmetrische Mehrkernprozessoren
Bei asymmetrischen Mehrkernprozessoren gibt es verschiedene Kerne, die unterschiedlich gesteuert werden und eine unterschiedliche Maschinensprache verstehen. Ein Programm kann nur auf einem seiner Übersetzung entsprechenden Kern ausgeführt werden. Bei dieser Art von Mehrkernprozessoren arbeiten einige der Kerne wie klassische Hauptprozessoren, andere wie asynchrone Coprozessoren.
Liste einiger Multicore-Prozessoren
Dual-Core-Prozessoren
Derzeit werden folgende Dual-Core-Prozessoren gefertigt oder sind geplant:
- AMD Athlon 64 FX: Dual-Core-Version seit Januar 2006 erhältlich
- AMD Athlon 64 X2: seit Frühjahr 2005 erhältlich
- AMD Opteron: Dual-Core-Version seit 21. April 2005 erhältlich
- AMD Turion 64 X2: Dual-Core-Prozessor für mobile Anwendungen; Einführung am 17. Mai 2006
- IBM POWER4: seit 2001 erhältlich
- IBM POWER4+: seit 2002 erhältlich
- IBM POWER5: seit 19. November 2004 erhältlich
- IBM POWER5+: seit Oktober 2005 erhältlich
- IBM PowerPC 970MP: am 6. Juni 2005 vorgestellt
- Intel Core Duo: seit Januar 2006 erhältlich
- Intel Core 2 Duo: Einführung Juli 2006
- Intel Core 2 Extreme: Einführung Juli 2006
- Intel Pentium D: seit Frühjahr 2005 erhältlich
- Intel Pentium Extreme Edition: seit Frühjahr 2005 erhältlich
- Intel Xeon DP: im Oktober 2005 vorgestellt
- Via C7: Dual-Core-Prozessor, für 2006 erwartet.
Multicore-Prozessor mit mehr als zwei Prozessor-Kernen
Derzeit werden folgende Multicore-Prozessoren gefertigt oder sind geplant:
- IBM / Sony / Toshiba Cell: 64-Bit-PowerPC-Kern und acht speziell ausgelegten "Synergistic"-Kernen (PlayStation 3)
- IBM POWER5+: Quad-Core seit Oktober 2005 erhältlich
- IBM POWER6: Markteinführung für 2007 erwartet
- Intel Clovertown und Kentsfield: Multicore-Prozessoren mit Intel Core-Mikroarchitektur, Einführung 2007
- SUN UltraSPARC T1 (Niagara): vier, sechs oder acht SPARC-Kerne