Zum Inhalt springen

Mehrkernprozessor

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 4. September 2006 um 09:06 Uhr durch 129.13.186.1 (Diskussion) (Rechtschreibfehler korrigiert). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Der Begriff Multicore-Prozessor (auch: Mehrkernprozessor oder Multikernprozessor) bezeichnet einen Mikroprozessor mit mehr als einem vollständigen Hauptprozessor oder genauer Haupt-CPU auf einem einzigen Chip. Sämtliche Ressourcen mit Ausnahme des Bus und eventuell einiger Caches sind repliziert. Es handelt sich also um mehrere vollständige, weitgehend voneinander unabhängige Prozessoren inklusive eigener ALU, Registersätze und, sofern überhaupt vorhanden, FPU.

Als Dual-Core-Prozessor (Doppelkernprozessor) bezeichnet man einen Multicore-Prozessor mit zwei Hauptprozessoren. Mikroprozessoren mit einem Hauptprozessor bezeichnet man zur Abgrenzung als Single-Core (Einzelkernprozessor). Diese Terminologie lässt sich entsprechend fortsetzen. So spricht man bei vier Kernen von einem Quad-Core-Prozessor usw., wobei ein Quad-Core-Prozessor üblicherweise aus zwei Dual-Core-Prozessoren besteht.

Hyper-Threading-CPUs sind mehrfädige (engl. multithreading) Single-Core-Prozessoren mit mehreren Programmzählern und Registersätzen, die sich gegenüber dem System aber als Multicore-Prozessor melden. Es handelt sich bei Hyper-Threading-CPUs also nicht um echte Multicore-Prozessoren.

Multicore-Prozessoren wurden entwickelt, weil die Kosten für den Einsatz eines einzelnen Chips mit mehreren Ressourcen häufig geringer sind als bei mehreren einzelnen Chips. Anders betrachtet kann mit der gleichen Anzahl an Chip-Sockeln und Chips theoretisch die n-fache Rechenleistung erzielt werden (mit n = 2 bei Dual-Core). Die Praxis erweist, dass ein Dual-Core-Prozessor je nach Anwendung die 1,3- bis 1,7-fache Leistung erbringt.

Inzwischen ist aber die von den Prozessoren produzierte Abwärme eine weitere Triebkraft bei der Prozessor-Entwicklung. Die AMD Opteron Dual-Core Prozessoren produzieren nur unwesentlich mehr Abwärme als ein AMD Opteron mit nur einem Prozessorkern. Damit wurde z.B. die Prozessor-Abwärmeleistung für ein Mehrprozessorsystem halbiert. Dies ist für HPC-Cluster aber vor allem für die Blade-Center wesentlich, da hier auf engstem Raum eine Vielzahl von Prozessoreinheiten (Blades) verbaut sind und somit ein 19-Zoll Industrieschrank eine Abwärmeleistung von über 20 kW produzieren kann. Diese ist in der Regel durch konvektive Kühlung nicht mehr abführbar.

Sinn und Zweck von Multicore-Prozessoren

Multicore-Prozessoren stellen neben einer Erhöhung der Taktfrequenz und dem Pipelining eine von vielen Möglichkeiten dar, die Leistung von Mikroprozessoren zu erhöhen. Die reine theoretische Leistungssteigerung ist vergleichsweise effizient und beträgt maximal 100% (gegenüber einem einzelnen Kern) pro zusätzlichem Kern. In der Praxis hängt die Leistungssteigerung aber stark von dem Parallelisierungsgrad des ausgeführten Programms und des verwendeten Betriebssystems ab. Unix, der smp-Linux-Kernel und Windows XP unterstützen Multicore-Prozessoren. Dabei verteilt das Betriebssystem Prozesse und Anwendungen auf die einzelnen Prozessoren, die diese dann unabhängig parallel ausführen. Wird hingegen nur eine Anwendung ausgeführt, so muss diese für die mehreren Prozessoren parallelisiert werden. Das bedeutet, die Anwendung wird so modifiziert, dass sie komplett oder auch nur Fragmente davon gleichzeitig auf mehreren Prozessoren als Threads ausgeführt werden. Dazu gibt es grundsätzlich zwei Parallelisierungsstrategien: SMP (Shared-Memory-Programmierung) und MPI (Message-Passing-Interface-Programmierung).

So unterscheiden sich verschiedene Architekturen. Während manche Architekturen performancesteigernde Komponenten wie z.B. einen Shared Cache auf dem Chip unterbringen (z.B. IBMs POWER4 und folgende), bestehen bei anderen Architekturen die Änderungen lediglich darin, mehrere Cores auf einem Chip unterzubringen, um in der Argumentation um Softwarelizenzen eine geringere CPU-Zahl ausweisen zu können. (z.B. Suns Ultra SPARC IV). Prozessorbasiert lizenzierende Softwareunternehmen haben verschiedene Konzepte entwickelt, um auf diese Entwicklungen zu reagieren. So zählt z.B. Oracle jeden Prozessorkern auf einem Chip mit einer Anzahl <1, Microsoft hat angekündigt, nicht mehr die Kerne, sondern die Chips als Basis für die Lizenzierung heranzuziehen. (Sprich ein Multikernprozessor = 1 Lizenz).

Shared-Memory-Programmierung

Die Parallelisierung erfolgt bei OpenMP entweder automatisch durch Compiler-Optionen oder direkt mit Parallelisierungs-Direktiven bzw. mit Verwendung von parallelen mathematischen Bibliotheken in der Anwendung. OpenMP-Programme haben in der Regel eine wesentlich bessere parallele Effizienz, als mit MPI parallelisierte Programme, da die Prozessor-Kommunikation direkt über einen schnellen breitbandigen Datenbus geht. Nachteil ist, dass große Shared-Memory-Parallelrechner relativ teuer sind und die Prozessoranzahl begrenzt ist. Klassisches SMP-System ist die SGI Origin von Silicon Graphics.

Message-Passing-Programmierung

Das Rechengebiet (Domain) wird dabei zerlegt und auf alle Prozessoren verteilt (Domain-Decomposition). Jeder Prozessor rechnet lokal und kommuniziert über optimierte MPI-Funktionen mit den anderen Prozessoren. Programmbibliotheken sind beispielsweise MPI, PVM oder SHMEM. Vorteil ist die extrem kostengünstige Hardware, sogenannte commodity-systeme. Das bedeutet solche Rechner können aus standard PC Komponenten gebaut werden, wie sie bei jedem PC-Händler zu finden sind. Sie sind theoretisch unendlich skalierbar, d.h. es können nahezu unendlich viele Prozessoren zusammengeschlossen werden. Diese kommunizieren dann in der Regel über IP (Ethernet, Fast Ethernet, Gigabit Ethernet, Myrinet-2000, Infiniband, Quadrics). In der Regel fällt aber die Effizienz mit der Anzahl der Prozessoren, da die Interprozessorkommunikation zu stark zunimmt. Es gibt aber auch Anwendungen die umgekehrt skalieren, da hier Effekte des Domain-Decomposition einen effizienteren Umgang mit dem Speicher ermöglichen.

Varianten

Symmetrische Mehrkernprozessoren

In symmetrischen Mehrkernprozessoren sind die einzelnen Kerne gleich. Ein für diesen Prozessor übersetztes Programm kann auf jedem beliebigen seiner Kerne ausgeführt werden. Bei dieser Art von Mehrkernprozessoren handelt es sich um SMP-Systeme.

Da es sich bei Multicore-Prozessoren um eine Variante des SMP handelt, ist der Sinn und Zweck eines Multicore-Prozessors der, SMP Platz sparend umzusetzen.

Asymmetrische Mehrkernprozessoren

Bei asymmetrischen Mehrkernprozessoren gibt es verschiedene Kerne, die unterschiedlich gesteuert werden und eine unterschiedliche Maschinensprache verstehen. Ein Programm kann nur auf einem seiner Übersetzung entsprechenden Kern ausgeführt werden. Bei dieser Art von Mehrkernprozessoren arbeiten einige der Kerne wie klassische Hauptprozessoren, andere wie asynchrone Coprozessoren.

Liste einiger Multicore-Prozessoren

Dual-Core-Prozessoren

Derzeit werden folgende Dual-Core-Prozessoren gefertigt oder sind geplant:

Multicore-Prozessor mit mehr als zwei Prozessor-Kernen

Derzeit werden folgende Multicore-Prozessoren gefertigt oder sind geplant:

Siehe auch

Multithreading (hardwareseitig)