Streaming SIMD Extensions

Die Streaming SIMD Extensions (SSE), früher auch Internet Streaming Extensions (ISSE) ist eine von Intel entwickelte Befehlssatzerweiterung der X86er-Architektur, der mit der Einführung des Pentium-III-(Katmai)-Prozessors 1999 vorgestellt wurde und deshalb anfangs den Namen Katmai New Instructions (KNI) trug. Zweck ist es Programme durch Parallelisierung auf Instruktionslevel zu beschleunigen, genannt SIMD.
Konzept
Im Gegensatz zu der vorher veröffentlichten MMX-Befehlssatzerweiterung wurde SSE speziell für Gleitkommazahl-Datentypen entwickelt, außerdem wurden eigene und doppelt so breite 128 Bit-Register spendiert, häufig bemängelte Schwächen beim MMX-Instruktionssatz. Intel entschied sich auch den SSE-Instruktionssatz völlig neuzuentwickeln und nicht kompatibel zu dem bereits 1998 von Konkurrent AMD veröffentlichten 3DNow-Instruktionen zu machen, welche einen vergleichbaren Zweck erfüllten. Dieser Schritt war langfristig erfolgreich, SSE setzte sich gegenüber 3DNow durch und AMD unterstützt später ebenfalls nur noch SSE und ließ die 3DNow-Unterstützung auslaufen.[1]
Obwohl anfänglich im Namen (ISSE) ausdrücklich erwähnt, hat diese Technik direkt nichts mit dem Internet zu tun; vielmehr diente der Verweis der besseren Vermarktung (Intel warb bei Einführung des Pentium III u. a. damit, dass das Internetsurfen schneller bzw. generell aufregender werden würde). Nach kurzer Zeit ließ auch Intel das „I“ wegfallen, so dass man heutzutage nur noch von SSE spricht.
SSE-Weiterentwicklung
Der seit geraumer Zeit existierende Wettkampf zwischen AMD und Intel über die Definitionshoheit bei der Weiterentwicklung der x86-Architektur, führte seit ca. SSE3 zu inkompatiblen Erweiterungen von SSE.[2]
SSE2, SSE3, SSSE3, SSE4, SSE4a und SSE5 sind jüngere Erweiterungen bzw. Erweiterungsvorschläge von SSE sowohl von AMD als auch Intel. Inzwischen existiert mit den Advanced Vector Extensions ein weiterer Entwicklungszweig.
Technischer Aufbau

Die SSE-Befehlssatzerweiterung umfasst 70 Instruktionen und 8 neue Register XMM0 bis XMM7.
Wie AMDs 3DNow!-Erweiterungen ist auch SSE primär für Gleitkommaoperationen ausgelegt. Intel führte allerdings mit dem Pentium III neue 128 Bit breite Register ein, so dass mit SSE-Befehlen doppelt so viele Daten auf einmal parallel verarbeitet werden können wie mit dem auf 64-Bit-Registern basierenden 3DNow. Dies geht bei den damaligen Prozessoren jedoch nicht mit höherem Berechnungsdurchsatz einher, da die 128-Bit-SSE-Befehle intern in je zwei 64-Bit-SSE-Micro-Ops zerlegt werden, weil die internen Execution Units und ihre Datenpfade nur 64 Bit breit sind.[3] Bei aktuellen Prozessoren wie denen, die auf der Core-Mikroarchitektur basieren, werden die 128 Bit breiten SSE-Register tatsächlich in einem Schritt verarbeitet.
Unterstützung in den CPUs
Da SSE eine der ersten SIMD-Erweiterungen der x86-Architektur ist und bereits im Jahr 1999 auf den Markt kam, besitzen eigentlich alle x86-CPUs der letzten Jahre SSE. Eine vollständige Liste aller CPUs mit SSE wäre also sehr unübersichtlich. An dieser Stelle sei daher auf die Liste von Mikroprozessoren verwiesen.
Beispielsweise unterstützte AMD ab dem Athlon einen Teil der im SSE-Befehlssatz enthaltenen Befehle (unter anderem die, die mit 64-Bit-Registern arbeiten). Hierbei spricht man auch von einer Erweiterung von MMX. Seit dem Athlon-XP-Prozessor wird SSE vollständig unterstützt, inzwischen soweitgehend das sogar die eigene Erweiterung 3Dnow aufgegeben wurde.
Nachfolgend eine Übersicht, ab welcher CPU-Familie die jeweiligen Hersteller SSE integriert haben:
- AMD: ab Athlon XP komplett, beim Athlon und Duron (seit Prozessorkern Morgan) nur teilweise.
- Centaur Technology: beim C3 mit Prozessorkern Nehemiah
- Intel: ab Pentium III, beim Celeron mit Prozessorkern Coppermine
- Transmeta: ab Efficeon
Einzelnachweise
- ↑ 3DNow! Instructions are Being Deprecated (englisch)
- ↑ Agner Fog: Stop the instruction set war. agner.org, 5. Dezember 2009, abgerufen am 12. Mai 2012 (englisch).
- ↑ Jon Stokes: Into the Core: Intel's next-generation microarchitecture. arstechnica.com, 5. April 2006, archiviert vom am 1. April 2007; abgerufen am 12. Mai 2012 (englisch).