Transactional Synchronization Extensions
Die Transactional Synchronization Extensions − New Instructions (TSX−NI oder meist nur TSX) sind eine Erweiterung der x86-Architektur um Transaktionalen Speicher, womit die Ausführung von paralleler Software beschleunigt werden kann.[1]
Verbreitung
TSX wurde im Februar 2012 offiziell vorgestellt und im Juni 2013 erstmals in ausgewählten Prozessoren der Haswell-Architektur ausgeliefert. Mit Broadwell und Skylake fand TSX auch Eingang in Desktop-Prozessoren. Aufgrund eines Fehlers im Microcode wurde TSX aber bei zahlreichen Modellen der Haswell- und Broadwell-Architektur via UEFI-Update nachträglich deaktiviert; Die Version aus der Skylake-Architektur wurde hingegen ohne Änderung auch in Kaby Lake weiterverwendet und ist seit Kaby Lake auch in Celeron- und Pentium-Modellen erhältlich.
Funktion
TSX stellt zwei Schnittstellen zur Verfügung, um Code für parallele Abarbeitung zu erzeugen: Zunächst existiert mit Hardware Lock Elision (HLE) eine Schnittstelle zu Prozessoren, die nicht über TSX verfügen. Mit Restricted Transactional Memory (RTM) wird eine neue Befehlssatzerweiterung eingeführt, um effizienteren Code zu erzeugen.
Im Hauptspeicher werden Regionen definiert, in denen einerseits Berechnungen ausgeführt und Ergebnisse abgespeichert werden, in die andererseits fallweise aber auch Ergebnisse aus anderen Berechnungen geschrieben werden. Wird nun tatsächlich ein Ergebnis einer fremden Berechnung in so eine definierte Region abgespeichert, so werden die zuvor daraus ermittelten Ergebnisse verworfen und die Berechnungen erneut ausgeführt. Sämtliche derartige Berechnungen sind daher zunächst spekulativ (Speculative execution) und bringen erst im Zeitverlauf ein valides Ergebnis.
Mittels TSX wird nun, wenn die Software dahingehend überarbeitet wurde, Code wirklich parallel ausgeführt, wobei die sich ergebenden Abhängigkeiten automatisch ermittelt werden und gefundene Abhängigkeiten erneut berechnet werden. Bisher musste Software in Prozesse oder Threads aufgeteilt werden, um parallel ausgeführt zu werden, und Abhängigkeiten mussten in der Programmierung berücksichtigt werden. Nun werden einfach die zusammenhängenden Codebereiche gekennzeichnet, den Rest erledigt TSX automatisch, wenn mehrere Codebereiche interagieren.
In Benchmarks zeigte sich, dass Applikationen mit TSX rund 40 % schneller, datenintensive Anwendungen aber um ein Mehrfaches schneller ausgeführt werden können.[2]
Unterstüztung
Unter Linux wird TSX mithilfe der TSX-Tools, das ist eine Sammlung von Werkzeugen und Bibliotheken, softwareseitig erleichtert.[3]
Trivia
Die vergleichbare Erweiterung bei AMD wird Advanced Synchronization Facility genannt.
Einzelnachweise
- ↑ Richard M. Yoo, Christopher J. Hughes, Konrad Lai, Ravi Rajwar: Performance Evaluation of Intel Transactional Synchronization Extensions for High-Performance Computing. (PDF) In: intel-research.net. November 2013, abgerufen am 23. Dezember 2016.
- ↑ Tomas Karnagel, Roman Dementiev, Ravi Rajwar, Konrad Lai, Thomas Legler, Benjamin Schlegel, Wolfgang Lehner: Improving In-Memory Database Index Performance with Intel Transactional Synchronization Extensions. (PDF) In: software.intel.com. Februar 2014, abgerufen am 23. Dezember 2016.
- ↑ TSX-Tools auf github.com, abgerufen am 25. Dezember 2016