Zum Inhalt springen

RAID

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 22. Juni 2004 um 11:17 Uhr durch 217.255.220.90 (Diskussion) ('''RAID 1''': Spiegelung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Ein RAID-System (Abk. Redundant Array of Inexpensive / Independent Disks) dient zur Organisation von mehreren Festplatten bei einem Computer. Dadurch kann man Betriebssicherheit, Leistung und/oder Kapazität erhöhen. Dazu gibt es verschiedene Möglichkeiten, die man als RAID-Levels definiert hat.

Die Möglichkeit fehlertoleranter Systeme sind standardisiert und zu verschiedenen Levels zusammengefasst. Diese Levels werden als RAID bezeichnet. Sie repräsentieren verschiedene Kombinationen aus Leistung, Zuverlässigkeit und Kosten, d. h. durch Zusammenschaltung mehrerer Festplatten erhält man eine:

  • Erhöhung der Datensicherheit (Redundanz)
  • Steigerung der Transferraten
  • Aufbau großer, logischer Laufwerke

Geschichte

1987 veröffentlichte D. A. Patterson, G. Gibson und R.H. Katz von der University of California, Berkeley, USA einen Vorschlag um die langsamen Plattenzugriffe zu beschleunigen, indem die Daten auf vielen kleineren Platten anstatt auf wenigen großen abgelegt werden. (Paper: "A Case for Redundant Arrays of Inexpensive Disk (RAID)) Die Varianten Raid-0 und Raid-6 wurden erst später von der Industrie geprägt. Seit 1992 erfolgt eine Standardisierung durch das RAB (RAID Advisory Board). (ca. 50 Hersteller)

Die RAID-Levels im Einzelnen:

RAID 0: zusammengeschlossene Festplatten ohne Fehlertoleranz (Redundanz)

RAID 0 bietet gesteigerte Transferraten, indem mehrere Festplatten zusammengeschlossen werden und Schreiboperationen auf allen parallel durchgeführt werden (Striping). Die Performance-Steigerung (insbesondere bei sequentiellen Zugriffen) beruht darauf, dass die zu schreibenden Daten zunächst auf die Caches der verschiedenen Platten verteilt werden und jede einzelne Platte so weniger zu tun hat. Umgekehrt wird auch der Lesevorgang beschleunigt. Fällt jedoch eine der Festplatten durch einen Defekt aus, lassen sich die Daten nicht mehr rekonstruieren, da die Teildaten, aus denen der RAID-Controller nachher die ursprüngliche Datei zusammensetzt, jeweils nur auf einer Platte liegen. Streng genommen ist dies gar kein RAID, da es keine Redundanz gibt.

RAID 1: Spiegelung

RAID 1 bietet Redundanz der gespeicherten Daten, da diese immer auf mindestens zwei Festplatten in identischer Form vorliegen (mirroring). Fällt eine Platte aus, kann eine andere für sie einspringen. Obwohl RAID 1 die optimale Ausfallssicherheit bietet, wird es meist nur in kleinen Servern eingesetzt, da das doppelte der nutzbaren Festplattenkapazität benötigt wird, was schnell recht teuer werden kann.;)

RAID 2:

RAID 2 gibt es in der Praxis nicht, es stellt lediglich ein Abstraktionsmodell für die Funktionsweise der nachfolgenden RAID-Level dar: Auf einer Platte des RAID-Array werden Paritätsinformationen abgespeichert, die man aus der XOR-Verknüpfung (exklusives Oder) von jeweils zwei voneinander unabhängigen Datenblöcken auf unterschiedlichen Platten erhält. Sollte nun eine der Platten ausfallen, kann der Controller die Teil-Daten auf der defekten Platte unter Zuhilfenahme der Paritäts-Blöcke und des Stücks auf der anderen Platte rekonstruieren, indem er wieder XOR-verknüpft.

RAID 3:

RAID 3 ist inzwischen fast vom Markt verschwunden. Es stellt eine Implementierung von RAID 2 mit relativ geringen Paritätsblock-Größen dar.

RAID 4:

RAID 4 ist ebenfalls nie kommerziell erfolgreich gewesen, da die notwendigen Controller sehr teuer sind. Prinzipiell ist es eine Implementierung von RAID 2 mit größeren Paritätsblöcken.

RAID 5:

RAID 5 bietet sowohl gesteigerte Performance als auch Redundanz und ist damit die beliebsteste RAID-Variante. Darüberhinaus ist es die kostengünstigste Möglichkeit Daten mit Redundanz zu Speichern. Es werden mindestens 3 Platten benötigt. Bei n Platten sind (n-1)/n der Gesamtkapazität nutzbar; das restliche 1/n wird für die Paritätsdaten (Redundanz) benötigt. Zum Vergleich: bei RAID 1 lassen sich nur 1/2 der reellen Kapazität wirklich verwenden. Die Daten werden wie bei RAID 0 auf alle Festplatten verteilt. Die Paritätsinformationen werden jedoch nicht auf einer Platte konzentriert, sondern ebenfalls verteilt. Da sie im Normalfall nicht benötigt werden, stehen alle Platten zum parallelen Zugriff zur Verfügung. Bei RAID 5 ist die Datensicherheit beim Ausfall maximal einer Platte gewährleistet.

RAID 6:

RAID 6 funktioniert ähnlich wie RAID 5, verkraftet aber den Ausfall von bis zu zwei Festplatten. Hier werden nicht ein, sondern zwei Fehlerkorrekturwerte berechnet und so über die Platten verteilt, dass Daten und Paritätsblöcke auf unterschiedlichen Platten liegen.

RAID 7:

RAID 7, eine kaum verwendete Variante der Technologie, hat RAID 5 zur Grundlage. Allerdings läuft hierbei im Controller ein lokales Echtzeitbetriebssystem, welches die Lese- und Schreiboperationen steuern soll. RAID 7 unterstützt zusätzlich die Verwendung mehrerer Paritätsinformationen gemäß RAID 6.

Weitere:

Außerdem gibt es noch "RAID-Kombinationen", bei denen mehrere Platten zu einem parallelen RAID 0 zusammengefasst werden, und aus mehreren dieser RAID-0-Arrays z.B. ein RAID-5-Array gebildet wird. Man bezeichnet diese Kombinationen dann z.B. als RAID 50 (5+0). Die beliebteste Kombination ist allerdings das RAID 10, bei dem je zwei Platten parallel arbeiten und dabei von zwei anderen Platten gespiegelt werden (insgesamt 4 Platten).

Aktuell verwendet werden vor allem die RAID-Level 0, 1, 5 und 10.


siehe auch: Storage Area Network