Die unterschiedlichen RAID-Level und ihre Bedeutung
RAID: Vom "Redundant Array of Inexpensive Disks" zum "Redundant Array of Independent Disks"
DIREKT ZUR ANFRAGE

Attingo Datenrettung über RAID-Level

RAID (Akronym: Redundant Array of Independent Disks) beschreibt hauptsächlich eine Zusammenschaltung mehrerer Datenträger und/oder Festplattensysteme zu einem großen Festplattenverbund mit hoher Fehlertoleranz. Dieser agiert für den Anwender wie ein einziges großes Laufwerk und soll sowohl die Ausfallsicherheit als auch die Performance erhöhen.

Hamburg, Stellingen - 31. Juli 2018 - Sebastian Evers

RAID Ursprung

Die Schöpfung des RAID fand seinen Ursprung im Jahr 1987 an der University of California in Berkeley:

Ausgangssituation für RAID

Die Speicherung großer Datenmengen war für damalige Rechenzentren und Mainframes eine überaus kostspielige Angelegenheit. Die für hochkapazitive Bedürfnisse gedachten 14-Zoll Festplatten mit zwei bis zu drei Gigabyte waren eine kostenintensive Anschaffung. Im Vergleich zu den sogenannten SLED boten sich die weitaus kostengünstigeren 5,25-Zoll Festplatten an, welche jedoch über eine wesentlich geringere Speicherkapazitäten verfügten.

Der Begriff SLED bezeichnet eine einzelne teure Festplatte mit vergleichsweise hoher Kapazität. Die Bezeichnung war von Mitte der 1950er Jahre bis in die 1990er Jahre für die, unter anderem in Großrechnern eingesetzten, Datenspeicher, bestehend aus einzelnen - vom heutigen Blickwinkel aus - großen und verhältnismäßig teuren Festplatten, gebräuchlich. Durch den erheblichen Anstieg der Prozessorleistung und das Wachstum der Massenspeicherkapazitäten in Relation zur Zugriffsgeschwindigkeit (Rotationsgeschwindigkeiten, Spurwechselzeiten) wurde, durch den langfristig absehbaren Entwicklungsrückstand, eine I/O-Krise befürchtet.

Stagnierender Entwicklungsfortschritt bei Festplatten

Das Papier „A Case for Redundant Arrays of Inexpensive Disks (RAID)“ von David Patterson, Garth Gibson und Randy Katz, der Computer Science Divison des Department of Electrical Engineering and Computer Sciences weist ausführlich darauf hin, dass aus damaliger Sicht nicht mit einem baldigen Anstieg zu rechnen gewesen sei.

Andere Technologien zur Umgehung der Problematik waren zu dem Zeitpunkt nicht zu erwarten, weshalb nach anderen Möglichkeiten geforscht wurde. Die Entwicklung der RAID-Technologie hatte nicht nur eine erhöhte Leistung im Sinn, sondern auch eine weitaus höhere Fehlertoleranz. Die bestehenden Fehlertoleranzen einzelner Festplattenlaufwerke waren für z. B. Datenbanksysteme nicht ausreichend.

Konzeption von RAID

Für die RAID-Konzeptionierung wurde die Häufigkeit von Zugriffen sowie die Verteilung der Daten untersucht. Dabei wurde festgestellt, dass ca. 80 % aller Zugriffe auf nur 20 % der Daten auf dem Datenträger erfolgten, wodurch die Ablage der Daten auf einer einzelnen Festplatte ein schlechteres Leistungsverhältnis offenbarte.

Durch das Aufkommen der RAID-Lösung zum Ende der 1980er Jahre, resultierend aus o. g. Papier, wurden SLED Laufwerke obsolet und der Begriff des RAID bis heute geprägt. Damals stand die Bezeichnung RAID nicht, wie heute geläufig, für „Redundant Array of Independet Disks“, sondern für „Redundant Arrays of Inexpensive Disks“, also den Gegenentwurf zum Konzept der „Single Large Expensive Disks“.

RAID Definition und Anforderungen

Es wurden verschiedene Level für RAID definiert, welche jeweils eine Art der Sicherheit der Daten und Verteilung der Daten inne haben. Für die Leistungsoptimierung wurde die Stripingtechnologie, also das Verteilen das Daten auf mehrere Festplatten (RAID 0), entwickelt. Die Daten werden dabei einer Aufsplittung in chunks unterzogen. Mittels dieser segmentalen Aufteilung der Daten konnte die Eingabe- und Ausgabebelastung (I/O) verteilt und eine kombinierte Steigerung der Leistung erreicht werden. Die Verteilung der Daten erfolgte hierbei nicht mehr auf Dateiebene, sondern über ein separates Programm oder einen dedizierten RAID-Controller.

Die recht kurze MTBF der SLED Laufwerke wurde von kleineren eingesetzten Festplatten im direkten Vergleich zwar übertroffen, jedoch war nun die Zuverlässigkeit des gesamten Festplattenverbunds betroffen. Die immense Leistungssteigerung ging auf Kosten der Datensicherheit, diese konnte nicht mehr gewährleistet werden. Unter diesem Gesichtspunkt wurden die für RAID erforderlichen Vorgaben definiert: Diese umfassen den Zusammenschluss mehrerer Datenträger zu einem einzigen Volumen, die festgelegte Art und Weise in der die Anwenderdaten auf den Speichern verteilt werden sowie die Ergänzung um redundanten Speicher, welcher die Datenwiederherstellung im Falle des Ausfalls einer Festplatteneinheit ermöglichen soll.

Die RAID Vorgaben:

  1. Die Kombinationen und Verschaltung mehrerer Datenspeicher, sodass diese wie ein einziges großes Laufwerk erscheinen
  2. Die klar definierte Verteilung der Daten der Benutzer auf den sekundären Datenspeichern
  3. Ein zusätzlicher redundanter Speicher für die Wiederherstellung der Daten, beim Ausfall eines Datenträgers, wird implementiert

Definierte RAID Level

Die bis heute gültige Bezeichnung RAID Level ist irreführender Natur, da es sich bei den verschiedenen RAID Derivaten nicht um stufenweise aufeinander aufbauende Methoden handelt. Trotzdem hat sich die Terminologie der RAID Level bis heute durchgesetzt, obwohl die Techniken völlig unterschiedlich und unabhängig voneinander sind.

RAID 0

RAID Level 0 beschreibt das alleinige Striping. Durch die fehlende Redundanz erfüllt RAID 0 nicht alle Vorgaben des definierten RAID-Standards. Insbesondere ist hier die nicht existente Datensicherheit hervorzuheben. Dafür eignet sich dieser RAID-Level für besonders leistungshungrige Anforderungen und Anwendungen, bei denen minimierte Zugriffszeiten und nicht die Datensicherheit im Vordergrund steht.

Die Benutzerdaten werden segmental über mehrere Datenträger hinweg gespeichert. Für maßgeblich minimierte Zugriffszeiten ist es notwendig, dass die Datensegmentierung entsprechend der Erfordernisse mit größeren oder kleineren chunks angelegt wird. Für die Übertragungsoptimierung großer Daten, wie z. B. Multimediainhalte, bieten sich möglichst kleine chunks an, sodass im Idealfall alle involvierten Datenträger zeitgleich auf die Informationsfragmente der abgerufenen Datei zugreifen können.

Bei Datenbanken bietet sich hingegen die Wahl größer chunks an. Ist die im Zugriff befindliche Information eines Datensatzes kleiner als das eigentliche Datensegment können die Zugriffe verschiedener Benutzer „pseudo-parallel“ erfolgen.

RAID 1

RAID Level 1 entspricht den RAID-Vorgaben vollumfänglich, bietet volle Redundanz und stellt somit das erste echte RAID per Definition dar. Das aus mehreren Speichermedien bestehende Array erscheint dem Benutzer ebenfalls wie ein einziges Volumen, die geforderte Fehlertoleranz kann gewährleistet werden und mit dem Ausfall eines Datenträgers ist die Wiederherstellung der Daten realisierbar.

Beim sogenannten mirroring bzw. Spiegeln der Daten ist ein Performancegewinn theoretisch vorhanden: Es könnten beim Lesezugriff Daten von mehreren Festplatten gelesen werden. Der Schreibzugriff ist in der Regel langsamer, da diese parallel auf alle Datenträger erfolgen müssen. Außerdem ist RAID 1 im Bezug auf die Speicherausnutzung die teuerste Variante, da immer nur die Kapazität der kleinsten Festplatte im RAID 1 Verbund für den Anwender sichtbar und nutzbar ist, ganz gleich wie viele Festplatten insgesamt verschaltet worden sind.

Die Ausfalltoleranz ist im Gegenzug entsprechend hoch, da immer alle Daten auf allen Festplatten identisch sind. Allerdings bleibt der Ausfall einer defekten gespiegelten Festplatte vom Anwender unbemerkt, sofern dessen intaktes Pendant noch arbeitet und bei Zugriff Daten liefert.

RAID 2

RAID Level 2 verteilt die Daten wie RAID 0 über alle angeschlossenen Festplattenlaufwerke hinweg. Zusätzlich schreibt der RAID-Controller, auf einem dedizierten Festplattenlaufwerk zur Fehlerkorrektur, zu jedem chunk einen Prüfblock (Hamming-Code) hinzu.

Ausgehend von der jeweiligen Umsetzung ermöglicht RAID 2 die Korrektur einer Mehrzahl an Fehlern auf den Festplatten. Aufgrund des weitaus höheren Verwaltungsaufwands durch die Fehlerkorrektur ist mit damit einhergehenden Geschwindigkeitseinbußen zu rechnen.

RAID 3

Das RAID Level 3 gleicht in seinem Grundgerüst der Konzeption von RAID 2, wird allerdings um ein dediziertes Paritätslaufwerk, zusätzlich zur bisherigen Gruppe von Laufwerken, erweitert. Im Falle einer defekten Festplatte lassen sich die Daten aus den Redundanzdaten (XOR) auf den übrigen Festplatten wiederherstellen. Bei einem Festplatten-Array aus vier Festplatten werden die Daten ähnlich RAID 0 segmental auf den drei ersten Festplatten verteilt.

Die drei Festplatten speichern die Information an derselben Position, aus der sich die Paritätsinformation auf der vierten Festplatte generiert. Fällt nun eine der Festplatten aus, so lässt sich aus den Informationen der übrigen drei Festplatten der Datenbestand rekonstruieren. Die Schreibvorgänge sind aufgrund der Empfindlichkeit für das Auftreten von Datenverlusten entsprechend aufwendig gestaltet, sodass dieser hardwareseitig durchgeführt wird.

Ein Schreibzugriff umfasst stets vier Zugriffe: Jeweils ein Lese- und Schreibzugriff für die Daten und für die XOR-Information. Der Vorteil dieses aufwendigen Verfahrens besteht in der Fehlerüberwachung beim Schreiben von Daten sowie der damit einhergehenden Gewährleistung der Konsistenz der Daten.

RAID 4

Der Unterschied des RAID Level 4 im Vergleich zum RAID Level 3 liegt in der Größe der Datensegmente, welche in Relation zur angeforderten Datenkapazität größer definiert werden. RAID 4 Arrays unterstützen unabhängige Datenpfade für die einzelnen Laufwerke.

Das bedeutet, dass empfangene Daten unentwegt auf ein Laufwerk geschrieben werden, sofern die erforderliche Segmentgröße definiert worden ist. Daraus ergibt sich bei besonders kleinen chunks ein Vorteil gegenüber RAID 3, denn es können viele Zugriffe zeitgleich erfolgen.

RAID 5

Beim RAID Level 5 erfolgt die Generierung der Redundanzdaten, ähnlich wie beim RAID 3, über eine XOR-Funktion. Die Redundanzdaten werden allerdings über alle Festplatten verteilt gespeichert. Das bedeutet, dass statt einer einzelnen Paritätsfestplatte, jede im RAID Verbund integrierte Festplatte einen Anteil der Paritätsinformationen beinhaltet.

Bei einem beispielhaften RAID 5 Aufbau mit vier Festplatten übernimmt somit die erste Festplatte den ersten Teil der Daten, die zweite Festplatte den zweiten Teil der Daten , die dritte Festplatte den dritten Teil und die vierte Festplatte legt die mittels XOR gebildeten Redundanzdaten an der gleichen physischen Position ab. Im darauf folgenden Durchgang übernimmt die dritte Festplatte die Speicherung der Redundanzdaten, beim dritten Durchgang die zweite, beim vierten Durchgang die erste und dann ist wieder die vierte Festplatte an der Reihe.

Wie beim RAID 4 werden bei Schreibvorgängen stets zwei Festplatten beschäftigt. Dabei können die übrigen Festplatten andere Aufgaben und Zugriffe bewerkstelligen. Das ist aber nur dann sinnvoll, wenn die Datensegmente eine höhere Kapazität aufweisen als der angeforderte Datensatz. Mit der Verteilung der Prüfblöcke werden zudem Einbußen beim Schreiben der Prüfsummen unterbunden, andernfalls würden alle Schreibzugriffe auf eine einzige Festplatte erfolgen.

So kann im Vergleich zu den RAID Leveln 3 und 4 ein höherer Durchsatz gewährleistet werden. Dafür dauert die Wiederherstellung der Daten im Falle des Ausfalls und Austauschens eines Datenträgers wesentlich länger, da die Parität eben über alle Laufwerke hinweg verteilt wird und dementsprechend viele Lese- und Schreibzugriffe erforderlich sind.   

Nicht normierte RAID Level und Industriestandards

Die nachfolgenden RAID Level und Derivate wurden nicht von der University of California standardisiert, sondern wurden von der Industrie entwickelt und eingesetzt oder stellen Weiterentwicklungen vorangehender RAID Level dar.

RAID 5E

Das E in RAID 5E steht für Enhanced und bedeutet verbessert oder erweitert. Das RAID 5E beschreibt ein RAID 5 mit einer im Array aktiv eingebundenen Hot Spare Festplatte, welche an etwaigen Operationen beteiligt ist. Klassische Hot Spare Konstellationen bei RAID 5 sind so konfiguriert, dass die Hot Spare auf ihren Einsatz wartet bzw. darauf, dass eine Festplatte ausfällt.

Erst dann wird die Hot Spare Festplatte aktiv geschaltet und das RAID 5 Array startet das Rebuild mit der neuen Hardware. Die Kapazität eines RAID 5E gleicht einem RAID 5 in puncto Kapazität ohne Abweichungen. Der hauptsächliche Unterschied zwischen RAID 5E zu RAID 5 liegt darin, dass bei RAID 5E kein separates Laufwerk als Hot Spare zum Einsatz kommt. Stattdessen wird auf jedem involvierten Array-Laufwerk Speicherkapazität für einen eventuellen Ausfall reserviert.

Fällt nun ein Datenträger aus, so werden mit Hilfe der Paritätsinformationen die Daten in diese reservierten Bereiche geschrieben. Die Vorteile äußern sich nicht in einer gesteigerten Datensicherheit gegenüber RAID 5, sondern in gesteigerter Performance durch die ununterbrochene Nutzung aller vorhandenen Platten, insbesondere der ansonsten völlig leer mitlaufenden Hot Spare Festplatte.

RAID 5EE

Das RAID 5EE hat eine ähnliche Funktionsweise wie RAID 5E. Auch hierbei wird für die Hot Spare Speicherplatz auf den im Array befindlichen RAID Festplatten reserviert. Jedoch wird der freie Speicher nicht am Ende der Laufwerke definiert, sondern ebenso wie die Parität diagonal über die Festplatten hinweg geschrieben. Durch diese Konstellation bleibt beim Ausfall eines Datenträgers und der anschließenden Wiederherstellung der Daten eine höhere Datentransferrate erhalten.

RAID 6

Das RAID Level 6 gehört nicht zu den klassisch definierten RAID Leveln und baut auf dem RAID Level 5 auf. RAID 6 verfügt über eine modifizierte Paritätsbildung mit zwei Paritäten, sodass im Gegensatz zu RAID 5 mehr als ein Festplattenlaufwerk - maximal zwei Festplatten (siehe RAID DP) - ausfallen darf, ohne dass Datenverlust auftritt und das RAID offline ist. 

RAID 7

Der große Unterschied zwischen RAID Level 7 und anderen RAID Derivaten liegt unter anderem in der asynchronen Arbeitsweise und versteht sich wie eine Verschmelzung von RAID 3 und RAID 4, kombiniert mit einem zusätzlichen Puffer. Für jedes einzelne Laufwerk und jeden Controller existieren vollkommen unabhängige Datenpfade. Jeder existierende Datenpfad führt über den Hochgeschwindigkeits-Bus zum gemeinsamen Cache.

Das controllereigene Echtzeit-Betriebssystem arbeitet wie ein eigenständiger Computer und organisiert den Transfer der Daten zwischen dem Host und den Controllerinterfaces, völlig losgelöst vom Datentransfer mit den einzelnen Laufwerken. Durch diese Arbeitsweise lassen sich bei diesem RAID Level sehr hohe Datentransferraten erzielen, welche bei anderen RAID Systemen durch die Schnittstellengeschwindigkeit des Hostadapters limitiert werden.

RAID 7 ist nicht definiert und bezeichnet keinen gängige Industriestandard. Es handelt sich dabei um eine proprietäre Storage-Lösung und ist zudem ein eingetragener Marketingbegriff der Storage Computer Corporation. Diese stellt zugleich den einzigen Anbieter für die hochperformante und kostenintensive RAID 7 Lösung dar.

RAID 5DP

RAID 5DP ist die Bezeichnung von HP (Hewlett-Packard) für die Implementierung von RAID 6 in den eigenen Speicher-Systemen.

RAID ADG

RAID ADG (Advanced Data Guarding) ist ein von Compaq entwickeltes RAID 6 Derivat für die Compaq Smart Arrays, welches mit der Übernahme in den Besitz von Hewlett-Packard überging.

RAID TP

RAID TP (Triple Parity) ist eine proprietäre RAID Technologie (Hamming-Code/-Abstand) mit dreifacher Parität vom Hersteller easyRAID. Laut eigener Aussage des Herstellers können bei einem RAID TP bis zu drei Festplatten ohne Datenverlust ausfallen.

Triple Parity RAID-Z

Triple Parity RAID-Z oder auch RAID-3Z ist eine RAID-Implementierung (Reed-Solomon-Code) im ZFS Dateisystems von Sun Microsystems mit Dreifachparität. Durch die drei Paritätsbits können auch hierbei bis zu drei Festplatten ausfallen ohne Datenverlust zu verursachen.

RAID SHR

Das Synology Hybrid RAID (SHR) erlaubt den Ausfall eines oder zweier Laufwerke ohne Datenverlust und wird laut Herstellerangaben nicht von allen Synology NAS Geräten unterstützt. Klassische RAID Systeme erstellen ein Array auf Basis der kleinsten Kapazität eines integrierten Datenträgers, sodass bei größeren Festplatten im Verbund nicht der komplette Speicherplatz genutzt wird. SHR generiert zusätzlich redundante Speicherbereiche und sorgt somit für eine Ausnutzung der gesamten zur Verfügung stehenden Festplattenkapazitäten.

RAID DP

RAID DP ist eine Entwicklung des Hersteller NetApp und erweitert das RAID Level 4 um ein weiteres Laufwerk für die Parität. Zunächst konnte eine horizontale Parität zum Einsatz, welche um eine diagonale Parität erweitert wird. Somit können zwei Festplatten ausfallen, ohne dass es zu einem Datenverlust innerhalb des RAID-Arrays kommt. Damit erfüllt RAID DP auch die Anforderungen eines RAID 6.

RAID-S / Parity-RAID

Die Besonderheit von RAID-S zeigt sich darin, dass der Zusammenschluss mehrerer physischer Datenträger nicht automatisch ein einzelnes Volumen bilden muss. Die verschiedenen Laufwerke können vollkommen willkürlich miteinander kombiniert werden, sodass dennoch eine Parität gebildet werden kann. Diese proprietäre RAID Variante ist in der Praxis für sehr umfangreiche Serversysteme mit oftmals mehr als hunderten oder auch tausenden Festplatten gedacht und stammt vom Hersteller EMC² (EMC Corporation bzw. Dell EMC).

RAID-S findet sich auch unter anderen Bezeichnungen (z. B. RAID 3+1, 7+1, 14+2, 6+2) wieder. Die Zusätze +1 und +2 definieren die Anzahl an Datenträgern, welche ohne Auftreten von Datenverlust ausfallen dürfen - laut Herstellerangabe. In den meisten Fällen besteht ein RAID-S aus wenigen Festplatten (drei oder sieben), welche wiederum zu größeren logischen Volumen und Einheiten zusammen geschaltet werden.

Mit der HVE (Hypervolume Extension) Unterstützung ermöglichen einzelne physische Laufwerke die Unterbringung mehrerer logischer Volumen. Ein Parity-RAID 3+1 Array besteht aus vier Laufwerken, davon enthalten drei Laufwerke Daten und ein Laufwerk die Parität, dies ermöglicht eine Kapazitätsnutzung von drei Viertel der Gesamtkapazität aller integrierten Laufwerke.

Cubic RAID (cRAID)

Cubic RAID bezeichnet eine ebenfalls von EMC entwickelte multidimensionale RAID-Technik für den Bereich der Flash-Speicher-Technologie (NVMe) mit sehr hoher Kapazität. Das cRAID Verfahren orientiert sich in seiner Funktionsweise an der doppelten Parität bei RAID 6 Systemen. Es verspricht laut Hersteller EMC allerdings eine wesentlich höhere Datensicherheit, da es auf Zellenebene agiert.

NRAID

Das Non Reduandant Array of Independet Disks (SPAN, Linear Mode, JBOD) bezeichnet die Verschaltung zweier unabhängiger Festplatten mit beliebiger Kapazität zu einem, den Gesamtspeicherplatz zur Verfügung stellenden, Volumen. Die Bezeichnung RAID ist in diesem Kontext ebenso irreführend wie bei RAID 0, da in beiden Fällen keinerlei Redundanz gegeben ist. Beim NRAID handelt es sich viel eher um das Hardwarependant zum LVM (Logical Volume Manager). Außerdem fällt der Performancegewinn, welchen man bei einem RAID 0 haben könnte, weg. Der Vorteil ist, dass man den gesamten Speicherplatz und nicht nur die doppelte Kapazität der kleinsten Festplattengröße nutzen kann.

X-RAID / X-RAID 2

Das RAID Level X-RAID - X für „expandable“ (erweiterbar) - ist eine RAID Variation von Netgear die auf Netgear ReadyNAS-Speichersystemen zum Einsatz kommt. Netgear bewirbt die hauseigene RAID Lösung mit der On-the-fly-Implementierung weiterer Festplatten in den Datenträgerverbund, ohne dass die Datenträger neu formatiert werden oder Daten erst ausgelagert werden müssen. Die Erweiterung des Storages kann also im laufenden Betrieb vorgenommen werden.

Zudem finden alle Prozesse vollkommen automatisiert im Hintergrund statt und es wird bei mindestens zwei Datenträgern Redundanz gewährleistet – zumindest gegenüber dem Ausfall einer Festplatte. Durch die immens vereinfachte Bedienung und die gesenkte Komplexität gegenüber Flex-RAID hat man allerdings immer nur ein einziges virtuelles Laufwerk (Volume) zur Verfügung.

Die Kapazitätsnutzung von X-RAID bei unterschiedlich großen Festplatten erinnert ein wenig an Synologys RAID SHR, seit Firmware-Version 4.2.x (X-RAID 2) wird die Kapazität effizienter genutzt als bei klassischen RAID-Konstellationen – das gilt ab mindestens drei eingesetzten Festplatten.

X-RAID bildet bei zwei integrierten Datenträgern ein RAID 1. Die Anpassung der RAID-Level erfolgt bei weiterer Bestückung vollautomatisch, so dass ab drei Festplatten ein RAID 5 und für die doppelte Redundanz ab vier Festplatten sogar RAID 6 konfiguriert wird.

Durch die automatisierte RAID-Level Auswahl ist eine manuelle RAID Auswahl unter X-RAID quasi nicht möglich. Ebenso wie die Definition von mehreren Volumes. Unter Flex-RAID hingegen lässt sich beliebig auswählen, ob ein RAID 0, RAID 1, RAID 5, RAID 6 oder RAID 10 konfiguriert werden soll - basierend auf der Anzahl der verwendeten Festplatten.

Kombinierte RAID Level

Neben den nachfolgenden Beispielen kombinierter RAID Level gibt es noch weitaus mehr Variationen, wie verschiedene RAID Level miteinander geschaltet werden können, um die Ausfall- und Datensicherheit oder den Performancegewinn der eigenen Infrastruktur zu optimieren.

RAID 10 / RAID 0+1 / RAID 1+0

Das RAID Level 10 bezeichnet eine Kombination aus RAID 0 und RAID 1, welche sowohl als RAID 0+1 oder RAID 1+0 angelegt werden kann.

Bei RAID 0+1 werden die Daten als Stripeset über mehrere Festplatten hinweg geschrieben und anschließend gespiegelt. Hierbei kann maximal ein Festplattenausfall bzw. mehrere Festplattenausfälle in einem Stripeset kompensiert werden.

Bei RAID 1+0 werden die Daten gespiegelt und die gespiegelten Daten in Stripesets unterteilt. Die gängigste Konstellation besteht aus vier Datenträgern von denen zwei Datenträger ein Stripeset bilden, welches auf ein weiteres Stripeset gespielt wird. Fällt ein Laufwerk aus, so laufen die übrigen Laufwerke weiter. Des Weiteren kann das RAID 0+1 auch den Ausfall zweier Datenträger verkraften, allerdings nur unter dem Umstand, wenn nicht beide Laufwerke sich dieselbe Position im jeweiligen Stripeset teilen.

RAID 50 / RAID 5+0

Bei einem RAID 50 wird ein Stripset über mehrere RAID 5 Volumen hinweg angelegt. Hierbei wird die Performance von RAID 5 erheblich gesteigert, ohne dass man sich dem Risiko einer schlechteren Datensicherheit aussetzt.

RAID 60 /RAID 6+0

Wie bei einem RAID 50 wird ein diesem Fall ein Stripeset über mehrere RAID 6 Volumen angelegt. Die Ausfall- und Datensicherheit erhöht sich bei dieser Konstellation nochmals.

Weitere RAID Level sind u.a.: RAID 1.5, RAID 05, RAID 03, RAID 15, RAID 1E, RAID 1E0, RAID 30, RAID 45, RAID 51, RAID 53, RAID 55

Software-RAID und Hardware-RAID

Die Bezeichnungen Hardware- sowie Software-RAID stiften etwas Verwirrung - grundsätzlich erfordern beide RAID-Varianten Software für die Inbetriebnahme. Die Bezeichnung bezieht sich auf die Art der Implementierung.

Software-RAID

Beim Software-RAID erfolgt die Steuerung des Festplattenverbunds über eine auf der Prozessoreinheit des Hostsystems laufende Software. In den meisten Fällen ist das Betriebsystem bereits mit den entsprechenden Komponenten ausgerüstet. Unter Windows konnten sowohl Vista als auch XP RAID 0 und RAID 1, mit den entsprechenden Serverversionen des Betriebssystems auch RAID 5.

Linux unterstützt hingegen RAID-Arrays (Stichwort: mdadm) mit den Level 0, 1, 4 und 5 und mit neuerem Kernel (ab 2.6) auch RAID 6. Die Software-RAID Variante ist die kostengünstige Umsetzung und ist eine recht einfach zu handhabende Lösung. Allerdings ist die mögliche Parallelisierung der Festplattenzugriffe durch die limitierten Anschlussmöglichkeiten auch eine Einschränkung hinsichtlich der möglichen Performance.

Hardware-RAID

Beim Hardware-RAID verwaltet ein eigenständiger RAID-Controller die Verwaltung des RAID-Arrays. Dadurch wird der Prozessor des Hosts entlastet und eine wesentlich höhere Performance gewährleistet. Des Weiteren erfolgt die Ansteuerung der Festplattenlaufwerke über eine Vielzahl an Kanälen, wodurch zeitgleiche Zugriffe und somit weitaus höhere Datentransferraten ermöglicht werden können.

Im Gegensatz zum Software-RAID wird man bei der Hardware-Lösung mit einem weitaus höheren Kosteneinsatz kalkulieren müssen. Ein Hardware-RAID kann zwar plattformunabhängig agieren, zur Verwaltung wird aber dennoch Software benötigt, welche nicht unbedingt betriebssystemunabhängig sein muss.

RAID ist nach wie vor weit verbreitet

Die etablierten RAID Level erfüllen auch heutzutage noch ihre Pflicht, gelten nicht als obsolet und sind immer noch weit verbreitet - geraten dabei aber auch zunehmend unter Druck. In Anbetracht der immer weiter zunehmenden Speicherkapazitäten von Festplattenlaufwerken lässt sich die Hochverfügbarkeit von Datenbanken, Virtualisierungen und Dateien im Speziellen bei RAID Level 5 und RAID Level 6 weiterhin gewährleisten.

Durch die damit einhergehende wesentlich höhere Laufzeit des Rebuilds erhöht sich allerdings auch das potenzielle Risiko eines oder mehrerer weiterer Festplattenausfälle in dem Zeitraum immens. Insbesondere dann, wenn alle eingesetzten Festplatten ein und derselben Charge entstammen und dadurch denselben Reiseweg sowie die gleiche Betriebslaufzeit hinter sich haben.

Fällt das Laufwerk (RAID offline) vollständig aus, dann kann die Datenwiederherstellung in einem spezialisierten Datenrettungslabor je nach Komplexität des Systems mehrere Tage oder auch Wochen in Anspruch nehmen. Das sind kostbare Zeiträume, in denen ganze Unternehmensbereiche lahm liegen und Minute um Minute finanzielle Einbußen generiert werden.

Ein zeitnahes Wiederherstellen des Systems bei ausgefallenen Laufwerken bietet sich demnach an. Denn fehlen eine (RAID 5) oder zwei (RAID 6) Festplatten, dann kann von Hochverfügbarkeit nicht mehr die Rede sein und es tritt ein kritischer Status (RAID degraded) ein. Das gewünschte Sicherheitsniveau kann durch ein Rebuild wiederhergestellt werden, dieses findet dabei jedoch stets in einem geschwächten System statt.

Eine hohe Wiederherstellungspriorität beim Rebuild kann den RAID Server in puncto Datensicherheit schneller wieder in den Hochverfügbarkeitsmodus bringen. Dieser Vorgang ist jedoch besonders ressourcenhungrig, weshalb die Leistungsfähigkeit des Servers für den Zeitraum der RAID-Wiederherstellung deutliche Einbrüche erleben kann. Dabei muss mit Geschwindigkeitseinbußen von bis zu 50 % kalkuliert werden.

Durch die Option, das Rebuild im Hintergrund laufen zu lassen, bietet sich die Möglichkeit die Performance-Einschränkungen für laufende Prozesse und Zugriffe gering zu halten, so dass die Einbußen einen einigermaßen akzeptablen Rahmen haben. Dadurch erhöht sich der erforderliche Zeitrahmen für die Wiederherstellung des RAID und die Belastung für die Laufwerke, durch die erforderlichen Schreib- und Lesevorgänge im Rahmen des Rebuild-Prozesses sowie durch den betrieblich erforderlichen Zugriff, exorbitant.

Anhand dieses wesentlich höheren Stresslevels für die RAID-Festplatten steigt das Risiko für weitere Festplattenausfälle und den Absturz des RAID Servers und es muss mit Datenverlust gerechnet werden.

Angesichts dieser potenziellen Risiken stellt sich die Frage, wie klassische RAID Level mit hochkapazitiven Festplattenspeichern, bei der allgemein hohen Verfügbarkeits- und Sicherheitsanforderung für geschäftskritische Daten, sich noch immer großer Beliebtheit erfreuen. Möglicherweise hängt es mit dem  Preisvorteil zusammen; damit wären wir dann auch wieder bei dem Samen aus dem das Akronym RAID ursprünglich erwachsen ist, den "Inexpensive Disks".

Wie weiter oben bereits angemerkt haben verschiedenste Hersteller auf dem Fundament des RAID Konzepts aufgebaut und die vorliegenden RAID Blaupausen weitgehend modifiziert, um stetige Hochverfügbarkeit für die Kunden gewährleisten zu können.

Überlebenssicherung von RAID

AST-Technologie: Automatic-Storage-Tiering / Hybrid Storage

Automatische Speicher Einstufung kennt man in ähnlicher Form von SSHD Laufwerken, welche im Notebook oder im PC eingesetzt werden. Hierbei werden die Vorteile (Schreib-/Lesegeschwindigkeit) flashbasierter Speicherergänzungen optimal genutzt. Häufig vom Anwender bzw. System angeforderte Daten werden dem SSD Part der SSHD gespeichert, um schnellstmöglich abrufbar zu sein. Alle weiteren Daten finden sich auf dem klassischen HDD Part der SSHD.

Für das Verständnis des Laien biete sich als Analogie ein Ausflug in die Lageristik an: Auch hier werden häufig benötigte Produkte und Gegenstände an eher schnell erreichbaren Orten und Regalen gelagert, um bei entsprechenden Anfragen zeitnahe Zugriff darauf zu haben - robotergesteuerte Lager ausgenommen. 

AST macht sich diese Kombination aus Kosten- und Komplexitätssenkung ebenfalls zunutze. Dabei wird quasi eine Art dauerhafter Cache zur Verfügung gestellt, welcher häufig beanspruche Daten (sog. "hot data") identifiziert und auf den hochperformanten Speichern vorhält, während weniger häufig abgerufene Daten (sog. "cold data") auf den langsameren und kostengünstigeren Speichermedien abgelegt werden.

Das Hauptaugenmerk der Technologie richtet sich dabei primär auf die Auslagerung von Schreib-/Lesezugriffen auf leistungsfähige Speichermedien wie Hochgeschwindigkeits-SSDs oder SAS-Festplatten. Dabei gibt es gewisse Unterschiede, je nachdem ob die als "hot" deklarierten Datenpakete temporär und bis zum Prioritätsverfall vollständig (mirgrationsbasiert) auf performante Speicher verschoben werden oder ob die Daten auf die performanten Speicher dupliziert werden (cachebasiert), sodass die Kopie der Daten auf den langsameren Speicherplätzen verbleibt - beim Prioritätsverfall erfolgt dann die Löschung aus dem Cache.

Die Konzeptionierung von AST punktet allerdings nur dann, wenn die Identifizierung und Klassifizierung der Daten einwandfrei von Statten geht. Wäre dem nicht so, dann würden in der abgestuften Umgebung intensiver Schreib-/Leseanwendungen (z. B. Datenbanken) häufig benötigte Datenblöcke voraussichtlich auf den weniger leistungsstarken Speicherbereichen generiert werden, obwohl das Vorhalten der Daten erforderlich ist.

Die AST-Technologien sind bei vielen Herstellern unter unterschiedlichen Kennzeichnungen schon langfritstiger integraler Bestandteil der vertriebenen hybriden Storage-Lösungen, das gilt u. a. für Hewlett Packard Enterprise, Dell EMC, Hitachi, IBM, Infinidat, Fujitsu und NetApp und ergänzen die klassischen RAID-Funktionen. Dadurch wird das Modell der Hochverfügbarkeit sinnvoll erweitert, im Falle von Datenträgerausfällen bleiben jedoch die bekannten Probleme.

Aufgebohrte Rebuild Konzepte

Um der oben genannten Problematik der Einschränkungen im Verlauf des Rebuild-Prozess vorzubeugen haben sich einige Hersteller mit Zusatzfunktionen und Innovation hervor getan, um den Rebuild-Prozess entweder zu beschleunigen oder dem Risiko eines weiteren Datenträgerausfalls entgegenzuwirken.

Fujitsu Fast Recovery / High-Speed Rebuild:

Mit Fast Recovery soll der langwierige Rebuildingprozess und die damit einhergehende Risikopotenzierung für den Ausfall eines RAID-Laufwerks maßgeblich minimiert werden. Dabei liegt keine exklusive Hotspare Festplatte am RAID-Controller an, sondern das Rebuild erfolgt augenblicklich auf spezielle reservierte Speicherbereiche der übrigen Festplatten des RAID-Volumen (siehe auch: RAID 5E, RAID 5EE).

Tritt ein Festplattenfehler auf, so erfolgt der Rebuild-Prozess simultan, anstatt sich Festplatte für Festplatte einzeln vorzunehmen. Dadurch lässt sich die Rebuildlaufzeit für eine 1 TB Festplatte laut Herstellerangaben von 9 Stunden mit traditionellem Rebuild auf ca. 90 Minuten reduzieren. Unterstützt wird dies bei den ETERNUS Modellen. RAID 6 wird ebenfalls unterstützt. 

Seagate RAID Rebuild™:

Die RAID-Option von Hersteller Seagate verspricht eine schnelle Datenwiederherstellung für alle RAID-Level, mit einer Verkürzung der dafür erforderlichen Zeit. Dabei wird laut Herstellerangabe vor der eigentlichen RAID-Wiederherstellung (Rebuild) sämtliche Dateninhalte von der fehlerhaften Festplatte extrahiert, sodass der Host das Rebuild mit dem Extrakt durchführen kann. Der Vorgang soll nicht auf weiterer Hardware basieren und demnach weitere Ausfälle nicht begünstigen. Das bedeutet, dass in erster Instanz der Versuch statt findet die Daten von der fehlerhaften Festplatte automatisiert anderweitig zu speichern.

Die Bezeichnung "fehlerhaft" ist bei Festplatten ein recht weitgreifender Begriff, wodurch diese Technik nur partiell Anwendung finden könnte. In einem englischsprachigen Blogbeitrag weist Seagate darauf hin, dass diese Funktion bei defekten Schreib-/Leseköpfen nicht greift und selbst eine partielle Kopie die Durchlaufzeit des gesamten Rebuild senken kann.

 

DI (FH) Markus Häfele
Kundenbetreuung
(01) 236 01 01
info@attingo.com Live-Chat Online-Anfrage
24h-Service 98% Erfolgsrate
staatliche Auszeichnung Austria A iso 9001 siegel grau

Attingo-Magazin

Pressemeldungen & Aktuelles
Attingo in der Presse
Messetermine und Konferenzen
Blog
Stichwortverzeichnis
Fallstudien: Datenrettung