Welcher Raid ist zuverlässig aus 4 Festplatten. Warum RAID5 ein „must have“ ist

RAID-10 im Standard-Duplizierungsmodus ohne Datenverlust übersteht den Verlust einer beliebigen Festplatte, die Widerstandsfähigkeit gegen den Verlust der zweiten wird nicht garantiert. Zusammengebaut als Mirror über einen Stripe oder umgekehrt, Stripe über einen Mirror oder mdadm (was beides nicht ist) - macht keinen Unterschied, Stabilität ist nur ohne eine Platte gewährleistet. Betonung auf "beliebiges Laufwerk".

Jeder Datenblock in RAID-10 wird auf zwei Festplatten gespiegelt, was zu einem Gesamtkapazitätsverlust von der Hälfte führt. Aber aus diesem Grund, wenn Sie Pech haben und sogar von 10 Platten nur die zwei herausgefallen sind, die Spiegel eines Datensektors hatten, gibt es keinen anderen Ort, um diesen Sektor zu lesen. Im Glücksfall fallen genau die richtigen Platten heraus – Sie können bis zur Hälfte der Laufwerke des Arrays verlieren.

In Linux Raid, auch bekannt als mdadm, ist es beispielsweise möglich anzugeben, wie viele Datenkopien auf Festplatten repliziert werden sollen. Mit 3 Datenkopien auf 6 Festplatten können Sie beispielsweise zwei beliebige Festplattenausfälle überstehen und nicht 4. Der Preis dafür ist die verfügbare Kapazität des Arrays. Sie haben nur Zugriff auf die Kapazität von zwei der 6 Festplatten.

RAID5 und RAID6, über die sie Ihnen in den Kommentaren schreiben, werden den Verlust von einer bzw. zwei Festplatten überleben. Der Ausfall einer zweiten Festplatte in raid5 oder einer dritten Festplatte in raid6 ist fatal und führt zum Verlust des gesamten Arrays. Das Ziel und Schicksal dieser Raid-Levels ist es, sich gegen den Festplattentod zu versichern, aber gleichzeitig irgendwie billiger als ein Spiegel. RAID5 reduziert die formatierte Kapazität des Arrays um die Größe von nur einer Festplatte, RAID6 - um die Kapazität von nur zwei Festplatten. Nicht halb so wie RAID1 oder RAID10.

Beispielsweise können Sie aus 12 Festplatten mit je 1 TB Folgendes zusammenstellen:

  • RAID5 mit einer Kapazität von 11 TB, Sie können jede 1 Festplatte verlieren
  • 10 TB RAID6, 2 beliebige Festplatten können verloren gehen
  • 6 TB RAID10, 1 beliebiges Laufwerk kann verloren gehen
  • 4 TB RAID10 bei Konfiguration zum Verlust von 2 Laufwerken

Es scheint, warum wird raid10 dann so aktiv mit einem solchen Kapazitätsunterschied verwendet? Antwort: Wegen der Leistung. Bei RAID10 kann eine Leseanforderung jede Festplatte aus einem Paar bedienen, was bedeutet, dass bei einem normal erstellten RAID10 Leseanforderungen über verschiedene Festplatten hinweg parallelisiert werden können. In raid5/6 wird ein ursprünglicher Datenblock nur an einer Stelle gespeichert. Um es aus redundanten Daten zu lesen, müssen Sie dieses Segment von allen Festplatten gleichzeitig lesen und ein wenig rechnen. Dann ist RAID5/6 beim Schreiben langsamer. Und ein viel dramatischerer Unterschied in der degradierten Form, d.h. wenn eine Scheibe herausgefallen ist. RAID5/6 verschwenden Leistung mehr als empfindlich.

Wie viele Festplatten verloren gehen können - löst das Problem. Lassen Sie mich nur daran erinnern, dass, wenn eine ausgefallene Festplatte durch eine neue ersetzt wird und der Array-Synchronisationsprozess beginnt, dies eine sehr gefährliche Zeit ist, die Last auf alten Festplatten dramatisch ansteigt und jemand anderes sterben kann. Daher wird RAID5 eher selten verwendet, RAID6 ist für diese Aufgaben nicht viel teurer, aber es versichert beim Zusammenbau des Arrays.

Und noch ein wichtiger Punkt, der immer erwähnt werden sollte, wenn es um Raids geht: RAID ist kein Backup. Du solltest sowieso ein Backup haben.

RAID10 ist nicht gleich RAID01 und hier ist der Grund. Zum Beispiel haben wir acht Hards

Betrachten Sie den Fall mit RAID01

Diese Ebene hat zwei RAID0-Sätze (A und B). Jedes Set enthält vier Discs. Setzt untereinander in RAID1 (Spiegel)

Stellen Sie sich nun vor, dass eine beliebige Festplatte in Satz A ausfällt. Somit verschlechtert sich das gesamte Array A, es werden keine Daten mehr dorthin geschrieben und das System arbeitet auf Satz B. Wenn eine Festplatte aus Satz B ausfällt, sind Systemabsturz und Datenverlust unvermeidlich. Ich hoffe du hast Backups gemacht

Jetzt der Fall mit RAID10

Diese Ebene hat vier RAID1-Sätze. Jedes Set enthält zwei Discs. Setzt untereinander in RAID0

Angenommen, eine Festplatte in Satz 1 fällt aus. Das System wird weiter betrieben, da es eine zweite Festplatte in Satz 1 gibt. Wenn wir davon ausgehen, dass das zweite Laufwerk in Set 1 ausfällt, dann kommt es zu Systemabstürzen, Datenverlust und allem was sonst noch damit zusammenhängt. Noch eine Frage zum Backup

Wenn eine Festplatte aus einem anderen Satz ausfällt, funktioniert das System weiter. Auf diese Weise bleibt das System über Wasser, wenn eine Platte aus jedem Satz ausfällt, da die Arbeit jedes Satzes durch die Arbeit einer anderen Platte bereitgestellt wird.

Ein bisschen Mathe

Für RAID01 wird die Ausfallwahrscheinlichkeit anhand der Formel (n/2)/(n - 1)*100 berechnet, wobei n die Gesamtzahl der Festplatten im System ist

Für RAID10 wird die Ausfallwahrscheinlichkeit mit der Formel 1/(n - 1)*100 berechnet

Somit beträgt bei einem System mit acht Festplatten die Wahrscheinlichkeit, dass die letzte Festplatte verloren geht, gefolgt von einem Systemabsturz, ~57 % für RAID01 und ~14 % für RAID10. Dies gilt für Systeme mit zwei gespiegelten Laufwerken.

Zusammenfassung

  1. Die Leistung beider Arrays ist gleich
  2. Die Festplattengröße beider Arrays ist gleich
  3. Beim Wiederherstellen eines Arrays erfolgt die Datensynchronisierung im Fall von RAID10 gemäß der 1-zu-1-Formel und im Fall von RAID01 n/2-zu-n/2. Und das ist der Zeitpunkt und die Gelegenheit, einen Lesefehler aufzufangen
  4. In RAID10 können Sie nicht mehr als die Hälfte der Festplatten verlieren. In diesem Fall bleibt das System in Betrieb. In RAID01 führt ein Absturz von nur zwei Festplatten zu Datenverlust, und es spielt keine Rolle, ob sich vier oder vierundzwanzig Festplatten im Array befinden
  5. Wenn Sie also zwischen RAID10 und RAID01 wählen können, wählen Sie RAID10

Übersetzung Alexander Tschernych

Systemadministrator

Das Problem, die Zuverlässigkeit der Informationsspeicherung zu erhöhen, ist immer auf der Tagesordnung. Dies gilt insbesondere für große Datenarrays, Datenbanken, von denen die Arbeit abhängt komplexe Systeme in einer Vielzahl von Branchen. Dies ist besonders wichtig für Hochleistung Server.

Wie Sie wissen, wächst die Leistung moderner Prozessoren ständig, was für moderne Prozessoren in ihrer Entwicklung eindeutig nicht zeitgemäß ist.
Festplatte. Das Vorhandensein einer Festplatte, sei es SCSI oder, noch schlimmer, IDE, ist bereits vorhanden kann mich nicht entscheiden Aufgaben unserer Zeit. Sie benötigen viele Festplatten, die sich ergänzen, ersetzen, wenn eine herauskommt, speichern Sicherungen effizient und produktiv arbeiten.

Allerdings nur mit ein paar Festplatte nicht genug, sie brauchen zu einem System kombinieren, das reibungslos funktioniert und keinen Datenverlust im Falle von festplattenbezogenen Fehlern zulässt.

Sie müssen sich im Voraus darum kümmern, ein solches System zu erstellen, denn wie das bekannte Sprichwort sagt - Tschüss gebraten Der Hahn kräht nicht- nicht genug bekommen. Sie können Ihre Daten verlieren unwiderruflich.

Dieses System kann sein ÜBERFALLEN- eine Technologie der virtuellen Informationsspeicherung, die mehrere Festplatten zu einem logischen Element kombiniert. RAID-Array aufgerufen wird redundantes Array unabhängige Festplatten. Wird normalerweise verwendet, um die Leistung und Zuverlässigkeit zu verbessern.

Was braucht man um einen Raid zu erstellen? Zumindest das Vorhandensein von zwei Festplatten. Die Anzahl der verwendeten Speichergeräte variiert je nach Array-Ebene.

Was sind Raid-Arrays

Es gibt grundlegende, kombinierte RAID-Arrays. Das Institut in Berkeley, Kalifornien schlug vor, die Razzia aufzuteilen in Spezifikationsebenen:

  • Basic:
    • ÜBERFALLEN 1 ;
    • ÜBERFALLEN 2 ;
    • ÜBERFALLEN 3 ;
    • ÜBERFALLEN 4 ;
    • ÜBERFALLEN 5 ;
    • ÜBERFALLEN 6 .
  • Kombiniert:
    • ÜBERFALLEN 10 ;
    • ÜBERFALLEN 01 ;
    • ÜBERFALLEN 50 ;
    • ÜBERFALLEN 05 ;
    • ÜBERFALLEN 60 ;
    • ÜBERFALLEN 06 .

Betrachten Sie die am häufigsten verwendeten.

Überfall 0

RAID 0 vorgesehen um die Geschwindigkeit und Aufnahme zu erhöhen. Es erhöht nicht die Zuverlässigkeit des Speichers und ist daher nicht redundant. Auch sein Name ist Streifen (Streifen - "abwechselnd"). In der Regel benutzt 2 bis 4 Scheiben.

Die Daten werden in Blöcke aufgeteilt, die wiederum auf Platten geschrieben werden. Geschwindigkeit Schreiben/Lesen erhöht sich in diesem Fall um ein Vielfaches der Anzahl der Platten. Von Mängel man kann die erhöhte Wahrscheinlichkeit von Datenverlusten bei einem solchen System feststellen. Es macht keinen Sinn, Datenbanken auf solchen Platten zu speichern, weil jeder ernsthaft Versagen führt dazu, dass der Raid vollständig fehlschlägt, da es keine Möglichkeit zur Wiederherstellung gibt.

Überfall 1

RAID 1 bietet Spiegel Datenspeicherung an Hardware-Ebene. Wird auch als Array bezeichnet Spiegel, was heißt « Spiegel» . Das heißt, die Plattendaten werden in diesem Fall dupliziert. dürfen verwenden mit der Anzahl der Speichergeräte von 2 bis 4.

Geschwindigkeit gleichzeitig schreiben / lesen ändert sich praktisch nicht, was darauf zurückzuführen ist Leistungen. Das Array funktioniert, wenn mindestens eine RAID-Festplatte in Betrieb ist, aber das Volumen des Systems gleich dem Volumen einer Festplatte ist. In der Praxis wann Versagen einer der Festplatten, müssen Sie Schritte unternehmen, um sie so schnell wie möglich auszutauschen.

Überfall 2

RAID 2 - verwendet die sogenannte Hamming-Code. Daten werden ähnlich wie bei RAID 0 auf Festplatten verteilt, die verbleibenden Laufwerke speichern Fehlerkorrekturcodes, im Fehlerfall auf die Sie können regenerieren Information. Diese Methode ermöglicht on-the-fly finden und dann Korrekt Störungen im System.

Schnelligkeit lesen Schreiben in diesem Fall im Vergleich zur Verwendung einer einzelnen Festplatte steigt an. Der Nachteil ist eine große Anzahl von Festplatten, bei denen es sinnvoll ist, sie so zu verwenden, dass normalerweise keine Datenredundanz vorhanden ist 7 und mehr.

RAID 3 – In einem Array werden Daten auf alle Festplatten aufgeteilt, mit Ausnahme einer, die Paritätsbytes speichert. Resistent gegen Systemausfälle. Wenn einer der Datenträger geht außer Betrieb. Dann ist seine Information unter Verwendung der Paritätsprüfsummendaten einfach zu "erhöhen".

Im Vergleich zu RAID 2 keine Möglichkeit Fehlerkorrektur on the fly. Dieses Array ist anders Hochleistung und die Fähigkeit, von 3 Festplatten oder mehr zu verwenden.

Chef Minus- Ein solches System kann als erhöhte Belastung der Platte, die Paritätsbytes speichert, und als geringe Zuverlässigkeit dieser Platte angesehen werden.

Überfall 4

Im Allgemeinen ähnelt RAID 4 RAID 3 mit dem Unterschied dass Paritätsdaten in Blöcken und nicht in Bytes gespeichert werden, was die Geschwindigkeit der Übertragung kleiner Daten erhöht hat.

Minus- Das angegebene Array stellt sich als Schreibgeschwindigkeit heraus, da die Schreibparität auf einer einzelnen Festplatte wie RAID 3 generiert wird.

Es scheint eine gute Lösung für Server zu sein, auf denen Dateien häufiger gelesen als geschrieben werden.

Überfall 5

RAID 2 bis 4 hat den Nachteil, dass Schreibvorgänge nicht parallelisiert werden können. RAID 5 beseitigt dieses Manko. Paritätsblöcke werden geschrieben gleichzeitig zu allen Plattengeräten im Array, kein async in der Datenverteilung, was bedeutet, dass die Parität verteilt ist.

Anzahl Gebrauchte Festplatten ab 3. Das Array ist aufgrund seiner sehr verbreitet Universalität Und Wirtschaft, je mehr Datenträger Sie verwenden, desto sparsamer wird Ihr Speicherplatz sein. Geschwindigkeit dabei hoch aufgrund von Datenparallelisierung, aber Leistung gegenüber RAID 10 aufgrund der hohen Anzahl an Operationen reduziert. Wenn ein Laufwerk ausfällt, sinkt die Zuverlässigkeit auf RAID 0. Die Wiederherstellung dauert lange.

Überfall 6

Die RAID 6-Technologie ähnelt RAID 5, wurde jedoch aktualisiert Verlässlichkeit durch Erhöhen der Anzahl der Paritätsfestplatten.

Festplatten erfordern jedoch bereits ein Minimum von 5 oder mehr leistungsstarker Prozessor um die erhöhte Anzahl von Operationen zu bewältigen, und die Anzahl der Platten muss unbedingt gleich der Primzahl 5,7,11 sein, und so weiter.

Überfall 10, 50, 60

Als nächstes kommen Kombinationen zuvor erwähnte Razzien. RAID 10 ist beispielsweise RAID 0 + RAID 1.

Sie erben und Leistungen Arrays ihrer Komponenten in Bezug auf Zuverlässigkeit, Leistung und Anzahl der Festplatten und gleichzeitig Kosteneffizienz.

Erstellen eines Raid-Arrays auf einem Heim-PC

Die Vorteile der Erstellung eines Raid-Arrays zu Hause liegen nicht auf der Hand, da es unwirtschaftlich, Datenverlust ist im Vergleich zu Servern nicht so kritisch, und Information können in Sicherungskopien gespeichert werden, indem regelmäßig Sicherungskopien erstellt werden.

Für diese Zwecke benötigen Sie Raid-Controller, das über ein eigenes BIOS und eigene Einstellungen verfügt. Im modernen Motherboards Raid-Controller sein kann integriert in Südbrücke Chipsatz. Aber selbst in einem solchen Board können Sie einen anderen Controller anschließen, indem Sie ihn an einen PCI- oder PCI-E-Anschluss anschließen. Beispiele sind Geräte von Silicon Image und JMicron.

Jeder Controller kann sein eigenes Konfigurationsdienstprogramm haben.

Erwägen Sie die Erstellung eines Raids mit dem Intel Matrix Storage Manager Option ROM.

Überweisen alle Daten von Ihren Festplatten, andernfalls werden sie während des Erstellens eines Arrays gespeichert gelöscht.

Gehe zu BIOSAufstellen Ihr Motherboard und schalten Sie den Betriebsmodus ein ÜBERFALLEN für Ihre SATA-Festplatte.

Um das Dienstprogramm auszuführen, starten Sie Ihren PC neu, klicken Sie auf Strg+i während des Verfahrens POST. Im Programmfenster sehen Sie eine Liste der verfügbaren Datenträger. Klicken Erstellen Sie Massiv, Weiter auswählen erforderliche Array-Ebene.

Geben Sie in Zukunft nach der intuitiven Benutzeroberfläche ein Array-Größe Und bestätigen Sie seine Entstehung.

Lassen Sie uns nun sehen, welche Arten es gibt und wie sie sich unterscheiden.

UC Berkeley führte die folgenden Ebenen der RAID-Spezifikation ein, die als De-facto-Standard übernommen wurden:

  • RAID 0- Disk-Array erhöhte Leistung verschachtelt, keine Fehlertoleranz;
  • - Spiegelplattenarray;
  • RAID 2 reserviert für Arrays, die Hamming-Code verwenden;
  • RAID 3 und 4- Plattenarrays mit Striping und einer dedizierten Paritätsplatte;
  • - Festplatten-Array mit Striping und „nicht zugeordneter Paritätsfestplatte“;
  • - Striped Disk Array mit zwei Prüfsummen, die auf zwei unabhängige Arten berechnet werden;
  • - RAID 0-Array, das aus RAID 1-Arrays aufgebaut ist;
  • - RAID 0-Array, das aus RAID 5-Arrays aufgebaut ist;
  • - ein RAID 0-Array, das aus RAID 6-Arrays aufgebaut ist.

Ein Hardware-RAID-Controller kann gleichzeitig mehrere unterschiedliche RAID-Verbände unterstützen, deren Gesamtzahl an Festplatten die Anzahl ihrer Steckplätze nicht überschreitet. Gleichzeitig wird der Controller eingebaut Hauptplatine, in BIOS-Einstellungen hat nur zwei Zustände (aktiviert oder deaktiviert), also wenn eine neue Festplatte an einen unbenutzten Controller-Anschluss angeschlossen wird aktivierter Modus RAID kann vom System ignoriert werden, bis es als ein weiteres JBOD (überspanntes) RAID-Array zugeordnet wird, das aus einer einzelnen Festplatte besteht.

RAID 0 (Streifen - "abwechselnd")

Der Modus, der die Leistung maximiert. Die Daten werden gleichmäßig auf die Platten des Arrays verteilt, die Platten werden zu einer zusammengefasst, die in mehrere geteilt werden kann. Verteilte Lese- und Schreibvorgänge ermöglichen es Ihnen, die Arbeitsgeschwindigkeit erheblich zu erhöhen, da mehrere Festplatten gleichzeitig ihren Teil der Daten lesen / schreiben. Das gesamte Plattenvolumen steht dem Benutzer zur Verfügung, was jedoch die Zuverlässigkeit der Datenspeicherung verringert, da beim Ausfall einer der Platten in der Regel das Array zerstört wird und eine Wiederherstellung der Daten nahezu unmöglich ist. Anwendungsbereich - Anwendungen, die hohe Geschwindigkeiten des Festplattenaustauschs erfordern, z. B. Videoaufnahme, Videobearbeitung. Empfohlen für die Verwendung mit hochzuverlässigen Laufwerken.

(Spiegelung - "Spiegelung")

ein Array aus zwei Festplatten, die vollständige Kopien voneinander sind. Nicht zu verwechseln mit RAID 1+0-, RAID 0+1- und RAID 10-Arrays, die mehr als zwei Laufwerke und ausgefeiltere Spiegelungsmechanismen verwenden.

Bietet eine akzeptable Schreibgeschwindigkeit und einen Gewinn an Lesegeschwindigkeit beim Parallelisieren von Abfragen.

Es hat eine hohe Zuverlässigkeit - es funktioniert, solange mindestens eine Festplatte im Array funktioniert. Die Ausfallwahrscheinlichkeit von zwei Platten gleichzeitig ist gleich dem Produkt der Ausfallwahrscheinlichkeiten jeder Platte, d.h. deutlich geringer als die Ausfallwahrscheinlichkeit eines einzelnen Laufwerks. In der Praxis sollten beim Ausfall einer der Platten dringend Maßnahmen ergriffen werden – die Redundanz sollte wiederhergestellt werden. Zu diesem Zweck wird bei jedem RAID-Level (außer Null) empfohlen, Hot-Spare-Festplatten zu verwenden.

Ähnlich wie RAID10, eine Variante der Datenverteilung auf Festplatten, die die Verwendung einer ungeraden Anzahl von Festplatten ermöglicht (die Mindestanzahl ist 3)

RAID 2, 3, 4

verschiedene Optionen für verteilte Speicherung mit Festplatten, die für Paritätscodes und verschiedene Blockgrößen zugewiesen sind. Derzeit werden sie aufgrund der geringen Leistung und der Notwendigkeit, viel Speicherplatz zum Speichern von ECC- und/oder Paritätscodes zuzuweisen, praktisch nicht verwendet.

Der Hauptnachteil der RAID-Stufen 2 bis 4 ist die Unfähigkeit, parallele Schreibvorgänge durchzuführen, da eine separate Paritätsfestplatte zum Speichern von Paritätsinformationen verwendet wird. RAID 5 hat diesen Nachteil nicht. Datenblöcke und Prüfsummen werden zyklisch auf alle Platten im Array geschrieben, es gibt keine Asymmetrie in der Plattenkonfiguration. Prüfsummen sind das Ergebnis einer XOR-Operation (exklusives Oder). Xor verfügt über eine Funktion, die es ermöglicht, jeden Operanden durch das Ergebnis zu ersetzen und den Algorithmus zu verwenden xoder, erhalten Sie den fehlenden Operanden als Ergebnis. Zum Beispiel: a x oder b = c(wo ein, B, C- drei Festplatten des Raid-Arrays), wenn ein weigert, können wir ihn kriegen, indem wir ihn an seine Stelle setzen C und verbracht haben xoder zwischen C Und B: xoder b = a. Dies gilt unabhängig von der Anzahl der Operanden: a xoder b xoder c xoder d = e. Wenn es fehlschlägt C dann e nimmt seinen Platz ein und xoder als Ergebnis erhalten wir C: a xoder b xoder e xoder d = c. Diese Methode bietet im Wesentlichen Version 5-Fehlertoleranz. Es wird nur eine Festplatte benötigt, um das xor-Ergebnis zu speichern, dessen Größe gleich der Größe jeder anderen Festplatte im Raid ist.

Vorteile

RAID5 hat sich vor allem aufgrund seiner Kosteneffizienz durchgesetzt. Die Größe eines RAID5-Festplattenarrays wird mit der Formel (n-1)*hddsize berechnet, wobei n die Anzahl der Festplatten im Array und hddsize die Größe der kleinsten Festplatte ist. Beispielsweise beträgt das Gesamtvolumen für ein Array aus vier 80-GB-Festplatten (4 - 1) * 80 = 240 GB. Beim Schreiben von Informationen auf ein RAID 5-Volume werden zusätzliche Ressourcen verbraucht und die Leistung sinkt, da zusätzliche Berechnungen und Schreibvorgänge erforderlich sind, aber beim Lesen (im Vergleich zu einer separaten Festplatte) gibt es einen Gewinn, da Daten von mehreren Array-Festplatten strömen können parallel bearbeitet werden.

Nachteile

Die Leistung von RAID 5 ist merklich geringer, insbesondere bei zufälligen Schreibvorgängen (Schreibvorgänge in zufälliger Reihenfolge), bei denen die Leistung gegenüber RAID 0 (oder RAID 10) um 10–25 % abfällt, da mehr Festplattenvorgänge erforderlich sind (jeder Vorgang schreibt mit mit Ausnahme der sogenannten Full-Stripe-Writes wird der Server auf dem RAID-Controller durch vier ersetzt - zwei Reads und zwei Writes). Die Nachteile von RAID 5 treten auf, wenn eine der Festplatten ausfällt - das gesamte Volume wechselt in den kritischen Modus (degrade), alle Schreib- und Lesevorgänge werden von zusätzlichen Manipulationen begleitet, die Leistung sinkt stark. In diesem Fall wird die Zuverlässigkeitsstufe auf die Zuverlässigkeit von RAID-0 mit der entsprechenden Anzahl von Festplatten reduziert (d. h. n-mal niedriger als die Zuverlässigkeit einer einzelnen Festplatte). Wenn ein Fehler auftritt, bevor das Array vollständig wiederhergestellt ist, oder ein nicht behebbarer Lesefehler auf mindestens einer weiteren Platte auftritt, dann wird das Array zerstört und die darauf befindlichen Daten können nicht durch herkömmliche Verfahren wiederhergestellt werden. Es sollte auch berücksichtigt werden, dass der Prozess der RAID-Rekonstruktion (Wiederherstellung von RAID-Daten aufgrund von Redundanz) nach einem Plattenausfall eine intensive Leselast von Platten über viele Stunden ununterbrochen verursacht, was dazu führen kann, dass jede der verbleibenden Platten dabei ausfällt am wenigsten geschützten Zeitraum des RAID-Betriebs, sowie um zuvor unentdeckte Lesefehler in kalten Datenarrays (Daten, auf die während des normalen Betriebs des Arrays nicht zugegriffen wird, archivierte und inaktive Daten) zu erkennen, was das Ausfallrisiko während der Datenwiederherstellung erhöht.

Die Mindestanzahl verwendeter Datenträger beträgt drei.

RAID 6 - ähnlich wie RAID 5, aber mit höherer Zuverlässigkeit - die Kapazität von 2 Festplatten wird für Prüfsummen zugewiesen, 2 Summen werden mit unterschiedlichen Algorithmen berechnet. Benötigt einen leistungsfähigeren RAID-Controller. Bietet Funktionsfähigkeit nach gleichzeitigem Ausfall von zwei Festplatten - Schutz vor Mehrfachausfall. Zum Organisieren eines Arrays sind mindestens 4 Festplatten erforderlich. Typischerweise verursacht die Verwendung von RAID-6 im Vergleich zu RAID 5 einen Leistungsabfall von etwa 10–15 % der Festplattengruppe, was durch eine große Verarbeitungsmenge für den Controller verursacht wird (die Notwendigkeit, eine zweite Prüfsumme zu berechnen und mehr Festplatten zu lesen und zu überschreiben Blöcke, wenn jeder Block geschrieben wird).

RAID 0+1

RAID 0+1 kann grundsätzlich zwei Möglichkeiten bedeuten:

  • zwei RAID 0 werden zu RAID 1 zusammengeführt;
  • drei oder mehr Platten werden zu einem Array kombiniert, und jeder Datenblock wird auf zwei Platten dieses Arrays geschrieben; somit ist bei diesem Ansatz, wie beim „reinen“ RAID 1, das nutzbare Volumen des Verbundes die Hälfte des Gesamtvolumens aller Platten (sofern es sich um Platten gleicher Kapazität handelt).

RAID 10 (1+0)

RAID 10 ist ein gespiegeltes Array, bei dem Daten sequentiell auf mehrere Festplatten geschrieben werden, wie bei RAID 0. Diese Architektur ist ein Array vom Typ RAID 0, dessen Segmente anstelle von einzelnen Festplatten RAID 1-Arrays sind muss mindestens 4 Festplatten enthalten (und immer eine gerade Zahl). RAID 10 kombiniert hohe Fehlertoleranz und Leistung.

Die Behauptung, dass RAID 10 die zuverlässigste Speicheroption ist, wird durch die Tatsache gerechtfertigt, dass ein Array ausfällt, wenn alle Laufwerke im selben Array ausfallen. Wenn ein Laufwerk ausfällt, beträgt die Ausfallwahrscheinlichkeit des zweiten Laufwerks im selben Array 1/3 x 100 = 33 %. RAID 0+1 schlägt fehl, wenn zwei Laufwerke in unterschiedlichen Arrays ausfallen. Die Ausfallwahrscheinlichkeit eines Laufwerks in einem benachbarten Array beträgt 2/3*100=66 %, da jedoch ein Laufwerk in einem Array mit einem bereits ausgefallenen Laufwerk nicht mehr verwendet wird, ist die Wahrscheinlichkeit, dass das nächste Laufwerk deaktiviert wird gesamtes Array ist 2/2 * 100 = 100 %

ein RAID5-ähnliches Array, jedoch wird zusätzlich zur verteilten Speicherung von Paritätscodes die Verteilung von Ersatzbereichen verwendet - tatsächlich wird sie verwendet Festplatte, das einem RAID5-Array als Ersatz hinzugefügt werden kann (solche Arrays werden als 5+ oder 5+spare bezeichnet). In einem RAID 5-Array ist das Ersatzlaufwerk im Leerlauf, bis eine der primären Festplatten ausfällt, während in einem RAID 5EE-Array dieses Laufwerk die ganze Zeit mit dem Rest der Festplatte geteilt wird, was sich positiv auf die Leistung des Arrays auswirkt. Beispielsweise kann ein RAID5EE-Array aus 5 Festplatten 25 % mehr E/A-Vorgänge pro Sekunde ausführen als ein RAID5-Array aus 4 primären und einer Ersatzfestplatte. Die Mindestanzahl an Festplatten für ein solches Array beträgt 4.

Kombinieren von zwei (oder mehr, aber dies wird äußerst selten verwendet) RAID5-Arrays zu einem Stripe, d.h. eine Kombination aus RAID5 und RAID0, die teilweise den Hauptnachteil von RAID5 korrigiert - niedrige Datenschreibgeschwindigkeit aufgrund der parallelen Verwendung mehrerer solcher Arrays. Die Gesamtkapazität des Arrays wird um die Kapazität von zwei Laufwerken reduziert, aber im Gegensatz zu RAID6 kann es nur einen Ausfall eines einzelnen Laufwerks ohne Datenverlust tolerieren, und die Mindestanzahl von Laufwerken, die zum Erstellen eines RAID50-Arrays erforderlich sind, beträgt 6. Zusammen mit RAID10, dies ist das am meisten empfohlene RAID-Level für Anwendungen, bei denen eine hohe Leistung in Kombination mit akzeptabler Zuverlässigkeit erforderlich ist.

Zusammenführen von zwei RAID6-Arrays zu einem Stripe. Die Schreibgeschwindigkeit ist ungefähr doppelt so hoch wie die Schreibgeschwindigkeit in RAID6. Die Mindestanzahl an Festplatten zum Erstellen eines solchen Arrays beträgt 8. Informationen gehen nicht verloren, wenn zwei Festplatten von jedem RAID 6-Array ausfallen.

© Andrey Egorov, 2005, 2006. Unternehmensgruppe TIM.

Forumsbesucher stellen uns die Frage: "Was ist das zuverlässigste RAID-Level?" Jeder weiß, dass RAID5 die gebräuchlichste Stufe ist, aber es ist keineswegs frei von schwerwiegenden Mängeln, die für Laien nicht offensichtlich sind.

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 oder was sind RAID-Level?

In meinem Artikel werde ich versuchen, die gängigsten RAID-Level zu charakterisieren und dann Empfehlungen für die Verwendung dieser Level zu formulieren. Um diesen Artikel zu veranschaulichen, habe ich ein Diagramm erstellt, das diese Ebenen in einem dreidimensionalen Raum von Zuverlässigkeit, Leistung und Kosteneffizienz platziert.

JBOD(Just a Bunch of Disks) ist eine einfache Aufteilung von Festplatten, die formal kein RAID-Level ist. Ein JBOD-Volume kann ein Array aus einer einzelnen Festplatte oder einer Kombination aus mehreren Festplatten sein. Der RAID-Controller muss keine Berechnungen durchführen, um mit einem solchen Volume zu arbeiten. In unserem Diagramm dient das JBOD als "normaler" oder Ausgangspunkt - seine Zuverlässigkeits-, Leistungs- und Kostenwerte sind dieselben wie bei einer einzelnen Festplatte. Festplatte.

RAID 0(„Striping“) hat keine Redundanz und verteilt Informationen in Form von kleinen Blöcken („Stripes“) auf einmal über alle im Array enthaltenen Festplatten. Dies verbessert die Leistung erheblich, leidet jedoch unter der Zuverlässigkeit. Wie bei JBOD bekommen wir für unser Geld 100% der Plattenkapazität.

Lassen Sie mich erklären, warum die Zuverlässigkeit der Datenspeicherung auf jedem zusammengesetzten Volume abnimmt - denn wenn eine der darin enthaltenen Festplatten ausfällt, sind alle Informationen vollständig und unwiederbringlich verloren. In Übereinstimmung mit der Wahrscheinlichkeitstheorie ist die Zuverlässigkeit eines RAID0-Volumes mathematisch gleich dem Produkt der Zuverlässigkeit seiner einzelnen Festplatten, von denen jede kleiner als eins ist, sodass die Gesamtzuverlässigkeit offensichtlich niedriger ist als die Zuverlässigkeit jeder Festplatte .

Gutes Level - RAID 1(„Spiegeln“, „Spiegeln“). Es schützt vor dem Ausfall der Hälfte der verfügbaren Hardware (im allgemeinen Fall eine der beiden Festplatten), bietet eine akzeptable Schreibgeschwindigkeit und einen Gewinn an Lesegeschwindigkeit durch Abfrageparallelisierung. Der Nachteil ist, dass Sie die Kosten für zwei Festplatten bezahlen müssen und die nutzbare Kapazität einer Festplatte erhalten.

Zunächst wird davon ausgegangen, dass die Festplatte eine zuverlässige Sache ist. Dementsprechend ist die Ausfallwahrscheinlichkeit von zwei Platten gleichzeitig (gemäß der Formel) gleich dem Produkt der Wahrscheinlichkeiten, d.h. Größenordnungen niedriger! Leider, wahres Leben- keine Theorie! Zwei Festplatten stammen aus derselben Charge und arbeiten unter denselben Bedingungen, und wenn eine der Festplatten ausfällt, erhöht sich die Belastung der verbleibenden, daher sollten in der Praxis dringende Maßnahmen ergriffen werden, wenn eine der Festplatten ausfällt - Redundanz wieder herzustellen. Zu diesem Zweck wird bei jedem RAID-Level (außer Null) empfohlen, Hot-Spare-Festplatten zu verwenden Hotspare. Der Vorteil dieses Ansatzes ist die Aufrechterhaltung einer konstanten Zuverlässigkeit. Der Nachteil sind noch höhere Kosten (dh die Kosten für 3 Festplatten, um das Volumen einer Platte zu speichern).

Mirror auf vielen Laufwerken ist eine Ebene RAID 10. Bei Verwendung dieser Ebene reihen sich gespiegelte Festplattenpaare in einer „Kette“ aneinander, sodass das Volumen des resultierenden Volumes die Kapazität einer einzelnen Festplatte übersteigen kann. Die Vor- und Nachteile sind die gleichen wie beim RAID1-Level. Wie in anderen Fällen wird empfohlen, HotSpare-Hotspares im Array mit einer Rate von einem Spare für fünf Worker aufzunehmen.

RAID 5, in der Tat das beliebteste der Levels - hauptsächlich aufgrund seiner Wirtschaftlichkeit. Indem wir aus Gründen der Redundanz die Kapazität nur einer Festplatte des Arrays opfern, erhalten wir Schutz vor dem Ausfall einer der Festplatten des Volumes. Für das Schreiben von Informationen auf ein RAID5-Volume werden zusätzliche Ressourcen aufgewendet, da zusätzliche Berechnungen erforderlich sind, aber beim Lesen (im Vergleich zu einer separaten Festplatte) gibt es einen Gewinn, da Datenströme von mehreren Array-Laufwerken parallelisiert werden.

Die Nachteile von RAID5 treten auf, wenn eine der Festplatten ausfällt - das gesamte Volume wechselt in den kritischen Modus, alle Schreib- und Lesevorgänge werden von zusätzlichen Manipulationen begleitet, die Leistung sinkt stark, die Festplatten beginnen sich zu erwärmen. Wenn keine dringenden Maßnahmen ergriffen werden, können Sie das gesamte Volume verlieren. Daher muss (siehe oben) ein Hot-Spare-Laufwerk mit einem RAID5-Volume verwendet werden.

Neben den im Standard beschriebenen Basisleveln RAID0 - RAID5 gibt es kombinierte Levels RAID10, RAID30, RAID50, RAID15, die von verschiedenen Herstellern auf ihre Art interpretiert werden.

Das Wesentliche solcher Kombinationen ist in Kürze wie folgt. RAID10 ist eine Kombination aus Eins und Null (siehe oben). RAID50 ist eine Gruppierung von "0"-Volumes der 5. Ebene. RAID15 ist ein "Spiegel" von "Fünf". Usw.

Somit erben kombinierte Ebenen die Vor- (und Nachteile) ihrer "Eltern". Also das Erscheinen einer "Null" im Level RAID50 erhöht die Zuverlässigkeit nicht, wirkt sich aber positiv auf die Leistung aus. Stufe RAID 15, wahrscheinlich sehr zuverlässig, aber es ist nicht das schnellste und außerdem äußerst unwirtschaftlich (die nutzbare Kapazität des Volumes ist weniger als halb so groß wie das ursprüngliche Disk-Array).

RAID6 unterscheidet sich von RAID 5 darin, dass jede Datenzeile (auf Englisch Streifen) hat keine, aber zwei Prüfsummenblock. Prüfsummen sind "mehrdimensional", d.h. unabhängig voneinander, sodass Sie auch beim Ausfall zweier Festplatten im Verbund die Originaldaten retten können. Die Reed-Solomon-Prüfsummenberechnung erfordert im Vergleich zu RAID5 intensivere Berechnungen, sodass die sechste Ebene zuvor praktisch nicht verwendet wurde. Jetzt wird es von vielen Produkten unterstützt, da sie damit begannen, spezialisierte Mikroschaltkreise zu installieren, die alle erforderlichen mathematischen Operationen ausführen.

Einigen Studien zufolge endet die Wiederherstellung nach dem Ausfall eines einzelnen Laufwerks auf einem RAID5-Volume, das aus großen SATA-Laufwerken (400 und 500 Gigabyte) besteht, in 5 % der Fälle mit Datenverlust. Mit anderen Worten, in einem von zwanzig Fällen kann während der Regeneration eines RAID5-Arrays auf einer Hot-Spare-Festplatte eine zweite Festplatte ausfallen ... Daher die Empfehlungen der besten RAID-Treiber: 1) immer Backups erstellen; 2) verwenden RAID6!

Die neuen Ebenen RAID1E, RAID5E, RAID5EE sind kürzlich erschienen. Das „E“ im Namen steht für Erweitert.

RAID-Level-1 Erweitert (RAID-Level-1E) kombiniert Spiegelung und Data Striping. Diese Mischung der Ebenen 0 und 1 ist wie folgt angeordnet. Die Daten in der Reihe werden genau wie in RAID 0 verteilt. Das heißt, die Datenreihe hat keine Redundanz. Die nächste Reihe von Datenblöcken kopiert die vorherige mit einer Verschiebung um einen Block. Somit hat jeder Datenblock wie im Standard-RAID-1-Modus eine Spiegelkopie auf einer der Platten, sodass das nutzbare Volumen des Verbunds die Hälfte des Gesamtvolumens der im Verbund enthaltenen Festplatten beträgt. RAID 1E erfordert ein Pooling von drei oder mehr Laufwerken.

Ich mag das RAID1E-Level sehr. Für eine leistungsstarke Grafik-Workstation oder sogar für Heimcomputeroptimale Wahl! Es hat alle Vorteile von Zero und First Level - ausgezeichnete Geschwindigkeit und hohe Zuverlässigkeit.

Kommen wir zur Ebene RAID-Level-5 Erweitert (RAID-Level-5E). Dies ist dasselbe wie RAID5, nur mit einem in das Array eingebauten Ersatzlaufwerk. Ersatzlaufwerk. Diese Einbettung wird wie folgt durchgeführt: Auf allen Platten des Arrays wird 1/N des Speicherplatzes frei gelassen, der bei Ausfall einer der Platten als Hotspare verwendet wird. Aus diesem Grund zeigt RAID5E zusammen mit Zuverlässigkeit bessere Leistung, da Lesen / Schreiben parallel mit erfolgt mehr Laufwerke gleichzeitig und das Ersatzlaufwerk ist nicht im Leerlauf, wie in RAID5. Offensichtlich kann die im Volume enthaltene Ersatzfestplatte nicht mit anderen Volumes geteilt werden (dediziert vs. geteilt). Ein RAID 5E-Volume wird auf mindestens vier physischen Festplatten erstellt. Die nutzbare Größe eines logischen Volumes wird mit der Formel N-2 berechnet.

RAID-Level-5E Erweitert (RAID-Level-5EE)Ähnlich wie RAID-Level-5E, aber es hat eine effizientere Zuweisung von Ersatzlaufwerken und infolgedessen eine schnellere Wiederherstellungszeit. Wie der RAID5E-Level verteilt dieser RAID-Level Datenblöcke und Prüfsummen in Zeilen. Aber es weist auch freie Ersatzlaufwerkblöcke zu und lässt nicht nur einen Teil des Speicherplatzes für diese Zwecke übrig. Dies reduziert die Zeit, die zum Rekonstruieren der Integrität eines RAID5EE-Volumes erforderlich ist. Die im Volume enthaltene Ersatzfestplatte kann nicht mit anderen Volumes geteilt werden - wie im vorherigen Fall. Ein RAID 5EE-Volume wird auf mindestens vier physischen Festplatten erstellt. Die nutzbare Größe eines logischen Volumes wird mit der Formel N-2 berechnet.

Seltsamerweise keine Erwähnung des Levels RAID-6E Ich habe es im Internet nicht gefunden - bisher wird diese Stufe von keinem der Hersteller angeboten oder gar angekündigt. Aber die Ebene RAID6E (oder RAID6EE?) kann nach dem gleichen Prinzip wie die vorherige vorgeschlagen werden. Scheibe Hotspare Notwendig muss jedem RAID-Volume, einschließlich RAID 6, beiliegen. Natürlich verlieren wir keine Informationen, wenn ein oder zwei Laufwerke ausfallen, aber es ist äußerst wichtig, so schnell wie möglich mit der Wiederherstellung der Integrität des Arrays zu beginnen, um das System schnell wieder zum Laufen zu bringen des „kritischen“ Modus. Da die Notwendigkeit einer Hot-Spare-Festplatte für uns außer Zweifel steht, wäre es logisch, weiter zu gehen und sie so zu „verteilen“, wie es bei RAID 5EE der Fall ist, um die Vorteile der Verwendung von mehr Festplatten zu nutzen ( beste Geschwindigkeit Lesen-Schreiben oder mehr schnelle Erholung Integrität).

RAID-Level in "Zahlen".

In der Tabelle habe ich einige wichtige Parameter fast aller RAID-Level gesammelt, damit Sie sie miteinander vergleichen und ihre Essenz besser verstehen können.

Stufe
~~~~~~~

Hütte-
berühren
ness
~~~~~~~

Verwenden-
Bewertung der Festplattenkapazität
~~~~~~~

Produktion
Ditel-
ness
lesen

~~~~~~~

Produktion
Ditel-
ness
Aufzeichnungen

~~~~~~~

Eingebaut
Rabatt
Reservieren

~~~~~~~

Mindest. Anzahl der Festplatten
~~~~~~~

max. Anzahl der Festplatten

~~~~~~~

exkl

exkl

exkl

exkl

Alle "Spiegel"-Ebenen sind RAID 1, 1+0, 10, 1E, 1E0.

Lassen Sie uns noch einmal versuchen, gründlich zu verstehen, wie sich diese Ebenen unterscheiden.

RAID 1.
Dies ist ein klassischer Spiegel. Zwei (und nur zwei!) Festplatte funktionieren als eins, sind eine vollständige Kopie voneinander. Der Ausfall eines dieser beiden Laufwerke führt nicht zum Verlust Ihrer Daten, da der Controller mit dem verbleibenden Laufwerk weiterarbeitet. RAID1 in Zahlen: 2x Redundanz, 2x Zuverlässigkeit, 2x Kosten. Die Schreibleistung entspricht der einer einzelnen Festplatte. Die Leseleistung ist besser, da der Controller Lesevorgänge auf zwei Laufwerke verteilen kann.

RAID 10.
Die Essenz dieser Ebene besteht darin, dass die Festplatten des Arrays paarweise zu „Spiegeln“ (RAID 1) kombiniert werden und dann alle diese Spiegelpaare wiederum zu einem gemeinsamen Striped-Array (RAID 0) kombiniert werden. Deshalb wird es manchmal auch so bezeichnet RAID 1+0. Wichtiger Punkt– In RAID 10 kann nur eine gerade Anzahl von Festplatten kombiniert werden (Minimum - 4, Maximum - 16). Vorteile: Zuverlässigkeit wird vom "Spiegel", von "Null" geerbt - sowohl Lese- als auch Schreibleistung.

RAID-1E.
Der Buchstabe „E“ im Namen bedeutet „Enhanced“, d.h. "verbessert". Das Prinzip dieser Verbesserung ist wie folgt: Die Daten werden auf allen Platten des Arrays blockweise "striped" und dann wieder mit einer Verschiebung um eine Platte "interleaved". In RAID 1E können Sie drei bis 16 Festplatten kombinieren. Die Zuverlässigkeit entspricht den "Zehnern", und die Leistung wird aufgrund der größeren "Wechsel" etwas besser.

RAID 1E0.
Diese Ebene wird wie folgt implementiert: Wir erstellen ein „Null“-Array aus RAID1E-Arrays. Daher muss die Gesamtzahl der Festplatten ein Vielfaches von drei sein: mindestens drei und höchstens sechzig! In diesem Fall ist es unwahrscheinlich, dass wir einen Geschwindigkeitsvorteil erzielen, und die Komplexität der Implementierung kann die Zuverlässigkeit beeinträchtigen. Der Hauptvorteil ist die Möglichkeit, eine sehr große (bis zu 60) Anzahl von Festplatten in einem Array zu kombinieren.

Die Ähnlichkeit aller RAID 1X-Levels liegt in ihren Redundanzindikatoren: Genau 50 % der gesamten Festplattenkapazität des Arrays werden zugunsten der Zuverlässigkeit geopfert.