Який рейд надійний із 4 дисків. Чому RAID5 - "must have"

RAID-10 у стандартному режимі дублювання без втрати даних переживе випадання одного диска, стійкість від випадання другого не гарантована. Зібраний як дзеркало поверх страйпу, або навпаки страйп поверх дзеркала, або mdadm (який ні те ні інше) - різниці не має, гарантована стійкість лише без будь-якого диска. Особлива увага на "будь-якого диска".

Кожен блок даних RAID-10 дзеркається по двох дисках, через це загальна втрата ємності - половина. Але тому ж, якщо вам не пощастило, і випали хоч навіть із 10 дисків лише ті два, на яких були дзеркала одного сектора даних – цей сектор читати більше нема звідки. У разі великого успіху випадання саме потрібних дисків - можна втратити до половини накопичувачів масиву.

Наприклад, в linux raid aka mdadm можна вказати, скільки копій даних має реплікуватися по дисках. Наприклад, 3 копії даних на 6 дисках дадуть можливість пережити випадання будь-яких двох дисків і не будь-яких 4. Ціна цього - доступна ємність масиву. Вам буде доступна ємність лише двох дисків із 6.

RAID5 і RAID6, про які вам у коментарях пишуть - переживуть випадання одного та двох дисків відповідно. Вихід з ладу будь-якого другого диска в raid5 або будь-якого третього в raid6 - фатальний і спричиняє втрату всього масиву. Мета і доля цих рівнів рейду - підстрахуватися від смерті диска, але при цьому якось дешевше, ніж дзеркало. RAID5 зменшить форматовану ємність масиву на розмір лише одного диска, RAID6 - на ємність лише двох дисків. А не наполовину, як RAID1 чи RAID10.

Наприклад, із 12 дисків по 1 тб можна зібрати:

  • RAID5 ємністю в 11 Тб, можна втратити будь-який 1 диск
  • RAID6 ємністю в 10 ТБ, можна втратити будь-які 2 диски
  • RAID10 ємністю в 6 ТБ, можна втратити будь-який 1 диск
  • RAID10 ємністю в 4 ТБ, якщо налаштувати, що можна втратити будь-які 2 диски

Здавалося б, навіщо тоді так активно використовують raid10 із такою різницею по ємності? Відповідь: через продуктивність. У RAID10 запит на читання може обслужити будь-який диск з пари, значить у нормально зробленого RAID10 - запити на читання можна розпаралелити по різних дисках. У raid5/6 один вихідний блок даних зберігається лише одному місці. Щоб його прочитати з надлишкових даних - треба буде прочитати цей сегмент з усіх дисків відразу і застосувати трохи математики. Потім RAID5/6 повільніше на записі. І куди драматичніша різниця в деградованому вигляді, тобто. якщо один диск у нас випав. RAID5/6 просаджуються за продуктивністю більш ніж чутливо.

Скільки дисків можна втратити – вирішує завдання. Нагадаю тільки, що коли диск, що випав, замінюється на новий і починається процес синхронізації масиву - це дуже небезпечний час, на старі диски навантаження різко зростає і може померти хто-небудь ще. Тому RAID5 використовують досить рідко, RAID6 не набагато дорожче для цих завдань, але підстраховує на час перескладання масиву.

І ще важливий момент, який треба під час розмов про рейди завжди вказувати: RAID це не бекап. Бекап у вас має бути все одно.

RAID10 не дорівнює RAID01 і ось чому. Наприклад, у нас є вісім хардів.

Розглянемо випадок з RAID01

Цей рівень має два набори RAID0 (А та В). У кожному наборі по чотири диски. Набори між собою у RAID1 (дзеркало)

Тепер уявімо, що будь-який диск із набору А виходить з ладу. Таким чином весь масив А деградує, дані перестають туди записуватися і система працює на наборі В. Якщо з ладу вийде будь-який диск з набору, то крах системи і втрата даних неминучі. Сподіваюся Ви робили бекапи

Тепер випадок з RAID10

Цей рівень має чотири набори RAID1. У кожному наборі по два диски. Набори між собою в RAID0

Допустимо з ладу вихід диск набору 1. Система продовжить роботу, оскільки в наборі 1 є другий диск. Якщо припустити, що в наборі 1 з ладу виходить другий диск, крах системи, втрата даних і все подальше, що з цим пов'язано. Знову питання про бекапи

Якщо з ладу виходить диск з іншого набору, то система продовжить роботу. Таким чином, система залишиться на плаву при вильоті одного диска з кожного набору, оскільки робота кожного набору забезпечується роботою іншого диска.

Трохи математики

Для RAID01 ймовірність відмови розраховується за формулою (n/2)/(n - 1) * 100, де n - загальна кількість дисків у системі

Для RAID10 ймовірність відмови розраховується за формулою 1/(n - 1) * 100

Таким чином, для системи з восьми дисків ймовірність втрати останнього диска після чого настане крах системи дорівнює ~57% для RAID01 і ~14% для RAID10. Це вірно для систем із двома дисками в дзеркалі

Резюме

  1. Продуктивність обох масивів однакова
  2. Дисковий розмір обох масивів однаковий
  3. При відновленні масиву у разі RAID10 синхронізація даних буде відбуватися за формулою 1-на-1, а у випадку з RAID01 n/2-на-n/2. А цей час і можливість упіймати помилку читання
  4. У RAID10 можна втратити трохи більше половини дисків. У цьому система залишиться у строю. У RAID01 виліт всього двох дисків призведе до втрати даних і не має значення чотири було диска в масиві або двадцять чотири
  5. Таким чином, якщо стоїть вибір між RAID10 і RAID01, вибирайте RAID10.

переклад Олександр Чорних

системний адміністратор

Проблема підвищення надійності зберігання інформації завжди стоїть на порядку денному. Особливо це стосується великих масивів даних, баз даних яких залежить робота комплексних систему великому діапазоні галузей. Особливо це важливо для високопродуктивнихсерверів.

Як відомо, продуктивність сучасних процесорів незмінно зростає, за чим явно не встигають у своєму розвитку сучасні
жорсткі диски. Наявність одного диска, будь то SCSI або, ще гірше IDE, вже не зможе вирішитизавдання, актуальні для нашого часу. Потрібно безліч дисків, які доповнюватимуть один одного, підмінятимуть у разі виходу одного з них, зберігатимуть резервні копії, працювати якісно та продуктивно.

Однак, просто наявність кількох жорстких дисківнедостатньо, їх потрібно об'єднати в систему, яка злагоджено працюватиме і не допустить втрати даних при будь-яких збоях, пов'язаних з дисками.

Про створення такої системи потрібно подбати заздалегідь, адже, як каже відоме прислів'я – Бувайсмажений півень не клюне- не схопляться. Можна втратити свої дані безповоротно.

Цією системою може стати RAID– технологія віртуального зберігання інформації, що об'єднує кілька дисків на один логічний елемент. RAID масивом називається надлишковий масивнезалежні диски. Використовують зазвичай для покращення продуктивності та надійності.

Що потрібне для створення рейд? Як мінімум наявність двох вінчестерів. Залежно від рівня масиву варіюється кількість використовуваних пристроїв зберігання.

Які бувають масиви raid

Існують базові, комбіновані масиви RAID. Інститут у Берклі штат Каліфорнія запропонував розділяти рейд на рівні специфікації:

  • Базові:
    • RAID 1 ;
    • RAID 2 ;
    • RAID 3 ;
    • RAID 4 ;
    • RAID 5 ;
    • RAID 6 .
  • Комбіновані:
    • RAID 10 ;
    • RAID 01 ;
    • RAID 50 ;
    • RAID 05 ;
    • RAID 60 ;
    • RAID 06 .

Розглянемо найчастіше використовувані.

Рейд 0

RAID 0 призначенийдля збільшення швидкості та запису. Він не збільшує надійність зберігання, тому не є надлишковим. Ще його звуть страйп (striping - «чергування»). Зазвичай використовуєтьсявід 2 до 4 дисків.

Дані поділяються на блоки, що записують по черзі диски. Швидкістьзаписи/читания збільшується у число, кратне кількості дисків. З недоліківможна відзначити збільшену ймовірність втрати даних за такої системи. Бази даних на таких дисках зберігати не має сенсу, адже будь-який серйозний збійпризведе до повної непрацездатності рейду, оскільки немає коштів відновлення.

Рейд 1

RAID 1 забезпечує дзеркальнезберігання даних на апаратному рівні. Називають також масив Mirror, що значить « Дзеркало» . Тобто дані дисків у разі дублюються. Можна, можливо використовуватиза кількості пристроїв зберігання від 2 до 4.

Швидкістьзапису/читання при цьому практично не змінюється, що можна віднести до переваг. Масив працює, якщо хоч один диск рейду перебуває в роботі, але об'єм системи при цьому дорівнює обсягу одного диска. На практиці при виході з ладуодного з вінчестерів Вам потрібно буде якнайшвидше вжити заходів для його заміни.

Рейд 2

RAID 2 – використовує так званий код Хеммінгу. Дані розбиваються по жорстких дисках аналогічно RAID 0, на дисках, що залишилися, зберігаються. коди виправлення помилок, при збої за якими можна регенеруватиінформації. Цей метод дозволяє на льоту виявляти, а потім і виправлятизбої у системі.

Швидкість читання/записиу цьому випадку порівняно з використанням одного диска підвищується. Мінусом є велика кількість дисків, при якому його раціонально застосовувати, щоб не було надмірності даних, зазвичай це 7 і більше.

RAID 3 – у масиві дані розбиваються попри всі диску крім одного, у якому зберігаються байти парності. Стійкий до відмовам системи. Якщо один із дисків виходить з ладу. То його інформацію легко «підняти», використовуючи дані контрольних сум парності.

Порівняно з RAID 2 нема можливостікорекції помилок на льоту. Цей масив відрізняється високою продуктивністюта можливістю використовувати від 3 дисків та більше.

Головним мінусомтакої системи можна вважати підвищене навантаження на диск, що зберігає байти парності та низьку надійність цього диска.

Рейд 4

В цілому RAID 4 аналогічний RAID 3 з тією різницею, Дані парності зберігаються в блоках, а не в байтах, що дозволило збільшити швидкість передачі даних малого обсягу.

Мінусомзазначеного масиву виявляється швидкість запису, адже парність запису генерується на єдиний диск, як і RAID 3.

Це непогане рішення для тих серверів, де файли частіше зчитуються, ніж записуються.

Рейд 5

RAID від 2 до 4 мають недоліки, пов'язані з неможливістю розпаралелювання операцій запису. RAID 5 усуваєцей недолік. Блоки парності записуються одночаснона всі дискові пристрої масиву, немає асинхронностіу розподілі даних, отже, парність є розподіленою.

Числовикористовуваних вінчестерів від 3. Масив дуже поширений завдяки своїй універсальностіі економічності, Чим більше дисків буде використовуватися, тим економніше буде витрачатися дисковий простір. Швидкістьпри цьому високаза рахунок розпаралелювання даних, але продуктивністьзнижується в порівнянні з RAID 10, за рахунок великої кількості операцій. Якщо виходить один диск, то надійність знижується до рівня RAID 0. Потрібно багато часу на відновлення.

Рейд 6

Технологія RAID 6 схожа на RAID 5, але підвищується надійністюза рахунок збільшення кількості дисків парності.

Однак, дисків вже потрібно щонайменше 5 і більше потужний процесордля обробки зрослого числа операцій, причому кількість дисків обов'язково має дорівнювати простому числу 5,7,11 і так далі.

Рейд 10, 50, 60

Далі йдуть комбінаціїзазначених раніше рейдів. Наприклад, RAID 10 це RAID 0 + RAID 1.

Вони успадкують і перевагимасивів їх складових у плані надійності, продуктивності та кількості дисків, а водночас економічності.

Створення рейду масиву на домашньому ПК

Переваги створення рейд масиву будинку неочевидні з огляду на те, що це неекономічно, втрата даних не така критична в порівнянні з серверами, а інформаціюможна зберігати у резервних копіях, періодично роблячи бекапи.

Для цього Вам знадобиться рейд-контролер, що володіє власною BIOS та своїми налаштуваннями. У сучасних системних платахрейд-контролер може бути інтегрованийв південний містчіпсету. Але навіть у таких платах за допомогою підключення до PCI або PCI-E роз'єму можна підключити ще один контролер. Прикладами можуть бути пристрої фірм Silicon Image та JMicron.

Кожен контролер може мати свою утиліту для налаштування.

Розглянемо створення рейду за допомогою Intel Matrix Storage Manager Option ROM.

Перенесітьвсі дані з ваших дисків, інакше в процесі створення масиву вони будуть очищені.

Зайдіть у BIOSSetupВашої материнської плати та увімкніть режим роботи RAIDдля вашого sata вінчестер.

Щоб запустити утиліту, перезавантажте ПК, натисніть ctrl+iпід час процедури POST. У вікні програми ви побачите список доступних дисків. Натисніть Create Massive, Далі виберіть необхідний рівень масиву.

Надалі дотримуючись інтуїтивно зрозумілого інтерфейсу, введіть розмір масивуі підтвердітьйого створення.

Тепер подивимося, які є види і чим вони відрізняються.

Каліфорнійський університет у Берклі представив такі рівні специфікації RAID, які були прийняті як стандарт де-факто:

  • RAID 0- дисковий масив підвищеної продуктивностіз чергуванням, без стійкості до відмови;
  • - дзеркальний дисковий масив;
  • RAID 2зарезервований для масивів, які застосовують код Хеммінгу;
  • RAID 3 та 4- дискові масиви з чергуванням та виділеним диском парності;
  • - дисковий масив з чергуванням та «невиділеним диском парності»;
  • - дисковий масив із чергуванням, що використовує дві контрольні суми, що обчислюються двома незалежними способами;
  • - масив RAID 0, побудований із масивів RAID 1;
  • - масив RAID 0, побудований із масивів RAID 5;
  • - масив RAID 0, побудований із масивів RAID 6.

Апаратний RAID-контролер може підтримувати кілька різних RAID-масивів одночасно, сумарна кількість жорстких дисків яких не перевищує кількість роз'ємів для них. При цьому контролер, вбудований у материнську плату, в налаштуваннях BIOSмає всього два стани (включено або відключено), тому новий жорсткий диск, підключений в незадіяний роз'єм контролера при активованому режимі RAID може ігноруватися системою, поки він не буде асоційований як ще один RAID-масив типу JBOD (spanned), що складається з одного диска.

RAID 0 (striping - «чергування»)

Режим, за якого досягається максимальна продуктивність. Дані рівномірно розподіляються по дисках масиву, диски об'єднуються в один, який може бути помічений на кілька. Розподілені операції читання та запису дозволяють значно збільшити швидкість роботи, оскільки кілька дисків одночасно читають/записують свою порцію даних. Користувачеві доступний весь об'єм дисків, але це знижує надійність зберігання даних, оскільки при відмові одного з дисків масив зазвичай руйнується і відновити дані практично неможливо. Область застосування - програми, що вимагають високих швидкостей обміну з диском, наприклад, відеозахоплення, відеомонтаж. Рекомендується використовувати з високонадійними дисками.

(mirroring - «дзеркалювання»)

масив із двох дисків, що є повними копіями один одного. Не слід плутати з масивами RAID 1+0, RAID 0+1 та RAID 10, у яких використовується більше двох дисків та складніші механізми дзеркалізації.

Забезпечує прийнятну швидкість запису та виграш за швидкістю читання при розпаралелювання запитів.

Має високу надійність – працює доти, доки функціонує хоча б один диск у масиві. Імовірність виходу з експлуатації відразу двох дисків дорівнює добутку ймовірностей відмови кожного диска, тобто. значно нижче ймовірності виходу з експлуатації окремого диска. Насправді при виході з ладу однієї з дисків слід терміново вживати заходів - знову відновлювати надмірність. Для цього із будь-яким рівнем RAID (крім нульового) рекомендують використовувати диски гарячого резерву.

Подібний до RAID10 варіант розподілу даних по дисках, що допускає використання непарного числа дисків (мінімальна кількість - 3)

RAID 2, 3, 4

різні варіанти розподіленого зберігання даних з дисками, виділеними під коди парності та різними розмірами блоку. В даний час практично не використовуються через невисоку продуктивність та необхідність виділяти багато дискової ємності під зберігання кодів ЕСС та/або парності.

Основним недоліком рівнів RAID від 2-го до 4-го є неможливість робити паралельні операції записи, оскільки зберігання інформації про парності використовується окремий контрольний диск. RAID 5 не має цього недоліку. Блоки даних та контрольні суми циклічно записуються на всі диски масиву, немає асиметричності конфігурації дисків. Під контрольними сумами мається на увазі результат операції XOR (що виключає або). Xorмає особливість, яка дає можливість замінити будь-який операнд результатом, і, застосувавши алгоритм xor, Отримати в результаті відсутній операнд. Наприклад: a xor b = c(де a, b, c- три диски рейд-масиву), якщо aвідмовить, ми можемо отримати його, поставивши його місце cі провівши xorміж cі b: c xor b = a.Це можна застосовувати незалежно від кількості операндів: a xor b xor c xor d = e. Якщо відмовляє cтоді eвстає на його місце і провівши xorв результаті отримуємо c: a xor b xor e xor d = c. Цей метод по суті забезпечує стійкість до відмови 5 версії. Для зберігання результату xor потрібно всього 1 диск, розмір якого дорівнює розміру іншого диска в raid.

Переваги

RAID5 набув широкого поширення, в першу чергу завдяки своїй економічністі. Об'єм дискового масиву RAID5 розраховується за формулою (n-1) * hddsize, де n - число дисків масиві, а hddsize - розмір найменшого диска. Наприклад, для масиву з чотирьох дисків по 80 гігабайт загальний обсяг (4 - 1) * 80 = 240 гігабайт. На запис інформації на тому RAID 5 витрачаються додаткові ресурси і падає продуктивність, оскільки потрібні додаткові обчислення та операції запису, зате при читанні (проти окремого вінчестера) є виграш, тому що потоки даних з кількох дисків масиву можуть оброблятися паралельно.

Недоліки

Продуктивність RAID 5 помітно нижче, особливо у операціях типу Random Write (записи у довільному порядку), у яких продуктивність падає на 10-25% від продуктивності RAID 0 (чи RAID 10), оскільки потребує більшої кількості операцій із дисками (кожна операція записи, крім так званих full-stripe write-ов, сервера замінюється на контролері RAID чотирма - дві операції читання і дві операції записи). Недоліки RAID 5 виявляються при виході з ладу одного з дисків - весь том переходить у критичний режим (degrade), всі операції запису та читання супроводжуються додатковими маніпуляціями, різко падає продуктивність. При цьому рівень надійності знижується до надійності RAID-0 з відповідною кількістю дисків (тобто n разів нижче надійності одиночного диска). Якщо до повного відновлення масиву відбудеться вихід з ладу, або виникне непоновна помилка читання хоча б ще на одному диску, то масив руйнується, і дані на ньому відновленню звичайними методами не підлягають. Слід також взяти до уваги, що процес RAID Reconstruction (відновлення даних RAID за рахунок надмірності) після виходу з ладу диска викликає інтенсивне навантаження читання з дисків протягом багатьох годин безперервно, що може спровокувати вихід будь-якого з дисків, що залишилися, у цей найменше. захищений період роботи RAID, а також виявити раніше не виявлені збої читання в масивах cold data (даних, яких не звертаються при звичайній роботі масиву, архівні та малоактивні дані), що підвищує ризик збою при відновленні даних.

Мінімальна кількість дисків, що використовуються, дорівнює трьом.

RAID 6 - схожий на RAID 5, але має більше високий ступіньнадійності - під контрольні суми виділяється ємність 2-х дисків, розраховуються 2 суми з різних алгоритмів. Потребує потужніший RAID-контролер. Забезпечує працездатність після одночасного виходу з експлуатації двох дисків - захист від кратної відмови. Для організації масиву потрібно щонайменше 4 диски. Зазвичай використання RAID-6 викликає приблизно 10-15% падіння продуктивності дискової групи щодо RAID 5, що викликано великим обсягом обробки для контролера (необхідність розраховувати другу контрольну суму, а також читати та перезаписувати більше дискових блоків під час запису кожного блоку).

RAID 0+1

Під RAID 0+1 може матися на увазі в основному два варіанти:

  • два RAID 0 об'єднуються у RAID 1;
  • масив об'єднуються три і більше диска, і кожен блок даних записується на два диски даного масиву; таким чином, при такому підході, як і в «чистому» RAID 1, корисний об'єм масиву становить половину від сумарного об'єму всіх дисків (якщо це однакова ємність).

RAID 10 (1+0)

RAID 10 - дзеркальний масив, дані в якому записуються послідовно на кілька дисків, як в RAID 0. Ця архітектура є масивом типу RAID 0, сегментами якого замість окремих дисків є масиви RAID 1. Відповідно, масив цього рівня повинен містити як мінімум 4 диски ( і завжди парна кількість). RAID 10 поєднує в собі високу стійкість до відмов і продуктивність.

Твердження, що RAID 10 є найнадійнішим варіантом для зберігання даних цілком обґрунтовано тим, що масив буде виведений з ладу після виходу з ладу всіх накопичувачів в тому самому масиві. При одному накопичувачі, що вийшов з ладу, шанс виходу з ладу другого в тому самому масиві дорівнює 1/3*100=33%. RAID 0+1 вийде з ладу при двох накопичувачах, що вийшли з ладу у різних масивах. Шанс виходу з ладу накопичувача в сусідньому масиві дорівнює 2/3*100=66%, однак оскільки накопичувач у масиві з накопиченням, що вже вийшов з ладу, вже не використовується, то шанс того, що наступний накопичувач виведе з ладу масив цілком дорівнює 2/2 * 100 = 100%

масив, аналогічний RAID5, проте крім розподіленого зберігання кодів парності використовується розподіл резервних областей - фактично використовується жорсткий диск, який можна додати до масиву RAID5 як запасного (такі масиви називають 5+ або 5+spare). У RAID 5 масиві резервний диск простоює до тих пір, поки не вийде з ладу один з основних жорстких дисків, у той час як у RAID 5EE масиві цей диск використовується спільно з іншими HDD весь час, що позитивно впливає на продуктивність масиву. Наприклад, масив RAID5EE з 5 HDD зможе виконати на 25% більше операцій вводу/виводу за секунду, ніж RAID5 масив із 4 основних та одного резервного HDD. Мінімальна кількість дисків для такого масиву – 4.

об'єднання двох (або більше, але це вкрай рідко застосовується) масивів RAID5 в страйп, тобто. комбінація RAID5 і RAID0, що частково виправляє головний недолік RAID5 - низьку швидкість запису даних за рахунок паралельного використання кількох таких масивів. Загальна ємність масиву зменшується на ємність двох дисків, але на відміну від RAID6, без втрати даних такий масив переносить відмову лише одного диска, а мінімально необхідна кількість дисків для створення масиву RAID50 дорівнює 6. Поряд з RAID10, це найбільш рекомендований рівень RAID для використання у додатках, де потрібна висока продуктивність у поєднанні прийнятною надійністю.

об'єднання двох масивів RAID6 у страйп. Швидкість запису підвищується приблизно вдвічі, щодо швидкості запису в RAID6. Мінімальна кількість дисків для створення такого масиву - 8. Інформація не втрачається при відмові двох дисків з кожного RAID 6 масиву

© Андрій Єгоров, 2005, 2006. Група компаній ТІМ.

Відвідувачі форуму запитують нас: «Який рівень RAID найнадійніший?» Всі знають, що найпоширенішим є рівень RAID5, проте він аж ніяк не позбавлений серйозних недоліків, які є неочевидними для нефахівців.

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 чи що таке рівні RAID?

У своїй статті я спробую охарактеризувати найпопулярніші рівні RAID, а потім сформулюю рекомендації щодо використання цих рівнів. Для ілюстрації статті я побудував діаграму, на якій помістив ці рівні у тривимірному просторі надійності, продуктивності та цінової ефективності.

JBOD(Just a Bunch of Disks) - це просте об'єднання жорстких дисків, яке рівнем RAID формально не є. Том JBOD може бути масив з одного диска або об'єднання декількох дисків. Контролеру RAID для роботи з таким томом не потрібне проведення обчислень. На нашій діаграмі диск JBOD служить як «ординар» або відправна точка – його значення надійності, продуктивності та вартості збігаються з відповідними показниками одиничного жорсткого диска.

RAID 0("Striping") надмірності не має, а інформацію розподіляє відразу по всіх дисках, що входять в масив у вигляді невеликих блоків («страйпів»). За рахунок цього суттєво підвищується продуктивність, але страждає на надійність. Як і у випадку з JBOD, за свої гроші ми отримуємо 100% ємності диска.

Поясню, чому зменшується надійність зберігання даних на будь-якому складовому томі – тому що при виході з ладу будь-якого з вінчестерів, що входять до нього, повністю і безповоротно пропадає вся інформація. Відповідно до теорії ймовірностей математично надійність тому RAID0 дорівнює добутку надійностей складових його дисків, кожна з яких менше одиниці, тому сукупна надійність свідомо нижче надійності будь-якого диска.

Хороший рівень – RAID 1(“Mirroring”, “дзеркало”). Він має захист від виходу з ладу половини наявних апаратних засобів (загалом – одного з двох жорстких дисків), забезпечує прийнятну швидкість запису та виграш за швидкістю читання за рахунок розпаралелювання запитів. Недолік полягає в тому, що доводиться виплачувати вартість двох жорстких дисків, одержуючи корисний об'єм одного жорсткого диска.

Спочатку передбачається, що жорсткий диск – річ надійна. Відповідно, ймовірність виходу з експлуатації відразу двох дисків дорівнює (за формулою) добутку ймовірностей, тобто. нижче на порядок! На жаль, реальне життя- Не теорія! Два вінчестери беруться з однієї партії і працюють в однакових умовах, а при виході з ладу одного з дисків навантаження на збільшується, тому на практиці при виході з ладу одного з дисків слід терміново вживати заходів - знову відновлювати надмірність. Для цього з будь-яким рівнем RAID (крім нульового) рекомендують використовувати диски гарячого резерву HotSpare. Гідність такого підходу – підтримка постійної надійності. Недолік - ще більші витрати (тобто вартість 3-х вінчестерів для зберігання об'єму одного диска).

Дзеркало на багатьох дисках – це рівень RAID 10. При використанні такого рівня дзеркальні пари дисків вишиковуються в «ланцюжок», тому обсяг отриманого тома може перевищувати ємність одного жорсткого диска. Переваги та недоліки – такі самі, як і у рівня RAID1. Як і в інших випадках, рекомендується включати до масиву диски гарячого резерву HotSpare з розрахунку один резервний на п'ять робочих.

RAID 5, дійсно, найпопулярніший із рівнів – насамперед завдяки своїй економічності. Жертвуя задля надмірності ємністю всього одного диска з масиву, ми отримуємо захист від виходу з ладу будь-якого з вінчестерів тому. На запис інформації на тому RAID5 витрачаються додаткові ресурси, оскільки потрібні додаткові обчислення, зате при читанні (порівняно з окремим вінчестером) є виграш, тому що потоки даних з кількох накопичувачів масиву розпаралелюються.

Недоліки RAID5 виявляються при виході з ладу одного з дисків – весь том переходить у критичний режим, всі операції запису та читання супроводжуються додатковими маніпуляціями, різко падає продуктивність, диски починають грітися. Якщо терміново не вжити заходів – можна втратити весь том. Тому (див. вище) з томом RAID5 слід обов'язково використовувати диск Hot Spare.

Крім базових рівнів RAID0 - RAID5, описаних у стандарті, існують комбіновані рівні RAID10, RAID30, RAID50, RAID15, які різні виробники інтерпретують кожен по-своєму.

Суть таких комбінацій коротенько ось у чому. RAID10 – це поєднання одиниці та нуліка (див. вище). RAID50 - це об'єднання по "0" томів 5-го рівня. RAID15 - "дзеркало" "п'ятірок". І так далі.

Таким чином, комбіновані рівні успадковують переваги (і недоліки) своїх батьків. Так, поява «нуліка» у рівні RAID 50анітрохи не додає йому надійності, зате позитивно відбивається на продуктивності. Рівень RAID 15, напевно, дуже надійний, але він не найшвидший і, до того ж, вкрай неекономічний (корисна ємність тому становить менше половини обсягу вихідного дискового масиву).

RAID 6відрізняється від RAID 5 тим, що в кожному ряді даних (англійською stripe) має не один, а дваблок контрольних сум. Контрольні суми – «багатомірні», тобто. незалежні один від одного, тому навіть відмова двох дисків у масиві дозволяє зберегти вихідні дані. Обчислення контрольних сум за методом Ріда-Соломона потребує більш інтенсивних порівняно з RAID5 обчислень, тому раніше шостий рівень практично не використовувався. Нині він підтримується багатьма продуктами, оскільки вони стали встановлювати спеціалізовані мікросхеми, виконують всі необхідні математичні операції.

Згідно з деякими дослідженнями, відновлення цілісності після відмови одного диска на томі RAID5, складеному з дисків SATA великого об'єму (400 і 500 гігабайт), у 5% випадків закінчується втратою даних. Іншими словами, в одному випадку з двадцяти під час регенерації масиву RAID5 на диск резерву Hot Spare можливий вихід з ладу другого диска... завждиробіть резервні копії; 2) використовуйте RAID6!

Нещодавно з'явились нові рівні RAID1E, RAID5E, RAID5EE. Літера "Е" в назві означає Enhanced.

RAID level-1 Enhanced (RAID level-1E)комбінує mirroring та data striping. Ця суміш рівнів 0 та 1 влаштована наступним чином. Дані в ряді розподіляються точнісінько так, як у RAID 0. Тобто ряд даних не має надмірності. Наступний ряд блоків даних копіює попередній зі зсувом один блок. Таким чином, як і в стандартному режимі RAID 1 кожен блок даних має дзеркальну копію на одному з дисків, тому корисний об'єм масиву дорівнює половині сумарного об'єму жорстких дисків, що входять в масив. Для роботи RAID 1E потрібно об'єднання трьох або більше дисків.

Мені дуже подобається рівень RAID1E. Для потужної графічної робочої станції або навіть для домашнього комп'ютераоптимальний вибір! Він має всі переваги нульового і першого рівнів - відмінна швидкість і висока надійність.

Перейдемо тепер до рівня RAID level-5 Enhanced (RAID level-5E). Це те саме що і RAID5, тільки з вбудованим в масив резервним диском spare drive. Це вбудовування здійснюється наступним чином: на всіх дисках масиву залишається вільною 1/N частина простору, яка при відмові одного з дисків використовується як гарячий резерв. За рахунок цього RAID5E демонструє поряд із надійністю кращу продуктивність, оскільки читання/запис проводиться паралельно з великої кількостінакопичувачів одночасно і spare drive не простоює, як у RAID5. Очевидно, що резервний диск, що входить у тому, не можна ділити з іншими томами (dedicated vs. shared). Том RAID 5E будується щонайменше на чотирьох фізичних дисках. Корисний обсяг логічного тому обчислюється за формулою N-2.

RAID level-5E Enhanced (RAID level-5EE)подібний до рівня RAID level-5E, але він має більш ефективний розподіл spare drive і, як наслідок, - швидший час відновлення. Як і рівень RAID5E, цей рівень RAID розподіляє в рядах блоки даних та контрольних сум. Але він також розподіляє і вільні блоки spare drive, а не просто залишає під ці цілі частину об'єму диска. Це дозволяє зменшити час, необхідний реконструкцію цілісності тома RAID5EE. Резервний диск, що входить до того, не можна ділити з іншими томами – як і в попередньому випадку. Том RAID 5EE будується щонайменше на чотирьох фізичних дисках. Корисний обсяг логічного тому обчислюється за формулою N-2.

Як не дивно, жодних згадок про рівень RAID 6Eна просторах Інтернету я не знайшов - поки що такий рівень ніким із виробників не пропонується і навіть не анонсується. Адже рівень RAID6E (або RAID6EE?) можна запропонувати за тим же принципом, що й попередній. Диск HotSpare обов'язковоповинен супроводжувати будь-який том RAID, у тому числі і RAID 6. Звичайно, ми не втратимо інформацію при виході з ладу одного або двох дисків, але почати регенерацію цілісності масиву вкрай важливо якнайшвидше, щоб швидше вивести систему з «критичного» режиму. Оскільки необхідність диска Hot Spare для нас не підлягає сумніву, логічним було б піти далі і «розмазати» його тому, як це зроблено в RAID 5EE, щоб отримати переваги від використання великої кількості дисків ( найкраща швидкістьна читанні-записі та більше швидке відновленняцілісності).

Рівні RAID у «числах».

У таблиці я зібрав деякі важливі параметри майже всіх рівнів RAID, щоб можна було зіставити їх між собою і чіткіше зрозуміти їхню суть.

Рівень
~~~~~~~

Хати-
точ-
ність
~~~~~~~

Використання
зування ємності дисків
~~~~~~~

Вироб-
дитель-
ність
читання

~~~~~~~

Вироб-
дитель-
ність
записи

~~~~~~~

Вбудований-
ний диск
резерву

~~~~~~~

мін. у дисків
~~~~~~~

Макс. у дисків

~~~~~~~

Відл

Відл

Відл

Відл

Усі «дзеркальні» рівні – RAID 1, 1+0, 10, 1E, 1E0.

Давайте ще раз спробуємо досконально розібратися, чим відрізняються ці рівні?

RAID 1.
Це – класичне "дзеркало". Два (і лише два!) жорсткого дискапрацюють як один, будучи повною копією один одного. Вихід з ладу будь-якого з цих двох дисків не призводить до втрати ваших даних, так як контролер продовжує роботу з диском, що залишився. RAID1 у цифрах: дворазова надмірність, дворазова надійність, дворазова вартість. Продуктивність на запис еквівалентна продуктивності одного жорсткого диска. Продуктивність читання вища, оскільки контролер може розподіляти операції читання між двома дисками.

RAID 10
Суть цього рівня у цьому, що диски масиву об'єднуються парами в «дзеркала» (RAID 1), та був всі ці дзеркальні пари своєю чергою об'єднуються у загальний масив із чергуванням (RAID 0). Саме тому його іноді позначають як RAID 1+0. Важливий момент– у RAID 10 можна об'єднати лише парну кількість дисків (мінімум – 4, максимум – 16). Позитивні якості: від "дзеркала" успадковується надійність, від "нуля" - продуктивність як на читання, так і на запис.

RAID 1Е.
Літера "E" у назві означає "Enhanced", тобто. "Поліпшений". Принцип цього покращення наступний: дані блоками "чергуються" ("striped") на всі диски масиву, а потім ще раз "чергуються" зі зсувом на один диск. У RAID 1E можна поєднувати від трьох до 16 дисків. Надійність відповідає показникам "десятки", а продуктивність за рахунок більшого "чергування" стає трохи кращою.

RAID 1Е0.
Цей рівень реалізується так: ми створюємо "нульовий" масив із масивів RAID1E. Отже, загальна кількість дисків має бути втричі: мінімум три і максимум – шістдесят! Перевага у швидкості при цьому навряд чи отримаємо, а складність реалізації може несприятливо позначитися на надійності. Головна перевага – можливість об'єднати в один масив дуже велику (до 60) кількість дисків.

Подібність всіх рівнів RAID 1X полягає в їх показниках надмірності: задля реалізації надійності жертвується рівно 50% сумарної ємності дисків масиву.