Raid - основні поняття і поради

Акронім RAID (Reudant Array of Independed Disks) надлишковий масив незалежних дисків, вперше був використаний в 1988 році дослідниками з інституту Берклі Паттерсоном (Patterson), Гібсоном (Gibson) і Кацем (Katz). Вони описали конфігурацію масиву з декількох недорогих дисків, що забезпечують високі показники по відмовостійкості і проізводітельності.Наіболее «слабкою» в сенсі відмовостійкості частиною комп'ютерних систем завжди були жорсткі диски, оскільки вони, чи не єдині зі складових комп'ютера, мають механічні частини. Дані записані на жорсткий диск доступні тільки поки доступний жорсткий диск, і питання полягає не в тому, чи відмовить цей диск коли-небудь, а в тому, коли він откажет.RAID забезпечує метод доступу до декількох жорстких дисків, як якщо б був один великий диск (SLED - single large expensive disk), розподіляючи інформацію і доступ до неї по декількох дисках, забезпечуючи зниження ризику втрати даних, в разі відмови одного з вінчестерів, і збільшуючи швидкість доступу до них.

Навіщо використовувати RAID?

Зазвичай RAID використовується в великих файл серверах або серверах додатків, коли важлива висока швидкість і надійність доступу до даних. Сьогодні RAID застосовується так само в настільних системах, що працюють з CAD, мультимедійними завданнями і коли потрібно забезпечити високу продуктивність дискової системи.

Які типи RAID існують і в чому їх переваги і недоліки?

JBOD (Just a Bunch of Disks). Кожен з дисків доступний так само, як якби він був підключений до звичайного контролеру. Ця конфігурація застосовується коли необхідно мати кілька незалежних дисків, але не забезпечує ні підвищення швидкості, ні відмовостійкості.

Також його часто називають «страйпінг» (striping). Строго кажучи, RAID 0 не є рівнем RAID, оскільки не забезпечує збільшення відмовостійкості. Блок даних записується / читається одночасно на / з декількох дисків, що збільшує продуктивність дискових операцій.Преімущество страйпінга полягає у високій продуктивності і повному використанні входять до складу масиву дисків. Недолік - в відсутності відмовостійкості - якщо один з дисків відмовляє, то весь масив стає недоступним. (+): Висока продуктивність
(+): Відсутність відмовостійкості.

Віддзеркалення (mirroring) забезпечує високу надійність за допомогою багаторазового запису одного і того ж блоку даних (по одному разу на кожен з дисків). Якщо один з дисків відмовляє, то інші містять точну копію даних і контролер може негайно переключитися на використання непошкоджених дісков.Преімущество зеркалирования очевидно - висока надійність. Недоліками є відсутність збільшення продуктивності і висока ціна за рахунок повного дублювання дисків (при двох дисках відсоток їх використання становить 50%). (+): Висока надійність
(+): Відсутність збільшення продуктивності
(+): Ціна.

Розбиває дані на блоки розміром 1 байт, розподіляє їх по декількох дисках і використовує один додатковий диск для зберігання контрольних сум на випадок необхідності корекції або відновлення пошкоджених дисків. RAID 3 підтримується не всіма RAID контролерами. (+): Висока швидкість читання і запису даних.
(-): масив цього типу гарний тільки для однозадачной роботи з великими файлами, так як спостерігаються проблеми зі швидкістю при частих запитах даних невеликого обсягу.
(-): велике навантаження на контрольний диск, що призводить до того, що його надійність сильно падає в порівнянні з дисками з даними.

RAID 4 схожий на RAID 3, але відрізняється від нього тим, що дані розбиваються на блоки, а не на байти. Таким чином, вдалося «перемогти» проблему низької швидкості передачі даних невеликого об'єму. Запис же проводиться повільно через те, що парність для блоку генерується під час запису і записується на єдиний диск. Використовуються масиви такого типу дуже рідко.

Рівень RAID 5 використовується, мабуть, найчастіше. Він забезпечує як страйпінг, так і обчислення і зберігання контрольних сум на випадок необхідності корекції / відновлення. У RAID 5 блок парності розподіляється по всіх дисках в масиві, забезпечуючи більш збалансоване навантаження на них. Контрольні суми використовуються при корекції / відновленні даних в разі відмови одного з дисків. Результуюча ємність масиву з використання RAID 5 становить (N-1) * C, де N - кількість дисків в масиві, а C - їх ємність. Для побудови RAID 5 необхідно, як мінімум, 3 диска (ми настійно рекомендум використовувати, як мінімум 4). (+): Відмовостійкість.
(+): Економічність (в сенсі корисного кількості використовуваних дисків).
(+): При читанні (в порівнянні з окремим вінчестером) є виграш, тому що потоки даних з декількох накопичувачів масиву обробляються паралельно.
(-): повільний цикл записи (2 операції читання і 2 записи потрібні для запису одного блоку).
(-): при виході з ладу одного з дисків - весь тому переходить в критичний режим (degrade), всі операції запису і читання супроводжуються додатковими маніпуляціями, різко падає продуктивність. При цьому рівень надійності знижується до надійності одиночного диска. Якщо до повного відновлення масиву вийде з ладу хоча б ще один диск, то масив руйнується, і дані на ньому відновленню звичайними методами не підлягають. Мінімальна кількість використовуваних дисків дорівнює трьом. З томом RAID 5 можна використовувати диск Hot Spare. Основний час додатковий диск простоює, але при виході з ладу одного з дисків масиву, його відновлення починається негайно з використанням spare-диска. При використанні одного томи RAID 5 дана конфігурація дисків є марнотратною, ефективніше використовувати RAID 6. Доцільність використання spare-диска проявляється в системі з декількох томів RAID 5, в якій Hot Spare диск призначений для кожного з томів RAID 5, і може бути використаний у разі необхідності для негайного відновлення одного з томів.

Рівень RAID 6 є розвитком і розширенням RAID 5, яке забезпечує поліпшення відмовостійкості за рахунок записи не одного набору контрольних сум, як у випадку з RAID 5, а двух.Поскольку RAID 5 використовує тільки один набір контрольних сум, дані можуть бути безвовратно втрачені в тому випадку, коли в процесі перестроювання Рейд (після відмови одного з вінчестерів), відбувається відмова другого (або помилка доступу). Для вирішення цієї проблеми і розроблений RAID 6.

Порівняння RAID 5 і RAID 6

на операціях послідовного запису менша ніж у RAID 5 на 10-15%

Здавалося б: ймовірність виходу з ладу другого диска в процесі перестроювання RAID явище малоймовірне, але як показує наш досвід і досвід наших клієнтів це трапляється. Основними причинами почастішання таких випадків є:

  • Зростаюче застосування менш надійних дисків:
    Перевага S-ATA дисків полягає в низькій вартості і високої ємності, але MTBF (напрацювання на відмову) у них нижче, ніж у SCSI або SAS дисків. Це збільшує ймовірність ождновременного відмови двох дисків.
  • Більше ємність - більше час перестроювання, крім того, в процесі перестроювання, система відчуває більш високі навантаження, що так само підвищує ймовірність відмови другого диска.
  • Людський фактор.
    Коли один з дисків в RAID виходить з ладу, хтось повинен його замінити. Помилка, напрмер заміна не ту диска, призводить до повної втрати даних.
  • Кількість відмов зростає пропорційно кількості дисків.
    А якщо врахувати, що в сучасних системах два десятка дисків вже не є чимось незвичайним, то і одночасний (або послідовний у процесі перестроювання) відмова двох з них, вже не здається таким вже малоймовірним подією.

(+): Відмовостійкість (вище ніж у RAID 5).
(+): Економічність (в сенсі корисного кількості використовуваних дисків).
(+): При читанні (в порівнянні з окремим вінчестером) є виграш, тому що потоки даних з декількох накопичувачів масиву обробляються паралельно.
(-): не велика швидкість запису.

Детальніше про RAID 6 (англійською мовою) можна прочитати тут ».

Зазвичай при побудові RAID 5 один диск залишають вільним (Hot Spare), щоб у разі збою система відразу стала перебудовувати (rebuild) масив. При звичайній роботі цей диск працює вхолосту. Система RAID 5EE має на увазі використання цього диска в якості елемента масиву. А обсяг цього вільного диска розподіляється по всьому масиву. Мінімальна кількість дисків - 4 штуки. Доступний обсяг дорівнює n-2, обсяг одного диска використовується (будучи розподіленим між усіма) для парності, обсяг ще одного - вільний. При виході з ладу диска відбувається стиснення масиву до 3-х дисків (на прикладі мінімального числа) заповненням вільного простору. Виходить звичайний масив RAID 5, стійкий до відмови ще одного диска. При підключенні нового диска, масив розтискається і займає знову все диски. (+): Відмовостійкість.
(+): Економічність (в сенсі корисного кількості використовуваних дисків).
(+): При читанні (в порівнянні з окремим вінчестером) є виграш, тому що потоки даних з декількох накопичувачів масиву обробляються паралельно.
(-): невисока швидкість запису.

Це комбінація страйпінга (RAID 0) і міррорінга (RAID 1) без обчислення контрольних сум. Для реалізації такого рішення необхідно мінімум 4 диска. (+): Висока швидкість (як у RAID 0).
(+): Відмовостійкість (як у RAID 1).
(-): потрібно, як мінімум, подвоєна ємність дисків (як у RAID 1).

Це комбінація RAID 5 і страйпінга (RAID 0). Для реалізації такого рішення необхідно мінімум 6 дисків. (+): Висока швидкість передачі даних і обробки запитів.
(+): Хороша швидкість відновлення даних і стійкість при відмові.
(-): потрібно, як мінімум, 6 дисків.

Схожі статті