Типи архітектур систем зберігання даних, системна архітектура і все-все-все

Для пам'яті, існує 4 типи архітектур СГД:

1. Групові Сільносвязанная (вертикально масштабовані)

Характеризуються відсутністю загальної пам'яті, як дискової, тобто у кожного контролера свій набір дисків, так і загального кеша. Доступ до дисків, що належить іншому контролеру, так само як і синхронізація кешей, виробляються через інтерконект (як правило IB або 10GE). Зазвичай складаються з відмовостійкої пари контролерів (HA-pair), іноді такі пари можуть об'єднуватися в якусь подобу горизонтального кластера - федерації, як у Netapp. Переваги: ​​швидкі, відносно недорогі. Недоліки: відсутність горизонтального масштабування, тобто кожна конкретна порція даних завжди обслуговується тільки одним контролером, тим, кому належать диски, на яких лежать ці дані. Доступ через інші контролери можливий, але це буде indirect доступ, через внутрішній інтерконект.

  • Active / Passive- NetApp, EMC VNX
  • Active / Active- HDS HUS 100, Dell Compellent, EMC VNX gen2 *, IBM V7000
  • Програмні реалізації: DRBD, Starwind

* - В EMC VNX останньої генерації з'явився Symmetric Active-Active (SAA) для доступу до томів. На даний момент працює тільки для Classic LUN (начебто очікується підтримка на пулах), тобто поки для таких томів не працюватимуть thin LUN, дедуплікація, FastCache, FastVP

2. слабо зв'язаної (горизонтально масштабовані)

Також відсутня спільна пам'ять: у кожного контролера свій набір дисків, і свій кеш. Дані розподілені по безлічі вузлів-нод (уявіть собі RAID5, що складається не з дисків, а з нод). При цьому, як правило, обмін даними між сервером і такий СГД для кожної конкретної дискової операції відбувається через якусь одну ноду. Записи на все Ноди виробляються в синхронному режимі, тому консистентность даних зберігається: клієнт отримує підтвердження про успішне проведення записи тільки після того, як всі шматочки даних будуть записані на все Ноди, за якими цей запис «розмазується». Синхронізація кешів проводиться через інтерконект (як правило, 10GE). Переваги: ​​просте масштабування і управління, недорогі. Недоліки: велика кількість комунікацій між нодамі, звідси проблеми в latency, особливо на Random R / W невеликими порціями даних.

  • Апаратні: EMC Isilon, Dell Equallogic, HP StoreVirtual 4000, Nutanix
  • Програмні: VMware vSAN, IBM SONAS, HP StoreVirtual VSA, EMC ScaleIO, Ceph (block device)

3. Сільносвязанная (горизонтально масштабовані)

Характеризуються наявністю загальної пам'яті: загальний кеш, іноді загальний набір дисків. Симетричний доступ до даних через будь-який з контролерів, а також робота із загальним кешем (як правило, через RDMA) вимагає високошвидкісного інтерконекту (IB, Bynet або щось пропрієтарних). Переваги: ​​швидкість, горизонтальне масштабування з лінійним приростом продуктивності. Недоліки: дорого, обмеженість горизонтального масштабування, складність архітектури обумовлює відносно низьку функціональність і довгий прихід новомодних функцій в такі системи.

  • EMC Symmetrix VMAX, EMC XtremIO
  • HDS VSP, HDS HUS VM
  • HP 3Par

4. Розподілені без загальних елементів (shared nothing) - горизонтально масштабовані

Відсутня спільна пам'ять: у кожного контролера свій набір дисків, і свій кеш, кеші, як правило, не синхронізовані. Дані розподілені по безлічі вузлів-нод, але не транзакційно, а «ліниво». Тобто дані записуються на одну ноду, і з певною періодичністю (іноді) копіюються на інші Ноди для забезпечення захищеності (уявіть собі асинхронний RAID 1 з нодамі замість дисків). Переваги: ​​фантастичне масштабування, недорогі. Недоліки: не підходять для транзакційних завдань (напевно, це все таки не баг, а фіча;)).

Схожі статті