халатність сисадміна

Спасибі ОГРОМНЕЙШЕЕ. Ви просто врятували нас. Навіть після наших безуспішних спроб відновлення програмами (які нам радили в інших лабораторіях) будинку, сталося ЧУДО, і ВСІ файли (НАЙВАЖЛИВІШІ (читай весільні, невіддані клієнтам.) Фотографії NEF, TIFF, JPEG) були відновлені на 100%. Заради цього дійсно варто було перетнути половину Росії. Ви просто чарівники.

Одного ранку пролунав дзвінок. Молода людина повідомив, що у нього впав RAID5 масив з п'яти SCSI вінчестерів і потрібне відновлення даних. Сказав що з області і приїде через пару годин. З урахуванням московських пробок приїхав тільки під закриття, залишивши нам на діагностику півгодини. Сервер привіз цілком, близько 30 кг :)

Півгодини вистачило, що б констатувати страшний факт. Дані на всіх вінчестерах з масиву: знищені.

За словами системного адміністратора, ситуація була наступна. Сервер працював, до нього зверталися користувачі .... документи, 1С бухгалтерія тощо Помітили, що до одного з дисків немає звернення, які не моргає лампочка. БІОС RAID контролера показує що масив пошкоджений (Array DEGRADED), але дані при цьому читаються, хоч і швидкість роботи сервера помітно впала. Вирішили зробити «добру» справу. Вставити замість зламаного вінчестера новий і скористатися функцією REBUILD. Власне RAID5 на це і розрахований. Після довгої роботи REBUILD сервер перестав завантажуватися взагалі.

Коли диски потрапили до нас, на звичайному SCSI контролері, через ДіскЕдітор, на всіх дисках були видні нулі, по всій поверхні.

RAID5 організований таким чином, що дані пишуться секторами на все диски последоватьно, тобто дані існують на всіх дисках одночасно. На прикладі RAID5 з 5 дисків, чотири сектори запишуться послідовно на чотири диски, а на п'ятому сформується спеціальна контрольна сума від цих чотирьох секторів, і так далі, до кінця дисків. Сектора з контрольною сумою циклічно повторюються і переміщаються послідовно по всіх дисках в масиві. Зроблено це для того що б при виході з ладу будь-якого одного диска, можна вставити справний чистий диск, зробити ребілд, за допомогою контрольних сум чистий диск заповниться інформацією зламаного, і рейд продовжить функціонування, в звичайному режимі. RAID може працювати і в аварійному режимі, тобто: «на ходу» ламається диск, контролер продовжить вираховувати контрольну суму, але не писати її на диски, швидкість його роботи при цьому сповільнюється, RAID почне огидно пищати.

В даному випадку, замість перерахунку з робочих дисків з інформацією на новий чистий, REBUILD стався «навпаки». Нулі з нового диска записалися на всі інші, тим самим дані будете знищені.

У наявності, груба помилка системного адміністратора, недбале ставлення до інформації підприємства. Перш ніж здійснювати будь-які маніпуляції з даними, поки вони читаються, їх потрібно скопіювати в надійне місце. Ось так, ми залишилися без грошей, а фірма без даних;)