Відновлення даних з raid 5 scsi після ребілд

Якось я вже писав про феномен високого професіоналізму системних адміністраторів. Громадяни, які вміють встановлювати операційну систему і налаштовувати мережеві протоколи, негайно починають відчувати себе діамантами небаченої огранювання, гордо починають кликати себе "сисадмін" і вимагати оплати свого безцінного праці пудовими золотими злитками. У процесі здійснення послуг з ремонту жорстких дисків і відновлення файлів часто доводиться з такими стикатися.

Ось такі ось талановиті сисадміни працюють не тільки на дрібних підприємствах, а й у таких великих і шанованих конторах, як "Газпром". За останні дванадцять місяців з Газпрому до мене зверталися двічі. Один раз з Ставропольського головного офісу, а другий, зовсім недавно, з підрозділу в Изобильненский районі.


SCSI cервер, вид збоку

Обидва випадки схожі, як два хард-року з однієї партії. У розпорядженні адмінів крутий сервер, з гарячою заміною всього, чого можна, від блоків живлення (яких варто в корпусі два) до модулів пам'яті. Дисковий масив на сервері складається з п'яти "скази" вінчестерів Seagate Cheetah, об'єднаних в Raid масив п'ятого рівня.


Поламані HDD SCSI з Raid-5

В один момент один з дисків запалює червону лампочку і спікер на контролері починає пищати, сигналізуючи про несправності. Але, оскільки для Raid-5 така ситуація не є смертельною, падає тільки швидкість обміну даними, а сама ОС вантажиться і працює в штатному режимі, сисадміни вирішують, що нічого страшного не сталося. Подумаєш, "червоним диск загорівся", все ж працює!


Сервер з скази рейд масивом
Відновлення інформації з Raid 5

Коли через якийсь час падає другий диск, сисадміни приходять в деяке хвилювання - сервер перестає працювати, і замість околачіванія груш на високооплачувану роботу, треба щось робити і відновлювати роботу підприємства.

Рік тому була така картина, тоді відразу звернулися до мене і дані вдалося відновити відносно просто.

Цього разу все серйозніше - сисадміни в Риздвяновском Газпромі отримують велику зарплату, і в своїх силах і уміннях впевнені пропорційно більше. Коли з рейд-масиву вилетів другий накопичувач, сисадміни повезли поламаний сервер з Raid5 SCSI в сервіс-центр, який продає і лагодить Aquarius в Ставрополі.

Тепер сервер стоїть у мене в майстерні, і третій день я маю розвага, намагаючись зібрати з посекторного копій всіх старих робочих, нових свіже-отребілденних, і старих, які мені довелося відремонтувати, SCSI вінчестерів робочий рейдмассів з валідними даними.

Добре критикувати народ. Може цей "граматеі" по вашому і не нишпорять в райд масивах, але нишпорять в чомусь іншому. Неможливо знати ВСЕ в такої спеціальності як АСУ. І якщо Ви вважаєте інакше, то Ви юзер, який думає що сис адмін сидить і нічого не робить днями, але ж хороший сис адмін, це той, у якого все працює, а не той який постійно щось лагодить і намагається налагодити!

Я так зрозумів, Ви займаєтеся відновленням даних? Я ще зрозумів що ви в цьому добре розбираєтеся, але Ви, хороший сис адмін, зможете вивантажити базу 1с командою в 1 рядок з командного рядка? або тупо заправити картридж для лазерника? Ви відповісте, що зможете, якщо знадобиться, Але в даний момент Ви цього не можете. Так і все!

Ніхто не сперечається - розбиратися у всіх аспектах, що стосуються IT якщо і не неможливо, то принаймні дуже складно. Не можна бути просунутим програмістом на асемблері, 1С, знати всі тонкощі і секрети пакетів Adobe і Steinberg, заправляти і чиповать картриджі і паяти материнки з блоками живлення однаково добре.

Але человечетво додумалися до таких речей, як спеціалізація. Якщо я приходжу в ресторан, мені все одно, що кухар не може полагодити двигун на моїй машині, але я розраховую отримати від нього смачну їжу.

А в описаному випадку в наявності кричущий непрофесіоналізм! Люди взагалі не в курсах, що таке сервер, як влаштований рейд масив, що можна робити, у випадках збоїв, а що не можна. Вони не в змозі виконати головну роботу системного адміністратора - забезпечити безперебійну роботу комп'ютерного парку підприємства, зав'язаного на роботу сервера.

сумно. але я радий за тебе чувак. сам дуже часто бачив подібну картину. коли у великій фірмі варто хороше серверне обладнання і є людина яка повинна це обладнання обслужівать..но ось як тільки що то там ламається чому зазвичай ці люди або самі відразу звільняються або з часом звільняють іх..а котрі не взагалі беруть людину на посаду сис адміна для того щоб він їм папірці печатал..а коли ламається сервак викликають "комп'ютерну допомогу". так власне чому радий то. а тому що у всіх криза. а газпром дуже богатий..я думаю за таку роботу прийдеться йому не парою штук розплачуватися)

у нас на фірмі відбулася подібна ситуація з RAID5 з чотирьом дисків, ось тільки сервер Ніяк не сигналізував про вихід з ладу дисків, а й ребілд незрозуміло як був проведений - сисадміна на фірмі немає, сервер знаходиться в приміщенні під замком. Перший диск "випав" три тижні тому, другий - тиждень тому. Тепер ніяк не можемо зрозуміти, чи можна було таке зробити віддалено, або все сталося через неправильні налаштування "на автоматі"

Чи не дивлячись складно що-небудь сказати. На вскидку потрібно подивитися хоча б перші 6 млн. LBA з кожного диска, щоб зробити попередній висновок.

а) Не дуже віриться в саму можливість запустити ребілд при недостатній кількості дисків. Якщо том не деградував, а впав - чому і куди ребілд. Контролер просто не дозволить. Ось якщо повернути один з відвалилися дисків в онлайн - тоді так, ребілд піде, але до кінця, ясна річ, не дійде.

P.S. Цікаво, чи чули тобою описувані адміни про такий термін, як hotspare.

Нотатки схожої тематики:

Схожі статті