Grid як майбутнє комп'ютингу, відкриті системи

ІТ-інфраструктура для вашого підприємства

Спостерігаючи за розвитком комп'ютерів не втомлюєшся дивуватися тому, наскільки воно стрімко і безмежно. Здається, ну що може бути досконаліше того, що є на поточний момент, але на горизонті незмінно виявляється щось принципово інше, здатне змінити все. Сьогодні це Grid.

Зовсім не випадково активне звернення до Grid відбувається сьогодні, коли ми стали свідками кризи ІТ. Чисто зовні криза проявляється в тому, що технології явно втратили інвестиційну привабливість, хоча самі по собі і продовжують стрімко розвиватися.

В енциклопедії Britannica наведено таке визначення: «Grid - метод використання розподілених процесорних потужностей і розподілених систем зберігання, який став популярним завдяки схемам, що дозволяє використовувати незайняті обчислювальні ресурси, розкидані по всьому світу. Сьогодні, в основному з причин недостатньої безпеки, системи, побудовані на принципах Grid, створюються найчастіше всередині підприємств; цей метод дозволяє їм більш ефективно використовувати обчислювальні ресурси ».

Дійсно, ефективність використання інвестицій в комп'ютери хвилює сучасні підприємства більше, ніж раніше. Аж ніяк не випадково, що саме сьогодні HP, IBM і Sun Microsystems, а також більш дрібні компанії звернули свої погляди в бік Grid. Лідери напрочуд синхронно пропонують нові і надзвичайно близькі за змістом стратегії розвитку, спрямовані на реструктуризацію корпоративної інформаційної інфраструктури. Кожен називає власну ініціативу по-своєму, але будь то utility computing, autonomic computing або N1, по суті вони дуже схожі і, що показово, все міцно пов'язані з архітектурою Grid.

Однак було б помилкою визнати справедливість тільки цього досить вузького визначення і обмежити явище, яке називають Grid, тільки корпоративними підходами. Ризикну припустити, що Grid - це якийсь контрапункт, поворот в еволюції комп'ютингу, на якому закінчується чергова фаза його розвитку і починається наступна. Керівники провідних компаній-виробників відверто визнають: замовники з великим небажанням вкладають кошти в нову техніку. Має бути досить тривалий період стагнації. За даними Gartner Group, ніякого помітного зростання, наприклад, на ринку серверів в найближчі п'ять років не очікується.

Кілька зауважень про термінологію

Повернемося до паралелі між Grid і Internet. Технології, створені для Глобальної мережі, дали можливість народження внутрішньокорпоративних мереж intranet. З тих пір ми пишемо Internet з великої літери як власна назва (Мережа одна), а intranet - з маленької (таких мереж багато). Сьогодні ще немає однієї глобальної структури Grid, можливо вона коли-небудь виникне, але є ідея Grid. Невеликі корпоративні структури, побудовані на тих же принципах, будемо їх називати grid. Чи варто транслітерувати ці назви кирилицею, покаже час, хоча хотілося б.

Разом зі словами Grid і поєднанням Grid-комп'ютинг в професійний лексикон з неминучістю має ще міцніше увійти і супутнє йому? Комп'ютинг ?; воно з'явилося в даному контексті не випадково. Зазвичай слово комп'ютинг вживається там, де окремий комп'ютер стає частиною складної обчислювальної системи. До сих пір це слово зустрічалося в таких поєднаннях, як паралельний комп'ютинг, квазіфізіческіе комп'ютинг або метакомп'ютингу т. Е. Там, де на основі, умовно кажучи, простих комп'ютерів будують системи вищого рівня. До цього слова цілком можна звикнути, звикли ж автомобілісти до слова тьюнінг, а інші - до дайвінгу, а треті - до серфінгу. До речі, і саме слово комп'ютер теж йшло в російську мову не легко.

Комп'ютинг як не можна більш точно підходить до того, що являє собою Grid. На підтвердження звернемося до більш загальним визначенням Grid, наприклад, до такого [1]: «Grid являє собою якийсь? Віртуальний суперкомп'ютер. в якому віддалені обчислювальні пристрої спільно утворюють потужну обробну середу, щось на зразок Skynet в? Термінаторі 2. Grid-комп'ютинг - новий клас інфраструктур, в яких з віддалених ресурсів складається безпечний і масштабований обчислювальний механізм. До складу цього механізму можуть працювати на комп'ютерах, починаючи від настільних і до серверних ферм і суперкомп'ютерів, програмного забезпечення та пристрої введення / виводу. В основі Grid лежать програмні технології, що використовують нові стандарти і протоколи разом із відомими мережевими і Internet-протоколами ».

Зараз - справа і не справа - використовується словосполучення «інформаційні технології». Варто сказати кілька слів з цього приводу. Перш за все, тому що з часів Клода Шеннона на інженерному рівні відбулося змішання понять, об'єднання уявлень про інформацію і даних або сигналах, що кодують цю інформацію. З легкої руки першопрохідців інформацією стали називати, по суті, набори даних. До останнього часу, поки системи були відносно прості, відсутність чіткого поділу на дані та інформацію не мало практичного значення. Але з появою складних інформаційних систем, де функції розподілені між людиною і машиною, де людина є активною складовою, а також з розвитком таких дисциплін, як управління знаннями, потрібні більш точні визначення базисних понять: «дані», «інформація» і «знання» . У літературі можна знайти сотні різних визначень поняття «інформація»; багато з них суперечливі. Але якщо ми поки не можемо точно визначити, що таке інформація, то і що таке інформаційні технології, не дуже зрозуміло. Але збережемо його, як то кажуть, «термін зайнятий».

У Росії справа йде ще гірше. Слово «інформатика» безцеремонно забрали у скромній науки, теж називалася інформатикою, але при цьому відала саме інформацією, в основному науково-технічної (у всьому світі вона називається library science). У підсумку абсолютно неможливо розібрати, де технології, а де власне те, що будується на базі цих технологій. Навіть відповідне відділення Російської академії наук називається, як це не дивно, «Відділення інформаційних технологій і обчислювальних систем». Уявіть, що, наприклад, будівельну механіку, матеріалознавство і архітектуру змішали б в одну дисципліну.

Термін «комп'ютинг» може виявитися дуже корисним для уточнення термінології взагалі та визначення місця для інформаційних технологій, зокрема. Насправді взаємозв'язок між комп'ютинг і складовими інформаційну індустрію технологіями дуже проста: вона та сама, що і в будь-який інший індустрії, в авіації, машинобудуванні суднобудуванні, де завгодно. Всюди технології забезпечують будівельний матеріал, будівельні блоки для створення систем, що володіють кінцевими споживчими властивостями, літаків, верстатів, кораблів і т.д. Рівень зрілості індустрії визначається тим, наскільки глибоко технології приховані від споживача. Його користувачі не зобов'язані розуміти пристрій побутових електронних приладів або автомобілів, вони повинні вміти ними КОРИСТУВАТИСЯ.

Інформаційна індустрія, незважаючи на видимі успіхи, не є поки достатньо зрілою: деякими ознаками зрілості мають персональні комп'ютери, але на корпоративному рівні все ще на рівні становлення. Про зрілість (maturity) і незрілості (immaturity) інформаційних технологій ми розмовляли з Бадом Лаусон [2]. Видатний шведський вчений висловив думку, що, незважаючи на видимі досягнення, комп'ютери і їх застосування ще тільки вступають в пору зрілості. Лаусон не став називати реальні прояви і рушійні сили нової епохи, проте цілком імовірно, що це саме Grid і все, що з ним пов'язано.

походження Grid

Можливо, коли-небудь ті самі історики з майбутнього визнають 60-і роки XX століття «срібним століттям» комп'ютингу. Імена людей, які створювали комп'ютерну платформу сучасності в Росії, в США, у Великобританії та інших країнах, стали легендарними. Але не варто забувати, що тоді комп'ютери були потрібні в основному для наукових і військових програм, і розвиток відповідних галузей у всіх країнах фінансувалося з державних бюджетів. Визнаючи згубність впливу адміністраторів на науку, не можна не визнати, що без серйозних інвестицій були б неможливі необхідні перші кроки. Природно, це відкрило можливість для роботи і великих науково-дослідних організацій, і окремих видатних вчених для проведення фундаментальних досліджень. Американським вченим пощастило двічі. По-перше, обсяг інвестицій був незрівнянно більше, ніж в інших країнах, а по-друге, їм була дана велика свобода творчості, ніж в СРСР. Тому саме тоді і саме там були закладені основи тієї теорії, на якій грунтується сучасний комп'ютинг.

Америка - країна автомобілів; може бути, тому далі розвиток пішов по «автотранспортному» шляху: кожному індивідуальному користувачеві за власним автомобілю, а корпоративному - по автобусу, поїзду або навіть літаку. Неважко уявити собі, до чого це призвело. Персональні комп'ютери використовуються приблизно так само, як особисті автомобілі - здебільшого простоюють і лише іноді експлуатуються власниками. Цікаво, що чим більше обчислювальна система, тим менше простий. За даними Gartner Dataquest, ПК-сервери використовуються в середньому на 5-20%, так що орієнтація на дешеві стандартні сервери, можливо, не самий прямий шлях до економії.

Grid як майбутнє комп'ютингу, відкриті системи

Мал. 1. Еволюція Grid-комп'ютингу

Три покоління академічного Grid

Історія першого покоління академічного Grid починається в 1989 році. Тоді цей підхід мав назву метакомп'ютингу, робота велася за проектом CASA. У першій половині 90-х років найбільш активно розвивалися проекти FAFNER і I-WAY. При видимому відмінності (в FAFNER акцент був зроблений на робочі станції, а в I-WAY - на суперкомп'ютери) загальним було те, що в них вирішувалися проблеми комунікації, управління ресурсами, маніпуляції віддаленими даними.

Стимулом для появи проекту FAFNER (Factoring via Network Enabled Recursion) став конкурс Factoring Challenge, оголошений компанією RSA, першої запропонувала криптосистему з відкритим ключем. Ця система заснована на тому факті, що невідомо скільки-небудь прийнятного за часом роботи алгоритму розкладання твори двох великих простих чисел на множники. Оскільки є можливість для розпаралелювання алгоритмів розкладання і не потрібна висока швидкість обміну, для вирішення цього завдання була створена «павутина» з робочих станцій. За своєю логікою проект FAFNER дуже близький до SETI; участь в ньому носить добровільний характер.

Родзинка проекту I-WAY (Information Wide Area Year) полягала в тому, що для об'єднання 17 високопродуктивних вузлів не будувалася спеціальна високопродуктивна мережа, а віртуалізувати об'єднані ресурси десяти існуючих мереж, побудованих на основі технології ATM. На відміну від FAFNER, в цьому проекті була потрібна висока швидкість обміну даними між вузлами. Для управління цією системою був створений брокер ресурсів Computational Resource Broker, що складається з центрального керуючого вузла і агентів в кожному з решти, а також розподілена файлова система.

До перших спроб Grid були не надто вдалі. Проект FAFNER вимагав дуже великого людського участі, а проект I-WAY насилу піддавався масштабування і володів низькою надійністю. На підставі цих двох проектів були вироблені якості, якими повинен володіти Grid другого покоління.

Представниками другого покоління Grid можна вважати проекти Globus і Legion. Втім, проект Globus, що став розвитком проекту I-WAY, розвивався і далі; його нинішня версія відноситься до третього покоління. Це також географічно розподілений обчислювальний Grid. Центральним елементом проекту є інструментарій Globus Toolkit, який включає:

  • побудований на основі HTTP протокол резервування обчислювальних ресурсів GRAM (Globus Toolkit Resource Allocation Management);
  • розширену версію протоколу для передачі файлів GridFTP;
  • службу аутентифікації і безпеки GSI (Grid Security Infrastructure);
  • розподілений доступ до інформації на основі протоколу LDAP;
  • віддалений доступ до даних через послідовний і паралельний інтерфейс GASS (Globus Access to Secondary Storage);
  • резервування ресурсів GARA (Globus Reservation and Allocation).

Сьогодні з'являються принципово нові інструменти:

  • наукові портали, які дозволяють викликати по мережі пакети, спеціалізовані на вирішенні певних завдань;
  • засоби для організації розподілених обчислень, що збирають для вирішення завдань десятки тисяч комп'ютерів;
  • аналіз надвеликих обсягів даних, можливий завдяки об'єднанню засобами Grid систем зберігання;
  • об'єднання великих обчислювальних ресурсів для обробки експериментів в режимі онлайн.

Першими до магістралі підключаються суперкомп'ютерні центри університету штату Іллінойс і Каліфорнійського університету в Сан-Дієго, Національної Аргонської лабораторії (одна з провідних дослідницьких установ в області Grid) і Каліфорнійського технологічного інституту в Пасадені. За оцінками, сукупна обчислювальна потужність першої черги складе 13,6 TFLOPS, а до кінця десятиліття можливий вихід в петафлопного діапазон.

Що за горизонтом?

література

Поділіться матеріалом з колегами і друзями

Схожі статті