Можливо, через якісь кілька років інтернет поступиться місцем новій, більш глибокої інтеграції віддалених комп'ютерів, що дозволяє не тільки віддалено передавати інформацію, локалізовану в різних кінцях світу, але і автоматично використовувати віддалені обчислювальні ресурси.
ТЕКСТ: Олександра Борисова (Женева) ФОТО: lcg.web.cern.ch
У зв'язку з запуском Великого адронного коллайдера CERN вже кілька років працює над створенням такої мережі.
Те, що інтернет (або те, що позначається терміном web) був винайдений в Європейській організації ядерних досліджень (CERN), давно вже стало хрестоматійним фактом. Навколо таблички «У цих коридорах була створена всесвітня мережа» в одному зі звичайних коридорів звичайного будинку CERN під час дня відкритих дверей завжди товпляться роззяви. Зараз інтернет використовують для своїх практичних потреб люди по всьому світу, а спочатку він був створений для того, щоб вчені, що працюють на одному проекті, але знаходяться в різних кінцях планети, могли спілкуватися між собою, ділитися даними, публікувати інформацію, до якої можна було б отримати доступ віддалено.
Розробляється в CERN система GRID (по-англійськи grid - решітка, мережа) - це ще один крок вперед, нова ступінь інтеграції користувачів комп'ютерів.
Він дає не тільки можливість публікувати дані, які знаходяться десь в іншій точці планети, але і використовувати віддалені машинні ресурси, не сходячи зі свого місця.
Звичайно, звичайні комп'ютери не грають особливої ролі в забезпеченні обчислювальних потужностей, тому перший етап інтеграції - це з'єднання світових суперкомп'ютерних центрів.
Створення цієї системи спровокував Великий адронний коллайдер. Хоча вже зараз GRID використовується для маси інших завдань, без коллайдера його б не було, і навпаки, без GRID обробка результатів коллайдера неможлива.
Карта серверів GRID // lcg.web.cern.ch
Люди, які працюють в колабораціях БАК, знаходяться в різних кінцях планети. Відомо, що над цим приладом працюють не тільки європейці, а й всі 20 країн - офіційних учасниць CERN, всього ж близько 35 країн. Теоретично для забезпечення роботи ВАК існувала альтернатива GRID - розширення власних обчислювальних ресурсів комп'ютерного центру CERN.
Але тих ресурсів, що були на момент постановки задачі, було абсолютно недостатньо для моделювання роботи прискорювача, зберігання інформації його експериментів і її наукового опрацювання. Тому комп'ютерний центр потрібно було б дуже значно перебудовувати і модернізувати, закуповувати більше комп'ютерів і засобів для зберігання даних. Але це б означало, що все фінансування буде зосереджено в CERN. Це було не дуже прийнятно для країн, що знаходяться далеко від CERN. Звичайно, вони не були зацікавлені в спонсорування ресурсів, якими дуже складно буде скористатися і швидше схильні були нарощувати свій обчислювальний, машинний потенціал. Тому народилася ідея використовувати ресурси там, де вони знаходяться.
Не намагатися все зосередити в одному місці, а об'єднати те, що вже є в різних куточках планети.
Зокрема, залучати готові ресурси інститутів, які беруть участь у науковій програмі коллайдера. Так народилася ідея GRID. Проект був запущений кілька років тому, і з самого початку люди не дуже вірили в успіх. У першому тестовий запуск брали участь всього шість центрів ( «сайтів»), було дуже багато проблем, і багато песимістичних думок висловлювалося з цього приводу. Але пройшло всього лише кілька років, і вдалося побудувати величезну систему, яка зараз працює і одночасно продовжує розширюватися: підключаються нові і нові центри. Ця система з успіхом справляється з завданнями, які ставлять перед нею фізики проекту ВАК.
Як влаштований GRID? Система повинна працювати так, щоб все фізики ВАК (а це близько 7 тисяч чоловік по всьому світу) могли отримувати однаково ефективний доступ до всієї інформації експерименту. Вони не повинні відчувати різниці, працюючи в CERN в Москві, в Нью-Йорку або в Мумбаї.
Зовні це виглядає так, ніби складне завдання, поставлене вченим, вирішується на його ноутбуці або домашньому комп'ютері за допомогою програми, що забезпечує (на самом деле) зв'язок з GRID.
Система добре налагоджена і здатна сама діагностувати свій стан.
Періодично на всі центри надсилаються тестові завдання, які не мають наукового сенсу, але діагностують стану центрів. Якщо центр не відповідає, він тимчасово стає невидимим для користувачів і завдання не направляються на нього. Це виключає варіант затягування виконання роботи, яка могла б виявитися в листі очікування відмовив центру. При відновленні зв'язку з центром він знову включається в активну роботу.
Будівництво GRID, звичайно, було розпочато для коллайдера, і роботи прискорювача продовжують бути нашим головним замовником. Однак, крім того, GRID використовується і в інших цілях, коли стоїть завдання інтенсивних обчислень. Його використовують медики, геофізики, астрофізики. Проект Fusion на півдні Франції, націлений на розробку методу отримання електрики за допомогою термоядерного синтезу (тобто так, як виділяється енергія на Сонце або під час вибуху водневої бомби), також буде користуватися GRID. Крім того, під назвою CLOUD розпочато проект комерціалізації GRID. В рамках цього проекту невеликі компанії, інститути, які потребують обчислювальних потужностях, але не можуть собі дозволити з тих чи інших причин мати свій суперкомп'ютерний центр, можуть просто купувати у GRID обчислювальний час.
Система GRID не є плоскою, вона має ієрархічну структуру.
Сама верхня точка ієрархії - це, звичайно, CERN, тому що тут здійснюється отримання інформації з детекторів, збір наукових даних. Тут записуються «сирі» дані, що приходять з детектора. Перша їх копія буде зберігатися в CERN до кінця роботи експерименту, тобто, можливо, десятки років.
Зрозуміти, який гігантський обсяг інформації буде отримано, допоможе простий розрахунок. При виході на проектну світність (інтенсивність пучка протонів) в кожну секунду буде відбуватися кілька мільярдів подій. Але більшість з них не уявляють для фізиків інтересу, так як явища, які необхідно спостерігати, відбуваються з невеликою ймовірністю. На стадії реєстрації подій система автоматично сортує «цікаві» і «нецікаві» - з мільярда подій «цікавих» знаходиться близько 100. Кожен файл з явищем важить близько 1 Мб. Тобто кожну секунду виробляється 100 Мб даних. Помноживши це на 3600 отримаємо близько 360 Гб інформації на годину. Дальше більше.
Таким чином, за перший рік роботи планується зібрати до 15 петабайт (тисяч терабайт) даних.
Вони і записуються спочатку в носіях пам'яті CERN. Але такий механізм зберігання небезпечний - локалізовані комп'ютери CERN можуть бути тим чи іншим способом одночасно виведені з ладу. А дані дуже цінні, і ми не можемо допустити втрату даних. Для того щоб уникнути будь-якого ризику їх зникнення, друга копія цих даних зберігається десь в іншому куточку світу. Для цього завдання є 11 центрів GRID першого рівня - Tier1 (CERN - це як би нульовий рівень). Ці центри відрізняються тим, що володіють хорошими великими ресурсами для зберігання даних. Як тільки дані знімаються з детекторів, вони починають розподілятися по цим центрам першого рівня. Вони є в Італії, Франції, Великобританії, США, на Тайвані, а один центр першого рівня - CMS Tier1 - знаходиться в CERN. Наступними в ієрархії йдуть більш численні центри другого рівня - Tier2. У них не обов'язково є великі ресурси для зберігання даних, зазвичай таке завдання перед ними не стоїть. Зате вони володіють хорошими обчислювальними ресурсами, з якими вони охоче готові поділитися. За статистикою, зараз більше 85% всіх обчислювальних задач ВАК виконується поза CERN, з них понад 50% на центрах другого рівня.
І ось центри другого рівня створені й успішно функціонують в Росії.
Успішно працюють центри в Дубні (ОІЯД, Об'єднаний інститут ядерних досліджень), три центри в Москві (НИИЯФ МГУ, ФІАН, ІТЕФ - інститут теоретичної і експериментальної фізики), Троїцьку (ІЯД, Інститут ядерний досліджень), Протвино (ІФВЕ, інститут фізики високих енергій ) і Гатчині (ПІЯФ). Крім того, в єдину мережу з цими центрами пов'язані і центри інших країн-учасниць ОІЯД - в Харкові, Мінську, Єревані, Софії і Тбілісі.
Система GRID зростає і розвивається, так що, можливо, не далекий той день, коли вона так само буде пристосована для практичних потреб великих груп людей, як це сталося з інтернетом.
(Підготовлено за матеріалами головного обчислювального центру CERN)
Джерело: gazeta.ru.
(Поставте рейтинг статті!)