Ситуація на серверному ринку загострюється. У спеціальній презентації компанія Intel вирішила обговорити недоліки конкуруючих процесорів EPYC, проте рівень наведених аргументів викликав серйозне здивування у фахівців. Незалежні ж тести підтверджують: EPYC - сильний конкурент для Xeon-SP, здатний в ряді випадків відправити интеловскую новинку в нокаут
Це холодне літо виявилося спекотної часом для ринку серверних рішень: на ньому вперше за останні кілька років зароджується реальна конкуренція. Завдяки архітектурі Zen і процесорам EPYC на цей ринок готова повернутися компанія AMD. Причому, судячи з усього, у компанії є всі шанси похитнути гегемонію Intel навіть незважаючи на те, що мікропроцесорний гігант оновив свої серверні платформи і представив нове сімейство процесорів Xeon-SP. запровадивши в них нову архітектуру Skylake-SP. І це, здається, дійсно змушує Intel турбуватися. По крайней мере, на боротьбу з EPYC компанія вирішила кинути всю міць своєї маркетингової машини, яка в якості першого результату своєї роботи видала досить спірну презентацію, що розповідає про переваги Xeon-SP над EPYC. У цій презентації процесори AMD EPYC зневажливо описуються як склейка ( «glued-together») десктопних ядер, в той час як Xeon-SP називаються процесорами зі спеціальною серверною архітектурою.
У числі претензій до продукту конкурента маркетинг Intel висуває і теза про те, що для EPYC поки немає належної екосистеми і навіть стверджує, що «для нових серверних процесорів AMD буде потрібно оптимізація програмного забезпечення, як і для Ryzen». Однак цей аргумент теж здається притягнутим за вуха: порівняння серверних процесорів з відсиланням до продуктивності десктопних продуктів в іграх може здатися мають якийсь сенс хіба тільки для людей, далеких від IT-галузі.
Насправді ж навіть після анонса Xeon-SP процесори AMD EPYC продовжують здаватися цілком конкурентоспроможною новинкою. Наприклад, один процесор EPYC може мати до 32 ядер з підтримкою SMT, в той час як старші представники в лінійці Xeon-SP володіють лише 28 ядрами з Hyper-Threading. При цьому в процесорах Xeon-SP з'явилася підтримка AVX-512, якої немає в варіантах AMD, до того ж вони мають новою структурою кеш-пам'яті, яка передбачає розширення L2-кеша до 1 Мбайт на ядро. Однак на користь EPYC каже ціна. Старший 32-ядерний процесор EPYC 7601 коштує $ 4200 в той час як старший 28-ядерний Xeon Platinum 8180 оцінений Intel в $ 10 тис.
Перше порівняння EPYC і Xeon-SP в реальних тестах провів сайт Anadtech. Фахівці сайту порівняли продуктивність двох систем: двопроцесорного сервера на базі Epyc 7601 (32 ядра, 2,2-3,2 ГГц, 180 Вт TDP, $ 4200) і сервера на базі двох процесорів Xeon 8176 (28 ядер, 2,1-3, 8 ГГц, 165 Вт TDP, $ 8719).
В першу чергу системи продемонстрували абсолютно різну роботу з кешем і пам'яттю, обумовлену їх принципово різною будовою. Кожне ядро Skylake-SP має 1 Мбайт L2-кешем з латентністю 13 тактів (у Broadwell-EP кеш другого рівня мав розмір 256 Кбайт і латентність 11 тактів). Загальний на процесор L3-кеш формується з розрахунку 1,375 Мбайт на ядро, володіє неінклюзівним (віктимна) принципом роботи і має середню латентність 77 тактів (проти 44 тактів раніше).
У процесорах EPYC L2-кеш менше - всього 512 Кбайт на ядро, але зате його латентність - 12 тактів. Що ж стосується L3-кеша, то він не загальний, як у Intel, а розосереджений по чотирьохядерним комплексам CCX, яких в кожному кристалі Zeppelin розміщено по дві штуки. Сам кеш теж має ексклюзивний (Віктимний) принцип роботи, проте його латентність сильно залежить від того, де розташовані запитувані дані - в одному CCX з генеруючим запит ядром, в сусідньому на кристалі, або взагалі в іншому кристалі. У кращому випадку латентність становить 35 циклів, в гіршому - може бути вище на порядок. Іншими словами, не дивлячись на те, що AMD говорить про L3-кеші як про єдиний масиві ємністю 64 Мбайт, правильно говорити, що він в EPYC має формулу 8 x 8 Мбайт.
Подібним чином йде справа і з пам'яттю: кожен кристал в EPYC має власний двоканальний контролер, тому швидкість роботи з пам'яттю може сильно відрізнятися в залежності від того, де в системі знаходяться дані. Це накладає результати на результати тесту Stream, в якому вимірюється пропускна здатність пам'яті.
Пропускна здатність за даними Stream
Залежно від того, які процесорні ядра виконують цей тест, пропускна здатність Epyc 7601 може бути більш ніж в два рази краще, ніж у Xeon-SP, але може бути і вдвічі гірше. При цьому цікаво, що Skylake-SP став з точки зору пропускної здатності пам'яті гірше Broadwell-EP. Негативний внесок вносить нова чарункова структура з'єднання ядер, що прийшла на зміну кільцевих шинам.
Зате Xeon-SP майже завжди виграє у EPYC з точки зору латентності.
Несподівано продуктивність FPU у процесора AMD виявилася значно краще, ніж у Xeon-SP. Тому може бути кілька причин, але швидше за все визначальний вплив робить те, як турбо-режим працює при виконанні AVX-інструкцій. Зокрема, процесори Intel використовують помітно нижчі частоти при роботі з AVX-командами. Наприклад, Xeon 8176 при навантаженні на всі 28 ядер здатний працювати на частоті 2,8 ГГц, однак при активації AVX 2.0 його максимальна частота в тих же умовах обмежується величиною 2,4 ГГц. Якщо ж говорити про виконання AVX-512, то в цьому випадку гранична частота складе лише 1,9 ГГц при навантаженні на всі ядра.
Intel вказує, що її процесори використовують 256-бітові та 512-бітові виконавчі пристрої, в той час як у AMD обробка AVX-інструкцій відбувається на 128-бітних пристроях. Але цілком можливо, що в кінцевому підсумку реалізація AMD оптимальніше, оскільки частотам EPYC робота з векторними інструкціями не завдає ніякої шкоди. Так, при цьому у EPYC немає підтримки AVX-512, але і додатків, що спираються на такі інструкції, поки теж практично немає.
В кінцевому підсумку система на AMD EPYC програє системі на Xeon-SP при роботі з базами даних, але перевершує її в тестах Java і є надзвичайно конкурентоспроможною в тестах Big Data, особливо якщо взяти до уваги ситуацію з цінами.
Що стосується енергоспоживання, то воно сильно залежить від навантаження. Xeon Platinum 8176 дуже ненажерливий в режимі холостого ходу, але зате демонструє непогану ефективність при роботі з MySQL. Зате при рендеринге в POV-RAY система на EPYC виявляється не тільки значно економічніше, але і до того ж помітно швидше, ніж сервер з процесорами Xeon-SP.
Таким чином, реальність така, що AMD EPYC не можна назвати ні гіршим, ні кращим вибором для будь-якого сервера. Однак якщо враховувати його конкурентну середню продуктивність, низькі ціни, а також велику перевагу в окремих сферах, серверний процесор AMD поза всяких сумнівів зможе стати причиною головного болю для Intel. І в першу чергу EPYC приверне увагу тих підприємств, які захочуть оптимізувати ціну своїх дата-центрів. Але в той же час Intel все ще може запропонувати більш високу абсолютну продуктивність завдяки тому, що у компанії є масштабована платформа, що підтримує багатопроцесорні конфігурації.
І так, для того, щоб донести перевагу своїх значно більш дорогих серверних рішень до кінцевих користувачів, Intel дійсно доведеться задіяти маркетинговий відділ. Але той сокирний маркетинг, до якого компанія вдалася зараз, викликає серйозні питання.