Intel трійцю любить
Intel іменує Centrino технологією і просить дотримуватися цієї термінології. Однак для кращого розуміння і зручності читачів відзначимо, що Centrino має всі риси платформи, ретельно оптимізованої для мобільних потреб. Вона включає процесор Pentium M, сімейство чіпсетів Intel 855 і бездротові адаптери сімейства Intel Pro / Wireless 2100.
У минулому через нас версії BIOS Setup ноутбука ASUS S1N є цікавий розділ управління енергозбереженням, раніше в інших моделях не зустрічався. Зокрема, можна задати оптимізоване поведінку технології Enhanced SpeedStep в залежності від типу харчування (мережа або батареї) і метод управління перемиканням напруги процесора (Geyserville Transition Model; краще залишити в режимі SMM за замовчуванням, так як інший варіант зовсім не дає перемикати процесору робочі точки ).
Тонке (на виріст) управління енергозбереженням
в BIOS Setup ноутбука ASUS S1N.
Ми оцінили вплив налаштувань на роботу ноутбука (на жаль, їх опису від ASUSTeK поки немає) і можемо дати просту пораду: ставте «Automatic», не прогадаєте. В інших випадках (якщо в Control Panel / Power Options варто режим «Max Battery« або «Portable / Laptop«) змінюється, мабуть, тільки глибина миттєвого засипання в моменти бездіяльності системи, тобто відчувається її млявість реакції на рідкісну активність користувача. Однак потокові (які тривалий час інтенсивні) тести показують, що у всіх випадках загальна продуктивність залишається на колишньому рівні, тобто процесор з будь-якого сну розганяється до максимуму.
Тестування Centrino - особливий випадок, ми стикаємося з процесором абсолютно нової архітекури (і це не гучні слова). Тому практичні real-life тести відкладемо на кілька абзаців вниз, а почнемо з одного з найгучніших (після шести годин автономної роботи) обіцянки - поліпшеного прогнозування розгалужень.
Щоб оцінити роботу прогнозування розгалуження на процесорі Pentium M і порівняти її з іншими процесорами, ми використовували завдання про розстановку ферзів на шахівниці. Алгоритм рішень не вимагає складних обчислень, і весь програмний код в основному складається з складань і умовних переходів (у внутрішньому циклі це тільки команди завантажити, порівняти, перейти; завантажити, порівняти, перейти ...). Завдання про ферзів широко відома в мікропроцесорних колах, і застосовувалася фахівцями Intel в демонстрації процесора IA-64.
Example: Queens Loop.
Цей синтетичний тест напружує блок прогнозування розгалужень набагато сильніше, ніж це відбувається в звичайному житті, але зате ми матимемо уявлення who is who. Ми використовували варіант розстановки 32 ферзів на шахівниці 32 на 32. Час засікати засобами операційної системи (командний рядок Windows XP) від початку до завершення виконання програми, похибка вимірювання часу для варіанту n = 32 склала менше половини відсотка. Хоча тест проводився на процесорах з різною частотою, ми в праві порівняти архітектури тому, що програма поміщається в будь-який кеш першого рівня, тобто результат ідеально масштабується з частотою. Для перевірки ми також прогнали цей тест на ноутбуках в режимі максимального енергозбереження, коли процесор фіксує свою частоту на мінімум. На ноутбуках з мобільними процесорами Pentium 4-M, Pentium III-M і Athlon XP час, витрачений на розстановку ферзів, було строго обернено пропорційно частоті, так само як і на двох ноутбуках на процесорі Pentium M.
Порівнюючи нормовані результати (див. Таблицю), можна зробити висновок, що Pentium M (в ноутбуці ASUS S1N) втрачає помітно менше продуктивності від неправильно прогнозованих умовних переходів, ніж Northwood. Інші процесори виграють в цьому тесті тому, що перезаполненіе їх конвеєра займає набагато менше часу в такій великій кількості труднопредськазуємих розгалужень. Щоб грубо оцінити число стадій конвеєра Pentium M, ми допустимо, що навряд чи Pentium M заряджає кожну стадію конвеєра швидше високооптимізовані Pentium 4, але і вже точно не повільніше Pentium III. У нас виходить вилка від тринадцяти до сімнадцяти стадій, що цілком відповідає здоровому глузду і чутками про те, що вище двох гігагерц цей процесор не піде.
Співвідношення інструкцій в тесті
Коротко нагадаю пристрій блоків операцій з плаваючою крапкою. У Pentium 4 два блоки - один для FMUL, FSUB і FADD і інший (дуже повільний) для FDIV. У «Атлон» один FSUB / FADD, інший FMUL / FDIV, приблизно так само (в грубому наближенні) влаштовані FPU Pentium III. У K7 і P4 операції FSTORE і FLOAD виконуються окремими блоками.
Судячи з першого і особливо четвертому тесту, у Pentium M за операції множення і додавання відповідають різні блоки: результат P4 нижче майже в два рази, так як він не може распараллелізовать навантаження. Навряд чи в Banias більше двох FP-конвеєрів, інакше відставання від «Атлон» в сьомому тесті не було б таке велике. FMUL і FDIV обробляються разом, окремо від додавання і віднімання (див. # 3), але витрати на добування кореня дуже великі (див. # 2). Чи виконуються FSTORE і FLOAD окремими блоками, визначити за цими даними важко, але нам це важливо знати тільки в аспекті швидкості роботи з пам'яттю, а її ми розглянемо наступними тестами.
Cachemem теж не оптимізований для роботи з пам'яттю за допомогою SSE2, тому його результати нам не так цікаві. Особливо зацікавлені читачі можуть завантажити (1 Кбайт) output-файл Сachemem версії 2.65 для Pentium M.
Пропускна здатність інтегрованого чіпсета 855GM ноутбука ASUS S1N нижче, ніж у дискретного 845D, але вище ніж у старіючого (через підтримку старій пам'яті) 845G.
В операціях з плаваючою точкою при використанні SSE2 Pentium M на частоті 1,6 ГГц показує майже рівний результат з 2,4 ГГц Pentium 4 на 533-мегагерцовой шині. Якщо процесор правильно распараллелівать розрахунки (а оптимізацію під SSE2 писали за участю Intel), то результати на SSE2 добре узгоджуються зі здоровим глуздом, що говорять, що не може бути в Pentium M блоків SSE2 більше, ніж в Pentium 4. Погляньте уважно на діаграми. На чистих FPU-операціях Banias залишає Pentium 4 далеко позаду (що ми вже перевірили flops'амі). Але при включенні SSE2 дідок Pentium 4 наздоганяє за рахунок своєї більш високої частоти. А судячи з того, що пропорції приросту продуктивності від SSE2 відповідають частотам процесорів, ми робимо висновок, що блоки SSE2 у них однакові, і заспокоюємось на цьому.
Молекулярна динаміка,
настройки за замовчуванням
Час, з
(чим менше тим краще)
Звичайно, поки що важко уявити перспективи Centrino в наукових колах, але свою високу продуктивність рівня 2,53-гигагерцового Pentium 4 він підтвердив і тут. Хочемо акцентувати на цьому вашу увагу, так як Intel і деякі виробники ноутбуків зі зрозумілих причин до деяких пір цього робити не будуть. А процесор скажено гарний.
Для порівняння ми вибрали ASUS S1 - варіант на Pentium III-M в тому ж конструктиві, ASUS L3 - як високопродуктивний ноутбук на Pentium 4-M + Intel845MP з зовнішньої графікою, а також ASUS L3D - ноутбук середнього класу, що володіє дуже високою продуктивністю і часом життя від батарей. Результати зведені в одну таблицю, а потім, для ранжирування ро конкретними параметрами, розосереджені.
А тепер наше фірмове арифметичну дію: множення продуктивності (SYSscore) на час, протягом якого ця продуктивність демонструвалася. Ми називаємо це обчислювальним запасом, запасом роботи, яку можна зробити на ноутбуці автономно.
Модель, режим енергозбереження
Тривалість безперервного програвання DVD.
Час життя батарей в режимах мінімальної
активності і розважальних програмах.
Потужність, споживана різними компонентами ноутбуків,
за даними виробників.
Модель, опис завдання
Тривалість виконання, хвилин
На наш подив, чисто целочисленная робота процесора споживає на півтора вата більше (вимірювання з Queens проводилися двічі). Якби було навпаки, можна було сказати, що процесор відключив FPU і знизив споживану потужність, а рівні результати показали б порожнечу маркетингової мішури. У підсумку ж доводиться робити висновок, що через часті помилкових передбачень розгалужень процесор споживає помітно більше енергії, і Intel правильно зробила, витративши великі сили на поліпшення в новому процесорі пророкування розгалужень. Якщо читачам буде цікаво, ми постараємося знайти час, що більш ретельно дослідити все це власноруч написаними програмами під повністю керованої операційною системою Linux.
Ще один показовий висновок з цього тесту можна пов'язати з важко засвоюваним поняттям теплового конверта. За даними ASUSTeK, теплової конверт її ноутбуків S1N і M3N дорівнює 25 ватам. Що це за величина? За всіма тестами на додатках (див. Вище) максимальна споживана потужність S1N не перевищувала 17 Вт, а частка процесора, за нашими оцінками, не виходила за 12-13 Вт. Здавалося б, навіщо розраховувати систему охолодження на вдвічі більшу потужність? І ось вам відповідь - режим, нехай і надзвичайно синтетичний, в якому процесор розсіює якраз близько 25 Вт.
Вікно загальної інформації про систему в Windows XP знає
про процесор Pentium M щось особливе, часом видаючи
(Тільки в режимах «Portable / Laptop» і «Max Battery»!)
Чи не очевидно, але ймовірні значення поточної тактової частоти ядра.
Мабуть, Microsoft знає трохи більше, ніж ми з вами. В кінцевому рахунку, не так важливі подробиці коливань частот, користувачі навряд чи будуть в це вникати. Провідні виробники - ASUSTeK, IBM, Toshiba - традиційно забезпечать свої ноутбуки фірмовими утилітами (не такими витонченими, як BIOS Setup побував у нас ASUS S1N, а примітивно зрозумілими), які будуть вичавлювати з системи то, що потребують користувач - час роботи або продуктивність.
Все це можна списати на переваги впроваджень SSE2 і на невдоволення вічно скривдженої AMD, громадськість не отримала явних доказів нечесної гри. Для цього треба було порівняти з ще одним сучасним процесором, адже не виключено, що Athlon був по-справжньому настільки повільніше. Але іншого конкурента Pentium 4 не існувало ... до появи Pentium M, що має повноцінний, від народження, блоком SSE2 (доведено нами вище).
Вартість комплектів Centrino (чіпсет Intel 855PM, карта Intel Pro / Wireless 2100 і процесор Pentium M з тактовою частотою 1600, 1500, 1400 або 1300 МГц) дорівнює 720, 506, 377 і 292 доларів відповідно в партіях від тисячі штук. Для субноутбуков і планшетів передбачені процесори на 1100 МГц зі зниженим енергоспоживанням (LV) і на 900 МГц з наднизьким енергоспоживанням (ULV). Ціна цих комплектів 345 і 324 доларів відповідно.