програмований мікропроцесор

Процесор виконаний по 8-стадийной конвеєрної схемою з проміжною фіксацією результатів між стадіями конвеєра в черзі з дисципліною обслуговування FIFO. У процесорі реалізовано багато обхідних шляхів (bypass), що дозволяють використовувати проміжні результати відразу після їх отримання на кожній стадії конвеєра, в тому числі, для передачі в інші осередки. Передбачаються також кеш-пам'ять даних (32 Кбайт) і кеш-пам'ять команд (96 Кбайт).

Для того щоб прискорити межячеечние передачі даних, застосований наступний підхід. Регістри r24-r27 відображені на вхідні черги межячеечних каналів з дисципліною обслуговування FIFO. Звернення до регістру rj, j, з читання, в тому числі при виборі цього регістра як операнда, тягне вибірку елемента даних з відповідної вхідної черги. Якщо елемент в черзі відсутня, то завершення виконання звернення до регістру rj, j, затримується аж до надходження даних до вхідної черги. При зверненні до регістру rj, j, по запису, реальний запис проводиться в вихідну чергу межячеечних каналів. Якщо чергу заповнена, то завершення виконання записи затримується, аж до звільнення елемента черги.

Рішення по організації межячеечних зв'язків і зв'язків між обробними пристроями в конвеєрі ідентичні і базуються на проміжних FIFO-чергах, що передають дані по готовності приймача. Важливим наслідком такої організації є те, що перебіг обчислень визначається подіями, в якості яких виступають розміщення даних в чергах. На хід обчислень не впливають переривання, що відбуваються в процесорах, промахи в кеш-пам'яті і інші асинхронно майбутні події, безпосередньо не пов'язані з обчислювальним процесом.

Осередки, що знаходяться на кордоні поля осередків, мають вільні канали, до яких підключаються контролери пам'яті, периферійних зовнішніх пристроїв. Переривання від контролерів передаються у вигляді спеціальних однослівних повідомлень, в яких вказується, яка осередок повинна обробляти це переривання

Експериментальний кристал програмованого процесора виготовлений по 0,15-мікронної технології з 6 шарами мідних провідників на фабриці IBM. Кристал містить 16 (4х4) осередків і функціонує на частоті 225 МГц, споживаючи 25 Вт.

Розроблено компілятори мов Сі і Фортран, автоматично відображають оператори програми в масив осередків і формують команди статичного интерфейсного процесора цієї програми. Для однієї з програм набору SPECfp на 16 осередках отримано зменшення часу виконання програми від 6 до 11 разів у порівнянні з часом її виконання на одній клітинці. В іншому експерименті з використанням 32 осередків відповідне прискорення склало від 9 до 19 разів.

Схожі статті