Кодування алфавітно-цифрової інформації в обчислювальних системах

ЕОМ працює з програмами і даними, записаними на так званому машинному мові, на якому вся інформація може надаватися у вигляді двійкових слів.

Програма обчислень - це послідовність команд, що визначають машинні опе-рації. Програма кодується в цифрову форму і поміщається в пам'ять машини. Програма містить в собі послідовність команд, виконання яких забезпечує отримання необхідного результату.

Машинна команда - символьний оператор, упізнаваний і виконується технічними засобами машини. Код команди забезпечує вироблення в ЕОМ сигналів, необхідних для виконання певних операцій машинами над заданими числами. Код команди і дан-ні, з якими працює ЕОМ, - це комбінації двійкових цифр 0 і 1.

Для перших електронних обчислювальних машин програми складалися програміста-ми в машинних кодах в вісімковій системі числення і ЕОМ використовувалися в основному для виконання арифметичних операцій.

Надалі сфера застосування ЕОМ швидко розширювалася. В даний час ЕОМ при-змінюються не стільки для науково-технічних розрахунків, скільки для обробки самих раз-нообразних даних в області економіки, управління, інформаційне обслуговування, обу-ченіі і т. Д. З'явилися різноманітні алгоритмічні мови програмування - ПАСКАЛЬ, ФОРТРАН, C ++, ПРОЛОГ та інші, - які відіграють роль посередників між мовою людини і машинним мовою. У повідомленнях подібного роду містяться літери алфавіту, цифри від 0 до 9 і деякі спеціальні символи. У машині кожному з цих знаків - алфавітно-цифрових символів - відповідає певний код.

Для введення алфавітно-цифрових символів в машинах першого покоління застосовувалися пятіразрядний коди. З вдосконаленням ЕОМ виникла необхідність використання но-вих службових, арифметичних, логічних і інших символів і тому з'явилися раз-особисті варіанти шести- і семіразрядний кодів. У ЕОМ для введення і виведення інформації при-міняють семіразрядний і восьмизарядний коди, в мікроЕОМ застосовуються переважно семіразрядний коди.

При перетворенні символів (знаків) в цифровий код між множинами символів і кодів повинне мати місце взаємно-однозначна відповідність, тобто. Е. Різних символів повинні бути наз-начени різні цифрові коди, і навпаки. Ця умова є єдиною необхідною вимогою при побудові схеми перетворення символів в числа. Однак існує ряд прак-тичних угод, прийнятих при побудові схеми преоб-разования виходячи з міркувань наочності, ефективності, стандартизації. Таким чином, з міркувань наочності і легкості запам'ятовування доцільно безлічі символів, впорядкованих за будь-якою ознакою (наприклад, лексико-графічному), коди-ровать також за допомогою впорядкованої послідовності чисел.

Іншим важливим моментом при організації кодування сім-вільної інформації є ефективне використання опера-тивної пам'яті ЕОМ. Так як загальновживаними є при-мірно 100 знаків (сюди крім цифр, букв російського і англійської алфавітів; розділових знаків, арифметичних знаків входять знаки перекладу рядка, повернення каретки, повернення на крок і т. П.) То для взаємно-однозначного перетворення всіх знаків в коди досить приблизно сотні чисел. Значення цього вибору полягає в тому, що для розміщення числа з цього діапазону в оперативній пам'яті досить одного байта, а не машинного слова. Отже, при такій організації кодування досягається істотна економія обсягу пам'яті.

При призначенні кодів знакам треба також враховувати угоди, що стосуються стандартизації кодування. Можна призначити знакові коди за своїм вибором, але також виникнуть труднощі, пов'язані з необхідністю обміну інформацією з іншими організаціями, які використовують кодування, відмінну від нашої. В даний час існує декілька широко поширених схем кодування. Наприклад, код BCD (Binary-Coded Decimal) - двійково-десятковий код використовується для представлення чисел, при якому кожна десяткова цифра записується своїм четирехбітовим двійковим еквівалентом. Цей код може виявитися корисним, коли потрібно перетворити рядок числових знаків, наприклад, рядок з числових знаків «2537» в число 2537, над яким потім будуть проводитися арифметичні дії. Розширенням цього коду є EBCDIC (Extended Binary-Coded Decimal Interchange Code) - розширений двійково-десятковий код обміну інформацією, який перетворює як числові, так і літерні рядки.

У ЕОМ типу PDP (або СМ) застосовується код ASCII (American Standard Code for Information Interchange) - американський стандартами-мий код обміну інформацією. Цей код генерується деякими зовнішніми пристроями (принтером, АЦДП) і використовується для про-мена даними між ними і оперативною пам'яттю ЕОМ. Наприклад, коли натискаємо на терміналі клавішу G, то в результаті цієї дії код ASCII для символу G (1000111) передається в ЕОМ. А якщо треба цей символ роздрукувати на АЦДП, то його код ASCII повинен бути посланий на друкувальний пристрій.

Вітчизняної версією коду ASCII є код КОИ-7 (двоіче-ний семібітовий код обміну інформацією), який збігається з ним, за винятком букв російського алфавіту.

Схожі статті