Безперервна і дискретна інформація

Головна | Про нас | Зворотній зв'язок

Щоб повідомлення було передано від джерела до одержувача, необхідна деяка матеріальна субстанція - носій інформації. Повідомлення, що передається за допомогою носія, назвемо сигналом. У загальному випадку сигнал - це змінюється в часі фізичний процес. Такий процес може містити різні характеристики (наприклад, при передачі електричних сигналів можуть змінюватися напруга і сила струму). Та з характеристик, яка використовується для подання повідомлень, називається параметром сигналу.

У разі коли параметр сигналу приймає послідовне в часі кінцеве число значень (при цьому всі вони можуть бути пронумеровані), сигнал називається дискретним, а повідомлення, передане за допомогою таких сигналів - дискретним повідомленням. Інформація, передана джерелом, в цьому випадку також називається дискретною. Якщо ж джерело виробляє безперервне повідомлення (відповідно параметр сигналу - безперервна функція від часу), відповідна інформація називається неперервною. Приклад дискретного повідомлення - процес читання книги, інформація в якій представлена текстом, тобто дискретної послідовністю окремих значків (букв). Прикладом безперервного повідомлення служить людська мова, що передається модульованої звуковою хвилею; параметром сигналу в цьому випадку є тиск, що створюється цією хвилею в точці знаходження приймача - людського вуха.

Безперервне повідомлення може бути представлено безперервною функцією, заданою на деякому відрізку. Безперервне повідомлення можна перетворити в дискретний, така процедура називається дискретизацією.

Одиниці кількості інформації

Визначити поняття «кількість інформації» досить складно. У вирішенні цієї проблеми існують два основні підходи. Історично вони виникли майже одночасно, наприкінці 40-х років XX століття. Роботи Джон фон Неймана по створенню ЕОМ привели до об'ємного підходу вимірювання кількості інформації, а один з основоположників кібернетики американський математик Клод Шеннон розвинув імовірнісний підхід до вимірювання кількості інформації.

У двійковій системі числення знаки 0 і 1 будемо називати бітами (від англійського виразу Binary digits - виконавчі цифри). Відзначимо, що творці комп'ютерів віддають перевагу саме двійковій системі числення тому, що в технічному пристрої найбільш просто реалізувати два протилежних фізичних стану: певний фізичний елемент, який має два різних стани: намагніченість в двох протилежних напрямках; прилад, що пропускає чи ні електричний струм; конденсатор, заряджений або незаряджений і т.п. У комп'ютері біт є найменшій можливій одиницею інформації. Обсяг інформації, записаної двійковими знаками в пам'яті комп'ютера або на зовнішньому носії інформації підраховується просто за кількістю необхідних для такого запису двійкових символів. При цьому, зокрема, неможливо нецілим число бітів (на відміну від імовірнісного підходу).

Для зручності використання введені і більші, ніж біт, одиниці кількості інформації. Так, двійкове слово з восьми знаків містить один, байт інформації, 1024 байта утворюють кілобайт (КБ), 1024 кілобайт - мегабайт (Мбайт), а 1024 мегабайта - гігабайт (Гбайт), 1024 гігабайти - терабайт (Тбайт), 1024 терабайта - петабайт (Пбайт).

Інформація передається у вигляді повідомлень. Дискретна інформація записується за допомогою деякого кінцевого набору знаків, які будемо називати буквами, не вкладаючи в це слово звичного обмеженого значення (типу «російські літери» чи «латинські букви»). Буква в даному розширеному розумінні - будь-який із символів, які деяким угодою встановлені для спілкування. Наприклад, при звичній передачі повідомлень російською мовою такими знаками будуть російські літери - великі та малі, знаки пунктуації, пробіл; якщо в тексті є числа - то і цифри. Взагалі, буквою будемо називати елемент деякого кінцевого безлічі (набору) відмінних один від одного знаків. Безліч знаків, в якому визначено їх порядок, назвемо алфавітом (загальновідомий порядок знаків у російській алфавіті: А, Б. Я).

Розглянемо деякі приклади алфавітів.

1, Алфавіт прописних російських букв:

А Б В Г Д Е Є Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ ред И Ь Е Ю Я

2. Алфавіт Морзе:

3. Алфавіт клавіатурних символів ПЕОМ IBM (русифікована клавіатура):

5. Алфавіт арабських цифр:

6. Алфавіт шістнадцяткових цифр:

Цей приклад, зокрема, показує, що знаки одного алфавіту можуть утворюватися з знаків інших алфавітів.

7. Алфавіт довічних цифр: 0 1

Алфавіт 7 є одним із прикладів, так званих, «довічних» алфавітів, тобто алфавітів, що складаються з двох знаків. Іншими прикладами є виконавчі алфавіти 8 і 9:

8. Двійковий алфавіт «точка,« тире ». _

9. Двійковий алфавіт «плюс», «мінус»: + -

10. Алфавіт прописних латинських букв:

11. Алфавіт римської системи числення:

12. Алфавіт мови блок-схем зображення алгоритмів:

Кодова таблиця - це внутрішнє уявлення символів клавіатури. У всьому світі використовують таблицю ASC II (Аmerican Standart Code for Iformation, Interchange). Для зберігання 2-чного коду одного символу виділено 1 байт = 8 біт. З огляду на, що 1 біт = 0 або 1, то кількість різних поєднань в 1 байті = 2 8 = 256. Отже, за допомогою 1 байта можна отримати 256 різних двійкових комбінацій - символів, які складають таблицю ASC II.

Для скорочення запису використовують 16-чную систему, що складається з 16 символів: 10 цифр + A, B, C, D, E, F. Кожен символ в таблиці ASC II кодується за допомогою 8 2-чних або двох 16-чних (1 розряд = 4 біт) чисел. Стандарт ASC II визначає перші 128 символів: цифри, букви лат. алфавіту (0-127). 2-я половина (128-255) - національні символи, псевдографіку і математичні символи.

Символи. Це ще одна дискретна величина, оскільки комп'ютер оперує з певним обмеженим набором символів. Такий набір цілком можна назвати алфавітом машини, а в алфавіті все символи мають свої фіксовані позиції. Звідси основна ідея зберігання символів в пам'яті ЕОМ полягає в заміні кожного з них номером в алфавіті, тобто числом.

Приклади кодових таблиць:

· ЯКІ-7, ЯКІ-8 - кодування російських букв і символів (семи-, восьми -бітний кодування)

1) # 154 нерозривний пробіл.

Рис.1 Кодування КОІ8-Р

· ASCII -American Standard Code for Information Interchange (американський стандарт кодів для обміну інформацією) - це восьмирозрядна кодова таблиця, в ній закодовано 256 символів (127- стандартні коди символів англійської мови, спецсимволи, цифри, а коди від 128 до 255 - національний стандарт , алфавіт мови, символи псевдографіки, наукові символи, коди від 0 до 32 відведені не символ, а функціональних клавіш).

Мал. 2 Міжнародна кодування ASCII

· Unicode - стандарт, згідно з яким для подання кожного символу використовується 2 байта. (Можна кодувати математичні символи, російські, англійські, грецькі, і навіть китайські). C його допомогою можна закодувати НЕ 256, а 65536 різних символів. Повна специфікація стандарту Unicode включає в себе всі існуючі, вимерлі і штучно створені алфавіти світу, а також безліч математичних, музичних, хімічних та інших символів

· СР1251 - найбільш поширеною в даний час є кодування Microsoft Windows, ( "CP" означає "Code Page", "кодова сторінка").

1) # 160 нерозривний пробіл,

2) # 173 варіант переносу.

Мал. 3 Кодування CP1251

· Ср866 - кодування під MS DOS

1) # 255 нерозривний пробіл.

Мал. 4 Кодування ср866

· Мас - кодування в ПК фірми Apple, що працюють під управлінням операційної системи Mac OS.

1) # 202 нерозривний пробіл.

Мал. 5 Кодування Mac

· ISO 8859-5 -Міжнародна організація по стандартизації (International Standards Organization, ISO) затвердила в якості стандарту для російської мови ще одне кодування.

1) Коди 128-159 не використовуються;

2) # 160 нерозривний пробіл,

3) # 173 варіант переносу.