Назва «бнопня» (або, точніше, «бНОПНЯ») безпосередньо походить від явища неправильної настройки кодувань в поштових програмах. Так виглядає слово «Питання», перетворене з кодування CP1251 в KOI8-R. По слову «бНОПНЯ» досвідчені користувачі відразу визначали новачків, котрі задавали питання по налаштуванню кодування.
Незважаючи на все більш широке поширення Юникода. феномен крокозябра іноді зустрічається і сьогодні. Також є можливість отримати неадекватні символи при використанні неправильних шрифтів при друку на принтері або фотонаборном автоматі. невірно налаштованої локалі програми (коли замість CP1251 використовується CP1252)
Правильний текст:
(При відтворенні застосовується та ж кодування, що і при створенні тексту)
Øèðîêàÿ ýëåêòðèôèêàöèÿ þæíûõ ãóáåðíèé äàñò ìîùíûé òîë ÷ îê ïîäú¸ìó ñåëüñêîãî õîçÿéñòâà.
ьХПНЙЮ' ЩКЕЙРПХТХЙЮЖХ' ЧФМШУ ЦСАЕПМХІ ДЮЯР ЛНИМШІ РНКВНЙ ОНДЗ╦ЛС ЯЕКЕЯЙНЦН УНГ'ІЯРБЮ.
іш№ю'рџ §их'ђ№шєш'рішџ ўцећѕ уѓсх№ешщ фрёђ ьюљећщ ђюиїю' яюфњІьѓ yoхиќё'юую ѕючџщёђтр.
╪шЁю'р ¤их'ЄЁшЇш'рЎш ■ це√ї уєсхЁешщ фрёЄ ма ∙ е√щ Єюиўю' яюф · ╕ьє yoхи№ё'юую їюч щёЄтр.
Примітки
- ↑ 12345 Кодова таблиця ISO 8859-1 відрізняється лише відсутністю ряду зображених символів. В системі Microsoft Windows замість кодової сторінки ISO 8859-1 застосовується її розширення Windows -1252.
- ↑ Варіанти дешифрування по UTF-8 не наводиться, тому що велика частина російського тексту, записаного в 8-бітної кодової сторінці. буде визнана помилковою (де немає уявлення).
перекодування
Для відновлення тексту (взагалі для перекодування) можна використовувати утиліту
Якщо при відкритті текстових файлів отримуєте крокозябра, спробуйте відкрити його за допомогою будь-якого браузера, в якому є ручне вказівку кодування (зазвичай: Вид - кодування -. В верхньому меню, або в контекстному меню). Якщо після цього виходить текст з одного рядка без поділу на абзаци, можна в контекстному меню вибрати Оригінальний текст (View Source) і на початку сторінки прописати
і зберегти.Перекодування з метою відновлення вихідного тексту не завжди можлива. Наприклад, вже при дворазової перекодировке, що сталася, наприклад, при передачі повідомлення через кілька невірно налаштованих поштових серверів, може статися необоротна втрата інформації, т. К. Певні різні символи вихідного тексту при певних умовах можуть замінитися на інші, але однакові неправильні символи, і відновити таке повідомлення неможливо, навіть якщо знати, які перекодування і в якому порядку були проведені.
Інші спотворення, пов'язані з кодуванням
Нерідко буває, що перекодування здійснюється в правильному напрямку, але сам перекодировщик працює не зовсім коректно. Наприклад, через лінь програмістів багато перекодувальники перетворять тільки базові російські літери, а всі інші символи залишають на місці. В результаті при перекодуванні KOI8-R → Windows-1251 буква е перетворюється в Ј (сербська буква), значок градуса (°) перетворюється в њ і т. Д. (Такі тексти в достатку зустрічаються в Інтернеті, досить пошукати слова «всЈ» або «њС»).
Інший варіант спотворень пов'язаний з тим, що в цільової кодуванні можуть бути відсутні символи, наявні у вихідній кодуванні. В цьому випадку відсутні символи можуть просто викидатися, замінюватися на символ-замінник (часто знак питання -. Іноді на?) Або ж замінятися на схожі символи з U + 2212. -) може замінюватися на простий дефіс (U + 002D. -), буква š може замінюватися на s і т. Д. У разі простого тексту такі втрати інформації неминучі, однак, якщо перетворенню піддається файл HTML або XML, то коректним перетворенням буде заміна відсутніх в цільової кодуванні символів на коди з амперсендом: наприклад, знак мінуса повинен замінятися на − або # 8722; буква š повинна замінюватися на š або # 353; і т.д.
Дивитися що таке "Козяблікі" в інших словниках: