Зміна кодування текстового файлу з cp1251 на - utf8

Якщо при відкритті текстового файлу на екран виводяться крокозяби, то це говорить про те, що даний файл створений в неправильному кодуванні. У моєму випадку цей файл був створений в Windows в його "унікальною" кодуванні CP1251, а відкрити його потрібно в Ubuntu з "правильної" кодуванням UTF8.

Для того, щоб провести зміну кодування тестового файлу з CP1251 на кодування UTF8 нам знадобиться пакет enca. Все нижче описане буде приведено для дистрибутива Ubuntu, але алгоритм дій буде працювати і в інших дистрибутивах.

Зміна кодування текстового файлу з CP1251 на UTF8:
  1. Встановлюємо необхідний пакет:

sudo apt-get install enca

  • Конвертуємо один файл в кодування локалі дистрибутива, яка визначається автоматично:

    Замість имя_файла повинен знаходиться повний шлях до файлу в кодуванні CP1251, наприклад: enconv /home/koder/1.txt

    Якщо цих файлів виявиться кілька, то команда виглядає дещо інакше:

    find путь_к_діректоріі -name "* .txt" -exec enconv <> \;

    Для нашого прикладу має бути так: find / home / koder / -name "* .txt" | enconv

    Все-таки так буде наочніше ІМХО + мені сказали, що ваш спосіб для безлічі файлів не спрацював ...

    $ Find путь_к_діректоріі -name "* .txt" -exec enconv <> \;

    Поправив. Самому не було необхідності в конвертації великої кількості файлів

    допоможіть розшифрувати: ШДИ! Чг ... рРсйт? "Х4 ·