У даній статті мова піде про розпізнавання формату CSV.
І так, у мене був вихідний файл в CSV форматі, з кодуванням UTF-8, необхідно було його розібрати, для подальшого занесення в базу даних.
Невеликий фрагмент цього файлу
Як видно тут зустрічаються кирилиця, латиниця, умляути (розширена латиниця).
Для парсинг я скористався стандартною ф-цією PHP - fgetcsv.
При розборі на виндовс машині взагалі ніяких проблем не виникло, все було розібрано, розкладено - в загальному все як треба, залишилося тільки занести в БД.
При розборі цього файлу на лінукс машині виникли проблеми - кирилиця взагалі не хотіла розпізнаватися, якщо вона не була обрамлена - лапками ( «). Рішення знайшлося за 30 хвилин і випитої чашкою чаю.
Якщо у вас в проекті використовується кілька мов інтерфейсу, то при перемиканні, не забудьте перемкнути локаль. Особливо це важливо, якщо для перекладу інтерфейсу використовується ф-ція gettext ().
Всім удачі, Максим.
Парс csv і tsv файли в delphi ...
Читаючи іноземні блоги, наткнувся на пост, в якому піднімається проблема парсинга і відображення в TStringGrid tsv файлів (tab-separated values - значення, розділені символом табуляції, англ.). У таких файлах елементи в рядках розділені знакі ...
Будь ласка зробіть простий і ясний прімерчік того ж самого тільки для asp.net (можна для mvc - буде ще краще)
ЗИ Навіщо юзати MVC для простого парсинга файлів?