Имеются два текстовых файла (во вложении).
Требуется определить их исходную кодировку и перекодировать оба файла в кириллица Windows (1251) средствами AutoIt. Воспользоваться этим не получилось.
OffTopic:
А как китайский в файле wrar40b4_config.txt перевисти в кирилицу? Или это просто шутка была?
P.S. Извиняюсь, напервый раз казалось что то китайский..., а оказывается там несколько раз перекодировалось, думаю autoit c этим не справиться, в таких сложных случаях только программа штирлиц или аналогичная поможет, возможно в них есть возможность обработки из консоли..., как вариант.
asdf8
Все замечательно, за исключением одного, как "Определить кодировку текстового файла..." ? Как различить файлы для принятия решения о способе их обработки (перекодировки) ?
точно, и еще файл в кодировке ANSI имеет символы Chr(0) - этого тоже быть не должно.
Все равно функция _Encoding_GetFileEncoding из UDF Encoding правильно определяет один файл как ANSI, а другой, как UTF-16. Остается по BOM = 0xFFFE узнать, что его надо декодировать как UTF16 Little Endian
madmasles
Спасибо.
Привязываться к конкретной букве нельзя, т.к., текст может быть и другим, файлы приведены как образцы.
Нечто подобное мне тоже удалось сваять и без привязки:
Но остается проблема в последних четырех байтах (0D 00 0A 00) в файле wrar40b4_config_1251.txt. Вот от этих двух лишних нулевых байт мне избавится не удалось. :( К сожалению и с Вашим вариантом та же беда.