Re: Что это за кодировка?
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 27.01.15 19:46
Оценка: +1 :)
Здравствуйте, big-town, Вы писали:

BT>Сам долго мучился пока разгадал что эта за кодировка.


BT>C3 A7 │ 2D C3 A9 20 │ C3 AF C3 AE │ C3 A4 C3 BC │ C3 A5 C3 A7 — Щорса

BT>С этой кодировкой я столкнулся в свитче DLINK 2108.

На самом деле парность символов за пределами ASCII подсказывает, что это utf-8, но испорченный преобразованием между двумя 8-битными кодировками. Осталось понять, какие это были кодировки. Здесь приведён кусок надписи "з-й подъез(д)" (причём через "з", а не цифру 3). Но символы сдвинуты (A0-BF для строчных 32-буквенного базового русского ряда). Итого оно восстанавливается так (при консоли в utf-8):

$ printf '\xC3\xA7\x2D\xC3\xA9\x20\xC3\xAF\xC3\xAE\xC3\xA4\xC3\xBC\xC3\xA5\xC3\xA7\n' | iconv -f utf-8 -t iso-8859-1 | iconv -f cp1251 -t utf-8
з-й подьез


и никакой MIK тут ни при чём.

А что там перепутали в свиче — ХЗ, мне больше интересно, при чём тут третий подъезд к свичу. (UPDATE: а, понял, описание порта свича в сохранённом конфиге.)
The God is real, unless declared integer.
Отредактировано 28.01.2015 6:10 netch80 (озарило) . Предыдущая версия .
broken encoding
Re[2]: Что это за кодировка?
От: Pavel Dvorkin Россия  
Дата: 28.01.15 03:54
Оценка: +2
Здравствуйте, netch80, Вы писали:

N>А что там перепутали в свиче — ХЗ, мне больше интересно, при чём тут третий подъезд к свичу


А мне еще интересно, при чем тут WIN API
With best regards
Pavel Dvorkin
Что это за кодировка?
От: big-town  
Дата: 26.01.15 19:57
Оценка:
Сам долго мучился пока разгадал что эта за кодировка.

C3 A7 │ 2D C3 A9 20 │ C3 AF C3 AE │ C3 A4 C3 BC │ C3 A5 C3 A7 — Щорса
С этой кодировкой я столкнулся в свитче DLINK 2108.

Набросал простенький скрипт для перебора всех возможных кодировок, при использовании мощного конвертера iconv (кросплатформенный).

for CP in `iconv --list | sed 's/,/ /g' | sed 's/\/\///g'`
do
echo $CP
cat koi | iconv -f $CP -t utf8 | grep -i 'Щ'
done


И на кодировке MIK я получил что то подобное "├Щ├о├р├с├а".
Пропустив его через фильтр iconv -f MIK -t utf8 | sed 's/├//g'
я получил читабельный русский шрифт.

Может кому то будет полезно
Отредактировано 26.01.2015 20:05 big-town . Предыдущая версия .
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.