Здравствуйте, Sinclair, Вы писали:
S>И что? Три байта на символ???
А может, текст в кодировке RGB

?
Здравствуйте, Pavel Dvorkin, Вы писали:
PD>А может, текст в кодировке RGB
?
Ну, тогда нужно перевести в CMYK, а что делать с четырьмя байтами уже известно.
... << RSDN@Home 1.2.0 alpha rev. 677>>
Здравствуйте, Sinclair, Вы писали:
S>примеры реального кода и реальных данных.
в общем настрогал маленький тестовый пример:
int main()
{
wchar_t* c = L"Hello";
std::ofstream fout("test.txt", ios_base::binary);
for(int i = 0; i < 5; i++)
{
int n = (int)c[i];
unsigned char uc = 0;
uc = n;
fout<<uc;
uc = n<<8;
fout<<uc;
uc = n<<16;
fout<<uc;
uc = n<<24;
fout<<uc;
}
fout.close();
return 0;
}
Английский текст в итоге gedit распознает, как utf32(
http://files.rsdn.ru/50126/test3.txt), русский тоже как utf32, но записаны коряблы почему то(
http://files.rsdn.ru/50126/test2.txt).. Вероятно вводит не в той кодировке..
Здравствуйте, neFormal, Вы писали:
F>Здравствуйте, Sinclair, Вы писали:
S>>примеры реального кода и реальных данных.
F>в общем настрогал маленький тестовый пример:
F>F>int main()
F>{
F> wchar_t* c = L"Hello";
F> std::ofstream fout("test.txt", ios_base::binary);
F> for(int i = 0; i < 5; i++)
F> {
F> int n = (int)c[i];
F> unsigned char uc = 0;
F> uc = n;
F> fout<<uc;
F> uc = n<<8;
F> fout<<uc;
F> uc = n<<16;
F> fout<<uc;
F> uc = n<<24;
F> fout<<uc;
F> }
F> fout.close();
F> return 0;
F>}
F>
F>Английский текст в итоге gedit распознает, как utf32(http://files.rsdn.ru/50126/test3.txt), русский тоже как utf32, но записаны коряблы почему то(http://files.rsdn.ru/50126/test2.txt).. Вероятно вводит не в той кодировке..
У Вас сдвиг не в ту сторону (<< вместо >>), поэтому после младшего байта выводятся нули.
То, что в файле test2.txt — это нижние байты русских букв в кодировке utf-16 (или ucs-2, что почти одно и то же)
Здравствуйте, vmpire, Вы писали:
V>У Вас сдвиг не в ту сторону (<< вместо >>)
упс, сглючил +)
V>То, что в файле test2.txt — это нижние байты русских букв в кодировке utf-16 (или ucs-2, что почти одно и то же)
http://files.rsdn.ru/50126/test4.txt
да, utf32..
честно говоря, до последнего не верил, что ввод в utf32, когда вся ось под utf8.. что то я в этой жизни не понимаю..
+ странно, что файлик от Sinclair-а не прочитался..