RTF и CodePage
От: Sergey J. A. Беларусь  
Дата: 26.02.04 12:17
Оценка:
Как в RTF файле определяется содовая страница символов. Например у меня есть текст в котором есть кирилица и греческие символы (вроде альфы, беты и т.д.).
Внутри файла кодовая страница по умолчанию определена как
{\rtf1\ansi\ansicpg1251
Греческие символы кодируются что-то типа \'81 \'87 (к примеру, там конечно другие коды)
Кирилица тоже.

Так как определить codepage для \'86 ?
Re: RTF и CodePage
От: Pashka R. Украина  
Дата: 26.02.04 16:18
Оценка:
Здравствуйте, Sergey J. A., Вы писали:

SJA>Как в RTF файле определяется содовая страница символов. Например у меня есть текст в котором есть кирилица и греческие символы (вроде альфы, беты и т.д.).

SJA>Внутри файла кодовая страница по умолчанию определена как
SJA>{\rtf1\ansi\ansicpg1251
SJA>Греческие символы кодируются что-то типа \'81 \'87 (к примеру, там конечно другие коды)
SJA>Кирилица тоже.

SJA>Так как определить codepage для \'86 ?


Я точно не помню но в MSDN видел... там есть онисание формата RTF (я писал RTF<-->HTML)... если не найдешь, свисти попробую я найти
-----
Best regards, Pashka R. <pashka@land.ru>
ICQ: 860730
Re[2]: RTF и CodePage
От: Sergey J. A. Беларусь  
Дата: 26.02.04 16:24
Оценка:
Здравствуйте, Pashka R., Вы писали:

PR>Здравствуйте, Sergey J. A., Вы писали:


SJA>>Как в RTF файле определяется содовая страница символов. Например у меня есть текст в котором есть кирилица и греческие символы (вроде альфы, беты и т.д.).

SJA>>Внутри файла кодовая страница по умолчанию определена как
SJA>>{\rtf1\ansi\ansicpg1251
SJA>>Греческие символы кодируются что-то типа \'81 \'87 (к примеру, там конечно другие коды)
SJA>>Кирилица тоже.

SJA>>Так как определить codepage для \'86 ?


PR>Я точно не помню но в MSDN видел... там есть онисание формата RTF (я писал RTF<-->HTML)... если не найдешь, свисти попробую я найти


Короче я вроде разобрался, что к чему. Я всё понял так: если символ определяется просто как \'55 значит он относится к кодовой странице по умолчанию (задаётся через \ansicpg), если символ не может быть расположен в данной странице, он кодируется как Unicode, а после него идёт символ, который нужно пропустить: \u8034 \'33

Правда я не уверен, что нет больше способов представления символов...
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.