Информация об изменениях

Сообщение Re[3]: Есть ли iswalnum без привязки к локали. от 13.01.2021 9:15

Изменено 13.01.2021 9:17 netch80

Re[3]: Есть ли iswalnum без привязки к локали.
Здравствуйте, Went, Вы писали:

W>Это теоретически или практически? В вижуале wchar_t имеет размер в 16бит. Разве этого недостаточно для того, чтобы записать любую реальную букву? Ну, пускай, с небольшими ограничениями?


1. "Реальные" помещались в 16 бит до массового наступления эпохи эмодзи в юникоде. С ними, то есть последние лет 5 выход за пределы 0-FFFF это скорее норма, чем исключение.

В пару суррогатов это, конечно, влезет, но уже не столь просто.

2. Вы что имели в виду под "буква"? Цифры уже не в счёт? Символ, если быть точным, с самого начала не влазил — за счёт модификаторов: Á̃̈̌ это одна символ, но пять пунктов UTF-16.
Если считаете это не проблемой — учтите, что, например, софт под всякими макосями любит генерировать Й как Й (в два пункта). И это уже буква.

W> Или есть опасность, что где-то wchar_t будет вообще 8бит?


Не в этом дело
Re[3]: Есть ли iswalnum без привязки к локали.
Здравствуйте, Went, Вы писали:

W>Это теоретически или практически? В вижуале wchar_t имеет размер в 16бит. Разве этого недостаточно для того, чтобы записать любую реальную букву? Ну, пускай, с небольшими ограничениями?


1. "Реальные" помещались в 16 бит до массового наступления эпохи эмодзи в юникоде. С ними, то есть последние лет 5 выход за пределы 0-FFFF это скорее норма, чем исключение.

В пару суррогатов это, конечно, влезет, но уже не столь просто.

2. Вы что имели в виду под "буква"? Цифры уже не в счёт? Символ, если быть точным, с самого начала не влазил — за счёт модификаторов: Á̃̈̌ это одна символ (и таки буква), но пять пунктов UTF-16.
Если считаете это не проблемой — учтите, что, например, софт под всякими макосями любит генерировать Й как Й (в два пункта). И это уже буква. Если U+0418 ещё таким простым iswalnum() будет принят, то идущий за ним U+0306 — уже нет.

W> Или есть опасность, что где-то wchar_t будет вообще 8бит?


Не в этом дело