Re[2]: Найти конец C строки

Здравствуйте, _NN_, Вы писали:

_NN>Простые решения уже не в моде ?
_NN>Если это однобайтовая кодировка то один нулевой байт, если двубайтовая два нулевых, а если четырёхбайтовая то четыре.

Ну я ж написал:
TB>>С однобайтовыми, utf8 все просто, первый нулевой байт — конец строки. Для utf16/utf32 тоже все понятно.
Вопрос, возможны ли проблемы с некоторыми MBCS. Вот например, GB2312, Shift-JIS, EUC-KR кодируются 1-2 байтами, но нулевого байта там быть не должно.
Если еще кодировки с переменным числом байт на символ где может быть нулевой байт?
Если нет, то тут все просто конечно — отдельно обрабатываем UTF16/UTF32, а все остальные до первого нулевого байта.

Если еще конкретнее — существуют ли кодировки с переменным числом байт на символ, где может быть нулевой байт в последовательности байт кодирующей один символ.
По идее — не должно.

	От:	TheBeginner
	Дата:	25.01.24 08:00
	Оценка: