В чём отличие функций MultiByteToWideChar и AnsiToOem ? - C/C++. Прикладные вопросы

Здравствуйте, RussianFellow, Вы писали:

RF>В чём заключается отличие функций MultiByteToWideChar/WideCharToMultiByte и AnsiToOem/OemToAnsi ?

Первая пара это функции WinAPI переводящие строки из различных однобайтовых кодировок ANSI (OEM — CP437 в том числе) в различные Unicode кодировки и обратно. Названия "дебильные" и ни о чем не говорят.
Вторая пара это не понятно от куда. Могу предположить что переводит из OEM кодировки в заданную ANSI и обратно. Естественно с потерями, т.к. взаимнооднозначного соответствия нет (в OEM только латинские символы и псевдографика).

Здравствуйте, Videoman, Вы писали:

RF>>В чём заключается отличие функций MultiByteToWideChar/WideCharToMultiByte и AnsiToOem/OemToAnsi ?
V>Первая пара это функции WinAPI переводящие строки из различных однобайтовых кодировок ANSI (OEM — CP437 в том числе) в различные Unicode кодировки и обратно.

Функция MultiByteToWideChar переводит не только однобайтовые, но и многобайтовые (мультибайтные?) представления строк. Мультибайтные — это такие, где один символ кодируется одним или большим числом байт. Т.е. в одной строке часть символов кодируется одним байтом, часть — двумя и т.д.. Например UTF-8 — это мультибайтовая кодировка, хотя и Unicode. Насколько я помню, MultiByteToWideChar поддерживает в том числе мультибайтовые не Unicode кодировки (те кодировки, которые использовались до Unicode'а).

Здравствуйте, B0FEE664, Вы писали:

BFE>Здравствуйте, Videoman, Вы писали:

BFE>Функция MultiByteToWideChar переводит не только однобайтовые, но и многобайтовые (мультибайтные?) представления строк. Мультибайтные — это такие, где один символ кодируется одним или большим числом байт. Т.е. в одной строке часть символов кодируется одним байтом, часть — двумя и т.д.. Например UTF-8 — это мультибайтовая кодировка, хотя и Unicode.

Да. Так и есть. Тогда точнее так: функции переводят из/в ANSI/UNICODE различные кодировки переменной длины в кодировки фиксированной длины. Интересно что они понимают под WideChar ? UCS2 ? Но вроде как Windows уже давно поддерживает полноценный UTF-16. Все-таки логика названия функций от меня ускользает.

P.S. А ну в MSDN так и написано: начиная с Windows Vista все переводится в "настоящий" UTF-16 c суррогатными парами. Т.е. Функции переводят из различных кодировок переменной длины в UTF-16 переменной длины. Н-да-а-а

Здравствуйте, Videoman, Вы писали:

Глюкануло

V>Первая пара это функции WinAPI переводящие строки из различных однобайтовых кодировок ANSI (OEM — CP437 в том числе) в различные Unicode кодировки и обратно. Названия "дебильные" и ни о чем не говорят.
V>Вторая пара это не понятно от куда. Могу предположить что переводит из OEM кодировки в заданную ANSI и обратно. Естественно с потерями, т.к. взаимнооднозначного соответствия нет (в OEM только латинские символы и псевдографика).
Под OEM в винде подразумевается консольная кодировка, используемая в ДОС сессии. Например CP866 — вполне себе русская. Но не соответствует CP1251

RF>В чём заключается отличие функций MultiByteToWideChar/WideCharToMultiByte и AnsiToOem/OemToAnsi ?
AnsiToOem(src, dst) == {MultiByteToWideChar(CP_ACP, src, tmp); WideCharToMultiByte(CP_OEMCP, tmp, dst)}
Где CP_ACP/CP_OEMCP текущие кодировки, определенные настройками системы.
В правильно настроенной русской винде CP_ACP == CP_1251, а CP_OEMCP == CP866

От:	RussianFellow	http://russianfellow.livejournal.com
Дата:	30.01.19 10:00
Оценка:

От:	Videoman	https://hts.tv/
Дата:	30.01.19 10:21
Оценка:

	От:	B0FEE664
	Дата:	30.01.19 13:23
	Оценка:

От:	Videoman	https://hts.tv/
Дата:	30.01.19 14:10
Оценка:

От:	Videoman	https://hts.tv/
Дата:	30.01.19 14:16
Оценка: