1) как узнать текщую кодировку,
то есть как узнать что стоит в
setlocale(LC_ALL," вот здесь ")
есть ли getlocale()?
2) Как сконверитировать массив char из одного locale в другой?
То есть хочется чтобы независимо от кодировки текста у меня был текст
той кодировки которой необходимо...
Вообще задача состоит в том чтобы получиться отдельно все русские и английйские слова в тексте, другого варианта реализации не вижу...
Re: кодировка
От:
Аноним
Дата:
23.03.05 15:49
Оценка:
Здравствуйте, Аноним, Вы писали:
А>У меня возникло пара вопросов:
А>1) как узнать текщую кодировку, А>то есть как узнать что стоит в А>setlocale(LC_ALL," вот здесь ")
под виндами можно попробывать использовать
GetLocaleInfo(LOCALE_USER_DEFAULT, LOCALE_SLANGUAGE, buf, MAX_PATH);
setlocale(LC_ALL,"") выставляет кодировку в текущую системную
А>есть ли getlocale()?
А>2) Как сконверитировать массив char из одного locale в другой? А>То есть хочется чтобы независимо от кодировки текста у меня был текст А>той кодировки которой необходимо...
А>Вообще задача состоит в том чтобы получиться отдельно все русские и английйские слова в тексте, другого варианта реализации не вижу...
тоже виндовое:
LCMapString
Re: кодировка
От:
Аноним
Дата:
23.03.05 16:32
Оценка:
Появилась следующая идея:
сконвертить все в UNICODE
wchar_t а потом смотреть какие символы просто сравнивая
'а' 'я' через строковые функции для unicode
Будет ли это работать?
И как сконвертировать в UNICODE?
Здравствуйте, Аноним, Вы писали:
А>Появилась следующая идея:
А>сконвертить все в UNICODE А>wchar_t а потом смотреть какие символы просто сравнивая А>'а' 'я' через строковые функции для unicode
А>Будет ли это работать? А>И как сконвертировать в UNICODE?
Опиши более подробно природу данных — у тебя только русские и английские слова или еще что-то? Ведь если просто русские и английские слова, то английское слово определяется просто — у него все буквы лежат в диапазоне ниже 127.
Re[3]: кодировка
От:
Аноним
Дата:
23.03.05 16:47
Оценка:
АШ>Опиши более подробно природу данных — у тебя только русские и английские слова или еще что-то? Ведь если просто русские и английские слова, то английское слово определяется просто — у него все буквы лежат в диапазоне ниже 127.
На вход моей программы дается txt файл с обычным текстом (русским или английским с запятыми,точками, тире и прочими знаками припинания)
нужно выбрать из этого файла все английские и русские слова
то есть в результате мне нужно составить список в котором будут отдельно содержаться слова
(например получить новый файл в каждой строку которого будет слово)
Здравствуйте, <Аноним>, Вы писали:
А>Здравствуйте, Аноним, Вы писали:
А>>У меня возникло пара вопросов:
А>>1) как узнать текщую кодировку, А>>то есть как узнать что стоит в А>>setlocale(LC_ALL," вот здесь ")
А>под виндами можно попробывать использовать А>GetLocaleInfo(LOCALE_USER_DEFAULT, LOCALE_SLANGUAGE, buf, MAX_PATH);
Здравствуйте, <Аноним>, Вы писали:
АШ>>Опиши более подробно природу данных — у тебя только русские и английские слова или еще что-то? Ведь если просто русские и английские слова, то английское слово определяется просто — у него все буквы лежат в диапазоне ниже 127.
А>На вход моей программы дается txt файл с обычным текстом (русским или английским с запятыми,точками, тире и прочими знаками припинания)
А>нужно выбрать из этого файла все английские и русские слова А>то есть в результате мне нужно составить список в котором будут отдельно содержаться слова А>(например получить новый файл в каждой строку которого будет слово)
Проблема не решена,
неужели никто незнает как это можно сделать???
Здравствуйте, Adopt, Вы писали:
A>Здравствуйте, <Аноним>, Вы писали:
А>>Здравствуйте, Аноним, Вы писали:
А>>>У меня возникло пара вопросов:
А>>>1) как узнать текщую кодировку, А>>>то есть как узнать что стоит в А>>>setlocale(LC_ALL," вот здесь ")
А>>под виндами можно попробывать использовать А>>GetLocaleInfo(LOCALE_USER_DEFAULT, LOCALE_SLANGUAGE, buf, MAX_PATH);
A>но как узнать какая кодировка в текстовом файле?