M>С помощью какой либы можно сделать такое: M>есть текст в юникоде, нужно определить к какому языку(вм) может относиться каждый символ?
Если нужно реализовать определение языка по тексту, то лучше воспользоваться готовой библиотекой (они обычно работают на основе статистических методов и содержат в себе модели большинства языков).
Здравствуйте, chaotic-kotik, Вы писали:
CK>Если нужно реализовать определение языка по тексту, то лучше воспользоваться готовой библиотекой (они обычно работают на основе статистических методов и содержат в себе модели большинства языков).
какие можете посоветовать?
еще было б не плохо если б эта либа умела отделять буквы от цифр, знаков пунктуации и т.п. символов.
M>нужно отделить [a-zA-Z](буквы из алфавита. у всех же народов он есть?) от остальных. или хотя б для большинства современных. для дальнейшего вывода на экран. M>регекспы-тоже думал о них, но оставил этот вариант на последок, т.к. думаю это ресурсоемко и не удобно(хотя не пробовал еще)
Цыфры ещё китайские бывают, и настоящие арабские, например.
RSDN for Windows Phone 1.5.0.0 WinPhone71_Release_20130421.1
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском