Здравствуйте, Кодт, Вы писали:
К>Здравствуйте, Alex A. Kuzmin, Вы писали:
AAK>>здесь http://www.futura.ru/hg/ninja_ru.zip К>404 not found
К>А у меня в knr- и kns-файлах нет никаких # Версия 2.1.
Наличие # в версии 2.1 подтверждаю.
Файл 1049.kns (466213 байт), начиная с адреса 0x0160:
Очень похоже на (имхо, не очень удачный) справочник допустимых начал слов для 2-5 букв. Решетка — служебный символ, означает конец слова и, возможно, выступает в роли джокера.
Списки для 2 и 3 букв разделены "###". Между списками для 3 и 4 букв — "###й###х###ю###я\t". Как обрабатывается и что значит символ табуляции (0x09) — Напоминает неполный список распространенных последних букв прилагательных в разных падежах. Кстати, на следующей границе списков стоит "###й####х####ю####я#".
В начале файла, по-видимому, индекс расположения списков. В конце — аббревиатуры.
Д.К. << RSDN@Home 1.2.0 alpha rev. 655>>
Все на свете должно происходить медленно и неправильно...
Для решения задачи,
получения допустимых буквосочетаний русского языка,
как я понимаю, проще накидать прогу на C#
и разобрать текст "Война и Мир" в 4-х томах
на кусочки, а заодно и статистику по повторениям
посчитать, пригодится для ускорения доступа по справочнику.
Вопрос №2:
Какую книжку использовать для английского языка?