Помогите разобрать файл от KN, плиз
От: Alex A. Kuzmin Россия  
Дата: 30.10.07 20:00
Оценка:
Существует такая программа — Keyboard Ninja
которая сама переключает раскладки и как известно
не работает в Висте.

Для нее существую языковые файлы.
Пакет файлов для русского языка лежит
здесь http://www.futura.ru/hg/ninja_ru.zip

и содержит 5 файлов, среди которых есть
1049.kns. В нем содержатся
допустимые сочетания букв в русском языке.

Смотрю на файл, там есть служебные символы
типа # и никак не могу понять принцип по которому
это все можно считать в массив буквосочетаний

В общем нужен алгоритм разбора файла.
Гляньте, плиз, кому не лень.
Re: Помогите разобрать файл от KN, плиз
От: Кодт Россия  
Дата: 31.10.07 12:58
Оценка:
Здравствуйте, Alex A. Kuzmin, Вы писали:

AAK>здесь http://www.futura.ru/hg/ninja_ru.zip

404 not found

А у меня в knr- и kns-файлах нет никаких # Версия 2.1.
... << RSDN@Home 1.2.0 alpha rev. 655>>
http://files.rsdn.org/4783/catsmiley.gif Перекуём баги на фичи!
Re[2]: Помогите разобрать файл от KN, плиз
От: e-garin Россия  
Дата: 31.10.07 13:45
Оценка:
Здравствуйте, Кодт, Вы писали:

К>Здравствуйте, Alex A. Kuzmin, Вы писали:


AAK>>здесь http://www.futura.ru/hg/ninja_ru.zip

К>404 not found

К>А у меня в knr- и kns-файлах нет никаких # Версия 2.1.

Наличие # в версии 2.1 подтверждаю.
Файл 1049.kns (466213 байт), начиная с адреса 0x0160:

##-аа#ааабавагадаеажазаиайакаламанаоапарасатауафахацачашаэаяб#бабдбебёбжбзбиблбо

и т.д.
А мне нравится жить :).
Re[3]: Помогите разобрать файл от KN, плиз
От: conraddk Россия  
Дата: 31.10.07 18:55
Оценка:
Здравствуйте, e-garin, Вы писали:

EG>Файл 1049.kns (466213 байт), начиная с адреса 0x0160:

EG>

##-аа#ааабавагадаеажазаиайакаламанаоапарасатауафахацачашаэаяб#бабдбебёбжбзбиблбо

EG>и т.д.

Очень похоже на (имхо, не очень удачный) справочник допустимых начал слов для 2-5 букв. Решетка — служебный символ, означает конец слова и, возможно, выступает в роли джокера.

Списки для 2 и 3 букв разделены "###". Между списками для 3 и 4 букв — "###й###х###ю###я\t". Как обрабатывается и что значит символ табуляции (0x09) — Напоминает неполный список распространенных последних букв прилагательных в разных падежах. Кстати, на следующей границе списков стоит "###й####х####ю####я#".

В начале файла, по-видимому, индекс расположения списков. В конце — аббревиатуры.
Д.К. << RSDN@Home 1.2.0 alpha rev. 655>>
Все на свете должно происходить медленно и неправильно...
Re: Помогите разобрать файл от KN, плиз
От: Alex A. Kuzmin Россия  
Дата: 31.10.07 20:04
Оценка: +1
Для решения задачи,
получения допустимых буквосочетаний русского языка,
как я понимаю, проще накидать прогу на C#
и разобрать текст "Война и Мир" в 4-х томах
на кусочки, а заодно и статистику по повторениям
посчитать, пригодится для ускорения доступа по справочнику.

Вопрос №2:
Какую книжку использовать для английского языка?
Re[2]: Помогите разобрать файл от KN, плиз
От: Flamer Кипр http://users.livejournal.com/_flamer_/
Дата: 31.10.07 20:10
Оценка:
Здравствуйте, Alex A. Kuzmin, Вы писали:

[]

AAK>Вопрос №2:

AAK>Какую книжку использовать для английского языка?

Толкиеновский "Властелин колец"
<< Если человек рождается бедным и некрасивым, то в дальнейшем он имеет много шансов развить оба этих качества. >>
Re[3]: Помогите разобрать файл от KN, плиз
От: Alex A. Kuzmin Россия  
Дата: 31.10.07 20:26
Оценка:
Здравствуйте, Flamer, Вы писали:

F>Толкиеновский "Властелин колец"


Это тема! Будем искать...
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.