On 11.02.2013 16:01, jyuyjiyuijyu wrote:
> это я встречал ... но логика его работы мне как бы не подходит он на > каждое неправильное слово > выдает список возможных замен а мне надо автоматически менять > неправильные слова ...
Возможно что еще есть, если поискать, но полноценная проверка
правописания очень сложна и есть шансы, что такое ты нахаляву не
найдешь, придеться запрашивать у абби, возможно у них что-то есть, но
сколько это будет стоить — не представляю даже. Причем без контекста
нельзя сказать, какое слово правильно и нужен ли пробел между словами
(примеры приводить не буду, в учебнике русского языка найдешь).
А так, используй то, что уже есть дальше добавлять свою обработку. Он то
на неправильные слова тебе возможные правильные уже выдает. Дальше
делаешь в меру своих возможностей (может ты смысл выделять будешь и по
нему некоторые ошибки править, которые иначе не получиться).
Полноценный морфеный словарь ты не сделаешь — это очень много работы,
сделать словарь из всех возможных словоформ слов русского языка — его
объем будет очень и очень большим. Бесплатных их нет. Например есть
такой у црт в синтезе, но его тебе никто не продаст (да еще учитывая,
что они по нему уже несколько лет судятся, можешь попробовать купить
некий морфемный словарь у мужика, с кем црт судиться — в инете, если
порыскаешь найдешь).
То что ты написал это не spell check, а скорее grammar check.
grammar check для русского языка штука либо сложная либо особо никому не нужная, поэтому вероятнсть нахождения оной в виде именно компактной библиотеки крайне мала.
Во всяком случае поиск по "russian grammar check library" ничего не дает.
это я встречал ... но логика его работы мне как бы не подходит он на каждое неправильное слово
выдает список возможных замен а мне надо автоматически менять неправильные слова ...
Здравствуйте, jyuyjiyuijyu, Вы писали:
J>какую библиотку выбрать ?
Вряд ли ты такую сможешь разодыть бесплатно... да и за деньги тоже. Можно попробовать подцепить вордовй чекер через ком, если его интерфейс торчит наружу. Но это только идея если что.
Здравствуйте, Kernan, Вы писали:
K>Вряд ли ты такую сможешь разодыть бесплатно... да и за деньги тоже. Можно попробовать подцепить вордовй чекер через ком, если его интерфейс торчит наружу. Но это только идея если что.
этот вариант я встречал ... я вот чего не пойму... например у неправильно написанного слова есть несколько вариантов замены как он выберет правильный ? ведь обычные спелл чекеры предлагают на выбор а тут он должен будет выбрать автоматически ...
Здравствуйте, jyuyjiyuijyu, Вы писали:
J>логика его работы мне как бы не подходит он на каждое неправильное слово J>выдает список возможных замен а мне надо автоматически менять неправильные слова ...
— Я машину помыяла.
— Хорово.
Мне просто интересно, на какие слова программа должна сделать замену?
On 11.02.2013 16:41, watch-maker wrote:
> — Я машину помыяла. > — Хорово. > > > Мне просто интересно, на какие слова программа должна сделать замену?
Так я ж написал ему, что если он сделает выделение смысла в зависимости
от контектста, то как править сразу станет понятно.
On 11.02.2013 16:58, jyuyjiyuijyu wrote:
> я об этом задумывался ... надеялся на чудо ...
Так тут элементарно, садишь человека за зарплату или нескольких и они
совершают это чудо.
Здравствуйте, jyuyjiyuijyu, Вы писали:
J>этот вариант я встречал ... я вот чего не пойму... например у неправильно написанного слова есть несколько вариантов замены как он выберет правильный ? ведь обычные спелл чекеры предлагают на выбор а тут он должен будет выбрать автоматически ...
Считай расстояние Левенштейна и выбирай слово с ближайшим. Ну или пиши полноценный разбор и анализ текста с выбором слова по смыслу, но мало того что подобный алгоритм будет не хило так ошибаться, так еще и задача тянет на очень и очень объемную.
On 12.02.2013 3:38, kaa.python wrote:
> Считай расстояние Левенштейна и выбирай слово с ближайшим.
Тоже была первая мысль его сюда направить, но словарь... — объем словаря
может оказаться очень большим, а по этому расстоянию ему будет
возвращаться громадный список слов, предполагаю поболее, чем вернет тот
же Hunspell (хотя как он работает не знаю).
Можно, конечно еще много трюков различных применить, оценить
распределение вероятностей для слов, где человек больше ошибок
допускает; использовать тематический словарь; отдельно работать с
ошибками набора текста (перестановки букв, промахи на клавивтауре,
попуски пробелов и т.д.) — но тут работы много, причем исследовательской
— обзор литературу, исследования.
Ну а полноценные морфемные словари где есть я ему уже подсказал (а да,
еще промт) . Но их украсть не выйдет, там очень внимательно смотрят за
этим и посодют.