Re[3]: библиотека для спелл чекинга
От: Vzhyk  
Дата: 11.02.13 13:14
Оценка: 6 (1)
On 11.02.2013 16:01, jyuyjiyuijyu wrote:

> это я встречал ... но логика его работы мне как бы не подходит он на

> каждое неправильное слово
> выдает список возможных замен а мне надо автоматически менять
> неправильные слова ...
Возможно что еще есть, если поискать, но полноценная проверка
правописания очень сложна и есть шансы, что такое ты нахаляву не
найдешь, придеться запрашивать у абби, возможно у них что-то есть, но
сколько это будет стоить — не представляю даже. Причем без контекста
нельзя сказать, какое слово правильно и нужен ли пробел между словами
(примеры приводить не буду, в учебнике русского языка найдешь).
А так, используй то, что уже есть дальше добавлять свою обработку. Он то
на неправильные слова тебе возможные правильные уже выдает. Дальше
делаешь в меру своих возможностей (может ты смысл выделять будешь и по
нему некоторые ошибки править, которые иначе не получиться).
Полноценный морфеный словарь ты не сделаешь — это очень много работы,
сделать словарь из всех возможных словоформ слов русского языка — его
объем будет очень и очень большим. Бесплатных их нет. Например есть
такой у црт в синтезе, но его тебе никто не продаст (да еще учитывая,
что они по нему уже несколько лет судятся, можешь попробовать купить
некий морфемный словарь у мужика, с кем црт судиться — в инете, если
порыскаешь найдешь).
Posted via RSDN NNTP Server 2.1 beta
Re: библиотека для спелл чекинга
От: c-smile Канада http://terrainformatica.com
Дата: 10.02.13 18:17
Оценка: 1 (1)
Здравствуйте, jyuyjiyuijyu, Вы писали:

То что ты написал это не spell check, а скорее grammar check.
grammar check для русского языка штука либо сложная либо особо никому не нужная, поэтому вероятнсть нахождения оной в виде именно компактной библиотеки крайне мала.

Во всяком случае поиск по "russian grammar check library" ничего не дает.
Re[2]: библиотека для спелл чекинга
От: jyuyjiyuijyu  
Дата: 11.02.13 13:01
Оценка: :)
Здравствуйте, Vzhyk, Вы писали:

V>Первая ссылка в Гугле по "russian spell checker gpl"

V>http://hunspell.sourceforge.net/

это я встречал ... но логика его работы мне как бы не подходит он на каждое неправильное слово
выдает список возможных замен а мне надо автоматически менять неправильные слова ...
библиотека для спелл чекинга
От: jyuyjiyuijyu  
Дата: 10.02.13 16:26
Оценка:
Всем привет

нужно автоматически исправлять ошибки в тексте

например есть std::wstring с неким русским тесктом
внутри нужно правильно расставить пробелы например

было что — то стало что-то
или было лучшее-враг хорошего стало лучшее — враг хорошего

или пробелы убирать перед некоторыми знаками препинания

еще бывают слова написанные с ошибкой хотелось бы и в них
автоматически исправлять ошибки

использовать хочу так

correct_text(str);

на выходе правильный русский

какую библиотку выбрать ?

спасибо
Re: библиотека для спелл чекинга
От: Kernan Ниоткуда https://rsdn.ru/forum/flame.politics/
Дата: 11.02.13 10:27
Оценка:
Здравствуйте, jyuyjiyuijyu, Вы писали:

J>какую библиотку выбрать ?

Вряд ли ты такую сможешь разодыть бесплатно... да и за деньги тоже. Можно попробовать подцепить вордовй чекер через ком, если его интерфейс торчит наружу. Но это только идея если что.
Sic luceat lux!
Re[2]: библиотека для спелл чекинга
От: jyuyjiyuijyu  
Дата: 11.02.13 12:33
Оценка:
Здравствуйте, Kernan, Вы писали:

K>Вряд ли ты такую сможешь разодыть бесплатно... да и за деньги тоже. Можно попробовать подцепить вордовй чекер через ком, если его интерфейс торчит наружу. Но это только идея если что.


этот вариант я встречал ... я вот чего не пойму... например у неправильно написанного слова есть несколько вариантов замены как он выберет правильный ? ведь обычные спелл чекеры предлагают на выбор а тут он должен будет выбрать автоматически ...
Re: библиотека для спелл чекинга
От: Vzhyk  
Дата: 11.02.13 12:49
Оценка:
On 10.02.2013 19:26, jyuyjiyuijyu wrote:

Первая ссылка в Гугле по "russian spell checker gpl"
http://hunspell.sourceforge.net/
Posted via RSDN NNTP Server 2.1 beta
Re[3]: библиотека для спелл чекинга
От: watch-maker  
Дата: 11.02.13 13:41
Оценка:
Здравствуйте, jyuyjiyuijyu, Вы писали:

J>логика его работы мне как бы не подходит он на каждое неправильное слово

J>выдает список возможных замен а мне надо автоматически менять неправильные слова ...

— Я машину помыяла.
— Хорово.


Мне просто интересно, на какие слова программа должна сделать замену?
Re: библиотека для спелл чекинга
От: Mystic Украина http://mystic2000.newmail.ru
Дата: 11.02.13 13:52
Оценка:
Здравствуйте, jyuyjiyuijyu, Вы писали:

J>какую библиотку выбрать ?


Hunspell используется в Open Office, Firefox etc
Re[4]: библиотека для спелл чекинга
От: jyuyjiyuijyu  
Дата: 11.02.13 13:58
Оценка:
Здравствуйте, watch-maker, Вы писали:

WM>

— Я машину помыяла.
WM>— Хорово.


WM>Мне просто интересно, на какие слова программа должна сделать замену?


я об этом задумывался ... надеялся на чудо ...
Re[4]: библиотека для спелл чекинга
От: Vzhyk  
Дата: 11.02.13 13:59
Оценка:
On 11.02.2013 16:41, watch-maker wrote:

> — Я машину помыяла.

> — Хорово.
>
>
> Мне просто интересно, на какие слова программа должна сделать замену?
Так я ж написал ему, что если он сделает выделение смысла в зависимости
от контектста, то как править сразу станет понятно.
Posted via RSDN NNTP Server 2.1 beta
Re[5]: библиотека для спелл чекинга
От: Vzhyk  
Дата: 11.02.13 14:37
Оценка:
On 11.02.2013 16:58, jyuyjiyuijyu wrote:

> я об этом задумывался ... надеялся на чудо ...

Так тут элементарно, садишь человека за зарплату или нескольких и они
совершают это чудо.
Posted via RSDN NNTP Server 2.1 beta
Re[3]: библиотека для спелл чекинга
От: kaa.python Ниоткуда РСДН профессионально мёртв и завален ватой.
Дата: 12.02.13 00:38
Оценка:
Здравствуйте, jyuyjiyuijyu, Вы писали:

J>этот вариант я встречал ... я вот чего не пойму... например у неправильно написанного слова есть несколько вариантов замены как он выберет правильный ? ведь обычные спелл чекеры предлагают на выбор а тут он должен будет выбрать автоматически ...


Считай расстояние Левенштейна и выбирай слово с ближайшим. Ну или пиши полноценный разбор и анализ текста с выбором слова по смыслу, но мало того что подобный алгоритм будет не хило так ошибаться, так еще и задача тянет на очень и очень объемную.
Re[4]: библиотека для спелл чекинга
От: Vzhyk  
Дата: 12.02.13 08:51
Оценка:
On 12.02.2013 3:38, kaa.python wrote:

> Считай расстояние Левенштейна и выбирай слово с ближайшим.

Тоже была первая мысль его сюда направить, но словарь... — объем словаря
может оказаться очень большим, а по этому расстоянию ему будет
возвращаться громадный список слов, предполагаю поболее, чем вернет тот
же Hunspell (хотя как он работает не знаю).
Можно, конечно еще много трюков различных применить, оценить
распределение вероятностей для слов, где человек больше ошибок
допускает; использовать тематический словарь; отдельно работать с
ошибками набора текста (перестановки букв, промахи на клавивтауре,
попуски пробелов и т.д.) — но тут работы много, причем исследовательской
— обзор литературу, исследования.
Ну а полноценные морфемные словари где есть я ему уже подсказал (а да,
еще промт) . Но их украсть не выйдет, там очень внимательно смотрят за
этим и посодют.
Posted via RSDN NNTP Server 2.1 beta
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.