Здравствуйте, Pavel_Agurov, Вы писали:
P_A>Поэтому я там смайлик поставил. Ну а вдруг коллеге пригодится — если Word — проверяем, нету — ну извиняй, не проверяем...
Лицензия запрещает использование словарей встроенных в Word в 3rd party applications, даже если сам Word лицензионно чистый.
Здравствуйте, HotDog, Вы писали:
HD>Здравствуйте, Pavel_Agurov, Вы писали:
P_A>>Поэтому я там смайлик поставил. Ну а вдруг коллеге пригодится — если Word — проверяем, нету — ну извиняй, не проверяем...
HD>Лицензия запрещает использование словарей встроенных в Word в 3rd party applications, даже если сам Word лицензионно чистый.
The download includes an English dictionary with dictionaries for other languages available for download on the project web site. NetSpell also supports user added words and automatic creation of user dictionaries. It also includes a dictionary build tool to build custom dictionaries.
A>The download includes an English dictionary with dictionaries for other languages available for download on the project web site. NetSpell also supports user added words and automatic creation of user dictionaries. It also includes a dictionary build tool to build custom dictionaries.
A>Наверняка же есть словари для русского языка.
Искать неохота...
И ссылка для загрузки не работает.
Здравствуйте, jenyavb, Вы писали:
A>>Netspell
J>А русский язык поддерживает?
Она использует словари почти формата Опен-Оффис
На опенофисном сайте есть ссылка на несколко разных русских словарей.
Почти — потому что у офиса используется 2 (или 3?) файла на словарь (отдельно аффиксы/суффиксы и отдельно — основы слов), в данной же программе используется один словарь... полученный объединением этих двух
Т.е. надо посмотреть пример организации словаря и заполнить поля файла (там набор раздовов, разделенный заголовками как в ини-файлах) данными из словарей стандарта ОпенОфис. Ну может чуть подправить что, не помню детали — довольно давно игрался с нетспелом. Сперва довольно долго тормозил с этими словарями, потом сообразил — заработала, вполне себе проверяла орфографию. Но в практическом приложении я ее не применял — просто нужда отпала.
Здравствуйте, fmiracle, Вы писали:
F>Здравствуйте, jenyavb, Вы писали:
A>>>Netspell
J>>А русский язык поддерживает?
F>Она использует словари почти формата Опен-Оффис F>На опенофисном сайте есть ссылка на несколко разных русских словарей.
А что, верно говорят, что если использовать словарь из OpenOffice, то придется свою программу под GPL выпускать?
Здравствуйте, Красин, Вы писали:
F>>Она использует словари почти формата Опен-Оффис F>>На опенофисном сайте есть ссылка на несколко разных русских словарей.
К>А что, верно говорят, что если использовать словарь из OpenOffice, то придется свою программу под GPL выпускать?
Хм. Не уточнял. Я тогда собирался делать открытую прогу — меня бы и GPL и устроила. Да и все равно не сделал
С другой стороны — утверждение выглядит сомнительным — опен оффис в целом распространяется под лицензией LGPL (Lesser GPL), а она не накладывает подобных ограничений.
При этом касательно Netspell — по ссылке, что я говорил, лежат ссылки на словари разных авторов — те могут иметь свои лицензии со своими правилами.
F>С другой стороны — утверждение выглядит сомнительным — опен оффис в целом распространяется под лицензией LGPL (Lesser GPL), а она не накладывает подобных ограничений.
Я почитал, там словари по умолчанию идут по Public Documentation Licence, но что она разрешает и что требует, так и не ясно.
F>Почти — потому что у офиса используется 2 (или 3?) файла на словарь (отдельно аффиксы/суффиксы и отдельно — основы слов), в данной же программе используется один словарь... полученный объединением этих двух
Есть еще большой проект Wordnet — большая лексическая база для английского языка. API к нему есть и на .NET-е — здесь
EuroWordNet — поддержка Dutch, Italian, Spanish, German, French, Czech and Estonian.
Здравствуйте, HotDog, Вы писали:
HD>Лицензия запрещает использование словарей встроенных в Word в 3rd party applications, даже если сам Word лицензионно чистый.
Здравствуйте, Andre, Вы писали:
HD>>Лицензия запрещает использование словарей встроенных в Word в 3rd party applications, даже если сам Word лицензионно чистый.
A>Странно, а сам MS в FxCop их использует
Осталось дождаться, когда МС сама на себя в суд подаст. Думаю, будет интересное зрелище.
Здравствуйте, Красин, Вы писали:
К>Я почитал, там словари по умолчанию идут по Public Documentation Licence, но что она разрешает и что требует, так и не ясно.
Здравствуйте, jenyavb, Вы писали:
J>Здравствуйте, Красин, Вы писали:
К>>Я почитал, там словари по умолчанию идут по Public Documentation Licence, но что она разрешает и что требует, так и не ясно.
J>Мда... А мне для шаровары надо...
Вы посмотрите конкретно на тот словарь, который русский. Т.к. он не поставляется вместе с Open Office, вполне возможно, что у него лицензия "бери не хочу"
Re[8]: Проверка орфографии
От:
Аноним
Дата:
05.12.06 00:44
Оценка:
Вы посмотрите конкретно на тот словарь, который русский. Т.к. он не поставляется вместе с Open Office, вполне возможно, что у него лицензия "бери не хочу"
Кстати тот-же словарь сейчас идет с файрфоксом 2.0.
PS: вообще в нетспелле много лишнего на мой взгляд, плюс весьма тормозные алгоритмы поиска Suggestion.
Мне тут потребовалась проверка, так я выкинул три четверти его кода, перевел оставшееся на VB.NET 2.0 и дописал нативную загрузку словарей опенофиса (дабы ничего не конвертить руками)
pps:
А вот префиксов и Phonetics для русского языка d этих словарях нет Вот бы где найти словарь с ними и указанием частей речи для каждого слова ....
Здравствуйте, German_Ivanov, Вы писали:
G_I> Мне тут потребовалась проверка, так я выкинул три четверти его кода, перевел оставшееся на VB.NET 2.0 и дописал нативную загрузку словарей опенофиса (дабы ничего не конвертить руками)
Круто. Если вы поделитесь с народом такой библиотекой, куча людей скажет вам спасибо.
Здравствуйте, HotDog, Вы писали:
HD>Лицензия запрещает использование словарей встроенных в Word в 3rd party applications, даже если сам Word лицензионно чистый.
ps: Накидано "на коленке" за пару часов, так что за качество исполнения прошу ногами не пинать.
Да вот еще, есть некоторые неочевидные моменты
1) По идее все должно работать со словарями на любом другом языке (при загрузке определяется его кодовая страница)из этого вытекает то, что при желании вы можете переконвертить словарь openoffice из KOI-8 скажем в CP-1251 (подправив шапку — поле "set")
2) Можно вести свой юзерский словарь. см метод
UserFileAdd в классе WordDict. Словарь ведется на дефолтовой для системы ANSI странице (дабы его легче править было)
3) В оригинале AffixEntry.Condition было объявлено как = New Integer(256). Это приводило к падению проги на русских словарях(код русских букв находится в районе 1000). Я на скорую руку накрыл это дело подушкой, увеличив число до 2000.
3) .... По уму надо перебрать поле try словаря и выбрать символ с максимальным кодом и по нему задать размерность массива.
4) перед проверкой обязательно приведите слово к нижнему регистру! Словарь при загрузке сбрасывается в нижний регистр (мне так надо было)
5) на входе проверки стоит код который сразу отбрасывает слова содержащие символы не входящие в поле try словаря (цифры, слова на другом языке и прочие не буквенные символы) это тоже мне нужно было.
6) Все методы отвечающие за suggestion и phonetics из библиотеки выкинуты. Первые работают крайне неудовлетворительно(медленно и чушь советуют), вторых нет в русском словаре.
Здравствуйте, Pavel_Agurov, Вы писали:
P_A>using Microsoft.Office.Interop.Word;
Не могу никак врубиться, как заставить это работать. Имею MS Office 2003. В ссылках подключаю Microsoft Word 11 Object Library. Добавляются три ссылки. Слева от Word — восклицательный знак в жёлтом треугольнике. Компилятор выдаёт ошибки:
Error 1 The type or namespace name 'Interop' does not exist in the namespace 'Microsoft.Office' (are you missing an assembly reference?) D:\Documents\Visual Studio 2005\Projects\Orfography\Orfography\Form1.cs 10 24 Orfography
Error 2 The type or namespace name 'ApplicationClass' could not be found (are you missing a using directive or an assembly reference?) D:\Documents\Visual Studio 2005\Projects\Orfography\Orfography\Form1.cs 60 21 Orfography
Warning 3 Cannot find wrapper assembly for type library "Word". Orfography
Warning 4 The referenced component 'Word' could not be found.