Full Text Search
От: adontz Грузия http://adontz.wordpress.com/
Дата: 22.07.06 09:40
Оценка:
Итак. Есть множество документов, по которым надо осуществить поиск с учётом морфологии языка (100% будут английский, немецкий, испанский, португальский, французский, итальянский, русский).

При поиске наткнулся на ABBYY Retrieval & Morphology Engine
http://www.abbyy.ru/arme/

Но нет ознакомительной версии. Кроме того цена кусается и покупать кота в мешке не хотелось бы.

С алгоритмами индексации текста в общих чертах ознакомился, но качественная лемматизация без словарей не делается, а где брать словари совершенно не ясно. Тем более для такого спектра языков.

Вобщем посоветуйте мне, пожалуйста, кто что может.
A journey of a thousand miles must begin with a single step © Lau Tsu
Re: Full Text Search
От: George Saveliev Украина  
Дата: 22.07.06 14:24
Оценка: 102 (6)
Здравствуйте, adontz, Вы писали:

A>Итак. Есть множество документов, по которым надо осуществить поиск с учётом морфологии языка (100% будут английский, немецкий, испанский, португальский, французский, итальянский, русский).


A>При поиске наткнулся на ABBYY Retrieval & Morphology Engine

A>http://www.abbyy.ru/arme/

A>Но нет ознакомительной версии. Кроме того цена кусается и покупать кота в мешке не хотелось бы.


A>С алгоритмами индексации текста в общих чертах ознакомился, но качественная лемматизация без словарей не делается, а где брать словари совершенно не ясно. Тем более для такого спектра языков.


A>Вобщем посоветуйте мне, пожалуйста, кто что может.


Solarix
ПОИСКОВАЯ СИСТЕМА с поддержкой морфологии и синтаксиса
русского, английского, французского языков здесь
С уважением,
Савельев Георгий
Re[2]: Full Text Search
От: OldDino Россия  
Дата: 24.07.06 05:15
Оценка: 48 (2)
Здравствуйте, George Saveliev, Вы писали:

GS>Solarix

GS>ПОИСКОВАЯ СИСТЕМА с поддержкой морфологии и синтаксиса
GS>русского, английского, французского языков здесь

Работал с ней. Впечатления — хорошие. Особо хочу отметить, что очень приятно работать с автором программы. Он совершенно правильно воспринимает все замечания и пожелания, после чего старается их быстро реализовать. Пользуясь случаем, хочу сказать Илье Козиеву, автору, спасибо.

С уважением,

OldDino
Re: Full Text Search
От: Аноним  
Дата: 24.07.06 05:45
Оценка:
Здравствуйте, adontz, Вы писали:

A>Итак. Есть множество документов, по которым надо осуществить поиск с учётом морфологии языка (100% будут английский, немецкий, испанский, португальский, французский, итальянский, русский).


A>При поиске наткнулся на ABBYY Retrieval & Morphology Engine

A>http://www.abbyy.ru/arme/

A>Но нет ознакомительной версии. Кроме того цена кусается и покупать кота в мешке не хотелось бы.


A>С алгоритмами индексации текста в общих чертах ознакомился, но качественная лемматизация без словарей не делается, а где брать словари совершенно не ясно. Тем более для такого спектра языков.


A>Вобщем посоветуйте мне, пожалуйста, кто что может.


модули от Коваленко
от Информатика
и еще посмотри в MSDN: IWordBreaker, IStemmer
Re[3]: Full Text Search
От: ArtDenis Россия  
Дата: 24.07.06 10:40
Оценка:
OldDino пишет:
> Работал с ней. Впечатления — хорошие. Особо хочу отметить, что очень приятно работать с автором программы. Он совершенно правильно воспринимает все замечания и пожелания, после чего старается их быстро реализовать. Пользуясь случаем, хочу сказать Илье Козиеву, автору, спасибо.

Если бы прога имела хороший интерфейс и была бы попроще в использовании,
ей бы наверное не было цены (попользоваться ей не удалось, т.к. не
разобрался как она работает). Google-вский движок удобнее, хоть он и не
учитывает морфологию языка
Posted via RSDN NNTP Server 2.0
http://ufa-darts.ru/ — дартс-лига Уфы
Re[4]: Full Text Search
От: OldDino Россия  
Дата: 24.07.06 11:04
Оценка:
Здравствуйте, ArtDenis, Вы писали:

AD>Если бы прога имела хороший интерфейс и была бы попроще в использовании,

AD>ей бы наверное не было цены (попользоваться ей не удалось, т.к. не
AD>разобрался как она работает). Google-вский движок удобнее, хоть он и не
AD>учитывает морфологию языка

Ну, здесь можно, конечно, спорить и спорить. В использовании она для меня была крайне проста. Но, честно говоря, Илья в какой-то степени (в частности, грамматическую машину) подгонял её под мои нужды. Что же, например, касается его грамматической машины, то по простоте использования ей просто нет равных (точнее, я НЕ МОГУ представить что-то более простое — это чтобы не обидеть кого-то из разработчиков подобных продуктов). Указываешь в качестве аргумента словоформу (например, "стульев") и грамматическая машина возвращает тебе список типа "Стул, стула, стулу" и так далее.

С уважением,

OldDino
Re[5]: Full Text Search
От: adontz Грузия http://adontz.wordpress.com/
Дата: 24.07.06 12:05
Оценка:
Здравствуйте, OldDino, Вы писали:

Не в курсе ли ты (может спрашивал, раз уж так тестно работали) можно ли (конечно же на коммерческой основе) в перспективе добавить другие языки?
A journey of a thousand miles must begin with a single step © Lau Tsu
Re[6]: Full Text Search
От: OldDino Россия  
Дата: 24.07.06 12:37
Оценка:
Здравствуйте, adontz, Вы писали:

A>Не в курсе ли ты (может спрашивал, раз уж так тестно работали) можно ли (конечно же на коммерческой основе) в перспективе добавить другие языки?


Роман, здесь не принято указывать на грамматические ошибки, но твоя ошибка очень символична. Мы с Ильёй работали именно тесТно — то есть взаимодействие было очень тесным (и, надеюсь, полезным обеим сторонам), при этом я в некотором смысле тестировал его продукт. Кстати, его грамматическая машина включена в один из наших проектов (с его разрешения и при соблюдении всех копирайтов) и сейчас используется в одной крупной государственной организации.
Что же касается наших переговором с Ильёй — пойми правильно, они были приватными, поэтому я не вправе, наверное, передавать их содержание. С другой стороны, надеюсь, если ты обратишься к нему напрямую, он тебе ответит, и ты получишь информацию из первых рук. Во всяком случае, мой опыт общения с ним позволяет делать такие предположения.
Если ты не найдёшь его e-mail'а в сети, то я могу спросить у него разрешения сообщить тебе его адрес. Идёт?

С уважением,

OldDino
Re[7]: Full Text Search
От: adontz Грузия http://adontz.wordpress.com/
Дата: 24.07.06 12:50
Оценка:
Здравствуйте, OldDino, Вы писали:

OD>Что же касается наших переговором с Ильёй — пойми правильно, они были приватными, поэтому я не вправе, наверное, передавать их содержание. С другой стороны, надеюсь, если ты обратишься к нему напрямую, он тебе ответит, и ты получишь информацию из первых рук. Во всяком случае, мой опыт общения с ним позволяет делать такие предположения.


Так и не спрашиваю о чём вы говорили Я спрашиваю возможно ли добавить поддержку других языков? Может быть автор (ему проще) это сделает за деньги, а может быть мы (но опять таки не без помощи автора). Но самое важное, это потенциальная возможность добавить новый язык.

OD>Если ты не найдёшь его e-mail'а в сети, то я могу спросить у него разрешения сообщить тебе его адрес. Идёт?


Ладно. Было бы здорово.
Спасибо!
A journey of a thousand miles must begin with a single step © Lau Tsu
Re[8]: Full Text Search
От: OldDino Россия  
Дата: 24.07.06 13:02
Оценка:
Здравствуйте, adontz, Вы писали:

OD>>Если ты не найдёшь его e-mail'а в сети, то я могу спросить у него разрешения сообщить тебе его адрес. Идёт?


A>Ладно. Было бы здорово.

A>Спасибо!

Илье написал. Как только получу от него ответ, дам знать.

С уважением,

OldDino
Re[9]: Full Text Search
От: kelijah  
Дата: 25.07.06 04:09
Оценка: 1 (1)
Здравствуйте, OldDino, Вы писали:

OD>>>Если ты не найдёшь его e-mail'а в сети, то я могу спросить у него разрешения сообщить тебе его адрес. Идёт?


Доброе утро!

Если есть вопросы, bug report'ы или предложения по поисковику или грамматической машине — можно использовать kelijah@yandex.ru или support@solarix.ru.

Будучи настоящим жентыльменом, читаю RSDN каждое утро , так что ругать или обсуждать проект можно и здесь, если формат форума предпочтителен.

С уважением, Козиев Илья.
Re[8]: Full Text Search
От: OldDino Россия  
Дата: 25.07.06 13:40
Оценка:
Здравствуйте, adontz, Вы писали:

OD>>Если ты не найдёшь его e-mail'а в сети, то я могу спросить у него разрешения сообщить тебе его адрес. Идёт?


A>Ладно. Было бы здорово.

A>Спасибо!

Роман, думаю, теперь моя помощь уже и ни к чему. Илья и сам ответил.

С уважением,

Павел Румянцев
Re: Full Text Search
От: Shire  
Дата: 22.08.06 15:12
Оценка:
Здравствуйте, adontz, Вы писали:

A>Итак. Есть множество документов, по которым надо осуществить поиск с учётом морфологии языка (100% будут английский, немецкий, испанский, португальский, французский, итальянский, русский).


A>Вобщем посоветуйте мне, пожалуйста, кто что может.


http://www.snowball.tartarus.org/

Snowball is a small string processing language designed for creating stemming algorithms for use in Information Retrieval. This site describes Snowball, and presents several useful stemmers which have been implemented using it.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.