Уважаемые коллеги!
Мы открыли новый проект по обработке текстов. В первую очередь, мы решили переписать многим известный лемматизатор Алексея Сокирко (проект aot.ru).
Сейчас проект находится в следующем состоянии: реализован лемматизатор и компиляторы словарей для руского и английского языков. Начаты работы по написанию словарей для прибалтийских языков (литовский, рлатышский, эстонский).
Сайт проекта:
http://lemmatizer.org/
Очень нужны люди, которые заинтересованы в развитии проекта. прежде всего те, кто будет использовать, нужно писать документацию и руководства. И много, много всего.
Да, лематизатор уже работает под нагрузкой в рабочих проектах (пол миллиона слов в секунду на средней тачке). Т. е. развивать его скорее нужно в сторону расширения функционала.
Всех желающих приглашаем к участию!
А.