У нас имеется две вакансии:
1. Разработчик базовых технологий. Это про то, что я описывал.
2. Разработчик парсеров форматов. Это разработчик под Linux, имеющий желание писать парсеры сложных форматов: PDF, DOC, RTF и т.п. Перечисленные форматы мы уже парсим, но есть еще много чего распарсить. Надо будет еще поддерживать совсем небольшой код на QT. У нас есть инструмент, который автоматически выделяет термины категорий из переданных множеств текстов для каждой категории. Для него есть небольшой ГУИ, надо его будет время от времени улучшать и поддерживать.