Здравствуйте, RobinHood, Вы писали:
RH> Не подскажите какие на сегоднешний день сушествуют алгоритмы ,которые определяют о чем данный текст.
Посмотрите в сторону
латентного семантического анализа. Несмотря на обилие математики, идея очень проста. К сожалению, реализация на практике особенно для большого количества текстов, требует много вычислительных ресурсов. Менее ресурсоемкий но идейно похожий вариант я видел в библиотеке
semanticvectors.