Здравствуйте, igor-shikarev, Вы писали:
IS>Добрый день всем профессионалам!
IS>Встала задача по анализу текста статей. Заказчик пока неточно очертил
IS>задачу, но ему уже точно нужно чтобы результатом анализа была число
IS>встречающейся фразы в тексте. Определить, что если речь идет о
IS>человеке, то положительно или отрицательно говорится в статье о нем.
IS>Кто-нибудь занимался такой задачей или тыкнете носом где можно
IS>почитать об этом. Со стемингом уже разобрался и разобрался со стоп-словами, а вот дальше тупик, не хватает математических знаний
Я могу ошибаться, но думаю Вам стоит ознакомится с этой работой:
http://nlp.stanford.edu/courses/cs224n/2009/fp/7.pdf
Вкраце — авторы на основе текста/речи делают вывод, республиканец или демократ тот или иной политик.
Мне кажется, задача в целом схожая, хотя конечно могут возникнуть проблемы с адаптацией под русский язык.