семантическое расстояние
От: burbaka  
Дата: 05.03.06 12:29
Оценка:
Привет.

Есть следующая проблема. Даны два описания на естественном языке. Нужно определить, насколько близки эти понятия. То есть фактически нужно ввести расстояние на множестве понятий. Понятия будем считать словосочетаниями из небольшого числа слов (скажем, до 5).
Пусть (u[i], i=1..m) и (v[j], j=1..n) — наборы слов в понятиях. Тогда расстояние можно ввести как число совпадающих слов в наборах:
d(u,v) = Sum I(i,j),
         i,j

I(i,j) = 1, u[i]=v[j],
I(i,j) = 0, u[i]!=v[j]

Это простой способ, но он очень далек от идеала. Например понятие "Тихий Дон" очень далеко от "Дон Кихот", а понятие "программист" близко к понятию "разработчик приложений".
Подозреваю, что задача очень сложная, но нужен приемлемый на практике способ решения. Думаю, этим должна заниматься математическая лингвистика, но опыта в ней у меня нет. Поэтому буду очень благодарен за любые советы и особенно ссылки по теме.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.