Здравствуйте, Sinix, Вы писали:
S>Здравствуйте, Kernighan, Вы писали:
K>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
S>Не даёт, ибо контекст.
И чего, "контекст"? Выразись понятнее.
S>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных
Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
S>Если серьёзно, то разбор текста требует немножко другого подхода. Или фиксированных конструкций аля microsoft bots / Amazon Alexa, или хардкора в стиле Abbyy Compreno.
S>Причём последний по результатам не сильно так ушёл от студенческих поделок, на примере Findo можно проверить.
Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).
Вот топикстартер и придумывает. Разумеется всякие там Микрософты будут предлагать свои подходы.
Разумеется, Микрософтовские подходы будут "тяжёлые" — требующие большого числа данных, огромной статистики и трудоёмкости.
Разумеется, "кулибины" типа топикстартера будут предлагать "лёгкие" подходы,
которые требуют малого количества данных типа "присвоим каждому слову грамматический род" (или какую-то настолько же простую характеристику).
Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.
Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.
ЗЫ.
У меня нет впечатления, что топикстартер правильно подобрал базис булевых переменных.
Но это не значит, что мы в процессе обсуждения не подберём более правильный.