Здравствуйте, Dym On, Вы писали:
DO>Тут интересен практический аспект. Что даст построение такого тензора? Какие задачи решит/поможет решить? Можно на конкретном примере.
Примеры есть в вводной части книги, читайте.
И главное — постарайтесь немного поупражняться.
Пошевелите мозгами. Это однозначно полезно.
Здравствуйте, Dym On, Вы писали:
DO>Тут интересен практический аспект. Что даст построение такого тензора? Какие задачи решит/поможет решить? Можно на конкретном примере.
Так отвечено же.
Лично меня увлекает построение семантических тензоров.
Это как решать кроссворды, только пользы больше.
Если серьёзно, то топик — обычные рассуждения про гносеологию вперемешку с аксиологией. Единственно верного подхода в философии по определению нет, все вместе они принципиально несовместимы, поэтому выбираем направление по вкусу и наслаждаемся.
Здравствуйте, Dym On, Вы писали:
DO>Тут интересен практический аспект. Что даст построение такого тензора? Какие задачи решит/поможет решить? Можно на конкретном примере.
Ну например извлечение данных из естественного текста.
Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
K>Ну например извлечение данных из естественного текста. K>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
Спасибо.
Странно, что это ответ не автора.
Здравствуйте, Kernighan, Вы писали:
K>Ну например извлечение данных из естественного текста. K>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
Спасибо. Да. Это применение семантики сродни численным методам. Сюда входят понятия: семантическое пространство, с.сеть, с.ядро, пространство Осгуда и т.п.
Однако Семантическая алгебра является фундаментальной аналитической дисциплиной.
Основная задача С.А. — это построение семантического словаря на основе семантических отношений и операций семантического сложения и умножения.
Здравствуйте, Dym On, Вы писали:
K>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных. DO>Спасибо. DO>Странно, что это ответ не автора.
Автор косноязычен как... как... Даже не знаю как кто.
Поэтому его опусы производят такое странное юмористическое впечатление.
Он додумался до очень интересных мыслей, но излагает так, как будто это стёб, тролинг и идиотизм одновременно.
Здравствуйте, Kernighan, Вы писали:
K>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
Не даёт, ибо контекст.
С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных
Если серьёзно, то разбор текста требует немножко другого подхода. Или фиксированных конструкций аля microsoft bots / Amazon Alexa, или хардкора в стиле Abbyy Compreno.
Причём последний по результатам не сильно так ушёл от студенческих поделок, на примере Findo можно проверить.
Здравствуйте, Sinix, Вы писали:
S>Здравствуйте, Kernighan, Вы писали:
K>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
S>Не даёт, ибо контекст.
И чего, "контекст"? Выразись понятнее.
S>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных
Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
S>Если серьёзно, то разбор текста требует немножко другого подхода. Или фиксированных конструкций аля microsoft bots / Amazon Alexa, или хардкора в стиле Abbyy Compreno. S>Причём последний по результатам не сильно так ушёл от студенческих поделок, на примере Findo можно проверить.
Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).
Вот топикстартер и придумывает. Разумеется всякие там Микрософты будут предлагать свои подходы.
Разумеется, Микрософтовские подходы будут "тяжёлые" — требующие большого числа данных, огромной статистики и трудоёмкости.
Разумеется, "кулибины" типа топикстартера будут предлагать "лёгкие" подходы,
которые требуют малого количества данных типа "присвоим каждому слову грамматический род" (или какую-то настолько же простую характеристику).
Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.
Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.
ЗЫ.
У меня нет впечатления, что топикстартер правильно подобрал базис булевых переменных.
Но это не значит, что мы в процессе обсуждения не подберём более правильный.
K>>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных. S>>Не даёт, ибо контекст. K>И чего, "контекст"? Выразись понятнее.
В этом и была задумка
Без контекста (твоего "возможность описывать естественный язык") предложение выше бессмысленно.
S>>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных K>Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
Бинго! 99% "естественного" языка не имеет смысла при анализе не то что отдельных слов — абзацев. Значение любого слова может зависеть от подразумеваемой интонации, порядка слов, предыдущего ответа, пунктуации, отсылок к известным культурным феноменам, цитатам или мемам и так далее. Ну, т.е. если анализатор текста распознал "Бинго" не как "Как и было сказано" и не учёл кавычки вокруг "естественного" — отстой этот ваш анализатор.
Человек всё вышеперечисленное делает на автомате, поэтому даже оборванные или формально некорректные фразы воспринимаются вполне. А вот формализовать такие штуки как-то не очень получается.
K>Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).
Ну да. Только их надо предлагать не по принципу "мне нравится == истинно", а на базе любого научного подхода по вкусу. Иначе получается полушаманская методика, которая позволяет лишь зафиксировать некий результат, но не умеет ни в прогнозы, ни уж тем более в верификацию. Только это уже не гносеология будет, а что-то из эпистемологии, пардон мой французский.
K>Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.
Угу,
любая сложная задача имеет простое, легкое для понимания и неправильное решение.
не, при должном упорстве и если звёзды сошлись, что-то путное может и получится, но это явно не наш случай, кмк.
K>Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.
Гхмм...
The math showed that a single brain synapse could hold 4.7 bits of information, and the whole brain could actually hold one petabyte.
(с)
понятно, что это сферические петабайты в вакууме, но проблема не в этом. Проблема в том, что перед тем, как браться за задачу, неплохо хотя бы приблизительно представлять себе её масштабы. Корректный семантический анализ произвольного текста ненамного проще задачи моделирования человеческого сознания.
P.S. Вывод "у топикстартера с анализом никаких проблем, так что с сознанием тоже быстро разберёмся" — неправильный
Здравствуйте, LVE, Вы писали:
LVE>Однако Семантическая алгебра является фундаментальной аналитической дисциплиной. LVE>Основная задача С.А. — это построение семантического словаря на основе семантических отношений и операций семантического сложения и умножения.
Я думаю, что ты как-то слишком сильно уверовал (в религиозном смысле) в подобие семантической и обычной алгебры.
Разумеется в семантической алгебре будут какие-то операции. И возможно там даже будет сложение.
Но с чего ты взял, что это будут только умножение и сложение?
Даже если взять векторную алгебру, то даже там есть скалярное и векторное произведение векторов.
А ведь можно сочинить всякие другие смысловые операции и отношения.
Ну вот например "человек" "мужчина" "юноша" "ученик".
Какая тут операция (не в смысле алгебры, а в смысле естественного интеллекта)?
Каждое следующее слово — это уточнение, (конкретизация) предыдущего.
Есть в твоей алгебре отношение "конкретизация"?
Кстати, ортогонализация у тебя есть? До понятия "ортогональный базис" ты дошёл?
Здравствуйте, alpha21264, Вы писали:
A>Я думаю, что ты как-то слишком сильно уверовал (в религиозном смысле) в подобие семантической и обычной алгебры. A>Разумеется в семантической алгебре будут какие-то операции. И возможно там даже будет сложение. A>Но с чего ты взял, что это будут только умножение и сложение? A>Даже если взять векторную алгебру, то даже там есть скалярное и векторное произведение векторов. A>А ведь можно сочинить всякие другие смысловые операции и отношения.
С этим всё нормально. С.А. очень не похожа на математику.
Я 14 лет собирал сугубо практический материал.
А теория нарисовалась только за последний год.
Читай книгу. Кроме отношений и операций, там есть аксиомы, теоремы и гипотезы.
Если хочешь сделать свою редакцию книги — то я не возражаю.
Только сначала разберись и попрактикуйся.
И ещё, имей ввиду, что в книге чуть больше 1К слов увязаны в тензоры 3,4,5 — рангов.
По моей оценке, это 10% от нормального словаря.
Работы — море. И теории далеко ещё до полноты.
Пожалуйста, не отвлекай меня на частные вопросы, пока не разберёшься.
Здравствуйте, alpha21264, Вы писали:
A>Ну вот например "человек" "мужчина" "юноша" "ученик". A>Какая тут операция (не в смысле алгебры, а в смысле естественного интеллекта)? A>Каждое следующее слово — это уточнение, (конкретизация) предыдущего. A>Есть в твоей алгебре отношение "конкретизация"?
A>Кстати, ортогонализация у тебя есть? До понятия "ортогональный базис" ты дошёл?
Поставь пожалуйста себя на моё место.
Я писал книгу чтобы читатель мог сам найти ответы на такие вопросы.
Копипастить самого себя мне не интересно.
Здравствуйте, alpha21264, Вы писали:
A>Ну вот например "человек" "мужчина" "юноша" "ученик". A>Какая тут операция (не в смысле алгебры, а в смысле естественного интеллекта)? A>Каждое следующее слово — это уточнение, (конкретизация) предыдущего. A>Есть в твоей алгебре отношение "конкретизация"?
A>Кстати, ортогонализация у тебя есть? До понятия "ортогональный базис" ты дошёл?
Вот что ещё можно сделать — это собрать список подобных вопросов.
Только на это надо время (хотя бы месяц) и желание.
Потом я постараюсь поработать с этим списком.
Может получиться несколько новых глав и FAQ.
Так что задавайте пожалуйста вопросы.
Но не ждите быстрых ответов.
Здравствуйте, Sinix, Вы писали:
Здравствуйте, Kernighan, Вы писали:
Мужики! Вы — молодцы. Так держать!
Я спокойно работал над словарём антонимов, но ваше обсуждение заставило меня записать ряд соображений.
Ознакомьтесь пожалуйста:
3.10. О СЕМАНТИЧЕСКОМ СЛОВАРЕ
Одной из основных задач семантической алгебры, является построение семантического словаря. Здесь есть ряд соображений относительно этой темы.
Словарь вообще имеет 4 уровня:
1. Орфография, — это фиксация правописания,
2. Стилистические оттенки, — это эмоциональное многообразие,
3. Речевые формы, — это логическое многообразие,
4. Словарные знаки, — это фиксация сути,
Поэтому, для семантического словаря важно составить системообразующее ядро из словарных знаков, морфем.
Речевые формы и стилистические оттенки можно генерировать.
Следующий вопрос. Надо определить форму записи семантических отношений и операций. Это неоднозначно. Рассмотрим примеры.
Здесь ключевую роль играет парность понятий.
(Верх – Низ) * Направление = Вверх – Вниз;
(Верх – Низ) * Сравнение = Выше > Ниже;
(Верх – Низ) * Положение = Наверху & Внизу;
(Верх – Низ) * Атрибут = Верхний # Нижний;
Можно играть формой записи отношений, как в арифметике:
(Верх & Высота) – (Низ & Глубина) =
(Верх — Низ) & (Высота — Глубина);
Однако есть неоднозначность в фиксации семантических связей. Вот пример уравнения динамической семантики:
Механизм + Двигатель = Машина;
А с другой стороны мы имеем отношение наследования, конкретизации и устройства, агрегации:
Механизм ^ Машина; Машина % Двигатель.
Каким может быть семантический словарь? Пример:
Абажур (& Плафон, % Светильник, ^ Светорассеиватель).
Из этого примера видно, что отношение наследования содержит пару понятий из динамической семантики.
Традиционные словари антонимов, как правило, не содержат отношения: Вариации, Устройства и Наследования. Поэтому надо обратиться к информационным технологиям.
Рефлексия в ООП – это аналог мышления. Это способность допрашивать объект о его атрибутах, свойствах, поведении и принадлежности. В системообразующей области часто не хватает слов для определений. Их приходится выдумывать и давать новые определения. Это чистая философия.
Здравствуйте, Mna, Вы писали:
Mna>Читали ли вы, уважаемый, работы Георга нашего Вильгельма Фридриха Гегеля? Mna>Конкретно работу "Наука логики" ? Входящую в первой редакции в цикл "Энциклопедия филосовских наук", а вторым вышедшая отдельно.
Mna>Вот где "даны понятия"! Mna>На всякий случай следовало бы ознакомиться чтоб с нуля не филосипедить степени двойки и тройки Mna>(Без обид? ) Mna>Уж там точно привязки к языку не будет
Знаете. Я неделю ждал ваших извинений за этот пост.
Но вы ничего не поняли и гордо удалились.
Хорошо.
Сделайте на ассемблере UnDo !!!
Технически — это возможно, но очень неудобно.
Действительно, зачем изучать Джаву и Си++ если есть Ассемблер!!!
...
Самое печальное, что с вашем мировоззрением кто-то согласился.
Мне знакомы эти загробные стоны — типо —
"я старый и уважаемый человек, не заставляй меня работать мозгами.
Лучше скажи, что всё что ты нашёл — это фигня.
Потому что старое лучше нового, потому что я его лучше знаю.
"
Здравствуйте, Kernighan, Вы писали:
K>Автор косноязычен как... как... Даже не знаю как кто. K>Поэтому его опусы производят такое странное юмористическое впечатление. K>Он додумался до очень интересных мыслей, но излагает так, как будто это стёб, тролинг и идиотизм одновременно.
Вы что-то попутали!
Кого я здесь затроллил?
Министерство образования или РАН?
Если они вам не предоставили таких знаний, которые представлены в моей книге,
то направляйте свои претензии к ним, а не ко мне.
Здравствуйте, LVE, Вы писали:
LVE>Здравствуйте, Mna, Вы писали:
Mna>>Читали ли вы, уважаемый, работы Г. Гегеля? Mna>>Конкретно "Наука логики" ? Mna>> "даны понятия" Mna>>На всякий случай следовало бы ознакомиться чтоб с нуля не филосипедить степени двойки и тройки Mna>>(Без обид? ) Mna>>Уж там точно привязки к языку не будет
LVE>Знаете. (...)
TL;DR: взяв меч будьте "самоураем", проводите основательные background исследования, спрашивайте информацию и совета, воспринимайте советы а не игнорируйте их, не подделывайте результаты проб когда модель не адекватна, модель не самоценна, стоит лучше понимать что хотят от вас и что хотите вы
Long read:
Теперь буду стараться говорить более рублеными фразами (возможно было слишком мягко в прошл раз), авось будет у них лучше пробивающая способность
Во-первых я уже тогда понял достаточно. Что не выйдет удачной коммуникации когда исследователь назвался груздем но не только не полез в кузов но не начал еще толком шевелиться, а громкие заявления уже сделал.
НЕ уверен что вы что-то поймете из того что я скажу. Особенно если будете воспринимать не в конструктивном а в том же истерическом ключе.
Но я попробую тут (серьезно) в последний раз, и может будет полезно не вам в основном.
LVE>Знаете. Я неделю ждал ваших извинений за этот пост. LVE>Но вы ничего не поняли и гордо удалились.
Если вы самурай. а вы должны быть самураем, автономной, самостоятельной боевой единицей раз беретесь за такую решающую вещь как семантика + математика.
Вы должны проявлять если не мужественность, то решимость. Не получится проявлять смелость в анализе в одном и бояться спросить что-то непонятное в другом.
Мучатся, ждать извинений (неизвестно за что, не известив) недели две? это не модус операнди самурая, это так поступить может женщина в режиме истерики. ("я три ночи скакала чтоб сказать вам что вы мне безразличны")
Это было немного совсем неправильным способом оперирования.
Вы много чего предпологаете и домысливаете ("1вы ничего не поняли, 2вы удалились, 3вы удалились гордо N)ваше мировозрение"). на 2) Это сообщение я вообще заметил случайно.
единственный ответ был "спасибо", я этим удовлетворился. понимая, что нельзя требовать большего, хотеть, чтоб было проведен анализ что сделано, проведен нормальный research.
Опишу вкратце предысторию анализа вашего текста, может поможет не домысливать в след раз. а спрашивать. Или иметь определенную решимость сформулировать вопрос.
Я посмотрел то что было описано в том вашем тексте. Надо сказать что я знаком с сильно продвинутой системой организации семантики языка. И они исходит из языка, а не желания найти рифмы в пространстве кодирования понятий. Паттерны конечно есть, но не всегда регулярные. а говорить о степенях не приходится вообще.
Я понял что вы по-видимому не знакомы ни с системой понятий которую ввел Гегель. Может это для вас старо, но его мало кто порнимал всегда. Ни с новейшей новомоднейшей word2vec и особенно sence2vec. Это совсем другая опера. Но та же сфера NLP и CoLi (Natural Language processing и Computational Linguistics) в которую вы пытаетесь проникнуть, одновременно стараясь не знакомится с тем что уже есть.
LVE>Хорошо. LVE>Сделайте на ассемблере UnDo !!! LVE>Технически — это возможно, но очень неудобно. LVE>Действительно, зачем изучать Джаву и Си++ если есть Ассемблер!!! LVE>...
LVE>Самое печальное, что с вашем мировоззрением кто-то согласился. LVE>Мне знакомы эти загробные стоны — типо — LVE>"я старый и уважаемый человек, не заставляй меня работать мозгами. LVE>Лучше скажи, что всё что ты нашёл — это фигня. LVE>Потому что старое лучше нового, потому что я его лучше знаю. LVE>"
LVE> с вашем мировоззрением кто-то согласился.
Что-то не клеится: я мировозрения не высказал, а вы не умеете анализировать тексты. тексты не анализируете успешно, а формализованную модель анализа текстов строить хотите (анализа слов, если точнее).
Нет, я конечно мог бы приводить темы к техническим... что есть круче языки чем С++ и джава, это например Lisp (Common Lisp) (применялся раньше к AI) и особенно Python раз он красив и применяется к ML & NLP. Что, может лучше поиграться с sence2vec моделями. Много чего технически верного но не актульного для вашего восприятия
---
Проблема и в том что я не сказал "Лучше скажи, что всё что ты нашёл — это фигня" а вы так поняли
--Я очевидно сказал — "научитесь и приходите снова", "следующая попытка будет лучше, если она будет следующая по существу".
Проблема и в том, что тут нужно тренировать интуицию. А вы, с другого конца, строите алгебраические конструкции, а что им соответствует в реальности в языке, словах — проверить не пытаетесь.
Так традиционно поступают чистые математики считая факт наличия некой модели достаточной причиной ее сущестования.
По факту еще хуже — подгоняете семантику слов к вашей модели, когда она уже не выдерживает, вы искажаете смысл слов лишь бы вогнать их в прокрустово ложе модели переставшей быть адекватной на предыдущей итерации. -то что я назвал "натянутой рифмой" — на самом деле это рифма складывается только если "придумать новое слово" -- то есть дать известному слову новый смысл. сначала на первых итерациях новый оттенок, потом новый смысл.
Эта проблема вырастает в полный рост попробуй вы применить эти семантики слов — к словам другого языка.
---
Повторюсь напоследок. "Вреднее всего желание предохранить себя от ошибок"
Резюмируя должен добавить: Я вам не враг, а Конструктивная критика направлена на развитие
Здравствуйте, LVE, Вы писали:
LVE>Существует гипотеза о том, что все понятия языка группируются в пары. Эти пары образуют квадраты, затем кубы и так далее. То есть по 2, 4, 8, 16, … по степени числа 2, как в компьютере.
Всё сходится.
Знаете, я тут недавно придумал способ легко проходить все IQ тесты. Знаете, бывает очень сложно продолжить последовательность чисел — сидишь, думаешь, время тратишь... И меня осенило: я понял как надо действовать. Всё гениальное просто! Любую последовательность логически можно продолжить несколькими способами. Вот возьмём, например, вашу последовательность:
2, 4, 8, 16, …
Знающие люди полагают, что следующие число 32. Это банально. Давайте рассуждать логически. Раз ряд не закончен, значит у нас нет всех вариантов. Что это значит? Это значит, что последовательность можно продолжить несколькими способами! В самом деле:
чем ряд
2, 4, 8, 16, 32, 64, 128, 256...
лучше ряда
2, 4, 8, 16, 8, 4, 2, 4, 8, 16...
или ряда
2, 4, 8, 16, 1002, 1004, 1008, 1016, 2002, 2004, 2008, 2016...
?
Видно, что ни один ряд ничем не лучше другого. Вот так же и с вашей гипотезой группирования понятий в пары. Группируя понятия в пары вы оставляете смысл где-то во вне, т.е. теряете семантику.
Здравствуйте, B0FEE664, Вы писали:
BFE> Вот так же и с вашей гипотезой группирования понятий в пары. Группируя понятия в пары вы оставляете смысл где-то во вне, т.е. теряете семантику.
Да. Есть такая проблема.
СТ не дают художественный образ.
Увы.