Информация об изменениях

Сообщение Re[3]: Семантическая алгебра от 02.07.2017 11:24

Изменено 03.07.2017 4:44 LVE

Re[3]: Семантическая алгебра
Здравствуйте, alpha21264, Вы писали:
///

http://files.rsdn.org/125383/SA61.doc

5.ТЕНЗОРНАЯ ГРАММАТИКА

На эту часть меня вдохновили беседы с Дмитрием Анисимовым, который является автором универсальной системы перевода «PRAVDA», книги «ПРАВДА о машинном переводе», а также ряде лекций. Независимо от моей работы и ранее, Дмитрий реализовал операцию перемножения слов при помощи таблиц. Более того, он построил семантический тензор 5-го ранга глагольного времени. Считаю, что это серьёзный вклад в Семантическую алгебру, наравне с вкладом Григория Рейнина и Станислава Тактаева.


5.1.ПОЧЕМУ Я ТАК ПИШУ

Дело в том, что я сам являюсь относительно безграмотным человеком. Во-первых, работа на языках программирования даёт о себе знать. Во-вторых, это является сознательным выбором в пользу эпатажного стиля, вместо научного. Такие тексты интереснее читать и люди реагируют, людям это западает в душу. В-третьих, эта работа является исследованием, поэтому очень сложно перейти сразу к научно-популярному языку. Иначе, это было бы нечестно с моей стороны. Кроме того, мне много дало изучение богословия, но наложило определённый отпечаток.


5.2.ЦВЕТНОЙ ТЕКСТ

Научный и богословский стили мне представляются неудобоваримыми. Будучи аспирантом по электромеханике, я разработал систему цветовой раскраски текста научных статей. Таким явлениям, как электричество, магнетизм и механические силы, я поставил в соответствие определённые цвета. Соответствующим образом я подкрашивал текст отчётов. Требовался небольшой навык, который потом помогал ориентироваться в материале статей и понимать суть.


5.3.ПРИЧИНА СПОРОВ

Семантическая многомерность является причиной большинства споров. Пример: тема – ЛЁД:
Направления мысли: белый – прозрачный, скользкий – шероховатый, аморфный – кристалл, трескается – тает, и т.д.
Каждый человек воспринимает тему по разным семантическим измерениям, исходя из своих интересов.
Обычный человек способен воспринимать сразу только семантические вектора и матрицы. Семантические тензоры больших порядков без тренировки просто не воспринимаются. Человек видит набор случайных слов. Увы – это так.


5.4.СТАТИЧЕСКАЯ ГРАММАТИКА

Что такое фраза? Фраза – это траектория в семантическом пространстве. Если разложить каждое слово на семантические признаки, то каждый такой признак будет соответствовать некоторой координате в семантическом пространстве. Это статическое представление фразы.


5.5.ДИНАМИЧЕСКАЯ ГРАММАТИКА

Однако статической траектории недостаточно для раскрытия смысла. Потому, что существуют омонимы. Тогда недостаточно информации для правильного построения траектории. Как быть?
На помощь приходят динамические члены фразы, сказуемые. Их можно сравнить с вектором скорости точки в семантическом пространстве. Таким образом, фраза раскладывается на список пар координата-скорость, что даёт динамическую траекторию. Например:
«Побегу» = «Буду + Делать + Бег».
Возможно, что это и есть самая абстрактная и универсальная грамматическая форма фраз. Это обосновано системой жестов глухонемых людей. В ней присутствуют статические и динамические жесты. Однако, на практике удобнее иметь ещё и национальную грамматическую форму.


5.6.РАЗМЫШЛЕНИЯ О ГРАММАТИЧЕСКОМ ТЕНЗОРЕ

При разборе фраз русского языка, лучше ориентироваться на глобальные семантические группы. То есть, сразу разделить семантическое пространство на подпространства.

С другой стороны, если вспомнить грамматики Холмского, то их матрица образуется перемножением векторов «Статика — Динамика» на «Основное — Дополнительное». Это имеет основание.
Однако Дмитрий Анисимов показал в своей работе «ПРАВДА о машинном переводе» эффективность иной, 6-ти звенной грамматики. Но я не нашёл системного обоснования такого подхода. Это вопрос к тому, — должна ли грамматика фразы состоять из элементов тензора? Существует ли грамматический тензор?

Здесь сырец для разработки грамматического тензора русского языка:

1. Существительное : Статика * Основное,
2. Глагол : Динамика * Основное,
3. Прилагательное : Статика * Дополнительное,
4. Наречие : Динамика * Дополнительное,

5. Местоимение : лицо, признак, предмет,
6. Числительное : количество, порядок, собирательные,

7. Предлог, Информация конкретная,
8. Союз, Информация абстрактная,
9. Частица, Эмоция конкретная,
10. Междометие, Эмоция абстрактная,

11. ( , ) – ( — ),
12. ( : ) – ( ; ),
13. ( ! ) – ( ? ),
14. ( . ) – ( … ),

15. ( () ) – ( «» ),
16. ( абзац ) – ( глава )…

Есть подозрение, что надо конструировать отдельно универсальный и национальные грамматические тензоры.

С другой стороны, топология семантического пространства должна быть схожа с нейронной топологией мозга. Например: есть слова-сенсоры: имена и местоимения, и есть слова-эффекторы: мат и оскорбления. Аналогично существуют слова и фразы для фильтрации, передачи, администрирования и генерации. Таким образом, системообразующие семантические тензоры могут помочь в построении национальных грамматических тензоров.


5.7.МЕРНОСТЬ ГРАММАТИКИ

Основной задачей грамматики я считаю управление вниманием читателя или слушателя. Пожалуйста, не путайте семантическую мерность и грамматическую.
Рассматривая разные стили речи, я выделил следующие примеры:
1. Научная, художественная речь,
2. Пословицы, поговорки,
3. Притчи, частушки,
4. Стихи, Священные тексты.

С каждым уровнем мерность текста растёт. Таким образом, получилось 4 грамматических уровня и измерения текста.
Re[3]: Семантическая алгебра
Здравствуйте, alpha21264, Вы писали:
///

http://files.rsdn.org/125383/SA61.doc

5.ТЕНЗОРНАЯ ГРАММАТИКА

На эту часть меня вдохновили беседы с Дмитрием Анисимовым, который является автором универсальной системы перевода «PRAVDA», книги «ПРАВДА о машинном переводе», а также ряде лекций. Независимо от моей работы и ранее, Дмитрий реализовал операцию перемножения слов при помощи таблиц. Более того, он построил семантический тензор 5-го ранга глагольного времени. Считаю, что это серьёзный вклад в Семантическую алгебру, наравне с вкладом Григория Рейнина и Станислава Тактаева.


5.1.ПОЧЕМУ Я ТАК ПИШУ

Дело в том, что я сам являюсь относительно безграмотным человеком. Во-первых, работа на языках программирования даёт о себе знать. Во-вторых, это является сознательным выбором в пользу эпатажного стиля, вместо научного. Такие тексты интереснее читать и люди реагируют, людям это западает в душу. В-третьих, эта работа является исследованием, поэтому очень сложно перейти сразу к научно-популярному языку. Иначе, это было бы нечестно с моей стороны. Кроме того, мне много дало изучение богословия, но наложило определённый отпечаток.


5.2.ЦВЕТНОЙ ТЕКСТ

Научный и богословский стили мне представляются неудобоваримыми. Будучи аспирантом по электромеханике, я разработал систему цветовой раскраски текста научных статей. Таким явлениям, как электричество, магнетизм и механические силы, я поставил в соответствие определённые цвета. Соответствующим образом я подкрашивал текст отчётов. Требовался небольшой навык, который потом помогал ориентироваться в материале статей и понимать суть.


5.3.ПРИЧИНА СПОРОВ

Семантическая многомерность является причиной большинства споров. Пример: тема – ЛЁД:
Направления мысли: белый – прозрачный, скользкий – шероховатый, аморфный – кристалл, трескается – тает, и т.д.
Каждый человек воспринимает тему по разным семантическим измерениям, исходя из своих интересов.
Обычный человек способен воспринимать сразу только семантические вектора и матрицы. Семантические тензоры больших порядков без тренировки просто не воспринимаются. Человек видит набор случайных слов. Увы – это так.


5.4.СТАТИЧЕСКАЯ ГРАММАТИКА

Что такое фраза? Фраза – это траектория в семантическом пространстве. Если разложить каждое слово на семантические признаки, то каждый такой признак будет соответствовать некоторой координате в семантическом пространстве. Это статическое представление фразы.


5.5.ДИНАМИЧЕСКАЯ ГРАММАТИКА

Однако статической траектории недостаточно для раскрытия смысла. Потому, что существуют омонимы. Тогда недостаточно информации для правильного построения траектории. Как быть?
На помощь приходят динамические члены фразы, сказуемые. Их можно сравнить с вектором скорости точки в семантическом пространстве. Таким образом, фраза раскладывается на список пар координата-скорость, что даёт динамическую траекторию. Например:
«Побегу» = «Буду + Делать + Бег».
Возможно, что это и есть самая абстрактная и универсальная грамматическая форма фраз. Это обосновано системой жестов глухонемых людей. В ней присутствуют статические и динамические жесты. Однако, на практике удобнее иметь ещё и национальную грамматическую форму.


5.6.РАЗМЫШЛЕНИЯ О ГРАММАТИЧЕСКОМ ТЕНЗОРЕ

При разборе фраз русского языка, лучше ориентироваться на глобальные семантические группы. То есть, сразу разделить семантическое пространство на подпространства.

С другой стороны, если вспомнить грамматики Хомского, то их матрица образуется перемножением векторов «Статика — Динамика» на «Основное — Дополнительное». Это имеет основание.
Однако Дмитрий Анисимов показал в своей работе «ПРАВДА о машинном переводе» эффективность иной, 6-ти звенной грамматики. Но я не нашёл системного обоснования такого подхода. Это вопрос к тому, — должна ли грамматика фразы состоять из элементов тензора? Существует ли грамматический тензор?

Здесь сырец для разработки грамматического тензора русского языка:

1. Существительное : Статика * Основное,
2. Глагол : Динамика * Основное,
3. Прилагательное : Статика * Дополнительное,
4. Наречие : Динамика * Дополнительное,

5. Местоимение : лицо, признак, предмет,
6. Числительное : количество, порядок, собирательные,

7. Предлог, Информация конкретная,
8. Союз, Информация абстрактная,
9. Частица, Эмоция конкретная,
10. Междометие, Эмоция абстрактная,

11. ( , ) – ( — ),
12. ( : ) – ( ; ),
13. ( ! ) – ( ? ),
14. ( . ) – ( … ),

15. ( () ) – ( «» ),
16. ( абзац ) – ( глава )…

Есть подозрение, что надо конструировать отдельно универсальный и национальные грамматические тензоры.

С другой стороны, топология семантического пространства должна быть схожа с нейронной топологией мозга. Например: есть слова-сенсоры: имена и местоимения, и есть слова-эффекторы: мат и оскорбления. Аналогично существуют слова и фразы для фильтрации, передачи, администрирования и генерации. Таким образом, системообразующие семантические тензоры могут помочь в построении национальных грамматических тензоров.


5.7.МЕРНОСТЬ ГРАММАТИКИ

Основной задачей грамматики я считаю управление вниманием читателя или слушателя. Пожалуйста, не путайте семантическую мерность и грамматическую.
Рассматривая разные стили речи, я выделил следующие примеры:
1. Научная, художественная речь,
2. Пословицы, поговорки,
3. Притчи, частушки,
4. Стихи, Священные тексты.

С каждым уровнем мерность текста растёт. Таким образом, получилось 4 грамматических уровня и измерения текста.