примечание: синтаксис трактуется в узком смысле, как способ записи информации в виде текста (последовательности символов)
Что такое информация?
для лучшего понимания задачи синтаксиса, стоит немного отвлечься и разобраться что такое "информация".
описание дается упрощенное, чтобы его можно было себе наглядно представить (всё тоже самое можно формально ввести с помощью той же теории категории, но это будет менее визуально представимо)
попробуем построить, что такое информация:
начнем с простого: структуры и атомы.
структура — это вид отношений(связей) между атомами.
выделяют (по мере усложнения) следующие структуры: один элемент, множество(список), дерево, граф.
в первом приближении можно считать, что структура отвечает за ребра, а атомы — это вершины (но при этом стоит помнить, что с точки зрения математики вершины и ребра взаимозаменяемы, т.е. в любой момент можно ребра обозвать вершинами, а вершины — ребрами).
атомы (по мере усложнения): все одинаковые, фиксированный набор термов(имен), бесконечный набор термов(имен).
тоже самое применимо и к связам(отношениям): связи могут быть одинаковые или именованные — это дает такие структуры как:
"структура"(множество именованных элементов), именованное дерево, именованный граф.
отношения могут связывать не только отдельные термы, но и также множества или целые графы, и само отношение может быть представимо целым графом, а не только термом.
в итоге, информация, в общем виде — это именованный граф термов c элементами самоподобия, где и вершины и ребра также могут являться графами
Задача, проблемы и критерии лучшести синтаксиса
Основная задача синтаксиса — представить информационный граф в виде текста.
Основная проблема синтаксиса — с помощью линейной структуры текста и фиксированного набора символов(термов) передать графовую структуру информации и бесконечный набор термов
Критерии лучшего синтаксиса:
компактность,
стабильность(контекстно-независимость),
атомарность изменений,
близость к текстам, которыми обмениваются между собой люди.
Гипотеза: т.к. задача, проблемы и критерии хорошести синтаксиса фиксированные, то и задача выделения лучшего синтаксиса имеет одно решение (или конечный небольшой набор решений).
Приемы используемые синтаксисом
Для решения своей задачи синтаксис использует определенный набор приемов.
Разрыв в структуре(информация — граф, а текст — линеен(список)) решается как:
а) граф представляется в виде дерева, а остальные связи вводятся маркировкой элементов дерева и "использованием" маркеров
b) дерево записывается с помощью скобочной записи
Разрыв между конечным числом символов и бесконечностью термов(например, чисел) решается как:
терм кодируется последовательностью символов. конец последовательности помечается спец. символом.
Оба этих приема требуют ввода новых термов (скобки, маркеры, привязка маркера к элементу, "использование" маркера, границы одного терма и т.д.), которых не было в самой информации, что в ряде случаев может приводить к конфликту термов информации с термами синтаксиса.
Большая часть дальнейших улучшений синтаксиса сводятся к борьбе со скобочной записью и борьбе с конфликтом между исходными термами и термами синтаксиса.(это в следующий раз)