Идеальный синтаксис (постановка задачи)
От: DarkGray Россия http://blog.metatech.ru/post/ogni-razrabotki.aspx
Дата: 11.02.11 22:29
Оценка: 5 (1) :)
примечание: синтаксис трактуется в узком смысле, как способ записи информации в виде текста (последовательности символов)

Что такое информация?
для лучшего понимания задачи синтаксиса, стоит немного отвлечься и разобраться что такое "информация".

описание дается упрощенное, чтобы его можно было себе наглядно представить (всё тоже самое можно формально ввести с помощью той же теории категории, но это будет менее визуально представимо)

попробуем построить, что такое информация:
начнем с простого: структуры и атомы.
структура — это вид отношений(связей) между атомами.
выделяют (по мере усложнения) следующие структуры: один элемент, множество(список), дерево, граф.
в первом приближении можно считать, что структура отвечает за ребра, а атомы — это вершины (но при этом стоит помнить, что с точки зрения математики вершины и ребра взаимозаменяемы, т.е. в любой момент можно ребра обозвать вершинами, а вершины — ребрами).
атомы (по мере усложнения): все одинаковые, фиксированный набор термов(имен), бесконечный набор термов(имен).
тоже самое применимо и к связам(отношениям): связи могут быть одинаковые или именованные — это дает такие структуры как:
"структура"(множество именованных элементов), именованное дерево, именованный граф.
отношения могут связывать не только отдельные термы, но и также множества или целые графы, и само отношение может быть представимо целым графом, а не только термом.

в итоге, информация, в общем виде — это именованный граф термов c элементами самоподобия, где и вершины и ребра также могут являться графами

Задача, проблемы и критерии лучшести синтаксиса
Основная задача синтаксиса — представить информационный граф в виде текста.

Основная проблема синтаксиса — с помощью линейной структуры текста и фиксированного набора символов(термов) передать графовую структуру информации и бесконечный набор термов

Критерии лучшего синтаксиса:
компактность,
стабильность(контекстно-независимость),
атомарность изменений,
близость к текстам, которыми обмениваются между собой люди.

Гипотеза: т.к. задача, проблемы и критерии хорошести синтаксиса фиксированные, то и задача выделения лучшего синтаксиса имеет одно решение (или конечный небольшой набор решений).


Приемы используемые синтаксисом
Для решения своей задачи синтаксис использует определенный набор приемов.

Разрыв в структуре(информация — граф, а текст — линеен(список)) решается как:
а) граф представляется в виде дерева, а остальные связи вводятся маркировкой элементов дерева и "использованием" маркеров
b) дерево записывается с помощью скобочной записи

Разрыв между конечным числом символов и бесконечностью термов(например, чисел) решается как:
терм кодируется последовательностью символов. конец последовательности помечается спец. символом.

Оба этих приема требуют ввода новых термов (скобки, маркеры, привязка маркера к элементу, "использование" маркера, границы одного терма и т.д.), которых не было в самой информации, что в ряде случаев может приводить к конфликту термов информации с термами синтаксиса.

Большая часть дальнейших улучшений синтаксиса сводятся к борьбе со скобочной записью и борьбе с конфликтом между исходными термами и термами синтаксиса.(это в следующий раз)

продолжение следует...
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.