В Лиспе - атомы, кажется, выглядят так: `atom
В Эрланге - так: any_string_starting_from_lowercase
В Руби - так: :atom
В Окамле - как-то так: type atoms of [`Atom1, `Atom2, `Atom3];
Какой подход для вас наименее раздражающий? Меня тут все раздражает — в лиспе кракозябра, в руби — двоеточие, которое в других языках используется совсем по-другому, так что я долго не мог въехать, что это в руби вообще такое. В Окамле — кракозябра, в Эрланге — то, что идентификаторы должны быть с заглавной буквы. Так что в итоге я не знаю, как лучше сделать. Есть соображения, как лучше?
Здравствуйте, dmz, Вы писали:
dmz>Какой подход для вас наименее раздражающий? Меня тут все раздражает — в лиспе кракозябра, в руби — двоеточие, которое в других языках используется совсем по-другому, так что я долго не мог въехать, что это в руби вообще такое. В Окамле — кракозябра, в Эрланге — то, что идентификаторы должны быть с заглавной буквы. Так что в итоге я не знаю, как лучше сделать. Есть соображения, как лучше?
Может использовать префикс "^"? Вроде даже красиво: "^atom".
C>Может использовать префикс "^"? Вроде даже красиво: "^atom".
Ага, как в универе, "пи-с-ду[ж|ш]кой", "пи-с-домиком". Не знаю, совпадает с ксором, но вроде лексер получится убедить,
что это разные конструкции. Есть еще вариант с баксом и решеткой, правда решетку я под комменты взял, но можно переиграть.
Но что-то ничего не нравится. Можно заставлять явно аннотировать. Можно использовать вики-нотацию — т.е. слово в вики-нотации —
это автоматически атом. Меня все эти варианты раздражают, вот и решил заслушать Vox Dei, так сказать.
dmz>Какой подход для вас наименее раздражающий? Меня тут все раздражает — в лиспе кракозябра, в руби — двоеточие, которое в других языках используется совсем по-другому, так что я долго не мог въехать, что это в руби вообще такое. В Окамле — кракозябра, в Эрланге — то, что идентификаторы должны быть с заглавной буквы. Так что в итоге я не знаю, как лучше сделать. Есть соображения, как лучше?
Если я правильно понимаю — атом во всех этих языках это что-то вроде именованной константы или элемента перечисления?
Если так — из предложенных вариантов менее раздражающий `atom (символ ` воспринимается не как операция)
Хотя я привык к enum'ам
Здравствуйте, dmz, Вы писали:
dmz>Какой подход для вас наименее раздражающий? Меня тут все раздражает — в лиспе кракозябра, в руби — двоеточие, которое в других языках используется совсем по-другому, так что я долго не мог въехать, что это в руби вообще такое. В Окамле — кракозябра, в Эрланге — то, что идентификаторы должны быть с заглавной буквы. Так что в итоге я не знаю, как лучше сделать. Есть соображения, как лучше?
Меня больше всего эрланговский стиль устраивает. Хотя если попробовать обосновать — вряд ли смогу привести достаточно разумные доводы.
dmz>Какой подход для вас наименее раздражающий? Меня тут все раздражает — в лиспе кракозябра, в руби — двоеточие, которое в других языках используется совсем по-другому, так что я долго не мог въехать, что это в руби вообще такое. В Окамле — кракозябра, в Эрланге — то, что идентификаторы должны быть с заглавной буквы. Так что в итоге я не знаю, как лучше сделать. Есть соображения, как лучше?
Эрланг или Руби. Но все зависит не только от синтаксиса атомов, но и от синтаксиса языка в целом
Здравствуйте, dmz, Вы писали:
dmz>Ага, как в универе, "пи-с-ду[ж|ш]кой", "пи-с-домиком". Не знаю, совпадает с ксором, но вроде лексер получится убедить, dmz>что это разные конструкции. Есть еще вариант с баксом и решеткой, правда решетку я под комменты взял, но можно переиграть.
xor можно и словом записывать, не такая уж и частовстречающаяся операция.
В идеале лучше всего было бы атомы по контексту определять, без их синтаксического выделения. Только вот можно ли так сделать...
M>>Эрланг или Руби. Но все зависит не только от синтаксиса атомов, но и от синтаксиса языка в целом
dmz>Ну эрланг для них слишком много требует,
привыкаешь
dmz> а вот возьмем руби. Существенно, что именно двоеточие перед знаком атома? Или неважно?
нужен простой символ, который просто печатать. Именно потому "крышка"(^) не подходит, имхо. Двоеточие лучше.
Если считать, что код в основном набирается на латинице, то tick(`) тоже неплохо, но tick — достаточно мелкий символ. Можно апостроф/одинарную кавычку ('), она более заметна, но возникают проблемы, если в языке используются одинарные кавычки для строк/символов
Есть вариант с @. Возражения те же, что с крышкой, хотя, имхо, @ набирать удобнее.
Если в языке не используются конструкции с точкой, можно использовать точку.
Ни в коем случае не вертикальную черту(|). Ее неудобно набирать и на разных клавиатурах она находится в разных местах.
Как вариант — знак вопроса (в Эрланге им отмечаются define-ы):
Большинство других символов отпадают из-з их "ambiguity" (это скобки, +, -, =, ", %)
Я бы выбрал или двоеточие или вопросительный знак. Но если в языке есть тернарный оператор (? или можно использовать любые символы в названиях переменных (item.exists?), то я бы еще сильно подумал
MC>Вообще, лучше не запаривайтесь отдельно с атомами, а сделайте нормальное цитирование.
1) Васт ис "нормальное цитирование" и чем оно отличается от ненормального. В гугл чур не посылать, не я эту тему поднял
2) Запары с атомами я не вижу, пока мы тут обсуждаем, я их уже сделал. Собственно, они понадобились, поскольку
ничего глобального в языке пока нет, а вот какого-то рода константы нужны.
M>нужен простой символ, который просто печатать. Именно потому "крышка"(^) не подходит, имхо. Двоеточие лучше.
Ну в общем, я не очень понимаю разницу между shitf-tilda, shift-6 или shift-2, но решил, что во избежание лучше взять
кракозябру, которая еще нигде не используется. Таким образом пространство сужается до
@ $ ? `
, и, в общем, неважно что это будет, так как всегда можно поменять одно на другое.
C>В идеале лучше всего было бы атомы по контексту определять, без их синтаксического выделения. Только вот можно ли так сделать...
Можно, но внесет изрядную неочевидность.
if moo == foobar then puts("FOOBAR"); # тут определился атом
...
# а вот тут он втихую перекрылся, так как в одной области видимости
# вполне можно иметь одинаковые идентификаторы, но при этом один будет скрывать
# в порядке обхода AST, что будет иногда приводить к странным ошибкам
def foobar()
{
...
}
А если мы объявим функцию foobar раньше, чем одноименный атом, то стрельнет ошибка типов. В общем,
не стоит оно ни проблем при использовании, ни проблем при реализации.
Здравствуйте, dmz, Вы писали:
dmz>Какой подход для вас наименее раздражающий? Меня тут все раздражает — в лиспе кракозябра, в руби — двоеточие, которое в других языках используется совсем по-другому, так что я долго не мог въехать, что это в руби вообще такое. В Окамле — кракозябра, в Эрланге — то, что идентификаторы должны быть с заглавной буквы. Так что в итоге я не знаю, как лучше сделать. Есть соображения, как лучше?
Я за кракозябру, это уже вполне привычно и узнаваемо для знакомых с функциональщиной.
dmz пишет: > В Лиспе — атомы, кажется, выглядят так: `atom > В Эрланге — так: any_string_starting_from_lowercase > В Руби — так: :atom > В Окамле — как-то так: type atoms of [`Atom1, `Atom2, `Atom3];
Вы всё-таки про атомы, или про символы ?
Атом — это всё, что не список, а элемент списка (или последовательности).
Т.е. символы и константы разных типов.
> Какой подход для вас наименее раздражающий? Меня тут все раздражает — в > лиспе кракозябра,
В лиспе `atom — квотированный символ. И то не так, а так: 'atom.
А просто символ — просто atom.
В прологе, кстати, то же самое, но только в нижнем регистре.
CS>А какая грамматика/синтаксис лежит в основе твоего языка?
Питонолуа:
def parse(s)
{
local i = 0;
local end = strlen(s);
local e = [];
while i < end
{
if strnth(s, i) == ','
then {
local ss = strsub(s, i+1, 2);
if streq(ss, "EE") then e = ss :: e;
elif streq(ss, "DD") then e = ss :: e;
elif streq(ss, "FF") then e = ss :: e;
}
i = i + 1;
}
ret e;
}
def main()
{
local l = [];
l = parse("AAA,BB,CC,DD,EE,FF#");
while !nil(l) #когда нибудь тут будет foreach
{
putsn(head(l));
l = tail(l);
}
debug_dump_mem();
}