it-roy-ru.com

Почему языки программирования, особенно C, используют фигурные скобки, а не квадратные?

Определение "языка C-Style" практически может быть упрощено до "использования фигурных скобок ({}). "Почему мы используем этот конкретный символ (и почему не что-то более разумное, например [], который не требует клавиши Shift, по крайней мере, на клавиатурах США)?

Есть ли какая-то реальная выгода для производительности программиста, которая исходит из этих фигурных скобок, или новые разработчики языка должны искать альтернативы (то есть парни из Python)?

Википедия говорит нам, что C использует указанные скобки, но не почему. Утверждение в статье в Википедии о Список языков программирования на C предполагает, что этот синтаксический элемент несколько особенный:

Вообще говоря, языки семейства C - это те, которые используют C-подобный блочный синтаксис (включая фигурные скобки начать и закончить блок) ...

98
SomeKittens

Двумя основными факторами, влияющими на C, были семейство языков ALGOL (ALGOL 60 и ALGOL 68) и BCPL (от которого C берет свое название).

BCPL был первым языком программирования в фигурных скобках, и фигурные скобки пережили синтаксические изменения и стали обычным средством обозначения операторов исходного кода программы. На практике на ограниченных клавиатурах дня исходные программы часто использовали последовательности $ (и $) вместо символов {и}. Однострочные комментарии "//" BCPL, которые не были рассмотрены в C, появились в C++, а затем в C99.

От http://www.princeton.edu/~achaney/tmve/wiki100k/docs/BCPL.html

BCPL представил и внедрил несколько нововведений, которые стали довольно распространенными элементами в дизайне более поздних языков. Таким образом, это был первый язык программирования в фигурных скобках (один из которых использовал {} в качестве разделителей блоков), и это был первый язык, который использовал // для пометки встроенных комментариев.

От http://progopedia.com/language/bcpl/

В BCPL часто можно увидеть фигурные скобки, но не всегда. Это было ограничение клавиатуры в то время. Персонажи $( а также $) были лексикографически эквивалентны { а также }. орграфы и триграфы были сохранены в C (хотя другой набор для замены фигурных скобок - ??< а также ??>).

Использование фигурных скобок было дополнительно уточнено в B (что предшествовало C).

Из ссылки пользователя на B Кена Томпсона:

/* The following function will print a non-negative number, n, to
  the base b, where 2<=b<=10,  This routine uses the fact that
  in the ASCII character set, the digits 0 to 9 have sequential
  code values.  */

printn(n,b) {
        extern putchar;
        auto a;

        if(a=n/b) /* assignment, not test for equality */
                printn(a, b); /* recursive */
        putchar(n%b + '0');
}

Есть признаки того, что фигурные скобки использовались в качестве сокращения для begin и ​​end в ALGOL.

Я помню, что вы также включили их в 256-символьный код карты, который вы опубликовали в CACM, потому что мне показалось интересным, что вы предложили использовать их вместо ключевых слов ALGOL 'begin' и 'end', что точно как они были позже использованы в языке Си.

От http://www.bobbemer.com/BRACES.HTM


Использование квадратных скобок (в качестве предлагаемой замены в вопросе) восходит еще дальше. Как уже упоминалось, семейство ALGOL влияло на C. В ALGOL 60 и 68 (C был написан в 1972 г. и BCPL в 1966 г.) квадратная скобка использовалась для обозначения индекса в массиве или матрице.

BEGIN
  FILE F(KIND=REMOTE);
  EBCDIC ARRAY E[0:11];
  REPLACE E BY "HELLO WORLD!";
  WRITE(F, *, E);
END.

Поскольку программисты уже были знакомы с квадратными скобками для массивов в ALGOL и BCPL и фигурными скобками для блоков в BCPL, не было особой необходимости или желания изменить это при создании другого языка.


Обновленный вопрос включает в себя дополнение производительности для использования фигурных скобок и упоминает Python. Есть некоторые другие ресурсы, которые делают это исследование, хотя ответ сводится к "Это анекдотично, и то, к чему вы привыкли, это то, с чем вы наиболее продуктивны". Из-за различий в навыках программирования и знакомства с разными языками, их становится трудно объяснить.

См. Также: Переполнение стека Существуют ли статистические исследования, которые показывают, что Python "более продуктивен"?

Значительная часть выигрыша будет зависеть от используемого IDE (или его отсутствия)). В редакторах на основе vi наведите курсор на одно совпадение open/close и нажмите % затем переместит курсор на другой соответствующий символ. Это очень эффективно с языками на основе C в прежние времена - теперь меньше.

Лучшее сравнение будет между {} и ​​begin/end, которые были опциями дня (горизонтальное пространство было драгоценным). Многие языки Wirth были основаны на стилях begin и ​​end (ALGOL (упомянутый выше), Pascal (многие знакомы) и семейство Modula).

Мне трудно найти что-то, что изолирует эту особенность языка - в лучшем случае я могу показать, что языки с фигурными скобками гораздо более популярны, чем языки начального и конечного языков, и это общая конструкция. Как упомянуто в ссылке Боба Бемера выше, фигурная скобка использовалась, чтобы упростить программирование как сокращение.

От Почему Паскаль не мой любимый язык программирования

Программисты C и Ratfor считают "начало" и "конец" громоздкими по сравнению с {и}.

Что обо всем, что можно сказать - его знакомство и предпочтения.

101
user40980

Квадратные скобки [] легче вводить, поскольку IBM 2741 терминал, который был "широко использовался в Multics" ОС, в которой, в свою очередь, был Деннис Ритчи, один из создателей языка Си - как член команды разработчиков .

http://upload.wikimedia.org/wikipedia/commons/thumb/9/9f/APL-keybd2.svg/600px-APL-keybd2.svg.png

Обратите внимание на отсутствие фигурных скобок в макете IBM 2741!

В C квадратные скобки "взяты", поскольку они используются для массивы и указатели . Если бы разработчики языка ожидали, что массивы и указатели будут более важными/используемыми чаще, чем кодовые блоки (что звучит как разумное предположение с их стороны, больше в историческом контексте стиля кодирования ниже), это означало бы, что вьющиеся фигурные скобки будут идти к "менее важному" синтаксису.

Важность массивов довольно очевидна в статье Развитие языка Си Ритчи. Есть даже явно заявленное предположение "распространенности указателей в программах на Си" .

... новый язык сохранил связное и работоспособное (если необычно) объяснение семантики массивов ... Две идеи наиболее характерны для C среди языков своего класса: отношения между массивами и указателями ... Другая характерная особенность C, его обработка массивов ... имеет реальные достоинства. Хотя отношения между указателями и массивами необычны, их можно изучить. Более того, язык показывает значительную мощность для описания важных понятий, например, векторов, длина которых изменяется во время выполнения, с несколькими базовыми правилами и соглашениями ...


Для дальнейшего понимания исторического контекста и стиля кодирования того времени, когда был создан язык C, необходимо принять во внимание, что "Происхождение C тесно связано с разработкой Unix" и, в частности, портирование ОС на PDP-11 "привело к разработке ранней версии C" ( источник цитат ). Согласно Wikipedia , "в 1972 году Unix был переписан на языке программирования C".

Исходный код различных старых версий Unix доступен онлайн, например, на сайте The Unix Tree . Из различных представленных там версий наиболее актуальным представляется Второе издание Unix от 1972-06:

Второе издание Unix было разработано для PDP-11 в Bell Labs Кеном Томпсоном, Деннисом Ричи и другими. Он расширил первое издание большим количеством системных вызовов и большим количеством команд. В этом издании также появилось начало языка Си, который использовался для написания некоторых команд ...

Вы можете просмотреть и изучить исходный код на языке C со страницы Страница второго издания Unix (V2) , чтобы получить представление о типичном стиле кодирования того времени.

Яркий пример, подтверждающий идею о том, что в то время программисту было достаточно легко набирать квадратные скобки, можно найти в V2/c/ncc.c исходный код:

/* C command */

main(argc, argv)
char argv[][]; {
    extern callsys, printf, unlink, link, nodup;
    extern getsuf, setsuf, copy;
    extern tsp;
    extern tmp0, tmp1, tmp2, tmp3;
    char tmp0[], tmp1[], tmp2[], tmp3[];
    char glotch[100][], clist[50][], llist[50][], ts[500];
    char tsp[], av[50][], t[];
    auto nc, nl, cflag, i, j, c;

    tmp0 = tmp1 = tmp2 = tmp3 = "//";
    tsp = ts;
    i = nc = nl = cflag = 0;
    while(++i < argc) {
        if(*argv[i] == '-' & argv[i][1]=='c')
            cflag++;
        else {
            t = copy(argv[i]);
            if((c=getsuf(t))=='c') {
                clist[nc++] = t;
                llist[nl++] = setsuf(copy(t));
            } else {
            if (nodup(llist, t))
                llist[nl++] = t;
            }
        }
    }
    if(nc==0)
        goto nocom;
    tmp0 = copy("/tmp/ctm0a");
    while((c=open(tmp0, 0))>=0) {
        close(c);
        tmp0[9]++;
    }
    while((creat(tmp0, 012))<0)
        tmp0[9]++;
    intr(delfil);
    (tmp1 = copy(tmp0))[8] = '1';
    (tmp2 = copy(tmp0))[8] = '2';
    (tmp3 = copy(tmp0))[8] = '3';
    i = 0;
    while(i<nc) {
        if (nc>1)
            printf("%s:\n", clist[i]);
        av[0] = "c0";
        av[1] = clist[i];
        av[2] = tmp1;
        av[3] = tmp2;
        av[4] = 0;
        if (callsys("/usr/lib/c0", av)) {
            cflag++;
            goto loop;
        }
        av[0] = "c1";
        av[1] = tmp1;
        av[2] = tmp2;
        av[3] = tmp3;
        av[4] = 0;
        if(callsys("/usr/lib/c1", av)) {
            cflag++;
            goto loop;
        }
        av[0] = "as";
        av[1] = "-";
        av[2] = tmp3;
        av[3] = 0;
        callsys("/bin/as", av);
        t = setsuf(clist[i]);
        unlink(t);
        if(link("a.out", t) | unlink("a.out")) {
            printf("move failed: %s\n", t);
            cflag++;
        }
loop:;
        i++;
    }
nocom:
    if (cflag==0 & nl!=0) {
        i = 0;
        av[0] = "ld";
        av[1] = "/usr/lib/crt0.o";
        j = 2;
        while(i<nl)
            av[j++] = llist[i++];
        av[j++] = "-lc";
        av[j++] = "-l";
        av[j++] = 0;
        callsys("/bin/ld", av);
    }
delfil:
    dexit();
}
dexit()
{
    extern tmp0, tmp1, tmp2, tmp3;

    unlink(tmp1);
    unlink(tmp2);
    unlink(tmp3);
    unlink(tmp0);
    exit();
}

getsuf(s)
char s[];
{
    extern exit, printf;
    auto c;
    char t, os[];

    c = 0;
    os = s;
    while(t = *s++)
        if (t=='/')
            c = 0;
        else
            c++;
    s =- 3;
    if (c<=8 & c>2 & *s++=='.' & *s=='c')
        return('c');
    return(0);
}

setsuf(s)
char s[];
{
    char os[];

    os = s;
    while(*s++);
    s[-2] = 'o';
    return(os);
}

callsys(f, v)
char f[], v[][]; {

    extern fork, execv, wait, printf;
    auto t, status;

    if ((t=fork())==0) {
        execv(f, v);
        printf("Can't find %s\n", f);
        exit(1);
    } else
        if (t == -1) {
            printf("Try again\n");
            return(1);
        }
    while(t!=wait(&status));
    if ((t=(status&0377)) != 0) {
        if (t!=9)       /* interrupt */
            printf("Fatal error in %s\n", f);
        dexit();
    }
    return((status>>8) & 0377);
}

copy(s)
char s[]; {
    extern tsp;
    char tsp[], otsp[];

    otsp = tsp;
    while(*tsp++ = *s++);
    return(otsp);
}

nodup(l, s)
char l[][], s[]; {

    char t[], os[], c;

    os = s;
    while(t = *l++) {
        s = os;
        while(c = *s++)
            if (c != *t++) goto ll;
        if (*t++ == '\0') return (0);
ll:;
    }
    return(1);
}

tsp;
tmp0;
tmp1;
tmp2;
tmp3;

Интересно отметить, что прагматическая мотивация выбора символов для обозначения элементов синтаксиса языка, основанного на их использовании в целевых практических приложениях, напоминает закон Ципфа как объяснено в этом потрясающем ответе ...

наблюдаемая связь между частотой и длиной называется закон Ципфа

... с той лишь разницей, что length в приведенном выше выражении заменяется на/обобщенный как скорость набора текста.

24
gnat

C (а впоследствии и C++ и C #) унаследовал свой бодрящий стиль от своего предшественника B , который был написан Кеном Томпсоном (с участием Денниса Ритчи) в 1969 году.

Этот пример взят из ссылки пользователя на B Кена Томпсона (через Википедия ):

/* The following function will print a non-negative number, n, to
   the base b, where 2<=b<=10,  This routine uses the fact that
   in the ASCII character set, the digits 0 to 9 have sequential
   code values.  */

printn(n,b) {
        extern putchar;
        auto a;

        if(a=n/b) /* assignment, not test for equality */
                printn(a, b); /* recursive */
        putchar(n%b + '0');
}

Сам B снова был основан на BCPL , языке, написанном Мартином Ричардсом в 1966 году для операционной системы Multics. Система связывания B использует только круглые скобки, модифицированные дополнительными символами (пример печати факториала Мартином Ричардсом, через Wikipedia ):

GET "LIBHDR"

LET START() = VALOF $(
        FOR I = 1 TO 5 DO
                WRITEF("%N! = %I4*N", I, FACT(I))
        RESULTIS 0
)$

AND FACT(N) = N = 0 -> 1, N * FACT(N - 1)

Фигурные скобки, используемые в B и последующих языках "{...}", - это улучшение, которое Кен Томпсон сделал по сравнению с оригинальным составным стилем скобок в BCPL "$ (...) $".

1
ProphetV