第3版 代序

什么叫“会编程”

—《程序原本》节选—

程序设计语言—这种工具有什么性质呢?又或者,究竟是什么决定了一门语言称为Java,而另一门叫作C#呢?它们之间存有何种不同,又存有哪些渊源呢?

有趣的是,通过分析现有的种种程序设计语言,(正因为这些语言是我们人类自己创造的,所以)我们发现如同人类的自然语言一样,程序设计语言也总是有着三种基本性质:语法、语义与语用。莫里斯(C.W.Morris)在他于1938年出版的《符号理论基础》一书中,最早将语法学(syntaotics或syntax)、语义学(semantics)、语用学(pragmatics)明确地作为符号学的三个分支,从而构成了现代语言学研究的三个主要方面。正是这三种性质,使得一种语言区别于其他语言,而又能从其他语言那里有所借鉴,以及实现彼此沟通。

那么我们先来谈谈什么是语法。语法,是指我们表达内容的形式。这一形式首先与不同的表达手段有关,例如同一个意思,口头表达和书面表达是不同的。其次,即使表达手段相同,也会因为介质的材料性质存有差异而导致形式不同,例如钟鼎文和白话文都用于书写,但显然钟鼎文不能像白话文那样冗长。类似地,在我们的程序设计语言中,早期的程序输入就是电子开关的开合,因此代码会是一些操作命令,而现在我们可以将之输入为接近自然语言的程序文本;早期的运行环境要求代码必须尽量精简,而现在我们则考虑通过规整而冗长的代码来降低工程整体的复杂性。

所以,语法是对语言的表达手段,以及对该表达手段的条件限制加以综合考虑而设定的一种形式化的规则。而所谓语义,则是指我们表达内容的逻辑含义。语义有以下基本性质:

■ 一、必须是一个含义。概念或实体。即,在表达者的意识中需要表达的对象。

■ 二、该含义必须能够以某种基本的逻辑形式予以阐述。

语义还有一项非必需的性质,即:

■ 三、上述逻辑所表达的含义可以为语言的接受者所知。

略为讨论一下第二项性质。为何语义必须要能阐述为一种基本逻辑呢?因为语义定义为内容的含义,而这种含义可以由多种形式来表现,因此,如果它不能用一种基本逻辑来表达,也就没有办法在多种表现形式之间对它互做验证。例如,不能用书写的方式来确定口头转述的正确性,反之也不能通过口传心授来传播书本知识。自然语言中的这种性质(部分地)可以由基本逻辑的矛盾律来约束,即“一个概念不能既是该概念,而又非该概念”。正是因为我们的文字记录与对话交流等内容中存在着这样的一些基本逻辑,所以它才可能科学、严谨及正确。

第三项性质对自然语言来说是非必需的—如果一个人自言自语,那么他的言语可能仍然是有语义的,只是这个语义不为他人所知。但这一点对于程序设计语言来说却是必需的,因为我们设计这样一门语言的目的,正是要让我们所表达的含义为计算机所知。

正是这第三项性质,加入了对“接受者的理解能力”的限制。出于语义的前两项基本性质,这种理解能力也必然由两个方面构成,一是指含义,二是指逻辑。于是我们看到了我们曾经讨论过的全部内容:计算系统的要素,包括数、数据和逻辑,以及在此基础上进行正确计算的方法的抽象,即计算范式。只有通过这些组织起来的语义,才可能被(我们此前所述的)计算系统理解。

这些语义与其表现形式(即语法)是无关的,有其基本逻辑存在。我们所谓的“会编程”,正是指对这种语义的理解,而非对某种语法的熟悉。正因如此,我们才可以在Java上实现某个程序,又在C#上同样实现它,在(使用这些语言的)类似的仿制过程中,不变的是语义。这也意味着,语义上的表达能力决定了一门语言是否真正有别于其他语言。语义能力上等价的语言,除了开发人员的喜好或运行平台的限制之外,所谓有益的价值仅是开发库的丰富与社区的活跃等。而所有这些,都是与语言的本质无关的。

因此再进一步观察,编程这样的行为也就无非是将我们的意图表达为计算系统的理解能力范围内的语义罢了。归纳起来看,这种语义:

■ 由计算系统与程序员共同确知的数据与逻辑构成;且,

■ 最终可以由某种计算方法在指定计算系统上实施以得到计算结果。

这里的计算方法并不是指“算法”,而是指对某种计算实施过程的抽象,例如“命令式”和“函数式”这两种计算范式。所以,会编程与掌握某种语言的语法形式是无关的。

编程实质上是一种在语义描述上的能力修养。具备这种能力之后,语法也就只存在一些规则、限制和对不同计算系统的理解能力上的差别了。所以,“计算机程序设计”这门功课应该教你编程,而不是教你使用一门具体的语言—我们现在大多把它当成语言课,实在是本末倒置了。

周爱民

2012年6月于《程序原本》