国家通用文字政策论【1】

文字政策是语言政策的一个部分,在中国,文字政策更是语言政策的重要组成部分。这不仅因为中国有近30种文字在使用,而且也因为中国自古重视文字,重视书面文献,相对轻视口语。被称为“小学”的中国传统语文学,分音韵、文字、训诂三门,其研究对象大致就是汉字“音、形、义”三要素,或者说“小学”就是由文字三要素生发出来的学问。中国现代意义上的语言学的产生,以1898年马建忠之《马氏文通》的出版为标志。现代意义上的语言学的诞生与发展,“小学”的地位有所下降,但其研究内容、研究方法、研究成果逐渐融入现代语言学之中,其中文字学的地位反倒得到加强,文字学研究得到了新发展。

文字之学在中国古今不衰,是因为文字在中国人的语言意识中具有重要地位,也是因为汉字具有无穷的学术魅力。世界上有文字的语言多数都采用拼音制,拼音字母的文字要素相对简单,只有音、形两要素;而汉字有音、形、义三要素,且字量庞大,字形复杂,字义繁盛,汉字的学习、使用和研究都比拼音文字的字母有更为复杂的内容,需要更高的智慧运转,文字生活也自然就更加丰富多彩。语言政策是管理语言生活的。在使用拼音文字的国度里,其语言政策中关于文字生活的内容较少,而中国的语言政策中,文字政策占有重要地位,也需要较多的内容。

本文从三个方面来阐述中国的通用文字政策:第一,规范汉字是国家通用文字;第二,文字的规范化、标准化与信息化;第三,汉语拼音的地位与功能。有些讨论也涉及民族文字政策问题。

一 规范汉字是国家通用文字

中国的通用文字政策,主要体现在2000年10月31日通过的《中华人民共和国国家通用语言文字法》(简称“《国家通用语言文字法》”)中。该法是中国21世纪生效的第一部法律,其第一章总则的第二条规定:“本法所称的国家通用语言文字是普通话和规范汉字”。这是国家用法律形式第一次明确规范汉字的“国家通用文字”地位。

(一)规范汉字

规范汉字是指经过整理、由国家发布、在通用领域使用的现代标准汉字。【2】这一定义包含以下几个方面的意思:

第一,规范汉字是经过整理的。

汉字在其发展历程中不断得到整理,如秦代之“书同文”,“罢其不与秦文合者”,结束了六国长期割据所形成的“文字异形”的纷乱局面;汉代许慎《说文解字》、蔡邕《熹平石经》,唐代张参《五经文字》、唐玄度《九经字样》、颜元孙《干禄字书》,清代的《康熙字典》等,对汉字都具有程度不等的整理功能。近百年来,在语文现代化思潮的激荡下,对现代汉字的整理更为频繁和自觉。例如:

1913年(民国二年)2月25日,“读音统一会”在北京召开。审定了7100多字的国语读音,【3】奠定了现代汉字的字音基础。

1935年8月21日,国民政府教育部公布《第一批简体字表》,收简体字324个。这是20世纪20~30年代简体字运动成果的反映,是百年来政府颁布的第一个汉字简化方案,开启了汉字简化的先河。【4】

1956年1月28日,国务院全体会议第23次会议通过了《汉字简化方案》及《关于公布〈汉字简化方案〉的决议》。1964年5月,中国文字改革委员会(简称“文改会”)编印《简化字总表》,共简化汉字2238个。1986年10月《简化字总表》重新发表。【5】此表代表着当下中国汉字使用的基本规范。

1955年12月22日,文化部和文改会联合发布《第一批异体字整理表》。

1965年1月30日,文化部和文改会发布《印刷通用汉字字形表》,确定了6196个印刷通用汉字的字形。这种字形,印刷出版业称为“新字形”或“人民体”,是今天汉字字形规范的基本依据。

1988年1月26日,国家语委、国家教育委员会联合发布《现代汉语常用字表》。收汉字3500个,其中常用汉字2500个,次常用汉字1000个。

1988年3月25日,国家语委、新闻出版署联合发布《现代汉语通用字表》。收7000个通用汉字。

1997年12月1日,国家语委发布《GB13000.1字符集汉字部件规范》。

1999年10月1日,国家语委发布《GB13000.1字符集汉字字序(笔画序)规范》。

2001年12月19日,教育部、国家语委发布《GB13000.1字符集汉字折笔规范》。

2009年1月12日,教育部、国家语委发布《汉字部首表》、《GB13000.1字符集汉字部首归部规范》。

2009年3月24日,教育部、国家语委发布《现代常用字部件及部件名称规范》。

规范汉字就是在几千年汉字积累与整理的基础上,经过近百年来的整理逐步形成的,体现了对汉字系统的不断优化。当然,时代在发展,社会语言生活也在不断发生变化,对汉字的整理仍然需要适时进行。现在已经研制完成、等待发布的《通用规范汉字表》【6】,就是为适应现代汉字生活而研制的新的汉字规范。《通用规范汉字表》收字8000有余,并有新整理的简繁汉字对照表和正异汉字对照表。

第二,规范汉字是由国家认定的。

语言的产生使人类最终脱离动物界成为万物灵长,文字的产生使人类脱离野蛮进入文明时代。相传仓颉造字时“天雨粟,鬼夜哭”,这固然是历史传说,但也从一个侧面说明了文字产生是人类历史上动天地、泣鬼神的大事业。早期文字掌握在宫廷巫吏手中,之后逐渐有官学民庠。学校的兴起,文字走出巫吏之手,由人神沟通的秘符成为人际交流的工具;文字走出宫廷墙垣,由官府专利成为社会公器。文字使用功能的不断发展,不仅需要对文字进行整理,而且需要对整理结果给以权威认定,因为文字关乎政令统一、文牍正畅和学脉传承。正如许慎在《说文解字·序》中所言:“盖文字者,经艺之本,王政之始,前人所以垂后,后人所以识古。”

历史上很多朝代都对文字的使用较为关注,或是直接发布正字,或是钦定辞书,或是官府提倡。例如:秦代的书同文是政府直接进行的,罢黜六国文字,立小篆为正字。汉代许慎也将《说文解字》献于朝廷。熹平石经得到汉灵帝许可,立于太学讲堂,向天下公布经、文范本,开创了中国用石经来正文正字的先河。《五经文字》、《九经字样》都是奉诏而作,书于太学屋壁。《干禄字书》为赠秘书监之作。清代《康熙字典》是钦定字书。切音字运动时期,卢戆章、劳乃宣都曾将其切音字方案上呈朝廷,“恭候钦定,颁行天下”【7】

1911年,学部中央教育会议议决《统一国语办法案》。自此开始,包括文字在内的语言文字规范,必经政府发布或认定,已成故例。现代社会,教育普及,科学昌明,文字的社会作用与古代相比更为重要,牵涉到全民的语言生活,牵涉到国事运作,因此,全社会必须有统一的文字。国家对规范汉字给以认定,既是使规范汉字具有权威性,也是对现代汉字整理的科学成果的认定。

第三,规范汉字是在通用领域使用的。

文字使用领域非常广泛,文字的功能多种多样,文字生活纷纭多彩,要在所有领域让所有的人都使用规范汉字,既不合理也不可能。如前所述,秦时的规范文字是小篆,但是官府的书隶们为了应付繁重的文牍事务,在非正规场合创造、使用了隶书。唐《干禄字书》把字分为正、通、俗三类,在科举考试、朝堂政务等正规场合使用正字,书信留言、记账备忘之类则可以使用通字或俗字,各得其所,各得其用。

文字使用的历史经验,在《国家通用语言文字法》中得到了很好体现。该法第二章规定了国家机关、教育机构、汉语文出版物、广播电影电视、公共服务行业等,应当使用规范汉字,还具体规定广播电影电视用字、公共场所的设施用字、招牌广告用字、企业事业组织名称、在境内销售的商品的包装说明、信息处理和信息技术产品等,也应使用规范汉字。同时该法也规定了一些特殊场合可以保留或使用繁体字、异体字,如文物古迹,姓氏,书法、篆刻等艺术作品,题词和招牌的手书字,出版、教学、研究中需要使用的等。

《国家通用语言文字法》的立法目的十分清楚:既保证规范汉字在通用领域中通用,保证国家信息畅通,同时也为传统汉字的使用保留了空间,在文字生活中贯彻了主体性与多样性的辩证统一。

第四,汉字规范具有历史性和空间性。

汉字已经有几千年的历史,不同时代有不同时代的正字。秦有秦之正字,汉有汉之正字,唐有唐之正字,当今有当今之正字。规范汉字是现代的标准汉字,是记录现代汉语的标准汉字。很显然,汉字规范是与时俱进的,具有历史性;社会也应当有正字的历史观,不应以古律今,不必以旧范新。

汉字规范不仅具有历史性,而且也具有空间性。由于中华文化的历史魅力,汉字早就传播到东亚邻国和南海周边,在该地区具有广泛影响。中国大陆在使用汉字,中国的其他地区和周边国家也在使用或不同程度地使用汉字,不同的国家和地区也可以有自己的正字标准。比如日本有日本的标准汉字、韩国有韩国的标准汉字。甚至中国的台湾地区、香港和澳门特别行政区,也可以有自己的正字标准。

当然,汉字规范的空间性虽然认可不同地区和国家的汉字正字标准,但是必然大家生活在同一时代,或者是同胞,或者是邻居,在共时的层面上使用着有共同来源的汉字,无论是从信息传递的角度看,还是从文化交流的角度看,都应当相互沟通,缩小差异,特别是不要人为扩大相互之间的差异。

(二)文字平等政策与国家通用文字

规范汉字既是记录现代汉民族共同语的汉字规范,同时也是国家的通用文字。要正确地把握国家通用语言文字的使用,需要了解中国文字的基本状况,了解中国的文字平等政策。

第一,中国是一个多民族多语言多文种的国家。

中国的语言文字状况比较复杂。官方认可的民族有56个,还有一些人群的民族成分没有认定,如西藏的僜人、夏尔巴人,云南的八甲人、老品人、克木人等。语言与民族的关系是纵横交错的,传统的所谓“一个民族一种语言”的说法,是把问题简单化了。

中国究竟有多少语言,还是一个当今难下定论的问题。据孙宏开、胡增益、黄行等先生的《中国的语言》【8】报道,中国现有语言129种。不过其中有些是混合语,有些语言的身份还有待确定。笔者认为,说中国有100多种语言,可能较为稳妥。在这100多种语言中,有文字的语言不足1/4。据研究,目前有文字的少数民族有22个,使用着28种民族文字【9】;加上汉族汉字,可以说中国的23个民族使用着29种文字。

第二,地位平等,功能互补。

中国实行民族平等政策,民族区域自治是中国重要的政治制度。民族平等体现在多个方面,语言文字平等是主要方面之一。中华人民共和国《宪法》《民族区域自治法》《教育法》《义务教育法》《民事诉讼法》《刑事诉讼法》《国家通用语言文字法》等法律中,都有关于保证少数民族语言文字使用的规定。其中《国家通用语言文字法》第八条表述得最为精炼:“各民族都有使用和发展自己语言文字的自由。”

但是,语言文字平等主要是语言地位上的平等,在现实使用中是有差别的,特别是文字的使用更是如此。有许多语言没有文字,这样的语言就不容易进入学校教育,不能够具有自己的出版传媒体系,不能够在国家的政治生活中发挥作用。有文字的语言,由于文字体系的发育状态不同,使用状况也有较大差异。

规范汉字不仅是汉民族最为通用的交际工具,而且在国家交际层面,在跨民族交际层面,在对外国际交际层面,也是最为通用的交际工具,发挥着其他中国文字无法比肩的作用。不过,这并不等于说可以用规范汉字代替其他中国文字。在国家重要的政治生活中,在特殊的交际场合中,也会同时使用少数民族文字。比如,在全国人民代表大会和全国政治协商会议召开期间,会使用蒙古文、藏文、维吾尔文、哈萨克文、朝鲜文、彝文、壮文等七种少数民族文字为会议工作;国家一些重要的法律、文件等,也都会翻译为这七种文字。

在民族自治地方,普遍实行“双语”或“多语”制度,文字上自然也是使用“双文”或“多文”制度。在国家通用文字与少数民族文字共同使用时,一般都是少数民族文字在上,国家通用文字在下,以显示对少数民族文字的尊重,其实也是对少数民族的尊重。

显然,中国各民族的语言文字具有平等的政治地位和语言地位,但是由于各种文字的发育状态和使用状况不同,在现实语言生活中所发挥的功能也不相同。处理好国家通用文字与民族文字的关系,处理好各少数民族文字之间的关系,就可以使文字生活和谐,各种文字在使用功能上相互补益。

二 汉字的规范化、标准化和信息化

语言规划一般都细分为地位规划和本土规划。上节讲的是规范汉字的地位,属于地位规划;本节的内容基本上属于本体规划。汉字的本体规划,概括讲就是实现“三化”:规范化、标准化和信息化。【10】

(一)汉字规范化

中华人民共和国成立之后,语言文字工作主要完成三大任务。1958年1月10日,国务院总理周恩来在中国人民政治协商会议全国委员会作了《当前文字改革的任务》的报告。报告一开始就指出:“当前文字改革的任务,就是:简化汉字,推广普通话,制定和推行《汉语拼音方案》。”【11】

周恩来总理当时所讲的“文字改革”,是广义的,其外延几乎包括了当时的所有语言文字工作。他所讲的“简化汉字”,也不仅仅是简化了一批汉字,而是在进行文字整理工作,目标是实现文字的规范化。正如周恩来总理所说:“由于汉字难写,人民群众不断创造了许多简字。尽管历代的统治者不承认,说它们是‘别字’‘俗字’,简字还是在民间流行,并且受到群众的欢迎。因此,我们应该说,远在文字改革委员会成立之前,人民群众早已在改革汉字,而文字改革委员会的工作,无非是搜集、整理群众的创造,并且经过各方的讨论推广罢了。同时,我们也采用了某些日本简化了的汉字。可见使用简字方面存在的一些分歧并不是汉字简化工作引起的,而‘汉字简化方案’的制定,目的正在于把这个分歧引导到一个统一的规范。只有在汉字简化工作方面采取积极措施,才能逐渐转变这种分歧现象。”【12】

当年以“简化汉字”名义所进行的文字整理工作,其实是清朝末年以来、包括民国时期的语言文字运动的继续,其中也受到东邻日本简化汉字的影响。当然,由于当时的历史条件,文字整理主要考虑的是中国大陆的文字生活,更多地照顾了成人扫盲和儿童识字问题。

(二)汉字标准化

1986年1月,中国召开了第一次“全国语言文字工作会议”,以此为标志,中国的语言文字工作进入了“新时期”。这次会议有许多值得关注的地方,与文字相关的问题有:

1.建议废止《第二次汉字简化方案(草案)》。会后不久,国家语委就向国务院提交了《关于废止〈第二次汉字简化方案(草案)〉和纠正社会用字混乱现象的请示》【13】,国务院1986年6月24日为此发了批转通知:“1977年12月20日发表的《第二次汉字简化方案(草案)》,自本通知下达之日起停止使用。今后,对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对的稳定,以利社会应用。”【14】这表明进行了几十年的“汉字简化”工作到此将告一段落。

2.“汉语拼音化”不再作为当前国家语言文字工作的任务。时任国家语委主任刘导生在代表会议所作的《新时期的语言文字工作》报告中指出:“汉字的前途到底如何,我国能不能实现汉语拼音文字,什么时候实现,怎样实现,那是将来的事情,不属于当前文字改革的任务……”【15】

3.实现文字的标准化。“文字规范化”和“文字标准化”这两个概念十分接近,要严格把二者的外延、内涵都解释清楚,还有点困难,大概可以说,标准化是高级的规范化,规范化的进一步升华就是标准化。前述保持汉字形体的相对稳定、汉字简化告一段落、汉语拼音化不作为当前的工作任务等,都是为实现文字的标准化创造条件。文字标准化就是使现代汉语用字做到“四定”:定量、定形、定音、定序。

1)定量

确定现代汉语的用字数量。汉字数量古今积累,中外交合,各种字形相加字量已在10万左右。其中,有些只存于字书之中,而从没有在现实生活中使用过;有些是古代使用而当今不用的古字;有些是异体字甚至是错讹字;有些字只是用在人名、地名中;有些字的读音、意义都不明确。就共时用字而言,字种数量远远不需要那么多。例如:

十三经,6544字。

孙中山《三民主义》,2134字。

老舍《骆驼祥子》,2413字。

《毛泽东选集》(1—5卷),3136字。

中国国家语言资源监测与研究中心采集2005年的报纸、广播电视、网络等语料,建成了总字次达到7亿的媒体语料库,对这个语料库的统计显示,581个汉字覆盖率为80%,934字覆盖率为90%,2314字覆盖率为99%。【16】

文字是用来记录语言的,文字的数量以能够较好记录语言为限。现行汉字是记录现代汉语的,因此,为实现文字的标准化,首先应当确定现代汉语的当用字量。就语文实践和大量数据来看,现行用字的总字量大约为8000—10 000,其中最常用字600左右,次最常用字1000左右,常用字2500左右。

2)定形

在一定的字量范围内,为每个汉字确定标准字形。定形牵涉到笔画样式、笔画书写顺序(笔顺)、笔画之间的平面关系(平行、连断、相接、交叉……)、偏旁类型、偏旁组合关系等等。字形确定要有一些基本原则,例如:

第一,一字一形。也许就书法和一些特殊的文字活动而言,一字多形有其意义,有其价值,但是就一般的文字生活而言,一字多形是低效的,是文字冗余现象。

第二,“厚今薄古”。汉字在历史演变中,字形发生了很大变化。一些不同的笔形演变成了相同笔形,一些不同的偏旁合流为一,也有一些相同的笔形和结构在不同的字中写法有异,还有一些字形习非成是。这些变化,这些现象,可能造成汉字原本的造字理据的泯失,加剧字际关系的错综复杂性。尽管如此,还是应当承认汉字的这种演变结果,不应扭今复古。“约定俗成”是语言文字发展演变的第一定律,也是语言文字规范的首要依据。

第三,照顾系统。汉字结构具有系统性,在确定每个字的字形时,要考虑汉字的笔画系统、笔顺系统、偏旁系统、笔画组合系统、偏旁组合系统等等。尽量减少孤例,充分考虑汉字结构的系统性,有助于汉字字形系统的优化,也有助于提升汉字学习效率、节约社会记忆成本和汉字信息的加工成本。

汉字定形是循序渐进的工作,对于常用字的字形,要尽量少动或不动。字形整理时,还要考虑到更大字量的情况,考虑到其他使用汉字的国家和地区的情况。

3)定音

规定现代汉语用字的标准读音。由于语音演变、方言影响、外语读音介入、汉字字形分合等原因,便会产生一字多音现象。一字多音现象有的是“多音字”,有的是“异读字”。多音字的每一个字音对应一个或几个字义,每个读音都不是多余的;当然,每个读音是否都是必要的,需要“审音”。异读字是字义相同但读音不同,字之异读一般来说对于学习和使用是冗余的,需要选择一个音作为正音。

汉字定音,基本上是伴随着异读词审音进行的。1956年1月成立普通话审音委员会, 1963年2月编出《普通话异读词三次审音总表初稿》。1982年10月成立新的普通话审音委员会,1985年12月发布《普通话异读词审音表》。

汉字定音工作仍是今天的重要任务。原来审音表的疏漏需要补正,新的字音现象需要审定,轻声儿化字需要有个固定的范围,有许多人名、地名、科技术语名的字音需要斟酌,中国使用的日本“国字”需要给一个汉语读音等等。2011年10月28日,成立了新一届普通话审音委员会,向社会开通了“普通话审音网”,审议通过了《普通话审音委员会章程》,听取了课题组的“普通话审音原则制定和《普通话异读词审音表》修订”的报告。新世纪的审音工作相信能够为汉字定音做更多的事情。

4)定序

确定现代汉语用字的排列顺序。汉字排序过去主要是字典、词典的需要,而到了信息数量“爆炸式”增加、信息检索成为日常事体的时候,字序的确定就显得重要起来,因为字序是信息排序的基本依据。

给汉字排序的方式有多种,不同的排序方式形成不同的字序。字序可概括为音序和形序。由于同音字的大量存在,音序一般来说是不能完全解决字序问题的,需要形序给以一定的帮助。形序往往与偏旁、笔画类、笔画数、笔顺等相关,因此,为了满足定序的需要,在汉字定形工作中还要确定偏旁部首、笔画类型,并要根据一定的规则确定偏旁部首的排序、笔画类型的排序和笔顺等。

(三)汉字信息化

文字标准化的提出,是为了主动适应计算机语言处理和信息检索等要求。1986年召开的全国语言文字工作会议就认识到:“当前,世界正处于信息化迅速发展的时代,利用电子计算机进行信息处理,实现图书情报工作自动化,印刷排版现代化,生产管理自动化,以及办公室事务自动化,已经成为现代化建设中的重要课题。因此,加强语言文字研究,促进语言文字的规范化、标准化,提到了比以往任何时期都重要的地位。”【17】在当时能够认识到信息化与语言文字规范化、标准化的关系,应该说是具有远见卓识的。但是,由于当时计算机语言处理的水平还十分有限,信息化的时代特征还不明显,只是“小荷才露尖尖角”,所以当时文字标准化的“标准”还不足够。随着计算机语言处理的发展,实现文字的信息化,还需要在“四定”的基础上做更多工作。

第一,要给每一个汉字一个计算机码位。过去汉字的要素是“形、音、义”三要素,文字信息化使汉字具有了“形、音、码、义”四要素。要使全世界所有的计算机都能够认识汉字而不至于出现乱码,必须通过国际标准化组织来统一对汉字进行编码。过去的汉字整理工作可以只在大陆进行,而文字信息化要求在不同的国度和地区间协作进行,并且还要得到国际社会的认可。ISO/IEC10646的工作,CJK【18】统一汉字编码字符集的工作,就是中国(大陆、台湾)、日本、韩国共同努力的结果,是汉字标准国际化的具体体现。

第二,汉字整理的字量空前加大。过去汉字整理基本上是在现代通用字的范围内进行的。但是,随着计算机语言处理能力的迅速提高,各种现实信息和历史文献信息都需要数字化。计算机需要处理的字量空前加大,以前不需要特别关注的人名、地名用字,物理化学和中医中药等科技用字,古代文献用字等,现在都进入了文字整理的视野。也就是说汉字整理的范围由通用字发展到特殊用字,由现代汉语用字发展到历史文献用字,甚至由隶楷等“今文字”发展到甲骨文、金文和篆书等“古文字”。

第三,字际关系成为突出问题。字量扩大其实并不仅仅是字量问题,还需要在更大的范围内考虑字形问题、字际关系问题等。字形问题集中在如何处理新旧字形、特别是在规范汉字之外的范围怎样处理新旧字形问题。而更艰巨的任务是字际关系的整理。庞大的字量,是不同时代、不同地区、不同场合用字的集聚,异体字占了很大比例,梳理字与字之间的关系,做好简繁汉字、正异汉字之间的对应,需要学术功力和大量的时间。特别是使用汉字的国家和地区还有不同的正字标准,互联网域名已经可以使用汉字,古代文献的出版印行成为现代文化生活的重要内容,这就需要建立大字量的字际关系映射表、古今汉字统一查检表。在如此背景下,字际关系的研究就显得更为重要。

第四,汉字标准成为工业标准。汉字信息化使汉字标准由文化规范成为工业标准,由为人服务的柔性规范成为为机器服务的刚性标准,由文化消费成为可以赚取经济红利的文化产品。这种转变从政策、管理、研制、推广、社会理念等各方面,从标准制定、发布、实施等各环节,都需要发生相应的转变,以适应文字信息化。

三 汉语拼音的地位与功能

汉字自身的表音功能有限,为学习汉字的需要必须有注音工具。古代为汉字注音,是利用汉字来实现的。早期是用较通俗的汉字为较难的汉字注音;后来在古印度语言学的影响下,音韵学快速发展,发明了“反切”,用两个汉字的声韵相切为汉字注音。

明代,西洋传教士来到南洋和中国,为了传教和学习汉语,设计了不少汉语拼音方案,其中以利玛窦的拉丁字母式拼音对后世影响最大。到了清朝末年,以卢戆章1892出版《中国第一快切音新字》为发端,兴起了朝野关注、影响深远的切音字运动。切音字运动不仅出现了很多汉字注音方案,而且产生了用切音字代替汉字的思潮。这一思潮所引发的汉字存废的争论,持续了百年之久,至今仍未止息。

1911年,清朝学部中央教育会议议决的《统一国语办法案》,是中国近代史上政府通过的第一个语言规划文件,标志着中国语言政策由隐性向显性的转变。《统一国语办法案》吸收了切音字运动的成果,初步确定了北京话在国语中的地位,而且非常重视音标在国语推行中的重要性,提出了音标制定的原则及相关事项:“音标之要则有五:一、音韵须准须备;二、拼音法须合公例;三、字画须简;四、形式须美;五、书写须便。无论造新征旧,必以兼合此要则者,方能使用。又须兼备行楷两种。该音标订定后,先在各省府厅州县酌定期限,试行传授。遇有滞碍,随时举报总会修正。修正确当后,再行颁布,作为定本。”【19】

百年前这一音标制定原则是相当科学的,但是清政府已经无力完成这一任务。1913年召开的读音统一会,通过了汉字笔画式的注音字母,1918年正式公布,使用至今。1928年9月,国民政府大学院(教育部)公布《国语罗马字拼音法式》。1931年9月,中国新文字第一次代表大会在苏联的海参崴召开,通过了《中国拉丁化新文字的原则和规则》,这一常被简称为“北拉”的新文字方案,在当时的中国发生了不小影响。

1958年2月11日,第一届全国人民代表大会第五次会议通过了《关于〈汉语拼音方案〉的决议》。1977年,联合国第三届地名标准化会议,决定采用《汉语拼音方案》作为拼写中国汉语地名的国际标准。1979年,联合国秘书处采用汉语拼音作为转写中国人名、地名的标准。1982年,国际标准化组织决定采用《汉语拼音方案》作为汉语罗马字母拼写法的国际标准,编号为ISO 7098。【20】1986年1月,第一次全国语言文字工作会议明确表示,汉字拉丁化不再是中国语言文字工作的任务,这算是政府对百年汉字命运争论的一个明确态度,也是对汉语拼音性质、作用的一个外延限定:汉语拼音不是文字方案。

谈文字政策,按说应该不谈汉语拼音(以下所说的“汉语拼音”,基本上是指《汉语拼音方案》规定的汉语拼音),但是,由于汉字与汉语拼音的关系密切,由于汉语拼音与汉字的命运曾经息息相关,所以,要全面论述中国的通用文字政策,不能不谈汉语拼音问题,或者说汉语拼音是汉字政策的一个重要补充内容。

(一)汉语拼音的地位

《国家通用语言文字法》第十八条,专门对汉语拼音做了规定:“国家通用语言文字以《汉语拼音方案》作为拼写和注音工具。”“《汉语拼音方案》是中国人名、地名和中文文献罗马字母拼写法的统一规范,并用于汉字不便或不能使用的领域。”

这些条文规定了汉语拼音的地位:第一,是国家通用语言(普通话)的拼写工具;第二,是国家通用文字的注音工具;第三,是国际公认的中国人名、地名和中文文献罗马字母拼写法的规范;第四,在汉字不便或不能使用的领域发挥职能。更为概括地说,汉语拼音的地位就是“工具”与“辅助”:是国家通用语言文字的拼写和注音工具;辅助汉字发挥作用。汉语拼音的“工具”与“辅助”地位,决定了汉语拼音的三大基本功能:

1.为汉字注音

这是继反切、注音字母、《国语罗马字拼音法式》之后,汉字的最为通行、最为有效的注音工具,也是汉语拼音三大功能中基本上没有争议的功能。

《汉语拼音方案》采用的是拉丁字母。拉丁字母在世界具有较大的通行性,因为世界上多数文字采用的都是拉丁字母形体,非拉丁文字也普遍具有拉丁转写方式。而且拉丁字母式的汉语拼音,经过较长时期的试验,从利马窦方案,到切音字的一些方案,到国语罗马字,到中国拉丁化新文字等,都是采用的拉丁字母式,汉语的哪个音用什么字母表示,积累有大量的经验。

拼音方式实行的音素制,能够较为准确地反映字音,便于学习和拼读。汉语拼音也有用双字母表示一个音素的,如:zhchshnger;有个别字母表示多个音素的,如:ie;有些音素在拼写中有省略现象,如:iouiuueiuiuenun。但是,其基本制式还是音素制,具有音素制的优越性。

汉字本身表音成分有限,需要一个注音工具;汉语拼音采取音素制,能够较为准确地注音;汉语拼音采用拉丁字母,形体上国际通行且有长期的试验。有此三者,使汉语拼音成为汉字的优秀注音工具,为汉字的教育和使用立下了汗马功劳。【21】

2.拼写普通话

把有声的语言记录到书面上,是留声录音设备发明之前人类贮存语言的基本方式。用汉字记录普通话,是最为基本的方式;用国际音标记录普通话,一般都是为了研究或教学;用汉语拼音记录普通话,称为“拼写”,是处于文字、音标之间的一种记录汉语的方式。

拼写的作用是多方面的,比如普通话学习、学术交流、文化应用等。拼写在实际语言生活中也有不少表现,比如儿童拼音读物,外国人学汉语的阅读材料,外文学术文献中汉语的材料、论著篇目的引用等。拼写与注音的不同之处,不仅在于拼写的对象是语言,注音的对象是文字,而且拼写需要有正词法,诸如字母大小写、分词连写、标点符号用法、篇章的其他要求等等。就此而言,拼写从样式看与拼音文字已无大别,与拼音文字的差别主要是语言规划学上的地位,或者说是身份。拼写体现的是对汉字的一种辅助。

法律规定“《汉语拼音方案》是中国人名、地名和中文文献罗马字母拼写法的统一规范”,这是对1977年联合国第三届地名标准化会议决定和 ISO 7098的认可,所体现的也是汉语拼音拼写普通话的功能。人名、地名、中文文献在拼写时,都需要依据正词法。在现实生活中,对人名、地名拼写时,很多人使用给汉字注音的方式,不分词连写,不能正确使用大小写,这是汉语拼音正词法教育不普及的表现之一。

3.辅助汉字发挥作用

在某些活动、某些场合中,汉字有时候不便发挥作用,有时候不能发挥作用。例如飞机班次、火车车次,产品型号、外文地图中的中国地名、进出外国海关凭证上的中国人姓名、参加国际活动时的中国人姓名、计算机键盘的汉语拼音编码、汉字语音排序检索等等,都常常需要使用汉语拼音,体现着汉语拼音“辅助”汉字的功能。

汉语拼音的功能还有很多,比如:

(1)中国盲文、聋人使用的手指语、船舶旗语、灯光通信(又称“灯号”)等采用汉语拼音。汉语拼音为特殊教育做出了贡献,为特殊领域的通信做出了贡献。

(2)随着中国的改革开放,到中国旅游、学习、工作的外国人与日俱增,致使中国大中城市的市政名称、街道名称、交通标牌等都注有汉语拼音。汉语拼音的使用广泛度前所未有。

(3)20世纪50年代以后,中国曾经为一些少数民族制定文字方案或文字改革方案,其中许多方案都吸收了汉语拼音的成果。这些方案有的还在使用,有的已经弃用,但要看到,一些弃用的方案又在信息化中重新发挥作用。比如中国的维吾尔族和哈萨克族,在20世纪60年代曾经创制了拉丁化新文字。新文字从字母设计到正词法都受到汉语拼音的重要影响,并从1964年一直使用到1982年。当这两个民族重新恢复阿拉伯维吾尔文、哈萨克文之后,计算机语言处理和网络逐渐兴起,出现了不少维吾尔哈萨克文的拉丁方案,当年的拉丁化新文字稍加改造用于计算机语言处理,据研究是较为优化的方案。【22】

(4)计算机语言处理和现代信息产品的广泛使用,使汉语拼音的作用发挥到前所未有的程度。手机输入、计算机键盘编码、计算机程序设计语言、词汇库贮存、计算机语法信息词典、语料标注、汉字文本与汉语拼音文本自动转换系统等等,都在以汉语拼音为基础。为此,国家语委在2001年专门制定了《〈汉语拼音方案〉的通用键盘表示规范》。汉语拼音几乎成了人机对话和计算机处理汉语汉字的主要工具,同时应视为现代公民的必备素质。

很显然,随着中外交往越来越频繁,随着信息技术的发展及其产品在日常生活中的广泛应用,随着信息检索的量的激增和使用的普及化,需要用汉语拼音辅助汉字发挥作用的场合越来越多,汉语拼音的作用越来越巨大。汉语要在信息世界和国际世界中畅行,必须充分发挥汉语拼音的作用。

(二)汉语拼音正词法

汉语拼音要出色完成拼写国家通用语言文字的任务,要在“汉字不便或不能使用的领域”出色发挥作用,必须建立完善的汉语拼音正词法。汉语拼音正词法是指汉语拼音的拼写规范及书写格式的准则,包括音节的拼写和词的拼写等。历史上的多种汉语拼音方案、汉字拼音化方案,都涉及正词法问题,如卢戆章、蔡锡勇、朱文熊的切音字方案,如国语罗马字和北方话拉丁新文字等。

1958年的《汉语拼音方案》,主要解决的是音节拼写问题,但已经考虑到了词的拼写,为汉语拼音正词法留下了发展空间。比如隔音符号(’)的设置:“ɑoe开头的音节连接在其他音节后面的时候,如果音节的界限发生混淆,用隔音符号(’)隔开,例如:piɑo(皮袄)。”再如音节以 iuü开头时,为了避免同前一音节连写时发生音节界限混淆,要把 iu分别改作 yw,或是在 iuü之前添加 yw【23】

为使《汉语拼音方案》更好地发挥拼写功能,在以往实践中完善汉语拼音正词法,1982年3月,中国文字改革委员会成立了汉语拼音正词法委员会。1988年7月,国家教委和国家语委发布《汉语拼音正词法基本规则》。1996年1月,《汉语拼音正词法基本规则》(GB16159-1996)作为中华人民共和国国家标准由国家技术监督局发布。2012年6月29日,《汉语拼音正词法基本规则》重新修订发布,并同时发布了《中国人名汉语拼音字母拼写规则》。汉语拼音正词法的主要问题基本解决。

汉语拼音正词法研制与使用的主要困难,有以下几个方面:

1.词的辨认存在困难。汉语的词素、词、词组之间的界限有一定的模糊性,尽管大多数词的辨认不成问题,但的确有一部分词具有辨认难度。而且由于汉语书面语是以字为单位书写的,长期的阅读习惯形成了人们的“字意识”优于“词意识”。汉语拼音正词法实行分词连写,由于汉语客观上词与其上下单位的模糊性,由于人们主观上词的意识淡漠,便使分词连写出现一定困难。

2.成语拼式问题。汉语较多地使用成语,成语多为四字格,如果一条成语连续拼写,拼音形式过长。较为常见的处理办法,是在拼式中间加“-”,这样既保持了成语的整体性,又达到减短拼式的目的。但是,把“-”加在成语拼式的什么地方,却有不同意见和不同做法。例如:

(1)凡四字格的成语,皆采取“2+2”的切分方法。此法的优点在于好运用,但不能反映成语内部的结构关系。

(2)依照成语内部的结构关系进行切分。但是,不是每个使用者都具有足以分析成语结构的语法和构词知识,实际执行起来有相当的困难。例如“一衣带水”,可能有三种拼法:

yīyīdài shuǐ

yīyī-dài shuǐ

yīyīdài -shuǐ

2012年6月出版的《现代汉语词典》(第6版)的成语拼写,一般都采取“2+2”的切分方式,但是“一衣带水”则采用了① yīyīdài shuǐ 的方式,宁可让拼式长一点,也不做切分。【24】这样做法的长处是不需要分析成语的结构关系,或者说不做破坏成语结构的切分,但不足之处是整部词典成语的拼法不统一。成语拼式问题其实是一个技术问题,应当权衡利弊,做出一个利于实际应用的处理。

3.声调的标示方法。汉语是有声调的语言,如果正确反映汉语的读音,就需要在每个音节的韵腹处标上调类符号。作为注音工具,也许标调方式的问题并不怎么突出;但是如果作为拼写工具,标调方式的问题就凸现出来了。其一,个个音节标调,形式上不美观(有人批评说是“满脸麻子”),手写起来、键盘输入起来都不方便;其二,轻声要不要标调,如何标调;其三,变调现象如何处理,是标本调还是标变调。历史上曾经有字母重写或用几个字母专门表示调类的做法,而现在计算机学界习惯用“1、2、3、4”表示分别阴平、阳平、上声和去声。

4.专有名词的拼写问题。专有名词在拼写上常有许多特殊性,如人名、地名、科技术语名、组织机构名、品牌型号名、特殊日期名等等。专有名词在语言中出现频率高,负载信息量大,词语构造复杂,其学术研究也比较薄弱,是汉语拼音正词法的主要研究内容,也是正词法的主要规定内容。

此外,外族、外国的专有名词怎样在汉语拼音中表现,也是一个需要解决的问题。对于使用拉丁文字的语言,是否原形照搬?对于使用非拉丁文字的语言,是依照该语言的拉丁方案转写,还是按照其汉字翻译转写?其中,中国少数民族的人名、地名等专有名词的音译转写问题,不仅牵涉到使用上的合理与方便,还牵涉到民族政策和民族感情。日本人名、地名一般用汉字,但是读音与汉语有别,汉语拼音拼写日本的人名地名,是用中国的汉字读音,还是用日文的拉丁化方案?

汉语拼音正词法还有一些其他问题,比如:汉字与汉语拼音的转换只能单向进行,从文字转换为拼音较为容易,但是从拼音转换为文字就会遇到同音词问题,特别是人名、地名的转换更为困难。汉语拼音正词法的研究不多,实践不够,特别是有人对正词法有思想成见,担心正词法的完善会使汉语拼音变成文字方案,从而对汉字的前途造成不利影响。

汉语拼音不仅中国使用,国际上也在使用。要给每个汉语词语一个合适的拼音形式,不要说外国人,就是中国人,甚至是中国的语言学工作者都有一定困难。要真正方便使用者,只有正词法的规定是不够的,应当有一个足够量的汉语拼音词汇表。据悉,国家语委正在已有辞书的词语拼音标注的基础上,研制一个15万~20万词的汉语拼音词汇表。这是一项值得期待的文化工程。

四 结语

根据本文的讨论和中国语言政策,中国的通用文字政策可以这样表述:坚持简化字的规范地位,在一个时期内保持汉字形体的相对稳定。推动汉字的规范化、标准化和信息化。充分发挥规范汉字的主导作用,依法处理好繁体字、异体字的使用问题,依法处理好国家通用文字与少数民族文字的关系。重视汉语拼音的应用。满足经济社会发展和中国走向世界的汉字应用需要。【25】

这一表述包含这么几个方面的意思:

1.维护中国自1935年以来的汉字简化成果,在中国大陆不把繁体字作为国家通用文字。

2.保持汉字形体的相对稳定,不再成批量地简化汉字。

3.推动汉字的规范化、标准化和信息化,是当前文字工作的主要任务。

4.依法处理好国家通用文字与少数民族文字的关系,处理好规范汉字与繁体字、异体字之间的关系,构建和谐的语言生活。这种和谐的语言生活在文字政策上的表现,就是国家通用文字要发挥交际上的主导作用,但也要保护少数民族文字的使用,并对繁体字、异体字的使用留下空间。

5.汉语拼音方案虽然不是文字方案,但它是国家通用语言文字的拼写和注音工具,是汉字的得力助手,在汉字不便使用和不能使用的领域发挥作用。在信息化时代和国际化时代,更要重视发挥汉语拼音的作用。

6.制定文字政策的目的,也是衡量文字政策优劣的标准,就是满足经济社会发展的需要,满足中国走向世界的汉字应用需要。

主要参考文献

曹先擢 2009 《谈谈普通话异读词审音》,语文出版社。

戴庆厦主编 2009 《中国少数民族语言研究60年》,中央民族大学出版社。

费锦昌 1997 《中国语文现代化百年记事(1892-1995)》,语文出版社。

傅永和 2000 《字形的规范》,语文出版社。

高更生 2002 《现行汉字规范问题》,商务印书馆。

国家语言资源监测与研究中心编 2006 《中国语言生活状况报告(2005)》(下编),商务印书馆。

李建国 2000 《汉语规范史略》,语文出版社。

李宇明 2004 《规范汉字和〈规范汉字表〉》,《中国语文》第1期。

李宇明 2010a 《中国语言规划论》,商务印书馆。

李宇明 2010b 《中国语言规划续论》,商务印书馆。

李宇明主编 2011 《中国少数民族语言文字规范化信息化报告》,民族出版社。

李宇明、费锦昌主编 2004 《汉字规范百家谈》,商务印书馆。

厉 兵编 2004 《汉字字形研究》,商务印书馆。

刘导生 1986 《新时期的语言文字工作》,载全国语言文字工作会议秘书处编《新时期语言文字工作——全国语言文字工作会议文件汇编(1986年1月)》,语文出版社,1987年。

吕冀平 2000 《当前我国语言文字的规范化问题》,上海教育出版社。

吕叔湘 1983 《〈汉语拼音方案〉是最佳方案》,《文字改革》第2期。

马丽雅、李红杰 2008 《少数民族语言使用与文化发展政策和法律的国际比较》,中央民族大学。

全国文字改革会议秘书处编 1957 《第一次全国文字改革会议文件汇编》,文字改革出版社。

全国语言文字工作会议秘书处编 1987 《新时期语言文字工作——全国语言文字工作会议文件汇编(1986年1月)》,语文出版社。

盛桂琴 2003 《互联网上维吾尔、哈萨克拉丁字符方案的字母选用问题》,载苏培成主编《信息网络时代的汉语拼音》,语文出版社。

苏培成主编 2003《信息网络时代的汉语拼音》,语文出版社。

苏培成主编 2010 《当代中国的语文改革和语文规范》,商务印书馆。

孙宏开、胡增益、黄行主编 2008 《中国的语言》,商务印书馆。

王 均主编 1995 《当代中国的文字改革》,当代中国出版社。

王理嘉 2003 《汉语拼音运动与汉民族标准语》,语文出版社。

王立军 2008 《汉字的自然发展规律与人为规范》,《语言文字应用》第2期。

王 力、周有光 1983 《进一步发挥〈汉语拼音方案〉的作用》,《文字改革》第2期。

王 宁 2009 《字形调整应适应信息时代的要求》,《中国社会科学报》第3 期。

王 宁 2011 《谈〈规范汉字表〉的制定与应用》,李运富主编《民俗典籍文字研究中心论文选集》(第一集),中华书局。

文字改革出版社编 1958a 《1913年读音统一会资料汇编》,文字改革出版社。

文字改革出版社编 1958b 《清末文字改革文集》,文字改革出版社。

文字改革出版社编 1988 《汉语拼音论文选》,文字改革出版社。

徐世荣 1995 《四十年来的普通话语音规范》,《语文建设》第6期。

于锦恩 2007 《民国注音字母政策史论》,中华书局。

语文出版社编 2006 《语言文字规范手册》,语文出版社。

中国社会科学院语言研究所词典编辑室编 2012 《现代汉语词典》(第6版),商务印书馆。

周恩来 1958 《当前文字改革的任务》,人民出版社。

周有光 1988 《〈汉语拼音方案〉和国际标准》,《语文建设》第1期。

 

 

原载《世界汉语教学》2013年第1期


【1】 本文根据2012年元月11日在日本早稻田大学孔子学院的演讲整理而成。

【2】 曹先擢、傅永和、王宁、张万彬、王铁琨、费锦昌、张书岩、王立军、王翠叶、王敏、陈双新等先生,对“规范汉字”这一概念多有研究。本文规范汉字的定义,是在他们研究基础上的总结,其中受到曹先擢、王宁、张万彬、王铁琨、王翠叶等先生的影响尤大,特此鸣谢。

【3】 参见文字改革出版社编(1958a)。

【4】 1936年2月5日,教育部奉行政院之命,训令“简体字应暂缓推行”。

【5】 与1964年的《简化字总表》相比,只涉及“叠、覆、像、囉、余、瞭、雠”7个字的调整。

【6】 李按:《通用规范汉字表》2013年6月已由国务院正式发布。字表收字8105个,其中一级字表收字3500个,二级字表收字3000个,三级字表收字1605个。

【7】 劳乃宣《进呈〈简字谱录〉折》,见文字改革出版社编(1958b,79页)。

【8】 商务印书馆,2007年。

【9】 参见戴庆厦主编(2009,2页)。

【10】 这“三化”,也适合国家的少数民族文字规划。事实上,中国少数民族文字的规范化、标准化和信息化工作已经有了较快发展。具体情况请参看李宇明主编(2011)。

【11】 周恩来(1958,1页)。

【12】 周恩来(1958,5页)。

【13】 见全国语言文字工作会议秘书处编(1987,331~333页)。

【14】 见全国语言文字工作会议秘书处编(1987,330页)。

【15】 见全国语言文字工作会议秘书处编(1987,24页)。

【16】 见国家语言资源监测与研究中心编(2006,7页)

【17】 全国语言文字工作会议秘书处编(1987,22页)。

【18】 CJK是中文汉字(Chinese Hanzi)、日文汉字(Japanese Kanji)、韩文汉字(Korean Hanja)的缩写,其中C包括G(中国大陆使用的汉字)和T(中国台湾使用的汉字)。感谢张轴材先生提供的意见。

【19】见文字改革出版社编(1958b,43~144页)。

【20】见周有光(1988)、苏培成主编(2003,252~261页)。

【21】 参见吕叔湘(1983);王力、周有光(1983)。

【22】 参见盛桂琴(2003)。

【23】 ü前添加y时,ü上面的两点省略为u,如üyuüeyueüɑ nyuɑn
ünyun

【24】 见中国社会科学院语言研究所词典编辑室编(2012,1529页)。

【25】 这一表述,受到陈章太先生的著作和交谈等多方面影响,特此感谢。