国家通用文字政策论【1】
文字政策是语言政策的一个部分,在中国,文字政策更是语言政策的重要组成部分。这不仅因为中国有近30种文字在使用,而且也因为中国自古重视文字,重视书面文献,相对轻视口语。被称为“小学”的中国传统语文学,分音韵、文字、训诂三门,其研究对象大致就是汉字“音、形、义”三要素,或者说“小学”就是由文字三要素生发出来的学问。中国现代意义上的语言学的产生,以1898年马建忠之《马氏文通》的出版为标志。现代意义上的语言学的诞生与发展,“小学”的地位有所下降,但其研究内容、研究方法、研究成果逐渐融入现代语言学之中,其中文字学的地位反倒得到加强,文字学研究得到了新发展。
文字之学在中国古今不衰,是因为文字在中国人的语言意识中具有重要地位,也是因为汉字具有无穷的学术魅力。世界上有文字的语言多数都采用拼音制,拼音字母的文字要素相对简单,只有音、形两要素;而汉字有音、形、义三要素,且字量庞大,字形复杂,字义繁盛,汉字的学习、使用和研究都比拼音文字的字母有更为复杂的内容,需要更高的智慧运转,文字生活也自然就更加丰富多彩。语言政策是管理语言生活的。在使用拼音文字的国度里,其语言政策中关于文字生活的内容较少,而中国的语言政策中,文字政策占有重要地位,也需要较多的内容。
本文从三个方面来阐述中国的通用文字政策:第一,规范汉字是国家通用文字;第二,文字的规范化、标准化与信息化;第三,汉语拼音的地位与功能。有些讨论也涉及民族文字政策问题。
一 规范汉字是国家通用文字
中国的通用文字政策,主要体现在2000年10月31日通过的《中华人民共和国国家通用语言文字法》(简称“《国家通用语言文字法》”)中。该法是中国21世纪生效的第一部法律,其第一章总则的第二条规定:“本法所称的国家通用语言文字是普通话和规范汉字”。这是国家用法律形式第一次明确规范汉字的“国家通用文字”地位。
(一)规范汉字
规范汉字是指经过整理、由国家发布、在通用领域使用的现代标准汉字。【2】这一定义包含以下几个方面的意思:
第一,规范汉字是经过整理的。
汉字在其发展历程中不断得到整理,如秦代之“书同文”,“罢其不与秦文合者”,结束了六国长期割据所形成的“文字异形”的纷乱局面;汉代许慎《说文解字》、蔡邕《熹平石经》,唐代张参《五经文字》、唐玄度《九经字样》、颜元孙《干禄字书》,清代的《康熙字典》等,对汉字都具有程度不等的整理功能。近百年来,在语文现代化思潮的激荡下,对现代汉字的整理更为频繁和自觉。例如:
1913年(民国二年)2月25日,“读音统一会”在北京召开。审定了7100多字的国语读音,【3】奠定了现代汉字的字音基础。
1935年8月21日,国民政府教育部公布《第一批简体字表》,收简体字324个。这是20世纪20~30年代简体字运动成果的反映,是百年来政府颁布的第一个汉字简化方案,开启了汉字简化的先河。【4】
1956年1月28日,国务院全体会议第23次会议通过了《汉字简化方案》及《关于公布〈汉字简化方案〉的决议》。1964年5月,中国文字改革委员会(简称“文改会”)编印《简化字总表》,共简化汉字2238个。1986年10月《简化字总表》重新发表。【5】此表代表着当下中国汉字使用的基本规范。
1955年12月22日,文化部和文改会联合发布《第一批异体字整理表》。
1965年1月30日,文化部和文改会发布《印刷通用汉字字形表》,确定了6196个印刷通用汉字的字形。这种字形,印刷出版业称为“新字形”或“人民体”,是今天汉字字形规范的基本依据。
1988年1月26日,国家语委、国家教育委员会联合发布《现代汉语常用字表》。收汉字3500个,其中常用汉字2500个,次常用汉字1000个。
1988年3月25日,国家语委、新闻出版署联合发布《现代汉语通用字表》。收7000个通用汉字。
1997年12月1日,国家语委发布《GB13000.1字符集汉字部件规范》。
1999年10月1日,国家语委发布《GB13000.1字符集汉字字序(笔画序)规范》。
2001年12月19日,教育部、国家语委发布《GB13000.1字符集汉字折笔规范》。
2009年1月12日,教育部、国家语委发布《汉字部首表》、《GB13000.1字符集汉字部首归部规范》。
2009年3月24日,教育部、国家语委发布《现代常用字部件及部件名称规范》。
规范汉字就是在几千年汉字积累与整理的基础上,经过近百年来的整理逐步形成的,体现了对汉字系统的不断优化。当然,时代在发展,社会语言生活也在不断发生变化,对汉字的整理仍然需要适时进行。现在已经研制完成、等待发布的《通用规范汉字表》【6】,就是为适应现代汉字生活而研制的新的汉字规范。《通用规范汉字表》收字8000有余,并有新整理的简繁汉字对照表和正异汉字对照表。
第二,规范汉字是由国家认定的。
语言的产生使人类最终脱离动物界成为万物灵长,文字的产生使人类脱离野蛮进入文明时代。相传仓颉造字时“天雨粟,鬼夜哭”,这固然是历史传说,但也从一个侧面说明了文字产生是人类历史上动天地、泣鬼神的大事业。早期文字掌握在宫廷巫吏手中,之后逐渐有官学民庠。学校的兴起,文字走出巫吏之手,由人神沟通的秘符成为人际交流的工具;文字走出宫廷墙垣,由官府专利成为社会公器。文字使用功能的不断发展,不仅需要对文字进行整理,而且需要对整理结果给以权威认定,因为文字关乎政令统一、文牍正畅和学脉传承。正如许慎在《说文解字·序》中所言:“盖文字者,经艺之本,王政之始,前人所以垂后,后人所以识古。”
历史上很多朝代都对文字的使用较为关注,或是直接发布正字,或是钦定辞书,或是官府提倡。例如:秦代的书同文是政府直接进行的,罢黜六国文字,立小篆为正字。汉代许慎也将《说文解字》献于朝廷。熹平石经得到汉灵帝许可,立于太学讲堂,向天下公布经、文范本,开创了中国用石经来正文正字的先河。《五经文字》、《九经字样》都是奉诏而作,书于太学屋壁。《干禄字书》为赠秘书监之作。清代《康熙字典》是钦定字书。切音字运动时期,卢戆章、劳乃宣都曾将其切音字方案上呈朝廷,“恭候钦定,颁行天下”【7】。
1911年,学部中央教育会议议决《统一国语办法案》。自此开始,包括文字在内的语言文字规范,必经政府发布或认定,已成故例。现代社会,教育普及,科学昌明,文字的社会作用与古代相比更为重要,牵涉到全民的语言生活,牵涉到国事运作,因此,全社会必须有统一的文字。国家对规范汉字给以认定,既是使规范汉字具有权威性,也是对现代汉字整理的科学成果的认定。
第三,规范汉字是在通用领域使用的。
文字使用领域非常广泛,文字的功能多种多样,文字生活纷纭多彩,要在所有领域让所有的人都使用规范汉字,既不合理也不可能。如前所述,秦时的规范文字是小篆,但是官府的书隶们为了应付繁重的文牍事务,在非正规场合创造、使用了隶书。唐《干禄字书》把字分为正、通、俗三类,在科举考试、朝堂政务等正规场合使用正字,书信留言、记账备忘之类则可以使用通字或俗字,各得其所,各得其用。
文字使用的历史经验,在《国家通用语言文字法》中得到了很好体现。该法第二章规定了国家机关、教育机构、汉语文出版物、广播电影电视、公共服务行业等,应当使用规范汉字,还具体规定广播电影电视用字、公共场所的设施用字、招牌广告用字、企业事业组织名称、在境内销售的商品的包装说明、信息处理和信息技术产品等,也应使用规范汉字。同时该法也规定了一些特殊场合可以保留或使用繁体字、异体字,如文物古迹,姓氏,书法、篆刻等艺术作品,题词和招牌的手书字,出版、教学、研究中需要使用的等。
《国家通用语言文字法》的立法目的十分清楚:既保证规范汉字在通用领域中通用,保证国家信息畅通,同时也为传统汉字的使用保留了空间,在文字生活中贯彻了主体性与多样性的辩证统一。
第四,汉字规范具有历史性和空间性。
汉字已经有几千年的历史,不同时代有不同时代的正字。秦有秦之正字,汉有汉之正字,唐有唐之正字,当今有当今之正字。规范汉字是现代的标准汉字,是记录现代汉语的标准汉字。很显然,汉字规范是与时俱进的,具有历史性;社会也应当有正字的历史观,不应以古律今,不必以旧范新。
汉字规范不仅具有历史性,而且也具有空间性。由于中华文化的历史魅力,汉字早就传播到东亚邻国和南海周边,在该地区具有广泛影响。中国大陆在使用汉字,中国的其他地区和周边国家也在使用或不同程度地使用汉字,不同的国家和地区也可以有自己的正字标准。比如日本有日本的标准汉字、韩国有韩国的标准汉字。甚至中国的台湾地区、香港和澳门特别行政区,也可以有自己的正字标准。
当然,汉字规范的空间性虽然认可不同地区和国家的汉字正字标准,但是必然大家生活在同一时代,或者是同胞,或者是邻居,在共时的层面上使用着有共同来源的汉字,无论是从信息传递的角度看,还是从文化交流的角度看,都应当相互沟通,缩小差异,特别是不要人为扩大相互之间的差异。
(二)文字平等政策与国家通用文字
规范汉字既是记录现代汉民族共同语的汉字规范,同时也是国家的通用文字。要正确地把握国家通用语言文字的使用,需要了解中国文字的基本状况,了解中国的文字平等政策。
第一,中国是一个多民族多语言多文种的国家。
中国的语言文字状况比较复杂。官方认可的民族有56个,还有一些人群的民族成分没有认定,如西藏的僜人、夏尔巴人,云南的八甲人、老品人、克木人等。语言与民族的关系是纵横交错的,传统的所谓“一个民族一种语言”的说法,是把问题简单化了。
中国究竟有多少语言,还是一个当今难下定论的问题。据孙宏开、胡增益、黄行等先生的《中国的语言》【8】报道,中国现有语言129种。不过其中有些是混合语,有些语言的身份还有待确定。笔者认为,说中国有100多种语言,可能较为稳妥。在这100多种语言中,有文字的语言不足1/4。据研究,目前有文字的少数民族有22个,使用着28种民族文字【9】;加上汉族汉字,可以说中国的23个民族使用着29种文字。
第二,地位平等,功能互补。
中国实行民族平等政策,民族区域自治是中国重要的政治制度。民族平等体现在多个方面,语言文字平等是主要方面之一。中华人民共和国《宪法》《民族区域自治法》《教育法》《义务教育法》《民事诉讼法》《刑事诉讼法》《国家通用语言文字法》等法律中,都有关于保证少数民族语言文字使用的规定。其中《国家通用语言文字法》第八条表述得最为精炼:“各民族都有使用和发展自己语言文字的自由。”
但是,语言文字平等主要是语言地位上的平等,在现实使用中是有差别的,特别是文字的使用更是如此。有许多语言没有文字,这样的语言就不容易进入学校教育,不能够具有自己的出版传媒体系,不能够在国家的政治生活中发挥作用。有文字的语言,由于文字体系的发育状态不同,使用状况也有较大差异。
规范汉字不仅是汉民族最为通用的交际工具,而且在国家交际层面,在跨民族交际层面,在对外国际交际层面,也是最为通用的交际工具,发挥着其他中国文字无法比肩的作用。不过,这并不等于说可以用规范汉字代替其他中国文字。在国家重要的政治生活中,在特殊的交际场合中,也会同时使用少数民族文字。比如,在全国人民代表大会和全国政治协商会议召开期间,会使用蒙古文、藏文、维吾尔文、哈萨克文、朝鲜文、彝文、壮文等七种少数民族文字为会议工作;国家一些重要的法律、文件等,也都会翻译为这七种文字。
在民族自治地方,普遍实行“双语”或“多语”制度,文字上自然也是使用“双文”或“多文”制度。在国家通用文字与少数民族文字共同使用时,一般都是少数民族文字在上,国家通用文字在下,以显示对少数民族文字的尊重,其实也是对少数民族的尊重。
显然,中国各民族的语言文字具有平等的政治地位和语言地位,但是由于各种文字的发育状态和使用状况不同,在现实语言生活中所发挥的功能也不相同。处理好国家通用文字与民族文字的关系,处理好各少数民族文字之间的关系,就可以使文字生活和谐,各种文字在使用功能上相互补益。
二 汉字的规范化、标准化和信息化
语言规划一般都细分为地位规划和本土规划。上节讲的是规范汉字的地位,属于地位规划;本节的内容基本上属于本体规划。汉字的本体规划,概括讲就是实现“三化”:规范化、标准化和信息化。【10】
(一)汉字规范化
中华人民共和国成立之后,语言文字工作主要完成三大任务。1958年1月10日,国务院总理周恩来在中国人民政治协商会议全国委员会作了《当前文字改革的任务》的报告。报告一开始就指出:“当前文字改革的任务,就是:简化汉字,推广普通话,制定和推行《汉语拼音方案》。”【11】
周恩来总理当时所讲的“文字改革”,是广义的,其外延几乎包括了当时的所有语言文字工作。他所讲的“简化汉字”,也不仅仅是简化了一批汉字,而是在进行文字整理工作,目标是实现文字的规范化。正如周恩来总理所说:“由于汉字难写,人民群众不断创造了许多简字。尽管历代的统治者不承认,说它们是‘别字’‘俗字’,简字还是在民间流行,并且受到群众的欢迎。因此,我们应该说,远在文字改革委员会成立之前,人民群众早已在改革汉字,而文字改革委员会的工作,无非是搜集、整理群众的创造,并且经过各方的讨论推广罢了。同时,我们也采用了某些日本简化了的汉字。可见使用简字方面存在的一些分歧并不是汉字简化工作引起的,而‘汉字简化方案’的制定,目的正在于把这个分歧引导到一个统一的规范。只有在汉字简化工作方面采取积极措施,才能逐渐转变这种分歧现象。”【12】
当年以“简化汉字”名义所进行的文字整理工作,其实是清朝末年以来、包括民国时期的语言文字运动的继续,其中也受到东邻日本简化汉字的影响。当然,由于当时的历史条件,文字整理主要考虑的是中国大陆的文字生活,更多地照顾了成人扫盲和儿童识字问题。
(二)汉字标准化
1986年1月,中国召开了第一次“全国语言文字工作会议”,以此为标志,中国的语言文字工作进入了“新时期”。这次会议有许多值得关注的地方,与文字相关的问题有:
1.建议废止《第二次汉字简化方案(草案)》。会后不久,国家语委就向国务院提交了《关于废止〈第二次汉字简化方案(草案)〉和纠正社会用字混乱现象的请示》【13】,国务院1986年6月24日为此发了批转通知:“1977年12月20日发表的《第二次汉字简化方案(草案)》,自本通知下达之日起停止使用。今后,对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对的稳定,以利社会应用。”【14】这表明进行了几十年的“汉字简化”工作到此将告一段落。
2.“汉语拼音化”不再作为当前国家语言文字工作的任务。时任国家语委主任刘导生在代表会议所作的《新时期的语言文字工作》报告中指出:“汉字的前途到底如何,我国能不能实现汉语拼音文字,什么时候实现,怎样实现,那是将来的事情,不属于当前文字改革的任务……”【15】
3.实现文字的标准化。“文字规范化”和“文字标准化”这两个概念十分接近,要严格把二者的外延、内涵都解释清楚,还有点困难,大概可以说,标准化是高级的规范化,规范化的进一步升华就是标准化。前述保持汉字形体的相对稳定、汉字简化告一段落、汉语拼音化不作为当前的工作任务等,都是为实现文字的标准化创造条件。文字标准化就是使现代汉语用字做到“四定”:定量、定形、定音、定序。
1)定量
确定现代汉语的用字数量。汉字数量古今积累,中外交合,各种字形相加字量已在10万左右。其中,有些只存于字书之中,而从没有在现实生活中使用过;有些是古代使用而当今不用的古字;有些是异体字甚至是错讹字;有些字只是用在人名、地名中;有些字的读音、意义都不明确。就共时用字而言,字种数量远远不需要那么多。例如:
十三经,6544字。
孙中山《三民主义》,2134字。
老舍《骆驼祥子》,2413字。
《毛泽东选集》(1—5卷),3136字。
中国国家语言资源监测与研究中心采集2005年的报纸、广播电视、网络等语料,建成了总字次达到7亿的媒体语料库,对这个语料库的统计显示,581个汉字覆盖率为80%,934字覆盖率为90%,2314字覆盖率为99%。【16】
文字是用来记录语言的,文字的数量以能够较好记录语言为限。现行汉字是记录现代汉语的,因此,为实现文字的标准化,首先应当确定现代汉语的当用字量。就语文实践和大量数据来看,现行用字的总字量大约为8000—10 000,其中最常用字600左右,次最常用字1000左右,常用字2500左右。
2)定形
在一定的字量范围内,为每个汉字确定标准字形。定形牵涉到笔画样式、笔画书写顺序(笔顺)、笔画之间的平面关系(平行、连断、相接、交叉……)、偏旁类型、偏旁组合关系等等。字形确定要有一些基本原则,例如:
第一,一字一形。也许就书法和一些特殊的文字活动而言,一字多形有其意义,有其价值,但是就一般的文字生活而言,一字多形是低效的,是文字冗余现象。
第二,“厚今薄古”。汉字在历史演变中,字形发生了很大变化。一些不同的笔形演变成了相同笔形,一些不同的偏旁合流为一,也有一些相同的笔形和结构在不同的字中写法有异,还有一些字形习非成是。这些变化,这些现象,可能造成汉字原本的造字理据的泯失,加剧字际关系的错综复杂性。尽管如此,还是应当承认汉字的这种演变结果,不应扭今复古。“约定俗成”是语言文字发展演变的第一定律,也是语言文字规范的首要依据。
第三,照顾系统。汉字结构具有系统性,在确定每个字的字形时,要考虑汉字的笔画系统、笔顺系统、偏旁系统、笔画组合系统、偏旁组合系统等等。尽量减少孤例,充分考虑汉字结构的系统性,有助于汉字字形系统的优化,也有助于提升汉字学习效率、节约社会记忆成本和汉字信息的加工成本。
汉字定形是循序渐进的工作,对于常用字的字形,要尽量少动或不动。字形整理时,还要考虑到更大字量的情况,考虑到其他使用汉字的国家和地区的情况。
3)定音
规定现代汉语用字的标准读音。由于语音演变、方言影响、外语读音介入、汉字字形分合等原因,便会产生一字多音现象。一字多音现象有的是“多音字”,有的是“异读字”。多音字的每一个字音对应一个或几个字义,每个读音都不是多余的;当然,每个读音是否都是必要的,需要“审音”。异读字是字义相同但读音不同,字之异读一般来说对于学习和使用是冗余的,需要选择一个音作为正音。
汉字定音,基本上是伴随着异读词审音进行的。1956年1月成立普通话审音委员会, 1963年2月编出《普通话异读词三次审音总表初稿》。1982年10月成立新的普通话审音委员会,1985年12月发布《普通话异读词审音表》。
汉字定音工作仍是今天的重要任务。原来审音表的疏漏需要补正,新的字音现象需要审定,轻声儿化字需要有个固定的范围,有许多人名、地名、科技术语名的字音需要斟酌,中国使用的日本“国字”需要给一个汉语读音等等。2011年10月28日,成立了新一届普通话审音委员会,向社会开通了“普通话审音网”,审议通过了《普通话审音委员会章程》,听取了课题组的“普通话审音原则制定和《普通话异读词审音表》修订”的报告。新世纪的审音工作相信能够为汉字定音做更多的事情。
4)定序
确定现代汉语用字的排列顺序。汉字排序过去主要是字典、词典的需要,而到了信息数量“爆炸式”增加、信息检索成为日常事体的时候,字序的确定就显得重要起来,因为字序是信息排序的基本依据。
给汉字排序的方式有多种,不同的排序方式形成不同的字序。字序可概括为音序和形序。由于同音字的大量存在,音序一般来说是不能完全解决字序问题的,需要形序给以一定的帮助。形序往往与偏旁、笔画类、笔画数、笔顺等相关,因此,为了满足定序的需要,在汉字定形工作中还要确定偏旁部首、笔画类型,并要根据一定的规则确定偏旁部首的排序、笔画类型的排序和笔顺等。
(三)汉字信息化
文字标准化的提出,是为了主动适应计算机语言处理和信息检索等要求。1986年召开的全国语言文字工作会议就认识到:“当前,世界正处于信息化迅速发展的时代,利用电子计算机进行信息处理,实现图书情报工作自动化,印刷排版现代化,生产管理自动化,以及办公室事务自动化,已经成为现代化建设中的重要课题。因此,加强语言文字研究,促进语言文字的规范化、标准化,提到了比以往任何时期都重要的地位。”【17】在当时能够认识到信息化与语言文字规范化、标准化的关系,应该说是具有远见卓识的。但是,由于当时计算机语言处理的水平还十分有限,信息化的时代特征还不明显,只是“小荷才露尖尖角”,所以当时文字标准化的“标准”还不足够。随着计算机语言处理的发展,实现文字的信息化,还需要在“四定”的基础上做更多工作。
第一,要给每一个汉字一个计算机码位。过去汉字的要素是“形、音、义”三要素,文字信息化使汉字具有了“形、音、码、义”四要素。要使全世界所有的计算机都能够认识汉字而不至于出现乱码,必须通过国际标准化组织来统一对汉字进行编码。过去的汉字整理工作可以只在大陆进行,而文字信息化要求在不同的国度和地区间协作进行,并且还要得到国际社会的认可。ISO/IEC10646的工作,CJK【18】统一汉字编码字符集的工作,就是中国(大陆、台湾)、日本、韩国共同努力的结果,是汉字标准国际化的具体体现。
第二,汉字整理的字量空前加大。过去汉字整理基本上是在现代通用字的范围内进行的。但是,随着计算机语言处理能力的迅速提高,各种现实信息和历史文献信息都需要数字化。计算机需要处理的字量空前加大,以前不需要特别关注的人名、地名用字,物理化学和中医中药等科技用字,古代文献用字等,现在都进入了文字整理的视野。也就是说汉字整理的范围由通用字发展到特殊用字,由现代汉语用字发展到历史文献用字,甚至由隶楷等“今文字”发展到甲骨文、金文和篆书等“古文字”。
第三,字际关系成为突出问题。字量扩大其实并不仅仅是字量问题,还需要在更大的范围内考虑字形问题、字际关系问题等。字形问题集中在如何处理新旧字形、特别是在规范汉字之外的范围怎样处理新旧字形问题。而更艰巨的任务是字际关系的整理。庞大的字量,是不同时代、不同地区、不同场合用字的集聚,异体字占了很大比例,梳理字与字之间的关系,做好简繁汉字、正异汉字之间的对应,需要学术功力和大量的时间。特别是使用汉字的国家和地区还有不同的正字标准,互联网域名已经可以使用汉字,古代文献的出版印行成为现代文化生活的重要内容,这就需要建立大字量的字际关系映射表、古今汉字统一查检表。在如此背景下,字际关系的研究就显得更为重要。
第四,汉字标准成为工业标准。汉字信息化使汉字标准由文化规范成为工业标准,由为人服务的柔性规范成为为机器服务的刚性标准,由文化消费成为可以赚取经济红利的文化产品。这种转变从政策、管理、研制、推广、社会理念等各方面,从标准制定、发布、实施等各环节,都需要发生相应的转变,以适应文字信息化。
三 汉语拼音的地位与功能
汉字自身的表音功能有限,为学习汉字的需要必须有注音工具。古代为汉字注音,是利用汉字来实现的。早期是用较通俗的汉字为较难的汉字注音;后来在古印度语言学的影响下,音韵学快速发展,发明了“反切”,用两个汉字的声韵相切为汉字注音。
明代,西洋传教士来到南洋和中国,为了传教和学习汉语,设计了不少汉语拼音方案,其中以利玛窦的拉丁字母式拼音对后世影响最大。到了清朝末年,以卢戆章1892出版《中国第一快切音新字》为发端,兴起了朝野关注、影响深远的切音字运动。切音字运动不仅出现了很多汉字注音方案,而且产生了用切音字代替汉字的思潮。这一思潮所引发的汉字存废的争论,持续了百年之久,至今仍未止息。
1911年,清朝学部中央教育会议议决的《统一国语办法案》,是中国近代史上政府通过的第一个语言规划文件,标志着中国语言政策由隐性向显性的转变。《统一国语办法案》吸收了切音字运动的成果,初步确定了北京话在国语中的地位,而且非常重视音标在国语推行中的重要性,提出了音标制定的原则及相关事项:“音标之要则有五:一、音韵须准须备;二、拼音法须合公例;三、字画须简;四、形式须美;五、书写须便。无论造新征旧,必以兼合此要则者,方能使用。又须兼备行楷两种。该音标订定后,先在各省府厅州县酌定期限,试行传授。遇有滞碍,随时举报总会修正。修正确当后,再行颁布,作为定本。”【19】
百年前这一音标制定原则是相当科学的,但是清政府已经无力完成这一任务。1913年召开的读音统一会,通过了汉字笔画式的注音字母,1918年正式公布,使用至今。1928年9月,国民政府大学院(教育部)公布《国语罗马字拼音法式》。1931年9月,中国新文字第一次代表大会在苏联的海参崴召开,通过了《中国拉丁化新文字的原则和规则》,这一常被简称为“北拉”的新文字方案,在当时的中国发生了不小影响。
1958年2月11日,第一届全国人民代表大会第五次会议通过了《关于〈汉语拼音方案〉的决议》。1977年,联合国第三届地名标准化会议,决定采用《汉语拼音方案》作为拼写中国汉语地名的国际标准。1979年,联合国秘书处采用汉语拼音作为转写中国人名、地名的标准。1982年,国际标准化组织决定采用《汉语拼音方案》作为汉语罗马字母拼写法的国际标准,编号为ISO 7098。【20】1986年1月,第一次全国语言文字工作会议明确表示,汉字拉丁化不再是中国语言文字工作的任务,这算是政府对百年汉字命运争论的一个明确态度,也是对汉语拼音性质、作用的一个外延限定:汉语拼音不是文字方案。
谈文字政策,按说应该不谈汉语拼音(以下所说的“汉语拼音”,基本上是指《汉语拼音方案》规定的汉语拼音),但是,由于汉字与汉语拼音的关系密切,由于汉语拼音与汉字的命运曾经息息相关,所以,要全面论述中国的通用文字政策,不能不谈汉语拼音问题,或者说汉语拼音是汉字政策的一个重要补充内容。
(一)汉语拼音的地位
《国家通用语言文字法》第十八条,专门对汉语拼音做了规定:“国家通用语言文字以《汉语拼音方案》作为拼写和注音工具。”“《汉语拼音方案》是中国人名、地名和中文文献罗马字母拼写法的统一规范,并用于汉字不便或不能使用的领域。”
这些条文规定了汉语拼音的地位:第一,是国家通用语言(普通话)的拼写工具;第二,是国家通用文字的注音工具;第三,是国际公认的中国人名、地名和中文文献罗马字母拼写法的规范;第四,在汉字不便或不能使用的领域发挥职能。更为概括地说,汉语拼音的地位就是“工具”与“辅助”:是国家通用语言文字的拼写和注音工具;辅助汉字发挥作用。汉语拼音的“工具”与“辅助”地位,决定了汉语拼音的三大基本功能:
1.为汉字注音
这是继反切、注音字母、《国语罗马字拼音法式》之后,汉字的最为通行、最为有效的注音工具,也是汉语拼音三大功能中基本上没有争议的功能。
《汉语拼音方案》采用的是拉丁字母。拉丁字母在世界具有较大的通行性,因为世界上多数文字采用的都是拉丁字母形体,非拉丁文字也普遍具有拉丁转写方式。而且拉丁字母式的汉语拼音,经过较长时期的试验,从利马窦方案,到切音字的一些方案,到国语罗马字,到中国拉丁化新文字等,都是采用的拉丁字母式,汉语的哪个音用什么字母表示,积累有大量的经验。
拼音方式实行的音素制,能够较为准确地反映字音,便于学习和拼读。汉语拼音也有用双字母表示一个音素的,如:zh、ch、sh、ng、er;有个别字母表示多个音素的,如:i、e;有些音素在拼写中有省略现象,如:iou→iu、uei→ui、uen→un。但是,其基本制式还是音素制,具有音素制的优越性。
汉字本身表音成分有限,需要一个注音工具;汉语拼音采取音素制,能够较为准确地注音;汉语拼音采用拉丁字母,形体上国际通行且有长期的试验。有此三者,使汉语拼音成为汉字的优秀注音工具,为汉字的教育和使用立下了汗马功劳。【21】
2.拼写普通话
把有声的语言记录到书面上,是留声录音设备发明之前人类贮存语言的基本方式。用汉字记录普通话,是最为基本的方式;用国际音标记录普通话,一般都是为了研究或教学;用汉语拼音记录普通话,称为“拼写”,是处于文字、音标之间的一种记录汉语的方式。
拼写的作用是多方面的,比如普通话学习、学术交流、文化应用等。拼写在实际语言生活中也有不少表现,比如儿童拼音读物,外国人学汉语的阅读材料,外文学术文献中汉语的材料、论著篇目的引用等。拼写与注音的不同之处,不仅在于拼写的对象是语言,注音的对象是文字,而且拼写需要有正词法,诸如字母大小写、分词连写、标点符号用法、篇章的其他要求等等。就此而言,拼写从样式看与拼音文字已无大别,与拼音文字的差别主要是语言规划学上的地位,或者说是身份。拼写体现的是对汉字的一种辅助。
法律规定“《汉语拼音方案》是中国人名、地名和中文文献罗马字母拼写法的统一规范”,这是对1977年联合国第三届地名标准化会议决定和 ISO 7098的认可,所体现的也是汉语拼音拼写普通话的功能。人名、地名、中文文献在拼写时,都需要依据正词法。在现实生活中,对人名、地名拼写时,很多人使用给汉字注音的方式,不分词连写,不能正确使用大小写,这是汉语拼音正词法教育不普及的表现之一。
3.辅助汉字发挥作用
在某些活动、某些场合中,汉字有时候不便发挥作用,有时候不能发挥作用。例如飞机班次、火车车次,产品型号、外文地图中的中国地名、进出外国海关凭证上的中国人姓名、参加国际活动时的中国人姓名、计算机键盘的汉语拼音编码、汉字语音排序检索等等,都常常需要使用汉语拼音,体现着汉语拼音“辅助”汉字的功能。
汉语拼音的功能还有很多,比如:
(1)中国盲文、聋人使用的手指语、船舶旗语、灯光通信(又称“灯号”)等采用汉语拼音。汉语拼音为特殊教育做出了贡献,为特殊领域的通信做出了贡献。
(2)随着中国的改革开放,到中国旅游、学习、工作的外国人与日俱增,致使中国大中城市的市政名称、街道名称、交通标牌等都注有汉语拼音。汉语拼音的使用广泛度前所未有。
(3)20世纪50年代以后,中国曾经为一些少数民族制定文字方案或文字改革方案,其中许多方案都吸收了汉语拼音的成果。这些方案有的还在使用,有的已经弃用,但要看到,一些弃用的方案又在信息化中重新发挥作用。比如中国的维吾尔族和哈萨克族,在20世纪60年代曾经创制了拉丁化新文字。新文字从字母设计到正词法都受到汉语拼音的重要影响,并从1964年一直使用到1982年。当这两个民族重新恢复阿拉伯维吾尔文、哈萨克文之后,计算机语言处理和网络逐渐兴起,出现了不少维吾尔哈萨克文的拉丁方案,当年的拉丁化新文字稍加改造用于计算机语言处理,据研究是较为优化的方案。【22】
(4)计算机语言处理和现代信息产品的广泛使用,使汉语拼音的作用发挥到前所未有的程度。手机输入、计算机键盘编码、计算机程序设计语言、词汇库贮存、计算机语法信息词典、语料标注、汉字文本与汉语拼音文本自动转换系统等等,都在以汉语拼音为基础。为此,国家语委在2001年专门制定了《〈汉语拼音方案〉的通用键盘表示规范》。汉语拼音几乎成了人机对话和计算机处理汉语汉字的主要工具,同时应视为现代公民的必备素质。
很显然,随着中外交往越来越频繁,随着信息技术的发展及其产品在日常生活中的广泛应用,随着信息检索的量的激增和使用的普及化,需要用汉语拼音辅助汉字发挥作用的场合越来越多,汉语拼音的作用越来越巨大。汉语要在信息世界和国际世界中畅行,必须充分发挥汉语拼音的作用。
(二)汉语拼音正词法
汉语拼音要出色完成拼写国家通用语言文字的任务,要在“汉字不便或不能使用的领域”出色发挥作用,必须建立完善的汉语拼音正词法。汉语拼音正词法是指汉语拼音的拼写规范及书写格式的准则,包括音节的拼写和词的拼写等。历史上的多种汉语拼音方案、汉字拼音化方案,都涉及正词法问题,如卢戆章、蔡锡勇、朱文熊的切音字方案,如国语罗马字和北方话拉丁新文字等。
1958年的《汉语拼音方案》,主要解决的是音节拼写问题,但已经考虑到了词的拼写,为汉语拼音正词法留下了发展空间。比如隔音符号(’)的设置:“ɑ,o,e开头的音节连接在其他音节后面的时候,如果音节的界限发生混淆,用隔音符号(’)隔开,例如:pi’ɑo(皮袄)。”再如音节以 i、u、ü开头时,为了避免同前一音节连写时发生音节界限混淆,要把 i、u分别改作 y、w,或是在 i、u、ü之前添加 y、w。【23】
为使《汉语拼音方案》更好地发挥拼写功能,在以往实践中完善汉语拼音正词法,1982年3月,中国文字改革委员会成立了汉语拼音正词法委员会。1988年7月,国家教委和国家语委发布《汉语拼音正词法基本规则》。1996年1月,《汉语拼音正词法基本规则》(GB16159-1996)作为中华人民共和国国家标准由国家技术监督局发布。2012年6月29日,《汉语拼音正词法基本规则》重新修订发布,并同时发布了《中国人名汉语拼音字母拼写规则》。汉语拼音正词法的主要问题基本解决。
汉语拼音正词法研制与使用的主要困难,有以下几个方面:
1.词的辨认存在困难。汉语的词素、词、词组之间的界限有一定的模糊性,尽管大多数词的辨认不成问题,但的确有一部分词具有辨认难度。而且由于汉语书面语是以字为单位书写的,长期的阅读习惯形成了人们的“字意识”优于“词意识”。汉语拼音正词法实行分词连写,由于汉语客观上词与其上下单位的模糊性,由于人们主观上词的意识淡漠,便使分词连写出现一定困难。
2.成语拼式问题。汉语较多地使用成语,成语多为四字格,如果一条成语连续拼写,拼音形式过长。较为常见的处理办法,是在拼式中间加“-”,这样既保持了成语的整体性,又达到减短拼式的目的。但是,把“-”加在成语拼式的什么地方,却有不同意见和不同做法。例如:
(1)凡四字格的成语,皆采取“2+2”的切分方法。此法的优点在于好运用,但不能反映成语内部的结构关系。
(2)依照成语内部的结构关系进行切分。但是,不是每个使用者都具有足以分析成语结构的语法和构词知识,实际执行起来有相当的困难。例如“一衣带水”,可能有三种拼法:
① yīyīdài shuǐ;
② yīyī-dài shuǐ;
③ yīyīdài -shuǐ。
2012年6月出版的《现代汉语词典》(第6版)的成语拼写,一般都采取“2+2”的切分方式,但是“一衣带水”则采用了① yīyīdài shuǐ 的方式,宁可让拼式长一点,也不做切分。【24】这样做法的长处是不需要分析成语的结构关系,或者说不做破坏成语结构的切分,但不足之处是整部词典成语的拼法不统一。成语拼式问题其实是一个技术问题,应当权衡利弊,做出一个利于实际应用的处理。
3.声调的标示方法。汉语是有声调的语言,如果正确反映汉语的读音,就需要在每个音节的韵腹处标上调类符号。作为注音工具,也许标调方式的问题并不怎么突出;但是如果作为拼写工具,标调方式的问题就凸现出来了。其一,个个音节标调,形式上不美观(有人批评说是“满脸麻子”),手写起来、键盘输入起来都不方便;其二,轻声要不要标调,如何标调;其三,变调现象如何处理,是标本调还是标变调。历史上曾经有字母重写或用几个字母专门表示调类的做法,而现在计算机学界习惯用“1、2、3、4”表示分别阴平、阳平、上声和去声。
4.专有名词的拼写问题。专有名词在拼写上常有许多特殊性,如人名、地名、科技术语名、组织机构名、品牌型号名、特殊日期名等等。专有名词在语言中出现频率高,负载信息量大,词语构造复杂,其学术研究也比较薄弱,是汉语拼音正词法的主要研究内容,也是正词法的主要规定内容。
此外,外族、外国的专有名词怎样在汉语拼音中表现,也是一个需要解决的问题。对于使用拉丁文字的语言,是否原形照搬?对于使用非拉丁文字的语言,是依照该语言的拉丁方案转写,还是按照其汉字翻译转写?其中,中国少数民族的人名、地名等专有名词的音译转写问题,不仅牵涉到使用上的合理与方便,还牵涉到民族政策和民族感情。日本人名、地名一般用汉字,但是读音与汉语有别,汉语拼音拼写日本的人名地名,是用中国的汉字读音,还是用日文的拉丁化方案?
汉语拼音正词法还有一些其他问题,比如:汉字与汉语拼音的转换只能单向进行,从文字转换为拼音较为容易,但是从拼音转换为文字就会遇到同音词问题,特别是人名、地名的转换更为困难。汉语拼音正词法的研究不多,实践不够,特别是有人对正词法有思想成见,担心正词法的完善会使汉语拼音变成文字方案,从而对汉字的前途造成不利影响。
汉语拼音不仅中国使用,国际上也在使用。要给每个汉语词语一个合适的拼音形式,不要说外国人,就是中国人,甚至是中国的语言学工作者都有一定困难。要真正方便使用者,只有正词法的规定是不够的,应当有一个足够量的汉语拼音词汇表。据悉,国家语委正在已有辞书的词语拼音标注的基础上,研制一个15万~20万词的汉语拼音词汇表。这是一项值得期待的文化工程。
四 结语
根据本文的讨论和中国语言政策,中国的通用文字政策可以这样表述:坚持简化字的规范地位,在一个时期内保持汉字形体的相对稳定。推动汉字的规范化、标准化和信息化。充分发挥规范汉字的主导作用,依法处理好繁体字、异体字的使用问题,依法处理好国家通用文字与少数民族文字的关系。重视汉语拼音的应用。满足经济社会发展和中国走向世界的汉字应用需要。【25】
这一表述包含这么几个方面的意思:
1.维护中国自1935年以来的汉字简化成果,在中国大陆不把繁体字作为国家通用文字。
2.保持汉字形体的相对稳定,不再成批量地简化汉字。
3.推动汉字的规范化、标准化和信息化,是当前文字工作的主要任务。
4.依法处理好国家通用文字与少数民族文字的关系,处理好规范汉字与繁体字、异体字之间的关系,构建和谐的语言生活。这种和谐的语言生活在文字政策上的表现,就是国家通用文字要发挥交际上的主导作用,但也要保护少数民族文字的使用,并对繁体字、异体字的使用留下空间。
5.汉语拼音方案虽然不是文字方案,但它是国家通用语言文字的拼写和注音工具,是汉字的得力助手,在汉字不便使用和不能使用的领域发挥作用。在信息化时代和国际化时代,更要重视发挥汉语拼音的作用。
6.制定文字政策的目的,也是衡量文字政策优劣的标准,就是满足经济社会发展的需要,满足中国走向世界的汉字应用需要。
主要参考文献
曹先擢 2009 《谈谈普通话异读词审音》,语文出版社。
戴庆厦主编 2009 《中国少数民族语言研究60年》,中央民族大学出版社。
费锦昌 1997 《中国语文现代化百年记事(1892-1995)》,语文出版社。
傅永和 2000 《字形的规范》,语文出版社。
高更生 2002 《现行汉字规范问题》,商务印书馆。
国家语言资源监测与研究中心编 2006 《中国语言生活状况报告(2005)》(下编),商务印书馆。
李建国 2000 《汉语规范史略》,语文出版社。
李宇明 2004 《规范汉字和〈规范汉字表〉》,《中国语文》第1期。
李宇明 2010a 《中国语言规划论》,商务印书馆。
李宇明 2010b 《中国语言规划续论》,商务印书馆。
李宇明主编 2011 《中国少数民族语言文字规范化信息化报告》,民族出版社。
李宇明、费锦昌主编 2004 《汉字规范百家谈》,商务印书馆。
厉 兵编 2004 《汉字字形研究》,商务印书馆。
刘导生 1986 《新时期的语言文字工作》,载全国语言文字工作会议秘书处编《新时期语言文字工作——全国语言文字工作会议文件汇编(1986年1月)》,语文出版社,1987年。
吕冀平 2000 《当前我国语言文字的规范化问题》,上海教育出版社。
吕叔湘 1983 《〈汉语拼音方案〉是最佳方案》,《文字改革》第2期。
马丽雅、李红杰 2008 《少数民族语言使用与文化发展政策和法律的国际比较》,中央民族大学。
全国文字改革会议秘书处编 1957 《第一次全国文字改革会议文件汇编》,文字改革出版社。
全国语言文字工作会议秘书处编 1987 《新时期语言文字工作——全国语言文字工作会议文件汇编(1986年1月)》,语文出版社。
盛桂琴 2003 《互联网上维吾尔、哈萨克拉丁字符方案的字母选用问题》,载苏培成主编《信息网络时代的汉语拼音》,语文出版社。
苏培成主编 2003《信息网络时代的汉语拼音》,语文出版社。
苏培成主编 2010 《当代中国的语文改革和语文规范》,商务印书馆。
孙宏开、胡增益、黄行主编 2008 《中国的语言》,商务印书馆。
王 均主编 1995 《当代中国的文字改革》,当代中国出版社。
王理嘉 2003 《汉语拼音运动与汉民族标准语》,语文出版社。
王立军 2008 《汉字的自然发展规律与人为规范》,《语言文字应用》第2期。
王 力、周有光 1983 《进一步发挥〈汉语拼音方案〉的作用》,《文字改革》第2期。
王 宁 2009 《字形调整应适应信息时代的要求》,《中国社会科学报》第3 期。
王 宁 2011 《谈〈规范汉字表〉的制定与应用》,李运富主编《民俗典籍文字研究中心论文选集》(第一集),中华书局。
文字改革出版社编 1958a 《1913年读音统一会资料汇编》,文字改革出版社。
文字改革出版社编 1958b 《清末文字改革文集》,文字改革出版社。
文字改革出版社编 1988 《汉语拼音论文选》,文字改革出版社。
徐世荣 1995 《四十年来的普通话语音规范》,《语文建设》第6期。
于锦恩 2007 《民国注音字母政策史论》,中华书局。
语文出版社编 2006 《语言文字规范手册》,语文出版社。
中国社会科学院语言研究所词典编辑室编 2012 《现代汉语词典》(第6版),商务印书馆。
周恩来 1958 《当前文字改革的任务》,人民出版社。
周有光 1988 《〈汉语拼音方案〉和国际标准》,《语文建设》第1期。
[原载《世界汉语教学》2013年第1期]
【1】 本文根据2012年元月11日在日本早稻田大学孔子学院的演讲整理而成。
【2】 曹先擢、傅永和、王宁、张万彬、王铁琨、费锦昌、张书岩、王立军、王翠叶、王敏、陈双新等先生,对“规范汉字”这一概念多有研究。本文规范汉字的定义,是在他们研究基础上的总结,其中受到曹先擢、王宁、张万彬、王铁琨、王翠叶等先生的影响尤大,特此鸣谢。
【3】 参见文字改革出版社编(1958a)。
【4】 1936年2月5日,教育部奉行政院之命,训令“简体字应暂缓推行”。
【5】 与1964年的《简化字总表》相比,只涉及“叠、覆、像、囉、余、瞭、雠”7个字的调整。
【6】 李按:《通用规范汉字表》2013年6月已由国务院正式发布。字表收字8105个,其中一级字表收字3500个,二级字表收字3000个,三级字表收字1605个。
【7】 劳乃宣《进呈〈简字谱录〉折》,见文字改革出版社编(1958b,79页)。
【8】 商务印书馆,2007年。
【9】 参见戴庆厦主编(2009,2页)。
【10】 这“三化”,也适合国家的少数民族文字规划。事实上,中国少数民族文字的规范化、标准化和信息化工作已经有了较快发展。具体情况请参看李宇明主编(2011)。
【11】 周恩来(1958,1页)。
【12】 周恩来(1958,5页)。
【13】 见全国语言文字工作会议秘书处编(1987,331~333页)。
【14】 见全国语言文字工作会议秘书处编(1987,330页)。
【15】 见全国语言文字工作会议秘书处编(1987,24页)。
【16】 见国家语言资源监测与研究中心编(2006,7页)
【17】 全国语言文字工作会议秘书处编(1987,22页)。
【18】 CJK是中文汉字(Chinese Hanzi)、日文汉字(Japanese Kanji)、韩文汉字(Korean Hanja)的缩写,其中C包括G(中国大陆使用的汉字)和T(中国台湾使用的汉字)。感谢张轴材先生提供的意见。
【19】见文字改革出版社编(1958b,43~144页)。
【20】见周有光(1988)、苏培成主编(2003,252~261页)。
【21】 参见吕叔湘(1983);王力、周有光(1983)。
【22】 参见盛桂琴(2003)。
【23】 ü前添加y时,ü上面的两点省略为u,如ü→yu、üe →yue、üɑ n →yuɑn、
ün→yun。
【24】 见中国社会科学院语言研究所词典编辑室编(2012,1529页)。
【25】 这一表述,受到陈章太先生的著作和交谈等多方面影响,特此感谢。