3 汉语词汇结构的协同研究
3.1 引言
计量语言学使用量化概念、定量方法,以及大量真实文本探索语言结构及其规律。它的主要目的之一是通过大数据发现语言现象,揭示它们之间的关系,并使用公式化的定律来描述、解释这些现象(刘海涛,2012)。其发展至今,已有很多定律得到了证实,如多义度分布符合Waring分布函数,词长—词义关系符合齐普夫定律等。这些定律在一定程度上反映了语言的规律,然而,从“语言是一个动态系统”这一层面来说,这些定律反映的仅是语言这个“系统”的一个部分。为了更全面地了解语言系统的全貌,Köhler(1986)提出了协同语言学理论,即将语言视为自组织自调节的系统,关注其系统结构的自发变化和发展,将现存的语言学定律整合为一个动态系统。协同语言学旨在提供构建语言学理论的一套框架,把从理论得出的推论进行检验,并整合为法则网络或近似法则网络的表述,进而对观察到的现象做出解释,即构建普适假设的建模方法,并达到能够对所观察的现象进行解释和预测的目的。协同语言学的另一宗旨是重建被语言学界长期遗忘的一个观点:语言既是心理—社会现象,又是生理—认知现象。协同语言学的第一个模型是建立在语言的子系统——词汇层面上的,使用德语进行了验证(Köhler,1986)。此后,这套理论除了在词汇层面得到了证实,如波兰语(Hammerl,1991)、英语(Gieseking,1998)等语言,在语素层面(Köhler,1990a,1990b,1991; Krott,1996,1998)、句法层面(Köhler,1999,2012)都得到了数据支持,甚至可以将之推广到更泛化的符号系统,如音乐的研究(Köhler &Martináková,1998)。然而,该理论尚未得到汉语数据的验证,本研究将使用汉语数据,对词汇模型进行验证和讨论。