书名：计量语言学研究进展
作者名：刘海涛
本章字数：12字
更新时间：2025-02-26 01:41:45

3 汉语词汇结构的协同研究

3.1 引言

计量语言学使用量化概念、定量方法，以及大量真实文本探索语言结构及其规律。它的主要目的之一是通过大数据发现语言现象，揭示它们之间的关系，并使用公式化的定律来描述、解释这些现象（刘海涛，2012）。其发展至今，已有很多定律得到了证实，如多义度分布符合Waring分布函数，词长—词义关系符合齐普夫定律等。这些定律在一定程度上反映了语言的规律，然而，从“语言是一个动态系统”这一层面来说，这些定律反映的仅是语言这个“系统”的一个部分。为了更全面地了解语言系统的全貌，Köhler（1986）提出了协同语言学理论，即将语言视为自组织自调节的系统，关注其系统结构的自发变化和发展，将现存的语言学定律整合为一个动态系统。协同语言学旨在提供构建语言学理论的一套框架，把从理论得出的推论进行检验，并整合为法则网络或近似法则网络的表述，进而对观察到的现象做出解释，即构建普适假设的建模方法，并达到能够对所观察的现象进行解释和预测的目的。协同语言学的另一宗旨是重建被语言学界长期遗忘的一个观点：语言既是心理—社会现象，又是生理—认知现象。协同语言学的第一个模型是建立在语言的子系统——词汇层面上的，使用德语进行了验证（Köhler,1986）。此后，这套理论除了在词汇层面得到了证实，如波兰语（Hammerl,1991）、英语（Gieseking,1998）等语言，在语素层面（Köhler,1990a,1990b,1991; Krott,1996,1998）、句法层面（Köhler,1999,2012）都得到了数据支持，甚至可以将之推广到更泛化的符号系统，如音乐的研究（Köhler &Martináková,1998）。然而，该理论尚未得到汉语数据的验证，本研究将使用汉语数据，对词汇模型进行验证和讨论。