词汇统计学

（文学 | 语言文字）

词汇统计学（lexicostatistics），文学-语言文字-历史语言学及语言接触-历史语言学-历史比较语言学，利用统计手段，处理词汇材料，测量亲属语言亲疏程度的方法。由美国语言学家M.斯瓦迪士1950年在研究北美萨利希语（Salish）内部联系的文章中首倡。又称词汇统计年代推算法、语言年代学。斯瓦迪士发现，经过与已验证的语言历史相比较，在一些不同亲属语言中，基本词汇的变迁速率基本都是恒定的。在此基础上，斯瓦迪士提出了计算同源词汇的相似对应度，来测试语言之间彼此分化年代的方法设想。词汇统计学的基本假设主要有如下三点：①所有语言中都包含一批基本词汇，包括代词、数词、身体各部、地理名称等，这些词汇在人类语言中具有普遍性，且不易受社会文化环境的变迁而发生变化。斯瓦迪士专门编有所谓的“斯瓦迪士词表”，作为词汇统计研究的最基础的材料。②基本词汇被保存下来的速率在任何时期都是恒定的，为一个常数。每过1000年，斯瓦迪士100基本词表的范围内，被保存下来的词汇约为84%，200基本词表范围内保存原有词汇的80.5%。