词汇统计学(lexicostatistics),文学-语言文字-历史语言学及语言接触-历史语言学-历史比较语言学,利用统计手段,处理词汇材料,测量亲属语言亲疏程度的方法。由美国语言学家M.斯瓦迪士1950年在研究北美萨利希语(Salish)内部联系的文章中首倡。又称词汇统计年代推算法、语言年代学。斯瓦迪士发现,经过与已验证的语言历史相比较,在一些不同亲属语言中,基本词汇的变迁速率基本都是恒定的。在此基础上,斯瓦迪士提出了计算同源词汇的相似对应度,来测试语言之间彼此分化年代的方法设想。词汇统计学的基本假设主要有如下三点:①所有语言中都包含一批基本词汇,包括代词、数词、身体各部、地理名称等,这些词汇在人类语言中具有普遍性,且不易受社会文化环境的变迁而发生变化。斯瓦迪士专门编有所谓的“斯瓦迪士词表”,作为词汇统计研究的最基础的材料。②基本词汇被保存下来的速率在任何时期都是恒定的,为一个常数。每过1000年,斯瓦迪士100基本词表的范围内,被保存下来的词汇约为84%,200基本词表范围内保存原有词汇的80.5%。