语言抽样(language sampling),文学-语言文字-计算语言学及语料库语言学-计算语言学-语言成分的概率,语言学家在对语言事实进行统计研究时,抽取语言的总体之中部分的过程。由于考察语言文本的总体在现实中无法进行,只能通过语言抽样这种方式从总体中抽取一部分来进行研究。从语言的总体中抽取的这一部分材料叫作样本。语言学家等研究人员可以根据样本来讨论语言总体的面貌。从语言样本中观察到的结果与语言总体的面貌不可能完全对应,因此在根据语言样本来讨论语言总体时,有时十分可靠,有时不太可靠,有时则完全不可靠。N.A.莫罗佐夫(Nikolai Aleksandrovich Morozov,俄国/苏联)于1913年在《语言谱》(Лингвистические спектры)一文中,统计了俄罗斯古典作家普希金和果戈理等作品中,当样本容量=1000个词时,前置词“на”和“в”的出现频率。但是由于他没有遵循科学的统计方法来进行统计,其结果很不可靠。