单词通用度(common usage of words),文学-语言文字-计算语言学及语料库语言学-计算语言学,词语在语言使用的不同领域中常用程度的指标,可以表示语言在各个不同的领域里通用程度的大小。这里的“领域”,既可以指空间的领域,也可以指时间的领域;既可以指一个单词在共时的语言使用中在不同领域里的通用程度,也可以指一个单词在不同时间段的语言应用中的通用程度。单词通用度要考虑单词的出现频率和分布指数两个因素,并且把这两个因素结合起来。假设把抽样统计的全部文本分为k组,每组文本的数量大致相等,某一个单词在k组文本中出现的次数分别为,那么,这个单词的通用度可根据如下公式来计算:……(1)在这个公式中,当时,T取最大值N,当中只有一个不为零,而其他各项都为零时,T取最小值。因此有:……(2)假定对于中文文本I、II、III、IV、V中的一些单词进行频率统计。