语料库词频统计(word count; word frequency count),文学-语言文字-词典学-计算机辅助词典编纂-词典语料库,运用统计程序在某一语料库中分析和计算出语言单位出现次数的统计方法。词频统计方式分为全量统计、指定统计和字/词频统计三种。全量统计是计算出特定文档中所有词汇出现的频率,指定统计是计算出某些或某类词汇出现的频率,字/词频统计是计算出特定词项出现的频率。词频分为形频与类频两种,前者指某一语言单位(单词、短语或搭配)在语言文本中出现的次数,它决定该语言单位的固化程度;后者指某一语言型式在文本中的语言使用频率,它反映该型式的能产性。为便于不同容量的语料库之间进行词频对比统计,还可对词频进行标准化处理,处理前的词频称为“频数”,处理后的词频称为“频率”。在一个语料库中,可以运用检索工具的词表生成功能形成词频表,表内通常包括整个检索语料的形符数、类符数以及单个词的频数、百分比等信息,使用者可根据需要选择将词频表从高频到低频、或是从低频到高频,从A到Z或是从Z到A进行排列,以满足各种语言研究、语言教学和词典编纂调用。