统计标引法(statistical method of indexing),管理学-情报学-信息组织-信息加工处理-标引,以词频统计为基础的自动标引方法。统计标引法是依据下述假设来选择标引词:某词在文献中的出现频率与该词的文献区分功能有密切关系。一个词(实词)在文献中使用越频繁,就越有可能是一个指示主题的词,也就是先按词频给每个词加权,权值超过一定阈值的词选作标引词。此法由美国情报学家H.P.卢恩[注]首创于1957年,包括:词频统计标引法、加权统计标引法、N-Gram法等。后来又有研究者加以改进和补充,派生出了多种不同的统计标引方法,如绝对频率法、相对频率法、倒置文献频率法等。统计标引法的基本方法是将文献中每个词出现的频率按照递减顺序排列起来 (高频词在前,低频词在后),并用自然数给这些词编上等级序号,频次最高的是1级,其次是2级、3级……如果用表示词在文献中出现的频次,用表示词的等级序号,则有。通过对这些词语的统计,求出其中的高频词、中频词和低频词,并使用中频词作为标识文献的词。