赫丹词汇增长模型(Herdan vocabulary growth model),文学-语言文字-计算语言学及语料库语言学-计算语言学,一种研究词汇增长的模型。由英国学者G.赫丹(G.Herdan)于1964年提出。赫丹通过研究发现,词汇增长曲线在双对数平面上呈近似线状,因此他推论logV(N)和logN之间存在着线形关系,即:……(1)所以得出,……(2)这个公式为赫丹词汇增长模型的数学表达式。式中V(N)为文本中不同单词的数量;N为文本容量;参数α和β同样为经验系数,不存在概率解释。赫丹词汇增长模型的数学表达式是一个简单的指数函数关系式。根据赫丹词汇增长模型,可以根据文本容量N,计算出容量为N的文本中不同单词的数量V(N),再根据V(N)随着文本容量N的增长而增长的情况,就可以估计出文本中词汇增长的趋势。