布鲁奈词汇增长模型(Brunet vocabulary growth model),文学-语言文字-计算语言学及语料库语言学-计算语言学,一种描述文本中的词汇增长情况的模型。由法国学者E.布鲁奈(E. Brunet)于1978年提出。布鲁奈对于词汇增长模型给出了如下的数学表达式:……(1)由此推导得出:……(2)式中N为文本容量;V(N)为容量为N的文本中不同单词的数量;α为参数;W为布鲁奈常量(Brunet constant),作为对数函数的底。布鲁奈推导得出的公式是一个复杂的对数函数关系式,以logwN为自变量,logwV(N)为因变量。参数α通常默认取值0.17,这是一个经验值,不存在理论解释,目的是确保logwV(N)和logwN的常量函数关系。W虽然被称作布鲁奈常量,实际上却并不是一个常数,其取值随文本容量N的变化而变化。根据布鲁奈词汇增长模型,可以根据文本容量N,计算出容量为N的文本中不同单词的数量V(N),再根据V(N)随着文本容量N的增长而增长的情况,就可以估计出文本中词汇增长的趋势。