基罗词汇增长模型(Guiraud vocabulary growth model),文学-语言文字-计算语言学及语料库语言学-计算语言学,用于描述文本中的词汇增长情况的模型。由法国学者H.基罗(H. Guiraud)于1990年提出。模型的数学表达式如下:……(1)由此可以推出:……(2)式中N为文本容量;V(N)为容量为N的文本中不同单词的数量;R为基罗常量(Guiraud constant),作为表达式的系数。在统计语言学中,要把语言成分的类别与实例区分开来,类别称为类符,实例称为形符,文本中出现的单词的总数叫作文内形符数,而不同单词的总数叫作文内类符数。例如,在英文句子“She asked the visitor to come into the hall”(她请访问者来到大厅)中,文内形符数是9,而文内类符数则是8,因为形符“the”出现了两次。文内的类符数与形符数之比,叫作类符-形符比。如果用V(N)表示类符数,用N表示形符数,则类符-形符比为V(N)/N。