N元语法模型(N-gram model),文学-语言文字-计算语言学及语料库语言学-计算语言学,利用前面N-1个单词来预测下一个单词的语法模型。例如,有英语符号串“Just then, the white”(这个时候,白的)。在这样的上下文中,尽管“the”(定冠词)的出现概率大大高于“rabbit”(兔子),但是在单词“white”(白的)之后“rabbit”似乎是一个比“the”更合理的单词,因而可以预测出下面一个单词很可能是“rabbit”。给N-1赋值,通过前面一个、两个单词的条件概率来估计下一个单词出现的概率,这样的N元语法模型分别叫作二元语法模型(bigram model)和三元语法模型(trigram model)。二元语法模型可以推广到三元语法模型,再推广到N元语法模型。二元语法模型叫作一阶马尔可夫模型(因为它只看前面的一个单词),三元语法模型叫作二阶马尔可夫模型(因为它只看前面的两个单词),N元语法模型叫作N-1阶马尔可夫模型(因为它只看前面的N-1个单词)。