拉普拉斯平滑法(Laplace smoothing),文学-语言文字-计算语言学及语料库语言学-计算语言学,对于二元语法的计数矩阵,在把它们归一化之前,先给所有的计数加一,从而进行数据平滑的算法。又称“加一平滑法”(add-one smoothing)。非平滑的一元语法概率的最大似然度估计的计算,是用单词的“词例”的总数N去除单词数:……(1)不同的平滑可依赖于一个可调整的数来估算。对于拉普拉斯平滑来说,数的调整可以通过在词数上加一然后乘以一个归一化因子N/(N+V),其中V是该语言中单词的“词型”的总数,叫作词汇容量。因为对于每个单词的“词型”数都加了一,所以单词“词例”的总数将随着“词型”的数目的增加而增加。这样,拉普拉斯平滑的调整数可定义为:……(2)这个数可以用N来归一化,然后转变为概率。还有一种不同的方法是把平滑算法看成“打折”,也就是把某个非零的数降下来,使得到的概率量可以指派给那些为零的数。