删除插值法(deleted interpolation),文学-语言文字-计算语言学及语料库语言学-计算语言学,使用线性插值的手段,把不同阶的N元语法结合起来的数据平滑方法。由美国学者F.杰里奈克(Frederick Jelinek,1932~2010)和R.L.梅塞尔(Robert Leroy Mercer,1946~ )于1980年提出。例如,在计算三元语法时,把一元语法、二元语法和三元语法三种模型都结合起来。当估计概率的时候,要把一元语法、二元语法和三元语法都混合在一起,每种语法用线性权值λ来加权:使得各个λ的和为1:但在实际中,在删除插值法里不仅仅只为三元语法训练三个λ,还把每一个λ看成上下文的函数。如果对于一个特定的二元语法有特定的精确计数,并且假定三元语法的计数是基于二元语法的,那么,这样的办法将更加可靠,可以使这些三元语法的λ值更高,从而在插值时给三元语法更高的权值。