NIST评测方法(NIST evaluation approach),文学-语言文字-计算语言学及语料库语言学-计算语言学-沃古瓦三角形,在BLEU评测方法的基础上提出的一种机器翻译系统自动评测的改进方案。由美国国家标准与技术研究院(National Institute of Standards and Technology)提出。NIST评测方法采用各阶N元语法的算术平均值而不是几何平均值,使得总体评价结果更偏重于忠实度,而且也不至于因为某一阶N元语法的匹配率为零而导致总体评价为零。另外,NIST考虑到每一个N元语法在多个参考译文中出现的次数不同能够表现出该词的重要性,因此根据其在多个参考译文中出现的次数而给每一个N元语法赋予一个权值。实验证明,NIST在敏感性(对被测系统的区分程度)方面高于BLEU。下面是NIST的两个基本公式。评分公式:……(1)信息权重公式:……(2)式中是一个常数,是一个经验阈值,使得在时,使得长度罚分率为0.5;是参考答案的平均长度;表示被评测句子的长度;表示最大元语法长度;表示N元语法的权重;表示,即以自然对数为底的指数函数。