NIST评测方法

（文学 | 语言文字）

NIST评测方法（NIST evaluation approach），文学-语言文字-计算语言学及语料库语言学-计算语言学-沃古瓦三角形，在BLEU评测方法的基础上提出的一种机器翻译系统自动评测的改进方案。由美国国家标准与技术研究院（National Institute of Standards and Technology）提出。NIST评测方法采用各阶N元语法的算术平均值而不是几何平均值，使得总体评价结果更偏重于忠实度，而且也不至于因为某一阶N元语法的匹配率为零而导致总体评价为零。另外，NIST考虑到每一个N元语法在多个参考译文中出现的次数不同能够表现出该词的重要性，因此根据其在多个参考译文中出现的次数而给每一个N元语法赋予一个权值。实验证明，NIST在敏感性（对被测系统的区分程度）方面高于BLEU。下面是NIST的两个基本公式。评分公式：……（1）信息权重公式：……（2）式中是一个常数，是一个经验阈值，使得在时，使得长度罚分率为0.5；是参考答案的平均长度；表示被评测句子的长度；表示最大元语法长度；表示N元语法的权重；表示，即以自然对数为底的指数函数。

领域

词条相关