BLEU评测方法(BLEU evaluation approach),文学-语言文字-计算语言学及语料库语言学-计算语言学-沃古瓦三角形,IBM提出的机器翻译系统的自动评测方法。全称为Bilingual Evaluation Understudy。BLEU评测方法基于N元语法,通过对译文跟参考译文进行N元语法的比较综合而得出译文的好坏的评价分数。在这种基于N元语法共现的统计方法中,一元词的共现代表了翻译的忠实度,它表征了原文里面有多少单词被翻译了过来;而二元以上的共现词汇代表了目标语言的可理解度,阶数高的N元词的匹配度越高,系统译文的可理解度就越好。其基本计算公式为: ……(1)……(2)式中Pn表示被测译文中与参考答案匹配的N元语法总数/被测译文中N元语法总数;BP表示长度惩罚因子;Lref表示与被测句子长度最接近的答案长度;Lsys表示被评测句子的长度;N表示最大N元语法长度;wn表示N元语法的权重;exp x表示ex,即以自然对数e为底的指数函数。BLEU是根据N元语法准确率的几何平均值来计算的,得分越高越好。