机器翻译质量评价(machine translation quality evaluation),文学-语言文字-语用学、修辞学及翻译学-翻译-翻译技术,利用预先标注好的双语句对衡量机器翻译性能的技术。在机器翻译质量评价任务中,预先标注好的双语句对被称为测试集。核心思想是机器翻译输出的自动译文越接近测试集中的参考译文就越好。机器翻译质量评价系统主要有两个组成部分:①“接近”的衡量标准。②高质量的测试集。其中,主流的衡量标准有双语评估辅助系统(Bilingual Evaluation Understudy,简称BLEU)和翻译编辑评估系统(Translation Edit Rate,简称TER)。BLEU是业内最早提出的常用评估指标,重点关注相同文本下,机器与人翻译结果的近似程度。TER则基于译后编辑的次数来计算机器翻译译文和译后编辑译文之间差异,用来评定机器翻译结果所需译后编辑的工作量。