召回率(Recall Rate,也叫查全率)是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率;精度是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率。编辑本段基本概念对于数据测试结果有下面4种情况:TP: 预测为正,实际为正TN: 预测为负,实际为负FP:预测为正,实际为负FN: 预测为负,实际为正T/F:表示预测结果是否正确P/N:表示预测结果是正或负样本精确率、准确率:Accuracy=(TP+TN)/(TP+TN+FN+FP)精准率、查准率: P = TP/ (TP+FP)召回率、查全率: R = TP/ (TP+FN)真正例率(同召回率、查全率):TPR = TP/ (TP+FN)假正例率:FPR =FP/ (FP+TN)F1-score: 2*TP/(2*TP + FP + FN)编辑本段计算方法召回率和精度示意图recall假定:从一个大规模数据集合中检索文档时,可把文档分成四组:- 系统检索到的相关文档(A)- 系统检索到的不相关文档(B)