测试样本(testing samples),理学-统计学-数理统计-统计学习,用来评估最终模型性能的数据样本。又称测试集。在进行统计学习时,一般需要将已有样本划分成独立的三个部分,这三部分分别是训练样本、验证样本以及测试样本。其中训练样本用来估计模型,验证样本用来确定网络结构或者控制模型复杂程度的参数,而测试样本则检验最终选择最优的模型的性能如何。一般通过测试样本计算最终模型的准确率、敏感性、-统计量等来评估最终模型,从而反映模型的泛化能力。需要注意的是,验证样本和测试样本都会对因变量进行预测,并比较预测值与真实值的差距。但是两者的目的是不同的,验证样本为了从众多模型中选择出最佳的模型,而测试样本则是对最优模型进行评估。