测试样本

（理学 | 统计学）

测试样本（testing samples），理学-统计学-数理统计-统计学习，用来评估最终模型性能的数据样本。又称测试集。在进行统计学习时，一般需要将已有样本划分成独立的三个部分，这三部分分别是训练样本、验证样本以及测试样本。其中训练样本用来估计模型，验证样本用来确定网络结构或者控制模型复杂程度的参数，而测试样本则检验最终选择最优的模型的性能如何。一般通过测试样本计算最终模型的准确率、敏感性、-统计量等来评估最终模型，从而反映模型的泛化能力。需要注意的是，验证样本和测试样本都会对因变量进行预测，并比较预测值与真实值的差距。但是两者的目的是不同的，验证样本为了从众多模型中选择出最佳的模型，而测试样本则是对最优模型进行评估。