重抽样技术(resampling method),理学-统计学-大数据统计分析-数据简化,通过反复从训练集中抽取样本,对每一个样本重新拟合一个感兴趣的模型,来获取关于拟合模型附加信息的技术。重抽样技术假设观测集中的样本能够反映总体特征,因此,对观测集进行反复抽样可视为从一个总体中得到不同的样本。由于该过程中重复多次抽取样本,因此称为重抽样技术。经典的重抽样技术主要包含交叉验证法和自助法等方法。交叉验证的思想源于20世纪30年代,经过众多学者的发展,美国统计学家F.莫斯特勒(Frederick Mosteller)和J.W.图基(John Wilder Tukey)于1968年对该方法做出完整陈述。美国统计学家B.埃弗龙(Bradley Efron)于1979年提出非参数的自助法。随后发展出参数自助法、残差重抽样、平滑自助抽样和加权自助抽样等方法。重抽样技术通过反复从训练集中抽取样本,然后对每一个样本重新拟合一个感兴趣的模型,来获取关于拟合模型的附加信息。交叉验证法和自助法是两种常用的重抽样方法。①交叉验证法。