高维统计检验(high dimensional statistical inference),理学-统计学-大数据统计分析-数据简化,在高维数据情形下,当自变量的维数随着样本量一起趋于无穷时所建立的统计检验理论。随着数据日趋复杂,数据的自变量维数相对于样本量而言越来越大,甚至远大于样本容量。而建立在自变量维数固定且相对较小、样本量趋于无穷的假设下的经典统计理论,已逐渐脱离了现实分析的需要,所构造的相应检验统计量也不再服从相应结论。因而,针对高维数据情况,在自变量的维数随着样本量一起趋于无穷的假设下,需要从高维的角度重新进行分析,建立相应的高维统计检验理论。J.奈曼和E.L.斯科特于1948年首次指出在高维数据情况下,经典的统计理论已不再适用;1996年,白志东和H.萨拉纳达萨(Hewa Saranadasa)证明了当维数接近样本量时,霍特林检验将会失去效力,并提出了新的检验方法;陈松蹊等在2010年针对该问题进行了进一步的改进,并在《高维数据统计推断方法》中,对经典的统计理论进行更新,针对高维数据情况,建立了相应的高维统计推断理论体系。