博克斯-考克斯变换

（理学 | 统计学）

博克斯-考克斯变换（Box-Cox transformation），理学-统计学-描述统计-数据变换，常用于数据标准化以修正数据的非正态性和异方差性的一种数据变换形式。英国统计学家G.E.P.博克斯和D.R.考克斯于1964年提出了一种广义幂变换方法。后人将其命名为博克斯-考克斯变换。在进行线性回归的过程中，一般线性模型假定：，其中误差满足正态分布。但在使用实际数据建立回归模型时，通常会出现个别变量的系数无法通过统计检验的情况，例如不可观测的误差可能是和预测变量具有一定的相关性，误差不服从正态分布，于是给线性回归的最小二乘估计系数的估计带来误差。为了使模型满足线性性、独立性、方差齐性以及正态性，须改变数据形式，可以采用博克斯-考克斯变换。博克斯-考克斯变换的一般形式为：式中为经博克斯-考克斯变换后得到的新变量；为原始连续因变量；为变换参数。以上变换要求原始变量取值为正。当原始变量取值为负时，可先对所有原始数据同时加一个常数使其为正值，然后再进行博克斯-考克斯变换。变换参数不同，所作的变换也不同。当时该变换为对数变换。当时该变换为倒数变换。当时该变换为平方根变换。