高维数据变换(high-dimensional data transformation),理学-统计学-大数据统计分析-数据简化,将维数据投射到维空间内(),以便观察数据的特征和分布。高维数据变换需要将数据降维处理,具体的方法有以下三种:将高维数据投影到低维可显示空间中、设计新的可视化空间、直观呈现不同维度的相似程度。典型的高维数据变换方法有主成分分析法(principal component analysis; PCA)、多维尺度分析法(multidimensional scaling; MDS)、等距映射法(Isomap)、局部线性嵌入法(local linear embedding; LLE)。 高维数据变换的主要代表人物是美国计算机科学家J.B.克鲁斯卡尔[注]。主成分分析法将给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列,并且在变换中保持变量的总方差不变。变换后第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分,依次类推。通常我们选取前M个变量将数据降维到M维空间。