代谢组学数据缩放(scaling of metabonomics data),医学-现代医学-药学领域-药理学与药代动力学-代谢组学-代谢组学数据分析-多变量数据分析-代谢组学数据缩放,对代谢组学多变量数据进行的规整化处理。缩放后,数据量级的可比性更好、数据分布更接近正态分布,方便采用主成分分析方法对数据进行合理分析。又称代谢组学数据权重[注]。在含有多个变量的研究和实际数据分析中,变量数值常常具有不同的数量级。相对而言,数量级大的变量方差数量级也较大,数量级较小的变量方差数量级也较小。主成分分析主要基于方差数据进行投影和计算模型,因此,对于有较大方差的变量,其在主成分分析模型中占有的权重比方差较小的变量所占有的权重更加显著。但是,多变量数据分析中各个变量的实际重要性并不依赖于上述数量级大小和方差大小,有可能数量级较小的变量更加重要。因此,按照原始观测数据,数量级小的变量方差权重较低,其重要性就不能在模型里充分表达。解决上述问题的方法,是对各变量进行标准化,使各变量的数值范围按一定标准进行调整。下图为多变量数据缩放及平均值中心化的示意图。