离差平方和法(sum of deviation square method),理学-统计学-描述统计-数据变换,在对样本进行聚类时,采用方差分析的思想来度量类与类之间的距离,同类样本的离差平方和应较小,类与类间的样本离差平方和应较大的一种聚类方法。又称瓦尔德法。离差平方和法由统计学家A.瓦尔德(Abraham Wald)于1936年提出。该方法的思想源自方差分析,认为同类样品间的离差平方和应当较小,类与类的离差平方和应当较大。假定已将个样本分为类,记为,表示内的样本个数,表示的重心,表示中的第个样品(),则中样本的离差平方和:式中,为维向量;为一数值()。个类的总离差平方和:当固定,将选择使达到极小的分类。瓦尔德法把某两类合并后增加的离差平方和看成为类间的平方距离,即:式中为和类的平方距离,;分别为中样本的离差平方和。利用的定义可得:式中,经整理可得:当样本间距离采用欧式距离时,式(5)可表示成:式中为,的重心和的平方距离,且这表明此时瓦尔德法定义的类间距离与重心距离法只相差一个常数倍。当,合并成后,与其他类的距离有递推公式:在实际应用中,离差平方和法应用广泛,分类效果较好。