平均距离法(average distance method),理学-统计学-描述统计-数据变换,通过将类间两两样本间的平方距离的平均数定义为类与类之间距离,以实现系统聚类的一种方法。平均距离法考虑了每对样本的距离信息,对样本信息的利用更加充分。平均距离法是系统聚类分析方法的一种,系统聚类法的聚类原则取决于样本间的距离及类间距离的定义。为了充分利用各个样本的信息,平均距离法用两类样本两两之间平方距离的平均作为类之间的距离,因此类与之间的距离可以表示为:式中为类中的样本个数。为类中样本和类中样本的距离。设某一步骤将类和合并成一个新类,记为。,类所包含的样本个数分别为,和()。则类与其他类的距离平方的递推公式为:相比于最短距离法和最长距离法,平均距离法充分利用了各个样本的信息,使得信息利用更全面,聚类的结果更具代表性。