有序样本聚类法(ordered sample clustering),医学-现代医学-预防医学领域-卫生统计学-卫生统计方法-统计模型-聚类分析,在实际应用中,样本按一定的要求排列成序,如按时间的先后、数量的多少,地层的深浅等,分类时不能打乱这种次序,有序样本的聚类就是要寻找一种分割,使得分割后所形成的样本“段”之段内差异尽可能的小,各段之间的差异尽可能的大,这种分割就是最优分割。设给定有序样本,,...,,每一个样本都是P维向量,定义为一类,类的直径为:其中,为段内均值。将个样本分成类记为,它使得个样本在原序结构上分成了段,,…,,则目标函数为:目标函数其实质就是总体分类后全部个类的类内变差总和。目标函数愈小,分类就愈合理。对于分割数的确定有两种方法,一是按经验认为地确定值,二是给定一个阈值,使得,则满足该式的值即为最小分类数。