主成分聚类(principal component clustering),理学-统计学-数理统计-偏相关分析,一种通过主成分分析方法简化数据的聚类分析技术。在聚类分析中,当原始指标变量的维数较高并且变量之间具有较强的相关性时,通过采用直接聚类技术对样本进行聚类的效果较差,可以先通过主成分分析将多个具有较强相关性的原始变量通过变换转化成多个线性不相关的主成分,再将主成分作为指标变量,通过适当的聚类方法根据指标变量对样本进行聚类。假设原始数据有个变量,每个变量有个观测,对数据进行主成分分析,得到主成分,根据累积贡献率选取前个主成分,并以个主成分作为新的指标变量,采用聚类的方法(如均值聚类算法等)对数据进行聚类。