稀疏主成分分析(sparse principal component analysis),理学-统计学-大数据统计分析-数据简化,从所有变量中筛选少数的重要变量并进行线性组合,从而尽可能多地保留原始数据信息的一类降维方法。基本原理主成分分析是一类重要的特征降维方法,它通过对所有原始变量按照一定的准则进行线性组合从而形成主成分,往往少数几个主成分即可囊括大部分原始数据的变异信息。然而,由于主成分是所有原始变量的线性组合,当变量维度较高时,对主成分的分析和解释存在困难。因此需要考虑如何筛选少数几个重要的原始变量进行线性组合以形成易解释的主成分。2006年学者们提出了稀疏主成分分析方法,其核心思想是通过正则化的方式得到具有稀疏线性组合的主成分。基于不同的主成分求解过程,发展出了不同的稀疏主成分分析方法。