投影寻踪回归(projection pursuit regression),理学-统计学-数理统计-拟似然推断,使用低维投影来分析高维数据的方法,旨在发现高维数据中可能的非线性的低维结构。投影寻踪的思想最早由美国数学家J.B.克鲁斯卡尔(Joseph Bernard Kruskal,1928~2010)于1969年提出。美国统计学家J.H.弗里德曼和J.W.图基于1974年将其应用于探索性数据分析,并正式命名为投影寻踪,统计学家弗里德曼和W.施图茨[注]将投影寻踪的思想拓展到回归、分类和密度估计领域。设是维数据。考虑一维的投影寻踪,维向量。投影的数据为。通过投影寻踪指数来度量投影的重要性。对于一维投影寻踪来说,投影寻踪指数刻画了投影后数据的密度和之间的距离。投影寻踪指数越大,该投影越重要。两个函数和的距离可以表示为。有多种投影寻踪指数可供选择,埃尔米特指数是其中比较重要的一种。澳大利亚墨尔本大学教授P.G.霍尔[注]基于距离的埃尔米特多项式展开定义埃尔米特指数:式中为标准正态分布的密度函数;为埃尔米特多项式。不同的会导致不同的投影寻踪指数。