多源数据整合分析(penalized integrative analysis),理学-统计学-大数据统计分析-大数据,基于惩罚变量选择方法的多数据集分析方法。简史惩罚方法是单数据集变量选择中使用最为广泛的一类方法,它通过压缩未知参数值的方式,同时实现变量选择和参数估计的目的。惩罚方法最初缘起于1995年,由加州大学伯克利分校统计学家L.布赖曼[注]提出的NNG(Non-Negative-Garrote)方法。具有里程碑意义的惩罚方法是由美国统计学家R.蒂施莱尼[注]在1996年提出的Lasso(least absolute shrinkage and selection operator)方法。