高维问题(high-dimensional problems),理学-统计学-大数据统计分析-数据简化,数据集中变量的个数远大于传统统计分析中的变量数目(尤其以多变量小样本的形式呈现)与指数据集中变量数量和样本量都很大的两类问题。发展简史大批量的高维数据是在生命科学或遗传学里面产生,对于这类数据,一般样本从几十到几百不等,而变量个数可以达到102~104。到了21世纪,随着互联网的高速发展,这类高维数据也在互联网行业产生,对于这类数据,样本大小达到104~106,变量个数也可以达到104~106。