统计建模(statistical modeling),理学-统计学-数理统计-统计建模,用简化的概率模型来近似现实(数据产生机制)的方法。基本内容统计建模指基于数据背景分布的数学假定条件,建立概率模型,对模型进行检验、比较,并用所选模型进行统计推断。统计建模的核心问题是选择哪个概率模型来拟合数据。统计建模的特点是近似现实,我们只能得到更加接近现实的“更好”的模型。如把要研究的对象用变量来表示,影响的所有确定因素记为,用描述因素对的具体影响方式,即构造了模型,式中为随机因素,这个模型是个理想模型。然而,在实际建模分析过程中,无法知道确定因素有哪些,随机因素的变化规律是什么,更谈不上的结构表达式。尝试建立近似模型:式中为的近似;为的近似;为的近似,这个模型就是统计模型。在现实研究过程中理想模型是研究者追求的目标,但很遗憾无法确切知道,研究者只能不断地创建近似效果更好的统计模型。所以说,研究过程中所建立的统计模型只是理想模型的近似,没有准确的模型。统计学家G.E.P.博克斯[注]有句名言,“All models are wrong,but some are useful”即表达了这个道理。