判定系数(coefficient of determination),法学-社会学-社会学方法-数据分析,一个描述线性回归模型拟合优度的统计量,表示回归线在多大程度上反映了数据点的分布。判定系数一般以表示。表示所有数据点都在回归线上。在简单线性回归模型(只有一个自变量)中,判定系数等于皮尔逊相关系数的平方,即。如果线性回归模型中的自变量不止一个,那么判定系数就是多元相关系数[注]的平方。判定系数的计算逻辑如下。①若不知道的存在,或无法测量,在对进行估计时,一般用进行预测,此时的误差平方和为。表示总误差[注]。②若x可被测量,那么可用普通最小二乘方得到一个线性回归方程。对一个有个观察记录的数据,在散点图上会有n个坐标点。根据得到的线性回归方程,对每一个,都有一个预测值,它与真实之间的差称为残差[注]。线性回归方程就是最小化残差的平方和[注]:。判定系数就是描述在可以测量的情况下,对y预测的时候可以减少的误差比例:判定系数有一个缺点,即无论加入什么变量(即便是在理论上与因变量没有关系的变量),它一定会增大。