箱型图(box plot),理学-统计学-数理统计-Data Imputation,用作显示一组数据分散情况资料的统计图。又称为盒须图、盒式图、箱线图。基本内容箱型图因形状如箱子而得名,在各种领域也经常被使用。箱型图(图1)绘制须使用常用的统计量,主要包含六个数据节点,将一组数据从大到小排列,分别计算出这组数据的上边缘,上四分位数,中位数,下四分位数,下边缘,还有异常值。①中间的粗线是中位数。②中位数周围的方框标识了第一个和第三个四分位数,方框底端是,顶端是。③方框上方和下方的“虚线”显示了数据的范围,不包括离群值。④上边缘和下边缘分别是剔除离群值之后的数据中的最大值和最小值。⑤圆圈识别了离群值。在默认情况下,离群值定义为任何超出方框之外的数值。(为四分位差,或)。图1 箱型图示例图通过箱型图的形状可以看出数据分布的特征。几种不同的箱型图与其所对应的分布形状的比较(图2)。对于对称分布,中位数位于上下四分位数的中央,箱形图的方盒关于中位线对称。中位数越偏离上下四分位数的中心位置,分布偏态性越强。异常值集中在较大值一侧,则为右偏分布;异常值集中在较小值一侧,则为左偏分布。