小提琴图(violin plot),理学-统计学-描述统计-数据及数据类型,在垂直箱线图左右两侧对称添加核密度曲线而获得的图形。因形似小提琴而得名。在美国统计学家J.W.图基提出的箱线图基础上,以色列统计学家Y.本杰米尼[注]提出用核密度曲线取代垂直箱线图左右两条直线,同时将获得图形命名为花瓶图。花瓶图的密度曲线只描述了中间50%,即箱体部分的数据。在花瓶图基础上,美国统计学家J.L.欣茨[注]和R.D.纳尔逊[注]于1998年提出小提琴图,在小提琴图中,采用全部数据绘制核密度曲线。与箱线图只展示分位数位置不同,小提琴图展示了任意位置的密度,通过小提琴图可以知道哪些位置的密度较高。小提琴图对箱线图做了两处更改。一是用圆点替代了表示中位数的直线,二是离群值(outliers)和异常值(extremes)没有被个别地标示出来。例如:不同气缸数的汽车每加仑汽油可以行驶的里程数的分布情况(图1)。通常认为汽缸数量少的汽车每加仑汽油可以行驶更多里程数。圆点是中位数,小提琴形的上下范围是下四分位点到上四分位点,小提琴图上下两端的延长线表示离散值。小提琴形的左右曲线为核密度曲线。