删截(censoring),法学-社会学-社会学方法-数据分析,一种处理数据的方式,当数据的值低于某一标准时将其统一记为某个单一的值。受限因变量普遍存在于社会和健康数据中,本质上是数据缺乏的问题。此类变量的主要特征是删截和截尾。删截数据属于受限因变量的一种,当因变量在某一范围内的所有值都被转换为一个单一的值时,该数据即为删截数据。如,在收入分布中,将低于贫困线的收入均编码为0;在考试成绩分布中,所有高于或者等于满分的成绩被编码为满分。删截数据无处不在,包括家庭耐用商品的购买、婚外事件数、妇女在劳动力市场上工作的小时数等。删截数据与截尾数据的差别在于,前者仅是因变量被删截,自变量得到保留;而后者因变量和自变量均被删除。分析删截数据的中心任务是使用删截数据去推断整个总体的未删截的分布。在回归分析的背景下,主要的挑战是如何建立删截的正态分布的矩(平均数和方差)。在这种情况下,研究者既可使用删截的数据,也可以使用未删截的数据(uncensored data)对一个更大的总体进行回归模型估计。对删截数据的处理已发展出多种模型。