随机缺失(missing at random),理学-统计学-数理统计-缺失机制,变量的缺失概率与某些观测变量有关而与该变量自身无关的一种缺失机制。在随机缺失中,目标变量是否缺失不依赖于不完全变量(含缺失值的变量),只依赖于完全变量(不含缺失值的变量)。例如某单位在身体检查时,如果员工年龄没有达到40岁,将不做心电图检查。此次体检心电图数据的缺失为随机缺失。将数据集记为,表示第个观测的第个变量值,为中完全变量数据集,为中不完全变量数据集。缺失数据指标矩阵,当缺失时,,否则。给定时的条件分布记为。当发生随机缺失情况时。例如数据集(见表),表格中NA为数据缺失,心率变量含缺失值,为不完全变量,心率变量所在列数据为不完全变量数据集。其余变量均不含缺失值,为完全变量,其余列数据构成完全变量数据集。心率数据的缺失是由于心电图检查时对于年龄的限制,这时心率数据是否缺失与心率本身无关,受年龄数据影响。这种缺失为随机缺失。