不可忽略缺失(non-ignorable missing),理学-统计学-数理统计-缺失机制,变量的缺失概率只与不完全变量(含缺失值的变量)相关的一种缺失机制。又称非随机缺失。在不可忽略缺失情况下,目标变量是否缺失依赖于不完全变量(含缺失值的变量)。例如做收入调查时,高收入者不愿填写其收入情况,收入数据的缺失为不可忽略缺失。数据集记为,表示中完全变量(不含缺失值的变量)数据集,表示中不完全变量(含缺失值的变量)数据集。缺失数据指标矩阵,当缺失时,,否则。给定时的条件分布记为。当发生不可忽略缺失的情况时,与有关。例如含缺失值的数据集(见表),NA表示数据缺失。因收入变量含缺失值,为不完全变量,所以收入变量所在列数据为不完全变量数据集。当进行收入调查时,回答者和无回答者的收入可能是不同的,收入越高,回答倾向越低,即收入数据的缺失与收入本身有关,这种缺失为不可忽略缺失。