最近邻插补(nearest neighbor imputation),理学-统计学-数理统计-Data Imputation,利用辅助变量定义测量间距离度量,以距离含缺失数据观测最近的对应观测变量值作为插补值的方法。设辅助变量数据集为,为第个观测第个变量的数据,用为的第行观测数据,若为连续型数值变量,则不同观测间的距离可采用欧式距离:或马氏距离:式中为协方差矩阵。若为属性型数据,不同观测间的距离有多种度量方式,如可采用简单匹配系数距离:式中为示性函数。通过例子说明如何进行最近邻插补。数据集为,的第一行第三列数据缺失,用NA表示。以欧氏距离为例,第一个观测和第二个观测的距离:第一个观测和第三个观测的距离:因为,所以可用第二个观测的第三个变量数据值替代,即插补后。