辛克宏算法(Sinkhorn algorithm),理学-统计学-大数据统计分析-最优传输-辛克宏算法,近似求解正则化最优传输问题的一种迭代算法。是最优传输问题中最常用的快速算法之一。考虑经典的最优传输问题:令原始分布为、目标分布为,并假设这两个分布定义在一个规模为的离散点集上。令这个点集为,其中,且。将、视作中的向量,其中: (1)记为给定的度量矩阵,为元素全是1的维向量。记为分布和分布之间的耦合矩阵的集合。具体地,写作: (2)令表示两个矩阵对应元素的乘积,经典的瓦瑟斯坦距离是以下问题的解: (3)传统的线性规划方法求解问题(3)的算法复杂度高达,有一些方法可以把求解问题(3)的时间复杂度降至。然而这样高的时间复杂度依然阻碍了最优传输问题在很多大规模数据集上的应用。为了缓解这一高计算复杂度,巴黎理工学院M.库图里[注]转而考虑求解一种正则化最优传输问题,从而近似原始问题的解。这种正则化最优传输问题的最小值一般被称为辛克宏“距离”,定义如下:(4)式中为正则项参数;为的香农熵。进一步地,库图里发现这类正则化最优传输问题的解可以表示成矩阵的某种行和列的置换形式。