模糊k均值聚类(fuzzy k-means clustering),工学-信息与通信工程-模式识别-统计模式识别-k均值聚类-模糊k均值聚类,k均值聚类算法结合模糊集理论后的聚类算法。模糊k均值聚类算法是传统简单硬聚类算法k均值聚类算法的扩展,不同于k均值聚类算法,只能将样本归为确定的某一类。模糊k均值聚类算法采用了软聚类方式,即样本可以属于多个聚类类别,只是其属于某聚类的程度由模糊隶属函数来定义。通常模糊聚类算法要求样本对各个聚类的隶属度之和为1,通过迭代算法收敛后即可得到各类的聚类中心和样本对各类的隶属度值。用隶属度函数定义的聚类损失函数记为:…(1)式中为控制模糊程度的常数;为类别数;为样本数。其中隶属度函数满足:…(2)通过令对和的偏导数为0,求得和的迭代更新公式,通过反复迭代即可求得收敛解,从而确定各类的聚类中心和样本对于各类的隶属度。模糊k均值聚类算法能够避免k均值聚类算法初始值选取不当时,输出的某些类别会出现没有样本归属的情形。由于k均值聚类算法对于初始聚类中心非常敏感,为了得到较好的结果,可以用模糊k均值聚类算法的结果作为硬决策k均值聚类的初值。