CN114266321A

CN114266321A - 一种基于无约束先验信息模式的弱监督模糊聚类算法

Info

Publication number: CN114266321A
Application number: CN202111661326.5A
Authority: CN
Inventors: 张良均; 徐圣兵; 张敏; 刘名军; 张尚佳; 王宏刚; 王振友; 施兴; 赵云龙; 周东平; 杨惠
Original assignee: Guangdong Teddy Intelligent Technology Co ltd
Current assignee: Guangdong Teddy Intelligent Technology Co ltd
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2022-04-01

Abstract

本发明涉及弱监督学习技术领域，且公开了一种基于无约束先验信息模式的弱监督模糊聚类算法，包括以下步骤：S1：定义概念，定义标准模式、无约束先验隶属度、强标准模式、弱标准模式的概念；S2：获取无约束专家标注先验隶属度矩阵；S3：设计基于无约束先验信息模式的目标函数；S4：对目标函数运用拉格朗日乘数法求解；S5：设计聚类算法。本发明适用无约束先验信息，利用先验信息与后验信息的交叉熵测度作为正则项指导监督学习，可以有效解决传统弱监督聚类算法无法使用无约束先验信息的问题，提高无约束先验信息利用效率，利用交叉熵测度，有效利用专家标注信息标注，指导聚类过程，提高聚类结果准确性。

Description

一种基于无约束先验信息模式的弱监督模糊聚类算法

技术领域

本发明涉及弱监督学习技术领域，具体为一种基于无约束先验信息模式的弱监督模糊聚类算法。

背景技术

模式识别问题，需要根据样本特征将样本划分到一定的类别中。而实际中所使用的样本集往往既包含标记样本又包含无标记样本，因而可以通过弱监督聚类有效利用标记信息获得更好的聚类效果。基于先验隶属度信息的弱监督模糊聚类是一类模式识别方法。但传统的弱监督模糊聚类算法是在模式间相互独立的假设下建立的，对于模式间存在相近特征的情况，原有的先验隶属度信息不能体现模式间这种特性。

现有公布的弱监督模糊聚类技术方案包括以下几种：发明专利号：CN201210128475.X公开了一种基于熵权模糊聚类的渗漏通道探测方法，利用熵权法处理“信息流”数据，利用模糊聚类算法进行聚类。定量地确定样本的亲疏关系，从而客观地划分类型，并为最终准确判定渗漏通道的位置提供科学依据；发明专利号：CN201710394919.7本涉及一种子集分组半监督模糊聚类方法，以用户对多个不同子集的分组信息作为聚类指导。模糊聚类矩阵分解时不仅考虑分解误差，还同时考虑缩小子集中对象的分组和其近邻集中对象的分组的差别以及增大与远邻集中对象分组的差别，不需要过大的数目的约束就能达到满意的效果，在实际应用中聚类迅速，效率高，人工成本低；此类专利存在以下不足：未考虑利用先验信息指导算法学习过程，采用标签为成对约束标签，不涉及无约束先验隶属度指导学习过程，没考虑标注信息不可靠的情况下，先验信息对聚类结果的影响，不能满足人们的要求，因此提出一种基于无约束先验信息模式的弱监督模糊聚类算法。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种基于无约束先验信息模式的弱监督模糊聚类算法，解决了未考虑利用先验信息指导算法学习过程，采用标签为成对约束标签，不涉及无约束先验隶属度指导学习过程，没考虑标注信息不可靠的情况下，先验信息对聚类结果的影响，不能满足人们的要求的问题。

(二)技术方案

为实现上述目的，本发明提供如下技术方案：

一种基于无约束先验信息模式的弱监督模糊聚类算法，包括以下步骤：

S1：定义概念，定义标准模式、无约束先验隶属度、强标准模式、弱标准模式的概念；

S2：获取无约束专家标注先验隶属度矩阵，专家为样本X^L＝{x₁,x₂,...,x_n}标注无约束先验隶属度

构造无约束先验隶属度矩阵

其中

为c个标准模式，

为样本x_j对标准模式

模式的先验隶属度，

ρ为专家偏好系数，且存在样本x_k，使得

S3：设计基于无约束先验信息模式的目标函数，将无约束先验隶属度

引入KL散度正则化FCM算法的目标函数中，得到以下目标函数J(U,V)：

其中，后验隶属度μ_ij满足约束条件

和μ_ij∈[0,1]，先验隶属度

仅满足

条件，λ≥0是一个平衡参数；

S4：对目标函数运用拉格朗日乘数法求解，在约束条件

μ_ij∈[0,1]，

下，定义(1)的拉格朗日函数L(U,V,λ)为：

通过拉格朗日乘数法最小化L(U,V,γ)：

得到后验隶属度u_ij和聚类中心v_i的表达式：

当

时，

S5：设计聚类算法，设计sFCM-HC算法，进行计算。

作为本发明再进一步的方案，所述S1中标注先验隶属度时，给定了多个具有类簇代表性的样本，作为对样本标注隶属度时的参考标准，定义给定的具有类簇代表性的样本为标准模式，标准模式可由已建立的标准数据库中提取得到。

进一步的，所述S1中标准模式能在一定程度上反应其所代表类簇的特征，若标准模式具有很强的类簇代表性，模式之间相对独立且存在较大差异，定义为强标准模式，若标准模式具有较弱的类别代表性，模式之间可存在重合或特征的部分特征，定义为弱标准模式。

在前述方案的基础上，所述S1中传统的先验隶属度标签，是基于参考标准为强模式的假设下标注的，此时先验隶属度满足

的约束条件，而强模式的获取是有成本的，弱模式则是普遍存在的，而当参考标准为弱模式时，对于部分样本x_i可能存在

的情况，即无法满足满足

的约束条件，无约束先验隶属度不满足

约束条件，且针对未标注样本的先验隶属度利用专家偏好系数ρ进行填补。

进一步的，所述S3式中第1项为FCM的目标函数，第2项关于后验隶属度u_ij和无约束先验隶属度

的KL散度正则项，当第1项最小化时，u_ij隶属度为0或1，当第2项最小化时，u_j隶属度分布与

隶属度分布相似，如果是λ＝0，则sFCM-HC退化为FCM。

在前述方案的基础上，所述S5中算法步骤如下：nput：样本数n，样本维度d，类簇数c，ε迭代终止条件；数据集X，最大迭代次数T；初始隶属度U(0)，先验隶属度矩阵

平衡参数λ，Output：类簇中心矩阵V，后验隶属度矩阵U，Repeat：根据(4)式更新类簇中心矩阵

根据(5)式更新隶属度矩阵

Until：||U(t+1)-U(t)||≤ε,||V(t+1)-V(t)||≤εor t＝T。

(三)有益效果

与现有技术相比，本发明提供了一种基于无约束先验信息模式的弱监督模糊聚类算法，具备以下有益效果：

1、本发明中，有效适用于弱监督学习的业务场景，利用交叉熵测度，有效利用专家标注信息标注，指导聚类过程，提高聚类结果的准确性。

2、本发明中，适用无约束先验信息，利用先验信息与后验信息的交叉熵测度作为正则项指导监督学习。

3、本发明中，可以有效解决传统弱监督聚类算法无法使用无约束先验信息的问题，提高无约束先验信息利用效率，利用交叉熵测度，有效利用专家标注信息标注，指导聚类过程，提高聚类结果准确性。

4、本发明中，针对未标注样本的先验隶属度利用专家偏好系数ρ进行填补，得到能准确表征标准模式信息的先验隶属度，扩大标注量，降低标注成本的问题。

附图说明

图1为本发明提出的一种基于无约束先验信息模式的弱监督模糊聚类算法的流程结构示意图；

图2为本发明提出的一种基于无约束先验信息模式的弱监督模糊聚类算法的sFCM-HC算法流程结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1-2，一种基于无约束先验信息模式的弱监督模糊聚类算法，包括以下步骤：

构造无约束先验隶属度矩阵

其中

为c个标准模式，

为样本x_j对标准模式

模式的先验隶属度，

ρ为专家偏好系数，且存在样本x_k，使得

其中，后验隶属度μ_ij满足约束条件

和μ_ij∈[0,1]，先验隶属度

仅满足

条件，λ≥0是一个平衡参数，有效适用于弱监督学习的业务场景，利用交叉熵测度，有效利用专家标注信息标注，指导聚类过程，提高聚类结果的准确性；

S4：对目标函数运用拉格朗日乘数法求解，在约束条件

μ_ij∈[0,1]，

下，定义(1)的拉格朗日函数L(U,V,λ)为：

通过拉格朗日乘数法最小化L(U,V,γ)：

得到后验隶属度u_ij和聚类中心v_i的表达式：

当

时，

适用无约束先验信息，利用先验信息与后验信息的交叉熵测度作为正则项指导监督学习；

S5：设计聚类算法，设计sFCM-HC算法，进行计算，可以有效解决传统弱监督聚类算法无法使用无约束先验信息的问题，提高无约束先验信息利用效率，利用交叉熵测度，有效利用专家标注信息标注，指导聚类过程，提高聚类结果准确性。

本发明的S1中标注先验隶属度时，给定了多个具有类簇代表性的样本，作为对样本标注隶属度时的参考标准，定义给定的具有类簇代表性的样本为标准模式，标准模式可由已建立的标准数据库中提取得到，S1中标准模式能在一定程度上反应其所代表类簇的特征，若标准模式具有很强的类簇代表性，模式之间相对独立且存在较大差异，定义为强标准模式，若标准模式具有较弱的类别代表性，模式之间可存在重合或特征的部分特征，定义为弱标准模式，S1中传统的先验隶属度标签，是基于参考标准为强模式的假设下标注的，此时先验隶属度满足

的情况，即无法满足满足

的约束条件，无约束先验隶属度不满足

约束条件，且针对未标注样本的先验隶属度利用专家偏好系数ρ进行填补，得到能准确表征标准模式信息的先验隶属度，扩大标注量，降低标注成本的问题。

尤其的，S3式中第1项为FCM的目标函数，第2项关于后验隶属度u_ij和无约束先验隶属度

隶属度分布相似，如果是λ＝0，则sFCM-HC退化为FCM，S5中算法步骤如下：nput：样本数n，样本维度d，类簇数c，ε迭代终止条件；数据集X，最大迭代次数T；初始隶属度U(0)，先验隶属度矩阵

根据(5)式更新隶属度矩阵

Until：||U(t+1)-U(t)||≤ε,||V(t+1)-V(t)||≤εor t＝T。

在该文中的描述中，需要说明的是，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于无约束先验信息模式的弱监督模糊聚类算法，其特征在于，包括以下步骤：

构造无约束先验隶属度矩阵U％(V⁰,ρ)，其中

为c个标准模式，

为样本x_j对标准模式

模式的先验隶属度，

ρ为专家偏好系数，且存在样本x_k，使得

其中，后验隶属度μ_ij满足约束条件

和μ_ij∈[0,1]，先验隶属度

仅满足

条件，λ≥0是一个平衡参数；

S4：对目标函数运用拉格朗日乘数法求解，在约束条件

下，定义(1)的拉格朗日函数L(U,V,λ)为：

通过拉格朗日乘数法最小化L(U,V,γ)：

得到后验隶属度u_ij和聚类中心v_i的表达式：

当

时，

S5：设计聚类算法，设计sFCM-HC算法，进行计算。

2.根据权利要求1所述的一种基于无约束先验信息模式的弱监督模糊聚类算法，其特征在于，所述S1中标注先验隶属度时，给定了多个具有类簇代表性的样本，作为对样本标注隶属度时的参考标准，定义给定的具有类簇代表性的样本为标准模式，标准模式可由已建立的标准数据库中提取得到。

3.根据权利要求2所述的一种基于无约束先验信息模式的弱监督模糊聚类算法，其特征在于，所述S1中标准模式能在一定程度上反应其所代表类簇的特征，若标准模式具有很强的类簇代表性，模式之间相对独立且存在较大差异，定义为强标准模式，若标准模式具有较弱的类别代表性，模式之间可存在重合或特征的部分特征，定义为弱标准模式。

4.根据权利要求3所述的一种基于无约束先验信息模式的弱监督模糊聚类算法，其特征在于，所述S1中传统的先验隶属度标签，是基于参考标准为强模式的假设下标注的，此时先验隶属度满足

的情况，即无法满足满足

的约束条件，无约束先验隶属度不满足

5.根据权利要求1所述的一种基于无约束先验信息模式的弱监督模糊聚类算法，其特征在于，所述S3式中第1项为FCM的目标函数，第2项关于后验隶属度u_ij和无约束先验隶属度u％_ij的KL散度正则项，当第1项最小化时，u_ij隶属度为0或1，当第2项最小化时，u_j隶属度分布与

隶属度分布相似，如果是λ＝0，则sFCM-HC退化为FCM。

6.根据权利要求5所述的一种基于无约束先验信息模式的弱监督模糊聚类算法，其特征在于，所述S5中算法步骤如下：nput：样本数n，样本维度d，类簇数c，ε迭代终止条件；数据集X，最大迭代次数T；初始隶属度U(0)，先验隶属度矩阵U％(V⁰,ρ)，平衡参数λ，Output：类簇中心矩阵V，后验隶属度矩阵U，Repeat：根据(4)式更新类簇中心矩阵

根据(5)式更新隶属度矩阵

Until：||U(t+1)-U(t)||≤ε,||V(t+1)-V(t)||≤εor t＝T。