CN112926635B

CN112926635B - 一种基于迭代自适应近邻传播算法的目标聚类方法

Info

Publication number: CN112926635B
Application number: CN202110141014.5A
Authority: CN
Inventors: 刘昌云; 段玉先; 王刚; 李松; 郭相科; 韦刚; 张春梅; 姚小强
Original assignee: Air Force Engineering University of PLA
Current assignee: Air Force Engineering University of PLA
Priority date: 2021-02-01
Filing date: 2021-02-01
Publication date: 2022-10-04
Anticipated expiration: 2041-02-01
Also published as: CN112926635A

Abstract

本发明公开了一种基于迭代自适应近邻传播算法的目标聚类方法，包括S1.计算数据集中两两元素之间的相似度，构建迭代自适应近邻传播算法的相似度矩阵；S2.对偏向系数p进行优化选取，利用偏向系数p求相似度矩阵；S3.计算样本间的可分性和紧密性，输出偏向参数；S4.计算吸引度矩阵A与归属度矩阵r，选取r(k,k)+A(k,k)>0的值作为聚类中心，完成目标聚类；本方法利用高斯核函数进行相似度度量的基础，采用迭代自适应方式对偏向参数p自适应估计，选择silhouette指标最大的值对应的p值，输出最优的聚类数目；实验证明本方法在研究目标跟踪时，相比其他算法具有有效性和稳定性高的特点。

Description

一种基于迭代自适应近邻传播算法的目标聚类方法

技术领域

本发明涉及目标跟踪算法技术领域，具体涉及一种基于迭代自适应近邻传播算法的目标聚类方法。

背景技术

视觉目标(单目标)跟踪任务就是在给定某视频序列初始帧的目标大小与位置的情况下，预测后续帧中该目标的大小与位置目标； 1999年，美国学者Blackman在研究目标跟踪问题时，最先将目标分群看作是聚类问题；此后，有很多学者应用聚类方法为解决目标分群问题提出了新的见解和思路，如快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)、迭代自组织数据分析算法(Iterative Self-organizing Data Analysis,ISODATA)等，这些算法有以下两个弊端：

(1)上述算法在处理超球形分布效果良好，而在处理非凸形状的簇时则需要进一步改进，在面对分布稀疏、非线性排列的目标时，往往不能满足战场上对于目标分群的精确要求；(2)上述算法大多依赖于初始聚类中心和聚类数目的选择，对异常值敏感，在缺乏先验知识的条件下，很难做出准确判断，从而影响聚类效果；

因而采用一种迭代自适应近邻传播算法，该方法以聚类分析为理论支撑，可以实现对战目标的自动聚类，而现有算法中多采用近邻算法(Affinity Propagation，AP)进行迭代，近邻算法是在基于因子图以及和积算法的基础上提出，基本思路是将所有数据点全部看作潜在的聚类中心(exemplar)，进而构建相似度矩阵，通过彼此间的信息传递机制(A[]与r[])，不断搜索网络中符合作为最佳聚类中心条件的数据点，使所有数据点到各自聚类中心的相似度之和最大，从而完成聚类；可以看出，AP算法不断进行吸引度r[a，b]与归属度A[a，b]的迭代运算，逐渐搜索网络中最佳聚类中心，可以不受初始中心点和聚类数目的限制，通过目标的距离进行快速而准确的聚类；

虽然AP算法在处理多维、大规模的数据集时，往往能取得好的结果，但分析其特性，AP算法仍存在以下不足：(1)AP算法仍是利用基于中心的思想进行聚类分簇，因此在处理超球形分布的数据集时效果良好，但在处理非凸形状的簇时，由于传统AP算法是基于欧氏距离进行相似性的度量，因此可能会吸收其他簇内的样本，造成聚类结果的偏差；(2)偏向参数p需要事先输入，其大小直接影响产生的聚类数目，需要根据实际情况不断进行动态调整。

发明内容

针对上述存在的问题，一种基于迭代自适应近邻传播算法的目标聚类方法，本方法在利用高斯核函数进行相似度度量的基础上：首先，设置高斯核函数，通过特征变换，将数据映射到高维，对相似度矩阵进行改良，构建对称相似度矩阵；其次，针对p值需要人工输入的问题，利用自适应的方法对p进行调整，利用silhouette指标对结果进行评价，选择silhouette指标最大的值对应的p值，输出最优的聚类数目，相比其他算法，本方法具有有效性和稳定性高的特点。

为了实现上述目的，本发明所采用的技术方案如下：

一种基于迭代自适应近邻传播算法的目标聚类方法，包括步骤：

S1.根据作战目标的性质进行敌我属性识别，将敌方目标与我方目标进行区分，然后将我方在战场上的目标实体T看做目标集中的数据元素，构成目标跟踪的数据集，将数据集中的所有数据点看作潜在的聚类中心，计算数据集中两两元素之间的相似度，构建迭代自适应近邻传播算法的相似度矩阵；

S2.采用自适应的方式对偏向系数p进行优化选取，利用偏向系数p对相似度矩阵中对角线上的相似度进行初始化；

S3.通过计算样本之间的可分性和紧密性，并利用silhouette指标作为评价标准，对聚类质量进行排序，选择最大的silhouette对应的偏向参数进行聚类输出；

S4.迭代计算吸引度矩阵A与归属度矩阵r，当算法未达到最大迭代次数，或聚类中心的稳定次数时，选取r(k，k)+A(k，k)＞0的值作为聚类中心，剩余点划入各自簇中，完成数据集中的目标聚类。

优选的，步骤S1所述的区分敌我属性的判断过程包括：

S101.设在时刻t时，传感器读取到的战场目标属性集合为K，则

K＝{T₁，T₂，T₃，……T_n}

(1)

在这个集合中，T表示战场上的目标实体，每一个目标的属性信息用Ti(i＝1，2，3......n)表示，则：

T_i＝{T_i1，T_i2，T_i3，……T_im}

(2)

其中，T_im为第i个目标的第m个特征信息，包括其批号、速度、位置、类型、敌我属性信息。

优选的，步骤S1所述的迭代自适应近邻传播算法的相似矩阵的构建过程包括：

S102.用高斯核函数作为相似度计算的方式，高斯核函数表达式如式(3)所示：

其中：当i＝j时，则k(x_i，x_j)＝1，σ为高斯核参数；

S103.根据相似度定义和式(3)，推导两点之间的相似度为：

(1)相似度表示：节点a，b之间的相似度，表示节点b作为节点a聚类中心的程度，记作S[a，b]，采用负平方误差(负欧几里得距离)表示，即：

S[a，b]＝-||x_a-x_b||² (4)

(2)推导得出两点之间的相似度可用式(5)表示：

其中：||xi-xj||²表示两点间的欧式距离，σ表示带宽参数，σ的值与聚类效果与泛化程度密切相关；

S104.根据式(5)所示的两点之间的相似度，构建所有数据点之间的相似度矩阵。

优选的，步骤S2所述的迭代自适应近邻传播算法的偏向系数p 的选取过程包括：

S201.第一次选取时，确定抽样组距为N，样本空间为(p_min，p_max)，将其平均分为10组，抽取每一组中平均值点，假设得到的为a_i(1≤i ≤10)，比较各自的silhouette指标，选取最大的值对应的a_i，对其所在的分组作下一次抽样，计该组最大值为p′_max，最小值为p′_min；

S202.第二次选取时，样本空间为(p′_min，p′_max)，对该组样本平均分为10组，抽取每一组平均值点，计算各自的silhouette指标，进行比较，依照此方法，对偏向系数进行迭代选取；

S203.直至抽取分组内的最大silhouette指标值连续3次不变时，选取silhouette指标最大值对应的p值作为最佳偏向系数输出，选取完成。

优选的，步骤S3所述的利用silhouette指标作为评价标准，对聚类目标进行输出的过程包括：

S301.利用silhouette指标作为评价标准，对聚类质量进行评价，具体计算方法为：

其中：sil代表silhouette的值；设将一个数据集划分为N个聚类 C_i(i＝1，2……N)，a(t)代表C_i中样本点t与其相同簇中其他点的平均不相似度或距离，称为簇内不相似度；d(t，C_i)为簇C_j的样本点t到另一个簇C_i的所有样本的平均不相似度或距离，b(t)＝min{d(t，C_i)}(i≠j)，称为簇间不相似度；a(t)值越大，表示样本a越不属于所在簇，由此体现簇内紧密性；b(t)值越大，表示样本点t越不属于其他簇，由此体现簇间可分性；一个簇中的所有样本的平均silhouette值∈[-1，1]，可表示此簇的聚类紧密型和可分性；整个样本的平均silhouette值可用于反映聚类质量，silhouette值越大，聚类质量越好；

S302.在比较p取不同值时的silhouette值时，选取其中最大的 silhouette对应的p值作为偏向参数，输出最优的聚类数目。

优选的，步骤S4所述的迭代计算吸引度矩阵A与归属度矩阵r 的过程包括：

S401.设节点b作为聚类中心对节点a的吸引能力为r，记作r[a， b]，即：

r[a，b]＝S[a，b]-max{A[a，k]+S[a，k]} (7)

r[b，b]＝S[b，b]-max{S[b，k]} (8)

在式(7)中：k∈1，2，……N，k≠b；在式(8)中：k∈1，2，……N， k≠b；所述k称为候选代表点，代表数据集中其他节点；

S402.设节点a选择节点b作为聚类中心的可能性为A，而如果a＝b，则A[b,b]代表节点b选择自己作为聚类中心的可能性，即节点b作为聚类中心的能力，即：

A[a，b]＝min{0，r[b，b]+∑max(0，r[k，b])} (9)

A[b，b]＝∑max{0，r[k，b]} (10)

在式(9)中：k∈1，2，……N，

b≠a；在式(10)中：k∈1，2，……N，k≠b；

S403.用λ表示迭代中的收敛程度，取作[0，1]之间，取λ＝0.9，即吸引度矩阵A与归属度矩阵r的迭代计算式为：

r_n＝(1-λ)*r_n+λ*r_n-1 (11)

A_n＝(1-λ)*A_n+λ*A_n-1 (12)。

优选的，本算法的算法流程包括：

一、输入：待聚类的数据集{T₁，T₂，T₃，……T_n}，高斯核参数σ，阻尼系数λ；

二、运算：进行算法处理；

三、输出：聚类结果。

优选的，所述的算法处理逻辑流程包括：

(1)区分敌我属性：根据作战目标的性质进行敌我属性识别，将敌方目标与我方目标进行区分；

(2)利用公式(5)，计算数据集中两两元素之间的相似度，构成相似度矩阵；

(3)按照步骤2方法，对偏向系数p进行优化选取，选取合适的 p值作为最佳偏向系数输出；

(4)计算吸引度矩阵A与归属度矩阵r；

(5)更新吸引度矩阵A_n与归属度矩阵r_n；

(6)若算法未达到最大迭代次数达到1000，或聚类中心的稳定次数达到50次时，转入步骤(5)，同时N＝N+1；否则转入步骤(7)；

(7)选取r(k,k)+A(k,k)>0的值作为聚类中心，剩余点划入各自簇中。

本发明的有益效果是：本发明公开了一种基于迭代自适应近邻传播算法的目标聚类方法，与现有技术相比，本发明的改进之处在于：

针对传统AP算法存在的缺陷，本发明设计了一种基于迭代自适应近邻传播算法的目标聚类方法，在利用高斯核函数进行相似度度量的基础上，采用迭代自适应方式实现对偏向参数p的自适应估计，即迭代自适应近邻传播算法：首先，设置高斯核函数，通过特征变换，将数据映射到高维，对相似度矩阵进行改良，构建对称相似度矩阵；其次，针对p值需要人工输入的问题，利用自适应的方法对p进行调整，利用silhouette指标对结果进行评价，选择silhouette指标最大的值对应的p值，输出最优的聚类数目，实验证明，本计算方法在研究目标跟踪问题时，相比其他算法具有有效性和稳定性高的优点。

附图说明

图1为本发明基于迭代自适应近邻传播算法的目标聚类方法的流程图。

图2为本发明基于迭代自适应近邻传播算法的目标聚类方法计算过程中的逻辑框图。

图3为本发明实施例1人工数据集Dataset1聚类结果图。

图4为本发明实施例1人工数据集Dataset2聚类结果图。

其中：在图3和图4中：(a)代表原数据集的分布情况，(b)代表分别表示各自由AP算法的聚类结果，(c)代表由本文算法的聚类结果。

具体实施方式

为了使本领域的普通技术人员能更好的理解本发明的技术方案，下面结合附图和实施例对本发明的技术方案做进一步的描述。

参照附图1-2所示的一种基于迭代自适应近邻传播算法的目标聚类方法，用于进行目标跟踪过程中的目标点的聚类，包括步骤：

S1.根据作战目标的性质进行敌我属性识别，将敌方目标与我方目标进行区分，然后将我方在战场上的目标实体T看做目标集中的数据元素，构成目标跟踪的数据集，将数据集中的所有数据点看作潜在的聚类中心，计算数据集中两两元素之间的相似度，构建迭代自适应近邻传播算法的相似度矩阵，具体过程为：

S101.区分敌我属性：设在时刻t时，传感器读取到的战场目标属性集合为K，则

K＝{T₁，T₂，T₃，……T_n}

(1)

在这个集合中，T表示战场上的目标实体，每一个目标的属性信息用Ti(i＝1，2，3……n)表示，则：

T_i＝{T_i1，T_i2，T_i3，……T_im}

(2)

其中，T_im为第i个目标的第m个特征信息，包括其批号、速度、位置、类型、敌我属性等信息；

S102.在传统AP算法中，两数据间相似度由负欧氏距离表示，但欧氏距离在高维及非线性数据分布中表现不佳，当数据集在低维线性不可分时，传统AP算法容易将属于不同类别的数据并为一类，从而影响聚类的效果；支持向量机(SVM)通过设置核函数k(x_i，x_j)，将样本映射到高维空间，构造出分类平面，区分样本间差异，统计学习理论认为，凡是满足Mercer条件的函数都可以作为SVM的核函数，相比其他核函数，高斯核函数具有很强的局部性特点，可以通过映射把原始特征转换到无穷维，且相比其他核函数预测精度更高，结果更稳定，因此采用高斯核函数作为相似度计算的方式，高斯核函数表达式如式(3)所示：

其中：当i＝j时，则k(x_i，x_j)＝1，σ为高斯核参数；

S103.根据相似度定义和式(3)，推导两点之间的相似度为：

(1)相似度表示：节点a，b之间的相似度，表示节点b作为节点a聚类中心的程度，记作S[a，b]，一般采用负平方误差(负欧几里得距离)表示，即：

S[a，b]＝-||x_a-x_b||² (4)

(2)推导得出两点之间的相似度可用式(5)表示：

其中：||xi-xj||²表示两点间的欧式距离，σ表示带宽参数，σ的值与聚类效果与泛化程度密切相关；如果σ的设定过小，可能出现过学习的情况(过学习也可称为过拟合现象)；如果设定过大，其对新样本的正确分类能力将降低，会出现将所有样本划分为一类的情况；

S104.根据式(5)所示的两点之间的相似度，构建所有数据点之间的相似度矩阵如表1所示：

表1：相似度矩阵

S2.选取迭代自适应近邻传播算法的偏向系数p，利用偏向系数p，对相似度矩阵中对角线上的相似度进行初始化，其具体过程包括：

S201.在相似度矩阵中，对角线上的相似度需要进行初始化，记为偏向参数p，表示各点作为聚类中心的可能性，它的数值大小与产生的聚类数目密切相关，p值越大，倾向于成为最终类别代表点的数据点越多，并且最终簇的数量越多；相反，如果p值较小，则最终输出簇的数量较少；

p的选取与聚类数目密切相关，从而影响聚类效果，对于给定的数据集，为了产生最优的聚类效果，需要对p值选取方式进行改进，由于消息传递由S[a，b]与r[a，b]共同完成，因此p的选取与聚类数目没有对应的线性关系；在一个数据集中，对p取不同值，不仅会对聚类数目产生影响，也会影响到结果，本方法的选取过程为对p进行迭代选取，

第一次选取时，确定抽样组距为N，样本空间为(p_min，p_max)，将其平均分为10组，抽取每一组中平均值点，假设得到的为a_i(1≤i≤ 10)，比较各自的silhouette指标，选取最大的值对应的a_i，对其所在的分组作下一次抽样，计该组最大值为p′_max，最小值为p′_min；

S3.通过计算样本之间的可分性和紧密性，并利用silhouette指标作为评价标准，对聚类质量进行排序，选择最大的silhouette对应的偏向参数进行聚类输出，其具体过程包括：

S301.为了对聚类的效果进行评估，本文选取silhouette指标作为评价标准，silhouette指标是一种无标签的评价指标，反映聚类结构的相同簇内成员之间紧密性情况以及不同簇成员之间的可分性情况，可用于对聚类质量进行评价，也可用于对最佳聚类数目进行估计，在战场环境，往往没有先验知识的积累，因此使用无标签的评价指标较为合理，其具体计算方法为：

其中：sil代表silhouette的值；设将一个数据集划分为N个聚类 C_i(i＝1，2......N)，a(t)代表C_i中样本点t与其相同簇中其他点的平均不相似度或距离，称为簇内不相似度；d(t，C_i)为簇C_j的样本点t到另一个簇C_i的所有样本的平均不相似度或距离，b(t)＝min{d(t,C_i)}(i≠j)，称为簇间不相似度；a(t)值越大，表示样本a越不属于所在簇，由此体现簇内紧密性；b(t)值越大，表示样本点t越不属于其他簇，由此体现簇间可分性；一个簇中的所有样本的平均silhouette值∈[-1，1]，可表示此簇的聚类紧密型和可分性；整个样本的平均silhouette值可用于反映聚类质量，silhouette值越大，聚类质量越好；

S4.迭代计算吸引度矩阵A与归属度矩阵r，当算法未达到最大迭代次数，或聚类中心的稳定次数时，选取r(k,k)+A(k,k)>0的值作为聚类中心，剩余点划入各自簇中，完成数据集中的目标聚类，其具体过程包括：

S401.计算吸引度：设节点b作为聚类中心对节点a的吸引能力为r，记作r[a，b]，即：

r[a，b]＝S[a，b]-max{A[a，k]+S[a，k]} (7)

r[b，b]＝S[b，b]-max{S[b，k]} (8)

S402.计算归属度：设节点a选择节点b作为聚类中心的可能性为 A，而如果a＝b，则A[b,b]代表节点b选择自己作为聚类中心的可能性，即节点b作为聚类中心的能力，即：

A[a，b]＝min{0，r[b，b]+∑max(0，r[k，b])} (9)

A[b，b]＝∑max{0，r[k，b]} (10)

在式(9)中：k∈1，2，……N，

b≠a；在式(10)中：k∈1，2，……N，k≠b；

S403.计算阻尼系数：用λ表示迭代中的收敛程度，取作[0，1]之间，本文取λ＝0.9，其作用于吸引度和归属度，λ值越小，AP算法全局搜索能力越强，迭代速度也会加快，即吸引度矩阵A与归属度矩阵r的迭代计算式为：

r_n＝(1-λ)*r_n+λ*r_n-1 (11)

A_n＝(1-λ)*A_n+λ*A_n-1 (12)。

本发明所述的基于迭代自适应近邻传播算法的目标聚类方法的算法流程包括：

步骤一、输入：待聚类的数据集{T₁，T₂，T₃，……T_n}，高斯核参数σ，阻尼系数λ；

步骤二、运算：进行算法处理；

步骤三、输出：聚类结果。

其中，所述步骤二的算法处理逻辑流程包括：

(4)计算吸引度矩阵A与归属度矩阵r；

(5)更新吸引度矩阵A_n与归属度矩阵r_n；

实施例1：S5.仿真验证

为了更加直观地说明本文算法在目标聚类中的可行性和有效性，选取人工数据集行仿真实验，通过与传统的近邻传播算法进行对比，检验本文算法的分群效能和优势；仿真实验环境为Intel(R)Core(TM) i5-9300H CPU@2.40GHz，16GB内存，Windows 10操作系统 MATLAB R2019b仿真实验平台。

S501.测试数据集

仿真实验所使用的数据集具体信息如表2所示：

表2：数据集属性信息

其中：Dataset1、Dataset2是人工生成的数据集，利用3项聚类评价指标，将本算法与传统AP算法相比较，对各自聚类结果进行评价；

S502.仿真结果

采用AP算法和本文算法对人工数据集1和人工数据集2的聚类实验结果如图3和图4所示：其中图3(a)与图4(a)分别表示原数据集的分布情况，图3(b)与图4(b)分别表示各自由AP算法的聚类结果，图3(c)与图4(c)分别表示由本文算法的聚类结果。

由图3和图4可知，在数据集Dataset1中，传统AP算法将数据集分为11类，而本文算法将数据集分为2类；在数据集Dataset2中，传统AP算法将数据分为11类，本文算法分为2类；可见，传统AP 算法在面对线性不可分的数据分布时聚类效果不佳，而本算法在面对线性不可分的数据分布时聚类具有好的有效性和稳定性。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于迭代自适应近邻传播算法的目标聚类方法，其特征在于，包括步骤：

S1.根据作战目标的性质进行敌我属性识别，将敌方目标与我方目标进行区分，然后将我方在战场上的作战目标T看做目标集中的数据元素，构成目标跟踪的数据集，再数据集中的所有数据点看作潜在的聚类中心，计算数据集中两两元素之间的相似度，构建迭代自适应近邻传播算法的相似度矩阵；

2.根据权利要求1所述的一种基于迭代自适应近邻传播算法的目标聚类方法，其特征在于，步骤S1所述的区分敌我属性的判断过程包括：

S101.设在时刻t时，传感器读取到的战场目标属性集合为K，则

K＝{T₁，T₂，T₃，……T_n} (1)

T_i＝{T_i1，T_i2，T_i3，……T_im} (2)

3.根据权利要求2所述的一种基于迭代自适应近邻传播算法的目标聚类方法，其特征在于，步骤S1所述的迭代自适应近邻传播算法的相似矩阵的构建过程包括：

其中：当i＝j时，则k(x_i，x_j)＝1，σ为高斯核参数；

S103.根据相似度定义和式(3)，推导两点之间的相似度为：

S[a，b]＝-||x_a-x_b||² (4)

(2)推导得出两点之间的相似度可用式(5)表示：

其中：||xi-xj||²表示两点间的欧式距离，σ表示带宽参数；

4.根据权利要求1所述的一种基于迭代自适应近邻传播算法的目标聚类方法，其特征在于，步骤S2所述的迭代自适应近邻传播算法的偏向系数p的选取过程包括：

S201.第一次选取时，确定抽样组距为N，样本空间为(p_min，p_max)，将其平均分为10组，抽取每一组中平均值点，得到a_i(1≤i≤10)，比较各自的silhouette指标，选取最大的值对应的a_i，对其所在的分组作下一次抽样，计该组最大值为p′_max，最小值为p′_min；

5.根据权利要求1所述的一种基于迭代自适应近邻传播算法的目标聚类方法，其特征在于，步骤S3所述的利用silhouette指标作为评价标准，对聚类目标进行输出的过程包括：

其中：sil代表silhouette的值；设将一个数据集划分为N个聚类C_i(i＝1，2......N)，a(t)代表C_i中样本点t与其相同簇中其他点的平均不相似度或距离，称为簇内不相似度；d(t，C_i)为簇C_j的样本点t到另一个簇C_i的所有样本的平均不相似度或距离，b(t)＝min{d(t，C_i)}(i≠j)，称为簇间不相似度；a(t)值越大，表示样本a越不属于所在簇；b(t)值越大，表示样本点t越不属于其他簇；一个簇中的所有样本的平均silhouette值∈[-1，1]；整个样本的平均silhouette值可用于反映聚类质量，silhouette值越大，聚类质量越好；

S302.在比较p取不同值时的silhouette值的过程中，选取其中最大的silhouette对应的p值作为偏向参数，输出最优的聚类数目。

6.根据权利要求1所述的一种基于迭代自适应近邻传播算法的目标聚类方法，其特征在于，步骤S4所述的迭代计算吸引度矩阵A与归属度矩阵r的过程包括：

S401.设节点b作为聚类中心对节点a的吸引能力为r，记作r[a，b]，即：

r[a，b]＝S[a，b]-max{A[a，k]+S[a，k]} (7)

r[b，b]＝S[b，b]-max{S[b，k]} (8)

在式(7)中：k∈1，2，……N，k≠b；在式(8)中：k∈1，2，……N，k≠b；所述k称为候选代表点，代表数据集中其他节点；

S402.设节点a选择节点b作为聚类中心的可能性为A，而如果a＝b，则A[b，b]代表节点b选择自己作为聚类中心的可能性，即节点b作为聚类中心的能力，即：

A[a，b]＝min{0，r[b，b]+∑max(0，r[k，b])} (9)

A[b，b]＝∑max{0，r[k，b]} (10)

在式(9)中：k∈1，2，……N，

b≠a；在式(10)中：k∈1，2，……N，k≠b；

r_n＝(1-λ)*r_n+λ*r_n-1 (11)

A_n＝(1-λ)*A_n+λ*A_n-1 (12)。