CN112926635B - 一种基于迭代自适应近邻传播算法的目标聚类方法 - Google Patents

一种基于迭代自适应近邻传播算法的目标聚类方法 Download PDF

Info

Publication number
CN112926635B
CN112926635B CN202110141014.5A CN202110141014A CN112926635B CN 112926635 B CN112926635 B CN 112926635B CN 202110141014 A CN202110141014 A CN 202110141014A CN 112926635 B CN112926635 B CN 112926635B
Authority
CN
China
Prior art keywords
clustering
target
similarity
value
silouette
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110141014.5A
Other languages
English (en)
Other versions
CN112926635A (zh
Inventor
刘昌云
段玉先
王刚
李松
郭相科
韦刚
张春梅
姚小强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Air Force Engineering University of PLA
Original Assignee
Air Force Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Air Force Engineering University of PLA filed Critical Air Force Engineering University of PLA
Priority to CN202110141014.5A priority Critical patent/CN112926635B/zh
Publication of CN112926635A publication Critical patent/CN112926635A/zh
Application granted granted Critical
Publication of CN112926635B publication Critical patent/CN112926635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于迭代自适应近邻传播算法的目标聚类方法,包括S1.计算数据集中两两元素之间的相似度,构建迭代自适应近邻传播算法的相似度矩阵;S2.对偏向系数p进行优化选取,利用偏向系数p求相似度矩阵;S3.计算样本间的可分性和紧密性,输出偏向参数;S4.计算吸引度矩阵A与归属度矩阵r,选取r(k,k)+A(k,k)>0的值作为聚类中心,完成目标聚类;本方法利用高斯核函数进行相似度度量的基础,采用迭代自适应方式对偏向参数p自适应估计,选择silhouette指标最大的值对应的p值,输出最优的聚类数目;实验证明本方法在研究目标跟踪时,相比其他算法具有有效性和稳定性高的特点。

Description

一种基于迭代自适应近邻传播算法的目标聚类方法
技术领域
本发明涉及目标跟踪算法技术领域,具体涉及一种基于迭代自适 应近邻传播算法的目标聚类方法。
背景技术
视觉目标(单目标)跟踪任务就是在给定某视频序列初始帧的目 标大小与位置的情况下,预测后续帧中该目标的大小与位置目标; 1999年,美国学者Blackman在研究目标跟踪问题时,最先将目标分 群看作是聚类问题;此后,有很多学者应用聚类方法为解决目标分群 问题提出了新的见解和思路,如快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)、迭代自 组织数据分析算法(Iterative Self-organizing Data Analysis,ISODATA)等,这些算法有以下两个弊端:
(1)上述算法在处理超球形分布效果良好,而在处理非凸形状 的簇时则需要进一步改进,在面对分布稀疏、非线性排列的目标时, 往往不能满足战场上对于目标分群的精确要求;(2)上述算法大多依 赖于初始聚类中心和聚类数目的选择,对异常值敏感,在缺乏先验知 识的条件下,很难做出准确判断,从而影响聚类效果;
因而采用一种迭代自适应近邻传播算法,该方法以聚类分析为理 论支撑,可以实现对战目标的自动聚类,而现有算法中多采用近邻算 法(Affinity Propagation,AP)进行迭代,近邻算法是在基于因子图以 及和积算法的基础上提出,基本思路是将所有数据点全部看作潜在的 聚类中心(exemplar),进而构建相似度矩阵,通过彼此间的信息传递 机制(A[]与r[]),不断搜索网络中符合作为最佳聚类中心条件的数据 点,使所有数据点到各自聚类中心的相似度之和最大,从而完成聚类; 可以看出,AP算法不断进行吸引度r[a,b]与归属度A[a,b]的迭代 运算,逐渐搜索网络中最佳聚类中心,可以不受初始中心点和聚类数 目的限制,通过目标的距离进行快速而准确的聚类;
虽然AP算法在处理多维、大规模的数据集时,往往能取得好的 结果,但分析其特性,AP算法仍存在以下不足:(1)AP算法仍是利 用基于中心的思想进行聚类分簇,因此在处理超球形分布的数据集时 效果良好,但在处理非凸形状的簇时,由于传统AP算法是基于欧氏 距离进行相似性的度量,因此可能会吸收其他簇内的样本,造成聚类 结果的偏差;(2)偏向参数p需要事先输入,其大小直接影响产生的 聚类数目,需要根据实际情况不断进行动态调整。
发明内容
针对上述存在的问题,一种基于迭代自适应近邻传播算法的目标 聚类方法,本方法在利用高斯核函数进行相似度度量的基础上:首先, 设置高斯核函数,通过特征变换,将数据映射到高维,对相似度矩阵 进行改良,构建对称相似度矩阵;其次,针对p值需要人工输入的问 题,利用自适应的方法对p进行调整,利用silhouette指标对结果进 行评价,选择silhouette指标最大的值对应的p值,输出最优的聚类 数目,相比其他算法,本方法具有有效性和稳定性高的特点。
为了实现上述目的,本发明所采用的技术方案如下:
一种基于迭代自适应近邻传播算法的目标聚类方法,包括步骤:
S1.根据作战目标的性质进行敌我属性识别,将敌方目标与我方 目标进行区分,然后将我方在战场上的目标实体T看做目标集中的数 据元素,构成目标跟踪的数据集,将数据集中的所有数据点看作潜在 的聚类中心,计算数据集中两两元素之间的相似度,构建迭代自适应 近邻传播算法的相似度矩阵;
S2.采用自适应的方式对偏向系数p进行优化选取,利用偏向系 数p对相似度矩阵中对角线上的相似度进行初始化;
S3.通过计算样本之间的可分性和紧密性,并利用silhouette指 标作为评价标准,对聚类质量进行排序,选择最大的silhouette对应 的偏向参数进行聚类输出;
S4.迭代计算吸引度矩阵A与归属度矩阵r,当算法未达到最大 迭代次数,或聚类中心的稳定次数时,选取r(k,k)+A(k,k)>0的值作为 聚类中心,剩余点划入各自簇中,完成数据集中的目标聚类。
优选的,步骤S1所述的区分敌我属性的判断过程包括:
S101.设在时刻t时,传感器读取到的战场目标属性集合为K,则
K={T1,T2,T3,……Tn}
(1)
在这个集合中,T表示战场上的目标实体,每一个目标的属性信 息用Ti(i=1,2,3......n)表示,则:
Ti={Ti1,Ti2,Ti3,……Tim}
(2)
其中,Tim为第i个目标的第m个特征信息,包括其批号、速度、 位置、类型、敌我属性信息。
优选的,步骤S1所述的迭代自适应近邻传播算法的相似矩阵的 构建过程包括:
S102.用高斯核函数作为相似度计算的方式,高斯核函数表达式 如式(3)所示:
Figure BDA0002926382940000041
其中:当i=j时,则k(xi,xj)=1,σ为高斯核参数;
S103.根据相似度定义和式(3),推导两点之间的相似度为:
(1)相似度表示:节点a,b之间的相似度,表示节点b作为节 点a聚类中心的程度,记作S[a,b],采用负平方误差(负欧几里得 距离)表示,即:
S[a,b]=-||xa-xb||2 (4)
(2)推导得出两点之间的相似度可用式(5)表示:
Figure BDA0002926382940000042
其中:||xi-xj||2表示两点间的欧式距离,σ表示带宽参数,σ的 值与聚类效果与泛化程度密切相关;
S104.根据式(5)所示的两点之间的相似度,构建所有数据点之 间的相似度矩阵。
优选的,步骤S2所述的迭代自适应近邻传播算法的偏向系数p 的选取过程包括:
S201.第一次选取时,确定抽样组距为N,样本空间为(pmin,pmax), 将其平均分为10组,抽取每一组中平均值点,假设得到的为ai(1≤i ≤10),比较各自的silhouette指标,选取最大的值对应的ai,对其所在 的分组作下一次抽样,计该组最大值为p′max,最小值为p′min
S202.第二次选取时,样本空间为(p′min,p′max),对该组样本平均 分为10组,抽取每一组平均值点,计算各自的silhouette指标,进行 比较,依照此方法,对偏向系数进行迭代选取;
S203.直至抽取分组内的最大silhouette指标值连续3次不变时, 选取silhouette指标最大值对应的p值作为最佳偏向系数输出,选取 完成。
优选的,步骤S3所述的利用silhouette指标作为评价标准,对聚 类目标进行输出的过程包括:
S301.利用silhouette指标作为评价标准,对聚类质量进行评价, 具体计算方法为:
Figure BDA0002926382940000051
其中:sil代表silhouette的值;设将一个数据集划分为N个聚类 Ci(i=1,2……N),a(t)代表Ci中样本点t与其相同簇中其他点的平均不 相似度或距离,称为簇内不相似度;d(t,Ci)为簇Cj的样本点t到另一 个簇Ci的所有样本的平均不相似度或距离,b(t)=min{d(t,Ci)}(i≠j), 称为簇间不相似度;a(t)值越大,表示样本a越不属于所在簇,由此 体现簇内紧密性;b(t)值越大,表示样本点t越不属于其他簇,由此 体现簇间可分性;一个簇中的所有样本的平均silhouette值∈[-1,1], 可表示此簇的聚类紧密型和可分性;整个样本的平均silhouette值可 用于反映聚类质量,silhouette值越大,聚类质量越好;
S302.在比较p取不同值时的silhouette值时,选取其中最大的 silhouette对应的p值作为偏向参数,输出最优的聚类数目。
优选的,步骤S4所述的迭代计算吸引度矩阵A与归属度矩阵r 的过程包括:
S401.设节点b作为聚类中心对节点a的吸引能力为r,记作r[a, b],即:
r[a,b]=S[a,b]-max{A[a,k]+S[a,k]} (7)
r[b,b]=S[b,b]-max{S[b,k]} (8)
在式(7)中:k∈1,2,……N,k≠b;在式(8)中:k∈1,2,……N, k≠b;所述k称为候选代表点,代表数据集中其他节点;
S402.设节点a选择节点b作为聚类中心的可能性为A,而如果a=b, 则A[b,b]代表节点b选择自己作为聚类中心的可能性,即节点b作为 聚类中心的能力,即:
A[a,b]=min{0,r[b,b]+∑max(0,r[k,b])} (9)
A[b,b]=∑max{0,r[k,b]} (10)
在式(9)中:k∈1,2,……N,
Figure BDA0002926382940000061
b≠a;在式(10)中:k∈1,2,……N,k≠b;
S403.用λ表示迭代中的收敛程度,取作[0,1]之间,取λ=0.9,即 吸引度矩阵A与归属度矩阵r的迭代计算式为:
rn=(1-λ)*rn+λ*rn-1 (11)
An=(1-λ)*An+λ*An-1 (12)。
优选的,本算法的算法流程包括:
一、输入:待聚类的数据集{T1,T2,T3,……Tn},高斯核参 数σ,阻尼系数λ;
二、运算:进行算法处理;
三、输出:聚类结果。
优选的,所述的算法处理逻辑流程包括:
(1)区分敌我属性:根据作战目标的性质进行敌我属性识别,将 敌方目标与我方目标进行区分;
(2)利用公式(5),计算数据集中两两元素之间的相似度,构成 相似度矩阵;
(3)按照步骤2方法,对偏向系数p进行优化选取,选取合适的 p值作为最佳偏向系数输出;
(4)计算吸引度矩阵A与归属度矩阵r;
(5)更新吸引度矩阵An与归属度矩阵rn
(6)若算法未达到最大迭代次数达到1000,或聚类中心的稳定 次数达到50次时,转入步骤(5),同时N=N+1;否则转入步骤(7);
(7)选取r(k,k)+A(k,k)>0的值作为聚类中心,剩余点划入各自 簇中。
本发明的有益效果是:本发明公开了一种基于迭代自适应近邻传 播算法的目标聚类方法,与现有技术相比,本发明的改进之处在于:
针对传统AP算法存在的缺陷,本发明设计了一种基于迭代自适 应近邻传播算法的目标聚类方法,在利用高斯核函数进行相似度度量 的基础上,采用迭代自适应方式实现对偏向参数p的自适应估计,即 迭代自适应近邻传播算法:首先,设置高斯核函数,通过特征变换, 将数据映射到高维,对相似度矩阵进行改良,构建对称相似度矩阵; 其次,针对p值需要人工输入的问题,利用自适应的方法对p进行调 整,利用silhouette指标对结果进行评价,选择silhouette指标最大的 值对应的p值,输出最优的聚类数目,实验证明,本计算方法在研究 目标跟踪问题时,相比其他算法具有有效性和稳定性高的优点。
附图说明
图1为本发明基于迭代自适应近邻传播算法的目标聚类方法的 流程图。
图2为本发明基于迭代自适应近邻传播算法的目标聚类方法计 算过程中的逻辑框图。
图3为本发明实施例1人工数据集Dataset1聚类结果图。
图4为本发明实施例1人工数据集Dataset2聚类结果图。
其中:在图3和图4中:(a)代表原数据集的分布情况,(b)代 表分别表示各自由AP算法的聚类结果,(c)代表由本文算法的聚类 结果。
具体实施方式
为了使本领域的普通技术人员能更好的理解本发明的技术方案, 下面结合附图和实施例对本发明的技术方案做进一步的描述。
参照附图1-2所示的一种基于迭代自适应近邻传播算法的目标聚 类方法,用于进行目标跟踪过程中的目标点的聚类,包括步骤:
S1.根据作战目标的性质进行敌我属性识别,将敌方目标与我方 目标进行区分,然后将我方在战场上的目标实体T看做目标集中的数 据元素,构成目标跟踪的数据集,将数据集中的所有数据点看作潜在 的聚类中心,计算数据集中两两元素之间的相似度,构建迭代自适应 近邻传播算法的相似度矩阵,具体过程为:
S101.区分敌我属性:设在时刻t时,传感器读取到的战场目标 属性集合为K,则
K={T1,T2,T3,……Tn}
(1)
在这个集合中,T表示战场上的目标实体,每一个目标的属性信 息用Ti(i=1,2,3……n)表示,则:
Ti={Ti1,Ti2,Ti3,……Tim}
(2)
其中,Tim为第i个目标的第m个特征信息,包括其批号、速度、 位置、类型、敌我属性等信息;
S102.在传统AP算法中,两数据间相似度由负欧氏距离表示, 但欧氏距离在高维及非线性数据分布中表现不佳,当数据集在低维线 性不可分时,传统AP算法容易将属于不同类别的数据并为一类,从 而影响聚类的效果;支持向量机(SVM)通过设置核函数k(xi,xj), 将样本映射到高维空间,构造出分类平面,区分样本间差异,统计学 习理论认为,凡是满足Mercer条件的函数都可以作为SVM的核函数, 相比其他核函数,高斯核函数具有很强的局部性特点,可以通过映射 把原始特征转换到无穷维,且相比其他核函数预测精度更高,结果更 稳定,因此采用高斯核函数作为相似度计算的方式,高斯核函数表达 式如式(3)所示:
Figure BDA0002926382940000101
其中:当i=j时,则k(xi,xj)=1,σ为高斯核参数;
S103.根据相似度定义和式(3),推导两点之间的相似度为:
(1)相似度表示:节点a,b之间的相似度,表示节点b作为节 点a聚类中心的程度,记作S[a,b],一般采用负平方误差(负欧几 里得距离)表示,即:
S[a,b]=-||xa-xb||2 (4)
(2)推导得出两点之间的相似度可用式(5)表示:
Figure BDA0002926382940000102
其中:||xi-xj||2表示两点间的欧式距离,σ表示带宽参数,σ的 值与聚类效果与泛化程度密切相关;如果σ的设定过小,可能出现过 学习的情况(过学习也可称为过拟合现象);如果设定过大,其对新 样本的正确分类能力将降低,会出现将所有样本划分为一类的情况;
S104.根据式(5)所示的两点之间的相似度,构建所有数据点之 间的相似度矩阵如表1所示:
表1:相似度矩阵
Figure BDA0002926382940000111
S2.选取迭代自适应近邻传播算法的偏向系数p,利用偏向系数p, 对相似度矩阵中对角线上的相似度进行初始化,其具体过程包括:
S201.在相似度矩阵中,对角线上的相似度需要进行初始化,记 为偏向参数p,表示各点作为聚类中心的可能性,它的数值大小与产 生的聚类数目密切相关,p值越大,倾向于成为最终类别代表点的数 据点越多,并且最终簇的数量越多;相反,如果p值较小,则最终输 出簇的数量较少;
p的选取与聚类数目密切相关,从而影响聚类效果,对于给定的 数据集,为了产生最优的聚类效果,需要对p值选取方式进行改进, 由于消息传递由S[a,b]与r[a,b]共同完成,因此p的选取与聚类数目没 有对应的线性关系;在一个数据集中,对p取不同值,不仅会对聚类 数目产生影响,也会影响到结果,本方法的选取过程为对p进行迭代 选取,
第一次选取时,确定抽样组距为N,样本空间为(pmin,pmax),将 其平均分为10组,抽取每一组中平均值点,假设得到的为ai(1≤i≤ 10),比较各自的silhouette指标,选取最大的值对应的ai,对其所在的 分组作下一次抽样,计该组最大值为p′max,最小值为p′min
S202.第二次选取时,样本空间为(p′min,p′max),对该组样本平均 分为10组,抽取每一组平均值点,计算各自的silhouette指标,进行 比较,依照此方法,对偏向系数进行迭代选取;
S203.直至抽取分组内的最大silhouette指标值连续3次不变时, 选取silhouette指标最大值对应的p值作为最佳偏向系数输出,选取 完成。
S3.通过计算样本之间的可分性和紧密性,并利用silhouette指 标作为评价标准,对聚类质量进行排序,选择最大的silhouette对应 的偏向参数进行聚类输出,其具体过程包括:
S301.为了对聚类的效果进行评估,本文选取silhouette指标作为 评价标准,silhouette指标是一种无标签的评价指标,反映聚类结构的 相同簇内成员之间紧密性情况以及不同簇成员之间的可分性情况,可 用于对聚类质量进行评价,也可用于对最佳聚类数目进行估计,在战 场环境,往往没有先验知识的积累,因此使用无标签的评价指标较为合理,其具体计算方法为:
Figure BDA0002926382940000121
其中:sil代表silhouette的值;设将一个数据集划分为N个聚类 Ci(i=1,2......N),a(t)代表Ci中样本点t与其相同簇中其他点的平均不 相似度或距离,称为簇内不相似度;d(t,Ci)为簇Cj的样本点t到另一 个簇Ci的所有样本的平均不相似度或距离,b(t)=min{d(t,Ci)}(i≠j), 称为簇间不相似度;a(t)值越大,表示样本a越不属于所在簇,由此 体现簇内紧密性;b(t)值越大,表示样本点t越不属于其他簇,由此 体现簇间可分性;一个簇中的所有样本的平均silhouette值∈[-1,1], 可表示此簇的聚类紧密型和可分性;整个样本的平均silhouette值可 用于反映聚类质量,silhouette值越大,聚类质量越好;
S302.在比较p取不同值时的silhouette值时,选取其中最大的 silhouette对应的p值作为偏向参数,输出最优的聚类数目。
S4.迭代计算吸引度矩阵A与归属度矩阵r,当算法未达到最大 迭代次数,或聚类中心的稳定次数时,选取r(k,k)+A(k,k)>0的值作为 聚类中心,剩余点划入各自簇中,完成数据集中的目标聚类,其具体 过程包括:
S401.计算吸引度:设节点b作为聚类中心对节点a的吸引能力 为r,记作r[a,b],即:
r[a,b]=S[a,b]-max{A[a,k]+S[a,k]} (7)
r[b,b]=S[b,b]-max{S[b,k]} (8)
在式(7)中:k∈1,2,……N,k≠b;在式(8)中:k∈1,2,……N, k≠b;所述k称为候选代表点,代表数据集中其他节点;
S402.计算归属度:设节点a选择节点b作为聚类中心的可能性为 A,而如果a=b,则A[b,b]代表节点b选择自己作为聚类中心的可能 性,即节点b作为聚类中心的能力,即:
A[a,b]=min{0,r[b,b]+∑max(0,r[k,b])} (9)
A[b,b]=∑max{0,r[k,b]} (10)
在式(9)中:k∈1,2,……N,
Figure BDA0002926382940000141
b≠a;在式(10)中:k∈1,2,……N,k≠b;
S403.计算阻尼系数:用λ表示迭代中的收敛程度,取作[0,1]之 间,本文取λ=0.9,其作用于吸引度和归属度,λ值越小,AP算法全 局搜索能力越强,迭代速度也会加快,即吸引度矩阵A与归属度矩 阵r的迭代计算式为:
rn=(1-λ)*rn+λ*rn-1 (11)
An=(1-λ)*An+λ*An-1 (12)。
本发明所述的基于迭代自适应近邻传播算法的目标聚类方法的 算法流程包括:
步骤一、输入:待聚类的数据集{T1,T2,T3,……Tn},高斯 核参数σ,阻尼系数λ;
步骤二、运算:进行算法处理;
步骤三、输出:聚类结果。
其中,所述步骤二的算法处理逻辑流程包括:
(1)区分敌我属性:根据作战目标的性质进行敌我属性识别,将 敌方目标与我方目标进行区分;
(2)利用公式(5),计算数据集中两两元素之间的相似度,构成 相似度矩阵;
(3)按照步骤2方法,对偏向系数p进行优化选取,选取合适的 p值作为最佳偏向系数输出;
(4)计算吸引度矩阵A与归属度矩阵r;
(5)更新吸引度矩阵An与归属度矩阵rn
(6)若算法未达到最大迭代次数达到1000,或聚类中心的稳定 次数达到50次时,转入步骤(5),同时N=N+1;否则转入步骤(7);
(7)选取r(k,k)+A(k,k)>0的值作为聚类中心,剩余点划入各自 簇中。
实施例1:S5.仿真验证
为了更加直观地说明本文算法在目标聚类中的可行性和有效性, 选取人工数据集行仿真实验,通过与传统的近邻传播算法进行对比, 检验本文算法的分群效能和优势;仿真实验环境为Intel(R)Core(TM) i5-9300H CPU@2.40GHz,16GB内存,Windows 10操作系统 MATLAB R2019b仿真实验平台。
S501.测试数据集
仿真实验所使用的数据集具体信息如表2所示:
表2:数据集属性信息
Figure RE-GDA0003047470670000151
其中:Dataset1、Dataset2是人工生成的数据集,利用3项聚类 评价指标,将本算法与传统AP算法相比较,对各自聚类结果进行评 价;
S502.仿真结果
采用AP算法和本文算法对人工数据集1和人工数据集2的聚类 实验结果如图3和图4所示:其中图3(a)与图4(a)分别表示原 数据集的分布情况,图3(b)与图4(b)分别表示各自由AP算法 的聚类结果,图3(c)与图4(c)分别表示由本文算法的聚类结果。
由图3和图4可知,在数据集Dataset1中,传统AP算法将数据 集分为11类,而本文算法将数据集分为2类;在数据集Dataset2中, 传统AP算法将数据分为11类,本文算法分为2类;可见,传统AP 算法在面对线性不可分的数据分布时聚类效果不佳,而本算法在面对线性不可分的数据分布时聚类具有好的有效性和稳定性。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本 行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施 例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和 范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落 入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求 书及其等效物界定。

Claims (6)

1.一种基于迭代自适应近邻传播算法的目标聚类方法,其特征在于,包括步骤:
S1.根据作战目标的性质进行敌我属性识别,将敌方目标与我方目标进行区分,然后将我方在战场上的作战目标T看做目标集中的数据元素,构成目标跟踪的数据集,再数据集中的所有数据点看作潜在的聚类中心,计算数据集中两两元素之间的相似度,构建迭代自适应近邻传播算法的相似度矩阵;
S2.采用自适应的方式对偏向系数p进行优化选取,利用偏向系数p对相似度矩阵中对角线上的相似度进行初始化;
S3.通过计算样本之间的可分性和紧密性,并利用silhouette指标作为评价标准,对聚类质量进行排序,选择最大的silhouette对应的偏向参数进行聚类输出;
S4.迭代计算吸引度矩阵A与归属度矩阵r,当算法未达到最大迭代次数,或聚类中心的稳定次数时,选取r(k,k)+A(k,k)>0的值作为聚类中心,剩余点划入各自簇中,完成数据集中的目标聚类。
2.根据权利要求1所述的一种基于迭代自适应近邻传播算法的目标聚类方法,其特征在于,步骤S1所述的区分敌我属性的判断过程包括:
S101.设在时刻t时,传感器读取到的战场目标属性集合为K,则
K={T1,T2,T3,……Tn} (1)
在这个集合中,T表示战场上的目标实体,每一个目标的属性信息用Ti(i=1,2,3……n)表示,则:
Ti={Ti1,Ti2,Ti3,……Tim} (2)
其中,Tim为第i个目标的第m个特征信息,包括其批号、速度、位置、类型、敌我属性信息。
3.根据权利要求2所述的一种基于迭代自适应近邻传播算法的目标聚类方法,其特征在于,步骤S1所述的迭代自适应近邻传播算法的相似矩阵的构建过程包括:
S102.用高斯核函数作为相似度计算的方式,高斯核函数表达式如式(3)所示:
Figure FDA0002926382930000021
其中:当i=j时,则k(xi,xj)=1,σ为高斯核参数;
S103.根据相似度定义和式(3),推导两点之间的相似度为:
(1)相似度表示:节点a,b之间的相似度,表示节点b作为节点a聚类中心的程度,记作S[a,b],采用负平方误差(负欧几里得距离)表示,即:
S[a,b]=-||xa-xb||2 (4)
(2)推导得出两点之间的相似度可用式(5)表示:
Figure FDA0002926382930000022
其中:||xi-xj||2表示两点间的欧式距离,σ表示带宽参数;
S104.根据式(5)所示的两点之间的相似度,构建所有数据点之间的相似度矩阵。
4.根据权利要求1所述的一种基于迭代自适应近邻传播算法的目标聚类方法,其特征在于,步骤S2所述的迭代自适应近邻传播算法的偏向系数p的选取过程包括:
S201.第一次选取时,确定抽样组距为N,样本空间为(pmin,pmax),将其平均分为10组,抽取每一组中平均值点,得到ai(1≤i≤10),比较各自的silhouette指标,选取最大的值对应的ai,对其所在的分组作下一次抽样,计该组最大值为p′max,最小值为p′min
S202.第二次选取时,样本空间为(p′min,p′max),对该组样本平均分为10组,抽取每一组平均值点,计算各自的silhouette指标,进行比较,依照此方法,对偏向系数进行迭代选取;
S203.直至抽取分组内的最大silhouette指标值连续3次不变时,选取silhouette指标最大值对应的p值作为最佳偏向系数输出,选取完成。
5.根据权利要求1所述的一种基于迭代自适应近邻传播算法的目标聚类方法,其特征在于,步骤S3所述的利用silhouette指标作为评价标准,对聚类目标进行输出的过程包括:
S301.利用silhouette指标作为评价标准,对聚类质量进行评价,具体计算方法为:
Figure FDA0002926382930000031
其中:sil代表silhouette的值;设将一个数据集划分为N个聚类Ci(i=1,2......N),a(t)代表Ci中样本点t与其相同簇中其他点的平均不相似度或距离,称为簇内不相似度;d(t,Ci)为簇Cj的样本点t到另一个簇Ci的所有样本的平均不相似度或距离,b(t)=min{d(t,Ci)}(i≠j),称为簇间不相似度;a(t)值越大,表示样本a越不属于所在簇;b(t)值越大,表示样本点t越不属于其他簇;一个簇中的所有样本的平均silhouette值∈[-1,1];整个样本的平均silhouette值可用于反映聚类质量,silhouette值越大,聚类质量越好;
S302.在比较p取不同值时的silhouette值的过程中,选取其中最大的silhouette对应的p值作为偏向参数,输出最优的聚类数目。
6.根据权利要求1所述的一种基于迭代自适应近邻传播算法的目标聚类方法,其特征在于,步骤S4所述的迭代计算吸引度矩阵A与归属度矩阵r的过程包括:
S401.设节点b作为聚类中心对节点a的吸引能力为r,记作r[a,b],即:
r[a,b]=S[a,b]-max{A[a,k]+S[a,k]} (7)
r[b,b]=S[b,b]-max{S[b,k]} (8)
在式(7)中:k∈1,2,……N,k≠b;在式(8)中:k∈1,2,……N,k≠b;所述k称为候选代表点,代表数据集中其他节点;
S402.设节点a选择节点b作为聚类中心的可能性为A,而如果a=b,则A[b,b]代表节点b选择自己作为聚类中心的可能性,即节点b作为聚类中心的能力,即:
A[a,b]=min{0,r[b,b]+∑max(0,r[k,b])} (9)
A[b,b]=∑max{0,r[k,b]} (10)
在式(9)中:k∈1,2,……N,
Figure FDA0002926382930000041
b≠a;在式(10)中:k∈1,2,……N,k≠b;
S403.用λ表示迭代中的收敛程度,取作[0,1]之间,取λ=0.9,即吸引度矩阵A与归属度矩阵r的迭代计算式为:
rn=(1-λ)*rn+λ*rn-1 (11)
An=(1-λ)*An+λ*An-1 (12)。
CN202110141014.5A 2021-02-01 2021-02-01 一种基于迭代自适应近邻传播算法的目标聚类方法 Active CN112926635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110141014.5A CN112926635B (zh) 2021-02-01 2021-02-01 一种基于迭代自适应近邻传播算法的目标聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110141014.5A CN112926635B (zh) 2021-02-01 2021-02-01 一种基于迭代自适应近邻传播算法的目标聚类方法

Publications (2)

Publication Number Publication Date
CN112926635A CN112926635A (zh) 2021-06-08
CN112926635B true CN112926635B (zh) 2022-10-04

Family

ID=76169467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110141014.5A Active CN112926635B (zh) 2021-02-01 2021-02-01 一种基于迭代自适应近邻传播算法的目标聚类方法

Country Status (1)

Country Link
CN (1) CN112926635B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516388A (zh) * 2021-07-09 2021-10-19 中国人民解放军军事科学院评估论证研究中心 基于熵权的加权主成分距离聚类的创新发展态势评估方法
CN114330597B (zh) * 2022-01-14 2022-08-19 阿里巴巴达摩院(杭州)科技有限公司 用户聚类方法、数据聚类方法、装置、电子设备
CN114900871A (zh) * 2022-05-31 2022-08-12 长春工业大学 一种基于亲和传播和混沌狮群的无线传感器网络分簇方法
CN115545108B (zh) * 2022-10-09 2023-08-04 贵州电网有限责任公司 一种基于云计算的大数据信息分析系统及方法
CN116628289B (zh) * 2023-07-25 2023-12-01 泰能天然气有限公司 一种供暖系统运行数据处理方法及策略优化系统
CN116977857B (zh) * 2023-08-07 2024-06-11 广东粤港供水有限公司 一种基于深度学习的隧道裂缝自动检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171012A (zh) * 2018-01-17 2018-06-15 河南师范大学 一种基因分类方法与装置
CN110543913A (zh) * 2019-09-04 2019-12-06 西南科技大学 一种基于遗传算法的近邻传播聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171012A (zh) * 2018-01-17 2018-06-15 河南师范大学 一种基因分类方法与装置
CN110543913A (zh) * 2019-09-04 2019-12-06 西南科技大学 一种基于遗传算法的近邻传播聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
近邻传播聚类算法的优化;唐丹等;《计算机应用》;20170615;全文 *

Also Published As

Publication number Publication date
CN112926635A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN112926635B (zh) 一种基于迭代自适应近邻传播算法的目标聚类方法
CN115577275A (zh) 一种基于lof和孤立森林的时序数据异常监测系统及方法
CN112101430B (zh) 用于图像目标检测处理的锚框生成方法及轻量级目标检测方法
CN108733976B (zh) 基于融合生物与拓扑特征的关键蛋白质识别方法
Saha et al. A new multiobjective clustering technique based on the concepts of stability and symmetry
US20240311651A1 (en) Method and apparatus for searching for neural network ensemble model, and electronic device
CN104573130A (zh) 基于群体计算的实体解析方法及装置
CN111046979A (zh) 一种基于小样本学习的badcase发现方法及系统
CN113344128B (zh) 一种基于微簇的工业物联网自适应流聚类方法及装置
CN114116829A (zh) 异常数据分析方法、异常数据分析系统和存储介质
CN114565807A (zh) 训练目标图像检索模型的方法和装置
CN113435108A (zh) 一种基于改进的鲸鱼优化算法的战场目标分群方法
CN110544047A (zh) 一种不良数据辨识方法
CN115309906A (zh) 一种基于知识图谱技术的数据智能分类技术
Xing et al. Fuzzy c-means algorithm automatically determining optimal number of clusters
CN115114484A (zh) 异常事件检测方法、装置、计算机设备和存储介质
Rahman et al. An efficient approach for selecting initial centroid and outlier detection of data clustering
KR102158049B1 (ko) Cf 트리를 활용한 범위 질의 기반의 데이터 클러스터링 장치 및 방법
Cai et al. Fuzzy criteria in multi-objective feature selection for unsupervised learning
CN114529096A (zh) 基于三元闭包图嵌入的社交网络链路预测方法及系统
CN112308160A (zh) 一种k—均值聚类人工智能优化算法
Yang et al. Adaptive density peak clustering for determinging cluster center
Diallo et al. Deciphering Clusters With a Deterministic Measure of Clustering Tendency
Tareq et al. A new density-based method for clustering data stream using genetic algorithm
CN110766087A (zh) 一种基于离差最大化法改进k-means的提高数据聚类质量的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant