CN104008127A - 一种基于聚类算法的群组识别方法 - Google Patents
一种基于聚类算法的群组识别方法 Download PDFInfo
- Publication number
- CN104008127A CN104008127A CN201410162568.3A CN201410162568A CN104008127A CN 104008127 A CN104008127 A CN 104008127A CN 201410162568 A CN201410162568 A CN 201410162568A CN 104008127 A CN104008127 A CN 104008127A
- Authority
- CN
- China
- Prior art keywords
- clustering
- target
- class
- targets
- group identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于聚类算法的群组识别方法,属于信息处理技术领域。所述方法以多个目标的状态信息为分析对象,包括粗聚类和层次聚类两个步骤。首先提取目标特征,包括经度、纬度、高度、速度大小及方向;接着采用均值漂移算法对目标归一化的经度、纬度和速度方向特征进行聚类,得到初步的群组发现结果,称为粗聚类结果。在聚类时设置了类内最少目标门限值,起到了排除单个噪声点的作用;最后利用目标的高度和运动速度特征对每个类分别进行多层次均值漂移聚类,进一步发现尚未被识别的群组,排除类内的噪声,得到更为准确的最终结果。
Description
技术领域
本发明涉及一种基于聚类算法的群组识别方法,属于信息处理技术领域。
背景技术
团队协作是现代社会的重要特征之一,多个相同或不同类型的成员组成团队,相互协作完成既定任务。相应地,目标状态分析也由以往对单个目标特征和描述的研究逐渐过渡到对群体目标的组织结构和空间分布特性的研究。对此首先要解决的就是群组识别的问题。通过对观测范围内的单目标的属性特征进行聚类,在特征空间中寻找特征点分布密集的区域,从而判断群组的个数,并识别各群组的成员。
群组识别可减轻数据分析人员的认知压力,是描述所观测空间的状态和形势的一种重要概念和方法。与原始的目标状态信息集相比,群组挖掘减少了指挥员需要关注的“焦点”数量,可以大大提高指挥员的决策速度和质量。目前,群组发现技术是数据挖掘领域的研究热点,具有重要的理论和应用双重价值。
聚类是识别群组的主要技术手段,目前有代表性的聚类方法包括:层次聚类、K均值聚类、均值漂移、谱聚类和基于人工神经网络的聚类等方法。其中,层次聚类方法简单,但当聚类的初始准确性不高时,无法进行回溯改进;谱聚类和基于神经网络的聚类方法聚类效果较好,但计算复杂,难以满足实时性要求;K均值聚类法计算简单,但需要先验知识(如分群个数K等)作为输入参数,若采用预先人工确定K值,通过随机选择初始化聚类中心的方法,智能化程度不高,而且聚类结果容易陷入局部最优解。均值漂移是一种无参数的概率密度函数估计算法,该方法在聚类时无需提供样本分布的先验知识,仅从数据本身来估计其分布情况。基于均值漂移的聚类方法可以自动判断群组个数,但识别结果对带宽尺度的变化很敏感,单一尺度的带宽无法应对数据分布的多样化。谱聚类方法具有严密的数学理论,但是计算开销大。人工神经网络模型聚类精度较高,聚类速度快,但是需要额外的数据来预先训练模型参数。
此外,在整个观测空间中,除了目标群之外还存在多种多样的单个目标,这些单个目标的分布具有不确定性,可以看作随机的噪声,传统的聚类分析算法并没有较好的排除噪声的能力。因此有必要提出一种智能化的群组识别方法,自动、准确地识别目标状态数据中的群组,同时去掉无关的噪声点。
发明内容
针对现有技术的不足,本发明提供一种基于聚类算法的群组识别系统及方法,相比传统的识别方法,本发明提供的系统及方法能以较大的概率准确地识别出观测范围内的群组,同时排除掉无关的噪声点。
为实现所述发明目的,本发明的一方面提供基于聚类算法的群组识别方法,其包括:S01:获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;S02:从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类;S03:从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集对每一类中的目标进行层次聚类形成待识别的群组。
优选地,采用均值漂移算法根据第一特征向量集对多个目标进行粗聚类形成多个类。
优选地,粗聚类包括设置类内目标门限数的步骤。
优选地,,采用均值漂移算法根据第二特征向量集对粗聚类形成多个类中的每一类进行层次聚类形成待识别的群组。
优选地,,层次聚类包括设置类内目标门限数的步骤。
为实现所述发明目的,本发明的另一方面提供一种基于聚类算法的群组识别系统,其包括:信息采集模块,其用于获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;粗聚类模块,其从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类,以及层次聚类模块,从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集每一类中的目标进行层次聚类形成待识别的群组。
优选地,粗聚类模块采用均值漂移算法根据第一特征向量集对多个目标进行粗聚类形成多个类。
优选地,粗聚类模块包括先验参数输入模块,先验参数输入模块输入了类内目标门限数。
优选地,层次聚类模块采用均值漂移算法根据第二特征向量集对粗聚类形成多个类的每一类进行层次聚类形成待识别的群组。
优选地,层次聚类模块包括先验参数输入模块,先验参数输入模块输入了类内目标门限数。
与现有技术相比,本发明提供的基于聚类算法的群组识别方法能以较大的概率准确地识别出观测范围内的群组,同时排除掉无关的噪声点。
附图说明
图1是基于聚类算法的群组识别的流程图;
图2是基于均值漂移的粗聚类算法示意图;
图3是层次聚类过程示意图。
具体实施方式
下面结合附图详细说明本发明。
图1是基于聚类算法的群组识别的流程图。如图1所示,本发明提供的基于聚类算法的群组识别方法包括:
S01:获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;
S02:从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类;
S03:从待分析的对象目标集中提取出每一类的中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集对每一类中的目标进行层次聚类形成待识别的群组。
仍如图1所示,本发明提供的基于聚类算法的群组识别系统包括:基于聚类算法的群组识别系统,其包括:信息采集模块,其用于获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;粗聚类模块,其从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类,以及层次聚类模块,从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集每一类中的目标进行层次聚类形成待识别的群组。
图2是基于均值漂移的粗聚类算法示意图。如图2所示,对多个目标进粗聚类包括:
S02-1:对第一特征向量集中每一维度进行归一化处理组成归一化第一特征向量集 其中 其中 分别指第i个目标的经度、纬度和速度方向的归一化值;其中,采用下式对目标的经度、纬度和速度方向进行归一化处理:
xki表示目标集中第i个目标第k个维度的特征值,表示归一化处理后的特征值,xkmax和xkmin表示所有目标的第k个维度的最大值和最小值,k∈{1,2,3};
S02-2:输入先验参数,包括高斯核函数带宽H1、迭代终止阈值ε1和类内目标数门限C1的值;
S02-3:随机选择一个目标作为聚类起始样本点,其归一化特征向量记为
S02-4:采用下列公式计算多个目标中的第i个目标的均值漂移向量:
其中,为零均值、方差为H1的高斯核函数;
S02-5:计算并判断是否成立,如果是,则将样本点移动到即将赋值给并返回步骤S02-4,否则,迭代终止,即,收敛于模点将此时的赋值给
S02-6:计算i+1并赋值给i;
S02-7:判断i>N1是否成立,如果是,则执行步骤S02-8,否则返回步骤S02-4;
S02-8:将收敛于相同模点的目标归为同一类,计算各个类内目标数目,将类内目标数目大于目标数门限C1的作为粗聚类结果从而得到多个类。
仍如图2所示,本发明提供的粗聚类模块包括:
归一化处理模块,其对第一特征向量集中每一维度进行归一化处理组成归一化第一特征向量集
先验参数输入模块,其用于输入先验参数,所述参数包括高斯核函数带宽H1、迭代终止阈值ε1和类内目标数门限C1的值;
均值漂移向量计算模块,其用于随机选择一个目标作为聚类起始样本点,起始样本点的归一化特征向量记为
还用于采用下列公式计算多个目标中任一个目标的均值漂移向量:
其中,为零均值、方差为H1的高斯核函数;
还用于计算并判断是否成立,如果是,则将样本点移动到即将赋值给并重新计算该目标的均值漂移向量,否则,迭代终止,即,收敛于模点将此时的赋值给以及
粗聚类结果输出模块,其将收敛于相同模点的目标归为同一类,计算各个类内目标数目,将类内目标数目大于目标数门限C1的作为粗聚类结果从而得到多个类。
图3是层次聚类过程示意图,如图3所示,本发明提供的层次聚类包括:
S03-1:对第二特征向量集的每一维度进行归一化处理得到该类中归一化第二特征向量集其中N2≤N1;其中分别指类内第m个目标的高度和速度的大小的归一化值,其中,采用下式对目标的高度和目标的速度大小进行归一化处理:
ykm表示某类中第m个目标的第k个维度的特征值,表示归一化处理后的特征值,ykmax和ykmin表示所有目标的第k个维度的最大值和最小值,k∈{5,6};
S03-2:计算类内每一维度的方差,即
即采用下式计算类内目标的高度的方差:
S03-3:若该类内每一维度的方差都均低于所设定的门限值,则该类为一个识别出的群组,而后输出,否则执行下一步;
S03-4:输入先验参数,包括高斯核函数带宽H2、迭代终止阈值ε2和类内目标数门限C2的值;
S03-5:随机选择该类内一个目标作为聚类起始样本点,起始样本点的特征向量记为记
S03-6:采用下列公式计算该类第m个目标的均值漂移向量:
其中,为零均值、方差为H2的高斯核函数;
S03-7:计算并判断是否成立,如果是,则将样本点移动到并返回步骤S03-6,否则,迭代终止,即,收敛于模点将赋值给
S03-8:计算m+1并赋值给m;
S03-9:判断m>N2是否成立,如果是,则执行步骤S03-10,否则返回步骤S03-6:
S03-10:将收敛于相同模点的目标归为同一类,计算各个类内目标数目,将类内目标数目大于目标数门限C2的作为层次聚类结果从而又得到多个新的类,而后返回到步骤S03-2。
仍如图3所示,本发明提供的层次聚类模块包括:
归一化处理模块,其对第二特征向量集的每一维度进行归一化处理得到该类中归一化第二特征向量集
方差计算模块,其用于计算类内每一维度的方差,即
即采用下式计算类内目标的高度的方差:
门限判断模块,若该类内每一维度的方差都均低于所设定的门限值,则该类为一个识别出的群组,而后输出;
先验参数输入模块,其用于输入先验参数,包括高斯核函数带宽H2、迭代终止阈值ε2和类内目标数门限C2的值;
均值漂移向量计算模块,其用于随机选择该类内一个目标作为聚类起始样本点,其特征向量记为记
还用于采用下列公式计算该类任一个目标的均值漂移向量:
其中,为零均值、方差为H2的高斯核函数;
还用于计算并判断是否成立,如果是,则将样本点移动到并重新计算目标的均值漂移向量,否则,迭代终止,即,收敛于模点将赋值给
层次聚类结果输出模块,其将收敛于相同模点的目标归为同一类,计算各个类内目标数目,将类内目标数目大于目标数门限C2的做为层次聚类结果从而又得到多个新的类。
与传统的均值漂移聚类方法相比,本发明的显著优点为:(1)融合均值漂移算法和层次聚类算法的优点,发现群组的准确率更高。(2)在进行聚类时,由于设置了类内最少目标门限值,具有排除掉无关的噪声点的能力。
以上结合附图,详细说明了本发明的工作原理。但是本领域的普通技术人员应当明白,说明书仅是用于解释权利要求书。但本发明的保护范围并不局限于说明书。任何熟悉本技术领域的技术人员在本发明批露的技术范围内,可轻易想到的变化或者替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (10)
1.一种基于聚类算法的群组识别方法,其特征在于包括:
S01:获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;
S02:从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类;
S03:从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集对每一类中的目标进行层次聚类形成待识别的群组。
2.根据权利要求1所述的基于聚类算法的群组识别方法,其特征在于,采用均值漂移算法根据第一特征向量集对多个目标进行粗聚类形成多个类。
3.根据权利要求2所述的基于聚类算法的群组识别方法,其特征在于,粗聚类包括设置类内目标门限数的步骤。
4.根据权利要求3所述的基于聚类算法的群组识别方法,其特征在于,采用均值漂移算法根据第二特征向量集对粗聚类形成多个类中的每一类进行层次聚类形成待识别的群组。
5.根据权利要求4所述的基于聚类算法的群组识别方法,其特征在于,层次聚类包括设置类内目标门限数的步骤。
6.一种基于聚类算法的群组识别系统,其特征在于,包括:
信息采集模块,其用于获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;
粗聚类模块,其从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类,以及
层次聚类模块,从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集每一类中的目标进行层次聚类形成待识别的群组。
7.根据权利要求6所述的基于聚类算法的群组识别系统,其特征在于,粗聚类模块采用均值漂移算法根据第一特征向量集对多个目标进行粗聚类形成多个类。
8.根据权利要求7所述的基于聚类算法的群组识别系统,其特征在于,粗聚类模块包括先验参数输入模块,先验参数输入模块输入了类内目标门限数。
9.根据权利要求8所述的基于聚类算法的群组识别系统,其特征在于,层次聚类模块采用均值漂移算法根据第二特征向量集对粗聚类形成多个类的每一类进行层次聚类形成待识别的群组。
10.根据权利要求9所述的基于聚类算法的群组识别方法,其特征在于,层次聚类模块包括先验参数输入模块,先验参数输入模块输入类内目标门限数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410162568.3A CN104008127A (zh) | 2014-04-21 | 2014-04-21 | 一种基于聚类算法的群组识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410162568.3A CN104008127A (zh) | 2014-04-21 | 2014-04-21 | 一种基于聚类算法的群组识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104008127A true CN104008127A (zh) | 2014-08-27 |
Family
ID=51368784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410162568.3A Pending CN104008127A (zh) | 2014-04-21 | 2014-04-21 | 一种基于聚类算法的群组识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104008127A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143597A (zh) * | 2019-12-13 | 2020-05-12 | 浙江大华技术股份有限公司 | 图像检索方法、终端及存储装置 |
CN113850281A (zh) * | 2021-02-05 | 2021-12-28 | 天翼智慧家庭科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
CN114328922A (zh) * | 2021-12-28 | 2022-04-12 | 盐城工学院 | 一种基于谱图理论的选择性文本聚类集成方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011158980A (ja) * | 2010-01-29 | 2011-08-18 | Brother Industries Ltd | 消費者情報処理装置 |
CN102254303A (zh) * | 2011-06-13 | 2011-11-23 | 河海大学 | 遥感图像分割方法及遥感图像检索方法 |
CN103136757A (zh) * | 2013-04-02 | 2013-06-05 | 西安电子科技大学 | 基于流形距离的两阶段聚类算法的sar图像分割方法 |
CN103136337A (zh) * | 2013-02-01 | 2013-06-05 | 北京邮电大学 | 用于复杂网络的分布式知识数据挖掘装置和挖掘方法 |
CN103605362A (zh) * | 2013-09-11 | 2014-02-26 | 天津工业大学 | 基于车辆轨迹多特征的运动模式学习及异常检测方法 |
CN103699771A (zh) * | 2013-09-27 | 2014-04-02 | 广东工业大学 | 一种冷负荷预测的情景-聚类方法 |
-
2014
- 2014-04-21 CN CN201410162568.3A patent/CN104008127A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011158980A (ja) * | 2010-01-29 | 2011-08-18 | Brother Industries Ltd | 消費者情報処理装置 |
CN102254303A (zh) * | 2011-06-13 | 2011-11-23 | 河海大学 | 遥感图像分割方法及遥感图像检索方法 |
CN103136337A (zh) * | 2013-02-01 | 2013-06-05 | 北京邮电大学 | 用于复杂网络的分布式知识数据挖掘装置和挖掘方法 |
CN103136757A (zh) * | 2013-04-02 | 2013-06-05 | 西安电子科技大学 | 基于流形距离的两阶段聚类算法的sar图像分割方法 |
CN103605362A (zh) * | 2013-09-11 | 2014-02-26 | 天津工业大学 | 基于车辆轨迹多特征的运动模式学习及异常检测方法 |
CN103699771A (zh) * | 2013-09-27 | 2014-04-02 | 广东工业大学 | 一种冷负荷预测的情景-聚类方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143597A (zh) * | 2019-12-13 | 2020-05-12 | 浙江大华技术股份有限公司 | 图像检索方法、终端及存储装置 |
CN111143597B (zh) * | 2019-12-13 | 2023-06-20 | 浙江大华技术股份有限公司 | 图像检索方法、终端及存储装置 |
CN113850281A (zh) * | 2021-02-05 | 2021-12-28 | 天翼智慧家庭科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
CN113850281B (zh) * | 2021-02-05 | 2024-03-12 | 天翼数字生活科技有限公司 | 一种基于meanshift优化的数据处理方法和装置 |
CN114328922A (zh) * | 2021-12-28 | 2022-04-12 | 盐城工学院 | 一种基于谱图理论的选择性文本聚类集成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103945533A (zh) | 基于大数据的无线实时位置定位方法 | |
US20170243058A1 (en) | Gait recognition method based on deep learning | |
CN107247938A (zh) | 一种高分辨率遥感影像城市建筑物功能分类的方法 | |
CN105608450A (zh) | 基于深度卷积神经网络的异质人脸识别方法 | |
CN102496016B (zh) | 一种基于时空协同框架的红外目标检测方法 | |
CN101893704A (zh) | 一种基于粗糙集的雷达辐射源信号识别方法 | |
CN102521565A (zh) | 低分辨率视频的服装识别方法及系统 | |
CN104504674A (zh) | 空间碎片星点提取与定位方法 | |
Liu et al. | A Kriging algorithm for location fingerprinting based on received signal strength | |
CN110501671A (zh) | 一种基于测量分配的目标跟踪方法及装置 | |
CN104156929B (zh) | 基于全局滤波的红外弱小目标背景抑制方法及其装置 | |
CN103473786A (zh) | 基于多目标模糊聚类的灰度图像分割方法 | |
CN103150643A (zh) | 基于加权主成分分析的航空枢纽服务水平综合评价方法 | |
CN103971384B (zh) | 一种无线视频传感器节点协作目标跟踪方法 | |
CN104517095A (zh) | 一种基于深度图像的人头分割方法 | |
CN103268498B (zh) | 一种感兴趣区域模糊图像语义理解的方法 | |
CN109360224A (zh) | 一种融合kcf和粒子滤波的抗遮挡目标跟踪方法 | |
CN106405538A (zh) | 一种适用于杂波环境的多目标跟踪方法及跟踪系统 | |
CN104008127A (zh) | 一种基于聚类算法的群组识别方法 | |
CN103942535A (zh) | 多目标跟踪方法及装置 | |
CN102663723A (zh) | 一种基于颜色样本与电场模型的图像分割方法 | |
CN102163285A (zh) | 一种基于主动学习的跨域视频语义概念检测方法 | |
CN103700109B (zh) | 基于多目标优化moea/d和模糊聚类的sar图像变化检测方法 | |
CN103279944A (zh) | 一种基于生物地理优化的图像分割方法 | |
CN103150562B (zh) | 一种基于图像背景提取前提的蚁群多细胞跟踪系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140827 |
|
WD01 | Invention patent application deemed withdrawn after publication |