CN104463188A - 基于最佳传输模型的聚类普适性分析方法 - Google Patents

基于最佳传输模型的聚类普适性分析方法 Download PDF

Info

Publication number
CN104463188A
CN104463188A CN201410577553.3A CN201410577553A CN104463188A CN 104463188 A CN104463188 A CN 104463188A CN 201410577553 A CN201410577553 A CN 201410577553A CN 104463188 A CN104463188 A CN 104463188A
Authority
CN
China
Prior art keywords
cluster
bunch
node
distance
represent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410577553.3A
Other languages
English (en)
Inventor
黄正勇
夏俊
俞晖
楼亦厦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201410577553.3A priority Critical patent/CN104463188A/zh
Publication of CN104463188A publication Critical patent/CN104463188A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于最佳传输距离的多聚类相似度分析方法包括:计算簇的匹配距离,计算聚类的匹配距离和聚类普适性分析。本发明的技术方案可以分析指纹聚类之间的相似度。

Description

基于最佳传输模型的聚类普适性分析方法
技术领域
本发明涉及聚类相似度方法,具体涉及一种基于最佳传输模型的聚类普适性分析方法。
背景技术
随着移动互联网技术的快速发展,智慧城市概念的提出和迅速普及,基于位置的服务(Location Based Service,LBS)受到越来越多的关注,在医疗保健、紧急救助、个性化信息传递等科技生活领域显示出巨大的活力。以智能终端为平台,基于WLAN的室内定位因为其能够以纯软件的方式实现、定位系统成本低等特点,成为近年来普适计算和位置感知领域的一个研究热点。WLAN热点服务的高覆盖率是保证精确室内外无缝定位技术实现的可能,这一点正好契合智慧城市无线网络全覆盖的需求,同时大型的超市、卖场中WLAN热点的覆盖率也正在逐步上升。从目前针对室内定位的技术研究方向来说,主要是从指纹库的建立和定位匹配算法两个方面进行。由于WLAN热点的信号强度在室内的多径环境下的不稳定性导致的定位精度的下降以及指纹信息如何得到最大效用是广大研究人员所关注的重点。但是,实际的应用场景中仍然有这许多亟待解决的问题。比如说,如何高效地建立并维护指纹库,如何降低算法复杂度以提高响应速度,如何提高定位精度,以及如何解决在多用户情况下的高并发问题,这些都是室内定位技术走进应用所必须面临和解决的问题。
经对现有技术的文献检索发现,Chen Feng和Shahrokh Valaee于2010年在INFOCOM(International Conference on Computer Communications)发表了“Compressive Sensing Based Positioning UsingRSS of WLAN AccessPoints”(2010年IEEE组织在通信网络领域的会议,《利用无线局域网的信号强度值的压缩感知定位方法》),提出了利用相似性传播聚类算法给指纹库分类,进一步使用压缩感知的算法进行定位匹配从而达到提升定位精度的目的,利用聚类算法在一定程度上能够提高定位的响应速度。但是,由于存在多种指纹库的采集设备,这些设备之间存在一定的差异性,则不同设备采集的指纹聚类之间会存在差异,因此,如何分析这些指纹聚类之间的相似度是一个亟需解决的问题。
发明内容
本发明的技术方案要解决的技术问题是分析指纹聚类之间的相似度。
为解决上述问题本发明的技术方案提供了一种基于最佳传输模型的聚类普适性分析方法,包括:
计算簇的匹配距离,包括对于任意两个聚类:聚类Π和聚类Ω,基于最佳传输模型计算簇 A i ⋐ Π ( i = 1 . . . N ) 与簇 B j ⋐ Ω ( j = 1 . . . M ) 之间的簇类匹配距离,所述聚类Π和聚类Ω分别含有N和M个簇;
计算聚类的匹配距离,包括基于任意两个所述簇之间的簇类匹配距离,结合所述最佳传输模型计算所述聚类Π和聚类Ω之间的聚类匹配距离;
聚类普适性分析,包括根据所述聚类Π和聚类Ω之间的聚类匹配距离,获得所述聚类Π和聚类Ω之间的相似度信息,基于所述相似度信息,确定每个聚类普适性的性能。
可选的,所述基于最佳传输模型计算簇 A i ⋐ Π ( i = 1 . . . N ) 与簇 B j ⋐ Ω ( j = 1 . . . M ) 之间的簇类匹配距离包括计算任意两个所述聚类Π和聚类Ω中的簇之间的簇类最佳距离和簇类随机距离。
可选的,所述计算任意两个所述聚类Π和聚类Ω中的簇之间的簇类最佳距离和簇类随机距离包括:
统计出所述簇 A i ⋐ Π ( i = 1 . . . N ) 与簇 B j ⋐ Ω ( j = 1 . . . M ) 中所有共同的节点,即共同的节点集合C(Ai,Bj)=Ai∩Bj,同时表示所述簇Ai与簇Bj之间非共有的节点集合,其中所述共同的节点的个数Xi,所述非共有的节点的个数Yj
计算所述簇Ai与簇Bj之间的簇类最佳距离其计算公式为:
d ot A i , B j = min Σ i = 1 X i Σ j = 1 Y j λ ij d ij ;
其中,
λij>0,1≤i≤Xi,1≤j≤Yj
Σ i = 1 X i Σ j = 1 Y j λ ij = 1 ;
式中,dij表示节点i与节点j之间的距离,λij表示当取得最小值时所对应的gij,其中gij表示相应距离的权重,表示节点i的权重,表示节点j的权重;
计算所述簇Ai与簇Bj之间的簇类随机距离其计算公式定义为:
式中,dij表示节点i与节点j之间的距离,表示节点i的权重,表示节点j的权重;
计算所述簇Ai与簇Bj之间的簇类匹配距离其计算公式定义为:
d mat A i , B j = d ot A i , B j d rt A i , B j .
可选的,所述计算所述簇Ai与簇Bj之间的簇类最佳距离包括:优先确定每个节点的权重,再计算出所述簇类最佳距离
可选的,所述优先确定每个节点的权重包括:
比较所述共同的节点的个数Xi和所述非共有的节点的个数Yj的大小,如果Xi≥Yj,则所述簇Ai为供应方P,|P|=Xi,所述簇Bj为需求方N,|N|=Yj;反之,如果Xi<Yj,则所述簇Bj为供应方P,|P|=Yj,所述簇Ai为需求方N,|N|=Xi
确定所述供应方的每个节点的权重,其所述权重的值为
确定所述需求方的每个节点的权重,所述需求方的节点的数目小于所述供应方的节点的数目,利用整数分割原理,确定所述需求方的每个节点的需求数n1,n2,…,n|N|,其满足:n1+n2+…+n|N|=|P|,共有种可能性,所述需求方的每个节点的权重分别为: n 1 | P | , n 2 | P | , . . . , n | N | | P | .
可选的,所述基于任意两个所述簇之间的簇类匹配距离,结合所述最佳传输模型计算所述聚类Π和聚类Ω之间的聚类匹配距离包括:
计算任意两个所述聚类Π和聚类Ω之间的聚类最佳匹配距离其计算公式为:
d ot Π , Ω = min Σ i = 1 N Σ j = 1 M f ij d mat A i , B j ;
其中,
fij>0,1≤i≤N,1≤j≤M;
Σ j = 1 Y j f ij = κ i , 1 ≤ i ≤ N ;
Σ i = 1 X i f ij = κ j , 1 ≤ j ≤ M ;
Σ i = 1 X i Σ j = 1 Y j f ij = 1 ;
式中,表示所述簇Ai与簇Bj之间的簇类匹配距离,fij表示当取得最小值时所对应的gij,其中gij表示相应距离的权重,κi表示所述簇Ai的权重,κj表示所述簇Bj的权重,κi与κj的值参考步骤A2中所述过程;
计算任意两个所述聚类Π和聚类Ω之间的聚类随机距离其计算公式定义为:
d rt A i , B j = Σ i = 1 X i Σ j = 1 Y j κ i κ j d mat A i , B j ;
式中,表示所述簇Ai与簇Bj之间的簇类匹配距离,κi表示所述簇Ai的权重,κj表示所述簇Bj的权重;
计算任意两个所述聚类Π和聚类Ω之间的聚类匹配距离其计算公式定义为:
d mat Π , Ω = d ot Π , Ω d rt Π , Ω .
可选的,所述基于所述相似度信息,确定每个聚类普适性的性能包括:
统计所有聚类之间的聚类匹配距离,并统计同一个聚类与其他聚类之间的聚类匹配距离之和;
对每个聚类与其他聚类之间的聚类匹配距离之和进行降序排序,所述聚类匹配距离之和的值越小,则该聚类的普适性越强;否则,反之。
与现有技术相比,本发明具有如下有益效果:
通过大量的计算机仿真以及实际实验证实,本发明通过基于最佳传输模型分析聚类普适性的方法,能够很好地反映实验中所构建聚类的普适性性能。这种聚类普适性的分析方法在分析基于聚类的室内定位算法中的指纹聚类中,能够有效地辨别这些指纹聚类中最具普适性的聚类,利用这些筛选出来的聚类能够提高定位的效果。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例提供的基于最佳传输模型的聚类普适性分析方法的流程图;
图2是本发明实施例提供的聚类模拟图;
图3是本发明实施例提供的基于聚类的室内定位算法中的指纹库聚类图a;
图4是本发明实施例提供的基于聚类的室内定位算法中的指纹库聚类图b;
图5是本发明实施例提供的基于聚类的室内定位算法中的指纹库聚类图c;
图6是本发明实施例提供的基于聚类的室内定位算法中的指纹库聚类图d。
具体实施方式
下面结合具体实施案例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
图1本发明实施例提供的基于最佳传输模型的聚类普适性分析方法的流程图,下面结合图1详细说明。
步骤S1,计算簇的匹配距离,包括对于任意两个聚类:聚类Π和聚类Ω,基于最佳传输模型计算簇 A i ⋐ Π ( i = 1 . . . N ) 与簇 B j ⋐ Ω ( j = 1 . . . M ) 之间的簇类匹配距离,所述聚类Π和聚类Ω分别含有N和M个簇;
步骤S2,计算聚类的匹配距离,包括基于任意两个所述簇之间的簇类匹配距离,结合所述最佳传输模型计算所述聚类Π和聚类Ω之间的聚类匹配距离;
步骤S4,聚类普适性分析,包括根据所述聚类Π和聚类Ω之间的聚类匹配距离,获得所述聚类Π和聚类Ω之间的相似度信息,基于所述相似度信息,确定每个聚类普适性的性能。
所述步骤S1中,所述最佳传输模型表示在多个仓库和多个目的地之间根据运输计划运输货物,其中使得运输成本为最低的运输路径与方法被称为最佳传输模型;所述基于最佳传输模型计算簇 A i ⋐ Π ( i = 1 . . . N ) 与簇 B j ⋐ Ω ( j = 1 . . . M ) 之间的簇类匹配距离包括计算任意两个所述聚类Π和聚类Ω中的簇之间的最佳距离和随机距离。
所述计算任意两个所述聚类Π和聚类Ω中的簇之间的簇类最佳距离和簇类随机距离包括:
统计出所述簇 A i ⋐ Π ( i = 1 . . . N ) 与簇 B j ⋐ Ω ( j = 1 . . . M ) 中所有共同的节点,即共同的节点集合C(Ai,Bj)=Ai∩Bj,同时表示所述簇Ai与簇Bj之间非共有的节点集合,其中所述共同的节点的个数Xi,所述非共有的节点的个数Yj
计算所述簇Ai与簇Bj之间的簇类最佳距离其计算公式为:
d ot A i , B j = min Σ i = 1 X i Σ j = 1 Y j λ ij d ij
其中,
λij>0,1≤i≤Xi,1≤j≤Yj
Σ i = 1 X i Σ j = 1 Y j λ ij = 1 ;
式中,dij表示节点i与节点j之间的距离,λij表示当取得最小值时所对应的gij表示节点i的权重,表示节点j的权重;
计算所述簇Ai与簇Bj之间的簇类随机距离其计算公式定义为:
式中,dij表示节点i与节点j之间的距离,表示节点i的权重,表示节点j的权重;
计算所述簇Ai与簇Bj之间的簇类匹配距离其计算公式定义为:
d mat A i , B j = d ot A i , B j d rt A i , B j .
所述计算所述簇Ai与簇Bj之间的簇类最佳距离包括:优先确定每个节点的权重,再计算出所述簇类最佳距离
所述优先确定每个节点的权重包括:
比较所述共同的节点的个数Xi和所述非共有的节点的个数Yj的大小,如果Xi≥Yj,则所述簇Ai为供应方P,|P|=Xi,所述簇Bj为需求方N,|N|=Yj;反之,如果Xi≤Yj,则所述簇Bj为供应方P,|P|=Yj,所述簇Ai为需求方N,|N|=Xi
确定所述供应方的每个节点的权重,其所述权重的值为
确定所述需求方的每个节点的权重,所述需求方的节点的数目小于所述供应方的节点的数目,利用整数分割原理,确定所述需求方的每个节点的需求数n1,n2,…,n|N|,其满足:n1+n2+…+n|N|=|P|,共有种可能性,所述需求方的每个节点的权重分别为: n 1 | P | , n 2 | P | , . . . , n | N | | P | .
所述步骤S2中,所述基于任意两个所述簇之间的簇类匹配距离,结合所述最佳传输模型计算所述聚类Π和聚类Ω之间的聚类匹配距离包括:
计算任意两个所述聚类Π和聚类Ω之间的聚类最佳匹配距离其计算公式为:
d ot Π , Ω = min Σ i = 1 N Σ j = 1 M f ij d mat A i , B j ;
其中,
fij>0,1≤i≤N,1≤j≤M
Σ j = 1 Y j f ij = κ i , 1 ≤ i ≤ N
Σ i = 1 X i f ij = κ j , 1 ≤ j ≤ M
Σ i = 1 X i Σ j = 1 Y j f ij = 1 ;
式中,表示所述簇Ai与簇Bj之间的簇类匹配距离,fij表示当取得最小值时所对应的gij,κi表示所述簇Ai的权重,κj表示所述簇Bj的权重(κi与κj的值参考计算簇Ai与簇Bj之间的最佳距离的过程,这两个值是需要计算出来的,不同的情况下值是不一样的,但是计算方法是相同的);
计算任意两个所述聚类Π和聚类Ω之间的聚类随机距离其计算公式定义为:
d rt A i , B j = Σ i = 1 X i Σ j = 1 Y j κ i κ j d mat A i , B j ;
式中,表示所述簇Ai与簇Bj之间的簇类匹配距离,κi表示所述簇Ai的权重,κj表示所述簇Bj的权重;
计算任意两个所述聚类Π和聚类Ω之间的聚类匹配距离其计算公式定义为:
d mat Π , Ω = d ot Π , Ω d rt Π , Ω .
所述步骤S3中,所述基于所述相似度信息,确定每个聚类普适性的性能包括:
统计所有聚类之间的聚类匹配距离,并统计同一个聚类与其他聚类之间的聚类匹配距离之和;
对每个聚类与其他聚类之间的聚类匹配距离之和进行降序排序,所述聚类匹配距离之和的值越小,则该聚类的普适性越强;否则,反之。
本发明所述的基于最佳传输模型的聚类普适性分析方法主要包含三个层面:首先,求解出每个聚类中的各个簇之间的簇类匹配距离,所述簇类匹配距离被定义为最佳距离与随机距离的比值(参考图1中的步骤S1);其次,根据两个聚类中各个簇之间的簇类匹配距离,利用计算簇之间的簇类匹配距离的方法计算出两个聚类之间的聚类匹配距离(参考图1中的步骤S2);最后,统计每个聚类与其他聚类之间的聚类匹配距离之和,聚类匹配距离之和越小,则该聚类的普适性越强,反之则该聚类的普适性越弱(参考图1中的步骤S3)。
本发明的技术方案利用最佳传输模型分层分析聚类相似度,从而判断聚类的普适性性能,主要包括了计算任意两个聚类中簇之间的簇类最佳距离、簇类随机距离和簇类匹配距离,优先计算任意一对聚类中的两个对应的簇之间的簇类匹配距离,其次计算任意两个聚类之间的聚类匹配距离。
这种利用最佳传输模型计算出任意一对聚类中两个对应的簇之间的簇类匹配距离;进一步地,利用最佳传输模型计算出任意一对聚类之间的聚类匹配距离的分层分析聚类相似度的方法,能够很好地分析出任意两个聚类之间的相似度,从而可以判断出聚类的普适性性能,提高与之相关的应用系统的性能。
如图2所示两个聚类的模拟说明图,从图2中可以看出,两个聚类(聚类A和聚类B)本是对同一个对象进行描述的,由于形成聚类时所采用的采样设备的不同(聚类B中出现了与聚类A中不同的区域,分别是区域1,区域2和区域3),导致聚类结果存在偏差。因此,如果存在多个聚类,则需要统计出这些聚类的普适性,并选择其中普适性最好的聚类参与到应用系统中以降低设备的差异性所带来的误差。
在实验过程中,利用基于WiFi室内定位系统中的聚类的案例来说明本发明中所示的聚类分析方法,图3至图6所示的是在不同定位算法中,得到的两个地理位置聚类的不同结果图(也就是基于聚类的室内定位算法中的指纹库聚类图),其中,{A,B,...,H}表示聚类中的不同的簇100,图3和图4是基于距离算法所获得的聚类结果图,图5和图6是基于“RE3+DRW”算法所获得的聚类结果图,图3和图5是基于手机Nexus S所获得的结果,图4和图6是基于手机Nexus4所获得的结果(图3是手机Nexus S基于距离算法所获得的聚类结果图,图4是手机Nexus4基于距离算法所获得的聚类结果图,图5是手机Nexus S基于“RE3+DRW”算法所获得的聚类结果图,图6是手机Nexus4基于“RE3+DRW”算法所获得的聚类结果图,)。根据本发明所述的基于最佳传输模型的聚类普适性分析方法,对实验中不同算法以及不同类型手机所采集到的聚类之间的聚类匹配距离进行计算,结果如表1所示。从表1可以看出,在两种不同的算法中,基于手机Nexus4与Nexus S采集到的聚类之间的聚类匹配距离是最小的,基于手机Nexus7与Nexus S采集到的聚类之间的聚类匹配距离是最大的,基于手机Nexus7与Nexus4采集到的聚类之间的聚类匹配距离是居中的。因此,可知基于手机Nexus4采集到的聚类的普适性最强,基于手机Nexus S采集到的聚类的普适性次之,基于手机Nexus7采集到的聚类的普适性最弱。
表1
Nexus4-Nexus S Nexus7-Nexus S Nexus7-Nexus4
基于距离算法 0.1600 0.2653 0.1838
基于“RE3+DRW”算法 0.1003 0.1323 0.1102
更为具体地,在本发明的一个优选例中,本发明是通过以下技术方案实现的,本发明包括以下步骤:
第一步:不同类型的智能手机端,通过后台运行的应用程序对WiFi指纹信息进行采集,并通过指纹聚类算法,形成指纹聚类库;
第二步:针对所有的指纹聚类,对于任意两个聚类Π和Ω,分别含有N和M个簇,基于最佳传输模型计算簇 A i ⋐ Π ( i = 1 . . . N ) 与簇 B j ⋐ Ω ( j = 1 . . . M ) 之间的聚类匹配距离(参考图1中的步骤S1);
第三步:利用第二步中所获得的任意簇之间的簇类匹配距离,统计聚类Π和Ω中匹配度最高的簇的对应关系,根据相关的对应关系计算聚类Π和Ω之间的聚类匹配距离(参考图1中的步骤S2);
第四步:获得所有指纹聚类之间的匹配距离后,统计每个聚类与其他聚类之间的聚类匹配距离之和,根据该距离和的大小判断每个聚类的普适性的强弱(参考图1中的步骤S3)。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (7)

1.一种基于最佳传输模型的聚类普适性分析方法,其特征在于,包括:
计算簇的匹配距离,包括对于任意两个聚类:聚类Π和聚类Ω,基于最佳传输模型计算簇与簇之间的簇类匹配距离,所述聚类Π和聚类Ω分别含有N和M个簇;
计算聚类的匹配距离,包括基于任意两个所述簇之间的簇类匹配距离,结合所述最佳传输模型计算所述聚类Π和聚类Ω之间的聚类匹配距离;
聚类普适性分析,包括根据所述聚类Π和聚类Ω之间的聚类匹配距离,获得所述聚类Π和聚类Ω之间的相似度信息,基于所述相似度信息,确定每个聚类普适性的性能。
2.根据权利要求1所述的基于最佳传输模型的聚类普适性分析方法,其特征在于,所述基于最佳传输模型计算簇与簇之间的簇类匹配距离包括计算任意两个所述聚类Π和聚类Ω中的簇之间的簇类最佳距离和簇类随机距离。
3.根据权利要求2所述的基于最佳传输模型的聚类普适性分析方法,其特征在于,所述计算任意两个所述聚类Π和聚类Ω中的簇之间的簇类最佳距离和簇类随机距离包括:
统计出所述簇与簇中所有共同的节点,即共同的节点集合C(Ai,Bj)=Ai∩Bj,同时表示所述簇Ai与簇Bj之间非共有的节点集合,其中所述共同的节点的个数Xi,所述非共有的节点的个数Yj
计算所述簇Ai与簇Bj之间的簇类最佳距离其计算公式为:
d ot A i , B j = min Σ i = 1 X i Σ j = 1 Y j λ ij d ij ;
其中,
λij>0,1≤i≤Xi,1≤j≤Yj
Σ i = 1 X i Σ j = 1 Y j λ ij = 1 ;
式中,dij表示节点i与节点j之间的距离,λij表示当取得最小值时所对应的gij,其中gij表示相应距离的权重,表示节点i的权重,表示节点j的权重;
计算所述簇Ai与簇Bj之间的簇类随机距离其计算公式定义为:
式中,dij表示节点i与节点j之间的距离,表示节点i的权重,表示节点j的权重;
计算所述簇Ai与簇Bj之间的簇类匹配距离其计算公式定义为:
d mat A i , B j = d ot A i , B j d rt A i , B j .
4.根据权利要求3所述的基于最佳传输模型的聚类普适性分析方法,其特征在于,所述计算所述簇Ai与簇Bj之间的簇类最佳距离包括:优先确定每个节点的权重,再计算出所述簇类最佳距离
5.根据权利要求4所述的基于最佳传输模型的聚类普适性分析方法,其特征在于,所述优先确定每个节点的权重包括:
比较所述共同的节点的个数Xi和所述非共有的节点的个数Yj的大小,如果Xi≥Yj,则所述簇Ai为供应方P,|P|=Xi,所述簇Bj为需求方N,|N|=Yj;反之,如果Xi<Yj,则所述簇Bj为供应方P,|P|=Yj,所述簇Ai为需求方N,|N|=Xi
确定所述供应方的每个节点的权重,其所述权重的值为
确定所述需求方的每个节点的权重,所述需求方的节点的数目小于所述供应方的节点的数目,利用整数分割原理,确定所述需求方的每个节点的需求数n1,n2,…,n|N|,其满足:n1+n2+…+n|N|=|P|,共有种可能性,所述需求方的每个节点的权重分别为: n 1 | P | , n 2 | P | , . . . , n | N | | P | .
6.根据权利要求1所述的基于最佳传输模型的聚类普适性分析方法,其特征在于,所述基于任意两个所述簇之间的簇类匹配距离,结合所述最佳传输模型计算所述聚类Π和聚类Ω之间的聚类匹配距离包括:
计算任意两个所述聚类Π和聚类Ω之间的聚类最佳匹配距离其计算公式为:
d ot Π , Ω = min Σ i = 1 N Σ j = 1 M f ij d mat A i , B j ;
其中,
fij>0,1≤i≤N,1≤j≤M;
Σ j = 1 Y j f ij = κ i , 1 ≤ i ≤ N ;
Σ i = 1 X i f ij = κ j , 1 ≤ j ≤ M ;
Σ i = 1 X i Σ j = 1 Y j f ij = 1 ;
式中,表示所述簇Ai与簇Bj之间的簇类匹配距离,fij表示当取得最小值时所对应的gij,其中gij表示相应距离的权重,κi表示所述簇Ai的权重,κj表示所述簇Bj的权重,κi与κj的值参考步骤A2中所述过程;
计算任意两个所述聚类Π和聚类Ω之间的聚类随机距离其计算公式定义为:
d rt A i , B j = Σ i = 1 X i Σ j = 1 Y j κ i κ j d mat A i , B j ;
式中,表示所述簇Ai与簇Bj之间的簇类匹配距离,κi表示所述簇Ai的权重,κj表示所述簇Bj的权重;
计算任意两个所述聚类Π和聚类Ω之间的聚类匹配距离其计算公式定义为:
d mat Π , Ω = d ot Π , Ω d rt Π , Ω .
7.根据权利要求1所述的基于最佳传输模型的聚类普适性分析方法,其特征在于,所述基于所述相似度信息,确定每个聚类普适性的性能包括:
统计所有聚类之间的聚类匹配距离,并统计同一个聚类与其他聚类之间的聚类匹配距离之和;
对每个聚类与其他聚类之间的聚类匹配距离之和进行降序排序,所述聚类匹配距离之和的值越小,则该聚类的普适性越强;否则,反之。
CN201410577553.3A 2014-10-24 2014-10-24 基于最佳传输模型的聚类普适性分析方法 Pending CN104463188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410577553.3A CN104463188A (zh) 2014-10-24 2014-10-24 基于最佳传输模型的聚类普适性分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410577553.3A CN104463188A (zh) 2014-10-24 2014-10-24 基于最佳传输模型的聚类普适性分析方法

Publications (1)

Publication Number Publication Date
CN104463188A true CN104463188A (zh) 2015-03-25

Family

ID=52909202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410577553.3A Pending CN104463188A (zh) 2014-10-24 2014-10-24 基于最佳传输模型的聚类普适性分析方法

Country Status (1)

Country Link
CN (1) CN104463188A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105938562A (zh) * 2016-04-13 2016-09-14 中国科学院信息工程研究所 一种自动化网络应用指纹提取方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6526405B1 (en) * 1999-12-17 2003-02-25 Microsoft Corporation Determining similarity between event types in sequences
CN103731834A (zh) * 2014-01-02 2014-04-16 重庆邮电大学 认知无线网络抗协同式篡改感知数据攻击的方法及装置
CN103810261A (zh) * 2014-01-26 2014-05-21 西安理工大学 一种基于商空间理论的K-means聚类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6526405B1 (en) * 1999-12-17 2003-02-25 Microsoft Corporation Determining similarity between event types in sequences
CN103731834A (zh) * 2014-01-02 2014-04-16 重庆邮电大学 认知无线网络抗协同式篡改感知数据攻击的方法及装置
CN103810261A (zh) * 2014-01-26 2014-05-21 西安理工大学 一种基于商空间理论的K-means聚类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105938562A (zh) * 2016-04-13 2016-09-14 中国科学院信息工程研究所 一种自动化网络应用指纹提取方法及系统
CN105938562B (zh) * 2016-04-13 2019-06-11 中国科学院信息工程研究所 一种自动化网络应用指纹提取方法及系统

Similar Documents

Publication Publication Date Title
CN103634902B (zh) 基于指纹聚类的新型室内定位方法
CN101299834B (zh) 基站位置核查的方法
CN103634901A (zh) 基于核密度估计的新型定位指纹采集提取方法
CN105044662A (zh) 一种基于wifi信号强度的指纹聚类多点联合室内定位方法
Zou et al. A mutual information based online access point selection strategy for WiFi indoor localization
CN103116696A (zh) 基于稀疏采样的手机定位数据的人员常驻地点识别方法
CN106055627A (zh) 话题领域中社交网络关键节点的识别方法
CN104302000A (zh) 基于信号接收强度指示相关性的室内定位方法
CN100566345C (zh) 基于超宽带的无线传感器网络节点定位方法
CN106131158A (zh) 一种云数据中心环境下基于云租户信用度的资源调度装置
CN104462318A (zh) 一种多网络中相同人名的身份识别方法及装置
CN103763769A (zh) 基于接入点重选择和自适应簇分裂的室内指纹定位方法
CN112328728A (zh) 挖掘出行者轨迹的聚类方法、装置、电子装置和存储介质
CN108416514B (zh) 基于地理信息系统的邻区规划方法及装置
CN103913720A (zh) 一种面向非特定Wi-Fi设备的室内定位方法
CN104751396A (zh) 一种基于地理位置的社区服务推荐方法
Aroba et al. Meta analysis of heuristic approaches for optimizing node localization and energy efficiency in wireless sensor networks
CN103559209A (zh) 一种Voronoi Diagram与虚拟网格结合的高效空间最近邻查询方法
Song et al. A partial index for distributed broadcasting in wireless mobile networks
CN106922017A (zh) 定位方法以及终端
CN104463188A (zh) 基于最佳传输模型的聚类普适性分析方法
WO2019197160A1 (en) Identifying functional zones within a geographic region
CN111143639B (zh) 用户亲密度计算方法、装置、设备及介质
CN116542682A (zh) 污染物溯源方法、装置及计算机可读存储介质
CN107578258A (zh) 一种智能景区旅游服务公平性游客评价控制系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150325

WD01 Invention patent application deemed withdrawn after publication