CN105515859B - 基于路径相似度对符号网络进行社区检测的方法及系统 - Google Patents
基于路径相似度对符号网络进行社区检测的方法及系统 Download PDFInfo
- Publication number
- CN105515859B CN105515859B CN201510896076.1A CN201510896076A CN105515859B CN 105515859 B CN105515859 B CN 105515859B CN 201510896076 A CN201510896076 A CN 201510896076A CN 105515859 B CN105515859 B CN 105515859B
- Authority
- CN
- China
- Prior art keywords
- network
- network node
- community
- node
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种基于路径相似度对符号网络进行社区检测的方法,包括:输入邻接矩阵,计算路径对于节点相似性的影响,产生节点的初始状态,更新节点状态,判断更新后节点的状态是否稳定,以及检测出符号网络的社区结构并输出检测结果。本发明的方法针对符号网络特点,计算两个节点之间多跳邻居的正负影响,设计相似性矩阵,基于同社区节点相对于不同社区节点更容易实现同步的原理,对符号网络实现社区检测。节点按照正邻居聚集负邻居远离的网络模型,随时间不断更新状态最终实现社区划分,有效地提高节点状态趋于一致的效率,降低了符号网络社区检测的复杂性,有效快速地检测出符号网络的社区结构,从而克服现有技术检测效率低、复杂度高的缺陷。
Description
技术领域
本发明涉及网络技术领域,并且更具体地,涉及一种基于路径相似度对符号网络进行社区检测的方法及系统。本发明通过使用路径相似度并且利用节点状态趋于一致的原理,能够快速有效地检测出符号网络的各个社区。
背景技术
目前,复杂网络研究正渗透到数理学科、生命学科和工程学科等众多不同的领域,对复杂网络的定量与定性特征的科学理解已成为网络时代科学研究中一个极其重要的挑战性课题。现代网络科学是理解复杂系统的一个重要方法。现实世界中很多复杂系统可以建模成复杂网络,如信息网络、社会网络、合作关系网等等。社区结构是复杂网络中最普遍和最重要的拓扑结构之一。在社会网络中存在这样一种网络,个体之间的联系可能是正向的,如喜欢,尊敬,支持,信任;也有一些个体之间的联系是负向的,如不喜欢,不尊敬,反对,不信任。这样有正负连接关系的网络称之为符号网络。因为符号网络中负邻居的存在,使得不能直接应用原有复杂网络的社区检测方法。为了更加全面客观地检测符号网络中潜在的社区结构,有必要针对符号网络的特点设计出快速有效的社区检测方法。
信息技术领域的快速发展和复杂网络研究的兴起,为符号网络的研究和应用带来了新的机遇和挑战。一方面,随着信息技术领域的发展,无处不在的网络应用和海量的数字化网络数据给研究者提供了丰富的研究对象。以时下流行的在线社会网络为例,部分在线社会网络具有明确的符号标识,并且全程记录了整个网络的演化过程,比如消费者评论网站Epinions、技术新闻评论网站Slashdot、协同编辑百科全书Wikipeda的投票网络,还有包含多种对立关系的在线游戏网络等等,它们为符号网络的研究提供了良好的研究案例。在这些网络上的研究已表明,真实网络的演化即传统社会学中的符号网络演化理论有较高的一致性,同时还受到其他机制的作用。然而,由于在线社会网络的规模都很巨大,这对传统的符号网络分析方法提出了挑战。另一方面,随着复杂网络研究的发展,将复杂系统抽象为网络进行研究的思路和方法得到了学术界和工业界的普遍认可。除传统社会网络外,其他还有许多真实复杂系统中包含着对立关系,比如神经网络、万维网、信任网络等等,都可以抽象为符号网络进行研究。人们越来越意识到,基于符号属性去研究这些网络对准确认识这类复杂系统和其上的应用设计具有重要意义。例如,结合负边信息能在语义网络上更准确地识别话题,能在社交网站上更有效地进行推荐等。总体而言,近期符号网络研究在社会、生物,尤其是信息技术领域呈现增长的趋势。这些都说明符号网络在现阶段具有重要的研究意义和应用价值,并已引起不同领域研究人员的关注。
西安电子科技大学在其申请的专利“基于振荡器相位同步的符号网络社区检测方法”(专利申请号201310392893.4,公开号CN 103475539)中公开一种符号网络的社区检测方法。该方法基于振荡器相位同步原理,能对符号网络实现社区检测,并通过微分方程的并行处理方式可以有效地检测出符号网络的社区结构。但该方法的不足在于对于社区间有正连接的符号网络最终稳定节点相位不能达到一致,检测速度慢。
因此,现有技术存在对于能够有效地检测符号网络中的社区结构的方法和系统的需求。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于路径相似度对符号网络进行社区检测的方法及系统,以实现快速高效地检测符号网络中的社区结构。本发明使用路径相似度计算,基于节点状态趋于一致的原理,通过动态更新节点状态,根据各个节点稳定时的状态,可快速高效地检测出符号网络的各个社区。
根据本发明的一个方面,提供一种基于路径相似度对符号网络进行社区检测的方法,所述方法包括:
1)生成与待检测的符号网络对应的N×N阶的邻接矩阵A,所述邻接矩阵A用于表示待检测的符号网络中的网络节点之间的连接关系,其中N为所述待检测的符号网络中网络节点的数量,N为大于1的自然数;
其中如果所述待检测的符号网络中的网络节点i与网络节点j之间存在正向连接边,则将邻接矩阵A中的相应元素aij设定为正权值;
如果待检测的符号网络中的网络节点i与网络节点j之间存在负向连接边,则将邻接矩阵A中的相应元素aij设定为负权值;
如果待检测的符号网络中的网络节点i与网络节点j之间不存在连接边,则将邻接矩阵A中的相应元素aij设定为零;
其中i和j为自然数,并且1≤i≤N、1≤j≤N;
(2)对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵,根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵,
其中对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵包括:
2a)计算使得两个节点成为正连接一跳邻居的正能量
2b)计算使得两个节点成为正连接二跳邻居的正能量
2c)计算使得两个节点成为正连接一跳邻居的负能量
2d)计算使得两个节点成为正连接二跳邻居的负能量
2e)计算基于路径的系数λm,λm取值为网络平均度路径长度次幂的倒数,即其中m=1或2;即基于一跳路径的系数为λ1,基于二跳路径的系数为λ2,
2f)计算节点间相似度矩阵元素:
从而获得相似度矩阵R=(rij)N×N;
其中根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵包括:
2g)通过将相似度矩阵R=(rij)N×N中每一行的正相似度归一化,并且将每一行的负相似度归一化来获得相似性矩阵S=(sij)N×N,其中
(3)产生网络节点的初始状态值:
在[0,2π]内随机产生所述待检测的符号网络的N个网络节点中每个网络节点的初始状态值,其中所述初始状态值服从均匀分布;
(4)对待检测的符号网络中每个网络节点的状态值进行更新:
其中xi(t)表示网络中第i个节点在当前迭代t步的状态值,xj(t)表示网络中第j个节点在当前迭代t步的状态值,xi(t+1)表示网络中第i个节点在下一次迭代t+1步的状态值,K1,K2为系数;K1,K2取值范围都大于零;
(5)计算每个网络节点更新前的状态值与更新后的状态值相减后的绝对值,确定上述绝对值中的最大值,判断该最大值是否小于阈值τ;若小于,则确定每个网络节点更新后的状态值达到稳定,获得网络节点的状态图,进行步骤(6);否则,若该最大值大于阈值τ,将每个网络节点更新后的状态值作为该网络节点下一次更新的更新前的状态值,返回步骤(4);
(6)确定待检测的符号网络的社区划分结果并且在验证正确后输出所述社区划分结果:
6a)在网络节点的状态图中,将状态一致的节点放入同一组中,将同一组中的网络节点划分为一个社区,直至将所有的网络节点划分到各自对应的社区为止,从而获得社区划分结果;
6b)将步骤6a)中得到的社区划分结果中的网络节点与原始社区中的相应网络节点进行对比,通过与真实社区划分进行对比来验证社区划分的正确性,如果社区划分正确则输出社区划分结果。
优选地,步骤2f)中,当aij>0时,rij表示具有正连接的两个网络节点的相似度;当aij<0时,rij表示具有负连接的两个网络节点的相似度。
优选地,步骤(4)中,进行网络节点的状态值更新的迭代次数取值范围为[500,5000]。
优选地,步骤(5)中网络节点的达到稳定的状态值与2π取模,使所有网络节点的状态值都处于区间[0,2π]内;
步骤(5)中的阈值τ的取值范围为0≤τ≤0.001。
根据本发明的一个方面,提供一种基于路径相似度对符号网络进行社区检测的系统,所述系统包括:
邻接矩阵生成单元,生成与待检测的符号网络对应的N×N阶的邻接矩阵A,所述邻接矩阵A用于表示待检测的符号网络中的网络节点之间的连接关系,其中N为所述待检测的符号网络中网络节点的数量,N为大于1的自然数;
其中如果所述待检测的符号网络中的网络节点i与网络节点j之间存在正向连接边,则将邻接矩阵A中的相应元素aij设定为正权值;
如果待检测的符号网络中的网络节点i与网络节点j之间存在负向连接边,则将邻接矩阵A中的相应元素aij设定为负权值;
如果待检测的符号网络中的网络节点i与网络节点j之间不存在连接边,则将邻接矩阵A中的相应元素aij设定为零;
其中i和j为自然数,并且1≤i≤N、1≤j≤N;
相似性矩阵生成单元,对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵,根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵,
其中对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵包括:
计算使得两个节点成为正连接一跳邻居的正能量
计算使得两个节点成为正连接二跳邻居的正能量
计算使得两个节点成为正连接一跳邻居的负能量
计算使得两个节点成为正连接二跳邻居的负能量
计算基于路径的系数λm,λm取值为网络平均度路径长度次幂的倒数,即其中m=1或2;即基于一跳路径的系数为λ1,基于二跳路径的系数为λ2,
计算节点间相似度矩阵元素:
获得相似度矩阵R=(rij)N×N;其中根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵包括:
通过将相似度矩阵R=(rij)N×N中每一行的正相似度归一化,并且将每一行的负相似度归一化来获得相似性矩阵S=(sij)N×N,其中
其中,Pi={j|rij>0},Qi={j|rij<0};
网络节点状态确定单元,产生网络节点的初始状态值:在[0,2π]内随机产生所述待检测的符号网络的N个网络节点中每个网络节点的初始状态值,其中所述初始状态值服从均匀分布;
所述网络节点状态确定单元对待检测的符号网络中每个网络节点的状态值进行更新:
其中xi(t)表示网络中第i个节点在当前迭代t步的状态值,xj(t)表示网络中第j个节点在当前迭代t步的状态值,xi(t+1)表示网络中第i个节点在下一次迭代t+1步的状态值,K1,K2为系数;K1,K2取值范围都大于零;
所述网络节点状态确定单元对计算每个网络节点更新前的状态值与更新后的状态值相减后的绝对值,确定上述绝对值中的最大值,判断该最大值是否小于阈值τ;若小于,则确定每个网络节点更新后的状态值达到稳定,获得网络节点的状态图;否则,若该最大值大于阈值τ,将每个网络节点更新后的状态值作为该网络节点下一次更新的更新前的状态值,重新进行状态值的确定;
网络结构确定单元,确定待检测的符号网络的社区划分结果并且在验证正确后输出所述社区划分结果,具体为:
在网络节点的状态图中,将状态一致的节点放入同一组中,将同一组中的网络节点划分为一个社区,直至将所有的网络节点划分到各自对应的社区为止,从而获得社区划分结果;
将得到的社区划分结果中的网络节点与原始社区中的相应网络节点进行对比,通过与真实社区划分进行对比来验证社区划分的正确性,如果社区划分正确则输出社区划分结果。
优选地,若aij大于零,则rij表示具有正连接的两个网络节点的相似度;以及
若aij小于零,则rij表示具有负连接的两个网络节点的相似度。
优选地,进行网络节点的状态值更新的迭代次数取值范围为[500,5000]均大于0。
优选地,网络节点的达到稳定的状态值与2π取模,使所有网络节点的状态值都处于区间[0,2π]内;并且阈值τ的取值范围为0≤τ≤0.001。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明优选实施方式的基于路径相似度对符号网络进行社区检测的方法的流程图;
图2示出了根据本发明优选实施方式构造的符号网络的拓扑结构图;
图3示出了根据本发明优选实施方式的网络节点状态值随时间的变化的示意图;
图4示出了根据本发明优选实施方式的使用的Gahuku-Gama符号网络的拓扑结构图;
图5示出了根据本发明优选实施方式的使用的Gahuku-Gama符号网络的仿真结果示意图;以及
图6示出了根据本发明优选实施方式的基于路径相似度对符号网络进行社区检测的系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
图1示出了根据本发明优选实施方式的基于路径相似度对符号网络进行社区检测的方法的流程图。如图1所示,本发明的基于路径相似度对符号网络进行社区检测的方法的步骤如下:
步骤1,生成邻接矩阵。
生成与待检测的符号网络对应的N×N阶的邻接矩阵A,所述邻接矩阵A用于表示待检测的符号网络中的网络节点之间的连接关系,其中N为所述待检测的符号网络中网络节点的数量,N为大于1的自然数。虽然下面给出的实例中网络节点的数量N为10,但是所属领域技术人员容易了解的是,网络节点的数量N可以是200、500、1000、2000等。
根据本发明的优选实施方式,确定邻接矩阵A(N*N)中各个元素的初始值。优选地,将所述待检测的符号网络中网络节点i与网络节点j之间有正向连接边所对应的邻接矩阵中元素aij设定为正权值。如下面的实例所示,网络节点1与网络节点2之间的元素a12为5。优选地,将待检测符号网络中节点i与节点j之间有负向连接边所对应的邻接矩阵中元素aij设定为负权值。如下面的实例所示,网络节点2与网络节点7之间的元素a27为-3。优选地,将待检测符号网络中节点i与节点j之间无连接边所对应的邻接矩阵中元素aij设定为零。如下面的实例所示,网络节点3与网络节点2之间的元素a32为0。优选地,其中N为大于1的自然数。优选地,i和j是自然数并且1≤i≤N,1≤j≤N。优选地,将邻接矩阵A(N*N)主对角线上的元素设置为固定值。优选地,所述固定值是现有技术中固有的常用值。优选地,所述元素的值也可以是预先设置的,或是根据情况动态设置的。
优选地,符号网络的网络拓扑结构如图2所示,其中图2示出了根据本发明优选实施方式构造的符号网络的拓扑结构图。如图2所示,符号网络200包括10个网络节点,即网络节点1、网络节点2、网络节点3、网络节点4、网络节点5、网络节点6、网络节点7、网络节点8、网络节点9和网络节点10。优选地,网络节点可以是任意类型的设备,例如是服务器设备、用户设备、移动设备等。
如图2所示,网络节点之间的实线表示正向连接边,并且网络节点之间的虚线表示负向连接边。网络节点1与网络节点2有正向连接边所对应的邻接矩阵中元素a12为正权值5。网络节点1与网络节点3有正向连接边所对应的邻接矩阵中元素a13为0。网络节点1与网络节点4有负向连接边所对应的邻接矩阵中元素a14为0。网络节点1与网络节点5有负向连接边所对应的邻接矩阵中元素a15为正权值1。网络节点1与网络节点6有负向连接边所对应的邻接矩阵中元素a16为0。网络节点1与网络节点7有负向连接边所对应的邻接矩阵中元素a17为0。网络节点1与网络节点8有负向连接边所对应的邻接矩阵中元素a18为0。网络节点1与网络节点9有负向连接边所对应的邻接矩阵中元素a19为0。网络节点1与网络节点10有负向连接边所对应的邻接矩阵中元素a1,10为-3。
图2中的邻接矩阵A的实例为:
在本实施方式中,邻接矩阵A为非对称矩阵。然而,应当了解的是,邻接矩阵可以是沿主对角线的对称矩阵。例如,网络节点1与网络节点2有正向连接边所对应的邻接矩阵中元素a12为正权值5,而网络节点2与网络节点1无连接边所对应的邻接矩阵中元素a21为0。优选地,将邻接矩阵A(N*N)主对角线上的元素值0、0、0、0、0、0、0、0、0、0为固定值。
步骤2,对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵,根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵。
优选地,其中对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵R=(rij)N×N包括:
1)计算使得两个节点成为正连接一跳邻居的正能量
2)计算使得两个节点成为正连接二跳邻居的正能量
3)计算使得两个节点成为正连接一跳邻居的负能量
4)计算使得两个节点成为正连接二跳邻居的负能量
6)计算节点间相似度矩阵元素:
优选地,根据上述计算,确定图2中所示的符号网络的相似度矩阵为(取小数点后两位):
优选地,根据本发明的优选实施方式,根据所述相似度矩阵R=(rij)N×N计算所述待检测的符号网络的相似性矩阵S=(sij)N×N,具体为:
将相似度矩阵R=(rij)N×N中每一行的正相似度归一化,每一行的负相似度归一化:
优选地,根据上述计算,确定图2中所示的符号网络归一化相似性矩阵为(取小数点后两位):
步骤3,产生网络节点的初始状态值:
在[0,2π]内随机产生所述待检测的符号网络的N个网络节点中每个网络节点的初始状态值,其中所述初始状态值服从均匀分布。将所产生的初始状态值与符号网络中节点的初始状态一一对应。
本发明的实施例中,网络节点的数量为10,在[0,2π]内随机产生10个随机数[5.28,1.59,5.11,1.53,5.83,2.19,1.23,1.57,3.87,2.97]。即将5.28作为网络节点1的初始状态,将1.59作为网络节点2的初始状态,以此类推。
步骤4,对待检测的符号网络中每个网络节点的状态值进行更新:
其中xi(t)表示网络中第i个节点在当前迭代t步的状态值,xj(t)表示网络中第j个节点在当前迭代t步的状态值,xi(t+1)表示网络中第i个节点在下一次迭代t+1步的状态值,K1,K2为系数;K1,K2取值范围都大于零;其中1≤i≤N,1≤j≤N。
根据本发明的优选实施例,网络节点按照正邻居状态靠近并且负邻居状态远离的规律进行动态更新。优选地,可以将迭代次数设置为任何合理的数值,例如,500、1000等。优选地,即使迭代次数比较大,但是对图2中所示的符号网络而言,运行时间也只有0.001秒。优选地,图3中示出了在进行500次迭代以后只需要0.001秒的时间可以得到的曲线数据结果。
在本发明实施例中,符号网络结构图中的网络节点分别编号为1~10。在Matlab环境下,设演化参数k=20,动态演化模型的运行时间T为2秒,间隔为0.05,通过动态演化方程,不断更新网络中各个节点的状态值。
图3示出了根据本发明优选实施方式的网络节点状态值随时间的变化的示意图。如图3所示,纵坐标为网络节点的状态值,并且横坐标为迭代次数。图3示出了网络节点的状态值随迭代次数的变化图。网络节点状态值动态演化结束时,更新的状态值集合为[0.5128,0.5128,0.5128,0.5128,0.8234,0.8234,0.8235,0.8235,0.8235,0.8235](保留小数点后四位小数)。
步骤5,计算每个网络节点更新前的状态值与更新后的状态值相减后的绝对值,确定上述绝对值中的最大值,判断该最大值是否小于阈值τ;若小于,则确定每个网络节点更新后的状态值达到稳定,获得网络节点的状态图,进行步骤6;否则,若最大值大于阈值τ,将每个网络节点更新后的状态值作为该网络节点下一次更新的更新前的状态值,返回步骤4。
根据本发明的优选实施例,网络节点的稳定状态值都与2π取模,使所有网络节点的状态值都处于区间[0,2π]内。
在本发明的实施例中,当模型迭代250次时,符号网络内所有网络节点更新后的状态值与更新前的状态值的差值的最大值小于0.001,则所有网络节点的状态达到稳定状态,即符号网络社区内部网络节点的状态趋于一致。网络节点的稳定状态值为[0.5128,0.5128,0.5128,0.5128,0.8234,0.8234,0.8235,0.8235,0.8235,0.8235](保留小数点后四位小数)。
步骤6,确定待检测符号网络的社区划分结果并且在验证社区划分结果正确后进行输出:
1)在网络节点的状态图中,将状态一致的节点放入同一组中,将同一组中的网络节点划分为一个社区,直至将所有的网络节点划分到各自对应的社区为止,从而获得社区划分结果。
2)将步骤1)中得到的社区划分结果中的网络节点与原始社区中的相应网络节点进行对比,验证社区划分的正确性,如果社区划分正确则输出社区划分结果。
在本发明的实施例中,将每个状态一致的网络节点放入一个组中,即将网络节点1,2,3,4,5,6放入第一组,将网络节点7,8,9,10放到第二组。如图3所示,横坐标表示节点动态更新的迭代次数,纵坐标表示节点的状态值。将得到的社区划分结果中对应的网络节点变化1到10分别与原始的社区划分结果的网络节点编号进行对比,将网络节点1,2,3,4,5,6划分为一个社区,并且将7,8,9,10划分为一个社区。根据本发明实施方式的社区划分结果与原始的社区划分结果一致,说明本发明可以有效准确的进行社区划分。因为社区网络是所构造的人工网络的真实划分结构,所以算法所得出的划分结果通过与真实划分结果做对比,以此判断社区划分的有效性。
下面结合仿真图对本发明的效果做进一步的描述。
图4示出了根据本发明优选实施方式的使用的Gahuku-Gama符号网络的拓扑结构图并且图5示出了根据本发明优选实施方式的使用的Gahuku-Gama符号网络的仿真结果示意图。
1.仿真条件:
本发明是在CPU为Dual-Core2.30GHZ、内存2G、WINDOWS 7系统上使用MATLAB2009Ra进行仿真的。
2.仿真内容:
选取图2所示的符号网络和图4所示的Gahuku-Gama符号网络作为仿真对象。图2网络由10个节点组成,节点之间的连接代表成员之间的某种关系。图4所示的人工合成测试符号网络由28个节点组成,节点之间的连接边代表这些节点之间的关系,可得到该网络对应的邻接矩阵。。
参照附图2,在演化参数K1=10,K2=0.1,τ=0.001的条件下对图2所示符号网络进行社区检测;图2中,方形对应的节点{1,2,3,4,5,6}为符号网络的一个社区,圆形对应的节点{7,8,9,10}为符号网络的一个社区。图3所示社区划分结果与该网络的真实划分相吻合,因此验证了本发明的有效性。
参照附图4,在演化参数K1=10,K2=0.1,τ=0.001的条件下对图3所示的人工合成测试符号网络进行仿真。
参照附图4,图5为节点状态随时间的变化图。随机产生的初始状态值为[1.0812,0.0269,4.0998,2.3228,2.3631,2.7730,3.2429,1.8857,3.0054,0.0392,1.0772,1.9073,4.6776,3.6499,4.4058,5.0559,5.3532,0.7396,4.1297,4.7309,4.4116,3.8021,0.2404,1.2262,2.0777,4.039,1.366,0.4832]。当节点状态更新100次,状态达到稳定,图5中的28条曲线分别代表了编号为1~28的节点状态值随时间不断变化更新的过程。
参照附图5,将28条曲线分为三组,上三角形对应的节点{1,2,3,10,11,12,19,20,21,28}为符号网络的一个社区,在图形中记为C1,圆形对应的节点{8,9,17,18,26,27}为符号网络的一个社区,在图形中记为C2,方形对应的节点{4,5,6,7,13,14,15,16,22,23,24,25},在图形中记为C3。附图5所示社区划分结果与该测试网络的真实划分相吻合,因此验证了本发明的有效性。
从以上说明可以看出,基于动态演化的符号网络社区检测方法可以准确高效地检测出符号网络的各个社区。
图6示出了根据本发明优选实施方式的基于动态演化的符号网络社区检测系统的结构示意图。检测系统600包括:邻接矩阵生成单元601、相似性矩阵生成单元602、正邻居集合生成单元603、网络节点状态确定单元604以及网络结构确定单元605。
优选地,邻接矩阵生成单元601,用于生成与待检测的符号网络对应的N×N阶的邻接矩阵A,所述邻接矩阵A用于表示待检测的符号网络中的网络节点之间的连接关系,其中N为所述待检测的符号网络中网络节点的数量,N为大于1的自然数。优选地,如果所述待检测的符号网络中的网络节点i与网络节点j之间存在正向连接边,则将邻接矩阵A中的相应元素aij设定为正权值;如果待检测的符号网络中的网络节点i与网络节点j之间存在负向连接边,则将邻接矩阵A中的相应元素aij设定为负权值;如果待检测的符号网络中的网络节点i与网络节点j之间不存在连接边,则将邻接矩阵A中的相应元素aij设定为零。其中i和j为自然数,并且1≤i≤N、1≤j≤N;
优选地,相似性矩阵生成单元602对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵,根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵,
其中对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵包括:
计算使得两个节点成为正连接一跳邻居的正能量
计算使得两个节点成为正连接二跳邻居的正能量
计算使得两个节点成为正连接一跳邻居的负能量
计算使得两个节点成为正连接二跳邻居的负能量
计算节点间相似度矩阵元素:
获得相似度矩阵R=(rij)N×N;其中根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵包括:
通过将相似度矩阵R=(rij)N×N中每一行的正相似度归一化,并且将每一行的负相似度归一化来获得相似性矩阵S=(sij)N×N,其中
其中,Pi={j|rij>0},Qi={j|rij<0};
优选地,网络节点状态确定单元603产生网络节点的初始状态值:在[0,2π]内随机产生所述待检测的符号网络的N个网络节点中每个网络节点的初始状态值,其中所述初始状态值服从均匀分布;
所述网络节点状态确定单元对待检测的符号网络中每个网络节点的状态值进行更新:
其中xi(t)表示网络中第i个节点在当前迭代t步的状态值,xj(t)表示网络中第j个节点在当前迭代t步的状态值,xi(t+1)表示网络中第i个节点在下一次迭代t+1步的状态值,K1,K2为系数;K1,K2取值范围都大于零;其中1≤i≤N,1≤j≤N。
所述网络节点状态确定单元对计算每个网络节点更新前的状态值与更新后的状态值相减后的绝对值,确定上述绝对值中的最大值,判断该最大值是否小于阈值τ;若小于,则确定每个网络节点更新后的状态值达到稳定,获得网络节点的状态图;否则,若该最大值大于阈值τ,将每个网络节点更新后的状态值作为该网络节点下一次更新的更新前的状态值,重新进行状态值的确定;优选地,网络结构确定单元604确定待检测的符号网络的社区划分结果并且在验证正确后输出所述社区划分结果,具体为:
在网络节点的状态图中,将状态一致的节点放入同一组中,将同一组中的网络节点划分为一个社区,直至将所有的网络节点划分到各自对应的社区为止,从而获得社区划分结果;
将得到的社区划分结果中的网络节点与原始社区中的相应网络节点进行对比,验证社区划分的正确性,如果社区划分正确则输出社区划分结果
在先前的说明书和相关附图中呈现的教导下,本发明涉及的领域内普通技术人员将得知在此阐述的本发明的许多修改和其他实施例。因此,可以理解,本发明实施例不限于这里公开的特定实施例,并且其修改和其他实施例也被包括在所附权利要求的范围内。此外,尽管以上说明书和相关附图描述了在元件和/或功能的某些示例性组合的环境下的示例性实施例,但是应理解可通过备选实施例提供元件和/或功能的不同组合,而不脱离所附权利要求的范围。在这点上,例如,如可在所附权利要求中阐述的那样,也可设想除了以上明确所述的元件和/或功能之外的不同组合。尽管这里采用的特定术语,但是它们可仅通过一般性和描述性概念来使用,并非用于限制的目的。
Claims (8)
1.一种基于路径相似度对符号网络进行社区检测的方法,所述方法包括:
1)生成与待检测的符号网络对应的N×N阶的邻接矩阵A,所述邻接矩阵A用于表示待检测的符号网络中的网络节点之间的连接关系,其中N为所述待检测的符号网络中网络节点的数量,N为大于1的自然数;
其中如果所述待检测的符号网络中的网络节点i与网络节点j之间存在正向连接边,则将邻接矩阵A中的相应元素aij设定为正权值;
如果待检测的符号网络中的网络节点i与网络节点j之间存在负向连接边,则将邻接矩阵A中的相应元素aij设定为负权值;
如果待检测的符号网络中的网络节点i与网络节点j之间不存在连接边,则将邻接矩阵A中的相应元素aij设定为零;
其中i和j为自然数,并且1≤i≤N、1≤j≤N;
(2)对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵,根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵,
其中对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵包括:
2a)计算使得两个节点成为正连接一跳邻居的正能量
其中
2b)计算使得两个节点成为正连接二跳邻居的正能量
其中
2c)计算使得两个节点成为正连接一跳邻居的负能量
其中
2d)计算使得两个节点成为正连接二跳邻居的负能量
其中
2e)计算基于路径的系数λm,λm取值为网络平均度路径长度次幂的倒数,即其中m=1或2;即基于一跳路径的系数为λ1,基于二跳路径的系数为λ2,
其中
2f)计算节点间相似度矩阵元素:
从而获得相似度矩阵R=(rij)N×N;
其中根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵包括:
2g)通过将相似度矩阵R=(rij)N×N中每一行的正相似度归一化,并且将每一行的负相似度归一化来获得相似性矩阵S=(sij)N×N,其中
其中,Pi={j|rij>0},Qi={j|rij<0};
(3)产生网络节点的初始状态值:
在[0,2π]内随机产生所述待检测的符号网络的N个网络节点中每个网络节点的初始状态值,其中所述初始状态值服从均匀分布;
(4)对待检测的符号网络中每个网络节点的状态值进行更新:
其中xi(t)表示网络中第i个节点在当前迭代t步的状态值,xj(t)表示网络中第j个节点在当前迭代t步的状态值,xi(t+1)表示网络中第i个节点在下一次迭代t+1步的状态值,K1,K2为系数;K1,K2取值范围都大于零;
(5)计算每个网络节点更新前的状态值与更新后的状态值相减后的绝对值,确定上述绝对值中的最大值,判断该最大值是否小于阈值τ;若小于,则确定每个网络节点更新后的状态值达到稳定,获得网络节点的状态图,进行步骤(6);否则,若该最大值大于阈值τ,将每个网络节点更新后的状态值作为该网络节点下一次更新的更新前的状态值,返回步骤(4);
(6)确定待检测的符号网络的社区划分结果并且在验证正确后输出所述社区划分结果:
6a)在网络节点的状态图中,将状态一致的节点放入同一组中,将同一组中的网络节点划分为一个社区,直至将所有的网络节点划分到各自对应的社区为止,从而获得社区划分结果;
6b)将步骤6a)中得到的社区划分结果中的网络节点与原始社区中的相应网络节点进行对比,通过与真实社区划分进行对比来验证社区划分的正确性,如果社区划分正确则输出社区划分结果。
2.根据权利要求1所述的方法,其特征在于,
步骤2f)中,当aij>0时,rij表示具有正连接的两个网络节点的相似度;当aij<0时,rij表示具有负连接的两个网络节点的相似度。
3.根据权利要求1所述的方法,其特征在于,其中
步骤(4)中,进行网络节点的状态值更新的迭代次数取值范围为[500,5000]。
4.根据权利要求1所述的方法,其特征在于,其中
步骤(5)中网络节点的达到稳定的状态值与2π取模,使所有网络节点的状态值都处于区间[0,2π]内;
步骤(5)中的阈值τ的取值范围为0≤τ≤0.001。
5.一种基于路径相似度对符号网络进行社区检测的系统,所述系统包括:
邻接矩阵生成单元,生成与待检测的符号网络对应的N×N阶的邻接矩阵A,所述邻接矩阵A用于表示待检测的符号网络中的网络节点之间的连接关系,其中N为所述待检测的符号网络中网络节点的数量,N为大于1的自然数;
其中如果所述待检测的符号网络中的网络节点i与网络节点j之间存在正向连接边,则将邻接矩阵A中的相应元素aij设定为正权值;
如果待检测的符号网络中的网络节点i与网络节点j之间存在负向连接边,则将邻接矩阵A中的相应元素aij设定为负权值;
如果待检测的符号网络中的网络节点i与网络节点j之间不存在连接边,则将邻接矩阵A中的相应元素aij设定为零;
其中i和j为自然数,并且1≤i≤N、1≤j≤N;
相似性矩阵生成单元,对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵,根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵,
其中对邻接矩阵A中的元素进行相似度计算,以获得网络节点之间的相似度,根据网络节点之间的相似度确定所述待检测的符号网络的相似度矩阵包括:
计算使得两个节点成为正连接一跳邻居的正能量
其中
计算使得两个节点成为正连接二跳邻居的正能量
其中
计算使得两个节点成为正连接一跳邻居的负能量
其中
计算使得两个节点成为正连接二跳邻居的负能量
其中
计算基于路径的系数λm,λm取值为网络平均度路径长度次幂的倒数,即其中m=1或2;即基于一跳路径的系数为λ1,基于二跳路径的系数为λ2,
其中
计算节点间相似度矩阵元素:
获得相似度矩阵R=(rij)N×N;其中根据所述相似度矩阵计算所述待检测的符号网络的相似性矩阵包括:
通过将相似度矩阵R=(rij)N×N中每一行的正相似度归一化,并且将每一行的负相似度归一化来获得相似性矩阵S=(sij)N×N,其中
其中,Pi={j|rij>0},Qi={j|rij<0};
网络节点状态确定单元,产生网络节点的初始状态值:在[0,2π]内随机产生所述待检测的符号网络的N个网络节点中每个网络节点的初始状态值,其中所述初始状态值服从均匀分布;
所述网络节点状态确定单元对待检测的符号网络中每个网络节点的状态值进行更新:
其中xi(t)表示网络中第i个节点在当前迭代t步的状态值,xj(t)表示网络中第j个节点在当前迭代t步的状态值,xi(t+1)表示网络中第i个节点在下一次迭代t+1步的状态值,K1,K2为系数;K1,K2取值范围都大于零;
所述网络节点状态确定单元对计算每个网络节点更新前的状态值与更新后的状态值相减后的绝对值,确定上述绝对值中的最大值,判断该最大值是否小于阈值τ;若小于,则确定每个网络节点更新后的状态值达到稳定,获得网络节点的状态图;否则,若该最大值大于阈值τ,将每个网络节点更新后的状态值作为该网络节点下一次更新的更新前的状态值,重新进行状态值的确定;
网络结构确定单元,确定待检测的符号网络的社区划分结果并且在验证正确后输出所述社区划分结果,具体为:
在网络节点的状态图中,将状态一致的节点放入同一组中,将同一组中的网络节点划分为一个社区,直至将所有的网络节点划分到各自对应的社区为止,从而获得社区划分结果;
将得到的社区划分结果中的网络节点与原始社区中的相应网络节点进行对比,通过与真实社区划分进行对比来验证社区划分的正确性,如果社区划分正确则输出社区划分结果。
6.根据权利要求5所述的系统,其特征在于,
若aij大于零,则rij表示具有正连接的两个网络节点的相似度;以及
若aij小于零,则rij表示具有负连接的两个网络节点的相似度。
7.根据权利要求5所述的系统,其特征在于,其中
进行网络节点的状态值更新的迭代次数取值范围为[500,5000]均大于0。
8.根据权利要求5所述的系统,其特征在于,其中
网络节点的达到稳定的状态值与2π取模,使所有网络节点的状态值都处于区间[0,2π]内;并且阈值τ的取值范围为0≤τ≤0.001。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510896076.1A CN105515859B (zh) | 2015-12-01 | 2015-12-01 | 基于路径相似度对符号网络进行社区检测的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510896076.1A CN105515859B (zh) | 2015-12-01 | 2015-12-01 | 基于路径相似度对符号网络进行社区检测的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105515859A CN105515859A (zh) | 2016-04-20 |
CN105515859B true CN105515859B (zh) | 2018-09-14 |
Family
ID=55723518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510896076.1A Expired - Fee Related CN105515859B (zh) | 2015-12-01 | 2015-12-01 | 基于路径相似度对符号网络进行社区检测的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105515859B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109074622B (zh) | 2016-04-27 | 2022-04-05 | 北京嘀嘀无限科技发展有限公司 | 确定运输服务路线的系统及方法 |
CN107798020B (zh) * | 2016-09-07 | 2020-09-22 | 滴图(北京)科技有限公司 | 一种公交路线匹配判断方法及装置 |
CN111709518A (zh) * | 2020-06-16 | 2020-09-25 | 重庆大学 | 一种基于社区感知和关系注意力的增强网络表示学习的方法 |
CN113408090B (zh) * | 2021-05-31 | 2023-10-27 | 上海师范大学 | 一种基于符号网络的节点关系获取方法及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104217114A (zh) * | 2014-09-04 | 2014-12-17 | 内蒙古工业大学 | 基于动态演化对符号网络进行社区检测的方法及系统 |
CN104462321A (zh) * | 2014-12-01 | 2015-03-25 | 国家电网公司 | 一种科技成果的推广方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101969395B (zh) * | 2009-07-28 | 2013-02-27 | 华为技术有限公司 | 节点配置和路径探测方法、系统和网络设备 |
-
2015
- 2015-12-01 CN CN201510896076.1A patent/CN105515859B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104217114A (zh) * | 2014-09-04 | 2014-12-17 | 内蒙古工业大学 | 基于动态演化对符号网络进行社区检测的方法及系统 |
CN104462321A (zh) * | 2014-12-01 | 2015-03-25 | 国家电网公司 | 一种科技成果的推广方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105515859A (zh) | 2016-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105515859B (zh) | 基于路径相似度对符号网络进行社区检测的方法及系统 | |
Liu et al. | Information diffusion and opinion leader mathematical modeling based on microblog | |
Li et al. | Identifying overlapping communities in social networks using multi-scale local information expansion | |
CN107742169A (zh) | 一种基于复杂网络的城市公交网络系统构建方法及性能评估方法 | |
CN105761153A (zh) | 一种加权网络重要用户发现的实现方法 | |
CN110059731A (zh) | 一种基于加权k-阶传播数的节点重要性评价方法 | |
CN110705045A (zh) | 一种利用网络拓扑特性构建加权网络的链路预测方法 | |
Sun et al. | Overlapping community detection based on information dynamics | |
Liu et al. | How to protect ourselves from overlapping community detection in social networks | |
CN102819611A (zh) | 一种复杂网络局部社区挖掘方法 | |
CN105846437A (zh) | 一种计及互动相关性的cholesky分解半不变量潮流计算方法 | |
Wang et al. | Influential nodes identification using network local structural properties | |
Bagheri et al. | An efficient and fast influence maximization algorithm based on community detection | |
Bendahman et al. | Unveiling Influence in Networks: A Novel Centrality Metric and Comparative Analysis through Graph-Based Models | |
CN109255433B (zh) | 一种基于相似性的社区检测的方法 | |
Xie et al. | PathMLP: Smooth Path Towards High-order Homophily | |
CN107316246A (zh) | 一种社交网络关键用户的挖掘方法 | |
Liu et al. | Link Prediction in Signed Networks based on The Similarity and Structural Balance Theory. | |
CN104217114A (zh) | 基于动态演化对符号网络进行社区检测的方法及系统 | |
Zheng et al. | Measurement method of distributed nodes in wireless sensor networks based on multiple attributes | |
Nian et al. | Community detection in social networks based on information propagation and user engagement | |
Derr et al. | Signed node relevance measurements | |
Ferdowsi et al. | Generating high-quality synthetic graphs for community detection in social networks | |
Wang | An improved complex network community detection algorithm based on k-means | |
Zhao et al. | Overlapping Community Detection Algorithm Based on High‐Quality Subgraph Extension in Local Core Regions of Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180914 Termination date: 20191201 |