CN104537126A - 一种基于边图随机游走的重叠社区发现方法 - Google Patents

一种基于边图随机游走的重叠社区发现方法 Download PDF

Info

Publication number
CN104537126A
CN104537126A CN201510046401.5A CN201510046401A CN104537126A CN 104537126 A CN104537126 A CN 104537126A CN 201510046401 A CN201510046401 A CN 201510046401A CN 104537126 A CN104537126 A CN 104537126A
Authority
CN
China
Prior art keywords
limit
node
community
graph
beta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510046401.5A
Other languages
English (en)
Other versions
CN104537126B (zh
Inventor
邓晓衡
李更好
桂劲松
刘安丰
沈海澜
李登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201510046401.5A priority Critical patent/CN104537126B/zh
Publication of CN104537126A publication Critical patent/CN104537126A/zh
Application granted granted Critical
Publication of CN104537126B publication Critical patent/CN104537126B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于边图随机游走的重叠社区发现方法,主要包括以下步骤:1)根据网络中成员的关系,构建一个相互连接的无向图G,由图G的关联矩阵B可得到有权边图LG的权值矩阵H,有权边图LG中的节点为初始无向图G中的边。2)在有权边图LG上进行长度为T的随机游走,初始转移概率矩阵P根据权值矩阵H得到,无向图G中边之间的相似度为T步内转移概率之和,再将相似度转化为距离,聚类产生边社区。3)定义节点受到边社区的吸引度,找出边社区之间的边缘节点,根据吸引度的阈值δ可对边缘节点划分,最后检测到允许节点重叠的社区。本发明方法简单易行,并且通过调整阈值δ能发现不同重叠程度的社区。

Description

一种基于边图随机游走的重叠社区发现方法
技术领域
本发明属于复杂网络领域,具体涉及一种基于边图随机游走的重叠社区发现方法。
背景技术
在网络理论的研究中,复杂网络是由数量巨大的节点和节点之间错综复杂的关系共同构成的网络结构。用数学的语言来说,就是一个有着足够复杂的拓扑结构特征的图。现实世界中包含着各种类型的复杂网络,如社会网络(朋友关系网络及合作网络等)、技术网络(万维网以及电力网等)、生物网络(神经网络、食物链网络以及新陈代谢网络等)。人以群分,物以类聚,社区是社会网络一个非常重要的特征。社区是从一个中观的角度来研究网络,它分析的不是每一个节点的特性,而是网络中的某一部分的特性。往往社区内部成员之间会存在大量的信息和行为的交互,而社区之间的交互就会比较少。
传统的社区发现算法,大多是将网络的节点划分到某一个社区里,它认为每个成员在社区中地位或作用是平等的。然而,真实的网络中某些节点可能同时属于多个社区,这些重叠节点在社区之间的交互中起着一定的连接作用。例如,一个人同时属于几个社区:其中一个是工作中的同事圈,一个是关于家庭的亲人圈,还有同一兴趣爱好的朋友圈等等。节点的多尺度特性决定了节点属于的社区数,因而发现这些重叠的节点对于研究整个网络的结构有重要意义。于是,这种重叠社区发现方法就很好的突破传统方法的局限性,可以更有效地展示出网络潜在的社区结构。
但目前的重叠社区发现或聚类方法,存在以下问题:(1)目前基于距离的聚类方法都只考虑了当前状态下的网络结构状态,没有考虑时间的变化;(2)大多数的方法仅仅考虑节点的属性,忽略了边对社区的影响。
发明内容
本发明的目的在于提供一种基于边图随机游走的重叠社区发现方法,可以发现无向网络中的重叠社区。
为实现上述目的,本发明所述的重叠社区发现方法包括以下三大步骤:
步骤1),计算有权边图LG的权值矩阵H,具体步骤如下:
步骤1-1)根据复杂网络中成员与成员之间的关系构建一个相互连接的无向图G=(V,E),V代表成员节点的集合,E代表成员间的边集合。假定网络图中总的节点数为N,边数为M。A=[aij]为无向图G的邻接矩阵,若节点i与节点j相连,则aij=1,反之aij=0;W=[wij]则为无向图G的权值矩阵,其中wij表示无向边(i,j)的权值。节点i的强度si等于与节点i相连的所有边的权值之和,即si=∑jwij。若网络为无向无权图,则W=A,每条边权值为1。
步骤1-2)对无向图G中的边进行编号,并记录连接关系及权值,建立图G的关联矩阵B。关联矩阵B=[b]是一个N×M的矩阵,元素b计算公式为:
步骤1-3)构建有权边图LG,计算其权值矩阵H。有权边图LG中M个节点代表初始无向图G的M条边,两点之间的边表示无向图G中相应的两条边有公共顶点。其权值矩阵H=[hαβ]是一个M×M的矩阵,可以通过关联矩阵B计算得到,计算公式为:
h αβ = Σ i b iα b iβ s i   公式2
其中,节点的强度si=∑jwij=∑αb。权值矩阵H是一个对称矩阵且含有自环,表明随机游走者不仅仅可以进行边到边的游走,还可以在一条边的两个端点间游走,更符合实际情况。
步骤2),在有权边图LG上进行随机游走,计算LG中节点之间的距离,聚类获得边社区CL,具体步骤如下:
步骤2-1)在有权边图LG上进行长度为T的随机游走,计算并记录每一步t(1≤t≤T)的转移概率。其中,一步转移概率矩阵P=[pαβ]由权值矩阵H计算而得,计算公式为:
p αβ = h αβ Σ β h αβ   公式3
步骤2-2)对T步内的转移概率进行累加,得到有权边图LG中节点之间的相似度σαβ
σ αβ = σ βα = Σ t = 1 T ( [ P t ] αβ + [ P t ] βα )   公式4
其中,[Pt]αβ表示从边α出发经过t步到达边β的转移概率。
步骤2-3)对相似度进行归一化处理,得到有权边图LG中节点之间的距离,即无向图G中任意两边的距离dαβ
d αβ = d βα = 1 - σ αβ - min σ αβ max σ αβ - min σ αβ   公式5
步骤2-4)根据average-linkage聚类方法对距离进行处理,生成一个有层次的树状图。设定社区数目为q,则可将网络的边划分成q个子集,即边社区CL={P1,...,Pq}。
随机游走的长度T是一个经验值,当取T=1时,则边图LG中只有相邻节点对之间的相似度非零;当T增大时,节点之间的相似度发生相应的变化。不同的T值会产生不同的聚类树,可以利用最大化共表型相关系数c来得到合适的T,c的定义如下,
c = &Sigma; i < j ( d ij - d &OverBar; ) ( z ij - z &OverBar; ) &Sigma; i < j ( d ij - d &OverBar; ) 2 &Sigma; i < j ( z ij - z &OverBar; ) 2   公式6
其中,dij为i到j的距离,zij为链接聚类产生的i到j的cophenetic距离,分别为它们的平均值。
步骤3),将边社区转化为节点社区。
CL={P1,...,Pq}表示网络的边被划分成的q个边社区,我们可以定义网络中的节点u受到来自边社区Pc(1≤c≤q)的吸引度为:
I u P c = &Sigma; ( u , v ) &Element; P c w uv &Sigma; v w uv = s u in ( P c ) s u   公式7
其中,(u,v)表示初始图的一条边,u,v是该边的两个端点,su=∑vwuv为节点u的强度,表示边社区Pc内含有端点u的边的权值之和。吸引度表示边社区Pc内含有端点u的边的权和占节点u的强度的比例,若吸引度越大,则表示节点u被边社区Pc吸引的程度越强烈。根据定义可知时代表u与Pc没有吸引,即u与Pc之间不存在连接;当时代表u完全被Pc吸引,即u在Pc内部。所以,我们只要考虑处于边社区之间的边缘节点受到的吸引度,就可以把边社区转化成节点社区,方法如下:
步骤3-1)找出边社区之间的边缘节点,边缘节点(edge node)的表达式如下:
edge_node={u|{(u,v),(u,w)}∈E,(u,v)∈Pc,(u,w)∈Pd,1≤c<d≤q}
其中,(u,v)和(u,w)分别代表属于不同边社区的边,u,v,w代表不同的节点;
步骤3-2)边缘节点可以是重叠节点,为了避免重叠节点数目过多,我们利用边缘节点受到的吸引度来调节重叠节点的数目。
若边缘节点u受到的最大吸引度Imax来自于边社区Pm(1≤m≤q),它满足条件:
I max = I u P m > &delta; , 且Pm唯一,
则将边缘节点u纳入边社区Pm,反之,边缘节点u仍为重叠节点。
阈值δ的范围为[0,1],δ越小,条件越容易满足,重叠节点数目减少的越多;相反δ越大,条件越难满足,重叠节点数目减少的越少。通常取δ=1/2,即边缘节点受到的唯一最大吸引度大于0.5,则边缘节点可纳入对应的社区。若为无向无权图,则表示与边缘节点u相连的边有一半都在这个边社区里。
大部分节点都被纳入边社区CL,小部分不能纳入的成为重叠节点,最终发现的社区是允许节点重叠的。
所述的步骤2-2)中,无向图G中边之间的相似度是通过计算基于边图随机游走T步的转移概率并累加得到的。
所述的步骤步骤3-2)中,通过调整吸引度的阈值,获得重叠程度不同的社区。
本发明具有以下有益效果:
本发明所述的社区发现方法适用于无向网络,并且可以是有权的无向网。本发明方法首先将初始无向图G转化成有权边图LG,然后在边图LG上进行T步随机游走,统计每一步的转移概率并进行累加得到初始无向图中任意两边的相似度。将相似度进一步转化成距离,根据距离聚类得到边社区CL。最后,根据边缘节点受到边社区昀吸引度对其进行划分,通过控制吸引度的阈值δ可以得到不同重叠程度的节点社区。本发明方法重点考虑了边对网络划分的影响,利用随机游走考虑了网络的时间变化,并定义了边社区对节点的吸引度,可以发现不同重叠程度的社区,适应性强。
附图说明
图1为本发明实例获取社区结构的简单过程示意图,A为一简单无向无权图,B为由A得到的有权边图,C为对边图中的节点进行聚类得到的两个边社区示意图,D为根据边图中的边社区映射到无向无权图的节点社区示意图;
图2为本发明在社会网络Zachary’s karate club应用结果;
图3为本发明在社会网络Dolphins应用结果;
图4为本发明与三种相关的重叠社区方法的比较结果示意图。
具体实施方式
下面结合附图对本发明作进一步描述。
为实现上述目的,本发明所述的重叠社区算法包括以下三大步骤:
步骤1),计算有权边图LG的权值矩阵H,具体步骤如下:
1-1)根据复杂网络中成员与成员之间的关系构建一个相互连接的无向图G=(V,E),V代表成员节点的集合,E代表成员间的边集合。假定网络图中总的节点数为N,边数为M。A=[aij]为无向图G的邻接矩阵,若节点i与节点j相连,则aij=1,反之aij=0;W=[wij]则为无向图G的权值矩阵,其中wij表示无向边(i,j)的权值。节点i的强度si等于与节点i相连的所有边的权值之和,即si=∑jwij。若网络为无向无权图,则W=A,每条边权值为1。
步骤1-2)对无向图G中的边进行编号,并记录连接关系及权值,建立图G的关联矩阵B。关联矩阵B=[b]是一个N×M的矩阵,元素b表示边α占节点i强度的大小,计算公式为:
步骤1-3)构建有权边图LG,计算其权值矩阵H。有权边图LG中M个节点代表初始无向图G的M条边,两点之间的边表示无向图G中相应的两条边有公共顶点。其权值矩阵H=[hαβ]是一个M×M的矩阵,通过关联矩阵B计算得到,计算公式为:
h &alpha;&beta; = &Sigma; i b i&alpha; b i&beta; s i   公式2
其中,节点的强度si=∑jwij=∑αb。权值矩阵H是一个对称矩阵且含有自环,表明随机游走者不仅仅可以进行边到边的游走,还可以在一条边的两个端点间游走,更符合实际情况。
步骤2),在有权边图LG上进行随机游走,计算LG中节点之间的距离,聚类获得边社区CL,具体步骤如下:
步骤2-1)在有权边图LG上进行长度为T的随机游走,计算并记录每一步t(1≤t≤T)的转移概率。其中,一步转移概率矩阵P=[pαβ]由权值矩阵H计算而得,计算公式为:
p &alpha;&beta; = h &alpha;&beta; &Sigma; &beta; h &alpha;&beta;   公式3
步骤2-2)对T步内的转移概率进行累加,得到有权边图LG中节点之间的相似度σαβ
&sigma; &alpha;&beta; = &sigma; &beta;&alpha; = &Sigma; t = 1 T ( [ P t ] &alpha;&beta; + [ P t ] &beta;&alpha; )   公式4
其中,[Pt]αβ表示从边α出发经过t步到达边β的转移概率。
步骤2-3)对相似度进行归一化处理,得到有权边图LG中节点之间的距离,即无向图G中任意两边的距离dαβ
d &alpha;&beta; = d &beta;&alpha; = 1 - &sigma; &alpha;&beta; - min &sigma; &alpha;&beta; max &sigma; &alpha;&beta; - min &sigma; &alpha;&beta;   公式5
其中,maxσαβ,minσαβ分别表示最大和最小的距离。
步骤2-4)根据average-linkage聚类方法对距离进行处理,可生成一个有层次的树状图。设定社区数目为q,则可将网络的边划分成q个子集,即边社区CL={P1,...,Pq}。
随机游走的长度T是一个经验值,当取T=1时,则边图LG中只有相邻节点对之间的相似度非零;当T增大时,节点之间的相似度发生相应的变化。不同的T值会产生不同的聚类树,可以利用最大化共表型相关系数c来得到合适的T,c的定义如下,
c = &Sigma; i < j ( d ij - d &OverBar; ) ( z ij - z &OverBar; ) &Sigma; i < j ( d ij - d &OverBar; ) 2 &Sigma; i < j ( z ij - z &OverBar; ) 2   公式6
其中,dij为i到j的距离,zij为聚类方法产生的i到j的cophenetic距离,分别为它们的平均值。
步骤3),将边社区转化为节点社区。
CL={P1,...,Pq}表示网络的边被划分成的q个边社区,我们可以定义网络中的节点u受到来自边社区Pc(1≤c≤q)的吸引度为:
I u P c = &Sigma; ( u , v ) &Element; P c w uv &Sigma; v w uv = s u in ( P c ) s u   公式7
其中,(u,v)表示初始图的一条边,u,v是该边的两个端点,su=∑vwuv为节点u的强度,表示边社区Pc内含有端点u的边的权值之和。吸引度表示边社区Pc内含有端点u的边的权和占节点u的强度的比例,若吸引度越大,则表示节点u被边社区Pc吸引的程度越强烈。根据定义可知时代表u与Pc没有吸引,即u与Pc之间不存在连接;当时代表u完全被Pc吸引,即u在Pc内部。所以,我们只要考虑处于边社区之间的边缘节点受到的吸引度,就可以把边社区转化成节点社区,方法如下:
步骤3-1)找出边社区之间的边缘节点,边缘节点(edge node)的表达式如下:
edge_node={u|{(u,v),(u,w)}∈E,(u,v)∈Pc,(u,w)∈Pd,1≤c<d≤q}
其中,(u,v)和(uw)分别代表属于不同边社区的边,u,v,w代表不同的节点。
步骤3-2)边缘节点可以是重叠节点,为了避免重叠节点数目过多,我们利用边缘节点受到的吸引度来调节重叠节点的数目。
若边缘节点u受到的最大吸引度Imax来自于边社区Pm(1≤m≤q),它满足条件:且Pm唯一,
则将边缘节点u纳入边社区Pm,反之,边缘节点u仍为重叠节点。阈值δ的范围为[0,1],δ越小,条件越容易满足,重叠节点数目减少的越多;相反δ越大,条件越难满足,重叠节点数目减少的越少。通常取δ=1/2,即边缘节点受到的唯一最大吸引度大于0.5,则边缘节点可纳入对应的社区。若为无向无权图,则表示与边缘节点u相连的边有一半都在这个边社区里。
大部分节点都被纳入边社区CL,小部分不能纳入的成为重叠节点,最终发现的社区是允许节点重叠的。
实施例1
参考图1为本发明方法一个简单应用实例的基本过程示意图。图1A为一个有5个节点,6条边的无向无权图;图1B是由图1A转化成的有权边图,三角形节点代表无向无权图中的边,权值由公式2计算得到,图中节点含有自环,表明游走者可在三角形节点停留,即无向无权图中一条边的两个端点间游走;图1C为在有权边图进行一步随机游走,聚类后得到的两个边社区,三角形节点1,2,3是一个边社区,4,5,6是另一个边社区;图1D为由边社区映射到初始无向无权图的节点社区,此时节点3受到来自两个边社区的吸引度均为1/2,所以节点1,2,3是一个社区,3,4,5是另一个社区,节点3为两个社区的重叠节点。
实施例2
参考图2为本发明方法对Zachary’s karate club网络的处理结果。设定随机游走的长度T=1,图中两种灰度的边表示所划分的边社区,方块和圆表示所划分的两个节点社区,六边形则表示重叠部分。图3A为δ=1时,边缘节点1,2,3,34都是重叠节点;图3B是设定δ=1/2后,边缘节点1,2,34被纳入了对各自吸引度最大的边社区,只剩下节点3为重叠节点。实验结果与真实情况比较,除重叠节点外的其他节点均划分正确。
实施例3
参考图3为本发明方法对Dolphins网络的处理结果。设定随机游走的长度T=2,图中两种灰度的边表示所划分的边社区,用黑色和白色圆圈表示划分的两个节点社区,灰色的六边形节点为重叠部分。图3A为δ=1时,边缘节点2,31,41,58都是重叠节点;图3B是设定δ=1/2后,所有的边缘节点都被纳入到相应的最大吸引度的边社区。实验结果显示,最后的节点划分与真实的分裂情况完全一致。
实施例4
参考图4为本发明方法与其他几种相关方法进行比较的结果。首先,重叠模块度Qov的定义如下:
Q ov = 1 2 m &Sigma; l &Sigma; { i , j } &Element; C l 1 O i O j [ a ij - k i k j 2 m ]
其中,m为网络的总边数,Cl表示所划分的社区,Oi(Oj)表示节点i(j)所属社区的数目,aij为网络邻接矩阵的元素,ki(kj)表示节点i(j)的度。Qov是模块度Q的一个扩展,当任意一个节点i都满足Oi=1时,Qov等于Q。
实验比较了比较了四种算法:MCLC(本发明方法)、CPM、Link、CNM_IC,共使用了五个真实网络数据集,分别是karate、Dolphins、Polbooks、Football、Email网络。进行多次实验,取最大的重叠模块度进行比较。结果显示本发明的方法(MCLC)在五个网络中的表现都比较好,尤其是在Dolphins、Football、Email网络中,重叠模块度Qov是四个算法里最高的。

Claims (3)

1.一种基于边图随机游走的重叠社区发现方法,其特征在于包括以下步骤:
步骤1),计算有权边图LG的权值矩阵H,具体步骤如下:
步骤1-1)根据复杂网络中成员与成员之间的关系构建一个相互连接的无向图G=(V,E),V代表成员节点的集合,E代表成员间的边集合;假定网络图中总的节点数为N,边数为M,A=[aij]为无向图G的邻接矩阵,若节点i与节点j相连,则aij=1,反之aij=0;W=[ωij]则为无向图G的权值矩阵,其中ωij表示无向边(i,j)的权值;节点i的强度si等于与节点i相连的所有边的权值之和,即si=Σjωij;若网络为无向无权图,则W=A,每条边的权值为1;
步骤1-2)对无向图G中的边进行编号,并记录连接关系及权值,建立无向图G的关联矩阵B;关联矩阵B=[b]是一个N×M的矩阵,元素b计算为:
  公式1
步骤1-3)构建有权边图LG,计算其权值矩阵H:有权边图LG中M个节点代表无向图G的M条边,两点之间的边表示无向图G中相应的两条边有公共顶点;其权值矩阵H=[hαβ]是一个M×M的矩阵,通过关联矩阵B计算得到,计算公式为:
h &alpha;&beta; = &Sigma; i b i&alpha; b i&beta; s i   公式2
其中,节点的强度si=∑jωij=∑αb;权值矩阵H是一个对称矩阵且含有自环,表明随机游走者不仅仅可以进行边到边的游走,还可以在一条边的两个端点间游走,更符合实际情况;
步骤2),在有权边图LG上进行随机游走,计算有权边图LG中节点之间的距离,聚类获得边社区CL,具体步骤如下:
步骤2-1)在有权边图LG上进行长度为T的随机游走,计算并记录每一步t的转移概率,1≤t≤T;其中,一步转移概率矩阵P=[pαβ]由权值矩阵H计算而得,计算公式为:
p &alpha;&beta; = h &alpha;&beta; &Sigma; &beta; h &alpha;&beta;   公式3
步骤2-2)对T步内的转移概率进行累加,得到有权边图LG中节点之间的相似度σαβ
&sigma; &alpha;&beta; = &sigma; &beta;&alpha; = &Sigma; t = 1 T ( [ P t ] &alpha;&beta; + [ P t ] &beta;&alpha; )   公式4
其中,[Pt]αβ习表示从边α出发经过t步到达边β的转移概率;
步骤2-3)对相似度进行归一化处理,得到有权边图LG中节点之间的距离,即无向图G中任意两边的距离dαβ
d &alpha;&beta; = d &beta;&alpha; = 1 - &sigma; &alpha;&beta; - min &sigma; &alpha;&beta; max &sigma; &alpha;&beta; - min &sigma; &alpha;&beta;   公式5
其中,maxσαβ,minσαβ分别表示最大和最小的距离;
步骤2-4)根据average-linkage聚类方法对距离进行处理,生成一个有层次的树状图;设定社区数目为q,将网络的边划分成q个子集,即边社区CL={P1,…,Pq};
随机游走的长度T是一个经验值,当取T=1时,则边图LG中只有相邻节点对之间的相似度非零;当T增大时,节点之间的相似度发生相应的变化;不同的T值会产生不同的聚类树,利用最大化共表型相关系数C来得到合适的T,C的定义如下,
C = &Sigma; i < j ( d ij - d &OverBar; ) ( z ij - z &OverBar; ) &Sigma; i < j ( d ij - d &OverBar; ) 2 &Sigma; i < j ( z ij - z &OverBar; ) 2   公式6
其中,dij为i到j的距离,zij为聚类方法产生的i到j的cophenetic距离, 分别为它们的平均值;
步骤3),将边社区转化为节点社区;
CL={P1,…,Pq}表示网络的边被划分成的q个边社区,我们可以定义网络中的节点u受到来自边社区Pc,1≤c≤q的吸引度为:
I u P c = &Sigma; ( u , v ) &Element; P c &omega; uv &Sigma; v &omega; uv = s u in ( P c ) s u   公式7
其中,(u,v)表示初始无向图G的一条边,u,v是该边的两个端点,su=∑vωuv为节点u的强度,表示边社区Pc内含有端点u的边的权值之和;吸引度表示边社区Pc内含有端点u的边的权和占节点u的强度的比例,若吸引度越大,则表示节点u被边社区Pc吸引的程度越强烈;根据定义可知时代表u与Pc没有吸引,即u与Pc之间不存在连接;当时代表u完全被Pc吸引,即u在Pc内部;只要考虑处于边社区之间的边缘节点受到的吸引度,就能将边社区转化成节点社区,方法如下:
步骤3-1)找出边社区之间的边缘节点,边缘节点的表达式如下:
edge_node={u|(u,v)∈Pc,(u,ω)∈Pd,1≤c<d≤q}
其中,(u,v)和(u,ω)分别代表属于不同边社区的边,u,v,ω代表不同的节点;
步骤3-2)边缘节点可以是重叠节点,为了避免重叠节点数目过多,我们利用边缘节点受到的吸引度来调节重叠节点的数目;
若边缘节点u受到的最大吸引度Imax来自于边社区Pm,1≤m≤q,它满足条件
I max = I u P m > &delta; , 且Pm唯一,
则将边缘节点u纳入边社区Pm,反之,边缘节点u仍为重叠节点;
阈值δ的范围为[0,1],δ越小,条件越容易满足,重叠节点数目减少的越多;相反δ越大,条件越难满足,重叠节点数目减少的越少;通常取δ=1/2,即边缘节点受到的唯一最大吸引度大于0.5,则边缘节点可纳入对应的社区;若为无向无权图,则表示与边缘节点u相连的边有一半都在这个边社区里;
大部分节点都被纳入边社区CL,小部分不能纳入的成为重叠节点,最终发现的社区是允许节点重叠的。
2.根据权利要求1所述的基于边图随机游走的重叠社区发现方法,其特征在于:所述的步骤步骤2-2)中,无向图G中边之间的相似度是通过计算基于边图随机游走T步内的转移概率并累加得到的。
3.根据权利要求1所述的基于边图随机游走的重叠社区发现方法,其特征在于:所述的步骤步骤3-2)中,通过调整吸引度的阈值δ,获得重叠程度不同的社区。
CN201510046401.5A 2015-01-29 2015-01-29 一种基于边图随机游走的重叠社区发现方法 Active CN104537126B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510046401.5A CN104537126B (zh) 2015-01-29 2015-01-29 一种基于边图随机游走的重叠社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510046401.5A CN104537126B (zh) 2015-01-29 2015-01-29 一种基于边图随机游走的重叠社区发现方法

Publications (2)

Publication Number Publication Date
CN104537126A true CN104537126A (zh) 2015-04-22
CN104537126B CN104537126B (zh) 2017-12-01

Family

ID=52852654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510046401.5A Active CN104537126B (zh) 2015-01-29 2015-01-29 一种基于边图随机游走的重叠社区发现方法

Country Status (1)

Country Link
CN (1) CN104537126B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184075A (zh) * 2015-09-01 2015-12-23 南京大学 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法
CN105608624A (zh) * 2015-12-29 2016-05-25 武汉理工大学 基于用户体验的微博大数据兴趣社区分析优化方法
CN106355044A (zh) * 2016-08-15 2017-01-25 上海电机学院 基于随机游走模型的蛋白质复合物识别方法
CN107578136A (zh) * 2017-09-14 2018-01-12 福州大学 基于随机游走与种子扩展的重叠社区发现方法
CN108614932A (zh) * 2018-04-23 2018-10-02 中南大学 基于边图的线性流重叠社区发现方法、系统及存储介质
CN109165322A (zh) * 2018-08-01 2019-01-08 成都数联铭品科技有限公司 基于路径关系的网络特征提取系统及方法
CN110276375A (zh) * 2019-05-14 2019-09-24 嘉兴职业技术学院 一种人群动态聚类信息的识别和处理方法
CN110753382A (zh) * 2019-10-23 2020-02-04 中南大学 一种基于车辆位置预测的车载网络路由设置方法
CN111371611A (zh) * 2020-02-28 2020-07-03 广州大学 一种基于深度学习的加权网络社区发现方法及装置
CN111881977A (zh) * 2020-07-27 2020-11-03 复旦大学 一种基于节点间距离趋势的社团网络检测方法、设备和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102857525A (zh) * 2011-06-28 2013-01-02 安徽大学 基于随机游走策略的社区发现方法
CN103699617A (zh) * 2013-12-16 2014-04-02 西安交通大学 一种基于随机游走的社区发现方法
CN103729467A (zh) * 2014-01-16 2014-04-16 重庆邮电大学 一种社交网络中的社区结构发现方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102857525A (zh) * 2011-06-28 2013-01-02 安徽大学 基于随机游走策略的社区发现方法
CN103699617A (zh) * 2013-12-16 2014-04-02 西安交通大学 一种基于随机游走的社区发现方法
CN103729467A (zh) * 2014-01-16 2014-04-16 重庆邮电大学 一种社交网络中的社区结构发现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
袁超等: "复杂网络的局部社团结构挖掘算法", 《自动化学报》 *
马宇哲等: "社交网络重叠社团检测初探", 《计算机与数学工程》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184075B (zh) * 2015-09-01 2018-07-06 南京大学 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法
CN105184075A (zh) * 2015-09-01 2015-12-23 南京大学 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法
CN105608624A (zh) * 2015-12-29 2016-05-25 武汉理工大学 基于用户体验的微博大数据兴趣社区分析优化方法
CN106355044A (zh) * 2016-08-15 2017-01-25 上海电机学院 基于随机游走模型的蛋白质复合物识别方法
CN107578136A (zh) * 2017-09-14 2018-01-12 福州大学 基于随机游走与种子扩展的重叠社区发现方法
CN108614932B (zh) * 2018-04-23 2021-11-30 中南大学 基于边图的线性流重叠社区发现方法、系统及存储介质
CN108614932A (zh) * 2018-04-23 2018-10-02 中南大学 基于边图的线性流重叠社区发现方法、系统及存储介质
CN109165322A (zh) * 2018-08-01 2019-01-08 成都数联铭品科技有限公司 基于路径关系的网络特征提取系统及方法
CN109165322B (zh) * 2018-08-01 2022-04-19 成都数联铭品科技有限公司 基于路径关系的网络特征提取系统及方法
CN110276375B (zh) * 2019-05-14 2021-08-20 嘉兴职业技术学院 一种人群动态聚类信息的识别和处理方法
CN110276375A (zh) * 2019-05-14 2019-09-24 嘉兴职业技术学院 一种人群动态聚类信息的识别和处理方法
CN110753382A (zh) * 2019-10-23 2020-02-04 中南大学 一种基于车辆位置预测的车载网络路由设置方法
CN110753382B (zh) * 2019-10-23 2021-08-17 中南大学 一种基于车辆位置预测的车载网络路由设置方法
CN111371611A (zh) * 2020-02-28 2020-07-03 广州大学 一种基于深度学习的加权网络社区发现方法及装置
CN111881977A (zh) * 2020-07-27 2020-11-03 复旦大学 一种基于节点间距离趋势的社团网络检测方法、设备和系统

Also Published As

Publication number Publication date
CN104537126B (zh) 2017-12-01

Similar Documents

Publication Publication Date Title
CN104537126A (zh) 一种基于边图随机游走的重叠社区发现方法
Tong et al. An efficient deep model for day-ahead electricity load forecasting with stacked denoising auto-encoders
Malafeyev et al. Stochastic models of social-economic dynamics
CN102426697B (zh) 基于遗传粗糙集c均值聚类的图像分割方法
CN104731962A (zh) 一种社交网络中基于相似社团的好友推荐方法及系统
CN102521656A (zh) 非平衡样本分类的集成迁移学习方法
CN107945199A (zh) 基于蝙蝠算法和大津算法的红外图像分割方法及系统
Kaur et al. Minimal variability OWA operator combining ANFIS and fuzzy c-means for forecasting BSE index
CN113886460A (zh) 低带宽分布式深度学习方法
Mahalakshmi et al. Mamdani fuzzy rule based model to classify sites for aquaculture development
CN102270343B (zh) 一种基于Ising图模型的图像分割方法
CN117056763A (zh) 基于变分图嵌入的社区发现方法
Zahari et al. Evaluation of sustainable development indicators with fuzzy TOPSIS based on subjective and objective weights
Yue-Ju et al. Improving land resource evaluation using fuzzy neural network ensembles
Han et al. A new approach for function approximation incorporating adaptive particle swarm optimization and a priori information
Aprianti et al. The application of rough set and fuzzy rough set based algorithm to classify incomplete meteorological data
CN104021563B (zh) 基于多目标模糊聚类和反对学习的噪声图像分割方法
Elomda et al. MCDM method based on improved fuzzy decision map
Nawaz et al. Event-based rainfall-runoff modeling using adaptive network-based fuzzy inference system
CN111476321A (zh) 基于特征加权贝叶斯优化算法的空中飞行物识别方法
CN112990618A (zh) 一种工业物联网中基于机器学习方法的预测方法
CN106780069A (zh) 一种基于节点社团重要度的局部动态路径选择机制方法
Sunori et al. Classification of rainfall levels using various machine learning techniques
CN117424813B (zh) 一种用于区块链的节点扩充方法
Xu et al. A weather forecast system based on artificial immune system

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant