CN107133877A - 网络中重叠社团的挖掘方法 - Google Patents
网络中重叠社团的挖掘方法 Download PDFInfo
- Publication number
- CN107133877A CN107133877A CN201710419287.5A CN201710419287A CN107133877A CN 107133877 A CN107133877 A CN 107133877A CN 201710419287 A CN201710419287 A CN 201710419287A CN 107133877 A CN107133877 A CN 107133877A
- Authority
- CN
- China
- Prior art keywords
- seed
- corporations
- summit
- vertex
- coverage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012804 iterative process Methods 0.000 claims abstract description 4
- 238000005295 random walk Methods 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 16
- 241000894007 species Species 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000013508 migration Methods 0.000 claims description 3
- 241001632422 Radiola linoides Species 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 241001632427 Radiola Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明揭示了一种网络中重叠社团的挖掘方法,包括步骤A、通过定义种子选择的过程,在种子选择迭代过程中依次选择不属于覆盖集的顶点作为种子,并根据顶点覆盖增长率的变化范围确定种子数目,自适应产生最优种子;B、利用个性化PageRank算法以各顶点为起点扩展社团范围,覆盖多数顶点;C、将未覆盖顶点自适应划分到邻近社团中,调整社团结构,完成社团划分。本发明的优点在于网络中重叠社团的挖掘方法通过对顶点增长覆盖率等的定义,可在种子选择阶段根据社团结构自行产生最优种子,并能在个性PageRank算法后自适应地合并和调整未覆盖顶点。
Description
技术领域
本发明涉及在复杂网络中对重叠社团进行检测和划分的方法,具体涉及一种基于种子选择和种子扩展的自适应社团检测方法。
背景技术
挖掘复杂网络中的社团结构,对于发现复杂网络中的隐藏规律、预测网络行为以及增强网络的安全可信度具有重要的理论意义和广泛的应用前景。社团检测作为网络分析领域中的基础课题,在生物科学、社会学、计算机科学、经济学等众多研究领域都具有应用价值。对于某一特定的网络,可以采用一定的模型将其转化为只考虑边和顶点关系的图结构。复杂网络的一大基本特征是具有较明显的“社团”划分,属于同一社团的顶点间连接紧密,而不同社团间连接稀疏。相同社团内的顶点具有某些相似的特征,而不同社团的顶点特征差异较大。针对真实复杂网络的社团检测有利于识别网络结构,分析网络特性。
多数传统的社团检测方法将图中顶点划分到某一特定社团中。然而在现实世界,顶点可能属于多社团共享状态。如社交网络中,个人鉴于其不同身份,参与多个社交圈子。考虑顶点属于多个社团的情况更具有实用性和研究价值。重叠社团检测允许多个社团间相互重叠,重叠区域内的顶点属于这若干个社团共有。因此,重叠社团检测成为社团检测问题中需要进一步探究的问题。
Whang等人提出两种不同的种子选择方法,分别使用各社团的中心顶点和“高密度”顶点作为种子来源,不能有效处理含离群点的网络结构;种子数目事先指定,无法根据社团规模自行调整。Coscia等人提出的DEMON方法采用“局部为先”思想,结合了标记传播法进行社团检测,易陷入局部最优的状态,无法根据社团整体结构动态调整种子分布。
发明内容
本发明所要解决的技术问题是实现一种能够处理复杂网络中的社团检测问题的方法,也是一种复杂网络的重叠社团挖掘方法,该方法需要能够自适应各类型的复杂网络中的重叠社团检测,根据社团整体结构动态调整种子分布,达到适用范围广泛,效率较高的要求。
为了实现上述目的,本发明采用的技术方案为:网络中重叠社团的挖掘方法,包括以下步骤:
步骤1、种子选择阶段:在定义种子选择的过程中根据社团结构自适应产生最优的种子;
步骤2、种子扩展阶段:利用个性化PageRank算法,并根据社团和种子顶点间的关系进行种子扩展,覆盖网络多数顶点;
步骤3、社团扩展阶段:将未覆盖的顶点自适应划分到邻近社团中,完成社团划分。
所述步骤1中,先定义种子集、覆盖集和顶点覆盖增长率的概念,将顶点按照度从大到小排序,之后在种子选择迭代过程中依次选择不属于覆盖集的顶点作为种子,并根据顶点覆盖增长率的变化范围确定种子数目,根据顶点覆盖增长率的定义选择顶点,并获取初始种子集。
所述步骤2中,基于种子选择阶段得到的初始种子集按顺序对其中的种子及其邻接点进行种子扩展。
所述步骤3中,在PageRank算法结束时,未被覆盖的社团可分成两种类型,种类一、顶点至少有一个邻接点属于簇类中,种类二、顶点是离群点,其所有邻接点也都未被覆盖,如果顶点属于种类一,则将顶点与其邻接点分到同一社团中;如果顶点属于种类二,则将顶点与可能存在的邻接点组成一个新社团。
所述步骤1包括以下步骤:
步骤1.1、记G(V,E)为无向图,顶点集记为V={v1,v2,...vN},对应N个顶点和边集将顶点按照度从大到小排序,并对其进行1到n编号,计算顶点vi的度degree(vi),初始化i=1;
步骤1.2、记Coveragei-1包含第i次迭代时生成的种子集及它们的邻接点;
定义式:Coveragei=si∪neighbor(si)∪Coveragei-1;其中si表示第i次迭代时选择的种子,neighbor(si)表示si的邻接点,n为迭代的次数;
如果顶点vi不存在于第i-1次迭代时生成的种子集及它们的邻接点集合Coveragei-1中,则利用式Seedi=si∪Seedi-1(i=1,2,...,n),计算第i次迭代时生成的种子集Seedi,将顶点vi加入种子集Seedi中,并计算Coveragei,将顶点vi和它的邻接点和上一次迭代生成的Coveragei-1加入集合Coveragei中;
步骤1.3、利用顶点覆盖增长率GrowthRatei控制种子的数量;
再通过计算顶点覆盖增长率GrowthRatei,其中size(Coveragei)是Coveragei中元素的个数;
如果GrowthRatei>η,表明还有顶点可以加入种子集,i=i+1,找到序列中的下一个顶点,并循环步骤1.2和步骤1.3,若条件不满足,则进入步骤1.4;
步骤1.4、将上一次迭代的种子集Seedi-1复制到Seedall,Seedall就是选择完毕的种子集。
所述步骤2包括以下步骤:
步骤2.1、基于种子选择阶段,已经得到初步种子集Seedall,记α为传送概率,ε为随机游走的误差,初始化count=1,对于Seedall中所有种子scount按顺序进行扩展;
步骤2.2、利用T←{scount}∪{neighbor(scount)}将scount及它的邻接点neighbor(scount) 加入集合T中,寻找scount的邻接点中是否存在可能的种子;
步骤2.3、设Xi={x1i,x2i,...,xni}为page-rank算法第i次随机游走后的 Page-Rank向量,向量Ri={r1i,r2i,...,rni}为每个顶点第i次随机游走时的启动向量,之后对于点集合V中的任意顶点v,顶点v在第1次随机游走后的概率xv1=0,对于集合V/T中的任意顶点v,顶点v在第1次随机游走后启动向量的概率rv1=0,对于集合T中的任意顶点v,顶点v在第1次随机游走后启动向量的概率最后令i=1;
步骤2.4、如果此时满足rvi>degree(v)·ε;
利用计算顶点v在第i+1次随机游走后的概率xv(i+1),对于边集合E中所有与v相连的边(v,u);
利用rui=ru(i-1)+(1-α)rv(i-1)/2degree(v)计算顶点u在第i+1次随机游走后启动向量的概率ru(i+1),其中α为传送概率,ε为随机游走的误差(ε-approximate),两者取值位于(0,1]之间;
利用rvi=(1-α)rv(i-1)/2计算顶点v在第i+1次随机游走后启动向量的概率rv(i+1);
之后对点集V中的下一个顶点进行计算,如果此时还满足rvi>degree(v)·ε条件,则循环步骤2.4,若干不满足,则进入步骤2.5;
步骤2.5、对于点集合V中所有顶点v,如果就将该顶点作为新种子加入Ccount;
步骤2.6、将Ccount加入社团集合C中,继续从步骤2.1开始从Seedall下一个种子进行种子扩展,直到遍历完Seedall中的所有种子。
所述步骤3包括以下步骤:
步骤3.1、基于种子扩展阶段生成的社团集合C,将C中的每个社团Ci复制给Ci',最终保存在社团集合C'中;
步骤3.2、对于在点集合V不在集合C中的顶点,即没有被划分到任何一个社团中的剩余顶点v,利用Remain←Remain∪{v}将顶点加入到剩余集合Remain中;
步骤3.3、对于剩余集合Remain中的顶点v,如果v存在至少有一个邻接点u 属于簇类中,利用Ci'←Ci'∪{v}将v与u所在的社团合并,否则,说明v是离群点,其所有邻接点也都未被覆盖,利用C'M+1←{v}∪{neighbor(v)}将顶点v与它的邻接点合并形成一个新社团。
本发明的优点在于网络中重叠社团的挖掘方法通过对顶点增长覆盖率等的定义,可在种子选择阶段根据社团结构自行产生最优种子,并能在个性PageRank 算法后自适应地合并和调整未覆盖顶点。
附图说明
下面对本发明说明书中每幅附图表达的内容作简要说明:
图1为网络中重叠社团的挖掘方法流程图;
图2为种子选择阶段控制流程图;
图3为种子扩展阶段控制流程图;
图4为社团扩展阶段控制流程图。
具体实施方式
如图1所示,重叠社团挖掘方法通过以下三步实现:
步骤1、种子选择阶段:通过定义种子选择的过程,根据社团结构自适应产生最优种子。定义种子集,覆盖集和顶点覆盖增长率的概念,将顶点按照度从大到小排序。然后在种子选择迭代过程中依次选择不属于覆盖集的顶点作为种子并根据顶点覆盖增长率的变化范围确定种子数目。根据顶点覆盖增长率的定义选择顶点,结合贪心法思想,获取初始种子集。
步骤2、种子扩展阶段:利用个性化PageRank算法根据社团和种子顶点间的关系进行种子扩展,覆盖网络多数顶点。基于种子选择阶段得到的初始种子集按顺序对其中的种子及其邻接点进行种子扩展。
步骤3、社团扩展阶段:将未覆盖顶点自适应划分到临近社团中,完成社团划分。在PageRank算法结束时,未被覆盖的社团可分成两种类型,一种顶点至少有一个邻接点属于簇类中;另一种顶点是离群点,其所有邻接点也都未被覆盖。如果顶点属于前者,则与其邻接点分到同一社团中;如果顶点属于后者,则将它与可能存在的邻接点组成一个新社团。
如图2所示,种子选择阶段包括以下步骤:
步骤1.1记G(V,E)为无向图,顶点集记为V={v1,v2,...vN},对应N个顶点和边集将顶点按照度从大到小排序,并对其进行1到n编号,计算顶点vi的度degree(vi),初始化i=1;
步骤1.2记Coveragei-1包含第i次迭代时生成的种子集及它们的邻接点,具体定义如式(1),如果顶点vi不存在于第i-1次迭代时生成的种子集及它们的邻接点集合Coveragei-1中,则利用式(2)计算第i次迭代时生成的种子集Seedi,将顶点vi加入种子集Seedi中,利用式(1)计算Coveragei,将顶点vi和它的邻接点和上一次迭代生成的Coveragei-1加入集合Coveragei中;
步骤1.3利用顶点覆盖增长率GrowthRatei控制种子的数量,再通过式(3)计算顶点覆盖增长率GrowthRatei,如果GrowthRatei>η,说明还有顶点可以加入种子集,i=i+1,找到序列中的下一个顶点,循环步骤1.2和1.3,如果不满足该条件,则进入步骤1.4;
步骤1.4将上一次迭代生成的种子集Seedi-1复制到Seedall,Seedall就是选择完毕的种子集。
公式如下:
Coveragei=si∪neighbor(si)∪Coveragei-1 (1)
式(1)中,si表示第i次迭代时选择的种子,neighbor(si)表示si的邻接点,n为迭代的次数。
Seedi=si∪Seedi-1(i=1,2,...,n) (2)
其中size(Coveragei)是Coveragei中元素的个数。
如图3所示,种子扩展阶段包括以下步骤:
步骤2.1基于种子选择阶段,已经得到初步种子集Seedall,记α为传送概率,ε为随机游走的误差,初始化count=1,对于Seedall中所有种子scount按顺序进行扩展;
步骤2.2首先利用式(4)将scount及它的邻接点neighbor(scount)加入集合T中,寻找scount的邻接点中是否存在可能的种子;
步骤2.3设Xi={x1i,x2i,...,xni}为page-rank算法第i次随机游走后的 Page-Rank向量,向量Ri={r1i,r2i,...,rni}为每个顶点第i次随机游走时的启动向量。然后对于点集合V中的任意顶点v,顶点v在第1次随机游走后的概率xv1=0。对于集合V/T中的任意顶点v,顶点v在首次随机游走后启动向量的概率rv1=0。对于集合T中的任意顶点v,顶点v在首次随机游走后启动向量的概率最后令i=1;
步骤2.4如果此时满足式(5),利用式(6)计算顶点v在第i+1次随机游走后的概率xv(i+1)。对于边集合E中所有与v相连的边(v,u),利用式(8)计算顶点u在第 i+1次随机游走后启动向量的概率ru(i+1)。利用式(7)计算顶点v在第i+1次随机游走后启动向量的概率rv(i+1)。然后对点集V中的下一个顶点进行计算,如果此时还满足式(5)这个条件,则循环该步骤,不满足,则进入步骤2.5;
步骤2.5对于点集合V中所有顶点v,如果就将该顶点作为新种子加入Ccount;
步骤2.6将Ccount加入社团集合C中,继续从步骤2.1开始从Seedall下一个种子进行种子扩展,直到遍历完Seedall中的所有种子。
T←{scount}∪{neighbor(scount)}; (4)
rvi>degree(v)·ε (5)
rvi=(1-α)rv(i-1)/2 (7)
rui=ru(i-1)+(1-α)rv(i-1)/2degree(v) (8)
其中α为传送概率,ε为随机游走的误差(ε-approximate),两者取值位于(0,1] 之间。
如图4所述,社团扩展阶段包括以下步骤:
步骤3.1基于种子扩展阶段生成的社团集合C,将C中的每个社团Ci复制给Ci',最终保存在社团集合C'中;
步骤3.2对于在点集合V不在集合C中的顶点,就是所要找的没有被划分到任何一个社团中的剩余顶点v,利用式(9)将顶点加入到剩余集合Remain;
步骤3.3对于剩余集合Remain中的顶点v,如果v存在至少有一个邻接点u 属于簇类中,利用式(10)将v与u所在的社团合并。否则,说明v是离群点,其所有邻接点也都未被覆盖,利用式(11)将顶点v与它的邻接点合并形成一个新社团。
Remain←Remain∪{v} (9)
Ci'←Ci'∪{v} (10)
C'M+1←{v}∪{neighbor(v)} (11)
上面结合附图对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。
Claims (7)
1.网络中重叠社团的挖掘方法,其特征在于,包括以下步骤:
步骤1、种子选择阶段:在定义种子选择的过程中根据社团结构自适应产生最优的种子;
步骤2、种子扩展阶段:利用个性化PageRank算法,并根据社团和种子顶点间的关系进行种子扩展,覆盖网络多数顶点;
步骤3、社团扩展阶段:将未覆盖的顶点自适应划分到邻近社团中,完成社团划分。
2.根据权利要求1所述的网络中重叠社团的挖掘方法,其特征在于:所述步骤1中,先定义种子集、覆盖集和顶点覆盖增长率的概念,将顶点按照度从大到小排序,之后在种子选择迭代过程中依次选择不属于覆盖集的顶点作为种子,并根据顶点覆盖增长率的变化范围确定种子数目,根据顶点覆盖增长率的定义选择顶点,并获取初始种子集。
3.根据权利要求1所述的网络中重叠社团的挖掘方法,其特征在于:所述步骤2中,基于种子选择阶段得到的初始种子集按顺序对其中的种子及其邻接点进行种子扩展。
4.根据权利要求1所述的网络中重叠社团的挖掘方法,其特征在于:所述步骤3中,在PageRank算法结束时,未被覆盖的社团可分成两种类型,种类一、顶点至少有一个邻接点属于簇类中,种类二、顶点是离群点,其所有邻接点也都未被覆盖,如果顶点属于种类一,则将顶点与其邻接点分到同一社团中;如果顶点属于种类二,则将顶点与可能存在的邻接点组成一个新社团。
5.根据权利要求1或2所述的网络中重叠社团的挖掘方法,其特征在于,所述步骤1包括以下步骤:
步骤1.1、记G(V,E)为无向图,顶点集记为V={v1,v2,...vN},对应N个顶点和边集将顶点按照度从大到小排序,并对其进行1到n编号,计算顶点vi的度degree(vi),初始化i=1;
步骤1.2、记Coveragei-1包含第i次迭代时生成的种子集及它们的邻接点;
定义式:Coveragei=si∪neighbor(si)∪Coveragei-1;其中si表示第i次迭代时选择的种子,neighbor(si)表示si的邻接点,n为迭代的次数;
如果顶点vi不存在于第i-1次迭代时生成的种子集及它们的邻接点集合Coveragei-1中,则利用式Seedi=si∪Seedi-1(i=1,2,...,n),计算第i次迭代时生成的种子集Seedi,将顶点vi加入种子集Seedi中,并计算Coveragei,将顶点vi和它的邻接点和上一次迭代生成的Coveragei-1加入集合Coveragei中;
步骤1.3、利用顶点覆盖增长率GrowthRatei控制种子的数量;
再通过计算顶点覆盖增长率GrowthRatei,其中size(Coveragei)是Coveragei中元素的个数;
如果GrowthRatei>η,表明还有顶点可以加入种子集,i=i+1,找到序列中的下一个顶点,并循环步骤1.2和步骤1.3,若条件不满足,则进入步骤1.4;
步骤1.4、将上一次迭代的种子集Seedi-1复制到Seedall,Seedall就是选择完毕的种子集。
6.根据权利要求1或3所述的网络中重叠社团的挖掘方法,其特征在于,所述步骤2包括以下步骤:
步骤2.1、基于种子选择阶段,已经得到初步种子集Seedall,记α为传送概率,ε为随机游走的误差,初始化count=1,对于Seedall中所有种子scount按顺序进行扩展;
步骤2.2、利用T←{scount}∪{neighbor(scount)}将scount及它的邻接点neighbor(scount)加入集合T中,寻找scount的邻接点中是否存在可能的种子;
步骤2.3、设Xi={x1i,x2i,...,xni}为page-rank算法第i次随机游走后的Page-Rank向量,向量Ri={r1i,r2i,...,rni}为每个顶点第i次随机游走时的启动向量,之后对于点集合V中的任意顶点v,顶点v在第1次随机游走后的概率xv1=0,对于集合V/T中的任意顶点v,顶点v在第1次随机游走后启动向量的概率rv1=0,对于集合T中的任意顶点v,顶点v在第1次随机游走后启动向量的概率最后令i=1;
步骤2.4、如果此时满足rvi>degree(v)·ε;
利用计算顶点v在第i+1次随机游走后的概率xv(i+1),对于边集合E中所有与v相连的边(v,u);
利用rui=ru(i-1)+(1-α)rv(i-1)/2degree(v)计算顶点u在第i+1次随机游走后启动向量的概率ru(i+1),其中α为传送概率,ε为随机游走的误差(ε-approximate),两者取值位于(0,1]之间;
利用rvi=(1-α)rv(i-1)/2计算顶点v在第i+1次随机游走后启动向量的概率rv(i+1);
之后对点集V中的下一个顶点进行计算,如果此时还满足rvi>degree(v)·ε条件,则循环步骤2.4,若干不满足,则进入步骤2.5;
步骤2.5、对于点集合V中所有顶点v,如果就将该顶点作为新种子加入Ccount;
步骤2.6、将Ccount加入社团集合C中,继续从步骤2.1开始从Seedall下一个种子进行种子扩展,直到遍历完Seedall中的所有种子。
7.根据权利要求1或4所述的网络中重叠社团的挖掘方法,其特征在于,所述步骤3包括以下步骤:
步骤3.1、基于种子扩展阶段生成的社团集合C,将C中的每个社团Ci复制给C'i,最终保存在社团集合C'中;
步骤3.2、对于在点集合V不在集合C中的顶点,即没有被划分到任何一个社团中的剩余顶点v,利用Remain←Remain∪{v}将顶点加入到剩余集合Remain中;
步骤3.3、对于剩余集合Remain中的顶点v,如果v存在至少有一个邻接点u属于簇类中,利用C'i←C'i∪{v}将v与u所在的社团合并,否则,说明v是离群点,其所有邻接点也都未被覆盖,利用C'M+1←{v}∪{neighbor(v)}将顶点v与它的邻接点合并形成一个新社团。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710419287.5A CN107133877B (zh) | 2017-06-06 | 2017-06-06 | 网络中重叠社团的挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710419287.5A CN107133877B (zh) | 2017-06-06 | 2017-06-06 | 网络中重叠社团的挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107133877A true CN107133877A (zh) | 2017-09-05 |
CN107133877B CN107133877B (zh) | 2021-02-09 |
Family
ID=59735221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710419287.5A Active CN107133877B (zh) | 2017-06-06 | 2017-06-06 | 网络中重叠社团的挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107133877B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704572A (zh) * | 2017-09-30 | 2018-02-16 | 北京奇虎科技有限公司 | 人物实体的创作角度挖掘方法及装置 |
CN108537452A (zh) * | 2018-04-13 | 2018-09-14 | 中山大学 | 一种面向大规模复杂网络的密集可重叠社区划分方法 |
CN108989449A (zh) * | 2018-08-03 | 2018-12-11 | 杭州安恒信息技术股份有限公司 | 一种应用于大规模部署场景下的大文件传播方法及装置 |
CN110287237A (zh) * | 2019-06-25 | 2019-09-27 | 上海诚数信息科技有限公司 | 一种基于社会网络结构分析高效社团数据挖掘方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400299A (zh) * | 2013-07-02 | 2013-11-20 | 西安交通大学 | 基于重叠点识别的网络重叠社团检测方法 |
CN104008165A (zh) * | 2014-05-29 | 2014-08-27 | 华东师范大学 | 一种基于网络拓扑结构和节点属性的社团检测方法 |
US20140278504A1 (en) * | 2013-03-14 | 2014-09-18 | Mark M. BRAUER | Medical Research Technology Information Consortium |
US20140351267A1 (en) * | 2013-05-24 | 2014-11-27 | Google Inc. | Overlapping Community Detection in Weighted Graphs |
CN104239965A (zh) * | 2014-08-27 | 2014-12-24 | 浙江工业大学 | 一种基于重叠社团划分的大规模道路网络双层路由方法 |
CN104657418A (zh) * | 2014-12-18 | 2015-05-27 | 北京航空航天大学 | 一种基于隶属度传播的复杂网络模糊社团挖掘方法 |
CN105184075A (zh) * | 2015-09-01 | 2015-12-23 | 南京大学 | 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法 |
US20160057631A1 (en) * | 2009-04-28 | 2016-02-25 | Apple Inc. | Methods and Apparatus for Configuration of Femtocells in a Wireless Network |
-
2017
- 2017-06-06 CN CN201710419287.5A patent/CN107133877B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160057631A1 (en) * | 2009-04-28 | 2016-02-25 | Apple Inc. | Methods and Apparatus for Configuration of Femtocells in a Wireless Network |
US20140278504A1 (en) * | 2013-03-14 | 2014-09-18 | Mark M. BRAUER | Medical Research Technology Information Consortium |
US20140351267A1 (en) * | 2013-05-24 | 2014-11-27 | Google Inc. | Overlapping Community Detection in Weighted Graphs |
CN103400299A (zh) * | 2013-07-02 | 2013-11-20 | 西安交通大学 | 基于重叠点识别的网络重叠社团检测方法 |
CN104008165A (zh) * | 2014-05-29 | 2014-08-27 | 华东师范大学 | 一种基于网络拓扑结构和节点属性的社团检测方法 |
CN104239965A (zh) * | 2014-08-27 | 2014-12-24 | 浙江工业大学 | 一种基于重叠社团划分的大规模道路网络双层路由方法 |
CN104657418A (zh) * | 2014-12-18 | 2015-05-27 | 北京航空航天大学 | 一种基于隶属度传播的复杂网络模糊社团挖掘方法 |
CN105184075A (zh) * | 2015-09-01 | 2015-12-23 | 南京大学 | 适用tcmf网络的基于多三角形群组相似性凝聚的重叠社区发现方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704572A (zh) * | 2017-09-30 | 2018-02-16 | 北京奇虎科技有限公司 | 人物实体的创作角度挖掘方法及装置 |
CN107704572B (zh) * | 2017-09-30 | 2021-07-13 | 北京奇虎科技有限公司 | 人物实体的创作角度挖掘方法及装置 |
CN108537452A (zh) * | 2018-04-13 | 2018-09-14 | 中山大学 | 一种面向大规模复杂网络的密集可重叠社区划分方法 |
CN108989449A (zh) * | 2018-08-03 | 2018-12-11 | 杭州安恒信息技术股份有限公司 | 一种应用于大规模部署场景下的大文件传播方法及装置 |
CN108989449B (zh) * | 2018-08-03 | 2021-06-22 | 杭州安恒信息技术股份有限公司 | 一种应用于大规模部署场景下的大文件传播方法及装置 |
CN110287237A (zh) * | 2019-06-25 | 2019-09-27 | 上海诚数信息科技有限公司 | 一种基于社会网络结构分析高效社团数据挖掘方法 |
CN110287237B (zh) * | 2019-06-25 | 2021-07-09 | 上海诚数信息科技有限公司 | 一种基于社会网络结构分析社团数据挖掘方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107133877B (zh) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107133877A (zh) | 网络中重叠社团的挖掘方法 | |
CN104657418B (zh) | 一种基于隶属度传播的复杂网络模糊社团挖掘方法 | |
CN110502006A (zh) | 一种矿区废弃地移动机器人全覆盖路径规划方法 | |
CN104936186B (zh) | 基于布谷鸟搜索算法的认知无线电网络频谱分配方法 | |
CN105976048A (zh) | 一种基于改进人工蜂群算法的输电网扩展规划方法 | |
CN105101093B (zh) | 一种关于地理位置信息的网络拓扑可视化方法 | |
CN104317904B (zh) | 一种带权重社会网络的泛化方法 | |
CN103106279A (zh) | 一种同时基于节点属性以及结构关系相似度的聚类方法 | |
CN104469833A (zh) | 一种基于用户感知的异构网络运维管理方法 | |
Froese et al. | The border k-means clustering algorithm for one dimensional data | |
CN103888541A (zh) | 一种融合拓扑势和谱聚类的社区发现方法及系统 | |
CN106845623A (zh) | 一种基于人工鱼群算法的电力无线专网基站规划方法 | |
CN107067091A (zh) | 一种基于蚁群优化算法的城市生态用地空间规划模型 | |
CN108765180A (zh) | 基于影响力与种子扩展的重叠社区发现方法 | |
CN104239965B (zh) | 一种基于重叠社团划分的大规模道路网络双层路由方法 | |
CN107194498A (zh) | 一种水文监测网络的优化方法 | |
CN108809697A (zh) | 基于影响力最大化的社交网络关键节点识别方法及系统 | |
Qian et al. | A cold island connectivity and network perspective to mitigate the urban heat island effect | |
CN107609694A (zh) | 海上风电集群输电系统结构优化方法及存储介质 | |
Li et al. | Sustainability of water and energy use for food production based on optimal allocation of agricultural irrigation water | |
CN106789338A (zh) | 一种在动态大规模社交网络中发现关键人物的方法 | |
CN103164487B (zh) | 一种基于密度与几何信息的数据聚类方法 | |
CN106651011A (zh) | 一种基于粒子群算法的渠系优化配水方法 | |
CN104618852B (zh) | 基于层次聚类的数据汇聚方法和系统 | |
CN107578136A (zh) | 基于随机游走与种子扩展的重叠社区发现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |