CN109166047A - 基于密度聚类的增量动态社区发现方法 - Google Patents
基于密度聚类的增量动态社区发现方法 Download PDFInfo
- Publication number
- CN109166047A CN109166047A CN201810880924.3A CN201810880924A CN109166047A CN 109166047 A CN109166047 A CN 109166047A CN 201810880924 A CN201810880924 A CN 201810880924A CN 109166047 A CN109166047 A CN 109166047A
- Authority
- CN
- China
- Prior art keywords
- community
- node
- moment
- indicate
- increment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- BULVZWIRKLYCBC-UHFFFAOYSA-N phorate Chemical compound CCOP(=S)(OCC)SCSCC BULVZWIRKLYCBC-UHFFFAOYSA-N 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000008034 disappearance Effects 0.000 claims 2
- 230000035772 mutation Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005293 physical law Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
发明涉及一种基于密度聚类的增量动态社区发现方法,包括S1:采集初始时刻t 1的网络数据集,生成网络图G 1;S2:通过余弦相似度计算初始时刻t 1的网络中节点间距;S3:采用改进的DBSCAN算法进行初始时刻t 1的社区生成;S4:对初始时刻t 1生成的社区进行迭代合并;S5:输出初始时刻t 1的最终社区划分结果;S6:计算t i (2≤i≤T)时刻的增量节点;S7:采用余弦相似度求取t i 时刻新增节点IVt间的距离;S8:采用改进的DBSCAN算法对t i 时刻的新增节点IVt进行社区生成;S9:对t i 时刻邻居发生变化的节点NCVt及其邻居节点进行社区归属调整;S10:迭代的把t i 时刻生成的社区进行合并以降低噪声社区对社区发现结果的影响;S11:得到t i 时刻最终的社区划分结果。
Description
技术领域
本发明涉及复杂网络上的动态社区发现技术领域,具体涉及一种基于密度聚类的增量动态社区发现方法。
背景技术
社区发现已经在信息传播、生物网络、群体事件等领域存在广泛应用。社区发现是指把网络划分成多个不同组织,各组织内部连接紧密,组织间连接较为稀疏。由于真实社会网络中个体及其之间的联系是不断动态变化的,动态社区发现的研究已经成为当前社交网络领域研究的热点之一。
动态社区发现实质是研究社会网络的演化发展行为。目前,动态社区发现方法主要分为基于时空独立评价的方法、基于时空集成评价的方法、基于统一评价的方法和增量动态社区发现方法等4类。其中,增量动态社区发现方法重点对相邻时刻的局部差量节点进行处理,具有较低的时间复杂度,成为动态社区发现算法的一个重要研究方向。
增量动态社区发现通过比较不同时刻的网络快照,分析网络快照的差量节点,并基于差量节点进行社区扩展。主要采用基于物理定律的增量策略和基于图特征的增量策略。目前已有一些学者对动态社区发现进行了研究,也取得了一定的成果,但现有多数增量动态社区发现算法存在的无法较好处理网络结构突变和增量累计误差等问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于密度聚类的增量动态社区发现方法,能在有效处理网络结构突变和增量计算累积误差带来的影响的同时具有较低的时间复杂度。
为实现上述目的,本发明采用如下技术方案:
一种基于密度聚类的增量动态社区发现方法,其特征在于:包括以下步骤:
步骤S1:采集初始时刻t1的网络数据集,生成网络图G1;
步骤S2:通过余弦相似度计算初始时刻t1的网络中节点间距;
步骤S3:采用改进的DBSCAN算法进行初始时刻t1的社区生成;
步骤S4:对初始时刻t1生成的社区进行迭代合并,以降低噪声社区对社区发现结果的影响;
步骤S5:输出初始时刻t1的最终社区划分结果;
步骤S6:计算ti时刻的增量节点;
步骤S7:采用余弦相似度求取ti时刻新增节点IVt间的距离;具体步骤和步骤S2求取节点间距离的方法类似。
步骤S8::采用改进的DBSCAN算法对ti时刻的新增节点IVt进行社区生成;具体步骤和和步骤S3生成社区的方法类似。
步骤S9:对ti时刻邻居发生变化的节点NCVt及其邻居节点进行社区归属调整;
步骤S10:迭代的把ti时刻生成的社区进行合并以降低噪声社区对社区发现结果的影响;
步骤S11:得到ti时刻最终的社区划分结果。
进一步的,读取t1时刻网络数据集,生成用于划分t1时刻社区结构的网络图G1=(V1,E1),其中V1表示t1时刻的节点集,E1表示t1时刻的边集。
进一步的,所述步骤S2具体为:
步骤S21:遍历V1中每个节点v;
步骤S22:遍历节点v的每个邻居u,根据公式(1)、(2)求出节点u,v间的距离d(u,v),并把d(u,v)添加到距离集合Dis中:
d(u,v)=1-σ(u,v) (2)
其中|NB+(u)|表示节点u的邻居节点个数,|NB+(v)|表示节点v的邻居节点个数σ(u,v)表示节点u,v的余弦相似度;
步骤S23:遍历节点u的每个邻居r,按公式(3)、(4)求出节点r,v间的距离d(r,u),并把d(r,v)添加到距离集合Dis中;
d(r,v)=1-σ(r,v) (4)
其中|NB+(r)|表示节点r的邻居节点个数;
步骤S24:输出距离集合Dis。
进一步的,所述步骤S3具体为:
步骤S31:初始化噪声节点集合Sn、核心点集合Sc、聚类生成的簇集合Sclu、共享节点字典Ssn、核心点扩展对列EQ和节点访问标记字典Vis为空;
步骤S32:采用DBSCAN算法对节点集V1进行聚类,得到共享节点并添加到共享节点字典Ssn中;
步骤S33:遍历共享节点字典Ssn中的每个元素,获取每个元素对应的节点u所属的社区集合Cid,并把节点u划分到社区集合Cid中每个元素所代表的社区中;
步骤S34:输出生成的社区CSt和噪声节点集合Sn。
共享节点定义为:设若至少存在两个核心点o1、o2,o1和o2属于不同的簇且p分别从o1和o2密度可达,则称p为共享节点(SharedNode),记为SN。
进一步的,所述步骤S4具体为:
步骤S41:初始化模块度增益矩阵M1为零矩阵;
步骤S42:通过公式(5)、(6)计算t1时刻的模块度增益矩阵:
ΔQij=2(eij-ai×aj) (5)
其中,ΔQij表示社区Ci,Cj合并后的模块度增益,ei,j表示Ci与Cj(i≠j)之间的连接边占总边数的比例的一半,ai表示与Ci中节点相连,但另一个节点不属于Ci的边数占网络总边数的比例;ki表示Ci内节点的度数之和,m表示网络的总边数。
步骤S43:根据性质1进行t1时刻社区合并,并根据公式(3)、(4)迭代更新M1;
性质1:在复杂网络G中,设社区Ck,Ci和Cj内部的边数分别为emk,emi和emj,社区Ci和Cj之间的连接边数为emij,则emk=emi+emj+emij;社区Ck与其它社区Cs(s≠i,j)之间的连接边数emks=emis+emjs,其中,emis和emjs分别为社区Ci、Cj和社区Cs之间的连接边数;
步骤S44:输出合并后的社区结构CS1和模块度增益矩阵M1。
进一步的,遍历社区结构CS1,并输出CS1中的每个元素到文件,文件的每一行代表一个社区。
进一步的,所述步骤S6具体为:
步骤S61:初始化增量节点集合ΔCVt、新增节点集合IVt、邻居变化节点集合NCVt、消失节点集合DVt、只存在于t-1时刻的边集eP和只存在于t时刻的边集合eN为空;
步骤S62:计算边集eP和边集eN。
步骤S63:根据增量节点集合求取IVt、NCVt和DVt。
增量节点集合:设IVt、DVt和NCVt分别代表t时刻相对于t-1时刻的新增节点集、消失节点集和邻居变化节点集,则增量节点集ΔCVt定义为:
IVt={v|v是t时刻新增节点}
DVt={v|v是t时刻消失节点}
ΔCVt={IVt∪DVt∪NCVt}
步骤S64:获取ΔCVt节点集合并输出。
进一步的,所述步骤S9具体为:
步骤S91:初始化边变化率扩展队列ECRQ和边变化率临时队列ECRQ'为空;
步骤S92:通过公式(7)计算NCVt中节点的边变化率并添加到ECRQ'中,且对ECRQ'按边变化率大小进行降序排列
其中,|et +(u)|表示节点u在t时刻新增边的数目,|et -(u)|表示节点u在t时刻消失边的数目,|et-1(u)|表示t-1时刻节点u的度,ECR(u)表示节点u的边变化率;
步骤S93:依次从排序后的ECRQ'中取出首元素,通过公式(8)调整该首元素所对应的节点的归属社区:
其中,σ(u,v)表示节点v和节点u之间的余弦相似度,d(u)表示节点的度,max{d(r)}表示网络中节点的最大度,affv,i表示t时刻节点v对当前时刻的社区Ct,i的社区归属度;
步骤S94:通过公式(1)计算归属社区发生变化的节点和邻居节点的相似度,按相似度大小降序排序,且根据相似度大小对邻居节点排序;
步骤S95:通过公式(8)调整社区归属发生变化节点的邻居节点的社区归属,并根据邻居节点的社区归属情况把间接邻居添加到ECRQ中;
步骤S96:重复执行步骤S93~步骤S95直到ECRQ和ECRQ'为空;
步骤S97:输出调整后的社区CSt。
进一步地,在步骤S10中,迭代的把ti(2≤i≤T)时刻生成的社区进行合并以降低噪声社区对社区发现结果的影响,主要步骤和步骤4进行迭代社区合并的方法类似。
进一步地,在步骤S11中,输出t1(2≤i≤T)时刻最终的社区划分结果,主要步骤和步骤5输出社区划分结果的方法类似。
本发明与现有技术相比具有以下有益效果:
1、本发明改进DBSCAN算法,通过把社区间共享节点划分到多个社区,而不是把共享节点划分到最先发现的社区中,能够降低算法对邻域阈值参数ε的敏感性;
2、本发明提出边变化率指标,并结合余弦相似度指标来确定相邻时刻增量节点的社区归属,这两个指标结合有效降低了网络突变和增量计算累计误差对社区发现精度的影响;
3、本发明在进行社区归属度计算时,不仅考虑节点邻居的影响,还考虑间接邻居的影响,可以有效提高归属度计算结果的准确性;
4、本发明通过计算和更新动态模块度增益矩阵来完成社区合并,可以最大限度降低噪声社区的影响。
附图说明
图1是本发明的流程图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种基于密度聚类的增量动态社区发现方法,其特征在于:包括以下步骤:
步骤S1:采集初始时刻t1的网络数据集,生成网络图G1;
步骤S2:通过余弦相似度计算初始时刻t1的网络中节点间距;
步骤S3:采用改进的DBSCAN算法进行初始时刻t1的社区生成;
步骤S4:对初始时刻t1生成的社区进行迭代合并,以降低噪声社区对社区发现结果的影响;
步骤S5:输出初始时刻t1的最终社区划分结果;
步骤S6:计算ti时刻的增量节点;
步骤S7:采用余弦相似度求取ti时刻新增节点IVt间的距离;具体步骤和步骤S2求取节点间距离的方法类似。
步骤S8::采用改进的DBSCAN算法对ti时刻的新增节点IVt进行社区生成;具体步骤和和步骤S3生成社区的方法类似。
步骤S9:对ti时刻邻居发生变化的节点NCVt及其邻居节点进行社区归属调整;
步骤S10:迭代的把ti时刻生成的社区进行合并以降低噪声社区对社区发现结果的影响;
步骤S11:得到ti时刻最终的社区划分结果。
在本发明一实施例中,读取t1时刻网络数据集,生成用于划分t1时刻社区结构的网络图G1=(V1,E1),其中V1表示t1时刻的节点集,E1表示t1时刻的边集。
在本发明一实施例中,所述步骤S2具体为:
步骤S21:遍历V1中每个节点v;
步骤S22:遍历节点v的每个邻居u,根据公式(1)、(2)求出节点u,v间的距离d(u,v),并把d(u,v)添加到距离集合Dis中:
d(u,v)=1-σ(u,v) (2)
其中|NB+(u)|表示节点u的邻居节点个数,|NB+(v)|表示节点v的邻居节点个数σ(u,v)表示节点u,v的余弦相似度;
步骤S23:遍历节点u的每个邻居r,按公式(3)、(4)求出节点r,v间的距离d(r,u),并把d(r,v)添加到距离集合Dis中;
d(r,v)=1-σ(r,v) (4)
其中|NB+(r)|表示节点r的邻居节点个数;
步骤S24:输出距离集合Dis。
在本发明一实施例中,所述步骤S3具体为:
步骤S31:初始化噪声节点集合Sn、核心点集合Sc、聚类生成的簇集合Sclu、共享节点字典Ssn、核心点扩展对列EQ和节点访问标记字典Vis为空;
步骤S32:采用DBSCAN算法对节点集V1进行聚类,得到共享节点并添加到共享节点字典Ssn中;
步骤S33:遍历共享节点字典Ssn中的每个元素,获取每个元素对应的节点u所属的社区集合Cid,并把节点u划分到社区集合Cid中每个元素所代表的社区中;
步骤S34:输出生成的社区CSt和噪声节点集合Sn。
共享节点定义为:设若至少存在两个核心点o1、o2,o1和o2属于不同的簇且p分别从o1和o2密度可达,则称p为共享节点(SharedNode),记为SN。
在本发明一实施例中,所述步骤S4具体为:
步骤S41:初始化模块度增益矩阵M1为零矩阵;
步骤S42:通过公式(5)、(6)计算t1时刻的模块度增益矩阵:
ΔQij=2(eij-ai×aj) (5)
其中,ΔQij表示社区Ci,Cj合并后的模块度增益,ei,j表示Ci与Cj(i≠j)之间的连接边占总边数的比例的一半,ai表示与Ci中节点相连,但另一个节点不属于Ci的边数占网络总边数的比例;ki表示Ci内节点的度数之和,m表示网络的总边数。
步骤S43:根据性质1进行t1时刻社区合并,并根据公式(3)、(4)迭代更新M1;
性质1:在复杂网络G中,设社区Ck,Ci和Cj内部的边数分别为emk,emi和emj,社区Ci和Cj之间的连接边数为emij,则emk=emi+emj+emij;社区Ck与其它社区Cs(s≠i,j)之间的连接边数emks=emis+emjs,其中,emis和emjs分别为社区Ci、Cj和社区Cs之间的连接边数;
步骤S44:输出合并后的社区结构CS1和模块度增益矩阵M1。
在本发明一实施例中,遍历社区结构CS1,并输出CS1中的每个元素到文件,文件的每一行代表一个社区。
在本发明一实施例中,所述步骤S6具体为:
步骤S61:初始化增量节点集合ΔCVt、新增节点集合IVt、邻居变化节点集合NCVt、消失节点集合DVt、只存在于t-1时刻的边集eP和只存在于t时刻的边集合eN为空;
步骤S62:计算边集eP和边集eN。
步骤S63:根据增量节点集合求取IVt、NCVt和DVt。
增量节点集合:设IVt、DVt和NCVt分别代表t时刻相对于t-1时刻的新增节点集、消失节点集和邻居变化节点集,则增量节点集ΔCVt定义为:
IVt={v|v是t时刻新增节点}
DVt={v|v是t时刻消失节点}
ΔCVt={IVt∪DVt∪NCVt}
步骤S64:获取ΔCVt节点集合并输出。
在本发明一实施例中,所述步骤S9具体为:
步骤S91:初始化边变化率扩展队列ECRQ和边变化率临时队列ECRQ'为空;
步骤S92:通过公式(7)计算NCVt中节点的边变化率并添加到ECRQ'中,且对ECRQ'按边变化率大小进行降序排列
其中,|et +(u)|表示节点u在t时刻新增边的数目,|et -(u)|表示节点u在t时刻消失边的数目,|et-1(u)|表示t-1时刻节点u的度,ECR(u)表示节点u的边变化率;
步骤S93:依次从排序后的ECRQ'中取出首元素,通过公式(8)调整该首元素所对应的节点的归属社区:
其中,σ(u,v)表示节点v和节点u之间的余弦相似度,d(u)表示节点的度,max{d(r)}表示网络中节点的最大度,affv,i表示t时刻节点v对当前时刻的社区Ct,i的社区归属度;
步骤S94:通过公式(1)计算归属社区发生变化的节点和邻居节点的相似度,按相似度大小降序排序,且根据相似度大小对邻居节点排序;
步骤S95:通过公式(8)调整社区归属发生变化节点的邻居节点的社区归属,并根据邻居节点的社区归属情况把间接邻居添加到ECRQ中;
步骤S96:重复执行步骤S93~步骤S95直到ECRQ和ECRQ'为空;
步骤S97:输出调整后的社区CSt。
在本发明一实施例中,在步骤S10中,迭代的把ti(2≤i≤T)时刻生成的社区进行合并以降低噪声社区对社区发现结果的影响,主要步骤和步骤4进行迭代社区合并的方法类似。
在本发明一实施例中,在步骤S11中,输出t1(2≤i≤T)时刻最终的社区划分结果,主要步骤和步骤5输出社区划分结果的方法类似。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (8)
1.一种基于密度聚类的增量动态社区发现方法,其特征在于:包括以下步骤:
步骤S1:采集初始时刻t1的网络数据集,生成网络图G1;
步骤S2:通过余弦相似度计算初始时刻t1的网络中节点间距;
步骤S3:采用改进的DBSCAN算法进行初始时刻t1的社区生成;
步骤S4:对初始时刻t1生成的社区进行迭代合并,以降低噪声社区对社区发现结果的影响;
步骤S5:输出初始时刻t1的最终社区划分结果;
步骤S6:计算ti时刻的增量节点;
步骤S7:采用余弦相似度求取ti时刻新增节点IVt间的距离;
步骤S8:采用改进的DBSCAN算法对ti时刻的新增节点IVt进行社区生成;
步骤S9:对ti时刻邻居发生变化的节点NCVt及其邻居节点进行社区归属调整;
步骤S10:迭代的把ti时刻生成的社区进行合并以降低噪声社区对社区发现结果的影响;
步骤S11:得到ti时刻最终的社区划分结果。
2.根据权利要求1所述的基于密度聚类的增量动态社区发现方法,其特征在于:所述步骤S1具体为:读取t1时刻网络数据集,生成用于划分t1时刻社区结构的网络图G1=(V1,E1),其中V1表示t1时刻的节点集,E1表示t1时刻的边集。
3.根据权利要求2所述的基于密度聚类的增量动态社区发现方法,其特征在于:所述步骤S2具体为:
步骤S21:遍历V1中每个节点v;
步骤S22:遍历节点v的每个邻居u,根据公式(1)、(2)求出节点u,v间的距离d(u,v),并把d(u,v)添加到距离集合Dis中:
d(u,v)=1-σ(u,v) (2)
其中|NB+(u)|表示节点u的邻居节点个数,|NB+(v)|表示节点v的邻居节点个数σ(u,v)表示节点u,v的余弦相似度;
步骤S23:遍历节点u的每个邻居r,按公式(3)、(4)求出节点r,v间的距离d(r,u),并把d(r,v)添加到距离集合Dis中;
d(r,v)=1-σ(r,v) (4)
其中|NB+(r)|表示节点r的邻居节点个数;
步骤S24:输出距离集合Dis。
4.根据权利要求3所述的基于密度聚类的增量动态社区发现方法,其特征在于:所述步骤S3具体为:
步骤S31:初始化噪声节点集合Sn、核心点集合Sc、聚类生成的簇集合Sclu、共享节点字典Ssn、核心点扩展对列EQ和节点访问标记字典Vis为空;
步骤S32:采用DBSCAN算法对节点集V1进行聚类,得到共享节点并添加到共享节点字典Ssn中;
步骤S33:遍历共享节点字典Ssn中的每个元素,获取每个元素对应的节点u所属的社区集合Cid,并把节点u划分到社区集合Cid中每个元素所代表的社区中;
步骤S34:输出生成的社区CSt和噪声节点集合Sn。
5.根据权利要求4所述的基于密度聚类的增量动态社区发现方法,其特征在于:所述步骤S4具体为:
步骤S41:初始化模块度增益矩阵M1为零矩阵;
步骤S42:通过公式(5)、(6)计算t1时刻的模块度增益矩阵:
ΔQij=2(eij-ai×aj) (5)
其中,ΔQij表示社区Ci,Cj合并后的模块度增益,ei,j表示Ci与Cj(i≠j)之间的连接边占总边数的比例的一半,ai表示与Ci中节点相连,但另一个节点不属于Ci的边数占网络总边数的比例;ki表示Ci内节点的度数之和,m表示网络的总边数。
步骤S43:根据性质1进行t1时刻社区合并,并根据公式(3)、(4)迭代更新M1;
性质1:在复杂网络G中,设社区Ck,Ci和Cj内部的边数分别为emk,emi和emj,社区Ci和Cj之间的连接边数为emij,则emk=emi+emj+emij;社区Ck与其它社区Cs(s≠i,j)之间的连接边数emks=emis+emjs,其中,emis和emjs分别为社区Ci、Cj和社区Cs之间的连接边数;
步骤S44:输出合并后的社区结构CS1和模块度增益矩阵M1。
6.根据权利要求5所述的基于密度聚类的增量动态社区发现方法,其特征在于:所述步骤S5具体为:遍历社区结构CS1,并输出CS1中的每个元素到文件,文件的每一行代表一个社区。
7.根据权利要求5所述的基于密度聚类的增量动态社区发现方法,其特征在于:所述步骤S6具体为:
步骤S61:初始化增量节点集合ΔCVt、新增节点集合IVt、邻居变化节点集合NCVt、消失节点集合DVt、只存在于t-1时刻的边集eP和只存在于t时刻的边集合eN为空;
步骤S62:计算边集eP和边集eN。
步骤S63:根据增量节点集合求取IVt、NCVt和DVt。
增量节点集合:设IVt、DVt和NCVt分别代表t时刻相对于t-1时刻的新增节点集、消失节点集和邻居变化节点集,则增量节点集ΔCVt定义为:
IVt={v|v是t时刻新增节点}
DVt={v|v是t时刻消失节点}
ΔCVt={IVt∪DVt∪NCVt}
步骤S64:获取ΔCVt节点集合并输出。
8.根据权利要求7所述的基于密度聚类的增量动态社区发现方法,其特征在于:所述步骤S9具体为:
步骤S91:初始化边变化率扩展队列ECRQ和边变化率临时队列ECRQ'为空;
步骤S92:通过公式(7)计算NCVt中节点的边变化率并添加到ECRQ'中,且对ECRQ'按边变化率大小进行降序排列
其中,|et +(u)|表示节点u在t时刻新增边的数目,|et -(u)|表示节点u在t时刻消失边的数目,|et-1(u)|表示t-1时刻节点u的度,ECR(u)表示节点u的边变化率;
步骤S93:依次从排序后的ECRQ'中取出首元素,通过公式(8)调整该首元素所对应的节点的归属社区:
其中,σ(u,v)表示节点v和节点u之间的余弦相似度,d(u)表示节点的度,max{d(r)}表示网络中节点的最大度,affv,i表示t时刻节点v对当前时刻的社区Ct,i的社区归属度;
步骤S94:通过公式(1)计算归属社区发生变化的节点和邻居节点的相似度,按相似度大小降序排序,且根据相似度大小对邻居节点排序;
步骤S95:通过公式(8)调整社区归属发生变化节点的邻居节点的社区归属,并根据邻居节点的社区归属情况把间接邻居添加到ECRQ中;
步骤S96:重复执行步骤S93~步骤S95直到ECRQ和ECRQ'为空;
步骤S97:输出调整后的社区CSt。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810880924.3A CN109166047A (zh) | 2018-08-04 | 2018-08-04 | 基于密度聚类的增量动态社区发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810880924.3A CN109166047A (zh) | 2018-08-04 | 2018-08-04 | 基于密度聚类的增量动态社区发现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109166047A true CN109166047A (zh) | 2019-01-08 |
Family
ID=64898912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810880924.3A Pending CN109166047A (zh) | 2018-08-04 | 2018-08-04 | 基于密度聚类的增量动态社区发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109166047A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019845A (zh) * | 2019-04-16 | 2019-07-16 | 济南大学 | 一种基于知识图谱的社区演化分析方法及装置 |
CN110569415A (zh) * | 2019-08-28 | 2019-12-13 | 浙江工业大学 | 一种基于网络表征学习和邻居合力的微博用户社区发现方法 |
CN116308860A (zh) * | 2023-03-21 | 2023-06-23 | 东北电力大学 | 基于分配与分裂的动态社区检测方法 |
-
2018
- 2018-08-04 CN CN201810880924.3A patent/CN109166047A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019845A (zh) * | 2019-04-16 | 2019-07-16 | 济南大学 | 一种基于知识图谱的社区演化分析方法及装置 |
CN110019845B (zh) * | 2019-04-16 | 2021-04-09 | 济南大学 | 一种基于知识图谱的社区演化分析方法及装置 |
CN110569415A (zh) * | 2019-08-28 | 2019-12-13 | 浙江工业大学 | 一种基于网络表征学习和邻居合力的微博用户社区发现方法 |
CN110569415B (zh) * | 2019-08-28 | 2021-06-18 | 浙江工业大学 | 一种基于网络表征学习和邻居合力的微博用户社区发现方法 |
CN116308860A (zh) * | 2023-03-21 | 2023-06-23 | 东北电力大学 | 基于分配与分裂的动态社区检测方法 |
CN116308860B (zh) * | 2023-03-21 | 2024-01-12 | 东北电力大学 | 基于分配与分裂的动态社区检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109582864B (zh) | 基于大数据科学和动态权重调整的课程推荐方法及系统 | |
CN109166047A (zh) | 基于密度聚类的增量动态社区发现方法 | |
CN104462184B (zh) | 一种基于双向抽样组合的大规模数据异常识别方法 | |
CN103699678A (zh) | 一种基于多阶段分层采样的层次聚类方法和系统 | |
CN115001983B (zh) | 基于高阶聚类系数的网络结构差异性评估方法 | |
CN109886334A (zh) | 一种隐私保护的共享近邻密度峰聚类方法 | |
CN113222181A (zh) | 一种面向k-means聚类算法的联邦学习方法 | |
CN104731887B (zh) | 一种协同过滤中的用户相似度度量方法 | |
CN116454870A (zh) | 一种区域分布式光伏短期功率预测方法 | |
CN105260748A (zh) | 一种不确定数据的聚类方法 | |
CN107276093B (zh) | 基于场景削减的电力系统概率潮流计算方法 | |
CN108959652A (zh) | 基于密度峰值与社区归属度的重叠社区发现方法 | |
CN109472712A (zh) | 一种基于结构特征强化的高效马尔可夫随机场社团发现方法 | |
He et al. | Rel-CNN: learning relationship features in time series for classification | |
CN117056763A (zh) | 基于变分图嵌入的社区发现方法 | |
CN115357862B (zh) | 一种狭长空间中的定位方法 | |
CN112149052A (zh) | 一种基于plr-dtw的日负荷曲线聚类方法 | |
Parvin et al. | A metric to evaluate a cluster by eliminating effect of complement cluster | |
CN103489037A (zh) | 一种可发电风资源的预测方法 | |
CN110113215A (zh) | 一种基于时间加权的重叠社区检测算法 | |
CN110348323B (zh) | 一种基于神经网络优化的穿戴式设备手势识别方法 | |
CN113658012A (zh) | 一种基于深度网络表示学习的社团发现方法 | |
CN109408728A (zh) | 一种基于覆盖算法的差分隐私保护推荐方法 | |
Ding et al. | User identity linkage across location-based social networks with spatio-temporal check-in patterns | |
CN111444454A (zh) | 一种基于谱方法的动态社团划分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190108 |