CN109493246A - 一种动态社交网络社区演化分析方法及其系统 - Google Patents

一种动态社交网络社区演化分析方法及其系统 Download PDF

Info

Publication number
CN109493246A
CN109493246A CN201811399856.5A CN201811399856A CN109493246A CN 109493246 A CN109493246 A CN 109493246A CN 201811399856 A CN201811399856 A CN 201811399856A CN 109493246 A CN109493246 A CN 109493246A
Authority
CN
China
Prior art keywords
event
community
evolution
superspreader
superblocker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811399856.5A
Other languages
English (en)
Other versions
CN109493246B (zh
Inventor
王志晓
徐志鸥
席景科
袁冠
何婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN201811399856.5A priority Critical patent/CN109493246B/zh
Publication of CN109493246A publication Critical patent/CN109493246A/zh
Application granted granted Critical
Publication of CN109493246B publication Critical patent/CN109493246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种动态社交网络社区演化分析方法及其系统,属于网络识别技术领域,解决了现有技术未能充分利用网络拓扑结构信息和未对核心节点的类型进行区分的问题。该方法包括如下步骤:针对给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;根据社区结构划分结果,计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合;针对superspreader集合,确定每一社区的演化事件1类型,即产生、合并和扩张事件;针对superblocker集合,确定每一社区的演化事件2类型,即消失、分裂和缩减事件。本发明利用superspreader的传播性强和superblocker破坏连通性的特点,根据这两类节点集合的变化情况分析动态社交网络社区演化事件,演化事件识别准确性、效率高。

Description

一种动态社交网络社区演化分析方法及其系统
技术领域
本发明涉及网络识别技术领域,尤其涉及一种动态社交网络社区演化分析方法及其系统。
背景技术
一般情况下,复杂的社交网络中都隐藏着社区结构,同一社区的用户联系紧密,而不同社区的用户相互联系较为稀疏。现实的社交网络会随时间的推移而发生频繁且持续的变化,因此仅研究社交网络的静态特性不足以刻画其真实性,目前,研究者越来越关注动态社交网络的演化,其在很多领域都有广泛的应用。比如,对于疾病传播网络,跟踪感染病人的社区变化情况有助于发现疾病的传播路径,从而找到有效的措施控制疾病的传播。对于在线销售网络,分析动态社区的演化有助于预测市场流行趋势及消费者喜好的变化。
关于动态社交网络社区演化分析的现有技术,主要包括基于相似度的社区演化分析方法和基于核心节点的社区演化分析方法。基于相似度的社区演化分析方法,通过计算Jaccard系数或者改进的Jaccard系数作为两个社区之间的相似度来匹配前后时间片的两个社区,若两个社区之间的相似度超过某设定的阈值,则认定这前后两个时间片的社区相匹配。该类方法设计简单、复杂度低,但对于相似度阈值的选择问题,难以通过理论分析或者简单的实验确定,并且,没有考虑到社区内部的拓扑结构信息,社区匹配的准确性难以保证。而基于核心节点的社区演化分析方法考虑了社区的拓扑结构信息,并且不需要设定阈值,但是该方法没有充分考虑不同特性的核心节点对不同类型的社区演化事件的贡献情况,而是利用单一类型的核心节点识别所有的演化事件,导致演化事件识别的准确性难以保证。
综上所述,现有的动态社交网络社区演化分析方法主要存在两个不足:1)没有较好地利用网络拓扑结构,准确性有待提高;2)不同的核心节点拥有不同的特性,对演化事件检测的贡献不同,但是现有技术没有对核心节点的类型进行区分。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种动态社交网络社区演化分析方法及其系统,用以解决现有技术未能充分利用网络拓扑结构信息和未对核心节点的类型进行区分的问题的问题。
一方面,本发明实施例提供了一种动态社交网络社区演化分析方法,包括如下步骤:
针对给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
根据社区结构划分结果,计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合;
针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张事件;
针对上述superblocker集合,确定每一社区的演化事件2类型;所述演化事件2可能的类型包括消失、分裂和缩减事件。
上述技术方案的有益效果如下:演化事件的类型包括产生、合并、扩张、消失、分裂和缩减。上述技术方案利用superspreader的传播性强和superblocker破坏连通性的特点,根据这两类节点集合的变化情况分析动态社交网络社区演化事件,经大量试验证明,演化事件识别的准确性和效率较高。上述技术方案解决了现有动态社交网络社区演化分析忽略社区网络的内部拓扑结构信息以及未对核心节点的类型进行区分的问题,将核心节点分为superspreader和superblocker,利用superspreader传播性强的特性发现社区的产生、合并、扩张事件,利用superblocker破坏网络连通性的特点发现社区的消失、分裂、缩减事件。
基于上述方法的另一个实施例中,所述针对给定的动态社交网络、从第一个时间片开始、对每个时间片划分该时间片网络对应的社区结构,包括如下步骤:
针对给定的动态社交网络,从第一个时间片开始,获得每个时间片网络中各个节点之间的邻居关系;
根据上述邻居关系,通过QCA算法,划分每个时间片网络对应的社区结构。
上述技术方案的有益效果是:QCA算法是一种典型的动态社交网络社区划分方法,能够较好地划分每个时间片网络对应的社区结构,该方法具有很高的执行效率,并且其划分结果合理、可靠、准确。
进一步,所述计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合,包括如下步骤:
通过Degree Discount算法,得到每个时间片网络的superspreader集合;
通过CoreHD算法,得到每个时间片网络对应的每个社区的superblocker集合。
上述进一步方案的有益效果是:Degree Discount算法是一种典型的社交网络superspreader集合识别方法,能够较好地计算每个时间片网络的superspreader集合。CoreHD算法是一种典型的社交网络superblocker集合识别方法,能够较好地计算每个时间片网络对应的每个社区的superblocker集合。这两种方法都具有很高的执行效率,并且得到的结果合理、准确、可靠。
进一步,所述针对上述superspreader集合、确定每一社区的演化事件1类型,包括如下步骤:
根据产生事件的计算模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区;
根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t的同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并;
根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
上述进一步方案的有益效果是:充分利用superspreader节点传播性强的特点来判断产生、合并和扩张事件,使得演化事件1类型的判断更加准确。
进一步,所述针对上述superblocker集合、确定每一社区的演化事件2类型,包括如下步骤:
根据消失事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的superblocker节点在当前时间片t不存在或不再是superblocker集合中的节点,则判定演化事件2为消失事件,该superblocker节点曾经代表的社区在当前时间片t发生死亡;
根据分裂事件的计算模型进行演化事件2类型判断,若前一个时间片t-1在同一个社区的两个superblocker节点在当前时间片t分别在两个不同的社区,则判定演化事件2为分裂事件,前一个时间片t-1的所述社区在当前时间片t发生分裂;
根据缩减事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的某一社区内superblocker节点规模大于当前时间片t对应社区的superblocker节点规模,则判定演化事件2为缩减事件,所述社区在当前时间片t发生缩减。
上述进一步方案的有益效果是:充分利用superblocker节点对社交网络连通性破坏性强的特点来判断消失、分裂和缩减事件,使得演化事件2类型的判断更加准确。
进一步,所述产生事件的计算模型为
式中,ss表示某一superspreader节点,代表t时刻的第k个社区,SSt代表t时刻动态社交网络的superspreader集合,SSt-1代表t-1时刻动态社交网络的superspreader集合,Birth()=1代表产生事件为真;
所述合并事件的计算模型为
式中,ss1、ss2表示某两个superspreader节点,是t-1时刻的某两个社区,是t时刻第k个社区,SSt-1代表t-1时刻动态社交网络的superspreader集合,Merging()=1表示合并事件为真;
所述扩张事件的计算模型为
式中,ss表示某一superspreader节点,是t-1时刻的第k个社区,是t时刻第s个社区,SSt是t时刻动态社交网络的superspreader集合,SSt-1代表t-1时刻动态社交网络的superspreader集合,Expansion()=1表示扩张事件为真。
上述进一步方案的有益效果是:根据superspreader节点对产生、合并和扩张事件的不同作用与贡献,分别给出具体的事件计算模型,使得演化事件1类型的判断更加准确。
进一步,所述消失事件的计算模型为
式中,sb表示某一superblocker节点,表示t-1时刻第k个社区,SBt-1表示t-1时刻动态社交网络的superblocker集合,Death()=1表示消失事件为真;
所述分裂事件的计算模型为
式中,sb1、sb2表示某两个superblocker节点,是t-1时刻的第k个社区,是t时刻的某两个社区,SBt是t时刻动态社交网络的superblocker集合,SBt-1是t时刻动态社交网络的superblocker集合,Splitting()=1表示分裂事件为真;
所述缩减事件的计算模型为
式中,sb表示某一superblocker节点,是t-1时刻的第k个社区,是t时刻的第s个社区,SBt是t时刻的superblocker集合,SBt-1是t-1时刻动态社交网络的superblocker集合,Reduction()=1表示缩减事件为真。
上述进一步方案的有益效果是:根据superblocker节点对消失、分裂和缩减事件的不同作用与贡献,分别给出具体的事件计算模型,使得演化事件2类型的判断更加准确。
另一方面,本发明实施例提供了一种动态社交网络社区演化分析系统,其特征在于,包括社区划分模块、superspreader集合计算模块、superblocker集合计算模块、基于superspreader的演化事件分析模块、基于superblocker的演化事件分析模块;其中,
所述社区划分模块,用于根据给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
所述superspreader集合计算模块,用于根据所述社区划分模块输出的社区结构划分结果,计算每个时间片网络的superspreader集合;
所述superblocker集合计算模块,用于根据所述社区划分模块输出的社区结构划分结果,计算每个时间片网络对应的每个社区的superblocker集合;
所述基于superspreader的演化事件分析模块,用于针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张;
所述基于superblocker的演化事件分析模块,用于针对上述superblocker集合,确定每一社区的演化事件2类型;所述演化事件2可能的类型包括消失、分裂和缩减。
上述技术方案的有益效果是:演化事件的类型包括产生、合并、扩张、消失、分裂和缩减。上述技术方案利用superspreader的传播性强和superblocker破坏连通性的特点,根据这两类节点集合的变化情况分析动态社交网络社区演化事件,经大量试验证明,发现准确性和效率较高。上述技术方案解决了现有动态社交网络社区演化分析忽略社区网络的内部拓扑结构信息以及未对核心节点类型进行区分的问题,将核心节点分为superspreader和superblocker,利用superspreader传播性强的特性发现社区的产生、合并、扩张事件,利用superblocker破坏网络连通性的特点发现社区的消失、分裂、缩减事件。
进一步,所述基于superspreader的演化事件分析模块,包括产生事件判断单元、合并事件判断单元、扩张事件判断单元;其中,
产生事件判断单元,用于根据产生事件模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定所述演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区;
所述合并事件判断单元,用于根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并;
所述扩张事件判断单元,用于根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
上述进一步方案的有益效果是:充分利用superspreader节点传播性强的特点来判断产生、合并和扩张事件,使得演化事件1类型的判断更加准确。并且,产生、合并和扩张事件判断单元间相对独立,便于系统的升级与维护。
进一步,所述基于superblocker的演化事件分析模块,包括消失事件判断单元、分裂事件判断单元、缩减事件判断单元;其中,
所述消失事件判断单元,用于根据消失事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的superblocker节点在当前时间片t不存在或不再是superblocker集合中的节点,则判定演化事件2为消失事件,该superblocker节点曾经代表的社区在当前时间片t发生死亡;
所述分裂事件判断单元,用于根据分裂事件的计算模型进行演化事件2类型判断,若前一个时间片t-1在同一个社区的两个superblocker节点在当前时间片t分别在两个不同的社区,则判定演化事件2为分裂事件,前一个时间片t-1的所述社区在当前时间片t发生分裂;
所述缩减事件判断单元,用于根据缩减事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的某一社区内superblocker节点规模大于当前时间片t对应社区的superblocker节点规模,则判定演化事件2为缩减事件,所述社区在当前时间片t发生缩减。
上述进一步方案的有益效果是:充分利用superblocker节点对社交网络连通性破坏性强的特点来判断消失、分裂和缩减事件,使得演化事件2类型的判断更加准确。并且,消失、分裂和缩减事件判断单元间相对独立,便于系统的升级与维护。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书、权利要求书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例1动态社交网络社区演化分析方法步骤示意图;
图2为本发明实施例2对每个时间片划分该时间片网络对应的社区结构的步骤示意图;
图3为本发明实施例2计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合的步骤示意图;
图4为本发明实施例2针对superspreader集合确定每一社区的演化事件1类型的步骤示意图;
图5为本发明实施例2针对superblocker集合确定每一社区的演化事件2类型的步骤示意图;
图6为本发明实施例3动态社交网络社区演化分析系统结构示意图;
图7为本发明实施例3动态社交网络社区演化分析系统工作流程图;
图8为本发明实施例4社区演化事件的部分演化图;
图9为本发明实施例5社区演化事件的部分演化图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
实施例1
本发明的一个具体实施例,公开了一种动态社交网络社区演化分析方法,如图1所示,包括如下步骤:
S1.针对给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
S2.根据社区结构划分结果,计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合;
S3.针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张事件;
S4.针对上述superblocker集合,确定每一社区的演化事件2类型;所述演化事件2可能的类型包括消失、分裂和缩减事件。
与现有技术相比,本实施例提供的演化事件的类型包括产生、合并、扩张、消失、分裂和缩减。上述技术方案利用superspreader的传播性强和superblocker破坏连通性的特点,根据这两类节点集合的变化情况分析动态社交网络社区演化事件,经大量试验证明,发现准确性和效率较高。上述技术方案解决了现有动态社交网络社区演化分析忽略社区网络的内部拓扑结构信息以及未对核心节点类型区分的问题,将核心节点分为superspreader和superblocker,利用superspreader传播性强的特性发现社区的产生、合并、扩张事件,利用superblocker破坏网络连通性的特点发现社区的消失、分裂、缩减事件。
实施例2
在实施例1的基础上进行优化,如图2所示,步骤S1可进一步细化为如下步骤:
S11.针对给定的动态社交网络,从第一个时间片开始,获得每个时间片网络中各个节点之间的邻居关系;
S12.根据上述邻居关系,通过QCA算法,划分每个时间片网络对应的社区结构。
QCA算法是一种基于模块度的快速自适应动态社区发现算法,为每种网络变化制定不同的社区结构更新策略,包括节点加入、节点删除、边的增加、边的删除,通过模块度最大化来决定增量节点的社区归属。
优选地,如图3所示,步骤S2可进一步细化为如下步骤:
S21.通过Degree Discount算法,得到每个时间片网络的superspreader集合;
S22.通过CoreHD算法,得到每个时间片网络对应的每个社区的superblocker集合。
具体地,所述superspreader的计算方法为
ddv=dv-2tv-(dv-tv)tvp
式中,ddv是superspreader节点v的影响力分值,dv是superspreader节点v的度值,tv是superspreader节点v的邻居节点被选为种子节点的个数,p是社交网络中superspreader节点信息的传播概率。
Degree Discount算法循环使用上述公式计算节点的影响力分值,每次找出影响力分值最大的节点加入种子节点集合。该种子节点集合就是上述superspreader集合。
所述superblocker的计算方法为:通过CoreHD算法首先删除尽可能少的节点,使得删除节点后网络中没有循环。然后,从基于2核分解的网络中自适应地移除节点度值最高的节点,以找到尽可能小规模的节点集,即superblocker集合,使得在移除这些节点之后,网络被分解成几个独立的连通分量。
优选地,如图4所示,步骤S3可进一步细化为如下步骤:
S31.根据产生事件的计算模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区。
S32.根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t的同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并。
S33.根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
优选地,如图5所示,步骤S4可进一步细化为包括如下步骤:
S41.根据消失事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的superblocker节点在当前时间片t不存在或不再是superblocker集合中的节点,则判定演化事件2为消失事件,该superblocker节点曾经代表的社区在当前时间片t发生死亡。
S42.根据分裂事件的计算模型进行演化事件2类型判断,若前一个时间片t-1在同一个社区的两个superblocker节点在当前时间片t分别在两个不同的社区,则判定演化事件2为分裂事件,前一个时间片t-1的所述社区在当前时间片t发生分裂。
S43.根据缩减事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的某一社区内superblocker节点规模大于当前时间片t对应社区的superblocker节点规模,则判定演化事件2为缩减事件,所述社区在当前时间片t发生缩减。
优选地,所述产生事件的计算模型为
式中,ss表示某一superspreader节点,代表t时刻的第k个社区,SSt代表t时刻动态社交网络的superspreader集合,SSt-1代表t-1时刻动态社交网络的superspreader集合,Birth()=1代表产生事件为真。
在t时刻,对于任意属于的superspreader节点ss,在t-1时刻不是superspreader,则节点ss所属的社区是一个新生成的社区。
所述合并事件的计算模型为
式中,ss1、ss2表示某两个superspreader节点,是t-1时刻的某两个社区,是t时刻第k个社区,SSt-1代表t-1时刻动态社交网络的superspreader集合,Merging()=1表示合并事件为真。
在t-1时刻,存在ss1、ss2分别是两个社区内的superspreader,但在t时刻,ss1、ss2在同一个社区内,则社区发生了合并。
所述扩张事件的计算模型为
式中,ss表示某一superspreader节点,是t-1时刻的第k个社区,是t时刻第s个社区,SSt是t时刻动态社交网络的superspreader集合,SSt-1代表t-1时刻动态社交网络的superspreader集合,Expansion()=1表示扩张事件为真。
在t-1时刻,任意ss是社区内的superspreader,在t时刻是社区内的superspreader,且内的superspreader数量少于内的superspreader数量,则社区发生了扩张。
优选地,所述消失事件的计算模型为
式中,sb表示某一superblocker节点,表示t-1时刻第k个社区,SBt-1表示t-1时刻动态社交网络的superblocker集合,Death()=1表示消失事件为真。
在t-1时刻,任意社区内的superblocker节点sb,在t时刻不再是superblocker,则sb所在的社区发生了消亡。
所述分裂事件的计算模型为
式中,sb1、sb2表示某两个superblocker节点,是t-1时刻的第k个社区,是t时刻的某两个社区,SBt是t时刻动态社交网络的superblocker集合,SBt-1是t时刻动态社交网络的superblocker集合,Splitting()=1表示分裂事件为真。
在t-1时刻,同一个社区内的两个superblockersb1、sb2,在t时刻,在不同的社区中,则sb1、sb2所在的社区发生了分裂。
所述缩减事件的计算模型为
式中,sb表示某一superblocker节点,是t-1时刻的第k个社区,是t时刻的第s个社区,SBt是t时刻的superblocker集合,SBt-1是t-1时刻动态社交网络的superblocker集合,Reduction()=1表示缩减事件为真。
在t-1时刻,社区内的任一supersblcokersb,在t时刻是社区内的superblocker,但是社区内的superblocker数量多于社区内的superblocker数量,则社区发生了缩减。
与实施例1相比,本实施例对步骤S1~S4进行了进一步限定,充分利用superspreader节点传播性强的特点来判断产生、合并和扩张事件,使得演化事件1类型的判断更加准确,并充分利用superblocker节点对社交网络连通性破坏性强的特点来判断消失、分裂和缩减事件,使得演化事件2类型的判断更加准确。
实施例3
本发明的另一个具体实施例,公开了一种动态社交网络社区演化分析系统,该系统使用实施例1所述方法进行演化分析。具体地,如图6所示,该动态社交网络社区演化分析系统包括社区划分模块、superspreader集合计算模块、superblocker集合计算模块、基于superspreader的演化事件分析模块、基于superblocker的演化事件分析模块。其中,社区划分模块的输出端与superspreader集合计算模块、superblocker集合计算模块、基于superspreader的演化事件分析模块、基于superblocker的演化事件分析模块的输入端连接。superspreader集合计算模块的输出端与基于superspreader的演化事件分析模块的输入端连接,superblocker集合计算模块的输出端与基于superblocker的演化事件分析模块的输出端连接。
社区划分模块,用于根据给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
superspreader集合计算模块,用于根据所述社区划分模块输出的社区结构划分结果,计算每个时间片网络的superspreader集合;
基于superspreader的演化事件分析模块,用于针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张;
基于superblocker的演化事件分析模块,用于针对上述superblocker集合,确定每一社区的演化事件2类型;所述演化事件2可能的类型包括消失、分裂和缩减。
优选地,基于superspreader的演化事件分析模块,包括产生事件判断单元、合并事件判断单元、扩张事件判断单元。
产生事件判断单元,用于根据产生事件模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定所述演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区。
合并事件判断单元,用于根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并。
扩张事件判断单元,用于根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
优选地,基于superblocker的演化事件分析模块,包括消失事件判断单元、分裂事件判断单元、缩减事件判断单元。
消失事件判断单元,用于根据消失事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的superblocker节点在当前时间片t不存在或不再是superblocker集合中的节点,则判定演化事件2为消失事件,该superblocker节点曾经代表的社区在当前时间片t发生死亡;
分裂事件判断单元,用于根据分裂事件的计算模型进行演化事件2类型判断,若前一个时间片t-1在同一个社区的两个superblocker节点在当前时间片t分别在两个不同的社区,则判定演化事件2为分裂事件,前一个时间片t-1的所述社区在当前时间片t发生分裂;
缩减事件判断单元,用于根据缩减事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的某一社区内superblocker节点规模大于当前时间片t对应社区的superblocker节点规模,则判定演化事件2为缩减事件,所述社区在当前时间片t发生缩减。
该实施例所示系统与实施例2中的方法基于相同的原理,其相通之处可相互借鉴。
优选地,QCA算法是一种基于模块度的快速自适应动态社区发现算法,为每种网络变化制定不同的社区结构更新策略,包括节点加入、节点删除、边的增加、边的删除,通过模块度最大化来决定增量节点的社区归属。
实施时,该系统的流程如图7所示。
与现有技术相比,本实施例提供的系统利用superspreader的传播性强和superblocker破坏连通性的特点,根据这两类节点集合的变化情况分析动态社交网络社区演化事件,经大量试验证明,发现准确性和效率较高。本实施例解决了现有动态社交网络社区演化分析忽略社区网络的内部拓扑结构信息以及未对核心节点类型区分的问题,将核心节点分为superspreader和superblocker,利用superspreader传播性强的特性发现社区的产生、合并、扩张事件,利用superblocker破坏网络连通性的特点发现社区的消失、分裂、缩减事件。
实施例4
本实施例以恐怖分子通信数据集VAST 2008网络为例,将实施例2所述动态社交网络社区演化分析方法用于识别VAST 2008网络的社区演化事件。恐怖分子通信数据集VAST2008是来自IEEE VAST 2008的开放竞赛项目,包括400个恐怖分子在10天间的通话记录。每个恐怖分子被抽象为一个节点,当恐怖分子之间存在一条通话记录,则表示这两个点之间存在一条边。我们将每一天的通话数据作为一个时间片,得到该网络10个时间片的动态拓扑结构。这是一个比较具有代表性的社交网络,许多演化分析方法都基于这个数据集进行测试。
本实施例包括以下具体步骤:
S1.针对给定的VAST 2008网络,使用QCA算法,划分每个时间片网络的社区结构。
S2.使用DegreeDiscount算法计算每个时间片网络的superspreader节点集合。使用CoreHD算法计算每个时间片网络的superblocker节点集合。Superspreader是一种传播性极强的节点,通过它们能将信息尽可能地传播到更多的节点。Superblocker是一种破坏连通性的节点,删除它们能使得剩余的连通分量尽可能地小。
S3.根据步骤S1划分出的社区结构和步骤S2得出的superspreader节点集合,分析社区演化事件,包括:产生事件,合并事件,扩张事件。
S4.根据步骤S1划分出的社区结构和步骤S2得出的superblocker节点集合,分析社区演化事件,包括:消失事件,分裂事件,缩减事件。
图8是通过步骤S3和步骤S4分析出的部分社区演化事件,发现通过superspreader和superblocker节点的变化能很好地发现动态社交网络社区的变化,如节点1,2,3,5所代表的社区,在1-7时间片活跃后消失,而节点306,309,360.360所代表的社区从第8时间片出现后活跃。社区之间的分裂和合并事件也同样被检测出来,比如第一时间片的社区5分裂成2和5,第三时间片的社区3和5在第四时间片合并成一个社区,又分裂成了第五时间片的社区3和5。第8时间片的社区309,360合并成了第9时间片的309,到第十时间片又分裂成了社区309和360。
实施例5
本实施例以arXiv网络为例,将实施例2所述动态社交网络社区演化分析方法用于识别arXiv网络的社区演化事件。arXiv网络是KDD cup2003发布的电子引文网络,由1991年至2003年发表的352,768篇论文组成。每篇论文被视为一个节点,论文间的引用被视为带有时间戳的边。根据论文发布的年份将该网络分为13个连续时间片。这是一个比较具有代表性的社交网络,许多演化分析方法都基于这个数据集进行测试。
图9是通过步骤S3和步骤S4分析出的部分社区演化事件,发现通过superspreader和superblocker节点的变化的确能很好地发现社区的变化。比如,一个新生成的社区在早期的时间片内经常发生合并事件,而从后期时间片到死亡期间经常发生分裂事件。这种现象与电子引文网络的本质特征是一致的。一开始,新研究课题有不同的定义和标准,可以模拟为产生事件;然后,逐步形成统一的定义和标准,可以将其模拟为合并事件;然而,随着研究的深入,该课题向不同方向延伸,不同的研究方向成为不同的子课题,可以模拟为分裂事件;有些课题在一段时间内保持或扩张或缩小,直到消失,这可以被模拟为扩张、缩减和消失事件。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种动态社交网络社区演化分析方法,其特征在于,包括如下步骤:
针对给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
根据社区结构划分结果,计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合;
针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张事件;
针对上述superblocker集合,确定每一社区的演化事件2类型:所述演化事件2可能的类型包括消失、分裂和缩减事件。
2.根据权利要求1所述的动态社交网络社区演化分析方法,其特征在于,所述针对给定的动态社交网络、从第一个时间片开始、对每个时间片划分该时间片网络对应的社区结构,包括如下步骤:
针对给定的动态社交网络,从第一个时间片开始,获得每个时间片网络中各个节点之间的邻居关系;
根据上述邻居关系,通过QCA算法,划分每个时间片网络对应的社区结构。
3.根据权利要求1或2所述的动态社交网络社区演化分析方法,其特征在于,所述计算每个时间片网络的superspreader集合和该时间片网络对应的每个社区的superblocker集合,包括如下步骤:
通过Degree Discount算法,得到每个时间片网络的superspreader集合;
通过CoreHD算法,得到每个时间片网络对应的每个社区的superblocker集合。
4.根据权利要求1或2所述的动态社交网络社区演化分析方法,其特征在于,所述针对上述superspreader集合、确定每一社区的演化事件1类型,包括如下步骤:
根据产生事件的计算模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区;
根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t的同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并;
根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
5.根据权利要求1或2所述的动态社交网络社区演化分析方法,其特征在于,所述针对上述superblocker集合、确定每一社区的演化事件2类型,包括如下步骤:
根据消失事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的superblocker节点在当前时间片t不存在或不再是superblocker集合中的节点,则判定演化事件2为消失事件,该superblocker节点曾经代表的社区在当前时间片t发生死亡;
根据分裂事件的计算模型进行演化事件2类型判断,若前一个时间片t-1在同一个社区的两个superblocker节点在当前时间片t分别在两个不同的社区,则判定演化事件2为分裂事件,前一个时间片t-1的所述社区在当前时间片t发生分裂;
根据缩减事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的某一社区内superblocker节点规模大于当前时间片t对应社区的superblocker节点规模,则判定演化事件2为缩减事件,所述社区在当前时间片t发生缩减。
6.根据权利要求4所述的动态社交网络社区演化分析方法,其特征在于,所述产生事件的计算模型为
式中,ss表示某一superspreader节点,代表t时刻的第k个社区,SSt代表t时刻动态社交网络的superspreader集合,SSt-1代表t-1时刻动态社交网络的superspreader集合,Birth()=1代表产生事件为真;
所述合并事件的计算模型为
式中,ss1、ss2表示某两个superspreader节点,是t-1时刻的某两个社区,是t时刻第k个社区,SSt-1代表t-1时刻动态社交网络的superspreader集合,Merging()=1表示合并事件为真;
所述扩张事件的计算模型为
式中,ss表示某一superspreader节点,是t-1时刻的第k个社区,是t时刻第s个社区,SSt是t时刻动态社交网络的superspreader集合,SSt-1代表t-1时刻动态社交网络的superspreader集合,Expansion()=1表示扩张事件为真。
7.根据权利要求5所述的动态社交网络社区演化分析方法,其特征在于,所述消失事件的计算模型为
式中,sb表示某一superblocker节点,表示t-1时刻第k个社区,SBt-1表示t-1时刻动态社交网络的superblocker集合,Death()=1表示消失事件为真;
所述分裂事件的计算模型为
式中,sb1、sb2表示某两个superblocker节点,是t-1时刻的第k个社区,是t时刻的某两个社区,SBt是t时刻动态社交网络的superblocker集合,SBt-1是t时刻动态社交网络的superblocker集合,Splitting()=1表示分裂事件为真;
所述缩减事件的计算模型为
式中,sb表示某一superblocker节点,是t-1时刻的第k个社区,是t时刻的第s个社区,SBt是t时刻的superblocker集合,SBt-1是t-1时刻动态社交网络的superblocker集合,Reduction()=1表示缩减事件为真。
8.一种动态社交网络社区演化分析系统,其特征在于,包括社区划分模块、superspreader集合计算模块、superblocker集合计算模块、基于superspreader的演化事件分析模块、基于superblocker的演化事件分析模块;其中,
所述社区划分模块,用于根据给定的动态社交网络,从第一个时间片开始,对每个时间片划分该时间片网络对应的社区结构;
所述superspreader集合计算模块,用于根据所述社区划分模块输出的社区结构划分结果,计算每个时间片网络的superspreader集合;
所述superblocker集合计算模块,用于根据所述社区划分模块输出的社区结构划分结果,计算每个时间片网络对应的每个社区的superblocker集合;
所述基于superspreader的演化事件分析模块,用于针对上述superspreader集合,确定每一社区的演化事件1类型;所述演化事件1可能的类型包括产生、合并和扩张;
所述基于superblocker的演化事件分析模块,用于针对上述superblocker集合,确定每一社区的演化事件2类型;所述演化事件2可能的类型包括消失、分裂和缩减。
9.根据权利要求8所述的动态社交网络社区演化分析系统,其特征在于,所述基于superspreader的演化事件分析模块,包括产生事件判断单元、合并事件判断单元、扩张事件判断单元;其中,
产生事件判断单元,用于根据产生事件模型进行演化事件1类型判断,若当前时间片t的superspreader节点在前一个时间片t-1不存在或者不是superspreader集合中的节点,则判定所述演化事件1为产生事件,该superspreader节点所代表的社区为当前时间片t新生成的社区;
所述合并事件判断单元,用于根据合并事件的计算模型进行演化事件1类型判断,若当前时间片t同一个社区内的两个superspreader节点在前一个时间片t-1分别属于不同的社区,则判定演化事件1为合并事件,所述两个superspreader节点所代表的社区在当前时间片t发生合并;
所述扩张事件判断单元,用于根据扩张事件的计算模型进行演化事件1类型判断,若当前时间片t的某个社区内superspreader节点规模大于前一个时间片t-1对应社区的superspreader节点规模,则判定演化事件1为扩展事件,所述社区在当前时间片t发生扩张。
10.根据权利要求8或9所述的动态社交网络社区演化分析系统,其特征在于,所述基于superblocker的演化事件分析模块,包括消失事件判断单元、分裂事件判断单元、缩减事件判断单元;其中,
所述消失事件判断单元,用于根据消失事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的superblocker节点在当前时间片t不存在或不再是superblocker集合中的节点,则判定演化事件2为消失事件,该superblocker节点曾经代表的社区在当前时间片t发生死亡;
所述分裂事件判断单元,用于根据分裂事件的计算模型进行演化事件2类型判断,若前一个时间片t-1在同一个社区的两个superblocker节点在当前时间片t分别在两个不同的社区,则判定演化事件2为分裂事件,前一个时间片t-1的所述社区在当前时间片t发生分裂;
所述缩减事件判断单元,用于根据缩减事件的计算模型进行演化事件2类型判断,若前一个时间片t-1的某一社区内superblocker节点规模大于当前时间片t对应社区的superblocker节点规模,则判定演化事件2为缩减事件,所述社区在当前时间片t发生缩减。
CN201811399856.5A 2018-11-22 2018-11-22 一种动态社交网络社区演化分析方法及其系统 Active CN109493246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811399856.5A CN109493246B (zh) 2018-11-22 2018-11-22 一种动态社交网络社区演化分析方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811399856.5A CN109493246B (zh) 2018-11-22 2018-11-22 一种动态社交网络社区演化分析方法及其系统

Publications (2)

Publication Number Publication Date
CN109493246A true CN109493246A (zh) 2019-03-19
CN109493246B CN109493246B (zh) 2021-06-25

Family

ID=65697421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811399856.5A Active CN109493246B (zh) 2018-11-22 2018-11-22 一种动态社交网络社区演化分析方法及其系统

Country Status (1)

Country Link
CN (1) CN109493246B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472105A (zh) * 2019-08-06 2019-11-19 电子科技大学 一种基于时间划分的社交网络事件演化追踪方法
CN111047453A (zh) * 2019-12-04 2020-04-21 兰州交通大学 基于高阶张量分解大规模社交网络社区的检测方法及装置
CN111475736A (zh) * 2020-03-18 2020-07-31 华为技术有限公司 社区挖掘的方法、装置和服务器
CN112581298A (zh) * 2020-11-26 2021-03-30 北京理工大学 一种基于lstm的社交网络演化分类方法
CN113436674A (zh) * 2021-06-23 2021-09-24 兰州大学 一种基于topsis种子扩张的增量式社团检测方法—tseia

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103853739A (zh) * 2012-11-29 2014-06-11 中国移动通信集团公司 动态社会关系网络社区演化识别以及稳定社区提取方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103853739A (zh) * 2012-11-29 2014-06-11 中国移动通信集团公司 动态社会关系网络社区演化识别以及稳定社区提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FILIPPO RADICCHI ET AL: "Fundamental difference between superblockers and superspreaders in networks", 《PHYSICAL REVIEW》 *
张伟伟,: "社会网络中社区演化分析框架", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472105A (zh) * 2019-08-06 2019-11-19 电子科技大学 一种基于时间划分的社交网络事件演化追踪方法
CN111047453A (zh) * 2019-12-04 2020-04-21 兰州交通大学 基于高阶张量分解大规模社交网络社区的检测方法及装置
CN111475736A (zh) * 2020-03-18 2020-07-31 华为技术有限公司 社区挖掘的方法、装置和服务器
CN112581298A (zh) * 2020-11-26 2021-03-30 北京理工大学 一种基于lstm的社交网络演化分类方法
CN113436674A (zh) * 2021-06-23 2021-09-24 兰州大学 一种基于topsis种子扩张的增量式社团检测方法—tseia
CN113436674B (zh) * 2021-06-23 2023-02-17 兰州大学 一种基于topsis种子扩张的增量式社团检测方法—tseia

Also Published As

Publication number Publication date
CN109493246B (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN109493246A (zh) 一种动态社交网络社区演化分析方法及其系统
Wu et al. Net: Degree-specific graph neural networks for node and graph classification
Rahman et al. A decision tree-based missing value imputation technique for data pre-processing
Newman Fast algorithm for detecting community structure in networks
Huang et al. A flexible framework for probabilistic models of social trust
CN105306475A (zh) 一种基于关联规则分类的网络入侵检测方法
Rees et al. Overlapping community detection by collective friendship group inference
Tseng et al. Effective temporal data classification by integrating sequential pattern mining and probabilistic induction
Achar et al. Pattern-growth based frequent serial episode discovery
Zhang et al. Blockchain phishing scam detection via multi-channel graph classification
Ozcan et al. Multivariate time series link prediction for evolving heterogeneous network
Yang et al. Finding key attribute subset in dataset for outlier detection
Martin et al. Anomaly detection in blockchain using network representation and machine learning
Jalali et al. Social network sampling using spanning trees
CN109522416A (zh) 一种金融风险控制知识图谱的构建方法
Liu et al. Adaptive multi-channel bayesian graph attention network for iot transaction security
Zarezade et al. Community detection using a new node scoring and synchronous label updating of boundary nodes in social networks
Junuthula et al. Leveraging friendship networks for dynamic link prediction in social interaction networks
Coscia Generalized Euclidean measure to estimate network distances
Aslan et al. Predicting potential links by using strengthened projections in evolving bipartite networks
Islam et al. DETECTIVE: A decision tree based categorical value clustering and perturbation technique for preserving privacy in data mining
Yeh et al. Analyzing network reliability with imperfect nodes using OBDD
CN112150285B (zh) 基于邻域拓扑结构的异常金融组织层次划分系统及方法
Adewole et al. The quadratic entropy approach to implement the Id3 decision tree algorithm
Segarra-Martín et al. A novel approach to discover numerical association based on the coronavirus optimization algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant