CN106067140A - 一种社会网络事件检测的混合指标量子群智能方法 - Google Patents

一种社会网络事件检测的混合指标量子群智能方法 Download PDF

Info

Publication number
CN106067140A
CN106067140A CN201610375108.8A CN201610375108A CN106067140A CN 106067140 A CN106067140 A CN 106067140A CN 201610375108 A CN201610375108 A CN 201610375108A CN 106067140 A CN106067140 A CN 106067140A
Authority
CN
China
Prior art keywords
theta
network
auc
formula
mixing index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610375108.8A
Other languages
English (en)
Inventor
胡文斌
王欢
杜博
严丽平
邱振宇
聂聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201610375108.8A priority Critical patent/CN106067140A/zh
Publication of CN106067140A publication Critical patent/CN106067140A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种社会网络事件检测的混合指标量子群智能方法,针对社会网络数据集,利用事件检测方法IndexEvent依次对各时间段的演化波动进行定量评价,通过评价结果去检测网络事件的发生;事件检测方法IndexEvent利用OWA算法和FDA算法,依次对各时间段的演化波动进行定量评价;本发明有助于及时发现社会网络中的异常事件,引导社会网络健康演化,避免恶性群体事件的发生。

Description

一种社会网络事件检测的混合指标量子群智能方法
技术领域
本发明属于社会网络技术领域,涉及一种社会网络中事件检测方法,具体涉及一种全新的社会网络事件检测的混合指标量子群智能方法。
背景技术
社会网络是指社会不同个体成员之间因互动而形成的相对稳定的关系体系。社会网络事件检测通常通过检测各个时段的网络演化的变化,分析出网络演化的异样,从而检测出当前网络发生的事件,提出干预和处置策略。社会网络事件检测具有广泛的应用场景和极大的实用价值,例如,它可以分析犯罪网络中核心头目的更替、预测公司人员结构调整影响、分析股票波动,进行舆情检测等。
在真实的社会网络中,很多事件的发生都有可能导致网络偏离正常的演化机制,产生异常的网络演化波动。如何基于当前复杂的社会网络,快速准确的检测出当前网络发生的重大事件,评估不同事件产生的影响,并且提出有效的处置策略,是社会网络事件检测面临的重大挑战。目前社会网络事件检测的主要方法如下:
(1)直接建立网络演化模型,调整模型参数使产生的网络更加接近真实网络,仿真各个时间段的网络结构,发现异常网络结构。比较典型的模型有Watts-Strogatz小世界模型,Barabasi-Albert无标度模型。但这些网络演化模型都处于理论探究阶段,尚不能应用在真实网络上;
(2)基于网络结构图的分析方法进行事件检测,涉及图形数据挖掘、数理统计,机器学习等理论,常见方法有图形模式识别、图形相似度比较、统计过程控制、扫描统计。
但是这些方法计算量巨大,适用范围局限,忽视了网络演化的动态性。
发明内容
为了解决上述技术问题,本发明提供了一种社会网络事件检测的混合指标量子群智能方法,可以评价不同网络的演化波动,发现网络波动异常,进行事件检测。
本发明所采用的技术方案是:一种社会网络事件检测的混合指标量子群智能方法,针对社会网络数据集,利用事件检测方法IndexEvent依次对各时间段的演化波动进行定量评价,通过评价结果去检测网络事件的发生;其特征在于:所述事件检测方法IndexEvent依次对各时间段的演化波动进行定量评价,其具体实现包括以下步骤:
步骤1:利用OWA算法,确定最佳混合指标;其具体实现包括以下子步骤;
步骤1.1:选定衡量指标;
步骤1.2:确定最佳混合指标的单位指标;
步骤1.3:产生携带权重数组的初始量子粒子群;
步骤1.4:权重数组更新;
步骤1.5:权重数组变异处理,确定最佳混合指标并输出;
步骤2:利用FDA算法,量化不同时刻网络演化波动;其具体实现包括以下子步骤;
步骤2.1:从网络演化稳定的时刻中选取网络检测稳定点TO;
步骤2.2:基于TO时的网络快照,通过OWA算法得到TO时最佳混合指标BMixSimIndexTO
步骤2.3:针对现有网络快照集{g1,g2,...,gt,…,gn},循环迭代求t时刻的网络演化波动的评价值Mt
步骤2.4:通过对Mt放大处理后得到的t时刻的网络事件检测值Ft,输出事件检测序列(F1,F2,…,Ft,...,FT)。
作为优选,步骤1.1中所述选定衡量指标,为一种混合指标MixSimIndex,用式(1)表示如下:
M i x S i m I n d e x = Σ m = 1 n w m × SimIndex m , SimIndex m ∈ φ , Σ m = 1 n w m = 1 - - - ( 1 )
其中,SimIndexm是特定的相似性指标,称为MixSimIndex的单位指标;wm为对应的单位指标SimIndexm的权重,权重数组W=(w1,w2,...,wt,...wT);;n是所选定的相似性指标的数目,即单位指标的数目;单位指标都源于集合φ,集合φ包括表1中所示的8种相似性指标;
表1相似性指标
其中,S(i,j)表示节点i与节点j的相似性得分,Γ(i)表示节点i的邻居所组成的集合,节点i的度为k(i)=|Γ(i)|。
作为优选,步骤1.2中所述确定最佳混合指标的单位指标,是选取AUC是作为衡量指标,它的定义用式(2)表示:
A U C = n ′ + 0.5 n ′ ′ n - - - ( 2 )
n表示比较的次数,n'表示从测试集中随机选择边的得分大于从不存在边构成集合中随机选择边的得分的次数,n"表示相等的次数;集合φ中满足AUC大于0.5的相似性指标被选为单位指标。
作为优选,步骤1.3中所述产生携带权重数组的初始量子粒子群,量子粒子群中每个量子态粒子编码方式如式(3)所示:
P i = [ cos ( θ i 1 ) sin ( θ i 1 ) cos ( θ i 2 ) sin ( θ i 2 ) ... ... cos ( θ i n ) sin ( θ i n ) ] - - - ( 3 )
其中θij=2π×rnd,rnd为(0,1)之间的随机数;i=1,2,...,m,j=1,2,...,n,m是量子粒子群中粒子数目,n表示最佳混合指标中的有n单位指标;
每个量子态粒子占据的两个位置分别对应于概率幅Pis和Pic,用式(4)和式(5)表示。
Pis=(sin(θi1),sin(θi2),···,sin(θin)) (4)
Pic=(cos(θi1),cos(θi2),···,cos(θin)) (5)
每个量子态粒子的概率幅Pis和Pic通过式(6)和式(7)转化为对应的权重数组Wis和Wic
W i s = s i n ( θ i 1 ) Σ m = 1 n s i n ( θ i m ) , s i n ( θ i 2 ) Σ m = 1 n s i n ( θ i m ) , ... , s i n ( θ i n ) Σ m = 1 n s i n ( θ i m ) - - - ( 6 )
W i c = cos ( θ i 1 ) Σ m = 1 n cos ( θ i m ) , cos ( θ i 2 ) Σ m = 1 n cos ( θ i m ) , ... , cos ( θ i n ) Σ m = 1 n cos ( θ i m ) - - - ( 7 )
权重数组W值为Wis或Wic
作为优选,步骤1.4中所述权重数组更新是由概率幅Pis和Pic的更新实现的,每次迭代,都将Pis和Pic通过式(8)得到然后实现更新,继续进行下次迭代;
P ‾ i c = ( c o s ( θ i 1 ( t ) + Δθ n ( t + 1 ) ) , ... , c o s ( θ i n ( t ) + Δθ i n ( t + 1 ) ) )
P ‾ i c = ( s i n ( θ i 1 ( t ) + Δθ i 1 ( t + 1 ) ) , ... , s i n ( θ i n ( t ) + Δθ i n ( t + 1 ) ) ) - - - ( 8 )
其中
△θij(t+1)=w△θij(t)+c1r1(△θl)+c2r2(△θg),
作为优选,步骤1.4中所述权重数组变异处理,其具体实现过程是,设权重数组变异概率为pm,在(0,1)之间随机生成rndi,如果rndi<pm,则随机选择该量子态粒子上个量子比特通过式(9)进行变异操作;
0 1 0 1 c o s ( &theta; i j ) s i n ( &theta; i j ) = s i n ( &theta; i j ) c o s ( &theta; i j ) = c o s ( &pi; 2 - &theta; i j ) s i n ( &pi; 2 - &theta; i j ) - - - ( 9 )
设有m个量子态粒子共经历了gmax次迭代优化,Pil对应的权重数组Wil,为粒子i当前搜索到的适应度值最高的权重数组;Pg对应的权重数组为Wg,为整个粒子群当前搜索到的适应度值最大的权重数组;Pg通过式(6)或者式(7)转换为对应的权重数组,确定最佳混合指标并输出。
作为优选,步骤2.1中所述网络检测稳定点TO,是选取网络中没有事件发生的检测稳定点TO。
作为优选,步骤2.3中所述求t时刻的网络演化波动的评价值Mt,其公式为:
其中,△t表示记忆时间;AUCt与AUCt-1分别表示基于t和t-1时刻的网络求出的AUC值;t时刻的网络演化波动值Mt是由AUCt与AUCt-1至AUCt-△t平均值的差值的决定。
作为优选,步骤2.4中所述通过对Mt放大处理后得到的t时刻的网络事件检测值Ft,其公式为:
F t = A &times; M t , M t < M D M t , M t > = M D - - - ( 15 )
其中,MD为事件检测阀值,根据需求设置;A为放大系数;
通过式(15)对网络演化波动序列(M1,M2,…,Mt,...,Mn)中的异常波动进行放大处理,得到事件检测序列(F1,F2,…,Ft,...,FT),Ft可以为负数值,值越小,表明此时的网络演化波动越大,发生事件的可能性越大。
作为优选,步骤2.3中所述求t时刻的网络演化波动的评价值Mt,其公式为:
mAUC t = ( &Sigma; i &Element; &Gamma; ( T ) AUC i t N t ) &times; AUC t - - - ( 16 )
将链路预测衡量指标引入到微观节点层面得到求解时把t时刻节点i与其他节点相对于t-1时刻新增的连边作为测试集合,节点i与t时刻网络中其他节点之间不存在的连边构成不存在边集合。
本发明有助于及时发现社会网络中的异常事件,引导社会网络健康演化,避免恶性群体事件的发生。
附图说明
图1是本发明实施例的IndexEvent方法框架;
图2是本发明实施例的相似性指标对应的衡量指标值随时间步变化图(时间步单位:秒)。
具体实施方式
以下结合附图和实施例详细说明本发明技术方案。为了检测网络事件,量化事件对社会网络演化产生的影响,本发明提出了一种混合指标群智能方法IndexEvent,利用最佳权重算法OWA来确定当前时段网络的最佳混合指标,然后通过基于AUC或基于mAUC的网络波动检测算法FDA检测事件。
IndexEvent方法框架如图1所示,它包含算法OWA和FDA:
算法OWA:
基于相似性指标的链路预测方法是一种简约高效的方法,目前已有许多节点相似指标被提出,常见相似性指标及其计算方法如1所示。
表1常见的相似性指标
通过相似性指标计算出的两个节点之间相似性得分越大,它们之间存在连边的可能性越大。其中,S(i,j)表示节点i与节点j的相似性得分,Γ(i)表示节点i的邻居所组成的集合,节点i的度为k(i)=|Γ(i)|。Γ(t)表示t时刻网络节点集合,Nt表示Γ(t)中的节点数目。一个真实网络的演化往往交杂多种网络演化机制,基于一种相似性指标的链路预测算法很难能全面的刻画真实网络的演化。为了更全面的刻画真实网络的演化,本发明基于现有的节点相似性指标提出了一种混合指标的概念,称为MixSimIndex。用式(1)表示如下:
M i x S i m I n d e x = &Sigma; m = 1 n w m &times; SimIndex m , SimIndex m &Element; &phi; , &Sigma; m = 1 n w m = 1 - - - ( 1 )
SimIndexm是特定的相似性指标,称为MixSimIndex的单位指标。wm为对应的单位指标SimIndexm的权重。n是所选定的相似性指标的数目,即单位指标的数目。φ代表相似性指标集合,以后研究中提出的新的相似性指标也可以不断加入该集合中。单位指标都源于集合φ。本发明中集合φ只考虑表1中所示的8种相似性指标。例如,MixSimIndex=0.7×AA+0.1×SA+0.2×CN,基于MixSimIndex可计算节点对i和j的相似性得分,为
同时由式(1)可知,独立的相似性指标(如表1中CN,JA,PA,SO,AA,HPI,SA,LNH等)属于MixSimIndex的特例。例如集合φ中只有CN被选作为单位指标,则CN的权重一定是1,MixSimIndex=CN,此时混合指标就等同于独立的相似性指标。
AUC是最常用的一种衡量指标,它从整体上衡量算法的精度。本发明选取AUC是作为衡量指标,它的定义用式(2)表示:
A U C = n &prime; + 0.5 n &prime; &prime; n - - - ( 2 )
n表示比较的次数,n'表示从测试集中随机选择边的得分大于从不存在边构成集合中随机选择边的得分的次数,n"表示相等的次数。AUC反映了链路预测算法的预测精度,值越大说明所对应的指标越好,越符合当前的网络演化机制。当所有节点对的得分是随机产生的,则理想情况下AUC=0.5。当AUC>0.5时才能表明相似性指标的有效性,所以本发明规定φ中满足AUC大于0.5的相似性指标才能被选为单位指标。
Watts和Strogatz提出了著名的WS小世界网络,它介于规则网络和随机网络之间。为了更好的解释混合指标,本发明构造WS小世界网络实例:生成200个节点,每个节点有4个近邻居,以0.3的概率随机化重连边。所构造实例特性如表2所示。
表2构造的WS小世界网络特性
利用表2中的相似性指标对所构造的WS小世界网络实例进行链路预测,当前网络存在的所有的边作为测试集合,当前网络所有节点间不存在的边构成不存在边集合。同时由于所构建的WS小世界网规模较小,为了更好的说明混合指标的有效性,本发明将测试集和不存在边集合中的所有边都进行一一比较,防止边选取时的随机性导致AUC的波动。基于表1中各相似性指标链路预测算法对应的AUC值比较见表3。
表3常见相似性指标AUC
由于表3中的8种相似性指标的AUC值都大于0.5,所以本发明可以灵活选取一定数目的指标作为混合指标的单位指标。以单位指标组合AA和HPI,CN和PA为例,如表4所示,当MixSimIndex为0.5×AA+0.5×HPI和0.9×CN+0.1×PA时,它们得到AUC值都高于表3中8个独立指标。但是当MixSimIndex为0.1×AA+0.9×HPI时的AUC值低于单独相似性指标AA的AUC值,当MixSimIndex为0.1×CN+0.9×PA时的AUC值低于表3中8个单独相似性指标。由表4可知,混合指标的存在是有意义的。但并不是所有的混合指标都能取得比常见独立相似性指标更高的链路预测精度,只有当混合指标中的单位指标被赋予合适权重的情况下,才能取得比独立相似性指标更高的链路预测精度。
表4混合指标AUC值举例
算法OWA可以自动计算各单位指标的合适权重,快速高效确定最佳的混合指标,避免了考虑单位指标数量级的差异。对于本发明采用的衡量指标AUC,最佳混合指标的单位指标只需要满足AUC值大于0.5。当有多个相似性指标都满足单位指标的要求时,可以把所有满足条件的指标都作为MixSimIndex的单位指标。当OWA迭代足够多次数的情况下,不利于AUC值提升的单位指标的权重会被确定为0。但实际操作中可适当选取一定数目满足条件的相似性指标作为单位指标,比如简单选取AUC值最大的两个相似性指标,时间复杂度可由O(n×m×gmax)降低到O(2×m×gmax),这会有效的提升OWA的效率。
量子信息的基本存储单元是量子比特,|0>和|1>表示一个量子比特的两种极化状态。量子比特状态可表示为Pic|0>+Pisβ|1>,Pic和Pis分别表示量子位状态|0>和|1>的概率幅。本发明提出基于QPSO的算法OWA快速确定混合指标中各单位指标的最佳权重,生成最佳混合指标。
假设已确定最佳混合指标中的有n单位指标SimIndex1,SimIndex2,….,SimIndexn,它们各自对应的权重为w1,w2,….,wn,可组成权重数组W=(w1,w2,....,wn)。fitness(MixSimIndex(W))表示权重数组W对应的混合指标的适应度值,即在权重数组W=(w1,w2,....,wn)对应的混合指标上进行链路预测最终得到的衡量指标值。适应度值越大,则表示权重数组W生成的混合指标越优秀。算法OWA具体可分为三个步骤。
(1)产生携带权重数组的初始量子粒子群:量子粒子群中每个量子态粒子编码方式如式(3)所示。
其中θij=2π×rnd,rnd为(0,1)之间的随机数;i=1,2,...,m,j=1,2,...,n,m是量子粒子群中粒子数目,粒子数目越多越能增加初始化时权重数组的差异性。n表示最佳混合指标中的有n单位指标。每个量子态粒子占据的两个位置分别对应于概率幅Pis和Pic,可用式(4)和式(5)表示。
Pis=(sin(θi1),sin(θi2),···,sin(θin)) (4)
Pic=(cos(θi1),cos(θi2),···,cos(θin)) (5)
每个量子态粒子的概率幅Pis和Pic可以通过式(6)和式(7)转化为对应的权重数组Wis和Wic。W可以取值为Wis或Wic
W i s = s i n ( &theta; i 1 ) &Sigma; m = 1 n s i n ( &theta; i m ) , s i n ( &theta; i 2 ) &Sigma; m = 1 n s i n ( &theta; i m ) , ... , s i n ( &theta; i n ) &Sigma; m = 1 n s i n ( &theta; i m ) - - - ( 6 )
W i c = cos ( &theta; i 1 ) &Sigma; m = 1 n cos ( &theta; i m ) , cos ( &theta; i 2 ) &Sigma; m = 1 n cos ( &theta; i m ) , ... , cos ( &theta; i n ) &Sigma; m = 1 n cos ( &theta; i m ) - - - ( 7 )
(2)权重数组更新:权重数组的更新是由概率幅Pis和Pic的更新实现的。每次迭代,都将Pis和Pic通过式(8)得到然后实现更新,继续进行下次迭代。
P &OverBar; i c = ( c o s ( &theta; i 1 ( t ) + &Delta;&theta; n ( t + 1 ) ) , ... , c o s ( &theta; i n ( t ) + &Delta;&theta; i n ( t + 1 ) ) ) P &OverBar; i c = ( s i n ( &theta; i 1 ( t ) + &Delta;&theta; i 1 ( t + 1 ) ) , ... , s i n ( &theta; i n ( t ) + &Delta;&theta; i n ( t + 1 ) ) ) - - - ( 8 )
其中:
△θij(t+1)=w△θij(t)+c1r1(△θl)+c2r2(△θg),
(3)权重数组变异处理:原始的PSO算法易陷入混合指标局部最优,主要原因在于搜索过程中权重数组的多样性的丢失。算法OWA借助量子非门实现变异操作来避免多样性丢失。设权重数组变异概率为pm,在(0,1)之间随机生成rndi,如果rndi<pm,则随机选择该量子态粒子上个量子比特通过式(9)进行变异操作。
0 1 0 1 c o s ( &theta; i j ) s i n ( &theta; i j ) = s i n ( &theta; i j ) c o s ( &theta; i j ) = c o s ( &pi; 2 - &theta; i j ) s i n ( &pi; 2 - &theta; i j ) - - - ( 9 )
设有m个量子态粒子共经历了gmax次迭代优化。Pil对应的权重数组Wil,为粒子i当前搜索到的适应度值最高的权重数组。Pg对应的权重数组为Wg,为整个粒子群当前搜索到的适应度值最大的权重数组。
OWA具体实现如下。
算法OWA可以自动计算各单位指标的合适权重,快速高效确定最佳的混合指标,避免了考虑单位指标数量级的差异。对于本发明采用的衡量指标AUC,最佳混合指标的单位指标只需要满足AUC值大于0.5。当有多个相似性指标都满足单位指标的要求时,可以把所有满足条件的指标都作为MixSimIndex的单位指标。当OWA迭代足够多次数的情况下,不利于AUC值提升的单位指标的权重会被确定为0。但实际操作中可适当选取一定数目满足条件的相似性指标作为单位指标,比如简单选取AUC值最大的两个相似性指标,时间复杂度可由O(n×m×gmax)降低到O(2×m×gmax),这会有效的提升OWA的效率。
FDA算法:
给定的网络G在t时刻的网络快照可用gt表示,假设现有网络G的n个快照构成集合{g1,g2,...,gt,…,gn},每两个相邻快照之间的时间间隔是一致的。OWA已经能在给定网络快照的情况下,高效确定当前时段的最佳混合指标。基于最佳混合指标的链路预测算法,能取得最好的链路预测效果(最高的衡量指标值)。因为网络演化机制与链路预测算法具有内在的一致性,所以基于最佳混合指标的链路预测算法最符合当前网络的演化机制。正常情况下,当前网络的演化机制会在一段时间内保持一定程度的稳定,所以基于当前最佳混合指标的链路预测算法会在一段时间内取得较高的衡量指标值。当某时刻最佳混合指标的衡量指标值发生了显著的下降,可以猜测发生了网络事件,扰乱了网络的内在演化机制,造成衡量指标值下降。
比如基于网络快照gt得到t时刻的最佳混合指标,表示为BMixSimIndext。如果没有网络事件发生,基于BMixSimIndext的链路预测算法应该在后续的t+1和t+2时刻对应的网络快照gt+1,gt+2上仍取得较高的AUC值。如果基于BMixSimIndext的链路预测算法在网络快照gt+1上保持着较高的AUC值,在网络快照gt+2上AUC值明显下降,可以推测t+1到t+2时段发生了网络事件,扰乱了网络内在的演化机制,导致BMixSimIndext不再符合t+1到t+2时段网络演化机制,所以基于BMixSimIndext的链路预测算法不能在网络快照gt+2取得较高的AUC值。
Barabási与Albert基于优先连接的网络演化机制提出了著名的BA无标度模型。为了更好的解释链路预测衡量指标变动与网络演化波动的一致性,本发明构建BA网络实例N1和加入事件的BA网络实例N2。N1构造步骤如下:(1)初始网络为空,第1个时间步加入一个节点;(2)从第2个时间步开始,每次加入1个新节点,并且每个新节点优先与现有的度最大的节点构成一条边;(3)迭代200个时间步后停止。N2构造步骤如下:(1)正常网络演化阶段:第1个时间步加入一个节点。从第2个时间步开始,每次加入1个新节点,并且每个新节点优先与现有的度最大的节点构成一条边。迭代120个时间步后停止。(2)网络事件发生阶段:从121开始到159个时间步,每次加入1个新节点,并且每个新节点随机的与现有节点构成一条边。(3)网络演化恢复正常阶段:从160开始到200个时间步,每次加入1个新节点,每个新节点再次优先与现有的度最大的节点构成一条边。
网络N1和N2的区别在于,N2从121到159个时间步中采用了不同于N1的演化机制来模仿网络事件的发生。AUCt表示基于t时刻的网络快照gt进行链路预测得到的AUC值t时刻网络快照gt相对于t-1时刻网络快照gt-1新增加的边构成测试边集合,t时刻节点之间不存在的边构成不存在边集合。
为了检测出121到159发生的网络事件,对于网络N1和N2作如下探究:
(1)在正常网络演化阶段第120个时间步结束时,N1和N2的网络快照一样,它们各相似性指标的AUC120值相同,如表5所示。
表5常见相似性指标AUC120
表5中所有相似性指标中只有PA的AUC值超过0.5,所以只能选取PA作为最佳混合指标的单位指标,则PA的权重一定为1,第120个时间步结束时当前网络的最佳混合指标BMixSimIndex120=PA。
(2)每隔20个时间步,利用衡量指标AUC评价基于BMixSimIndex120=PA和表1中各相似性指标的链路预测算法效果,它们的AUC值如图1所示。由于SA,JA,SO,HPI,LNH与CN,AA有近乎相似的曲线,所以为了让图2更清晰,只有CN,AA指标被选取展示。PA在无事件发生的网络N1和发生事件的网络N2上的变化都在图2中进行了展示。
从图2可得出如下结论:
(1)当选取正确的相似性指标(AUC值大于0.5)时,链路预测衡量指标变动与网络演化波动的具有一致性。对于上述N2网络的例子,PA(BMixSimIndex120)可以很好的通过其AUC值变动,反映网络演化波动。但是SA,JA,SO,HPI,LNH,CN和AA一直没太大变化,无法反映网络演化波动。PA指标对应的AUC值在正常网络演化阶段(第1至第120时间步)一直高于0.7,但是在网络事件发生阶段(第121至第159时间步),由于网络内在演化机制发生了改变(每个新节点优先与现有的度最大的节点构成一条边变成每个新节点随机的与现有节点构成一条边),PA对应的AUC值迅速下降,远低于0.7。在网络演化恢复正常阶段(第160至第200个时间步),PA对应的AUC值才逐渐提升。对于没有事件发生的N2而言,它的最佳混合指标BMixSimIndex120=PA的衡量指标值一直保持高于0.7。
(2)通过最佳混合指标对应的衡量指标可以很好地进行网络事件检测。基于最佳混合指标BMixSimIndex120=PA,可以很好的反映N2的网络事件发生阶段和正常网。
本发明进一步提出了算法FDA,来有效避免非事件引起的网络正常波动带来的干扰,发现事件引起的异常网络波动,进行事件检测。假设现有网络快照集{g1,g2,...,gt,…,gn},Mt代表t时刻的网络演化波动的评价值。
△t表示记忆时间。t时刻的网络演化波动值Mt是由AUCt与AUCt-1至AUCt-△t平均值的差值的决定。当多个事件引起连续的网络波动时,△t应设置较小值来避免事件间的相互干扰。当△t=0时,此时Mt=AUCt,相当于t时刻网络演化波动的评价值直接由t时刻链路预测的AUC值来表示。
MD为事件检测阀值,可以根据需求来灵活设置。当Mt>MD时,则认为t时刻的网络演化发生了显著异常波动,很可能发生了事件。设置放大系数A,通过式(15)对网络演化波动序列(M1,M2,…,Mt,...,Mn)中的异常波动进行放大处理,得到事件检测序列(F1,F2,…,Ft,...,FT)。Ft是通过对Mt放大处理后得到的t时刻的网络事件检测值。Ft可以为负数值,值越小,表明此时的网络演化波动越大,发生事件的可能性越大。事件检测序列(F1,F2,…,Ft,...,FT)相对于网络演化波动序列(M1,M2,…,Mt,...,MT),能更好的区分非事件引起的网络正常波动和事件引起的异常波动。
F t = A &times; M t , M t < M D M t , M t > = M D - - - ( 15 )
定义时刻TO为网络检测稳定点,一般可选取前后网络演化没有明显波动的时刻作为TO。事件检测阀值MD,网络检测稳定点TO,放大系数A可人为设置,增强了算法的灵活性。一种基于AUC的算法FDA表示如下。
式(14)是基于衡量指标AUC提出的。然而衡量指标AUC只是宏观上评价整体网络演化波动,并没有考虑的微观上每个节点演化的差异。实际上,如果节点周围拓扑结构变化符合网络演化规律,可以看做节点是正常演化,其对网络演化波动影响较小。如果节点周围拓扑结构变化不符合演化规律,极有可能是事件发生导致内在演化规律被打破。考虑节点的微观演化有助于更精准全面的量化网络演化波动,进一步避免非事件引起的网络正常波动的干扰。于是本发明进一步提出一种考虑了节点微观演化的衡量指标mAUC,对宏观的AUC值进行了调整。
将链路预测衡量指标引入到微观节点层面得到求解时把t时刻节点i与其他节点相对于t-1时刻新增的连边作为测试集合,节点i与t时刻网络中其他节点之间不存在的连边构成不存在边集合。Γ(t)表示t时刻网络节点集合,Nt表示Γ(t)中的节点数目。
用式(16)和式(17)表示如下。
mAUC t = ( &Sigma; i &Element; &Gamma; ( T ) AUC i t N t ) &times; AUC t - - - ( 16 )
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (10)

1.一种社会网络事件检测的混合指标量子群智能方法,针对社会网络数据集,利用事件检测方法IndexEvent依次对各时间段的演化波动进行定量评价,通过评价结果去检测网络事件的发生;其特征在于:所述事件检测方法IndexEvent依次对各时间段的演化波动进行定量评价,其具体实现包括以下步骤:
步骤1:利用OWA算法,确定最佳混合指标;其具体实现包括以下子步骤;
步骤1.1:选定衡量指标;
步骤1.2:确定最佳混合指标的单位指标;
步骤1.3:产生携带权重数组的初始量子粒子群;
步骤1.4:权重数组更新;
步骤1.5:权重数组变异处理,确定最佳混合指标并输出;
步骤2:利用FDA算法,量化不同时刻网络演化波动;其具体实现包括以下子步骤;
步骤2.1:从网络演化稳定的时刻中选取网络检测稳定点TO;
步骤2.2:基于TO时的网络快照,通过OWA算法得到TO时最佳混合指标BMixSimIndexTO
步骤2.3:针对现有网络快照集{g1,g2,...,gt,…,gn},循环迭代求t时刻的网络演化波动的评价值Mt
步骤2.4:通过对Mt放大处理后得到的t时刻的网络事件检测值Ft,输出事件检测序列(F1,F2,…,Ft,...,FT)。
2.根据权利要求1所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤1.1中所述选定衡量指标,为一种混合指标MixSimIndex,用式(1)表示如下:
M i x S i m I n d e x = &Sigma; m = 1 n w m &times; SimIndex m , SimIndex m &Element; &phi; , &Sigma; m = 1 n w m = 1 - - - ( 1 )
其中,SimIndexm是特定的相似性指标,称为MixSimIndex的单位指标;wm为对应的单位指标SimIndexm的权重,权重数组W=(w1,w2,...,wt,...wT);n是所选定的相似性指标的数目,即单位指标的数目;单位指标都源于集合φ,集合φ包括表1中所示的8种相似性指标;
表1 相似性指标
其中,S(i,j)表示节点i与节点j的相似性得分,Γ(i)表示节点i的邻居所组成的集合,节点i的度为k(i)=|Γ(i)|。
3.根据权利要求2所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤1.2中所述确定最佳混合指标的单位指标,是选取AUC是作为衡量指标,它的定义用式(2)表示:
A U C = n &prime; + 0.5 n &prime; &prime; n - - - ( 2 )
n表示比较的次数,n'表示从测试集中随机选择边的得分大于从不存在边构成集合中随机选择边的得分的次数,n"表示相等的次数;集合φ中满足AUC大于0.5的相似性指标被选为单位指标。
4.根据权利要求2所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤1.3中所述产生携带权重数组的初始量子粒子群,量子粒子群中每个量子态粒子编码方式如式(3)所示:
P i = &lsqb; | c o s ( &theta; i 1 ) s i n ( &theta; i 1 ) | c o s ( &theta; i 2 ) s i n ( &theta; i 2 ) | ... ... | c o s ( &theta; i n ) s i n ( &theta; i n ) | &rsqb; - - - ( 3 )
其中θij=2π×rnd,rnd为(0,1)之间的随机数;i=1,2,...,m,j=1,2,...,n,m是量子粒子群中粒子数目,n表示最佳混合指标中的有n单位指标;
每个量子态粒子占据的两个位置分别对应于概率幅Pis和Pic,用式(4)和式(5)表示。
Pis=(sin(θi1),sin(θi2),···,sin(θin)) (4)
Pic=(cos(θi1),cos(θi2),···,cos(θin)) (5)
每个量子态粒子的概率幅Pis和Pic通过式(6)和式(7)转化为对应的权重数组Wis和Wic
W i s = ( sin ( &theta; i 1 ) &Sigma; m = 1 n sin ( &theta; i m ) , sin ( &theta; i 2 ) &Sigma; m = 1 n sin ( &theta; i m ) , .... , sin ( &theta; i n ) &Sigma; m = 1 n sin ( &theta; i m ) ) - - - ( 6 )
W i c = ( c o s ( &theta; i 1 ) &Sigma; m = 1 n cos ( &theta; i m ) , c o s ( &theta; i 2 ) &Sigma; m = 1 n c o s ( &theta; i m ) , .... , c o s ( &theta; i n ) &Sigma; m = 1 n cos ( &theta; i m ) ) - - - ( 7 )
权重数组W值为Wis或Wic
5.根据权利要求4所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤1.4中所述权重数组更新是由概率幅Pis和Pic的更新实现的,每次迭代,都将Pis和Pic通过式(8)得到然后实现更新,继续进行下次迭代;
P &OverBar; i c = ( c o s ( &theta; i 1 ( t ) + &Delta;&theta; i 1 ( t + 1 ) ) , ... , c o s ( &theta; i n ( t ) + &Delta;&theta; i n ( t + 1 ) ) )
P &OverBar; i c = ( s i n ( &theta; i 1 ( t ) + &Delta;&theta; i 1 ( t + 1 ) ) , ... , s i n ( &theta; i n ( t ) + &Delta;&theta; i n ( t + 1 ) ) ) - - - ( 8 )
其中
&Delta;&theta; i j ( t + 1 ) = w&Delta;&theta; i j ( t ) + c 1 r 1 ( &Delta;&theta; l ) + c 2 r 2 ( &Delta;&theta; g ) , &Delta;&theta; l = 2 &pi; + &theta; i l j + &theta; i j ( &theta; i l j - &theta; i j < - &pi; ) &theta; i l j - &theta; i j ( - &pi; &le; &theta; i l j - &theta; i j &le; &pi; ) &theta; i l j - &theta; i j - 2 &pi; ( &theta; i l j - &theta; i j > &pi; ) , &Delta;&theta; g = 2 &pi; + &theta; g j + &theta; i j ( &theta; g j - &theta; i j < - &pi; ) &theta; g j - &theta; i j ( - &pi; &le; &theta; g j - &theta; i j &le; &pi; ) &theta; g j - &theta; i j - 2 &pi; ( &theta; g j - &theta; i j > &pi; ) .
6.根据权利要求5所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤1.4中所述权重数组变异处理,其具体实现过程是,设权重数组变异概率为pm,在(0,1)之间随机生成rndi,如果rndi<pm,则随机选择该量子态粒子上个量子比特通过式(9)进行变异操作;
0 1 0 1 c o s ( &theta; i j ) s i n ( &theta; i j ) = s i n ( &theta; i j ) c o s ( &theta; i j ) = c o s ( &pi; 2 - &theta; i j ) s i n ( &pi; 2 - &theta; i j ) - - - ( 9 )
设有m个量子态粒子共经历了gmax次迭代优化,Pil对应的权重数组Wil,为粒子i当前搜索到的适应度值最高的权重数组;Pg对应的权重数组为Wg,为整个粒子群当前搜索到的适应度值最大的权重数组;Pg通过式(6)或者式(7)转换为对应的权重数组,确定最佳混合指标并输出。
7.根据权利要求1所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤2.1中所述网络检测稳定点TO,是选取网络中没有事件发生的检测稳定点TO。
8.根据权利要求2所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤2.3中所述求t时刻的网络演化波动的评价值Mt,其公式为:
其中,Δt表示记忆时间;AUCt与AUCt-1分别表示基于t和t-1时刻的网络求出的AUC值;t时刻的网络演化波动值Mt是由AUCt与AUCt-1至AUCt-Δt平均值的差值的决定。
9.根据权利要求8所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤2.4中所述通过对Mt放大处理后得到的t时刻的网络事件检测值Ft,其公式为:
F t = A &times; M t , M t < M D M t , M t > = M D - - - ( 15 )
其中,MD为事件检测阀值,根据需求设置;A为放大系数;
通过式(15)对网络演化波动序列(M1,M2,…,Mt,...,Mn)中的异常波动进行放大处理,得到事件检测序列(F1,F2,…,Ft,...,FT),Ft可以为负数值,值越小,表明此时的网络演化波动越大,发生事件的可能性越大。
10.根据权利要求8任意一项所述的社会网络事件检测的混合指标量子群智能方法,其特征在于:步骤2.3中所述求t时刻的网络演化波动的评价值Mt,其公式为:
mAUC t = ( &Sigma; i &Element; &Gamma; ( T ) AUC i t N t ) &times; AUC t - - - ( 16 )
将链路预测衡量指标引入到微观节点层面得到求解时把t时刻节点i与其他节点相对于t-1时刻新增的连边作为测试集合,节点i与t时刻网络中其他节点之间不存在的连边构成不存在边集合。
CN201610375108.8A 2016-05-31 2016-05-31 一种社会网络事件检测的混合指标量子群智能方法 Pending CN106067140A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610375108.8A CN106067140A (zh) 2016-05-31 2016-05-31 一种社会网络事件检测的混合指标量子群智能方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610375108.8A CN106067140A (zh) 2016-05-31 2016-05-31 一种社会网络事件检测的混合指标量子群智能方法

Publications (1)

Publication Number Publication Date
CN106067140A true CN106067140A (zh) 2016-11-02

Family

ID=57420129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610375108.8A Pending CN106067140A (zh) 2016-05-31 2016-05-31 一种社会网络事件检测的混合指标量子群智能方法

Country Status (1)

Country Link
CN (1) CN106067140A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107705212A (zh) * 2017-07-07 2018-02-16 江苏开放大学 一种基于粒子群随机游走的角色识别方法
CN108446429A (zh) * 2018-02-05 2018-08-24 电子科技大学 一种应用于pic静电模型的粒子受力有限元求解算法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107705212A (zh) * 2017-07-07 2018-02-16 江苏开放大学 一种基于粒子群随机游走的角色识别方法
CN107705212B (zh) * 2017-07-07 2021-06-15 江苏开放大学 一种基于粒子群随机游走的角色识别方法
CN108446429A (zh) * 2018-02-05 2018-08-24 电子科技大学 一种应用于pic静电模型的粒子受力有限元求解算法

Similar Documents

Publication Publication Date Title
Li et al. A hybrid model based on synchronous optimisation for multi-step short-term wind speed forecasting
CN106168799B (zh) 一种基于大数据机器学习进行电动汽车电池预测性维护的方法
Nabil et al. Deep recurrent electricity theft detection in AMI networks with random tuning of hyper-parameters
Amjady et al. Short-term wind power forecasting using ridgelet neural network
Sturaro et al. A realistic model for failure propagation in interdependent cyber-physical systems
McConnell et al. A distributed approach for prediction in sensor networks
Donate et al. Time series forecasting. A comparative study between an evolving artificial neural networks system and statistical methods
Rendsburg et al. Netgan without gan: From random walks to low-rank approximations
Carmona et al. MEFES: an evolutionary proposal for the detection of exceptions in subgroup discovery. An application to concentrating photovoltaic technology
US11197175B2 (en) Forcasting time series data
Oliveira et al. Applying particle swarm optimization algorithm for tuning a neuro-fuzzy inference system for sensor monitoring
CN106067140A (zh) 一种社会网络事件检测的混合指标量子群智能方法
Sultana et al. Salp swarm-artificial neural network based cyber-attack detection in smart grid
Liu et al. Event-based distributed secondary voltage tracking control of microgrids under DoS attacks
Celik et al. An improved marriage in honey bees optimization algorithm for single objective unconstrained optimization
Khomami et al. Utilizing cellular learning automata for finding communities in weighted networks
Elnour et al. A Machine Learning Based Framework For Real-time Detection and Mitigation of Sensor False Data Injection Cyber-Physical Attacks in Industrial Control Systems
Fatima et al. Machine learning for power outage prediction during hurricanes: An extensive review
Tian et al. Causal network construction based on convergent cross mapping (CCM) for alarm system root cause tracing of nonlinear industrial process
Peña et al. A synthesis of structural equation model-analytical hierarchy process, nonlinear autoregressive and backpropagation neural network-sensitivity analysis for construction and demolition waste assessment in the Philippines
Patel et al. Forecasting nonstationary wind data using adaptive min-max normalization
Jiang et al. Learning instance greedily cloning naive Bayes for ranking
Alshahrani et al. A Transfer Learning Approach to Discover IDS Configurations Using Deep Neural Networks
Salehkaleybar et al. Identifying nonlinear 1-step causal influences in presence of latent variables
CN109740931A (zh) 一种用于进行水质评价的解耦合参评模型获取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161102

RJ01 Rejection of invention patent application after publication