CN104050245B - 一种基于活跃度的社交网络影响力最大化方法 - Google Patents

一种基于活跃度的社交网络影响力最大化方法 Download PDF

Info

Publication number
CN104050245B
CN104050245B CN201410243677.8A CN201410243677A CN104050245B CN 104050245 B CN104050245 B CN 104050245B CN 201410243677 A CN201410243677 A CN 201410243677A CN 104050245 B CN104050245 B CN 104050245B
Authority
CN
China
Prior art keywords
node
liveness
act
influence power
mrow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410243677.8A
Other languages
English (en)
Other versions
CN104050245A (zh
Inventor
周莲英
朱锋
郭远
郑吉�
喻志浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN201410243677.8A priority Critical patent/CN104050245B/zh
Publication of CN104050245A publication Critical patent/CN104050245A/zh
Application granted granted Critical
Publication of CN104050245B publication Critical patent/CN104050245B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于活跃度的社交网络影响力最大化方法,包括如下步骤:构建精简网络G′;根据节点活跃度ACT属性,选取活跃度ACT属性值高的节点进入ACT节点集H;依据节点活跃度ACT属性值与影响力大小,计算节点影响力综合值aps(v);循环选取k个种子节点,每选取出一个种子节点都要更新网络中节点影响力综合值aps(v)。结果表明,基于IC模型引入了活跃度属性,模型的扩展使社交网络影响力最大化问题更科学,ACH算法在影响范围上接近KK贪婪算法的影响范围,并且在时效性上有非常好的表现。

Description

一种基于活跃度的社交网络影响力最大化方法
技术领域
本发明属于计算机信息技术应用领域,涉及社交网络影响力最大化技术,具体为一种基于活跃度的社交网络影响力最大化种子节点选择方法。
背景技术
社交网络由海量的用户及用户间复杂的关系(包括亲属关系,朋友关系,同学关系,工作关系等)所组成,不同于传统网络,社交网络中信息的传播与扩散依赖于用户间的关系。如何使信息在网络中能被尽可能多的用户所接收,即社交网络影响力最大化问题,为当前社交网络及其应用研究热点。Richardson,M.在文献《Mining knowledge-sharingsites for viral marketing》、以及Domingos,P.在《Mining the network value ofcustomers》中均将这一问题归纳为一社交网络影响力最大化算法设计问题,即在社交网络中如何选择K个最具传播影响力的初始节点,通过迭代,使得信息在整个网络中的传播最大化。
目前,研究者所提出的相应算法包括两大类,一类是影响范围接近最优的贪婪爬山算法,另一类是时效性优越的启发式算法;相对而言,由于启发式算法能更好的适应大型社交网络,为当前研究的主要方向。现有启发式算法所基于的影响力传播模型有两种,分别为独立级联(IC)模型和线性阈值(LT)模型,其中IC模型,为算法主要使用的模型,激活规则是传播模型的核心。IC模型中所采用的激活规则认为,在邻居节点被激活的概率为p(u,v)的状态下,处于激活状态的节点会100%自发地向邻居节点执行激活行为。
然而,由实际分析可知,初始节点的选择效果取决于两方面,首先是如何定义节点影响力,其次算法执行效果影响也很大。现有研究常用的独立级联(IC)信息传播模型,一般基于节点邻居节点的数量和节点对邻居节点的激活概率这两个属性计算节点影响力,不难分析,该计算方法存在两个问题:第一个在于徒有影响力的用户,即部分影响力很高的用户,由于自身活跃度低,并没有真正发挥影响力来传递信息,这些徒有影响力的节点不应该入选种子节点集;第二个问题在于传递力有限的激活用户,传统IC模型中认为激活状态的节点就会100%地对其邻居节点执行再激活行为,但事实是激活用户的再激活力远低于100%,这个关系到整个传播过程在何时结束。
发明内容
本发明的目的是进一步优化社交网络影响力最大化算法的时效性与实际影响范围。实现本发明目的的基本技术思路是提供一种基于活跃度的社交网络影响力最大化算法。
具体技术方案包括:
一种基于活跃度的社交网络影响力最大化方法,包括如下步骤:
1)构建精简网络G′;
2)根据节点活跃度ACT属性,选取活跃度ACT属性值高的节点进入ACT节点集H;
3)依据节点活跃度ACT属性值与影响力大小,计算节点影响力综合值aps(v);
4)循环选取k个种子节点,每选取出一个种子节点都要更新网络中节点影响力综合值aps(v)。
进一步,所述步骤2)中选取活跃度ACT属性值的过程,采用节点出度来产生一个0~1之间的随机数的方式,在基于活跃度的独立级联模型AIC中,根据节点间活跃度ACT(ACT∈[0,1])的不同,处于激活状态的节点是否去激活邻居节点的概率也不同,如果活跃度越高,那么去激活邻居节点的概率也越高,反之则越低。
进一步,所述步骤3)的具体过程为:首先对于活跃度ACT节点集中的每一个节点做遍历;然后综合考虑节点的ACT属性值与影响力大小,节点综合影响力定义如下:
其中ACTv为节点v的活跃度属性值,dv为节点v的出度,N(v)为节点v的邻居节点集,节点u∈N(v)为节点v的邻居节点,p(v,u)为节点v的邻居节点被节点v激活的概率。
进一步,所述步骤4)中当一个节点被选择作为种子节点时,还需要进行如下操作步骤:
a)模拟这个节点的影响力传播过程,并对传播过程中的边做标记;
b)更新网络节点与节点间的边;
c)更新节点出度;
d)更新节点影响力综合值aps(v)。
最后,所述步骤4)中在挑选aps(v)最大值的节点作为种子节点时还需要考虑节点v的邻居节点u的ACT属性值。
本发明的有益效果是:
1)基于IC模型引入了活跃度属性,模型的扩展使社交网络影响力最大化问题更科学。
2)ACH算法在影响范围上接近KK贪婪算法的影响范围,并且在时效性上有非常好的表现。
附图说明
图1为本发明的ACH方法流程图;
图2数据集Epinions上的种子节点集质量对比图;
图3DBLP上的种子节点集质量对比图。
具体实施方式
下面结合附图对本发明的具体实施方式进一步说明。
如图1所示,基于活跃度的社交网络影响力最大化方法的实施步骤如下:
1)构建精简网络G′;
2)根据节点活跃度ACT属性,选取活跃度ACT属性值高的节点进入ACT节点集H;
3)依据节点活跃度ACT属性值与影响力大小,计算节点影响力综合值aps(v);
4)循环选取k个种子节点,每选取出一个种子节点都要更新网络中节点影响力综合值aps(v)。
下面进一步就上述4个步骤的具体情况进行详细介绍。
首先是AIC模型的描述,AIC模型代指基于活跃度的IC模型,即基于活跃度的独立级联模型。AIC模型中的活跃度ACT属性值的生成过程是采用根据节点出度来产生一个0~1之间的随机数的方式,在70%的情况下是ACT值与节点出度成正比,30%情况下ACT值与节点出度成反比,即大部分情况下可认为节点影响力越大,节点活跃度也越高,但是也有部分情况是影响力较大的节点活跃度却很低。由此可以模拟出现实情况中影响力不发挥的情况。
在AIC模型中,每一条边(u,v)∈E(u,v∈V),p(u,v)代表节点u和激活节点v的概率(p(u,v)∈[0,1],若则p(u,v)=0)。AIC模型中的影响力传播过程也类似于IC模型, 表示在步骤t≥0时网络中被激活的节点集,其中A0=S。在步骤t+1,每一个节点v∈At拥有唯一的一次机会去激活它的邻居节点v,激活概率为p(u,v)。当时,传播过程结束。与IC模型不同的地方是,在AIC模型中根据节点间活跃度ACT(ACT∈[0,1])的不同,处于激活状态的节点是否去激活邻居节点的概率也不同,如果活跃度越高,那么去 激活邻居节点的概率也越高,反之则越低(若ACT=1则100%去激活邻居节点,ACT=0则不会去激活邻居节点),因此,在AIC模型中影响力在传播过程中,当被激活节点的ACT=0时,虽然该节点被激活,但是并不去对邻居节点执行激活行为,因此影响力也不会继续向下传播。需要注意的是IC模型是AIC模型的一个特例,即所有节点ACT=1的情况。两个模型中,处于未激活状态的节点被激活的过程是一致的,不同的是,处于激活状态的节点对邻居节点的激活过程。在ACT模型中,必须首先考虑节点ACT,否则即使该节点的影响力再高也无法发挥其作用。
基于AIC模型,该发明针对节点ACT属性提出了一种启发式算法ACH,算法的主要思想是精简网络,因为传统算法(包括贪婪算法和启发式算法)都是默认遍历网络中的每一个节点进行判断,但是事实上社交网络中的海量节点中只有一部分节点有机会成为种子节点,而且节点间的关系(边)很多对于种子节点的挑选也是无效的(当激活概率过低时,可认为当前节点间的关系是无效的),因此在构建网络拓扑时就可以先对网络中的无效信息(包括无效的节点与节点间的边)进行过滤,这大大降低了网络的大小,从而可以降低计算的时耗。在精简之后的网络G′中,需要考虑节点ACT属性,也就是首先选取ACT属性值高的节点进入ACT节点集H,然后对于ACT节点集中的每一个节点做遍历,综合考虑节点的ACT属性值与影响力大小,节点综合影响力定义如下:
其中ACTv为节点v的活跃度属性值,dv为节点v的出度,N(v)为节点v的邻居节点集,节点u∈N(v)为节点v的邻居节点,p(v,u)为节点v的邻居节点被节点v激活的概率。最后选出综合值aps(v)最高的作为种子节点,计算aps(v)时,也需要考虑节点v的邻居节点u的ACT属性值。当一个节点被选择作为种子节点时,还需要进行如下操作:
首先,模拟这个节点的影响力传播过程,并且对传播过程中的节点间的边(关系)做标记,因为AIC模型中节点间的激活也是有且仅有一次机会;
然后,更新网络节点与节点间的边;经过一次传播之后我们将这些边从网络中删去;
其次,更新节点出度;即更新网络中剩余节点的出度,这样就进一步缩小了选择范围,提高了选择精度;
最后,更新节点影响力综合值aps(v)。
综上所述,在实际操作中,基于活跃度的社交网络影响力最大化方法整体过程的具体实施步骤如下:
1)读取网络,构建G(V,E),并完成节点集S的初始化;
2)构建精简的网络G′;其中dv为节点v的出度,p(v,u)为节点v的邻居节点被节点v激活的概率,θ和β分别是节点出度阈值和激活概率阈值,则:
G′=(V′,E′)
V′={v|v∈V,dv≥θ},E′={(u,v)∈E|p(v,u)≥β}
3)构建ACT节点集H,对节点集H进行初始化,ACTv为节点v的活跃度属性值,γ为ACTv阈值:
H={v∈V′|ACTv≥γ}
4)依据节点ACT值与影响力大小,计算ACT节点集H中节点影响力综合值aps(v):
5)挑选aps(v)最大值的节点作为种子节点,也就是选择综合影响力最高的节点做种子节点:
S=S∪{u}u=argmaxv{aps(v)|v∈H,S}
6)模拟传播过程,并对传播过程中的边作标记:
flag(u,v)=true,(u,v)∈E′
7)更新网络节点与节点间的边:
G′=(V″,E″)
E″={(u,v)∈E′|flag(u,v)≠true}
8)更新节点出度,tv为节点v的出边中被标记的边的数量:
dv=dv-tv
9)更新节点综合值aps(v):
重复4)至9)直到|S|=k,整个选择过程结束。
上述步骤具体算法执行的伪代码程序如表1所示:
表1伪代码程序
图2和图3给出了Greedy、Degree、MIA和ACH四种算法在数据集Epinions和数据集DBLP上的种子节点集质量对比情况,其中数据集Epinions和数据集DBLP的数据统计如表所示:
表2数据集Epinions和数据集DBLP的数据统计表
图2中的X坐标为种子节点集的大小,纵坐标为种子节点集的影响范围,即网络中被节点集S激活的节点数量,它反映了种子节点集的质量。在数据集Epinions上,由于ACH算法针对AIC模型的ACT属性进行了针对性的处理,对于节点综合影响力的计算更加科学,同时实时更新网络中节点综合影响力,而Degree和MIA算法都没有考虑节点的活跃度属性,所以ACH算法得到的种子节点集的质量都要优于Degree和MIA算法,其影响范围基本与Greedy算法的影响范围一致。在规模更大的数据集DBLP也得到了一致的结果,ACH算法得到的种子节点集的质量要优于Degree和MIA算法,其影响范围基本与Greedy算法的影响范围基本上一致。
结合图2以及图3发现,随着种子节点集的增大,在两个数据集上ACH算法相对于MIA算法的优势也越来越明显,这是因为选择少量种子节点时并不能全面的体现算法的性能,当种子节点数量增大后,算法的性能得到更好的表现。在更大规模的数据集DBLP上,ACH算法对于MIA算的优势也更明显,说明ACH算法对更大规模的网络适应能力更强,这是因为ACH算法每选择一个种子节点就会实时更新网络状态,更新状态发生改变的节点的综合影响力,这提高了种子节点的质量。而且由于ACH算法在预处理阶段会精简网络,对于精简的网络还会根据节点活跃度进行优质筛选,种子节点的选择都是在精简后的较小规模的候选节点集中进行,这使ACH算法的性能受网络规模变化的影响较小。即使网络规模变大很多,算法性能依然稳定。

Claims (3)

1.一种基于活跃度的社交网络影响力最大化方法,其特征在于:包括如下步骤:
1)构建精简网络G';
2)根据节点活跃度ACT属性,选取活跃度ACT属性值高的节点进入ACT节点集H;
3)依据节点活跃度ACT属性值与影响力大小,计算节点影响力综合值aps(v);
4)循环选取k个种子节点,每选取出一个种子节点都要更新网络中节点影响力综合值aps(v);
所述步骤2)中选取活跃度ACT属性值的过程,采用节点出度来产生一个0~1之间的随机数的方式,在基于活跃度的独立级联模型AIC中,根据节点间活跃度ACT(ACT∈[0,1])的不同,处于激活状态的节点是否去激活邻居节点的概率也不同,如果活跃度越高,那么去激活邻居节点的概率也越高,反之则越低;
所述步骤3)的具体过程为:首先对于活跃度ACT节点集中的每一个节点做遍历;然后综合考虑节点的ACT属性值与影响力大小,节点综合影响力定义如下:
<mrow> <mi>a</mi> <mi>p</mi> <mi>s</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>ACT</mi> <mi>v</mi> </msub> <mo>*</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>u</mi> <mo>&amp;Element;</mo> <mi>N</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow> </munder> <msub> <mi>d</mi> <mi>v</mi> </msub> <mo>*</mo> <mi>p</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>u</mi> <mo>)</mo> </mrow> <mo>,</mo> <mi>v</mi> <mo>&amp;Element;</mo> <mi>H</mi> </mrow>
其中ACTv为节点v的活跃度属性值,dv为节点v的出度,N(v)为节点v的邻居节点集,节点u∈N(v)为节点v的邻居节点,p(v,u)为节点v的邻居节点被节点v激活的概率。
2.根据权利要求1所述的基于活跃度的社交网络影响力最大化方法,其特征在于:所述步骤4)中当一个节点被选择作为种子节点时,还需要进行如下操作步骤:
a)模拟这个节点的影响力传播过程,并对传播过程中的边做标记;
b)更新网络节点与节点间的边;
c)更新节点出度;
d)更新节点影响力综合值aps(v)。
3.根据权利要求1所述的基于活跃度的社交网络影响力最大化方法,其特征在于:所述步骤4)中在挑选aps(v)最大值的节点作为种子节点时还需要考虑节点v的邻居节点u的ACT属性值。
CN201410243677.8A 2014-06-04 2014-06-04 一种基于活跃度的社交网络影响力最大化方法 Expired - Fee Related CN104050245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410243677.8A CN104050245B (zh) 2014-06-04 2014-06-04 一种基于活跃度的社交网络影响力最大化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410243677.8A CN104050245B (zh) 2014-06-04 2014-06-04 一种基于活跃度的社交网络影响力最大化方法

Publications (2)

Publication Number Publication Date
CN104050245A CN104050245A (zh) 2014-09-17
CN104050245B true CN104050245B (zh) 2018-02-27

Family

ID=51503077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410243677.8A Expired - Fee Related CN104050245B (zh) 2014-06-04 2014-06-04 一种基于活跃度的社交网络影响力最大化方法

Country Status (1)

Country Link
CN (1) CN104050245B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616200B (zh) * 2015-02-11 2017-10-10 中南大学 一种基于节点特性的影响力最大化初始节点选取方法
CN106097108A (zh) * 2016-06-06 2016-11-09 江西理工大学 基于两阶段启发的社交网络影响最大化问题求解方法
CN106933949B (zh) * 2017-01-20 2020-09-11 浙江大学 一种控制社交网络中影响力爆发的规划方法
CN106875281B (zh) * 2017-03-13 2020-12-18 哈尔滨工程大学 基于贪心子图的社会网络节点挖掘激活方法
CN109410078B (zh) * 2018-09-12 2021-09-28 河南理工大学 一种适用于面向文件共享的移动社交网络的信息传播预测方法
CN109460490B (zh) * 2018-09-28 2021-05-04 上海达家迎信息科技有限公司 社交网络中中心顶点的确定方法、装置、设备及存储介质
CN109617871B (zh) * 2018-12-06 2020-04-14 西安电子科技大学 基于社团结构信息和阈值的网络节点免疫方法
CN111695043A (zh) * 2020-06-16 2020-09-22 桂林电子科技大学 一种基于地理区域的社交网络阻塞影响最大化方法
CN115329209A (zh) * 2022-07-18 2022-11-11 齐齐哈尔大学 一种改进K-shell的时序社交网络影响力最大化方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101859315A (zh) * 2010-04-30 2010-10-13 西北工业大学 基于度启发式的社交网络影响力最大化求解方法
CN103064917A (zh) * 2012-12-20 2013-04-24 中国科学院深圳先进技术研究院 一种面向微博的特定倾向的高影响力用户群发现方法
CN103678669A (zh) * 2013-12-25 2014-03-26 福州大学 一种社交网络中的社区影响力评估系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9367879B2 (en) * 2012-09-28 2016-06-14 Microsoft Corporation Determining influence in a network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101859315A (zh) * 2010-04-30 2010-10-13 西北工业大学 基于度启发式的社交网络影响力最大化求解方法
CN103064917A (zh) * 2012-12-20 2013-04-24 中国科学院深圳先进技术研究院 一种面向微博的特定倾向的高影响力用户群发现方法
CN103678669A (zh) * 2013-12-25 2014-03-26 福州大学 一种社交网络中的社区影响力评估系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于微博网络的影响力最大化算法;吴凯 等;《计算机应用》;20130801;第33卷(第8期);第2091-2094页 *
基于话题的学术网络影响力最大化研究;贺人贵;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130715(第07期);I138-1481 *

Also Published As

Publication number Publication date
CN104050245A (zh) 2014-09-17

Similar Documents

Publication Publication Date Title
CN104050245B (zh) 一种基于活跃度的社交网络影响力最大化方法
Tong et al. A survey on algorithms for intelligent computing and smart city applications
CN107784598A (zh) 一种网络社区发现方法
CN108492201B (zh) 一种基于社区结构的社交网络影响力最大化方法
CN106649659B (zh) 一种面向社交网络的链接预测系统及方法
CN104598605B (zh) 一种社交网络中的用户影响力评估方法
CN104361036B (zh) 告警事件关联规则挖掘方法
Kundu et al. Fuzzy-rough community in social networks
CN106951524A (zh) 基于节点影响力的重叠社区发现方法
Lim et al. Energy-efficient chain formation algorithm for data gathering in wireless sensor networks
CN103064917A (zh) 一种面向微博的特定倾向的高影响力用户群发现方法
CN105554844A (zh) 一种无线传感器网络拓扑构建方法
CN105138526A (zh) 用于为关系型数据库自动生成语义映射的方法和系统
CN105095419A (zh) 一种面向微博特定类型用户的信息影响力最大化方法
Mukherjee et al. Dynamic clustering method based on power demand and information volume for intelligent and green IoT
CN108711111A (zh) 一种基于K-shell分解的社交网络影响力最大化方法
CN113486190A (zh) 一种融合实体图像信息和实体类别信息的多模态知识表示方法
CN109165239B (zh) 基于用户属性和内容属性的d2d信息传播建模方法
CN113780002A (zh) 基于图表示学习和深度强化学习的知识推理方法及装置
Wu et al. Epidemic waves of a spatial SIR model in combination with random dispersal and non-local dispersal
Han et al. Identifying top-k influential nodes based on discrete particle swarm optimization with local neighborhood degree centrality
CN108965287B (zh) 一种基于有限临时删边的病毒传播控制方法
Zhang et al. Application of internet of things technology based on artificial intelligence in electronic information engineering
Du et al. Multi-group discrete symbiotic organisms search applied in traveling salesman problems
CN105159911A (zh) 基于主题交互的社区发现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180227

Termination date: 20180604