CN113378470A - 一种面向时序网络的影响力最大化方法及系统 - Google Patents
一种面向时序网络的影响力最大化方法及系统 Download PDFInfo
- Publication number
- CN113378470A CN113378470A CN202110689098.6A CN202110689098A CN113378470A CN 113378470 A CN113378470 A CN 113378470A CN 202110689098 A CN202110689098 A CN 202110689098A CN 113378470 A CN113378470 A CN 113378470A
- Authority
- CN
- China
- Prior art keywords
- nodes
- node
- time
- network
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 177
- 239000013598 vector Substances 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims description 28
- 230000006872 improvement Effects 0.000 claims description 2
- 230000000644 propagated effect Effects 0.000 claims description 2
- 230000003068 static effect Effects 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005295 random walk Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 102100034799 CCAAT/enhancer-binding protein delta Human genes 0.000 description 1
- 101000945965 Homo sapiens CCAAT/enhancer-binding protein delta Proteins 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种面向时序网络的影响力最大化方法,包括:划分时序网络的层数,对时序网络进行建模;基于网络中节点的特征向量中心性计算节点间的传播概率;基于时序网络中节点的局部信息、传播概率及时间特性定义新的时序中心性测度,以计算节点的影响力;构建传播模型,结合启发式算法和贪心算法,以选择影响力最大化的种子节点。本发明考虑了节点间建立联系的时序性,且以特征向量中心性为基础计算节点间传播概率,可以反映不同切片网络中节点间传播概率的差异性,同时在节点度的基础上,考虑节点的实际传播过程并基于贪心策略来选择种子节点集,具有较高的准确性和高效性。
Description
技术领域
本发明涉及时序网络的影响力最大化方法,尤其是涉及结合启发式和贪心策略的时序网络影响力最大化种子节点选择方法及系统。
背景技术
在线社交网络在人们生活中扮演着重要的角色。人们可以通过社交网络表达想法、分享信息并相互影响。影响力最大化种子节点选择在广告投放、舆情监督及推荐系统等方面有着重要的应用。例如,一些企业品牌选择社交网络(微博、微信、FaceBook及Twitter等)中的明星用户代言产品,通过他们影响更多的普通用户购买产品并分享给他们的朋友,最终该品牌就会新增许多潜在客户,同时促进品牌影响力的最大提升。
经检索国内外文献发现,目前关于影响力最大化种子节点选择方法多数都基于静态网络展开研究,但是现实生活中的许多网络并不能被简单建模为静态网络,因为网络中的节点可能只在某个时间段内存在联系,即节点之间的连边会随时间间断性的消失或出现。所以本发明涉及的是时序网络中的影响力最大化种子节点选择方法。
最经典的影响力最大化算法是基于贪心算法的。但是贪心算法需要花费大量时间以致于不能被广泛应用至大规模社交网络中。为了减少算法的运行时间,一些学者提出了启发式算法,但其精度不高。考虑到社交网络是动态变化的,越来越多的研究者开始以时序网络为研究对象,并设计时序网络上的影响力最大化算法。
公告号为CN 108510115 A的发明专利公开了一种面向动态社交网络的影响力最大化分析方法,包括:(1)获取激活概率,通过使用影响力延迟分布函数幂率分布将时间因素加入到激活概率中;(2)建立影响力传播模型LAIC;(3)执行贪心算法,利用贪心算法计算每个节点的初始边际收益;(4)使用CELF算法对原始贪心算法进行优化,通过影响力函数的子模特性和影响力优先队列提高了搜索种子节点的效率。该方法的影响力传播模型为LAIC,在LAIC模型中考虑幂率分布,以使其适应真实的社交网络。但是LAIC模型没有考虑节点间建立联系的时序性和不同切片网络中节点间传播概率的差异性。
发明内容
1、本发明的目的
针对现有技术存在的问题,本发明提供一种面向时序网络的影响力最大化方法及系统,本发明考虑了节点间建立联系的时序性,且以特征向量中心性为基础计算节点间传播概率,可以反映不同切片网络中节点间传播概率的差异性,同时在节点度的基础上,考虑节点的实际传播过程并基于贪心策略来选择种子节点集,具有较高的准确性和高效性。
2、本发明所采用的技术方案
一种面向时序网络的影响力最大化方法,包括以下步骤:
S01:划分时序网络的层数,对时序网络进行建模;
S02:基于网络中节点的特征向量中心性计算节点间的传播概率;
S03:基于时序网络中节点的局部信息、传播概率及时间特性定义新的时序中心性测度,以计算节点的影响力;
S04:构建传播模型,结合启发式算法和贪心算法,以选择影响力最大化的种子节点。
优选的技术方案中,所述步骤S01中基于时间窗图模型对时序网络进行建模,包括:
S11:建模时序网络G=(V,E),其中V={v1,v2,...,vN}表示所有节点构成的节点集,用三元组et=(u,v,t)表示网络在时间段[0,m]的边集,其中u和v表示网络中的节点,t表示两节点建立联系的时间,即在时间t,节点u与节点v之间出现连边,所有这样的三元组构成网络的边集E={e1,e2,...,et};
S12:将时间段[0,m]切分成时间窗大小为ω的T个切片网络G1,G2,...,GT(T=m/ω)。
优选的技术方案中,所述步骤S02中传播概率puv计算式为:
式中,Eu、Ev分别表示网络中节点u、v的特征向量中心性;
所述特征向量中心性根据节点的中心性计算它们的权重,然后将与当前节点可达的其他节点的权重的线性和作为该节点的特征向量中心性值,即当前节点的影响力取决于邻接节点影响力的线性和。
优选的技术方案中,所述步骤S03中基于节点的局部信息、传播概率和时间特性定义在一段时间[ti,tj]内节点v的时序中心性测度为:
优选的技术方案中,所述步骤S04中构建的传播模型为改进的独立级联模型,具体改进为:
1)在每个切片网络中,独立级联模型的传播过程一直进行,直到该切片网络中没有新的节点被激活为止;
2)如果一个节点未能激活其邻居节点,则在随后的切片网络中,它将无法再次激活该邻居节点;
3)利用步骤S02中的公式计算每个切片网络中节点间的传播概率,以充分反映不同节点间传播概率的差异性。
优选的技术方案中,所述步骤S04中结合启发式算法和贪心算法包括时序启发式阶段和时序贪心阶段,所述启发式阶段包括通过步骤S03中的公式计算时序网络中每个节点的时序中心性测度值,然后选择计算值大的K个节点构成候选种子集CS,从候选种子集合选取种子节点;所述贪心阶段包括算法共执行k轮,每一轮都从启发阶段选取的候选种子集中选择边际增益最大的节点加入到种子集合S中,直到|S|=k结束,其中,k为种子节点个数。
本发明还公开了一种面向时序网络的影响力最大化系统,包括:
时序网络建模模块,划分时序网络的层数,对时序网络进行建模;
传播概率计算模块,基于网络中节点的特征向量中心性计算节点间的传播概率;
时序中心性测度计算模块,基于时序网络中节点的局部信息、传播概率及时间特性定义新的时序中心性测度,以计算节点的影响力;
TCHG算法模块,构建传播模型,结合启发式算法和贪心算法,以选择影响力最大化的种子节点。
优选的技术方案中,所述传播概率计算模块中传播概率puv计算式为:
式中,Eu、Ev分别表示网络中节点u、v的特征向量中心性;
所述特征向量中心性根据节点的中心性计算它们的权重,然后将与当前节点可达的其他节点的权重的线性和作为该节点的特征向量中心性值,即当前节点的影响力取决于邻接节点影响力的线性和。
优选的技术方案中,所述时序中心性测度计算模块中基于节点的局部信息、传播概率和时间特性定义在一段时间[ti,tj]内节点v的时序中心性测度为:
优选的技术方案中,所述TCHG算法模块中结合启发式算法和贪心算法包括时序启发式阶段和时序贪心阶段,所述启发式阶段包括通过步骤S03中的公式计算时序网络中每个节点的时序中心性测度值,然后选择计算值大的K个节点构成候选种子集CS,从候选种子集合选取种子节点;所述贪心阶段包括算法共执行k轮,每一轮都从启发阶段选取的候选种子集中选择边际增益最大的节点加入到种子集合S中,直到|S|=k结束,其中,k为种子节点个数。
3、本发明所采用的有益效果
1、本发明给出了一种新的时序网络中节点影响力度量方法和节点间传播概率计算方法。以种子节点的影响范围和算法的运行时间衡量算法的准确度和效率。本发明考虑了节点间建立联系的时序性,且以特征向量中心性为基础计算节点间传播概率,可以反映不同切片网络中节点间传播概率的差异性,同时在节点度的基础上,考虑节点的实际传播过程并基于贪心策略来选择种子节点集。所以本发明算法的影响范围均大于其他对比的启发式算法,运行时间也远低于其他算法。例如在CollegeMsg数据上,当选择50个种子节点时,TCHG算法的运行时间比MNC算法和greedy算法分别减少了98.105s和2269.57s,说明TCHG算法能够更好的贴合实际问题。
2、随着种子节点数k增大,本发明算法的影响范围均大于其他对比算法,而运行时间远远低于用来对比的greedy算法。说明本发明算法适用于解决时序网络中的影响力最大化问题。
附图说明
图1为本实施例面向时序网络的影响力最大化方法的流程图;
图2为本实施例面向时序网络的影响力最大化系统的原理框图;
图3为本实施例面向时序网络的影响力最大化系统的工作流程图;
图4a-4d为本实施例四个数据集上不同算法的影响力传播范围,其中4a为Manufacturing,4b为Highschool3,4c为Email-Eu-core,4d为CollegeMsg。
具体实施方式
下面结合本发明实例中的附图,对本发明实例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域技术人员在没有做创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
下面将结合附图对本发明实例作进一步地详细描述。
实施例1
如图1所示,一种面向时序网络的影响力最大化方法,包括以下步骤:
S01:划分时序网络的层数,对时序网络进行建模;
S02:基于网络中节点的特征向量中心性计算节点间的传播概率;
S03:基于时序网络中节点的局部信息、传播概率及时间特性定义新的时序中心性测度,以计算节点的影响力;
S04:构建传播模型,结合启发式算法和贪心算法,以选择影响力最大化的种子节点。
影响力最大化即在大规模社交网络中寻找k个用户作为种子节点,使得信息在特定的传播模型下,通过这k个用户在网络中尽可能多的影响其他用户。
一较佳的实施例中,步骤S01中基于时间窗图模型对时序网络进行建模,包括:
S11:建模时序网络G=(V,E),其中V={v1,v2,...,vN}表示所有节点构成的节点集,用三元组et=(u,v,t)表示网络在时间段[0,m]的边集,其中u和v表示网络中的节点,t表示两节点建立联系的时间,即在时间t,节点u与节点v之间出现连边,所有这样的三元组构成网络的边集E={e1,e2,...,et};
S12:将时间段[0,m]切分成时间窗大小为ω的T个切片网络G1,G2,...,GT(T=m/ω)。
一较佳的实施例中,步骤S02中传播概率puv计算式为:
式中,Eu、Ev分别表示网络中节点u、v的特征向量中心性;
所述特征向量中心性根据节点的中心性计算它们的权重,然后将与当前节点可达的其他节点的权重的线性和作为该节点的特征向量中心性值,即当前节点的影响力取决于邻接节点影响力的线性和。
这样使得节点的影响力与和它相连的其他节点的影响力相关,即与之相连的节点影响力越大,该节点在网络中的影响力随之增大。能充分反映节点间传播概率的差异性。
一较佳的实施例中,步骤S03中基于节点的局部信息、传播概率和时间特性定义在一段时间[ti,tj]内节点v的时序中心性测度为:
优选的,本实施例的传播概率λv=0.05。
一较佳的实施例中,步骤S04中构建的传播模型为改进的独立级联模型,具体改进为:
1)在每个切片网络中,独立级联模型的传播过程一直进行,直到该切片网络中没有新的节点被激活为止;
2)如果一个节点未能激活其邻居节点,则在随后的切片网络中,它将无法再次激活该邻居节点;
3)利用步骤S02中的公式计算每个切片网络中节点间的传播概率,以充分反映不同节点间传播概率的差异性。
一较佳的实施例中,步骤S04中结合启发式算法和贪心算法包括时序启发式阶段和时序贪心阶段,所述启发式阶段包括通过步骤S03中的公式计算时序网络中每个节点的时序中心性测度值,然后选择计算值大的K个节点构成候选种子集CS,从候选种子集合选取种子节点;所述贪心阶段包括算法共执行k轮,每一轮都从启发阶段选取的候选种子集中选择边际增益最大的节点加入到种子集合S中,直到|S|=k结束,其中,k为种子节点个数。
如图2所示,本发明还公开了一种面向时序网络的影响力最大化系统,包括:
时序网络建模模块10,划分时序网络的层数,对时序网络进行建模;
传播概率计算模块20,基于网络中节点的特征向量中心性计算节点间的传播概率;
时序中心性测度计算模块30,基于时序网络中节点的局部信息、传播概率及时间特性定义新的时序中心性测度,以计算节点的影响力;
TCHG算法模块40,构建传播模型,结合启发式算法和贪心算法,以选择影响力最大化的种子节点。
下面详细描述该面向时序网络的影响力最大化系统的工作流程,如图3所示,具体包括以下几个步骤:
S1:划分时序网络的层数,基于时间窗图模型建模时序网络;
给定一个时序网络G=(V,E),其中V={v1,v2,...,vN}表示所有节点构成的节点集,用三元组et=(u,v,t)表示网络在时间段[0,m]的边集,其中u和v表示网络中的节点,t表示两节点建立联系的时间,即在时间t,节点u与节点v之间出现连边,所有这样的三元组构成网络的边集E={e1,e2,...,et}。时间窗图模型的核心是将研究的整个时间段[0,m]切分成时间窗大小为ω的T个切片网络G1,G2,...,GT(T=m/ω)。利用该模型,可以将数据集分解为几个时间连续的切片网络。每个切片网络可以看作是一个静态网络,多个切片网络及其关联看作一个时序网络。
S2:基于网络种节点的特征向量中心性计算节点间的传播概率;
在经典的影响力最大化算法中,节点间的传播概率常用固定的常数(0.01,0.1等)表示,未能充分反映节点间传播概率的差异性,因为时序网络的结构是随时间发生变化的。虽然传播概率的取值非常小时(0.01)时可以有更稳定的结果,但是会使得IC模型的影响范围很小,并且网络中每条边的传播概率都很小不符合真实的信息传播动力学。
本发明考虑到高中心性的节点更容易影响到低中心性的节点,例如,在一些基于用户关系的社交媒体平台(微博、微信、博客和论坛等),粉丝数多的用户更容易影响粉丝数少的用户。
在各种中心性度量方法中,基于度的方法简单,计算复杂度低,但它只能反映节点及其邻居之间的联系,是对节点局部影响力的度量,不能很好的衡量节点在整个网络中的影响力;基于最短路径的方法(紧密中心性、介数中心性等)可以从网络整体度量节点的影响力,但其计算复杂度较高,且节点的影响力通过最短路径来发挥作用是一种理想状态,在现实生活中不是很容易达到;而基于随机游走的方法(特征向量中心性、Katz中心性、PageRank中心性等)可以利用随机游走路径上的节点衡量当前节点的影响力。
综上所述,本发明利用网络中每条边的两个节点特征向量的中心性计算传播概率,最终传播概率puv计算式为:
式中,Eu、Ev分别表示网络中节点u、v的特征向量中心性;
特征向量中心性是根据节点的中心性计算它们的权重,然后将与当前节点可达的其他节点的权重的线性和视为该节点的中心性值。其核心思想是,节点的影响力是与和它相连的其他节点的影响力相关的,即与之相连的节点影响力越大,该节点在网络中的影响力随之增大。
S3:基于时序网络中节点的局部信息、传播概率及时间特性定义一种新的时序中心性测度——TPC,以计算节点的影响力;
度和聚类系数是计算节点影响力的两个重要中心性度量指标。因此,本发明基于目标节点与其邻居的度和节点的实际传播过程、目标节点的二阶邻居的聚类系数及时序时间特性,定义在一段时间[ti,tj]内节点v的TPC测度为:
S4:改进独立级联模型(IC)使其适用于时序网络中的信息传播;
IC模型是基于静态网络提出的,并不能直接被应用到时序网络中,因此,本发明在文献“PBródka,J Jankowski,Michalski R.Sequential seeding in multilayernetworks[J].2020.”的基础上,进一步改进IC模型使其可以适用于时序网络中的信息传播,具体改进如下:
1)在每个切片网络中,IC模型的传播过程都会一直进行,直到该切片网络中没有新的节点被激活为止。
2)如果一个节点未能激活其邻居节点,则在随后的切片网络中,它将无法再次激活该邻居节点。
3)利用步骤S2中的公式计算每个切片网络中节点间的传播概率,以充分反映不同节点间传播概率的差异性。
S5:基于改进的独立级联模型,结合启发式算法和贪心算法的优点,提出TCHG算法,以选择影响力最大化的种子节点。
基于改进的独立级联模型,结合启发式算法和贪心算法的优点,提出TCHG算法,以选择影响力最大化的种子节点。TCHG算法分为时序启发式阶段和时序贪心阶段,启发式阶段的核心思想是通过步骤S3中的公式计算时序网络中每个节点的TPC值,然后选择计算值较大的K个节点构成候选种子集CS,以使种子节点的选取从整个网络减少至候选种子集合,以减少算法的运行时间;贪心阶段的核心思想是算法共执行k轮,每一轮都从启发阶段选取的候选种子集中选择边际增益最大的节点加入到种子集合S中,直到|S|=k结束(其中,k为种子节点个数)。
TCHG算法结合启发式算法和贪心算法优点,首先在启发式阶段选取出候选种子集,其次计算候选种子集中的每个节点的边际增益,最后选取边际增益较大的节点构成种子集S。该算法在保证影响范围与贪心算法近似的同时,大大缩短了算法的运行时间。
本实施例的有效性可以通过下面的仿真实验来进一步说明。
1)仿真条件:
操作系统Windows10,CPU:nter(R)Core(TM)i7-5500U@2.40GHz,内存8GB,硬盘500GB,编程环境Pycharm,软件Python3.7。
2)仿真内容:
用于仿真实验的数据集包括四个真实网络:Enrons2001、Highschool3、Emaildept3、Workspace网络。表1显示了四个真实网络的基本统计信息。其中N表示节点总数,TE表示时序边数,E表示静态边数,TS表示时间跨度(以天为单位),T表示最终时序网络划分的切片个数。
表1数据集的基本特征
Datasets | N | TE | E | TS | T |
Manufacturing | 169 | 82927 | 5784 | 271 | 9 |
HighSchool3 | 327 | 188508 | 5817 | 5 | 5 |
Email-Eu-core | 986 | 332334 | 24929 | 803 | 9 |
CollegeMsg | 1899 | 59835 | 20296 | 193 | 7 |
3)对比方法
Temporal degree(Tdeg)算法:基于明显路径流的时序网络模型所提出,通过计算一段时间内节点的时序度值,以反映节点的重要程度。通过计算时序网络中时序度值较大的节点的作为种子节点。
Neighbourhood Size(NS)算法:在基于快照的时序网络模型中,通过计算每个节点在各个切片网络中的邻居集合并取交集,然后依次选择交集中邻居节点个数较多的节点作为种子节点,直到选择k个节点。
MNC算法:一种由多层图表示的时序网络中基于特征向量中心性的一种中心性测度泛化方法。通过在超中心性矩阵(NT*NT维矩阵)中耦合时间层中心性矩阵(以权重w耦合相邻时间层中对应节点,其中w=0.5)实现。最终选择k个节点作为种子节点。
DegreeDiscount算法:它是启发式算法的代表,选择的种子节点若有邻居节点被选为种子节点时,在计算它的度数时要减少,直至选择k个种子节点。
NewDiscount算法:利用不同中心性测度,改进IC模型中的传播概率,进而对DegreeDiscount算法进行改进。
greedy算法:它是一个简单的贪心算法,其算法思想是计算所有节点的边际增益并进行排序,选取k个节点作为种子节点。
在种子节点的选取阶段,各个算法的种子集合大小k分别取值为5、10、15、20、25、30、35、40、45和50,相应的候选种子集中节点个数K=2*k。
4)仿真实验分析
为了验证本发明方法的效果,基于种子集的影响范围和算法的运行时间来评价该方法。
图4a-4d是各个算法在Manufacturing、Highschool3、Email-Eu-core和CollegeMsg数据集上的种子集影响范围。从图4a-4d可以看出,本发明提出的TCHG算法在不同数据集上的影响范围均高于其他对比算法。
图4a中,TCHG算法的影响范围最大,Tdeg算法、NS算法和MNC算法次之且影响范围比较接近,而DegreeDiscount算法和NewDicount算法影响范围最小。另外,当k>35时,TCHG算法影响范围折线与Tdeg几乎重合,差异不大。
图4b中,TCHG算法的影响范围明显高于所有对比算法,当k=50时,TCHG算法的影响范围比DegreeDiscount、NewDiscount、MNC、NS和Tdeg算法分别提高了49.36%,37.02%,25.96%,20.43%和25.94%。Tdeg算法和NS算法的影响范围折线整体上几乎重合,且高于MNC算法。DegreeDiscount算法的影响范围小。
图4c中,TCHG算法的影响范围最大。当10<k<30时,Tdeg算法的影响范围略高于NS算法;当k>30,两者的影响范围折线几乎重合。在其余的算法中,MNC算法的影响较高,NewDiscount算法次之,而DegreeDiscount算法影响范围最小。
图4d中,TCHG算法的影响范围明显高于其他对比算法,当k>25时,TCHG算法、Tdeg和NS算法的影响范围仍然随着k的增加而提高,但整体上增加缓慢,且Tdeg和NS算法影响范围折现几乎重合。其余算法中,NewDiscount算法的影响范围高于DegreeDiscount算法。当k=50时,TCHG算法的影响范围比DegreeDiscount、NewDiscount、MNC、NS和Tdeg算法分别提高了67.32%,60.19%,27.61%,19.75%和20.16%。
在改进的IC传播模型下,分别统计了DegreeDiscount、NewDiscount、MNC、NS、Tdeg和TCHG算法的运行时间,具体统计了各个算法在4个数据集中分别选择30和50个种子节点的运行时间如下表所示:
k=30
k=50
从上表中可以看出,随着网络规模的增大,DegreeDicount算法、NewDiscount算法、Tdeg算法和NS算法的运行时间增幅较小,DegreeDiscount算法的运行时间最短。MNC算法的运行时间随着网络规模的增大其运行时间增幅较大。而本文提出的TCHG算法的运行时间在Highschol3数据集和Manufacturing数据集的运行时间大于MNC算法,而在Email-Eu-core数据集和CollegeMsg数据集上的运时间远小于MNC算法。greedy算法的运行时间最长,且随着网络规模增大,greedy算法的运行时间呈指数级增长。
通过对实验结果进行分析可以得出,DegreeDiscout算法和NewDicscount算法是静态网络中的经典影响力最大化算法,其运行时间很短,但影响范围远远低于其他算法。
DegreeDiscount算法仅仅简单以节点的度数为基础来选择种子节点,而NewDiscount算法在DegreeDiscount算法的基础上考虑到了节点间传播概率的差异性,所以其影响范围大于DegreeDiscout算法。
但是上述两种算法均未考虑节点间建立联系的时序性,即节点间只在某个特定的时刻会建立联系,Tdeg算法和NS算法考虑了网络的时序性,以基于快照的时序网络模型建模时序网络,然后分别以各个时间切片网络中节点的度数和节点邻居的交集为基础选择种子节点,实验结果表明,Tdeg和NS算法的影响范围均大于DegreeDiscount和NewDiscount算法,且运行时间也小于NewDiscount算法的运行时间,例如在Email-Eu-core数据集上,当选择50个种子节点时,Tdeg算法、NewDiscount算法和DegreeDiscount算法的运行时间分别为0.221s、0.358s和0.015s。
MNC算法基于多层图建模时序网络,考虑了相邻切片网络中节点的耦合关系,并基于特征向量中心性选择种子节点,其影响范围接近于Tdeg算法和NS算法,但运行时间较长。
greedy算法的运行时间随着网络规模增大呈指数级增长,不适用于现实生活中的大规模网络。
而TCHG算法考虑了节点间建立联系的时序性,且以特征向量中心性为基础计算节点间传播概率,可以反映不同切片网络中节点间传播概率的差异性,同时在节点度的基础上,考虑节点的实际传播过程并基于贪心策略来选择种子节点集。所以TCHG算法的影响范围均大于其他对比的启发式算法,运行时间也远低于greedy算法和MNC算法,例如在CollegeMsg数据上,当选择50个种子节点时,TCHG算法的运行时间比MNC算法和greedy算法分别减少了98.105s和2269.57s,说明TCHG算法能够更好的贴合实际问题。
综上所述,随着种子节点数k增大,TCHG算法的影响范围均大于其他对比算法,而运行时间远远低于用来对比的greedy算法。说明TCHG算法适用于解决时序网络中的影响力最大化问题。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (10)
1.一种面向时序网络的影响力最大化方法,其特征在于,包括以下步骤:
S01:划分时序网络的层数,对时序网络进行建模;
S02:基于网络中节点的特征向量中心性计算节点间的传播概率;
S03:基于时序网络中节点的局部信息、传播概率及时间特性定义新的时序中心性测度,以计算节点的影响力;
S04:构建传播模型,结合启发式算法和贪心算法的优点,以选择影响力最大化的种子节点。
2.根据权利要求1所述的面向时序网络的影响力最大化方法,其特征在于,所述步骤S01中基于时间窗图模型对时序网络进行建模,包括:
S11:建模时序网络G=(V,E),其中V={v1,v2,...,vN}表示所有节点构成的节点集,用三元组et=(u,v,t)表示网络在时间段[0,m]的边集,其中u和v表示网络中的节点,t表示两节点建立联系的时间,即在时间t,节点u与节点v之间出现连边,所有这样的三元组构成网络的边集E={e1,e2,...,et};
S12:将时间段[0,m]切分成时间窗大小为ω的T个切片网络G1,G2,...,GT(T=m/ω)。
4.根据权利要求1所述的面向时序网络的影响力最大化方法,其特征在于,所述步骤S03中基于节点的局部信息、传播概率和时间特性定义在一段时间[ti,tj]内节点v的时序中心性测度为:
5.根据权利要求3所述的面向时序网络的影响力最大化方法,其特征在于,所述步骤S04中构建的传播模型为改进的独立级联模型,具体改进为:
1)在每个切片网络中,独立级联模型的传播过程一直进行,直到该切片网络中没有新的节点被激活为止;
2)如果一个节点未能激活其邻居节点,则在随后的切片网络中,它将无法再次激活该邻居节点;
3)利用步骤S02中的公式计算每个切片网络中节点间的传播概率,以充分反映不同节点间传播概率的差异性。
6.根据权利要求3或5所述的面向时序网络的影响力最大化方法,其特征在于,所述步骤S04中结合启发式算法和贪心算法包括时序启发式阶段和时序贪心阶段,所述启发式阶段包括通过步骤S03中的公式计算时序网络中每个节点的时序中心性测度值,然后选择计算值大的K个节点构成候选种子集CS,从候选种子集合选取种子节点;所述贪心阶段包括算法共执行k轮,每一轮都从启发阶段选取的候选种子集中选择边际增益最大的节点加入到种子集合S中,直到|S|=k结束,其中,k为种子节点个数。
7.一种面向时序网络的影响力最大化系统,其特征在于,包括:
时序网络建模模块,划分时序网络的层数,对时序网络进行建模;
传播概率计算模块,基于网络中节点的特征向量中心性计算节点间的传播概率;
时序中心性测度计算模块,基于时序网络中节点的局部信息、传播概率及时间特性定义新的时序中心性测度,以计算节点的影响力;
TCHG算法模块,构建传播模型,结合启发式算法和贪心算法,以选择影响力最大化的种子节点。
9.根据权利要求7所述的面向时序网络的影响力最大化系统,其特征在于,所述时序中心性测度计算模块中基于节点的局部信息、传播概率和时间特性定义在一段时间[ti,tj]内节点v的时序中心性测度为:
10.根据权利要求8所述的面向时序网络的影响力最大化系统,其特征在于,所述TCHG算法模块中结合启发式算法和贪心算法包括时序启发式阶段和时序贪心阶段,所述启发式阶段包括通过步骤S03中的公式计算时序网络中每个节点的时序中心性测度值,然后选择计算值大的K个节点构成候选种子集CS,从候选种子集合选取种子节点;所述贪心阶段包括算法共执行k轮,每一轮都从启发阶段选取的候选种子集中选择边际增益最大的节点加入到种子集合S中,直到|S|=k结束,其中,k为种子节点个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110689098.6A CN113378470A (zh) | 2021-06-22 | 2021-06-22 | 一种面向时序网络的影响力最大化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110689098.6A CN113378470A (zh) | 2021-06-22 | 2021-06-22 | 一种面向时序网络的影响力最大化方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113378470A true CN113378470A (zh) | 2021-09-10 |
Family
ID=77578218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110689098.6A Pending CN113378470A (zh) | 2021-06-22 | 2021-06-22 | 一种面向时序网络的影响力最大化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113378470A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417184A (zh) * | 2022-03-31 | 2022-04-29 | 苏州浪潮智能科技有限公司 | 一种种子节点筛选方法、装置、设备、存储介质 |
CN115329209A (zh) * | 2022-07-18 | 2022-11-11 | 齐齐哈尔大学 | 一种改进K-shell的时序社交网络影响力最大化方法 |
CN115442243A (zh) * | 2022-08-31 | 2022-12-06 | 西南大学 | 基于时序路径树的时序网络节点中心性评估方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060133293A1 (en) * | 2003-12-25 | 2006-06-22 | Nec Corporation | Method and apparatus for evaluating performance of wireless LAN system |
US20150019474A1 (en) * | 2013-07-10 | 2015-01-15 | Yahoo! Inc. | Influence maximization with viral product design |
US20170063620A1 (en) * | 2015-08-31 | 2017-03-02 | International Business Machines Corporation | Identifying Marginal-Influence Maximizing Nodes in Networks |
CN107392365A (zh) * | 2017-07-11 | 2017-11-24 | 扬州大学 | 基于传播路径分析的独立级联模型的影响力最大化方法 |
CN108510115A (zh) * | 2018-03-29 | 2018-09-07 | 山东科技大学 | 一种面向动态社交网络的影响力最大化分析方法 |
CN109741198A (zh) * | 2018-11-28 | 2019-05-10 | 中国科学院计算技术研究所 | 网络信息传播影响力度量方法、系统及影响力最大化方法 |
CN109740024A (zh) * | 2019-01-08 | 2019-05-10 | 东北大学 | 一种面向大规模时序图影响力最大化问题的解决方法 |
CN111339444A (zh) * | 2020-03-11 | 2020-06-26 | 嘉兴学院 | 一种基于库仑力模型求解社会网络影响力问题的方法 |
CN112214689A (zh) * | 2020-10-22 | 2021-01-12 | 上海交通大学 | 基于社交网络中群体的影响力最大化方法及系统 |
-
2021
- 2021-06-22 CN CN202110689098.6A patent/CN113378470A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060133293A1 (en) * | 2003-12-25 | 2006-06-22 | Nec Corporation | Method and apparatus for evaluating performance of wireless LAN system |
US20150019474A1 (en) * | 2013-07-10 | 2015-01-15 | Yahoo! Inc. | Influence maximization with viral product design |
US20170063620A1 (en) * | 2015-08-31 | 2017-03-02 | International Business Machines Corporation | Identifying Marginal-Influence Maximizing Nodes in Networks |
CN107392365A (zh) * | 2017-07-11 | 2017-11-24 | 扬州大学 | 基于传播路径分析的独立级联模型的影响力最大化方法 |
CN108510115A (zh) * | 2018-03-29 | 2018-09-07 | 山东科技大学 | 一种面向动态社交网络的影响力最大化分析方法 |
CN109741198A (zh) * | 2018-11-28 | 2019-05-10 | 中国科学院计算技术研究所 | 网络信息传播影响力度量方法、系统及影响力最大化方法 |
CN109740024A (zh) * | 2019-01-08 | 2019-05-10 | 东北大学 | 一种面向大规模时序图影响力最大化问题的解决方法 |
CN111339444A (zh) * | 2020-03-11 | 2020-06-26 | 嘉兴学院 | 一种基于库仑力模型求解社会网络影响力问题的方法 |
CN112214689A (zh) * | 2020-10-22 | 2021-01-12 | 上海交通大学 | 基于社交网络中群体的影响力最大化方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417184A (zh) * | 2022-03-31 | 2022-04-29 | 苏州浪潮智能科技有限公司 | 一种种子节点筛选方法、装置、设备、存储介质 |
CN115329209A (zh) * | 2022-07-18 | 2022-11-11 | 齐齐哈尔大学 | 一种改进K-shell的时序社交网络影响力最大化方法 |
CN115442243A (zh) * | 2022-08-31 | 2022-12-06 | 西南大学 | 基于时序路径树的时序网络节点中心性评估方法及装置 |
CN115442243B (zh) * | 2022-08-31 | 2024-04-16 | 西南大学 | 基于时序路径树的时序网络节点中心性评估方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | Influence maximization in social networks using graph embedding and graph neural network | |
CN113378470A (zh) | 一种面向时序网络的影响力最大化方法及系统 | |
CN112085172B (zh) | 图神经网络的训练方法及装置 | |
CN106355506B (zh) | 一种在线社会网络中影响力最大化初始节点选取方法 | |
US8433660B2 (en) | Managing a portfolio of experts | |
US11605118B2 (en) | Systems and methods for next basket recommendation with dynamic attributes modeling | |
US8346783B2 (en) | Method and system for merchandise hierarchy refinement by incorporation of product correlation | |
EP4217934A1 (en) | Method and system for relation learning by multi-hop attention graph neural network | |
US11854022B2 (en) | Proactively predicting transaction dates based on sparse transaction data | |
Hung et al. | When social influence meets item inference | |
JP6311851B2 (ja) | 共クラスタリングシステム、方法およびプログラム | |
Bezáková et al. | Graph model selection using maximum likelihood | |
Zuo et al. | Online competitive influence maximization | |
CN110929172A (zh) | 信息选择方法、装置、电子设备及可读存储介质 | |
Luke et al. | Recommending long-tail items using extended tripartite graphs | |
Shen et al. | From 0.5 million to 2.5 million: Efficiently scaling up real-time bidding | |
Abadi et al. | Influence maximization in viral marketing with expert and influential leader discovery approach | |
CN115456708A (zh) | 推荐模型的训练方法、装置、电子设备和存储介质 | |
Dhamal | Effectiveness of diffusing information through a social network in multiple phases | |
US8090835B1 (en) | Optimizing website traffic among content sources | |
Wang et al. | Using incremental clustering technique in collaborative filtering data update | |
CN111626890B (zh) | 一种基于销售信息网络的显著社团发现方法 | |
Yin et al. | Improving accuracy and scalability of personal recommendation based on bipartite network projection | |
Nikolakopoulos et al. | On the use of lanczos vectors for efficient latent factor-based top-n recommendation | |
Lu et al. | Definition and Goal of Graph Clustering-Motivation to Explore a New Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |