CN111221875A - 一种基于约束的种子节点数据挖掘系统 - Google Patents

一种基于约束的种子节点数据挖掘系统 Download PDF

Info

Publication number
CN111221875A
CN111221875A CN202010008842.7A CN202010008842A CN111221875A CN 111221875 A CN111221875 A CN 111221875A CN 202010008842 A CN202010008842 A CN 202010008842A CN 111221875 A CN111221875 A CN 111221875A
Authority
CN
China
Prior art keywords
node
influence
seed
diffusion
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010008842.7A
Other languages
English (en)
Other versions
CN111221875B (zh
Inventor
张霄宏
钱凯
张东生
郝浩宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Technology
Original Assignee
Henan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Technology filed Critical Henan University of Technology
Priority to CN202010008842.7A priority Critical patent/CN111221875B/zh
Publication of CN111221875A publication Critical patent/CN111221875A/zh
Application granted granted Critical
Publication of CN111221875B publication Critical patent/CN111221875B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明针对种子节点选择过程中存在的性能问题和影响力重叠问题,提出一种基于约束的种子节点数据挖掘系统。该系统包括影响力计算装置、候选种子筛选装置和重叠开销检查装置。影响力计算装置计算节点影响力;候选种子筛选装置以节点影响力为输入筛选出候选种子节点;重叠开销检查装置计算候选种子节点与已有种子节点的重叠开销,并选出种子节点。本发明提出了有限贪婪的种子选择思想,在有限的邻居间以贪婪方式识别出影响力最大的节点,即保留了贪婪方式能获取接近最优结果的长处,又降低了本发明的时间复杂度。本发明还提出了重叠开销计算模型,根据重叠开销决定一个候选种子节点能否成为种子节点,以此降低由影响力重叠引起的传播效率缩水。

Description

一种基于约束的种子节点数据挖掘系统
技术领域
本发明涉及一种数据挖掘系统,具体涉及一种基于约束的种子节点数据挖掘系统,属于数据技术领域。
背景技术
影响力最大化问题最早源于市场营销领域,早期在利用数据挖掘改进病毒营销的研究中首次提出了社交网络影响力最大化的问题,即通过在网络中选择k个最有影响力的营销点去推销产品,使得最后购买该产品的人最多。后来又给出了作为离散优化问题的影响最大化的系统性研究。均从社交网络分析交互式粒子系统和市场营销的早期工作中提取出了两个非常经典的基础模型:线性阈值模型(Linear Threshold,LT)和独立级联模型(Independent Cascade,IC)。不仅证明了优化问题是NP难的,而且还提出了一种贪婪方法,可以保证最优结果近似在(1-1/e)因子内。由于大量的蒙特卡罗模拟导致了时间复杂度很高,因此如果面对实际网络中拥有上万,上千万甚至上亿个节点的大型网络时,贪心方法的时间过度消耗会使得其根本无法使用。
针对贪心方法时间的低效性和不能扩展到大规模社交网络的问题,此后许多研究者基于这两种模型进行了不断改进,各种不同的方法也相继被提了出来,如CELF方法、CELF++方法、NewGreedy方法、MixGreedy方法等。尽管如此,面对成百上千万的大型网络,其高时间成本问题仍然未能得到很好的解决。为了进一步提升选种子的效率,一些启发式方法也被提了出来,如degree discount方法、Group-PageRank策略、IMRank、IM-PLA方法、geneticalgorithm等。然而,这些方法选择种子依赖于迭代计算,这也是造成很高时间成本的关键原因之一。
发明内容
本发明针对选择种子节点的过程中存在性能问题和影响力重叠问题,提出一种基于约束的种子节点数据挖掘系统,具体步骤为:该系统包括影响力计算装置、候选种子筛选装置和重叠开销检查装置,影响力计算装置计算节点的影响力,候选种子筛选装置以影响力计算装置计算得到的影响力为输入,筛选出候选种子节点,重叠开销检查装置以候选种子节点筛选装置筛选出的候选种子为输入,选择出种子节点,其中:
影响力计算装置包括活跃度计算模块、扩散意愿计算模块、传播潜力计算模块和直接影响力计算模块,活跃度计算模块、扩散意愿计算模块和传播潜力计算模块的输出共同构成直接影响力计算模块的输入;
候选种子节点选择装置用于筛选候选种子节点,由受限邻居节点集合模块、受限扩散影响力计算模块和筛选模块组成;
影响力重叠检测装置由重叠开销计算模块和种子节点决策模块组成。
进一步地,在影响力计算装置中,活跃度计算模块用于计算节点参与信息传播的活跃程度,其中
Figure BDA0002356032290000021
节点vi的活跃度记为Act(vi),由
Figure BDA0002356032290000022
Figure BDA0002356032290000023
计算,Nvi表示vi的出边邻居集合,Wvi,vj表示连接vi和vj的边的权重。Act(vi)越大,表明vi分享信息的频率越高;
扩散意愿计算模块定量计算节点vi将信息传播给vj的积极程度,
Figure BDA0002356032290000024
Figure BDA0002356032290000025
vi对vj的扩散意愿记为DW(vi,vj),
Figure BDA0002356032290000026
DW(vi,vj)是vi分享信息给vj的优选项,其值越高,表示vi越倾向于向vj共享信息;
传播潜力计算模块计算节点传播信息的潜在能力,
Figure BDA0002356032290000027
vi的传播潜力记为DP(vi),
Figure BDA0002356032290000028
其中,outdegree(vi)表示vi的出度,DP(vi)值越高,节点vi的扩散潜力越大;
直接影响计算模块计算一个节点对邻居节点的影响程度,
Figure BDA0002356032290000029
Figure BDA00023560322900000210
vi对vj的直接影响力记为DI(vi,vj),DI(vi,vj)=ω1Act(vi)+ω2Wdiffu(vi,vj)+ω3DP(vi),其中ω1、ω2、ω3分别为节点活跃度、扩散意愿和传播潜力的权重系数。
进一步地,候选种子节点选择装置中,受限邻居节点集合模块输入一个给定节点,输出该节点的受限邻居节点集合,
Figure BDA00023560322900000211
如果从vi出发的一个消息能够在传播有限的距离后到达vj,则vj便是vi的受限邻居,记作为
Figure BDA00023560322900000212
vi受限邻居节点集合描述vi可以通过贪婪的方式传播影响力的节点集合,记为CNvi
Figure BDA00023560322900000213
受限扩散影响力计算模块用于计算任意节点在受限邻居间的影响力,输入待计算的节点、该节点的受限邻居集合以及该节点对各个受限邻居的直接影响力,
Figure BDA0002356032290000031
vi的受限扩散影响力
Figure BDA0002356032290000032
activate(vi,vj)决定了vj是否能够被vi激活,
Figure BDA0002356032290000033
如果vi能够激活vj,则activate(vi,vj)=1,否则其值为0。
筛选模块选出受限扩散影响力最大的2K个节点作为候选种子节点,其中K表示种子节点的数量。
进一步地,候选种子节点选择装置的工作流程为:
步骤1:记划定有限邻居的最大距离为max-distance,令dis=1;
步骤2:从网络中选择一个节点记为curNode,构建只包含CurNode的集合N,
步骤3:对于集合N中的每个节点,执行下列步骤:
步骤3.1:利用节点活跃度计算模块和扩散潜力计算模块分别计算当前节点活跃度和扩散潜力;
步骤3.2:对于当前节点,利用受限邻居节点集合模块计算与当前节点距离为dis的受限邻居集合L;
步骤3.3:利用受限扩散影响力计算模块计算该节点在受限邻居集合中的影响力,具体步骤如下:
步骤3.3.1:对于L中的每个非激活邻居,执行下列操作:
步骤3.3.1.1:利用扩散意愿计算模块计算当前节点对当前非激活邻居的扩散意愿;
步骤3.3.1.2:利用直接影响力计算模块计算当前节点对当前非激活邻居的直接影响力;
步骤3.3.1.3;如果直接影响力大于预定义的阈值θ,则将该邻居置为激活状态,并将其加入集合N中。
步骤3.3.2:从N中删除当前节点,令dis=dis+1,
步骤4:重复步骤3,直至dis大于预定义的距离max-distance;将此过程中激活的受限邻居数量作为curNode的受限扩散影响力;
步骤5:重复步骤2到步骤4,得到网络中每个节点的受限扩散影响力;
步骤6:利用筛选模块,选出2K个候选种子节点。
进一步地,影响力重叠检测装置工作过程如下:
步骤1:按受限扩散影响力由高到低的顺序对所有的候选种子节点排序;
步骤2:将第一个候选种子节点作为种子加入种子集合;
步骤3:对后续的每个候选种子节点执行下列操作:
步骤3.1:利用重叠开销计算模块计算当前候选种子节点和每个种子的重叠开销;
步骤3.2:利用种子节点决策模块计算是否将当前候选种子节点作为种子节点;如果可以把当前候选节点作为种子,则将此候选种子节点加入种子节点集合;
步骤4:重复步骤3,直到获得K个种子节点。
本发明提出了有限贪婪的种子选择思想,在有限的邻居之内通过贪婪方式识别出影响力最大的节点,即利用了贪婪可以获取接近最优结果的长处,又将贪婪搜索限制在一定范围之内,从而降低时间复杂度。本发明还提出了重叠开销计算模型。在决定是否将一个节点作为种子节点时,根据此模型计算该节点和种子节点之间的重叠开销。如果重叠开销不满足要求,则将该节点排除在种子节点之外,以此降低由影响力重叠引起的传播效率缩水。
附图说明
图1为本发明系统结构图。
图2为重叠效果对比图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本实施例提供了种子节点挖掘方法的一种技术方案。所述的种子节点挖掘方法由影响力计算装置、候选种子筛选装置和重叠开销检查装置协同执行。并且,所述的种子节点挖掘方法集成部署在多台通过网络互连的计算机内部。
参见图1,所述的种子节点挖掘方法包括:
所述的种子节点挖掘方法由影响力计算装置、候选种子筛选装置和重叠开销检查装置构成。所述的影响力计算装置计算节点的影响力,所述的候选种子筛选装置以所述的影响力计算装置计算得到的影响力为输入,筛选出候选种子节点,所述的重叠开销检查装置以所述的候选种子节点筛选出的候选种子为输入,选择出种子节点。
所述的影响力计算装置由活跃度计算模块、扩散意愿度计算模块、传播潜力计算模块以及直接影响力计算模块三部分构成。所述的影响力计算装置以节点的拓扑属性、社交属性为输入,计算节点的直接影响力。
所谓社交属性包括但不限于发布和接收社交信息的频率等。
所谓网络拓扑属性包括节点的度属性、邻居关系等。
所述的活跃度计算模块根据活跃度模型计算节点的活跃度。所述的活跃度模型描述在节点既定社交属性的前提下节点在社交活动中的活跃度。所述的活跃度指的是节点参与信息共享的频繁程度。
所述的扩散意愿度计算模块根据扩散意愿度模型计算节点相对于某邻居节点的扩散意愿度。所述的扩散意愿度模型在节点既定的社交属性和网络拓扑属性的前提下描述其向某邻居节点共享信息的倾向。节点对某邻居节点的扩散意愿度越大,表明此节点越倾向于向此邻居节点共享信息。
所述的传播潜力计算模块根据传播潜力模型计算节点传播信息的潜在能力。所述的传播潜力模型描述在既定节点拓扑属性下描述节点在网络中传播信息的潜在能力。
所述的直接影响力计算模块根据直接影响力模型计算节点对某个邻居节点的影响程度。所述的直接影响力计算模块根据所述的节点的活跃度、扩散意愿度以及传播潜力描述节点在信息传播过程中对某邻居节点的影响程度。
基于约束的种子节点数据挖掘装置包括影响力计算装置、候选种子筛选装置和重叠开销检查装置。其中,影响力计算装置由活跃度计算模块、扩散意愿度计算模块、传播潜力计算模块以及直接影响计算模块四部分构成。活跃度计算模块、扩散意愿度计算模块和传播潜力计算模块的输出共同构成直接影响计算模块的输入。
活跃度计算模块用于计算参与信息传播的活跃程度,它的计算操作根据定义1设置。
定义1(活跃度):描述节点参与信息传播的活跃程度。
Figure BDA0002356032290000051
节点vi的活跃度记为Act(vi),
Figure BDA0002356032290000061
式中:
Figure BDA0002356032290000062
定示vi的出边邻居集合,
Figure BDA0002356032290000063
表示连接vi和vjd边的权重。Act(vi)越大,表明vi分享信息的频率越高。
扩散意愿度计算模块定量计算节点vi将信息传播给vj的积极程度。该模块执行的的主要操作根据定义2设置。
定义2(扩散意愿):描述两个节点间扩散信息的积极程度。
Figure BDA0002356032290000064
Figure BDA0002356032290000065
vi对vj的扩散意愿记为DW(vi,vj),
Figure BDA0002356032290000066
DW(vi,vj)是用户vi分享信息给vj的优选项,其值越高,表示vi越倾向于向vj共享信息。
传播潜力计算模块计算节点传播信息的潜在能力。该模块的主要操作依据定义3设置。
定义3(传播潜力):描述节点传播信息的潜在能力。
Figure BDA0002356032290000067
vi的传播潜力记为DP(vi),
Figure BDA0002356032290000068
outdegree(vi)表示vi的出度。节点的传播潜力反映该节点能够传递消息的范围大小,DP(vi)的值越高,节点vi的传播潜力就越大。
直接影响力计算模块计算一个节点对邻居节点的影响程度。直接影响力计算模块执行的操作根据定义4设置。
定义4(直接影响力):描述一个节点对某个邻居节点的影响程度。
Figure BDA0002356032290000069
vi对vj的直接影响力记为DI(vi,vj),DI(vi,vj)=ω1Act(vi)+ω2Wdiffu(vi,vj)+ω3DP(vi),其中ω1、ω2、ω3分别为节点活跃度、传播意愿及传播潜力的权重系数。这三个系数的值可通过序关系分析法确定。
候选种子节点选择装置用于筛选候选种子节点,候选种子节点是最有可能成为种子的节点。该装置由受限邻居节点集合模块、受限扩散影响力计算模块和筛选模块组成。
受限邻居节点集合模块的输入是一个给定节点,输出是该节点的受限邻居节点集合。该模块的操作根据定义5和定义6设置。
定义5(受限邻居):
Figure BDA00023560322900000610
如果从vi出发的一个消息能够在传播有限的距离后到达vj,则vj便是vi的有限邻居,记作为
Figure BDA00023560322900000611
定义6(受限邻居节点集合):
Figure BDA0002356032290000071
vi受限邻居节点集合描述vi可以通过贪婪的方式向其传播影响力的节点集合,记为
Figure BDA0002356032290000072
Figure BDA0002356032290000073
受限扩散影响力计算模块用于计算任意节点在受限邻居间的影响力。它的输入有三项:待计算的节点、该节点的受限邻居集合以及该节点对各个受限邻居的直接影响力。第二个参数由受限邻居节点集合模块产生,第三个参数由影响力计算装置的直接影响计算模块产生。
定义7(受限扩散影响力):
Figure BDA0002356032290000074
vi的扩散影响力由式(7)计算。
Figure BDA0002356032290000075
在该式中,activate(vi,vj)决定了vj是否能够被vi激活。activate(vi,vj)由公式(8)定义。由此式可知,如果vi能够激活vj,则activate(vi,vj)=1,否则其值为0。
Figure BDA0002356032290000076
筛选模块的主要任务是选出2K个候选节点,其中K表示种子节点的数量。该模块根据受限扩散影响力计算模块的计算结果,按照受限扩散影响力对所有节点进行降序排列,取前2K个节点作为候选种子节点。
候选种子节点的扩散影响力要比非候选节点大。但是,如果候选节点的影响力彼此重叠,那它们的影响力就会大打折扣。为了最大化种子节点的传播影响力,必须降低重叠开销。本发明采取的策略是如果一个候选节点与种子节点的重叠开销小于预定义的阈值,则该候选节点被选作种子节点;否则,剥夺该候选节点成为种子节点的权力。依据以上策略,影响力重叠检测装置由两个模块构成,分别是重叠开销计算模块和种子节点决策模块。
重叠开销计算模块计算一个给定候选种子节点与一个种子节点之间的重叠开销。它的主要操作根据定义8设置。
定义8(重叠开销):
Figure BDA0002356032290000081
种子节点si和候选节点vj的重叠开销记为OC(si,vj)。
Figure BDA0002356032290000082
式(9)中,δ是一个常量,dis表示从si到vj或者vj到si的距离,可以用跳数表示。OC(si,vj)随着si到vj之间的距离增加而减小,当si和vj互不可达时,OC(si,vj)的值最小,记为0。
种子节点决策模块根据重叠开销计算模块得到的候选种子节点与各个种子节点的重叠开销,决定是否将此候选种子节点作为种子节点。此模块采取的决策策略如下:只要候选节点与任一种子节点的重叠开销大于预定义的开销阈值δcost,则剥夺该候选节点成为种子节点的权力。只有当该候选节点与所有种子节点的重叠开销都小于δcost时,该候选节点才被选为种子节点。
以图2为例。假定v2已经被选择为种子点,v3和v9为候选种子节点,由于v2和v3直接相连,它们的距离为1,OC(v2,v3)=δ。而v2和v9互不可达,故OC(v2,v9)=0,显而易见,v9应被选作种子节点。如果δ小于预定义的阈值,则v3会被选作种子节点。如果δ大于等于此阈值,v3则没有资格成为种子节点。
影响力重叠检测装置工作过程如下:
步骤1:按受限扩散影响力由高到低的顺序对所有的候选种子节点排序;
步骤2:将第一个候选种子节点作为种子加入种子集合;
步骤3:对后续的每个候选种子节点执行下列操作:
步骤3.1:利用重叠开销计算模块计算当前候选种子节点和每个种子的重叠开销;
步骤3.2:利用种子节点决策模块计算是否将当前候选种子节点作为种子节点;如果可以把当前候选节点作为种子,则将此候选种子节点加入种子节点集合;
步骤4:重复步骤3,直到获得K个种子节点。

Claims (5)

1.一种基于约束的种子节点数据挖掘系统,其特征在于:该系统包括影响力计算装置、候选种子筛选装置和重叠开销检查装置,影响力计算装置计算节点的影响力,候选种子筛选装置以影响力计算装置计算得到的影响力为输入,筛选出候选种子节点,重叠开销检查装置以候选种子节点筛选出的候选种子为输入,选择出种子节点,其中:
影响力计算装置包括活跃度计算模块、扩散意愿计算模块、传播潜力计算模块和直接影响力计算模块,活跃度计算模块、扩散意愿计算模块和传播潜力计算模块的输出共同构成直接影响计算模块的输入;
候选种子节点选择装置用于筛选候选种子节点,由受限邻居节点集合模块、受限扩散影响力计算模块和筛选模块组成;
影响力重叠检测装置由重叠开销计算模块和种子节点决策模块组成。
2.根据权利要求1所述的系统,其特征在于:在影响力计算装置中,活跃度计算模块用于计算节点参与信息传播的活跃程度,其中
Figure FDA0002356032280000011
节点vi的活跃度记为Act(vi),由
Figure FDA0002356032280000012
计算,Nvi表示vi的出边邻居集合,Wvi,vj表示连接vi和vj的边的权重。Act(vi)越大,表明vi分享信息的频率越高;
扩散意愿计算模块定量计算节点vi将信息传播给vj的积极程度,
Figure FDA0002356032280000013
Figure FDA0002356032280000014
vi对vj的扩散意愿记为DW(vi,vj),
Figure FDA0002356032280000015
DW(vi,vj)是vi分享信息给vj的优选项,其值越高,表示vi越倾向于向vj共享信息;
传播潜力计算模块计算节点传播信息的潜在能力,
Figure FDA0002356032280000016
vi的传播潜力记为DP(vi),
Figure FDA0002356032280000017
f(vi)=lnoutdegree(vi)+1),其中,outdegree(vi)表示vi的出度,DP(vi)值越高,节点vi的扩散潜力越大;
直接影响计算模块计算一个节点对邻居节点的影响程度,
Figure FDA0002356032280000018
Figure FDA0002356032280000019
vi对vj的直接影响力记为DI(vi,vj),DI(vi,vj)=ω1Act(vi)+ω2Wdiffu(vi,vj)+ω3DP(vi),其中ω1、ω2、ω3分别为节点活跃度、扩散意愿和传播潜力的权重系数。
3.根据权利要求1所述的系统,其特征在于:候选种子节点选择装置的工作流程为:
步骤1:记划定有限邻居的最大距离为max-distance,令dis=1;
步骤2:从网络中选择一个节点记为curNode,构建只包含CurNode的集合N,
步骤3:对于集合N中的每个节点,执行按下列步骤:
步骤3.1:利用节点活跃度计算模块和扩散潜力计算模块分别计算当前节点活跃度和扩散潜力;
步骤3.2:对于当前节点,利用受限邻居节点集合模块计算与当前节点距离为dis的受限邻居集合L;
步骤3.3:利用受限扩散影响力计算模块计算该节点在受限邻居集合中的影响力,具体步骤如下:
步骤3.3.1:对于L中的每个非激活邻居,执行下列操作:
步骤3.3.1.1:利用扩散意愿计算模块计算当前节点对当前非激活邻居的扩散意愿;
步骤3.3.1.2:利用直接影响力计算模块计算当前节点对当前非激活邻居的直接影响力;
步骤3.3.1.3:如果直接影响力大于预定义的阈值θ,则将该邻居置为激活状态,并将其加入集合N中。
步骤3.3.2:从N中删除当前节点,令dis=dis+1,
步骤4:重复步骤3,直至dis大于预定义的距离max-distance;将此过程中激活的受限邻居数量作为curNode的受限扩散影响力;
步骤5:重复步骤2到步骤4,得到网络中每个节点的受限扩散影响力;
步骤6:利用筛选模块,选出2K个候选种子节点。
4.根据权利要求1所述的系统,其特征在于:候选种子节点选择装置中,受限邻居节点集合模块输入一个给定节点,输出该节点的受限邻居节点集合,
Figure FDA0002356032280000021
Figure FDA0002356032280000022
如果从vi出发的一个消息能够在传播有限的距离后到达vj,则vj便是vi的受限邻居,记作为
Figure FDA0002356032280000026
Figure FDA0002356032280000023
vi受限邻居节点集合描述vi通过贪婪的方式向其传播影响力的节点集合,记为CNvi
Figure FDA0002356032280000024
Figure FDA0002356032280000025
受限扩散影响力计算模块用于计算任意节点在受限邻居间的影响力,输入待计算的节点、该节点的受限邻居集合以及该节点对各个受限邻居的直接影响力,
Figure FDA0002356032280000031
vi的受限扩散影响力
Figure FDA0002356032280000032
activate(vi,vj)决定了vj是否能够被vi激活,
Figure FDA0002356032280000033
如果vi能够激活vj,则activate(vi,vj)=1,否则其值为0。
筛选模块选出受限扩散影响力最大的2K个节点作为候选种子节点,其中K表示种子节点的数量。
5.根据权利要求1所述的系统,其特征在于:影响力重叠检测装置工作过程如下:
步骤1:按受限扩散影响力由高到低的顺序对所有的候选种子节点排序;
步骤2:将第一个候选种子节点作为种子加入种子集合;
步骤3:对后续的每个候选种子节点执行下列操作:
步骤3.1:利用重叠开销计算模块计算当前候选种子节点和每个种子的重叠开销;
步骤3.2:利用种子节点决策模块计算是否将当前候选种子节点作为种子节点;如果可以把当前候选节点作为种子,则将此候选种子节点加入种子节点集合;
步骤4:重复步骤3,直到获得K个种子节点。
CN202010008842.7A 2020-01-06 2020-01-06 一种基于约束的种子节点数据挖掘系统 Active CN111221875B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010008842.7A CN111221875B (zh) 2020-01-06 2020-01-06 一种基于约束的种子节点数据挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010008842.7A CN111221875B (zh) 2020-01-06 2020-01-06 一种基于约束的种子节点数据挖掘系统

Publications (2)

Publication Number Publication Date
CN111221875A true CN111221875A (zh) 2020-06-02
CN111221875B CN111221875B (zh) 2022-11-04

Family

ID=70806493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010008842.7A Active CN111221875B (zh) 2020-01-06 2020-01-06 一种基于约束的种子节点数据挖掘系统

Country Status (1)

Country Link
CN (1) CN111221875B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361462A (zh) * 2014-11-21 2015-02-18 西安电子科技大学 基于文化基因算法的社交网络影响最大化方法
CN105260410A (zh) * 2015-09-22 2016-01-20 天津大学 基于亲密度和影响力的微博社交兴趣圈挖掘方法及其装置
CN105938608A (zh) * 2016-04-12 2016-09-14 福建师范大学 一种基于标签影响力的半同步社区发现方法
CN106875281A (zh) * 2017-03-13 2017-06-20 哈尔滨工程大学 基于贪心子图的社会网络节点挖掘方法
CN107220486A (zh) * 2017-05-12 2017-09-29 上海交通大学 基于局部影响力计算的影响力阻断最大化方法
CN108491449A (zh) * 2018-02-25 2018-09-04 河南理工大学 一种基于近邻特征传播标签的社区发现方法
CN109190807A (zh) * 2018-08-15 2019-01-11 上海交通大学 一种面向目标群体的代价最小化传播优化方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361462A (zh) * 2014-11-21 2015-02-18 西安电子科技大学 基于文化基因算法的社交网络影响最大化方法
CN105260410A (zh) * 2015-09-22 2016-01-20 天津大学 基于亲密度和影响力的微博社交兴趣圈挖掘方法及其装置
CN105938608A (zh) * 2016-04-12 2016-09-14 福建师范大学 一种基于标签影响力的半同步社区发现方法
CN106875281A (zh) * 2017-03-13 2017-06-20 哈尔滨工程大学 基于贪心子图的社会网络节点挖掘方法
CN107220486A (zh) * 2017-05-12 2017-09-29 上海交通大学 基于局部影响力计算的影响力阻断最大化方法
CN108491449A (zh) * 2018-02-25 2018-09-04 河南理工大学 一种基于近邻特征传播标签的社区发现方法
CN109190807A (zh) * 2018-08-15 2019-01-11 上海交通大学 一种面向目标群体的代价最小化传播优化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SONGSONG LI,等: "Influence maximization in social networks with user attitude modification", 《2014 IEEE INTERNATIONAL CONFERENCE ON COMMUNICATIONS (ICC)》 *
徐浩,等: "基于NVPA算法的社交网络影响力最大化算法", 《通信技术》 *

Also Published As

Publication number Publication date
CN111221875B (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN108492201B (zh) 一种基于社区结构的社交网络影响力最大化方法
Li et al. Identification of influential spreaders based on classified neighbors in real-world complex networks
Jiang et al. Community detection in complex networks with an ambiguous structure using central node based link prediction
Qiu et al. PHG: A three-phase algorithm for influence maximization based on community structure
Chen et al. Multi-objective optimization of community detection using discrete teaching–learning-based optimization with decomposition
Wang et al. Memetic Algorithm based on Improved Inver–over operator and Lin–Kernighan local search for the Euclidean traveling salesman problem
CN112422571A (zh) 一种跨越多个属性网络进行异常对齐的方法
Liqing et al. TSIM: A two-stage selection algorithm for influence maximization in social networks
Hajarathaiah et al. Efficient algorithm for finding the influential nodes using local relative change of average shortest path
Han et al. Identifying top-k influential nodes based on discrete particle swarm optimization with local neighborhood degree centrality
CN110598055A (zh) 一种基于属性图的并行图摘要方法
Liang et al. Region2vec: Community detection on spatial networks using graph embedding with node attributes and spatial interactions
Li et al. ABEM: An adaptive agent-based evolutionary approach for influence maximization in dynamic social networks
Wang et al. A two phase removing algorithm for minimum independent dominating set problem
CN111221875B (zh) 一种基于约束的种子节点数据挖掘系统
CN113127730A (zh) 一种基于重叠社区的社区检测方法、终端设备及存储介质
Banerjee et al. Epidemic thresholds with external agents
Rácz et al. Matching correlated inhomogeneous random graphs using the k-core estimator
CN103902547A (zh) 一种基于mdl的增量式动态社区快速发现方法及系统
Lee et al. Spectral bounds for independent cascade model with sensitive edges
Proulx et al. Modeling social network relationships via t-cherry junction trees
CN113592663A (zh) 一种基于社区度和结构洞的影响力最大化方法
Gong et al. Influence maximization on hypergraphs via multi-hop influence estimation
Zhu et al. PHEE: Identifying influential nodes in social networks with a phased evaluation-enhanced search
CN109039722B (zh) 基于共同邻节点资源分配和朴素贝叶斯的链路预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant