CN114553818A - 社交网络影响力最大化节点识别方法及系统 - Google Patents
社交网络影响力最大化节点识别方法及系统 Download PDFInfo
- Publication number
- CN114553818A CN114553818A CN202210169168.XA CN202210169168A CN114553818A CN 114553818 A CN114553818 A CN 114553818A CN 202210169168 A CN202210169168 A CN 202210169168A CN 114553818 A CN114553818 A CN 114553818A
- Authority
- CN
- China
- Prior art keywords
- node
- influence
- value
- weighted
- updated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000004364 calculation method Methods 0.000 claims description 35
- 230000001105 regulatory effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 16
- 238000010187 selection method Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000000342 Monte Carlo simulation Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- ZOKXUAHZSKEQSS-UHFFFAOYSA-N tribufos Chemical compound CCCCSP(=O)(SCCCC)SCCCC ZOKXUAHZSKEQSS-UHFFFAOYSA-N 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- -1 hydrogen Chemical class 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供一种社交网络影响力最大化节点识别方法及系统,包括:对于给定的社交网络,根据每个节点的三元闭包结构数量,计算每个节点的三元闭包加权度值;根据每个节点的所有邻居节点的所述三元闭包加权度值,计算每个节点的加权影响力期望值;基于每个节点的所述加权影响力期望值降序排列所有节点;根据降序排列的加权影响力期望值,进行影响力最大化节点识别。本发明解决了在社交网络影响力最大化节点识别过程中,更新节点影响力期望值的现有方法时间复杂度过高,以及影响力最大化节点选取方法过于局部化,识别结果不够准确的问题。
Description
技术领域
本发明属于社交网络分析技术领域,尤其涉及一种社交网络影响力最大化节点识别方法及系统。
背景技术
随着全球社交媒体网络的发展,社交网络已成为移动互联网时代信息传播的核心枢纽。社交网络由多个电子设备(如计算机、手机等)联网构成,用于实现信息的发布和传播;社交网络中的节点即为网络中的各个电子设备。影响力最大化节点指对网络功能影响力最大的一些节点,比如对网络的信息交互能力、数据传输能力的影响。准确识别出社交网络中影响力最大化节点,可以高效地影响网络中的其他节点,从而提升信息在该社交网络中的影响力和传播能力,例如,影响范围和传输速度等。
基于影响力最大化的社交网络节点识别方法大致可以分为三类:基于蒙特卡洛模拟的贪心方法、基于采样的近似方法和基于拓扑结构的启发式方法。
基于蒙特卡洛模拟的贪心方法需要进行大量的蒙特卡洛模拟,导致复杂度很高,难以适用于大规模社交网络;基于采样的近似方法的采样过程需要消耗大量的内存,仍不适用于大规模社交网络;与前两种类型相比,基于拓扑结构的启发式算法在时间效率、内存消耗与最终的影响范围结果上可以达到平衡,因而其为目前大规模社交网络的影响力最大化识别的通用方法。但现有技术在节点的影响力期望值更新过程中,需要更新网络中所有剩余节点,而非精准地更新某个节点的期望值,从而阻碍了在时间效率方面的进一步改进;在关键节点选取过程中,现有技术一般依据度值或修正度值最大的原则选取节点,没有考虑网络的全局信息,从而导致选取节点的策略过于局部化,识别出的节点不够准确。
发明内容
鉴于上述的分析,本发明旨在提供一种社交网络影响力最大化节点识别方法及系统,用于解决现有基于拓扑结构的启发式社交网络影响力最大化方法在更新节点影响力期望过程中时间复杂度过高以及影响力最大化节点选取方法过于局部化的问题。
本发明的目的主要是通过以下技术方案实现的:
一方面,本发明公开了一种社交网络影响力最大化节点识别方法,包括以下步骤:
对于给定的社交网络,根据每个节点的三元闭包结构数量,计算每个节点的三元闭包加权度值;
根据每个节点的所有邻居节点的三元闭包加权度值,计算每个节点的加权影响力期望值;
基于每个节点的加权影响力期望值降序排列所有节点;
根据降序排列的加权影响力期望值,进行影响力最大化节点识别。
进一步的,前述的根据降序排列的加权影响力期望值,进行影响力最大化节点识别,包括:
选取影响力期望值最大的节点;
判断选取的所述影响力期望值最大的节点的影响力期望值是否已更新;
若已更新,则将其作为种子节点放入种子节点集合,将其期望值置负,并将所述网络中的所有节点置为未更新状态;
若未更新,则更新其影响力期望值,并将其置为已更新状态;重新降序排列所有节点并选取影响力期望值最大的节点,直至选出已更新且影响力期望值最大的节点;
其中,种子节点集合中的节点即为识别得到的影响力最大化节点。
进一步的,进行一次所述影响力最大化节点识别后,还包括:
重新基于每个节点的所述加权影响力期望值降序排列所有节点;
判断并更新下一个所述影响力期望值最大的节点的加权影响力期望值;
根据降序排列的加权影响力期望值,进行影响力最大化节点识别;直至选出所需数量的影响力最大化节点。
进一步的,前述的更新节点的影响力期望值,包括:
排除已识别的影响力最大化节点及其所有邻居节点,得到待更新节点的当前邻居节点结构,根据待更新节点的当前邻居节点的三元闭包结构,计算待更新节点的所有当前邻居节点的更新加权度值;
根据待更新节点的当前邻居节点的更新加权度值,计算待更新节点的更新加权影响力期望值。
进一步的,根据下述公式计算所述更新加权度值,
其中,GTD(u)表示节点u的更新加权度值;Nu表示节点u邻居节点集合;S表示已识别的影响力最大化节点集合,即种子节点集合;Nu∪{u}表示节点u本身及其邻居的集合;表示除S和其所有邻居之外的节点集合;ω为调节参数,ω=1/<d>,<d>表示网络的平均度值;nuv表示节点u与节点v间存在三元闭包的数量。
进一步的,根据下述公式计算待更新节点的更新加权影响力期望值,
其中,E(u)表示节点u的更新加权影响力期望;Su表示节点u的邻居中种子节点集合;NSu表示节点u的邻居中非种子节点集合;p(u,k)表示节点u影响节点k的传播概率;GTD(k)表示节点k的更新加权度值。
进一步的,利用下述公式计算每个节点的三元闭包加权度值:
其中,TD(u)表示给定的所述社交网络中节点u的基于三元闭包加权度值;Nu∪{u}表示节点u本身及其邻居的集合;nuv表示节点u与节点v之间存在三元闭包的数量;ω为网络的调节参数,ω=1/<d>,<d>表示网络的平均度值。
进一步的,利用下式计算每个节点的加权影响力期望值:
其中,E(u)表示节点u的加权影响力期望值;Nu表示节点u的邻居节点集合;p(u,v)表示节点u对节点v的传播概率;TD(v)为节点v的基于三元闭包的加权度值。
本发明还提供一种社交网络影响力最大化节点识别系统,其特征在于,包括:
加权影响力期望值计算模块,用于根据给定社交网络中每个节点的三元闭包结构数量,计算每个节点的三元闭包加权度值和加权影响力期望值;
加权影响力期望更新迭代计算模块,用于计算节点的更新加权度值和更新加权影响力期望值;
影响力最大化节点统计模块,用于根据降序排列的加权影响力期望值,选取影响力期望值最大的节点,直至选出所需数量的影响力最大化节点。
进一步的,前述的节点识别系统还包括影响力期望值排序单元、节点更新判断单元、更新加权度值计算单元和更新加权影响力期望值计算单元;
所述影响力期望值排序单元,用于基于每个节点的所述加权影响力期望值降序排列所有节点,并选取影响力期望最大的节点;
节点更新判断单元,用于判断已选节点的影响力期望值是否已更新;若已更新,则通过影响力最大化节点统计模块识别为种子节点,并放入种子节点集合;若未更新,则将其设定为待更新节点;
更新加权度值计算单元,排除已识别的种子节点及其所有邻居节点,得到待更新节点的当前邻居节点结构,根据待更新节点的当前邻居节点的三元闭包结构,计算待更新节点的当前邻居节点的更新加权度值;
更新加权影响力期望值计算单元,用于根据待更新节点的当前邻居节点的更新加权度值,计算待更新节点的更新加权影响力期望值。
本技术方案的有益效果:
本发明充分利用社交网络中的三元闭包信息结构,并考虑到节点间的紧密度特性,采用基于三元闭包加权的影响力期望迭代计算方法确保社交网络影响力最大化节点识别的准确性。
在节点选取过程中,仅需精准更新网络中尚未更新的期望值最大的节点,极大的提高了时间效率。
本申请的影响力最大化节点识别方法包含了全局信息,即考虑了网络中节点间的传播概率与每选取一个影响力最大化节点后网络节点间的更新变化,识别出的影响力最大化节点集合影响力强、稳定性高。
本发明的关键技术点:
1.将三元闭包结构应用于社交网络影响力最大化识别方法中,综合考虑节点间的传播概率与基于三元闭包的加权度值,准确地评估节点在网络中的影响力,极大提高了所识别出的影响力最大化节点集合的影响力效果。
2.在节点选取过程中,仅需更新当前轮次中网络的期望值最大的节点,而非网络中剩余节点,因而极大的提高了算法的时间效率。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例的基于三元闭包的社交网络影响力最大化节点识别方法的流程示意图。
图2为本发明实施例的基于三元闭包的社交网络影响力最大化节点识别系统的结构示意图。
图3为本发明实施例的一个简单网络的结构示意图。
图4为本发明实施例的图3所示网络结构中节点6的更新示意图。
图5为本发明实施例的图3所示网络结构中节点2的更新示意图。
图6为Bible网络的影响力指标示意图。
图7为Gnutella-09网络的影响力指标示意图。
图8为Ca-CondMat网络的影响力指标示意图。
图9为Douban网络的影响力指标示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
社交网络可以为如下真实网络:Bible网络、Gnutella-09网络、Ca-CondMat网络、Douban网络等。
本发明的技术构思:三元闭包结构具有很强的传递性和聚集性,基于三元闭包结构的加权影响力期望综合考虑节点间的传播概率与基于三元闭包的加权度值,因而基于三元闭包结构的加权影响力期望值较大的节点,其聚集性和传递性更强,所以基于三元闭包结构识别出的影响力最大化节点在网络中必然高度互联,可以更加高效地影响网络中的其他节点,从而让信息的影响范围更大;且基于三元闭包结构在进行影响力最大化节点识别过程中,可以在排除掉已被识别出的影响力最大化节点后,精准的更新下一个加权影响力期望值最大的节点,使得基于三元闭包的影响力最大化识别方法既考虑了社交网络的全局信息精确识别节点,且极大的提高了时间效率,能够适用于当前社交网络的快速发展需要。
实施例一:
图1为本发明实施例的社交网络影响力最大化节点识别方法的流程示意图。
本实施例提供一种社交网络影响力最大化节点识别方法,如图1所示,包括:
步骤S110、对于给定的社交网络,根据三元闭包结构计算网络中所有节点的基于三元闭包的加权影响力期望值,包括:
根据给定的社交网络中三元闭包结构的数量计算网络中所有节点的基于三元闭包的加权度值;
根据三元闭包加权度值计算所有节点的基于三元闭包的加权影响力期望值。
其中,具体利用下述公式计算给定的网络中每个节点的基于三元闭包的加权度值:
其中,TD(u)表示给定的社交网络中节点u的基于三元闭包加权度值;Nu∪{u}表示节点u本身及其邻居的集合;nuv表示节点u与节点v之间存在三元闭包的数量;ω为调节参数,ω=1/<d>,<d>表示网络的平均度值。平均度值可以衡量社交网络中节点之间的紧密程度,其值越低表示节点间的交互较少,在计算基于三元闭包的加权度值的过程中,考虑到网络的调节参数ω,在本实施例中,设置ω=1/<d>,<d>表示网络的平均度值;当给定的网络紧密度越高,ω的值越小,每个节点的基于三元闭包的加权度值也越小,更有利于提高网络中不同节点的影响力区分度,从而提高网络中影响力最大化节点识别的准确性。
利用下述公式计算所有节点的基于三元闭包的加权影响力期望值:
其中,E(u)表示节点u的基于三元闭包的加权影响力期望;Nu表示节点u邻居节点集合;p(u,v)表示节点u对节点u的传播概率;TD(v)为节点v的基于三元闭包的加权度值。
步骤S120、基于每个节点的基于三元闭包的加权影响力期望值降序排列所有节点;
步骤S130、根据降序排列的加权影响力期望值,进行影响力最大化节点识别。
可选的,步骤S130包括:
根据降序排列的加权影响力期望值,选择期望值最大的节点;
判断所选取的影响力期望值最大的节点的影响力期望值是否已更新;
若已更新,则将其作为种子节点放入种子节点集合,将其期望值置负,并将网络中的所有节点置为未更新状态;
若未更新,则更新其影响力期望值,并将其置为已更新状态;重新降序排列所有节点并选取影响力期望值最大的节点,直至选出已更新且影响力期望值最大的节点;
其中,前述的种子节点集合中的节点即为识别得到的影响力最大化节点。
所述更新节点的影响力期望值包括:
排除已识别的影响力最大化节点及其所有邻居节点,得到待更新节点的当前邻居结构,根据待更新节点的当前邻居节点的三元闭包结构,计算待更新节点的所有当前邻居节点的更新加权度值;
根据待更新节点的当前邻居节点的更新加权度值,计算待更新节点的更新加权影响力期望值。
具体的,利用下述公式计算待更新节点的所有当前邻居节点的更新加权度值:
其中,GTD(u)表示节点u的基于三元闭包的更新加权度值;Nu表示节点u邻居节点集合;S表示已识别的影响力最大化节点集合,即种子节点集合;Nu∪{u}表示节点u本身及其邻居的集合;表示除S和其所有邻居之外的节点集合;ω为调节参数,其值设置为平均度值的倒数(即ω=1/<d>),nuv表示节点u与节点v间存在三元闭包的数量。
利用下述公式计算节点基于三元闭包的更新加权影响力期望值:
其中,E(u)表示节点u的基于三元闭包的更新加权影响力期望;Su表示节点u的邻居中种子节点集合;NSu表示节点u的邻居中非种子节点集合;p(u,k)表示节点u对节点k的传播概率;GTD(k)表示节点k的基于三元闭包更新加权度值。
需要说明的是,在计算节点的更新加权影响力期望值过程中,为了消除已选中的种子节点及其邻居节点的富人俱乐部影响,在计算更新加权度值时,需排除已选的种子节点及其邻居节点,得到待更新节点的当前邻居结构,根据待更新节点的当前邻居节点的三元闭包结构,计算所述待更新节点的所有当前邻居节点的更新加权度值;并根据待更新节点的当前邻居节点的更新加权度值,计算待更新节点的更新加权影响力期望值;即,本实施例对节点加权度值和影响力期望值的更新,需要排除已选中的种子节点及其邻居,更新当前影响力期望值最大的节点,更新过程是基于社交网络全局性的变化,得到的更新加权影响力期望值更加准确,可以更加精确地反映其在社交网络中的影响范围,从而提高了社交网络影响力最大化节点的识别准确性。
在计算节点的更新加权影响力期望值的过程中,同样需要考虑已被选中的种子节点的影响,其中表示的是节点u的邻居中非种子节点的期望增益部分,NSu为节点u的所有邻居中排除已被选中的影响力最大化的节点后的节点集合,即为节点u的所有邻居中非种子节点集合;表示的是已被选中的种子节点及其邻居相互作用后的减益部分,Su为节点u的所有邻居中已被选为影响力最大化的节点的集合,即为节点u的所有邻居节点中的种子节点的集合。
需要说明的是,本申请在计算加权影响力期望值过程中,考虑到社交网络增益部分和减益部分的影响,即考虑到社交网络的全局信息,使得识别到的影响力最大化节点更为准确,影响范围更大,结构也更加稳定。
进一步,识别出一个影响力最大化节点并放入种子节点集合后,需要迭代更新节点的影响力期望值计算过程和影响力最大化节点选取过程,直至选出所需数量的影响力最大化节点,包括:
识别出一个影响力最大化节点并放入种子节点集合后,重新排序并更新下一个加权影响力期望值最大的节点;
若其期望值更新后仍为最大,则将其作为种子节点放入种子节点集合;
若其期望值在更新后不是最大值,则更新下一个期望值最大的节点,直至所选择的节点更新后的期望值为最大值,则将其作为种子节点放入种子节点集合;
重复前述的更新期望值、按期望值进行排序以及识别种子节点的步骤,直至选出所需要数量的影响力最大化节点。
需要说明的是,本申请基于三元闭包的影响力最大化节点识别方法,可以精准的更新期望值最大的节点,极大的提高了识别效率,使得本方案能够适用于大多数复杂网络。
实施例二:
本发明还提供一种社交网络影响力最大化节点识别系统,如图2所示,包括:加权影响力期望计算模块210,加权影响力期望更新迭代计算模块220,影响力最大化节点统计模块230。
系统中,加权影响力期望计算模块210根据给定的社交网络,基于三元闭包结构计算网络中所有节点的三元闭包加权度值和加权影响力期望值。
具体的,加权影响力期望计算模块210包括:加权度值计算单元211和加权影响力期望计算单元212;
其中,加权度值计算单元211用于根据三元闭包结构计算网络中所有节点的三元闭包加权度值;
加权影响力期望计算单元212与加权度值计算单元211相连,用于根据所述节点加权度值计算所有节点的加权影响力期望值。
特殊的,加权度值的计算函数为:
其中,TD(u)表示网络中节点u的基于三元闭包加权度值;Nu∪{u}表示节点u自身及其邻居集合;nuv表示节点u与节点v之间存在三元闭包的数量;ω为网络的调节参数,值的大小表示网络的紧密程度,在本方法中,设置ω=1/<d>,<d>表示网络的平均度值。
进一步的,加权影响力期望的计算函数为:
其中,E(u)表示节点u的基于三元闭包的加权影响力期望值;Nu表示节点u邻居节点集合;p(u,v)表示节点u对节点u的传播概率;TD(v)为节点v的基于三元闭包的加权度值。
系统中,加权影响力期望更新迭代计算模块220与加权影响力期望计算模块210相连,用于计算更新加权度值和更新加权影响力期望值。
具体的,加权影响力期望更新迭代计算模块220包括:影响力期望排序单元221、节点更新判断单元222、更新加权度值计算单元223和更新加权影响力期望计算单元224;
其中,影响力期望排序单元221与加权影响力期望计算单元212相连,用于根据节点的影响力期望值降序排列所有节点并选取影响力期望最大的节点;
节点更新判断单元222与影响力期望排序单元221相连,判断被选中的影响力期望值最大的节点是否已更新;
更新加权度值计算单元223与节点更新判断单元222相连,用于根据当前邻居节点的三元闭包结构,计算所述待更新节点的所有当前邻居节点的更新加权度值;所述当前邻居节点是排除已识别的种子节点及其所有邻居后,待更新节点剩余的邻居节点;
更新加权影响力期望值计算单元224与更新加权度值计算单元223相连,用于根据待更新节点的当前邻居节点的更新加权度值,计算待更新节点的更新加权影响力期望值。
特殊的,更新加权度值计算单元223的计算函数为:
其中,GTD(u)表示节点u的更新加权度值;Nu表示节点u邻居节点集合;S表示种子节点集合;Nu∪{u}表示节点u本身及其邻居的集合;表示网络中除S和其所有邻居之外的节点集合;ω为调节参数,其值设置为平均度值的倒数(即ω=1/<d>),nuv表示节点u与节点v间存在三元闭包的数量。
更新加权影响力期望计算单元224的计算函数为:
其中,E(u)表示节点u的基于三元闭包的更新加权影响力期望;其中,NSu表示节点u的邻居中非种子节点集合;p(u,k)表示节点u对节点k的传播概率;GTD(k)表示节点k的基于三元闭包更新加权度值;表示的是节点u的邻居非种子节点的期望增益部分;表示为考虑种子节点的邻居相互作用后的减益部分。
系统中,影响力最大化节点统计模块230,与加权影响力期望更新迭代计算模块220相连,选取已更新的且影响力期望值最大的节点放入影响力最大化节点集合,即种子节点集合;如果未选出所需数量的影响力最大化节点,则调用加权影响力期望更新迭代计算模块220,若已选出所需数量的影响力最大化节点,则系统终止执行,并输出识别出的社交网络影响力最大化节点。
本发明充分利用社交网络中的三元闭包信息结构,并考虑到节点间的紧密度特性,采用基于三元闭包加权的影响力期望迭代计算方法确保社交网络影响力最大化节点识别的准确性。
实施例三:
作为一个具体的实施例,以一个简单的网络示意图为例,用以说明本发明基于三元闭包的社交网络影响力最大化节点识别方法的具体实现方法,网络示意图的拓扑结构如图3所示。
本实施例包括以下具体步骤:
根据给定的社交网络,如图3所示,按照本发明实施例一所述的方法计算图3中24个节点的加权度值和加权影响力期望值,其中,设置调节参数ω=1/<d>=0.3015。结果如表1所示。
表1:基于三元闭包的节点影响力期望值评估结果
可以看出,节点3的加权影响力期望值最大,为32.03,且其更新标志cur为1,表示已更新,所以节点3将被选中作为第一个影响力最大化节点,将其作为种子节点放入种子节点集合;
节点3作为种子节点放入种子节点集合后,为避免重复选择,将其影响力期望值置负(如表2所示);另外,为了保证影响力最大化节点识别的准确性,在选中一个种子节点并放入种子节点集合后,需将所有节点的更新标志cur置为未更新状态,以确保下一个影响力期望值最大的节点被选中后,排除已识别的种子节点及其所有邻居,重新根据网络中当前的三元闭包结构计算更新加权影响力期望值。
在图3所示网络中,节点3被识别为种子节点并放入种子节点集合后,在选择第二个影响力最大化节点时,首先选择当前影响力期望最大的节点,即节点6,其影响力期望如表1所示为22.56,其更新标志cur为0,即为未更新状态;按照本发明实施例一所述的方法对其进行更新,即计算其更新加权影响力期望值。
如图4所示,节点5、7、13表示节点6的邻居中不与节点3相连的节点,节点14-17和节点20表示在节点6与节点3之间构建三元闭包的节点,图4中节点14-17和节点20组成的节点集合即为与当前需更新节点(即节点3)和其邻居种子节点所能构成三元闭包的节点集合,即Nj∩NSu。在根据实施例一的方法计算节点6的更新加权度值及更新加权影响力期望值时,需排除节点14-17和节点20,得到节点6当前的邻居结构,并基于当前的邻居结构计算节点6的当前邻居节点的更新加权度值,进一步根据其更新加权度值计算更新加权影响力期望值;如表2所示,节点6的更新后的影响力期望值为4.02,其更新标志在更新后需置为1。
此时,网络中影响力期望最大的节点为节点2,其影响力期望值如表1所示为15.03,且为未更新状态,因此需要对节点2的影响力期望按照本发明实施例一所述的方法对其进行更新。如图5所示,根据基于三元闭包的加权影响力期望值更新方法更新节点2的影响力期望值,其值降为13.19,将其更新标志置为1(如表2所示)。在本次更新后,节点2的期望值为最大且其更新标志为1,因此将节点2作为第二个种子节点放入种子节点集合。
表2.图3中节点影响力期望更新变化情况
本实施例通过一个简单的网络示意图,采用本发明的节点识别方法进行影响力最大化节点识别,所识别出的关键节点为3号和2号节点。若按照初始的影响力期望值排序,影响力期望值最大的两个节点分别为3号和6号节点;但根据本发明的关键节点识别方法,首先,由于3号节点的综合影响力更强,因此3号节点作为第一个影响力最大化节点被识别;此外,由于3号节点和6号节点的邻居之间存在大量的重叠,因此在3号节点被选为影响力最大化节点之后,6号节点所能影响到的节点变得十分有限;本方法依靠其网络节点影响力期望更新策略很好地避免了已识别节点的影响并选择了2号节点。根据网络示意图可见,由3号、2号所组成的影响力最大化节点集合所覆盖的影响范围更广,由此证明了本发明的有效性。
实施例四:
本实施例以四个真实网络为例,将本发明提出的社交网络影响力最大化节点识别方法用于四个真实网络的影响力最大化节点识别,并与其他典型的基于影响力最大化的社交网络关键节点识别方法进行比较。选取的典型方法包括:节点度方法(Degree)、DegreeDiscount方法(简称DD)、Martingale Influence Maximization(简称IMM)、FirstImprovement of Degree Distance(简称FIDD)、Degree Punishment(简称DP)、Probability-Based Multi-hop Degree Method(简称ProbD)、Local Index Rank(简称LIR)以及Node Coverage Gain(简称NCG);本发明所述方法简称为TC-IM(Triadic Closurebased Influence Maximization)。为了更好地评价各种重要性评估方法的性能,此处引入影响力指标Influence spread;影响力指标定义如下:
Influence spread(k)=MCG(k,p)
其中,G为网络拓扑结构,k表示选取的关键节点个数,p表示网络中的传播概率,MCG(k,p)为选取k个关键节点在网络结构G中以传播概率p进行一定次数(通常是1万次)的蒙特卡洛模拟后得到的平均影响范围。易知,该影响力指标越大,表明选取出的关键节点的传播能力越强,对应的方法越有效。
本实施例所应用到的四个真实网络分别为:
1)Bible描述包含《圣经》(授权版)中的名词(地名和人名)关系的网络;
2)Gnutella-09反映点对点文件共享的一系列快照的网络;
3)Ca-CondMat涵盖了提交到“凝聚态”类别的作者论文之间的科学协作关系,反映凝聚态物理协作的网络;
4)Douban反映中国在线推荐网站豆瓣的社交网络。
各个网络的详细参数见表3。
表3:真实网络的具体参数
数据集 | N | E | <d> | d<sub>max</sub> | ω |
Bible | 1773 | 9131 | 10.30 | 364 | 0.0971 |
Gnutella-09 | 8114 | 26013 | 6.4119 | 102 | 0.1559 |
Ca-CondMat | 23133 | 93497 | 8.0784 | 279 | 0.1238 |
Douban | 154908 | 327162 | 4.2240 | 287 | 0.2367 |
其中,N和E分别表示网络中的节点总数和存在连边总数;<d>表示网络的平均度,即网络中所有节点度值的均值;dmax表示最大度,它反应了网络中拥有最多邻居的节点的具体度值;ω表示网络中的调节参数,其值设置为平均度值的倒数(即ω=1/<d>)。图6~图9分别对应Bible网络、Gnutella-09网络、Ca-CondMat网络和Douban网络。从图6~图9可以看出,随着选择的关键节点规模变化,本发明所提出的TC-IM方法始终可以取得非常好的效果,在Influence spread指标上高于其他对比方法。虽然IMM方法也有着很好的效果,但是该方法的时间复杂度高,有着较大的内存需求,因而不适用于大型的社交网络。因此,较之其它8种基于影响力最大化的社交网络关键节点识别方法,本发明所述方法能够更准确地识别影响力最大化节点。
综上所述,本实施例公开的基于三元闭包的社交网络影响力最大化节点识别方法及系统,与其他典型基于影响力最大化的社交网络关键节点识别方法相比,对于不同关键节点规模,都可以取得非常好的效果。
本发明充分利用社交网络中的三元闭包信息结构,并考虑到节点间的紧密度特性,采用基于三元闭包加权的影响力期望迭代计算方法确保社交网络影响力最大化节点识别的准确性;本发明在节点选取过程中,仅需精准更新网络中尚未更新的期望值最大的节点,大大节省了时间的开销。故本发明的社交网络影响力最大化节点识别方法包含了全局信息,选取的影响力最大化节点集合影响力强、稳定性高,且具有时间效率高的优势
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种社交网络影响力最大化节点识别方法,其特征在于,包括以下步骤:
对于给定的社交网络,根据每个节点的三元闭包结构数量,计算每个节点的三元闭包加权度值;
根据每个节点的所有邻居节点的所述三元闭包加权度值,计算每个节点的加权影响力期望值;
基于每个节点的所述加权影响力期望值降序排列所有节点;
根据降序排列的加权影响力期望值,进行影响力最大化节点识别。
2.根据权利要求1所述的节点识别方法,其特征在于,所述根据降序排列的加权影响力期望值,进行影响力最大化节点识别,包括:
选取影响力期望值最大的节点;
判断选取的所述影响力期望值最大的节点的影响力期望值是否已更新;
若已更新,则将其作为种子节点放入种子节点集合,将其期望值置负,并将所述网络中的所有节点置为未更新状态;
若未更新,则更新其影响力期望值,并将其置为已更新状态;重新降序排列所有节点并选取影响力期望值最大的节点,直至选出已更新且影响力期望值最大的节点;
其中,所述种子节点集合中的节点即为识别得到的影响力最大化节点。
3.根据权利要求2所述的节点识别方法,其特征在于,进行一次所述影响力最大化节点识别后,还包括:
重新基于每个节点的所述加权影响力期望值降序排列所有节点;
判断并更新下一个所述影响力期望值最大的节点的加权影响力期望值;
根据降序排列的加权影响力期望值,进行影响力最大化节点识别;直至选出所需数量的影响力最大化节点。
4.根据权利要求2或3所述的节点识别方法,其特征在于,所述更新节点的影响力期望值,包括:
排除已识别的影响力最大化节点及其所有邻居节点,得到待更新节点的当前邻居结构,根据待更新节点的当前邻居节点的三元闭包结构,计算所述待更新节点的所有当前邻居节点的更新加权度值;
根据所述待更新节点的当前邻居节点的更新加权度值,计算待更新节点的更新加权影响力期望值。
9.一种社交网络影响力最大化节点识别系统,其特征在于,包括:
加权影响力期望值计算模块,用于根据给定社交网络中每个节点的三元闭包结构数量,计算每个节点的三元闭包加权度值和加权影响力期望值;
加权影响力期望更新迭代计算模块,用于计算节点的更新加权度值和更新加权影响力期望值;
影响力最大化节点统计模块,用于基于更新后的节点的加权影响力期望值,进行影响力最大化节点识别;直至选出所需数量的影响力最大化节点。
10.根据权利要求9所述的节点识别系统,其特征在于,所述节点识别系统还包括影响力期望值排序单元、节点更新判断单元、更新加权度值计算单元和更新加权影响力期望值计算单元;
所述影响力期望值排序单元,用于基于每个节点的所述加权影响力期望值降序排列所有节点,并选取影响力期望最大的节点;
所述节点更新判断单元,用于判断已选节点的影响力期望值是否已更新;若已更新,则通过影响力最大化节点统计模块识别为种子节点,并放入种子节点集合;若未更新,则将其设为待更新节点;
所述更新加权度值计算单元,排除已识别的种子节点及其所有邻居节点,得到待更新节点的当前邻居结构,根据待更新节点的当前邻居节点的三元闭包结构,计算待更新节点的当前邻居节点的更新加权度值;
所述更新加权影响力期望值计算单元,用于根据待更新节点的当前邻居节点的更新加权度值,计算待更新节点的更新加权影响力期望值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210169168.XA CN114553818B (zh) | 2022-02-23 | 2022-02-23 | 社交网络影响力最大化节点识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210169168.XA CN114553818B (zh) | 2022-02-23 | 2022-02-23 | 社交网络影响力最大化节点识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114553818A true CN114553818A (zh) | 2022-05-27 |
CN114553818B CN114553818B (zh) | 2022-11-18 |
Family
ID=81676875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210169168.XA Active CN114553818B (zh) | 2022-02-23 | 2022-02-23 | 社交网络影响力最大化节点识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114553818B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869054A (zh) * | 2016-03-23 | 2016-08-17 | 哈尔滨工程大学 | 基于三度影响力原则的社会网络影响力最大化的方法 |
CN108809697A (zh) * | 2018-05-18 | 2018-11-13 | 中国矿业大学 | 基于影响力最大化的社交网络关键节点识别方法及系统 |
CN108876648A (zh) * | 2018-06-29 | 2018-11-23 | 中国矿业大学 | 基于节点覆盖范围的社交网络影响力最大化方法及系统 |
US20180349961A1 (en) * | 2017-06-01 | 2018-12-06 | Adobe Systems Incorporated | Influence Maximization Determination in a Social Network System |
CN110084714A (zh) * | 2019-04-25 | 2019-08-02 | 太原理工大学 | 基于有向树的社交网络影响力最大化方法、装置及设备 |
US10452729B1 (en) * | 2014-08-19 | 2019-10-22 | Hrl Laboratories, Llc | System and method for using network data to improve event predictions |
CN110838072A (zh) * | 2019-10-24 | 2020-02-25 | 华中科技大学 | 一种基于社区发现的社交网络影响力最大化方法及系统 |
CN112214689A (zh) * | 2020-10-22 | 2021-01-12 | 上海交通大学 | 基于社交网络中群体的影响力最大化方法及系统 |
CN112446634A (zh) * | 2020-12-03 | 2021-03-05 | 兰州大学 | 一种社交网络中影响力最大化节点的探测方法及系统 |
CN113518010A (zh) * | 2021-07-13 | 2021-10-19 | 中国工商银行股份有限公司 | 一种链路预测方法、装置及存储介质 |
CN114037550A (zh) * | 2021-10-29 | 2022-02-11 | 成都博智云创科技有限公司 | 一种动态社交网络表示学习方法 |
-
2022
- 2022-02-23 CN CN202210169168.XA patent/CN114553818B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10452729B1 (en) * | 2014-08-19 | 2019-10-22 | Hrl Laboratories, Llc | System and method for using network data to improve event predictions |
CN105869054A (zh) * | 2016-03-23 | 2016-08-17 | 哈尔滨工程大学 | 基于三度影响力原则的社会网络影响力最大化的方法 |
US20180349961A1 (en) * | 2017-06-01 | 2018-12-06 | Adobe Systems Incorporated | Influence Maximization Determination in a Social Network System |
CN108809697A (zh) * | 2018-05-18 | 2018-11-13 | 中国矿业大学 | 基于影响力最大化的社交网络关键节点识别方法及系统 |
CN108876648A (zh) * | 2018-06-29 | 2018-11-23 | 中国矿业大学 | 基于节点覆盖范围的社交网络影响力最大化方法及系统 |
CN110084714A (zh) * | 2019-04-25 | 2019-08-02 | 太原理工大学 | 基于有向树的社交网络影响力最大化方法、装置及设备 |
CN110838072A (zh) * | 2019-10-24 | 2020-02-25 | 华中科技大学 | 一种基于社区发现的社交网络影响力最大化方法及系统 |
CN112214689A (zh) * | 2020-10-22 | 2021-01-12 | 上海交通大学 | 基于社交网络中群体的影响力最大化方法及系统 |
CN112446634A (zh) * | 2020-12-03 | 2021-03-05 | 兰州大学 | 一种社交网络中影响力最大化节点的探测方法及系统 |
CN113518010A (zh) * | 2021-07-13 | 2021-10-19 | 中国工商银行股份有限公司 | 一种链路预测方法、装置及存储介质 |
CN114037550A (zh) * | 2021-10-29 | 2022-02-11 | 成都博智云创科技有限公司 | 一种动态社交网络表示学习方法 |
Non-Patent Citations (3)
Title |
---|
徐宝达等: "基于社会网络分析的微信公众号信息传播研究", 《情报杂志》 * |
李建华: "有向社交网络中社区发现算法研究及应用", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
王俊,余伟,胡亚慧,李石君: "基于3-layer中心度的社交网络影响力最大化算法", 《计算机科学》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114553818B (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105894372B (zh) | 预测群体信用的方法和装置 | |
WO2019223384A1 (zh) | Gbdt模型的特征解释方法和装置 | |
CN108809697B (zh) | 基于影响力最大化的社交网络关键节点识别方法及系统 | |
Song et al. | A quantile estimation for massive data with generalized Pareto distribution | |
Chatterjee et al. | Single document extractive text summarization using genetic algorithms | |
CN106789338B (zh) | 一种在动态大规模社交网络中发现关键人物的方法 | |
CN115630328A (zh) | 应急物流网络中关键节点的识别方法 | |
CN113157922A (zh) | 基于图的网络实体行为评估、可视化方法 | |
Yu et al. | Fast budgeted influence maximization over multi-action event logs | |
Li et al. | An efficient discrete differential evolution algorithm based on community structure for influence maximization | |
CN110717043A (zh) | 基于网络表示学习训练的学术团队构建方法 | |
Jing et al. | Model specification searches in structural equation modeling with a hybrid ant colony optimization algorithm | |
CN114553818B (zh) | 社交网络影响力最大化节点识别方法及系统 | |
CN116796481A (zh) | 基于改进弹性模型的社交网络关键节点识别方法及系统 | |
CN109255433B (zh) | 一种基于相似性的社区检测的方法 | |
CN113537461B (zh) | 基于sir值学习的网络关键节点发现方法及系统 | |
CN114117306B (zh) | 一种基于本地化差分隐私保护的多目标推荐方法 | |
CN115665082A (zh) | 基于信息熵改进的社交网络关键节点识别方法及系统 | |
CN113347255B (zh) | 边缘服务器选址部署模型及其求解方法 | |
CN108876648B (zh) | 基于节点覆盖范围的社交网络影响力最大化方法及系统 | |
CN113205185A (zh) | 网络模型优化方法、装置、计算机设备和存储介质 | |
Qian et al. | An improved MOEA/D algorithm for complex data analysis | |
Ozturk et al. | Model‐based inference using judgement post‐stratified samples in finite populations | |
CN116056158B (zh) | 一种频率分配方法、装置、电子设备及存储介质 | |
Huang et al. | Influenced node discovery in a temporal contact network based on common nodes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |