CN115063251A - 基于关系强度与反馈机制的社交传播动态网络表示方法 - Google Patents
基于关系强度与反馈机制的社交传播动态网络表示方法 Download PDFInfo
- Publication number
- CN115063251A CN115063251A CN202210601033.6A CN202210601033A CN115063251A CN 115063251 A CN115063251 A CN 115063251A CN 202210601033 A CN202210601033 A CN 202210601033A CN 115063251 A CN115063251 A CN 115063251A
- Authority
- CN
- China
- Prior art keywords
- node
- network
- time
- propagation
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000006854 communication Effects 0.000 title claims abstract description 55
- 238000004891 communication Methods 0.000 title claims abstract description 54
- 230000008713 feedback mechanism Effects 0.000 title claims abstract description 19
- 230000008859 change Effects 0.000 claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 35
- 230000007246 mechanism Effects 0.000 claims abstract description 15
- 230000004931 aggregating effect Effects 0.000 claims abstract description 5
- 238000004220 aggregation Methods 0.000 claims description 20
- 230000002776 aggregation Effects 0.000 claims description 18
- 230000006399 behavior Effects 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000000737 periodic effect Effects 0.000 claims description 3
- 230000001902 propagating effect Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 abstract description 7
- 230000003993 interaction Effects 0.000 description 10
- 102100026983 Protein FAM107B Human genes 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 230000003068 static effect Effects 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000005295 random walk Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于关系强度与反馈机制的社交传播动态网络表示方法,属于社交传播领域,包括:基于关系强度将社交传播动态网络划分为关系网络与传播网络;对传播动态网络进行描述;对社交传播网络中的节点表示;更新相关节点的邻接矩阵与注意力权重,同时聚合节点信息并反馈节点变化信息,最后结合自相关项与时间项更新节点表示;将attention机制应用到动态的模型中来度量各个节点的权重,考虑网络动态变化对attention的影响;本发明提供的方法用于社交传播动态网络表示,进行动态链接预测任务,解决了动态网络表示的及时性问题。
Description
技术领域
本发明涉及社交网络分析领域,特别是指基于关系强度理论与反馈机制的社交传播动态 网络表示。
背景技术
互联网的迅速发展和进步,以及移动设备的快速更新换代助推了在线社交网络的发展, 这极大拓宽了人们获取消息、传播信息、表明态度的渠道,传播主体的下沉使得每个人都能 成为社交传播的主体。然而个体意见通过社交网络汇聚成集体意见,民意的自由表达若被有 心人利用将会引发社会舆论压力,因此,社交网络社交传播的研究是必要的。
近年来深度学习技术在众多领域的不同任务中都展现了较为优异的性能。在社交传播领 域,当前利用深度学习技术处理社交传播预测任务有一套较为通用的流程:首先,将社交网 络用户节点与连边进行网络表示学习(Network Representation Learning,NRL),将网络结构数 据表示为低维稠密向量;然后,再将低维稠密向量的网络节点作为输入进行各类社交传播预 测任务。因此要提升社交传播预测的性能,合适、高效的网络表示学习方法就显得尤为重要。
网络表示学习大致可分为静态网络表示和动态网络表示两类。静态网络表示方法早期大 都基于谱聚类,但这类方法时间和空间的复杂度较高,无法满足日益增长的网络规模的需求。 随着网络表示学习的发展,许多新的表示学习模型被提出。DeepWalk将网络嵌入问题描述为 一个序列建模问题,通过随机游走的方式生成节点序列,并使用Skip-Gram学习节点表示。 基于DeepWalk模型,Node2vec集成了深度优先搜索和广度优先搜索策略,更灵活地探索挖 掘网络结构信息。另外,结合外部信息的方法有TADW、CANE、MMDW。以上静态网络表 示学习方法尝试解决目前网络领域面临的大规模性、网络空间高维性难题,然而真实世界的 互动系统是动态的,其连边、节点都是随时间不断变化的。这些时间特性是动态网络的重要 体现,也反映了网络演化机制和其上的动力学。因此,在社交传播领域的研究中静态网络表 示学习并不适用。
关于动态网络的研究是相对较少的,并且大多数研究局限于表示为图的快照序列的离散 时间动态图,这些模型虽然可以通过忽略时间演化特性将静态网络深度学习模型应用于动态 网络中,但这并非最优方案,同时这些方法对于每一个时间片都需要进行重新训练,因此时 间成本巨大。此外这些方法虽然表现了网络在不同时刻的变化特征,但缺乏对网络动态变化 本质属性的挖掘,对现实网络的高度动态性建模不够。
对于社交网络中的社交传播而言,动态网络表示学习依旧存在几个挑战:
1)结合传播学理论建立更加贴合真实世界的有效网络表示
本发明在进一步分析社交网络中的社交传播时发现,在社交传播网络中普遍存在着区别 于社交强关系的弱关系(即存在非好友关系的用户对形成了社交传播关联)。强弱关系假设是 社会学与传播学中一个很重要的理论,Friedkin认为弱关系在信息流传播过程中起推动和“桥 梁”的作用,连接了不同的关系群体。而在现今开放社交网络蓬勃发展,弱关系的存在可使 社交传播得更快更广,因此弱关系的存在是不可忽视的。
2)及时捕获网络动态演化信息
自然观察到的关联以及之间的交互行为存在动力学关系,但是现有方法中没有一种能够 对它们进行联合建模,进而通过动态图进行表示学习。此外,当前大部分算法都是直推式的, 即针对特定领域或特定网络结构生成固定节点嵌入,而当网络结构或信息发生改变时,直推 式表示学习模型就需要进行重新训练,相较之下归纳式学习的方法更加适用于网络变化。然 而大多归纳式学习的方法仅采用聚合的方式生成节点表示,对于社交传播网络容易造成延迟, 从而影响到下游机器学习任务的性能。
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于关系强度与反馈机制 的社交传播动态网络表示方法,本发明结合社会传播学中的关系强度等相关理论,加入信息 反馈机制,建立更适用于社交网络社交传播扩散分析的动态网络表示模型,用以对社交传播 网络进行动态网络表示,解决现有研究方法不能很好反映真实传播网络、忽略社交传播中的 动力学特征以及网络动态演化信息表示的及时性问题。
本发明采用如下技术方案:
基于关系强度与反馈机制的社交传播动态网络表示方法,所述方法包括:
基于关系强度将社交传播动态网络划分为关系网络与传播网络;
对社交传播动态网络以及对社交传播动态网络变化进行描述;
对社交传播动态网络中的节点更新进行表示;
对节点领域信息进行更新,包括:更新相关节点的邻接矩阵与注意力权重,同时聚合节 点信息并反馈节点变化信息,结合自相关项与时间项更新节点表示;
引入attention机制度量各个节点的权重,实现节点信息的聚合与反馈。
具体地,对社交传播动态网络以及对社交传播动态网络变化进行描述,具体为:
首先,我们定义t时刻的社交传播动态网络:
Gt=(Vt,et)
其中,Vt为节点集合,et表示边的集合;
然后,在时间窗口[0,t]中社交传播动态网络变化的集合定义为:
O={(u,v,t,k)}
其中,{u,v}表示发生变化的两个节点,t表示时刻,k作为一个标记,k=0代表关系网络 的变化,k=1代表传播网络的变化;在社交传播网络中t时刻发生的变化简化描述为ti,k,k∈{0,1}。
具体地,对社交传播动态网络中的节点更新进行表示,具体为:
节点更新的表示可以描述为:
其中,Ev(t)为节点v在t时刻的节点表示;表示t-1时刻用户节点邻域间的影响, 即提取、聚合网络结构信息并反馈变化信息,是关于节点v的邻居节点u的信息的表示 向量,其中包含注意力机制;MrEv(t-1)表示自身历史变化的影响,Ev(t-1)是节点v过去表示 的周期性状态;MT(τ-τt-1)表示外部环境的影响,τ表示时间点,Ms、Mr、MT为可学习参 数。
具体地,对节点领域信息进行更新,具体为:
1)节点i与节点j在t-1时刻无关联,t时刻发生i到j的传播行为;
节点的注意力关系强度矩阵S不变,即:
Si,j(t)=Si,j(t-1),S∈n×n
n*n表示关系强度矩阵为方阵,n代表矩阵大小;
2)节点i与节点j在t-1时刻已存在关联,t时刻发生i到j的传播行为;
引入概率密度λ度量节点对的关系强度,并采用softplus函数作为外部函数,概率密度 λ计算方式为:
所以λ时刻节点的注意力关系强度矩阵S的计算为:
其中,Ni(t)表示节点i的邻居节点个数;
3)节点i与节点j无关联,t时刻同时发生关联以及从i到j的传播行为;
节点i与节点j的邻接矩阵更新为Ai,j(t)=1;节点i邻域注意力权重改变,同时在t时刻传 播网络改变,节点i与邻居节点的注意力关系强度矩阵S计算公式为:
其中,Ui表示节点i所有邻居节点的集合;
产生关联的节点i与节点j的注意力关系强度矩阵为注意力关系强度矩阵Si,j(t)。
具体地,引入attention机制度量各个节点的权重,实现节点信息的聚合与反馈,具体为:
其中,Si,r(t)表示节点i与邻域的注意力关系强度矩阵;Er(t-1)表示节点i邻居节点t-1时 刻的节点表示;Mh与bh为可学习的、控制社交传播的参数;Ui(t)表示节点i的邻居节点的集合 σ(*)表示sigmoid激活函数;
引入了attention反馈机制,将节点i的信息反馈到其邻居节点,在发生动态变化的节点 i更新了节点表示后,节点i向邻域反馈自身变化信息,邻居节点的表示Er(t)的更新公式为:
其中,Er(t-1)为t-1时刻节点i邻居节点的表示;Md为可学习向量;(Ei(t)-Ei(t-1))表示 节点i的变化信息;Ui(t-1)表示t-1时刻节点i的邻居节点的集合。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
(1)本发明提出基于关系强度与反馈机制的社交传播动态网络表示方法,结合社会传播 学中的关系强度等相关理论,加入信息反馈机制,建立更适用于社交网络社交传播扩散分析 的动态网络表示模型,用以对社交传播网络进行动态网络表示,解决现有研究方法不能很好 反映真实传播网络、忽略社交传播中的动力学特征以及网络动态演化信息表示的及时性问题。
(2)本发明通过计算变化节点对的概率密度和邻接矩阵,更新节点注意力强度矩阵,聚 合节点邻域变化信息,以及融合节点邻域变化信息、自身历史信息以及外部影响因素对社交 传播动态网络进行归纳式表示学习,同时引入反馈机制将最新的节点表示反馈到邻居节点, 解决网络表示及时性问题,提升网络表示性能。
附图说明
图1为本发明实施例提供的基于社交传播动态网络(DNRep)模型的框架图;
图2为本发明实施例提供的本发明方法与处理时间快照网络的动态网络表示方法的实验 对比结果(Hits@10)
图3为本发明实施例提供的本发明方法与处理时间快照网络的动态网络表示方法的实验 对比结果(MAR)
图4为本发明实施例提供的LDG(bilinear)与DNRep的时间效率比较。
具体实施方式
以下通过具体实施方式对本发明作进一步的描述。
如图1,为为本发明实施例提供的基于社交传播动态网络(DNRep)模型的框架图;
(1)基于关系强度将社交传播动态网络划分为关系网络与传播网络
本发明融合了社交网络关系强度理论和信息反馈机制,提出了动态网络表示模型(Dynamic Network Representations,DNRep)。在建立DNRep模型时,本发明结合了传播 学中的关系强度理论,将社交传播动态网络划分为关系网络(强关系)和传播网络(弱关系)。考虑社交传播过程中,关系网络和传播网络都在不断变化,而两者是共存的,且变化相互影响,形成传播动力学演化机制,因此将表示学习过程作为两个网络的中介过程,将两个网络的变化过程联系起来,从而驱动两个网络演变,并使节点表示随时间动态演化。
基于关系强度将社交传播动态网络划分为关系网络与传播网络,具体为:
将社交传播动态网络划分为传播网络(弱关系网络)和关系网络(强关系网络),并且以 强关系变化来辅助影响弱关系交互,以动态变化驱动网络,用归纳式的方法从两个子网络的 相互驱动中得到网络表示。
划分规则:互动较多且双方关系比较紧密的是强关系,而互动较少且没有比较强情感维 系的就是弱关系。将此种关系强度理论引入到社交网络的划分中,我们可以认为用户间已建 立的关系网络就是一种强关系,信息能够轻易在强关系网络中传播;而由用户间的信息交流 构成的传播网络则可以认定为弱关系,只在某一时刻针对特定事件或特定信息产生互动,是 一种临时性的短期关系。
好处:将传播动态网络分为更细致、更贴合实际传播网络的两种动态网络类型,更能够 将真实的网络传播信息体现在网络表示中。
(2)传播动态网络的描述
用户间已建立的关系网络就是一种强关系,信息能够轻易在强关系网络中传播;而由用 户间的信息交流构成的传播网络则可以认定为弱关系,只在某一时刻针对特定事件或特定信 息产生互动,是一种临时性的短期关系。
首先,基于以上理论,我们定义t时刻的传播动态网络:
Gt=(Vt,et)
其中,Vt为节点集合,et表示边的集合。
然后,在时间窗口[0,t]中网络变化的集合定义为:
O={(u,v,t,k)}
其中,{u,v}表示发生变化的两个节点,t表示时刻,k作为一个标记,k=0代表网络拓扑 结构演变(即关系网络的变化),k=1代表“固定”网络拓扑结构上的交互活动(即传播网 络的变化)。在社交传播网络中t时刻发生的变化也可简化描述为ti,k,k∈{0,1}。
(3)网络节点表示
在社交传播网络中影响节点表示变化的因素主要有三个:1)用户节点间建立新的关系(强 关系或弱关系),信息从一个邻域传播到另一个邻域;2)节点自身过去变化带来的影响(如 时间衰减);3)外部因素影响。因此节点更新的表示可以描述为:
其中,Ev(t)为节点v在t时刻的节点表示;表示t-1时刻用户节点邻域间的影响, 即提取、聚合了网络结构信息并反馈了变化信息,是关于节点v的邻居节点u的信息的 表示向量,其中包含注意力机制;MrEv(t-1)表示自身历史变化带来的影响,Ev(t-1)是节点v 过去表示的周期性状态;MT(τ-τt-1)表示外部环境的影响,如与该节点相关的两次网络拓扑 结构的变化之间会产生外部影响,τ表示时间点。Ms、Mr、MT为可学习参数。
(4)节点邻域信息更新
社交传播网络中用户节点的变化大致可以分为三类:1)该时刻节点间只形成弱关系;2) 节点间已存在关注、好友等强关系,该时刻发生了如转发的弱关系交互行为;3)该时刻节点 间既形成了强关系也形成了弱关系。DNRep模型更新节点表示的流程图如图1所示(以第三 类,即关联网络与传播网络同时发生变化为例)。
图1中展示了在t时刻,节点2与节点4之间发生了关联(强关系)与传播(弱关系)行为,由于关系网络与传播网络同时发生变化,因此需要更新相关节点的邻接矩阵与注意力权 重,同时聚合节点信息并反馈节点变化信息,最后结合自相关项与时间项更新节点表示。
由于节点间的变化可能有三类不同的情况发生,因此对于节点邻域信息的更新,本发明 对三类情况分别进行讨论。
1)节点i与节点j在t-1时刻无关联,t时刻发生i到j的传播行为
此时由于仅形成弱关系,因此节点的注意力关系强度矩阵S不变,即:
Si,j(t)=Si,j(t-1),S∈n×n
n*n表示关系强度矩阵为方阵,n代表矩阵大小;
2)节点i与节点j在t-1时刻已存在关联,t时刻发生i到j的传播行为
为了度量节点对的关系强度,引入概率密度λ。考虑λ需要满足计算结果为正值的条件下 还需要区分关联网络与传播网络,本发明利用softplus函数作为外部函数,概率密度λ计算 方式为:
所以λ时刻节点的注意力关系强度矩阵S的计算为:
其中,Ni(t)表示节点i的邻居节点个数。
3)节点与节点j无关联,t时刻同时发生关联以及从i到j的传播行为
由于在t时刻产生关联,所以节点i与节点j的邻接矩阵更新为Ai,j(t)=1。关联行为产生的 网络拓扑结构的改变也使得节点i邻域注意力权重发生改变,同时在t时刻传播网络也发生了 变化,因此节点i与邻居节点的注意力关系强度矩阵S计算公式为:
其中,Ui表示节点i所有邻居节点的集合。
而新产生关联的节点i与节点j的注意力关系强度矩阵S的计算方式如式(6)。
(5)节点信息聚合与反馈
本发明将attention机制应用到动态的模型中来度量各个节点的权重,考虑了网络动态 变化对attention的影响,并利用softmax将聚合信息以向量形式输出,因此节点i邻域信息 聚合的输出向量计算公式为:
其中,Si,r(t)表示节点i与邻域的注意力关系强度矩阵;Er(t-1)表示节点i邻居节点t-1时 刻的节点表示;Mh与bh为可学习的、控制社交传播的参数;Ui(t)表示节点i的邻居节点的集合。
式(3)中,由于Ej(t-1)为自相关项,(τ-τt-1)为时间相关项,两者均可直接进行计算,因 此可以根据式(3)计算得到i时刻的节点表示Ei(t-1)。
然后为了提高网络更新的及时性,我们引入了反馈机制,将节点i的信息反馈到其邻居节 点。在发生动态变化的节点i更新了节点表示后,节点i向邻域反馈了自身变化信息,邻居节 点的表示Er(t)的更新公式为:
其中,Er(t-1)为t-1时刻节点i邻居节点的表示;Md为可学习向量;(Ei(t)-Ei(t-1))表示 节点i的变化信息;Ui(t-1)表示t-1时刻节点i的邻居节点的集合。
将采用本发明方法表示的社交传播网络输入预测模型进行训练;具体训练方法为:
首先模型采用无监督的学习过程,整个模型待学习的参数空间Ω为:
Ω={Ms,Mr,Mt,Mh,Md,bh,{wk}k=0,1,{ψk}k=0,1}
然后模型的训练过程通过最小化负对数似然实现,对于一个在时间窗口[0,T]上产生了n 次变化的集合O,损失函数L的定义为:
其中,n≠0;λ为节点对关系强度的概率密度函数;后一项表示总的残存概率。
本发明实施例为了评估本发明提供的社交传播动态网络模型的性能,提高可比性,本发 明选用的数据集是前人工作所使用的数据集,包括Social Evolution数据集和Github数据集;
Social Evolution数据集包含了超过200万个事件(包括社交传播事件与关系建立事件)。 本发明将观点交换等社交传播事件作为模型的传播网络,将师生间的closefriend关系作为模 型的关系网络。由于相邻间隔记录的数量太大并且包含大量噪声,因此我们采用与DyRep模 型相同的方式对该数据集进行预处理,根据相邻间隔记录发生的概率进行过滤。预处理后的 数据集统计如表1所示。
Github数据集根据时间轴记录了开发人员编写代码、提交文档以及访问收藏等内容,数 据集每小时更新一次。本发明将开发人员间的关注收藏等行为构成的网络作为模型的关系网 络,将文档的访问和提交等行为构成的网络作为模型的传播网络。同时采用与LDG模型相似 的预处理方法后,得到的数据集统计如表1所示。
表1Social Evolution和Github数据集
数据集 | Social Evolution | Github |
节点数 | 83 | 284 |
初始关联 | 575 | 149 |
最终关联 | 708 | 710 |
训练事件 | 43834 | 11644 |
测试事件 | 10535 | 9082 |
为了更好对比模型性能,本发明选择了七种具有代表性的方法作为对比方法,具体如下:
(1)Node2vec模型。Node2vec模型是利用网络中存在类似结构特征(即社区结构)的特 点而设计的一种既保持节点邻居信息又能体现网络信息的易训练网络嵌入模型,其基本思想 和Deepwalk类似,也是生成随机游走,对随机游走进行采样得到网络节点表示。
(2)DynGem模型。一种动态网络表示学习算法,使用深度自编码器对动态图的快照进行 编码,将时间线划分为离散的时间点,并保留结构,学习在这些时间点上的图形快照的嵌入。
(3)GraphSage模型。一种归纳式表示学习方法,采样图中每个节点的邻居结构信息,再 通过聚合函数聚合采样信息,从而得到图中各个顶点的向量表示。
(4)GAT模型。GAT模型在GraphSage模型的基础上对邻域采用多头非均匀注意力机制。
(5)Know-Evolve模型。Know-Evolve模型是将时间点过程引入动态图表示学习的先驱, 模型结合动态时间点过程和深度神经网络框架,考虑了知识随时间的进化以及实体在多元关 系中复杂的交互过程,通过参数化条件强度函数和关系得分将知识图中事件的发生建模为多 维点过程。
(6)DyRep模型。将图结构的变化分为两种过程,引入聚合机制并结合注意力机制,通过 训练对应的参数得到相关节点表示,且这种表示是可以动态变化的。本发明所设计模型是基 于DyRep模型进行改进的。
(7)LDG模型。LDG模型使用神经关系推理(NRI)模型来推理图中的事件类型,可以同时考虑两种以上类型的边,将DyRep模型拓展为研究多关系图,同时还加入双线性编码层(Bilinear Encoder Layers),用以捕获不同节点之间更深层次的交互。
评估标准如下:
链接预测就是预测下一时刻可能产生交互关联的用户。由于存在大量潜在的目标用户, 因此精确的预测下一个用户通常是不现实的,但是可以预测一个用户候选集。预测下一个可 能转发信息的用户可以被视为一个检索问题,将所有下一时刻可能产生链接的用户进行排序, 采用排名指标作为评价标准。参照现有的社交传播扩散研究,选择前十命中率(HITS@10) 和平均排名(Mean Average Rank,MAR)作为评价指标。
前十命中率(HITS@10):在进行预测任务时对于给定元组,计算其与其他节点的条件 密度,并对它们进行排名,再与下一时刻进行对比,测试节点出现在前十名的次数的比例。 HITS@10值越高表示实验评价结果越好。
平均排名(Mean Average Rank,MAR):测试元组的平均排名。MAR越小则实验评价结 果越好。
实验的超参数设置:训练的batch_size=200,dropout=0,隐藏层的神经元个数d=32。本 发明使用Adam优化器来训练模型,学习率为0.0002。每个模型运行10次取平均结果。
图2、图3分别为本发明方法与Node2vec、DyGem、GraphSage、GAT四种基于时间快照离散网络的动态网络表示方法在两个数据集上的Hits@10值与MAR值对比结果。以上这几种表示方法在处理动态图时的主要思路都是将动态图切分成离散的快照图,然后对当前时 刻的快照图进行静态网络表示。真实世界的社交传播网络是动态的,并且变化发生的时间分 布不均匀,在连续的时间序列中静态网络表示性能受到极大影响。因此这几种模型在真实世 界动态网络数据集的预测任务中效果并不好。
对于Social Evolution数据集,四种模型中性能最优的是GraphSage模型,HITS@10和 MAR值分别为0.12和37.0;对于数据量较大、节点分布较为稀疏的Github数据集,GAT模 型由于引入了多头非均匀注意力机制,所以处理稀疏数据的性能在四者中较优,HITS@10和MAR值分别为0.21和107.1。而较为经典的Node2vec模型,通过随机游走,再对结果采样, 结合社区结构等特征生成节点表示,在处理数据规模大、节点稀疏的Github数据集时效果并 不好,MAR值达到了139.4(随机预测的MAR值约为140)。
本发明的方法是一种处理连续时间网络的动态网络表示方法,在连续变化的动态网络中 能有较为优异的性能,实验证明本发明的方法明显优于以上四种方法。
表2为本发明的方法与其他基于连续时间网络的动态网络表示方法在SocialEvolution和 Github数据集上的实验对比结果。其中,性能最优的实验结果用粗体标注,次优的用下划线 标注。
表2与处理连续时间网络的动态网络表示方法的实验对比结果
针对实验的结果,将本发明所提模型与其他基线方法做对比,作出如下分析。
1)与Know-Evolve模型对比。
Know-Evolve模型主要适用于知识图谱的表示学习,对于真实世界动态网络数据集的表 示效果较为有限。在Social Evolution数据集中实验得到的HITS@10和MAR值分别为0.25 和30.0;在Github数据集中实验得到的HITS@10和MAR值分别为0.17和109.8。Know-Evolve 模型相较于前三种切分成离散快照图形式的网络表示学习方法性能上还是有一定优势的,但 是相比于本发明的方法,显然本发明的方法效果更优。
2)与DyRep模型对比。
对于DyRep模型,本发明主要基于DyRep模型框架进行改进,在该模型上考虑了传播 学的关系强度理论以及在节点信息聚合后加入信息反馈机制。在Social Evolution数据集的实 验中,本发明方法在HITS@10和MAR值上分别比DyRep模型提高了0.09和1.6;在Github 数据集中,本发明的方法在两个评价指标上分别高出了0.03和25.7。由此说明本发明改进后 模型性能有了较为明显的提升。
3)与LDG模型对比。
LDG模型使用神经关系推理(NRI)来改进DyRep模型,突破了DyRep模型只能研究两种关系类型的限制;另外加入了双线性编码层,使模型能捕获更多节点信息。没有加入双线性编码层的条件下,本发明的方法在两个数据集上的各项评价指标均优于LDG模型。
对于加入双线性编码层的LDG模型,本发明的方法在Social Evolution数据集进行实验 得到的结果在HITS@10和MAR两个指标上分别高了0.19和2.5。而由于Github数据集数据 量大且节点分布稀疏,双线性编码层在大型稀疏网络中捕获的潜在关系能有效提高下游预测 任务的性能,所以本发明的方法在Github数据集上的实验结果是次优的。
本发明在Intel(R)Xeon(R)W-2102CPU,NVIDIA GeForce GTX 1080GPU,32G内存,Windows 10Professional系统环境下,对本发明的方法与加入双线性编码层的LDG模型在两 个数据集中进行链接预测任务的时间效率测试。测试进行十次取平均结果,测试结果如图4 所示。
测试结果显示本发明的方法的时间效率明显优于加入双线性层的LDG模型,其中本发明 的方法在Social Evolution数据集上平均时间效率高于加入双线性层的LDG模型91.8%,而在 Github数据集上本发明的方法也同样高出了87.2%。
综上所述,本发明提出的DNRep模型在真实网络数据集的实验中各项评价指标都是最优 或次优的。加入双线性编码层后的LDG模型在Github数据集上表现出较为优异的性能,然 而在时间效率上本发明所提方法要显著优于LDG模型。对于真实世界中只包含强弱两种关系 的较为稠密的社交传播网络,本发明提出的DNRep模型更为适用、综合性能更佳。总体而言 本发明做出的改进是有效的,所提出的DNRep模型对于提高下游预测任务的性能有着显著成 效。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对 本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
Claims (5)
1.基于关系强度与反馈机制的社交传播动态网络表示方法,其特征在于,所述方法包括:
基于关系强度将社交传播动态网络划分为关系网络与传播网络;
对社交传播动态网络以及对社交传播动态网络变化进行描述;
对社交传播动态网络中的节点更新进行表示;
对节点领域信息进行更新,包括:更新相关节点的邻接矩阵与注意力权重,同时聚合节点信息并反馈节点变化信息,结合自相关项与时间项更新节点表示;
引入attention机制度量各个节点的权重,实现节点信息的聚合与反馈。
2.根据权利要求1所述的基于关系强度与反馈机制的社交传播动态网络表示方法,其特征在于,对社交传播动态网络以及对社交传播动态网络变化进行描述,具体为:
首先,我们定义t时刻的社交传播动态网络:
Gt=(Vt,et)
其中,Vt为节点集合,et表示边的集合;
然后,在时间窗口[0,t]中社交传播动态网络变化的集合定义为:
O={(u,v,t,k)}
其中,{u,v}表示发生变化的两个节点,t表示时刻,k作为一个标记,k=0代表关系网络的变化,k=1代表传播网络的变化;在社交传播网络中t时刻发生的变化简化描述为ti,k,k∈{0,1}。
4.根据权利要求1所述的基于关系强度与反馈机制的社交传播动态网络表示方法,其特征在于,对节点领域信息进行更新,具体为:
1)节点i与节点j在t-1时刻无关联,t时刻发生i到j的传播行为;
节点的注意力关系强度矩阵S不变,即:
Si,j(t)=Si,j(t-1),S∈n×n
其中,n*n表示关系强度矩阵为方阵,n代表矩阵大小;
2)节点i与节点j在t-1时刻已存在关联,t时刻发生i到j的传播行为;
引入概率密度λ度量节点对的关系强度,并采用softplus函数作为外部函数,概率密度λ计算方式为:
所以λ时刻节点的注意力关系强度矩阵S的计算为:
其中,Ni(t)表示节点i的邻居节点个数;
3)节点i与节点j无关联,t时刻同时发生关联以及从i到j的传播行为;
节点i与节点j的邻接矩阵更新为Ai,j(t)=1;节点i邻域注意力权重改变,同时在t时刻传播网络改变,节点i与邻居节点的注意力关系强度矩阵S计算公式为:
其中,Ui表示节点i所有邻居节点的集合;
产生关联的节点i与节点j的注意力关系强度矩阵为注意力关系强度矩阵Si,j(t)。
5.根据权利要求1所述的基于关系强度与反馈机制的社交传播动态网络表示方法,其特征在于,引入attention机制度量各个节点的权重,实现节点信息的聚合与反馈,具体为:
其中,Si,r(t)表示节点i与邻域的注意力关系强度矩阵;Er(t-1)表示节点i邻居节点t-1时刻的节点表示;Mh与bh为可学习的、控制社交传播的参数;Ui(t)表示节点i的邻居节点的集合;
引入了attention反馈机制,将节点i的信息反馈到其邻居节点,在发生动态变化的节点i更新了节点表示后,节点i向邻域反馈自身变化信息,邻居节点的表示Er(t)的更新公式为:
其中,Er(t-1)为t-1时刻节点i邻居节点的表示;Md为可学习向量;(Ei(t)-Ei(t-1))表示节点i的变化信息;Ui(t-1)表示t-1时刻节点i的邻居节点的集合,σ(*)表示sigmoid激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210601033.6A CN115063251A (zh) | 2022-05-30 | 2022-05-30 | 基于关系强度与反馈机制的社交传播动态网络表示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210601033.6A CN115063251A (zh) | 2022-05-30 | 2022-05-30 | 基于关系强度与反馈机制的社交传播动态网络表示方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115063251A true CN115063251A (zh) | 2022-09-16 |
Family
ID=83198398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210601033.6A Pending CN115063251A (zh) | 2022-05-30 | 2022-05-30 | 基于关系强度与反馈机制的社交传播动态网络表示方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115063251A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349386A (zh) * | 2023-10-12 | 2024-01-05 | 吉玖(天津)技术有限责任公司 | 一种基于数据强弱关联模型的数字人文应用方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413844A (zh) * | 2019-05-24 | 2019-11-05 | 浙江工业大学 | 基于时空注意力深度模型的动态链路预测方法 |
CN111709518A (zh) * | 2020-06-16 | 2020-09-25 | 重庆大学 | 一种基于社区感知和关系注意力的增强网络表示学习的方法 |
CN111931903A (zh) * | 2020-07-09 | 2020-11-13 | 北京邮电大学 | 一种基于双层图注意力神经网络的网络对齐方法 |
CN112446542A (zh) * | 2020-11-30 | 2021-03-05 | 西安电子科技大学 | 基于注意力神经网络的社交网络链路预测方法 |
CN112508085A (zh) * | 2020-12-05 | 2021-03-16 | 西安电子科技大学 | 基于感知神经网络的社交网络链路预测方法 |
US20210160142A1 (en) * | 2019-11-22 | 2021-05-27 | International Business Machines Corporation | Generalized correlation of network resources and associated data records in dynamic network environments |
CN113762334A (zh) * | 2021-07-26 | 2021-12-07 | 南昌航空大学 | 一种采用深度强化学习评估异质社交网络关键节点的方法 |
CN114037550A (zh) * | 2021-10-29 | 2022-02-11 | 成都博智云创科技有限公司 | 一种动态社交网络表示学习方法 |
-
2022
- 2022-05-30 CN CN202210601033.6A patent/CN115063251A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413844A (zh) * | 2019-05-24 | 2019-11-05 | 浙江工业大学 | 基于时空注意力深度模型的动态链路预测方法 |
US20210160142A1 (en) * | 2019-11-22 | 2021-05-27 | International Business Machines Corporation | Generalized correlation of network resources and associated data records in dynamic network environments |
CN111709518A (zh) * | 2020-06-16 | 2020-09-25 | 重庆大学 | 一种基于社区感知和关系注意力的增强网络表示学习的方法 |
CN111931903A (zh) * | 2020-07-09 | 2020-11-13 | 北京邮电大学 | 一种基于双层图注意力神经网络的网络对齐方法 |
CN112446542A (zh) * | 2020-11-30 | 2021-03-05 | 西安电子科技大学 | 基于注意力神经网络的社交网络链路预测方法 |
CN112508085A (zh) * | 2020-12-05 | 2021-03-16 | 西安电子科技大学 | 基于感知神经网络的社交网络链路预测方法 |
CN113762334A (zh) * | 2021-07-26 | 2021-12-07 | 南昌航空大学 | 一种采用深度强化学习评估异质社交网络关键节点的方法 |
CN114037550A (zh) * | 2021-10-29 | 2022-02-11 | 成都博智云创科技有限公司 | 一种动态社交网络表示学习方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349386A (zh) * | 2023-10-12 | 2024-01-05 | 吉玖(天津)技术有限责任公司 | 一种基于数据强弱关联模型的数字人文应用方法 |
CN117349386B (zh) * | 2023-10-12 | 2024-04-12 | 吉玖(天津)技术有限责任公司 | 一种基于数据强弱关联模型的数字人文应用方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Niyogisubizo et al. | Predicting student's dropout in university classes using two-layer ensemble machine learning approach: A novel stacked generalization | |
CN112199608B (zh) | 基于网络信息传播图建模的社交媒体谣言检测方法 | |
CN110674840A (zh) | 一种基于贝叶斯网络的多方证据关联模型构建方法和证据链提取方法及装置 | |
CN109523021A (zh) | 一种基于长短时记忆网络的动态网络结构预测方法 | |
CN107391542A (zh) | 一种基于文件知识图谱的开源软件社区专家推荐方法 | |
Li et al. | Heterogeneous dynamic graph attention network | |
CN117591944B (zh) | 一种针对于大数据分析的学习预警方法及系统 | |
CN112148891A (zh) | 一种基于图感知张量分解的知识图谱补全方法 | |
Liu et al. | Research and citation analysis of data mining technology based on Bayes algorithm | |
CN114969078A (zh) | 一种联邦学习的专家研究兴趣实时在线预测更新方法 | |
CN116401380A (zh) | 面向异构知识图谱的对比学习预测方法及系统 | |
Zhou et al. | Betweenness centrality-based community adaptive network representation for link prediction | |
Chen et al. | Pre-training on dynamic graph neural networks | |
CN115063251A (zh) | 基于关系强度与反馈机制的社交传播动态网络表示方法 | |
He et al. | Modeling knowledge proficiency using multi-hierarchical capsule graph neural network | |
CN115982373A (zh) | 结合多级交互式对比学习的知识图谱推荐方法 | |
CN113256024B (zh) | 一种融合群体行为的用户行为预测方法 | |
CN115827968A (zh) | 一种基于知识图谱推荐的个性化知识追踪方法 | |
CN115481325A (zh) | 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统 | |
Liao | Development and Utilization of English Online Course Resources Based on Fuzzy Neural Network | |
Liu et al. | A novel recommendation algorithm with knowledge graph | |
Stanhope et al. | Group link prediction | |
Shi et al. | A survey on bayesian graph neural networks | |
CN116192650B (zh) | 一种基于子图特征的链路预测方法 | |
Namdeo et al. | Result analysis using classification techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |