CN117171448B - 一种基于图神经网络的多行为社会化推荐方法及系统 - Google Patents
一种基于图神经网络的多行为社会化推荐方法及系统 Download PDFInfo
- Publication number
- CN117171448B CN117171448B CN202311015948.XA CN202311015948A CN117171448B CN 117171448 B CN117171448 B CN 117171448B CN 202311015948 A CN202311015948 A CN 202311015948A CN 117171448 B CN117171448 B CN 117171448B
- Authority
- CN
- China
- Prior art keywords
- behavior
- propagation
- user
- layer
- social
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 35
- 230000006399 behavior Effects 0.000 claims abstract description 135
- 230000003993 interaction Effects 0.000 claims abstract description 36
- 230000008569 process Effects 0.000 claims abstract description 32
- 230000010354 integration Effects 0.000 claims abstract description 31
- 239000010410 layer Substances 0.000 claims description 70
- 238000009792 diffusion process Methods 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 238000010586 diagram Methods 0.000 claims description 11
- 230000003542 behavioural effect Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 6
- 238000012512 characterization method Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 5
- 239000002356 single layer Substances 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 230000001902 propagating effect Effects 0.000 claims description 3
- 230000007480 spreading Effects 0.000 claims description 3
- 238000003892 spreading Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 abstract description 6
- 230000004069 differentiation Effects 0.000 abstract description 3
- 238000001914 filtration Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000002679 ablation Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000012442 analytical experiment Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于图神经网络的多行为社会化推荐方法及系统,涉及推荐技术领域,为了解决现在的推荐方法没有区分与交互行为相关联的信任传播过程。本发明提出一个多行为社会化推荐框架MB‑Soc模型,该模型将细粒度的多行为信息集成到社交推荐架构中,MB‑Soc架构由四个主要部分组成:嵌入层、传播层、多行为集成层和预测层。本发明提出了一种全新的多行为社会化推荐框架MB‑Soc来探索社交推荐中的细粒度信任传播过程,对实体的多种类行为在社交网络中的传播进行区分,并完成在社会化推荐场景下的差分化传播。本发明完成了在真实数据集上的可扩展实验,大量实验证明了本发明所提出的MB‑Soc模型的优越性和有效性。
Description
技术领域
本发明涉及推荐技术领域,特别涉及基于图神经网络的多行为社会化推荐方法及系统。
背景技术
由于数据爆炸和信息过载,推荐系统在我们的日常生活中发挥了至关重要的作用,它侧重于挖掘用户与潜在消费物品之间的分布模式,探索基于历史交互的用户偏好扩散范式。协同过滤将用户与物品之间的交互记录协同分解到一个潜在的表示空间中,然后利用这些潜在的嵌入表示来预测交互情况。基于协同过滤的推荐方法已经成为主流的推荐解决方案。然而,数据稀疏性和冷启动问题仍然是协同过滤与推荐系统场景中的主要挑战,严重制约了推荐性能,影响了推荐精度。为了应对这些挑战,社会化推荐近年来引起了人们的极大关注,并已成为主流的推荐分支。
社会化推荐主要是利用用户与用户之间的社交网络连接,通过用户与用户之间的喜好传播与影响力渗透,从而在协同过滤的基础上更加精细地完成用户偏好的推理。通过引入社会化信息,推荐系统的准确性得到了显著的增强。社会化推荐利用社交网络服务提供的用户间信任正则化或偏好传播来提高推荐性能。其核心思想是社会影响力和社交同质性理论,该理论认为用户倾向于通过社交关系与朋友分享类似的物品。通过利用社交网络中的好友关系作为辅助信息来提高推荐性能,社会化推荐有效缓解了数据稀疏性、冷启动等问题造成的推荐性能下降。
根据社会化推荐所采用的社会关系融合范式,社会化推荐方法一般可以分为两大类:基于社交正则化的协同过滤模型和基于信任传播的协同过滤模型。具体来说,(1)基于社交正则化的方法利用社会关系作为辅助限制来增强用户的表征。通过在协同过滤的基础上对社交网络连接用户的表示进行正则化,将社会约束作为辅助优化目标。通过不同的学习范式得到社会增强的用户表征。(2)基于信任传播的方法通过从社会关系中获得的学习表征来明确地建模偏好扩散过程。信任传播方法借助深度神经网络强大的表示能力,吸收了不同学习范式来完成信任传播的各种扩散特性。包括信任传播过程的图结构信息(图神经网络)、深层非线性隐含信息(卷积神经网络)以及时序依赖关系信息(循环神经网络)等。
尽管这些方法已经取得了令人满意的结果,但它们的一个突出缺点是只对信任扩散过程进行了粗粒度建模,而忽略了社会化推荐中多行为下的微观传播。然而,这在我们的现实生活中可能是不合适的。用户的各种行为分别沿着社会关系扩散,因此用户针对不同行为具有相应的潜在偏好。用户的多类型行为对好友用户的影响力度和影响范围随着行为种类变化而不同。传统的社会化推荐只是粗粒度地描述用户之间的整体影响,并将用户视为封闭的实体,这可能导致推荐性能的下降。如果我们能够利用多行为社会化推荐中多个行为之间的差异化传播信息,就有可能描绘出全面的信任扩散过程,从而提高社会化推荐的性能。
发明内容
本发明要解决的技术问题是:行为信息会促进信任网络中的偏好扩散过程,从而提高社会推荐的性能,然而,传统的社交推荐只将实体(包括用户与物品)描述为一个整体单元,没有区分与交互行为相关联的信任传播过程。针对这一问题,本发明提出了一种全新的多行为社会化推荐框架MB-Soc来探索社交推荐中的细粒度信任传播过程,对实体的多种类行为在社交网络中的传播进行区分,并完成在社会化推荐场景下的差分化传播。
本发有为解决上述技术问题所采用的技术方案为:
一种基于图神经网络的多行为社会化推荐方法,所述多行为社会化推荐方法由输入至输出包括嵌入层、传播层、多行为集成层和预测层;
嵌入层以用户ID和项目ID作为输入,生成相应的ID嵌入表示向量以供进一步计算,ID向量是可训练的模型参数,嵌入层的各种嵌入表示都随着训练优化而进行变化;
传播层对单一行为类型b下的嵌入传播进行建模,将传播过程细分为行为传播模块和信任扩散模块,分别完成用户偏好传播建模和用户偏好在社交网络中的相互影响建模;
通过多行为整合层完成不同行为下的实体嵌入表示整合;对于每个实体,不同的行为嵌入表示实体特征的不同方面;为获得行为嵌入的分布模式以及它们之间的关系,部署基于自监督学习的模型框架来挖掘不同行为之间的相关性,多行为整合层采用对比学习来实现实体多样性的表征;
经过基于对比学习的多行为集成层后,潜在意图嵌入和整体行为嵌入表示在潜在表示空间中趋于一致;利用潜在意图来表示每个实体的整体特征,利用单层线性MLP架构进行预测。
进一步地,所述方法的实现过程为:
变量定义:用户集合U(U={u1,u2,...,uM})、物品集合I(I={i1,i2,...,iN}),其中M=|U|,N=|I|分别表示用户数量与物品数量;
定义多行为交互图GI:已知用户与物品之间的多行为交互历史,构建用户-物品多行为交互图GI=(U,I,EI);其中,EI∈U×I表示用户与物品之间的多行为连边,共包含B种行为;针对EI中任意连边如果表示用户u与物品i在行为种类b下具有交互历史;反之,如果表示没有交互;
同理,定义社交信任图GS:通过用户与用户之间的好友关系构建社交信任图GS=(U,ES)。其中,ES∈U×U表示用户之间的好友关系连边,对于任意如果表示用户u与用户v之间存在好友关系;反之,如果则无好友关系存在;
基于给定上述定义,给出多行为社会化推荐问题的形式化表达如下:给定用户集合U,物品集合I,用户U与物品I之间的多行为交互图GI,用户之间的社会信任图GS,多行为社会化推荐模型完成任意用户u与任意物品i在行为b下的交互概率yui;
嵌入层、传播层、多行为集成层和预测层的实现过程为:
嵌入层:通过初始化一个检查表来生成嵌入,别用和表示用户u和物品i在行为种类b∈{1,…,B}下的ID嵌入表示,其中d为嵌入向量的大小;用不同的行为嵌入来表示不同的行为类型b;对于每个用户u和每个物品i,初始化一个潜在意图嵌入来建模实体在不同行为下的整体意图,分别表示为eu,0和ei,0,所有的嵌入表示都使用具有同一维度d的向量进行表示;
传播层:
行为传播模块:
行为传播模块负责传播在嵌入层中初始化的单行为嵌入表示;针对用户与物品之间的交互偏好的传播,构建了一个基于图神经网络GNN的行为传播模块;在行为传播模块中,主要描述单一行为类型b内用户-物品交互下的行为内偏好扩散现象,首先将多行为图拆分为B个单行为图,分别为对于任意行为类型b,定义单一行为图其中
针对单一行为图针对任意邻接二元组(u,i),定义图神经网络传播过程如下所示:
其中,与分别表示与用户u与物品i在行为b的单一行为图中直接邻接的邻居节点个数;上式中,使用对称归一化的方式来避免不同邻接节点造成的不平衡问题;
信任扩散模块:
在信任扩散模块中,计算用户与用户之间的社会化影响力对其偏好传播的影响过程,设计基于图注意力网络的信任扩散完成社交用户之间的偏好传播;
首先通过一个双层多层感知机网络MLP完成社交图中注意力系数的计算:
其中都是可训练参数,||表示向量连接符号。此外,选用sigmoid函数作为非线性激活函数σ(·);通过双层感知机运算的注意力系数通过softmax函数进行归一化得到最终的注意力系数如下:
其中,表示用户u在图GS上的直接邻接邻居节点用户集合;在获得任意社会元之间的注意系数后,将图的注意扩散过程表述为:
在单一行为类型b下,所有相邻的社会用户都以注意力权重集中传递社会影响;为克服梯度计算问题对社会化嵌入表示和进行了跳线连接,并使用逐位均值池化完成表示:
行为信任多跳传播:
堆叠多个图神经网络传播层可以扩展图神经网络感受野,在更广泛的范围内捕获实体之间的相关性;将公式(1)、公式(2)中的单跳行为传播和公式(3)-公式(6)中的信任扩散过程分别表示为及将两个模块上的单跳传播行为表述为:
通过在交互图和社交图上迭代传播,可以得到用户u和物品i分别在传播深度为l∈{1,2,…,L}的最终嵌入表示,和其中L表示最大传播深度;
分别用和表示用户u和项目i的单一行为整体表征。和通过均值池化得到,用于表示用户的整体行为特性:
多行为整合层:
使用潜在意图嵌入来模拟用户行为的整体意图,每个实体(包括用户和物品)都拥有一种潜在的意识,这种意识指导实体在不同的行为下进行交互,设计一个基于对比学习的对比集成模块来集成不同的行为嵌入;用p,q表示任意实体(包括用户和物品);对比集成模块的学习目标是最小化同一实体的潜在意图嵌入(ep,0)和行为嵌入之间的距离,并最大化任何不同行为嵌入之间的距离;设计两个学习损失项来增强表示过程:
其中sim(·)为相似性计算的判别函数,通过简单而有效的内积运算实现;τ是控制收敛速度的温度参数;
通过利用作项为对比学习的相似损失项,最小化潜在意图嵌入和不同行为嵌入之间的距离;确保了潜在意图嵌入可以揭示实体行为的整体表现;另一方面,项被用来度量任意两个行为嵌入之间的距离;越小,不同的行为嵌入ep,b′和越相似;多行为整合层用于模拟不同嵌入行为的多样性和丰富性,项求反后背包含在总损失中;
预测层:
利用单层线性MLP架构进行预测,以赋予模型更强的表达能力:
其中,与都是模型可训练参数。
进一步地,所述方法的实现还包括模型训练过程:
用均方误差(Mean Squared Error,MSELoss)来表示主学习损失,并加入对比损失项来增强潜在意图嵌入的表达能力和实体特征的多样性:
加入2范式正则化损失项来防止过拟合,模型的整体训练目标函数表示为:
其中,η1和η2是衰减系数,用于调节不同的损失项占比;
进一步地,在模型训练过程中,采用预训练&微调学习策略来提升推荐能力,具体为:在预训练阶段,随机初始化模型,利用损失作为目标项;在微调阶段,使用预训练导出值初始化所有变量,并使用所有损失项(即)完成模型的优化。
一种基于图神经网络的多行为社会化推荐系统,该系统具有与上述技术方案的步骤对应的程序模块,运行时执行上述的一种基于图神经网络的多行为社会化推荐方法中的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现上述的一种基于图神经网络的多行为社会化推荐方法的步骤。
本发明具有以下有益技术效果:
本发明所述的一种基于图神经网络的多行为社会化推荐方法(多行为社会化推荐对应的英文为Multi-Behavior Social Recommender)简称为MB-Soc模型、MB-Soc架构或MB-Soc。本发明更好地实现行为信息促进信任网络中的偏好扩散过程,进一步提高了社会推荐的性能。解决了传统的社交推荐只将实体(包括用户与物品)描述为一个整体单元,没有区分与交互行为相关联的信任传播过程的问题,本发明提出的一种全新的多行为社会化推荐框架MB-Soc来探索社交推荐中的细粒度信任传播过程,对实体的多种类行为在社交网络中的传播进行区分,并完成在社会化推荐场景下的差分化传播,这种差分化传播是本发明首次提出来的。
本发明的主要贡献如下所示:(1)为区分多行为的不同特性表达,有效提取多行为推荐中实体的主要特征,本发明对多行为之间的潜在相关性进行了建模,并提出了一种基于图神经网络的多行为社会推荐架构MB-Soc,将行为反馈的传播与社交关系进行了结合。(2)为完成多行为推荐场景下行为异质性表达及多行为相关性挖掘,本发明提出一个基于自监督学习的多行为集成框架,以同时保证多个行为的相关性和多样性,并探索用户的潜在意图。(3)本发明完成了在真实数据集上的可扩展实验,大量实验证明了本发明所提出的MB-Soc模型的优越性和有效性,解决了本发明记载的技术问题。
附图说明
图1为MB-Soc模型总体框架示意图;图2为消融实验结果对比图;图3为L对模型的影响图;图4为d对模型的影响图。
具体实施方式
1、本发明提出的一种全新的多行为社会化推荐框架MB-Soc来探索社交推荐中的细粒度信任传播过程,对实体的多种类行为在社交网络中的传播进行区分,并完成在社会化推荐场景下的差分化传播。
2、技术方案的具体阐述:
2.1总体方案
问题形式化,变量定义为:用户集合U(U={u1,u2,...,uM})、物品集合I(I={i1,i2,...,iN}),其中M=|U|,N=|I|分别表示用户数量与物品数量。
在此基础上,我们定义多行为交互图GI:已知用户与物品之间的多行为交互历史,我们可以构建用户-物品多行为交互图GI=(U,I,EI)。其中,EI∈U×I表示用户与物品之间的多行为连边,共包含B种行为(例如,加购物车、加收藏、购买等行为)。针对EI中任意连边如果表示用户u与物品i在行为种类b下具有交互历史;反之,如果表示没有交互。
同理,定义社交信任图GS:通过用户与用户之间的好友关系构建社交信任图GS=(U,ES)。其中,ES∈U×U表示用户之间的好友关系连边,对于任意如果表示用户u与用户v之间存在好友关系;反之,如果则无好友关系存在。
给定上述定义,我们给出多行为社会化推荐问题的形式化表达如下:给定用户集合U,物品集合I,用户U与物品I之间的多行为交互图GI,用户之间的社会信任图GS,多行为社会化推荐模型完成任意用户u与任意物品i在行为b下的交互概率yui。
总体方案介绍:本发明提出一个多行为社会化推荐框架MB-Soc模型,该模型将细粒度的多行为信息集成到社交推荐架构中,如图1所示。MB-Soc架构由四个主要部分组成,即(1)嵌入层,(2)传播层,(3)多行为集成层,(4)预测层。我们将在以下部分中详细解释每个组件的实现。
2.2嵌入层
嵌入层以用户ID和项目ID作为输入,生成相应的ID嵌入表示向量以供进一步计算。需要注意的是本发明提出的MB-Soc模型是一个端到端的系统,其中ID向量是可训练的模型参数。因此,嵌入层的各种嵌入表示都随着系统的训练优化而进行变化。
我们通过初始化一个检查表来生成嵌入。我们分别用和表示用户u和物品i在行为种类b∈{1,…,B}下的ID嵌入表示,其中d为嵌入向量的大小。值得注意的是,我们用不同的行为嵌入来表示不同的行为类型b。此外,对于每个用户u和每个物品i,我们初始化一个潜在意图嵌入来建模实体在不同行为下的整体意图,我们分别表示为eu,0和ei,0。为了计算方便,所有的嵌入表示都使用具有同一维度d的向量进行表示。
2.3传播层
MB-Soc采用传播层对单一行为类型b下的嵌入传播进行建模,将传播过程细分为行为传播模块和信任扩散模块,分别完成用户偏好传播建模和用户偏好在社交网络中的相互影响建模。
2.3.1行为传播模块
行为传播模块负责传播在嵌入层中初始化的单行为嵌入表示。针对用户与物品之间的交互偏好的传播,我们构建了一个基于图神经网络GNN的行为传播模块。
具体而言,在行为传播模块中,我们主要描述单一行为类型b内用户-物品交互下的行为内偏好扩散现象。为此,我们首先将多行为图拆分为B个单行为图,分别为对于任意行为类型b,我们定义单一行为图其中
针对单一行为图针对任意邻接二元组(u,i),我们定义图神经网络传播过程如下所示:
其中,与分别表示与用户u与物品i在行为b的单一行为图中直接邻接的邻居节点个数。上式中,我们使用对称归一化的方式来避免不同邻接节点造成的不平衡问题。
2.3.2信任扩散模块
在信任扩散模块中,我们计算了用户与用户之间的社会化影响力对其偏好传播的影响过程。我们设计了基于图注意力网络的信任扩散完成社交用户之间的偏好传播。
我们首先通过一个双层多层感知机网络MLP完成社交图中注意力系数的计算:
其中都是可训练参数,||表示向量连接符号。此外,我们选用sigmoid函数作为非线性激活函数σ(·)。通过双层感知机运算的注意力系数通过softmax函数进行归一化得到最终的注意力系数如下:
其中,表示用户u在图Gs上的直接邻接邻居节点用户集合。在获得任意社会元之间的注意系数后,我们将图的注意扩散过程表述为:
在单一行为类型b下,所有相邻的社会用户都以注意力权重集中传递社会影响。此外,为了克服梯度计算问题,我们对社会化嵌入表示和进行了跳线连接,并使用逐位均值池化完成表示:
2.3.3行为信任多跳传播
堆叠多个图神经网络传播层可以扩展图神经网络感受野,在更广泛的范围内捕获实体之间的相关性。我们将公式(1)、公式(2)中的单跳行为传播和公式(3)-公式(6)中的信任扩散过程分别表示为及因此,我们将两个模块上的单跳传播行为表述为:
通过在交互图和社交图上迭代传播,我们可以得到用户u和物品i分别在传播深度为l∈{1,2,…,L}的最终嵌入表示,和其中L表示最大传播深度。
我们分别用和表示用户u和项目i的单一行为整体表征。和通过均值池化得到,用于表示用户的整体行为特性:
2.4多行为整合层
本发明通过多行为整合层完成不同行为下的实体嵌入表示整合。对于每个实体,不同的行为嵌入表示实体特征的不同方面。本发明的目标是探索行为嵌入的分布模式以及它们之间的关系。因此,自然的解决方案是部署基于自监督学习的模型框架来挖掘不同行为之间的相关性。具体来说,多行为整合层采用对比学习来实现实体多样性的表征。
本发明使用潜在意图嵌入来模拟用户行为的整体意图。其理念是,每个实体(包括用户和物品)都拥有一种潜在的意识,这种意识指导实体在不同的行为下进行交互。因此,我们设计了一个基于对比学习的对比集成模块来集成不同的行为嵌入。为了表示方便,我们用p,q表示任意实体(包括用户和物品)。对比集成模块的学习目标是最小化同一实体的潜在意图嵌入(ep,0)和行为嵌入之间的距离,并最大化任何不同行为嵌入之间的距离。因此,我们设计了两个学习损失项来增强表示过程:
其中sim(·)为相似性计算的判别函数,通过简单而有效的内积运算实现;τ是控制收敛速度的温度参数。
通过利用作项为对比学习的相似损失项,最小化潜在意图嵌入和不同行为嵌入之间的距离。确保了潜在意图嵌入可以揭示实体行为的整体表现。另一方面,项被用来度量任意两个行为嵌入之间的距离。越小,不同的行为嵌入ep,b′和越相似。多行为整合层的目的在于模拟不同嵌入行为的多样性和丰富性。因此,项求反后背包含在总损失中。
2.5预测层
经过基于对比学习的多行为集成层后,潜在意图嵌入和整体行为嵌入表示在潜在表示空间中趋于一致。因此,我们利用潜在意图来表示每个实体的整体特征。我们利用单层线性MLP架构进行预测,以赋予模型更强的表达能力:
其中,与都是模型可训练参数。
2.6模型训练
我们用均方误差(Mean Squared Error,MSELoss)来表示主学习损失,并加入对比损失项来增强潜在意图嵌入的表达能力和实体特征的多样性:
此外,我们加入2范式正则化损失项来防止过拟合,因此,模型的整体训练目标函数表示为:
其中,η1和η2是衰减系数,用于调节不同的损失项占比。
我们采用预训练&微调学习策略来提升推荐能力。具体来说,在预训练阶段,我们随机初始化模型,利用损失作为目标项。在微调阶段,我们使用预训练导出值初始化所有变量,并使用所有损失项(即)完成模型的优化。
3、发明效果
3.1实验环境及参数设置
3.1.1数据集
为了评估MB-Soc模型的性能,本发明在两个现实世界的数据集上进行了实验,即Ciao和Epinions,这两个数据集在社交推荐中被广泛采用。我们采用相同的数据处理程序来进行公平的比较,即我们按照传统多行为推荐将它们分为以下三种多行为:不喜欢(1≤r<3)、中性(r=3)及喜欢(r>3)。
3.1.2评价指标
本发明使用被广泛采用的MAE和RMSE指标进行比较。值得注意的是,MAE和RMSE的值越小表示性能越好,并且先前的文献已经验证,即使MAE和RMSE的微小改进也可以显著提高推荐质量。
3.1.3基线方法
为了验证我们的模型的优越性和有效性,我们将MB-Soc与9个基线模型进行了比较,包括最先进的非社会化CF方法、社会正则化方法和信任传播方法。具体地,NCF和STAR-GCN是基于GNN的协同过滤模型,没有对社会化信息进行利用。SocialMF、SoReg和TrustMF利用社会正则化来提高协同过滤的性能。SAMN、EATNN、DiffNet和S-NGCF(社会化NGCF模型)明确地模拟了推荐系统场景下的社会传播过程。
3.1.4参数设置
为了进行全面的性能比较,我们将每个数据集分成训练集、验证集和测试集,比例分别为8∶1∶1和6∶2∶2。我们将早期停止学习策略应用于验证集的学习,如果验证集上的指标MAE连续5轮停止增长,则停止训练。我们使用Adam作为模型训练优化器。学习率lr和批量大小分别设置为1e-4和512。所有嵌入都使用正态分布的随机数进行初始化(平均值为0,标准差为0.1)。针对嵌入表示的维度d,我们在{32,64,128,256}的范围内进行了搜索,通常情况下d=3会达到最好的性能表现。针对图神经网络最大传播深度参数L,我们在{1,2,…,4}范围内进行了参数搜索,结果显示通常情况下L=2的MB-Soc性能最佳。针对衰减系数η1和η2,我们分别在{1e-4,1e-3,…,1e-1}范围内及{5e-5,5e-4,…,5e-1}范围内进行了参数搜索,结果表明η1=1e-3,η2=5e-4下的模型性能最佳。
3.2总体实验结果对比
表1.整体性能表现对比
我们在表1中展示了总体性能比较。以下是我们的观察结果:
·MB-Soc模型始终优于其他最先进的模型,并表现出巨大的性能提升。具体而言,MB-Soc在Ciao 80%、Ciao 60%、Epinions 80%和Epinions 60%上的性能分别比最佳基线模型提高10.68%、6.28%、2.96%、3.19%。这表明了我们提出的多行为增强社会推荐的优越性。
·总体来讲,基于深度神经网络的信任传播方法优于社会正则化方法。这说明了信任关系嵌入传播显式建模的有效性,进一步证实了基于图神经网络的传播层的有效性。
·与Epinions相比,MB-Soc在Ciao上实现了更好的性能提升。这可能是因为Ciao数据集上的社交连接更为紧密。我们认为MB-Soc在更复杂的社交图谱上会表现得更好。
3.3消融实验结果对比
消融研究用以探索每个单一模块的单独影响。本发明将不包含多行为模块、社会扩散模块和以上两个模块的模型分别表示为MB-Soc w/o MB、MB-Soc w/o Soc和MB-Soc w/o MB&Soc。由于篇幅的限制,我们在图2中展示了在Ciao 80%上模型的消融实验的性能比较。其他数据集的结果显示了相同的结论。我们可以观察到:
·MB-Soc始终在其他变体中表现出最佳性能。这验证了MB-Soc每个组件的必要性,所有组件的微妙组合产生最佳性能。
·与MB-Soc相比,MB-Soc w/o Soc表现出了明显的性能下降。这也验证了社会传播建模的重要性。
·与MB-Soc相比,MB-Soc w/o MB表现出相对较小的性能退化。这可能是因为多行为增强主要关注社会传播过程,因此单独使用多行为传播无法提供较为明显的性能帮助。
·MB-Soc w/o MB&Soc在所有变体中表现最差。这证明了我们提出的多行为社会推荐的有效性。
3.4关键参数分析
在本节中,我们对包括传播层深度L和全局统一的嵌入维数d在内的关键参数进行了分析实验,以确保最优的参数赋值。我们展示了在Ciao 60%上的分析实验结果,对其他数据集的观察也得出了同样的结论。
模型图神经网络层深L
对于连续的GNN和GAT模块的传播深度L,我们将最大传播深度L的模型记为MB-Soc-L,如图3所示。以下是我们的观察结果:
·随着L的增加,MB-Soc-L的性能在L≤2时随着L的增加而增加。这表明模型随着模型感受野的增加而具有更好的表达能力。从而证明随着GNN深度的增加,MB-Soc的容量也相应增加。
·但同时MB-Soc-L在L≥2之后性能表现出退化趋势,并且性能下降趋势不稳定。这可能是因为过度平滑问题影响了模型嵌入向量的表示能力。
模型嵌入表示维度d
为了节省计算量,我们将所有模型嵌入的维数统一设置为d。为了研究最佳嵌入维数,我们进行了针对维度d的分析实验,并将具有不同嵌入尺寸的模型变体表示为MB-Soc-d,其性能比较如图4所示。以下是我们的观察结果:
·随着d的增加,MB-Soc-d表现出一致的性能下降。这可能是因为MB-Soc-d受到维度d过大而产生的过拟合的影响。由于我们的模型通过独立的嵌入表示对实体的多个特征进行了表示,因此较小的维度d就可以对模型进行适当地表示,因此维度d具有相对较小的值。
·将图4与表1结合分析,我们可以看到,即使MB-Soc-256也优于大多数基线方法。这表明除去不同嵌入维度的影响,我们的MB-Soc模型针对社会化推荐的性能提升依旧可观。
Claims (5)
1.一种基于图神经网络的多行为社会化推荐方法,其特征在于,所述多行为社会化推荐方法由输入至输出包括嵌入层、传播层、多行为集成层和预测层;
嵌入层以用户ID和项目ID作为输入,生成相应的ID嵌入表示向量以供进一步计算,ID向量是可训练的模型参数,嵌入层的各种嵌入表示都随着训练优化而进行变化;
传播层对单一行为类型b下的嵌入传播进行建模,将传播过程细分为行为传播模块和信任扩散模块,分别完成用户偏好传播建模和用户偏好在社交网络中的相互影响建模;
通过多行为整合层完成不同行为下的实体嵌入表示整合;对于每个实体,不同的行为嵌入表示实体特征的不同方面;为获得行为嵌入的分布模式以及它们之间的关系,部署基于自监督学习的模型框架来挖掘不同行为之间的相关性,多行为整合层采用对比学习来实现实体多样性的表征;
经过基于对比学习的多行为集成层后,潜在意图嵌入和整体行为嵌入表示在潜在表示空间中趋于一致;利用潜在意图来表示每个实体的整体特征,利用单层线性MLP架构进行预测;
所述方法的实现过程为:
变量定义:用户集合U(U={u1,u2,...,uM})、物品集合I(I={i1,i2,...,iN}),其中M=|U|,N=|I|分别表示用户数量与物品数量;
定义多行为交互图GI:已知用户与物品之间的多行为交互历史,构建用户-物品多行为交互图GI=(U,I,EI);其中,EI∈U×I表示用户与物品之间的多行为连边,共包含B种行为;针对EI中任意连边如果表示用户u与物品i在行为种类b下具有交互历史;反之,如果表示没有交互;
同理,定义社交信任图GS:通过用户与用户之间的好友关系构建社交信任图GS=(U,ES);其中,ES∈U×U表示用户之间的好友关系连边,对于任意如果表示用户u与用户v之间存在好友关系;反之,如果则无好友关系存在;
基于给定上述定义,给出多行为社会化推荐问题的形式化表达如下:给定用户集合U,物品集合I,用户U与物品I之间的多行为交互图GI,用户之间的社会信任图GS,多行为社会化推荐模型完成任意用户u与任意物品i在行为b下的交互概率yui;
嵌入层、传播层、多行为集成层和预测层的实现过程为:
嵌入层:通过初始化一个检查表来生成嵌入,别用和表示用户u和物品i在行为种类b∈{1,…,B}下的ID嵌入表示,其中d为嵌入向量的大小;用不同的行为嵌入来表示不同的行为类型b;对于每个用户u和每个物品i,初始化一个潜在意图嵌入来建模实体在不同行为下的整体意图,分别表示为eu,0和ei,0,所有的嵌入表示都使用具有同一维度d的向量进行表示;
传播层:
行为传播模块:
行为传播模块负责传播在嵌入层中初始化的单行为嵌入表示;针对用户与物品之间的交互偏好的传播,构建了一个基于图神经网络GNN的行为传播模块;在行为传播模块中,主要描述单一行为类型b内用户-物品交互下的行为内偏好扩散现象,首先将多行为图拆分为B个单行为图,分别为对于任意行为类型b,定义单一行为图其中
针对单一行为图针对任意邻接二元组(u,i),定义图神经网络传播过程如下所示:
其中,与分别表示与用户u与物品i在行为b的单一行为图中直接邻接的邻居节点个数;上式中,使用对称归一化的方式来避免不同邻接节点造成的不平衡问题;
信任扩散模块:
在信任扩散模块中,计算用户与用户之间的社会化影响力对其偏好传播的影响过程,设计基于图注意力网络的信任扩散完成社交用户之间的偏好传播;
首先通过一个双层多层感知机网络MLP完成社交图中注意力系数的计算:
其中都是可训练参数,||表示向量连接符号;此外,选用sigmoid函数作为非线性激活函数σ(·);通过双层感知机运算的注意力系数通过softmax函数进行归一化得到最终的注意力系数如下:
其中,表示用户u在图GS上的直接邻接邻居节点用户集合;在获得任意社会元之间的注意系数后,将图的注意扩散过程表述为:
在单一行为类型b下,所有相邻的社会用户都以注意力权重集中传递社会影响;为克服梯度计算问题对社会化嵌入表示和进行了跳线连接,并使用逐位均值池化完成表示:
行为信任多跳传播:
堆叠多个图神经网络传播层可以扩展图神经网络感受野,在更广泛的范围内捕获实体之间的相关性;将公式(1)、公式(2)中的单跳行为传播和公式(3)-公式(6)中的信任扩散过程分别表示为及将两个模块上的单跳传播行为表述为:
通过在交互图和社交图上迭代传播,可以得到用户u和物品i分别在传播深度为l∈{1,2,…,L}的最终嵌入表示,和其中L表示最大传播深度;
分别用和表示用户u和项目i的单一行为整体表征;和通过均值池化得到,用于表示用户的整体行为特性:
多行为整合层:
使用潜在意图嵌入来模拟用户行为的整体意图,每个实体(包括用户和物品)都拥有一种潜在的意识,这种意识指导实体在不同的行为下进行交互,设计一个基于对比学习的对比集成模块来集成不同的行为嵌入;用p,q表示任意实体(包括用户和物品);对比集成模块的学习目标是最小化同一实体的潜在意图嵌入(ep,0)和行为嵌入之间的距离,并最大化任何不同行为嵌入之间的距离;设计两个学习损失项来增强表示过程:
其中sim(·)为相似性计算的判别函数,通过简单而有效的内积运算实现;τ是控制收敛速度的温度参数;
通过利用作项为对比学习的相似损失项,最小化潜在意图嵌入和不同行为嵌入之间的距离;确保了潜在意图嵌入可以揭示实体行为的整体表现;另一方面,项被用来度量任意两个行为嵌入之间的距离;越小,不同的行为嵌入ep,b′和越相似;多行为整合层用于模拟不同嵌入行为的多样性和丰富性,项求反后背包含在总损失中;
预测层:
利用单层线性MLP架构进行预测,以赋予模型更强的表达能力:
其中,与都是模型可训练参数。
2.根据权利要求1所述的一种基于图神经网络的多行为社会化推荐方法,其特征在于,所述方法的实现还包括模型训练过程:
用均方误差来表示主学习损失,并加入对比损失项来增强潜在意图嵌入的表达能力和实体特征的多样性:
加入2范式正则化损失项来防止过拟合,模型的整体训练目标函数表示为:
其中,η1和η2是衰减系数,用于调节不同的损失项占比。
3.根据权利要求2所述的一种基于图神经网络的多行为社会化推荐方法,其特征在于,在模型训练过程中,采用预训练&微调学习策略来提升推荐能力,具体为:在预训练阶段,随机初始化模型,利用损失作为目标项;在微调阶段,使用预训练导出值初始化所有变量,并使用所有损失项即完成模型的优化。
4.一种基于图神经网络的多行为社会化推荐系统,其特征在于,该系统具有与上述权利要求1-3任一项权利要求的步骤对应的程序模块,运行时执行上述的一种基于图神经网络的多行为社会化推荐方法中的步骤。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现权利要求1-3中任一项所述的一种基于图神经网络的多行为社会化推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311015948.XA CN117171448B (zh) | 2023-08-11 | 2023-08-11 | 一种基于图神经网络的多行为社会化推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311015948.XA CN117171448B (zh) | 2023-08-11 | 2023-08-11 | 一种基于图神经网络的多行为社会化推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117171448A CN117171448A (zh) | 2023-12-05 |
CN117171448B true CN117171448B (zh) | 2024-05-28 |
Family
ID=88945979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311015948.XA Active CN117171448B (zh) | 2023-08-11 | 2023-08-11 | 一种基于图神经网络的多行为社会化推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117171448B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117851687B (zh) * | 2024-03-04 | 2024-05-14 | 江西财经大学 | 融合自注意力机制的多行为图对比学习推荐方法与系统 |
CN118378102B (zh) * | 2024-06-24 | 2024-09-27 | 中国科学技术大学 | 基于网络特性和传播信息联合建模的扩散传播方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321494A (zh) * | 2019-06-26 | 2019-10-11 | 北京交通大学 | 基于矩阵分解与网络嵌入联合模型的社会化推荐方法 |
CN114519147A (zh) * | 2022-02-17 | 2022-05-20 | 云南大学 | 一种基于gcn增强影响扩散的社交推荐方法 |
CN114692808A (zh) * | 2020-12-25 | 2022-07-01 | 第四范式(北京)技术有限公司 | 图神经网络传播模型确定方法和系统 |
CN115187343A (zh) * | 2022-07-20 | 2022-10-14 | 山东省人工智能研究院 | 基于注意图卷积神经网络的多行为推荐方法 |
WO2022222037A1 (zh) * | 2021-04-20 | 2022-10-27 | 中国科学院深圳先进技术研究院 | 一种基于图神经网络推理的可解释推荐方法 |
CN116167812A (zh) * | 2022-12-02 | 2023-05-26 | 重庆邮电大学 | 用于多行为推荐的异构协同过滤方法 |
CN116383515A (zh) * | 2023-02-16 | 2023-07-04 | 山东师范大学 | 基于轻量级图卷积网络的社交推荐方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113222700B (zh) * | 2021-05-17 | 2023-04-18 | 中国人民解放军国防科技大学 | 基于会话的推荐方法及装置 |
CN113254803B (zh) * | 2021-06-24 | 2021-10-22 | 暨南大学 | 一种基于多特征异质图神经网络的社交推荐方法 |
-
2023
- 2023-08-11 CN CN202311015948.XA patent/CN117171448B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321494A (zh) * | 2019-06-26 | 2019-10-11 | 北京交通大学 | 基于矩阵分解与网络嵌入联合模型的社会化推荐方法 |
CN114692808A (zh) * | 2020-12-25 | 2022-07-01 | 第四范式(北京)技术有限公司 | 图神经网络传播模型确定方法和系统 |
WO2022222037A1 (zh) * | 2021-04-20 | 2022-10-27 | 中国科学院深圳先进技术研究院 | 一种基于图神经网络推理的可解释推荐方法 |
CN114519147A (zh) * | 2022-02-17 | 2022-05-20 | 云南大学 | 一种基于gcn增强影响扩散的社交推荐方法 |
CN115187343A (zh) * | 2022-07-20 | 2022-10-14 | 山东省人工智能研究院 | 基于注意图卷积神经网络的多行为推荐方法 |
CN116167812A (zh) * | 2022-12-02 | 2023-05-26 | 重庆邮电大学 | 用于多行为推荐的异构协同过滤方法 |
CN116383515A (zh) * | 2023-02-16 | 2023-07-04 | 山东师范大学 | 基于轻量级图卷积网络的社交推荐方法及系统 |
Non-Patent Citations (3)
Title |
---|
Hongfei Yu等.Multi-behavior recommendation based on simplified graph convolution networks.《IEEE》.2021,全文. * |
Knowledge Enhancement for Contrastive Multi-behavior Recommendation;Hongrui Xuan等;《ACM》;20230227;全文 * |
Weiqi Fan.Graph neural networks for social recommendation.《Web of Science》.2019,全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN117171448A (zh) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117171448B (zh) | 一种基于图神经网络的多行为社会化推荐方法及系统 | |
Tang et al. | Dynamic evolution of multi-graph based collaborative filtering for recommendation systems | |
CN112905900A (zh) | 基于图卷积注意力机制的协同过滤推荐算法 | |
Gwadabe et al. | Improving graph neural network for session-based recommendation system via non-sequential interactions | |
CN113918832B (zh) | 基于社交关系的图卷积协同过滤推荐系统 | |
CN113918833B (zh) | 通过社交网络关系的图卷积协同过滤实现的产品推荐方法 | |
Sheng et al. | Enhanced graph neural network for session-based recommendation | |
Xiao et al. | Link prediction based on feature representation and fusion | |
CN113918834B (zh) | 融合社交关系的图卷积协同过滤推荐方法 | |
Pasa et al. | Multiresolution reservoir graph neural network | |
Wang et al. | To see further: Knowledge graph-aware deep graph convolutional network for recommender systems | |
CN113590976A (zh) | 一种空间自适应图卷积网络的推荐方法 | |
Liu et al. | Graph-ICF: Item-based collaborative filtering based on graph neural network | |
Lei et al. | DigGCN: Learning compact graph convolutional networks via diffusion aggregation | |
Xiao et al. | Multi-interaction fusion collaborative filtering for social recommendation | |
Chen et al. | Integrating user-group relationships under interest similarity constraints for social recommendation | |
Ma et al. | Knowledge graph random neural networks for recommender systems | |
Chang et al. | GraphRR: A multiplex Graph based Reciprocal friend Recommender system with applications on online gaming service | |
Zhong et al. | Reinforcement learning enhanced heterogeneous graph neural network | |
He et al. | Meta-path based graph contrastive learning for micro-video recommendation | |
Shu et al. | Multi-task feature and structure learning for user-preference based knowledge-aware recommendation | |
Li et al. | Item Attribute-aware Graph Collaborative Filtering | |
Liu et al. | Interest Evolution-driven Gated Neighborhood aggregation representation for dynamic recommendation in e-commerce | |
Cai et al. | Knowledge-aware graph collaborative filtering for recommender systems | |
Zhu et al. | Matrix Completion of Adaptive Jumping Graph Neural Networks for Recommendation Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |