CN112541639B

CN112541639B - 基于图神经网络和注意力机制的推荐系统评分预测方法

Info

Publication number: CN112541639B
Application number: CN202011526793.2A
Authority: CN
Inventors: 陈波; 刘鑫宇; 王庆先
Original assignee: Research Institute Of Yibin University Of Electronic Science And Technology; University of Electronic Science and Technology of China
Current assignee: Research Institute Of Yibin University Of Electronic Science And Technology; University of Electronic Science and Technology of China
Priority date: 2020-12-22
Filing date: 2020-12-22
Publication date: 2023-07-07
Anticipated expiration: 2040-12-22
Also published as: CN112541639A

Abstract

本发明公开了基于图神经网络和注意力机制的推荐系统评分预测方法，包括S1、基于度和时间信息，将“用户‑项目评分图”转换为“用户‑项目评分可信度图”，并为图中的每个顶点采样邻居顶点；S2、利用采样结果结合时间信息，对“用户‑项目评分可信度图”中各个顶点状态进行更新；S3、基于注意力机制实现用户对项目的进行评分预测，并更新评分预测模型；S4、利用评分预测模型实现用户对项目的评分预测。本发明给出了图神经网络在通用推荐系统中的应用途径，结合用户和项目的静态特征，利用图神经网络的图表示学习能力学习用户项目交互网络中隐特征的重要程度，更关注地为推荐系统服务。

Description

基于图神经网络和注意力机制的推荐系统评分预测方法

技术领域

本发明属于推荐系统技术领域，具体涉及一种基于图神经网络和注意力机制的推荐系统评分预测方法。

背景技术

推荐系统旨在为用户推荐潜在关联项目，其中项目是指电影、音乐、网页和商品等可供推荐的各类资源。在推荐系统中，用户对项目的评分预测是进行推荐和排名的前提，该过程也被描述为矩阵填充，即对评分矩阵中暂缺的评分数据进行填充，传统的图表示学习方法，基于矩阵分级等技术生成或学习得到用户和项目的向量表示，进而利用向量和点积运算实现评分预测。这类评分预测方法注重于挖掘静态的用户项目交互网络结构特征，存在三点问题：其一，没有充分利用用户顶点和项目顶点本身的静态特征，评分预测的精度提升很容易达到瓶颈；其二，很少考虑时间信息，对时间不敏感的特点使得这类模型无法捕获网络的演变特性，难以保证基于预测评分的推荐过程长期有效；其三，使用点积运算进行评分预测完全依赖于用户和项目的表示学习过程，却忽略了在评分预测任务中对用户项目表示重要程度的衡量。

发明内容

针对现有技术中的上述不足，本发明提供的基于图神经网络和注意力机制的推荐系统评分预测方法充分利用了用户和项目的静态特征以及时间度信息，实现更准确的评分预测，解决了背景技术中的上述问题。

为了达到上述发明目的，本发明采用的技术方案为：基于图神经网络和注意力机制的推荐系统评分预测方法，包括以下步骤：

S1、基于度和时间信息，将“用户-项目评分图”转换为“用户-项目评分可信度图”，并为“用户-项目评分可信度图”中的每个顶点采样邻居顶点；

S2、利用采样结果结合时间信息，基于图神经网络分别从用户视角和项目视角对“用户-项目评分可信度图”中各个顶点状态进行更新；

S3、基于注意力机制实现推荐系统中用户对项目的评分预测模型的构建，并完成模型训练及相关参数的更新；

S4、利用训练完成的评分预测模型，实现推荐系统中用户对象项目的评分预测。

进一步地，所述步骤S1中，将“用户-项目评分图”转换为“用户-项目评分可信度图”的方法具体为：

A1、获取“用户-项目评分图”的数据集合；

其中，“用户-项目评分图”的数据集合包括N个用户U＝{u₁,u₂,…,u_p,…,u_N}和M个项目I＝{i₁,i₂,…,i_q,…,i_M}一起构成的顶点集V＝U∪I、用户对项目的评分集R＝{r_pq|u_p∈U,i_q∈I,0≤r_pq≤F}和归一化的时间戳集T＝{t_pq|u_p∈U,i_q∈I,0<t_pq<1}；

式中，u₁,u₂,…,u_p,…,u_N表示第1到N个用户，i₁,i₂,…,i_q,…,i_M表示第1到M个项目，r_pq表示用户u_p与项目i_q之间存在的评分，且评分最大值为F，当r_pq∈R时，表示用户u_p与项目i_q之间暂无评分，t_pq表示用户u_p给项目i_q评分r_pq的时间，已归一化(0,1)的范围内，t_pq数值越大越临近现在，即对应的评分r_pq越新；

A2、根据“用户-项目评分图”的数据集合中的评分集R统计出各个顶点的度，得到表征度信息统计的度集D＝{d_v|v∈V}；

式中，d_v为顶点集V中顶点v的度；

A3、基于度集D＝{d_v|v∈V}和时间戳集T＝{t_pq|u_p∈U,i_q∈I,0<t_pq<1}，计算得到评分可信度集C＝{c_pq|v_p,v_q∈V}，并通过顶点集V和评分可信度集C构成“用户-项目评分可信度图”；

式中，c_pq表示源顶点v_p给目标顶点v_q之间的边评分的可信度。

进一步地，所述步骤S1中，为“用户-项目评分可信度图”中的每个顶点采样邻居顶点的方法具体为：

B1、根据“用户-项目评分可信度图”，基于置信度计算图中各个顶点的邻居顶点被采样的概率P(v_q|v_p)；

B2、基于邻居顶点被采样的概率P(v_q|v_p)的分布为顶点集V中的各个顶点采样

个邻居顶点；

B3、基于采样的

个邻居顶点，在“用户-项目评分可信度图”中以用户节点u为源顶点采样得到邻居顶点/>

以项目节点为源顶点采样得到邻居顶点

进而实现邻居顶点采样；

式中，

为用户u采样的/>

个其评分的项目顶点，/>

为项目i采样的/>

个其评分的用户顶点。

进一步地，所述步骤S2具体为：

S21、获取用户和项目的静态特征矩阵X_U和X_I；

其中，用户静态特征矩阵X_U中每一行表示为一个用户u的特征输入

项目特征矩阵X_I中每一行表示为一个项目i的特征输入/>

S22、将用户和项目的静态特征

和/>

分别作为用户u和项目i的初始状态，记为/>

和/>

S23、结合

和时间戳集T分别从用户和项目两个视角，通过图神经网络状态更新过程聚合邻居顶点特征，生成并逐层更新用户u和项目i的状态表示/>

和/>

实现“用户-项目评分可信度图”中各个顶点的状态更新。

进一步地，所述步骤S23中的图神经网络包括K层，第k层更新得到的用户状态表示和项目状态表示分别为

和/>

用户视角和项目视角的状态更新过程的公式表示分别为：

式中，AGGREGATOR1(·)和AGGREGATOR2(·)分别表示用户视角和项目视角下图神经网络的状态更新过程函数，包括若干个待学习的参数矩阵，该状态更新过程结合时间信息聚合邻居顶点上一层的状态表示，生成当前层的状态表示，最后一层图神经网络状态更新过程函数的输出即为用户u和项目i的最终状态表示

和/>

进一步地，所述步骤S23中AGGREGATOR1(·)和AGGREGATOR2(·)的实现方法包括利用GRU多到一的序列学习能力的聚合方法实现或利用考虑时间信息的加权平均聚合方法实现；

当利用GRU多到一的序列学习能力的聚合方法实现时，AGGREGATOR1(·)和AGGREGATOR2(·)分别为：

式中，SORTED(·)表示排序过程函数，

和/>

分别表示两个视图下第k层的循环神经单元，/>

为第k-1层图神经网络状态更新过程函数输出的源顶点的状态表示，/>

为第k-1层图神经网络状态更新过程函数输出的目标顶点的状态表示；

当利用考虑时间信息的加权平均聚合方法实现时，AGGREGATOR1(·)和AGGREGATOR2(·)分别为：

式中，σ(·)为sigmoid激活函数，MEAN(·)为均值函数，W_agg1和W_agg2分别为用户视角和项目视角下待学习的参数矩阵，t_pi为用户为源顶点时的时间信息，t_uq为项目为目标顶点时的时间信息。

进一步地，所述步骤S3具体为：

S31、基于用户状态表示

和项目状态表示/>

分别计算用户u的状态的注意力矩阵/>

和项目i的注意力矩阵/>

其中，ATTENTION1(·)和ATTENTION2(·)分别表示注意力的计算过程函数，包括若干用于学习衡量状态信息重要性权重的待学习参数的参数矩阵；

S32、基于注意力矩阵A_u和A_i，利用用户和项目的状态表示

和/>

生成用户u对项目i的预测评分/>

并将所有用户对所有项目的预测评分构成集

其中，PREDICT(·)表示基于注意力机制的预测评分函数，包括若干个待学习的参数矩阵；

S33、基于预测评分的集合

和实际评分的评分集R，计算损失值/>

其中，LOSS(·)为损失函数；

S34、基于计算出的损失值，采用随机梯度下降法更新推荐系统中评分预测模型中的各个待学习参数矩阵直到损失值收敛，进而使基于图神经网络和注意力机制的评分预测模型得到训练，并完成相关参数的更新。

进一步地，所述步骤S31中的注意力矩阵A_u和注意力矩阵A_i分别为：

式中，

均为待学习的参数矩阵，σ(·)是sigmoid激活函数，SOFTMAX为softmax函数。

进一步地，所述步骤S32中，通过全连接注意力网络或注意力点积网络生成用户u对项目i的预测评分

当通过全连接注意力网络生成用户u对项目i的预测评分时，分别将用户、项目的注意力矩阵和状态矩阵拼接成完整的注意力矩阵和输入矩阵，得到预测评分

式中，W_R为待学习的参数矩阵，σ(·)为sigmoid激活函数，SCORE_PROJECT为映射函数，用于将(0,1)范围内的输出映射到实际评分的范围内，·||为拼接操作；

当通过注意力点积网络生成用户u对项目i的预测评分时，将全连接注意力网络中的参数矩阵替换为点积运算，得到预测评分

式中，·表示点积运算。

本发明的有益效果为：

(1)本发明给出了图神经网络在通用推荐系统中的应用途径，结合用户和项目的静态特征，利用图神经网络的图表示学习能力学习用户项目交互网络中隐特征的重要程度，使得整个评分预测模型的训练过程摆脱了单纯的“图表示学习导向”，更关注地为推荐系统服务。

附图说明

图1为本发明提供的基于图神经网络和注意力机制的推荐系统评分预测方法流程图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，基于图神经网络和注意力机制的推荐系统评分预测方法，包括以下步骤：

在本实施例的步骤S1中，将“用户-项目评分图”转换为“用户-项目评分可信度图”的方法具体为：

A1、获取“用户-项目评分图”的数据集合；

式中，u₁,u₂,…,u_p,…,u_N表示第1到N个用户，i₁,i₂,…,i_q,…,i_M表示第1到M个项目，r_pq表示用户u_p与项目i_q之间存在的评分，且评分最大值为F，当r_pq∈R时，表示用户u_p与项目i_q之间暂无评分，t_pq表示用户u_p给项目i_q评分r_pq的时间，已归一化(0,1)的范围内，t_pq数值越大越临近现在，即对应的评分r_pq越新；这里需要强调的是，顶点集V中包含了用户和项目两类顶点；

式中，d_v为顶点集V中顶点的v的度，即每个顶点分别有多少个邻居节点与之相连，对每个用户顶点来说是指该用户有多少个评过分的项目，对每个项目顶点而言来说就是指有多少个用户为该项目评过分；

具体地，计算评分可信度的过程如下公式：

在步骤A1中已知，v_p和v_q均是顶点集V＝U∪I中的顶点，c_pq表示源顶点是v_p目标顶点是v_q的情况下对顶点v_p来说顶点v_q与它之间的评分可信度。计算过程中需要注意区分“源顶点是用户顶点”即v_p∈I,v_q∈U,r_pq∈R和“源顶点是项目顶点”即v_p∈U,v_q∈I,r_qp∈R两种情况：

1)源顶点是用户顶点：当源顶点是用户即v_p∈U的时候，目标顶点是项目即v_q∈I，那么对于用户顶点v_p来说项目顶点v_q与它之间的评分r_pq可信度为c_pq，D_q为项目顶点v_q的度，t_pq表示用户顶点v_p给项目顶点v_q评分时对应的归一化时间戳信息(0<t_pq<1)；D_q越大表示项目顶点v_q和用户之间存在的交互关系越多，t_pq越大表示用户顶点v_p对项目顶点v_q评分的时间越接近现在；对于用户顶点v_p来说，D_q和t_pq越大，它对项目顶点v_q的评分行为具有越高的可信度。

2)源顶点是项目顶点：当源顶点是项目即v_p∈I的时候，目标顶点是用户即v_q∈U，那么对于项目顶点v_p来说用户顶点v_q与它之间的评分r_qp可信度为c_pq，D_q为用户顶点v_q的度，t_qp表示项目顶点v_p被用户顶点v_q评分时对应的归一化时间戳信息(0<t_pq<1)；D_q越大表示用户顶点v_q和项目之间存在的交互关系越多，t_pq越大表示项目顶点v_p被用户顶点v_q评分的时间越接近现在；对于项目顶点v_p来说，D_q和t_pq越大，它被用户顶点v_q评分的行为具有越高的可信度。

可以看出来2)和1)两种情况的计算过程高度相似，实际上由于用户和项目之间评分行为的对称性，两种情况下评分时间也是相同的，即t_pq＝t_qp；但是，需要注意的是，用户项目交互图中一条边上的项目顶点和用户顶点各自的度是不一样的，因此计算得到的c_pq是不一样的，c_pq衡量的是对于源顶点来说目标顶点的可信度，这将作为邻居采样的依据。

顶点集V和评分可信度集C共同构成了“用户-项目评分可信度图”，该图的特殊之处在于其顶点之间可能包含两条边或者没有边，只要用户顶点和项目顶点之间存在评分，那么它们之间就会有两条边，一条边的权重是对用户顶点来说相连项目顶点的可信度，另一条上的权重是对项目顶点来说相连用户顶点的可信度，这两个数值含义不同，数值也不相同；

本实施例的步骤S1中，为“用户-项目评分可信度图”中的每个顶点采样邻居顶点的方法具体为：

个邻居顶点；

B3、基于采样的

以项目节点为源顶点采样得到邻居顶点

进而实现邻居顶点采样；

式中，

为用户u采样的/>

个其评分的项目顶点，/>

为项目i采样的/>

个其评分的用户顶点。

具体地，和前面计算评分可信度一样，这里P(v_q|v_p)的计算也需要考虑“源顶点是用户顶点”即v_p∈I,v_q∈U,r_pq∈R和“源顶点是项目顶点”即v_p∈U,v_q∈I,r_qp∈R两种情况：

其中，针对源顶点v_p，所有与之相连(即存在评分交互，r_pj∈R或r_jp∈R)若干个顶点的可信度之和

或/>

作为归一化因子，用目标顶点v_q的可信度c_pq除以这个归一化因子即可得到源顶点为v_p时目标顶点v_q被采样的概率。

最终，以用户节点u为源顶点采样得到的邻居顶点表示为

表示为用户u采样的/>

个其评分的项目顶点；以项目节点i为源顶点采样得到的邻居顶点表示为

表示为项目i采样的/>

个为其评分的用户顶点。SAMPLE(V,R,P)表示利用顶点集、评分集和计算得到的概率分布P进行采样的过程，具体实现可采用python语言中random包提供的choices方法实现。

本实施例的步骤S2具体为：

S21、获取用户和项目的静态特征矩阵X_U和X_I；

项目特征矩阵X_I中每一行表示为一个项目i的特征输入/>

S22、将用户和项目的静态特征

和/>

分别作为用户u和项目i的初始状态，记为/>

和/>

S23、结合

和/>

实现“用户-项目评分可信度图”中各个顶点的状态更新。

具体地，步骤S23中的图神经网络包括K层，第k层更新得到的用户状态表示和项目状态表示分别为

和/>

用户视角和项目视角的状态更新过程的公式表示分别为：

和/>

其中，AGGREGATOR1(·)和AGGREGATOR2(·)的实现方法包括利用GRU多到一的序列学习能力的聚合方法实现或利用考虑时间信息的加权平均聚合方法实现；

式中，SORTED(·)表示排序过程函数，查找归一化信息集T对采样得到的邻居顶点

或者/>

进行按照从过去到现在的顺序对邻居顶点/>

或/>

的上层状态表示/>

或/>

进行排序，即按照T中对应时间戳t_uq∈T或t_pi∈T从小到大排列；然后输入GRU循环单元(可利用keras框架提供的相关api实现)，GRU的输出与上一层用户顶点u状态表示/>

或者上一层项目顶点i状态表示/>

进行||拼接操作，得到当前层对应的顶点状态表示/>

或/>

需要强调的一点是，上述两个公式中即用户视图和项目视图的每一层状态更新中GRU均包含不同的待学习参数矩阵(每层每个视角均有6个待学习的参数矩阵，每层共12个待学习的参数矩阵)，因此分别用/>

和/>

表示两个视图下第k层的循环神经单元，/>

式中，σ(·)为sigmoid激活函数，MEAN(·)为均值函数，t_pi为用户为源顶点时的时间信息，t_uq为项目为目标顶点时的时间信息，W_agg1和W_agg2分别为用户视角和项目视角下待学习的参数矩阵，通过加权平均和激活函数的输出与上一层用户顶点u状态表示

或者上一层项目顶点i状态表示/>

进行||拼接操作，得到当前层对应的顶点状态表示/>

或/>

该方案相对于基于GRU的实现方案需要学习的参数矩阵较少，每层仅需要学习2个参数矩阵，训练所需成本小了很多，但是欠缺挖掘时序特征的能力，可以根据实际情况选择。

本实施例的步骤S3具体为：

S31、基于用户状态表示

和项目状态表示/>

分别计算用户u的状态的注意力矩阵

和项目i的注意力矩阵/>

其中，ATTENTION1(·)和ATTENTION2(·)分别表示注意力的计算过程函数，包括若干用于学习衡量状态信息重要性权重的待学习参数的参数矩阵，具体计算公式为：

式中，

均为待学习的参数矩阵，σ(·)是sigmoid激活函数，SOFTMAX为softmax函数，用于将输出注意力矩阵中的各个元素映射到(0,1)区间内；

S32、基于注意力矩阵A_u和A_i，利用用户和项目的状态表示

和/>

生成用户u对项目i的预测评分/>

并将所有用户对所有项目的预测评分构成集

其中，PREDICT(·)表示基于注意力机制的预测评分函数，包括若干个待学习的参数矩阵，该过程有两个实现方案，包括通过全连接注意力网络或注意力点积网络生成用户u对项目i的预测评分

1)当通过全连接注意力网络生成用户u对项目i的预测评分时，即常规的注意力网络分别将用户、项目的注意力矩阵和状态矩阵拼接成完整的注意力矩阵和输入矩阵，得到预测评分

式中，W_R为待学习的参数矩阵，σ(·)为sigmoid激活函数，SCORE_PROJECT为映射函数，用于将(0,1)范围内的输出映射到实际评分的范围内以便后续计算损失，具体实现可直接给输出乘上可获得的最高评分F，必要时还可以进一步四舍五入，即可得到{0,1,2，…,F}中的离散值作为预测评分；||为拼接操作；

2)当通过注意力点积网络生成用户u对项目i的预测评分时，为了节省计算成本，将全连接注意力网络中的参数矩阵替换为点积运算，得到预测评分

式中，·表示点积运算，即计算数量积；该方案省略了一个待学习的参数，而是通过注意力矩阵A_u和A_i对用户和项目的状态表示

和/>

中各个维度进行重要性权衡，然后进行点积运算，最后的输出也需要通过SCORE_PROJECT进行映射；

S33、基于预测评分的集合

和实际评分的评分集R，计算损失值/>

其中，LOSS(·)为损失函数，用于衡量预测评分与实际评分之间的差距，本实施例中采样MSE均方差误差实现，如下公式所示；

其中，

表示预测评分的数目，由于具体实现时可能还需要划分训练集、验证集和测试集，这里的数据就是指当前划分数据集中预测的评分的数目；

需要主要的是，在实现模型训练时可能还需要划分训练集、验证集和测试集，这里用于更新模型的损失值是根据训练集计算得到的，验证集或者测试集上进计算损失仅用于评估模型。