CN116257691A

CN116257691A - 基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法

Info

Publication number: CN116257691A
Application number: CN202310385724.1A
Authority: CN
Inventors: 顾盼; 胡海洋
Original assignee: Hangzhou Dianzi University Shangyu Science and Engineering Research Institute Co Ltd
Current assignee: Hangzhou Dianzi University Shangyu Science and Engineering Research Institute Co Ltd
Priority date: 2023-04-12
Filing date: 2023-04-12
Publication date: 2023-06-13

Abstract

本发明公开了一种基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法，基于用户的历史行为序列，预测用户点击目标物品的概率。本发明主要分为七个部分：第一部分是将用户历史行为序列分为近期历史行为序列和远期历史行为序列；第二部分是基于用户近期历史行为序列，利用循环神经网络得到用户的短期兴趣；第三部分是根据用户历史行为序列中物品相似度，挖掘潜在图结构；第四部分是基于挖掘出的图结构，利用图神经网络更新物品向量；并基于更新后的物品向量利用循环神经网络得到用户的长期兴趣；第五部分是根据用户兴趣多样性偏好，融合用户的短期兴趣和长期兴趣；第六部分是预测用户对物品的点击率。

Description

基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法

技术领域

本发明属于互联网服务技术领域，尤其是涉及基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法。

背景技术

近几年，国内移动网民在短视频平台上花费的时间越来越长。2021年8月发布的《2021年Q2国内移动互联网报告》中指出，国内移动网民日均在短视频应用上使用时长约1.5小时。短视频的时长较短，因此用户在一天中可以观看很多短视频。通常来讲，用户在短视频平台中会浏览不同类型的短视频，即用户在短视频平台中有较强的多样性偏好。有研究将用户的历史序列输入到用户短期兴趣建模模型中，发现将用户的最近几个行为去掉，短期兴趣建模模型的效果反而得到提升，这也在一定程度上体现用户有较强的多样性偏好。

传统的推荐方法通常将用户的最近行为序列输入到模型中，得到用户的短期兴趣，进而给用户推荐感兴趣的短视频。但是用户在短视屏平台中的行为极为丰富和密集，如果忽略用户远期的历史行为序列，只考虑用户近期历史行为序列，会损失用户远期历史行为序列中包含的丰富信息，且可能会对用户近期兴趣过拟合，造成推荐结果较为单一。而如果直接将用户的所有历史行为序列直接输入到兴趣建模模型中，用户远期行为历史序列中包含的大量噪音会损害模型推荐效果，且模型复杂度过高，训练和运行时间较长。

发明内容

本方法的问题定义为基于用户的行为序列，预测用户点击目标物品的概率。涉及到的数学符号有：平台中用户集合表示为U，物品集合表示为V。用户u_i的历史行为序列为

其中任一物品v_j∈V，下标m表示用户u_i行为序列

的长度。现有的推荐方法通常将用户的最近行为序列输入到模型中，得到用户的短期兴趣，进而给用户推荐感兴趣的短视频。但是用户在短视屏平台中的行为极为丰富和密集，如果忽略用户远期的历史行为序列，只考虑用户近期历史行为序列，会损失用户远期历史行为序列中包含的丰富信息，且可能会对用户近期兴趣过拟合，造成推荐结果较为单一。而如果直接将用户的所有历史行为序列直接输入到兴趣建模模型中，用户远期行为历史序列中包含的大量噪音会损害模型推荐效果，且模型复杂度过高，训练和运行时间较长。

为此，本发明采用以下技术方案：

一种基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法，其具体方法如下：

S1、获取用户历史行为序列，并按照用户对物品的行为执行先后顺序，将用户历史行为序列分为近期历史行为序列和远期历史行为序列；

S2、基于用户近期历史行为序列，利用循环神经网络进行建模，得到用户的短期兴趣；

S3、根据用户历史行为序列中物品相似度，通过一个多次循环过程构成的过滤操作挖掘潜在的图结构；

S4、基于挖掘出的图结构，利用图神经网络更新物品向量，再基于更新后的物品向量通过长短期记忆神经网络得到用户的长期兴趣；

S5、根据用户兴趣多样性偏好，计算用户行为丰富程度，并结合通过学习得到的长短期兴趣的权重，对用户的短期兴趣和长期兴趣进行融合，得到最终的用户兴趣表示；

S6、通过计算用户兴趣表示和目标物品的向量表示之间的相似度，来预测用户对物品的点击率，实现物品推荐。

作为优选，所述S1的具体实现方法如下：

获取平台中的用户集合U和物品集合V，获取用户u_i的历史行为序列

其中任一物品v_j∈V，下标m表示用户u_i行为序列

的长度；v_j的向量表征是x_j；将用户历史行为序列

中的后n个物品作为用户的近期历史行为序列，表示为

将用户历史行为序列中前m-n个物品作为用户的远期历史行为序列，表示为

作为优选，所述S2的具体实现方法如下：

针对用户u_i，采用长短期记忆神经网络对用户近期历史行为序列

进行建模，得到用户的短期兴趣p^s：

p^s＝LSTM({x_m-n+1,x_m-n+2,…,x_m})

其中，{x_m-n+1,x_m-n+2,…,x_m}是用户近期历史行为序列{v_m-n+1,v_m-n+2,…,v_m}的向量表示，LSTM()表示长短期记忆神经网络，长短期记忆神经网络最后一个隐状态的输出即为用户的短期兴趣p^s。

作为优选，所述S3的具体实现方法如下：

计算用户历史行为序列中前面的物品和后面的物品之间的cosine相似度，得到图结构的初始邻接矩阵M；矩阵M是一个下三角矩阵，当矩阵中第i行第j列的M_ij下标满足i≥j时，M_ij＝0；M_ij表示用户历史行为序列中物品v_i和v_j的相似度，具体的值为物品v_i和v_j的向量表征x_i和x_j的cosine相似度；进一步对该初始邻接矩阵M进行过滤操作，得到一个稀疏的图结构G，所述过滤操作是一个多次循环过程：

第一步，设最终图结构包含的节点集合为N_v，要扩展的集合为C_v，N_v和C_v都初始化为{v_m-n+1,v_m-n+2,…,v_m}；

第二步，根据初始邻接矩阵M，得到C_v中每个物品的最相似物品集合F_v，将集合F_v中的物品放入集合N_v中，即N_v＝N_v∪F_v，并更新C_v为F_v，即C_v＝F_v；

第三步，重复第二步K次，最终得到一个稀疏的图结构G和该图的邻接矩阵A；上述多次循环过程中每一次重复第二步时对应邻接矩阵A的变化用公式表示为：

其中，

表示集合C_v中所有物品v_j，M_ij＝MAX_τ(M_τj)表示找到和物品v_j最相似的物品v_i，然后给邻接矩阵A_ij值赋为1。

作为优选，所述S4的具体实现方法如下：

S41、基于挖掘出的图结构，利用图神经网络更新物品向量；所述图神经网络是一个多层次结构，通过总共L层的信息传递将用户更久远的行为信息融合进来；其中L＝K+1；图中节点v_i的第l层物品向量表示为

其更新公式为：

其中，

表示对邻接矩阵A进行正则化；D是图结构G的度数矩阵，计算公式是

度数矩阵是一个对角矩阵；

是邻接矩阵A正则化后的矩阵，其中第i行第j列的矩阵元素为

NH(i)表示v_i的邻居集合，

表示v_j的第l-1层物品向量表示；图中节点v_i第0层向量

初始化为x_i；经过L层的信息传递之后，最终得到节点v_i更新后的物品向量为

S42、基于用户近期历史行为序列{v_m-n+1,v_m-n+2,…,v_m}的更新后的物品向量表示为

再利用长短期记忆神经网络得到用户的长期兴趣p^l，其中

作为优选，所述S5的具体实现方法如下：

S51、统计数据集中类目的种类数量为N_cate，标签种类数量为N_tag；将用户在某一类目或者标签下的行为个数大于T作为判定该用户对该类目或者标签有兴趣的标准，统计用户历史行为序列中用户感兴趣的类目个数n_cate和标签个数n_tag，得到用户行为丰富程度w_div为：

其中，

和

是超参数，分别控制类目和标签信息的重要程度，

S52、用一个两层的MLP模型来学习长短期兴趣的权重，并结合用户行为丰富程度w_div得到最终的长短期兴趣权重，具体如下：

其中，q和W是两层MLP模型的模型参数，在训练时得到更新，上标

是转置符号；tanh表示tanh激活函数，sigmoid表示sigmoid激活函数；

是由模型自己学习到的用户长期兴趣的权重，经由sigmoid()函数将其归一化到(0,1范围内，然后再乘以用户行为丰富程度w_div得到最终的用户长期兴趣权重γ^l；

S53、基于用户长期兴趣权重γ^l和用户短期兴趣权重1-γ^l，对用户的长期兴趣p^l和短期兴趣p^s进行融合，得到最终的用户兴趣表示p＝γ^lp^l+(1-γ^l)p^s；

作为优选，所述S6的具体实现方法如下：

根据用户u_i的用户兴趣表示p，将用户兴趣表示和目标物品v_τ的向量表示x_τ进行内积计算，预测用户对目标物品v_τ的点击率

作为优选，所述S1～S6构成的推荐模型框架，在实际进行推理前需要预先进行训练；训练过程中，通过用户对目标物品v_τ的点击率预测值

计算点击率预测值

和点击率真实值y之间的交叉熵损失函数来指导模型参数的更新过程，并采用Adam优化器更新模型参数。

作为优选，所述交叉熵损失函数的计算式为：

其中，y∈{0,1}是真实值，代表用户是否点击了目标物品；σ是sigmoid函数。

作为优选，所述平台为短视频平台，所述物品为短视频，且x_j被初始化为短视频主图的向量表示。

本发明的有益技术效果如下：

(1)本方法为了充分利用用户较长行为序列中的信息，提出将用户历史行为序列分为近期历史行为序列和远期历史行为序列，并从远期历史行为序列中抽取有关用户长期兴趣信息，融合到用户近期历史行为序列的物品向量中。

(2)本方法提出基于历史行为序列构建单向图结构，具体地先根据物品的相似度计算出一个下三角邻接矩阵，然后采用一个多次循环过程从下三角邻接矩阵中过滤出有价值的边信息。

(3)本方法在融合用户长期和短期兴趣时，将用户的多样性偏好考虑进去，通过计算用户行为中涉及到的物品类目和标签的丰富度来模拟用户的多样性偏好程度。

附图说明

图1为本发明基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法的流程示意图；

图2为本发明基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法的模型图。

具体实施方式

为了进一步理解本发明，下面结合具体实施方式对本发明提供的基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

本方法的问题定义为基于用户的历史行为序列，预测用户点击目标物品的概率。在短视频领域中，物品就是短视频。涉及到的数学符号有：平台中用户集合表示为U，物品集合表示为V。用户u_i的历史行为序列为

其中任一物品v_j∈V，下标m表示用户u_i行为序列

的长度。基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法由七个部分组成。第一部分是将用户历史行为序列分为近期历史行为序列和远期历史行为序列；第二部分是基于用户近期历史行为序列，利用循环神经网络得到用户的短期兴趣；第三部分是根据用户历史行为序列中物品相似度，挖掘潜在图结构；第四部分是基于挖掘出的图结构，利用图神经网络更新物品向量；并基于更新后的物品向量利用循环神经网络得到用户的长期兴趣；第五部分是根据用户兴趣多样性偏好，融合用户的短期兴趣和长期兴趣；第六部分是预测用户对物品的点击率；第七部分是根据模型特性，设计损失函数。

如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

S100，获取用户历史行为序列，并按照用户对物品的行为执行先后顺序，将用户历史行为序列分为近期历史行为序列和远期历史行为序列。

将平台中用户集合表示为U，物品集合表示为V。针对目标用户u_i，获取其历史行为序列为

其中任一物品v_j∈V，下标m表示用户u_i行为序列

的长度。v_j的向量表征是x_j。在本实施例中，该推荐方法可应用于短视频领域，因此对应的平台为短视频平台，物品为短视频，x_j被初始化为短视频主图的向量表示。将用户历史行为序列

中的后n个物品作为用户的近期历史行为序列，表示为

需要说明的是，此处用于划分近期历史行为序列和远期历史行为序列的关键参数为n和m，其具体取值需要根据实际的数据进行优化确定，以最终的推荐效果最佳为准。

S200，基于用户近期历史行为序列，利用循环神经网络进行建模，得到用户的短期兴趣。

本发明中采用的循环神经网络是序列建模的常用方法，通常包括长短期记忆神经网络和门控循环单元神经网络。本实施例中循环神经网络采用长短期记忆神经网络(Longshort-term memory,LSTM)来对用户近期历史行为序列

建模，得到用户的短期兴趣p^s：

p^s＝LSTM({x_m-n+1,x_m-n+2,…,x_m})

S300，根据用户历史行为序列中物品相似度，通过一个多次循环过程构成的过滤操作挖掘潜在的图结构。

在本实施例中，上述图结构的具体挖掘方式如下：

计算用户历史行为序列中前面的物品和后面的物品之间的cosine相似度，得到图结构的初始邻接矩阵M。矩阵M是一个下三角矩阵，即当矩阵中第i行第j列的M_ij下标满足i≥j时，M_ij＝0。且M_ij表示用户历史行为序列中物品v_i和v_j的相似度，具体的值为物品v_i和v_j的向量表征x_i和x_j的cosine相似度。该初始邻接矩阵M过于密集，包含很多噪音，需要进一步进行过滤操作，得到一个稀疏的图结构G。上述过滤操作是一个多次循环过程，其具体循环过程如下：

第一步，设最终图结构包含的节点集合为N_v，要扩展的集合为C_v，N_v和C_v都初始化为{v_m-n+1,v_m-n+2,…,v_m}，也就是将用户近期历史行为序列中的物品都放入节点集合N_v和C_v中。

第二步，根据初始邻接矩阵M，得到C_v中每个物品的最相似物品集合F_v，将集合F_v中的物品放入集合N_v中，即N_v＝N_v∪F_v，并更新C_v为F_v，即C_v＝F_v。

第三步，重复第二步K次，最终得到一个稀疏的图结构和该图的邻接矩阵。上述重复循环次数K的取值需要根据不同场景取不同的值，K越大，可以融合进更多的用户长期兴趣信息，但是噪音也越大。本方法中K＝3。图结构表示为G，对应的邻接矩阵表示为A，用公式表示上述多次循环过程中每一次重复第二步时对应邻接矩阵A的变化为：

其中，

S400，基于挖掘出的图结构，利用图神经网络更新物品向量，再基于更新后的物品向量通过长短期记忆神经网络得到用户的长期兴趣。

图神经网络的本质是将图中节点的邻居节点信息传递并融合进节点中，且本实施例中的图神经网络是一个多层次结构，总层数为L，通过L层的信息传递，可以将用户更久远的行为信息融合进来。这里L的值和K有关，L＝K+1。图中节点v_i的第l层物品向量表示为

其更新公式为：

其中，

表示对邻接矩阵A进行正则化，防止模型在训练时梯度爆炸或者消失。D是图结构G的度数矩阵，计算公式是

度数矩阵是一个对角矩阵。

是邻接矩阵A正则化后的矩阵，其中第i行第j列的矩阵元素为

NH(i)表示v_i的邻居集合，

表示v_j的第l-1层物品向量表示。图中节点v_i第0层向量

初始化为x_i。经过L层的信息传递之后，最终得到节点v_i的更新后的物品向量为

该向量融入了用户长期偏好信息。此时，用户近期历史行为序列{v_m-n+1,v_m-n+2,…,v_m}的向量表示为

再利用长短期记忆神经网络得到基于

得到用户的长期兴趣p^l，其中

S500，根据用户兴趣多样性偏好，计算用户行为丰富程度，并结合通过学习得到的长短期兴趣的权重，对用户的短期兴趣和长期兴趣进行融合，得到最终的用户兴趣表示。

抽取的用户长期兴趣因为融合了用户更多行为信息，包含了用户更丰富的兴趣偏好。本方法结合用户的行为丰富程度和长短期兴趣的差异，来对用户的长短期兴趣进行融合。用户历史行为的丰富程度由用户行为中涉及的类目和标签等信息的丰富程度决定。统计数据集中类目的种类数量为N_cate，标签种类数量为N_tag。定义用户对类目或者标签有兴趣的标准为：用户在某一类目或者标签下的行为个数大于T即认为该用户对该类目或者标签有兴趣。在本实施例中，T＝10。统计用户历史行为序列中用户感兴趣的类目个数n_cate和标签个数n_tag，即可通过下式计算得到用户行为丰富程度w_div为：

其中，

和

是超参数，分别控制类目和标签信息的重要程度，

本实施例中

长短期兴趣的差异越大，说明用户短期兴趣越单一，本实施例用一个两层的MLP模型来学习长短期兴趣的权重，并结合用户行为丰富程度w_div得到最终的长短期兴趣权重，具体如下：

其中，q和W是两层MLP模型的模型参数，在训练时得到更新，上标T是转置符号。tanh是tanh激活函数，sigmoid是sigmoid激活函数。

是由模型自己学习到的用户长期兴趣的权重，经由sigmoid()函数将其归一化到(0,1)范围内，然后再乘以用户行为丰富程度w_div得到最终的用户长期兴趣权重γ^l。

最后用户的兴趣表示为p＝γ^lp^l+(1-γ^l)p^s。

S600，通过计算用户兴趣表示和目标物品的向量表示之间的相似度，来预测用户对物品的点击率，实现物品推荐。

根据用户u_i的用户向量p，预测用户对目标物品v_τ的点击率

物品v_τ的向量是x_τ。计算点击率的方法是将用户向量和物品向量进行内积，得到相似度：

需要说明的是，上述步骤S100～步骤S600，实际上构成了本发明的推荐方法的模型框架，该框架如图2所示。该模型框架用于进行推理前需要预先进行训练。训练过程可通过下述S700来实现。

S700，根据模型特性，设计用于训练上述模型框架的损失函数。在本实施例中，可通过用户对目标物品的点击率预测值

计算点击率预测值

和点击率真实值y之间的误差，进而使用误差来更新模型参数。点击率预测值

和点击率真实值y之间的误差可采用交叉熵形式，通过交叉熵损失函数来指导模型参数的更新过程。交叉熵损失函数属于现有技术，其公式如下：

其中，y∈{0,1}是真实值，代表用户是否点击了目标物品。σ是sigmoid函数。需要说明的是，训练数据集的构建也属于现有技术，对此不再展开描述。在实际训练过程中，模型参数的更新，可采用Adam优化器来实现。

综上，本发明的实施例中，针对短视频领域中的短视频推荐，提出了一种基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法。首先，按照用户行为发生的时间将用户历史行为序列划分为用户远期历史行为序列和用户近期历史行为序列。然后，采用循环神经网络从用户近期历史行为序列中抽取用户的短期兴趣。然后，挖掘用户历史行为序列的图结构，这里的图结构是一种单向的图结构，即只存在先观看的短视频到后观看的短视频的边。根据学习到的图结构，采用图神经网络更新短视频向量表征，经过更新后的用户近期历史行为序列中的短视频向量已经融合了用户的长期兴趣信息。然后再采用循环神经网络对用户近期历史行为序列进行建模，得到用户长期兴趣。最后，考虑用户的多样性偏好信息，对用户的长短期兴趣进行融合，并给用户推荐可能感兴趣的短视频。本发明可有效实现符合用户兴趣的短视频推荐任务。

上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims

1.一种基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法，其特征在于：

S100、获取用户历史行为序列，并按照用户对物品的行为执行先后顺序，将用户历史行为序列分为近期历史行为序列和远期历史行为序列；

S200、基于用户近期历史行为序列，利用循环神经网络进行建模，得到用户的短期兴趣；

S300、根据用户历史行为序列中物品相似度，通过一个多次循环过程构成的过滤操作挖掘潜在的图结构；

S400、基于挖掘出的图结构，利用图神经网络更新物品向量，再基于更新后的物品向量通过长短期记忆神经网络得到用户的长期兴趣；

S500、根据用户兴趣多样性偏好，计算用户行为丰富程度，并结合通过学习得到的长短期兴趣的权重，对用户的短期兴趣和长期兴趣进行融合，得到最终的用户兴趣表示；

S600、通过计算用户兴趣表示和目标物品的向量表示之间的相似度，来预测用户对物品的点击率，实现物品推荐。

2.如权利要求1所述的基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法，其特征在于，所述S100的具体实现方法如下：

其中任一物品v_j∈V，下标m表示用户u_i行为序列

的长度；v_j的向量表征是x_j；将用户历史行为序列

中的后n个物品作为用户的近期历史行为序列，表示为

3.如权利要求2所述的基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法，其特征在于，所述S200的具体实现方法如下：

进行建模，得到用户的短期兴趣p^s：

p^s＝LSTM({x_m-n+1，x_m-n+2，…，x_m})

其中，{x_m-n+1，x_m-n+2，…，x_m}是用户近期历史行为序列{v_m-n+1，v_m-n+2，…，v_m}的向量表示，LSTM()表示长短期记忆神经网络，长短期记忆神经网络最后一个隐状态的输出即为用户的短期兴趣p^s。

4.如权利要求3所述的基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法，其特征在于，所述S300的具体实现方法如下：

计算用户历史行为序列中前面的物品和后面的物品之间的cosine相似度，得到图结构的初始邻接矩阵M；矩阵M是一个下三角矩阵，当矩阵中第i行第h列的M_ij下标满足i≥j时，M_ij＝0；M_ij表示用户历史行为序列中物品v_i和v_j的相似度，具体的值为物品v_i和v_j的向量表征x_i和x_j的cosine相似度；进一步对该初始邻接矩阵M进行过滤操作，得到一个稀疏的图结构G，所述过滤操作是一个多次循环过程：

第一步，设最终图结构包含的节点集合为N_v，要扩展的集合为C_v，N_v和C_v都初始化为{v_m-n+1，v_m-n+2，…，v_m}；