CN114519145A - 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法 - Google Patents

一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法 Download PDF

Info

Publication number
CN114519145A
CN114519145A CN202210160090.5A CN202210160090A CN114519145A CN 114519145 A CN114519145 A CN 114519145A CN 202210160090 A CN202210160090 A CN 202210160090A CN 114519145 A CN114519145 A CN 114519145A
Authority
CN
China
Prior art keywords
term
user
short
sequence
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210160090.5A
Other languages
English (en)
Inventor
韩启龙
刘东升
宋洪涛
李丽洁
马志强
王也
王宇华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202210160090.5A priority Critical patent/CN114519145A/zh
Publication of CN114519145A publication Critical patent/CN114519145A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,获得用户个人信息和用户交互序列数据集,将数据集进行预处理并分为训练集和测试集;构建基于图神经网络挖掘用户长短期兴趣的序列推荐模型;对所述基于图神经网络挖掘用户长短期兴趣的序列推荐模型进行训练;将待推荐用户的个人信息和交互序列输入到训练后的基于图神经网络挖掘用户长短期兴趣的序列推荐模型,计算待推荐项目相对于该用户的推荐得分,根据推荐得分将项目推荐给用户;本发明解决序列推荐场景中没有办法有效捕获用户长短期兴趣,并难以分辨噪声的问题。

Description

一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法
技术领域
本发明属于序列推荐技术领域,具体地,涉及一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法。
背景技术
随着互联网服务和移动设备使用的不断增长,互联网用户可以轻松访问大量在线产品和服务。尽管这种增长为用户提供了更多可用的选择,但用户也很难从大量候选商品中挑选出最喜欢的商品。为了减少信息过载,满足用户多样化的需求,个性化推荐系统应运而生,并在现代社会中发挥着越来越重要的作用。这些系统可以提供个性化的体验,服务用户的个人需求,具体好处有:(1)帮助用户轻松发现自己感兴趣的产品;(2)为产品提供商创造增加收入的机会。
在各种互联网服务中,用户按时间顺序访问项目,其中用户将交互的项目与他刚刚访问的那些项目密切相关。此属性有助于完成一项重要的推荐任务——序列推荐,它将用户行为历史视为按交互时间戳排序的交互序列。
关于序列推荐的最早工作是使用马尔可夫链(Markov chains MCs)来模拟项目之间的一阶转移关系,或者使用马尔可夫决策过程(Markov decision processes,MDP)来处理长期影响。后来,因子化的个性化MCs被提出并扩展到更高阶的版本,其灵感来自并结合了基于通用矩阵分解(matrix factorization,MF)的方法。例如,FPMC(FactorizingPersonalized Markov Chains)分解个性化马尔可夫链,以便捕捉长期兴趣和短期偏好。Fossil结合了基于相似性的模型和高阶马尔可夫链。TransRec(Translation-basedRecommendation)提出了一种基于转化的序列推荐方法。最近,受序列学习在自然语言处理中的优势的启发,研究人员提出了基于(深度)神经网络的方法来学习序列。例如,Caser(Convolutional Sequence Embedding Recommendation)应用卷积神经网络来处理项目嵌入序列。基于递归神经网络(Recurrent Neural Network,RNN)的方法,特别是基于门控递归单元(Gate Recurrent Unit,GRU)的方法已经被用于基于序列的推荐任务。自注意力机制在序列学习中有着良好的表现,并开始用于序列推荐。SASRec(Self-AttentiveSequential Recommendation)利用自我关注来自适应地考虑项目之间的相互作用。
目前基于深度学习的序列推荐方法中存在的问题:(1)用户行为在其丰富的历史序列中往往是隐含的和有噪声的偏好信号,它们不能充分反映用户的实际偏好;(2)在建模用户长期兴趣和短期偏好方面还存在着不足。
发明内容
本发明针对现有技术的不足,使用图神经网络等技术,挖掘用户长期兴趣和短期偏好,提出了一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法。
本发明通过以下技术方案实现:
一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,所述方法具体包括以下步骤:
步骤1:获得用户个人信息和用户交互序列数据集,将数据集进行预处理并分为训练集和测试集;
步骤2:构建基于图神经网络挖掘用户长短期兴趣的序列推荐模型;
步骤3:对步骤2所述基于图神经网络挖掘用户长短期兴趣的序列推荐模型进行训练;
步骤4:将待推荐用户的个人信息和交互序列输入到步骤3中训练后的基于图神经网络挖掘用户长短期兴趣的序列推荐模型,计算待推荐项目相对于该用户的推荐得分,根据推荐得分将项目推荐给用户。
进一步地,在步骤1中,
所述数据集包括用户的点击项目和评论数据;
所述步骤1具体为:
处理数据集中的数据:首先去掉用户交互的项目小于10的用户,去掉项目出现次数小于5的项目数;
读取用户对项目的评论:删除没有评论的项目,对于每个用户按照交互过的时间戳来进行重新排序;
最后生成PKL文件:数据处理完后,用户交互的系列表示为
Figure BDA0003513744350000021
Figure BDA0003513744350000022
I表示用户U交互的项目。
进一步地,在步骤2中,具体包含如下步骤:
步骤2.1:将数据集划分成用户交互的长期序列和短期序列;
将最近交互的5个项目为短期序列,其余交互的项目作为长期序列;
步骤2.2:获得用户个人信息嵌入表示向量和用户交互序列嵌入表示向量;
Hu,l表示用户u交互的长期序列,Lu,l表示用户u交互的短期序列,ui表示用户i的嵌入,ei表示项目i的嵌入;
步骤2.3:在长期序列上构建紧凑的项目-项目图,利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息,采用图池化技术和聚合函数聚合图中信息,得到用户的长期兴趣;
步骤2.4:在短期序列上采用两层门控网络来捕获项目特征,采用聚合函数得到用户的短期偏好;
步骤2.5:采用门控的方式来自适应的结合用户长期兴趣和短期偏好;公式如下:
Figure BDA0003513744350000031
Figure BDA0003513744350000032
其中gu,l为可学习门控参数,σ为激活函数,Wg5、Wg6、Wg7为可学习的权重参数,ui为用户嵌入,
Figure BDA0003513744350000033
为用户长期兴趣,
Figure BDA0003513744350000034
为长期兴趣与短期偏好融合后序列表示,
Figure BDA0003513744350000035
为用户短期偏好;
步骤2.6:在短期序列上采用双线性函数来捕获项目间的共现模式,得到结果向量
Figure BDA0003513744350000036
具体公式如下:
Figure BDA0003513744350000037
其中ei是项目嵌入,Wr是可学习权重参数。
进一步地,所述步骤2.3中具体为:
(1)通过在项目之间做相似度计算,构建紧凑的item-item图,具体公式如下:
Mi,j=cos(w⊙ei,w⊙ej)
Figure BDA0003513744350000038
其中Ai,j表示邻接矩阵,Mi,j表示项目i与项目j之间的相似度打分,cos表述余弦计算,
Figure BDA0003513744350000041
表示的是在M中第εn2大的数字,ε用来控制图的稀疏程度,n表示图中节点的数目,⊙表示为哈达玛积;
(2)利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息;公式如下:
ei=cos(ei,ui)·Wg3·ei
Figure BDA0003513744350000042
Figure BDA0003513744350000043
Figure BDA0003513744350000044
公式中,Wg3是可学习的权重参数;σ为激活函数,I为单位矩阵,第0层的输入为用户长期交互序列Hu,l,经历过l层得到新的节点嵌入;
(3)采用图池化技术和聚合函数AUGRU聚合图中信息得到用户的长期兴趣,公式如下:
S(l)=softmax(GNNl,pool(A(l),H(l)))
Figure BDA0003513744350000049
Figure BDA00035137443500000410
Figure BDA0003513744350000045
其中S(l)代表的是分配矩阵;
通过图池化的方式在保持图原有结构的基础上对图进行粗化;最后通过GRU加注意力的方式来获得长期的用户表示。
进一步地,在步骤2.4中:
所述两层门控模块分别是:特征门控模块,实例门控模块;特征门控模块所捕获的用户特定特征
Figure BDA0003513744350000046
将被传递给实例门控模块;在实例门控模块中,反映用户当前短期偏好的重要项目
Figure BDA0003513744350000047
将被区分出来并用于未来将要交互项目的预测,最后采用聚合函数AUGRU得用用户短期兴趣,具体公式如下:
Figure BDA0003513744350000048
Figure BDA0003513744350000051
Figure BDA0003513744350000052
公式中
Figure BDA0003513744350000053
表示两层门控的最终输出,
Figure BDA0003513744350000054
则代表用户短期偏好。
进一步地,在步骤3中,具体包含如下步骤:
步骤3.1:将步骤2.2的用户个人信息嵌入表示向量和用户交互序列嵌入表示向量,步骤2.5得到的长短期兴趣表示向量以及步骤2.6得到的结果向量输入到预测模块;
具体公式如下:
Figure BDA0003513744350000055
Figure BDA0003513744350000056
是对要预测项目的打分,
Figure BDA0003513744350000057
表示用户嵌入,
Figure BDA0003513744350000058
表示长期兴趣与短期偏好融合后序列表示,qj表示目标项目;
步骤3.2:通过贝叶斯个性化排名损失函数来更新模型的参数,训练得到最优的基于图神经网络挖掘用户长短期兴趣的序列推荐模型;
所述步骤3.2中,损失函数公式如下所示:
Figure BDA0003513744350000059
Figure BDA00035137443500000510
表示负实例打分,Θ表示可训练参数集,λ是正则化参数,表示惩罚力度。
进一步地,在步骤4中,将所述项目推荐得分进行排序,取前k个得分最高的项目推荐给用户。
一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现上述任一项所述方法的步骤。
本发明有益效果
本发明提供了一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,解决序列推荐场景中没有办法有效捕获用户长短期兴趣,并难以分辨噪声的问题。
附图说明
图1为本发明一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法的流程图;
图2为本发明一种基于图神经网络挖掘用户长短期兴趣的序列推荐模型框架图;
图3为本发明的构建项目-项目图的示意图;
图4为本发明的长短期兴趣门控结合图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
结合图1至图4。
一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,所述方法具体包括以下步骤:
步骤1:获得用户个人信息和用户交互序列数据集,将数据集进行预处理并分为训练集和测试集;
步骤2:构建基于图神经网络挖掘用户长短期兴趣的序列推荐模型;
步骤3:对步骤2所述基于图神经网络挖掘用户长短期兴趣的序列推荐模型进行训练;
步骤4:将待推荐用户的个人信息和交互序列输入到步骤3中训练后的基于图神经网络挖掘用户长短期兴趣的序列推荐模型,计算待推荐项目相对于该用户的推荐得分,根据推荐得分将项目推荐给用户。
在步骤1中,
所述数据集包括用户的点击项目和评论等数据;,本发明中选取三个数据集:Amazon-CDs、Goodreads-Children、MovieLens-20M;下文以Amazon-CDss数据集为例进行介绍;
所述步骤1具体为:
处理数据集中的数据:首先去掉用户交互的项目小于10的用户,去掉项目出现次数小于5的项目数;
读取用户对项目的评论:删除没有评论的项目,对于每个用户按照交互过的时间戳来进行重新排序;
最后生成PKL文件:数据处理完后,用户交互的系列表示为
Figure BDA0003513744350000071
Figure BDA0003513744350000072
I表示用户U交互的项目。
在步骤2中,具体包含如下步骤:
步骤2.1:将数据集划分成用户交互的长期序列和最近交互的短期序列;
将最近交互的5个项目为短期序列,其余交互的项目作为长期序列;
步骤2.2:获得用户个人信息嵌入表示向量和用户交互序列嵌入表示向量;
Hu,l表示用户u交互的长期序列,Lu,l表示用户u交互的短期序列,ui表示用户i的嵌入,ei表示项目i的嵌入;
步骤2.3:在长期序列上构建紧凑的项目-项目图,利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息,采用图池化技术和聚合函数聚合图中信息,得到用户的长期兴趣;
所述步骤2.3中具体为:
(1)通过在项目之间做相似度计算,构建紧凑的item-item图,具体公式如下:
Mi,j=cos(w⊙ei,w⊙ej)
Figure BDA0003513744350000073
其中Ai,j表示邻接矩阵,Mi,j表示项目i与项目j之间的相似度打分,cos表述余弦计算,
Figure BDA0003513744350000074
表示的是在M中第εn2大的数字,ε用来控制图的稀疏程度,n表示图中节点的数目,⊙表示为哈达玛积;
(2)利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息;公式如下:
ei=cos(ei,ui)·Wg3·ei
Figure BDA0003513744350000075
Figure BDA0003513744350000076
Figure BDA0003513744350000077
公式中,Wg3是可学习的权重参数;σ为激活函数,I为单位矩阵,第0层的输入为用户长期交互序列Hu,l,经历过l层得到新的节点嵌入;
采用用户嵌入与节点嵌入进行相似度计算,使得有噪声的项目在捕获用户整体的兴趣的过程中占有的权重降低;
(3)采用图池化技术和聚合函数AUGRU聚合图中信息得到用户的长期兴趣,公式如下:
S(l)=softmax(GNNl,pool(A(l),H(l)))
Figure BDA0003513744350000089
Figure BDA00035137443500000810
Figure BDA0003513744350000081
其中S(l)代表的是分配矩阵,可以在模型优化中训练;
通过图池化的方式在保持图原有结构的基础上对图进行粗化;最后通过GRU加注意力的方式来获得长期的用户表示。
步骤2.4:在短期序列上采用两层门控网络来捕获项目特征,采用聚合函数得到用户的短期偏好;
在步骤2.4中:
所述两层门控模块分别是:特征门控模块(feature gating module),实例门控模块(instance gating module);特征门控模块能够基于用户偏好,自适应地捕获项目中真正吸引用户的潜在特征,其中所捕获的用户特定特征
Figure BDA0003513744350000082
将被传递给实例门控模块;在实例门控模块中,反映用户当前短期偏好的重要项目
Figure BDA0003513744350000083
将被区分出来并用于未来将要交互项目的预测,最后采用聚合函数AUGRU得用用户短期兴趣,具体公式如下:
Figure BDA0003513744350000084
Figure BDA0003513744350000085
Figure BDA0003513744350000086
公式中
Figure BDA0003513744350000087
表示两层门控的最终输出,
Figure BDA0003513744350000088
则代表用户短期偏好。
步骤2.5:采用门控的方式来自适应的结合用户长期兴趣和短期偏好;
所述步骤2.5中,然后采用门控的方式结合长期兴趣和短期兴趣,来控制两种兴趣的贡献度;采用的方式类似于GRU;使用一个可学习门控来控制长期兴趣的表示和短期兴趣的表示对最终预测项目的贡献;公式如下:
Figure BDA0003513744350000091
Figure BDA0003513744350000092
其中gu,l为可学习门控参数,σ为激活函数,Wg5、Wg6、Wg7为可学习的权重参数,ui为用户嵌入,
Figure BDA0003513744350000093
为用户长期兴趣,
Figure BDA0003513744350000094
为长期兴趣与短期偏好融合后序列表示,
Figure BDA0003513744350000095
为用户短期偏好;
步骤2.6:在短期序列上采用双线性函数来捕获项目间的共现模式,得到结果向量
Figure BDA0003513744350000096
具体公式如下:
Figure BDA0003513744350000097
其中ei是项目嵌入,Wr是可学习权重参数。
在步骤3中,具体包含如下步骤:
步骤3.1:将步骤2.2的用户个人信息嵌入表示向量和用户交互序列嵌入表示向量,步骤2.5得到的长短期兴趣表示向量以及步骤2.6得到的结果向量输入到预测模块;
具体公式如下:
Figure BDA0003513744350000098
Figure BDA0003513744350000099
是对要预测项目的打分,
Figure BDA00035137443500000910
表示用户嵌入,
Figure BDA00035137443500000911
表示长期兴趣与短期偏好融合后序列表示,qj表示目标项目;
步骤3.2:通过贝叶斯个性化排名损失函数来更新模型的参数,训练得到最优的基于图神经网络挖掘用户长短期兴趣的序列推荐模型;
所述步骤3.2中,损失函数公式如下所示:
Figure BDA0003513744350000101
Figure BDA0003513744350000102
表示负实例打分,Θ表示可训练参数集,λ是正则化参数,表示惩罚力度。
在步骤4中,将所述项目推荐得分进行排序,取前k个得分最高的项目推荐给用户。
一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现上述任一项所述方法的步骤。
以上对本发明所提出的一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,进行了详细介绍,对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,其特征在于:
所述方法具体包括以下步骤:
步骤1:获得用户个人信息和用户交互序列数据集,将数据集进行预处理并分为训练集和测试集;
步骤2:构建基于图神经网络挖掘用户长短期兴趣的序列推荐模型;
步骤3:对步骤2所述基于图神经网络挖掘用户长短期兴趣的序列推荐模型进行训练;
步骤4:将待推荐用户的个人信息和交互序列输入到步骤3中训练后的基于图神经网络挖掘用户长短期兴趣的序列推荐模型,计算待推荐项目相对于该用户的推荐得分,根据推荐得分将项目推荐给用户。
2.根据权利要求1所述方法,其特征在于:在步骤1中,
所述数据集包括用户的点击项目和评论数据;
所述步骤1具体为:
处理数据集中的数据:首先去掉用户交互的项目小于10的用户,去掉项目出现次数小于5的项目数;
读取用户对项目的评论:删除没有评论的项目,对于每个用户按照交互过的时间戳来进行重新排序;
最后生成PKL文件:数据处理完后,用户交互的系列表示为
Figure FDA0003513744340000011
Figure FDA0003513744340000012
I表示用户U交互的项目。
3.根据权利要求2所述方法,其特征在于:
在步骤2中,具体包含如下步骤:
步骤2.1:将数据集划分成用户交互的长期序列和短期序列;
将最近交互的5个项目为短期序列,其余交互的项目作为长期序列;
步骤2.2:获得用户个人信息嵌入表示向量和用户交互序列嵌入表示向量;
Hu,l表示用户u交互的长期序列,Lu,l表示用户u交互的短期序列,ui表示用户i的嵌入,ei表示项目i的嵌入;
步骤2.3:在长期序列上构建紧凑的项目-项目图,利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息,采用图池化技术和聚合函数聚合图中信息,得到用户的长期兴趣;
步骤2.4:在短期序列上采用两层门控网络来捕获项目特征,采用聚合函数得到用户的短期偏好;
步骤2.5:采用门控的方式来自适应的结合用户长期兴趣和短期偏好;
公式如下:
Figure FDA0003513744340000021
Figure FDA0003513744340000022
其中gu,l为可学习门控参数,σ为激活函数,Wg5、Wg6、Wg7为可学习的权重参数,ui为用户嵌入,
Figure FDA0003513744340000023
为用户长期兴趣,
Figure FDA0003513744340000024
为长期兴趣与短期偏好融合后序列表示,
Figure FDA0003513744340000025
为用户短期偏好;
步骤2.6:在短期序列上采用双线性函数来捕获项目间的共现模式,得到结果向量
Figure FDA0003513744340000026
具体公式如下:
Figure FDA0003513744340000027
其中ei是项目嵌入,Wr是可学习权重参数。
4.根据权利要求3所述方法,其特征在于:
所述步骤2.3中具体为:
(1)通过在项目之间做相似度计算,构建紧凑的item-item图,具体公式如下:
Mi,j=cos(w⊙ei,w⊙ej)
Figure FDA0003513744340000028
其中Ai,j表示邻接矩阵,Mi,j表示项目i与项目j之间的相似度打分,cos表述余弦计算,
Figure FDA0003513744340000029
表示的是在M中第εn2大的数字,ε用来控制图的稀疏程度,n表示图中节点的数目,⊙表示为哈达玛积;
(2)利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息;公式如下:
ei=cos(ei,ui)·Wg3·ei
Figure FDA0003513744340000031
Figure FDA0003513744340000032
Figure FDA0003513744340000033
公式中,Wg3是可学习的权重参数;σ为激活函数,I为单位矩阵,第0层的输入为用户长期交互序列Hu,l,经历过l层得到新的节点嵌入;
(3)采用图池化技术和聚合函数AUGRU聚合图中信息得到用户的长期兴趣,公式如下:
S(l)=softmax(GNNl,pool(A(l),H(l)))
Figure FDA00035137443400000312
Figure FDA00035137443400000313
Figure FDA0003513744340000034
其中S(l)代表的是分配矩阵;
通过图池化的方式在保持图原有结构的基础上对图进行粗化;最后通过GRU加注意力的方式来获得长期的用户表示。
5.根据权利要求4所述方法,其特征在于:在步骤2.4中:
所述两层门控模块分别是:特征门控模块,实例门控模块;特征门控模块所捕获的用户特定特征
Figure FDA0003513744340000035
将被传递给实例门控模块;在实例门控模块中,反映用户当前短期偏好的重要项目
Figure FDA0003513744340000036
将被区分出来并用于未来将要交互项目的预测,最后采用聚合函数AUGRU得用用户短期兴趣,具体公式如下:
Figure FDA0003513744340000037
Figure FDA0003513744340000038
Figure FDA0003513744340000039
公式中
Figure FDA00035137443400000310
表示两层门控的最终输出,
Figure FDA00035137443400000311
则代表用户短期偏好。
6.根据权利要求5所述方法,其特征在于:
在步骤3中,具体包含如下步骤:
步骤3.1:将步骤2.2的用户个人信息嵌入表示向量和用户交互序列嵌入表示向量,步骤2.5得到的长短期兴趣表示向量以及步骤2.6得到的结果向量输入到预测模块;
具体公式如下:
Figure FDA0003513744340000041
Figure FDA0003513744340000042
是对要预测项目的打分,
Figure FDA0003513744340000043
表示用户嵌入,
Figure FDA0003513744340000044
表示长期兴趣与短期偏好融合后序列表示,qj表示目标项目;
步骤3.2:通过贝叶斯个性化排名损失函数来更新模型的参数,训练得到最优的基于图神经网络挖掘用户长短期兴趣的序列推荐模型;
所述步骤3.2中,损失函数公式如下所示:
Figure FDA0003513744340000045
Figure FDA0003513744340000046
表示负实例打分,Θ表示可训练参数集,λ是正则化参数,表示惩罚力度。
7.根据权利要求6所述方法,其特征在于:
在步骤4中,将所述项目推荐得分进行排序,取前k个得分最高的项目推荐给用户。
8.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
9.一种计算机可读存储介质,用于存储计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
CN202210160090.5A 2022-02-22 2022-02-22 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法 Pending CN114519145A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210160090.5A CN114519145A (zh) 2022-02-22 2022-02-22 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210160090.5A CN114519145A (zh) 2022-02-22 2022-02-22 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法

Publications (1)

Publication Number Publication Date
CN114519145A true CN114519145A (zh) 2022-05-20

Family

ID=81598179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210160090.5A Pending CN114519145A (zh) 2022-02-22 2022-02-22 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法

Country Status (1)

Country Link
CN (1) CN114519145A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114925279A (zh) * 2022-06-07 2022-08-19 支付宝(杭州)信息技术有限公司 推荐模型训练方法、推荐方法以及装置
CN114971784A (zh) * 2022-05-21 2022-08-30 内蒙古工业大学 一种融合自注意力机制基于图神经网络的会话推荐方法与系统
CN115062230A (zh) * 2022-08-16 2022-09-16 深圳市海清视讯科技有限公司 数据处理方法、装置、设备、介质和程序产品
CN115099886A (zh) * 2022-05-25 2022-09-23 华南理工大学 一种长短兴趣序列推荐方法、装置及存储介质
CN116562992A (zh) * 2023-07-11 2023-08-08 数据空间研究院 一种建模用户新兴趣不确定性的物品推荐方法、装置及介质
CN116842266A (zh) * 2023-07-11 2023-10-03 盐城工学院 一种感知用户行为与兴趣的动态推荐系统
CN116932893A (zh) * 2023-06-21 2023-10-24 江苏大学 一种基于图卷积网络的序列推荐方法、系统、设备及介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114971784A (zh) * 2022-05-21 2022-08-30 内蒙古工业大学 一种融合自注意力机制基于图神经网络的会话推荐方法与系统
CN114971784B (zh) * 2022-05-21 2024-05-14 内蒙古工业大学 一种融合自注意力机制基于图神经网络的会话推荐方法与系统
CN115099886A (zh) * 2022-05-25 2022-09-23 华南理工大学 一种长短兴趣序列推荐方法、装置及存储介质
CN115099886B (zh) * 2022-05-25 2024-04-19 华南理工大学 一种长短兴趣序列推荐方法、装置及存储介质
CN114925279A (zh) * 2022-06-07 2022-08-19 支付宝(杭州)信息技术有限公司 推荐模型训练方法、推荐方法以及装置
CN115062230A (zh) * 2022-08-16 2022-09-16 深圳市海清视讯科技有限公司 数据处理方法、装置、设备、介质和程序产品
CN115062230B (zh) * 2022-08-16 2023-01-06 深圳市海清视讯科技有限公司 数据处理方法、装置、设备、介质和程序产品
CN116932893A (zh) * 2023-06-21 2023-10-24 江苏大学 一种基于图卷积网络的序列推荐方法、系统、设备及介质
CN116562992A (zh) * 2023-07-11 2023-08-08 数据空间研究院 一种建模用户新兴趣不确定性的物品推荐方法、装置及介质
CN116562992B (zh) * 2023-07-11 2023-09-29 数据空间研究院 一种建模用户新兴趣不确定性的物品推荐方法、装置及介质
CN116842266A (zh) * 2023-07-11 2023-10-03 盐城工学院 一种感知用户行为与兴趣的动态推荐系统
CN116842266B (zh) * 2023-07-11 2024-01-26 盐城工学院 一种感知用户行为与兴趣的动态推荐系统

Similar Documents

Publication Publication Date Title
Wu et al. Session-based recommendation with graph neural networks
CN114519145A (zh) 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法
CN110929164B (zh) 一种基于用户动态偏好与注意力机制的兴趣点推荐方法
CN111931062B (zh) 一种信息推荐模型的训练方法和相关装置
CN107423442B (zh) 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备
WO2021233199A1 (zh) 搜索推荐模型的训练方法、搜索结果排序的方法及装置
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN111127142B (zh) 一种基于广义神经注意力的物品推荐方法
CN112182154B (zh) 一种利用个人词向量消除关键词歧义的个性化搜索模型
CN116542720B (zh) 一种基于图卷积网络的时间增强信息序列推荐方法及系统
CN113918832A (zh) 基于社交关系的图卷积协同过滤推荐系统
CN114595383A (zh) 一种基于会话序列的海洋环境数据推荐方法及系统
Long et al. Multi-task learning for collaborative filtering
CN115618101A (zh) 基于负反馈的流媒体内容推荐方法、装置及电子设备
CN115718826A (zh) 图结构数据中的目标节点分类方法、系统、设备及介质
CN114943034A (zh) 基于细粒度方面特征的智能新闻推荐方法和系统
Zhang et al. Skip-attention encoder–decoder framework for human motion prediction
Bao et al. Multisource heterogeneous user-generated contents-driven interactive estimation of distribution algorithms for personalized search
WO2024067373A1 (zh) 一种数据处理方法及相关装置
Zhou et al. A content search method for security topics in microblog based on deep reinforcement learning
Yuan et al. Deep learning from a statistical perspective
CN113590976A (zh) 一种空间自适应图卷积网络的推荐方法
CN111368168A (zh) 一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质
CN115730143A (zh) 基于任务对齐元学习和增广图的推荐系统、方法、终端及介质
Sun et al. DSMN: A personalized information retrieval algorithm based on improved DSSM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination