CN113256367B - 用户行为历史数据的商品推荐方法、系统、设备及介质 - Google Patents

用户行为历史数据的商品推荐方法、系统、设备及介质 Download PDF

Info

Publication number
CN113256367B
CN113256367B CN202110463510.2A CN202110463510A CN113256367B CN 113256367 B CN113256367 B CN 113256367B CN 202110463510 A CN202110463510 A CN 202110463510A CN 113256367 B CN113256367 B CN 113256367B
Authority
CN
China
Prior art keywords
user
commodity
recommended
vector
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110463510.2A
Other languages
English (en)
Other versions
CN113256367A (zh
Inventor
郝俊美
顿玉洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110463510.2A priority Critical patent/CN113256367B/zh
Publication of CN113256367A publication Critical patent/CN113256367A/zh
Application granted granted Critical
Publication of CN113256367B publication Critical patent/CN113256367B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种基于用户行为历史数据的商品推荐方法、系统、设备及介质,所述方法包括以下步骤:获取待推荐用户的用户行为历史数据;将所述待推荐用户的用户行为历史数据输入预训练好的矩阵分解模型,获得待推荐用户的长期偏好向量和商品特征向量;基于所述待推荐用户的用户行为历史数据,获得待推荐用户的用户行为序列;将所述待推荐用户的用户行为序列、长期偏好向量和商品特征向量输入预训练好的环形图注意力网络模型,获得用户和商品的匹配度得分结果;基于匹配度得分结果,将达到预设要求的商品推荐给待推荐用户。本发明能够根据用户的历史行为以及用户对商品的评分矩阵为用户提供准确的推荐。

Description

用户行为历史数据的商品推荐方法、系统、设备及介质
技术领域
本发明属于计算机信息检索技术领域,特别涉及一种基于用户行为历史数据的商品推荐方法、系统、设备及介质。
背景技术
随着社交网络的爆发,在线看电影和网络购物越来越流行,爆炸性信息造成严重的信息过载问题。推荐系统可以提供过滤信息的功能,帮助用户找到他们感兴趣的商品和内容,以解决信息过载的问题。大多数系统只根据用户的基本特征(例如,年龄、性别等特征)推荐商品,而不考虑用户行为序列所反应的用户短期偏好;因此,在推荐系统中,序列推荐发挥着重要作用。序列推荐模型对用户行为序列进行建模,以在短时间内了解用户偏好的变化,并利用用户的行为序列预测用户的下一个行为,推荐系统有必要挖掘用户的历史行为序列来推荐商品。推荐系统引入序列推荐来为用户推荐下一个商品或是未来行为序列中的一个商品可以更有效地为用户提供商品推荐。
目前已有的基于图神经网络的推荐系统、基于深度学习的生物医学出版物推荐系统等推荐系统并未使用用户行为的顺序关系;目前已有的基于马尔可夫链的会话式推荐系统,其考虑了用户行为的顺序关系,但是并没有考虑用户的长期偏好特征。
综上,为了能够准确的给用户推荐商品,现有技术开发了很多种算法,目前现有技术中的算法存在的缺陷包括:
只使用了用户商品评分矩阵,而没有考虑用户的行为的时间顺序关系;
或者,只使用了用户的行为进行序列推荐,但是没有考虑从用户商品评分矩阵中挖掘用户的长期偏好特征;
或者,虽然两种都考虑了,但是在考虑用户行为序列的时候只利用相邻行为来捕获序列的特征,忽略了非相邻序列项之间的特征和序列的汇总特征;
综上,上述这些缺陷使得现有推荐方法的准确率较低。
发明内容
本发明的目的在于提供一种基于用户行为历史数据的商品推荐方法、系统、设备及介质,以解决上述存在的一个或多个技术问题。本发明能够根据用户的历史行为以及用户对商品的评分矩阵为用户提供准确的推荐。
为达到上述目的,本发明采用以下技术方案:
本发明的一种基于用户行为历史数据的商品推荐方法,包括以下步骤:
获取待推荐用户的用户行为历史数据;
将所述待推荐用户的用户行为历史数据输入预训练好的矩阵分解模型,获得待推荐用户的长期偏好向量和商品特征向量;
基于所述待推荐用户的用户行为历史数据,获得待推荐用户的用户行为序列;将所述待推荐用户的用户行为序列、长期偏好向量和商品特征向量输入预训练好的环形图注意力网络模型,获得用户和商品的匹配度得分结果;
基于匹配度得分结果,将达到预设要求的商品推荐给待推荐用户。
本发明的进一步改进在于,所述用户行为历史数据包括用户对商品的点击、购买和评价行为中的一种或多种。
本发明的进一步改进在于,所述预训练好的矩阵分解模型的获取步骤具体包括:
获取预设数量用户在预设数量网站上的历史行为数据;
基于所述历史行为数据将所有用户和商品的评分统计在一起,形成用于矩阵分解的用户商品评分矩阵;
所述矩阵分解模型中,通过矩阵分解将所述用户商品评分矩阵分解为长期偏好矩阵P∈Rd*M和商品特征矩阵Q∈Rd*K;其中,d是向量维度,M为用户总数量,K为商品总数量;用户u对商品i的评分的预测值的计算表达式为:
Figure SMS_1
式中,
Figure SMS_2
为用户u对商品i的评分的预测值,Pu为用户u的长期偏好向量,Qi为商品i的商品特征向量;
所述矩阵分解模型拟合过程中,目标函数表示为:
Figure SMS_3
式中,Ru,i为用户u对商品i的评分,
Figure SMS_4
是用户u对商品i的评分预测值;
通过使用最小化目标函数来学习P和Q矩阵,选择随机梯度下降作为优化器,达到收敛条件,获得训练好的矩阵分解模型。
本发明的进一步改进在于,所述预训练好的环形图注意力网络模型的获取步骤具体包括:
基于所述历史行为数据集,先按照用户的不同进行分组,再对每个用户的行为按照行为的时间顺序进行排序,形成用户行为序列数据集;
采用滑动窗口将所述用户行为序列数据集中每个用户的用户行为序列分成多个预设长度的短序列,将每个所述短序列构建成一个环形图,所述短序列中的每个行为设置有一个对应的子环形图;所述环形图包括整个所述短序列的信息,所述子环形图只包括与该行为相邻的行为所连成的图;
环形图注意力网络模型中,将环形图注意力机制分别应用在所述环形图和每个子环形图上,得到每个用户的全局特征和局部特征;将用户的局部特征和全局特征拼接结合后得到用户的短期偏好向量;将用户的短期偏好向量与长期偏好向量拼接结合后输入多层感知机网络,获得用户特征;将用户特征与商品特征相匹配获得得分结果;
基于得分结果训练环形图注意力网络模型,采用二进制交叉熵损失函数,表达式为:
Figure SMS_5
式中,i为用户u的正样本,j为用户u的负样本,j的选择为从用户u从未有过行为的商品中随机筛选;σ为sigmoid激活函数。
本发明的进一步改进在于,所述环形图注意力网络模型的环形图注意力机制AGAtt计算表达式为:
Figure SMS_6
式中,q∈R1*d是更新节点的向量表示,k∈Rl*d,v∈Rl*d均为与更新节点相连接的节点的结合,l为环形图上下文注意力的长度,d为向量维度,Wq,Wk,Wv分别表示q,k,v的权重参数。
本发明的进一步改进在于,所述将用户特征与商品特征相匹配获得得分结果的过程中,得分结果的计算表达式为:
y=z*WI+b,
式中,y是计算的得分结果,z是用户的最终表示向量,WI∈RI*d表示所有候选商品的特征向量,b∈RI表示偏置项。
本发明的进一步改进在于,基于匹配度得分结果,将达到预设要求的商品推荐给待推荐用户的具体步骤包括:
将得分结果映射为概率,概率达到预设要求的商品推荐给待推荐用户。
本发明的一种基于用户行为历史数据的商品推荐系统,包括:
获取模块,用于获取待推荐用户的用户行为历史数据;
矩阵分解模块,用于将所述待推荐用户的用户行为历史数据输入预训练好的矩阵分解模型,获得待推荐用户的长期偏好向量和商品特征向量;
得分结果获取模块,用于根据所述待推荐用户的用户行为历史数据,获得待推荐用户的用户行为序列;将所述待推荐用户的用户行为序列、长期偏好向量和商品特征向量输入预训练好的环形图注意力网络模型,获得用户和商品的匹配度得分结果;
推荐模块,用于根据匹配度得分结果,将达到预设要求的商品推荐给待推荐用户。
本发明的一种电子设备,包括:处理器;存储器,用于存储计算机程序指令;所述计算机程序指令由所述处理器加载并运行时,所述处理器执行本发明任一项上述的基于用户行为历史数据的商品推荐方法。
本发明的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,所述计算机程序指令被处理器加载并运行时,所述处理器执行本发明任一项上述的基于用户行为历史数据的商品推荐方法。
与现有技术相比,本发明具有以下有益效果:
本发明提供的基于用户行为数据或序列的商品推荐方法中,环形图注意力网络通过对用户行为序列行成的环形图进行权重计算,得到用户的短期偏好向量,并将基于矩阵分解得到的长期偏好向量合并到统一的一个框架中。本发明可显著提升用户建模的准确度,提升算法的准确率和召回率,通过用户长期偏好和短期偏好相结合的方式,刻画更精准的用户画像,可以应用在电商视频旅游等推荐系统应用场景中,可以提供更准确迅速的推荐服务。
本发明中,为了增强对用户短期偏好的建模,在用户行为序列的基础上构建了一个环形图,并提出一个环形图注意力应用在环形图上,并从两个方面探讨了用户的短期偏好:第一种是在子环形图上应用环形图注意来探索局部特征,第二种是在整个环形图上应用环形图注意来探索全局特征,可提高推荐的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面对实施例或现有技术描述中所需要使用的附图做简单的介绍;显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种基于环形图注意力网络对用户建模的序列推荐方法的流程示意图;
图2是本发明实施例中,采用的环形图示意图;
图3是本发明实施例中,使用Mean Average Precision(MAP)来衡量推荐系统性能的示意图(针对不同的用户序列滑窗窗口的大小);其中,图3中(a)为MAP在MovieLens上的值的示意图;图3中(b)为MAP在Gowalla上的值的示意图;
图4是本发明实施例中,使用Mean Average Precision(MAP)来衡量推荐系统性能的示意图(针对不同的用户推荐目标商品个数的大小);
图5是本发明实施例中,使用Mean Average Precision(MAP)来衡量推荐系统性能的示意图(针对不同的用户和商品的向量的维度大小);其中,图5中(a)为MAP在MovieLens上的值的示意图;图5中(b)为MAP在Gowalla上的值的示意图。
具体实施方式
为使本发明实施例的目的、技术效果及技术方案更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述;显然,所描述的实施例是本发明一部分实施例。基于本发明公开的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的其它实施例,都应属于本发明保护的范围。
图注意力机制和矩阵分解的联合应用在推荐系统上具有优越的性能,本发明实施例主要思路是建立用户行为之间的相关性,探索用户序列行为的顺序影响,以及不相邻的行为之间的相互影响力,这个过程是环形图注意力网络自动进行的,保证了所使用的高级特征是最适合对应任务的,加上矩阵分解得到的用户长期偏好特征以及商品特征,也保证了对用户整体特征建模的稳定性。
请参阅图1,本发明实施例的一种基于用户行为序列或历史数据的商品推荐方法,具体包括如下步骤:
步骤1:采集预设数量的用户在一个或多个预设网站上的历史行为数据;示例性的,本发明实施例所述历史行为数据包括用户对商品的点击、购买、评分等行为信息;
基于所述历史行为数据,按照用户的不同进行分组,然后再对每个用户的行为按照行为的时间顺序进行排序,形成环形图注意力网络的学习样本,即用户行为序列,用于后续的环形图注意网络的训练;
基于所述历史行为数据,将所有用户和商品的评分统计在一起,形成用于矩阵分解的用户商品评分矩阵数据集。示例性的,本发明实施例中,对于有评分记录的数据集,用户没有评分的商品取0分;对于没有评分记录的数据集,可以将用户有过行为的商品“评分”设为1,没有过行为的商品“评分”设为0;行为包括点击、购买等用户行为。
步骤2:构建用于进行序列推荐的环形图注意力网络,使用用户的历史行为数据进行训练,获得训练好的环形图注意力网络模型;所述训练好的环形图注意力网络模型用于输入待推荐用户的历史行为信息,输出所述待推荐用户的短期偏好向量。
请参阅图2,本发明实施例的步骤2具体包括:
步骤2.1、采用滑动窗口将用户行为序列分成多个短序列,将每个短序列作为网络的输入;
步骤2.2、将用户的短序列构建成一个环形图;
步骤2.3、整个环形图包括整个序列中所有的信息,用户行为序列中的每一个行为都有一个对应的子环形图,子环形图只包括和与该行为相邻的行为;
将环形图注意力分别应用在整个环形图上和每个子环形图上,得到用户的全局特征和局部特征;环形图注意力AGAtt计算表达式为:
Figure SMS_7
其中,q∈R1*d是所更新节点的向量表示,k∈Rl*d,v∈Rl*d都是其环形图的上下文向量,即与该训练节点相连接的节点的结合l为环形图上下文注意力的长度,d为向量维度,Wq,Wk,Wv是可以训练的权重参数;
步骤2.4、将用户的局部特征和全局特征拼接结合后得到用户的短期偏好向量。
步骤3:构建用于得到用户长期偏好向量和商品向量的矩阵分解模型,得到用户的长期偏好向量和商品的特征向量,包括:
步骤3.1、使用用户商品评分矩阵数据集;
步骤3.2、初始化用户矩阵P∈Rd*M和商品矩阵Q∈Rd*K,其中,d是向量维度,M为用户的总数量,K为商品的总数量;
步骤3.3、使用评分矩阵学习用户矩阵和商品矩阵:Ru,i为用户u对商品i对真实评分,
Figure SMS_8
为用户u对商品i的预测评分,/>
Figure SMS_9
的计算为:/>
Figure SMS_10
步骤3.4、利用最小化均方误差损失函数训练矩阵分解模型得到用户的长期偏好向量和商品特征:
Figure SMS_11
其中Ru,i用户u对商品i的评分,
Figure SMS_12
是用户u对商品i的评分预测值。
步骤4:将步骤2得到的用户的短期偏好向量和步骤3得到的长期偏好向量进行拼接结合,然后将多层感知机设置为3层,最后进行特征提取得到用户的高阶表示向量;
步骤5:将用户的最终表示向量和商品的特征向量相匹配,将步骤4得到的用户的最终表示向量z和所有候选商品的特征向量WI做乘积,计算得分:y=z*WI+b;其中,y是计算的得分,z是用户的最终表示向量,WI∈RI*d表示所有候选商品的特征向量,b∈RI表示偏置项。
步骤6:根据步骤5计算出的得分映射为数据进行概率映射,得到推荐下一个行为的贝叶斯概率:
Figure SMS_13
其中,/>
Figure SMS_14
表示用户u在时间t的行为(即购买的商品),σ表示sigmoid激活函数。
本发明实施例中,为了训练模型,将最后的推荐排序问题看为二分类问题,并使用二进制交叉熵损失函数作为此阶段最后的损失函数:
Figure SMS_15
式中,i为用户u的正样本(即用户购买的下一个商品),j为用户u的负样本,j的选择为从用户u从未有过行为的商品中随机筛选;可选的,j的个数为3。σ为sigmoid激活函数
在推荐的时候,直接根据用户对商品的评分排序为用户进行推荐。
本发明是一种基于用户行为序列的商品推荐方法及系统:本推荐系统的环形图注意力网络通过对用户行为序列行成的环形图进行权重计算,得到用户的短期偏好向量,并将基于矩阵分解得到的长期偏好向量合并到统一的一个框架中;为了增强对用户短期偏好的建模,本推荐系统在用户行为序列的基础上构建了一个环形图,并提出一个环形图注意力应用在环形图上,并从两个方面探讨了用户的短期偏好:第一种是在子环形图上应用环形图注意来探索局部特征,第二种是在整个环形图上应用环形图注意来探索全局特征。本发明显著提升了用户建模的准确度,提升了算法的准确率和召回率,通过用户长期偏好和短期偏好相结合的方式,刻画更精准的用户画像,可以应用在电商视频旅游等推荐系统应用场景中,可以提供更准确迅速的推荐服务。
本发明可以在视频网站,旅游网站,电商网站上进行应用;本发明提出的环形图注意力不仅可以对短期序列的局部特征建模,而且可以对短期序列的全局特征进行建模,以找到序列中最有影响的行为提取有效信息。从实验中,模型在两个真实世界的数据集上性能都优于当前最先进的方法。相比现有方法,本发明显著提升了推荐系统的准确率,召回率,以及平均均值精度(排序性能),可以为用户提供更好的推荐服务。本发明跳出普通的序列模型,将滑窗得到的用户序列看作一个环形图,提出了基于用户行为序列的商品推荐方法及系统(简称为AGSR),可以在视频网站的推荐系统;旅游推荐系统等应用场景上应用。
本发明实施例中,以电影推荐和POI推荐为实验案例,证明该算法的优越性;实验是在两个真实数据集上进行的:MovieLens数据集(https://grouplens.org/datasets/movielens/1m)和Gowalla数据集(https://snap.stanford.edu/data/loc-gowalla.html);使用的过滤后的MovieLens数据集包含了6000名用户对3400部电影共993000的观看评分行为,此数据集的时间戳以秒表示,使用的Gowalla数据集包括了13100名用户对14000个地点的533694个打卡行为。
将本发明与当前国内外最先进推荐模型进行对比,并采用公认的流行评价指标;其中,推荐性能的评价指标主要有Precision(准确率)、Recall(召回率)、Mean AveragePrecision(MAP)(平均均值精度),用评价指标Precision,Recall,MAP衡量推荐性能的结果如表1所示。
表1用评价指标Precision,Recall,MAP衡量推荐性能
Figure SMS_16
从表1可以看出,本发明在Precision、Recall、MAP三个评价指标都高于其它推荐模型,证明了本发明的有效性,它能够明显提高推荐的准确性。特别是,在Movielens数据集上,本发明的精准率、召回率和MAP都有了显著的提高;与最佳对比算法模型相比,Precision@1提高了19.89%,Recall@1提高了28.76%,MAP提高了17.78。
如图3所示,示出了序列长度对MovieLens和Gowalla的影响,y轴是MAP,x轴是序列长度;图3给出了本发明实验案例使用MAP来衡量推荐系统性能的图(针对不同的对用户序列滑窗窗口的大小)。图3展示了序列长度对两个数据集的影响。本发明只改变序列长度,从1到8,其他参数不改变。在这种情况下,将目标序列的长度设置为1。从图3中可以看出,序列长度的选择与数据集有关,不同的数据集对序列有不同的依赖关系。在MovieLens数据集中,序列长度越大,性能就越好,而在其他数据集中,序列长度的增加并不能提高性能。这是因为稀疏数据集对序列的依赖性较弱,稠密的数据集有更强的序列依赖性。如果稀疏数据集的序列长度太长,就会带来额外的噪声,从而导致性能降低。从图3中观察到在所有序列长度上,本发明实施例的模型的性能都优于其他对比模型。此外,当序列长度设置为5时,AGSR的MAP最高。
如图4所示,示出了目标长度对MovieLens和Gowalla数据集的影响,y轴是MAP,x轴是目标长度;图4给出了本发明实验案例使用MAP来衡量推荐系统性能的图(针对不同的用户推荐目标商品个数的大小);目标行为序列的长度可以反映跳跃影响的效果。跳跃影响意味着用户的下一个交互行为可能受到倒数第二个行为或者倒数第三个行为的影响而不是倒数第一个行为的影响。图4说明了当目标行为序列的长度在1到3之间变化并且其他参数保持不变时,AGSR和Caser在两个数据集上的性能。从图4中可以发现AGSR的整体性能优于Caser。Caser-1、Caser-2和Caser-3分别表示目标行为长度为1,2,3。AGSR-1,AGSR-2,AGSR-3同上。在Movielens数据集上,模型性能随着目标行为序列长度的增加而提高。但在Gowalla数据集上,目标行为序列长度为2是模型中最好的超参数。
如图5所示,示出了维度对MovieLens和Gowalla的影响。y轴是MAP,x轴是维度;图5是本发明实验案例使用MAP来衡量推荐系统性能的图(针对不同的用户和商品的向量的维度大小)。为了衡量维度对模型性能的影响,只改变隐藏层的维度大小,其他参数是固定的。图5展示了在这两个数据集上的不同维度大小的实验结果。从图中观察到,本发明的模型在所有维度上的性能都优于其他模型。在MovieLens数据集中,增加维度并不能提高系统的性能。相反,较大的隐藏层维度可能导致过度拟合。然而,在Gowalla数据集上,随着维度的增长,本发明得到了更好的性能结果。这其中的原因是Gowalla数据集太稀疏,因此它需要一个更大的隐藏向量空间来表达稀疏信息。因此,本发明在MovieLens数据集上选择的最优的维度参数为50以及Gowalla数据集上的维度为100。
本发明实施例的一种电子设备,包括:
在硬件层面,该电子设备包括:处理器,可选的还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存储器,也可能还包括非易失性存储器,例如,至少一个磁盘存储器等。当然,该电子设备可能还包括其他业务所需的硬件。
处理器、网络接口、存储器通过内部总线互相连接,该内部总线可以是工业标准体系结构总线、外设部件互连标准总线、扩展工业标准结构总线等。总线可以分为地址总线、数据总线、控制总线等。
存储器用于存放程序。具体地,程序可以包括程序代码、所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成上述电子设备。处理器执行程序时,具体执行以下操作:获取待推荐用户的用户行为历史数据;将所述待推荐用户的用户行为历史数据输入预训练好的矩阵分解模型,获得待推荐用户的长期偏好向量和商品特征向量;基于所述待推荐用户的用户行为历史数据,获得待推荐用户的用户行为序列;将所述待推荐用户的用户行为序列、长期偏好向量和商品特征向量输入预训练好的环形图注意力网络模型,获得用户和商品的匹配度得分结果;基于匹配度得分结果,将达到预设要求的商品推荐给待推荐用户。
本发明实施例的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,所述计算机程序指令被处理器加载并运行时,所述处理器执行的方法包括:获取待推荐用户的用户行为历史数据;将所述待推荐用户的用户行为历史数据输入预训练好的矩阵分解模型,获得待推荐用户的长期偏好向量和商品特征向量;基于所述待推荐用户的用户行为历史数据,获得待推荐用户的用户行为序列;将所述待推荐用户的用户行为序列、长期偏好向量和商品特征向量输入预训练好的环形图注意力网络模型,获得用户和商品的匹配度得分结果;基于匹配度得分结果,将达到预设要求的商品推荐给待推荐用户。具体地,所述计算机可读存储介质包括但不限于例如易失性存储器和/或非易失性存储器。所述易失性存储器可以包括随机存储存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器可以包括只读存储器(ROM)、硬盘、闪存、光盘、磁盘等。
综上所述,本发明实施例公开一种基于用户行为序列的商品推荐方法及系统:采集用户在网站上的历史行为数据,形成推荐数据集;构建用于进行序列推荐的环形图注意力网络,使用用户的历史行为数据进行训练,得到用户的短期偏好向量;构建用于得到用户长期偏好向量和商品向量的矩阵分解模型,得到用户的长期偏好向量和商品的特征向量;将用户的短期向量和长期向量进行拼接结合,经过多层感知机网络得到用户的最终表示向量;将用户的最终表示向量和商品的特征向量相匹配,计算得分;将计算出的得分映射为概率,概率高的商品将被推荐给用户。本发明显著提升了推荐系统的准确率,召回率,以及平均均值精度(排序性能),可以为用户提供更好的推荐服务。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。

Claims (6)

1.一种基于用户行为历史数据的商品推荐方法,其特征在于,包括以下步骤:
获取待推荐用户的用户行为历史数据;
将所述待推荐用户的用户行为历史数据输入预训练好的矩阵分解模型,获得待推荐用户的长期偏好向量和商品特征向量;
基于所述待推荐用户的用户行为历史数据,获得待推荐用户的用户行为序列;将所述待推荐用户的用户行为序列、长期偏好向量和商品特征向量输入预训练好的环形图注意力网络模型,获得用户和商品的匹配度得分结果;
基于匹配度得分结果,将达到预设要求的商品推荐给待推荐用户;
其中,所述预训练好的矩阵分解模型的获取步骤具体包括:
获取预设数量用户在预设数量网站上的历史行为数据;
基于所述历史行为数据将所有用户和商品的评分统计在一起,形成用于矩阵分解的用户商品评分矩阵;
所述矩阵分解模型中,通过矩阵分解将所述用户商品评分矩阵分解为长期偏好矩阵P∈Rd*M和商品特征矩阵Q∈Rd*K;其中,d是向量维度,M为用户总数量,K为商品总数量;用户u对商品i的评分的预测值的计算表达式为:
Figure FDA0004191431170000011
式中,
Figure FDA0004191431170000012
为用户u对商品i的评分的预测值,Pu为用户u的长期偏好向量,Qi为商品i的商品特征向量;
所述矩阵分解模型拟合过程中,目标函数表示为:
Figure FDA0004191431170000013
式中,Ru,i为用户u对商品i的评分,
Figure FDA0004191431170000014
是用户u对商品i的评分预测值;
通过使用最小化目标函数来学习P和Q矩阵,选择随机梯度下降作为优化器,达到收敛条件,获得训练好的矩阵分解模型;
所述预训练好的环形图注意力网络模型的获取步骤具体包括:
基于所述历史行为数据集,先按照用户的不同进行分组,再对每个用户的行为按照行为的时间顺序进行排序,形成用户行为序列数据集;
采用滑动窗口将所述用户行为序列数据集中每个用户的用户行为序列分成多个预设长度的短序列,将每个所述短序列构建成一个环形图,所述短序列中的每个行为设置有一个对应的子环形图;所述环形图包括整个所述短序列的信息,所述子环形图只包括与该行为相邻的行为所连成的图;
环形图注意力网络模型中,将环形图注意力机制分别应用在所述环形图和每个子环形图上,得到每个用户的全局特征和局部特征;将用户的局部特征和全局特征拼接结合后得到用户的短期偏好向量;将用户的短期偏好向量与长期偏好向量拼接结合后输入多层感知机网络,获得用户特征;将用户特征与商品特征相匹配获得得分结果;
基于得分结果训练环形图注意力网络模型,采用二进制交叉熵损失函数,表达式为:
Figure FDA0004191431170000021
式中,i为用户u的正样本,j为用户u的负样本,j的选择为从用户u从未有过行为的商品中随机筛选;σ为sigmoid激活函数;
所述环形图注意力网络模型的环形图注意力机制AGAtt计算表达式为:
Figure FDA0004191431170000022
式中,q∈R1*d是更新节点的向量表示,k∈Rl*d,v∈Rl*d均为与更新节点相连接的节点的结合,l为环形图上下文注意力的长度,d为向量维度,Wq,Wk,Wv分别表示q,k,v的权重参数;
所述将用户特征与商品特征相匹配获得得分结果的过程中,得分结果的计算表达式为:
y=z*WI+b,
式中,y是计算的得分结果,z是用户的最终表示向量,WI∈RI*d表示所有候选商品的特征向量,b∈RI表示偏置项。
2.根据权利要求1所述的一种基于用户行为历史数据的商品推荐方法,其特征在于,所述用户行为历史数据包括用户对商品的点击、购买和评价行为中的一种或多种。
3.根据权利要求1所述的一种基于用户行为历史数据的商品推荐方法,其特征在于,基于匹配度得分结果,将达到预设要求的商品推荐给待推荐用户的具体步骤包括:
将得分结果映射为概率,概率达到预设要求的商品推荐给待推荐用户。
4.一种基于用户行为历史数据的商品推荐系统,其特征在于,包括:
获取模块,用于获取待推荐用户的用户行为历史数据;
矩阵分解模块,用于将所述待推荐用户的用户行为历史数据输入预训练好的矩阵分解模型,获得待推荐用户的长期偏好向量和商品特征向量;
得分结果获取模块,用于根据所述待推荐用户的用户行为历史数据,获得待推荐用户的用户行为序列;将所述待推荐用户的用户行为序列、长期偏好向量和商品特征向量输入预训练好的环形图注意力网络模型,获得用户和商品的匹配度得分结果;
推荐模块,用于根据匹配度得分结果,将达到预设要求的商品推荐给待推荐用户;
其中,所述预训练好的矩阵分解模型的获取步骤具体包括:
获取预设数量用户在预设数量网站上的历史行为数据;
基于所述历史行为数据将所有用户和商品的评分统计在一起,形成用于矩阵分解的用户商品评分矩阵;
所述矩阵分解模型中,通过矩阵分解将所述用户商品评分矩阵分解为长期偏好矩阵P∈Rd*M和商品特征矩阵Q∈Rd*K;其中,d是向量维度,M为用户总数量,K为商品总数量;用户u对商品i的评分的预测值的计算表达式为:
Figure FDA0004191431170000041
式中,
Figure FDA0004191431170000042
为用户u对商品i的评分的预测值,Pu为用户u的长期偏好向量,Qi为商品i的商品特征向量;
所述矩阵分解模型拟合过程中,目标函数表示为:
Figure FDA0004191431170000043
式中,Ru,i为用户u对商品i的评分,
Figure FDA0004191431170000044
是用户u对商品i的评分预测值;
通过使用最小化目标函数来学习P和Q矩阵,选择随机梯度下降作为优化器,达到收敛条件,获得训练好的矩阵分解模型;
所述预训练好的环形图注意力网络模型的获取步骤具体包括:
基于所述历史行为数据集,先按照用户的不同进行分组,再对每个用户的行为按照行为的时间顺序进行排序,形成用户行为序列数据集;
采用滑动窗口将所述用户行为序列数据集中每个用户的用户行为序列分成多个预设长度的短序列,将每个所述短序列构建成一个环形图,所述短序列中的每个行为设置有一个对应的子环形图;所述环形图包括整个所述短序列的信息,所述子环形图只包括与该行为相邻的行为所连成的图;
环形图注意力网络模型中,将环形图注意力机制分别应用在所述环形图和每个子环形图上,得到每个用户的全局特征和局部特征;将用户的局部特征和全局特征拼接结合后得到用户的短期偏好向量;将用户的短期偏好向量与长期偏好向量拼接结合后输入多层感知机网络,获得用户特征;将用户特征与商品特征相匹配获得得分结果;
基于得分结果训练环形图注意力网络模型,采用二进制交叉熵损失函数,表达式为:
Figure FDA0004191431170000045
式中,i为用户u的正样本,j为用户u的负样本,j的选择为从用户u从未有过行为的商品中随机筛选;σ为sigmoid激活函数;
所述环形图注意力网络模型的环形图注意力机制AGAtt计算表达式为:
Figure FDA0004191431170000051
式中,q∈R1*d是更新节点的向量表示,k∈Rl*d,v∈Rl*d均为与更新节点相连接的节点的结合,l为环形图上下文注意力的长度,d为向量维度,Wq,Wk,Wv分别表示q,k,v的权重参数;
所述将用户特征与商品特征相匹配获得得分结果的过程中,得分结果的计算表达式为:
y=z*WI+b,
式中,y是计算的得分结果,z是用户的最终表示向量,WI∈RI*d表示所有候选商品的特征向量,b∈RI表示偏置项。
5.一种电子设备,包括:处理器;存储器,用于存储计算机程序指令;其特征在于,
所述计算机程序指令由所述处理器加载并运行时,所述处理器执行权利要求1至3中任一项所述的基于用户行为历史数据的商品推荐方法。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器加载并运行时,所述处理器执行权利要求1至3中任一项所述的基于用户行为历史数据的商品推荐方法。
CN202110463510.2A 2021-04-25 2021-04-25 用户行为历史数据的商品推荐方法、系统、设备及介质 Active CN113256367B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110463510.2A CN113256367B (zh) 2021-04-25 2021-04-25 用户行为历史数据的商品推荐方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110463510.2A CN113256367B (zh) 2021-04-25 2021-04-25 用户行为历史数据的商品推荐方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN113256367A CN113256367A (zh) 2021-08-13
CN113256367B true CN113256367B (zh) 2023-06-06

Family

ID=77222320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110463510.2A Active CN113256367B (zh) 2021-04-25 2021-04-25 用户行为历史数据的商品推荐方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN113256367B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627598B (zh) * 2021-08-16 2022-06-07 重庆大学 一种用于加速推荐的孪生自编码器神经网络算法及系统
CN113781160B (zh) * 2021-08-24 2023-02-03 福建金塑宝科技有限公司 一种基于人工智能的商品推荐的方法
CN113468434B (zh) * 2021-09-06 2021-12-24 北京搜狐新动力信息技术有限公司 资源推荐方法、装置、可读介质以及设备
CN114399352B (zh) * 2021-12-22 2023-06-16 中国电信股份有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN114564640A (zh) * 2022-02-17 2022-05-31 上海师范大学 基于长短期记忆和图注意力网络的oj平台题目推荐方法
CN114781625B (zh) * 2022-06-13 2022-09-23 支付宝(杭州)信息技术有限公司 一种网络模型训练、推送内容确定方法及装置
CN115222486B (zh) * 2022-07-29 2024-02-02 平安科技(深圳)有限公司 物品推荐模型训练方法、物品推荐方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737778A (zh) * 2019-09-04 2020-01-31 北京邮电大学 基于知识图谱和Transformer的专利推荐方法
CN111522962A (zh) * 2020-04-09 2020-08-11 苏州大学 序列推荐方法、装置及计算机可读存储介质
CN111681067A (zh) * 2020-04-17 2020-09-18 清华大学 基于图注意力网络的长尾商品推荐方法及系统
CN111797210A (zh) * 2020-03-03 2020-10-20 中国平安人寿保险股份有限公司 基于用户画像的信息推荐方法、装置、设备及存储介质
CN112035746A (zh) * 2020-09-01 2020-12-04 湖南大学 一种基于时空序列图卷积网络的会话推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737778A (zh) * 2019-09-04 2020-01-31 北京邮电大学 基于知识图谱和Transformer的专利推荐方法
CN111797210A (zh) * 2020-03-03 2020-10-20 中国平安人寿保险股份有限公司 基于用户画像的信息推荐方法、装置、设备及存储介质
CN111522962A (zh) * 2020-04-09 2020-08-11 苏州大学 序列推荐方法、装置及计算机可读存储介质
CN111681067A (zh) * 2020-04-17 2020-09-18 清华大学 基于图注意力网络的长尾商品推荐方法及系统
CN112035746A (zh) * 2020-09-01 2020-12-04 湖南大学 一种基于时空序列图卷积网络的会话推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Diversity Regularized Interests Modeling for Recommender Systems";Junmei Hao et al.;《arXiv》;第1-7页 *
"基于网络文本分析的自行车骑行行为与空间特征研究";吕旭涛 等;《北京体育大学学报》;第32-39页 *

Also Published As

Publication number Publication date
CN113256367A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN113256367B (zh) 用户行为历史数据的商品推荐方法、系统、设备及介质
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN113508378A (zh) 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN113688304A (zh) 搜索推荐模型的训练方法、搜索结果排序的方法及装置
CN111709810A (zh) 基于推荐模型的对象推荐方法及装置
CN112115377A (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN112508613A (zh) 一种商品推荐方法、装置、电子设备和可读存储介质
CN113268656A (zh) 一种用户推荐方法、装置、电子设备及计算机存储介质
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN116561424A (zh) 一种应用于智能推荐系统的图神经网络结合Transformer的推荐方法
Ben-Shimon et al. An ensemble method for top-N recommendations from the SVD
Duarte et al. Machine learning and marketing: A systematic literature review
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN113610610B (zh) 基于图神经网络和评论相似度的会话推荐方法和系统
CN114511387A (zh) 产品推荐方法、装置、电子设备及存储介质
CN111738807B (zh) 用于推荐目标对象的方法、计算设备和计算机存储介质
CN113779380A (zh) 跨域推荐、内容推荐方法、装置及设备
CN110851694A (zh) 基于用户记忆网络和树形结构的深度模型的个性化推荐系统
CN116977019A (zh) 一种商户推荐方法、装置、电子设备及存储介质
CN113449176A (zh) 基于知识图谱的推荐方法及装置
Sangeetha et al. Predicting personalized recommendations using GNN
Chu et al. Deep graph embedding for ranking optimization in e-commerce
CN114168804B (zh) 一种基于异质子图神经网络的相似信息检索方法和系统
CN114936901A (zh) 基于跨模态语义推理与融合的视觉感知推荐方法及系统
CN110956528B (zh) 一种电商平台的推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant