CN110955826A - 基于改进型循环神经网络单元的推荐系统 - Google Patents

基于改进型循环神经网络单元的推荐系统 Download PDF

Info

Publication number
CN110955826A
CN110955826A CN201911088184.0A CN201911088184A CN110955826A CN 110955826 A CN110955826 A CN 110955826A CN 201911088184 A CN201911088184 A CN 201911088184A CN 110955826 A CN110955826 A CN 110955826A
Authority
CN
China
Prior art keywords
user
neural network
recurrent neural
hidden state
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911088184.0A
Other languages
English (en)
Other versions
CN110955826B (zh
Inventor
徐亚南
朱燕民
俞嘉地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201911088184.0A priority Critical patent/CN110955826B/zh
Publication of CN110955826A publication Critical patent/CN110955826A/zh
Application granted granted Critical
Publication of CN110955826B publication Critical patent/CN110955826B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于改进型循环神经网络单元的推荐系统,包括:多用户行为数据编码器和多任务解码器,编码器基于用户的交互序列数据抽取用户的购物意图信息,并用隐藏状态序列表示,三个解码器分别对应不同的任务,根据挖掘到的用户购物意图分别完成预测下一个交互的物品和类别、判断两个序列是否属于同一个用户、推荐用户新的物品等三种任务。本发明通过两种循环神经网络来建模用户多种不同的行为数据;同时考虑到交互行为的复杂性,本发明利用多个循环神经网络,分别建模交互行为数据中不同商品类别层面的信息;此外,本发明通过多任务学习,给用户和物品学习具有商品类别等语义信息的向量表达,基于多种用户行为数据,缓解数据稀疏性问题,挖掘交互序列中包含的多种商品类别层面的信息,提升推荐效果。

Description

基于改进型循环神经网络单元的推荐系统
技术领域
本发明涉及的是一种互联网信息领域的技术,具体是一种基于改进型循环神经网络单元的推荐系统。
背景技术
基于协同过滤的推荐方法是使用用户与物品的交互历史记录,建模用户对物品的偏好程度,为用户推荐感兴趣的物品集合。但是,现有的协同过滤方法基本上都是基于单一的用户与物品交互数据,如评分或者购买等,而现实生活中可能同时存在多种用户行为,如购物网站上的点击、加入购物车、购买等。如果利用多种交互行为的数据就能够增加训练数据,解决推荐系统的数据稀疏性问题。然而,这些行为数据不能够简单地不加区别地使用。因为,不同类型的行为对用户的偏好情况表现程度是不同的。例如,用户的购买行为要比点击行为更能表现用户喜欢一个物品。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于改进型循环神经网络单元的推荐系统,通过两种循环神经网络来建模用户多种不同的行为数据;同时考虑到交互行为的复杂性,本发明利用多个循环神经网络,分别建模交互行为数据中不同商品类别层面的信息;此外,本发明通过多任务学习,给用户和物品学习具有商品类别等语义信息的向量表达,基于多种用户行为数据,缓解数据稀疏性问题,挖掘交互序列中包含的多种商品类别层面的信息,提升推荐效果。
本发明是通过以下技术方案实现的:
本发明涉及一种基于改进型循环神经网络单元的推荐系统,包括:多用户行为数据编码器和多任务解码器,其中:编码器基于用户的交互序列数据抽取用户的购物意图信息,并用隐藏状态序列表示,三个解码器分别对应不同的任务,根据挖掘到的用户购物意图分别完成预测下一个交互的物品和类别、判断两个序列是否属于同一个用户、推荐用户新的物品等三种任务。
本发明涉及上述系统的推荐方法,包括如下步骤:
步骤一,基于用户与物品交互记录,构建交互序列,每条记录包括物品的编号、物品的类别和交互行为类型;
步骤二,构建多个多行为循环神经网络,用于建模交互序列,生成隐藏状态序列,各个循环神经网络的隐藏状态序列包含了在不同商品类别层面的信息;
步骤三,基于隐藏状态序列构建预测下一个交互物品、判断两个序列是否属于同一个用户以及推荐用户新的物品三个任务;
步骤四,使用步骤二得到的交互序列训练所述多行为循环神经网络;
步骤五,根据每个用户的历史交互序列以及候选推荐物品,使用训练后的多行为循环神经网络获得用户对各个物品的偏好得分,将偏好得分最高的物品作为该用户的推荐结果。
技术效果
与现有技术相比,本发明通过建模用户的多种行为,解决了推荐系统的数据稀疏问题,提高了推荐效果,所设计的多种预测任务也对推荐效果的提升有帮助;由此产生的意料之外的技术效果包括:本发明所设计的神经网络学习到的物品向量表达包含了物品类别的语义信息。
附图说明
图1为用户多行为推荐模型整体结构图;
图2为Hard-MGRU神经网络单元结构示意图;
图3为Soft-MGRU神经网络单元结构图;
图4为本发明的方法在使用不同用户行为数据下的推荐结果示意图;
图5为本发明的方法在使用不同任务作为训练目标时的推荐结果示意图。
具体实施方式
如图1所示,为本实施例涉及一种建模用户多意图的推荐系统,包括:一个编码器和三个解码器,其中:编码器基于用户的交互序列数据抽取用户的购物意图信息,并用隐藏状态序列表示,三个解码器分别对应不同的任务,根据挖掘到的用户购物意图分别完成预测下一个交互的物品和类别、判断两个序列是否属于同一个用户、推荐用户新的物品等三种任务。
所述的编码器采用多用户行为门循环单元(Multi-behavior Gate RecurrentUnit,MGRU)包括:Hard-MGRU循环神经网络和Soft-MGRU循环神经网络,其中:Hard-MGRU循环神经网络针对不同的用户行为,使用不同的模型参数,相邻的用户行为之间使用循环神经网络的隐藏状态ht传递信息;Soft-MGRU循环神经网络利用GRU(Gate Recurrent Unit)中的门结构来建模用户的不同行为并转换成低维的向量表达。
本实施例涉及上述系统的推荐方法,包括以下步骤:
步骤1、训练数据准备:将用户与物品的交互记录数据,处理成后续模型所需要的格式。用户与物品的交互记录可以表示为(xt,ct,bt),其中:xt是物品的编号,ct是该物品的类别,bt是交互行为的类型。本实施例令B={b1,b2,…,bR}为所有交互行为的类别集合,包括用户点击、加入购物车、购买等。针对一个用户u,将他的交互记录根据时间进行排序以构成多交互行为的序列,也就是Su={(x1,c1,b1),(x2,c2,b2),…,(xT,cT,bT)}。所有用户的交互序列的集合,就构成了模型的训练数据,即H={S1,S2,…,Su,…,Sn},其中:n表示用户的数量。
基于用户的行为数据,推荐结果表示为:给定一个用户的历史交互序列Su={(x1,c1,b1),(x2,c2,b2),…,(xT,cT,bT)},预测用户下一个要购买的物品。
步骤2、如图1所示,使用多个循环神经网络建模用户的交互序列,每个循环神经网络对应序列包含的不同商品类别上的信息,具体为:针对输入序列Su={(x1,c1,b1),(x2,c2,b2),…,(xT,cT,bT)},循环神经网络j输出对应的隐藏状态序列
Figure BDA0002266062330000031
其中:上标j为对应循环神经网络处理的结果。
步骤3、基于多个循环神经网络输出的隐藏状态序列,多任务解码器完成三个任务,具体为:针对每个循环神经网络j,编码器模块均生成一个隐藏状态序列
Figure BDA0002266062330000032
然后多任务解码器完成相关任务,即预测下一个交互物品任务、判断两个序列是否属于同一个用户以及推荐用户新的物品任务、给用户推荐新的物品任务。
所述的预测下一个交互物品任务,即预测的目标包括物品的编号和物品类别,具体为:根据从编码器中获取当前时刻的隐藏状态,因为本实施例使用多个循环神经网络来挖掘多种用户购物意图,所以对t时刻,具有多个隐藏状态,即
Figure BDA0002266062330000033
其中:m表示循环神经网络的个数;然后计算隐藏状态均值并聚合成向量
Figure BDA0002266062330000034
其中:ht表示聚合后的向量;根据聚合后的向量,预测用户下一个要交互的物品编号和物品类别;
Figure BDA0002266062330000035
Figure BDA0002266062330000036
其中:
Figure BDA0002266062330000037
分别表示用户下一个交互的物品是某个物品编号和类别的概率,WI和WC是相应的参数。
所述的判断两个序列是否属于同一个用户任务,即用户的交互序列数据表征用户的偏好情况,不同的用户对物品的偏好有很大差别,根据用户交互序列学到的隐藏向量,表征用户的购物意图,因此给定两个交互序列,判断其是否属于同一个用户,具体为:取出编码器的最后一个隐藏状态向量作为交互序列的表征,即hT和h′T分别表示两个交互序列的表征;然后拼接该两个向量后输入多层全连接神经网络中,得到该两个序列属于同一个用户的概率
Figure BDA0002266062330000039
Figure BDA00022660623300000310
其中:f(·)表示全连接神经网络。
所述的推荐用户新的物品任务,即依据序列数据的最后一个隐藏状态,用于计算用户对于所有物品的偏好值,具体为:将多个循环神经网络的最后一个隐藏状态,使用注意力机制进行聚合
Figure BDA00022660623300000311
其中:
Figure BDA00022660623300000312
为编码器的最后一个隐藏状态,m为循环神经网络个数;ei为待估计偏好值的物品i的编号的低维向量表达,g(·)表示全连接神经网络,用于计算目标物品和各个隐藏状态的相似性,h表示聚合之后的向量;然后使用内积来计算用户对该物品的偏好值,即
Figure BDA00022660623300000313
当该用户在未来购买了该物品,则
Figure BDA00022660623300000314
否则
Figure BDA00022660623300000315
步骤4、模型训练:对应多任务解码器完成三个任务的损失函数分别为:
Figure BDA0002266062330000041
Figure BDA0002266062330000042
Figure BDA0002266062330000043
其中:Y=Y+∪Y-,分别是正样本和负样本集合,本实施例中针对每个正样本采样得到若干用户未购买的物品作为负样本;则全局损失函数L=λ1L12L23L3,其中:λi为第i个任务的权重;再使用梯度下降法以学习获得最终的模型。
步骤5、物品推荐:以待测用户的历史交互序列作为输入,通过训练后的推荐模型得到该用户对于所有物品的偏好值
Figure BDA0002266062330000044
以偏好值最高的物品作为推荐结果。
如图2所示,所述的Hard-MGRU循环神经网络包括:六个矩阵乘法单元
Figure BDA0002266062330000045
三个点积乘法单元⊙、两个Sigmoid函数单元σ、双曲正切单元tanh、加法单元
Figure BDA0002266062330000046
和归一化单元Norm,其中:位于最下层的三个矩阵乘法单元分别接收当前的交互行为类型,从Wr、Wz、Wh中获得循环神经网络单元的参数矩阵,分别用于后续的更新门、重置门、隐藏状态的计算。中间两个乘法单元接收物品信息(pt,qt),并分别输出至两个Sigmoid函数单元,分别计算重置门rt和更新门zt。前一个时刻的隐藏状态ht-1、当前的交互物品信息pt和物品类别信息qt输入到中间部分的第三个矩阵乘法单元,然后输出至双曲正切单元,计算当前的隐藏状态
Figure BDA0002266062330000047
然后前一个时刻的隐藏状态ht-1和以及当前的隐藏状态
Figure BDA0002266062330000048
分别与1-zt和zt输入到两个点积乘法单元,再输出至加法单元,计算得到
Figure BDA0002266062330000049
Figure BDA00022660623300000410
经过归一化单元,输出最终的隐藏状态ht
如图2所示,所述的Hard-MGRU循环神经网络是基于GRU模型进行的改进,该循环神经网络首先针对当前时刻t,用户的交互记录(xt,ct,bt)中,把物品的编号和物品类别,从one-hot编码转换成低维的向量表达,即:pt=EIxt,qt=ECct,其中:EI和EC分别是物品和类别的参数矩阵,pt和qt分别是对应的物品和物品类别的低维向量表达;根据用户当前的行为类别bt选择循环神经网络单元的参数,即Wr=Wrbt,Wz=Wzbt,Wh=Whbt,其中:bt是用户行为类型的one-hot表达,粗体的W表示所有行为类型的参数矩阵,每一列对应一种行为类型,两者相乘表示从W中取出与当前行为类型对应的参数;然后将Wr、Wz、Wh转换为合适的形状作为循环神经网络单元参数矩阵(对于偏置参数采用同样方式处理);然后将前面获得的物品和类别低维向量表达输入到循环神经网络单元中,生成当前时刻的隐藏状况ht
所述的Hard-MGRU循环神经网络中的重置门和更新门具体为:rt=σ(Wr[pt,qt]+br);zt=σ(Wz[pt,qt]+bz);候选隐藏状态
Figure BDA00022660623300000411
当前的隐藏状态
Figure BDA00022660623300000412
归一化的隐藏状况
Figure BDA00022660623300000413
其中:σ(·)和tanh(·)分别是sigmoid函数和双曲正切函数,
Figure BDA00022660623300000414
表示
Figure BDA00022660623300000415
的向量长度,W和b分别是单元中的权值矩阵和偏置。
上述Wr、Wz、Wh参数和当前的行为类型bt相关联。
上述模型为了同时捕获序列中多商品类别层面的信息,因此使用了多个Hard-MGRU循环神经网络来处理用户行为序列,这里使用
Figure BDA0002266062330000051
表示第j个循环神经网络在第t步的隐藏状态,第j个循环神经网络输出的隐藏状态序列可以表示为
Figure BDA0002266062330000052
如图3所示,所述的SoftMGRU循环神经网络包括:三个矩阵乘法单元
Figure BDA0002266062330000053
三个点积乘法单元(⊙)、两个Sigmoid函数单元(σ)、双曲正切单元(tanh)、加法单元
Figure BDA0002266062330000054
和归一化单元(Norm),其中:第一和第二矩阵乘法单元接收物品信息和当前行为类别信息(pt,qt,at),并分别输出至两个Sigmoid函数单元,分别计算重置门rt和更新门zt。前一个时刻的隐藏状态ht-1、当前的交互物品信息pt和物品类别信息qt输入到第三个矩阵乘法单元,然后输出至双曲正切单元,计算当前的隐藏状态
Figure BDA0002266062330000055
然后前一个时刻的隐藏状态ht-1和以及当前的隐藏状态
Figure BDA0002266062330000056
分别与1-zt和zt输入到两个点积乘法单元,再输出至加法单元,计算得到
Figure BDA0002266062330000057
Figure BDA0002266062330000058
经过归一化单元,输出最终的隐藏状态ht
所述的Soft-MGRU循环神经网络利用GRU中的门结构来建模用户的不同行为,所有的用户行为类型共享,具体为:将用户行为进行低维向量表达at=EBbt;然后依次计算重置门和更新门以及当前的隐藏状态:rt=σ(Wr[pt,qt,at]+br);zt=σ(Wz[pt,qt,at]+bz);
Figure BDA0002266062330000059
Figure BDA00022660623300000510
其中:重置门rt和更新门zt不仅依赖于当前的物品编号和物品类别,还依赖于当前的用户行为。
通过循环神经网络,每个循环神经网络以得到一个隐藏状态序列
Figure BDA00022660623300000511
经过具体实际实验,基于淘宝和零售两个数据集,每个用户最后购买的1个物品和其他99未购买的物品作为测试集。针对每个用户,推荐K个物品,计算命中率(Hit Ratio)和推荐结果排序的好坏(Normalized Discounted Cumulative Gain),即HR@K和NDCG@K。每层神经网络的神经元个数设置为64。循环神经网络的个数设置为4。学习速率设置为0.01。对比方法包括CMF、MC-BPR、VALS、NMTR、ATRank、BINN。使用了Hard-MGRU和Soft-MGRU的本实施例提出的方法分别用IARS-H和IARS-S表示以上述参数启动/运行上述方法,能够得到如下的实验数据。
首先与现有技术相比,本系统中的门结构的计算依赖于当前用户行为的类型,控制模型学习当前行为信息的多少;本系统通过解码器中得多任务包括判断两个序列是否属于同一个用户以及使用注意力机制聚合多个循环神经网络的隐藏状态,计算用户对物品偏好值。
通过在HR和NDCG两个指标上,在两个真实的数据集上均要好于已有的方法,具体如表1所示。可以看出同样是建模用户的多种行为,本实施例提出模型IARS-H和IARS-S的能极大地提高推荐的准确性,其中:BINN也是基于循环神经网络的方法,通过对比可以看出Hard-MGRU和Soft-MGRU是本实施例对技术效果产生了最大的贡献。
表1
Figure BDA0002266062330000061
此外,本实施例还验证了对多种行为数据的建模效果。图4中显示了本实施例的两个模型,在使用不同用户行为的状况下的推荐效果。a和b分别表示推荐方法在淘宝和零售数据集上的表现。从图中可以看出,通过建模多种用户的行为数据,很大地提升了推荐的效果。图5显示了上述方法在使用不同任务的情况下的推荐效果。a和b分别表示本实施例的方法在淘宝和零售数据集上的推荐结果。从图中可以看出,本实施例设计的三种任务,对于推荐效果都是有提升的。
上述具体实施可由本领域技术人员在不背离本实施例原理和宗旨的前提下以不同的方式对其进行局部调整,本实施例的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本实施例之约束。

Claims (9)

1.一种基于改进型循环神经网络单元的推荐系统,其特征在于,包括:多用户行为数据编码器和多任务解码器,其中:编码器基于用户的交互序列数据抽取用户的购物意图信息,并用隐藏状态序列表示,三个解码器分别对应不同的任务,根据挖掘到的用户购物意图分别完成预测下一个交互的物品和类别、判断两个序列是否属于同一个用户、推荐用户新的物品等三种任务;
所述的编码器采用多用户行为门循环单元包括:Hard-MGRU循环神经网络和Soft-MGRU循环神经网络,其中:Hard-MGRU循环神经网络针对不同的用户行为,使用不同的模型参数,相邻的用户行为之间使用循环神经网络的隐藏状态ht传递信息;Soft-MGRU循环神经网络利用GRU中的门结构来建模用户的不同行为并转换成低维的向量表达。
2.根据权利要求1所述的推荐系统,其特征是,所述的Hard-MGRU循环神经网络包括:六个矩阵乘法单元
Figure FDA0002266062320000011
三个点积乘法单元⊙、两个Sigmoid函数单元σ、双曲正切单元tanh、加法单元
Figure FDA0002266062320000012
和归一化单元Norm,其中:位于最下层的三个矩阵乘法单元分别接收当前的交互行为类型,从Wr、Wz、Wh中获得循环神经网络单元的参数矩阵,分别用于后续的更新门、重置门、隐藏状态的计算;中间两个乘法单元接收物品信息(pt,qt),并分别输出至两个Sigmoid函数单元,分别计算重置门rt和更新门zt;前一个时刻的隐藏状态ht-1、当前的交互物品信息pt和物品类别信息qt输入到中间部分的第三个矩阵乘法单元,然后输出至双曲正切单元,计算当前的隐藏状态
Figure FDA00022660623200000113
然后前一个时刻的隐藏状态ht-1和以及当前的隐藏状态
Figure FDA0002266062320000019
分别与1-zt和zt输入到两个点积乘法单元,再输出至加法单元,计算得到
Figure FDA00022660623200000110
Figure FDA00022660623200000111
经过归一化单元,输出最终的隐藏状态ht
所述的Hard-MGRU循环神经网络中的重置门和更新门具体为:rt=σ(Wr[pt,qt]+br);zt=σ(Wz[pt,qt]+bz);候选隐藏状态
Figure FDA0002266062320000013
当前的隐藏状态
Figure FDA0002266062320000014
归一化的隐藏状况
Figure FDA00022660623200000112
其中:σ(·)和tanh(·)分别是sigmoid函数和双曲正切函数,
Figure FDA0002266062320000015
表示
Figure FDA0002266062320000016
的向量长度,W和b分别是单元中的权值矩阵和偏置。
3.根据权利要求1所述的推荐系统,其特征是,所述的SoftMGRU循环神经网络包括:三个矩阵乘法单元
Figure FDA0002266062320000017
三个点积乘法单元(⊙)、两个Sigmoid函数单元(σ)、双曲正切单元(tanh)、加法单元
Figure FDA0002266062320000018
和归一化单元(Norm),其中:第一和第二矩阵乘法单元接收物品信息和当前行为类别信息(pt,qt,at),并分别输出至两个Sigmoid函数单元,分别计算重置门rt和更新门zt;前一个时刻的隐藏状态ht-1、当前的交互物品信息pt和物品类别信息qt输入到第三个矩阵乘法单元,然后输出至双曲正切单元,计算当前的隐藏状态
Figure FDA0002266062320000028
然后前一个时刻的隐藏状态ht-1和以及当前的隐藏状态
Figure FDA0002266062320000021
分别与1-zt和zt输入到两个点积乘法单元,再输出至加法单元,计算得到
Figure FDA0002266062320000023
Figure FDA0002266062320000022
经过归一化单元,输出最终的隐藏状态ht
所述的SoftMGRU循环神经网络利用GRU中的门结构来建模用户的不同行为,所有的用户行为类型共享,具体为:将用户行为进行低维向量表达at=EBbt;然后依次计算重置门和更新门以及当前的隐藏状态:rt=σ(Wr[pt,qt,at]+br);zt=σ(Wz[pt,qt,at]+bz);
Figure FDA0002266062320000026
Figure FDA0002266062320000027
其中:重置门rt和更新门zt不仅依赖于当前的物品编号和物品类别,还依赖于当前的用户行为;通过循环神经网络,每个循环神经网络以得到一个隐藏状态序列
Figure FDA0002266062320000025
4.一种基于上述任一权利要求所述系统的推荐方法,其特征在于,包括如下步骤:
步骤一,基于用户与物品交互记录,构建交互序列,每条记录包括物品的编号、物品的类别和交互行为类型;
步骤二,构建多个多行为循环神经网络,用于建模交互序列,生成隐藏状态序列,各个循环神经网络的隐藏状态序列包含了在不同商品类别层面的信息;
步骤三,基于隐藏状态序列构建预测下一个交互物品、判断两个序列是否属于同一个用户以及推荐用户新的物品三个任务;
步骤四,使用步骤二得到的交互序列训练所述多行为循环神经网络;
步骤五,根据每个用户的历史交互序列以及候选推荐物品,使用训练后的多行为循环神经网络获得用户对各个物品的偏好得分,将偏好得分最高的物品作为该用户的推荐结果。
5.根据权利要求4所述的方法,其特征是,所述的步骤一具体是指:将用户与物品的交互记录数据,处理成后续模型所需要的格式;用户与物品的交互记录可以表示为(xt,ct,bt),其中:xt是物品的编号,ct是该物品的类别,bt是交互行为的类型;本实施例令B={b1,b2,…,bR}为所有交互行为的类别集合,包括用户点击、加入购物车、购买等;针对一个用户u,将他的交互记录根据时间进行排序以构成多交互行为的序列,也就是Su={(x1,c1,b1),(x2,c2,b2),…,(xT,cT,bT)};所有用户的交互序列的集合,就构成了模型的训练数据,即H={S1,S2,…,Su,…,Sn},其中:n表示用户的数量;基于用户的行为数据,推荐结果表示为:给定一个用户的历史交互序列Su={(x1,c1,b1),(x2,c2,b2),…,(xT,cT,bT)},预测用户下一个要购买的物品。
6.根据权利要求4所述的方法,其特征是,所述的步骤二具体是指:针对输入序列Su={(x1,c1,b1),(x2,c2,b2),…,(xT,cT,bT)},循环神经网络j输出对应的隐藏状态序列
Figure FDA00022660623200000310
其中:上标j为对应循环神经网络处理的结果。
7.根据权利要求4所述的方法,其特征是,所述的步骤三具体是指:针对每个循环神经网络j,编码器模块均生成一个隐藏状态序列
Figure FDA0002266062320000031
然后多任务解码器完成相关任务,即预测下一个交互物品任务、判断两个序列是否属于同一个用户以及推荐用户新的物品任务、给用户推荐新的物品任务。
8.根据权利要求7所述的方法,其特征是,所述的预测下一个交互物品任务,即预测的目标包括物品的编号和物品类别,具体为:根据从编码器中获取当前时刻的隐藏状态,因为本实施例使用多个循环神经网络来挖掘多种用户购物意图,所以对t时刻,具有多个隐藏状态,即
Figure FDA00022660623200000312
其中:m表示循环神经网络的个数;然后计算隐藏状态均值并聚合成向量
Figure FDA00022660623200000311
其中:ht表示聚合后的向量;根据聚合后的向量,预测用户下一个要交互的物品编号和物品类别;
Figure FDA0002266062320000032
其中:
Figure FDA0002266062320000033
Figure FDA0002266062320000034
分别表示用户下一个交互的物品是某个物品编号和类别的概率,WI和WC是相应的参数;
所述的判断两个序列是否属于同一个用户任务,即用户的交互序列数据表征用户的偏好情况,不同的用户对物品的偏好有很大差别,根据用户交互序列学到的隐藏向量,表征用户的购物意图,因此给定两个交互序列,判断其是否属于同一个用户,具体为:取出编码器的最后一个隐藏状态向量作为交互序列的表征,即hT和h′T分别表示两个交互序列的表征;然后拼接该两个向量后输入多层全连接神经网络中,得到该两个序列属于同一个用户的概率
Figure FDA00022660623200000313
其中:f(·)表示全连接神经网络;
所述的推荐用户新的物品任务,即依据序列数据的最后一个隐藏状态,用于计算用户对于所有物品的偏好值,具体为:将多个循环神经网络的最后一个隐藏状态,使用注意力机制进行聚合
Figure FDA0002266062320000039
其中:
Figure FDA0002266062320000037
为编码器的最后一个隐藏状态,m为循环神经网络个数;ei为待估计偏好值的物品i的编号的低维向量表达,g(·)表示全连接神经网络,用于计算目标物品和各个隐藏状态的相似性,h表示聚合之后的向量;然后使用内积来计算用户对该物品的偏好值,即
Figure FDA0002266062320000036
当该用户在未来购买了该物品,则
Figure FDA0002266062320000038
否则
Figure FDA0002266062320000035
9.根据权利要求4所述的方法,其特征是,所述的步骤四中,对应多任务解码器完成三个任务的损失函数分别为:
Figure FDA0002266062320000041
Figure FDA0002266062320000042
其中:Y=Y+∪Y-,分别是正样本和负样本集合,本实施例中针对每个正样本采样得到若干用户未购买的物品作为负样本;则全局损失函数L=λ1L12L23L3,其中:λi为第i个任务的权重;再使用梯度下降法以学习获得最终的模型。
CN201911088184.0A 2019-11-08 2019-11-08 基于改进型循环神经网络单元的推荐系统 Active CN110955826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911088184.0A CN110955826B (zh) 2019-11-08 2019-11-08 基于改进型循环神经网络单元的推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911088184.0A CN110955826B (zh) 2019-11-08 2019-11-08 基于改进型循环神经网络单元的推荐系统

Publications (2)

Publication Number Publication Date
CN110955826A true CN110955826A (zh) 2020-04-03
CN110955826B CN110955826B (zh) 2023-06-20

Family

ID=69976652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911088184.0A Active CN110955826B (zh) 2019-11-08 2019-11-08 基于改进型循环神经网络单元的推荐系统

Country Status (1)

Country Link
CN (1) CN110955826B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667339A (zh) * 2020-05-26 2020-09-15 吉林大学 一种基于改进递归神经网络的诽谤性恶意用户检测方法
CN112101984A (zh) * 2020-08-16 2020-12-18 复旦大学 一种融合用户微观行为和知识图谱的会话推荐模型
CN112381615A (zh) * 2020-11-27 2021-02-19 华中科技大学 基于用户重复行为模式挖掘的短序列推荐方法
CN112988785A (zh) * 2021-05-10 2021-06-18 浙江大学 基于语言模型编码和多任务解码的sql转换方法及系统
CN113467740A (zh) * 2021-07-15 2021-10-01 青岛博天数通信息科技有限公司 一种基于联合编码的视频监控阵列显示优化方法和装置
CN113569155A (zh) * 2021-07-30 2021-10-29 西南大学 一种基于改进循环神经网络算法的推荐召回方法及系统
CN115718846A (zh) * 2022-12-22 2023-02-28 云南炳暖蔡网络科技有限公司 用于智能化交互网络的大数据挖掘方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897404A (zh) * 2017-02-14 2017-06-27 中国船舶重工集团公司第七0九研究所 一种基于多gru层神经网络的推荐方法与系统
CN108647251A (zh) * 2018-04-20 2018-10-12 昆明理工大学 基于宽深度门循环联合模型的推荐排序方法
CN109086865A (zh) * 2018-06-11 2018-12-25 上海交通大学 一种基于切分循环神经网络的序列模型建立方法
CN109522474A (zh) * 2018-10-19 2019-03-26 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
CN110245299A (zh) * 2019-06-19 2019-09-17 中国人民解放军国防科技大学 一种基于动态交互注意力机制的序列推荐方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897404A (zh) * 2017-02-14 2017-06-27 中国船舶重工集团公司第七0九研究所 一种基于多gru层神经网络的推荐方法与系统
CN108647251A (zh) * 2018-04-20 2018-10-12 昆明理工大学 基于宽深度门循环联合模型的推荐排序方法
CN109086865A (zh) * 2018-06-11 2018-12-25 上海交通大学 一种基于切分循环神经网络的序列模型建立方法
CN109522474A (zh) * 2018-10-19 2019-03-26 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
CN110245299A (zh) * 2019-06-19 2019-09-17 中国人民解放军国防科技大学 一种基于动态交互注意力机制的序列推荐方法及其系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Leveraging app usage contexts for app rec- ommendation: a neural approach" *
李全;许新华;刘兴红;陈琦;: "融合时空感知GRU和注意力的下一个地点推荐" *
荣光辉;黄震华;: "基于深度学习的问答匹配方法" *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667339A (zh) * 2020-05-26 2020-09-15 吉林大学 一种基于改进递归神经网络的诽谤性恶意用户检测方法
CN111667339B (zh) * 2020-05-26 2022-05-27 吉林大学 一种基于改进递归神经网络的诽谤性恶意用户检测方法
CN112101984A (zh) * 2020-08-16 2020-12-18 复旦大学 一种融合用户微观行为和知识图谱的会话推荐模型
CN112381615A (zh) * 2020-11-27 2021-02-19 华中科技大学 基于用户重复行为模式挖掘的短序列推荐方法
CN112988785A (zh) * 2021-05-10 2021-06-18 浙江大学 基于语言模型编码和多任务解码的sql转换方法及系统
CN113467740A (zh) * 2021-07-15 2021-10-01 青岛博天数通信息科技有限公司 一种基于联合编码的视频监控阵列显示优化方法和装置
CN113467740B (zh) * 2021-07-15 2024-02-02 青岛博天数通信息科技有限公司 一种基于联合编码的视频监控阵列显示优化方法和装置
CN113569155A (zh) * 2021-07-30 2021-10-29 西南大学 一种基于改进循环神经网络算法的推荐召回方法及系统
CN113569155B (zh) * 2021-07-30 2022-05-03 西南大学 一种基于改进循环神经网络算法的推荐召回方法及系统
CN115718846A (zh) * 2022-12-22 2023-02-28 云南炳暖蔡网络科技有限公司 用于智能化交互网络的大数据挖掘方法及系统
CN115718846B (zh) * 2022-12-22 2023-10-27 北京国联视讯信息技术股份有限公司 用于智能化交互网络的大数据挖掘方法及系统

Also Published As

Publication number Publication date
CN110955826B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
CN110955826B (zh) 基于改进型循环神经网络单元的推荐系统
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
CN106920147B (zh) 一种基于词向量数据驱动的商品智能推荐方法
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN110956497A (zh) 一种电子商务平台用户重复购买行为预测方法
CN111242729A (zh) 一种基于长短期兴趣的序列化推荐方法
CN111523047A (zh) 基于图神经网络的多关系协同过滤算法
CN115082147B (zh) 一种基于超图神经网络的序列推荐方法及装置
CN111932336A (zh) 一种基于长短期兴趣偏好的商品列表推荐方法
CN109087178A (zh) 商品推荐方法和装置
CN109584006B (zh) 一种基于深度匹配模型的跨平台商品匹配方法
CN113190751B (zh) 一种融合关键词生成的推荐方法
CN111400603A (zh) 一种信息推送方法、装置、设备及计算机可读存储介质
CN111127146A (zh) 基于卷积神经网络与降噪自编码器的信息推荐方法及系统
CN110619540A (zh) 一种神经网络的点击流预估方法
CN115186097A (zh) 一种基于知识图谱和强化学习的交互式推荐方法
CN110781401A (zh) 一种基于协同自回归流实现的Top-n项目推荐方法
CN111695024A (zh) 对象评估值的预测方法及系统、推荐方法及系统
CN115880027A (zh) 一种电子商务网站商品季节性预测模型创建方法
CN114529077A (zh) 一种基于会话内异构行为的点击率预测方法
CN115809374B (zh) 纠正推荐系统主流偏差的方法、系统、设备及存储介质
CN116452293A (zh) 一种融合物品受众特征的深度学习推荐方法及系统
CN116484092A (zh) 基于用户长短期偏好的分层注意力网络序列推荐方法
CN115659277A (zh) 一种基于多行为特征融合的电商会话推荐方法、系统、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant