CN114329200A - 一种个性化自适应捆绑推荐模型及推荐方法 - Google Patents
一种个性化自适应捆绑推荐模型及推荐方法 Download PDFInfo
- Publication number
- CN114329200A CN114329200A CN202111615929.1A CN202111615929A CN114329200A CN 114329200 A CN114329200 A CN 114329200A CN 202111615929 A CN202111615929 A CN 202111615929A CN 114329200 A CN114329200 A CN 114329200A
- Authority
- CN
- China
- Prior art keywords
- item
- user
- bundle
- layer
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000005457 optimization Methods 0.000 claims abstract description 39
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000010586 diagram Methods 0.000 claims description 24
- 238000013508 migration Methods 0.000 claims description 23
- 230000005012 migration Effects 0.000 claims description 23
- 230000003044 adaptive effect Effects 0.000 claims description 19
- 230000006399 behavior Effects 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 12
- 238000012512 characterization method Methods 0.000 claims description 11
- 238000013136 deep learning model Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- XHEFDIBZLJXQHF-UHFFFAOYSA-N fisetin Chemical compound C=1C(O)=CC=C(C(C=2O)=O)C=1OC=2C1=CC=C(O)C(O)=C1 XHEFDIBZLJXQHF-UHFFFAOYSA-N 0.000 claims description 6
- 238000005295 random walk Methods 0.000 claims description 6
- 101100153581 Bacillus anthracis topX gene Proteins 0.000 claims description 4
- 101150041570 TOP1 gene Proteins 0.000 claims description 4
- 230000028161 membrane depolarization Effects 0.000 claims description 3
- 108090000623 proteins and genes Proteins 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 101100153591 Cricetulus griseus TOP1 gene Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种个性化自适应捆绑推荐模型及推荐方法,属于推荐数据处理领域。基于个性化自适应捆绑推荐模型的推荐方法包括以下步骤:S100、采用D‑TI根据用户的访问路径生成初始捆绑包,进而优化为基础捆绑包;S200、采用带有约束的多目标优化方法优化基础捆绑包;S300、提出一种新的基于正、负情况相关性的损失计算方法,并利用所述损失计算方法对捆绑包进行优化。本发明使捆绑包集合的质量和多样性得到了有效的保证,并提出了一种针对捆绑包的优化方法,使其整体性能得到进一步优化,最终使本发明的推荐模型获得了较好的性能。
Description
技术领域
本发明涉及一种个性化自适应捆绑推荐模型及推荐方法,属于推荐数据处理领域。
背景技术
随着互联网的发展,数据的规模以几何倍数增长,我们来到了数据爆炸的时代。这种情境下,用户面对的物品花样繁多,各种类型的数据信息随处可见,用户的行为也变得复杂多样。如何从海量的数据中提取有用的信息并进行有效处理成为一个难题。能否精准的抓住用户的行为偏好并提供内容,为用户推荐符合其自身喜好的物品以获取更高利润,是服务提供商的关注的热点问题,由此推荐系统应运而生。推荐系统,简单描述就是根据用户的偏好给其推荐可能感兴趣的物品,这里物品是一个广泛的概念,物品可以是一首歌,一个新闻,一段视频等等。传统的推荐方法主要着眼于利用用户-物品之间的交互信息,预测他们之间的匹配评分,最终将评分最高的一个(TOP-1)或N个(TOP-N)物品(item)推荐给用户。
与此同时,用户的行为变得日趋复杂,大多时候用户不仅限于与一个物品进行交互。他们往往希望一次性获得更多可用的产品,不仅满足自身日常所需,更能节约时间与经济成本。例如在电子商务中,很多用户基于不同的目的(凑单满减,免运费等)会选择将多种物品加入到购物车之后再进行统一购买。这种方式比逐个添加物品进行购买更加经济便捷。此外,在其他应用领域用户也常常希望获得一连串的推荐列表。例如音乐播放列表,新闻推荐的头条新闻等。将一组物品推荐给用户的思路随之诞生,事实上,一次性给用户推荐多个物品会大概率推荐出一系列相似的物品。那么,怎样才能使用户获得适合的一系列物品,且这一系列物品多样性能够得到保证。这是一个富有挑战性的问题。
《Matching User with Item Set:Collaborative Bundle Recommendation withDeep Attention Network.In IJCAI Pages 2095-2101,2019.》的作者提出了捆绑包推荐(bundle)的概念:它是根据已经制定好的标准,将一定数量的物品打包成一组物品集合。作者着重解决怎么表征捆绑包,没有研究怎么生成捆绑包和生成之后的优化。《DeepGenerative Ranking for Personalized Recommendation,RecSys,Pages 34–42,2019.》设计了一个模型对用户与捆绑包进行评分匹配,但模型没有进一步进行优化。
从实际应用的角度出发,我们发现许多现实问题:1)评分低的单个物品,不一定比评分高的一组物品(bundle)缺乏吸引力;2)一些物品由于交互较少,曝光率低,较难获得更好的推荐;3)一组优秀的物品能获得相较以往更大的利润。如果能够准确把握用户的多个需求,必会减少用户搜索路径,降低时间成本,这对用户和服务提供商来说这是双赢。那么,如何设计一个策略获得合适的捆绑包呢?根据以上理由,将一组物品推荐给用户的思路是有意义且有价值的的,最近有少量的研究工作也开始着眼于此。《Matching User withItem Set:Collaborative Bundle Recommendation with Deep Attention Network.InIJCAI Pages2095-2101,2019.》提出了一个基于注意力的bundle表征方法,很好的解决了表征bundle这一问题。它将捆绑包的推荐分为两个阶段:1)根据一定规则生成捆绑包,2)根据算法或模型预测用户对捆绑包的喜好。但是他们的工作只是着眼于匹配阶段,而没有解决生成阶段的问题。《PersonalizedBundle List Recommendation,In WWW,pages Pages60–71,2019.》引入了确定性点过程理论来生成捆绑包,却无法保证捆绑包的质量,没有对bundle进行有力的优化,易陷入流行性陷阱。
发明内容
本发明的目的是提出一种个性化自适应捆绑推荐模型及推荐方法,以解决本发明申请要解决的技术问题。
一种个性化自适应捆绑推荐模型,所述个性化自适应捆绑推荐模型包括输入层、嵌入层、深度模型层、深度游走层和多目标优化层,所述输入层、嵌入层、深度模型层、深度游走层和多目标优化层依次连接。
进一步的,所述输入层,用于根据用户历史行为序列,构建物品-物品之间的序列生成图;
所述嵌入层,用于根据用户和物品的数据规模分别将其投射到稠密的向量空间,获得用户行为序列的初始表征结果;
然后设计一种约束来形成捆绑包候选集,利用TF-IDF思想进行约束,避免产生相似的捆绑包,随之产生基础捆绑包;
所述多目标优化层,用于对所述的基础捆绑包的列表里的每个物品进行评估优化。
进一步的,所述输入层,具体的,用于根据用户的历史记录,得到每个用户的访问序列,对每个用户和item进行One-Hot处理,并输入到嵌入层,同时还用于将用户的交互序列输入到深度模型层左边的部分,构建节点是item的User访问序列图。
进一步的,所述嵌入层,具体的,用于得到输入层的数据流后,对每一个用户和item进行嵌入处理,每一个用户和物品进行One-hot向量化用户和物品的潜在因子矩阵分别为这里M和K分别代表用户数量和潜在空间维数,则用户和item的嵌入如下所示:
其中,V={v1,v2,v3,…,vn},为物品集合,U={u1,u2,u3,…,um},为用户集合,在得到嵌入之后,输入到深度模型层,进行训练。
进一步的,所述深度模型层,具体的,用于使用NCF深度学习模型,针对每一位用户和物品进行匹配,以使得每一位用户得到评分最高的物品,
其中,公式(2)表示的是NCF中的广义矩阵分解组件,和分别表示GMF和MLP的用户嵌入,和分别表示了GMF和MLP的物品嵌入,公式(3)表示的是NCF中的的MLP组件,公式(4)将公式(2)和公式(3)两个组件结合起来,得到预测评分具体表示用户u对物品i的预测评分,选择出评分最高的item,输入到下一层。
进一步的,所述深度游走层,具体的,用于使用所述评分最高的item作为起始节点,在生成序列图上进行深度游走,跳转概率为:
其中,N+(vi)表示所有从节点vi出发的有向边指向的节点的集合,Mij表示物品i跳转到物品j的跳转权重,通过随即游走,产生若干数量的物品序列,即含有若干捆绑包的预选集,
还用于利用TF-IDF算法对所述预选集进行约束,去除其中相似的捆绑包,最终获得基础捆绑包:
先计算一个物品vi在针对用户u生成的捆绑列表bj中出现的频率,计算公式定义如下:
其中,VFi表示物品i在捆绑包列表j中出现的频率,nij表示物品i在捆绑包列表j中出现的次数,n*j表示捆绑包列表j中所有物品的数量,
接下来计算物品vi在所有用户的捆绑包列表中出现的频次,公式如下:
其中,N是每个用户bundle列表的总数,Ni是包含物品vi的列表的总数,将VFi和IDFi合并,表示为:
Gi=VFi*IDF (8)
使用D-TI算法去产生基础捆绑包,然后对每个捆绑包进行表征,通过自适应加权操作,获得捆绑包的嵌入向量:
其中,α(i,j)表示用户ui考虑与捆绑包bs交互时,物品vj所代表的权重,在一个低秩模型里参数化α(i,j):
其中,aj表征了在对一个bundle中的一个物品做决策时,表征物品vj的向量,利用上述表征方法对模型中生成的捆绑包进行表征,进行下一步训练。
一种基于个性化自适应捆绑推荐模型的推荐方法,基于上述的一种个性化自适应捆绑推荐模型,其特征在于,所述基于个性化自适应捆绑推荐模型的推荐方法包括以下步骤:
S100、采用D-TI根据用户的访问路径生成初始捆绑包,进而优化为基础捆绑包;
S200、采用带有约束的多目标优化方法优化基础捆绑包。
进一步的,在S100中,具体的,输入层根据用户的历史记录,得到每个用户的访问序列,对每个用户和item进行One-Hot处理,并输入到嵌入层,同时还用于将用户的交互序列输入到深度模型层左边的部分,构建节点是item的User访问序列图,
嵌入层得到输入层的数据流后,对每一个用户和item进行嵌入处理,每一个用户和物品进行One-hot向量化用户和物品的潜在因子矩阵分别为这里M和K分别代表用户数量和潜在空间维数,则用户和item的嵌入如下所示:
其中,V={v1,v2,v3,…,vn},为物品集合,U={u1,u2,u3,…,um},为用户集合,
在得到嵌入之后,输入到深度模型层,进行训练,
深度模型层使用NCF深度学习模型,针对每一位用户和物品进行匹配,以使得每一位用户得到评分最高的物品,
其中,公式(2)表示的是NCF中的广义矩阵分解组件,和分别表示GMF和MLP的用户嵌入,和分别表示了GMF和MLP的物品嵌入,公式(3)表示的是NCF中的的MLP组件,公式(4)将公式(2)和公式(3)两个组件结合起来,得到预测评分具体表示用户u对物品i的预测评分,选择出评分最高的item,输入到下一层,
深度游走层使用所述评分最高的item作为起始节点,在生成序列图上进行深度游走,跳转概率为:
其中,N+(vi)表示所有从节点vi出发的有向边指向的节点的集合,Mij表示物品i跳转到物品j的跳转权重,通过随即游走,产生若干数量的物品序列,即含有若干捆绑包的预选集,
深度游走层利用TF-IDF算法对所述预选集进行约束,去除其中相似的捆绑包,最终获得基础捆绑包:
先计算一个物品vi在针对用户u生成的捆绑列表bj中出现的频率,计算公式定义如下:
其中,VFi表示物品i在捆绑包列表j中出现的频率,nij表示物品i在捆绑包列表j中出现的次数,n*j表示捆绑包列表j中所有物品的数量,
接下来计算物品vi在所有用户的捆绑包列表中出现的频次,公式如下:
其中,N是每个用户bundle列表的总数,Ni是包含物品vi的列表的总数,将VFi和IDFi合并,表示为:
Gi=VFi*IDF (8)
使用D-TI算法去产生基础捆绑包,然后对每个捆绑包进行表征,通过自适应加权操作,获得捆绑包的嵌入向量:
其中,α(i,j)表示用户ui考虑与捆绑包bs交互时,物品vj所代表的权重,在一个低秩模型里参数化α(i,j):
其中,aj表征了在对一个bundle中的一个物品做决策时,表征物品vj的向量,利用上述表征方法对模型中生成的捆绑包进行表征,进行下一步训练。
进一步的,在S200中,具体的,多目标优化层为捆绑包推荐定义两个不同的目标:高评分和高多样性,
采用MMoE模型,将物品作为专家,采用softmax作为门控单元,计算每个物品对优化目标的重要程度,
yk=zk(fk(x)) (10)
其中,k代表不同的任务,k=1,2,…,fk(x)表示物品向量阶段,对于不同任务k,捆绑包组成不同,所以每个fk(x)也不相同,
将注意力Ak(x)作为每个优化目标的门控单元,注意力计算方法如下:
进一步的,在S300中,具体的,假设:用户对单个正向项目的偏好必须大于对一个正向捆绑项目的偏好;用户对捆绑包的非首选项必须小于对消极项目的非首选项,基于所述假设,定义如下关系:
Itempositive>Bundlepositive>Bundlenegative>Itemnegative
基于以上序列,我们建立了一个新颖的损失计算方法:
其中,Lbundle与Litem是BPR损失,在此之上,加入了Bundlenegative>Itemnegative这一对损失,当一个捆绑包里面包含用户不喜欢的物品时,这个物品对捆绑包的影响较大,我们以这个原则进行优化,
L=Lbundle+Litem+Lfused (15)。
本发明的有以下有益效果:
(1)针对多个物品的推荐问题,设计了一种bundle的生成算法(D-T),可以有效生成符合用户个性化的bundle基础序列,保证了用户对物品的多样性需求;
(2)提出了一个具有5层结构的新颖的自适应的捆绑推荐模型(PersonalizedandMulti-Objective OptimizedModel)(MO-PoM),能够对生成bundle进行多目标的优化,有效提升bundle的推荐性能;
(3)Mo-PoM使用了一种可解释的新的损失计算方法,在保证包内物品多样性的基础上,使模型的性能得到了有效的提升;
(4)Mo-PoM被部署在两个真实的数据集上,并做了大量的实验,用各种不同的度量标准对它们进行了测试。实验结果表明,该模型优于现有主流模型。
附图说明
图1为本发明的一种个性化自适应捆绑推荐模型的整体示意图;
图2为用户访问序列示意图;
图3为高评分、高多样性多优化目标示意图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先进行问题定义:
对于每个物品vj∈V来说,它都归属于物品集合V={v1,v2,v3,…,vn},对于每个用户ui∈U来说,它都属于用户集合U={u1,u2,u3,…,um}。据此,我们可以得到用户-物品的交互矩阵[Huv]m*n。而对于每个生成的捆绑包bs∈B来说,都属于捆绑包集合B={b1,b2,b3,…,bk},bs是V的子集。据此,可以得到用户-捆绑包的交互矩阵[Rub]m*k。在交互矩阵里面,1代表用户与项目有交互(例:点击,购买,评论,观看…),0代表没有交互。
推荐一个捆绑包的列表能够将普通的推荐问题泛化,这样即可将单个捆绑包推荐、单个物品推荐和多个物品推荐都囊括其中。当捆绑包数量k=1时,捆绑包问题能够泛化为一个朴素的寻求top-y的item推荐问题。本文我们的工作不仅要解决复杂的捆绑包生成问题,而且要考虑用户的多重目标的需求,以此获得一个个性化的多目标优化捆绑包推荐模型。
问题定义:我们根据用户的行为记录,对每个用户ui∈U,匹配一组捆绑包,{b1,b2,b3,…,bk},每个捆绑包bs都是物品集合V的一个子集。
根据一定规则产生捆绑包,进行优化,然后推荐给用户,这是一个新的尝试,我们基于用户-物品,物品-物品之间的关系(图1)构造一个了捆绑包生成模型,并测试它的推荐效果。在这个阶段,我们将详细介绍我们的模型。我们讨论了物品的个数对捆绑包生成的影响。最后,我们还验证了新提出的损失计算方法对性能的影响。我们工作分为三个部分:1)基于物品与物品之间的序列关系,用DeepWalk方法生成基准捆绑包;2)优化生成的捆绑包的候选序列;3)利用我们提出的新的捆绑包损失计算方法进行对捆绑包的优化。
本发明提出了一种个性化自适应捆绑推荐模型的一实施例,所述个性化自适应捆绑推荐模型包括输入层、嵌入层、深度模型层、深度游走层和多目标优化层,所述输入层、嵌入层、深度模型层、深度游走层和多目标优化层依次连接。
进一步的,所述输入层,用于根据用户历史行为序列,构建物品-物品之间的序列生成图;
所述嵌入层,用于根据用户和物品的数据规模分别将其投射到稠密的向量空间,获得用户行为序列的初始表征结果;
然后设计一种约束来形成捆绑包候选集,利用TF-IDF思想进行约束,避免产生相似的捆绑包,随之产生基础捆绑包;
所述多目标优化层,用于对所述的基础捆绑包的列表里的每个物品进行评估优化。
具体的,我们的模型构建由5层结构组成(输入层,嵌入层,深度模型层,深度游走层,多目标优化层),整体框架如图2。1)首先是输入层(Input Layer)。对于每一个用户,我们根据用户历史行为序列,构建物品-物品之间的序列生成图。2)第二层是嵌入层(Embedding Layer)。这里,我们根据用户和物品的数据规模分别将其投射到了稠密的向量空间,获得用户行为序列的初始表征结果。3)经过嵌入之后,我们能够应用当前最流行的深度模型,将物品和用户的嵌入结果共同输入到深度建模层中,并进行匹配预测,获得4)深度游走层(Deep Walk Layer):在这一层,我们将要在用户序列生成图中进行随机游走。我们利用上一层获得的初始预测结果将其相应的匹配列表中获得的第1个结果(top1)作为DeepWalk的起始节点。接下来,我们设计一种约束来形成捆绑包候选集。我们利用TF-IDF思想进行约束,尽可能的避免产生相似的捆绑包,随之产生了基础捆绑包。5)最后一层为多目标优化层(Multi-objective optimization layer),它对基础捆绑包列表里的每个物品进行评估优化,以保证每个捆绑包尽可能满足用户的不同需求。
进一步的,所述输入层,具体的,每个用户及每个item都有ID用来标记他们,用于根据用户的历史记录,得到每个用户的访问序列,例如在图2左半部分,用户1的访问序列为{v1,v3,v5,v6}。我们在输入阶段对每个用户和item进行One-Hot处理,并输入到嵌入层,同时还用于将用户的交互序列输入到深度模型层左边的部分,构建节点是item的User访问序列图。
进一步的,所述嵌入层,具体的,用于得到输入层的数据流后,对每一个用户和item进行嵌入处理,每一个用户和物品进行One-hot向量化用户和物品的潜在因子矩阵分别为这里M和K分别代表用户数量和潜在空间维数,则用户和item的嵌入如下所示:
其中,V={v1,v2,v3,…,vn},为物品集合,U={u1,u2,u3,…,um},为用户集合,在得到嵌入之后,输入到深度模型层,进行训练。
进一步的,所述深度模型层,具体的,用于使用NCF深度学习模型,针对每一位用户和物品进行匹配,以使得每一位用户得到评分最高的物品,
其中,公式(2)表示的是NCF中的广义矩阵分解组件,和分别表示GMF和MLP的用户嵌入,和分别表示了GMF和MLP的物品嵌入,公式(3)表示的是NCF中的的MLP组件,公式(4)将公式(2)和公式(3)两个组件结合起来,得到预测评分具体表示用户u对物品i的预测评分,选择出评分最高的item,输入到下一层。
具体的,对于每个用户的交互序列,我们通过物品与用户的交互来描述一个物品,并在所有用户行为序列构成的拓扑图里表达物品之间的关系。我们使用有向图的随机游走序列来表征用户的喜好,然后采用这个序列作为候选捆绑包。
在深度学习层的左边部分,根据输入的用户序列,构建User的访问序列图,如图2有半部分所示。图中的节点是item,以节点v1,v3举例,User1的序列里有v1→v3这样一个访问先后顺序,则对其建立一条有向边,接着User3也有这样一个先后顺序,则对其权重M1,3进行+1。考虑到会存在权重极大的有向边,我们采用了ln函数更新了权重,对其进行约束。更新完权重之后将访问序列图输入到下一层。
进一步的,所述深度游走层,具体的,用于使用所述评分最高的item作为起始节点,在生成序列图上进行深度游走,跳转概率为:
其中,N+(vi)表示所有从节点vi出发的有向边指向的节点的集合,Mij表示物品i跳转到物品j的跳转权重,通过随即游走,产生若干数量的物品序列,即含有若干捆绑包的预选集,这就是我们模型中初始的捆绑包。
经过上述操作之后,我们获得了一定规模的预选集。但由于拓扑图的复杂性,一个物品会出现在多个捆绑包中,导致生成的捆绑包中较大概率出现一些相似度很高的捆绑包。接下来我们利用自然语言处理中常用的TF-IDF算法进行约束,去除其中相似的捆绑包,最终获得基础捆绑包。
在TF-IDF中,有两个阶段:首先计算词i在文档j中出现的频率,接着计算词i在文档集中的逆文档频率。在此的模型中,我们将每个物品视为一个单词,每个捆绑包都是一个句子,一个用户形成的捆绑包列表作为一个文档。针对以上假设,先计算一个物品vi在针对用户u生成的捆绑列表bj中出现的频率,计算公式定义如下:
其中,VFi表示物品i在捆绑包列表j中出现的频率,nij表示物品i在捆绑包列表j中出现的次数,n*j表示捆绑包列表j中所有物品的数量(包含重复),VFi不仅能够对item的数量进行归一化,一定程度表达出物品i的重要性,而且可以防止结果偏向过长的捆绑包列表。
接下来计算物品vi在所有用户的捆绑包列表中出现的频次,公式如下:
其中,N是每个用户bundle列表的总数,Ni是包含物品vi的列表的总数,IDFi可以度量无皮vi在所有捆绑包中的重要性。在计算出上述两种频率后,我们将它们合并,表示为:
Gi=VFi*IDF (8)
对于每个捆绑包来说,起始节点能够保证匹配度,而Gi则是针对每个用户的候选捆绑包list来约束捆绑包的多样性。根据TF-IDF理论,每个Gi不为0的物品,都会提升模型的多样性。我们提出了D-TI算法去产生基础捆绑包,具体方法如下:
在得到基础捆绑之后,我们需要对每个捆绑包进行表征。不同于单个物品,捆绑包可由多个元素组成,怎么较好的表征它并应用于神经网络是个难题,为了准确把握捆绑包的特性,本发明设计了一个自适应加权操作,获得了捆绑包的嵌入向量:
其中,α(i,j)表示用户ui考虑与捆绑包bs交互时,物品vj所代表的权重,在一个低秩模型里参数化α(i,j):
其中,aj表征了在对一个bundle中的一个物品做决策时,表征物品vj的向量,利用上述表征方法对模型中生成的捆绑包进行表征,进行下一步训练。
一种基于个性化自适应捆绑推荐模型的推荐方法,基于上述的一种个性化自适应捆绑推荐模型,其特征在于,所述基于个性化自适应捆绑推荐模型的推荐方法包括以下步骤:
S100、采用D-TI根据用户的访问路径生成初始捆绑包,进而优化为基础捆绑包;
S200、采用带有约束的多目标优化方法优化基础捆绑包。
进一步的,在S100中,具体的,输入层根据用户的历史记录,得到每个用户的访问序列,对每个用户和item进行One-Hot处理,并输入到嵌入层,同时还用于将用户的交互序列输入到深度模型层左边的部分,构建节点是item的User访问序列图,
嵌入层得到输入层的数据流后,对每一个用户和item进行嵌入处理,每一个用户和物品进行One-hot向量化用户和物品的潜在因子矩阵分别为这里M和K分别代表用户数量和潜在空间维数,则用户和item的嵌入如下所示:
其中,V={v1,v2,v3,…,vn},为物品集合,U={u1,u2,u3,…,um},为用户集合,
在得到嵌入之后,输入到深度模型层,进行训练,
深度模型层使用NCF深度学习模型,针对每一位用户和物品进行匹配,以使得每一位用户得到评分最高的物品,
其中,公式(2)表示的是NCF中的广义矩阵分解组件,和分别表示GMF和MLP的用户嵌入,和分别表示了GMF和MLP的物品嵌入,公式(3)表示的是NCF中的的MLP组件,公式(4)将公式(2)和公式(3)两个组件结合起来,得到预测评分具体表示用户u对物品i的预测评分,选择出评分最高的item,输入到下一层,
深度游走层使用所述评分最高的item作为起始节点,在生成序列图上进行深度游走,跳转概率为:
其中,N+(vi)表示所有从节点vi出发的有向边指向的节点的集合,Mij表示物品i跳转到物品j的跳转权重,通过随即游走,产生若干数量的物品序列,即含有若干捆绑包的预选集,
深度游走层利用TF-IDF算法对所述预选集进行约束,去除其中相似的捆绑包,最终获得基础捆绑包:
先计算一个物品vi在针对用户u生成的捆绑列表bj中出现的频率,计算公式定义如下:
其中,VFi表示物品i在捆绑包列表j中出现的频率,nij表示物品i在捆绑包列表j中出现的次数,n*j表示捆绑包列表j中所有物品的数量,
接下来计算物品vi在所有用户的捆绑包列表中出现的频次,公式如下:
其中,N是每个用户bundle列表的总数,Ni是包含物品vi的列表的总数,将VFi和IDFi合并,表示为:
Gi=VFi*IDF (8)
使用D-TI算法去产生基础捆绑包,然后对每个捆绑包进行表征,通过自适应加权操作,获得捆绑包的嵌入向量:
其中,α(i,j)表示用户ui考虑与捆绑包bs交互时,物品vj所代表的权重,在一个低秩模型里参数化α(i,j):
其中,aj表征了在对一个bundle中的一个物品做决策时,表征物品vj的向量,利用上述表征方法对模型中生成的捆绑包进行表征,进行下一步训练。
进一步的,优化是找到一个或多个解决方案,使一个或多个指定目标最小化(或最大化),并满足所有约束。而多目标优化往往同时考虑多个相互冲突的不同目标。本发明设计的模型框架是在捆绑包推荐背景下,建立的适应多个不同目标的推荐模型。
捆绑包往往由一个或多个物品组成。一般来说,考虑物品的多样化必然造成推荐质量的下降,因此本文主要面临的问题是如何解决捆绑包的高匹配度与捆绑包多样性之间的冲突。捆绑包的推荐是要推荐给用户捆绑包列表。由于捆绑包的匹配度来源于组成捆绑包的物品的匹配度,当我们为了捆绑包的高评分而追求包内物品的高评分时,捆绑包列表中物品内容就会高度相似。为了解决这一冲突,本文中我们为捆绑包推荐定义两个不同的目标:高评分和高多样性。
为使获得的bundle列表拥有更高的用户喜爱度,同时又不失物品多样性,我们将高评分,高多样性两个作为本文的多优化目标(图3所示)。MMoE模型中最重要的是Expert的定义,我们将物品作为专家,凸显每一个物品在捆绑包中的重要性,采用softmax作为门控单元,计算每个物品对优化目标的重要程度。
在S200中,具体的,多目标优化层为捆绑包推荐定义两个不同的目标:高评分和高多样性,
采用MMoE模型,将物品作为专家,采用softmax作为门控单元,计算每个物品对优化目标的重要程度,
yk=zk(fk(x)) (10)
其中,k代表不同的任务,k=1,2,…,fk(x)表示物品向量阶段,对于不同任务k,捆绑包组成不同,所以每个fk(x)也不相同,
将注意力Ak(x)作为每个优化目标的门控单元,注意力计算方法如下:
进一步的,传统损失函数的计算方法往往基于预设单个物品。然而,在推荐捆绑包时,我们也应该考虑捆绑包的影响。基于这一思想,我们提出了一种新的基于正、负情况相关性的损失方法PP-NN。
对于用户来说,当他与一个物品交互时,这在很大程度上表明他喜欢这个物品。我们将该物品作为一个正样例,并将其表示为Itempositive。反之,作为负样例,记为itemnegative。类似地,当用户与一个bundle交互时,它在很大程度上表明用户喜欢这个捆绑包的组合,这被记录为Bundlepositive,但是它不能确定用户是否会喜欢这个bundle中的所有项目。反之亦然。用户不喜欢这个bundle或者不与它交互,标记为Bundlenegative。事实上,我们无法判断用户是否不喜欢捆绑中的每个物品。这很容易理解和解释。
在S300中,具体的,假设:用户对单个正向项目的偏好必须大于对一个正向捆绑项目的偏好;用户对捆绑包的非首选项必须小于对消极项目的非首选项,基于所述假设,定义如下关系:
Itempositive>Bundlepositive>Bundlenegative>Itemnegative
基于以上序列,我们建立了一个新颖的损失计算方法:
其中,Lbundle与Litem是BPR损失,在此之上,加入了Bundlenegative>Itemnegative这一对损失,当一个捆绑包里面包含用户不喜欢的物品时,这个物品对捆绑包的影响较大,我们以这个原则进行优化,
L=Lbundle+Litem+Lfused (15)。
本发明利用用户的行为序列信息,构建了基于物品的用户行为序列图。随后,以深度模型产生的最高匹配度的物品作为起始节点,并利用用户行为序列图进行深度游走来产生候选集。利用TF-IDF方法对候选集进行合理约束以此获得优质的基础捆绑包。本发明提出了高评分性和高多样性的两个优化目标,并以此优化了捆绑包集合,使捆绑包集合的质量和多样性得到了有效的保证。此外,本发明提出了一种针对捆绑包的优化方法,使其整体性能得到进一步优化。最终我们的模型获得了较好的性能。
Claims (10)
1.一种个性化自适应捆绑推荐模型,其特征在于,所述个性化自适应捆绑推荐模型包括输入层、嵌入层、深度模型层、深度游走层和多目标优化层,所述输入层、嵌入层、深度模型层、深度游走层和多目标优化层依次连接。
2.根据权利要求1所述的一种个性化自适应捆绑推荐模型,其特征在于,
所述输入层,用于根据用户历史行为序列,构建物品-物品之间的序列生成图;
所述嵌入层,用于根据用户和物品的数据规模分别将其投射到稠密的向量空间,获得用户行为序列的初始表征结果;
然后设计一种约束来形成捆绑包候选集,利用TF-IDF思想进行约束,避免产生相似的捆绑包,随之产生基础捆绑包;
所述多目标优化层,用于对所述的基础捆绑包的列表里的每个物品进行评估优化。
3.根据权利要求2所述的一种个性化自适应捆绑推荐模型,其特征在于,所述输入层,具体的,用于根据用户的历史记录,得到每个用户的访问序列,对每个用户和item进行One-Hot处理,并输入到嵌入层,同时还用于将用户的交互序列输入到深度模型层左边的部分,构建节点是item的User访问序列图。
6.根据权利要求5所述的一种个性化自适应捆绑推荐模型,其特征在于,所述深度游走层,具体的,用于使用所述评分最高的item作为起始节点,在生成序列图上进行深度游走,跳转概率为:
其中,N+(vi)表示所有从节点vi出发的有向边指向的节点的集合,Mij表示物品i跳转到物品j的跳转权重,通过随即游走,产生若干数量的物品序列,即含有若干捆绑包的预选集,
还用于利用TF-IDF算法对所述预选集进行约束,去除其中相似的捆绑包,最终获得基础捆绑包:
先计算一个物品vi在针对用户u生成的捆绑列表bj中出现的频率,计算公式定义如下:
其中,VFi表示物品i在捆绑包列表j中出现的频率,nij表示物品i在捆绑包列表j中出现的次数,n*j表示捆绑包列表j中所有物品的数量,
接下来计算物品vi在所有用户的捆绑包列表中出现的频次,公式如下:
其中,N是每个用户bundle列表的总数,Ni是包含物品vi的列表的总数,将VFi和IDFi合并,表示为:
Gi=VFi*IDF (8)
使用D-TI算法去产生基础捆绑包,然后对每个捆绑包进行表征,通过自适应加权操作,获得捆绑包的嵌入向量:
其中,α(i,j)表示用户ui考虑与捆绑包bs交互时,物品vj所代表的权重,在一个低秩模型里参数化α(i,j):
其中,aj表征了在对一个bundle中的一个物品做决策时,表征物品vj的向量,利用上述表征方法对模型中生成的捆绑包进行表征,进行下一步训练。
7.一种基于个性化自适应捆绑推荐模型的推荐方法,基于权利要求1-6任一项所述的一种个性化自适应捆绑推荐模型,其特征在于,所述基于个性化自适应捆绑推荐模型的推荐方法包括以下步骤:
S100、采用D-TI根据用户的访问路径生成初始捆绑包,进而优化为基础捆绑包;
S200、采用带有约束的多目标优化方法优化基础捆绑包;
S300、提出一种新的基于正、负情况相关性的损失计算方法,并利用所述损失计算方法对捆绑包进行优化。
8.根据权利要求7所述的一种基于个性化自适应捆绑推荐模型的推荐方法,其特征在于,在S100中,具体的,输入层根据用户的历史记录,得到每个用户的访问序列,对每个用户和item进行One-Hot处理,并输入到嵌入层,同时还用于将用户的交互序列输入到深度模型层左边的部分,构建节点是item的User访问序列图,
嵌入层得到输入层的数据流后,对每一个用户和item进行嵌入处理,每一个用户和物品进行One-hot向量化用户和物品的潜在因子矩阵分别为这里M和K分别代表用户数量和潜在空间维数,则用户和item的嵌入如下所示:
其中,V={v1,v2,v3,…,vn},为物品集合,U={u1,u2,u3,…,um},为用户集合,
在得到嵌入之后,输入到深度模型层,进行训练,
深度模型层使用NCF深度学习模型,针对每一位用户和物品进行匹配,以使得每一位用户得到评分最高的物品,
其中,公式(2)表示的是NCF中的广义矩阵分解组件,和分别表示GMF和MLP的用户嵌入,和分别表示了GMF和MLP的物品嵌入,公式(3)表示的是NCF中的的MLP组件,公式(4)将公式(2)和公式(3)两个组件结合起来,得到预测评分具体表示用户u对物品i的预测评分,选择出评分最高的item,输入到下一层,
深度游走层使用所述评分最高的item作为起始节点,在生成序列图上进行深度游走,跳转概率为:
其中,N+(vi)表示所有从节点vi出发的有向边指向的节点的集合,Mij表示物品i跳转到物品j的跳转权重,通过随即游走,产生若干数量的物品序列,即含有若干捆绑包的预选集,
深度游走层利用TF-IDF算法对所述预选集进行约束,去除其中相似的捆绑包,最终获得基础捆绑包:
先计算一个物品vi在针对用户u生成的捆绑列表bj中出现的频率,计算公式定义如下:
其中,VFi表示物品i在捆绑包列表j中出现的频率,nij表示物品i在捆绑包列表j中出现的次数,n*j表示捆绑包列表j中所有物品的数量,
接下来计算物品vi在所有用户的捆绑包列表中出现的频次,公式如下:
其中,N是每个用户bundle列表的总数,Ni是包含物品vi的列表的总数,将VFi和IDFi合并,表示为:
Gi=VFi*IDF (8)
使用D-TI算法去产生基础捆绑包,然后对每个捆绑包进行表征,通过自适应加权操作,获得捆绑包的嵌入向量:
其中,α(i,j)表示用户ui考虑与捆绑包bs交互时,物品vj所代表的权重,在一个低秩模型里参数化α(i,j):
其中,aj表征了在对一个bundle中的一个物品做决策时,表征物品vj的向量,利用上述表征方法对模型中生成的捆绑包进行表征,进行下一步训练。
9.根据权利要求8所述的一种基于个性化自适应捆绑推荐模型的推荐方法,其特征在于,在S200中,具体的,多目标优化层为捆绑包推荐定义两个不同的目标:高评分和高多样性,
采用MMoE模型,将物品作为专家,采用softmax作为门控单元,计算每个物品对优化目标的重要程度,
yk=zk(fk(x)) (11)
其中,k代表不同的任务,k=1,2,…,fk(x)表示物品向量阶段,对于不同任务k,捆绑包组成不同,所以每个fk(x)也不相同,
将注意力Ak(x)作为每个优化目标的门控单元,注意力计算方法如下:
10.根据权利要求9所述的一种基于个性化自适应捆绑推荐模型的推荐方法,其特征在于,在S300中,具体的,假设:用户对单个正向项目的偏好必须大于对一个正向捆绑项目的偏好;用户对捆绑包的非首选项必须小于对消极项目的非首选项,基于所述假设,定义如下关系:
Itempositive>Bundlepositive>Bundlenegative>Itemnegative
基于以上序列,我们建立了一个新颖的损失计算方法:
其中,Lbundle与Litem是BPR损失,在此之上,加入了Bundlenegative>Itemnegative这一对损失,当一个捆绑包里面包含用户不喜欢的物品时,这个物品对捆绑包的影响较大,我们以这个原则进行优化,
L=Lbundle+Litem+Lfused (15)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111615929.1A CN114329200B (zh) | 2021-12-27 | 2021-12-27 | 一种个性化自适应捆绑推荐模型及推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111615929.1A CN114329200B (zh) | 2021-12-27 | 2021-12-27 | 一种个性化自适应捆绑推荐模型及推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114329200A true CN114329200A (zh) | 2022-04-12 |
CN114329200B CN114329200B (zh) | 2023-05-26 |
Family
ID=81012931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111615929.1A Active CN114329200B (zh) | 2021-12-27 | 2021-12-27 | 一种个性化自适应捆绑推荐模型及推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114329200B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115659063A (zh) * | 2022-11-08 | 2023-01-31 | 黑龙江大学 | 针对用户兴趣漂移的关联性信息增强推荐方法、计算机设备、存储介质和程序产品 |
CN116578769A (zh) * | 2023-03-03 | 2023-08-11 | 齐鲁工业大学(山东省科学院) | 一种基于行为模式转换的多任务学习推荐方法 |
CN116823407A (zh) * | 2023-08-29 | 2023-09-29 | 北京国电通网络技术有限公司 | 产品信息推送方法、装置、电子设备和计算机可读介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140358665A1 (en) * | 2013-05-31 | 2014-12-04 | Wal-Mart Stores, Inc. | Predictive Item Bundling Recommendation Systems And Methods |
CN107077475A (zh) * | 2014-10-31 | 2017-08-18 | 谷歌公司 | 根据产品/用户标签和共安装图推荐产品捆绑包的系统和方法 |
US20170255987A1 (en) * | 2016-03-04 | 2017-09-07 | Michelle Harrison Bacharach | Methods, systems, and media for providing information based on grouping information |
CN111611472A (zh) * | 2020-03-31 | 2020-09-01 | 清华大学 | 一种基于图卷积神经网络的捆绑推荐方法及系统 |
CN113177159A (zh) * | 2021-05-11 | 2021-07-27 | 清华大学 | 基于多通道超图神经网络的捆绑推荐方法 |
US20210342701A1 (en) * | 2020-05-04 | 2021-11-04 | Adobe Inc. | Deep learning based visual compatibility prediction for bundle recommendations |
-
2021
- 2021-12-27 CN CN202111615929.1A patent/CN114329200B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140358665A1 (en) * | 2013-05-31 | 2014-12-04 | Wal-Mart Stores, Inc. | Predictive Item Bundling Recommendation Systems And Methods |
CN107077475A (zh) * | 2014-10-31 | 2017-08-18 | 谷歌公司 | 根据产品/用户标签和共安装图推荐产品捆绑包的系统和方法 |
US20170255987A1 (en) * | 2016-03-04 | 2017-09-07 | Michelle Harrison Bacharach | Methods, systems, and media for providing information based on grouping information |
CN111611472A (zh) * | 2020-03-31 | 2020-09-01 | 清华大学 | 一种基于图卷积神经网络的捆绑推荐方法及系统 |
US20210342701A1 (en) * | 2020-05-04 | 2021-11-04 | Adobe Inc. | Deep learning based visual compatibility prediction for bundle recommendations |
CN113177159A (zh) * | 2021-05-11 | 2021-07-27 | 清华大学 | 基于多通道超图神经网络的捆绑推荐方法 |
Non-Patent Citations (3)
Title |
---|
JINZE BAI等: "Personalized Bundle List Recommendation", 《ACM》 * |
李姣燕等: "个性化捆绑销售推荐系统", 《电脑知识与技术》 * |
裘立波等: "基于关联规则和协同过滤的网络商品捆绑方法研究", 《计算机与现代化》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115659063A (zh) * | 2022-11-08 | 2023-01-31 | 黑龙江大学 | 针对用户兴趣漂移的关联性信息增强推荐方法、计算机设备、存储介质和程序产品 |
CN116578769A (zh) * | 2023-03-03 | 2023-08-11 | 齐鲁工业大学(山东省科学院) | 一种基于行为模式转换的多任务学习推荐方法 |
CN116578769B (zh) * | 2023-03-03 | 2024-03-01 | 齐鲁工业大学(山东省科学院) | 一种基于行为模式转换的多任务学习推荐方法 |
CN116823407A (zh) * | 2023-08-29 | 2023-09-29 | 北京国电通网络技术有限公司 | 产品信息推送方法、装置、电子设备和计算机可读介质 |
CN116823407B (zh) * | 2023-08-29 | 2024-01-12 | 北京国电通网络技术有限公司 | 产品信息推送方法、装置、电子设备和计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114329200B (zh) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bai et al. | An attribute-aware neural attentive model for next basket recommendation | |
CN114329200B (zh) | 一种个性化自适应捆绑推荐模型及推荐方法 | |
CN108629665B (zh) | 一种个性化商品推荐方法和系统 | |
Lee et al. | Scalable deep learning-based recommendation systems | |
Moreno et al. | Talmud: transfer learning for multiple domains | |
Amatriain | Big & personal: data and models behind netflix recommendations | |
CN103678672B (zh) | 一种信息推荐方法 | |
CN110162690A (zh) | 确定用户对物品的兴趣度的方法与装置、设备和存储介质 | |
Geng et al. | NNIA-RS: A multi-objective optimization based recommender system | |
Xiang et al. | Time-dependent models in collaborative filtering based recommender system | |
Aggarwal et al. | Ensemble-based and hybrid recommender systems | |
Sun et al. | APL: Adversarial pairwise learning for recommender systems | |
Chai et al. | Recommendation system based on singular value decomposition and multi-objective immune optimization | |
Pujahari et al. | Aggregation of preference relations to enhance the ranking quality of collaborative filtering based group recommender system | |
Gonçalves et al. | Simpler is better: a novel genetic algorithm to induce compact multi-label chain classifiers | |
Wu et al. | GCRec: Graph-augmented capsule network for next-item recommendation | |
Xia et al. | Modeling consumer buying decision for recommendation based on multi-task deep learning | |
CN113918832A (zh) | 基于社交关系的图卷积协同过滤推荐系统 | |
CN113918833A (zh) | 通过社交网络关系的图卷积协同过滤实现的产品推荐方法 | |
Zhang et al. | An Improved Collaborative Filtering Algorithm Based on User Interest. | |
CN113918834A (zh) | 融合社交关系的图卷积协同过滤推荐方法 | |
Li et al. | An efficient co-attention neural network for social recommendation | |
De Boom et al. | Large-scale user modeling with recurrent neural networks for music discovery on multiple time scales | |
Mantha et al. | A large-scale deep architecture for personalized grocery basket recommendations | |
Dong et al. | Improving sequential recommendation with attribute-augmented graph neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |