CN110619082A - 一种基于重复搜索机制的项目推荐方法 - Google Patents
一种基于重复搜索机制的项目推荐方法 Download PDFInfo
- Publication number
- CN110619082A CN110619082A CN201910894851.8A CN201910894851A CN110619082A CN 110619082 A CN110619082 A CN 110619082A CN 201910894851 A CN201910894851 A CN 201910894851A CN 110619082 A CN110619082 A CN 110619082A
- Authority
- CN
- China
- Prior art keywords
- item
- sequence
- items
- repeated
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000006399 behavior Effects 0.000 claims abstract description 68
- 230000021824 exploration behavior Effects 0.000 claims abstract description 47
- 238000009826 distribution Methods 0.000 claims abstract description 38
- 238000013528 artificial neural network Methods 0.000 claims abstract description 31
- 239000013598 vector Substances 0.000 claims description 107
- 230000003989 repetitive behavior Effects 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 13
- 208000013406 repetitive behavior Diseases 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 abstract description 9
- 238000000547 structure data Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000003993 interaction Effects 0.000 description 5
- 230000003252 repetitive effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于重复搜索机制的项目推荐方法、装置、设备及可读存储介质,该方案基于图神经网络和重复搜索机制来实现项目推荐,首先将用户在当前会话中交互的项目序列作为会话图进行处理,每个项目都被编码为图结构数据;然后,应用注意机制层捕获当前会话中用户的主要目的,确定当前会话属于重复行为模式和探索行为模式的概率分布;最后,利用重复搜索机制确定候选项目分别在重复行为模式和探索行为模式的得分,并据此确定候选项目的最终得分,以决定是否向用户推荐该候选项目。可见,该方案通过分别考虑重复行为模式和探索行为模式两种情形,能够更精准的预测用户行为,提升推荐效果。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种基于重复搜索机制的项目推荐方法、装置、设备及可读存储介质。
背景技术
推荐系统在人们的日常生活中发挥着重要的作用,在许多实际应用中,推荐系统帮助用户缓解信息过载的问题,并推荐用户可能感兴趣的产品。现有的推荐系统大多基于用户的历史交互或其他用户的信息,然而,在许多情况下,用户的个人资料和过去的活动并没有被记录下来,我们所拥有的只是一组发生在用户会话中的交互数据。
近年来,图形神经网络(GNN)得到了长足的发展,在学习图形数据的有意义表示时得到了很好的应用。GNN的核心思想是利用神经网络对局部图节点的特征信息进行聚类,GNN自然地整合了节点信息,并被证明在表示学习中具有重要影响。对于基于会话的推荐,相关学者通过将会话的项序列建模为会话图,利用GNN捕捉项的复杂转换,生成精确的项嵌入向量。基于实际的项目嵌入,GNN学习可靠的向量表示,并更精确地预测下一个单击的项目。
虽然上述推荐方案在基于会话的推荐方面取得了很大的进展,但仍然存在一定的局限性,他们都没有注意到所谓的重复推荐,因此推荐效果不是很理想。重复推荐在基于会话的推荐中占很大比例,例如,人们在网上购物时可能会反复浏览产品信息几次,我们往往会在一天中频繁地听相同的音乐。
综上,现有的基于会话的推荐方案没有考虑重复推荐,导致推荐效果较差。
发明内容
本申请的目的是提供一种基于重复搜索机制的项目推荐方法、装置、设备及可读存储介质,用以解决现有的基于会话的推荐方案没有考虑重复推荐,导致推荐效果较差的问题。具体方案如下:
第一方面,本申请提供了一种基于重复搜索机制的项目推荐方法,包括:
获取当前用户在当前会话中访问过的项目序列;利用图神经网络确定所述项目序列中各个项目的向量表示;
利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布;其中,所述重复行为模式指所述当前用户下一次访问的项目为所述项目序列中的项目的情况,所述探索行为模式指所述当前用户下一次访问的项目并非所述项目序列中的项目的情况;
利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分;
利用第三注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述候选项目在探索行为模式下的得分;
根据所述概率分布、所述候选项目在重复行为模式下的得分、所述候选项目在探索行为模式下的得分,确定所述候选项目的最终得分;在所述最终得分满足预设要求时,向所述当前用户推荐所述候选项目。
优选的,所述利用图神经网络确定所述项目序列中各个项目的向量表示,包括:
确定所述项目序列中各个项目的初始的向量表示;
利用图神经网络对所述项目序列中各个项目的向量表示进行目标次数的迭代更新,得到最终的所述项目序列中各个项目的向量表示,其中所述目标次数等于所述项目序列中的项目数量。
优选的,所述利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布,包括:
根据第一注意力机制层的训练参数和偏置项以及所述项目序列中各个项目的向量表示,确定所述当前会话的第一向量表示;根据所述第一向量表示、所述项目序列中最后一个项目的向量表示、预设权重矩阵,确定目标多维矩阵;将所述目标多维矩阵投影至二维空间,得到所述当前会话中重复行为和探索行为的概率分布。
优选的,所述利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分,包括:
根据第二注意力机制层的训练参数和偏置项以及所述项目序列中各个项目的向量表示,确定所述当前会话在重复行为模式下的第二向量表示;根据所述第二向量表示和候选项目的向量表示,确定候选项目在重复行为模式下的得分。
优选的,所述在所述最终得分满足预设要求时,向所述当前用户推荐所述候选项目,包括:
在确定候选集合中各个候选项目的最终得分后,确定最终得分最高的目标候选项目,并向所述当前用户推荐所述目标候选项目。
第二方面,本申请提供了一种基于重复搜索机制的项目推荐装置,包括:
获取模块:用于获取当前用户在当前会话中访问过的项目序列;利用图神经网络确定所述项目序列中各个项目的向量表示;
概率分布确定模块:用于利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布;其中,所述重复行为模式指所述当前用户下一次访问的项目为所述项目序列中的项目的情况,所述探索行为模式指所述当前用户下一次访问的项目并非所述项目序列中的项目的情况;
第一得分确定模块:用于利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分;
第二得分确定模块:用于利用第三注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述候选项目在探索行为模式下的得分;
推荐模块:用于根据所述概率分布、所述候选项目在重复行为模式下的得分、所述候选项目在探索行为模式下的得分,确定所述候选项目的最终得分;在所述最终得分满足预设要求时,向所述当前用户推荐所述候选项目。
第三方面,本申请提供了一种基于重复搜索机制的项目推荐设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如上所述的一种基于重复搜索机制的项目推荐方法的步骤。
第四方面,本申请提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时用于实现如上所述的一种基于重复搜索机制的项目推荐方法的步骤。
本申请所提供的一种基于重复搜索机制的项目推荐方法、装置、设备及可读存储介质,包括:获取当前用户在当前会话中访问过的项目序列;利用图神经网络确定项目序列中各个项目的向量表示;利用第一注意力机制层,根据项目序列中各个项目的向量表示,确定当前会话属于重复行为模式和探索行为模式的概率分布;利用第二注意力机制层,根据项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分;利用第三注意力机制层,所述项目序列中各个项目的向量表示,确定候选项目在探索行为模式下的得分;根据重复行为和探索行为的概率分布、候选项目在重复行为模式下的得分、候选项目在探索行为模式下的得分,确定候选项目的最终得分;在最终得分满足预设要求时,向当前用户推荐候选项目。
综上,该方案基于图神经网络和重复搜索机制来实现项目推荐,首先将用户在当前会话中交互的项目序列作为会话图进行处理,每个项目都被编码为图结构数据;然后,应用注意机制层捕获当前会话中用户的主要目的,确定当前会话属于重复行为模式和探索行为模式的概率分布;最后,利用重复搜索机制确定候选项目分别在重复行为模式和探索行为模式的得分,并据此确定候选项目的最终得分,以决定是否向用户推荐该候选项目。可见,该方案通过分别考虑重复行为模式和探索行为模式两种情形,能够更精准的预测用户行为,提升推荐效果。
附图说明
为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的一种基于重复搜索机制的项目推荐方法实施例一的实现流程图;
图2为本申请所提供的一种基于重复搜索机制的项目推荐方法实施例一的会话图实例示意图;
图3为本申请所提供的一种基于重复搜索机制的项目推荐方法实施例二的实现流程图;
图4为本申请所提供的一种基于重复搜索机制的项目推荐装置实施例的功能框图;
图5为本申请所提供的一种基于重复搜索机制的项目推荐设备实施例的结构示意图。
具体实施方式
本申请的核心是提供一种基于重复搜索机制的项目推荐方法、装置、设备及可读存储介质,基于图神经网络和重复搜索机制来实现推荐,显著提升了推荐效果。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面对本申请提供的一种基于重复搜索机制的项目推荐方法实施例一进行介绍,参见图1,实施例一包括:
S101、获取当前用户在当前会话中访问过的项目序列;利用图神经网络确定所述项目序列中各个项目的向量表示;
本实施例的目的在于,根据用户在某次会话中访问过的项目,预测用户下一次访问的项目。具体的,给定用户在当前会话中访问过的项目序列,并给定候选集合,其中项目序列中各个项目按照访问时间的先后顺序进行排列,候选集合中包括一个或多个候选项目。
在会话图中,为了得到图节点的潜在向量,本实施例首先随机生成各个节点的初始嵌入向量,该初始嵌入向量包含每个项目的内在特征,然后利用图神经网络对初始嵌入向量进行更新。具体的,图神经网络通过捕捉多个图节点之间的转换,提取会话图的特征,适合于项目表示学习,最终得到各个项目的向量表示。
S102、利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布;
在学习完所有的项目表示之后,本实施例进一步使用注意力机制来获取用户在当前会话中的主要目的,生成当前会话的表示,并确定当前会话属于重复行为模式和探索行为模式的概率分布。其中,所述重复行为模式指当前用户下一次访问的项目为项目序列中的项目的情况,所述探索行为模式指当前用户下一次访问的项目并非项目序列中的项目的情况。
S103、利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分;
此过程与S102类似,不同之处在于,本实施例在第二注意力机制层中重新初始化和计算训练参数以及偏置项,来获得在重复行为模式下的会话向量表示以及候选集中候选项目在重复行为模式下的得分。
S104、利用第三注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述候选项目在探索行为模式下的得分;
此过程与S102类似,不同之处在于,本实施例在第三注意力机制层中重新初始化和计算训练参数以及偏置项,来获得在探索模式下的会话向量表示以及候选集中项目在探索行为模式下的得分。
值得一提的是,上述S102、S103、S104三者的执行先后顺序可以进行调整,只要保证三者均为S101之后且在S105之前执行即可。
S105、根据所述概率分布、所述候选项目在重复行为模式下的得分、所述候选项目在探索行为模式下的得分,确定所述候选项目的最终得分;在所述最终得分满足预设要求时,向所述当前用户推荐所述候选项目。
在项目推荐过程中,本实施例结合了重复行为模式和探索行为模式的项目评分。具体的,在计算出两个模式的概率分布以及候选项目分布在两个模式下得分之后,对其进行加权求和,得到候选项目的最终得分。在最终得分满足预设要求时,向当前用户推荐该候选项目。作为一种具体的实施方式,选取候选集合中最终得分最高的候选项目,将其作为最终的推荐项目推荐给用户;或者,依次计算候选集合中各个候选项目的最终得分,直到得出最终得分超过预设阈值的候选项目,将其作为最终的推荐项目推荐给用户。本实施例对上述预设要求不做具体限定,具体根据实际需求确定即可。
本实施例所提供一种基于重复搜索机制的项目推荐方法,基于图神经网络和重复搜索机制来实现推荐,首先将用户在当前会话中交互的项目序列作为会话图进行处理,每个项目都被编码为图结构数据;然后,应用注意机制层捕获当前会话中用户的主要目的,确定当前会话属于重复行为模式和探索行为模式的概率分布;最后,利用重复搜索机制分别考虑重复行为模式和探索行为模式的得分,并据此确定候选项目的最终得分,以决定是否向用户推荐该候选项目。可见,该方案通过分别考虑重复行为模式和探索行为模式两种情形,能够更精准的预测用户行为,提升推荐效果。
下面开始详细介绍本申请提供的一种基于重复搜索机制的项目推荐方法实施例二,实施例二基于前述实施例一实现,并在实施例一的基础上进行了一定程度上的拓展。
参见图3,实施例二具体包括:
S201、获取当前用户在当前会话中访问过的项目序列;
本实施例的目标是,根据用户在当前会话中访问过的项目序列,预测在候选集用户最可能访问的下一个项目。具体的,将当前用户在当前会话中访问过的项目序列记为Is=[I1,I2,....,Ij,....In],其中Ij是用户在当前会话中访问过第j个项目,本实施例将预测In+1。
S202、确定所述项目序列中各个项目的初始的向量表示;利用图神经网络对所述项目序列中各个项目的向量表示进行目标次数的迭代更新,得到最终的所述项目序列中各个项目的向量表示;
本实施例中,将Ij的初始嵌入向量记为xj,因此上述序列可以表示为xs=[x1,x2,....,xj,....xn]。作为一种具体的实施方式,本实施例使用正太分布为所有项目分别初始化随机向量,得到上述初始的向量表示,该向量表示包含项目的内在特征。
本实施例中,图神经网络的输入为所有项目在最初状态下的向量表示,即上述初始的向量表示,输出为利用图神经网络在t个时刻更新之后的所有项目的最终的向量表示。由于用户在每个会话之中,随着时间推移,所交互的项目数量也逐渐递增,在每个新增项目的时刻,本实施例将新的项目和现有的项目使用图神经网络重新构造其关系,并且更新每个项目的表示向量。在迭代t次之后,会话中的所有项目向量更新为最终的状态。
图神经网络的实现过程如下式所示:
其中,是在t-1时刻的所有项目向量的激活状态,并且在会话中的初始项目状态为[x1,x2,...,xn]。W,Wz,Wr是权重矩阵,b是偏置项。σ()和tanh()分别代表两个常用的激活函数,即西格玛激活和tanh激活函数。此外,⊙是元素级别的乘积,是更新门,是重置门。最后E∈Rn×2n是会话图的边邻接矩阵。
本实施例定义E为两个矩阵的拼接,即Ein∈Rn×n和Eout∈Rn×n,他们分别描述了会话图中的出边信息和入边信息。与传统矩阵不同的是,本实施例将每个节点的出边或者入边的权重之和设为1。比如图2中,节点i2有两条出边e2和e3,那么它们在Eout中的权重就都是1/2。图神经网络的总体流程是,对于每个会话图,获取所有节点在t-1状态时的联系,然后和决定哪部分信息将在在t时刻被更新或者保留,最后得到在时刻t的准确项目表示
S203、利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布;
其中,所述重复行为模式指所述当前用户下一次访问的项目为所述项目序列中的项目的情况,所述探索行为模式指所述当前用户下一次访问的项目并非所述项目序列中的项目的情况。
在学习完所有的项目表示之后,本实施例进一步使用注意力机制来获取用户在当前会话中的主要目的,并且产生会话的第一向量表示表示。令sg作为全局的会话表示,sc为局部的会话表示。对于sc,令其中是在t时刻被图神经网络编码过的,用户访问的最后一个项目向量。本实施例通过如下的方式计算出会话表示和重复行为模式以及探索行为模式的概率分布:
sre=Wre4[sg,sc]
[Pr,Pe]=softmax(Wresre)
其中,Wre1∈Rd,Wre2和Wre3∈Rd×d,Wre4∈Rd×2d,Wre∈R2×d都是权重矩阵,他们控制着权重和嵌入向量的维度。是项目ij的权重得分。它结合了和的影响。然后,连接全局会话向量sg和局部会话向量sc,并且将他们通过一个线性投影,得到最后的会话表示sre。最后,我们通过把sre投影到一个二维空间来获取重复行为模式和探索行为模式的概率分布。
也就是说,本实施例中,第一注意力机制层的输入为图神经网络输出的在当前会话中的所有项目的最终的向量表示,输出为当前会话的第一向量表示,以及当前会话对应重复行为模式或者探索行为模式的概率分布。第一注意力机制层的实现过程包括:由S202得到所有项目的最终向量表示,本实施例对属于当前会话中的所有项目的向量表示,在对每一个项目乘以训练参数之后,加上最后一个访问的项目向量和偏置项,进行加权求和,最终可以得到当前会话的第一向量表示。对于计算出的会话表示向量表示,再拼接上最后一个交互项目向量,乘以权重矩阵,将得到的多维矩阵投影到一个二维的概率分布中,得到当前会话属于重复行为模式和探索行为模式的概率。
S204、利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分;
第二注意力机制层是指,在考虑用户的下一个交互行为偏向于选择之前已交互过的项目的情况,重新计算这种模式下当前会话的第二向量表示。所有参数用于学习用户的重复行为特征,计算用户在当前会话中与之交互的项目的得分,如下所示:
sr=Wr4[sgr,sc]
其中Wr1∈Rd,Wr2andWre3∈Rd×d,Wr4∈Rd×2d是权重矩阵,sgr是在重复模块中的全局的会话向量,sr是在第二注意力机制层中当前会话的第二向量表示。最后为用户已经访问过的所以项目计算得分I(·)是一个指示函数,用户未访问过的项目得分将为0。
第二注意力机制层的输入为图神经网络输出的在当前会话中的所有项目的最终的向量表示,输出为用户在重复行为模式下,对有所候选项目的评分计算,即在重复行为模式中,所有候选项目的得分。实现过程此过程与第一注意力机制层类似,不同之处在于,第二注意力机制层重新初始化和计算训练参数以及偏置项,来获得在重复行为模式下当前会话的第二向量表示,以及候选项目在重复行为模式下的得分。在对每一个项目前乘以训练参数之后,加上最后一个访问的项目向量和偏置项,进行加权求和。最终可以得到当前会话的第二向量表示,对于计算出的向量表示,使用它乘以候选项目的向量表示,来获得用户在该模式下对该项目的偏好得分。
S205、利用第三注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述候选项目在探索行为模式下的得分;
第三注意力机制层的作用为计算用户的下一个交互的项目为未出现在交互历史中的情况。计算过程与第二注意力机制层相似,计算条目得分如下:
se=We4[sge,sc]
其中We1∈Rd,We2和Wre3∈Rd×d,We4∈R2×d是权重矩阵,be是偏置项。在第三注意力机制层中,只计算在用户当前会话中未出现过的项目的得分,那些用户已访问过的项目的得分为0。
第三注意力机制层的输入为图神经网络输出的在当前会话中的所有项目的最终的向量表示,输出为用户在探索行为模式下,对有所候选项目的评分计算,即在探索行为模式中,对所有候选项目的偏好得分。实现过程:此过程与第一注意力机制层类似,不同之处在于,第三注意力机制层重新初始化和计算训练参数以及偏置项,来获得在探索行为模式下的会话向量表示以及用户对候选集中项目的评分。在对每一个项目之前乘以训练参数之后,加上最后一个访问的项目向量和偏置项,进行加权求和,最终可以得到当前会话的第三向量表示,对于计算出的向量表示,使用它乘以候选项目的向量表示,来获得用户在该模式下对该项目的偏好得分。
S206、根据所述概率分布、所述候选项目在重复行为模式下的得分、所述候选项目在探索行为模式下的得分,确定所述候选项目的最终得分;
S207、在确定候选集合中各个候选项目的最终得分后,确定最终得分最高的目标候选项目,并向所述当前用户推荐所述目标候选项目。
对于推荐,本实施例结合了重复行为模式和探索行为模式的项目评分。然后,使用softmax函数对组合项目得分进行标准化:
其中,Pr和Pe是重复行为模式和探索行为模式的概率分布,也可以把它认为是两个得分各自的权重。是候选集中所有项目的最终得分。
对于损失函数,本实施例在当前会话中计算项目预测和地面真值的交叉熵如下:
其中,yj是一个会话的真实值,本实施例把它处理为一个独热向量。对于模型的优化,本实施例最小化代价函数所有的参数通过一个端对端的反向传播算法进行学习。
也就是说,对前文计算出的属于两个模式的概率分布分别乘以在两个模式下计算出的候选项目得分,求和之后归一化处理,得到所有候选项目的在[0,1]中的得分。最后根据得分由高到低,向用户推荐对应的项目。
可见,本实施例提供的一种基于重复搜索机制的项目推荐方法,为了充分捕捉会话项之间的复杂转换,准确地建模用户重复行为模式和探索行为模式,本实施例提出了一种新的方法,它结合了图神经网络和重复搜索机制来提高推荐系统的性能。具体的,将用户在会话中交互的项序列作为会话图进行处理,每个项都被编码为图结构数据。该方法将用户的重复行为转化为会话图的边缘信息,通过图神经网络可以准确地学习到该边缘信息,形成项目表示。然后,应用注意机制捕获当前会话中用户的主要目的,并将其组合为统一的会话表示。最后,利用重复搜索机制分别考虑用户在重复模式和搜索模式下的行为模式,并预测得分。最终据此确定候选项目的最终得分,显著提升推荐效果,且具备一定鲁棒性。
下面对本申请实施例提供的一种基于重复搜索机制的项目推荐装置进行介绍,下文描述的一种基于重复搜索机制的项目推荐装置与上文描述的一种基于重复搜索机制的项目推荐方法可相互对应参照。
如图4所示,该装置包括:
获取模块401:用于获取当前用户在当前会话中访问过的项目序列;利用图神经网络确定所述项目序列中各个项目的向量表示;
概率分布确定模块402:用于利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布;其中,所述重复行为模式指所述当前用户下一次访问的项目为所述项目序列中的项目的情况,所述探索行为模式指所述当前用户下一次访问的项目并非所述项目序列中的项目的情况;
第一得分确定模块403:用于利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分;
第二得分确定模块404:用于利用第三注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述候选项目在探索行为模式下的得分;
推荐模块405:用于根据所述概率分布、所述候选项目在重复行为模式下的得分、所述候选项目在探索行为模式下的得分,确定所述候选项目的最终得分;在所述最终得分满足预设要求时,向所述当前用户推荐所述候选项目。
本实施例的基于重复搜索机制的项目推荐装置用于实现前述的基于重复搜索机制的项目推荐方法,因此该装置中的具体实施方式可见前文中的基于重复搜索机制的项目推荐方法的实施例部分,例如,获取模块401、概率分布确定模块402、第一得分确定模块403、第二得分确定模块404、推荐模块405,分别用于实现上述基于重复搜索机制的项目推荐方法中步骤S101,S102,S103,S104,S105。所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再展开介绍。
另外,由于本实施例的基于重复搜索机制的项目推荐装置用于实现前述的基于重复搜索机制的项目推荐方法,因此其作用与上述方法的作用相对应,这里不再赘述。
此外,本申请还提供了一种基于重复搜索机制的项目推荐设备,如图5所示,包括:
存储器100:用于存储计算机程序;
处理器200:用于执行所述计算机程序,以实现如前文所述的一种基于重复搜索机制的项目推荐方法的步骤。
最后,本申请提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时用于实现如前文所述的一种基于重复搜索机制的项目推荐方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (8)
1.一种基于重复搜索机制的项目推荐方法,其特征在于,包括:
获取当前用户在当前会话中访问过的项目序列;利用图神经网络确定所述项目序列中各个项目的向量表示;
利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布;其中,所述重复行为模式指所述当前用户下一次访问的项目为所述项目序列中的项目的情况,所述探索行为模式指所述当前用户下一次访问的项目并非所述项目序列中的项目的情况;
利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分;
利用第三注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述候选项目在探索行为模式下的得分;
根据所述概率分布、所述候选项目在重复行为模式下的得分、所述候选项目在探索行为模式下的得分,确定所述候选项目的最终得分;在所述最终得分满足预设要求时,向所述当前用户推荐所述候选项目。
2.如权利要求1所述的方法,其特征在于,所述利用图神经网络确定所述项目序列中各个项目的向量表示,包括:
确定所述项目序列中各个项目的初始的向量表示;
利用图神经网络对所述项目序列中各个项目的向量表示进行目标次数的迭代更新,得到最终的所述项目序列中各个项目的向量表示,其中所述目标次数等于所述项目序列中的项目数量。
3.如权利要求2所述的方法,其特征在于,所述利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布,包括:
根据第一注意力机制层的训练参数和偏置项以及所述项目序列中各个项目的向量表示,确定所述当前会话的第一向量表示;根据所述第一向量表示、所述项目序列中最后一个项目的向量表示、预设权重矩阵,确定目标多维矩阵;将所述目标多维矩阵投影至二维空间,得到所述当前会话中重复行为和探索行为的概率分布。
4.如权利要求3所述的方法,其特征在于,所述利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分,包括:
根据第二注意力机制层的训练参数和偏置项以及所述项目序列中各个项目的向量表示,确定所述当前会话在重复行为模式下的第二向量表示;根据所述第二向量表示和候选项目的向量表示,确定候选项目在重复行为模式下的得分。
5.如权利要求1-4任意一项所述的方法,其特征在于,所述在所述最终得分满足预设要求时,向所述当前用户推荐所述候选项目,包括:
在确定候选集合中各个候选项目的最终得分后,确定最终得分最高的目标候选项目,并向所述当前用户推荐所述目标候选项目。
6.一种基于重复搜索机制的项目推荐装置,其特征在于,包括:
获取模块:用于获取当前用户在当前会话中访问过的项目序列;利用图神经网络确定所述项目序列中各个项目的向量表示;
概率分布确定模块:用于利用第一注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述当前会话属于重复行为模式和探索行为模式的概率分布;其中,所述重复行为模式指所述当前用户下一次访问的项目为所述项目序列中的项目的情况,所述探索行为模式指所述当前用户下一次访问的项目并非所述项目序列中的项目的情况;
第一得分确定模块:用于利用第二注意力机制层,根据所述项目序列中各个项目的向量表示,确定候选项目在重复行为模式下的得分;
第二得分确定模块:用于利用第三注意力机制层,根据所述项目序列中各个项目的向量表示,确定所述候选项目在探索行为模式下的得分;
推荐模块:用于根据所述概率分布、所述候选项目在重复行为模式下的得分、所述候选项目在探索行为模式下的得分,确定所述候选项目的最终得分;在所述最终得分满足预设要求时,向所述当前用户推荐所述候选项目。
7.一种基于重复搜索机制的项目推荐设备,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如权利要求1-5任意一项所述的一种基于重复搜索机制的项目推荐方法的步骤。
8.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时用于实现如权利要求1-5任意一项所述的一种基于重复搜索机制的项目推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910894851.8A CN110619082B (zh) | 2019-09-20 | 2019-09-20 | 一种基于重复搜索机制的项目推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910894851.8A CN110619082B (zh) | 2019-09-20 | 2019-09-20 | 一种基于重复搜索机制的项目推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110619082A true CN110619082A (zh) | 2019-12-27 |
CN110619082B CN110619082B (zh) | 2022-05-17 |
Family
ID=68923844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910894851.8A Active CN110619082B (zh) | 2019-09-20 | 2019-09-20 | 一种基于重复搜索机制的项目推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110619082B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111708876A (zh) * | 2020-06-16 | 2020-09-25 | 北京百度网讯科技有限公司 | 生成信息的方法和装置 |
CN111859160A (zh) * | 2020-08-07 | 2020-10-30 | 成都理工大学 | 一种基于图神经网络会话序列推荐方法及系统 |
CN111915216A (zh) * | 2020-08-14 | 2020-11-10 | 南京大学 | 基于二次注意力机制的开源软件项目开发人员推荐方法 |
CN112258262A (zh) * | 2020-09-15 | 2021-01-22 | 浙江大学 | 一种基于卷积自注意力网络的会话推荐方法 |
CN112381615A (zh) * | 2020-11-27 | 2021-02-19 | 华中科技大学 | 基于用户重复行为模式挖掘的短序列推荐方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080004989A1 (en) * | 2006-06-16 | 2008-01-03 | Yi Jin Y | Extrapolation of behavior-based associations to behavior-deficient items |
US20080294617A1 (en) * | 2007-05-22 | 2008-11-27 | Kushal Chakrabarti | Probabilistic Recommendation System |
CN107949843A (zh) * | 2015-09-04 | 2018-04-20 | 株式会社东芝 | 项目推荐系统、项目推荐方法以及程序 |
CN108205682A (zh) * | 2016-12-19 | 2018-06-26 | 同济大学 | 一种用于个性化推荐的融合内容和行为的协同过滤方法 |
CN109829775A (zh) * | 2018-12-03 | 2019-05-31 | 苏州大学 | 一种物品推荐方法、装置、设备及可读存储介质 |
CN110060097A (zh) * | 2019-04-01 | 2019-07-26 | 苏州市职业大学 | 基于注意力机制和卷积神经网络的用户行为序列推荐方法 |
CN110119467A (zh) * | 2019-05-14 | 2019-08-13 | 苏州大学 | 一种基于会话的项目推荐方法、装置、设备及存储介质 |
-
2019
- 2019-09-20 CN CN201910894851.8A patent/CN110619082B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080004989A1 (en) * | 2006-06-16 | 2008-01-03 | Yi Jin Y | Extrapolation of behavior-based associations to behavior-deficient items |
US20080294617A1 (en) * | 2007-05-22 | 2008-11-27 | Kushal Chakrabarti | Probabilistic Recommendation System |
CN107949843A (zh) * | 2015-09-04 | 2018-04-20 | 株式会社东芝 | 项目推荐系统、项目推荐方法以及程序 |
CN108205682A (zh) * | 2016-12-19 | 2018-06-26 | 同济大学 | 一种用于个性化推荐的融合内容和行为的协同过滤方法 |
CN109829775A (zh) * | 2018-12-03 | 2019-05-31 | 苏州大学 | 一种物品推荐方法、装置、设备及可读存储介质 |
CN110060097A (zh) * | 2019-04-01 | 2019-07-26 | 苏州市职业大学 | 基于注意力机制和卷积神经网络的用户行为序列推荐方法 |
CN110119467A (zh) * | 2019-05-14 | 2019-08-13 | 苏州大学 | 一种基于会话的项目推荐方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
刘洪伟: "基于用户浏览行为的兴趣识别管理模型", 《数据分析与知识发现》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111708876A (zh) * | 2020-06-16 | 2020-09-25 | 北京百度网讯科技有限公司 | 生成信息的方法和装置 |
CN111708876B (zh) * | 2020-06-16 | 2023-07-18 | 北京百度网讯科技有限公司 | 生成信息的方法和装置 |
CN111859160A (zh) * | 2020-08-07 | 2020-10-30 | 成都理工大学 | 一种基于图神经网络会话序列推荐方法及系统 |
CN111859160B (zh) * | 2020-08-07 | 2023-06-16 | 成都理工大学 | 一种基于图神经网络会话序列推荐方法及系统 |
CN111915216A (zh) * | 2020-08-14 | 2020-11-10 | 南京大学 | 基于二次注意力机制的开源软件项目开发人员推荐方法 |
CN111915216B (zh) * | 2020-08-14 | 2023-09-12 | 南京大学 | 基于二次注意力机制的开源软件项目开发人员推荐方法 |
CN112258262A (zh) * | 2020-09-15 | 2021-01-22 | 浙江大学 | 一种基于卷积自注意力网络的会话推荐方法 |
CN112258262B (zh) * | 2020-09-15 | 2023-09-26 | 浙江大学 | 一种基于卷积自注意力网络的会话推荐方法 |
CN112381615A (zh) * | 2020-11-27 | 2021-02-19 | 华中科技大学 | 基于用户重复行为模式挖掘的短序列推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110619082B (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110619082B (zh) | 一种基于重复搜索机制的项目推荐方法 | |
Tang et al. | # exploration: A study of count-based exploration for deep reinforcement learning | |
EP3992857A1 (en) | Method and device for generating neural network model, and computer-readable storage medium | |
CN109840154B (zh) | 一种移动云环境下基于任务依赖的计算迁移方法 | |
CN112085615B (zh) | 图神经网络的训练方法及装置 | |
CN112085172A (zh) | 图神经网络的训练方法及装置 | |
CN110235149B (zh) | 神经情节控制 | |
CN107818514B (zh) | 一种控制在线社交网络信息传播的方法、装置及终端 | |
CN116010684A (zh) | 物品推荐方法、装置及存储介质 | |
CN115905691B (zh) | 一种基于深度强化学习的偏好感知推荐方法 | |
CN113011471A (zh) | 一种社交群体的划分方法、划分系统及相关装置 | |
CN111767985B (zh) | 一种神经网络的训练方法、视频识别方法及装置 | |
CN111957053A (zh) | 游戏玩家匹配方法、装置、存储介质与电子设备 | |
CN114116995B (zh) | 基于增强图神经网络的会话推荐方法、系统及介质 | |
CN114493674A (zh) | 一种广告点击率预测模型及方法 | |
CN112131089A (zh) | 软件缺陷预测的方法、分类器、计算机设备及存储介质 | |
CN116975686A (zh) | 训练学生模型的方法、行为预测方法和装置 | |
CN116975434A (zh) | 内容推荐方法以及相关设备 | |
CN113409096B (zh) | 目标对象识别方法、装置、计算机设备及存储介质 | |
CN115438164A (zh) | 问答方法、系统、设备及存储介质 | |
CN115238134A (zh) | 用于生成图数据结构的图向量表示的方法及装置 | |
Du et al. | Optimization of the critical diameter and average path length of social networks | |
CN114528992A (zh) | 一种基于区块链的电子商务业务分析模型的训练方法 | |
CN111667028A (zh) | 一种可靠负样本确定方法和相关装置 | |
CN116957058A (zh) | 时空交通预测模型的对抗训练方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |