CN110858374A - 一种bpr中样本空间缩小方法及装置 - Google Patents
一种bpr中样本空间缩小方法及装置 Download PDFInfo
- Publication number
- CN110858374A CN110858374A CN201810961395.XA CN201810961395A CN110858374A CN 110858374 A CN110858374 A CN 110858374A CN 201810961395 A CN201810961395 A CN 201810961395A CN 110858374 A CN110858374 A CN 110858374A
- Authority
- CN
- China
- Prior art keywords
- negative sample
- user
- candidate set
- commodity
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000008569 process Effects 0.000 title claims abstract description 9
- 238000005070 sampling Methods 0.000 claims abstract description 43
- 238000000605 extraction Methods 0.000 claims description 35
- 230000009467 reduction Effects 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 15
- 230000003993 interaction Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种BPR中样本空间缩小方法及装置,所述方法包括:对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。本发明缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。
Description
技术领域
本发明属于推荐系统技术领域,更具体地,涉及一种BPR中样本空间缩小方法及装置。
背景技术
个性化排序是指给用户提供商品列表以供用户选择,也称为商品推荐。典型的例子是电商希望给用户个性化地推荐该用户可能购买过的商品排序列表。而在大多数应用场景下,这样的排序列表只能通过用户与商品之间隐式的反馈行为进行推断,如购买属于隐式反馈,而对商品的评分则属于显式反馈。隐式反馈推荐系统的特点是仅能观察到的用户的正反馈行为,如购买商品,而未观察到的行为,即一个用户未购买某样商品,则由真正的负反馈和缺失值组成,其中负反馈为用户实际上没有兴趣购买过的商品,缺失值为用户可能有兴趣购买,只是没有发现的商品。
商品推荐系统通常的做法是用分数预测用户u对商品i的喜好程度,通过使预测值与真实值xui之间的误差最小化,得到最优的分数将商品按照预测分数的高低进行排序,得到推荐列表,这种做法称为逐点回归推荐算法。为了在隐反馈系统中采用逐点回归的算法,需要将观测到的正反馈行为标记为正样本,如赋值为1,未观测的行为均标记为负样本,如赋值为0。之后用最小化均方根误差的方法进行数据拟合。这种不区分未观测行为的做法有明显的缺陷,如果一个模型能非常好的拟合训练数据,那么所有未观测行为均被预测为0,无法得到商品的排序列表;此外,通常观测到的数据只占很少一部分,如果将所有未观测到的用户-商品交互都标记为负样本,则会对算法效率提出很高的要求。
贝叶斯个性化排序(Bayesian Personalized Ranking,简称BPR)模型是代表性的逐对排序推荐算法,为了避免逐元素算法不区分未观测行为的弊端,BPR优化的目标不再是单个的预测分数而是不同反馈行为之间的排序。BPR假定观测到的正样本的预测分数应当高于未观测的样本预测分数,其优化目标如下:
其中,u代表用户,i代表该用户有正反馈交互行为的商品,j代表同一用户的未观测行为对应的商品,D代表了所有满足条件的(u,i,j)构成的集合;代表两种行为预测分数之差,为sigmoid函数,将差值转化为概率值;λθ‖θ‖2一项用于防止过拟合,θ代表模型参数,λθ控制过拟合程度。上述优化目标等效于优化排序结果的AUC(Area under The ROC Curve,ROC曲线下面积)参数。ROC(Receiver OperatingCharacteristic,受试者工作特征)曲线又称为感受性曲线,在ROC曲线上各点反应这相同的感受性,它们都是对同一信号刺激的反应。
为了获得用户u对某一商品i的喜好程度可以采用矩阵分解或k近邻的方式。通常采用随机梯度下降方法进行优化,在每一次迭代中,随机选取观测到的交互行为(u,i),再从用户u没有交互的商品中选择j构成训练样本(u,i,j)。选取j的过程,称为负采样器,BPR的性能很大程度上取决于负采样器。传统的BPR算法中,采用从负样本空间中均匀采样的方式选择负样本j,这种采样方式非常低效,而且会减缓收敛速度,尤其在样本空间大的数据集上。动态负采样器旨在通过选择预测分数较大的负样本,即使得loss函数偏大的负样本,在每一次迭代中获得较大的梯度,相比传统的BPR算法有了明显的提升,但是,这种采样方式仍然基于整个负样本空间,在样本数量较大时仍然十分低效。
发明内容
为克服上述现有的BPR模型基于整个负样本空间导致负样本的采样和商品推荐低效的问题或者至少部分地解决上述问题,本发明提供一种BPR中样本空间缩小方法及装置。
根据本发明的第一方面,提供一种BPR中样本空间缩小方法,包括:
对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
根据本发明第二方面提供一种BPR中样本空间缩小装置,包括:
获取模块,用于对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
缩小模块,用于根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
根据本发明的第三方面,提供一种电子设备,包括:
至少一个处理器、至少一个存储器和总线;其中,
所述处理器和存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前所述的方法。
根据本发明的第四方面,提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如前所述的方法。
本发明提供一种BPR中样本空间缩小方法及装置,该方法通过将用户没有购买过的商品作为负样本,根据各用户购买过的商品获取各用户对应的采样比例系数,根据采样比例系数从用户没有购买过的商品中按比例选取负样本,将选取的负样本的集合作为负样本空间,从而缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。
附图说明
图1为本发明实施例提供的BPR中样本空间缩小方法整体流程示意图;
图2为本发明实施例提供的BPR中样本空间缩小方法中基于缩小后的负样本空间更新BPR模型参数的流程示意图;
图3为本发明实施例提供的BPR中样本空间缩小装置整体结构示意图;
图4为本发明实施例提供的电子设备整体结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
在本发明的一个实施例中提供一种BPR中样本空间缩小方法,图1为本发明实施例提供的BPR中样本空间缩小方法整体流程示意图,该方法包括:S101,对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
其中,目标购物系统为需要进行商品推荐的购物系统。对于目标购物系统中的任一用户,将该用户购买过的商品作为正样本,将该用户对应的正样本的集合作为正样本空间,即发生用户正反馈的商品。目标购物系统的商品全集是指目标购物系统中的所有商品构成的集合。现有技术直接将目标购物系统的商品全集中除该用户购买过的商品以外的商品,即用户未购买过的商品作为负样本空间。负样本空间包括用户没有兴趣购买过的商品和用户可能有兴趣购买但没发现的商品。负样本空间中商品的数量一般很多,从而造成基于大负样本空间进行商品推荐的计算量很大,导致商品推荐的效率低。本实施例中将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本,将该用户对应的所有负样本的集合作为该用户对应的负样本候选集。即每个用户对应有一个负样本候选集。负样本候选集是指从中选取负样本构建负样本空间的商品集合。根据负采样比例系数从负样本候选集中按比例选取负样本作为负样本空间,从而使得负样本空间中商品的数量大大减小。负采样比例系数为从负样本候选集中选取商品的比例,通过用户购买过的商品获取。由于不同用户购买过的商品数量不同,购买商品越多,交互次数越多,在BPR的参数更新过程中被使用的次数越多,因此负样本空间也就越大。因此,负采样比例系数与用户购买过的商品有关。
S102,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
具体地,每个用户对应一个负采样比例系数,根据该用户对应的负采样比例系数从负样本候选集中按比例选取负样本,将选取的所有负样本作为一个负样本空间。每个用户对应一个负样本空间。负样本空间是指用于进行商品推荐的负样本的集合。
本实施例将用户没有购买过的商品作为负样本,根据各用户购买过的商品获取各用户对应的采样比例系数,根据采样比例系数从用户没有购买过的商品中按比例选取负样本,将选取的负样本的集合作为负样本空间,从而缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。
在上述实施例的基础上,本实施例中通过以下公式根据该用户购买过的商品获取该用户对应的负采样比例系数:
其中,αu为负采样比例系数,c为第一预设常数,|Su|为该用户购买过的商品的数量。
其中,c为预先设定的一个常数,用于控制负样本空间的缩小程度。本实施例中用户购买过的商品的数量|Su|越大,交互次数越大,在BPR的参数更新过程中被使用的次数越大,因此,负样本空间越大。负样本空间越大,需要使用更大的负采样比例系数αu,以从负样本候选集中选取更多的负样本构建负样本空间。可以采用均匀选取的方式从负样本候选集中选取负样本构建负样本空间。
本实施例考虑到不同用户购买过的商品数量不同,根据用户购买过的商品数量确定负采样比例系数,即从负样本候选集中选取负样本的比例,从而提高了负样本空间选取的精确性。
在上述实施例的基础上,本实施例中根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤具体包括:使用该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数,获取抽取个数;根据抽取个数,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
其中,从负样本候选集中抽取商品的个数,即该用户对应的负样本空间的大小等于该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数。
在上述实施例的基础上,本实施例中根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之前还包括:根据负样本候选集中各商品的购买数量,获取负样本候选集中各商品的流行程度;根据负样本候选集中各商品的流行程度,确定负样本候选集中各商品的抽取概率;相应地,根据抽取个数,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间的步骤还包括:根据抽取个数和负样本候选集中各商品的抽取概率,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
其中,负样本候选集中各商品的购买数量为负样本候选集中各商品被目标购物系统中所有用户购买过的总数量。商品的流行程度是指各商品是否畅销,为预先设定的多个等级,如非常流行、比较流行和不流行。根据负样本候选集中各商品的购买数量确定负样本候选集中各商品的流行程度。每个流行程度对应有一个预设概率。流行程度越高,流行程度对应的预设概率越大,被抽取的概率也就越大。本实施例中负样本空间的缩小范围由抽取个数和抽取概率共同决定。其中,抽取个数决定负样本空间的大小,抽取概率决定负样本空间的内容。
本实施例中考虑到商品的特殊性,不同商品的流行度不同,越流行的商品越有可能被购买,即越有可能成为正样本,从而越有可能出现没有兴趣购买过的情况,即作为负样本的概率越大,越有可能被抽取,本实施例提高了负样本空间选取的精确性。
在上述实施例的基础上,本实施例中根据负样本候选集中各商品的购买数量,获取负样本候选集中各商品的流行程度的步骤具体包括:将负样本候选集中各商品的购买数量与多个预设范围进行比较,获取负样本候选集中各商品的购买数量所落入的预设范围;根据各所落入的预设范围,获取各所落入的预设范围对应的流行程度;其中,所落入的预设范围与流行程度预先关联存储;相应地,根据负样本候选集中各商品的流行程度,确定负样本候选集中各商品的抽取概率的步骤具体包括:根据各流行程度,获取各流行程度对应的预设概率;其中,流行程度与预设概率预先关联存储;根据各流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率。
具体地,每个流行程度对应有一个预设范围,对于负样本候选集中的任一商品,将该商品的购买数量所落入的预设范围对应的流行程度作为该商品的流行程度。每个流行程度都对应有一个预设概率。根据负样本候选集中各商品对应的预设概率,确定负样本候选集中各商品的抽取概率。本实施例中根据负样本候选集中各商品的流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率,提高了负样本空间选取的精确性。
在上述实施例的基础上,本实施例中通过以下公式根据各流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率:
其中,Pnsi为负样本候选集中第i个商品nsi的抽取概率,为负样本候选集中第i个商品nsi的流行程度对应的预设概率,为负样本候选集中第k个商品nsk的流行程度对应的预设概率,N为负样本候选集中商品的总个数,a为第二预设常数。
本实施例实现对负样本候选集中各商品的流行程度对应的预设概率进行归一化,获取负样本候选集中各商品的抽取概率。
在上述实施例的基础上,本实施例中根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之后还包括:从预先获取的该用户的购买记录集合中随机选取购买记录,从该用户对应的负样本空间中随机选取商品;其中,各购买记录包括该用户和该用户购买过的任一商品;根据从该用户的购买记录集合中选取的购买记录和从该用户对应的负样本空间中选取的商品,构建该用户对应的训练样本;根据该用户对应的训练样本,对BPR模型中的参数进行更新。
其中,购买记录集合S={(u,i)|u∈U,i∈Su},其中,u为目标购物系统中的任一用户,i为用户u购买过的任一商品,U为目标购物系统中所有用户的集合,Su为用户u购买过的所有商品的集合。如图2所示,从预先获取的该用户的购买记录集合中随机选取购买记录(u,i),(v,k)为购买记录集合中的另一购买记录。从用户u对应的负样本空间Tu中随机选取商品j。根据购买记录(u,i)和商品j构建训练样本(u,i,j)。通过以下公式使用训练样本(u,i,j)对BPR模型中的参数θ进行更新:
其中,为更新后的参数,β为控制梯度下降幅度的参数,BPR-OPT为优化目标,代表用户u购买商品i的预测分数和用户u购买商品j预测分数之差,λθθ一项用于防止过拟合,θ代表模型参数,λθ控制过拟合程度。本实施例中在保证推荐性能的基础上使用缩小后的负样本空间进行BPR中模型参数的更新,更新速度快,使得模型参数更快收敛。
在本发明的另一个实施例中提供一种BPR中样本空间缩小装置,该装置用于实现前述各实施例中的方法。因此,在前述BPR中样本空间缩小方法的各实施例中的描述和定义,可以用于本发明实施例中各个执行模块的理解。图3为本发明实施例提供的BPR中样本空间缩小装置整体结构示意图,该装置包括获取模块301和缩小模块302;其中:
获取模块301用于对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;缩小模块302用于根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
在上述实施例的基础上,本实施例中获取模块通过以下公式根据该用户购买过的商品获取该用户对应的负采样比例系数:
其中,αu为负采样比例系数,c为第一预设常数,|Su|为该用户购买过的商品数量。
在上述实施例的基础上,本实施例中缩小模块包括抽取子模块和缩小子模块,其中:
抽取子模块用于使用该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数,获取抽取个数;缩小子模块用于根据抽取个数,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
在上述实施例的基础上,本实施例中还包括确定模块,用于根据负样本候选集中各商品的购买数量,获取负样本候选集中各商品的流行程度;根据负样本候选集中各商品的流行程度,确定负样本候选集中各商品的抽取概率;相应地,缩小子模块还用于:根据抽取个数和负样本候选集中各商品的抽取概率,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
在上述实施例的基础上,本实施例中确定模块具体用于:将负样本候选集中各商品的购买数量与多个预设范围进行比较,获取负样本候选集中各商品的购买数量所落入的预设范围;根据各所落入的预设范围,获取各所落入的预设范围对应的流行程度;其中,所落入的预设范围与流行程度预先关联存储;根据各流行程度,获取各流行程度对应的预设概率;其中,流行程度与预设概率预先关联存储;根据各流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率。
在上述实施例的基础上,本实施例中确定模块通过以下公式根据各流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率:
其中,Pnsi为负样本候选集中第i个商品nsi的抽取概率,为负样本候选集中第i个商品nsi的流行程度对应的预设概率,为负样本候选集中第k个商品nsk的流行程度对应的预设概率,N为负样本候选集中商品的总个数,a为第二预设常数。
在上述各实施例的基础上,本实施例中还包括更新模块,用于从预先获取的该用户的购买记录集合中随机选取购买记录,从该用户对应的负样本空间中随机选取商品;其中,各购买记录包括该用户和该用户购买过的任一商品;根据从该用户的购买记录集合中选取的购买记录和从该用户对应的负样本空间中选取的商品,构建该用户对应的训练样本;根据该用户对应的训练样本,对BPR模型中的参数进行更新。
本实施例通过将用户没有购买过的商品作为负样本,根据各用户购买过的商品获取各用户对应的采样比例系数,根据采样比例系数从用户没有购买过的商品中按比例选取负样本,将选取的负样本的集合作为负样本空间,从而缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。
本实施例提供一种电子设备,图4为本发明实施例提供的电子设备整体结构示意图,该设备包括:至少一个处理器401、至少一个存储器402和总线403;其中,
处理器401和存储器402通过总线403完成相互间的通信;
存储器402存储有可被处理器401执行的程序指令,处理器调用程序指令能够执行上述各方法实施例所提供的方法,例如包括:对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的电子设备实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种BPR中样本空间缩小方法,其特征在于,包括:
对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
3.根据权利要求1所述的方法,其特征在于,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤具体包括:
使用该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数,获取抽取个数;
根据所述抽取个数,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
4.根据权利要求3所述的方法,其特征在于,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之前还包括:
根据所述负样本候选集中各商品的购买数量,获取所述负样本候选集中各商品的流行程度;
根据所述负样本候选集中各商品的流行程度,确定所述负样本候选集中各商品的抽取概率;
相应地,根据所述抽取个数,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间的步骤还包括:
根据所述抽取个数和所述负样本候选集中各商品的抽取概率,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
5.根据权利要求4所述的方法,其特征在于,根据所述负样本候选集中各商品的购买数量,获取所述负样本候选集中各商品的流行程度的步骤具体包括:
将所述负样本候选集中各商品的购买数量与多个预设范围进行比较,获取所述负样本候选集中各商品的购买数量所落入的预设范围;
根据各所述所落入的预设范围,获取各所述所落入的预设范围对应的流行程度;其中,所述所落入的预设范围与所述流行程度预先关联存储;
相应地,根据所述负样本候选集中各商品的流行程度,确定所述负样本候选集中各商品的抽取概率的步骤具体包括:
根据各所述流行程度,获取各所述流行程度对应的预设概率;其中,所述流行程度与所述预设概率预先关联存储;
根据各所述流行程度对应的预设概率,确定所述负样本候选集中各商品的抽取概率。
7.根据权利要求1-6任一所述的方法,其特征在于,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之后还包括:
从预先获取的该用户的购买记录集合中随机选取购买记录,从该用户对应的负样本空间中随机选取商品;其中,各购买记录包括该用户和该用户购买过的任一商品;
根据从该用户的购买记录集合中选取的购买记录和从该用户对应的负样本空间中选取的商品,构建该用户对应的训练样本;
根据该用户对应的训练样本,对BPR模型中的参数进行更新。
8.一种BPR中样本空间缩小装置,其特征在于,包括:
获取模块,用于对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
缩小模块,用于根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
9.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器和总线;其中,
所述处理器和存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810961395.XA CN110858374B (zh) | 2018-08-22 | 2018-08-22 | 一种bpr中样本空间缩小方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810961395.XA CN110858374B (zh) | 2018-08-22 | 2018-08-22 | 一种bpr中样本空间缩小方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110858374A true CN110858374A (zh) | 2020-03-03 |
CN110858374B CN110858374B (zh) | 2022-07-08 |
Family
ID=69634953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810961395.XA Active CN110858374B (zh) | 2018-08-22 | 2018-08-22 | 一种bpr中样本空间缩小方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110858374B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150278907A1 (en) * | 2014-03-27 | 2015-10-01 | Microsoft Corporation | User Inactivity Aware Recommendation System |
CN105740327A (zh) * | 2016-01-22 | 2016-07-06 | 天津中科智能识别产业技术研究院有限公司 | 一种基于用户偏好的自适应采样方法 |
CN106127546A (zh) * | 2016-06-20 | 2016-11-16 | 重庆房慧科技有限公司 | 一种基于智慧社区大数据的商品推荐方法 |
US20170132516A1 (en) * | 2015-11-05 | 2017-05-11 | Adobe Systems Incorporated | Adaptive sampling scheme for imbalanced large scale data |
CN106934071A (zh) * | 2017-04-27 | 2017-07-07 | 北京大学 | 基于异构信息网络和贝叶斯个性化排序的推荐方法及装置 |
-
2018
- 2018-08-22 CN CN201810961395.XA patent/CN110858374B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150278907A1 (en) * | 2014-03-27 | 2015-10-01 | Microsoft Corporation | User Inactivity Aware Recommendation System |
US20170132516A1 (en) * | 2015-11-05 | 2017-05-11 | Adobe Systems Incorporated | Adaptive sampling scheme for imbalanced large scale data |
CN105740327A (zh) * | 2016-01-22 | 2016-07-06 | 天津中科智能识别产业技术研究院有限公司 | 一种基于用户偏好的自适应采样方法 |
CN106127546A (zh) * | 2016-06-20 | 2016-11-16 | 重庆房慧科技有限公司 | 一种基于智慧社区大数据的商品推荐方法 |
CN106934071A (zh) * | 2017-04-27 | 2017-07-07 | 北京大学 | 基于异构信息网络和贝叶斯个性化排序的推荐方法及装置 |
Non-Patent Citations (5)
Title |
---|
DINGJINGTAO ET AL.: ""An Improved Sampler for Bayesian Personalized Ranking by Leveraging View Data"", 《COMPANION PROCEEDINGS OF THE WORLD WIDE WEB CONFERENCE 2018 (WWW 2018)》 * |
何慧: "基于Ranking的贝叶斯序列推荐算法", 《小型微型计算机系统》 * |
屠佳琪: ""基于内容和用户偏好学习的个性化商品推荐模型"", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑(月刊)》 * |
张航 等: "一种负样本改进的LDA主题模型推荐算法", 《中国计量大学学报》 * |
陆艺 等: "面向隐式反馈的推荐系统研究现状与趋势", 《计算机科学》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110858374B (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109087178B (zh) | 商品推荐方法和装置 | |
CN109102127B (zh) | 商品推荐方法及装置 | |
US10958748B2 (en) | Resource push method and apparatus | |
CN107563841B (zh) | 一种基于用户评分分解的推荐系统 | |
CN110717098B (zh) | 基于元路径的上下文感知用户建模方法、序列推荐方法 | |
US11100421B2 (en) | Customized website predictions for machine-learning systems | |
CN110969516A (zh) | 一种商品推荐方法及装置 | |
CN112085172B (zh) | 图神经网络的训练方法及装置 | |
CN110135951B (zh) | 游戏商品的推荐方法、装置及可读存储介质 | |
US10366092B2 (en) | Search relevance | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
US20190266619A1 (en) | Behavior pattern search system and behavior pattern search method | |
CN105159910A (zh) | 信息推荐方法和装置 | |
CN110598120A (zh) | 基于行为数据的理财推荐方法及装置、设备 | |
WO2020221022A1 (zh) | 业务对象推荐方法 | |
WO2020220692A1 (zh) | 深度神经网络及其训练 | |
CN110598084A (zh) | 对象排序方法、商品排序方法、装置及电子设备 | |
CN111680213B (zh) | 信息推荐方法、数据处理方法及装置 | |
CN110956511A (zh) | 商品推荐方法、装置、设备与计算机可读存储介质 | |
WO2020150163A1 (en) | Encoding textual data for personalized inventory management | |
US9201968B2 (en) | System and method for finding mood-dependent top selling/rated lists | |
US8577814B1 (en) | System and method for genetic creation of a rule set for duplicate detection | |
CN113836388B (zh) | 信息推荐方法、装置、服务器及存储介质 | |
CN115587875B (zh) | 基于均衡感知注意力网络的纺织品电商推荐方法及装置 | |
CN110858374B (zh) | 一种bpr中样本空间缩小方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20200303 Assignee: INSTITUTE FOR ELECTRONICS AND INFORMATION TECHNOLOGY IN TIANJIN, TSINGHUA University Assignor: TSINGHUA University Contract record no.: X2023110000009 Denomination of invention: A method and device for reducing sample space in BPR Granted publication date: 20220708 License type: Common License Record date: 20230112 |
|
EE01 | Entry into force of recordation of patent licensing contract |