CN110858374A - 一种bpr中样本空间缩小方法及装置 - Google Patents

一种bpr中样本空间缩小方法及装置 Download PDF

Info

Publication number
CN110858374A
CN110858374A CN201810961395.XA CN201810961395A CN110858374A CN 110858374 A CN110858374 A CN 110858374A CN 201810961395 A CN201810961395 A CN 201810961395A CN 110858374 A CN110858374 A CN 110858374A
Authority
CN
China
Prior art keywords
negative sample
user
candidate set
commodity
negative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810961395.XA
Other languages
English (en)
Other versions
CN110858374B (zh
Inventor
金德鹏
丁璟韬
李勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201810961395.XA priority Critical patent/CN110858374B/zh
Publication of CN110858374A publication Critical patent/CN110858374A/zh
Application granted granted Critical
Publication of CN110858374B publication Critical patent/CN110858374B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种BPR中样本空间缩小方法及装置,所述方法包括:对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。本发明缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。

Description

一种BPR中样本空间缩小方法及装置
技术领域
本发明属于推荐系统技术领域,更具体地,涉及一种BPR中样本空间缩小方法及装置。
背景技术
个性化排序是指给用户提供商品列表以供用户选择,也称为商品推荐。典型的例子是电商希望给用户个性化地推荐该用户可能购买过的商品排序列表。而在大多数应用场景下,这样的排序列表只能通过用户与商品之间隐式的反馈行为进行推断,如购买属于隐式反馈,而对商品的评分则属于显式反馈。隐式反馈推荐系统的特点是仅能观察到的用户的正反馈行为,如购买商品,而未观察到的行为,即一个用户未购买某样商品,则由真正的负反馈和缺失值组成,其中负反馈为用户实际上没有兴趣购买过的商品,缺失值为用户可能有兴趣购买,只是没有发现的商品。
商品推荐系统通常的做法是用分数
Figure BDA0001773889920000011
预测用户u对商品i的喜好程度,通过使预测值
Figure BDA0001773889920000012
与真实值xui之间的误差最小化,得到最优的分数
Figure BDA0001773889920000013
将商品按照预测分数的高低进行排序,得到推荐列表,这种做法称为逐点回归推荐算法。为了在隐反馈系统中采用逐点回归的算法,需要将观测到的正反馈行为标记为正样本,如赋值为1,未观测的行为均标记为负样本,如赋值为0。之后用最小化均方根误差的方法进行数据拟合。这种不区分未观测行为的做法有明显的缺陷,如果一个模型能非常好的拟合训练数据,那么所有未观测行为均被预测为0,无法得到商品的排序列表;此外,通常观测到的数据只占很少一部分,如果将所有未观测到的用户-商品交互都标记为负样本,则会对算法效率提出很高的要求。
贝叶斯个性化排序(Bayesian Personalized Ranking,简称BPR)模型是代表性的逐对排序推荐算法,为了避免逐元素算法不区分未观测行为的弊端,BPR优化的目标不再是单个的预测分数
Figure BDA0001773889920000021
而是不同反馈行为之间的排序。BPR假定观测到的正样本的预测分数应当高于未观测的样本预测分数,其优化目标如下:
其中,u代表用户,i代表该用户有正反馈交互行为的商品,j代表同一用户的未观测行为对应的商品,D代表了所有满足条件的(u,i,j)构成的集合;
Figure BDA0001773889920000023
代表两种行为预测分数之差,
Figure BDA0001773889920000024
为sigmoid函数,将差值转化为概率值;λθ‖θ‖2一项用于防止过拟合,θ代表模型参数,λθ控制过拟合程度。上述优化目标等效于优化排序结果的AUC(Area under The ROC Curve,ROC曲线下面积)参数。ROC(Receiver OperatingCharacteristic,受试者工作特征)曲线又称为感受性曲线,在ROC曲线上各点反应这相同的感受性,它们都是对同一信号刺激的反应。
为了获得用户u对某一商品i的喜好程度可以采用矩阵分解或k近邻的方式。通常采用随机梯度下降方法进行优化,在每一次迭代中,随机选取观测到的交互行为(u,i),再从用户u没有交互的商品中选择j构成训练样本(u,i,j)。选取j的过程,称为负采样器,BPR的性能很大程度上取决于负采样器。传统的BPR算法中,采用从负样本空间中均匀采样的方式选择负样本j,这种采样方式非常低效,而且会减缓收敛速度,尤其在样本空间大的数据集上。动态负采样器旨在通过选择预测分数较大的负样本,即使得loss函数偏大的负样本,在每一次迭代中获得较大的梯度,相比传统的BPR算法有了明显的提升,但是,这种采样方式仍然基于整个负样本空间,在样本数量较大时仍然十分低效。
发明内容
为克服上述现有的BPR模型基于整个负样本空间导致负样本的采样和商品推荐低效的问题或者至少部分地解决上述问题,本发明提供一种BPR中样本空间缩小方法及装置。
根据本发明的第一方面,提供一种BPR中样本空间缩小方法,包括:
对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
根据本发明第二方面提供一种BPR中样本空间缩小装置,包括:
获取模块,用于对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
缩小模块,用于根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
根据本发明的第三方面,提供一种电子设备,包括:
至少一个处理器、至少一个存储器和总线;其中,
所述处理器和存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前所述的方法。
根据本发明的第四方面,提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如前所述的方法。
本发明提供一种BPR中样本空间缩小方法及装置,该方法通过将用户没有购买过的商品作为负样本,根据各用户购买过的商品获取各用户对应的采样比例系数,根据采样比例系数从用户没有购买过的商品中按比例选取负样本,将选取的负样本的集合作为负样本空间,从而缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。
附图说明
图1为本发明实施例提供的BPR中样本空间缩小方法整体流程示意图;
图2为本发明实施例提供的BPR中样本空间缩小方法中基于缩小后的负样本空间更新BPR模型参数的流程示意图;
图3为本发明实施例提供的BPR中样本空间缩小装置整体结构示意图;
图4为本发明实施例提供的电子设备整体结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
在本发明的一个实施例中提供一种BPR中样本空间缩小方法,图1为本发明实施例提供的BPR中样本空间缩小方法整体流程示意图,该方法包括:S101,对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
其中,目标购物系统为需要进行商品推荐的购物系统。对于目标购物系统中的任一用户,将该用户购买过的商品作为正样本,将该用户对应的正样本的集合作为正样本空间,即发生用户正反馈的商品。目标购物系统的商品全集是指目标购物系统中的所有商品构成的集合。现有技术直接将目标购物系统的商品全集中除该用户购买过的商品以外的商品,即用户未购买过的商品作为负样本空间。负样本空间包括用户没有兴趣购买过的商品和用户可能有兴趣购买但没发现的商品。负样本空间中商品的数量一般很多,从而造成基于大负样本空间进行商品推荐的计算量很大,导致商品推荐的效率低。本实施例中将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本,将该用户对应的所有负样本的集合作为该用户对应的负样本候选集。即每个用户对应有一个负样本候选集。负样本候选集是指从中选取负样本构建负样本空间的商品集合。根据负采样比例系数从负样本候选集中按比例选取负样本作为负样本空间,从而使得负样本空间中商品的数量大大减小。负采样比例系数为从负样本候选集中选取商品的比例,通过用户购买过的商品获取。由于不同用户购买过的商品数量不同,购买商品越多,交互次数越多,在BPR的参数更新过程中被使用的次数越多,因此负样本空间也就越大。因此,负采样比例系数与用户购买过的商品有关。
S102,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
具体地,每个用户对应一个负采样比例系数,根据该用户对应的负采样比例系数从负样本候选集中按比例选取负样本,将选取的所有负样本作为一个负样本空间。每个用户对应一个负样本空间。负样本空间是指用于进行商品推荐的负样本的集合。
本实施例将用户没有购买过的商品作为负样本,根据各用户购买过的商品获取各用户对应的采样比例系数,根据采样比例系数从用户没有购买过的商品中按比例选取负样本,将选取的负样本的集合作为负样本空间,从而缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。
在上述实施例的基础上,本实施例中通过以下公式根据该用户购买过的商品获取该用户对应的负采样比例系数:
Figure BDA0001773889920000051
其中,αu为负采样比例系数,c为第一预设常数,|Su|为该用户购买过的商品的数量。
其中,c为预先设定的一个常数,用于控制负样本空间的缩小程度。本实施例中用户购买过的商品的数量|Su|越大,交互次数越大,在BPR的参数更新过程中被使用的次数越大,因此,负样本空间越大。负样本空间越大,需要使用更大的负采样比例系数αu,以从负样本候选集中选取更多的负样本构建负样本空间。可以采用均匀选取的方式从负样本候选集中选取负样本构建负样本空间。
本实施例考虑到不同用户购买过的商品数量不同,根据用户购买过的商品数量确定负采样比例系数,即从负样本候选集中选取负样本的比例,从而提高了负样本空间选取的精确性。
在上述实施例的基础上,本实施例中根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤具体包括:使用该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数,获取抽取个数;根据抽取个数,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
其中,从负样本候选集中抽取商品的个数,即该用户对应的负样本空间的大小等于该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数。
在上述实施例的基础上,本实施例中根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之前还包括:根据负样本候选集中各商品的购买数量,获取负样本候选集中各商品的流行程度;根据负样本候选集中各商品的流行程度,确定负样本候选集中各商品的抽取概率;相应地,根据抽取个数,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间的步骤还包括:根据抽取个数和负样本候选集中各商品的抽取概率,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
其中,负样本候选集中各商品的购买数量为负样本候选集中各商品被目标购物系统中所有用户购买过的总数量。商品的流行程度是指各商品是否畅销,为预先设定的多个等级,如非常流行、比较流行和不流行。根据负样本候选集中各商品的购买数量确定负样本候选集中各商品的流行程度。每个流行程度对应有一个预设概率。流行程度越高,流行程度对应的预设概率越大,被抽取的概率也就越大。本实施例中负样本空间的缩小范围由抽取个数和抽取概率共同决定。其中,抽取个数决定负样本空间的大小,抽取概率决定负样本空间的内容。
本实施例中考虑到商品的特殊性,不同商品的流行度不同,越流行的商品越有可能被购买,即越有可能成为正样本,从而越有可能出现没有兴趣购买过的情况,即作为负样本的概率越大,越有可能被抽取,本实施例提高了负样本空间选取的精确性。
在上述实施例的基础上,本实施例中根据负样本候选集中各商品的购买数量,获取负样本候选集中各商品的流行程度的步骤具体包括:将负样本候选集中各商品的购买数量与多个预设范围进行比较,获取负样本候选集中各商品的购买数量所落入的预设范围;根据各所落入的预设范围,获取各所落入的预设范围对应的流行程度;其中,所落入的预设范围与流行程度预先关联存储;相应地,根据负样本候选集中各商品的流行程度,确定负样本候选集中各商品的抽取概率的步骤具体包括:根据各流行程度,获取各流行程度对应的预设概率;其中,流行程度与预设概率预先关联存储;根据各流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率。
具体地,每个流行程度对应有一个预设范围,对于负样本候选集中的任一商品,将该商品的购买数量所落入的预设范围对应的流行程度作为该商品的流行程度。每个流行程度都对应有一个预设概率。根据负样本候选集中各商品对应的预设概率,确定负样本候选集中各商品的抽取概率。本实施例中根据负样本候选集中各商品的流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率,提高了负样本空间选取的精确性。
在上述实施例的基础上,本实施例中通过以下公式根据各流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率:
Figure BDA0001773889920000081
其中,Pnsi为负样本候选集中第i个商品nsi的抽取概率,
Figure BDA0001773889920000082
为负样本候选集中第i个商品nsi的流行程度对应的预设概率,
Figure BDA0001773889920000083
为负样本候选集中第k个商品nsk的流行程度对应的预设概率,N为负样本候选集中商品的总个数,a为第二预设常数。
本实施例实现对负样本候选集中各商品的流行程度对应的预设概率进行归一化,获取负样本候选集中各商品的抽取概率。
在上述实施例的基础上,本实施例中根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之后还包括:从预先获取的该用户的购买记录集合中随机选取购买记录,从该用户对应的负样本空间中随机选取商品;其中,各购买记录包括该用户和该用户购买过的任一商品;根据从该用户的购买记录集合中选取的购买记录和从该用户对应的负样本空间中选取的商品,构建该用户对应的训练样本;根据该用户对应的训练样本,对BPR模型中的参数进行更新。
其中,购买记录集合S={(u,i)|u∈U,i∈Su},其中,u为目标购物系统中的任一用户,i为用户u购买过的任一商品,U为目标购物系统中所有用户的集合,Su为用户u购买过的所有商品的集合。如图2所示,从预先获取的该用户的购买记录集合中随机选取购买记录(u,i),(v,k)为购买记录集合中的另一购买记录。从用户u对应的负样本空间Tu中随机选取商品j。根据购买记录(u,i)和商品j构建训练样本(u,i,j)。通过以下公式使用训练样本(u,i,j)对BPR模型中的参数θ进行更新:
Figure BDA0001773889920000084
其中,为更新后的参数,β为控制梯度下降幅度的参数,BPR-OPT为优化目标,
Figure BDA0001773889920000092
代表用户u购买商品i的预测分数
Figure BDA0001773889920000093
和用户u购买商品j预测分数
Figure BDA0001773889920000094
之差,λθθ一项用于防止过拟合,θ代表模型参数,λθ控制过拟合程度。本实施例中在保证推荐性能的基础上使用缩小后的负样本空间进行BPR中模型参数的更新,更新速度快,使得模型参数更快收敛。
在本发明的另一个实施例中提供一种BPR中样本空间缩小装置,该装置用于实现前述各实施例中的方法。因此,在前述BPR中样本空间缩小方法的各实施例中的描述和定义,可以用于本发明实施例中各个执行模块的理解。图3为本发明实施例提供的BPR中样本空间缩小装置整体结构示意图,该装置包括获取模块301和缩小模块302;其中:
获取模块301用于对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;缩小模块302用于根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
在上述实施例的基础上,本实施例中获取模块通过以下公式根据该用户购买过的商品获取该用户对应的负采样比例系数:
其中,αu为负采样比例系数,c为第一预设常数,|Su|为该用户购买过的商品数量。
在上述实施例的基础上,本实施例中缩小模块包括抽取子模块和缩小子模块,其中:
抽取子模块用于使用该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数,获取抽取个数;缩小子模块用于根据抽取个数,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
在上述实施例的基础上,本实施例中还包括确定模块,用于根据负样本候选集中各商品的购买数量,获取负样本候选集中各商品的流行程度;根据负样本候选集中各商品的流行程度,确定负样本候选集中各商品的抽取概率;相应地,缩小子模块还用于:根据抽取个数和负样本候选集中各商品的抽取概率,从负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
在上述实施例的基础上,本实施例中确定模块具体用于:将负样本候选集中各商品的购买数量与多个预设范围进行比较,获取负样本候选集中各商品的购买数量所落入的预设范围;根据各所落入的预设范围,获取各所落入的预设范围对应的流行程度;其中,所落入的预设范围与流行程度预先关联存储;根据各流行程度,获取各流行程度对应的预设概率;其中,流行程度与预设概率预先关联存储;根据各流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率。
在上述实施例的基础上,本实施例中确定模块通过以下公式根据各流行程度对应的预设概率,确定负样本候选集中各商品的抽取概率:
Figure BDA0001773889920000101
其中,Pnsi为负样本候选集中第i个商品nsi的抽取概率,
Figure BDA0001773889920000102
为负样本候选集中第i个商品nsi的流行程度对应的预设概率,
Figure BDA0001773889920000103
为负样本候选集中第k个商品nsk的流行程度对应的预设概率,N为负样本候选集中商品的总个数,a为第二预设常数。
在上述各实施例的基础上,本实施例中还包括更新模块,用于从预先获取的该用户的购买记录集合中随机选取购买记录,从该用户对应的负样本空间中随机选取商品;其中,各购买记录包括该用户和该用户购买过的任一商品;根据从该用户的购买记录集合中选取的购买记录和从该用户对应的负样本空间中选取的商品,构建该用户对应的训练样本;根据该用户对应的训练样本,对BPR模型中的参数进行更新。
本实施例通过将用户没有购买过的商品作为负样本,根据各用户购买过的商品获取各用户对应的采样比例系数,根据采样比例系数从用户没有购买过的商品中按比例选取负样本,将选取的负样本的集合作为负样本空间,从而缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。
本实施例提供一种电子设备,图4为本发明实施例提供的电子设备整体结构示意图,该设备包括:至少一个处理器401、至少一个存储器402和总线403;其中,
处理器401和存储器402通过总线403完成相互间的通信;
存储器402存储有可被处理器401执行的程序指令,处理器调用程序指令能够执行上述各方法实施例所提供的方法,例如包括:对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的电子设备实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种BPR中样本空间缩小方法,其特征在于,包括:
对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
2.根据权利要求1所述的方法,其特征在于,通过以下公式根据该用户购买过的商品获取该用户对应的负采样比例系数:
Figure FDA0001773889910000011
其中,αu为负采样比例系数,c为第一预设常数,|Su|为该用户购买过的商品数量。
3.根据权利要求1所述的方法,其特征在于,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤具体包括:
使用该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数,获取抽取个数;
根据所述抽取个数,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
4.根据权利要求3所述的方法,其特征在于,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之前还包括:
根据所述负样本候选集中各商品的购买数量,获取所述负样本候选集中各商品的流行程度;
根据所述负样本候选集中各商品的流行程度,确定所述负样本候选集中各商品的抽取概率;
相应地,根据所述抽取个数,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间的步骤还包括:
根据所述抽取个数和所述负样本候选集中各商品的抽取概率,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
5.根据权利要求4所述的方法,其特征在于,根据所述负样本候选集中各商品的购买数量,获取所述负样本候选集中各商品的流行程度的步骤具体包括:
将所述负样本候选集中各商品的购买数量与多个预设范围进行比较,获取所述负样本候选集中各商品的购买数量所落入的预设范围;
根据各所述所落入的预设范围,获取各所述所落入的预设范围对应的流行程度;其中,所述所落入的预设范围与所述流行程度预先关联存储;
相应地,根据所述负样本候选集中各商品的流行程度,确定所述负样本候选集中各商品的抽取概率的步骤具体包括:
根据各所述流行程度,获取各所述流行程度对应的预设概率;其中,所述流行程度与所述预设概率预先关联存储;
根据各所述流行程度对应的预设概率,确定所述负样本候选集中各商品的抽取概率。
6.根据权利要求5所述的方法,其特征在于,通过以下公式根据各所述流行程度对应的预设概率,确定所述负样本候选集中各商品的抽取概率:
Figure FDA0001773889910000021
其中,Pnsi为所述负样本候选集中第i个商品nsi的抽取概率,
Figure FDA0001773889910000022
为所述负样本候选集中第i个商品nsi的流行程度对应的预设概率,
Figure FDA0001773889910000031
为所述负样本候选集中第k个商品nsk的流行程度对应的预设概率,N为所述负样本候选集中商品的总个数,a为第二预设常数。
7.根据权利要求1-6任一所述的方法,其特征在于,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之后还包括:
从预先获取的该用户的购买记录集合中随机选取购买记录,从该用户对应的负样本空间中随机选取商品;其中,各购买记录包括该用户和该用户购买过的任一商品;
根据从该用户的购买记录集合中选取的购买记录和从该用户对应的负样本空间中选取的商品,构建该用户对应的训练样本;
根据该用户对应的训练样本,对BPR模型中的参数进行更新。
8.一种BPR中样本空间缩小装置,其特征在于,包括:
获取模块,用于对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;
缩小模块,用于根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。
9.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器和总线;其中,
所述处理器和存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7任一所述的方法。
CN201810961395.XA 2018-08-22 2018-08-22 一种bpr中样本空间缩小方法及装置 Active CN110858374B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810961395.XA CN110858374B (zh) 2018-08-22 2018-08-22 一种bpr中样本空间缩小方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810961395.XA CN110858374B (zh) 2018-08-22 2018-08-22 一种bpr中样本空间缩小方法及装置

Publications (2)

Publication Number Publication Date
CN110858374A true CN110858374A (zh) 2020-03-03
CN110858374B CN110858374B (zh) 2022-07-08

Family

ID=69634953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810961395.XA Active CN110858374B (zh) 2018-08-22 2018-08-22 一种bpr中样本空间缩小方法及装置

Country Status (1)

Country Link
CN (1) CN110858374B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150278907A1 (en) * 2014-03-27 2015-10-01 Microsoft Corporation User Inactivity Aware Recommendation System
CN105740327A (zh) * 2016-01-22 2016-07-06 天津中科智能识别产业技术研究院有限公司 一种基于用户偏好的自适应采样方法
CN106127546A (zh) * 2016-06-20 2016-11-16 重庆房慧科技有限公司 一种基于智慧社区大数据的商品推荐方法
US20170132516A1 (en) * 2015-11-05 2017-05-11 Adobe Systems Incorporated Adaptive sampling scheme for imbalanced large scale data
CN106934071A (zh) * 2017-04-27 2017-07-07 北京大学 基于异构信息网络和贝叶斯个性化排序的推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150278907A1 (en) * 2014-03-27 2015-10-01 Microsoft Corporation User Inactivity Aware Recommendation System
US20170132516A1 (en) * 2015-11-05 2017-05-11 Adobe Systems Incorporated Adaptive sampling scheme for imbalanced large scale data
CN105740327A (zh) * 2016-01-22 2016-07-06 天津中科智能识别产业技术研究院有限公司 一种基于用户偏好的自适应采样方法
CN106127546A (zh) * 2016-06-20 2016-11-16 重庆房慧科技有限公司 一种基于智慧社区大数据的商品推荐方法
CN106934071A (zh) * 2017-04-27 2017-07-07 北京大学 基于异构信息网络和贝叶斯个性化排序的推荐方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DINGJINGTAO ET AL.: ""An Improved Sampler for Bayesian Personalized Ranking by Leveraging View Data"", 《COMPANION PROCEEDINGS OF THE WORLD WIDE WEB CONFERENCE 2018 (WWW 2018)》 *
何慧: "基于Ranking的贝叶斯序列推荐算法", 《小型微型计算机系统》 *
屠佳琪: ""基于内容和用户偏好学习的个性化商品推荐模型"", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑(月刊)》 *
张航 等: "一种负样本改进的LDA主题模型推荐算法", 《中国计量大学学报》 *
陆艺 等: "面向隐式反馈的推荐系统研究现状与趋势", 《计算机科学》 *

Also Published As

Publication number Publication date
CN110858374B (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
CN109087178B (zh) 商品推荐方法和装置
CN109102127B (zh) 商品推荐方法及装置
US10958748B2 (en) Resource push method and apparatus
CN107563841B (zh) 一种基于用户评分分解的推荐系统
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
US11100421B2 (en) Customized website predictions for machine-learning systems
CN110969516A (zh) 一种商品推荐方法及装置
CN112085172B (zh) 图神经网络的训练方法及装置
CN110135951B (zh) 游戏商品的推荐方法、装置及可读存储介质
US10366092B2 (en) Search relevance
CN110008397B (zh) 一种推荐模型训练方法及装置
US20190266619A1 (en) Behavior pattern search system and behavior pattern search method
CN105159910A (zh) 信息推荐方法和装置
CN110598120A (zh) 基于行为数据的理财推荐方法及装置、设备
WO2020221022A1 (zh) 业务对象推荐方法
WO2020220692A1 (zh) 深度神经网络及其训练
CN110598084A (zh) 对象排序方法、商品排序方法、装置及电子设备
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN110956511A (zh) 商品推荐方法、装置、设备与计算机可读存储介质
WO2020150163A1 (en) Encoding textual data for personalized inventory management
US9201968B2 (en) System and method for finding mood-dependent top selling/rated lists
US8577814B1 (en) System and method for genetic creation of a rule set for duplicate detection
CN113836388B (zh) 信息推荐方法、装置、服务器及存储介质
CN115587875B (zh) 基于均衡感知注意力网络的纺织品电商推荐方法及装置
CN110858374B (zh) 一种bpr中样本空间缩小方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200303

Assignee: INSTITUTE FOR ELECTRONICS AND INFORMATION TECHNOLOGY IN TIANJIN, TSINGHUA University

Assignor: TSINGHUA University

Contract record no.: X2023110000009

Denomination of invention: A method and device for reducing sample space in BPR

Granted publication date: 20220708

License type: Common License

Record date: 20230112

EE01 Entry into force of recordation of patent licensing contract