CN110210944A - 联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统 - Google Patents

联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统 Download PDF

Info

Publication number
CN110210944A
CN110210944A CN201910485773.6A CN201910485773A CN110210944A CN 110210944 A CN110210944 A CN 110210944A CN 201910485773 A CN201910485773 A CN 201910485773A CN 110210944 A CN110210944 A CN 110210944A
Authority
CN
China
Prior art keywords
model
sampling
bayesian
factor
commodity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910485773.6A
Other languages
English (en)
Other versions
CN110210944B (zh
Inventor
杨振宇
张鸣鸽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN201910485773.6A priority Critical patent/CN110210944B/zh
Publication of CN110210944A publication Critical patent/CN110210944A/zh
Application granted granted Critical
Publication of CN110210944B publication Critical patent/CN110210944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Abstract

本公开提供了联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统。其中,多任务推荐方法包括:构建并行运行的嵌入潜在先验因子的贝叶斯模型以及嵌入平衡因子的采样模型;确定推荐商品的总数量以及嵌入潜在先验因子的贝叶斯模型和嵌入平衡因子的采样模型分别推荐商品的数量与推荐商品的总数量的占比;将从特定用户购物行为数据集中挖掘出的相应负序列模式输入至嵌入潜在先验因子的贝叶斯模型,按照概率大小顺序推荐相应数量的商品给特定用户;同时,利用嵌入平衡因子的采样模型对所有用户购物行为数据集进行采样,推荐相应数量的商品给特定用户。

Description

联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统
技术领域
本公开属于商品推荐领域,尤其涉及一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
对于用户购物行为数据的分析领域中,序列模式对于用户的行为分析的确可以达到很好的效果,并且可解释性强。但是大多数序列模式的应用仅关注用户的正向动作,如某用户分别购买了香蕉、苹果、鸭梨,对于用户的负向动作,如用户购买了香蕉、篮球、苹果的关注则表现出较低的关注度。但是在现实生活中,负序列的应用和参考价值并不低于正序列。当用户产生的显式反馈不足时,负序列模式挖掘往往能给我们提供更多的隐式反馈。而对于不同用户,每个用户购物行为数据大量增加,数据量的增大导致数据分析过程中存在算力不足的弊病。
发明人发现,日渐兴起的深度学习似乎可以解决上述问题,神经网络对于大数据的处理表现出了优秀的计算能力,在特征提取上也表现的非常优秀。但与此同时,无法绕开的一点就是,神经网络模型就像是一个“黑盒子”,虽然表现优秀,但是其可解释性相对弱一些,从先验的理论中所能获取的有效经验相对也少了很多。传统的协同过滤、奇异值分解等方法虽然可操作性强,并具有一定的可解释性,但是随着时代发展,已经日渐无法满足用户的个性化需求,需要对其进行创新或提出新的算法进行替代。目前,基于贝叶斯网络推理,几乎都集中在“正向推理”,即通过用户的显式反馈产生的行为记录来建图推理,极少考虑到用户的潜在偏好,上述问题均使得商品推荐个性化偏差,且推荐效率慢且推荐结果不准确。
发明内容
本公开的第一个方面提供一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法,其提高了对商品的覆盖率,缓解了长尾效应,同时提高了推荐准确率。
一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法,包括:
构建并行运行的嵌入潜在先验因子的贝叶斯模型以及嵌入平衡因子的采样模型;其中,潜在先验因子为从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率,且为贝叶斯模型的条件约束;采样模型为以平衡因子的倒数为权值的加权接受-拒绝采样模型;
确定推荐商品的总数量以及嵌入潜在先验因子的贝叶斯模型和嵌入平衡因子的采样模型分别推荐商品的数量与推荐商品的总数量的占比;
将从特定用户购物行为数据集中挖掘出的相应负序列模式输入至嵌入潜在先验因子的贝叶斯模型,按照概率大小顺序推荐相应数量的商品给特定用户;同时,利用嵌入平衡因子的采样模型对所有用户购物行为数据集进行采样,推荐相应数量的商品给特定用户。
进一步地,构建嵌入潜在先验因子的贝叶斯模型的过程为:
将特定用户购物行为数据集中每个商品为贝叶斯网络中的一个节点,根据用户购物顺序,建立贝叶斯网络中各个节点间的联系;
从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率作为贝叶斯网络的每一次推理的约束条件,按照概率大小顺序输出相应数量的商品。
本公开有效利用负序列模式挖掘的数据,与用户已经发生的动作的相比,“本应该发生,但是却没有发生”的动作则应该得到更高的关注度。而这些“没有发生”的事件能够带来大量用户的“隐式反馈”,以由负序列模式计算所得的条件概率加以表示,将挖掘到的负序列模式作为有效先验概率嵌入贝叶斯网络,提高了这样的结构充分了利用负序列模式挖掘在用户行为分析中所做的贡献,这样得到的先验概率使得推荐结果更具有可解释性和说服力。
进一步地,采用F-NSP+算法从特定用户购物行为数据集挖掘出的负序列模式。
F-NSP+算法是一种快速的负序列模式挖掘方法,负序列模式的引入能够更好地获取用户的隐式反馈。
进一步地,所述嵌入平衡因子的采样模型采样得到的数据符合高斯分布,且这些采样得到数据同时还服从参数为平衡因子的伯努利分布。
这样在随机采样的过程中,不仅考虑用户的个性化偏好,而且可以采样到一些符合大众喜好的物品。
本公开的第二个方面提供一种联合贝叶斯推理与加权拒绝采样的多任务推荐系统,其提高了对商品的覆盖率,缓解了长尾效应,同时提高了推荐准确率。
一种联合贝叶斯推理与加权拒绝采样的多任务推荐系统,包括:
模型构建模块,其用于构建并行运行的嵌入潜在先验因子的贝叶斯模型以及嵌入平衡因子的采样模型;其中,潜在先验因子为从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率,且为贝叶斯模型的条件约束;采样模型为以平衡因子的倒数为权值的加权接受-拒绝采样模型;
模型输出占比确定模块,其用于确定推荐商品的总数量以及嵌入潜在先验因子的贝叶斯模型和嵌入平衡因子的采样模型分别推荐商品的数量与推荐商品的总数量的占比;
并行推荐模块,其用于将从特定用户购物行为数据集中挖掘出的相应负序列模式输入至嵌入潜在先验因子的贝叶斯模型,按照概率大小顺序推荐相应数量的商品给特定用户;同时,利用嵌入平衡因子的采样模型对所有用户购物行为数据集进行采样,推荐相应数量的商品给特定用户。
进一步地,在所述模型构建模块中,构建嵌入潜在先验因子的贝叶斯模型的过程为:
将特定用户购物行为数据集中每个商品为贝叶斯网络中的一个节点,根据用户购物顺序,建立贝叶斯网络中各个节点间的联系;
从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率作为贝叶斯网络的每一次推理的约束条件,按照概率大小顺序输出相应数量的商品。
进一步地,在所述模型构建模块中,采用F-NSP+算法从特定用户购物行为数据集挖掘出的负序列模式。
进一步地,在所述模型构建模块中,所述嵌入平衡因子的采样模型采样得到的数据符合高斯分布,且这些采样得到数据同时还服从参数为平衡因子的伯努利分布。
本公开的第三个方面提供一种计算机可读存储介质,其提高了对商品的覆盖率,缓解了长尾效应,同时提高了推荐准确率。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所述的联合贝叶斯推理与加权拒绝采样的多任务推荐方法中的步骤。
本公开的第四个方面提供一种计算机设备,其提高了对商品的覆盖率,缓解了长尾效应,同时提高了推荐准确率。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述所述的联合贝叶斯推理与加权拒绝采样的多任务推荐方法中的步骤。
本公开的有益效果是:
(1)本公开通过两个子模型协同完成推荐任务,贝叶斯模型通过融合负序列模式的挖掘结果构建出嵌入潜在先验因子的贝叶斯模型,来实现对个体用户偏好的精准推理和预测;为了使得推荐的结果更具有多样性和惊喜度,将嵌入潜在先验因子的贝叶斯模型和嵌入平衡因子的采样模型并行设置,将贝叶斯的细粒度推理与嵌入平衡因子的采样模型相结合,通过采样的多样性来弥补贝叶斯图内搜索的限制;其中,嵌入平衡因子的采样模型中的平衡因子增加了模型对物品的整体覆盖率,模型的预测精度取决于两个子模型的任务权重的不同组合;理论上,能够通过不同的数据集和应用场景来调整两个子模型的任务权重,找到其他的最优平衡点,从而实现其他的业务目标。
(2)本公开提高了模型对商品的覆盖率,缓解了长尾效应。通过贝叶斯网络的因果推理与拒绝采样共同起作用的方法,从内部(用户的个性化路径)和外部(其他用户的行为路径)两个方面来得到推荐结果。
(3)本公开提高了推荐精准率。引入负序列模式挖掘方法不仅可以获得用户的正向行为序列,而且还能通过“未发生的动作”来挖掘用户的隐式偏好,这样的数据挖掘方法使贝叶斯网络本身就具备的分析和推理能力更强,进一步地提高了推荐的精准率。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1是本公开实施例的一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法流程图。
具体实施方式
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1
图1给出了本实施例的一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法流程图。
如图1所示,本实施例的一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法,包括:
S101:构建并行运行的嵌入潜在先验因子的贝叶斯模型以及嵌入平衡因子的采样模型;其中,潜在先验因子为从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率,且为贝叶斯模型的条件约束;采样模型为以平衡因子的倒数为权值的加权接受-拒绝采样模型。
在具体实施中,构建嵌入潜在先验因子的贝叶斯模型的过程为:
将特定用户购物行为数据集中每个商品为贝叶斯网络中的一个节点,根据用户购物顺序,建立贝叶斯网络中各个节点间的联系;
从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率作为贝叶斯网络的每一次推理的约束条件,按照概率大小顺序输出相应数量的商品。
具体地,贝叶斯网络的推理能力是基于整个网络系统来进行繁复的贝叶斯公式计算,得到各个变量的条件概率。贝叶斯网络中的节点的联合分布率p(x)可以看成诸多节点的条件概率的乘积:
x表示随机变量;xv表示节点v的随机变量;V表示贝叶斯网络中的节点集合;pa(v)是每一个节点v的父节点构成的集合。
对于这些随机变量的每一种组合集合来说,其任何成员的联合分布率可以根据链式法则来从条件分布率中计算得来:
其中,n为所有节点数量,其为大于或等于1的正整数;Xv表示节点v对应的变量,其值等于xv
从而得到以下的概率计算公式,其目的是体现出每一个随机变量由其祖先节点所造成的因果影响。
由各个节点之间的拓扑关系,可以得到最终需要的有向无环图(DAG)。
负序列模式挖掘(Negative Sequential Pattern,NSP)是序列模式研究中的重要组成部分,通过负序列模式挖掘方法来挖掘正序列模式(Positive Sequential Pattern,PSP)所无法发现的“隐式特征”。
通过用户所表现出的动作正序列,来挖掘潜在的动作负序列模式。在负序列模式研究中,将序列中的负元素解释为未发生的事件,这些“未发生事件”本质上是应该发生的,是由于某些原因而被隐藏。本实施例采用一种快速的负序列模式挖掘方法——F-NSP+算法,理论上,负序列模式的引入能够更好地获取用户的隐式反馈。下面给出一个f-NSP+算法进行负序列模式挖掘过程的简单描述。
具体地,根据通过读取用户的动作序列,得到以下表格:
表1 f-NSP+算法挖掘过程
其中,表1中的i1、i2、i3、i4均表示动作,该动作指的是购买物品的动作或点击鼠标的动作,或者下载的动作等等。表示未发生。
用户在一定时间内的动作可能存在一定的因果联系,将其理解为用户的每一次选择都是来自于出于当前情况的条件概率分布。在整个推荐过程我们不仅关注用户的显式反馈(如购买、点击、下载等),更要关注并将更多的注意力放在获取用户的隐式反馈(如在某一网页的停留时间、多次浏览、直接跳过等)。根据负序列模式挖掘的定义,挖掘得到的诸多负序列模式所体现出的可以理解为“此处本该发生但是却未发生的事件”,而这正是要挖掘的用户隐式反馈。
利用其所擅长的是对于具有因果关系来对模型进行刻画。在原有贝叶斯网络的基础上,将通过负序列模式所得到的条件先验概率知识嵌入为贝叶斯网络的图结构基础,将用户数量众多的历史记录作为输入,从而能够获得新的贝叶斯网络中具体的数值信息。
计算每一个与负元素有关的条件概率。出于用户可能出现短时偏好的改变的考虑,仅计算负元素的前项和后项,负元素的前项解释为“某用户在未购买物品B的条件下购买物品A的概率”,负元素的后项解释为“某用户在购买了物品B的条件下未购买物品A的概率”。
得到前项为负元素的概率计算公式:
其中,itemA表示购买物品A事件;
item-B表示未购买物品B事件;
p(item-B|itemA)表示在购买物品A的条件下未购买物品B的概率;
p(itemA)表示购买物品A的概率;
p(item-B)表示未购买物品B的概率;
P(itemA|item-B)表示在未购买物品B的条件下购买物品A的概率。
同理,可得后项为负元素的概率计算公式:
其中,item-A表示未购买物品A事件;
itemB表示购买物品B事件;
p(itemB|item-A)表示在未购买物品A的条件下购买物品B的概率;
p(item-A)表示未购买物品A的概率;
p(itemB)表示购买物品B的概率;
P(item-A|itemB)表示在购买物品B的条件下未购买物品A的概率。
所有的与负元素相关的概率都能够在负序列模式挖掘所得到的负序列模式中计算得到,并用一个潜在先验概率集priorlatent={p1,p2,...,pn}进行保存。认为该先验概率集,能够对贝叶斯网络推理过程起到一定的参考和约束。通过潜在概率集priorlatent={p1,p2,...,pn}来替换贝叶斯节点概率计算公式:
其中,Pprior_latent(Xv=xv|Xj=xjforXj∈pa(Xv))表示在Xj=xj事件发生的前提下,Xv=xv发生的概率,其中,Xj∈pa(Xv)。
在贝叶斯网络的每一次推理和预测过程中,将所得到的潜在先验概率作为每一步推理的约束条件进行关联嵌入,从而提高推理的可解释性。
在推理阶段,利用已经构造好的基于潜在先验概率嵌入的贝叶斯网络,利用推理时的输入作为当前条件约束,经过贝叶斯网络的前向推理来推理每一个节点发生的概率。这样的结构充分了利用负序列模式挖掘在用户行为分析中所做的贡献,这样得到的先验概率使得我们的推荐结果更具有可解释性和说服力。将正负序列模式处理为有效先验嵌入贝叶斯网络的方法能够更好的发挥贝叶斯网络的强大的推理能力。
为了解决贝叶斯网络固有的“弱探索”问题,通过采样的方法来对服从大众偏好的物品进行采样,并推荐给用户,引入高斯拒绝采样的方法来替代随机采样,并额外地赋予采样过程一个新的权重分布来对物品的受欢迎程度进行平衡。
拒绝采样方法是一种重复随机采样的方法,用频率估计概率,用以模拟对象的概率分布。模型中将拒绝采样做出如下设计:
给定形如公式(7)的预测得到的目标分布Aim(x):
其中,为已知预设目标分布,CP为未知的归一化常数。
通常,拒绝采样会考虑一个服从高斯分布的参考分布ref(x):
ref(x)~Gassian(μ,σ2)。
引入常数K,使得所有的x,满足
μ,σ2分别为均值和方差。
从参考分布ref(x)中取出x0,然后在[0,K(ref(x0))]中进行高斯采样,得到G0。若则接受该采样点,否则,拒绝该采样。最后,得到服从高斯分布的随机采样采样数据。
采样接受率P(accept)计算公式如公式(8)所示:
尽管经典的接受-拒绝采样方法已经相是一个相对好的随机采样方法,但是,考虑到推荐系统的实际应用场景,在随机采样的过程中,不仅考虑用户的个性化偏好,而且可以采样到一些符合大众喜好的物品。
在保留Gaussian拒绝采样方法的基础上对采样过程进行干预。假定是p(x)表示流行度的分布,即x服从参数为ωi的伯努利分布。ωi是平衡参数,它可以大体表征其他用户的偏好。其中,x表示在流行度分布下被采样的样本。
x~Bernoulli(ωi)
同时得到引入流行度分布后的采样接受率Ppop(accept)计算公式:
在整体的随机采样服从高斯分布的前提下,通过对原高斯采样附加一个1/ωi的方法,来实现对流行分布的反向加权。这样使得流行分布中“过热”和“过冷”的物品也能够有机会被采样到。
有效利用其他用户行为的频率以把握流行偏好。引入其他用户行为的行为数据,来客观的表示整个用户群体的稳定偏好,并通过逆概率的形式作用在高斯拒绝采样上。这样能通过该逆概率与拒绝采样共同作用的形式,不仅可以考虑到用户个性化偏好的一些物品,而且也能够覆盖到这个物品集中发生频率低的物品。
S102:确定推荐商品的总数量以及嵌入潜在先验因子的贝叶斯模型和嵌入平衡因子的采样模型分别推荐商品的数量与推荐商品的总数量的占比。
最终的推荐任务Tasktotal由两个子推荐模型来共同完成:
其中,α和β分别是嵌入潜在先验因子的贝叶斯模型BayesLatentCausalModel和嵌入平衡因子的采样模型BalanceFactorSampModel的权重。α和β的权重总和为1。
嵌入潜在先验因子的贝叶斯模型BayesLatentCausalModel和嵌入平衡因子的采样模型BalanceFactorSampModel为同时并行运行的任务1(task1)和任务2(task2)。
S103:将从特定用户购物行为数据集中挖掘出的相应负序列模式输入至嵌入潜在先验因子的贝叶斯模型,按照概率大小顺序推荐相应数量的商品给特定用户;同时,利用嵌入平衡因子的采样模型对所有用户购物行为数据集进行采样,推荐相应数量的商品给特定用户。
下面以某商场的购物场景为例来说明本公开的联合贝叶斯推理与加权拒绝采样的多任务推荐方法:
用户(user A)在过去的半年内,在该商场购物产生的购物记录中,将其视作N个购物序列;其中,N为等于或等于1的正整数;
通过f-NSP+算法对用户的N个购物序列进行负序列模式挖掘,得到多个负序列模式,将其视作是用户的潜在(隐式)偏好,下表中的各个序列的中的元素为购买动作,表示未发生。
计算所有的负序列模式中的条件概率,形如:
其中:
itemi3表示购买动作i3事件;
item-i2表示未购买动作i2事件;
P(itemi3|item-i2)表示在未购买动作i2事件发生的条件下购买动作i3事件发生的概率;
p(item-i2|itemi3)表示在购买动作i3事件发生的条件下未购买动作i2事件发生的概率;
p(itemi3)表示购买动作i3事件发生的概率;
p(item-i2)表示未购买动作i2事件发生的概率。
这样就可以得到一系列潜在概率,即将用户的购物行为中隐性的、并未表达的偏好以显式概率的形式表现出来。
在贝叶斯网络的每一次推理和预测过程中,将所得到的潜在先验概率作为每一步推理的约束条件进行关联嵌入,从而提高推理的可解释性。
在推理阶段,我们基于已经构造好的基于潜在先验概率嵌入的贝叶斯网络,当用户产生了新的购物行为,如节点b。经典贝叶斯网络推理中认为此时节点b和节点s是有关联的,因此可能会大概率推荐给用户。但是我们通过负序列模式挖掘得到的结果是,在该用户的购物序列中,b和s之间存在大量的负条件概率。这就意味着这两个节点之间并不存在高度的依赖关系,因此在我们的网络中,b-s的边以虚线形式呈现,概率减小,即当用户购买了商品b后,不一定会推荐给用户商品s。
与上述嵌入潜在先验因子的贝叶斯模型并行的,是基于嵌入平衡因子的采样模型。针对整个用户群体的购买记录进行以高斯分布作为参考分布的接受-拒绝采样。这就说明了,采样过程是符合大众偏好的。在整体的随机采样服从高斯分布的前提下,通过原高斯采样附加一个1/ωi的方法,实现对流行分布的反向加权。例如夏天冰淇淋的销量极高,通过反向加权来适当的降低冰淇淋的采样权重,对于其他能降暑的商品(如水、酸奶等)适当地增加权重。这样做的目的是让流行分布中“过热”和“过冷”的物品也能够有机会被采样到,对于整个商品集来说,一定程度上可以增加商品的推荐覆盖率。
最终,推荐结果由上述的两个部分的模型来共同完成:一部分是基于用户的个性化路径通过推理产生结果,一部分是从其他用户的行为记录中采样得到结果。
实施例2
本实施例提供了与实施例1相对应的一种联合贝叶斯推理与加权拒绝采样的多任务推荐系统,其提高了对商品的覆盖率,缓解了长尾效应,同时提高了推荐准确率。
本实施例的一种联合贝叶斯推理与加权拒绝采样的多任务推荐系统,包括:
(1)模型构建模块,其用于构建并行运行的嵌入潜在先验因子的贝叶斯模型以及嵌入平衡因子的采样模型;其中,潜在先验因子为从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率,且为贝叶斯模型的条件约束;采样模型为以平衡因子的倒数为权值的加权接受-拒绝采样模型;
在所述模型构建模块中,采用F-NSP+算法从特定用户购物行为数据集挖掘出的负序列模式。
需要说明的是,本领域技术人员也可采用其他序列模式挖掘算法来对负序列模式进行挖掘。
在所述模型构建模块中,所述嵌入平衡因子的采样模型采样得到的数据符合高斯分布,且这些采样得到数据同时还服从参数为平衡因子的伯努利分布。
本实施例有效利用负序列模式挖掘的数据,与用户已经发生的动作的相比,“本应该发生,但是却没有发生”的动作则应该得到更高的关注度。而这些“没有发生”的事件能够带来大量用户的“隐式反馈”,以由负序列模式计算所得的条件概率加以表示,将挖掘到的负序列模式作为有效先验概率嵌入贝叶斯网络,提高了这样的结构充分了利用负序列模式挖掘在用户行为分析中所做的贡献,这样得到的先验概率使得推荐结果更具有可解释性和说服力。
本实施例在随机采样的过程中,不仅考虑用户的个性化偏好,而且可以采样到一些符合大众喜好的物品。
(2)模型输出占比确定模块,其用于确定推荐商品的总数量以及嵌入潜在先验因子的贝叶斯模型和嵌入平衡因子的采样模型分别推荐商品的数量与推荐商品的总数量的占比;
(3)并行推荐模块,其用于将从特定用户购物行为数据集中挖掘出的相应负序列模式输入至嵌入潜在先验因子的贝叶斯模型,按照概率大小顺序推荐相应数量的商品给特定用户;同时,利用嵌入平衡因子的采样模型对所有用户购物行为数据集进行采样,推荐相应数量的商品给特定用户。
具体地,在所述模型构建模块中,构建嵌入潜在先验因子的贝叶斯模型的过程为:
将特定用户购物行为数据集中每个商品为贝叶斯网络中的一个节点,根据用户购物顺序,建立贝叶斯网络中各个节点间的联系;
从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率作为贝叶斯网络的每一次推理的约束条件,按照概率大小顺序输出相应数量的商品。
实施例3
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图1所示的联合贝叶斯推理与加权拒绝采样的多任务推荐方法中的步骤。
实施例4
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如图1所示的联合贝叶斯推理与加权拒绝采样的多任务推荐方法中的步骤。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法,其特征在于,包括:
构建并行运行的嵌入潜在先验因子的贝叶斯模型以及嵌入平衡因子的采样模型;其中,潜在先验因子为从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率,且为贝叶斯模型的条件约束;采样模型为以平衡因子的倒数为权值的加权接受-拒绝采样模型;
确定推荐商品的总数量以及嵌入潜在先验因子的贝叶斯模型和嵌入平衡因子的采样模型分别推荐商品的数量与推荐商品的总数量的占比;
将从特定用户购物行为数据集中挖掘出的相应负序列模式输入至嵌入潜在先验因子的贝叶斯模型,按照概率大小顺序推荐相应数量的商品给特定用户;同时,利用嵌入平衡因子的采样模型对所有用户购物行为数据集进行采样,推荐相应数量的商品给特定用户。
2.如权利要求1所述的一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法,其特征在于,构建嵌入潜在先验因子的贝叶斯模型的过程为:
将特定用户购物行为数据集中每个商品为贝叶斯网络中的一个节点,根据用户购物顺序,建立贝叶斯网络中各个节点间的联系;
从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率作为贝叶斯网络的每一次推理的约束条件,按照概率大小顺序输出相应数量的商品。
3.如权利要求1所述的一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法,其特征在于,采用F-NSP+算法从特定用户购物行为数据集挖掘出的负序列模式。
4.如权利要求1所述的一种联合贝叶斯推理与加权拒绝采样的多任务推荐方法,其特征在于,所述嵌入平衡因子的采样模型采样得到的数据符合高斯分布,且这些采样得到数据同时还服从参数为平衡因子的伯努利分布。
5.一种联合贝叶斯推理与加权拒绝采样的多任务推荐系统,其特征在于,包括:
模型构建模块,其用于构建并行运行的嵌入潜在先验因子的贝叶斯模型以及嵌入平衡因子的采样模型;其中,潜在先验因子为从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率,且为贝叶斯模型的条件约束;采样模型为以平衡因子的倒数为权值的加权接受-拒绝采样模型;
模型输出占比确定模块,其用于确定推荐商品的总数量以及嵌入潜在先验因子的贝叶斯模型和嵌入平衡因子的采样模型分别推荐商品的数量与推荐商品的总数量的占比;
并行推荐模块,其用于将从特定用户购物行为数据集中挖掘出的相应负序列模式输入至嵌入潜在先验因子的贝叶斯模型,按照概率大小顺序推荐相应数量的商品给特定用户;同时,利用嵌入平衡因子的采样模型对所有用户购物行为数据集进行采样,推荐相应数量的商品给特定用户。
6.如权利要求5所述的一种联合贝叶斯推理与加权拒绝采样的多任务推荐系统,其特征在于,在所述模型构建模块中,构建嵌入潜在先验因子的贝叶斯模型的过程为:
将特定用户购物行为数据集中每个商品为贝叶斯网络中的一个节点,根据用户购物顺序,建立贝叶斯网络中各个节点间的联系;
从特定用户购物行为数据集挖掘出的负序列模式中每个商品的条件概率作为贝叶斯网络的每一次推理的约束条件,按照概率大小顺序输出相应数量的商品。
7.如权利要求5所述的一种联合贝叶斯推理与加权拒绝采样的多任务推荐系统,其特征在于,在所述模型构建模块中,采用F-NSP+算法从特定用户购物行为数据集挖掘出的负序列模式。
8.如权利要求5所述的一种联合贝叶斯推理与加权拒绝采样的多任务推荐系统,其特征在于,在所述模型构建模块中,所述嵌入平衡因子的采样模型采样得到的数据符合高斯分布,且这些采样得到数据同时还服从参数为平衡因子的伯努利分布。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的联合贝叶斯推理与加权拒绝采样的多任务推荐方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4中任一项所述的联合贝叶斯推理与加权拒绝采样的多任务推荐方法中的步骤。
CN201910485773.6A 2019-06-05 2019-06-05 联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统 Active CN110210944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910485773.6A CN110210944B (zh) 2019-06-05 2019-06-05 联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910485773.6A CN110210944B (zh) 2019-06-05 2019-06-05 联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统

Publications (2)

Publication Number Publication Date
CN110210944A true CN110210944A (zh) 2019-09-06
CN110210944B CN110210944B (zh) 2021-04-23

Family

ID=67790978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910485773.6A Active CN110210944B (zh) 2019-06-05 2019-06-05 联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统

Country Status (1)

Country Link
CN (1) CN110210944B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582973A (zh) * 2020-04-09 2020-08-25 苏宁云计算有限公司 一种商品推荐数据生成方法、装置及系统
CN113657440A (zh) * 2021-07-08 2021-11-16 同盾科技有限公司 一种基于用户特征聚类的拒绝样本推断方法和装置
CN114996487A (zh) * 2022-05-24 2022-09-02 北京达佳互联信息技术有限公司 媒体资源推荐方法、装置、电子设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000070481A1 (en) * 1999-05-14 2000-11-23 Manna, Inc. Intelligent computer system
CN105809474A (zh) * 2016-02-29 2016-07-27 深圳市未来媒体技术研究院 一种层次化商品信息过滤推荐方法
CN105913296A (zh) * 2016-04-01 2016-08-31 北京理工大学 一种基于图的个性化推荐方法
CN107025311A (zh) * 2017-05-18 2017-08-08 北京大学 一种基于k近邻的贝叶斯个性化推荐方法及装置
CN107368519A (zh) * 2017-06-05 2017-11-21 桂林电子科技大学 一种契合用户兴趣变化的协同处理方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000070481A1 (en) * 1999-05-14 2000-11-23 Manna, Inc. Intelligent computer system
CN105809474A (zh) * 2016-02-29 2016-07-27 深圳市未来媒体技术研究院 一种层次化商品信息过滤推荐方法
CN105913296A (zh) * 2016-04-01 2016-08-31 北京理工大学 一种基于图的个性化推荐方法
CN107025311A (zh) * 2017-05-18 2017-08-08 北京大学 一种基于k近邻的贝叶斯个性化推荐方法及装置
CN107368519A (zh) * 2017-06-05 2017-11-21 桂林电子科技大学 一种契合用户兴趣变化的协同处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘传鲁: "可决策的正负序列模式选取方法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582973A (zh) * 2020-04-09 2020-08-25 苏宁云计算有限公司 一种商品推荐数据生成方法、装置及系统
CN113657440A (zh) * 2021-07-08 2021-11-16 同盾科技有限公司 一种基于用户特征聚类的拒绝样本推断方法和装置
CN114996487A (zh) * 2022-05-24 2022-09-02 北京达佳互联信息技术有限公司 媒体资源推荐方法、装置、电子设备以及存储介质

Also Published As

Publication number Publication date
CN110210944B (zh) 2021-04-23

Similar Documents

Publication Publication Date Title
Pham et al. A general graph-based model for recommendation in event-based social networks
Xiang et al. Time-dependent models in collaborative filtering based recommender system
CN108431833A (zh) 端到端深度协作过滤
CN110210944A (zh) 联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统
Seghir FDMOABC: Fuzzy discrete multi-objective artificial bee colony approach for solving the non-deterministic QoS-driven web service composition problem
Jiao et al. A novel learning rate function and its application on the SVD++ recommendation algorithm
CN113918832B (zh) 基于社交关系的图卷积协同过滤推荐系统
Tan et al. Object-oriented travel package recommendation
Guàrdia-Sebaoun et al. Latent trajectory modeling: A light and efficient way to introduce time in recommender systems
Zheng et al. Deviation-based contextual SLIM recommenders
CN113918833B (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN114202061A (zh) 基于生成对抗网络模型及深度强化学习的物品推荐方法、电子设备及介质
CN114329200B (zh) 一种个性化自适应捆绑推荐模型及推荐方法
Guchhait et al. Inventory model of a deteriorating item with price and credit linked fuzzy demand: A fuzzy differential equation approach
Chen et al. Reinforcement recommendation with user multi-aspect preference
Yu et al. Spectrum-enhanced pairwise learning to rank
Xie et al. A probabilistic recommendation method inspired by latent Dirichlet allocation model
CN108073578B (zh) 一种进行对象推荐的方法和系统
Han et al. Optimizing ranking algorithm in recommender system via deep reinforcement learning
CN110111184A (zh) 一种基于加权贝叶斯推理的负序列推荐方法及系统
Huang et al. Fusing frequent sub-sequences in the session-based recommender system
CN109446432A (zh) 一种信息推荐方法及装置
CN109636432A (zh) 计算机执行的项目选择方法和装置
Li et al. Genetic algorithm and graph theory based matrix factorization method for online friend recommendation
CN114330891A (zh) 一种面向云计算的多目标资源调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant