CN105809474B - 一种层次化商品信息过滤推荐方法 - Google Patents

一种层次化商品信息过滤推荐方法 Download PDF

Info

Publication number
CN105809474B
CN105809474B CN201610112904.2A CN201610112904A CN105809474B CN 105809474 B CN105809474 B CN 105809474B CN 201610112904 A CN201610112904 A CN 201610112904A CN 105809474 B CN105809474 B CN 105809474B
Authority
CN
China
Prior art keywords
distribution
commodity
user
gamma
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610112904.2A
Other languages
English (en)
Other versions
CN105809474A (zh
Inventor
杨余久
黄旭
邵航
张如意
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Weilai Media Technology Research Institute
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Weilai Media Technology Research Institute
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Weilai Media Technology Research Institute, Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Weilai Media Technology Research Institute
Priority to CN201610112904.2A priority Critical patent/CN105809474B/zh
Publication of CN105809474A publication Critical patent/CN105809474A/zh
Application granted granted Critical
Publication of CN105809474B publication Critical patent/CN105809474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种层次化商品信息过滤推荐方法,包括如下步骤:对于推荐系统,构造一种分层泊松模型;对每一组有效用户商品对构造长度为K的向量,评分大小为对应用户偏好向量与商品属性向量的内积;采用变分推断的方法进行逼近后验分布,利用坐标上升法多次迭代直至收敛,推导出所有隐变量的近似分布;预测每组用户商品对评分,根据得分大小排序可对用户进行最终的推荐。本发明的优点在于:1、可以生成对商品用户的稀疏表示;准确拟合了用户商品的长尾效应;3、对未评分用户商品对有降权效果;4、对稀疏评分矩阵可作出快速推断;5、良好的拓展性,适用于大规模评分集。

Description

一种层次化商品信息过滤推荐方法
技术领域
本发明涉及信息过滤技术,特别涉及一种层次化商品信息过滤推荐方法。
背景技术
推荐系统作为一类信息过滤技术,在工业界尤其是互联网产品中应用广泛,比如购物网站的商品推荐,豆瓣电影、读书推荐等等。推荐系统在工业上有着巨大的商用价值,可以挖掘出消费者对商品的喜好倾向。
一般而言,学习推荐系统需要一个包含所有用户的用户集以及包含所有商品的商品集,此外还包括用户对商品的评分矩阵。这里的评分矩阵一般情况下分为两种:显反馈和隐反馈。显式的评分即用户在给定打分范围内给商品评分,显式地表明对该商品的喜欢程度,比如豆瓣电影用户可以给自己看过的电影打分,1分表示不喜欢该电影,相反地,5分表明用户非常喜欢该电影。而更常见的情况是用户的隐反馈,比如用户在网上的购买、点击、收藏等记录,这些行为并非明确表示用户对商品的喜恶程度,而且一般情况下评分用0,1表示,1表示用户浏览过该商品,反之,0意味着用户没有浏览过该商品。
经典的推荐算法主要有:
1)基于近邻模型,比如协同过滤,这又可分为基于用户和基于商品,前者通过比较不同用户间的相似度,且先验地认为兴趣相似的用户对相同商品均感兴趣,后者则比较相似商品,同样先验地认为相似商品拥有相同的用户群;
2)基于矩阵分解的隐因子模型,即将评分矩阵分解为两个低秩矩阵乘积,分别表示为用户矩阵和商品矩阵。基于矩阵分解模型根据分解算法不同衍生出很多算法,比如奇异值分解(Singular Value Decompose,SVD)、非负矩阵分解(Non-negative MatrixFactorization,NMF)、带权值的非负矩阵分解(Weighted,Non-negative MatrixFactorization,WNMF)、概率非负矩阵分解(Probability Non-negative MatrixFactorization,PNMF)。以上算法一般针对显反馈情况,而在对隐反馈的研究中,已有的方法包括基于近邻的合并分解法,加权调整正样本相对重要性法,基于下采样的负样本法等。
业界根据用户对商品喜好的不同方式的反馈,将推荐问题分为两种,一种是基于评分制(比如豆瓣电影评分为1-10分),称为显式反馈,另一种更为广泛的是隐式反馈,比如用户购买、浏览、点击过商品,一般用1表示,其余为0。
发明内容
本发明的目的在于提供一种。本专利就推荐系统构建一种新的推荐模型,提出新的推荐算法。
为此,本发明提出的一种层次化商品信息过滤推荐方法包括如下步骤:
A1:对于推荐系统,构造一种分层泊松模型;A2、对每一组有效用户商品对构造长度为K的向量zui,其中每一个分量zuik~Poisson(θukβik),参数大小为对应用户偏好向量分量与商品属性向量分量乘积,其中K为商品属性向量和用户偏好向量的长度,zui为每组用户、商品对构造的长度为K的辅助向量,θu为用户偏好向量,βi为商品属性向量,k为分量的序号,u为用户序号,i为商品序号;
A3、采用变分推断的方法进行逼近后验分布,利用坐标上升法多次迭代直至收敛,推导出所有隐变量「β,θ,ξ,η,z]的近似分布;其中各参数的含义如下:β为βi的集合,θ表示θu的集合;ξu为用户偏好向量满足Gamma分布中的尺度参数,ξ表示ξu的集合,ηi为商品属性向量满足Gamma分布中的尺度参数,η为ηi的集合,z变量表示zui的集合;A4、预测每组用户商品对评分,
Figure BDF0000005837130000021
根据得分大小排序可对用户进行最终的推荐,其中上标T表示向量转置,将列向量转置为行向量。
优选地,本发明还可包括如下特征:
步骤A1中,构造分层泊松分布是针对隐反馈的情况。
步骤A1包括:
A1-1:对每一个用户u构造长度为K的用户偏好向量θu,该向量表示该用户的潜在特征,其中每个分量θuk~Gamma(a,ξu),即每个分量满足Gamma分布,并且该分布中的参数ξu定义为该用户的活跃度,即用户消费的商品占所有商品的比例,且ξu~Gamma(a′,a′/b′),即用户活跃度同样也满足Gamma分布;其中参数a表示用户偏好向量满足Gamma分布中的形状参数,a’表示′上述尺度参数满足Gamma分布中的形状参数,a’/b’表示上述尺度参数满足Gamma分布中的尺度参数;
A1-2:对于每件商品i构造长度为K的商品属性向量βi,该向量同样表明了该商品的潜在特征,其中每一个分量βik~Gamma(c,ηi),即每个分量满足Gamma分布,并且该分布中的参数ηi定义为该商品的流行度,即消费该商品的用户占所有用户的比例,且ηi~Gamma(c′,c′/d′),即商品流行度同样也满足Gamma分布;;其中参数c表示商品属性向量满足Gamma分布中的形状参数,c’表示上述尺度参数满足Gamma分布中的形状参数,c’/d’表示上述尺度参数满足Gamma分布中的尺度参数;
A1-3:每组用户商品对的评分假定满足Poisson分布,即
Figure BDF0000005837130000031
该分布中的参数等于用户偏好向量和商品属性向量的内积。
步骤A2中,假设zui各分量相互独立。
在于步骤A3中,通过坐标上升法,即假设其他隐变量分布已知,最大化关于当前目标变量分布的后验分布和真实分布之间的KL散度,通过多次迭代直至收敛,继而得出参数的近似后验分布。
步骤A4中,在辅助变量zui的帮助下,各隐变量的完全条件分布如下:
θuk|β,ξ,z,y~Gamma(a+∑izuiku+∑iβik)
βik|θ,η,z,y~Gamma(a+∑uzuiki+∑uθuk)
ξu|θ~Gamma(a′+Ka,b′+∑kθuk)
ηi|β~Gamma(c′+Kc,d′+∑kβik)
Figure BDF0000005837130000032
,其中y为yui的集合zui 为每组用户、商品对构造的长度为K的辅助向量
坐标上升法迭代所有参数包括:假设隐变量的后验分布可分解为各独立向量的分布乘积,即假设所有隐变量之间相互独立(实际上不可能),其形式如下:
Figure BDF0000005837130000033
Figure BDF0000005837130000034
其中,q为……,λik为变分推断中商品属性满足Gamma分布中的形状或尺度参数,γuk为变分推断中用户偏好满足Gamma分布中的形状或尺寸参数,κu为变分推断中用户活跃度满足Gamma分布中的形状或尺度参数;商品属性满足Gamma分布,Gamma分布中涉及形状参数和尺度参数,在此分别用上标shp和rte表示,则λik实际上表示两个参数
Figure BDF0000005837130000041
Figure BDF0000005837130000042
同样,用户偏好θuk满足Gamma分布,商品流行度ηi满足Gamma分布,用户活跃度ξu满足Gamma分布,辅助变量zui满足多项分布,因此其K个参数均大于零且和
Figure BDF0000005837130000043
对于每一个用户,其偏好权重分布的参数γuk及活跃度分布的参数κu按下面步骤依次迭代:
Figure BDF0000005837130000044
Figure BDF0000005837130000045
Figure BDF0000005837130000046
Figure BDF0000005837130000047
其中yui为用户u对i的评分,a为用户偏好的先验Gamma分布中形状参数,设为0.3,a′为用户活跃度的先验分布中的形状参数,设为0.3,b′为其尺度参数,设为1,φui为变分推断中辅助向量满足多项分布中的参数,
Figure BDF0000005837130000048
为变分推断中商品属性满足Gamma分布中的形状参数;
Figure BDF0000005837130000049
为变分推断中商品属性满足Gamma分布中的尺度参数,
Figure BDF00000058371300000410
为变分推断中用户偏好满足Gamma分布中的形状参数,
Figure BDF00000058371300000411
为变分推断中用户偏好满足Gamma分布中的尺度参数,
Figure BDF00000058371300000412
为变分推断中用户活跃度满足Gamma分布中的形状参数,
Figure BDF00000058371300000413
为变分推断中用户活跃度满足Gamma分布中的尺度参数。
对于每一商品,其属性分布的参数λik及流行度分布的参数τi按下面步骤依次迭代:
Figure BDF00000058371300000414
其中,c为商品属性的先验Gamma分布中的形状参数,设为0.3,c′为商品流行度的先验分布中的形状参数,设为0.3,d′为其尺度参数,设为1。
辅助变量zui的后验多项分布中参数φui按以下公式更新:
Figure BDF0000005837130000051
其中Ψ为双伽马函数。
本发明的优点在于:1、可以生成对商品用户的稀疏表示;准确拟合了用户商品的长尾效应;3、对未评分用户商品对有降权效果;4、对稀疏评分矩阵可作出快速推断;5、良好的拓展性,适用于大规模评分集。
附图说明
图1是本发明实施例模型自底向上的层次性。
图2是本发明实施例流程示意图。
具体实施方式
本实施例提出了一种基于泊松分布的商品推荐方法,是一种基于隐因子模型的分层泊松分解的推荐方法,首先对用户和商品分别构建特征向量,且向量值都满足Gamma分布,不但保证其值为正,同时有助于向量的稀疏化。此外,我们又利用一层Gamma分布控制底层向量的Gamma分布的速率(倒数为尺度)参数,这就保证了向量值的平均大小。通过这种分层的泊松分布结构,有利于捕捉到用户偏好和商品属性的多样性,而能够获取用户和商品的异质性正是优秀的推荐模型具有的性质。最后,采用变分推断法逼近因子的后验分布,利用用户商品的向量分布预测未观测的用户商品对评分,向用户推荐隐在的高分商品。
所述方法包括:
A1:对于推荐系统尤其是隐反馈的情况,构造一种分层泊松模型。
对每一用户u构造长度为K的用户偏好向量θu,其中每个分量θuk~Gamma(a,ξu),参数ξu定义为该用户的活跃度,且ξu~Gamma(a′,a′/b′);(Gamma分布是统计中常见的概率分布,若随机变量x~Gamma(α,β),则其中第一个参数α称为形状参数,第二个参数β称为尺度参数(倒数),且α,β>0)
对每一商品i构造长度为K的商品属性向量βi,其中每个分量βik~Gamma(c,ηi),参数ηi定义为该商品的流行度,且ηi~Gamma(c′,c′/d′);
每组用户商品对的评分
Figure BDF0000005837130000052
参数等于用户偏好向量和商品属性向量的内积。
2:为简化参数推断,对每一组有效用户商品对构造长度为K的向量zui,其中每一个分量zuik~Poisson(θukβik),参数大小为对应用户偏好向量分量与商品属性向量分量乘积。该法巧妙利用泊松分布的两个性质,一是满足泊松分布的n个随机变量x1,...xn之和x=∑ixi满足泊松分布,且参数为所有子泊松分布的参数之和,二是x1,...xn给定其和x的条件分布满足多项分布,即
Figure BDF0000005837130000061
A3:逼近后验分布时采用变分推断的方法,利用坐标上升法多次迭代直至收敛,推导出所有隐变量[β,θ,ξ,η,z]的近似分布;
A4:预测每组用户商品对评分,
Figure BDF0000005837130000062
根据得分大小排序可对用户进行最终的推荐。
图1清晰地表明了本文模型自底向上的层次性,U和D分别表示用户和商品集,中间灰色(表示观察量)表示用户u对商品i的评分,该评分满足Poisson分布,分布参数由用户向量θu和商品向量βi的内积控制,同时,θu和βi满足Gamma分布,其分布参数分别由(a,ξu)和(c,ηi),其中的用户活跃度ξu和商品流行度ηi分别又满足Gamma分布,其参数分别由(a′,a′/b′)和(c′,c′/d′)控制。总之,这是一个三层模型,从最底层至最顶层分别是Poisson分布、Gamma分布、Gamma分布。
本实施例针对推荐系统尤其是隐反馈的推荐,提出一种基于泊松分布的推荐方法。对每一位用户构造偏好向量以及活跃度,并且均服从Gamma分布;对每一件商品构造属性向量以及流行度,也均服从Gamma分布;设定每一组用户商品的评分(隐反馈下为0或1)服从泊松分布,同时将其分解为用户商品评分贡献向量,其所有分量之和等于该组用户商品的评分,且每一分量均满足泊松分布。然后采用变分推断法,这里所有的隐变量,包括用户偏好向量,用户活跃度,商品属性向量,商品流行度以及构造的用户商品评分贡献向量,其完全条件分布均属于指数族分布,因此均具有条件共轭的性质,所有隐变量的变分分布均类似于对应的完全条件分布。最后,采用坐标上升法迭代直至所有的变分参数收敛。具体步骤如下:
A1-1:分别对用户和商品分别建模,对每一个用户u构造长度为K的用户偏好向量θu,该向量表示该用户的潜在特征,其中每个分量θuk~Gamma(a,ξu),即每个分量满足Gamma分布,并且该分布中的参数ξu定义为该用户的活跃度,即用户消费的商品占所有商品的比例,且ξu~Gamma(a′,a′/b′),即用户活跃度同样也满足Gamma分布;
A1-2:对于每件商品i构造长度为K的商品属性向量βi,该向量同样表明了该商品的潜在特征,其中每一个分量βik~Gamma(c,ηi),即每个分量满足Gamma分布,并且该分布中的参数ηi定义为该商品的流行度,即消费该商品的用户占所有用户的比例,且ηi~Gamma(c′,c′/d′),即商品流行度同样也满足Gamma分布;
A1-3:最后,每组用户商品对的评分我们先验地认为满足Poisson分布,即
Figure BDF0000005837130000071
该分布中的参数等于用户偏好向量和商品属性向量的内积,这种做法很自然,因为Poisson分布的均值等于其参数;
A2:为方便后面的参数推断,使隐变量满足条件共轭的性质,对每一组有效(即有评分)用户商品对(u,i)构造长度为K的向量zui,其中每一个分量zuik~Poisson(θukβik),即满足泊松分布,参数大小为对应用户偏好向量分量与商品属性向量分量乘积,该分解同时也是对A1-3中泊松分布的分解,前提假设zui各分量相互独立。
A3:采用变分推断法逼近后验分布,通过坐标上升法,即假设其他隐变量分布已知,最大化关于当前目标变量分布的后验分布和真实分布之间的KL散度(KL距离),通过多次迭代直至收敛,继而得出参数的近似后验分布,关于参数具体的迭代公式在下面的具体实施方案中给出;
A4:预测每组用户商品对评分,
Figure BDF0000005837130000072
根据得分大小排序可对用户进行最终的推荐。
在具体的实施方案中,可按下面方式操作,首先给出一般的解决思路:
按贝叶斯统计的一般框架,
Figure BDF0000005837130000073
其中x为观察变量,z为隐变量,P(z|x)为似然分布,p(z)为先验分布,p(x)为边际似然分布(置信度),p(z|x)隐变量的后验分布。在本专利提出的算法中,涉及的隐变量如下:
用户u偏好向量第k个权重θuk,用户u的活跃度ξu
商品i属性向量第k个权重βik,商品i的流行度ηi
显式变量(观察变量):所有的评分yui
在计算边际分布时,由于其太过复杂或不可求得解析解,故采用变分推断法逼近后验分布。具体操作如下:
步骤A1中:首先构建如下模型:
用户u偏好向量θu,其分量θuk~Gamma(a,ξu),ξu~Gamma(a′,a′/b′);
商品i属性向量βi,其分量βik~Gamma(c,ηi),ηi~Gamma(c′,c′/d′);
用户商品对(u,i)的评分
Figure BDF0000005837130000084
每对用户商品(u,i)辅助隐变量zui,其中每个成分zuik~Poisson(θukβik);
步骤A2中:在辅助变量zui的帮助下,各隐变量(非观察量)的完全条件分布(即目标变量在其他所有变量给定的条件分布)如下:
θuk|β,ξ,z,y~Gamma(a+∑izuiku+∑iβik)
βik|θ,η,z,y~Gamma(a+∑uzuiki+∑uθuk)
ξu|θ~Gamma(a′+Ka,b′+∑kθuk)
ηi|β~Gamma(c′+Kc,d′+∑kβik)
Figure BDF0000005837130000081
因此在后面的变分推断中可以假设隐变量见独立且分布于上述一致,分别是Gamma分布以及多项分布。
步骤A3中:在变分推断中,采用坐标上升法迭代所有参数:
这里假设隐变量的后验分布可分解为各独立向量的分布乘积,即假设所有隐变量之间相互独立(实际上不可能),其形式如下:
Figure BDF0000005837130000082
Figure BDF0000005837130000083
其中,商品属性满足Gamma分布,由于Gamma分布中涉及形状参数和尺度参数,在本专利中分别用上标shp和rte表示,因此λik实际上表示两个参数
Figure BDF0000005837130000091
Figure BDF0000005837130000092
同样,用户偏好θuk满足Gamma分布,商品流行度ηi满足Gamma分布,用户活跃度ξu满足Gamma分布,辅助变量zui满足多项分布,因此其K个参数均大于零且和
Figure BDF0000005837130000093
对于每一个用户,其偏好权重分布的参数γuk及活跃度分布的参数κu按下面步骤依次迭代:
Figure BDF0000005837130000094
Figure BDF0000005837130000095
Figure BDF0000005837130000096
Figure BDF0000005837130000097
其中yui为用户u对i的评分,a为用户偏好的先验Gamma分布中形状参数,设为0.3,a′为用户活跃度的先验分布中的形状参数,设为0.3,b′为其尺度参数,设为1。
对于每一商品,其属性分布的参数λik及流行度分布的参数τi按下面步骤依次迭代:
Figure BDF0000005837130000098
其中,c为商品属性的先验Gamma分布中的形状参数,设为0.3,c′为商品流行度的先验分布中的形状参数,设为0.3,d′为其尺度参数,设为1。
另外,辅助变量zui的后验多项分布中参数φui按以下公式更新:
Figure BDF0000005837130000099
总之,所有参数总的迭代过程如下:
A1-1中:用户参数
Figure BDF0000005837130000101
Figure BDF0000005837130000102
Figure BDF0000005837130000103
Figure BDF0000005837130000104
A1-2中:商品参数
Figure BDF0000005837130000105
Figure BDF0000005837130000106
Figure BDF0000005837130000107
Figure BDF0000005837130000108
A1-3中:辅助变量
Figure BDF0000005837130000109
最终,当参数收敛时(可设定变化少于某个阈值,比如0.000001),即得到所有用户偏好权重、商品属性权重的分布,预测评分:
Figure BDF00000058371300001010
实验表明,采用该HPF(Hierarchical Poisson Factorization)模型,分层泊松分解有如下优点:
1、可以生成对商品用户的稀疏表示;
2、准确拟合了用户商品的长尾效应;
3、对未评分用户商品对有降权效果;
4、对稀疏评分矩阵可作出快速推断;
5、良好的拓展性,适用于大规模评分集。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效装置或等效方法变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种层次化商品信息过滤推荐方法,其特征在于包括如下步骤:
A1:对于推荐系统,构造一种分层泊松模型;具体包括如下步骤:
A1-1:对每一个用户u构造长度为K的用户偏好向量θu,该向量表示该用户的潜在特征,其中每个分量θuk~Gamma(a,ξu),即每个分量满足Gamma分布,并且该分布中的参数ξu定义为该用户的活跃度,其为用户偏好向量满足Gamma分布中的尺度参数,即用户消费的商品占所有商品的比例,且ξu~Gamma(a′,a′/b′),即用户活跃度同样也满足Gamma分布;其中参数a表示用户偏好向量满足Gamma分布中的形状参数,a’表示上述尺度参数ξu满足Gamma分布中的形状参数,a’/b’表示上述尺度参数ξu满足Gamma分布中的尺度参数;
A1-2:对于每件商品i构造长度为K的商品属性向量βi,该向量同样表明了该商品的潜在特征,其中每一个分量βik~Gamma(c,ηi),即每个分量满足Gamma分布,并且该分布中的参数ηi定义为该商品的流行度,其为商品属性向量满足Gamma分布中的尺度参数,即消费该商品的用户占所有用户的比例,且ηi~Gamma(c′,c′/d′),即商品流行度同样也满足Gamma分布;其中参数c表示商品属性向量满足Gamma分布中的形状参数,c’表示上述尺度ηi参数满足Gamma分布中的形状参数,c’/d’表示上述尺度参数ηi满足Gamma分布中的尺度参数;
A2、对每一组有效用户商品对构造长度为K的向量zui,其中每一个分量zuik~Poisson(θukβik),评分大小为对应用户偏好向量与商品属性向量的内积,其中K为商品属性向量和用户偏好向量的长度,zui为每组用户、商品对构造的长度为K的辅助向量,θu为用户偏好向量,βi为商品属性向量,k为分量的序号,u为用户序号,i为商品序号;
A3、采用变分推断的方法进行逼近后验分布,利用坐标上升法多次迭代直至收敛,推导出所有隐变量「β,θ,ξ,η,z]的近似分布;其中各参数的含义如下:β为βi的集合,θ表示θu的集合;ξ表示ξu的集合,η为ηi的集合,z变量表示zui的集合;
A4、预测每组用户商品对评分,
Figure FDA0002687045730000011
根据得分大小排序可对用户进行最终的推荐,向用户推荐隐在的高分商品,其中上标T表示向量转置,将列向量转置为行向量;
其中,通过分层的泊松分布结构,捕捉用户偏好和商品属性的多样性。
2.如权利要求1所述的层次化商品信息过滤推荐方法,其特征在于:步骤A1 中,构造分层泊松分布是针对隐反馈的情况。
3.如权利要求1所述的层次化商品信息过滤推荐方法,其特征在于步骤A1还包括:
A1-3:每组用户商品对的评分假定满足Poisson分布,即
Figure FDA0002687045730000021
该分布中的参数等于用户偏好向量和商品属性向量的内积。
4.如权利要求1或2或3所述的层次化商品信息过滤推荐方法,其特征在于步骤A2中,假设zui各分量相互独立。
5.如权利要求1或2或3所述的层次化商品信息过滤推荐方法,其特征在于在于步骤A3中,通过坐标上升法,即假设其他隐变量分布已知,最大化关于当前目标变量分布的后验分布和真实分布之间的KL散度,通过多次迭代直至收敛,继而得出参数的近似后验分布。
6.如权利要求3所述的层次化商品信息过滤推荐方法,其特征是在于步骤A4中,在辅助变量zui的帮助下,各隐变量的完全条件分布如下:
θuk|β,ξ,z,y~Gamma(a+∑izuiku+∑iβik)
βik|θ,η,z,y~Gamma(a+∑uzuiki+∑uθuk)
ξu|θ~Gamma(a′+Ka,b′+∑kθuk)
ηi|β~Gamma(c′+Kc,d′+∑kβik)
Figure FDA0002687045730000022
,其中y 为 yui 的集合, zui 为每组用户、商品对构造的长度为 K 的辅助向量 。
7.如权利要求5所述的层次化商品信息过滤推荐方法,其特征是坐标上升法迭代所有参数包括:假设隐变量的后验分布可分解为各独立向量的分布乘积,即假设所有隐变量之间相互独立,其形式如下:
Figure FDA0002687045730000023
Figure FDA0002687045730000024
其中,q()表示概率分布,λik为变分推断中商品属性满足Gamma分布中的形状或尺度参数,γuk为变分推断中用户偏好满足Gamma分布中的形状或尺寸参数,κu为变分推断中用户活跃度满足Gamma分布中的形状或尺度参数;商品属性满足Gamma分布,Gamma分布中涉及形状参数和尺度参数,在此分别用上标shp和rte表示,则λik实际上表示两个参数
Figure FDA0002687045730000031
Figure FDA0002687045730000032
同样,用户偏好θuk满足Gamma分布,商品流行度ηi满足Gamma分布,用户活跃度ξu满足Gamma分布,辅助变量zui满足多项分布,因此其K个参数均大于零且和
Figure FDA0002687045730000033
8.如权利要求7所述的层次化商品信息过滤推荐方法,其特征是:对于每一个用户,其偏好权重分布的参数γuk及活跃度分布的参数κu按下面步骤依次迭代:
Figure FDA0002687045730000034
Figure FDA0002687045730000035
Figure FDA0002687045730000036
Figure FDA0002687045730000037
其中yui为用户u对i的评分,a为用户偏好的先验Gamma分布中形状参数,设为0.3,a′为用户活跃度的先验分布中的形状参数,设为0.3,b′为其尺度参数,设为1,φui为变分推断中辅助向量满足多项分布中的参数,
Figure FDA0002687045730000038
为变分推断中商品属性满足Gamma分布中的形状参数;
Figure FDA0002687045730000039
为变分推断中商品属性满足Gamma分布中的尺度参数,
Figure FDA00026870457300000310
为变分推断中用户偏好满足Gamma分布中的形状参数,
Figure FDA00026870457300000311
为变分推断中用户偏好满足Gamma分布中的尺度参数,
Figure FDA00026870457300000312
为变分推断中用户活跃度满足Gamma分布中的形状参数,
Figure FDA00026870457300000313
为变分推断中用户活跃度满足Gamma分布中的尺度参数。
9.如权利要求7所述的层次化商品信息过滤推荐方法,其特征是:对于每一商品,其属性分布的参数λik及流行度分布的参数τi按下面步骤依次迭代:
Figure FDA0002687045730000041
Figure FDA0002687045730000042
Figure FDA0002687045730000043
Figure FDA0002687045730000044
其中,c为商品属性的先验Gamma分布中的形状参数,设为0.3,c′设为0.3,d′为其尺度参数,设为1。
10.如权利要求7所述的层次化商品信息过滤推荐方法,其特征是:辅助变量zui的后验多项分布中参数φui按以下公式更新:
Figure FDA0002687045730000045
其中Ψ为双伽马函数。
CN201610112904.2A 2016-02-29 2016-02-29 一种层次化商品信息过滤推荐方法 Active CN105809474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610112904.2A CN105809474B (zh) 2016-02-29 2016-02-29 一种层次化商品信息过滤推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610112904.2A CN105809474B (zh) 2016-02-29 2016-02-29 一种层次化商品信息过滤推荐方法

Publications (2)

Publication Number Publication Date
CN105809474A CN105809474A (zh) 2016-07-27
CN105809474B true CN105809474B (zh) 2020-11-17

Family

ID=56465944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610112904.2A Active CN105809474B (zh) 2016-02-29 2016-02-29 一种层次化商品信息过滤推荐方法

Country Status (1)

Country Link
CN (1) CN105809474B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862532B (zh) * 2016-09-22 2021-11-26 腾讯科技(深圳)有限公司 一种用户特征提取方法及相关装置
CN108510297B (zh) * 2017-02-28 2021-12-31 北京京东尚科信息技术有限公司 一种商品评价得分的处理方法及系统
CN108053268A (zh) * 2017-12-29 2018-05-18 广州品唯软件有限公司 一种商品聚类确认方法及装置
CN108388624B (zh) * 2018-02-12 2022-05-17 科大讯飞股份有限公司 多媒体信息推荐方法及装置
CN109509051B (zh) * 2018-09-12 2020-11-13 北京奇艺世纪科技有限公司 一种物品推荐方法及装置
CN110210944B (zh) * 2019-06-05 2021-04-23 齐鲁工业大学 联合贝叶斯推理与加权拒绝采样的多任务推荐方法及系统
CN116861323B (zh) * 2023-07-24 2024-02-23 深圳丰享信息技术有限公司 一种在推荐中解决长尾效应的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271559A (zh) * 2008-05-16 2008-09-24 华东师范大学 一种基于用户局部兴趣挖掘的协作推荐系统
CN102129463A (zh) * 2011-03-11 2011-07-20 北京航空航天大学 一种融合项目相关性的基于pmf的协同过滤推荐系统
CN102467709A (zh) * 2010-11-17 2012-05-23 阿里巴巴集团控股有限公司 一种发送商品信息的方法和装置
CN103279552A (zh) * 2013-06-06 2013-09-04 浙江大学 一种基于用户兴趣分组的协同过滤推荐方法
CN103824213A (zh) * 2014-03-13 2014-05-28 北京理工大学 一种基于用户偏好与商品属性的个性化推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130325551A1 (en) * 2012-06-05 2013-12-05 Clear Demand, Inc. System and method for modeling demand and optimizing prices with immunity to out-of-stock events

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271559A (zh) * 2008-05-16 2008-09-24 华东师范大学 一种基于用户局部兴趣挖掘的协作推荐系统
CN102467709A (zh) * 2010-11-17 2012-05-23 阿里巴巴集团控股有限公司 一种发送商品信息的方法和装置
CN102129463A (zh) * 2011-03-11 2011-07-20 北京航空航天大学 一种融合项目相关性的基于pmf的协同过滤推荐系统
CN103279552A (zh) * 2013-06-06 2013-09-04 浙江大学 一种基于用户兴趣分组的协同过滤推荐方法
CN103824213A (zh) * 2014-03-13 2014-05-28 北京理工大学 一种基于用户偏好与商品属性的个性化推荐方法

Also Published As

Publication number Publication date
CN105809474A (zh) 2016-07-27

Similar Documents

Publication Publication Date Title
CN105809474B (zh) 一种层次化商品信息过滤推荐方法
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
CN108460619B (zh) 一种提供融合显隐式反馈的协同推荐模型的方法
CN107330115B (zh) 一种信息推荐方法及装置
CN110084670B (zh) 一种基于lda-mlp的货架商品组合推荐方法
Hu et al. Movie collaborative filtering with multiplex implicit feedbacks
CN109783738B (zh) 一种基于多相似度的双极限学习机混合协同过滤推荐方法
CN106202519A (zh) 一种结合用户评论内容和评分的项目推荐方法
CN107545471B (zh) 一种基于高斯混合的大数据智能推荐方法
CN109840833B (zh) 贝叶斯协同过滤推荐方法
CN107563841A (zh) 一种基于用户评分分解的推荐系统
CN111797321A (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN103377296B (zh) 一种多指标评价信息的数据挖掘方法
CN107423335B (zh) 一种针对单类协同过滤问题的负样本选择方法
CN111681084B (zh) 一种基于社交关系影响因素的电商平台推荐方法
CN106157156A (zh) 一种基于用户社区的协作推荐系统
CN112950324A (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN107016058A (zh) 一种基于属性信息偏好自学习的推荐预测方法
CN112819575B (zh) 一种考虑重复购买行为的会话推荐方法
Deodhar et al. A framework for simultaneous co-clustering and learning from complex data
CN111310029B (zh) 一种基于用户商品画像和潜在因子特征提取的混合推荐方法
CN109190040A (zh) 基于协同演化的个性化推荐方法及装置
CN115840853A (zh) 一种基于知识图谱和图注意力网络的课程推荐系统
CN110059251B (zh) 基于多关系隐式反馈置信度的协同过滤推荐方法
CN108491477B (zh) 基于多维云和用户动态兴趣的神经网络推荐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant