CN105809474B

CN105809474B - 一种层次化商品信息过滤推荐方法

Info

Publication number: CN105809474B
Application number: CN201610112904.2A
Authority: CN
Inventors: 杨余久; 黄旭; 邵航; 张如意
Original assignee: Shenzhen Weilai Media Technology Research Institute; Shenzhen Graduate School Tsinghua University
Current assignee: Shenzhen Weilai Media Technology Research Institute; Shenzhen Graduate School Tsinghua University
Priority date: 2016-02-29
Filing date: 2016-02-29
Publication date: 2020-11-17
Anticipated expiration: 2036-02-29
Also published as: CN105809474A

Abstract

本发明涉及一种层次化商品信息过滤推荐方法，包括如下步骤：对于推荐系统，构造一种分层泊松模型；对每一组有效用户商品对构造长度为K的向量，评分大小为对应用户偏好向量与商品属性向量的内积；采用变分推断的方法进行逼近后验分布，利用坐标上升法多次迭代直至收敛，推导出所有隐变量的近似分布；预测每组用户商品对评分，根据得分大小排序可对用户进行最终的推荐。本发明的优点在于：1、可以生成对商品用户的稀疏表示；准确拟合了用户商品的长尾效应；3、对未评分用户商品对有降权效果；4、对稀疏评分矩阵可作出快速推断；5、良好的拓展性，适用于大规模评分集。

Description

一种层次化商品信息过滤推荐方法

技术领域

本发明涉及信息过滤技术，特别涉及一种层次化商品信息过滤推荐方法。

背景技术

推荐系统作为一类信息过滤技术，在工业界尤其是互联网产品中应用广泛，比如购物网站的商品推荐，豆瓣电影、读书推荐等等。推荐系统在工业上有着巨大的商用价值，可以挖掘出消费者对商品的喜好倾向。

一般而言，学习推荐系统需要一个包含所有用户的用户集以及包含所有商品的商品集，此外还包括用户对商品的评分矩阵。这里的评分矩阵一般情况下分为两种：显反馈和隐反馈。显式的评分即用户在给定打分范围内给商品评分，显式地表明对该商品的喜欢程度，比如豆瓣电影用户可以给自己看过的电影打分，1分表示不喜欢该电影，相反地，5分表明用户非常喜欢该电影。而更常见的情况是用户的隐反馈，比如用户在网上的购买、点击、收藏等记录，这些行为并非明确表示用户对商品的喜恶程度，而且一般情况下评分用0,1表示，1表示用户浏览过该商品，反之，0意味着用户没有浏览过该商品。

经典的推荐算法主要有：

1)基于近邻模型，比如协同过滤，这又可分为基于用户和基于商品，前者通过比较不同用户间的相似度，且先验地认为兴趣相似的用户对相同商品均感兴趣，后者则比较相似商品，同样先验地认为相似商品拥有相同的用户群；

2)基于矩阵分解的隐因子模型，即将评分矩阵分解为两个低秩矩阵乘积，分别表示为用户矩阵和商品矩阵。基于矩阵分解模型根据分解算法不同衍生出很多算法，比如奇异值分解(Singular Value Decompose,SVD)、非负矩阵分解(Non-negative MatrixFactorization,NMF)、带权值的非负矩阵分解(Weighted,Non-negative MatrixFactorization,WNMF)、概率非负矩阵分解(Probability Non-negative MatrixFactorization,PNMF)。以上算法一般针对显反馈情况，而在对隐反馈的研究中，已有的方法包括基于近邻的合并分解法，加权调整正样本相对重要性法，基于下采样的负样本法等。

业界根据用户对商品喜好的不同方式的反馈，将推荐问题分为两种，一种是基于评分制(比如豆瓣电影评分为1-10分)，称为显式反馈，另一种更为广泛的是隐式反馈，比如用户购买、浏览、点击过商品，一般用1表示，其余为0。

发明内容

本发明的目的在于提供一种。本专利就推荐系统构建一种新的推荐模型，提出新的推荐算法。

为此，本发明提出的一种层次化商品信息过滤推荐方法包括如下步骤：

A1：对于推荐系统，构造一种分层泊松模型；A2、对每一组有效用户商品对构造长度为K的向量z_ui，其中每一个分量z_uik～Poisson(θ_ukβ_ik)，参数大小为对应用户偏好向量分量与商品属性向量分量乘积，其中K为商品属性向量和用户偏好向量的长度，z_ui为每组用户、商品对构造的长度为K的辅助向量，θ_u为用户偏好向量，β_i为商品属性向量，k为分量的序号，u为用户序号，i为商品序号；

A3、采用变分推断的方法进行逼近后验分布，利用坐标上升法多次迭代直至收敛，推导出所有隐变量「β,θ,ξ,η,z]的近似分布；其中各参数的含义如下：β为β_i的集合，θ表示θ_u的集合；ξ_u为用户偏好向量满足Gamma分布中的尺度参数，ξ表示ξ_u的集合，η_i为商品属性向量满足Gamma分布中的尺度参数，η为η_i的集合，z变量表示z_ui的集合；A4、预测每组用户商品对评分，

根据得分大小排序可对用户进行最终的推荐，其中上标T表示向量转置，将列向量转置为行向量。

优选地，本发明还可包括如下特征：

步骤A1中，构造分层泊松分布是针对隐反馈的情况。

步骤A1包括：

A1-1：对每一个用户u构造长度为K的用户偏好向量θ_u，该向量表示该用户的潜在特征，其中每个分量θ_uk～Gamma(a,ξ_u)，即每个分量满足Gamma分布，并且该分布中的参数ξ_u定义为该用户的活跃度，即用户消费的商品占所有商品的比例，且ξ_u～Gamma(a′,a′/b′)，即用户活跃度同样也满足Gamma分布；其中参数a表示用户偏好向量满足Gamma分布中的形状参数，a’表示′上述尺度参数满足Gamma分布中的形状参数，a’/b’表示上述尺度参数满足Gamma分布中的尺度参数；

A1-2：对于每件商品i构造长度为K的商品属性向量β_i，该向量同样表明了该商品的潜在特征，其中每一个分量β_ik～Gamma(c,η_i)，即每个分量满足Gamma分布，并且该分布中的参数η_i定义为该商品的流行度，即消费该商品的用户占所有用户的比例，且η_i～Gamma(c′,c′/d′)，即商品流行度同样也满足Gamma分布；；其中参数c表示商品属性向量满足Gamma分布中的形状参数，c’表示上述尺度参数满足Gamma分布中的形状参数，c’/d’表示上述尺度参数满足Gamma分布中的尺度参数；

A1-3：每组用户商品对的评分假定满足Poisson分布，即

该分布中的参数等于用户偏好向量和商品属性向量的内积。

步骤A2中，假设z_ui各分量相互独立。

在于步骤A3中，通过坐标上升法，即假设其他隐变量分布已知，最大化关于当前目标变量分布的后验分布和真实分布之间的KL散度，通过多次迭代直至收敛，继而得出参数的近似后验分布。

步骤A4中，在辅助变量z_ui的帮助下，各隐变量的完全条件分布如下：

θ_uk|β,ξ,z,y～Gamma(a+∑_iz_uik,ξ_u+∑_iβ_ik)

β_ik|θ,η,z,y～Gamma(a+∑_uz_uik,η_i+∑_uθ_uk)

ξ_u|θ～Gamma(a′+Ka,b′+∑_kθ_uk)

η_i|β～Gamma(c′+Kc,d′+∑_kβ_ik)

，其中y为y_ui的集合，z_ui 为每组用户、商品对构造的长度为K的辅助向量。

坐标上升法迭代所有参数包括：假设隐变量的后验分布可分解为各独立向量的分布乘积，即假设所有隐变量之间相互独立(实际上不可能)，其形式如下：

其中，q为……，λ_ik为变分推断中商品属性满足Gamma分布中的形状或尺度参数，γuk为变分推断中用户偏好满足Gamma分布中的形状或尺寸参数，κ_u为变分推断中用户活跃度满足Gamma分布中的形状或尺度参数；商品属性满足Gamma分布，Gamma分布中涉及形状参数和尺度参数，在此分别用上标shp和rte表示，则λ_ik实际上表示两个参数

和

同样，用户偏好θ_uk满足Gamma分布，商品流行度η_i满足Gamma分布，用户活跃度ξ_u满足Gamma分布，辅助变量z_ui满足多项分布，因此其K个参数均大于零且和

对于每一个用户，其偏好权重分布的参数γ_uk及活跃度分布的参数κ_u按下面步骤依次迭代：

其中y_ui为用户u对i的评分，a为用户偏好的先验Gamma分布中形状参数，设为0.3，a′为用户活跃度的先验分布中的形状参数，设为0.3，b′为其尺度参数，设为1，φ_ui为变分推断中辅助向量满足多项分布中的参数，

为变分推断中商品属性满足Gamma分布中的形状参数；

为变分推断中商品属性满足Gamma分布中的尺度参数，

为变分推断中用户偏好满足Gamma分布中的形状参数，

为变分推断中用户偏好满足Gamma分布中的尺度参数，

为变分推断中用户活跃度满足Gamma分布中的形状参数，

为变分推断中用户活跃度满足Gamma分布中的尺度参数。

对于每一商品，其属性分布的参数λ_ik及流行度分布的参数τ_i按下面步骤依次迭代：

其中，c为商品属性的先验Gamma分布中的形状参数，设为0.3，c′为商品流行度的先验分布中的形状参数，设为0.3，d′为其尺度参数，设为1。

辅助变量z_ui的后验多项分布中参数φ_ui按以下公式更新：

其中Ψ为双伽马函数。

本发明的优点在于：1、可以生成对商品用户的稀疏表示；准确拟合了用户商品的长尾效应；3、对未评分用户商品对有降权效果；4、对稀疏评分矩阵可作出快速推断；5、良好的拓展性，适用于大规模评分集。

附图说明

图1是本发明实施例模型自底向上的层次性。

图2是本发明实施例流程示意图。

具体实施方式

本实施例提出了一种基于泊松分布的商品推荐方法，是一种基于隐因子模型的分层泊松分解的推荐方法，首先对用户和商品分别构建特征向量，且向量值都满足Gamma分布，不但保证其值为正，同时有助于向量的稀疏化。此外，我们又利用一层Gamma分布控制底层向量的Gamma分布的速率(倒数为尺度)参数，这就保证了向量值的平均大小。通过这种分层的泊松分布结构，有利于捕捉到用户偏好和商品属性的多样性，而能够获取用户和商品的异质性正是优秀的推荐模型具有的性质。最后，采用变分推断法逼近因子的后验分布，利用用户商品的向量分布预测未观测的用户商品对评分，向用户推荐隐在的高分商品。

所述方法包括：

A1：对于推荐系统尤其是隐反馈的情况，构造一种分层泊松模型。

对每一用户u构造长度为K的用户偏好向量θ_u，其中每个分量θ_uk～Gamma(a,ξ_u)，参数ξ_u定义为该用户的活跃度，且ξ_u～Gamma(a′,a′/b′)；(Gamma分布是统计中常见的概率分布，若随机变量x～Gamma(α,β)，则其中第一个参数α称为形状参数，第二个参数β称为尺度参数(倒数)，且α,β＞0)

对每一商品i构造长度为K的商品属性向量β_i，其中每个分量β_ik～Gamma(c,η_i)，参数η_i定义为该商品的流行度，且η_i～Gamma(c′,c′/d′)；

每组用户商品对的评分

参数等于用户偏好向量和商品属性向量的内积。

2：为简化参数推断，对每一组有效用户商品对构造长度为K的向量z_ui，其中每一个分量z_uik～Poisson(θ_ukβ_ik)，参数大小为对应用户偏好向量分量与商品属性向量分量乘积。该法巧妙利用泊松分布的两个性质，一是满足泊松分布的n个随机变量x₁,...x_n之和x＝∑_ix_i满足泊松分布，且参数为所有子泊松分布的参数之和，二是x₁,...x_n给定其和x的条件分布满足多项分布，即

A3：逼近后验分布时采用变分推断的方法，利用坐标上升法多次迭代直至收敛，推导出所有隐变量[β,θ,ξ,η,z]的近似分布；

A4：预测每组用户商品对评分，

根据得分大小排序可对用户进行最终的推荐。

图1清晰地表明了本文模型自底向上的层次性，U和D分别表示用户和商品集，中间灰色(表示观察量)表示用户u对商品i的评分，该评分满足Poisson分布，分布参数由用户向量θ_u和商品向量β_i的内积控制，同时，θ_u和β_i满足Gamma分布，其分布参数分别由(a,ξ_u)和(c,η_i)，其中的用户活跃度ξ_u和商品流行度η_i分别又满足Gamma分布，其参数分别由(a′,a′/b′)和(c′,c′/d′)控制。总之，这是一个三层模型，从最底层至最顶层分别是Poisson分布、Gamma分布、Gamma分布。

本实施例针对推荐系统尤其是隐反馈的推荐，提出一种基于泊松分布的推荐方法。对每一位用户构造偏好向量以及活跃度，并且均服从Gamma分布；对每一件商品构造属性向量以及流行度，也均服从Gamma分布；设定每一组用户商品的评分(隐反馈下为0或1)服从泊松分布，同时将其分解为用户商品评分贡献向量，其所有分量之和等于该组用户商品的评分，且每一分量均满足泊松分布。然后采用变分推断法，这里所有的隐变量，包括用户偏好向量，用户活跃度，商品属性向量，商品流行度以及构造的用户商品评分贡献向量，其完全条件分布均属于指数族分布，因此均具有条件共轭的性质，所有隐变量的变分分布均类似于对应的完全条件分布。最后，采用坐标上升法迭代直至所有的变分参数收敛。具体步骤如下：

A1-1：分别对用户和商品分别建模，对每一个用户u构造长度为K的用户偏好向量θ_u，该向量表示该用户的潜在特征，其中每个分量θ_uk～Gamma(a,ξ_u)，即每个分量满足Gamma分布，并且该分布中的参数ξ_u定义为该用户的活跃度，即用户消费的商品占所有商品的比例，且ξ_u～Gamma(a′,a′/b′)，即用户活跃度同样也满足Gamma分布；

A1-2：对于每件商品i构造长度为K的商品属性向量β_i，该向量同样表明了该商品的潜在特征，其中每一个分量β_ik～Gamma(c,η_i)，即每个分量满足Gamma分布，并且该分布中的参数η_i定义为该商品的流行度，即消费该商品的用户占所有用户的比例，且η_i～Gamma(c′,c′/d′)，即商品流行度同样也满足Gamma分布；

A1-3：最后，每组用户商品对的评分我们先验地认为满足Poisson分布，即

该分布中的参数等于用户偏好向量和商品属性向量的内积，这种做法很自然，因为Poisson分布的均值等于其参数；

A2：为方便后面的参数推断，使隐变量满足条件共轭的性质，对每一组有效(即有评分)用户商品对(u，i)构造长度为K的向量z_ui，其中每一个分量z_uik～Poisson(θ_ukβ_ik)，即满足泊松分布，参数大小为对应用户偏好向量分量与商品属性向量分量乘积，该分解同时也是对A1-3中泊松分布的分解，前提假设z_ui各分量相互独立。

A3：采用变分推断法逼近后验分布，通过坐标上升法，即假设其他隐变量分布已知，最大化关于当前目标变量分布的后验分布和真实分布之间的KL散度(KL距离)，通过多次迭代直至收敛，继而得出参数的近似后验分布，关于参数具体的迭代公式在下面的具体实施方案中给出；

A4：预测每组用户商品对评分，

根据得分大小排序可对用户进行最终的推荐。

在具体的实施方案中，可按下面方式操作，首先给出一般的解决思路：

按贝叶斯统计的一般框架，

其中x为观察变量，z为隐变量，P(z|x)为似然分布，p(z)为先验分布，p(x)为边际似然分布(置信度)，p(z|x)隐变量的后验分布。在本专利提出的算法中，涉及的隐变量如下：

用户u偏好向量第k个权重θ_uk，用户u的活跃度ξ_u；

商品i属性向量第k个权重β_ik，商品i的流行度η_i；

显式变量(观察变量)：所有的评分y_ui。

在计算边际分布时，由于其太过复杂或不可求得解析解，故采用变分推断法逼近后验分布。具体操作如下：

步骤A1中：首先构建如下模型：

用户u偏好向量θ_u，其分量θ_uk～Gamma(a,ξ_u)，ξ_u～Gamma(a′,a′/b′)；

商品i属性向量β_i，其分量β_ik～Gamma(c,η_i)，η_i～Gamma(c′,c′/d′)；

用户商品对(u，i)的评分

每对用户商品(u，i)辅助隐变量z_ui，其中每个成分z_uik～Poisson(θ_ukβ_ik)；

步骤A2中：在辅助变量z_ui的帮助下，各隐变量(非观察量)的完全条件分布(即目标变量在其他所有变量给定的条件分布)如下：

θ_uk|β,ξ,z,y～Gamma(a+∑_iz_uik,ξ_u+∑_iβ_ik)

β_ik|θ,η,z,y～Gamma(a+∑_uz_uik,η_i+∑_uθ_uk)

ξ_u|θ～Gamma(a′+Ka,b′+∑_kθ_uk)

η_i|β～Gamma(c′+Kc,d′+∑_kβ_ik)

因此在后面的变分推断中可以假设隐变量见独立且分布于上述一致，分别是Gamma分布以及多项分布。

步骤A3中：在变分推断中，采用坐标上升法迭代所有参数：

这里假设隐变量的后验分布可分解为各独立向量的分布乘积，即假设所有隐变量之间相互独立(实际上不可能)，其形式如下：

其中，商品属性满足Gamma分布，由于Gamma分布中涉及形状参数和尺度参数，在本专利中分别用上标shp和rte表示，因此λ_ik实际上表示两个参数

和

其中y_ui为用户u对i的评分，a为用户偏好的先验Gamma分布中形状参数，设为0.3，a′为用户活跃度的先验分布中的形状参数，设为0.3，b′为其尺度参数，设为1。

另外，辅助变量z_ui的后验多项分布中参数φ_ui按以下公式更新：

总之，所有参数总的迭代过程如下：

A1-1中：用户参数

A1-2中：商品参数

A1-3中：辅助变量

最终，当参数收敛时(可设定变化少于某个阈值，比如0.000001),即得到所有用户偏好权重、商品属性权重的分布，预测评分：

实验表明，采用该HPF(Hierarchical Poisson Factorization)模型，分层泊松分解有如下优点：

1、可以生成对商品用户的稀疏表示；

2、准确拟合了用户商品的长尾效应；

3、对未评分用户商品对有降权效果；

4、对稀疏评分矩阵可作出快速推断；

5、良好的拓展性，适用于大规模评分集。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效装置或等效方法变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种层次化商品信息过滤推荐方法，其特征在于包括如下步骤：

A1：对于推荐系统，构造一种分层泊松模型；具体包括如下步骤：

A1-1：对每一个用户u构造长度为K的用户偏好向量θ_u，该向量表示该用户的潜在特征，其中每个分量θ_uk～Gamma(a,ξ_u)，即每个分量满足Gamma分布，并且该分布中的参数ξ_u定义为该用户的活跃度，其为用户偏好向量满足Gamma分布中的尺度参数，即用户消费的商品占所有商品的比例，且ξ_u～Gamma(a′,a′/b′)，即用户活跃度同样也满足Gamma分布；其中参数a表示用户偏好向量满足Gamma分布中的形状参数，a’表示上述尺度参数ξ_u满足Gamma分布中的形状参数，a’/b’表示上述尺度参数ξ_u满足Gamma分布中的尺度参数；

A1-2：对于每件商品i构造长度为K的商品属性向量β_i，该向量同样表明了该商品的潜在特征，其中每一个分量β_ik～Gamma(c,η_i)，即每个分量满足Gamma分布，并且该分布中的参数η_i定义为该商品的流行度，其为商品属性向量满足Gamma分布中的尺度参数，即消费该商品的用户占所有用户的比例，且η_i～Gamma(c′,c′/d′)，即商品流行度同样也满足Gamma分布；其中参数c表示商品属性向量满足Gamma分布中的形状参数，c’表示上述尺度η_i参数满足Gamma分布中的形状参数，c’/d’表示上述尺度参数η_i满足Gamma分布中的尺度参数；

A2、对每一组有效用户商品对构造长度为K的向量z_ui，其中每一个分量z_uik～Poisson(θ_ukβ_ik)，评分大小为对应用户偏好向量与商品属性向量的内积，其中K为商品属性向量和用户偏好向量的长度，z_ui为每组用户、商品对构造的长度为K的辅助向量，θ_u为用户偏好向量，β_i为商品属性向量，k为分量的序号，u为用户序号，i为商品序号；

A3、采用变分推断的方法进行逼近后验分布，利用坐标上升法多次迭代直至收敛，推导出所有隐变量「β,θ,ξ,η,z]的近似分布；其中各参数的含义如下：β为β_i的集合，θ表示θ_u的集合；ξ表示ξ_u的集合，η为η_i的集合，z变量表示z_ui的集合；

A4、预测每组用户商品对评分，

根据得分大小排序可对用户进行最终的推荐，向用户推荐隐在的高分商品，其中上标T表示向量转置，将列向量转置为行向量；

其中，通过分层的泊松分布结构，捕捉用户偏好和商品属性的多样性。

2.如权利要求1所述的层次化商品信息过滤推荐方法，其特征在于：步骤A1 中，构造分层泊松分布是针对隐反馈的情况。

3.如权利要求1所述的层次化商品信息过滤推荐方法，其特征在于步骤A1还包括：

A1-3：每组用户商品对的评分假定满足Poisson分布，即

该分布中的参数等于用户偏好向量和商品属性向量的内积。

4.如权利要求1或2或3所述的层次化商品信息过滤推荐方法，其特征在于步骤A2中，假设z_ui各分量相互独立。

5.如权利要求1或2或3所述的层次化商品信息过滤推荐方法，其特征在于在于步骤A3中，通过坐标上升法，即假设其他隐变量分布已知，最大化关于当前目标变量分布的后验分布和真实分布之间的KL散度，通过多次迭代直至收敛，继而得出参数的近似后验分布。

6.如权利要求3所述的层次化商品信息过滤推荐方法，其特征是在于步骤A4中，在辅助变量z_ui的帮助下，各隐变量的完全条件分布如下：

θ_uk|β,ξ,z,y～Gamma(a+∑_iz_uik,ξ_u+∑_iβ_ik)

β_ik|θ,η,z,y～Gamma(a+∑_uz_uik,η_i+∑_uθ_uk)

ξ_u|θ～Gamma(a′+Ka,b′+∑_kθ_uk)

η_i|β～Gamma(c′+Kc,d′+∑_kβ_ik)

，其中y 为 y_ui 的集合， z_ui 为每组用户、商品对构造的长度为 K 的辅助向量。

7.如权利要求5所述的层次化商品信息过滤推荐方法，其特征是坐标上升法迭代所有参数包括：假设隐变量的后验分布可分解为各独立向量的分布乘积，即假设所有隐变量之间相互独立，其形式如下：

其中，q()表示概率分布，λ_ik为变分推断中商品属性满足Gamma分布中的形状或尺度参数，γ_uk为变分推断中用户偏好满足Gamma分布中的形状或尺寸参数，κ_u为变分推断中用户活跃度满足Gamma分布中的形状或尺度参数；商品属性满足Gamma分布，Gamma分布中涉及形状参数和尺度参数，在此分别用上标shp和rte表示，则λ_ik实际上表示两个参数