CN111612572A

CN111612572A - 一种基于推荐系统的自适应局部低秩矩阵近似建模方法

Info

Publication number: CN111612572A
Application number: CN202010349545.9A
Authority: CN
Inventors: 景丽萍; 刘华锋
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2020-09-01

Abstract

本发明提供了一种基于推荐系统的自适应局部低秩矩阵近似建模方法、推荐方法及推荐系统，用以解决现有技术中大数据背景下推荐系统性能不高的问题。所述基于推荐系统的自适应局部低秩矩阵近似建模方法，首先构建评分矩阵，再生成评分子矩阵，并自适应地确定每个子矩阵的秩，生成最优空间中局部隐表示，为评分子矩阵引入指示矩阵，并引入用户/物品偏置，构建观测评分模型，从而构建近似模型。本发明捕获了用户或物品的子集中的局部关联信息，允许在簇与簇之间动态分配统计容量，通过自动关联自适应地从每个子矩阵中挖掘用户或物品的隐表示，通过缺失机制确定潜在特征的重要性，在评分预测和排序预测上都显著地提升了推荐性能。

Description

一种基于推荐系统的自适应局部低秩矩阵近似建模方法

技术领域

本发明属于电子商务领域，具体涉及一种基于推荐系统的自适应局部低秩矩阵近似方法及近似模型。

背景技术

随着互联网技术的普及，电子商务已代替实体商铺成为人们日常生活及生产活动中的一种重要经济活动。推荐系统是利用电子商务网站向客户提供商品信息和建议，帮助用户决定应该购买什么产品，模拟销售人员帮助客户完成购买过程。矩阵近似是推荐系统中最有效的协同过滤方法之一，将推荐问题定义为在稀疏的用户-物品评分矩阵中对于未观测条目的预测任务。基于矩阵近似的主流推荐方法，假设整个稀疏评分矩阵是低秩的，这些方法通常可以有效地估计同时与多个或全部物品相关的全局结构，称为全局低秩矩阵近似。然而，当物品种类繁多、用户数量庞大且兴趣各异时，这些方法并不能取得较好的性能。

为了捕获用户多种多样的兴趣，越来越多的研究人员开始考虑用户之间或物品之间的局部关联信息。首先将原始的评分矩阵拆分为几个子矩阵，其中每个子矩阵包含一些志趣相投的用户和这些用户感兴趣的物品。在每个子矩阵中，采用低秩矩阵近似技术来建模子矩阵特定的用户和物品的隐表示。最后，使用子矩阵中预测结果的加权和来估计缺失的条目。这类方法被称为两阶段的分离局部低秩矩阵近似，也就是说，它们需要一个与低秩子矩阵近似解耦合的独立的评分矩阵划分阶段，之后通过一个统一的概率图模型将这两个阶段结合起来。尽管这些研究在一定程度上改进了全局低秩矩阵近似方法，却可能因为每个子矩阵只覆盖了某个特定用户或物品的部分评分信息而限制了推荐的质量，不能很好地处理当用户有多重兴趣的情况，这也使得低秩矩阵近似过分强调局部结构而忽略了全局信息。

最近，研究人员将全局低秩矩阵近似和局部低秩矩阵近似相结合，称作全局-局部低秩矩阵近似。有研究利用全局信息，通过高斯混合模型将用户和物品的全局隐表示和局部隐表示统一起来，提高推荐的准确性。通过对基于聚类的矩阵近似方法进行了扩展，使用预训练的标准矩阵近似模型来捕获全局信息，并将局部模型与全局信息相结合进行进一步的预测。将用户-物品子矩阵中的局部关联信息与所有用户或物品之间的公共关联信息统一起来是提升推荐性能的好方法。然而，与局部低秩矩阵近似方法一样，这些全局-局部低秩矩阵近似方法在确定用户或物品的表示时必须固定隐空间的大小。

然而，为所有用户和物品设置一个固定的隐空间大小无法完美地模拟整个评分矩阵的内部结构，这可能导致不完全的近似且预测精度下降；同时，当采用不同秩的全局低秩矩阵混合近似模型对整个评分矩阵进行近似时，全局低秩矩阵近似方法建立缺失机制通常以一种高度复杂的策略进行构建，由于在一个很大的范围内尝试不同的秩，具有很高的计算复杂度，计算数据量庞大，导致参数估计耗费了大量时间。

全局低秩矩阵近似方法仅仅考虑偏好矩阵的整体结构，而忽略了局部结构，而考虑局部结构信息的局部低秩矩阵近似方法面临着两方面的问题：一是在捕获局部信息的过程中如何自适应地决定子矩阵的数目而不是手工调节；另一个是如何自适应地为每个子矩阵设置合适的秩而不是固定所有子矩阵的秩。由于用户之间或物品之间的评分数量有着显著差异，因此为不同的子矩阵设置不同的秩是必要的。

为了有效地探索评分矩阵的全局和局部结构，研究人员将全局和局部隐表示的识别过程合并起来，或者将预先学习的全局结构嵌入到局部结构的训练过程之中。然而，这些方法面临着两方面的问题：一是在捕获局部信息的过程中如何自适应地决定子矩阵的数目而不是手工调节；另一个是如何自适应地为每个子矩阵设置合适的秩而不是固定所有子矩阵的秩。由于用户之间或物品之间的评分数量有着显著差异，因此为不同的子矩阵设置不同的秩是必要的。在这种情况下，具有较少评分的子矩阵应该是低秩的，而具有较多评分的子矩阵可能具有相对较高的秩。

此外，许多关于协同过滤和推荐系统的研究假设其缺失评分是随机缺失的，其本质意义是一个评分缺失的概率并不依赖于该评分值，或者其它任意的缺失评分值。然而，最近协同过滤中关于缺失数据的研究表明，推荐系统中的数据是非随机缺失的。关于缺失数据的不正确假设可能导致参数的有偏估计以及在各种推荐模型中的预测偏差。例如，用户不会给一个差的物品低评分值，而是倾向于根本不进行评分，而缺失机制依赖于评分值，此时推荐系统则无法获得良好的基础数据，无法取得较好的性能。

发明内容

为了提高推荐系统的性能，克服在大数据背景下推荐系统性能不高的问题，本发明提供了一种基于推荐系统的自适应局部低秩矩阵近似方法及近似模型(Adaptive LocalMatrix Appriximation,ALoMA)，通过非参数化的统一贝叶斯图模型，在确定评分子矩阵的同时，确定每个子矩阵的最优秩，在评分预测和排序预测上都显著地提升了推荐性能，并且能够友好地提供可解释的推荐结果。

为了实现上述目的，本发明采取了如下技术方案。

本发明一方面提供了一种基于推荐系统的自适应局部低秩矩阵近似建模方法，建模方法包括如下步骤：

步骤S1，构建评分矩阵；

步骤S2，根据评分矩阵，生成评分子矩阵；

步骤S3，根据评分子矩阵，自适应地确定每个子矩阵的秩，生成最优空间中局部隐表示；

步骤S4，依据用户注意力和物品吸引力因素，为每一个评分子矩阵引入一个指示矩阵；

步骤S5，根据指示矩阵及评分子矩阵，引入用户/物品偏置刻画全局的用户偏好和物品流行度，构建基于评分子矩阵的观测评分模型；

步骤S6，根据观测评分模型构建基于推荐系统的自适应局部低秩矩阵近似模型ALoMA；通过该自适应局部低秩矩阵近似模型ALoMA获得推荐方案。

优选地，步骤S1中，构建评分矩阵，进一步为，给定一个由n个用户和m个物品构成的的评分矩阵R＝[R_ij]_n×m，其中可观测到的元素R_ij记录了第i个用户给第j个物品的评分。

优选地，步骤S2中生成评分子矩阵，通过中国餐馆过程对评分矩阵中的行和列进行联合聚类，同时允许类别之间对统计容量进行动态分配，实现自适应确定评分子矩阵的生成。

优选地，步骤S4中，每个评分子矩阵R^(cd)的指示矩阵为X^(cd)，其中

表示评分

是可观测的，

表示评分是不可观测的。

优选地，步骤S5中，构建基于评分子矩阵的观测评分模型，进一步为，令bu_i和bv_j分别表示第i个用户和第j个物品的偏置，且假设其服从零均值的高斯分布，即

式(8)中σ_u和σ_v分别是用户和物品的方差。

优选地，基于推荐系统的自适应局部低秩矩阵近似建模方法，还包括：

步骤S7，对所建模型ALoMA的推断过程。

优选地，步骤S7进一步包括：

步骤S701，用户/物品类别分配推断；

步骤S702，更新用户/物品的局部隐表示；

步骤S703，更新用户注意力和物品吸引力；

步骤S704，更新用户/物品全局偏置；

步骤S705，方差推断。

步骤S8，对所建模型ALoMA的计算复杂度分析。

由上述本发明的实施例提供的技术方案可以看出，本发明实施例的一种基于推荐系统的自适应局部低秩矩阵近似建模方法、推荐方法及推荐系统，首先构建评分矩阵，再生成评分子矩阵，并自适应地确定每个子矩阵的秩，生成最优空间中局部隐表示，为评分子矩阵引入指示矩阵，并引入用户/物品偏置，构建观测评分模型，从而构建近似模型。本发明捕获了用户或物品的子集中的局部关联信息，允许在簇与簇之间动态分配统计容量，而不是预先定义簇的数量；从每个子矩阵中挖掘用户或物品的隐表示，通过自动关联确定技术自适应地确定每个子矩阵的最优秩；通过挖掘评分数据的缺失机制确定潜在特征的重要性；利用用户或物品的局部隐表示、潜在特征的重要性以及用户或物品的全局偏置进行推荐。其所构建的ALoMA模型，是一个统一贝叶斯矩阵分解模型，能够在确定评分子矩阵的同时，确定每个子矩阵的最优子空间，学习子矩阵特定的用户和物品的隐表示，并结合缺失机制估计潜在特征的重要性，四个部分无缝衔接并且相互促进，泛化误差界限得到了理论证明，保证了评分矩阵能够被近似。同时，采用基于Gibbs采样的高效算法对ALoMA模型进行推断，并且可以处理大规模的推荐数据。与目前最高水平的推荐方法相比较，ALoMA在评分预测和排序预测上都显著地提升了整个推荐系统的推荐性能，并且能够友好地提供可解释的推荐结果。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于推荐系统的自适应局部低秩矩阵近似模型框架示意图；

图2为本发明实施例提供的一种基于推荐系统的自适应局部低秩矩阵近似模型结构示意图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解，下面将结合附图以几个具体实施例为例做进一步的解释说明，且各个实施例并不构成对本发明实施例的限定。

第一实施例

本实施例提供了一种基于推荐系统的自适应局部低秩矩阵近似建模方法，所述建模方法包括如下步骤：

步骤S1，构建评分矩阵。

本步骤中所述构建评分矩阵，进一步为，给定一个由n个用户和m个物品构成的的评分矩阵R＝[R_ij]_n×m，其中可观测到的元素R_ij记录了第i个用户给第j个物品的评分。

本步骤中，通常，R非常稀疏(已知值的占比小于1％)，因此，目标是预测未知元素集合Π＝{(i,j):R_ij缺失}的评分值，并将该集合表示为R_Π。令X＝[X_ij∈{0,1}]_n×m表示一个指示矩阵，若R_ij为观测数据，则X_ij＝1；若R_ij为缺失数据，则X_ij＝0。

步骤S2，根据所述评分矩阵，生成评分子矩阵。

为了从大规模的评分矩阵R中捕获局部结构，将用户或物品分割为适当数目的群体，由此一个用户群体可以视为表现出对物品有着相似偏好的用户集合，一个物品集合可视为吸引用户的属性相似的物品集合。为了达成这个目标，将中国餐馆过程(CPR)应用于评分矩阵来对行和列进行联合聚类，同时允许类别之间对统计容量进行动态分配。具体地，对于用户i的类别分配

其中c_i∈{1,…,k_n}，以及物品j的类别分配

其中d_j∈{1,…,k_m}，其生成过程如下：

式(1)中，

和

为别表示参数为γ_c和γ_d的中国餐馆过程。

采用CPR是因为它可以视为基于非参数贝叶斯模型的Dirichlet过程，其类别的数目不受限制，也就是说，用户类别的数目k_n和物品类别的数目k_m可以自适应地确定而不需要预先设定。特别地，第一个用户被分配给第一个类别。第i个用户会有两种可能的情况：一是可能被分配给一个现有的类别c，其概率与类别c中已经存在的用户数量成正比；另一种是创建一个新的类别，其概率正比于尺度参数γ_c：

式(2)中，n_c表示用户类别c中已有用户数。

对物品而言，可以得到类似的表达式，其尺度参数为γ_d。γ_c和γ_d控制了创建新类别的概率，其值越大，类别数目就越大。在这种情况下，属于第c类的用户和属于第d类的物品构成了子类别(cd)。进而整个评分矩阵被分为了k_n×k_m个子矩阵，其中子矩阵可表示为R^(cd)。

步骤S3，根据所述评分子矩阵，自适应地确定每个子矩阵的秩，生成最优空间中局部隐表示。

由于每个子矩阵可能具有不同的秩，因此自适应地确定子矩阵的秩是必要的，由此在最优的隐空间中挖掘用户或物品的局部隐表示。例如，较稀疏的子矩阵应该具有较低的秩，而较稠密的子矩阵应该具有较高的秩。

对每一个子矩阵R^(cd)而言，令U^(cd)和V^(cd)分别表示用户和物品的隐表示，且可以表示为：

其中n^(cd)和m^(cd)分别是第cd个子矩阵中用户和物品的数目，r^(cd)是该子矩阵的最优秩。与PMF中的评分模型类似，隐向量

和

的第l个部分是通过一个均值为0，方差为

的高斯模型建模的，如下：

式(3)中，

为高斯分布，

为逆伽马分布，其中{η_a,η_b}为逆伽马分布的参数。

假设潜在特征是相互独立的。在这种情况下，

和

可通过如下高斯分布建模：

式(4)中

是隐表示的协方差矩阵，其第l个对角元素为

是一个对角矩阵。为了确定最优秩r^(cd)，采用自动关联方法进行确定。由于假设每一个潜在特征(l)都是零均值的，因此方差

较小的特征会接近于0。在这种情况下，方差较小的潜在特征将不被用于描述用户和物品。即只有较大方差的潜在特征(经验上大于0.05)才对于隐空间的形成有作用。

步骤S4，依据用户注意力和物品吸引力因素，为每一个所述评分子矩阵引入一个指示矩阵。

进一步地，为了构建在评分矩阵中的缺失机制，为每个评分子矩阵R^(cd)引入一个指示矩阵X^(cd)，其中

表示评分

是可观测的，否则

指示条目

在用户注意力和物品吸引力的帮助下构建，这是基于用户消费一件物品的概率取决于用户可能喜欢的因素(即用户的关注点)和物品强调的因素(即物品的吸引力)这一潜在的事实。

令

和

分别是第cd子矩阵中用户i的注意力向量和物品j的吸引力向量。由于指示条目

表示

是否可观测，本实施例采用伯努利分布来刻画：

式(5)中，

是均值为p的Bernoulli分布的概率密度函数。同时，元素

和

均独立服从Beta分布：

本实施例采用Beta分布是因为Beta分布是伯努利分布的共轭先验，从而使得基于采样的算法更为有效。在这样的情况下，元素

支持[0,1]数据，且

中的所有元素相互独立，因此每个用户可以同时关注多个方面。类似的，元素

也支持[0,1]数据，且

中的所有元素相互独立，因此每个物品可以同时从几个方面吸引用户。

那么对于每一个用户-物品对，可以估计用户注意力和物品吸引力中每个潜在特征的重要性：

当用户注意力和物品吸引力的第l个潜在特征均有较大的值时，元素

的值较大。系数

则保证了

的迹为1。

由此，可以得到所述评分子矩阵的指示矩阵为X^(cd)。

步骤S5，根据所述指示矩阵及评分子矩阵，引入用户/物品偏置刻画全局的用户偏好和物品流行度，构建基于评分子矩阵的观测评分模型。

本实施例中，除了关注评分矩阵的局部结构以外，还考虑了所有用户和物品的全局信息。特别地，本实施例中引入了用户/物品偏置来刻画全局的用户偏好和物品流行度。令bu_i和bv_j分别表示第i个用户和第j个物品的偏置，且假设其服从零均值的高斯分布，即

式(8)中σ_u和σ_v分别是用户和物品的方差。本实施例采用反伽马分布用以生成一个完整的贝叶斯方法。

每个观测评分都属于一个子矩阵，沿用概率矩阵分解中的思想，假设

服从高斯分布，使用均值

而不是

和方差σ^(cd)对

进行建模，如下：

式(9)中，

是一个对角矩阵，每个对角元素表示相应潜在特征的重要性。对每个子矩阵而言，当

时，将退回为原始的概率矩阵分解模型。与用户/物品的偏置类似，采用反伽马分布来得到完整的贝叶斯方法。

步骤S6，根据所述观测评分模型构建基于推荐系统的自适应局部低秩矩阵近似模型(Adaptive Local Matrix Appriximation,ALoMA)。

本步骤中，为了构建完整的贝叶斯方法，所有的参数：

Θ＝{η_a,η_b,ζ_a,ζ_b,σ_u,σ_v,γ_c,γ_d,σ^(cd),a_g,b_g,a_z,b_z}

都是从与似然项共轭的对应分布中生成的。

通过最大化观测数据和所有隐变量的联合概率，根据贝叶斯规则实现最大化所有隐变量的后验分布。联合概率可以表示为：

式(13)中，第一项通过公式(12)和公式(8)刻画观测评分和指示矩阵，第二项用于确定子矩阵特定的用户/物品隐表示和相应的潜在特征方差，并且自适应地确定用户/物品类别的最优数目，第三项用于为每个特征捕获用户注意力和物品吸引力，第四项用于将用户和物品分配到不同的类别，最后一项用于挖掘用户和物品的全局偏置，由此可以更为精确地近似观测评分。

下面通过一个具体的算法流程对本实施例的所述基于推荐系统的自适应局部低秩矩阵近似建模方法进行举例说明。

算法1：构建ALoMA模型

对于每个超参数：

生成超参数{η_a,η_b,ζ_a,ζ_b,μ_a,μ_b,v_a,v_b}

对于每个方差：

生成

对于每个用户i：

生成用户类别

生成用户偏置

对于每个物品j：

生成物品类别

生成用户偏置

对于每个子矩阵R^(cd)：

生成

对于隐空间的每个维度l：

生成

对于子类别(cd)中的每个用户i：

生成用户隐表示

生成用户注意力

对于子类别(cd)中的每个物品j：

生成物品隐表示

生成物品吸引力

对于指示子矩阵X^(cd)的每个元素：

生成布尔变量

对于子矩阵R^(cd)中用户i对物品j的观测评分：

生成评分

最后，通过该自适应局部低秩矩阵近似模型ALoMA获得推荐方案。

本实施例所述基于推荐系统的自适应局部低秩矩阵近似建模方法，还包括：

步骤S7，对所建模型ALoMA的推断过程。

在ALoMA模型中，学习了子矩阵R^(cd)特定的用户/物品类别分配变量c_i和d_j、用户隐表示U^(cd)、物品隐表示V^(cd)、用户注意力向量G^(cd)和物品吸引力向量Z^(cd)，用户/物品在完整评分矩阵上的全局偏置b_u和b_v，以及几个相关的变量σ_u,σ_v,σ^(cd),Λ^(cd)。由于变量和超参数的复耦合，很难直接最大化联合概率。本节中，在推断和变量更新的过程中采用了Gibbs采样算法，交替进行用户/物品类别分配推断，用户/物品隐表示、用户注意力、物品吸引力和用户/物品全局偏置的更新，以及相关参数的推断，直至算法收敛。

进一步地，对所建模型ALoMA的推断过程，包括：

步骤S701，用户/物品类别分配推断。

为进行用户类别成员的采样，需要指定用户类别分配的后验概率。本实施例介绍了离散类别成员的采样。特别地，每个用户类别c的条件概率由三部分组成：CPR先验、指示值的似然以及观测评分的似然。

固定所有用户/物品的局部隐表示、用户注意力、物品吸引力、全局偏置以及变量(将所有这样的变量表示为rest)，可以为每个用户导出其条件分布p(c_i＝c|rest)(即，用户i属于某已有类别c的条件概率)如下：

同时，用户i被分配给一个新的用户类别c_n的概率为：

式(12)中，

表示每个观测评分的近似误差，γ_c是控制生成新类别的概率的参数，n_c表示分配给类别c的用户数目，n是用户的总数目。

类似于(11)和(12)的策略，一个已有物品类别d和一个新类别d_n的后验分布可以近似为

和

步骤S702，更新用户/物品的局部隐表示。

对于每一个子矩阵，固定其全局偏置、用户注意力、物品吸引力和变量(将所有这样的变量表示为rest)，可以更新用户/物品的局部隐表示。

由于ALoMA模型中参数和超参数共轭先验的使用，用户局部隐表示

的条件分布服从高斯分布

式(15)中

式(16)中，用户潜在特征矩阵U^(cd)的条件分布可以分解为独立的用户特征向量条件分布的乘积

因此可以通过并行地从这些条件分布中采样来加速采样过程。当子矩阵中用户数目庞大时，这种加速可能是显著的。同时，可以对不同子矩阵的采样过程进行并行处理。物品的局部隐表示

可以通过类似的方法学得。

步骤S703，更新用户注意力和物品吸引力。

对于每一个指示子矩阵X^(cd)，固定用户局部隐表示U^(cd)、物品隐表示V^(cd)、物品吸引力向量Z^(cd)以及全局偏置，可以通过用户注意力先验、指示值的似然以及观测评分的似然导出用户注意力的第l个维度

的条件概率

为了有效地近似上述条件概率，本实施例用一个最优的高斯分布

来代替Beta分布

并通过最小化两者之间的KL散度实现这一过程。为了简便，将形状参数

表示为

表示为

式(19)中的优化问题可以通过固定除μ_g和σ_g外的所有参数解决。因此，用户注意力的第l个维度

的条件分布为

式(20)中

与局部隐表示类似，可以通过对不同用户的条件分布并行采样来加速采样过程。物品吸引力向量Z^(cd)可以通过类似的方法学得。

步骤S704，更新用户/物品全局偏置。

在给定其他变量时，用户全局偏置bu的条件分布是一个高斯分布

式(22)中

式(23)中

表示用户i是否属于子类别(cd)。物品全局偏置bv的更新过程与bu类似。

步骤S705，方差推断。

为了生成一个完全贝叶斯方法，四个方差{Λ^(cd),σ^(cd),σ_u,σ_v}(分别与局部隐表示、子矩阵中的评分、用户/物品全局偏置相关)服从逆伽马分布。可从如下的条件概率中生成：

式(24)中

式(25)中n_c是类别c中的用户数目，n_d是类别d中的用户数目，n_(cd)是子矩阵R^(cd)中观测评分的数目。

和

是指示函数，

意味着用户i属于用户类别c，其它情况下

在获得上述变量之后，可以通过如下公式预测未知评分

式(26)中

t是迭代的索引，T是总的迭代次数。在实验中，将前S次迭代(例如，S＝100)作为bun-in周期。

下面通过一个具体的算法流程对本实施例的所述基于推荐系统的自适应局部低秩矩阵近似建模方法中的步骤S7对所构建模型推断过程，进行举例说明。

算法2：ALoMA的推断过程

输入：n个用户和m个物品的评分矩阵R、CPR中的参数γ_c和γ_d、逆伽马分布中的参数{η,ζ,u,v}、Beta分布中的参数{a_g,b_g,a_z,b_z}、ARD的方差阈值∈_λ

当采样器未收敛时，循环进行

对于每个用户i：

根据公式(22)采样用户偏置bu_i，根据公式(11)或(12)采样用户类别c_i

对于每个物品j：

采样物品偏置bv_j，根据公式(13)或(14)采样物品类别d_j

对于每一个子类别(cd)：

对于子类别(cd)中的每个用户i：

根据公式(18)采样用户注意力的各个维度

根据公式(15)采样用户隐表示

对于子类别(cd)中的每个物品j：

采样物品吸引力的各个维度

采样物品隐表示

对于所有的变量：

根据公式(24)采样其方差Λ^(cd),σ^(cd),σ_u,σ_v

若相关的ARD方差低于预先定义的阈值∈λ，则降低某些维度

结束循环

输出：每个子类别相关的稳定变量U^(cd),V^(cd),G^(cd),Z^(cd)，以及bu和bv。

进一步地，本实施例所述基于推荐系统的自适应局部低秩矩阵近似建模方法，还包括：

步骤S8，对所建模型ALoMA的计算复杂度分析。

如算法2所示的所述对所建模型的推断过程即学习过程中，整个迭代过程将会一直执行，直到其收敛为止。为了有效地实现学习过程，其主要部分可以并行进行。

在每一次迭代中，更新全局偏置bu_i和bv_j的时间复杂度为

和

其中

是子矩阵(cd)中用户i进行评分的物品数目，r^(cd)表示包含n_c个用户和n_d个物品的子矩阵(cd)的排名。公式(14)和(15)中更新用户类别分配c_i的时间复杂度为

更新公式(18)中的

和公式(20)中的

的计算复杂度分别为

和

因此更新与某用户相关变量的计算复杂度最差为

类似地，更新与某物品相关变量的计算复杂度最差为

因此，经过T次迭代，推断过程的整体计算复杂度为

显然，由于与用户和物品相关的采样器是相互独立的，因此与用户或物品相关的变量可以在多核上并行更新，那么总体的计算复杂度与用户和物品数目线性相关，因此在实际中可以用于大规模数据集。

由以上技术方案可以看出，本实施例所述基于推荐系统的自适应局部低秩矩阵近似建模方法，捕获了用户或物品的子集中的局部关联信息，允许在簇与簇之间动态分配统计容量，而不是预先定义簇的数量；从每个子矩阵中挖掘用户或物品的隐表示，通过自动关联确定技术自适应地确定每个子矩阵的最优秩；通过挖掘评分数据的缺失机制确定潜在特征的重要性；利用用户或物品的局部隐表示、潜在特征的重要性以及用户或物品的全局偏置进行推荐。其所构建的ALoMA模型，是一个统一贝叶斯矩阵分解模型，能够在确定评分子矩阵的同时，确定每个子矩阵的最优子空间，学习子矩阵特定的用户和物品的隐表示，并结合缺失机制估计潜在特征的重要性，四个部分无缝衔接并且相互促进，泛化误差界限得到了理论证明，保证了评分矩阵能够被近似。同时，采用基于Gibbs采样的高效算法对ALoMA模型进行推断，并且可以处理大规模的推荐数据。与目前最高水平的推荐方法相比较，ALoMA在评分预测和排序预测上都显著地提升了推荐性能，并且能够友好地提供可解释的推荐结果。

第二实施例

本实施例提供了一种基于推荐系统的自适应局部低秩矩阵近似模型(AdaptiveLocal Matrix Appriximation,ALoMA)，图1所示为所述模型的框架示意图。如图1所示，所述模型包括：

由上述实施例一的方法获得的评分矩阵、用户物品子矩阵和用户物品特征表示矩阵。

进一步地，图2所示为所述模型的结构示意图。如图2所示，该模型包括：

评分矩阵R为一个由n个用户和m个物品构成的矩阵，c_i和d_j分别表示第i个用户和第j个物品所属类别，第ij个评分条目(R_ij)被分配到第cd个子矩阵

中；如果第i个用户属于第c类(即，c＝c_i)且第j个物品属于第d类(即，d＝d_j)，则第ij个评分条目(R_ij)会被分配到第cd个子矩阵

中。对于每一个子矩阵

引入一个指示矩阵

来表示评分是否缺失，其中n_c是用户类别c中的用户数目，n_d是物品类别d中的物品数目。

和

分别是第cd个子矩阵对应的用户和物品的隐表示。

控制子矩阵特定隐表示的第l个部分的生成过程。

由

和

共同建模，用于捕获评分条目中每个潜在特征的重要性。其中，

表示用户可能喜欢的物品特征，

是从指示矩阵X^(cd)中学到的，表示物品强调的特征。此外，bu_i和bv_j分别表示用于捕获全局用户或物品信息的偏置。所有的变量都可根据其分布生成。

本实施例所述基于推荐系统的自适应局部低秩矩阵近似模型，通过第一实施例所述基于推荐系统的自适应局部低秩矩阵近似建模方法进行构建，因此，对于第一实施例中相关技术特征的描述，同样适用于本实施例所述基于推荐系统的自适应局部低秩矩阵近似模型，在此不再赘述。

第三实施例

本实施例提供了一种推荐方法，所述推荐方法采用第二实施例所述的基于推荐系统的自适应局部低秩矩阵近似模型。

第四实施例

本实施例提供了一种推荐系统，所述推荐系统采用第二实施例所述的基于推荐系统的自适应局部低秩矩阵近似模型。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本领域普通技术人员可以理解：实施例中的装置中的部件可以按照实施例描述分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的部件可以合并为一个部件，也可以进一步拆分成多个子部件。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于推荐系统的自适应局部低秩矩阵近似建模方法，其特征在于，所述建模方法包括如下步骤：

步骤S1，构建评分矩阵；

步骤S2，根据所述评分矩阵，生成评分子矩阵；

步骤S3，根据所述评分子矩阵，自适应地确定每个子矩阵的秩，生成最优空间中局部隐表示；

步骤S4，依据用户注意力和物品吸引力因素，为每一个所述评分子矩阵引入一个指示矩阵；

步骤S5，根据所述指示矩阵及评分子矩阵，引入用户/物品偏置刻画全局的用户偏好和物品流行度，构建基于评分子矩阵的观测评分模型；

步骤S6，根据所述观测评分模型构建基于推荐系统的自适应局部低秩矩阵近似模型ALoMA；通过该自适应局部低秩矩阵近似模型ALoMA获得推荐方案。

2.根据权利要求1所述的自适应局部低秩矩阵近似建模方法，其特征在于，所述步骤S1中，所述构建评分矩阵，进一步为，给定一个由n个用户和m个物品构成的的评分矩阵R＝[R_ij]_n×m，其中可观测到的元素R_ij记录了第i个用户给第j个物品的评分。

3.根据权利要求2所述的自适应局部低秩矩阵近似建模方法，其特征在于，所述步骤S2中生成评分子矩阵，通过中国餐馆过程对评分矩阵中的行和列进行联合聚类，同时允许类别之间对统计容量进行动态分配，实现自适应确定评分子矩阵的生成。

4.根据权利要求3所述的自适应局部低秩矩阵近似建模方法，其特征在于，所述步骤S4中，每个评分子矩阵R^(cd)的指示矩阵为X^(cd)，其中

表示评分

是可观测的，

表示评分是不可观测的。

5.根据权利要求4所述的自适应局部低秩矩阵近似建模方法，其特征在于，所述步骤S5中，构建基于评分子矩阵的观测评分模型，进一步为，令bu_i和bv_j分别表示第i个用户和第j个物品的偏置，且假设其服从零均值的高斯分布，即

式(8)中σ_u和σ_v分别是用户和物品的方差。

6.根据权利要求1至5任一项所述的自适应局部低秩矩阵近似建模方法，其特征在于，所述基于推荐系统的自适应局部低秩矩阵近似建模方法，还包括：

步骤S7，对所建模型ALoMA的推断过程。

7.根据权利要求6任一项所述的自适应局部低秩矩阵近似建模方法，其特征在于，所述步骤S7进一步包括：

步骤S701，用户/物品类别分配推断；

步骤S702，更新用户/物品的局部隐表示；

步骤S703，更新用户注意力和物品吸引力；

步骤S704，更新用户/物品全局偏置；

步骤S705，方差推断。

8.根据权利要求1至5任一项所述的自适应局部低秩矩阵近似建模方法，其特征在于，所述基于推荐系统的自适应局部低秩矩阵近似建模方法，还包括：

步骤S8，对所建模型ALoMA的计算复杂度分析。