CN111612572A - 一种基于推荐系统的自适应局部低秩矩阵近似建模方法 - Google Patents

一种基于推荐系统的自适应局部低秩矩阵近似建模方法 Download PDF

Info

Publication number
CN111612572A
CN111612572A CN202010349545.9A CN202010349545A CN111612572A CN 111612572 A CN111612572 A CN 111612572A CN 202010349545 A CN202010349545 A CN 202010349545A CN 111612572 A CN111612572 A CN 111612572A
Authority
CN
China
Prior art keywords
matrix
scoring
user
rank
modeling method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010349545.9A
Other languages
English (en)
Inventor
景丽萍
刘华锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202010349545.9A priority Critical patent/CN111612572A/zh
Publication of CN111612572A publication Critical patent/CN111612572A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于推荐系统的自适应局部低秩矩阵近似建模方法、推荐方法及推荐系统,用以解决现有技术中大数据背景下推荐系统性能不高的问题。所述基于推荐系统的自适应局部低秩矩阵近似建模方法,首先构建评分矩阵,再生成评分子矩阵,并自适应地确定每个子矩阵的秩,生成最优空间中局部隐表示,为评分子矩阵引入指示矩阵,并引入用户/物品偏置,构建观测评分模型,从而构建近似模型。本发明捕获了用户或物品的子集中的局部关联信息,允许在簇与簇之间动态分配统计容量,通过自动关联自适应地从每个子矩阵中挖掘用户或物品的隐表示,通过缺失机制确定潜在特征的重要性,在评分预测和排序预测上都显著地提升了推荐性能。

Description

一种基于推荐系统的自适应局部低秩矩阵近似建模方法
技术领域
本发明属于电子商务领域,具体涉及一种基于推荐系统的自适应局部低秩矩阵近似方法及近似模型。
背景技术
随着互联网技术的普及,电子商务已代替实体商铺成为人们日常生活及生产活动中的一种重要经济活动。推荐系统是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。矩阵近似是推荐系统中最有效的协同过滤方法之一,将推荐问题定义为在稀疏的用户-物品评分矩阵中对于未观测条目的预测任务。基于矩阵近似的主流推荐方法,假设整个稀疏评分矩阵是低秩的,这些方法通常可以有效地估计同时与多个或全部物品相关的全局结构,称为全局低秩矩阵近似。然而,当物品种类繁多、用户数量庞大且兴趣各异时,这些方法并不能取得较好的性能。
为了捕获用户多种多样的兴趣,越来越多的研究人员开始考虑用户之间或物品之间的局部关联信息。首先将原始的评分矩阵拆分为几个子矩阵,其中每个子矩阵包含一些志趣相投的用户和这些用户感兴趣的物品。在每个子矩阵中,采用低秩矩阵近似技术来建模子矩阵特定的用户和物品的隐表示。最后,使用子矩阵中预测结果的加权和来估计缺失的条目。这类方法被称为两阶段的分离局部低秩矩阵近似,也就是说,它们需要一个与低秩子矩阵近似解耦合的独立的评分矩阵划分阶段,之后通过一个统一的概率图模型将这两个阶段结合起来。尽管这些研究在一定程度上改进了全局低秩矩阵近似方法,却可能因为每个子矩阵只覆盖了某个特定用户或物品的部分评分信息而限制了推荐的质量,不能很好地处理当用户有多重兴趣的情况,这也使得低秩矩阵近似过分强调局部结构而忽略了全局信息。
最近,研究人员将全局低秩矩阵近似和局部低秩矩阵近似相结合,称作全局-局部低秩矩阵近似。有研究利用全局信息,通过高斯混合模型将用户和物品的全局隐表示和局部隐表示统一起来,提高推荐的准确性。通过对基于聚类的矩阵近似方法进行了扩展,使用预训练的标准矩阵近似模型来捕获全局信息,并将局部模型与全局信息相结合进行进一步的预测。将用户-物品子矩阵中的局部关联信息与所有用户或物品之间的公共关联信息统一起来是提升推荐性能的好方法。然而,与局部低秩矩阵近似方法一样,这些全局-局部低秩矩阵近似方法在确定用户或物品的表示时必须固定隐空间的大小。
然而,为所有用户和物品设置一个固定的隐空间大小无法完美地模拟整个评分矩阵的内部结构,这可能导致不完全的近似且预测精度下降;同时,当采用不同秩的全局低秩矩阵混合近似模型对整个评分矩阵进行近似时,全局低秩矩阵近似方法建立缺失机制通常以一种高度复杂的策略进行构建,由于在一个很大的范围内尝试不同的秩,具有很高的计算复杂度,计算数据量庞大,导致参数估计耗费了大量时间。
全局低秩矩阵近似方法仅仅考虑偏好矩阵的整体结构,而忽略了局部结构,而考虑局部结构信息的局部低秩矩阵近似方法面临着两方面的问题:一是在捕获局部信息的过程中如何自适应地决定子矩阵的数目而不是手工调节;另一个是如何自适应地为每个子矩阵设置合适的秩而不是固定所有子矩阵的秩。由于用户之间或物品之间的评分数量有着显著差异,因此为不同的子矩阵设置不同的秩是必要的。
为了有效地探索评分矩阵的全局和局部结构,研究人员将全局和局部隐表示的识别过程合并起来,或者将预先学习的全局结构嵌入到局部结构的训练过程之中。然而,这些方法面临着两方面的问题:一是在捕获局部信息的过程中如何自适应地决定子矩阵的数目而不是手工调节;另一个是如何自适应地为每个子矩阵设置合适的秩而不是固定所有子矩阵的秩。由于用户之间或物品之间的评分数量有着显著差异,因此为不同的子矩阵设置不同的秩是必要的。在这种情况下,具有较少评分的子矩阵应该是低秩的,而具有较多评分的子矩阵可能具有相对较高的秩。
此外,许多关于协同过滤和推荐系统的研究假设其缺失评分是随机缺失的,其本质意义是一个评分缺失的概率并不依赖于该评分值,或者其它任意的缺失评分值。然而,最近协同过滤中关于缺失数据的研究表明,推荐系统中的数据是非随机缺失的。关于缺失数据的不正确假设可能导致参数的有偏估计以及在各种推荐模型中的预测偏差。例如,用户不会给一个差的物品低评分值,而是倾向于根本不进行评分,而缺失机制依赖于评分值,此时推荐系统则无法获得良好的基础数据,无法取得较好的性能。
发明内容
为了提高推荐系统的性能,克服在大数据背景下推荐系统性能不高的问题,本发明提供了一种基于推荐系统的自适应局部低秩矩阵近似方法及近似模型(Adaptive LocalMatrix Appriximation,ALoMA),通过非参数化的统一贝叶斯图模型,在确定评分子矩阵的同时,确定每个子矩阵的最优秩,在评分预测和排序预测上都显著地提升了推荐性能,并且能够友好地提供可解释的推荐结果。
为了实现上述目的,本发明采取了如下技术方案。
本发明一方面提供了一种基于推荐系统的自适应局部低秩矩阵近似建模方法,建模方法包括如下步骤:
步骤S1,构建评分矩阵;
步骤S2,根据评分矩阵,生成评分子矩阵;
步骤S3,根据评分子矩阵,自适应地确定每个子矩阵的秩,生成最优空间中局部隐表示;
步骤S4,依据用户注意力和物品吸引力因素,为每一个评分子矩阵引入一个指示矩阵;
步骤S5,根据指示矩阵及评分子矩阵,引入用户/物品偏置刻画全局的用户偏好和物品流行度,构建基于评分子矩阵的观测评分模型;
步骤S6,根据观测评分模型构建基于推荐系统的自适应局部低秩矩阵近似模型ALoMA;通过该自适应局部低秩矩阵近似模型ALoMA获得推荐方案。
优选地,步骤S1中,构建评分矩阵,进一步为,给定一个由n个用户和m个物品构成的的评分矩阵R=[Rij]n×m,其中可观测到的元素Rij记录了第i个用户给第j个物品的评分。
优选地,步骤S2中生成评分子矩阵,通过中国餐馆过程对评分矩阵中的行和列进行联合聚类,同时允许类别之间对统计容量进行动态分配,实现自适应确定评分子矩阵的生成。
优选地,步骤S4中,每个评分子矩阵R(cd)的指示矩阵为X(cd),其中
Figure BDA0002471457350000041
表示评分
Figure BDA0002471457350000042
是可观测的,
Figure BDA0002471457350000043
表示评分是不可观测的。
优选地,步骤S5中,构建基于评分子矩阵的观测评分模型,进一步为,令bui和bvj分别表示第i个用户和第j个物品的偏置,且假设其服从零均值的高斯分布,即
Figure BDA0002471457350000045
式(8)中σu和σv分别是用户和物品的方差。
优选地,基于推荐系统的自适应局部低秩矩阵近似建模方法,还包括:
步骤S7,对所建模型ALoMA的推断过程。
优选地,步骤S7进一步包括:
步骤S701,用户/物品类别分配推断;
步骤S702,更新用户/物品的局部隐表示;
步骤S703,更新用户注意力和物品吸引力;
步骤S704,更新用户/物品全局偏置;
步骤S705,方差推断。
优选地,基于推荐系统的自适应局部低秩矩阵近似建模方法,还包括:
步骤S8,对所建模型ALoMA的计算复杂度分析。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例的一种基于推荐系统的自适应局部低秩矩阵近似建模方法、推荐方法及推荐系统,首先构建评分矩阵,再生成评分子矩阵,并自适应地确定每个子矩阵的秩,生成最优空间中局部隐表示,为评分子矩阵引入指示矩阵,并引入用户/物品偏置,构建观测评分模型,从而构建近似模型。本发明捕获了用户或物品的子集中的局部关联信息,允许在簇与簇之间动态分配统计容量,而不是预先定义簇的数量;从每个子矩阵中挖掘用户或物品的隐表示,通过自动关联确定技术自适应地确定每个子矩阵的最优秩;通过挖掘评分数据的缺失机制确定潜在特征的重要性;利用用户或物品的局部隐表示、潜在特征的重要性以及用户或物品的全局偏置进行推荐。其所构建的ALoMA模型,是一个统一贝叶斯矩阵分解模型,能够在确定评分子矩阵的同时,确定每个子矩阵的最优子空间,学习子矩阵特定的用户和物品的隐表示,并结合缺失机制估计潜在特征的重要性,四个部分无缝衔接并且相互促进,泛化误差界限得到了理论证明,保证了评分矩阵能够被近似。同时,采用基于Gibbs采样的高效算法对ALoMA模型进行推断,并且可以处理大规模的推荐数据。与目前最高水平的推荐方法相比较,ALoMA在评分预测和排序预测上都显著地提升了整个推荐系统的推荐性能,并且能够友好地提供可解释的推荐结果。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于推荐系统的自适应局部低秩矩阵近似模型框架示意图;
图2为本发明实施例提供的一种基于推荐系统的自适应局部低秩矩阵近似模型结构示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
第一实施例
本实施例提供了一种基于推荐系统的自适应局部低秩矩阵近似建模方法,所述建模方法包括如下步骤:
步骤S1,构建评分矩阵。
本步骤中所述构建评分矩阵,进一步为,给定一个由n个用户和m个物品构成的的评分矩阵R=[Rij]n×m,其中可观测到的元素Rij记录了第i个用户给第j个物品的评分。
本步骤中,通常,R非常稀疏(已知值的占比小于1%),因此,目标是预测未知元素集合Π={(i,j):Rij缺失}的评分值,并将该集合表示为RΠ。令X=[Xij∈{0,1}]n×m表示一个指示矩阵,若Rij为观测数据,则Xij=1;若Rij为缺失数据,则Xij=0。
步骤S2,根据所述评分矩阵,生成评分子矩阵。
为了从大规模的评分矩阵R中捕获局部结构,将用户或物品分割为适当数目的群体,由此一个用户群体可以视为表现出对物品有着相似偏好的用户集合,一个物品集合可视为吸引用户的属性相似的物品集合。为了达成这个目标,将中国餐馆过程(CPR)应用于评分矩阵来对行和列进行联合聚类,同时允许类别之间对统计容量进行动态分配。具体地,对于用户i的类别分配
Figure BDA0002471457350000071
其中ci∈{1,…,kn},以及物品j的类别分配
Figure BDA0002471457350000072
其中dj∈{1,…,km},其生成过程如下:
Figure BDA0002471457350000073
式(1)中,
Figure BDA0002471457350000074
Figure BDA0002471457350000075
为别表示参数为γc和γd的中国餐馆过程。
采用CPR是因为它可以视为基于非参数贝叶斯模型的Dirichlet过程,其类别的数目不受限制,也就是说,用户类别的数目kn和物品类别的数目km可以自适应地确定而不需要预先设定。特别地,第一个用户被分配给第一个类别。第i个用户会有两种可能的情况:一是可能被分配给一个现有的类别c,其概率与类别c中已经存在的用户数量成正比;另一种是创建一个新的类别,其概率正比于尺度参数γc
Figure BDA0002471457350000081
式(2)中,nc表示用户类别c中已有用户数。
对物品而言,可以得到类似的表达式,其尺度参数为γd。γc和γd控制了创建新类别的概率,其值越大,类别数目就越大。在这种情况下,属于第c类的用户和属于第d类的物品构成了子类别(cd)。进而整个评分矩阵被分为了kn×km个子矩阵,其中子矩阵可表示为R(cd)
步骤S3,根据所述评分子矩阵,自适应地确定每个子矩阵的秩,生成最优空间中局部隐表示。
由于每个子矩阵可能具有不同的秩,因此自适应地确定子矩阵的秩是必要的,由此在最优的隐空间中挖掘用户或物品的局部隐表示。例如,较稀疏的子矩阵应该具有较低的秩,而较稠密的子矩阵应该具有较高的秩。
对每一个子矩阵R(cd)而言,令U(cd)和V(cd)分别表示用户和物品的隐表示,且可以表示为:
Figure BDA0002471457350000082
Figure BDA0002471457350000083
其中n(cd)和m(cd)分别是第cd个子矩阵中用户和物品的数目,r(cd)是该子矩阵的最优秩。与PMF中的评分模型类似,隐向量
Figure BDA0002471457350000084
Figure BDA0002471457350000085
的第l个部分是通过一个均值为0,方差为
Figure BDA0002471457350000086
的高斯模型建模的,如下:
Figure BDA0002471457350000092
式(3)中,
Figure BDA0002471457350000093
为高斯分布,
Figure BDA0002471457350000094
为逆伽马分布,其中{ηab}为逆伽马分布的参数。
假设潜在特征是相互独立的。在这种情况下,
Figure BDA0002471457350000095
Figure BDA0002471457350000096
可通过如下高斯分布建模:
Figure BDA0002471457350000098
式(4)中
Figure BDA0002471457350000099
是隐表示的协方差矩阵,其第l个对角元素为
Figure BDA00024714573500000910
是一个对角矩阵。为了确定最优秩r(cd),采用自动关联方法进行确定。由于假设每一个潜在特征(l)都是零均值的,因此方差
Figure BDA00024714573500000911
较小的特征会接近于0。在这种情况下,方差较小的潜在特征将不被用于描述用户和物品。即只有较大方差的潜在特征(经验上大于0.05)才对于隐空间的形成有作用。
步骤S4,依据用户注意力和物品吸引力因素,为每一个所述评分子矩阵引入一个指示矩阵。
进一步地,为了构建在评分矩阵中的缺失机制,为每个评分子矩阵R(cd)引入一个指示矩阵X(cd),其中
Figure BDA00024714573500000912
表示评分
Figure BDA00024714573500000913
是可观测的,否则
Figure BDA00024714573500000914
指示条目
Figure BDA00024714573500000915
在用户注意力和物品吸引力的帮助下构建,这是基于用户消费一件物品的概率取决于用户可能喜欢的因素(即用户的关注点)和物品强调的因素(即物品的吸引力)这一潜在的事实。
Figure BDA00024714573500000916
Figure BDA00024714573500000917
分别是第cd子矩阵中用户i的注意力向量和物品j的吸引力向量。由于指示条目
Figure BDA00024714573500000918
表示
Figure BDA00024714573500000919
是否可观测,本实施例采用伯努利分布来刻画:
Figure BDA0002471457350000101
式(5)中,
Figure BDA0002471457350000102
是均值为p的Bernoulli分布的概率密度函数。同时,元素
Figure BDA0002471457350000103
Figure BDA0002471457350000104
均独立服从Beta分布:
Figure BDA0002471457350000105
本实施例采用Beta分布是因为Beta分布是伯努利分布的共轭先验,从而使得基于采样的算法更为有效。在这样的情况下,元素
Figure BDA0002471457350000106
支持[0,1]数据,且
Figure BDA0002471457350000107
中的所有元素相互独立,因此每个用户可以同时关注多个方面。类似的,元素
Figure BDA0002471457350000108
也支持[0,1]数据,且
Figure BDA0002471457350000109
中的所有元素相互独立,因此每个物品可以同时从几个方面吸引用户。
那么对于每一个用户-物品对,可以估计用户注意力和物品吸引力中每个潜在特征的重要性:
Figure BDA00024714573500001010
当用户注意力和物品吸引力的第l个潜在特征均有较大的值时,元素
Figure BDA00024714573500001011
的值较大。系数
Figure BDA00024714573500001012
则保证了
Figure BDA00024714573500001013
的迹为1。
由此,可以得到所述评分子矩阵的指示矩阵为X(cd)
步骤S5,根据所述指示矩阵及评分子矩阵,引入用户/物品偏置刻画全局的用户偏好和物品流行度,构建基于评分子矩阵的观测评分模型。
本实施例中,除了关注评分矩阵的局部结构以外,还考虑了所有用户和物品的全局信息。特别地,本实施例中引入了用户/物品偏置来刻画全局的用户偏好和物品流行度。令bui和bvj分别表示第i个用户和第j个物品的偏置,且假设其服从零均值的高斯分布,即
Figure BDA00024714573500001015
式(8)中σu和σv分别是用户和物品的方差。本实施例采用反伽马分布用以生成一个完整的贝叶斯方法。
每个观测评分都属于一个子矩阵,沿用概率矩阵分解中的思想,假设
Figure BDA0002471457350000111
服从高斯分布,使用均值
Figure BDA0002471457350000112
而不是
Figure BDA0002471457350000113
和方差σ(cd)
Figure BDA0002471457350000114
进行建模,如下:
Figure BDA0002471457350000116
式(9)中,
Figure BDA0002471457350000117
是一个对角矩阵,每个对角元素表示相应潜在特征的重要性。对每个子矩阵而言,当
Figure BDA0002471457350000118
时,将退回为原始的概率矩阵分解模型。与用户/物品的偏置类似,采用反伽马分布来得到完整的贝叶斯方法。
步骤S6,根据所述观测评分模型构建基于推荐系统的自适应局部低秩矩阵近似模型(Adaptive Local Matrix Appriximation,ALoMA)。
本步骤中,为了构建完整的贝叶斯方法,所有的参数:
Θ={ηababuvcd(cd),ag,bg,az,bz}
都是从与似然项共轭的对应分布中生成的。
通过最大化观测数据和所有隐变量的联合概率,根据贝叶斯规则实现最大化所有隐变量的后验分布。联合概率可以表示为:
Figure BDA0002471457350000119
Figure BDA0002471457350000121
式(13)中,第一项通过公式(12)和公式(8)刻画观测评分和指示矩阵,第二项用于确定子矩阵特定的用户/物品隐表示和相应的潜在特征方差,并且自适应地确定用户/物品类别的最优数目,第三项用于为每个特征捕获用户注意力和物品吸引力,第四项用于将用户和物品分配到不同的类别,最后一项用于挖掘用户和物品的全局偏置,由此可以更为精确地近似观测评分。
下面通过一个具体的算法流程对本实施例的所述基于推荐系统的自适应局部低秩矩阵近似建模方法进行举例说明。
算法1:构建ALoMA模型
对于每个超参数:
生成超参数{ηababab,va,vb}
对于每个方差:
生成
Figure BDA0002471457350000122
对于每个用户i:
生成用户类别
Figure BDA0002471457350000123
生成用户偏置
Figure BDA0002471457350000124
对于每个物品j:
生成物品类别
Figure BDA0002471457350000125
生成用户偏置
Figure BDA0002471457350000126
对于每个子矩阵R(cd)
生成
Figure BDA0002471457350000127
对于隐空间的每个维度l:
生成
Figure BDA0002471457350000131
对于子类别(cd)中的每个用户i:
生成用户隐表示
Figure BDA0002471457350000132
生成用户注意力
Figure BDA0002471457350000133
对于子类别(cd)中的每个物品j:
生成物品隐表示
Figure BDA0002471457350000134
生成物品吸引力
Figure BDA0002471457350000135
对于指示子矩阵X(cd)的每个元素:
生成布尔变量
Figure BDA0002471457350000136
对于子矩阵R(cd)中用户i对物品j的观测评分:
生成评分
Figure BDA0002471457350000137
最后,通过该自适应局部低秩矩阵近似模型ALoMA获得推荐方案。
本实施例所述基于推荐系统的自适应局部低秩矩阵近似建模方法,还包括:
步骤S7,对所建模型ALoMA的推断过程。
在ALoMA模型中,学习了子矩阵R(cd)特定的用户/物品类别分配变量ci和dj、用户隐表示U(cd)、物品隐表示V(cd)、用户注意力向量G(cd)和物品吸引力向量Z(cd),用户/物品在完整评分矩阵上的全局偏置bu和bv,以及几个相关的变量σuv(cd)(cd)。由于变量和超参数的复耦合,很难直接最大化联合概率。本节中,在推断和变量更新的过程中采用了Gibbs采样算法,交替进行用户/物品类别分配推断,用户/物品隐表示、用户注意力、物品吸引力和用户/物品全局偏置的更新,以及相关参数的推断,直至算法收敛。
进一步地,对所建模型ALoMA的推断过程,包括:
步骤S701,用户/物品类别分配推断。
为进行用户类别成员的采样,需要指定用户类别分配的后验概率。本实施例介绍了离散类别成员的采样。特别地,每个用户类别c的条件概率由三部分组成:CPR先验、指示值的似然以及观测评分的似然。
固定所有用户/物品的局部隐表示、用户注意力、物品吸引力、全局偏置以及变量(将所有这样的变量表示为rest),可以为每个用户导出其条件分布p(ci=c|rest)(即,用户i属于某已有类别c的条件概率)如下:
Figure BDA0002471457350000141
同时,用户i被分配给一个新的用户类别cn的概率为:
Figure BDA0002471457350000142
式(12)中,
Figure BDA0002471457350000143
表示每个观测评分的近似误差,γc是控制生成新类别的概率的参数,nc表示分配给类别c的用户数目,n是用户的总数目。
类似于(11)和(12)的策略,一个已有物品类别d和一个新类别dn的后验分布可以近似为
Figure BDA0002471457350000151
Figure BDA0002471457350000152
步骤S702,更新用户/物品的局部隐表示。
对于每一个子矩阵,固定其全局偏置、用户注意力、物品吸引力和变量(将所有这样的变量表示为rest),可以更新用户/物品的局部隐表示。
由于ALoMA模型中参数和超参数共轭先验的使用,用户局部隐表示
Figure BDA0002471457350000153
的条件分布服从高斯分布
Figure BDA0002471457350000154
Figure BDA0002471457350000161
式(15)中
Figure BDA0002471457350000163
式(16)中,用户潜在特征矩阵U(cd)的条件分布可以分解为独立的用户特征向量条件分布的乘积
Figure BDA0002471457350000164
因此可以通过并行地从这些条件分布中采样来加速采样过程。当子矩阵中用户数目庞大时,这种加速可能是显著的。同时,可以对不同子矩阵的采样过程进行并行处理。物品的局部隐表示
Figure BDA0002471457350000165
可以通过类似的方法学得。
步骤S703,更新用户注意力和物品吸引力。
对于每一个指示子矩阵X(cd),固定用户局部隐表示U(cd)、物品隐表示V(cd)、物品吸引力向量Z(cd)以及全局偏置,可以通过用户注意力先验、指示值的似然以及观测评分的似然导出用户注意力的第l个维度
Figure BDA0002471457350000166
的条件概率
Figure BDA0002471457350000167
Figure BDA0002471457350000171
为了有效地近似上述条件概率,本实施例用一个最优的高斯分布
Figure BDA0002471457350000172
来代替Beta分布
Figure BDA0002471457350000173
并通过最小化两者之间的KL散度实现这一过程。为了简便,将形状参数
Figure BDA0002471457350000174
表示为
Figure BDA0002471457350000175
表示为
Figure BDA0002471457350000176
Figure BDA0002471457350000177
式(19)中的优化问题可以通过固定除μg和σg外的所有参数解决。因此,用户注意力的第l个维度
Figure BDA0002471457350000178
的条件分布为
Figure BDA0002471457350000179
式(20)中
Figure BDA0002471457350000182
与局部隐表示类似,可以通过对不同用户的条件分布并行采样来加速采样过程。物品吸引力向量Z(cd)可以通过类似的方法学得。
步骤S704,更新用户/物品全局偏置。
在给定其他变量时,用户全局偏置bu的条件分布是一个高斯分布
Figure BDA0002471457350000183
式(22)中
Figure BDA0002471457350000185
式(23)中
Figure BDA0002471457350000186
表示用户i是否属于子类别(cd)。物品全局偏置bv的更新过程与bu类似。
步骤S705,方差推断。
为了生成一个完全贝叶斯方法,四个方差{Λ(cd)(cd)uv}(分别与局部隐表示、子矩阵中的评分、用户/物品全局偏置相关)服从逆伽马分布。可从如下的条件概率中生成:
Figure BDA0002471457350000187
Figure BDA0002471457350000193
式(24)中
Figure BDA0002471457350000197
式(25)中nc是类别c中的用户数目,nd是类别d中的用户数目,n(cd)是子矩阵R(cd)中观测评分的数目。
Figure BDA0002471457350000198
Figure BDA0002471457350000199
是指示函数,
Figure BDA00024714573500001910
意味着用户i属于用户类别c,其它情况下
Figure BDA00024714573500001911
在获得上述变量之后,可以通过如下公式预测未知评分
Figure BDA00024714573500001912
式(26)中
Figure BDA00024714573500001913
t是迭代的索引,T是总的迭代次数。在实验中,将前S次迭代(例如,S=100)作为bun-in周期。
下面通过一个具体的算法流程对本实施例的所述基于推荐系统的自适应局部低秩矩阵近似建模方法中的步骤S7对所构建模型推断过程,进行举例说明。
算法2:ALoMA的推断过程
输入:n个用户和m个物品的评分矩阵R、CPR中的参数γc和γd、逆伽马分布中的参数{η,ζ,u,v}、Beta分布中的参数{ag,bg,az,bz}、ARD的方差阈值∈λ
当采样器未收敛时,循环进行
对于每个用户i:
根据公式(22)采样用户偏置bui,根据公式(11)或(12)采样用户类别ci
对于每个物品j:
采样物品偏置bvj,根据公式(13)或(14)采样物品类别dj
对于每一个子类别(cd):
对于子类别(cd)中的每个用户i:
根据公式(18)采样用户注意力的各个维度
Figure BDA0002471457350000201
根据公式(15)采样用户隐表示
Figure BDA0002471457350000202
对于子类别(cd)中的每个物品j:
采样物品吸引力的各个维度
Figure BDA0002471457350000203
采样物品隐表示
Figure BDA0002471457350000204
对于所有的变量:
根据公式(24)采样其方差Λ(cd)(cd)uv
若相关的ARD方差低于预先定义的阈值∈λ,则降低某些维度
结束循环
输出:每个子类别相关的稳定变量U(cd),V(cd),G(cd),Z(cd),以及bu和bv。
进一步地,本实施例所述基于推荐系统的自适应局部低秩矩阵近似建模方法,还包括:
步骤S8,对所建模型ALoMA的计算复杂度分析。
如算法2所示的所述对所建模型的推断过程即学习过程中,整个迭代过程将会一直执行,直到其收敛为止。为了有效地实现学习过程,其主要部分可以并行进行。
在每一次迭代中,更新全局偏置bui和bvj的时间复杂度为
Figure BDA0002471457350000211
Figure BDA0002471457350000212
其中
Figure BDA0002471457350000213
是子矩阵(cd)中用户i进行评分的物品数目,r(cd)表示包含nc个用户和nd个物品的子矩阵(cd)的排名。公式(14)和(15)中更新用户类别分配ci的时间复杂度为
Figure BDA0002471457350000214
Figure BDA0002471457350000215
更新公式(18)中的
Figure BDA0002471457350000216
和公式(20)中的
Figure BDA0002471457350000217
的计算复杂度分别为
Figure BDA0002471457350000218
Figure BDA0002471457350000219
因此更新与某用户相关变量的计算复杂度最差为
Figure BDA00024714573500002110
类似地,更新与某物品相关变量的计算复杂度最差为
Figure BDA00024714573500002111
因此,经过T次迭代,推断过程的整体计算复杂度为
Figure BDA00024714573500002112
显然,由于与用户和物品相关的采样器是相互独立的,因此与用户或物品相关的变量可以在多核上并行更新,那么总体的计算复杂度与用户和物品数目线性相关,因此在实际中可以用于大规模数据集。
由以上技术方案可以看出,本实施例所述基于推荐系统的自适应局部低秩矩阵近似建模方法,捕获了用户或物品的子集中的局部关联信息,允许在簇与簇之间动态分配统计容量,而不是预先定义簇的数量;从每个子矩阵中挖掘用户或物品的隐表示,通过自动关联确定技术自适应地确定每个子矩阵的最优秩;通过挖掘评分数据的缺失机制确定潜在特征的重要性;利用用户或物品的局部隐表示、潜在特征的重要性以及用户或物品的全局偏置进行推荐。其所构建的ALoMA模型,是一个统一贝叶斯矩阵分解模型,能够在确定评分子矩阵的同时,确定每个子矩阵的最优子空间,学习子矩阵特定的用户和物品的隐表示,并结合缺失机制估计潜在特征的重要性,四个部分无缝衔接并且相互促进,泛化误差界限得到了理论证明,保证了评分矩阵能够被近似。同时,采用基于Gibbs采样的高效算法对ALoMA模型进行推断,并且可以处理大规模的推荐数据。与目前最高水平的推荐方法相比较,ALoMA在评分预测和排序预测上都显著地提升了推荐性能,并且能够友好地提供可解释的推荐结果。
第二实施例
本实施例提供了一种基于推荐系统的自适应局部低秩矩阵近似模型(AdaptiveLocal Matrix Appriximation,ALoMA),图1所示为所述模型的框架示意图。如图1所示,所述模型包括:
由上述实施例一的方法获得的评分矩阵、用户物品子矩阵和用户物品特征表示矩阵。
进一步地,图2所示为所述模型的结构示意图。如图2所示,该模型包括:
评分矩阵R为一个由n个用户和m个物品构成的矩阵,ci和dj分别表示第i个用户和第j个物品所属类别,第ij个评分条目(Rij)被分配到第cd个子矩阵
Figure BDA0002471457350000221
中;如果第i个用户属于第c类(即,c=ci)且第j个物品属于第d类(即,d=dj),则第ij个评分条目(Rij)会被分配到第cd个子矩阵
Figure BDA0002471457350000222
中。对于每一个子矩阵
Figure BDA0002471457350000223
引入一个指示矩阵
Figure BDA0002471457350000224
来表示评分是否缺失,其中nc是用户类别c中的用户数目,nd是物品类别d中的物品数目。
Figure BDA0002471457350000225
Figure BDA0002471457350000226
分别是第cd个子矩阵对应的用户和物品的隐表示。
Figure BDA0002471457350000227
控制子矩阵特定隐表示的第l个部分的生成过程。
Figure BDA0002471457350000228
Figure BDA0002471457350000229
Figure BDA00024714573500002210
共同建模,用于捕获评分条目中每个潜在特征的重要性。其中,
Figure BDA0002471457350000231
表示用户可能喜欢的物品特征,
Figure BDA0002471457350000232
是从指示矩阵X(cd)中学到的,表示物品强调的特征。此外,bui和bvj分别表示用于捕获全局用户或物品信息的偏置。所有的变量都可根据其分布生成。
本实施例所述基于推荐系统的自适应局部低秩矩阵近似模型,通过第一实施例所述基于推荐系统的自适应局部低秩矩阵近似建模方法进行构建,因此,对于第一实施例中相关技术特征的描述,同样适用于本实施例所述基于推荐系统的自适应局部低秩矩阵近似模型,在此不再赘述。
第三实施例
本实施例提供了一种推荐方法,所述推荐方法采用第二实施例所述的基于推荐系统的自适应局部低秩矩阵近似模型。
第四实施例
本实施例提供了一种推荐系统,所述推荐系统采用第二实施例所述的基于推荐系统的自适应局部低秩矩阵近似模型。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本领域普通技术人员可以理解:实施例中的装置中的部件可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的部件可以合并为一个部件,也可以进一步拆分成多个子部件。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种基于推荐系统的自适应局部低秩矩阵近似建模方法,其特征在于,所述建模方法包括如下步骤:
步骤S1,构建评分矩阵;
步骤S2,根据所述评分矩阵,生成评分子矩阵;
步骤S3,根据所述评分子矩阵,自适应地确定每个子矩阵的秩,生成最优空间中局部隐表示;
步骤S4,依据用户注意力和物品吸引力因素,为每一个所述评分子矩阵引入一个指示矩阵;
步骤S5,根据所述指示矩阵及评分子矩阵,引入用户/物品偏置刻画全局的用户偏好和物品流行度,构建基于评分子矩阵的观测评分模型;
步骤S6,根据所述观测评分模型构建基于推荐系统的自适应局部低秩矩阵近似模型ALoMA;通过该自适应局部低秩矩阵近似模型ALoMA获得推荐方案。
2.根据权利要求1所述的自适应局部低秩矩阵近似建模方法,其特征在于,所述步骤S1中,所述构建评分矩阵,进一步为,给定一个由n个用户和m个物品构成的的评分矩阵R=[Rij]n×m,其中可观测到的元素Rij记录了第i个用户给第j个物品的评分。
3.根据权利要求2所述的自适应局部低秩矩阵近似建模方法,其特征在于,所述步骤S2中生成评分子矩阵,通过中国餐馆过程对评分矩阵中的行和列进行联合聚类,同时允许类别之间对统计容量进行动态分配,实现自适应确定评分子矩阵的生成。
4.根据权利要求3所述的自适应局部低秩矩阵近似建模方法,其特征在于,所述步骤S4中,每个评分子矩阵R(cd)的指示矩阵为X(cd),其中
Figure FDA0002471457340000011
表示评分
Figure FDA0002471457340000012
是可观测的,
Figure FDA0002471457340000013
表示评分是不可观测的。
5.根据权利要求4所述的自适应局部低秩矩阵近似建模方法,其特征在于,所述步骤S5中,构建基于评分子矩阵的观测评分模型,进一步为,令bui和bvj分别表示第i个用户和第j个物品的偏置,且假设其服从零均值的高斯分布,即
Figure FDA0002471457340000021
Figure FDA0002471457340000022
式(8)中σu和σv分别是用户和物品的方差。
6.根据权利要求1至5任一项所述的自适应局部低秩矩阵近似建模方法,其特征在于,所述基于推荐系统的自适应局部低秩矩阵近似建模方法,还包括:
步骤S7,对所建模型ALoMA的推断过程。
7.根据权利要求6任一项所述的自适应局部低秩矩阵近似建模方法,其特征在于,所述步骤S7进一步包括:
步骤S701,用户/物品类别分配推断;
步骤S702,更新用户/物品的局部隐表示;
步骤S703,更新用户注意力和物品吸引力;
步骤S704,更新用户/物品全局偏置;
步骤S705,方差推断。
8.根据权利要求1至5任一项所述的自适应局部低秩矩阵近似建模方法,其特征在于,所述基于推荐系统的自适应局部低秩矩阵近似建模方法,还包括:
步骤S8,对所建模型ALoMA的计算复杂度分析。
CN202010349545.9A 2020-04-28 2020-04-28 一种基于推荐系统的自适应局部低秩矩阵近似建模方法 Pending CN111612572A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010349545.9A CN111612572A (zh) 2020-04-28 2020-04-28 一种基于推荐系统的自适应局部低秩矩阵近似建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010349545.9A CN111612572A (zh) 2020-04-28 2020-04-28 一种基于推荐系统的自适应局部低秩矩阵近似建模方法

Publications (1)

Publication Number Publication Date
CN111612572A true CN111612572A (zh) 2020-09-01

Family

ID=72201268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010349545.9A Pending CN111612572A (zh) 2020-04-28 2020-04-28 一种基于推荐系统的自适应局部低秩矩阵近似建模方法

Country Status (1)

Country Link
CN (1) CN111612572A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114021836A (zh) * 2021-11-16 2022-02-08 电子科技大学 基于不同角度融合的多变量水库入水量预测系统、训练方法及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682963A (zh) * 2016-12-29 2017-05-17 同济大学 基于凸优化局部低秩矩阵近似的推荐系统数据补全方法
CN108415943A (zh) * 2018-01-30 2018-08-17 南京邮电大学 一种基于局部低秩矩阵的个性化推荐方法
CN108520450A (zh) * 2018-03-21 2018-09-11 电子科技大学 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682963A (zh) * 2016-12-29 2017-05-17 同济大学 基于凸优化局部低秩矩阵近似的推荐系统数据补全方法
CN108415943A (zh) * 2018-01-30 2018-08-17 南京邮电大学 一种基于局部低秩矩阵的个性化推荐方法
CN108520450A (zh) * 2018-03-21 2018-09-11 电子科技大学 基于隐式反馈信息的局部低秩矩阵近似的推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HUAFENG LIU 等: ""Adaptive Local Low-rank Matrix Approximation for Recommendation"" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114021836A (zh) * 2021-11-16 2022-02-08 电子科技大学 基于不同角度融合的多变量水库入水量预测系统、训练方法及应用
CN114021836B (zh) * 2021-11-16 2023-05-16 电子科技大学 基于不同角度融合的多变量水库入水量预测系统、训练方法及应用

Similar Documents

Publication Publication Date Title
CN107330115B (zh) 一种信息推荐方法及装置
Zhang et al. MOOCRC: A highly accurate resource recommendation model for use in MOOC environments
CN111241311B (zh) 媒体信息推荐方法、装置、电子设备及存储介质
CN111104595B (zh) 一种基于文本信息的深度强化学习交互式推荐方法及系统
Yang et al. Finding progression stages in time-evolving event sequences
CN111242310B (zh) 特征有效性评估方法、装置、电子设备及存储介质
US8346686B2 (en) Taxonomy-driven lumping for sequence mining
CN114048331A (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
CN108563755A (zh) 一种基于双向循环神经网络的个性化推荐系统及方法
CN107766573B (zh) 基于数据处理的商品推荐方法、装置、设备和存储介质
CN115186097A (zh) 一种基于知识图谱和强化学习的交互式推荐方法
CN110727872A (zh) 基于隐式反馈进行不明确选择行为挖掘的方法及装置
Priya et al. Heuristically repopulated Bayesian ant colony optimization for treating missing values in large databases
CN109933720B (zh) 一种基于用户兴趣自适应演化的动态推荐方法
Bai et al. Comparative analysis of thermal preference prediction performance in different conditions using ensemble learning models based on ASHRAE Comfort Database II
CN111612572A (zh) 一种基于推荐系统的自适应局部低秩矩阵近似建模方法
CN113449182A (zh) 一种知识信息个性化推荐方法及系统
CN112651499A (zh) 一种基于蚁群优化算法和层间信息的结构化模型剪枝方法
CN110993121A (zh) 一种基于双协同线性流形的药物关联预测方法
Zhang et al. Probabilistic matrix factorization recommendation of self-attention mechanism convolutional neural networks with item auxiliary information
CN114676315A (zh) 基于增强图卷积的属性融合交互推荐模型构建方法及系统
Poulakis Unsupervised AutoML: a study on automated machine learning in the context of clustering
Cuevas et al. An improved evolutionary algorithm for reducing the number of function evaluations
CN116720007B (zh) 基于多维学习者状态和联合奖励的在线学习资源推荐方法
CN114049166B (zh) 基于离散因子分解机的物品推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination