CN115147192A - 基于双视角纠偏的推荐方法及推荐系统 - Google Patents

基于双视角纠偏的推荐方法及推荐系统 Download PDF

Info

Publication number
CN115147192A
CN115147192A CN202210906481.7A CN202210906481A CN115147192A CN 115147192 A CN115147192 A CN 115147192A CN 202210906481 A CN202210906481 A CN 202210906481A CN 115147192 A CN115147192 A CN 115147192A
Authority
CN
China
Prior art keywords
popularity
user
item
data
deviation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210906481.7A
Other languages
English (en)
Inventor
黄露
倪葎
金澈清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN202210906481.7A priority Critical patent/CN115147192A/zh
Publication of CN115147192A publication Critical patent/CN115147192A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于双视角纠偏的推荐方法,包括:步骤1、定量分析数据中是否存在物品流行度偏差和用户活跃度偏差,构建符合数据生成机制的因果图;步骤2、基于步骤1中构建的因果图,在训练阶段使用do算子,采用P(Y|do(U,I))代替传统的P(Y|U,I),消除物品表征和用户表征的流行度偏差的影响,来表示用户对物品的真实偏好,然后使用后门调整技术,通过数据估计出P(Y|do(U,I))因果估计量;步骤3、对步骤2中的因果估计量进行参数化,使其可用已有数据恢复出来并进行训练,改进贝叶斯个性化排序BPR损失函数,使得推荐模型能够利用物品流行度和用户活跃度两方面信息进行去偏;步骤4、在推断阶段,通过调整流行度偏差找出在测试集上潜在受欢迎的物品。

Description

基于双视角纠偏的推荐方法及推荐系统
技术领域
本发明涉及推荐系统领域,尤其涉及一种基于双视角纠偏的推荐方法及推荐系统。
背景技术
如今是一个信息爆炸的时代,推荐系统的出现有效地缓解了信息过载的问题。当下,推荐系统已在电商、社交平台、个性化内容推荐等领域发挥着重要作用,成了现代互联网应用场景中不可或缺的一部分。
传统推荐系统大都关注于找到更好的模型来拟合观察数据。但观察数据中存在各种各样的偏差,例如选择偏差、暴露偏差、流行度偏差等[1]。如果将观察数据直接作为信号的话,学习出的模型参数并不能准确表征用户对物品的真实偏好,会造成推荐效果的下降。
常见的推荐偏差处理思路是在训练中去除掉偏差。例如显示反馈数据中常见的选择偏差,它是由于用户自由选择物品进行评分,导致观测到的评分不是所有评分的代表性样本[1]。所以现有的研究利用逆概率加权来修正每组样本的曝光概率,从而去除选择偏差。但对于流行度偏差而言,其本身并不会降低模型的预测性能。而是在下一次推荐中,流行物品的曝光概率进一步增大,不流行物品的曝光概率进一步减小,导致的偏差放大会降低模型的预测性能。最终也会影响用户的个性化体验和物品提供方的潜在收益。
当前已有少量研究通过利用流行度偏差来提升模型的性能和用户的满意度[2]。但现有的推荐方法都只是从物品这一单个角度考虑,忽略了用户视角下,用户活跃度对最终点击概率的影响,导致推荐结果并不能准确表征用户对物品的真实偏好。
综上所述,目前推荐系统中普遍存在着由偏差导致的推荐结果不能反映用户真实偏好的问题。
发明内容
由于推荐系统中各种偏差的存在,导致推荐结果不能准确表征用户真实的偏好。为了解决这一问题,本发明提出了基于物品和用户双视角纠偏的推荐方法,其特点是利用物品和用户双视角构建符合数据生成机制的因果图,在训练阶段,基于该因果图定义一个能反映用户真实偏好的因果估计量并将其用数据估计出来,在推断阶段,通过调整流行度找到测试集上潜在受欢迎的物品,从而提升推荐性能,因此本发明能够更精准地表征用户对物品的真实偏好。
本发明提出了基于双视角纠偏的推荐方法,所述双视角是指同时考虑了物品和用户两个视角,包括以下步骤:
步骤1:定量分析数据中是否存在物品流行度偏差和用户活跃度偏差,构建符合数据生成机制的因果图,例如图1所示;
步骤2:基于步骤1中构建的因果图,在训练阶段使用do算子,采用P(Y|do(U,I))代替传统的P(Y|U,I),消除了物品表征和用户表征的流行度偏差的影响,来表示用户对物品的真实偏好。使用后门调整技术,通过数据估计出P(Y|do(U,I))因果估计量,所述因果估计量是指用户对物品真实的点击概率;
步骤3:对步骤2中的因果估计量进行参数化,这里的参数化是指将因果估计量用带有参数的函数表示出来,使得因果估计量可用已有数据恢复出来并进行训练,改进贝叶斯个性化排序(Bayesian Personalized Ranking,BPR)损失函数,使得现有的推荐模型,例如矩阵分解模型、LightGCN模型,可以利用物品流行度和用户活跃度两方面信息进行去偏。具体来说,通过P(Y|do(U,I))来切断图1中通向节点I和节点U的连边,从而切断混杂因子M和N对物品和用户曝光分布的影响;
步骤4:在推断阶段,通过调整流行度偏差找出在测试集上潜在受欢迎的物品。
为优化上述技术方案,采取的具体措施还包括:
上述步骤1,所述的因果图,主体是由用户表征节点U、物品表征节点I和最终点击概率Y组成的,其中U和I作为模型输入,经过训练得到Y,因此节点U和I同时指向节点Y。在此基础上,定义节点M和N,分别表示物品流行度和用户活跃度,M作为混杂因子同时指向节点I和Y,同理N也是混杂因子,同时指向节点U和Y。这里的混杂因子会造成结果Y存在物品流行度偏差和用户活跃度偏差,本发明的目的就是在训练阶段去除混杂因子,在推断阶段调整混杂因子对结果的影响。
所述的物品流行度M指的是物品流行的程度,本发明定义t时刻物品i的流行度为
Figure BDA0003772623650000021
其中
Figure BDA0003772623650000022
表示t时刻物品i的交互量,物品表征节点I表示物品的集合;
所述的用户活跃度N指的是用户活跃的程度,本发明定义t时刻用户u的活跃度为
Figure BDA0003772623650000023
其中
Figure BDA0003772623650000024
表示t时刻用户u的交互量,用户表征节点U表示用户的集合;
所述用户表征节点U表示用户嵌入向量;
所述物品表征节点I表示物品嵌入向量;
所述最终点击概率Y表示在经过用户和物品两个因素的作用后,用户对物品的点击概率。
本发明对数据中是否存在物品流行度偏差进行定量分析,按照时间顺序对数据集进行划分,根据交互时间将数据集划分成十个阶段,每个阶段具有相同的时间间隔,从而度量不同时间段内的物品流行度。在此基础上利用Yang等[2]提出的流行度偏移量,刻画物品流行度随时间的变化趋势,从而定量分析数据中是否存在物品流行度偏差;流行度偏移量的范围为[0,ln 2],如果流行度偏移量的值大于零就认为存在物品流行度偏差,如果流行度偏移量等于零或非常接近零就认为不存在物品流行度偏差;
本发明对数据中是否存在用户活跃度偏差进行定量分析,按照时间顺序对数据集进行划分,根据交互时间将数据集划分成十个阶段,每个阶段具有相同的时间间隔,从而度量不同时间段内的用户活跃度。与所定义的流行度偏移量相类似,活跃度偏移量用于刻画用户活跃度随时间的变化趋势,可定量分析数据中是否存在用户活跃度偏差。活跃度偏移量的范围为[0,ln 2],如果活跃度偏移量的值大于零就认为存在用户活跃度偏差,如果活跃度偏移量等于零或非常接近零就认为不存在用户活跃度偏差。
所述的物品流行度偏移量是使用Jensen-Shannon散度来度量的,具体可以表示为
Figure BDA0003772623650000031
其中t1和t2为两个时间阶段,
Figure BDA0003772623650000032
为t1时刻下物品的概率分布,
Figure BDA0003772623650000033
为t2时刻下物品的概率分布。
所述的用户活跃度偏移量也是使用Jensen-Shannon散度来度量的,具体可以表示为
Figure BDA0003772623650000034
其中t1和t2为两个时间阶段,
Figure BDA0003772623650000035
为t1时刻下用户的概率分布,
Figure BDA0003772623650000036
为t2时刻下用户的概率分布。
上述步骤2,所述的do算子,是对物品表征和用户表征的一种干预行为,目的是去除影响物品表征和用户表征的流行度偏差。简单来说,就是切断图1中混杂因子M和N通向节点I和节点U的连边,从而切断混杂因子M和N对物品和用户曝光分布的影响。所述的后门调整技术[3],是将含有do算子的表达式P(Y|do(X))转化成可以用数据表示的形式,具体转化方式如下:
Figure BDA0003772623650000037
其中Y表示最终的结果,等价于推荐系统中的点击概率;X表示原因,等价于物品表征节点或用户表征节点;Z表示混杂因子,等价于物品流行度或用户活跃度。
本发明中,利用后门调整技术表示P(Y|do(U,I))如下所示:
Figure BDA0003772623650000038
其中P(·)是概率,P(m)是物品流行度的概率,P(n)是用户活跃度的概率。
上述步骤3,所述的BPR损失函数[4]是推荐系统排序任务中常用的损失函数,公式如下:
lBPR=-ln(σ(yui-yuj))
其中σ(·)表示sigmoid函数,yui和yuj分别表示正样本和负样本的得分,其中正样本i是用户u交互过的物品,负样本j是用户u未交互过的物品。BPR损失函数训练的目的是学习出给定用户u对正样本i比负样本j的偏好程度。在训练过程中加入物品流行度和用户活跃度的信息可以对已有的BPR损失函数进行改进,即所述的改进版BPR损失函数可以利用物品流行度和用户活跃度两方面信息进行训练,公式如下:
Figure BDA0003772623650000041
Figure BDA0003772623650000042
l=l1+l2+λ·||Θ||2
其中,l1表示物品流行度训练给定用户u对不同物品的偏好程度;l2表示用户活跃度训练不同用户对给定物品i的偏好程度;u为用户表征,i为用户u交互过的物品表征,j为用户u未交互过的物品表征,v表示未与物品i交互过的用户表征。
Figure BDA0003772623650000043
表示物品i在t时刻下的流行度,
Figure BDA0003772623650000044
表示用户u在t时刻下的活跃度;σ(·)表示sigmoid函数。λ是L2正则项系数,用来控制过拟合的。通过最小化损失函数l来确定参数Θ,从而确定用户嵌入向量和物品嵌入向量。
Figure BDA0003772623650000045
表示历史交互数据集。
上述步骤4,所述的调整流行度偏差,指的是在推断阶段对流行度进行干预,来获得更符合流行度的发展趋势。这里的干预流行度是使用数学公式去预测测试集上的流行度,来缓解数据在训练集和测试集之间非独立同分布的问题,最终获得推荐物品的排序。通常,数学公式有两种。其一,预测公式如下:
Figure BDA0003772623650000046
这里的
Figure BDA0003772623650000047
表示训练集中最后一阶段的流行度。也就是说,利用训练集中最后一阶段的流行度作为测试集中物品流行度的预测。
其二,预测公式如下:
Figure BDA0003772623650000048
这里的
Figure BDA0003772623650000049
表示训练集中最后一阶段的流行度,
Figure BDA00037726236500000410
表示训练集中倒数第二阶段的流行度。α是一个超参,用来控制流行度偏移量的。
本发明是一种基于双视角纠偏的推荐方法,更全面地分析了观察数据中存在的偏差,并针对所分析的偏差,利用因果推断中的后门调整技术,在训练阶段去除掉测试集上的偏差,在推断阶段依据测试集分布调整偏差,从而使得最终的推荐结果能反映用户的真实偏好,提升用户的个性化体验和物品提供方的潜在收益。
本发明还提供了一种实现上述推荐方法的推荐系统,所述系统包括:因果图构建模块、因果估计量计算模块和因果估计量调整模块。
具体地,所述的因果图构建模块会利用流行度偏移量和活跃度偏移量分析数据中是否存在物品流行度偏差和用户活跃度偏差,构建符合数据生成机制的因果图;
所述的因果估计量计算模块会先参数化因果估计量P(Y|do(U,I)),然后使用包括矩阵分解模型或者LightGCN模型在内的推荐模型对训练数据进行拟合;
所述因果估计量调整模块会预测测试集上的物品流行度,对训练好的因果估计量进行调整,即对预测结果进行调整。
本发明的有益效果包括:通过在训练阶段去除流行度偏差,测试阶段调整流行度偏差,解决了推荐系统中线下训练数据和线上测试数据分布不一致的问题。同时,从物品和用户两个角度考虑数据中存在的偏差,提升了推荐系统的预测性能。相对于现有的相关技术,本推荐系统的预测性能在douban_movie、ml10m和amazon_book三个大规模真实数据集上的Recall@20指标上的提升值分别为5.02%,19.70%,6.94%,在NDCG@20指标上的提升值分别为7.55%,14.36%,10.21%。
另外,在探究用户视角下,“头部用户”对最终推荐性能的影响时,本发明所提方法对于较活跃用户交互过的物品捕捉能力较强。本发明在amazon_book数据集上考虑头部用户的影响率(Influence Rate of Top Users,IRTU),即从训练集中取出最活跃的K个用户交互过的物品,以这些物品在测试集中被推荐的次数作为指标,这里选取前20个用户交互过的物品进行统计。效果如图4,在不同K值下,DBDA的IRTU值均高于PDA。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明考虑物品流行度和用户活跃度的因果图。
图2为本发明的训练流程示意图。
图3为本发明的预测流程示意图。
图4为本发明在amazon_book数据集上的头部用户影响程度柱状图。
图5为本发明运行流程图。
具体实施方式
结合以下具体实施例和附图,对发明做进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普通知识和公共常识,本发明没有特别限制内容。
本发明提出了一种基于双视角纠偏的推荐方法,首先是构建符合数据生成机制的因果图;然后利用因果推断中的后门调整技术定义一个能准确表征用户真实兴趣的因果估计量;之后在训练阶段利用物品流行度和用户活跃度学习物品和用户的嵌入向量,学习到真实的用户兴趣;最后在推断阶段调整流行度偏差,找到测试集上潜在受欢迎的物品,解决了现有推荐系统的过拟合问题,实现了符合用户当前偏好的精准推荐。
具体地,本发明首先通过先验知识构建符合数据生成机制的因果图,其次在训练阶段,基于该因果图定义一个能反映用户真实偏好的因果估计量并将其用数据估计出来,最后在推断阶段,通过调整流行度找到测试集上潜在受欢迎的物品,向用户推荐他们可能喜欢的物品。
所述先验知识包括推荐系统的交互数据中存在物品流行度偏差和用户活跃度偏差。
步骤1:构建如图1所示的因果图。该因果图将物品流行度和用户活跃度两个混杂因子显式地展现出来,从而达到解耦的效果。这里M表示的是物品流行度,N表示的是用户活跃度。所述解耦指的是物品流行度和用户活跃度之间是相互独立的。
步骤2:在训练阶段进行双视角去偏。如图2本发明的训练流程示意图所示,其中右边箭头表示物品侧训练阶段,左边箭头表示用户侧训练阶段,
Figure BDA0003772623650000061
符号表示张量的内积,训练过程中的权重共享,ei为物品的嵌入向量,eu为用户的嵌入向量,
Figure BDA0003772623650000062
表示t时刻下物品i的流行度,
Figure BDA0003772623650000063
表示t时刻下用户u的活跃度。训练阶段的目标是去除物品流行度和用户活跃度的影响,从而得到用户对给定物品的“真实”兴趣,也就是说,最终的点击概率只是用户真实兴趣的体现,不应受到其他混杂因子的影响。这里使用do算子,采用P(Y|do(U,I))代替传统的P(Y|U,I),来表示最终的点击概率,使用后门调整技术[3],利用数据表示P(Y|do(U,I)),即
Figure BDA0003772623650000064
其中P(·)是概率,P(m)是物品流行度的概率,P(n)是用户活跃度的概率。注意到上式的第二个等式成立,是因为本发明中所构建的因果图,如图1所示。此时物品流行度和用户活跃度是互相独立的。
步骤2.1:估计P(Y|U,I,M,N)。P(Y|U,I,M,N)表示给定(u,i)对以及物品i的流行度
Figure BDA0003772623650000065
和用户u的活跃度
Figure BDA0003772623650000066
下点击行为的发生概率。设该条件概率的参数为Θ,通过历史交互数据集
Figure BDA0003772623650000071
及BPR损失函数[4]来学习未知参数:
Figure BDA0003772623650000072
其中
Figure BDA0003772623650000073
表示历史数据集,即历史获得的用户和物品发生的交互情况,j表示用户u对物品的负采样,σ(·)表示sigmoid函数。
下面将
Figure BDA0003772623650000074
参数化,并将其转化成本发明可以解决的问题:
Figure BDA0003772623650000075
其中ELU'(·)为指数线性单元(Exponential Linear Unit,ELU)激活函数[6]的一种变体。fΘ(u,i)表示用户-物品的匹配模型,本发明采用经典的矩阵分解(MatrixFactorization,MF)模型[5]对数据进行拟合。为了确保匹配函数fΘ(·)的值一直为正:
Figure BDA0003772623650000076
其中,
Figure BDA0003772623650000077
Figure BDA0003772623650000078
的值均为正数;如果γ1和γ2为零,表示物品流行度和用户活跃度不起作用;如果γ1和γ2越大,则物品流行度和用户活跃度的影响也越大。而ELU'(·)是一个单调函数,这确保了概率函数的单调性。
步骤2.2:基于双视角改进损失函数。根据参数化后的因果估计量可知,物品流行度和用户活跃度是相互独立的。将参数化后的因果估计量代入传统的BPR损失函数,容易发现,物品流行度和用户活跃度解耦了,于是在用BPR损失函数进行参数训练时,用户活跃度在减号两边取值相同,导致无法对训练产生影响。换句话说,这样直接构造的损失函数因为没有利用到用户活跃度的信息,所以也就无法达到对用户活跃度去偏的目的。因此,为解决这一问题,本发明对传统BPR损失函数进行改进,代替原本的参数训练方法。本发明利用物品流行度和用户活跃度的信息分别构建了两个损失函数:
Figure BDA0003772623650000079
Figure BDA00037726236500000710
l=l1+l2+λ·||Θ||2
其中l1是利用了物品流行度训练给定用户u对不同物品的偏好程度,l2是利用了用户活跃度训练不同用户对给定物品i的偏好程度。l是完整的损失函数,λ是L2正则项系数,用来控制过拟合的。通过最小化损失函数l来确定参数Θ。
步骤2.3:估计P(Y|do(U,I))。这里需要对物品流行度m和用户活跃度n进行求和,但其空间十分庞大,难以遍历。由步骤2.1可知,物品流行度和用户活跃度已经解耦了,于是,可以推导出:
Figure BDA0003772623650000081
其中E(·)表示期望,而期望通常认为是一个常数。在推荐问题中,最终的任务是一个对物品的排序任务,因此本发明更关注点击概率的相对值,而非绝对值。因此,可以直接用ELU'(u·i)来代替P(Y|do(U,I))的估计。
综上,本发明用
Figure BDA0003772623650000082
拟合了历史交互数据,用改进版BPR损失函数训练含有参数的
Figure BDA0003772623650000083
使得物品流行度和用户活跃度在训练过程中均能得到利用,最后用ELU'(u·i)进行排序任务。本发明将该方法命名为双偏去混(Double BiasDeconfounding,DBD),即对物品流行度和用户活跃度两个混杂因子分别去偏。
步骤3:在推断阶段调整流行度偏差。如图3本发明的预测流程示意图所示,其中到达预测值DBD的路径表示传统推荐方法的预测方式,到达预测值DBDA的路径表示本发明提出方法的预测方式,
Figure BDA0003772623650000084
符号表示张量的内积。在训练阶段采用P(Y|do(U,I))是为了避免流行度偏差的积累。然而,在推断阶段,本发明通过利用流行度偏差去找出在测试集上潜在受欢迎的物品,从而提升推荐性能。值得注意的是,本发明无需对用户活跃度进行干预,因为在排序任务中,对用户活跃度的干预并不会改变点击概率的相对值,即不会改变推荐列表的顺序。于是,推断阶段仅对物品流行度进行干预:
Figure BDA0003772623650000085
其中,
Figure BDA0003772623650000086
表示测试集上的物品流行度。根据后门调整技术,干预的概率可直接等于条件概率,这是因为Y和M以及Y和N之间并没有后门路径。
步骤3.1:预测流行度。这里
Figure BDA0003772623650000087
表示的是测试集上的物品流行度,本发明采用数学公式去预测它。该预测公式如下:
第一种、
Figure BDA0003772623650000091
这里的
Figure BDA0003772623650000092
表示训练集中最后一阶段的流行度。也就是说,利用训练集中最后一阶段的流行度作为测试集中物品流行度的预测。这个公式在实施例中对应预测方法(a)。
第二种、
Figure BDA0003772623650000093
这里的
Figure BDA0003772623650000094
表示的是训练集中最后一阶段的流行度。α是一个超参,用来控制流行度偏移量。这个公式在实施例中对应预测方法(b)。
步骤3.2:估计P(Y|do(U,I),do(M),do(N))。在推断阶段利用流行度偏差对预测结果进行调整:
Figure BDA0003772623650000095
该方法还是用步骤2中改进的BPR损失函数进行训练,只是推断阶段本发明对物品流行度进行了调整。本发明将该方法命名为双偏去混及调整(Double Bias Deconfoundingand Adjusting,DBDA),即在训练阶段对物品流行度和用户活跃度两个混杂因子分别去偏,推断阶段对物品流行度进行调整。
实施例
参阅图5整个方法的运行流程图,按下述步骤进行推荐模型的训练:
步骤1:收集数据集并对数据进行预处理。Douban Movie是从国内豆瓣网站上收集到的数据,它包含了10年内用户对电影的评分。本实施例选取2010年之后的数据,将所有有评分的交互作为正样本。过滤掉交互量小于10的物品和用户。最终得到的交互量为7,174,218,用户数为47,890,物品数为26,047。这里本实施例将数据分为10个时间阶段,每个阶段都有相同的时间间隔,最后一个阶段随机将30%用户的交互数据作为验证集,70%用户的交互数据作为测试集。仅在最后一个阶段出现的用户和物品不纳入本实验中。
步骤2:对上述处理过的数据进行训练。训练之前的采样方法:本发明对于给定的(u,i)对,会随机采样一个用户u没有交互过的物品j和一个没有交互过物品i的用户v作为负样本,形成一个四元组(u,v,i,j)。然后进行迭代训练。
步骤3:基于步骤2训练的参数,在推断阶段,根据之前所定义的两种流行度预测公式对流行度进行调整。
本发明在Douban Movie数据集上做了实验,并与BPRMF、PD、PDA模型进行了对比。实验结果如表1所示,其中Recall为召回率,Precision为精确率,Hit Ratio(HR)为测试集中的item出现在top-K推荐列表中的命中率,NDCG为在top-K推荐列表中正负样本之间的相对顺序:
表1
Figure BDA0003772623650000101
表1展现的是在Douban Movie数据集上针对5种不同方法推荐性能的比较。前3种方法是在训练阶段去除流行度偏差的。后2种方法是在推断阶段利用了流行度偏差对排序进行调整,这里给出两种流行度预测方法,一种是用前一阶段的流行度作为测试阶段流行度的预测值,对应表中方法(a),另一种是在之前所定义的流行度预测公式,对应表中方法(b)。
对于每一种评价指标,表中加粗部分表示最优结果,下划线表示次优结果。先看每个数据集的前3种方法,可以看出本发明的方法在各指标上都要优于其他方法。再看后2种方法,本发明的方法也是全面优于对比方法PDA的。特别是NDCG@K评价指标下,本发明的方法的效果要远好于PDA。在Douban Movie数据集中,相对于PDA方法,DBDA方法在Recall@20指标上,预测方法(a)和(b)的相对提升值分别为5.02%和6.17%;在NDCG@20指标上,预测方法(a)和(b)的相对提升值分别为7.55%和10.00%。由于NDCG指标主要思想是用户喜欢的物品被排在推荐列表前面比排在后面会更大程度上增加用户的体验,所以本发明的方法对用户喜欢程度排前面的物品预测更准,这也更符合推荐的要求。
而在同类方法中,本发明比较了各流行度预测公式对结果的影响。可以看出:不论是PDA,还是本发明的方法DBDA。
对于预测流行度公式的敏感程度较大。在实际应用中,可以通过验证集来确定适合数据的流行度预测公式。对于本发明所提出的方法,例如:在Douban Movie数据集上,预测方法(a)的效果更好一些。
参考文献
[1]CHEN J W,WANG X,FENG F L,et al.Bias issues and solutions inrecommender system[C]//Proceedings of the 15th ACM Conference on RecommenderSystems,Amsterdam,Sep 27-Oct 1,2021.NewYork:ACM,2021:825-827.
[2]ZHANG Y,FENG F L,HE X N,et al.Causal intervention for leveragingpopularity bias in recommendation[C]//Proceedings of the 44th ACM SIGIRConference on Research and Development in Information Retrieval,Montreal,Jul11-15,2021.New York:ACM,2021:11-20.
[3]PEARL J.Causality[M].2nd ed.New York:Cambridge university press,2009:65-106.
[4]RENDLE S,FREUDENTHALER C,GANTNER Z,et al.BPR:bayesian personalizedranking from implicit feedback[C]//Proceedings of the 25th Conference onUncertainty in Artificial Intelligence,Montreal,Jun 18-21,2009.AUAI,2009:452-461.
[5]KOREN Y,BELL R,VOLINSKY C.Matrix factorization techniques forrecommender systems[J]//the IEEE Computer Society,2009,42(8):30-37.
[6]CLEVERT DA,UNTERTHINER T,HOCHREITER S.Fast and accurate deepnetwork learning by exponential linear units(elus)[C]//Proceedings of the 4thInternational Conference on Learning Representations,San Juan,May 2-4,2016.OpenReview.net,2016.
本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。

Claims (10)

1.一种基于双视角纠偏的推荐方法,其特征在于,所述推荐方法同时考虑了物品和用户两个视角,包括以下步骤:
步骤1:定量分析数据中是否存在物品流行度偏差和用户活跃度偏差,构建符合数据生成机制的因果图;
步骤2:基于步骤1中构建的因果图,在训练阶段使用do算子,采用P(Y|do(U,I))代替传统的P(Y|U,I),消除物品表征和用户表征的流行度偏差的影响,来表示用户对物品的真实偏好,然后使用后门调整技术,通过数据估计出P(Y|do(U,I))因果估计量;
步骤3:对步骤2中的因果估计量进行参数化,使所述因果估计量可用已有数据恢复出来并进行训练,改进贝叶斯个性化排序BPR损失函数,使得推荐模型能够利用物品流行度和用户活跃度两方面信息进行去偏;所述推荐模型包括矩阵分解模型、LightGCN模型;
步骤4:在推断阶段,通过调整流行度偏差找出在测试集上潜在受欢迎的物品。
2.如权利要求1所述的基于双视角纠偏的推荐方法,其特征在于,步骤1中所述的因果图,主体是由用户表征节点U、物品表征节点I和最终点击概率Y组成的,其中U和I作为模型输入,经过训练得到Y,因此节点U和I同时指向节点Y;在此基础上,定义节点M和N,分别表示物品流行度和用户活跃度,M作为混杂因子同时指向节点I和Y,同理N也是混杂因子,同时指向节点U和Y。
3.如权利要求2所述的基于双视角纠偏的推荐方法,其特征在于,所述的物品流行度M指的是物品受欢迎的程度,定义t时刻物品i的流行度为
Figure FDA0003772623640000011
其中
Figure FDA0003772623640000012
表示t时刻物品i的交互量,物品表征节点I表示物品的集合;
所述的用户活跃度N指的是用户活跃的程度,定义t时刻用户u的流行度为
Figure FDA0003772623640000013
Figure FDA0003772623640000014
其中
Figure FDA0003772623640000015
表示t时刻用户u的交互量,用户表征节点U表示用户的集合;
所述用户表征节点U表示用户的嵌入向量;
所述物品表征节点I表示物品的嵌入向量;
所述最终点击概率Y表示在经过用户和物品的两个因素的作用后,用户对物品的点击概率。
4.如权利要求1所述的基于双视角纠偏的推荐方法,其特征在于,步骤1中,对数据中是否存在物品流行度偏差进行定量分析,按照时间顺序对数据集进行划分,根据交互时间将数据集划分成十个阶段,每个阶段具有相同的时间间隔,从而度量不同时间段内的物品流行度,在此基础上利用流行度偏移量,刻画物品流行度随时间的变化趋势,从而定量分析数据中是否存在物品流行度偏差;
对数据中是否存在用户活跃度偏差进行定量分析,按照时间顺序对数据集进行划分,根据交互时间将数据集划分成十个阶段,每个阶段具有相同的时间间隔,在此基础上利用活跃度偏移量,刻画用户活跃度随时间的变化趋势,从而定量分析数据中是否存在用户活跃度偏差。
5.如权利要求4所述的基于双视角纠偏的推荐方法,其特征在于,所述的物品流行度偏移量使用Jensen-Shannon散度度量,表示为
Figure FDA0003772623640000021
其中t1和t2为两个时间阶段,
Figure FDA0003772623640000022
为t1时刻下物品的概率分布,
Figure FDA0003772623640000023
为t2时刻下物品的概率分布;
所述的用户活跃度偏移量使用Jensen-Shannon散度度量,表示为
Figure FDA0003772623640000024
Figure FDA0003772623640000025
其中t1和t2为两个时间阶段,
Figure FDA0003772623640000026
为t1时刻下用户的概率分布,
Figure FDA0003772623640000027
为t2时刻下用户的概率分布。
6.如权利要求1所述的基于双视角纠偏的推荐方法,其特征在于,步骤2中,所述的do算子通过切断因果图中混杂因子M和N通向节点I和节点U的连边,从而切断混杂因子M和N对物品和用户曝光分布的影响,去除影响物品表征和用户表征的流行度偏差。
7.如权利要求1所述的基于双视角纠偏的推荐方法,其特征在于,步骤2中,所述的后门调整技术,是将含有do算子的表达式P(Y|do(X))转化成用数据表示的形式,具体转化方式如下:
P(Y=y|do(X=x))=∑zP(Y=y|X=x,Z=z)P(Z=z),
其中Y表示最终的结果,等价于推荐系统中的点击概率;X表示原因,等价于物品表征节点或用户表征节点;Z表示混杂因子,等价于物品流行度或用户活跃度;
利用后门调整技术表示P(Y|do(U,I))如下所示:
P(Y|do(U,I))=∑m,nP(Y|U,I,m,n)P(m,n)=∑m,nP(Y|U,I,m,n)P(m)P(n),
其中P(·)是概率,P(m)是物品流行度的概率,P(n)是用户活跃度的概率。
8.如权利要求1所述的基于双视角纠偏的推荐方法,其特征在于,步骤3中,利用物品流行度和用户活跃度两方面信息进行去偏,改进BPR损失函数,改进后的BPR损失函数公式如下:
Figure FDA0003772623640000028
Figure FDA0003772623640000029
l=l1+l2+λ·||Θ||2
其中,l1表示物品流行度训练给定用户u对不同物品的偏好程度;l2表示用户活跃度训练不同用户对给定物品i的偏好程度;u为用户表征,i为用户u交互过的物品表征,j为用户u未交互过的物品表征,v表示未与物品i交互过的用户表征;
Figure FDA0003772623640000031
表示物品i在t时刻下的流行度,
Figure FDA0003772623640000032
表示用户u在t时刻下的活跃度;σ(·)表示sigmoid函数;λ是L2正则项系数,控制过拟合;通过最小化损失函数l来确定参数Θ,从而确定用户嵌入向量和物品嵌入向量;
Figure FDA0003772623640000033
表示历史交互数据集。
9.如权利要求1所述的基于双视角纠偏的推荐方法,其特征在于,步骤4中所述的调整流行度偏差,指的是在推断阶段对流行度进行干预,以获得更符合流行度的发展趋势,即使用数学公式去预测测试集上的流行度,来缓解数据在训练集和测试集之间非独立同分布的问题,最终获得推荐物品的排序;
所述数学公式包括
Figure FDA0003772623640000034
Figure FDA0003772623640000035
其中,
Figure FDA0003772623640000036
表示训练集中最后一阶段的流行度;
Figure FDA0003772623640000037
表示训练集中倒数第二阶段的流行度;α是一个超参,用来控制流行度偏移量。
10.一种实现如权利要求1-9之任一项所述推荐方法的推荐系统,其特征在于,所述系统包括:因果图构建模块、因果估计量计算模块和因果估计量调整模块;
其中,所述的因果图构建模块会利用流行度偏移量和活跃度偏移量分析数据中是否存在物品流行度偏差和用户活跃度偏差,构建符合数据生成机制的因果图;
所述的因果估计量计算模块会先参数化因果估计量P(Y|do(U,I)),然后使用包括矩阵分解模型或者LightGCN模型在内的推荐模型对训练数据进行拟合;
所述因果估计量调整模块会预测测试集上的物品流行度,对训练好的因果估计量进行调整,即对预测结果进行调整。
CN202210906481.7A 2022-07-29 2022-07-29 基于双视角纠偏的推荐方法及推荐系统 Pending CN115147192A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210906481.7A CN115147192A (zh) 2022-07-29 2022-07-29 基于双视角纠偏的推荐方法及推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210906481.7A CN115147192A (zh) 2022-07-29 2022-07-29 基于双视角纠偏的推荐方法及推荐系统

Publications (1)

Publication Number Publication Date
CN115147192A true CN115147192A (zh) 2022-10-04

Family

ID=83413510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210906481.7A Pending CN115147192A (zh) 2022-07-29 2022-07-29 基于双视角纠偏的推荐方法及推荐系统

Country Status (1)

Country Link
CN (1) CN115147192A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115809374A (zh) * 2023-02-13 2023-03-17 四川大学 纠正推荐系统主流偏差的方法、系统、设备及存储介质
CN116610857A (zh) * 2023-04-10 2023-08-18 南京邮电大学 一种基于用户对岗位流行度偏好的个性化岗位推荐方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115809374A (zh) * 2023-02-13 2023-03-17 四川大学 纠正推荐系统主流偏差的方法、系统、设备及存储介质
CN116610857A (zh) * 2023-04-10 2023-08-18 南京邮电大学 一种基于用户对岗位流行度偏好的个性化岗位推荐方法
CN116610857B (zh) * 2023-04-10 2024-05-03 南京邮电大学 一种基于用户对岗位流行度偏好的个性化岗位推荐方法

Similar Documents

Publication Publication Date Title
Chen et al. Matrix factorization for recommendation with explicit and implicit feedback
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
US20170161644A1 (en) Media recommendation using internet media stream modeling
CN115147192A (zh) 基于双视角纠偏的推荐方法及推荐系统
CN104935963A (zh) 一种基于时序数据挖掘的视频推荐方法
CN108470052B (zh) 一种基于矩阵补全的抗托攻击推荐算法
Yu et al. Multi-linear interactive matrix factorization
Wu et al. Optimization matrix factorization recommendation algorithm based on rating centrality
CN112765461A (zh) 一种基于多兴趣胶囊网络的会话推荐方法
Wang et al. Modeling uncertainty to improve personalized recommendations via Bayesian deep learning
CN112819575A (zh) 一种考虑重复购买行为的会话推荐方法
Ranjbar Kermany et al. Fair-SRS: A fair session-based recommendation system
Jeunen A probabilistic position bias model for short-video recommendation feeds
Yan et al. Dynamic clustering based contextual combinatorial multi-armed bandit for online recommendation
Liang et al. Measure prediction capability of data for collaborative filtering
Guan et al. Enhanced SVD for collaborative filtering
Yan et al. Modeling implicit feedback based on bandit learning for recommendation
Sang et al. Position-aware graph neural network for session-based recommendation
CN116186395A (zh) 一种资源推荐、模型训练方法及装置、设备及存储介质
CN112559905B (zh) 一种基于双模式注意力机制和社交相似度的会话推荐方法
CN114638316A (zh) 一种数据聚类方法、装置和设备
CN114117229A (zh) 一种基于有向和无向结构信息的图神经网络的项目推荐方法
Liu et al. Personalized recommendation considering secondary implicit feedback

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination