CN110059251B - 基于多关系隐式反馈置信度的协同过滤推荐方法 - Google Patents

基于多关系隐式反馈置信度的协同过滤推荐方法 Download PDF

Info

Publication number
CN110059251B
CN110059251B CN201910321811.4A CN201910321811A CN110059251B CN 110059251 B CN110059251 B CN 110059251B CN 201910321811 A CN201910321811 A CN 201910321811A CN 110059251 B CN110059251 B CN 110059251B
Authority
CN
China
Prior art keywords
feedback
deterministic
user
auxiliary
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910321811.4A
Other languages
English (en)
Other versions
CN110059251A (zh
Inventor
高山
张宏坡
周兵
王宗敏
郭晓晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University
Original Assignee
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University filed Critical Zhengzhou University
Priority to CN201910321811.4A priority Critical patent/CN110059251B/zh
Publication of CN110059251A publication Critical patent/CN110059251A/zh
Application granted granted Critical
Publication of CN110059251B publication Critical patent/CN110059251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于多关系隐式反馈置信度的协同过滤推荐方法,通过引入多种类型行为的隐式反馈,采用逻辑回归模型和基于树的特征选择模型两种置信度计算方法,并根据置信度对多种类型辅助反馈进行筛选,能够筛选出更丰富、更有效的确定性辅助反馈数据,从而对多关系隐式反馈中的用户偏好进行量化。本发明方法能够选出更多有效的反馈数据,准确刻画多关系隐式反馈中的用户偏好,有效提升推荐算法的性能和准确度。

Description

基于多关系隐式反馈置信度的协同过滤推荐方法
技术领域
本发明涉及排序学习推荐算法领域,具体的说,涉及了一种基于多关系隐式反馈置信度的协同过滤推荐方法。
背景技术
近年来,由于隐式反馈数据具有数据量丰富、易获取等特点,基于隐式反馈的推荐算法得到了越来越多研究学者的关注。Pan等人提出的单类协同过滤问题OCCF说明,仅从隐式反馈数据我们很难判定用户是否确实不喜欢某个项目。因为,与显式反馈相比,隐式反馈数据相当于仅包括用户的“正反馈”数据,而对于那些没有产生隐式反馈的项目来说,并不能因用户没有产生行为(如购买、观看、阅览等)而确定用户对于未选择项目的都不感兴趣。对于这种因负反馈缺失而导的偏好表达不对称性问题,已有的研究成果主要从以下两方面来进行解决:一方面,推荐系统中用户的行为类型是丰富多样的,在主隐式反馈的基础上,通过引入多种用户行为产生的辅助隐式反馈,来进一步提高推荐系统的准确性;另一方面,在引入辅助隐式反馈的同时,重点关注辅助反馈和主反馈之间的关系,研究不同类型辅助反馈对于用户偏好的差异性和相关性,解决多种类型辅助隐式反馈的“不确定性”问题,从而提高推荐准确性。
在真实的应用环境中,用户的行为类型及其产生的隐式反馈类型也是有多种的,但当将多关系隐式反馈同时引入推荐系统中时,用户对于不同隐式反馈的偏好表达存在一定的差异性,并且还存在多种类型隐式反馈的“不确定性”问题。
为了解决以上存在的问题,人们一直在寻求一种理想的技术解决方案。
发明内容
本发明的目的是针对现有技术的不足,提供一种基于多关系隐式反馈置信度的协同过滤推荐方法。
为了实现上述目的,本发明所采用的技术方案是:
一种基于多关系隐式反馈置信度的协同过滤推荐方法,包括以下步骤:
步骤1,将用户多种类型行为下的隐式反馈数据重新进行筛选和划分,并定义为确定性目标反馈、确定性辅助反馈和非确定性反馈三类;
确定性目标反馈:如果用户u在主隐式反馈和至少一种类型辅助隐式反馈中选择过项目i,则将用户u和项目i组成的记录集合定义为确定性目标反馈:DTu={(u,i)},其中u∈U,i∈FTu
确定性辅助反馈:通过置信度从用户u的多种类型辅助隐式反馈筛选出的数据中,如果用户u选择过项目k,则将用户u和项目k组成的记录集合定义为确定性辅助反馈:DAu={(u,k)},其中u∈U,k∈FAu
非明确性反馈:在用户u的确定性目标反馈和确定性辅助反馈中,如果项目j都没有被用户u选择过,则将用户u和项目j组成的记录集合定义为非明确性反馈:Nu={(u,j)},u∈U,
Figure GDA0003791948050000031
步骤2,模型构建
模型的目标函数为:
Figure GDA0003791948050000032
其中,cuk是计算的确定性辅助反馈的置信度;
采用矩阵分解模型对用户对项目的隐藏偏好进行建模,则
Figure GDA0003791948050000033
其中U∈Rd×m,V∈Rd ×n,b∈Rn,d是隐藏特征向量维度;
步骤3,计算确定性辅助反馈的置信度cuk,从多种类型辅助反馈中筛选出确定性辅助反馈,其中,置信度cuk的值越大,表示非确定性反馈与确定性反馈之间的相关性越大,可信度越高;
步骤4,定义以下偏序关系假设:
Figure GDA0003791948050000034
其中,xui表示用户u对于确定性目标反馈中的项目i的偏好,xuk表示用户u对于确定性辅助反馈中的项目k的偏好,xuj表示用户u对于非明确性反馈中的项目j的偏好;
针对每个用户u,训练学习一个排序模型f(u,i),利用该排序模型可以为用户u产生相应的项目排序列表Ranked_list(I):
Figure GDA0003791948050000041
本发明相对现有技术具有突出的实质性特点和显著的进步,具体的说,本发明引入多种类型行为的隐式反馈,采用逻辑回归模型和基于树的特征选择模型两种置信度计算方法,并根据置信度对多种类型辅助反馈进行筛选,能够筛选出更丰富、更有效的确定性辅助反馈数据,从而对多关系隐式反馈中的用户偏好进行量化。本发明方法能够选出更多有效的反馈数据,准确刻画多关系隐式反馈中的用户偏好,有效提升推荐算法的性能和准确度。
附图说明
图1是本发明方法,在数据集Topmd-M上,当参数d=10和d=20时,MTC-BPR算法及其3种不相同类型算法的NDCG值对比图。
图2是本发明方法,在数据集Sobazaar上,当参数d=10和d=20时,MTC-BPR算法及其3种不相同类型算法的NDCG值对比图。
图3是本发明方法,当参数d=10和d=20时,阈值η∈(0,1),步长取0.1,MTC-BPR在数据集Topmd-M和Sobazaar上的NDCG值。
具体实施方式
下面通过具体实施方式,对本发明的技术方案做进一步的详细描述。
假设一个推荐系统,m个用户和n个项目之间产生的多关系隐式反馈集合为Rtr={(u,i)},U和I分别表示用户集合和项目集合,其中u∈U,i,k,j∈I。本章中将多关系隐式反馈中的主隐式反馈称为目标反馈或确定性反馈,用户u的主隐式反馈中的项目集合表示为FTu∈I,将多种类型辅助隐式反馈称为辅助反馈或非确定性反馈,用户u的多种类型辅助隐式反馈中的项目集合表示为FAu∈I,剩余的项目包含在集合
Figure GDA0003791948050000052
中。本实施例随后将要用到的其他一些数学符号的定义详见表1。
表1相关符号定义
Figure GDA0003791948050000051
一种基于多关系隐式反馈置信度的协同过滤推荐方法,包括以下步骤:
步骤1,将用户多种类型行为下的隐式反馈数据重新进行筛选和划分,并定义为确定性目标反馈、确定性辅助反馈和非确定性反馈三类;
确定性目标反馈:如果用户u在主隐式反馈和至少一种类型辅助隐式反馈中选择过项目i,则将用户u和项目i组成的记录集合定义为确定性目标反馈:DTu={(u,i)},其中u∈U,i∈FTu
确定性辅助反馈:通过置信度从用户u的多种类型辅助隐式反馈筛选出的数据中,如果用户u选择过项目k,则将用户u和项目k组成的记录集合定义为确定性辅助反馈:DAu={(u,k)},其中u∈U,k∈FAu
非明确性反馈:在用户u的确定性目标反馈和确定性辅助反馈中,如果项目j都没有被用户u选择过,则将用户u和项目j组成的记录集合定义为非明确性反馈:Nu={(u,j)},u∈U,
Figure GDA0003791948050000061
步骤2,模型构建
模型的目标函数为:
Figure GDA0003791948050000062
其中,cuk是计算的确定性辅助反馈的置信度;
采用矩阵分解模型对用户对项目的隐藏偏好进行建模,则
Figure GDA0003791948050000063
Figure GDA0003791948050000064
其中U∈Rd×m,V∈Rd×n,b∈Rn,d是隐藏特征向量维度;regularization正则化项是用来防止模型学习过程中出现过拟合,Θ={U,V,b}是矩阵分解模型的参数,我们使用l2-norm即L2正则化,则正则化项可以改写为:
λΘ||Θ||2=λ||U||2+λ||V||2+λ||V||2+λ||V||2+λ||bi||2+λ||bk||2+λ||bj||2
其中λ为正则化参数。
步骤3,计算确定性辅助反馈的置信度vuk,从多种类型辅助反馈中筛选出确定性辅助反馈,其中,置信度cuk的值越大,表示非确定性反馈与确定性反馈之间的相关性越大;本发明方法可以采用逻辑回归和基于树的特征选择的方法来计算置信度cuk
逻辑回归
采用逻辑回归模型计算非确定性反馈与确定性辅助反馈之间的相关性,根据学习到的回归系数以及以下公式从多种类型非确定性反馈中筛选出确定性辅助反馈:
Figure GDA0003791948050000071
其中,A是多种类型辅助隐式反馈,xa∈{0,1}代表第a种辅助隐式反馈,β0和βa是学习到的回归系数;由公式可以看出,当xa的值为1时,代表用户有相应类型的非确定性反馈,反之,当xa的值为0时则代表用户没有相应类型的非确定性反馈。根据计算得到的h是否为1,从而决定是否将该条记录筛选为确定性辅助反馈。回归系数是在WeKa平台中进行计算,相应的参数设为:Logistic Regression with ridge parameter of 1.0E-8,使用10-交叉验证来计算。
本发明所使用的数据集是Topmd-M数据集和Sobazaar数据集,而基于以上2个实验数据集,使用逻辑回归模型学习得到的各种类型行为反馈的回归系数值如表2和表3所示。从表2中可以看出,对于Topmd-M数据集:(1)x1和x3(即网上咨询和查找名医)2种辅助行为对于主反馈行为(即预约挂号)有明显的积极影响,即:如果一个用户在“名医网”平台上查找并咨询过某个医生,则说明该用户最终有可能在该平台上进行预约挂号。(2)x2(即访问名医空间)对于主反馈行为(即预约挂号)的影响相对较小,说明如果一个用户在“名医网”平台上访问过某个医生空间,但该用户最终在该平台上进行预约挂号的可能性较小。
从表3中可以看出,对于Sobazaar数据集:(1)x1和x4这2种辅助行为对于主反馈(即购买行为)有明显的积极影响,即:如果一个用户产生x1和这两种行为时,该用户有很大可能最终会购买该产品。(2)x3和x8对于主反馈有积极的作用,但是影响相对较小。(3)x5和x6这2种辅助行为对于主反馈根本没有任何影响,原因可能是由于x5和x6这2种行为本身与用户的购买行为没有任何联系,或者这2种辅助反馈行为的作用被其他辅助行为代替了,如x4
表2逻辑回归模型在Topmd-M数据集上的结果
Figure GDA0003791948050000091
表3逻辑回归模型在Sobazaar数据集上的结果
Figure GDA0003791948050000092
总之,从以上分析结果可以看出,对于不同的真实应用场景,不同类型的辅助反馈对于主反馈的影响是不尽相同的。因此,应当关注和考虑这种不同程度的影响和相关性,以进一步提高推荐系统的准确性。
通过以上步骤,从多种类型辅助反馈中筛选出确定性辅助反馈数据,而后计算用户对于筛选出的确定性辅助反馈中的项目产生主反馈的可能性,具体计算方式:
Figure GDA0003791948050000093
其中A是多种类型辅助隐式反馈,σ为logistic sigmoid函数,
Figure GDA0003791948050000094
为用户u对于产品k上的第a种辅助隐式反馈的值。以上公式,可以计算出置信度cuk,表示用户u对产品k发生主反馈的可能性。
基于树的特征选择方法
采用基于树的特征选择方法计算各个非确定性反馈的重要性,并将计算到的重要性作为权重系数ωa,则确定性辅助反馈的置信度cuk
Figure GDA0003791948050000101
其中,A是多种类型辅助隐式反馈,
Figure GDA0003791948050000102
为用户u对于产品k上的第a种辅助隐式反馈的值;
定阈值η(其中η∈(0,1)),根据cuk是否大于阈值η来决定是否将用户对该产品产生的辅助反馈筛选为确定性辅助反馈。
步骤4,定义以下偏序关系假设:
Figure GDA0003791948050000103
其中,xui表示用户u对于确定性目标反馈中的项目i的偏好,xuk表示用户u对于确定性辅助反馈中的项目k的偏好,xuj表示用户u对于非明确性反馈中的项目j的偏好;本实施例将用户多种类型行为下的隐式反馈数据划分为三类,并假设:用户对于确定性目标反馈中项目的偏好度高于确定性辅助反馈的项目,同时,用户对于确定性辅助反馈中项目的偏好度高于非明确性反馈的项目。该种模型偏好假设同时考虑了多种类型辅助反馈对于用户偏好的影响,并利用置信度来衡量主反馈和辅助反馈之间的相关性和可信度,在真实应用场景中更加合理有效;
训练学习一个排序模型f(u,i),利用该排序模型可以为用户u产生相应的项目排序列表Ranked_list(I):
Figure GDA0003791948050000112
本发明采用以下方法对所建模型进行模型训练和参数学习:
首先基于用户的主反馈和多种类型的辅助反馈,筛选出确定性主反馈,并采用步骤3中的置信度计算方法筛选出确定性辅助反馈;而后,随机采样偏序关系(u,i,k)和(u,k,j),其中i∈DTu,k∈DAu,j∈Nu;最后,计算目标函数关于各模型参数的梯度,在每次迭代过程进行更新。
具体的工作流程如算法1所示。
Figure GDA0003791948050000111
算法1中的置信度cuk可以通过离线的方式进行计算,然后作为算法1的输入参数。算法1的时间复杂度为O(Td*(|DT|+|DA|)),其中T是迭代次数,d是隐藏特征向量维度,DT是确定性目标反馈,DA是确定性辅助反馈。
目标函数关于各变量求偏导得到对应的梯度分别如下所示:
Figure GDA0003791948050000121
Figure GDA0003791948050000122
Figure GDA0003791948050000123
Figure GDA0003791948050000124
Figure GDA0003791948050000125
Figure GDA0003791948050000126
Figure GDA0003791948050000127
其中αu,αv,βv是超参数,基于以上各变量对应的梯度,模型参数的更新规则如下所示:
Figure GDA0003791948050000128
其中,γ>0学习速率。
模型性能验证与对比分析
数据集说明
本发明所使用的第一个数据集是Topmd-M,该数据集是基于“名医网”平台注册用户的历史行为数据。本发明从中选择了注册用户的预约挂号、网上咨询、查找名医、访问名医空间共计4种典型行为产生的隐式反馈数据,共整理收集了包含29,980个用户和2,444个医生之间的4种典型用户行为产生的隐式反馈数据105,798条。该数据集的基本情况如表4和表5所示。
表4 Topmd-M数据集的基本特征
Figure GDA0003791948050000131
表5 Topmd-M数据集隐式反馈统计情况
Figure GDA0003791948050000132
数据集Sobazaar是从Telenor Digital公司开发的一个移动电子商务APP收集的,收集了用户在该平台上将商品添加到收藏列表、浏览商品详细信息、购买以及与商品图片相关等多种行为反馈的记录,共包含17,126个用户和24,785个商品之间的9种用户行为隐式反馈,其中除了用户的购买行为之外,还包含8种用户辅助行为的隐式反馈数据。该数据集的基本特征描述如表6所示。
表6 Sobazaar数据集的基本特征
Figure GDA0003791948050000133
Figure GDA0003791948050000141
从数据集中选取同时包含主反馈和至少一种类型辅助反馈的记录作为确定性目标反馈。对于Topmd-M数据集,从中抽取出52,454条确定性目标反馈记录,同时,考虑到数据集的平衡性,从不存在主反馈的记录中随机抽取相同数量的记录作为负反馈。对于Sobazaar数据集,采取相同的处理方法,从中抽取了13,540条确定性目标反馈。
使用五折交叉验证的方法,将这5次实验在每个评价指标上的结果取平均值作为最终验证结果。
评价指标
采用基于隐式反馈推荐系统中常用的一些评价指标来衡量模型的推荐能,具体包括:precision@k、recall@k、AUC、NDCG、MAP、MRR,其中k是推荐列表长度,设置k=5来评估本发明算法的推荐性能。
对比算法
为了验证本发明算法的推荐性能,与以下几种典型算法进行对比:
(1)ImplicitALS:属于点级排序方法中的经典模型,仅基于一种隐式反馈数据(即主反馈),该模型认为隐式反馈的数量(如:观看时长)可以用来表达隐式反馈的置信度,值越大表示置信度越高。
(2)BPR:BPR属于对级排序方法的经典模型,也是仅基于主反馈数据。
(3)MBPR:是在主反馈的基础上,引入了一种类型的辅助反馈,并利用主反馈和辅助反馈行为次数的差值来区分用户对不同类型行为反馈中的项目的偏好差异。
本发明算法根据置信度计算方式和取值的不同,分为以下几个类型:
(1)MTC-BPR:同时采用逻辑回归模型和基于树的特征选择模型来筛选并计算确定性辅助反馈的置信度。
(2)MTC-BPRh:同时采用逻辑回归模型和基于树的特征选择模型来筛选确定性辅助反馈,但筛选出的确定性辅助反馈的置信度均设置为1。
(3)MTC-BPRl:仅采用逻辑回归模型学习的回归系数来筛选并计算确定性辅助反馈的置信度。
(4)MTC-BPRt:仅采用基于树的特征选择模型学习的权重系数来筛选并计算确定性辅助反馈的置信度。
参数设置
在LibRec推荐系统开源平台上进行试验。各对比算法,迭代次数设置为T∈{100,500,1000},隐藏特征向量维度d∈{10,20}。其中,模型超参数的取值范围设定为αu=αv=βv∈{0.1,0.01,0.001,0.0001},并将评价指标NDCG作为选择其最优值的标准,学习速率取值范围设定为γ∈{0.1,0.01,0.001,0.0001}。对于ImplicitALS,参数α=1。
性能对比
在隐藏特征向量维度d=10和d=20的情况下,各对比算法在数据集Topmd-M和Sobazaar上的实验结果分别如表7和表8所示。
从表7和表8的对比结果可知:
(1)在两个数据集上,对于各个评价指标,ImplicitALS、BPR、MBPR、MTC-BPRl、MTC-BPRt、MTC-BPRh和MTC-BPR均大幅优于Random,充分说明了本发明的推荐效果。
(2)在两个数据集上,MBPR的各个评价指标值均优于BPR和ImplicitALS,再次说明引入一种类型辅助隐式反馈,并考虑用户对主反馈和辅助反馈中项目的偏好差异,对于提升推荐性能是有帮助的。
(3)在两个数据集上,对于各个评价指标,本发明方法性能优于其他对比算法,验证了本发明的有效性。同时说明,在主反馈的基础上,引入多种类型辅助隐式反馈,并利用学习到的置信度来筛选和衡量不同类型辅助反馈对于主反馈的影响程度和相关性,可以有效的提高推荐算法的性能。
表7各算法在Topmd-M数据集上的性能对比
Figure GDA0003791948050000161
Figure GDA0003791948050000171
表8各算法在Sobazaar数据集上的性能对比
Figure GDA0003791948050000172
Figure GDA0003791948050000181
置信度计算方法的影响
图1和图2分别展示了在数据集Topmd-M和Sobazaar上,当参数d=10和d=20时,MTC-BPR算法及其3种不同类型算法的NDCG值对比图。
由图1和图2对比结果可知:
(1)在2个数据集上,MTC-BPRl、MTC-BPRt和MTC-BPR均优于MTC-BPRh,并且在Sobazaar数据集上,MTC-BPRh的NDCG值要低于MBPR。说明:引入多种类型辅助反馈对于提高推荐性能是有帮助的,但如果不对筛选出的确定性辅助反馈的置信度进行进一步的计算,会影响和限制推荐性能的提升。
(2)在2个数据集上,对于各个评价指标,MTC-BPRt均要优于MTC-BPRl,说明:与逻辑回归方法相比,采用基于树的特征选择方法能够筛选出更加有效的确定性辅助反馈数据,更有助于提高推荐系统的性能。
(3)在2个数据集上,对于各个评价指标,MTC-BPR均要优于其他3种不同类型的算法,而MTC-BPR是同时采用逻辑回归模型和基于树的特征选择模型来筛选并计算确定性辅助反馈的置信度。说明:同时采用2种不同方法来共同筛选确定性辅助反馈并分别计算其相应的置信度,该种方法一方面能够筛选出更丰富、更有效的确定性辅助反馈数据,另一方面也说明,置信度对于推荐系统性能的提高是非常重要的一个影响因素。
不同阈值取值的影响
当参数d=10和d=20时,η∈(0,1),步长取0.1,MTC-BPR在数据集Topmd-M和Sobazaar上的NDCG值如图3所示。
(1)当阈值取值较小时,MTC-BPR的NDCG值要低于MTC-BPRl,说明:η较小时,根据该阈值筛选出来的确定性辅助反馈包含的噪声相对较多,从一定程度上影响了推荐系统的性能。
(2)随着阈值的逐步增大,MTC-BPR的NDCG值也有明显的提升,并分别在Topmd-M数据集上阈值η=0.8、Sobazaar数据集上阈值η=0.5时,结果为最优。此后,阈值继续增大,其相应的NDCG值也略有降低,并逐渐与MTC-BPRl的NDCG值持平。说明:随着阈值的逐步增大,根据该阈值能够筛选出更加有效的确定性辅助反馈数据,更有助于推荐系统性能的进一步提升。但同时,阈值过大,使用基于树的特征选择方法筛选出的确定性辅助反馈也会越来越少,MTC-BPR会逐步退化成为MTC-BPRl算法,其相应的推荐性能也会略有降低。
(3)在Topmd-M数据集上,基于树的特征选择模型计算得到的cuk范围为{0.1,0.4,0.5,0.8},而在Sobazaar数据集上,基于树的特征选择模型计算得到的cuk范围为{0.1,0.3,0.4,0.5}。因此,在数据集Topmd-M和Sobazaar上,当阈值分别取值为η>0.8和η>0.5时,MTC-BPR已退化成为MTC-BPRl算法,相应的NDCG值等于MTC-BPRl的NDCG值。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (4)

1.一种基于多关系隐式反馈置信度的协同过滤推荐方法,其特征在于,包括以下步骤:
步骤1,将用户多种类型行为下的隐式反馈数据重新进行筛选和划分,并定义为确定性目标反馈、确定性辅助反馈和非确定性反馈三类;
确定性目标反馈:如果用户u在主隐式反馈和至少一种类型辅助隐式反馈中选择过项目i,则将用户u和项目i组成的记录集合定义为确定性目标反馈:DTu={(u,i)},其中u∈U,i∈FTu
确定性辅助反馈:通过置信度从用户u的多种类型辅助隐式反馈筛选出的数据中,如果用户u选择过项目k,则将用户u和项目k组成的记录集合定义为确定性辅助反馈:DAu={(u,k)},其中u∈U,k∈FAu
非明确性反馈:在用户u的确定性目标反馈和确定性辅助反馈中,如果项目j都没有被用户u选择过,则将用户u和项目j组成的记录集合定义为非明确性反馈:Nu={(u,j)},u∈U,
Figure FDA0003791948040000011
步骤2,模型构建
模型的目标函数为:
Figure FDA0003791948040000012
其中,cuk是计算的确定性辅助反馈的置信度;Θ={U,V,b}是矩阵分解模型的参数,regularization是正则化项,用来防止模型学习过程中出现过拟合;
采用矩阵分解模型对用户对项目的隐藏偏好进行建模,则
Figure FDA0003791948040000021
其中U∈Rd×m,V∈Rd×n,b∈Rn,d是隐藏特征向量维度;
步骤3,计算确定性辅助反馈的置信度vuk,从多种类型辅助反馈中筛选出确定性辅助反馈,其中,置信度cuk的值越大,表示非确定性反馈与确定性反馈之间的相关性越大,可信度越高;
步骤4,定义以下偏序关系假设:
Figure FDA0003791948040000022
其中,xui表示用户u对于确定性目标反馈中的项目i的偏好,xuk表示用户u对于确定性辅助反馈中的项目k的偏好,xuj表示用户u对于非明确性反馈中的项目j的偏好;
针对每个用户u,训练学习一个排序模型f(u,i),利用该排序模型可以为用户u产生相应的项目排序列表Ranked_list(I):
f:
Figure FDA0003791948040000023
2.根据权利要求1所述的基于多关系隐式反馈置信度的协同过滤推荐方法,其特征在于,采用以下方法对所建模型进行模型训练和参数学习:
首先基于用户的主反馈和多种类型的辅助反馈,筛选出确定性主反馈,并采用步骤3中的置信度计算方法筛选出确定性辅助反馈;而后,随机采样偏序关系(u,i,k)和(u,k,j),其中i∈DTu,k∈DAu,j∈Nu;最后,计算目标函数关于各模型参数的梯度,在每次迭代过程进行更新。
3.根据权利要求1所述的基于多关系隐式反馈置信度的协同过滤推荐方法,其特征在于:
采用逻辑回归模型计算非确定性反馈与确定性辅助反馈之间的相关性,根据学习到的回归系数以及以下公式从多种类型非确定性反馈中筛选出确定性辅助反馈:
Figure FDA0003791948040000031
其中,A是多种类型辅助隐式反馈,xa∈{0,1}代表第a种辅助隐式反馈,β0和βa是学习到的回归系数;
计算用户对于筛选出的确定性辅助反馈中的项目产生主反馈的可能性,即置信度cuk
Figure FDA0003791948040000032
其中A是多种类型辅助隐式反馈,σ为logistic sigmoid函数,
Figure FDA0003791948040000033
为用户u对于产品k上的第a种辅助隐式反馈的值。
4.根据权利要求1所述的基于多关系隐式反馈置信度的协同过滤推荐方法,其特征在于:
采用基于树的特征选择方法计算各个非确定性反馈的重要性,并将计算到的重要性作为权重系数ωa,则确定性辅助反馈的置信度cuk为:
Figure FDA0003791948040000041
其中,A是多种类型辅助隐式反馈,
Figure FDA0003791948040000042
为用户u对于产品k上的第a种辅助隐式反馈的值,ωa是采用基于树的特征选择模型学习到的权重系数;
设定阈值η,其中η∈(0,1),根据cuk是否大于阈值η来决定是否将用户对该产品产生的辅助反馈筛选为确定性辅助反馈。
CN201910321811.4A 2019-04-22 2019-04-22 基于多关系隐式反馈置信度的协同过滤推荐方法 Active CN110059251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910321811.4A CN110059251B (zh) 2019-04-22 2019-04-22 基于多关系隐式反馈置信度的协同过滤推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910321811.4A CN110059251B (zh) 2019-04-22 2019-04-22 基于多关系隐式反馈置信度的协同过滤推荐方法

Publications (2)

Publication Number Publication Date
CN110059251A CN110059251A (zh) 2019-07-26
CN110059251B true CN110059251B (zh) 2022-10-28

Family

ID=67319883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910321811.4A Active CN110059251B (zh) 2019-04-22 2019-04-22 基于多关系隐式反馈置信度的协同过滤推荐方法

Country Status (1)

Country Link
CN (1) CN110059251B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110880128A (zh) * 2019-10-31 2020-03-13 支付宝(杭州)信息技术有限公司 异常信息挖掘方法、装置、系统及终端设备
EP4070208A4 (en) * 2019-12-04 2023-07-26 Sarah Ankaret Anderson Dean ACCESSIBILITY CHECK IN A COLLABORATIVE FILTERED RECOMMENDATION DEVICE
CN114598905A (zh) * 2021-11-25 2022-06-07 浙江光辉工具有限公司 一种视频推送方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488216A (zh) * 2015-12-17 2016-04-13 上海中彦信息科技有限公司 基于隐式反馈协同过滤算法的推荐系统及方法
CN106951528A (zh) * 2017-03-21 2017-07-14 北京邮电大学 一种推荐信息确定方法及装置
CN107766439A (zh) * 2017-09-21 2018-03-06 汉鼎宇佑互联网股份有限公司 一种融合结构特征和隐式反馈的个性化推荐方法
CN108460619A (zh) * 2018-01-16 2018-08-28 杭州电子科技大学 一种融合显隐式反馈的协同推荐模型
CN109241440A (zh) * 2018-09-29 2019-01-18 北京工业大学 一种基于深度学习的面向隐式反馈推荐方法
CN109299370A (zh) * 2018-10-09 2019-02-01 中国科学技术大学 多对级个性化推荐方法
CN109635206A (zh) * 2018-11-22 2019-04-16 华南师范大学 融合隐式反馈和用户社会地位的个性化推荐方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8037080B2 (en) * 2008-07-30 2011-10-11 At&T Intellectual Property Ii, Lp Recommender system utilizing collaborative filtering combining explicit and implicit feedback with both neighborhood and latent factor models
US20110153663A1 (en) * 2009-12-21 2011-06-23 At&T Intellectual Property I, L.P. Recommendation engine using implicit feedback observations
US20150187024A1 (en) * 2013-12-27 2015-07-02 Telefonica Digital España, S.L.U. System and Method for Socially Aware Recommendations Based on Implicit User Feedback

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488216A (zh) * 2015-12-17 2016-04-13 上海中彦信息科技有限公司 基于隐式反馈协同过滤算法的推荐系统及方法
CN106951528A (zh) * 2017-03-21 2017-07-14 北京邮电大学 一种推荐信息确定方法及装置
CN107766439A (zh) * 2017-09-21 2018-03-06 汉鼎宇佑互联网股份有限公司 一种融合结构特征和隐式反馈的个性化推荐方法
CN108460619A (zh) * 2018-01-16 2018-08-28 杭州电子科技大学 一种融合显隐式反馈的协同推荐模型
CN109241440A (zh) * 2018-09-29 2019-01-18 北京工业大学 一种基于深度学习的面向隐式反馈推荐方法
CN109299370A (zh) * 2018-10-09 2019-02-01 中国科学技术大学 多对级个性化推荐方法
CN109635206A (zh) * 2018-11-22 2019-04-16 华南师范大学 融合隐式反馈和用户社会地位的个性化推荐方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Resolving data sparsity by multi-type auxiliary implicit feedback for recommender systems;Guibing Guo等;《Elsevier》;20171215;第202-207页 *
基于多种隐式反馈数据的商品推荐算法;周巧扣等;《计算机应用与软件》;20181012(第10期);第23-27页 *

Also Published As

Publication number Publication date
CN110059251A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
CN111310063B (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
Huang et al. Keeping dataset biases out of the simulation: A debiased simulator for reinforcement learning based recommender systems
CN109299370B (zh) 多对级个性化推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN111523047A (zh) 基于图神经网络的多关系协同过滤算法
CN110059251B (zh) 基于多关系隐式反馈置信度的协同过滤推荐方法
Lin et al. Multiobjective personalized recommendation algorithm using extreme point guided evolutionary computation
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
CN112800334A (zh) 一种基于知识图谱和深度学习的协同过滤推荐方法及设备
CN112597392B (zh) 一种基于动态注意力和分层强化学习的推荐系统
CN113918833B (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN112950324A (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
Lam et al. Efficacy of using support vector machine in a contractor prequalification decision model
CN115186097A (zh) 一种基于知识图谱和强化学习的交互式推荐方法
CN113918832A (zh) 基于社交关系的图卷积协同过滤推荐系统
CN112699310A (zh) 基于深度神经网络的冷启动跨域混合推荐的方法及系统
CN116167812A (zh) 用于多行为推荐的异构协同过滤方法
Chen et al. DPM-IEDA: dual probabilistic model assisted interactive estimation of distribution algorithm for personalized search
Suleiman et al. A clinical coding recommender system
CN115840853A (zh) 一种基于知识图谱和图注意力网络的课程推荐系统
CN115310004A (zh) 融合项目时序关系的图神经协同过滤推荐方法
CN109345274B (zh) 基于bp神经网络评分预测误差的近邻用户选择方法
Gangwar et al. An adaptive boosting technique to mitigate popularity bias in recommender system
Chae et al. Adversarial training of deep autoencoders towards recommendation tasks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant