CN110825981A - 一种基于证据理论的群推荐方法 - Google Patents

一种基于证据理论的群推荐方法 Download PDF

Info

Publication number
CN110825981A
CN110825981A CN201911076443.8A CN201911076443A CN110825981A CN 110825981 A CN110825981 A CN 110825981A CN 201911076443 A CN201911076443 A CN 201911076443A CN 110825981 A CN110825981 A CN 110825981A
Authority
CN
China
Prior art keywords
group
formula
item
user
potential feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911076443.8A
Other languages
English (en)
Other versions
CN110825981B (zh
Inventor
王刚
褚燕
王含茹
张馨悦
张峰
马敬玲
张亚楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201911076443.8A priority Critical patent/CN110825981B/zh
Publication of CN110825981A publication Critical patent/CN110825981A/zh
Application granted granted Critical
Publication of CN110825981B publication Critical patent/CN110825981B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于证据理论的群推荐方法,其步骤包括:1、用三元组分别表示用户对项目的评分,以及用户与群组之间所属关系;2、实施概率矩阵分解方法,获取群组中每个成员对项目的预测评分;3、定义群组中每个成员的权重以及可靠性;4、针对每个群组,利用证据推理方法融合群成员的预测评分信息,获得群组对项目的预测评分;5、根据群组对项目的预测评分由高到低排序,选取前W个项目最终构成该群组的推荐列表。本发明能够在为群进行推荐时充分考虑群成员的权重,并同时为不同权重的证据赋予一定的可靠性,通过采用证据理论的方法合成尽可能使大多数群成员都满意的群推荐结果,从而有效提高群推荐的效果。

Description

一种基于证据理论的群推荐方法
技术领域
本发明涉及推荐方法技术领域,具体地说是一种基于证据理论的群推荐方法。
背景技术
近年来,随着在线社区的发展,各大社交媒体上涌现出海量的用户及信息,在方便用户 的同时也带来了信息过载等问题。而推荐系统作为解决信息过载问题的一种有效途径,可以 帮助用户在海量的数据中快速有效地找寻自己所需信息,满足不同用户的个性化需求,当前 已受到学术界和工业界的广泛关注。
由于人类的社会属性,人们往往喜欢以某种群组的形式一起参与某项活动,例如,与同 公司的一群同事下班之后的聚餐,与家人一起看的电视节目,与朋友一起规划的旅行地点。 过去这些活动基本都是在线下进行,而随着在线社区的发展,用户可以直接通过线上组建一 群拥有共同兴趣爱好的用户作为群组以共同参与一些活动,推荐系统则需要为这些群组推荐 组内成员们共同喜欢的活动。显然,面向个人的推荐系统并不适用于为这些群组进行推荐, 因此,群推荐系统应运而生,通过考虑群组内所有成员的偏好,为群组进行推荐,使得推荐 结果尽可能满足群组中大多数成员的需求。
群推荐系统建立在面向个人的推荐技术基础上,其核心问题是如何根据单个用户的偏好 得到群组的偏好,即群组偏好建模。实际上,大部分群推荐方法通过在个人推荐的偏好提取、 评分预测、推荐列表生成等不同阶段合成群组内成员的偏好,使建模得到的群组偏好能够符 合大多数成员的需求,进而获得面向群组的推荐结果。现有的研究方法虽然能够为群推荐系 统的构建提供理论基础和实践指导,但仍存在一些不足之处。其中,在群推荐的不同阶段合 成过程中,现有方法的合成策略通常选择使用简单的启发式合成策略,如平均策略、最小遗 憾策略、最大幸福策略等。最小遗憾策略、最大幸福策略仅仅将群组中最不满意或最满意的 成员意见当成群组的意见,显然无法对群组偏好进行有效建模,而平均策略在合成群组意见 时将群内所有成员的意见平等对待,没有考虑到实际情境下群成员的不同贡献度,如群组中 有的群成员初来乍到,而有的群成员经验丰富,有的群成员受人敬仰,而有的群成员默默无 闻,实际上,不同群成员拥有的不同特质会使他们在生成群推荐结果的过程中扮演着不同的 角色,而已有的研究方法往往忽略了这一点,降低了群推荐方法的精度。
发明内容
为了解决现有技术中存在的上述技术缺陷,本发明提供一种基于证据理论的群推荐方法, 以期能充分考虑到不同群成员的影响力,获得使大多数群成员都满意的群推荐结果,从而有 效提高群推荐的准确率。
本发明为达到上述发明目的,采用以下技术方案:
本发明一种基于证据理论的群推荐方法的特点是按如下步骤进行:
步骤1、构造表示用户-项目-评分信息的三元组T,以及表示用户-群组-所属关系的三元 组P:
步骤1.1、令三元组T=<M,N,R>表示用户-项目-评分信息,其中,M表示用户集合, 且M={u1,u2,...,ui,...,u|M|},ui表示用户集合M中第i个用户,1≤i≤|M|;N表示项目集合, 且N={v1,v2,...,vj,...,v|N|},vj表示项目集合N中第j个项目,1≤j≤|N|;R表示用户对项目 的评分矩阵,且R={Ri,j}|M|×|N|,Ri,j=p表示第i个用户ui对第j个项目vj的评分为p;
步骤1.2、令三元组P=<G,M,A>表示用户-群组-所属关系,其中,G表示群组集合,且 G={G1,G2,...,Gg,...G|G|},Gg表示群组集合G中的第g个群组,1≤g≤|G|;A表示用户与群 组的所属关系矩阵,且A={Ag,i}|G|×|M|,若Ag,i=1,则表示第i个用户ui加入第g个群组Gg,若 Ag,i=0,则表示第i个用户ui未加入第g个群组Gg
步骤2、利用概率矩阵分解法获得群组内每个用户对项目的预测评分:
步骤2.1、利用式(1)构建评分矩阵R的先验分布假设
Figure BDA0002262613660000021
Figure BDA0002262613660000022
式(1)中,U、V分别表示评分矩阵R分解后得到的用户潜在特征矩阵和项目潜在特征矩 阵,Ui表示第i个用户ui的潜在特征向量,Ui T表示第i个用户ui的潜在特征向量的转置,Vj表示第j个项目vj的潜在特征向量,N(Ri,j|g(Ui TVj),σR 2)表示第i个用户ui对第j个项目vj的 评分Ri,j服从均值为g(Ui TVj)、方差为σR 2的高斯分布,且g(Ui TVj)=1/[1+exp(-Ui TVj)],Ii,j R为 指示函数,表示评分矩阵R中第i个用户ui是否对第j个项目vj评过分,若评过分,则令否则,令
Figure BDA0002262613660000024
步骤2.2、利用式(2)构建用户潜在矩阵U的先验分布假设P(U|σU 2):
Figure BDA0002262613660000031
式(2)中,N(Ui|0,σU 2I)表示第i个用户ui的潜在特征向量Ui服从均值为0,方差为σU 2I的 高斯分布;I表示单位矩阵;
步骤2.3、利用式(3)构建项目潜在特征矩阵V的先验分布假设P(V|σV 2):
Figure BDA0002262613660000032
式(3)中,N(Vj|0,σV 2I)表示第j个项目vj的潜在特征向量Vj服从均值为0,方差为σV 2I的 高斯分布;
步骤2.4、根据贝叶斯推断,以及评分矩阵R、用户潜在特征矩阵U、项目潜在特征矩阵 V的先验分布,得到如式(4)所示的最大后验概率:
步骤2.5、根据式(4),建立如式(5)所示的目标函数E:
Figure BDA0002262613660000034
式(5)中,λu、λv为两个正则化参数,且
Figure BDA0002262613660000035
步骤2.6、定义当前迭代次数为X,最大迭代次数为τ,学习率为α;并初始化X=0,随机初始化用户潜在特征矩阵U和项目潜在特征矩阵V;
步骤2.7、利用式(6)、式(7)分别获取第X次迭代后第i个用户ui的潜在特征向量Ui的梯 度
Figure BDA0002262613660000036
以及第X次迭代后第j个项目vj的潜在特征向量Vj的梯度
Figure BDA0002262613660000037
Figure BDA0002262613660000038
Figure BDA0002262613660000039
步骤2.8、利用式(8)、式(9)分别更新第X次迭代得到的第i个用户ui的潜在特征向量
Figure BDA0002262613660000041
以及第X次迭代后第j个项目vj的潜在特征向量
Figure BDA0002262613660000042
获得第X+1次迭代后第i个用户ui的 潜在特征向量以及第X+1次迭代后第j个项目vj的潜在特征向量
Figure BDA0002262613660000044
Figure BDA0002262613660000045
Figure BDA0002262613660000046
步骤2.9、将X+1赋值给X后,判断X>τ是否成立,若成立,则表示第τ次迭代后第i 个用户ui的潜在特征向量以及第τ次迭代后第j个项目vj的潜在特征向量
Figure BDA0002262613660000048
即为最终的第i个用户ui的潜在特征向量和第j个项目vj的潜在特征向量,并记为
Figure BDA0002262613660000049
否则,则 返回步骤2.7顺序执行;
步骤2.10、利用式(10)获取用户ui对项目vj的预测评分
Figure BDA00022626136600000410
式(10)中,
Figure BDA00022626136600000412
表示第i个用户ui的潜在特征向量
Figure BDA00022626136600000413
中第d个元素,
Figure BDA00022626136600000414
表示第j个项 目vj的潜在特征向量
Figure BDA00022626136600000415
中第d个元素,1≤d≤D;D为潜在特征的维度;
步骤3、定义群组内不同成员的权重以及可靠性:
步骤3.1、假定第g个群组Gg内包含Z个成员,表示为Gg={ug1,ug2,...,ugk,...,ugZ},并且 {ug1,ug2,...,ugk,...,ugZ}∈M,则第g个群组Gg中第k个成员ugk的权重表示为wk,且0≤wk≤1, 当wk=0表示第k个成员ugk“最不重要”,当wk=1表示第k个成员ugk“最重要”;
令第k个成员ugk的可靠性表示为rk,且0≤rk≤1;当rk=0表示第k个成员ugk“非常不 可靠”,当rk=1表示第k个成员ugk“完全可靠”;
步骤3.2、利用式(11)得到第k个成员ugk的权重wk
Figure BDA00022626136600000416
式(11)中,uwk表示未归一化前的第k个成员ugk的权重,并有:
Figure BDA0002262613660000051
式(12)中,Hitk表示为第k个成员ugk推荐正确的项目个数,ActLikeg表示第g个群组Gg中 所有成员喜欢的项目总数;
步骤3.3、根据式(14)得到第k个成员ugk的可靠性rk
Figure BDA0002262613660000052
式(13)中,RLk表示为第k个成员ugk推荐的项目总数;
步骤4、针对每个群组,利用证据理论融合群成员对项目的预测评分信息,获得群组对项 目的预测评分:
步骤4.1、定义识别框架为Θ={v1,v2,...,v|N|},即包含待推荐的所有项目的集合,令P(Θ)表 示识别框架Θ的幂集,且则利用式(14)得到 融合时的第k条群成员ugk的信念分布ek
式(14)中,(v,pv,k)表示第k个群成员ugk对识别框架Θ中的任意一个项目v的支持度为 pv,k,且第k个群成员ugk对所有项目的支持度之和为1;
步骤4.2、针对第g个群组Gg,利用式(15)合成第1个群成员ug1和第2个群成员ug2对识 别框架Θ中的项目v的融合支持度
Figure BDA0002262613660000055
Figure BDA0002262613660000056
式(15)中,mv,1、mv,2分别表示考虑权重后的第1个群成员ug1和第2个群成员ug2对项目v 的支持度,并有mv,1=w1×pv,1,mv,2=w2×pv,2,其中,w1、pv,1分别为第1个群成员ug1的权重以及对项目v的支持度,w2、pv,2分别为第2个群成员ug2的权重以及对项目v的支持度; B和C均为识别框架Θ的任意子集,mB,1、mC,2分别表示第1个群成员ug1和第2个群成员ug2对集合B和集合C的支持度;
步骤4.3、利用式(16)对第1个群成员ug1和第2个群成员ug2的融合支持度
Figure BDA0002262613660000061
进行归一 化处理,得到归一化后的融合支持度pv,e(2)
Figure BDA0002262613660000062
步骤4.4、若群组成员个数Z>2,则初始化k=3后,并执行步骤4.5;否则,执行步骤5;
步骤4.5、根据式(17)递归计算第k个群成员的支持度与前k-1个群成员的归一化后的融 合支持度之间的融合结果,从而得到前k个群成员对项目v的融合支持度
Figure BDA0002262613660000063
Figure BDA0002262613660000064
式(17)中,mv,k表示考虑权重后第k个群成员ugk对项目v的支持度,并有:
mv,k=wk×pv,k (18)
式(17)中,mv,e(k-1)表示前k-1个群成员对项目v的融合支持度进行归一化之后的融 合支持度,并有:
Figure BDA0002262613660000066
式(19)中,
Figure BDA0002262613660000067
表示前k-1个群成员融合过程中的剩余支持度,并有:
Figure BDA0002262613660000068
式(20)中,若k=3时,第1个群成员ug1和第2个群成员ug2的融合时的剩余支持度表示为
Figure BDA0002262613660000069
并有:
Figure BDA00022626136600000610
步骤4.6、将k+1赋值给k后判断,k>Z是否成立,若成立,则表示得到得到
Figure BDA00022626136600000611
并执行步骤4.7;否则,返回步骤4.5;
步骤4.7、根据式(19)对群组内Z个成员的融合支持度
Figure BDA00022626136600000612
进行归一化处理,获得归一 化后的融合支持度mv,e(Z),从而利用式(22)得到所有Z个成员对项目v的融合预测评分为pv
Figure BDA0002262613660000071
步骤5、根据步骤4,得到第g个群组Gg群组对所有项目的融合预测评分,并进行降序排 序,从而选取前W个项目作为第g个群组Gg的推荐列表;进而获得所有群组的推荐列表。
相对于现有技术,本发明的有益效果在于:
1、本发明在个人评分预测阶段对群成员意见进行融合,采用当前较流行的概率矩阵分解 方法对群组内每个成员的评分进行预测,之后再合成群组内所有成员对项目的预测评分,生 成群推荐。与个人偏好提取阶段合成相比,该阶段合成时信息更加充足;与个人推荐列表生 成阶段合成相比,该阶段合成时具有更丰富的信息包括项目偏好顺序及项目评分,而不是仅 仅只包含项目偏好顺序。
2、本发明利用证据理论方法进行合成,与以往简单的合成策略不同的是,该方法有效考 虑了群组内成员的权重,并为不同权重的证据赋予一定的可靠性,通过采用证据理论的方法 可以合成使大多数群成员都满意的群推荐结果,从而有效提高群推荐的效果。
3、本发明的应用范围广泛,可以向群组推荐电影、音乐、餐厅、旅行地点等多种项目, 同时可以在各种平台上的推荐系统中使用。
附图说明
图1为本发明基于证据理论的群推荐方法的总流程示意图;
图2为本发明推荐准确率实验结果图;
图3为本发明推荐召回率实验结果图。
具体实施方式
本实施例中,如图1所示,一种基于证据理论的群推荐方法包括如下步骤:
步骤1、构造表示用户-项目-评分信息的三元组T,以及表示用户-群组-所属关系的三元 组P:
步骤1.1、令三元组T=<M,N,R>表示用户-项目-评分信息,其中,M表示用户集合, 且M={u1,u2,...,ui,...,u|M|},ui表示用户集合M中第i个用户,1≤i≤|M|;N表示项目集合, 且N={v1,v2,...,vj,...,v|N|},vj表示项目集合N中第j个项目,1≤j≤|N|;R表示用户对项目 的评分矩阵,且R={Ri,j}|M|×|N|,Ri,j=p表示第i个用户ui对第j个项目vj的评分为p;
步骤1.2、令三元组P=<G,M,A>表示用户-群组-所属关系,其中,G表示群组集合,且G={G1,G2,...,Gg,...G|G|},Gg表示群组集合G中的第g个群组,1≤g≤|G|;A表示用户与群 组的所属关系矩阵,且A={Ag,i}|G|×|M|,若Ag,i=1,则表示第i个用户ui加入第g个群组Gg,若 Ag,i=0,则表示第i个用户ui未加入第g个群组Gg
步骤2、利用概率矩阵分解法获得群组内每个用户对项目的预测评分:
步骤2.1、利用式(1)构建评分矩阵R的先验分布假设
Figure BDA0002262613660000081
Figure BDA0002262613660000082
式(1)中,U、V分别表示评分矩阵R分解后得到的用户潜在特征矩阵和项目潜在特征矩 阵,Ui表示第i个用户ui的潜在特征向量,Ui T表示第i个用户ui的潜在特征向量的转置,Vj表示第j个项目vj的潜在特征向量,N(Ri,j|g(Ui TVj),σR 2)表示第i个用户ui对第j个项目vj的 评分Ri,j服从均值为g(Ui TVj)、方差为σR 2的高斯分布,且g(Ui TVj)=1/[1+exp(-Ui TVj)],Ii,j R为 指示函数,表示评分矩阵R中第i个用户ui是否对第j个项目vj评过分,若评过分,则令
Figure BDA0002262613660000083
否则,令
Figure BDA0002262613660000084
步骤2.2、利用式(2)构建用户潜在矩阵U的先验分布假设P(U|σU 2):
Figure BDA0002262613660000085
式(2)中,N(Ui|0,σU 2I)表示第i个用户ui的潜在特征向量Ui服从均值为0,方差为σU 2I的 高斯分布;I表示单位矩阵;
步骤2.3、利用式(3)构建项目潜在特征矩阵V的先验分布假设P(V|σV 2):
式(3)中,N(Vj|0,σV 2I)表示第j个项目vj的潜在特征向量Vj服从均值为0,方差为σV 2I的 高斯分布;
步骤2.4、根据贝叶斯推断,以及评分矩阵R、用户潜在特征矩阵U、项目潜在特征矩阵 V的先验分布,得到如式(4)所示的最大后验概率:
Figure RE-GDA0002315369440000091
步骤2.5、对式(4)进行对数处理后转化为下式:
Figure RE-GDA0002315369440000092
式(5)中,D为潜在特征维度,即用户ui的潜在特征向量Ui的维度,以及项目vj的潜在特 征向量Vj的维度,C为常数;
步骤2.6、根据式(4)和式(5),将最大化后验概率转化为最小化目标问题,建立如式(6)所 示的目标函数E:
Figure BDA0002262613660000093
式(6)中,λu、λv为两个正则化参数,且
Figure BDA0002262613660000094
步骤2.7、定义当前迭代次数为X,最大迭代次数为τ,学习率为α;并初始化X=0,随机初始化用户潜在特征矩阵U和项目潜在特征矩阵V;
步骤2.8、利用式(7)、式(8)分别获取第X次迭代后第i个用户ui的潜在特征向量Ui的梯 度
Figure BDA0002262613660000095
以及第X次迭代后第j个项目vj的潜在特征向量Vj的梯度
Figure BDA0002262613660000096
Figure BDA0002262613660000097
Figure BDA0002262613660000098
步骤2.9、利用式(9)、式(10)分别更新第X次迭代得到的第i个用户ui的潜在特征向量
Figure BDA0002262613660000099
以及第X次迭代后第j个项目vj的潜在特征向量
Figure BDA00022626136600000910
获得第X+1次迭代后第i个用户ui的 潜在特征向量
Figure BDA0002262613660000101
以及第X+1次迭代后第j个项目vj的潜在特征向量
Figure BDA0002262613660000102
Figure BDA0002262613660000104
步骤2.10、将X+1赋值给X后,判断X>τ是否成立,若成立,则表示第τ次迭代后第i个用户ui的潜在特征向量
Figure BDA0002262613660000105
以及第τ次迭代后第j个项目vj的潜在特征向量
Figure BDA0002262613660000106
即为最终的 第i个用户ui的潜在特征向量和第j个项目vj的潜在特征向量,并记为
Figure BDA0002262613660000107
否则,则返回步骤2.8顺序执行;
步骤2.11、利用式(11)获取用户ui对项目vj的预测评分
Figure BDA0002262613660000108
Figure BDA0002262613660000109
式(11)中,
Figure BDA00022626136600001010
表示第i个用户ui的潜在特征向量
Figure BDA00022626136600001011
中第d个元素,
Figure BDA00022626136600001012
表示第j个项目 vj的潜在特征向量
Figure BDA00022626136600001013
中第d个元素,1≤d≤D;
步骤3、定义群组内不同成员的权重以及可靠性:
步骤3.1、假定第g个群组Gg内包含Z个成员,表示为Gg={ug1,ug2,...,ugk,...,ugZ},并且 {ug1,ug2,...,ugk,...,ugZ}∈M,则第g个群组Gg中第k个成员ugk的权重表示为wk,且0≤wk≤1, 当wk=0表示第k个成员ugk“最不重要”,当wk=1表示第k个成员ugk“最重要”;
令第k个成员ugk的可靠性表示为rk,且0≤rk≤1;当rk=0表示第k个成员ugk“非常不 可靠”,当rk=1表示第k个成员ugk“完全可靠”;
步骤3.2、利用式(12)得到第k个成员ugk的权重wk
式(12)中,uwk表示未归一化前的第k个成员ugk的权重,并有:
Figure BDA00022626136600001015
式(13)中,Hitk表示为第k个成员ugk推荐正确的项目个数,ActLikeg表示第g个群组Gg中 所有成员喜欢的项目总数,由于权重表示成员在这个群组中的相对地位,对群推荐结果贡献 越高的成员则其权重也越高,因此,在设定权重时,以召回率来定义成员的贡献程度,召回 率越高,说明这个成员可以从群组的实际偏好中召回更多的项目,即对群推荐的结果贡献更 大,听从他的意见可能获取更有效的推荐结果;
步骤3.3、根据式(14)得到第k个成员ugk的可靠性rk
Figure BDA0002262613660000111
式(14)中,RLk表示为第k个成员ugk推荐的项目总数,由式(14)可以看出,本发明在设定 可靠性时,是根据每个成员的推荐精度来定义的,如果一个成员的推荐精度极低,也就说明 他之前评过分的项目不足以支持他得到有效的推荐结果,说明这个人非常不可靠,那么即使 他有着高权重,也不能过分听从他的意见。因此在对成员赋予权重的基础上增加了基于推荐 精度的可靠性,使群合成结果更加可信;
步骤4、针对每个群组,利用证据理论融合群成员对项目的预测评分信息,获得群组对项 目的预测评分:
步骤4.1、定义识别框架为Θ={v1,v2,...,v|N|},即包含待推荐的所有项目的集合,令P(Θ)表 示识别框架Θ的幂集,且
Figure BDA0002262613660000112
则利用式(15)得到 融合时的第k条群成员ugk的信念分布ek
Figure BDA0002262613660000113
式(15)中,(v,pv,k)表示第k个群成员ugk对识别框架Θ中的任意一个项目v的支持度为 pv,k,且第k个群成员ugk对所有项目的支持度之和为1;
步骤4.2、针对第g个群组Gg,利用式(16)合成第1个群成员ug1和第2个群成员ug2对识 别框架Θ中的项目v的融合支持度
Figure BDA0002262613660000114
式(16)中,mv,1、mv,2分别表示考虑权重后的第1个群成员ug1和第2个群成员ug2对项目v 的支持度,并有mv,1=w1×pv,1,mv,2=w2×pv,2,其中,w1、pv,1分别为第1个群成员ug1的权重以 及对项目v的原始支持度,w2、pv,2分别为第2个群成员ug2的权重以及对项目v的原始支持度。B和C 均为识别框架Θ的任意子集,mB,1、mC,2分别表示第1个群成员ug1和第2个群成员ug2对集合 B和集合C的支持度;
步骤4.3、利用式(17)对第1个群成员ug1和第2个群成员ug2的融合支持度
Figure BDA00022626136600001211
进行归一 化处理,得到归一化后的融合支持度pv,e(2)
Figure BDA0002262613660000121
步骤4.4、若群组成员个数Z>2,则初始化k=3后,并执行步骤4.5;否则,执行步骤5;
步骤4.5、根据式(18)递归计算第k个群成员的支持度与前k-1个群成员的归一化后的融 合支持度之间的融合结果,从而得到前k个群成员对项目v的融合支持度
Figure BDA0002262613660000123
式(18)中,mv,k表示考虑权重后第k个群成员ugk对项目v的支持度,并有:
mv,k=wk×pv,k (19)
式(18)中,mv,e(k-1)表示前k-1个群成员对项目v的融合支持度
Figure BDA0002262613660000124
进行归一化之后的融 合支持度,并有:
Figure BDA0002262613660000125
式(20)中,
Figure BDA0002262613660000126
表示前k-1个群成员融合过程中的剩余支持度,并有:
Figure BDA0002262613660000127
式(21)中,若k=3时,第1个群成员ug1和第2个群成员ug2的融合时的剩余支持度表示为
Figure BDA0002262613660000128
并有:
Figure BDA0002262613660000129
步骤4.6、将k+1赋值给k后判断,k>Z是否成立,若成立,则表示得到得到
Figure BDA00022626136600001210
并执 行步骤4.7;否则,返回步骤4.5;
步骤4.7、根据式(20)对群组内Z个成员的融合支持度
Figure BDA0002262613660000131
进行归一化处理,获得归一 化后的融合支持度mv,e(Z),从而利用式(23)得到所有Z个成员对项目v的融合预测评分为pv
Figure BDA0002262613660000132
步骤5、根据步骤4,得到第g个群组Gg群组对所有项目的融合预测评分,并进行降序排 序,从而选取前W个项目作为第g个群组Gg的推荐列表;进而获得所有群组的推荐列表。
下面以具体实例,针对本发明方法进行实验论证,具体内容如下:
1、数据集:
本发明采用从豆瓣抓取的电影评分数据集来验证基于证据理论的群推荐方法的有效性。 为保证实验质量,我们对抓取的数据集进行一定的预处理,处理后的数据集中包含1132个用 户,16782部电影和816个兴趣小组。在实验过程中,将数据集划分为80%训练集,20%测 试集,对模型进行训练及评估。
2、评价指标:
本发明采用推荐系统中常用的准确率(Precision)、召回率(Recall)作为本实验的评价指标。 其中准确率表示为在群组的推荐列表中,群组真正喜欢的项目数量占推荐列表总长度的比例, 准确率越高,表示推荐越精准。召回率则表示为群组推荐列表中群组真正喜欢的项目数量占 测试集中群组真正喜欢的项目数量的比例,召回率越高,表示推荐效果越好。因此,准确率 和召回率可由如下公式度量:
Figure BDA0002262613660000133
Figure BDA0002262613660000134
其中,式(24)用来度量准确率(Precision),式(25)用来度量召回率(Recall)。R(ui)表示群组Gg的推荐列表集合,T(ui)表示群组Gg在测试集中实际评价过的项目集合,|R(Gg)∩T(Gg)|则 表示测试集中群组Gg实际评价过的项目被推荐给群组的项目集合。
3、实验结果:
为了验证本发明所提出的基于证据理论的群推荐方法的有效性,我们选取了常用的方法 进行对比实验。实验结果如图2、图3所示,其中,横坐标表示推荐的个数,纵坐标表示各 评价指标下不同方法对应的结果。并且,在图2和图3中,AveGR表示利用平均策略融合群 内成员意见,LMGR表示利用最小遗憾策略融合群内成员意见,MPGR表示利用最大幸福策略融合群内成员意见,ERGR表示本发明所提的基于证据理论的群推荐方法,即在合成个人预测评分阶段利用证据理论融合群内成员意见。可以看出,基于证据理论的群推荐方法优于 现有方法,验证了本发明所提方法的有效性和可行性。

Claims (1)

1.一种基于证据理论的群推荐方法,其特征是按如下步骤进行:
步骤1、构造表示用户-项目-评分信息的三元组T,以及表示用户-群组-所属关系的三元组P:
步骤1.1、令三元组T=<M,N,R>表示用户-项目-评分信息,其中,M表示用户集合,且M={u1,u2,...,ui,...,u|M|},ui表示用户集合M中第i个用户,1≤i≤|M|;N表示项目集合,且N={v1,v2,...,vj,...,v|N|},vj表示项目集合N中第j个项目,1≤j≤|N|;R表示用户对项目的评分矩阵,且R={Ri,j}|M|×|N|,Ri,j=p表示第i个用户ui对第j个项目vj的评分为p;
步骤1.2、令三元组P=<G,M,A>表示用户-群组-所属关系,其中,G表示群组集合,且G={G1,G2,...,Gg,...G|G|},Gg表示群组集合G中的第g个群组,1≤g≤|G|;A表示用户与群组的所属关系矩阵,且A={Ag,i}|G|×|M|,若Ag,i=1,则表示第i个用户ui加入第g个群组Gg,若Ag,i=0,则表示第i个用户ui未加入第g个群组Gg
步骤2、利用概率矩阵分解法获得群组内每个用户对项目的预测评分:
步骤2.1、利用式(1)构建评分矩阵R的先验分布假设
Figure FDA0002262613650000011
Figure FDA0002262613650000012
式(1)中,U、V分别表示评分矩阵R分解后得到的用户潜在特征矩阵和项目潜在特征矩阵,Ui表示第i个用户ui的潜在特征向量,Ui T表示第i个用户ui的潜在特征向量的转置,Vj表示第j个项目vj的潜在特征向量,N(Ri,j|g(Ui TVj),σR 2)表示第i个用户ui对第j个项目vj的评分Ri,j服从均值为g(Ui TVj)、方差为σR 2的高斯分布,且g(Ui TVj)=1/[1+exp(-Ui TVj)],Ii,j R为指示函数,表示评分矩阵R中第i个用户ui是否对第j个项目vj评过分,若评过分,则令
Figure FDA0002262613650000013
否则,令
Figure FDA0002262613650000014
步骤2.2、利用式(2)构建用户潜在矩阵U的先验分布假设P(U|σU 2):
Figure FDA0002262613650000015
式(2)中,N(Ui|0,σU 2I)表示第i个用户ui的潜在特征向量Ui服从均值为0,方差为σU 2I的高斯分布;I表示单位矩阵;
步骤2.3、利用式(3)构建项目潜在特征矩阵V的先验分布假设P(V|σV 2):
式(3)中,N(Vj|0,σV 2I)表示第j个项目vj的潜在特征向量Vj服从均值为0,方差为σV 2I的高斯分布;
步骤2.4、根据贝叶斯推断,以及评分矩阵R、用户潜在特征矩阵U、项目潜在特征矩阵V的先验分布,得到如式(4)所示的最大后验概率:
Figure FDA0002262613650000022
步骤2.5、根据式(4),建立如式(5)所示的目标函数E:
Figure FDA0002262613650000023
式(5)中,λu、λv为两个正则化参数,且
步骤2.6、定义当前迭代次数为X,最大迭代次数为τ,学习率为α;并初始化X=0,随机初始化用户潜在特征矩阵U和项目潜在特征矩阵V;
步骤2.7、利用式(6)、式(7)分别获取第X次迭代后第i个用户ui的潜在特征向量Ui的梯度
Figure FDA0002262613650000025
以及第X次迭代后第j个项目vj的潜在特征向量Vj的梯度
Figure FDA0002262613650000026
Figure FDA0002262613650000027
Figure FDA0002262613650000028
步骤2.8、利用式(8)、式(9)分别更新第X次迭代得到的第i个用户ui的潜在特征向量
Figure FDA0002262613650000029
以及第X次迭代后第j个项目vj的潜在特征向量
Figure FDA00022626136500000210
获得第X+1次迭代后第i个用户ui的潜在特征向量
Figure FDA00022626136500000211
以及第X+1次迭代后第j个项目vj的潜在特征向量
Figure FDA00022626136500000212
Figure FDA0002262613650000032
步骤2.9、将X+1赋值给X后,判断X>τ是否成立,若成立,则表示第τ次迭代后第i个用户ui的潜在特征向量
Figure FDA0002262613650000033
以及第τ次迭代后第j个项目vj的潜在特征向量
Figure FDA0002262613650000034
即为最终的第i个用户ui的潜在特征向量和第j个项目vj的潜在特征向量,并记为否则,则返回步骤2.7顺序执行;
步骤2.10、利用式(10)获取用户ui对项目vj的预测评分
Figure FDA0002262613650000036
Figure FDA0002262613650000037
式(10)中,
Figure FDA0002262613650000038
表示第i个用户ui的潜在特征向量
Figure FDA0002262613650000039
中第d个元素,
Figure FDA00022626136500000310
表示第j个项目vj的潜在特征向量
Figure FDA00022626136500000311
中第d个元素,1≤d≤D;D为潜在特征的维度;
步骤3、定义群组内不同成员的权重以及可靠性:
步骤3.1、假定第g个群组Gg内包含Z个成员,表示为Gg={ug1,ug2,...,ugk,...,ugZ},并且{ug1,ug2,...,ugk,...,ugZ}∈M,则第g个群组Gg中第k个成员ugk的权重表示为wk,且0≤wk≤1,当wk=0表示第k个成员ugk“最不重要”,当wk=1表示第k个成员ugk“最重要”;
令第k个成员ugk的可靠性表示为rk,且0≤rk≤1;当rk=0表示第k个成员ugk“非常不可靠”,当rk=1表示第k个成员ugk“完全可靠”;
步骤3.2、利用式(11)得到第k个成员ugk的权重wk
Figure FDA00022626136500000312
式(11)中,uwk表示未归一化前的第k个成员ugk的权重,并有:
Figure FDA00022626136500000313
式(12)中,Hitk表示为第k个成员ugk推荐正确的项目个数,ActLikeg表示第g个群组Gg中所有成员喜欢的项目总数;
步骤3.3、根据式(14)得到第k个成员ugk的可靠性rk
Figure FDA0002262613650000041
式(13)中,RLk表示为第k个成员ugk推荐的项目总数;
步骤4、针对每个群组,利用证据理论融合群成员对项目的预测评分信息,获得群组对项目的预测评分:
步骤4.1、定义识别框架为Θ={v1,v2,...,v|N|},即包含待推荐的所有项目的集合,令P(Θ)表示识别框架Θ的幂集,且则利用式(14)得到融合时的第k条群成员ugk的信念分布ek
式(14)中,(v,pv,k)表示第k个群成员ugk对识别框架Θ中的任意一个项目v的支持度为pv,k,且第k个群成员ugk对所有项目的支持度之和为1;
步骤4.2、针对第g个群组Gg,利用式(15)合成第1个群成员ug1和第2个群成员ug2对识别框架Θ中的项目v的融合支持度
Figure FDA0002262613650000045
式(15)中,mv,1、mv,2分别表示考虑权重后的第1个群成员ug1和第2个群成员ug2对项目v的支持度,并有mv,1=w1×pv,1,mv,2=w2×pv,2,其中,w1、pv,1分别为第1个群成员ug1的权重以及对项目v的支持度,w2、pv,2分别为第2个群成员ug2的权重以及对项目v的支持度;B和C均为识别框架Θ的任意子集,mB,1、mC,2分别表示第1个群成员ug1和第2个群成员ug2对集合B和集合C的支持度;
步骤4.3、利用式(16)对第1个群成员ug1和第2个群成员ug2的融合支持度
Figure FDA0002262613650000046
进行归一化处理,得到归一化后的融合支持度pv,e(2)
Figure FDA0002262613650000051
步骤4.4、若群组成员个数Z>2,则初始化k=3后,并执行步骤4.5;否则,执行步骤5;
步骤4.5、根据式(17)递归计算第k个群成员的支持度与前k-1个群成员的归一化后的融合支持度之间的融合结果,从而得到前k个群成员对项目v的融合支持度
Figure FDA0002262613650000052
Figure FDA0002262613650000053
式(17)中,mv,k表示考虑权重后第k个群成员ugk对项目v的支持度,并有:
mv,k=wk×pv,k (18)
式(17)中,mv,e(k-1)表示前k-1个群成员对项目v的融合支持度
Figure FDA0002262613650000054
进行归一化之后的融合支持度,并有:
Figure FDA0002262613650000055
式(19)中,
Figure FDA0002262613650000056
表示前k-1个群成员融合过程中的剩余支持度,并有:
Figure FDA0002262613650000057
式(20)中,若k=3时,第1个群成员ug1和第2个群成员ug2的融合时的剩余支持度表示为
Figure FDA0002262613650000058
并有:
步骤4.6、将k+1赋值给k后判断,k>Z是否成立,若成立,则表示得到得到并执行步骤4.7;否则,返回步骤4.5;
步骤4.7、根据式(19)对群组内Z个成员的融合支持度
Figure FDA00022626136500000511
进行归一化处理,获得归一化后的融合支持度mv,e(Z),从而利用式(22)得到所有Z个成员对项目v的融合预测评分为pv
步骤5、根据步骤4,得到第g个群组Gg群组对所有项目的融合预测评分,并进行降序排序,从而选取前W个项目作为第g个群组Gg的推荐列表;进而获得所有群组的推荐列表。
CN201911076443.8A 2019-11-06 2019-11-06 一种基于证据理论的群推荐方法 Active CN110825981B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911076443.8A CN110825981B (zh) 2019-11-06 2019-11-06 一种基于证据理论的群推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911076443.8A CN110825981B (zh) 2019-11-06 2019-11-06 一种基于证据理论的群推荐方法

Publications (2)

Publication Number Publication Date
CN110825981A true CN110825981A (zh) 2020-02-21
CN110825981B CN110825981B (zh) 2021-08-17

Family

ID=69553206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911076443.8A Active CN110825981B (zh) 2019-11-06 2019-11-06 一种基于证据理论的群推荐方法

Country Status (1)

Country Link
CN (1) CN110825981B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113938344A (zh) * 2020-07-14 2022-01-14 中国移动通信有限公司研究院 家庭宽带业务家庭群组满意度确定方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763304A (zh) * 2009-12-31 2010-06-30 合肥工业大学 一种基于证据理论的不确定型软件可信性评估方法
CN103425880A (zh) * 2013-08-06 2013-12-04 福建江夏学院 一种基于证据理论的群组间个体双向最佳匹配决策算法
US20150278909A1 (en) * 2014-03-27 2015-10-01 Yahoo! Inc. Techniques for improving diversity and privacy in connection with use of recommendation systems
CN105260390A (zh) * 2015-09-11 2016-01-20 合肥工业大学 一种面向群组的基于联合概率矩阵分解的项目推荐方法
US9602607B2 (en) * 2013-05-10 2017-03-21 International Business Machines Corporation Query-driven virtual social network group

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763304A (zh) * 2009-12-31 2010-06-30 合肥工业大学 一种基于证据理论的不确定型软件可信性评估方法
US9602607B2 (en) * 2013-05-10 2017-03-21 International Business Machines Corporation Query-driven virtual social network group
CN103425880A (zh) * 2013-08-06 2013-12-04 福建江夏学院 一种基于证据理论的群组间个体双向最佳匹配决策算法
US20150278909A1 (en) * 2014-03-27 2015-10-01 Yahoo! Inc. Techniques for improving diversity and privacy in connection with use of recommendation systems
CN105260390A (zh) * 2015-09-11 2016-01-20 合肥工业大学 一种面向群组的基于联合概率矩阵分解的项目推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
F ORTEGA等: "Incorporating group recommendations to recommender systems: Alternatives and performance", 《INFORMATION PROCESSING AND MANAGEMENT》 *
王刚等: "基于联合概率矩阵分解的群推荐方法研究", 《计算机学报》 *
陈云翔等: "基于证据理论和直觉模糊集的群决策信息集结方法", 《系统工程与电子技术》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113938344A (zh) * 2020-07-14 2022-01-14 中国移动通信有限公司研究院 家庭宽带业务家庭群组满意度确定方法及系统

Also Published As

Publication number Publication date
CN110825981B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN108460619B (zh) 一种提供融合显隐式反馈的协同推荐模型的方法
CN111428147B (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN110362738B (zh) 一种基于深度学习的结合信任和影响力的个性化推荐方法
CN111859166B (zh) 一种基于改进的图卷积神经网络的物品评分预测方法
US20090210246A1 (en) Statistical personalized recommendation system
US20040172267A1 (en) Statistical personalized recommendation system
CN106980648B (zh) 一种基于概率矩阵分解结合相似度的个性化推荐方法
Navgaran et al. Evolutionary based matrix factorization method for collaborative filtering systems
CN107562787B (zh) 一种poi编码方法及装置、poi推荐方法,电子设备
Blédaité et al. Pairwise preferences elicitation and exploitation for conversational collaborative filtering
Ding et al. Product color emotional design considering color layout
CN105787100A (zh) 一种基于深度神经网络的用户会话推荐方法
CN110222838B (zh) 文档排序方法、装置、电子设备及存储介质
Ding et al. Product color emotional design based on a convolutional neural network and search neural network
CN110825981B (zh) 一种基于证据理论的群推荐方法
CN113330462A (zh) 使用软最近邻损失的神经网络训练
CN107391637A (zh) 针对具备地理社交信息的群组推荐方法
CN108537638B (zh) 基于贝叶斯回归的利基产品推荐方法及装置
CN116186409A (zh) 一种结合难度与薄弱知识点的多样化习题推荐方法、系统及设备
CN106528584B (zh) 一种基于组合学习的群组推荐方法
CN113849725B (zh) 一种基于图注意力对抗网络的社会化推荐方法及系统
CN112926329B (zh) 文本生成方法、装置、设备及计算机可读存储介质
Zhang et al. Potential Preference Based Bayesian Personalised Ranking for One-Class Collaborative Filtering
CN109918576B (zh) 一种基于联合概率矩阵分解的微博关注推荐方法
Chae et al. Adversarial training of deep autoencoders towards recommendation tasks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant