CN109857928B - 基于多元信用评估的用户偏好预测方法 - Google Patents

基于多元信用评估的用户偏好预测方法 Download PDF

Info

Publication number
CN109857928B
CN109857928B CN201811594836.3A CN201811594836A CN109857928B CN 109857928 B CN109857928 B CN 109857928B CN 201811594836 A CN201811594836 A CN 201811594836A CN 109857928 B CN109857928 B CN 109857928B
Authority
CN
China
Prior art keywords
user
trust
users
target
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811594836.3A
Other languages
English (en)
Other versions
CN109857928A (zh
Inventor
熊菲
李朝一
沈伟瀚
李泽松
杨平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
CETC Big Data Research Institute Co Ltd
Original Assignee
Beijing Jiaotong University
CETC Big Data Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University, CETC Big Data Research Institute Co Ltd filed Critical Beijing Jiaotong University
Priority to CN201811594836.3A priority Critical patent/CN109857928B/zh
Publication of CN109857928A publication Critical patent/CN109857928A/zh
Application granted granted Critical
Publication of CN109857928B publication Critical patent/CN109857928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种基于多元信用评估的用户偏好预测方法,属于互联网用户偏好预测技术领域。该方法首先构建目标用户与其他用户间的信任邻接矩阵以及目标用户与商品间的评分稀疏矩阵;根据信任邻接矩阵和评分稀疏矩阵,获取目标用户的综合信任度和重要度,并对其分别进行归一化处理;根据所述归一化处理后的综合信任度和重要度,建立目标用户对商品的评分预测模型,构造评分预测模型的目标函数,通过梯度下降法优化目标函数,获取用户偏好向量和商品特征向量;根据用户偏好向量和商品特征向量,计算目标用户偏好。本发明考虑了用户间的直接信任关系以及通过中介用户传递的间接信任关系,剔除了恶意用户对偏好预测的影响,计算复杂度小,预测更加准确。

Description

基于多元信用评估的用户偏好预测方法
技术领域
本发明涉及互联网用户偏好预测技术领域,具体涉及一种预测更加准确的基于多元信用评估的用户偏好预测方法。
背景技术
Web2.0的出现和普及给互联网用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着互联网规模的迅速扩大而带来的网上可用信息的大幅增加,使得互联网用户在面对大量信息时无法从中获取自己感兴趣的信息以及对自己有用的信息,降低了对信息的使用效率,这就是所谓的信息超载问题。
解决信息超载问题一个非常有潜力的办法是推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。
在推荐系统中,一个核心的问题就是对用户的偏好建模。所谓的用户偏好就是指用户对物品(可能是音乐,电影,商品等)的喜好程度。如何根据已有的用户行为和信息,准确地对用户偏好进行预测是一个很重要的问题。
传统推荐算法利用用户对物品的历史评分信息来预测用户的偏好,其中经典的推荐算法为协同过滤。协同过滤又包括基于物品的协同过滤与基于用户的协同过滤。基于物品的协同过滤算法的推荐思想是,如果用户喜欢物品A,那么该用户很可能也喜欢与A相似的物品B。基于用户的协同过滤算法的推荐思想是,如果用户A喜欢某一物品,那么与用户A相似的用户B也可能喜欢该物品。基于用户的协同过滤通过用户与物品关联矩阵计算用户间相似度,从而将相似用户感兴趣的物品有限推荐给目标用户。
近来结合用户的历史评分信息和用户之间的社交网络来预测用户的兴趣偏好成为推荐领域的一个研究热点。Epinions利用用户之间的直接信任关系来学习用户的偏好,从而为目标用户推荐其潜在感兴趣的物品。其基本思想是:相比于协同过滤算法计算得出的邻居,目标用户的兴趣偏好更接近于其直接信任的用户。通过利用用户的信任网络计算得出目标用户邻居以及评分权重并应用于协同过滤中的方法,推荐系统的准确性较传统协同过滤算法有较大的提升。通过在矩阵分解技术的基础上结合用户的信任网络,推荐系统可以更加准确地学习到用户的偏好向量和物品的特征向量,从而提供更加准确的个性化推荐结果。
虽然通过用户间的直接信任信息来预测用户的兴趣偏好取得了较传统算法更好的预测效果,但依然存在以下几个方面的问题:
第一,由于不同用户之间的信任值是不同的,因此利用直接信任用户之间的信任信息进行用户偏好预测的过程中需要对两两用户之间的信任值进行计算,譬如用户A同时信任用户B和用户C,但由于用户B的评分/评论和用户C的评分/评论对用户A的帮助不同,所以用户A对用户B和用户C的信任程度是不同的,所以需要分别计算用户A与用户B的信任度以及用户A与用户C的信任度,造成计算量大,且计算不准确。
第二,同用户评分信息类似,用户之间的信任信息也具有稀疏性,具体表现为用户信列表中的信任用户数量所占网站用户量的比例极小。信任信息的稀疏性导致用户之间信任值计算的不准确以及不能很好地计算用户的影响力,从而导致用户偏好预测的不准确。
第三,现有推荐系统没有将用户之间的不信任关系考虑进去,导致不能发现恶意用户的恶意评分/评论,从而影响信任值的计算准确性,损害推荐系统的性能表现。
发明内容
本发明的目的在于提供一种考虑了用户间的多元信用关系的用户偏好预测方法,以解决上述背景技术中存在的技术问题。
为了实现上述目的,本发明采取了如下技术方案:
本发明提供的一种基于多元信用评估的用户偏好预测方法,该方法包括如下流程步骤:
步骤S110:构建目标用户与其他用户间的信任邻接矩阵以及目标用户与商品间的评分稀疏矩阵;
步骤S120:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取所述目标用户的综合信任度,并对其进行归一化处理;
步骤S130:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取目标用户的重要度,并对其进行归一化处理;
步骤S140:根据所述归一化处理后的综合信任度和重要度,建立目标用户对商品的评分预测模型;
步骤S150:构造所述评分预测模型的目标函数,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量;
步骤S160:根据所述用户偏好向量和所述商品特征向量,利用所述评分预测模型计算目标用户偏好。
进一步的,所述步骤S110中,构建信任邻接矩阵具体包括:
根据每个用户的信任列表获得网络信任关系拓扑G={U,E},构建目标用户与其他用户之间的有向信任邻接矩阵M,其中,U表示用户集合,E表示用户间的信任关系集合,
Figure BDA0001921121690000041
进一步的,所述步骤S120具体包括,
步骤S121:根据所述评分稀疏矩阵,获取用户u和用户v之间的相似度;
Figure BDA0001921121690000042
其中,sim(u,v)表示用户u和用户v之间的相似度,
Figure BDA0001921121690000043
表示用户u对商品的平均评分,
Figure BDA0001921121690000044
表示用户v对商品的平均评分,I(u)表示用户u评价过的商品集合,I(v)表示用户v评价过的商品集合,Ru,i表示用户u对商品i的评分,Rv,i表示用户v对商品i的评分;
步骤S122:结合所述相似度,计算所述目标用户的直接信任度;
Figure BDA0001921121690000045
其中,DTu,v表示目标用户u和用户v之间的直接信任度,
Figure BDA0001921121690000046
表示与用户v有直接信任关系的用户的个数,
Figure BDA0001921121690000047
表示用户v的信任列表中的用户总个数,|Iv|表示用户v评价过的商品的个数,|I|表示商品的总个数;
步骤S123:计算所述目标用户的间接信任度,具体包括:
用户u与用户v之间除具有直接信任关系外,还存在通过其他具有与用户u存在直接信任关系的用户w传递的间接信任关系,则用户u与用户v之间的间接信任度为:
Figure BDA0001921121690000048
其中,DTw,v表示用户v与用户w之间的直接信任度,DTu,w表示用户u与用户w之间的直接信任度,
Figure BDA0001921121690000049
表示与用户u有直接信任关系的用户集合;
步骤S124:利用线性函数对所述直接信任度和所述间接信任度进行加权融合,得综合信任度,为:
T′u,v=mDTu,v+(1-m)ITu,v
其中,m表示一个0到1之间的常数,用来控制直接信任度和间接信任度所占的比重,m的值越大,直接信任度的比重越大,m的值越小,则间接信任度所占的比重越大;
步骤S125:对所述综合信任度进行归一化处理,使T′u,v的值保持在0到1之间,
Figure BDA0001921121690000051
其中,
Figure BDA0001921121690000052
表示的是用户u的信任用户的集合,它包括用户u的直接信任用户和间接信任用户。
进一步的,所述步骤S130具体包括:根据所述评分稀疏矩阵中目标用户评价过的商品数量以及所述信任邻接矩阵中目标用户受到其他用户信任的数量,得到目标用户的重要度为:
Figure BDA0001921121690000053
其中,|Iu|表示目标用户u所评价过的商品的个数,|I|表示商品的总个数,
Figure BDA0001921121690000054
表示用户u的活跃度,
Figure BDA0001921121690000055
表示用户u的信任关系的数量,|T|表示信任关系的总个数,
Figure BDA0001921121690000056
表示用户u的权威度,s是一个0到1之间的常数,s的值越大,用户的活跃度在重要度中所占比重越大,s越小,用户权威度在重要度中所占比重越大,∈ut表示网络中评分数与用户u一样的用户的比例,δut表示网络中关注者数量和用户u一样的用户的比例;
对重要度Wu′进行归一化处理,得:
Figure BDA0001921121690000061
进一步的,所述步骤S140中,建立的目标用户对商品的评分预测模型为:
Figure BDA0001921121690000062
其中,
Figure BDA0001921121690000063
表示用户u对商品i的偏好预测值,qi表示商品i的特征向量,pu表示用户u的特征向量,b是一个0到1之间的常数,用来控制用户重要度和综合信任度最预测结果的影响,b的值越大,用户重要度的影响越大,b的值越小,用户综合信任度的影响越大。
进一步的,所述步骤S150中,建立的目标函数为:
Figure BDA0001921121690000064
其中,λ是0到1之间的常数,用来防止过拟合,
Figure BDA0001921121690000065
表示二范数,Θ表示为防止过拟合所需要用到的参数。
进一步的,所述步骤S150中,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量具体包括:
Figure BDA0001921121690000066
Figure BDA0001921121690000067
Figure BDA0001921121690000068
Figure BDA0001921121690000071
其中,
Figure BDA0001921121690000072
表示偏好预测值与真实值之间的差值的绝对值。
本发明有益效果:本发明考虑了用户间的直接信任关系以及通过中介用户传递的间接信任关系,剔除了恶意用户的恶意评论对偏好预测的影响,计算复杂度更小,预测更加准确。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述的基于多元信用评估的用户偏好预测方法流程图。
图2为本发明实施例所述的计算目标用户综合信任度的方法流程图。
图3为本发明实施例二所述的基于多元信用评估的用户偏好预测方法原理框图。
图4为本发明实施例二所述的用户信任关系拓扑图。
图5为本发明实施例二所述的用户-用户间的信任邻接矩阵示意图。
图6为本发明实施例二所述的用户-商品间的评分稀疏矩阵示意图。
图7为本发明实施例二所述的模型时间复杂度随数据量的变化示意图。
图8为本发明实施例二所述的用户对商品的评分分布示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的模块。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以具体实施例为例做进一步的解释说明,且实施例并不构成对本发明实施例的限定。
本领域普通技术人员应当理解的是,附图只是一个实施例的示意图,附图中的部件或装置并不一定是实施本发明所必须的。
实施例一
如图1所示,本发明实施例一提供了一种基于多元信用评估的用户偏好预测方法,包括如下流程步骤:
步骤S110:构建目标用户与其他用户间的信任邻接矩阵以及目标用户与商品间的评分稀疏矩阵;
步骤S120:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取所述目标用户的综合信任度,并对其进行归一化处理;
步骤S130:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取目标用户的重要度,并对其进行归一化处理;
步骤S140:根据所述归一化处理后的综合信任度和重要度,建立目标用户对商品的评分预测模型;
步骤S150:构造所述评分预测模型的目标函数,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量;
步骤S160:根据所述用户偏好向量和所述商品特征向量,利用所述评分预测模型计算目标用户偏好。
在本发明的具体实施例一中,所述步骤S110中,构建信任邻接矩阵具体包括:
根据每个用户的信任列表获得网络信任关系拓扑G={U,E},构建目标用户与其他用户之间的有向信任邻接矩阵M,其中,U表示用户集合,E表示用户间的信任关系集合,
Figure BDA0001921121690000091
如图2所示,在本发明的具体实施例一中,所述步骤S120具体包括,
步骤S121:根据所述评分稀疏矩阵,获取用户u和用户v之间的相似度;
Figure BDA0001921121690000092
其中,sim(u,v)表示用户u和用户v之间的相似度,
Figure BDA0001921121690000093
表示用户u对商品的平均评分,
Figure BDA0001921121690000094
表示用户v对商品的平均评分,I(u)表示用户u评价过的商品集合,I(v)表示用户v评价过的商品集合,Ru,i表示用户u对商品i的评分,Rv,i表示用户v对商品i的评分;
步骤S122:结合所述相似度,计算所述目标用户的直接信任度;
Figure BDA0001921121690000095
其中,DTu,v表示目标用户u和用户v之间的直接信任度,
Figure BDA0001921121690000096
表示与用户v有直接信任关系的用户的个数,
Figure BDA0001921121690000097
表示用户v的信任列表中的用户总个数,|Iv|表示用户v评价过的商品的个数,|I|表示商品的总个数;
步骤S123:计算所述目标用户的间接信任度,具体包括:
用户u与用户v之间除具有直接信任关系外,还存在通过其他具有与用户u存在直接信任关系的用户w传递的间接信任关系,则用户u与用户v之间的间接信任度为:
Figure BDA0001921121690000101
其中,DTw,v表示用户v与用户w之间的直接信任度,DTu,w表示用户u与用户w之间的直接信任度,
Figure BDA0001921121690000102
表示与用户u有直接信任关系的用户集合;
步骤S124:利用线性函数对所述直接信任度和所述间接信任度进行加权融合,得综合信任度,为:
T′u,v=mDTu,v+(1-m)ITu,v
其中,m表示一个0到1之间的常数,用来控制直接信任度和间接信任度所占的比重,m的值越大,直接信任度的比重越大,m的值越小,则间接信任度所占的比重越大;
步骤S125:对所述综合信任度进行归一化处理,使T′u,v的值保持在0到1之间,
Figure BDA0001921121690000103
其中,
Figure BDA0001921121690000104
表示的是用户u的信任用户的集合,它包括用户u的直接信任用户和间接信任用户。
在本发明的具体实施例一中,所述步骤S130具体包括:根据所述评分稀疏矩阵中目标用户评价过的商品数量以及所述信任邻接矩阵中目标用户受到其他用户信任的数量,得到目标用户的重要度为:
Figure BDA0001921121690000105
其中,|Iu|表示目标用户u所评价过的商品的个数,|I|表示商品的总个数,
Figure BDA0001921121690000111
表示用户u的活跃度,
Figure BDA0001921121690000112
表示用户u的信任关系的数量,|T|表示信任关系的总个数,
Figure BDA0001921121690000113
表示用户u的权威度,s是一个0到1之间的常数,s的值越大,用户的活跃度在重要度中所占比重越大,s越小,用户权威度在重要度中所占比重越大,∈ut表示网络中评分数与用户u一样的用户的比例,δut表示网络中关注者数量和用户u一样的用户的比例;
对重要度Wu′进行归一化处理,得:
Figure BDA0001921121690000114
在本发明的具体实施例一中,所述步骤S140中,建立的目标用户对商品的评分预测模型为:
Figure BDA0001921121690000115
其中,
Figure BDA0001921121690000116
表示用户u对商品i的偏好预测值,qi表示商品i的特征向量,pu表示用户u的特征向量,b是一个0到1之间的常数,用来控制用户重要度和综合信任度最预测结果的影响,b的值越大,用户重要度的影响越大,b的值越小,用户综合信任度的影响越大。
在本发明的具体实施例一中,所述步骤S150中,建立的目标函数为:
Figure BDA0001921121690000117
其中,λ是0到1之间的常数,用来防止过拟合,
Figure BDA0001921121690000118
表示二范数,Θ表示为防止过拟合所需要用到的参数。
在本发明的具体实施例一中,所述步骤S150中,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量具体包括:
Figure BDA0001921121690000121
Figure BDA0001921121690000122
Figure BDA0001921121690000123
Figure BDA0001921121690000124
其中,
Figure BDA0001921121690000125
表示偏好预测值与真实值之间的差值的绝对值。
实施例二
如图3所示,本发明的实施例二为解决利用直接信任关系预测用户偏好算法中存在的问题,提供一种基于多元信用评估的用户偏好预测方法,使得对用户的偏好预测更加准确。本发明通过对据收集的用户-商品稀疏大矩阵和用户-用户关系矩阵的学习分解,分解为低维隐式空间中的两个矩阵,初始矩阵与分解为的两个矩阵点乘之间满足差值的最小化,计算过程中最小化这个差值的目标函数,通过梯度下降方法优化两个矩阵,并最终将两个矩阵点乘得到预测矩阵。
实施例二所述的方法具体包括如下步骤:
(1)用户信任关系矩阵的建立和更新
用户信任关系矩阵是进行用户偏好预测的基础性依据。它是依据用户信任数据的拓扑结构得到。
用户在选择一件商品的时候,往往会寻求他所信任的用户的建议。因此,获取用户的信任关系数据并进行处理是十分有必要的,本发明实施例二采用的方法是构建信任关系矩阵。首先,需要根据每个用户的信任列表获得网络信任拓扑,例如,用户A的信任列表中有用户B,则A到B之间有一条单向的信任关系。
如图4所示,假设用一个拓扑图G=(U,E)来表示用户之间的信任关系,U集合表示用户集合,E表示用户之间的信任关系集合。
图4中,信任关系E为各用户(节点)之间的有向边。图中u1到u2之间有一条单向箭头,代表用户u1的信任列表中包含u2。根据这个信任关系拓扑图,可以构成用户与用户之间的有向信任邻接矩阵M,如图5所示。数值0或1反映了用户间是否存在直接信任关系,即
Figure BDA0001921121690000131
由于更新用户的信任关系矩阵需要重新扫描所有用户的信任列表,因此如果将更新机制设定为监听模式,用户每次更新信任关系时就立即更新矩阵会耗费很多的资源且不易实现。因此可以设定一个时间阈值t,通常用户不会频繁更新自己的信任列表,因此可以将t设置为1小时,这样每过1小时就重新统计用户信任数据建立新的信任关系矩阵,既可以高效的利用资源同时不会过多的影响到数据的时效性。
(2)用户的综合信任度计算
首先,计算直接信任度。
直接信任度DTu,v表示存在直接信任关系的用户u和v的信任度。在本发明的具体实施例二中,直接信任度由用户直接信任关系和相似度得到。
Figure BDA0001921121690000132
其中,Mu,v的值取自用户信任关系矩阵,
Figure BDA0001921121690000133
表示用户v所受到的信任个数,或者说是信任用户v的用户数量,
Figure BDA0001921121690000134
则是用户v信任列表的用户个数。
Figure BDA0001921121690000141
的值过低则表示该用户很可能是僵尸用户,因此是不值得信赖的,
Figure BDA0001921121690000142
的值越高说明其在信任网络中的权重越高,因此信任度也越高。|Iv|表示用户v所评价过的商品个数,|I|表示商品列表的总个数,
Figure BDA0001921121690000143
越高表示该用户的活跃度越高,因此也更值得信赖。而用户的相似度sim(u,v)的计算需要用户-商品矩阵评分R。当用户点击或者购买某一个商品后,会为这件商品进行打分,通常这个值在0到5之间。
如图6所示,为本发明实施例二的一个用户对商品的评分稀疏矩阵,用户集合U={u1,u2,...,u5},商品集合I={i1,i2,...,i5}。
有了用户-商品的评分矩阵,就可以通过评分值来计算两用户之间的相似度。至于相似度计算方法,本发明实施例二采用PCC法计算相似度。
Figure BDA0001921121690000144
其中,
Figure BDA0001921121690000145
表示用户u的平均评分,I(u)表示用户u评价过的商品的集合,I(v)表示用户v评价过的商品的集合。
然后,计算间接信任度。
间接信任度表示除了直接信任度以外,两个用户之间的间接影响。尤其当两用户之间没有直接信任关系时,间接信任度的计算尤为重要。由于人与人之间的信任关系存在着一定的传递性。例如,当一个用户寻求他所信任的朋友的帮助时,他的朋友也可能继续寻找自己所信任的朋友来提供建议。同时考虑到太长的传递路径并没有实际意义,因此本发明只考虑两用户之间仅存在一次信任传递的情况,也就是用户u到v之间可以通过中介用户w传递信任关系。间接信任度的结算可以通过与中介用户之间的直接信任度传递得到,而中介用户则选自
Figure BDA0001921121690000151
为用户u的直接信任用户集合。则,间接信任度可表示为:
Figure BDA0001921121690000152
其中,其中,DTw,v表示用户v与用户w之间的直接信任度,DTu,w表示用户u与用户w之间的直接信任度。
最后,计算综合信任度。
综合信任度根据用户之间的直接信任度和间接信任度得出,利用线性函数对两者进行加权融合就可以得出两用户之间的综合信任度。
T′u,v=mDTu,v+(1-m)ITu,t
其中,m是一个0到1之间的常数,用来控制直接信任度和间接信任度所占的比重。m的值越大,直接信任度的比重越大,m的值越小,则间接信任所占的比重越大。
对上面得到的综合信任度的进行归一化处理,使得T′u,v的值保持在0到1之间。
Figure BDA0001921121690000153
其中,
Figure BDA0001921121690000154
表示的是用户u的信任用户的集合,它包括用户u的直接信任用户和间接信任用户。
(3)计算用户的重要度
由于在预测目标用户的偏好时需要考虑到其他用户的影响,因此简单的认为每个用户对目标用户的影响程度都相同是不合理的。在本发明的评估系统中每个用户具有不同的重要程度。用户的重要程度可以从两个方面进行计算:1)用户评价过的商品数量。用户评价过得商品越多,代表其越活跃,用户在受到其他用户影响时,越活跃的用户其影响力通常更大。2)用户受到其他用户的信任数量。用户受到的信任关系乐队,代表其权威性越大,用户在受到其他用户影响时,越权威的用户其影响力也越大。因此,本发明实施例二中,用户的重要性可以通过下面的公式计算。
Figure BDA0001921121690000161
其中,|Iu|表示用户u所评分过得商品个数,|I|表示商品的总个数,
Figure BDA0001921121690000162
代表了用户的活跃度。
Figure BDA0001921121690000163
表示用户u受到的信任关系数量,或者说是信任用户u的用户数量。|T|表示信任关系的总个数,
Figure BDA0001921121690000164
代表了用户的权威度。s是一个0到1之间的常数,s的值越大,用户的活跃度在重要度中所占比重越大,s越小,用户权威度在重要度中所占比重越大。∈ut表示网络中评分数与用户u一样的用户的比例,δut表示网络中关注者数量和用户u一样的用户的比例。对上面的得到的重要度Wu′进行归一化处理:
Figure BDA0001921121690000165
(4)偏好的预测
在本发明的实施例二中,在对用户信任度和重要度进行计算之后,就可以开始评估用户对商品的偏好程度,在本发明的实施例二中,使用用户对商品评分作为偏好程度的评判标准,计算方法如下。
建立商品评分预测模型:
Figure BDA0001921121690000166
其中,
Figure BDA0001921121690000167
表示用户u对商品i的预测值,qi表示的是商品i的特征向量,pu表示的是用户u的特征向量。b是一个0到1之间的常数,用来控制用户重要度和综合信任度最预测结果的影响。b的值越大,用户重要度的影响越大,b的值越小,用户综合信任度的影响越大。
在本发明的具体实施例二中,为了使预测值尽量接近真实值,需要对下面的目标函数进行优化学习。
Figure BDA0001921121690000171
当L的值最小时,预测的
Figure BDA0001921121690000172
就最接近真实值。λ是0到1之间的常数,用来防止过拟合,
Figure BDA0001921121690000173
表示二范数,Θ表示为防止过拟合所需要用到的参数。
为了使得L的值最小,需要采用低度下降法,其计算方法如下:
Figure BDA0001921121690000174
Figure BDA0001921121690000175
Figure BDA0001921121690000176
Figure BDA0001921121690000177
其中,
Figure BDA0001921121690000178
表示偏好预测值与真实值之间的差值的绝对值。通过最小化目标函数来学习得到用户偏好向量和商品特征向量,并分别组成矩阵P和Q。用P和Q的乘积来预测用户的偏好。
对比验证试验
本实验通过利用以下五种算法的偏好预测方法与本发明实施例所述的方法进行对比:
1.PMF:概率矩阵分解,是在正则化矩阵分解的基础上,引入了概率模型进一步优化。
2.SoRec:同时对评分矩阵和社交关系矩阵进行矩阵分解,共享用户特征空间。
3.RSTE:在矩阵分解基础上结合基于信任的邻居模型,用邻居的评分对目标用户的评分作出预测。
4.SocialMF:通过引入正则项的方式结合直接信任信息,使目标用户的兴趣偏好于其信任好友接近。
5.SoReg:在矩阵分解的基础上引入了社交正则项,并通过目标用户与其信任用户之间的评分相似度来控制目标用户与其信任好友之间兴趣偏好的相近程度。
试验过程如下:
一,数据准备
我们选取了推荐系统常用的标准评分数据集Epinions,对数据集进行预处理后,提取276116条评分数据和52982条直接信任数据进行仿真实验,实验数据集组成的矩阵的稀疏度分别为0.43%和0.096%。
二,形成训练集测试集
采用交叉验证的方法进行仿真实验。将评分数据集中的80%的数据抽出作为训练集,将剩下20%的数据作为验证集。
三,实验过程
首先初始化随机生成低维矩阵P、Q,维度k设为10,然后根据目标函数利用低度下降法进行P,Q的更新,迭代更新P、Q至目标函数收敛。共进行10次实验,最终结果取平均。
四,性能指标
1.我们选取均方根误差(RMSE)和绝对误差(MAE)两个指标来进行算法性能的判断。两个指标的基本思想都是判断预测矩阵与测试矩阵之间的距离。RMSE和MAE的公式分别为:
Figure BDA0001921121690000191
Figure BDA0001921121690000192
对于上述两个指标,其值越小表明预测推荐的性能越好。如下表1所示,为上述五种算法与本发明实施例所述的算法的两个指标值的对比表。
表1:
Figure BDA0001921121690000193
由表1可知,本发明实施例所述的算法,指标MAE的值为0.7988,指标RMSE的值为1.0322,两个指标值均小于其他五种算法的指标值,性能优于其他五种算法。
如图7所示,为本发明实施例所述的方法的计算时间与所计算的数据量的关系。该图说明了我们的算法的时间消耗与数据量呈线性关系,表明我们的模型应用在大数据时,时间效率依然较高。
如图8所示,为本发明对比实验中实际场景中用户评价过的物品数是服从幂率分布分布示意图,即评价过较多物品的用户只占总体用户很小的一部分,绝大部分用户评价过的物品数量很少。大部分用户评价过的物品数量集中在35个以下。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (5)

1.一种基于多元信用评估的用户偏好预测方法,其特征在于,包括如下流程步骤:
步骤S110:构建目标用户与其他用户间的信任邻接矩阵以及目标用户与商品间的评分稀疏矩阵;
步骤S120:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取所述目标用户的综合信任度,并对其进行归一化处理;
步骤S130:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取目标用户的重要度,并对其进行归一化处理;
步骤S140:根据所述归一化处理后的综合信任度和重要度,建立目标用户对商品的评分预测模型;
步骤S150:构造所述评分预测模型的目标函数,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量;
步骤S160:根据所述用户偏好向量和所述商品特征向量,利用所述评分预测模型计算目标用户偏好;
所述步骤S110中,构建信任邻接矩阵具体包括:
根据每个用户的信任列表获得网络信任关系拓扑G={U,E},构建目标用户与其他用户之间的有向信任邻接矩阵M,其中,U表示用户集合,E表示用户间的信任关系集合,
Figure FDA0002733086140000011
所述步骤S120具体包括,
步骤S121:根据所述评分稀疏矩阵,获取用户u和用户v之间的相似度;
Figure FDA0002733086140000021
其中,sim(u,v)表示用户u和用户v之间的相似度,
Figure FDA0002733086140000022
表示用户u对商品的平均评分,
Figure FDA0002733086140000023
表示用户v对商品的平均评分,I(u)表示用户u评价过的商品集合,I(v)表示用户v评价过的商品集合,Ru,i表示用户u对商品i的评分,Rv,i表示用户v对商品i的评分;
步骤S122:结合所述相似度,计算所述目标用户的直接信任度;
Figure FDA0002733086140000024
其中,DTu,v表示目标用户u和用户v之间的直接信任度,
Figure FDA0002733086140000025
表示与用户v有直接信任关系的用户的个数,
Figure FDA0002733086140000026
表示用户v的信任列表中的用户总个数,|Iv|表示用户v评价过的商品的个数,|I|表示商品的总个数;
步骤S123:计算所述目标用户的间接信任度,具体包括:
用户u与用户v之间除具有直接信任关系外,还存在通过其他具有与用户u存在直接信任关系的用户w传递的间接信任关系,则用户u与用户v之间的间接信任度为:
Figure FDA0002733086140000027
其中,DTw,v表示用户v与用户w之间的直接信任度,DTu,w表示用户u与用户w之间的直接信任度,
Figure FDA0002733086140000028
表示与用户u有直接信任关系的用户集合;
步骤S124:利用线性函数对所述直接信任度和所述间接信任度进行加权融合,得综合信任度,为:
T′u,v=mDTu,v+(1-m)ITu,v
其中,m表示一个0到1之间的常数,用来控制直接信任度和间接信任度所占的比重,m的值越大,直接信任度的比重越大,m的值越小,则间接信任度所占的比重越大;
步骤S125:对所述综合信任度进行归一化处理,使T′u,v的值保持在0到1之间,
Figure FDA0002733086140000031
其中,
Figure FDA0002733086140000032
表示的是用户u的信任用户的集合,它包括用户u的直接信任用户和间接信任用户。
2.根据权利要求1所述的方法,其特征在于,所述步骤S130具体包括:根据所述评分稀疏矩阵中目标用户评价过的商品数量以及所述信任邻接矩阵中目标用户受到其他用户信任的数量,得到目标用户的重要度为:
Figure FDA0002733086140000033
其中,|Iu|表示目标用户u所评价过的商品的个数,|I|表示商品的总个数,
Figure FDA0002733086140000034
表示用户u的活跃度,|Tu|表示用户u的信任关系的数量,|T|表示信任关系的总个数,
Figure FDA0002733086140000035
表示用户u的权威度,s是一个0到1之间的常数,s的值越大,用户的活跃度在重要度中所占比重越大,s越小,用户权威度在重要度中所占比重越大,∈ut表示网络中评分数与用户u一样的用户的比例,δut表示网络中关注者数量和用户u一样的用户的比例;
对重要度Wu′进行归一化处理,得:
Figure FDA0002733086140000036
3.根据权利要求2所述的方法,其特征在于,所述步骤S140中,建立的目标用户对商品的评分预测模型为:
Figure FDA0002733086140000041
其中,
Figure FDA0002733086140000042
表示用户u对商品i的偏好预测值,qi表示商品i的特征向量,pu表示用户u的特征向量,b是一个0到1之间的常数,用来控制用户重要度和综合信任度最预测结果的影响,b的值越大,用户重要度的影响越大,b的值越小,用户综合信任度的影响越大。
4.根据权利要求3所述的方法,其特征在于,所述步骤S150中,建立的目标函数为:
Figure FDA0002733086140000043
其中,λ是0到1之间的常数,用来防止过拟合,
Figure FDA0002733086140000044
表示为防止过拟合所需要用到的参数的二范数,Θ表示为防止过拟合所需要用到的参数;
Figure FDA0002733086140000045
表示用户u对商品i的偏好预测值,ru,i表示用户u对商品i的偏好真实值。
5.根据权利要求4所述的方法,其特征在于,所述步骤S150中,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量具体包括:
Figure FDA0002733086140000046
Figure FDA0002733086140000047
Figure FDA0002733086140000048
Figure FDA0002733086140000049
其中,
Figure FDA00027330861400000410
表示偏好预测值与真实值之间的差值的绝对值。
CN201811594836.3A 2018-12-25 2018-12-25 基于多元信用评估的用户偏好预测方法 Active CN109857928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811594836.3A CN109857928B (zh) 2018-12-25 2018-12-25 基于多元信用评估的用户偏好预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811594836.3A CN109857928B (zh) 2018-12-25 2018-12-25 基于多元信用评估的用户偏好预测方法

Publications (2)

Publication Number Publication Date
CN109857928A CN109857928A (zh) 2019-06-07
CN109857928B true CN109857928B (zh) 2020-12-29

Family

ID=66892307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811594836.3A Active CN109857928B (zh) 2018-12-25 2018-12-25 基于多元信用评估的用户偏好预测方法

Country Status (1)

Country Link
CN (1) CN109857928B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111178986B (zh) * 2020-02-18 2023-04-07 电子科技大学 用户-商品偏好的预测方法及系统
CN111723290B (zh) * 2020-06-09 2023-04-18 清华大学深圳国际研究生院 基于多角度非传递偏好关系的用户个性化偏好预测方法
CN112883289B (zh) * 2021-04-16 2022-05-06 河北工程大学 一种基于社交信任和标签语义相似度的pmf推荐方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740430A (zh) * 2016-01-29 2016-07-06 大连理工大学 一种融合社会化信息的个性化推荐方法
CN106484876A (zh) * 2016-10-13 2017-03-08 中山大学 一种基于典型度和信任网络的协同过滤推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10041803B2 (en) * 2015-06-18 2018-08-07 Amgine Technologies (Us), Inc. Scoring system for travel planning

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740430A (zh) * 2016-01-29 2016-07-06 大连理工大学 一种融合社会化信息的个性化推荐方法
CN106484876A (zh) * 2016-10-13 2017-03-08 中山大学 一种基于典型度和信任网络的协同过滤推荐方法

Also Published As

Publication number Publication date
CN109857928A (zh) 2019-06-07

Similar Documents

Publication Publication Date Title
Cai et al. A hybrid recommendation system with many-objective evolutionary algorithm
CN106682114B (zh) 一种融合用户信任关系和评论信息的个性化推荐方法
CN111127142B (zh) 一种基于广义神经注意力的物品推荐方法
CN106980648B (zh) 一种基于概率矩阵分解结合相似度的个性化推荐方法
Ghavipour et al. An adaptive fuzzy recommender system based on learning automata
CN109857928B (zh) 基于多元信用评估的用户偏好预测方法
CN107301583B (zh) 一种基于用户偏好和信任的冷启动推荐方法
CN109635206B (zh) 融合隐式反馈和用户社会地位的个性化推荐方法及系统
Hassan et al. Genetic algorithm approaches for improving prediction accuracy of multi-criteria recommender systems
CN111400612A (zh) 一种融合社交影响和项目关联的个性化推荐方法
CN111475744B (zh) 一种基于集成学习的个性化位置推荐方法
CN116244513B (zh) 随机群组poi推荐方法、系统、设备及存储介质
Wu et al. Optimization matrix factorization recommendation algorithm based on rating centrality
Jin et al. Neighborhood-aware web service quality prediction using deep learning
CN113590976A (zh) 一种空间自适应图卷积网络的推荐方法
CN112883289B (zh) 一种基于社交信任和标签语义相似度的pmf推荐方法
CN110795640B (zh) 一种弥补群组成员差异的自适应组推荐方法
CN111198991A (zh) 一种基于信任度和专家用户的协同过滤推荐方法
CN116541592A (zh) 向量生成方法、信息推荐方法、装置、设备及介质
CN116308618A (zh) 一种推荐模型的训练方法、推荐模型及商品推荐方法
Zhang et al. A factored similarity model with trust and social influence for top-n recommendation
CN115599990A (zh) 一种知识感知结合深度强化学习的跨域推荐方法及系统
Li et al. Genetic algorithm and graph theory based matrix factorization method for online friend recommendation
Liu et al. Effective similarity measures of collaborative filtering recommendations based on user ratings habits
CN104883366A (zh) 利用用户实时反馈信息更新Web服务可靠性预测值的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant