CN113918823A - 一种融合信任关系的排序学习poi推荐算法 - Google Patents

一种融合信任关系的排序学习poi推荐算法 Download PDF

Info

Publication number
CN113918823A
CN113918823A CN202111286263.XA CN202111286263A CN113918823A CN 113918823 A CN113918823 A CN 113918823A CN 202111286263 A CN202111286263 A CN 202111286263A CN 113918823 A CN113918823 A CN 113918823A
Authority
CN
China
Prior art keywords
user
users
trust
attribute
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111286263.XA
Other languages
English (en)
Inventor
张秀娟
马瑞
刘鹏涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Wanwei Information Technology Co Ltd
Original Assignee
China Telecom Wanwei Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Wanwei Information Technology Co Ltd filed Critical China Telecom Wanwei Information Technology Co Ltd
Priority to CN202111286263.XA priority Critical patent/CN113918823A/zh
Publication of CN113918823A publication Critical patent/CN113918823A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及大数据处理技术领域,具体为融合信任关系的排序学习POI推荐算法。算法首先通过分析多层社交网络中用户的结构特征与社会属性特征对信任值的影响,构建用户之间的综合信任值,然后将用户的综合信任值应用到矩阵分解中获得用户的初始推荐列表,最后利用排序学习获得每个用户的最终的推荐列表。本发明通过引入边信息与矩阵分解相结合获得初始推荐列表,在一定程度上缓解了POI推荐的数据稀疏性与冷启动带来的影响,同时利用排序学习的隐语义分析模型进一步弥补了隐性反馈不足的缺点。实验结果在真实数据集上表明,所提算法与同类型的算法相比提高了推荐的准确性。

Description

一种融合信任关系的排序学习POI推荐算法
技术领域
本发明涉及大数据处理技术领域,具体为融合信任关系的排序学习POI推荐算法。
背景技术
随着移动互联的快速发展与全球定位系统的逐渐完善,基于位置的社交网络(location-based social network,LBSN)成为当前研究的热点,相继产生了一系列的LBSN应用服务,如Foursquare、Twinkle、Yelp等。这些应用服务依据各自的社交平台收集用户分享的位置签到信息,充分挖掘用户与签到位置之间的关联关系,从而为用户提供优质化服务。POI推荐是指通过分析用户的历史签到位置数据,为用户推荐感兴趣的位置,如餐厅、酒店、商店等等。利用兴趣点推荐有助于用户快速搜索同城的生活服务、适应新环境,以及减少搜索时间成本,同时也为商家带来潜在的经济利益。
与传统推荐系统(如商品推荐、电影推荐等)不同,POI推荐涉及面更广,推荐任务更加复杂。POI推荐是以LBSN为研究基石,研究内容涵盖用户与用户之间社交关系,用户与位置之间的牵连关系,以及与POI相关的语义关系等三个方面的内容。由于在LBSN服务中涉及到的兴趣点种类繁多,而用户的签到记录相对较少,POI推荐面临着更为严重的数据稀疏、冷启动问题。此外,用户的签到数据涉及个人隐私,为保护隐私不被泄露,用户的签到数据往往不会被记录,如何处理这样的数据隐性反馈已成为当前亟待解决的重要问题。
发明内容
近年来,为缓解POI推荐现存在的问题,研究学者将排序学习引入POI推荐系统,以提升推荐性能。排序学习通过自动的学习训练数据构建排序函数,按得分排序用户兴趣点列表,输出排名较高的兴趣点,实验结果表明,这些方法一定程度上提高了推荐性能。然而,传统的方法在构建排序函数的过程中,只考虑了用户历史签到的上下文信息和兴趣点的语义信息,并未融合用户的社交关系。社交关系是多层社交网络中维持用户联系的纽带,而社交关系的本质是信任关系,用户信任作为社会交互的核心部分,是一个人在社交网络中的相处模式的集中体现,也是维持和建立人际关系的桥梁。通过建立信任,人与人之间保持一种长期稳定的社交联系,随着时间的改变,信任关系越强的用户之间汇聚在一起,彼此之间共享信息,通过相互影响建立相似的兴趣与爱好。为此,我们融合信任关系重新构建排序学习的排序函数,提出一种融合用户社交关系的排序学习推荐模型(Ranking learning POIrecommendation algorithm fused with trust relationship,RLPOI)。
针对POI推荐数据稀疏、冷启动以及隐性反馈等问题,本发明提出一种融合信任关系的排序学习POI推荐算法。首先通过分析多层社交网络中用户结构信任与社会属性信任,获得用户之间的综合信任值。之后,利用融合信任关系的矩阵分解获得每个用户的初始推荐列表。最后,通过排序学习得到最终的推荐列表。
一种融合信任关系的排序学习POI推荐算法,其特征在于包括如下步骤:A将多层网络中结构信任与社会属性信任相结合获得用户之间的综合信任值;B将综合信任值与矩阵分解模型相结合获得用户初始推荐矩阵
Figure 379336DEST_PATH_IMAGE001
;C将综合信任值引入排序学习中得到KL损失函数,经过ALS最小二乘法迭代求解之后获得每个用户的最佳兴趣点推荐列表;
以Yelp数据集为基础,随机抽取m个用户对n个地点的签到数据,并且抽取到m个用户的社交数据集,分别为Twiitter层,Facebook层以及DBLP层,将用户的社会属性特征采用矩阵
Figure 246798DEST_PATH_IMAGE002
描述,1表示用户拥有该属性,0表示没有该属性,用户社会属性特征包含人口统计特征,如性别,年龄,职业,学历,此外也包含用户的兴趣、爱好;
S1:算法输入用户对兴趣点的签到矩阵
Figure 159260DEST_PATH_IMAGE003
和多层社交网络
Figure 562821DEST_PATH_IMAGE004
本文将多层社交网络形式化定义为带有属性信息的无向图
Figure 840219DEST_PATH_IMAGE004
其中
Figure 132660DEST_PATH_IMAGE005
表示网络层数,对应于用户扮演的角色数量,如研究网络由三层组成,分别为Twiitter层,Facebook层以及DBLP层,用户在每个层中都扮演着一个角色身份;
Figure 786495DEST_PATH_IMAGE006
表示n个节点集合;
Figure 808678DEST_PATH_IMAGE007
表示m个边集合,边为节点之间的社交关系,边上权值0<
Figure 758442DEST_PATH_IMAGE008
<1为节点之间关系的强弱程度;
Figure 600496DEST_PATH_IMAGE009
是网络中节点的属性集合;
签到矩阵
Figure 854759DEST_PATH_IMAGE003
表示m个用户对n个签到点的评分;
S2:依据最短路径信任值
Figure 731449DEST_PATH_IMAGE010
和路径数量信任值
Figure 869692DEST_PATH_IMAGE011
,通过(1)式来计算结构信任值
Figure 199042DEST_PATH_IMAGE012
Figure 132363DEST_PATH_IMAGE013
(1)
其中L表示网络层数,
Figure 597979DEST_PATH_IMAGE014
为不同层的用户之间的交互权重,满足0<
Figure 653660DEST_PATH_IMAGE014
<1,即当前层的交互频数占总交互频数的比重;当
Figure 768509DEST_PATH_IMAGE014
越接近1,表明当前层交互频数越重要;
Figure 630154DEST_PATH_IMAGE012
越大,用户之间的信任度越高;
S3:依据(2)式得到社会属性信任值
Figure 887960DEST_PATH_IMAGE015
Figure 114542DEST_PATH_IMAGE016
(2)
式中,
Figure 919950DEST_PATH_IMAGE017
表示社会属性数量,
Figure 257390DEST_PATH_IMAGE018
表示节点
Figure 697599DEST_PATH_IMAGE019
针对属性
Figure 360661DEST_PATH_IMAGE020
的信任关系,按属性的不同其取值可分为两种情况;当属性
Figure 184523DEST_PATH_IMAGE020
是离散属性时,如职业,文凭,年龄,用户
Figure 591233DEST_PATH_IMAGE019
有相同的属性值,
Figure 885949DEST_PATH_IMAGE021
的取值为1,否则为0;当属性
Figure 454333DEST_PATH_IMAGE020
是短本文属性时,如搜索记录、聊天记录等,受短文本挖掘的启发,以文本中关键词出现的频率来计算
Figure 962894DEST_PATH_IMAGE021
的取值;假设
Figure 579820DEST_PATH_IMAGE022
是文本属性
Figure 994621DEST_PATH_IMAGE020
的关键字,则
Figure 733907DEST_PATH_IMAGE023
,式中
Figure 30896DEST_PATH_IMAGE024
为包含关键字
Figure 280874DEST_PATH_IMAGE025
的节点数量,
Figure 284602DEST_PATH_IMAGE026
为节点
Figure 460369DEST_PATH_IMAGE027
的属性是否包含
Figure 120020DEST_PATH_IMAGE025
,如果包含
Figure 406645DEST_PATH_IMAGE028
=1,否则
Figure 31923DEST_PATH_IMAGE028
=0;
S4:依据公式(3)将结构信任值
Figure 909750DEST_PATH_IMAGE029
和社会属性信任值
Figure 384593DEST_PATH_IMAGE030
相结合得到用户之间的综合信任值
Figure 474909DEST_PATH_IMAGE031
Figure 954694DEST_PATH_IMAGE032
(3)
其中
Figure 144367DEST_PATH_IMAGE031
为用户i对j的单向信任值,当
Figure 840928DEST_PATH_IMAGE031
越接近1时,用户对的信任关系越强;
Figure 203776DEST_PATH_IMAGE029
为用户i对其近邻用户的信任总和,
Figure 567761DEST_PATH_IMAGE033
为指示函数,当
Figure 548575DEST_PATH_IMAGE030
小于等于0时,值为0;相反,值为
Figure 732431DEST_PATH_IMAGE030
;然而,在交互的过程中,用户之间信任关系的建立往往取决于信任值较低的一方,为此,本文选择
Figure 164550DEST_PATH_IMAGE034
作为用户之间的最终信任度;
S5:将S4步获得的综合信任值
Figure 383041DEST_PATH_IMAGE035
代入公式(4)中,通过最小化
Figure 478299DEST_PATH_IMAGE036
获得初始的用户签到矩阵
Figure 149451DEST_PATH_IMAGE037
Figure 119681DEST_PATH_IMAGE038
(4)
其中,
Figure 864783DEST_PATH_IMAGE039
为用户i对兴趣点h的签到记录,有签到记录
Figure 895056DEST_PATH_IMAGE040
=1,反之
Figure 289391DEST_PATH_IMAGE041
=0,
Figure 63312DEST_PATH_IMAGE042
为签到矩阵;
Figure 787554DEST_PATH_IMAGE043
为用户i的近邻偏好向量,即与用户i直接相连节点的偏好向量,偏好向量表示为用户的喜好特征,由用户签到矩阵分解得到;第二项将偏好向量与近邻偏好向量相减,以此间接修正用户偏好向量,提高推荐效率,通常近似强度依赖于信任关系强度;
通过最小化
Figure 988728DEST_PATH_IMAGE044
获得初始的用户签到矩阵
Figure 135938DEST_PATH_IMAGE045
本文采用随机梯度下降法求解
Figure 713550DEST_PATH_IMAGE044
Figure 495561DEST_PATH_IMAGE046
偏导数为:
Figure 867637DEST_PATH_IMAGE047
(5)
Figure 496283DEST_PATH_IMAGE048
等于0,可以计算得到
Figure 612007DEST_PATH_IMAGE049
(6)
Figure 248525DEST_PATH_IMAGE050
的偏导数为:
Figure 57081DEST_PATH_IMAGE051
(7)
Figure 913303DEST_PATH_IMAGE052
等于0,可以计算得到
Figure 832718DEST_PATH_IMAGE053
(8)
S6:依据公式(5)分别获得用户对兴趣点的真实排序概率和预测排序概率;
Figure 589321DEST_PATH_IMAGE054
(9)
其中
Figure 568779DEST_PATH_IMAGE055
表示用户的兴趣点推荐列表,
Figure 115560DEST_PATH_IMAGE056
为通常表示为指数函数
Figure 573086DEST_PATH_IMAGE057
S7:依据公式(10),通过最小二乘法最小化损失函数,获得最终的推荐列表;
Figure 246513DEST_PATH_IMAGE058
(10)
其中,
Figure 334555DEST_PATH_IMAGE059
为预测概率,
Figure 165370DEST_PATH_IMAGE060
为正则化项,为了防止过拟合。
针对兴趣点推荐模型中数据稀疏、冷启动以及隐性反馈等问题,本发明提出一种融合信任关系的排序学习POI推荐算法。算法首先通过分析多层社交网络中用户的结构特征与社会属性特征对信任值的影响,构建用户之间的综合信任值,然后将用户的综合信任值应用到矩阵分解中获得用户的初始推荐列表,最后利用排序学习获得每个用户的最终的推荐列表。本发明通过引入边信息(信任关系)与矩阵分解相结合获得初始推荐列表,在一定程度上缓解了POI推荐的数据稀疏性与冷启动带来的影响,同时利用排序学习的隐语义分析模型进一步弥补了隐性反馈不足的缺点。实验结果在真实数据集上表明,所提算法与同类型的算法相比提高了推荐的准确性。
附图说明
图1为本发明算法流程图;
图2为Yelp数据集上各个算法的MAE值;
图3为Yelp数据集上各个算法的RMSE值;
图4为Foursquare数据集上各个算法的MAE值;
图5为Foursquare数据集上各个算法的RMSE值。
具体实施方式
、信任关系计算
本节将详细描述多层社交网络中用户之间信任值的计算过程;由于节点的结构与社会属性是网络的两个基本特征,节点的结构与社会属性成为影响信任的主要因素。
定义1(多层社交网络)本文将多层社交网络形式化定义为带有属性信息的无向图
Figure DEST_PATH_IMAGE061
其中
Figure 488904DEST_PATH_IMAGE062
表示网络层数,对应于用户扮演的角色数量;
Figure DEST_PATH_IMAGE063
表示图中n个节点集合;
Figure 801459DEST_PATH_IMAGE064
表示图中的m个边集合,边为节点之间的社交关系,边上权值
Figure DEST_PATH_IMAGE065
为节点之间关系的强弱程度;
Figure 919457DEST_PATH_IMAGE066
是网络中节点的属性集合。
(1)结构特征对信任的影响
定义2(最短路径信任值,
Figure DEST_PATH_IMAGE067
)用户节点i、j之间的最短路径越长,
Figure 96622DEST_PATH_IMAGE068
越小。
在通信领域,信息传播的过程中所经过的路径越长,信息的准确性与完整性越弱。同理,在多层社交网络的其中一层,当两个用户节点之间需要建立交互关系,所包含的节点数越多时,它们之间的信任度越低。如用户A、B无直接交互关系,但都与用户C有直接联系,则用户A、B与C的信任度肯定比用户A和B之间的信任度强。
定义3(路径数量信任值,
Figure DEST_PATH_IMAGE069
)用户节点i、j之间的路径越多,
Figure 958268DEST_PATH_IMAGE069
越大。
现实生活中,共有朋友数量越多的用户之间交互性越强。如用户A、B是微信好友关系,并有很多的共同微信好友,说明他们之间具有很多共同的兴趣点,表现亲密。
定义4(结构信任值,
Figure 278391DEST_PATH_IMAGE070
)给定多层社交网络
Figure DEST_PATH_IMAGE071
,结合定义2与3,则节点之间的多层结构信任值可表示为:
Figure 599913DEST_PATH_IMAGE072
(1)
其中L表示网络层数,
Figure DEST_PATH_IMAGE073
为不同层的用户之间的交互权重,即当前层交互频数占总频数的比重,
Figure 700593DEST_PATH_IMAGE074
越大,用户之间的信任度越高。
(2)社会属性特征对信任的影响
结构特征在多层社交网络主要以边的形式存在,而社会属性特征依附于网络,为用户的固有特征。研究表明,社交网络中节点之间的社会属性相似程度越高,用户之间的同质性越强[25],而同质性又可描述为用户之间的信任程度。
定义5(社会属性信任值,
Figure DEST_PATH_IMAGE075
):给定多层社交网络
Figure 601815DEST_PATH_IMAGE076
,用户之间共有的社会属性越多,社会属性信任值越强。
Figure DEST_PATH_IMAGE077
(2)
式中,
Figure 42024DEST_PATH_IMAGE078
表示社会属性数量,
Figure DEST_PATH_IMAGE079
表示节点i、j针对属性p的信任关系,按属性的不同其取值可分为两种情况。当属性是离散属性时,如职业,文凭等,用户i、j有相同的属性值,
Figure 997429DEST_PATH_IMAGE080
的取值为1,否则为0。当属性p是本文属性时,如搜索记录、聊天记录等,受短文本挖掘的启发,本文以文本中关键字出现的频率来计算
Figure DEST_PATH_IMAGE081
的取值。假设
Figure 850985DEST_PATH_IMAGE082
是文本属性p的关键字,则
Figure DEST_PATH_IMAGE083
,式中
Figure 290319DEST_PATH_IMAGE084
为包含关键字k的节点数量,
Figure DEST_PATH_IMAGE085
为节点u的属性是否包含k,如果包含
Figure 444088DEST_PATH_IMAGE086
=1,否则
Figure DEST_PATH_IMAGE087
=0。
(3)综合信任值
由于个人的性格受环境背景、家庭教育以及外在因素等各个方面综合影响,用户之间信任关系往往并不是等价的。
定义6(综合信任值,
Figure 841834DEST_PATH_IMAGE088
)给定
Figure 526893DEST_PATH_IMAGE071
Figure DEST_PATH_IMAGE089
Figure 534032DEST_PATH_IMAGE090
,则用户i对j的综合信任值可表示为:
Figure DEST_PATH_IMAGE091
(3)
其中
Figure 247036DEST_PATH_IMAGE092
为用户i对j的单向信任值,当
Figure DEST_PATH_IMAGE093
越接近1时,用户i对j的信任关系越强。
Figure 110955DEST_PATH_IMAGE094
为用户i对其近邻用户的信任总和,
Figure DEST_PATH_IMAGE095
为指示函数,当
Figure 903550DEST_PATH_IMAGE096
小于等于0时,值为0;相反,值为
Figure 58588DEST_PATH_IMAGE096
。然而,在交互的过程中,用户之间信任关系的建立往往取决于信任值较低的一方,为此,本文选择
Figure DEST_PATH_IMAGE097
作为用户之间的最终信任度。
、获得初始推荐列表
由于喜好相似或信任程度较强的用户之间往往具有共同的兴趣点,同时矩阵分解是依据相似的近邻预测用户评分,本文将用户之间的信任关系与矩阵分解相结合以此来获得用户的初始签到列表。融合信任关系的矩阵分解表示为:
Figure 390212DEST_PATH_IMAGE098
(4)
其中,
Figure DEST_PATH_IMAGE099
为用户i对兴趣点h的签到记录,有签到记录
Figure 926498DEST_PATH_IMAGE100
=1,反之
Figure 914045DEST_PATH_IMAGE100
=0,
Figure DEST_PATH_IMAGE101
为签到矩阵。
Figure 997408DEST_PATH_IMAGE102
为用户i的近邻偏好向量。第二项通过限制偏好向量与近邻偏好向量近似相等,以此提高推荐效率,通常近似强度依赖于信任关系强度。
通过最小化
Figure DEST_PATH_IMAGE103
获得初始的用户签到矩阵
Figure 357107DEST_PATH_IMAGE104
、排序学习推荐模型
排序学习主要可分为三种类型,点级排序、对级排序以及列表级排序。由于点级排序和对级排序在分布均匀的数据集中才能表现出较好的效果,对于兴趣点签到这种分布不均匀的数据集并不适用。为此,本文采用列表级排序学习推荐模型。
列表级排序学习是一种监督学习,通过直接优化兴趣点的签到列表,为用户提供更加精准推荐服务。具体的,列表级排序推荐是以兴趣点的真实排序和预测排序之间的KL距离作为误差函数,通过最小二乘法或梯度下降法不断迭代使其误差达到最小,从而得到最优训练模型。本文通过top-1概率来描述KL距离,采用最小二乘法求解模型,以此获得每个用户的最佳推荐列表。
定义7(top-1概率)兴趣点h在用户推荐列表中排名第一的概率,定义为
Figure DEST_PATH_IMAGE105
(5)
其中
Figure 500513DEST_PATH_IMAGE106
表示用户的兴趣点推荐列表,
Figure 975356DEST_PATH_IMAGE056
为通常表示为指数函数
Figure 567137DEST_PATH_IMAGE057
定义8(KL距离)用于度量真实排序概率与预测排序概率之间的距离,表示为:
Figure 1
(6)
其中,
Figure 670091DEST_PATH_IMAGE108
为预测概率,
Figure DEST_PATH_IMAGE109
为正则化项,为了防止过拟合。
本发明所提的RLPOI算法主要分为三个步骤:(1)将多层网络中结构信任与社会属性信任相结合获得用户之间的综合信任值;(2)将信任值与矩阵分解模型相结合获得用户初始推荐矩阵
Figure 214424DEST_PATH_IMAGE110
;(3)将综合信任值引入排序学习中得到KL损失函数,经过ALS最小二乘法迭代求解之后获得每个用户的最佳兴趣点推荐列表。
算法具体实现步骤如下
本文以Yelp数据集为例,详细说明所提算法的计算流程;本文随机抽取4个用户对7个地点的签到数据;并且抽取到4个用户的社交数据集,分别为Twiitter层,Facebook层以及DBLP层,用户之间的结构关系采用邻接表表示;同时,我们将用户的社会属性特征采用向量
Figure DEST_PATH_IMAGE111
描述,1表示用户拥有该属性,0表示没有该属性。
Figure 910985DEST_PATH_IMAGE112
S1:算法输入用户对兴趣点的签到矩阵
Figure DEST_PATH_IMAGE113
和多层社交网络
Figure 336150DEST_PATH_IMAGE114
本文将多层社交网络形式化定义为带有属性信息的无向图
Figure 201600DEST_PATH_IMAGE114
其中
Figure DEST_PATH_IMAGE115
表示网络层数,对应于用户扮演的角色数量,如研究网络由三层组成,分别为Twiitter层,Facebook层以及DBLP层,用户在每个层中都扮演着一个角色身份;
Figure 686808DEST_PATH_IMAGE116
表示图中n个节点集合;
Figure DEST_PATH_IMAGE117
表示图中的m个边集合,边为节点之间的社交关系,边上权值0<q<1为节点之间关系的强弱程度;
Figure 496763DEST_PATH_IMAGE118
是网络中节点的属性集合;
签到矩阵
Figure DEST_PATH_IMAGE119
表示m个用户对n个签到点的评分;
S2:依据定义2的最短路径信任值
Figure 397723DEST_PATH_IMAGE120
和定义3的路径数量信任值
Figure DEST_PATH_IMAGE121
,通过(1)式来计算结构信任值
Figure 412952DEST_PATH_IMAGE122
Figure DEST_PATH_IMAGE123
(1)
其中L表示网络层数,
Figure 570526DEST_PATH_IMAGE124
为不同层的用户之间的交互权重,满足0<
Figure 241679DEST_PATH_IMAGE124
<1,即当前层的交互频数占总交互频数的比重;当
Figure 274226DEST_PATH_IMAGE124
越接近1,表明当前层交互频数越重要;
Figure DEST_PATH_IMAGE125
越大,用户之间的信任度越高;
用户之间的结构信任计算结果如下:
Figure 928584DEST_PATH_IMAGE126
S3:依据(2)式得到社会属性信任值
Figure DEST_PATH_IMAGE127
Figure 21174DEST_PATH_IMAGE128
(1)
式中,
Figure DEST_PATH_IMAGE129
表示社会属性数量,
Figure 477825DEST_PATH_IMAGE130
表示节点i,j针对属性p的信任关系,按属性的不同其取值可分为两种情况;当属性p是离散属性时,如职业,文凭,年龄等,用户i,j有相同的属性值,
Figure DEST_PATH_IMAGE131
的取值为1,否则为0;当属性p是短本文属性时,如搜索记录、聊天记录等,受短文本挖掘的启发,本文以文本中关键词出现的频率来计算
Figure 314063DEST_PATH_IMAGE132
的取值;关键词指短文本中出现频繁的词,能够用来表示短文的中心思想;假设
Figure DEST_PATH_IMAGE133
是文本属性p的关键字,则
Figure 805350DEST_PATH_IMAGE134
,式中
Figure DEST_PATH_IMAGE135
为包含关键字k的节点数量,
Figure 740945DEST_PATH_IMAGE136
为节点u的属性是否包含k,如果包含
Figure 121110DEST_PATH_IMAGE136
=1,否则
Figure 731346DEST_PATH_IMAGE136
=0;
用户之间的社会属性信任计算结果如下:
Figure DEST_PATH_IMAGE137
S4:依据公式(3)将结构信任值
Figure 44515DEST_PATH_IMAGE138
和社会属性信任值
Figure DEST_PATH_IMAGE139
相结合得到用户之间的综合信任值
Figure 505672DEST_PATH_IMAGE140
Figure DEST_PATH_IMAGE141
(3)
其中
Figure 107554DEST_PATH_IMAGE142
为用户i对j的单向信任值,当
Figure DEST_PATH_IMAGE143
越接近1时,用户i对j的信任关系越强;
Figure 82332DEST_PATH_IMAGE144
为用户对其近邻用户的信任总和,
Figure DEST_PATH_IMAGE145
为指示函数,当
Figure 282632DEST_PATH_IMAGE146
小于等于0时,值为0;相反,值为
Figure 497712DEST_PATH_IMAGE146
;然而,在交互的过程中,用户之间信任关系的建立往往取决于信任值较低的一方,为此,本文选择
Figure DEST_PATH_IMAGE147
作为用户之间的最终信任度;
用户之间的综合信任计算结果如下:
Figure 649208DEST_PATH_IMAGE148
S5:将S4步获得的综合信任值
Figure DEST_PATH_IMAGE149
代入公式(4)中,通过最小化
Figure 929142DEST_PATH_IMAGE150
获得初始的用户签到矩阵
Figure DEST_PATH_IMAGE151
Figure 748062DEST_PATH_IMAGE152
(4)
其中,
Figure DEST_PATH_IMAGE153
为用户i对兴趣点h的签到记录,有签到记录
Figure 760143DEST_PATH_IMAGE154
=1,反之
Figure 539880DEST_PATH_IMAGE154
=0,
Figure DEST_PATH_IMAGE155
为签到矩阵;
Figure 590882DEST_PATH_IMAGE156
为用户i的近邻偏好向量,即与用户i直接相连节点的偏好向量,偏好向量表示为用户的喜好特征,由用户签到矩阵分解得到;第二项将偏好向量与近邻偏好向量相减,以此间接修正用户偏好向量,提高推荐效率,通常近似强度依赖于信任关系强度;
通过最小化
Figure DEST_PATH_IMAGE157
获得初始的用户签到矩阵
Figure 494335DEST_PATH_IMAGE158
本文采用随机梯度下降法求解
Figure DEST_PATH_IMAGE159
Figure 707010DEST_PATH_IMAGE160
偏导数为:
Figure DEST_PATH_IMAGE161
(5)
Figure 6667DEST_PATH_IMAGE162
等于0,可以计算得到
Figure DEST_PATH_IMAGE163
(6)
Figure 126938DEST_PATH_IMAGE164
的偏导数为:
Figure DEST_PATH_IMAGE165
(7)
Figure 61396DEST_PATH_IMAGE166
等于0,可以计算得到
Figure DEST_PATH_IMAGE167
(8)
由此可获得初始
Figure 680859DEST_PATH_IMAGE168
为:
Figure DEST_PATH_IMAGE169
S6:依据公式(5)分别获得用户对兴趣点的真实排序概率和预测排序概率;
Figure 356560DEST_PATH_IMAGE170
(9)
其中
Figure DEST_PATH_IMAGE171
表示用户的兴趣点推荐列表,
Figure 126195DEST_PATH_IMAGE172
为通常表示为指数函数
Figure DEST_PATH_IMAGE173
S7:依据公式(10),通过最小二乘法最小化损失函数,获得最终的推荐列表;
Figure 508635DEST_PATH_IMAGE174
(10)
其中,
Figure DEST_PATH_IMAGE175
为预测概率,
Figure 355456DEST_PATH_IMAGE176
为正则化项,为了防止过拟合;
最终的推荐
Figure DEST_PATH_IMAGE177
为,我们选择评分最高的兴趣点推荐给用户:
Figure 190557DEST_PATH_IMAGE178
、实验
(1)数据集与评价指标
本文选择公开数据集Yelp和Foursquare以检测本文算法的准确性;Yelp数据集包含21718个用户对12920个兴趣点的617538个签到记录,同时也包含用户和项目的属性特征,如签到时间,兴趣点内容等。Foursquare数据集包含31540个用户对22412个兴趣点的273703个签到记录。
为评估本文算法的推荐性能,采用平均绝对误差(MAE)和均方根误差(RMSE)作为算法的评价指标。
MAE(mean alsolute error)表示预测值和真实值之间绝对误差的平均值,MAE 越小推荐精度越高;定义如下:
Figure DEST_PATH_IMAGE179
(11)
RMSE(Root Mean Square Error)表示预测值和真实值之间的偏差平方和与预测次数n比值的平方根;RMSE反应了样本的离散程度,RMSE越小推荐精度越高;定义如下:
Figure 527997DEST_PATH_IMAGE180
(12)
其中
Figure DEST_PATH_IMAGE181
为预测评分值,
Figure 125463DEST_PATH_IMAGE182
为真实值,n为预测评分个数;
(2)实验结果与分析
为验证本文算法的可行性,本文选择同类型4个对比算法,如下所示:
GeoFM算法:该算法将用户的签到评分记录作为用户的隐式反馈,建立增强兴趣点推荐模型,通过加权矩阵分解求解;。
RankGeoFM算法:该算法通过分析用户的签到频率构建用户的偏好模型,利用排序学习获得用户感兴趣的项目;
TGMF算法:该算法结合用户的信任与相似关系,建立用户偏好模型,利用矩阵分解改进用户偏序关系,获得用户推荐序列;TELSR算法;该算法结合信任关系一定程度上弥补了数据稀疏性的问题,通过列表级排序建立最优推荐模型,利用用户的可信邻居来推荐兴趣点;实验过程中,将两个数据集随机划分为不同比例的测试集与训练集,各自分别进行10次实验最后取平均值;
实验结果:从各个图中可看出,针对不同的数据集,本发明所提出的POI推荐算法模型,即RLPOI,在各个评价指标(MAE,RMSE)中明显优于其他算法;由于本发明通过引入边信息(信任关系)与矩阵分解相结合获得初始推荐列表,在一定程度上缓解了POI推荐的数据稀疏性与冷启动带来的影响,同时利用排序学习的隐语义分析模型进一步弥补了隐性反馈不足的缺点;因此表现较好的性能。
(3)总结
针对POI推荐目前存在的问题,本发明提出一种融合信任关系的排序学习POI推荐算法(RLPOI);算法通过分析社交关系来建立综合信任值,之后,与矩阵分解相结合获得每个用户的初始推荐列表;最后,通过排序学习得到最终的推荐列表;实验结果在真是数据集上表明,本发明所提算法与同类型推荐算法相比,取得较好的推荐效果。

Claims (1)

1.一种融合信任关系的排序学习POI推荐算法,其特征在于包括如下步骤:A将多层网络中结构信任与社会属性信任相结合获得用户之间的综合信任值;B将综合信任值与矩阵分解模型相结合获得用户初始推荐矩阵
Figure DEST_PATH_IMAGE001
;C将综合信任值引入排序学习中得到KL损失函数,经过ALS最小二乘法迭代求解之后获得每个用户的最佳兴趣点推荐列表;
以Yelp数据集为基础,随机抽取m个用户对n个地点的签到数据,并且抽取到m个用户的社交数据集,分别为Twiitter层,Facebook层以及DBLP层,将用户的社会属性特征采用矩阵
Figure 871563DEST_PATH_IMAGE002
描述,1表示用户拥有该属性,0表示没有该属性,用户社会属性特征包含人口统计特征,如性别,年龄,职业,学历,此外也包含用户的兴趣、爱好;
S1:算法输入用户对兴趣点的签到矩阵
Figure DEST_PATH_IMAGE003
和多层社交网络
Figure 241233DEST_PATH_IMAGE004
本文将多层社交网络形式化定义为带有属性信息的无向图
Figure 906789DEST_PATH_IMAGE004
其中
Figure DEST_PATH_IMAGE005
表示网络层数,对应于用户扮演的角色数量,网络由三层组成,分别为Twiitter层,Facebook层以及DBLP层,用户在每个层中都扮演着一个角色身份;
Figure 459255DEST_PATH_IMAGE006
表示n个节点集合;
Figure DEST_PATH_IMAGE007
表示m个边集合,边为节点之间的社交关系,边上权值0<
Figure 289939DEST_PATH_IMAGE008
<1为节点之间关系的强弱程度;
Figure DEST_PATH_IMAGE009
是网络中节点的属性集合;
签到矩阵
Figure 33773DEST_PATH_IMAGE003
表示m个用户对n个签到点的评分;
S2:依据最短路径信任值
Figure 723643DEST_PATH_IMAGE010
和路径数量信任值
Figure DEST_PATH_IMAGE011
,通过(1)式来计算结构信任值
Figure 628537DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
(1)
其中L表示网络层数,
Figure 422049DEST_PATH_IMAGE014
为不同层的用户之间的交互权重,满足0<
Figure 680992DEST_PATH_IMAGE014
<1,即当前层的交互频数占总交互频数的比重;当
Figure 326999DEST_PATH_IMAGE014
越接近1,表明当前层交互频数越重要;
Figure 719804DEST_PATH_IMAGE012
越大,用户之间的信任度越高;
S3:依据(2)式得到社会属性信任值
Figure DEST_PATH_IMAGE015
Figure 931604DEST_PATH_IMAGE016
(2)
式中,
Figure DEST_PATH_IMAGE017
表示社会属性数量,
Figure 518706DEST_PATH_IMAGE018
表示节点
Figure DEST_PATH_IMAGE019
针对属性
Figure 974046DEST_PATH_IMAGE020
的信任关系,按属性的不同其取值分为两种情况;当属性
Figure 452432DEST_PATH_IMAGE020
是离散属性时,如职业,文凭,年龄,用户有相同的属性值,
Figure DEST_PATH_IMAGE021
的取值为1,否则为0;当属性
Figure 486116DEST_PATH_IMAGE020
是短本文属性时,如搜索记录、聊天记录等,以文本中关键词出现的频率来计算
Figure 883599DEST_PATH_IMAGE021
的取值;假设
Figure 441881DEST_PATH_IMAGE022
是文本属性
Figure 583013DEST_PATH_IMAGE020
的关键字,则
Figure DEST_PATH_IMAGE023
,式中
Figure 471203DEST_PATH_IMAGE024
为包含关键字
Figure DEST_PATH_IMAGE025
的节点数量,
Figure 868949DEST_PATH_IMAGE026
为节点
Figure DEST_PATH_IMAGE027
的属性是否包含
Figure 85167DEST_PATH_IMAGE025
,如果包含
Figure 29989DEST_PATH_IMAGE028
=1,否则
Figure 211834DEST_PATH_IMAGE028
=0;
S4:依据公式(3)将结构信任值
Figure DEST_PATH_IMAGE029
和社会属性信任值
Figure 544595DEST_PATH_IMAGE030
相结合得到用户之间的综合信任值
Figure DEST_PATH_IMAGE031
Figure 868348DEST_PATH_IMAGE032
(3)
其中
Figure 492227DEST_PATH_IMAGE031
为用户i对j的单向信任值,当
Figure 27114DEST_PATH_IMAGE031
越接近1时,用户i对j的信任关系越强;
Figure 468459DEST_PATH_IMAGE029
为用户i对其近邻用户的信任总和,
Figure DEST_PATH_IMAGE033
为指示函数,当
Figure 285368DEST_PATH_IMAGE030
小于等于0时,值为0;相反,值为
Figure 837572DEST_PATH_IMAGE030
;然而,在交互的过程中,用户之间信任关系的建立往往取决于信任值较低的一方,为此,本文选择
Figure 961386DEST_PATH_IMAGE034
作为用户之间的最终信任度;
S5:将S4步获得的综合信任值
Figure DEST_PATH_IMAGE035
代入公式(4)中,通过最小化
Figure 511316DEST_PATH_IMAGE036
获得初始的用户签到矩阵
Figure DEST_PATH_IMAGE037
Figure 815521DEST_PATH_IMAGE038
(4)
其中,
Figure DEST_PATH_IMAGE039
为用户i对兴趣点h的签到记录,有签到记录
Figure 233732DEST_PATH_IMAGE040
=1,反之
Figure DEST_PATH_IMAGE041
=0,
Figure 306993DEST_PATH_IMAGE042
为签到矩阵;
Figure DEST_PATH_IMAGE043
为用户i的近邻偏好向量,即与用户i直接相连节点的偏好向量,偏好向量表示为用户的喜好特征,由用户签到矩阵分解得到;第二项将偏好向量与近邻偏好向量相减,以此间接修正用户偏好向量;
通过最小化
Figure 762245DEST_PATH_IMAGE044
获得初始的用户签到矩阵
Figure DEST_PATH_IMAGE045
本文采用随机梯度下降法求解
Figure 282307DEST_PATH_IMAGE044
Figure 910735DEST_PATH_IMAGE046
偏导数为:
Figure DEST_PATH_IMAGE047
(5)
Figure 602616DEST_PATH_IMAGE048
等于0,可以计算得到
Figure DEST_PATH_IMAGE049
(6)
Figure 589289DEST_PATH_IMAGE050
的偏导数为:
Figure DEST_PATH_IMAGE051
(7)
Figure 366621DEST_PATH_IMAGE052
等于0,可以计算得到
Figure DEST_PATH_IMAGE053
(8)
S6:依据公式(5)分别获得用户对兴趣点的真实排序概率和预测排序概率;
Figure 362521DEST_PATH_IMAGE054
(9)
其中
Figure DEST_PATH_IMAGE055
表示用户的兴趣点推荐列表,
Figure 643330DEST_PATH_IMAGE056
为通常表示为指数函数
Figure DEST_PATH_IMAGE057
S7:依据公式(10),通过最小二乘法最小化损失函数,获得最终的推荐列表;
Figure 66483DEST_PATH_IMAGE058
(10)
其中,
Figure DEST_PATH_IMAGE059
为预测概率,
Figure 799953DEST_PATH_IMAGE060
为正则化项,为了防止过拟合。
CN202111286263.XA 2021-11-02 2021-11-02 一种融合信任关系的排序学习poi推荐算法 Pending CN113918823A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111286263.XA CN113918823A (zh) 2021-11-02 2021-11-02 一种融合信任关系的排序学习poi推荐算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111286263.XA CN113918823A (zh) 2021-11-02 2021-11-02 一种融合信任关系的排序学习poi推荐算法

Publications (1)

Publication Number Publication Date
CN113918823A true CN113918823A (zh) 2022-01-11

Family

ID=79245019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111286263.XA Pending CN113918823A (zh) 2021-11-02 2021-11-02 一种融合信任关系的排序学习poi推荐算法

Country Status (1)

Country Link
CN (1) CN113918823A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120290652A1 (en) * 2011-05-13 2012-11-15 Zeljko BOSKOVIC Arrangement and method for transport sharing
KR20140087065A (ko) * 2012-12-21 2014-07-09 서울대학교산학협력단 링크 예측을 이용한 소셜 추천 방법
CN107507073A (zh) * 2017-09-14 2017-12-22 中国人民解放军信息工程大学 基于信任扩展和列表级排序学习的服务推荐方法
CN107609002A (zh) * 2017-07-11 2018-01-19 河南科技大学 一种社交网络用户信任的计算方法和计算系统
CN108460101A (zh) * 2018-02-05 2018-08-28 山东师范大学 面向位置社交网络基于地理位置正则化的兴趣点推荐方法
CN108470075A (zh) * 2018-04-12 2018-08-31 重庆邮电大学 一种面向排序预测的社会化推荐方法
CN109241454A (zh) * 2018-07-18 2019-01-18 广东工业大学 一种将社交网络和图像内容融合的兴趣点推荐方法
CN110955829A (zh) * 2019-11-19 2020-04-03 江西财经大学 融合信任度和度量因子矩阵分解的兴趣点推荐方法及系统
CN111061961A (zh) * 2019-11-19 2020-04-24 江西财经大学 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统
CN111209475A (zh) * 2019-12-27 2020-05-29 武汉大学 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120290652A1 (en) * 2011-05-13 2012-11-15 Zeljko BOSKOVIC Arrangement and method for transport sharing
KR20140087065A (ko) * 2012-12-21 2014-07-09 서울대학교산학협력단 링크 예측을 이용한 소셜 추천 방법
CN107609002A (zh) * 2017-07-11 2018-01-19 河南科技大学 一种社交网络用户信任的计算方法和计算系统
CN107507073A (zh) * 2017-09-14 2017-12-22 中国人民解放军信息工程大学 基于信任扩展和列表级排序学习的服务推荐方法
CN108460101A (zh) * 2018-02-05 2018-08-28 山东师范大学 面向位置社交网络基于地理位置正则化的兴趣点推荐方法
CN108470075A (zh) * 2018-04-12 2018-08-31 重庆邮电大学 一种面向排序预测的社会化推荐方法
CN109241454A (zh) * 2018-07-18 2019-01-18 广东工业大学 一种将社交网络和图像内容融合的兴趣点推荐方法
CN110955829A (zh) * 2019-11-19 2020-04-03 江西财经大学 融合信任度和度量因子矩阵分解的兴趣点推荐方法及系统
CN111061961A (zh) * 2019-11-19 2020-04-24 江西财经大学 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统
CN111209475A (zh) * 2019-12-27 2020-05-29 武汉大学 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JUNJIE JIA, ET AL.: "Local optimization overlapping community discovery algorithm combining attribute features", IEEE, 11 April 2021 (2021-04-11), pages 350 - 355, XP033907207, DOI: 10.1109/ICSP51882.2021.9409003 *
贾俊杰等: "融合社交信息的矩阵分解改进推荐算法", 计算机工程, vol. 47, no. 9, 30 September 2021 (2021-09-30), pages 97 - 105 *
邵长城;陈平华;: "融合社交网络和图像内容的兴趣点推荐", 计算机应用, no. 05, 21 January 2019 (2019-01-21) *

Similar Documents

Publication Publication Date Title
Christensen et al. Social group recommendation in the tourism domain
Yu et al. A multi-criteria decision-making model for hotel selection with linguistic distribution assessments
Yusefi Hafshejani et al. Improving sparsity and new user problems in collaborative filtering by clustering the personality factors
US20150187024A1 (en) System and Method for Socially Aware Recommendations Based on Implicit User Feedback
Xu et al. Integrated collaborative filtering recommendation in social cyber-physical systems
Zhao et al. Service rating prediction by exploring social mobile users’ geographical locations
Lesani et al. Fuzzy trust aggregation and personalized trust inference in virtual social networks
CN109635206B (zh) 融合隐式反馈和用户社会地位的个性化推荐方法及系统
US20140188994A1 (en) Social Neighborhood Determination
Margaris et al. Knowledge-based leisure time recommendations in social networks
Zhang et al. Multi-criteria recommender system based on social relationships and criteria preferences
CN106384259A (zh) 一种融合社交信息的推荐系统解决方法
Pramanik et al. Deep learning driven venue recommender for event-based social networks
KR101459537B1 (ko) 링크 예측을 이용한 소셜 추천 방법
Tu et al. Activity recommendation with partners
CN109857928A (zh) 基于多元信用评估的用户偏好预测方法
Chen Ubiquitous hotel recommendation using a fuzzy‐weighted‐average and backpropagation‐network approach
Yang et al. Personalized recommendation based on collaborative filtering in social network
Liu Trust management in online social networks
CN113918823A (zh) 一种融合信任关系的排序学习poi推荐算法
Zhang Research on collaborative filtering recommendation algorithm based on social network
Huang et al. A comprehensive mechanism for hotel recommendation to achieve personalized search engine
Chen Hesitant fuzzy multi-attribute group decision making method based on weighted power operators in social network and their application
CN114417166A (zh) 基于行为序列和动态社交影响的连续兴趣点推荐方法
Liu et al. Effective similarity measures of collaborative filtering recommendations based on user ratings habits

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination