CN109710835B - 一种带有时间权重的异构信息网络推荐方法 - Google Patents

一种带有时间权重的异构信息网络推荐方法 Download PDF

Info

Publication number
CN109710835B
CN109710835B CN201811360273.1A CN201811360273A CN109710835B CN 109710835 B CN109710835 B CN 109710835B CN 201811360273 A CN201811360273 A CN 201811360273A CN 109710835 B CN109710835 B CN 109710835B
Authority
CN
China
Prior art keywords
matrix
time
user
information network
meta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811360273.1A
Other languages
English (en)
Other versions
CN109710835A (zh
Inventor
凌艳香
赵卫伟
宋晓峰
曹巍
董绍进
吴文华
刘喆
王志国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201811360273.1A priority Critical patent/CN109710835B/zh
Publication of CN109710835A publication Critical patent/CN109710835A/zh
Application granted granted Critical
Publication of CN109710835B publication Critical patent/CN109710835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种带有时间权重的异构信息网络推荐方法,属于通信技术领域,其特征在于:将元路径上带有时间权重的关系对应的邻接矩阵与对应的时间偏差矩阵做哈德曼积,得到带有时间权重的邻接矩阵;将元路径上各相邻接矩阵依次相乘,得到带有时间权重的交换矩阵;将带有时间权重的交换矩阵分解为用户因子矩阵和商品因子矩阵两个矩阵;对任一元路径通过对用户因子矩阵和商品因子矩阵的优化构建预测矩阵得到结果;采用线性组合的方式将多条元路径的预测结果进行融合,获得用户商品评分;依据评分进行推荐。通过时间偏差矩阵,将时间因素对用户偏好的影响量化。通过用户偏差项和商品偏差项,考虑需求稳定的特殊用户以及优质商品,在原有基础上对算法进行优化。

Description

一种带有时间权重的异构信息网络推荐方法
技术领域
本发明属于通信技术领域,尤其涉及一种带有时间权重的异构信息网络推荐方法。
背景技术
异构信息网络(Heterogeneous Information Network,HIN)中节点和边的类型有多种,这使其能比通常的同构网络更好的表达各类复杂真实的数据,如著作网络数据、社会网络数据、知识图谱等。HIN率先被用于解决信息检索中相似对象搜索问题,近年来也被用于链路预测、聚类、分类以及推荐等领域。
数据的稀疏性,一直是推荐系统领域面临的严峻问题之一。由于用户和商品数量庞大,因此用户和商品之间的交互记录将会非常稀疏,这就使得推荐算法的依据不够充足。为了缓解数据稀疏性,很多学者提出要将边信息(side information)融入推荐算法,如用户的社交网络信息、用户和商品的特征信息、用户交互过程中产生的文本图片等信息。
基于异构信息网络挖掘的推荐方法虽然取得了良好的推荐效果,但仍然存在诸多挑战。比如,当前的异构信息网络并未考虑时间因素对边信息的影响。在真实的推荐系统中,用户的偏好和需求会随着时间发生变化,不同时期可能喜欢不一样的商品,这也说明用户的远期行为和近期行为对其当前需求的影响程度是不同的。一般来说,用户近期的行为更能反映出当前的需求和偏好。如果忽视边信息中的时间因素,推荐算法将难以及时发现用户最新的需求,生成的推荐结果也将很难被采纳,用户的使用体验也会随之下降。
发明内容
本发明旨在解决上述问题,提供一种带有时间权重的异构信息网络推荐方法。
本发明所述带有时间权重的异构信息网络推荐方法,包括
通过增加时间属性构建带有时间权重的异构信息网络;所述异构信息网络包括若干元路径;任一所述元路径上任意两相邻实体间的关系带有时间属性,即为带有时间权重的元路径;及时间偏差矩阵,用于记录时间因素对两相邻实体之间关系的影响程度;及
邻接矩阵,用于表示元路径上相邻实体之间的关系。如用户和商品之间的邻接矩阵表示用户和商品之间的评分关系,矩阵中的元素代表相应用户对相应商品的评分;及
带有时间权重的交换矩阵,通过时间偏差矩阵和邻接矩阵构建带有时间权重的交换矩阵,用于表示用户与商品在元路径上的相关性;及
预测矩阵,用于预测用户对商品的评分;
建立推荐模型:
将元路径上带有时间权重的关系对应的邻接矩阵与对应的时间偏差矩阵做Hadamard(哈德曼)积,得到新的带有时间权重的邻接矩阵;将元路径上各相邻实体的邻接矩阵依次相乘,得到带有时间权重的交换矩阵。将带有时间权重的交换矩阵分解为用户因子矩阵和商品因子矩阵两个矩阵;对于任一元路径,通过对用户因子矩阵和商品因子矩阵的优化,构建预测矩阵,获得预测结果;
采用线性组合的方式将多条元路径的预测结果进行融合,获得最终用户商品评分;
依据最终用户商品评分进行推荐。
本发明所述带有时间权重的异构信息网络推荐方法,所述带有时间权重的异构信息网络设定模式为
Figure GDA0002720429280000021
带有时间权重的信息网络设定为G=(V,E,T);且满足映射关系
Figure GDA0002720429280000022
Figure GDA0002720429280000023
即实体类型不只一种,或者
Figure GDA0002720429280000024
关系类型不只一种,G为异构信息网络;反之,G为同构信息网络;当
Figure GDA0002720429280000025
Figure GDA0002720429280000026
时,G为带有时间权重的异构信息网络;反之,G为普通异构信息网络;
其中,
Figure GDA0002720429280000027
为实体类型集合,
Figure GDA0002720429280000028
为关系类型集合,
Figure GDA0002720429280000029
为关系对应的时间属性集合;V为节点集,E为边集,T为时间属性集。
本发明所述带有时间权重的异构信息网络推荐方法,所述元路径设定为P,表达式为
Figure GDA00027204292800000210
l为元路径P涉及的关系总数,(l+1)为元路径P涉及的对象类型总数;当元路径P上任一关系Rn(n∈[1,l],n为正整数)带有时间属性时,则P 为带有时间权重的元路径,δn(Rn)为关系Rn的时间属性函数。
本发明所述带有时间权重的异构信息网络推荐方法,所述时间偏差矩阵定义为
Figure GDA00027204292800000211
其计算公式如下:
Figure GDA00027204292800000212
其中,
Figure GDA00027204292800000213
为时间偏差矩阵
Figure GDA00027204292800000214
在第p行第q列的元素值,表示对象
Figure GDA00027204292800000215
和对象
Figure GDA00027204292800000216
之间的时间影响指数,Ai和Aj分别表示元路径上第i种和第j种对象类型,每个对象类型则包含了一系列属于该类型的对象,i,j∈[1,l+1],(l+1)表示元路径P涉及的对象类型总数;
Figure GDA00027204292800000217
表示对象
Figure GDA00027204292800000218
和对象
Figure GDA00027204292800000219
之间关系发生的具体时间,单位为“天”;current为超参数,表示当前时间;β为超参数,表示时间对用户偏好的影响程度。
本发明所述带有时间权重的异构信息网络推荐方法,所述交换矩阵设定为
Figure GDA0002720429280000031
其中,
Figure GDA0002720429280000032
是对象类型Ai和对象类型Aj之间的邻接矩阵;
Figure GDA0002720429280000033
是对象类型Ai和对象类型Aj之间关系的时间偏差矩阵,能够反映时间因素对于关系的影响程度;⊙为哈德曼(Hadamard) 积运算;i,j∈[1,l+1],(l+1)表示元路径P涉及的对象类型总数。
本发明所述带有时间权重的异构信息网络推荐方法,所述交换矩阵CP分解为用户因子矩阵Up和商品因子矩阵Mp,其中用户因子矩阵Up包含用户偏好的隐性特征,商品因子矩阵Mp包含商品属性的隐性特征;分解过程通过优化以下函数进行:
Figure GDA0002720429280000034
其中λU和λM为超参数,用以防止过拟合现象;设异构信息网络共有S条元路径,通过以上分解过程后,可得到S组用户因子矩阵和商品因子矩阵,分别记作[U(1),...,U(S)]和 [M(1),...,M(S)];优化过程中,Up∈[U(1),...,U(S)],Mp∈[M(1),...,M(S)]。
本发明所述带有时间权重的异构信息网络推荐方法,所述任意一条元路径Ps (s∈[1,S]),其对应用户商品评分预测矩阵
Figure GDA0002720429280000035
可表示为:
Figure GDA0002720429280000036
其中U(s)和M(s)分别为元路径Ps对应的用户因子矩阵和商品因子矩阵。
本发明所述带有时间权重的异构信息网络推荐方法,所述的最终用户商品评分预测结果
Figure GDA0002720429280000037
由S条元路径对应的用户商品评分矩阵
Figure GDA0002720429280000038
加权获得,计算过程如下:
Figure GDA0002720429280000039
其中ω(s)表示第s条(s∈[1,S])元路径的权重。
本发明所述带有时间权重的异构信息网络推荐方法,所述元路径的权重向量ω=(ω(1),...,ω(S))的优化函数为:
Figure GDA00027204292800000310
其中
Figure GDA00027204292800000311
为方法预测的用户评分矩阵,Y为真实的用户评分矩阵,λω为超参数,用于防止过拟合现象。
本发明所述带有时间权重的异构信息网络推荐方法,所述用户商品评分的预测矩阵
Figure GDA00027204292800000312
还包括用户偏差矩阵BU和商品偏差矩阵BM,即:
Figure GDA00027204292800000313
其中BU反应用户偏好的时间敏感度;在矩阵BU中每个用户的偏好时间敏感度为常量,假设异构信息网络共有|U|个用户,对于任一用户u(u∈[1,|U|]),其偏好的时间敏感度计算为:
Figure GDA0002720429280000041
其中
Figure GDA0002720429280000042
Figure GDA0002720429280000043
分别表示用户u在异构信息网络中第一次和最后一次进行评分行为的时间; |Category(Yu|)表示用户u在异构信息网络中评分的商品的类型总数;
BM反应商品热度;在矩阵BM中每个商品的热度为常量,假设异构信息网络共有|M|个商品,对于任一商品m(m∈[1,|M|]),其热度计算为:
Figure GDA0002720429280000044
其中
Figure GDA0002720429280000045
Figure GDA0002720429280000046
分别表示商品m在异构信息网络中第一次和最后一次被评分的时间。|Ym|表示商品m被评分的总次数。
本发明所述带有时间权重的异构信息网络推荐方法,通过设置带有时间权重的异构信息网络、元路径以及交换矩阵,使传统异构信息网络不仅能够容纳大量语义信息,还能考虑这些信息随时间的变化情况。通过时间偏差矩阵,将时间因素对用户偏好的影响量化。通过用户偏差项和商品偏差项,考虑需求稳定的特殊用户以及优质商品,在原有基础上对算法进行了优化。
附图说明
图1为本发明所述带有时间权重的异构信息网络推荐方法流程示意图;
图2为本发明实施例二元路径结构示意图。
具体实施方式
下面结合附图及实施例对本发明所述带有时间权重的异构信息网络推荐方法进行详细说明。
实施例一
本发明所述带有时间权重的异构信息网络推荐方法,包括
通过增加时间属性构建带有时间权重的异构信息网络;所述异构信息网络包括若干元路径;任一所述元路径上任意两相邻实体间的关系带有时间属性,即为带有时间权重的元路径;及时间偏差矩阵,用于记录时间因素对两相邻实体之间关系的影响程度;及
邻接矩阵,用于表示元路径上相邻实体之间的关系。如用户和商品之间的邻接矩阵表示用户和商品之间的评分关系,矩阵中的元素代表相应用户对相应商品的评分;及
带有时间权重的交换矩阵,通过时间偏差矩阵和邻接矩阵构建带有时间权重的交换矩阵,用于表示用户与商品在元路径上的相关性;及
预测矩阵,用于预测用户对商品的评分;
建立推荐模型:
如图1所示,将带有时间权重的交换矩阵分解为用户因子矩阵和商品因子矩阵两个矩阵;对于任一元路径(不特指带有时间权重的元路径),通过对用户因子矩阵和商品因子矩阵的优化,及时间偏差矩阵构建预测矩阵,获得预测结果;
采用线性组合的方式将多条元路径的预测结果进行融合,获得最终用户商品评分;
依据最终用户商品评分进行推荐。
本发明所述带有时间权重的异构信息网络推荐方法,所述带有时间权重的异构信息网络设定模式为
Figure GDA0002720429280000051
带有时间权重的信息网络设定为G=(V,E,T);且满足映射关系
Figure GDA0002720429280000052
Figure GDA0002720429280000053
即实体类型不只一种,或者
Figure GDA0002720429280000054
关系类型不只一种,G为异构信息网络;反之,G为同构信息网络;当
Figure GDA0002720429280000055
Figure GDA0002720429280000056
时,G为带有时间权重的异构信息网络;反之,G为普通异构信息网络;
其中,
Figure GDA0002720429280000057
为实体类型集合,
Figure GDA0002720429280000058
为关系类型集合,
Figure GDA0002720429280000059
为关系对应的时间属性集合;V为节点集,E为边集,T为时间属性集。
本发明所述带有时间权重的异构信息网络推荐方法,所述元路径设定为P,表达式为
Figure GDA00027204292800000510
当元路径P上任意一个关系Rn(n∈[1,l],n为正整数)带有时间属性,则P为带有时间权重的元路径;δn(Rn)为关系Rn的时间属性函数。考虑关系Ri的时间属性对元路径的影响,对Ri对应的邻接矩阵进行变换,假设Ri对应的邻接矩阵为Wi,Ri对应的时间偏差矩阵为Ti,则δi(Ri)=Wi⊙Ti
本发明所述带有时间权重的异构信息网络推荐方法,所述时间偏差矩阵定义为
Figure GDA00027204292800000511
其计算公式如下:
Figure GDA00027204292800000512
其中,
Figure GDA00027204292800000513
为时间偏差矩阵
Figure GDA00027204292800000514
在第p行第q列的元素值,表示对象
Figure GDA00027204292800000515
和对象
Figure GDA00027204292800000516
之间的时间影响指数,Ai和Aj分别表示元路径上第i种和第j种对象类型,每个对象类型则包含了一系列属于该类型的对象,i,j∈[1,l+1],(l+1)表示元路径P涉及的对象类型总数;
Figure GDA0002720429280000061
表示对象
Figure GDA0002720429280000062
和对象
Figure GDA0002720429280000063
之间关系发生的具体时间,单位为“天”;current为超参数,表示当前时间;β为超参数,表示时间对用户偏好的影响程度。
本发明所述带有时间权重的异构信息网络推荐方法,所述交换矩阵设定为
Figure GDA0002720429280000064
其中,
Figure GDA0002720429280000065
是对象类型Ai和对象类型Aj之间的邻接矩阵;
Figure GDA0002720429280000066
是对象类型Ai和对象类型Aj之间关系的时间偏差矩阵,能够反映时间因素对于关系的影响程度;⊙为哈德曼(Hadamard) 积运算;i,j∈[1,l+1],(l+1)表示元路径P涉及的对象类型总数。
本发明所述带有时间权重的异构信息网络推荐方法,所述交换矩阵CP分解为用户因子矩阵UP和商品因子矩阵MP,所述用户因子矩阵包括用户的隐性特性;所述商品因子矩阵包括商品的隐性特性;分解过程通过优化以下函数进行:
Figure GDA0002720429280000067
其中λU和λM为超参数,用以防止过拟合现象;设异构信息网络共有S条元路径,通过以上分解过程后,可得到S组用户因子矩阵和商品因子矩阵,分别记作[U(1),...,U(S)]和 [M(1),...,M(S)];优化过程中,Up∈[U(1),...,U(S)],Mp∈[M(1),...,M(S)]。
本发明所述带有时间权重的异构信息网络推荐方法,所述任意一条元路径Ps (s∈[1,S]),其对应用户商品评分预测矩阵
Figure GDA0002720429280000068
可表示为:
Figure GDA0002720429280000069
其中U(s)和M(s)分别为元路径Ps对应的用户因子矩阵和商品因子矩阵。
本发明所述带有时间权重的异构信息网络推荐方法,所述的最终用户商品评分预测结果
Figure GDA00027204292800000610
由S条元路径对应的用户商品评分矩阵
Figure GDA00027204292800000611
加权获得,计算过程如下:
Figure GDA00027204292800000612
其中ω(s)表示第s条(s∈[1,S])元路径的权重。
本发明所述带有时间权重的异构信息网络推荐方法,所述元路径的权重向量ω=(ω(1),...,ω(S))的优化函数为:
Figure GDA00027204292800000613
其中
Figure GDA00027204292800000614
为方法预测的用户评分矩阵,Y为真实的用户评分矩阵,λω为超参数,用于防止过拟合现象。
本发明所述带有时间权重的异构信息网络推荐方法,所述用户商品评分的预测矩阵
Figure GDA0002720429280000071
还包括用户偏差矩阵BU和商品偏差矩阵BM,即:
Figure GDA0002720429280000072
其中BU反应用户偏好的时间敏感度;在矩阵BU中每个用户的偏好时间敏感度为常量,假设异构信息网络共有|U|个用户,对于任一用户u(u∈[1,|U|]),其偏好的时间敏感度计算为:
Figure GDA0002720429280000073
其中
Figure GDA0002720429280000074
Figure GDA0002720429280000075
分别表示用户u在异构信息网络中第一次和最后一次进行评分行为的时间; |Category(Yu|)表示用户u在异构信息网络中评分的商品的类型总数;
BM反应商品热度;在矩阵BM中每个商品的热度为常量,假设异构信息网络共有|M|个商品,对于任一商品m(m∈[1,|M|]),其热度计算为:
Figure GDA0002720429280000076
其中
Figure GDA0002720429280000077
Figure GDA0002720429280000078
分别表示商品m在异构信息网络中第一次和最后一次被评分的时间。|Ym|表示商品m被评分的总次数
实施例二
首先,提出带有时间权重的异构信息网络概念;其次,在挖掘异构信息网络时采用了经典的元路径法,并依据元路径上的时间信息构造了一个时间偏差矩阵T,以此区分用户远期行为和近期行为对当前需求的影响程度;再得到每条元路径对应的推荐结果,最终的推荐结果由各条元路径对应推荐结果线性融合得到;最后,考虑到某些用户可能具有稳定的需求和偏好,某些优质商品可能具有持久的关注度,因此在最终的推荐结果中加入了用户偏差项和商品偏差项进行优化。
带有时间权重的异构信息网络(Time-weighted Heterogeneous InformationNetwork, THIN):给定基本模式
Figure GDA0002720429280000079
Figure GDA00027204292800000710
为实体类型集合,
Figure GDA00027204292800000711
为关系类型集合,
Figure GDA00027204292800000712
为关系对应的时间属性集合。G=(V,E,T)为带有时间权重的信息网络,V为节点集, E为边集,T为时间属性集,且满足映射关系
Figure GDA00027204292800000713
某个节点 v∈V属于某一种实体类型
Figure GDA00027204292800000714
同理某个边e∈E属于某一种关系类型
Figure GDA00027204292800000715
某个时间属性t∈T属于某一种关系对应的时间属性
Figure GDA00027204292800000716
Figure GDA00027204292800000717
即实体类型不只一种,或者
Figure GDA0002720429280000081
关系类型不只一种,G为异构信息网络;反之,G为同构信息网络。当
Figure GDA0002720429280000082
Figure GDA0002720429280000083
Figure GDA0002720429280000084
时,G为带有时间权重的异构信息网络;反之,G为普通异构信息网络。
对于复杂的异构信息网络,可将其分解为若干个元路径进行分析。元路径,是异构信息网络的一种基本网络结构,它是一条有向的路径,由若干实体和关系连接组成。以下给出了带有时间权重的元路径定义。
带有时间权重的元路径(Time-weighted Meta Path):给定元路径P,表达为
Figure GDA0002720429280000085
当路径P上任意一个关系Ri带有时间属性,则P为带有时间权重的元路径,其中δi(Ri)为一个时间属性函数,用以衡量时间对于关系Ri的影响。
对于一个带有时间权重的异构信息网络,它的元路径既可以有时间属性,也可以没有时间属性。如图2所示给出了从CiaoDVD数据集中抽取出的4条元路径,由于原数据集中包含用户打分的具体时间,因此P1、P2和P4为带有时间权重的元路径,P3为普通元路径。对于得到的元路径,利用交换矩阵来衡量元路径源节点(用户)和目标节点(商品)之间的相关性。
带有时间权重的交换矩阵(Time-weighted Commuting matrix):对于带有时间权重的元路径P=(A1→A2→...→Al),它的交换矩阵为
Figure GDA0002720429280000086
其中
Figure GDA0002720429280000087
是Ai类型实体和Aj类型实体之间的邻接矩阵,
Figure GDA0002720429280000088
是Ai和Aj之间关系的时间偏差矩阵,可以反映时间因素对关系的影响程度。⊙为哈达玛积运算。矩阵CP的元素CP(m,n)表示,实体A1 m∈A1和实体Al n∈Al在元路径P上的相关性。如果Ai和Aj之间的关系没有时间属性,那么
Figure GDA0002720429280000089
的所有元素均为1。
如图2所示的元路径P2,它的交换矩阵
Figure GDA00027204292800000810
其中WUM为用户实体和商品实体之间的邻接矩阵,实际上就是用户评分矩阵;WMM为商品实体之间的邻接矩阵,当矩阵元素为1时,表示对应商品属于同一类型;TUM表示用户给商品评分的时间。
时间偏差矩阵;时间偏差矩阵
Figure GDA00027204292800000811
用于记录时间因素对Ai和Aj之间关系的影响程度,其计算公式如下:
Figure GDA00027204292800000812
其中tlk指Ai和Aj之间关系发生的时间,如2017-12-12;current为超参数,指当前时间;β也是一个超参数,通常可以通过交叉验证获得最佳取值,本实施例中β=0.5。在
Figure GDA0002720429280000091
中,关系发生时间距离当前时间越接近,其影响力越大,对应
Figure GDA00027204292800000915
越大,这与现实场景相符。
推荐模型;使用隐向量模型的思想,将交换矩阵CP分解为两个低维矩阵UP和MP,分别代表用户的隐性特征和商品的隐性特征。为了提高矩阵分解的效率,采用FunkSVD算法替代传统的SVD(奇异值分解)。通过以下优化函数,得到CP≈UPMP
Figure GDA0002720429280000092
其中λU和λM为超参数,用以防止过拟合现象;设异构信息网络共有S条元路径,通过以上分解过程后,可得到S组用户因子矩阵和商品因子矩阵,分别记作[U(1),...,U(S)]和 [M(1),...,M(S)];优化过程中,Up∈[U(1),...,U(S)],Mp∈[M(1),...,M(S)]。
对于某一条元路径Ps(s∈[1,S]),它的用户商品评分预测矩阵
Figure GDA0002720429280000093
不同的元路径,得到的预测结果不同,采用线性组合的方式将多条元路径的预测结果进行融合。最终的预测矩阵
Figure GDA0002720429280000094
其中元路径的权重向量ω=(ω(1),...,ω(S))通过以下优化函数获得:
Figure GDA0002720429280000095
用户偏差项和商品偏差项;推荐结果
Figure GDA00027204292800000916
的获得,考虑了时间因素对于用户需求的影响,认为用户的近期行为比远期行为具有更大的影响力。但值得考虑的是:有些用户的需求和偏好是相对稳定的,随时间变化较小;而有些优质商品的受关注度也是持久的。这说明当前的
Figure GDA00027204292800000917
很可能忽略了用户的一些稳定需求以及一些优质的商品。
为了解决该问题,在每对“用户-商品”的预测评分
Figure GDA0002720429280000096
的计算公式中设置用户偏差项和商品偏差项,新的
Figure GDA0002720429280000097
计算如下:
Figure GDA0002720429280000098
Figure GDA0002720429280000099
是预测的用户ui对商品mj的评分;
Figure GDA00027204292800000910
是用户ui的隐特征向量;
Figure GDA00027204292800000911
是商品mj的隐特征向量;BU和BM分别为用户偏差矩阵和商品偏差矩阵,BU反应用户偏好的时间敏感度;在矩阵BU中每个用户的偏好时间敏感度为常量,假设异构信息网络共有|U|个用户,对于任一用户u(u∈[1,|U|]),其偏好的时间敏感度计算为:
Figure GDA00027204292800000912
Figure GDA00027204292800000913
Figure GDA00027204292800000914
分别表示用户u在异构信息网络中第一次和最后一次进行评分行为的时间;|Category(Yu)|表示用户u在异构信息网络中评分的商品的类型总数;bu越大,表示用户偏好和需求的稳定性越强。
BM反应商品热度;在矩阵BM中每个商品的热度为常量,假设异构信息网络共有|M|个商品,对于任一商品m(m∈[1,|M|]),其热度计算为:
Figure GDA0002720429280000101
Figure GDA0002720429280000102
Figure GDA0002720429280000103
分别指商品m在推荐系统中第一次和最后一次被评分的时间,|Ym|指商品m被评分的总次数。bm越大,表示商品越优质,受关注度越持久。
实施例三
(一)数据集
在CiaoDVD数据集上进行了实验,验证本发明所述方法的有效性CiaoDVD数据包含17615 个用户、16121部电影、72665条评分行为,以及用户间的信任关系和电影的属性信息。数据集的详细信息如下表:
表1
关系(A-B) A的数量 B的数量 (A-B)的数量
用户-电影(评分行为) 17615 16121 72665
用户-评论(评论撰写行为) 21019 71633 1635480
用户-用户(信任关系) 1438 4299 40133
评论-电影(评分行为) 72665 16121 72665
(二)评价指标
采用RMSE(均方根误差)和MAE(平均绝对误差)来评估方法的有效性;
Figure GDA0002720429280000104
Figure GDA0002720429280000105
Rtest指整个测试集,Ru,m是真实评分,
Figure GDA0002720429280000106
为预测评分。MAE和RMSE越小,表示算法精度越高。
(三)比较对象
选择近几年来两种经典的且相关算法的推荐算法作为比较对象,分别是PMF和HeteMF。其中PMF采用矩阵分解的方式进行推荐,HeteMF是将矩阵分解运用于异构信息网络挖掘来实现推荐。
(四)实验结果
PMF HeteMF TMP
RMSE 0.767 0.751 0.723
MAE 0.601 0.565 0.542
对比PMF和TMP发现:TMP算法和PMF算法,从根本上都使用了矩阵分解的思想,但TMP将异构信息融入推荐,极大的缓解了原始数据的稀疏性,因此预测精度得到提高, TMP指带有时间权重的异构信息网络推荐方法的结果。
对比HeteMF和TMP发现:HeteMF和TMP都运用了基于元路径的异构信息网络挖掘思想,但TMP将时间因素纳入推荐策略的设计,使得预测精度得到了提高。

Claims (9)

1.一种带有时间权重的异构信息网络推荐方法,其特征在于:通过增加时间属性构建带有时间权重的异构信息网络;所述异构信息网络包括若干元路径;任一所述元路径上的任意两相邻实体间关系带有时间属性,即为带有时间权重的元路径;及时间偏差矩阵,用于记录时间因素对两相邻实体之间关系的影响程度;及邻接矩阵,用于表示元路径上相邻实体之间的关系;及带有时间权重的交换矩阵,通过时间偏差矩阵和邻接矩阵构建带有时间权重的交换矩阵,用于表示元路径两端的用户和商品的相似性;及预测矩阵,用于预测用户对商品的评分;
建立推荐模型:将元路径上带有时间权重的关系对应的邻接矩阵与对应的时间偏差矩阵做哈德曼积,得到新的带有时间权重的邻接矩阵;将元路径上各相邻实体的邻接矩阵依次相乘,得到带有时间权重的交换矩阵;
将带有时间权重的交换矩阵分解为用户因子矩阵和商品因子矩阵两个矩阵;对于任一元路径,通过对用户因子矩阵和商品因子矩阵的优化,构建预测矩阵,获得预测结果;采用线性组合的方式将多条元路径的预测结果进行融合,获得最终用户商品评分;依据最终用户商品评分进行推荐;
所述带有时间权重的异构信息网络设定模式为
Figure FDA0002772354180000011
带有时间权重的信息网络设定为G=(V,E,T);且满足映射关系
Figure FDA0002772354180000012
Figure FDA0002772354180000013
即对象类型不只一种,或者
Figure FDA0002772354180000014
关系类型不只一种,G为异构信息网络;反之,G为同构信息网络;当
Figure FDA0002772354180000015
Figure FDA0002772354180000016
时,G为带有时间权重的异构信息网络;反之,G为普通异构信息网络;
其中,
Figure FDA0002772354180000017
为对象类型集合,
Figure FDA0002772354180000018
为关系类型集合,
Figure FDA0002772354180000019
为关系对应的时间属性集合;V为节点集,E为边集,T为时间属性集。
2.根据权利要求1所述带有时间权重的异构信息网络推荐方法,其特征在于:所述元路径设定为P,表达式为
Figure FDA00027723541800000110
l为元路径P涉及的关系总数,(l+1)为元路径P涉及的对象类型总数;当元路径P上任一关系Rn(n∈[1,l],n为正整数)带有时间属性时,则P为带有时间权重的元路径,δn(Rn)为关系Rn的时间属性函数。
3.根据权利要求2所述带有时间权重的异构信息网络推荐方法,其特征在于:所述时间偏差矩阵定义为
Figure FDA0002772354180000021
其计算公式如下:
Figure FDA0002772354180000022
其中,
Figure FDA0002772354180000023
为时间偏差矩阵
Figure FDA0002772354180000024
在第p行第q列的元素值,表示对象
Figure FDA0002772354180000025
和对象
Figure FDA0002772354180000026
之间的时间影响指数,Ai和Aj分别表示元路径上第i种和第j种对象类型,每个对象类型则包含了一系列属于该类型的对象,i,j∈[1,l+1],(l+1)表示元路径P涉及的对象类型总数;
Figure FDA0002772354180000027
表示对象
Figure FDA0002772354180000028
和对象
Figure FDA0002772354180000029
之间关系发生的具体时间,单位为“天”;current为超参数,表示当前时间;β为超参数,表示时间对用户偏好的影响程度。
4.根据权利要求3所述带有时间权重的异构信息网络推荐方法,其特征在于:所述交换矩阵设定为
Figure FDA00027723541800000210
其中,
Figure FDA00027723541800000211
是对象类型Ai和对象类型Aj之间的邻接矩阵;
Figure FDA00027723541800000212
是对象类型Ai和对象类型Aj之间关系的时间偏差矩阵,能够反映时间因素对于关系的影响程度;⊙为哈德曼(Hadamard)积运算;i,j∈[1,l+1],(l+1)表示元路径P涉及的对象类型总数。
5.根据权利要求4所述带有时间权重的异构信息网络推荐方法,其特征在于:所述交换矩阵CP分解为用户因子矩阵UP和商品因子矩阵MP,其中用户因子矩阵UP包含用户偏好的隐性特征,商品因子矩阵MP包含商品属性的隐性特征;分解过程通过优化以下函数进行:
Figure FDA00027723541800000213
其中λU和λM为超参数,用以防止过拟合现象;设异构信息网络共有S条元路径,通过以上分解过程后,可得到S组用户因子矩阵和商品因子矩阵,分别记作[U(1),...,U(S)]和[M(1),...,M(S)];优化过程中,Up∈[U(1),...,U(S)],Mp∈[M(1),...,M(S)]。
6.根据权利要求5所述带有时间权重的异构信息网络推荐方法,其特征在于:任意一条所述元路径Ps(s∈[1,S]),其对应用户商品评分预测矩阵
Figure FDA00027723541800000214
可表示为:
Figure FDA0002772354180000031
其中U(s)和M(s)分别为元路径Ps对应的用户因子矩阵和商品因子矩阵。
7.根据权利要求6所述带有时间权重的异构信息网络推荐方法,其特征在于:所述的最终用户商品评分预测结果
Figure FDA0002772354180000032
由S条元路径对应的用户商品评分矩阵
Figure FDA0002772354180000033
加权获得,计算过程如下:
Figure FDA0002772354180000034
其中ω(s)表示第s条(s∈[1,S])元路径的权重。
8.根据权利要求7所述带有时间权重的异构信息网络推荐方法,其特征在于:所述元路径的权重向量ω=(ω(1),...,ω(S))的优化函数为:
Figure FDA0002772354180000035
其中
Figure FDA0002772354180000036
为方法预测的用户评分矩阵,Y为真实的用户评分矩阵,λω为超参数,用于防止过拟合现象。
9.根据权利要求8所述带有时间权重的异构信息网络推荐方法,其特征在于:所述用户商品评分的预测矩阵
Figure FDA0002772354180000037
还包括用户偏差矩阵BU和商品偏差矩阵BM,即:
Figure FDA0002772354180000038
其中BU反应用户偏好的时间敏感度;在矩阵BU中每个用户的偏好时间敏感度为常量,假设异构信息网络共有|U|个用户,对于任一用户u(u∈[1,|U|]),其偏好的时间敏感度计算为:
Figure FDA0002772354180000039
其中
Figure FDA00027723541800000310
Figure FDA00027723541800000311
分别表示用户u在异构信息网络中第一次和最后一次进行评分行为的时间;|Category(Yu)|表示用户u在异构信息网络中评分的商品的类型总数;
BM反应商品热度;在矩阵BM中每个商品的热度为常量,假设异构信息网络共有|M|个商品,对于任一商品m(m∈[1,|M|]),其热度计算为:
Figure FDA0002772354180000041
其中
Figure FDA0002772354180000042
Figure FDA0002772354180000043
分别表示商品m在异构信息网络中第一次和最后一次被评分的时间;
|Ym|表示商品m被评分的总次数。
CN201811360273.1A 2018-11-15 2018-11-15 一种带有时间权重的异构信息网络推荐方法 Active CN109710835B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811360273.1A CN109710835B (zh) 2018-11-15 2018-11-15 一种带有时间权重的异构信息网络推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811360273.1A CN109710835B (zh) 2018-11-15 2018-11-15 一种带有时间权重的异构信息网络推荐方法

Publications (2)

Publication Number Publication Date
CN109710835A CN109710835A (zh) 2019-05-03
CN109710835B true CN109710835B (zh) 2020-12-29

Family

ID=66254834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811360273.1A Active CN109710835B (zh) 2018-11-15 2018-11-15 一种带有时间权重的异构信息网络推荐方法

Country Status (1)

Country Link
CN (1) CN109710835B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570226B (zh) * 2019-07-10 2020-05-22 杭州电子科技大学 一种联合主题模型和异质信息网络的评分预测方法
CN110533253B (zh) * 2019-09-04 2021-05-25 安徽大学 一种基于异构信息网络的科研合作关系预测方法
CN112016701B (zh) * 2020-09-09 2023-09-15 四川大学 一种融合时序和属性行为的异常变化检测方法及系统
CN112380355A (zh) * 2020-11-20 2021-02-19 华南理工大学 一种时隙异构知识图谱的表示与存储方法
CN113239264A (zh) * 2021-04-07 2021-08-10 中国人民解放军战略支援部队信息工程大学 基于元路径网络表示学习的个性化推荐方法及系统
CN115860880B (zh) * 2023-01-06 2023-07-14 中国海洋大学 基于多层异质图卷积模型的个性化商品推荐方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709037A (zh) * 2016-12-29 2017-05-24 武汉大学 一种基于异构信息网络的电影推荐方法
CN107577710A (zh) * 2017-08-01 2018-01-12 广州市香港科大霍英东研究院 基于异构信息网络的推荐方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9576048B2 (en) * 2014-06-26 2017-02-21 International Business Machines Corporation Complex service network ranking and clustering
CN104063481B (zh) * 2014-07-02 2017-11-14 山东大学 一种基于用户实时兴趣向量的电影个性化推荐方法
CN106354862A (zh) * 2016-09-06 2017-01-25 山东大学 一种异构网络中多维个性化推荐方法
CN106802956B (zh) * 2017-01-19 2020-06-05 山东大学 一种基于加权异构信息网络的电影推荐方法
CN107562795A (zh) * 2017-08-01 2018-01-09 广州市香港科大霍英东研究院 基于异构信息网络的推荐方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709037A (zh) * 2016-12-29 2017-05-24 武汉大学 一种基于异构信息网络的电影推荐方法
CN107577710A (zh) * 2017-08-01 2018-01-12 广州市香港科大霍英东研究院 基于异构信息网络的推荐方法及装置

Also Published As

Publication number Publication date
CN109710835A (zh) 2019-05-03

Similar Documents

Publication Publication Date Title
CN109710835B (zh) 一种带有时间权重的异构信息网络推荐方法
Yu et al. A cross-domain collaborative filtering algorithm with expanding user and item features via the latent factor space of auxiliary domains
US20210271975A1 (en) User tag generation method and apparatus, storage medium, and computer device
CN111104595B (zh) 一种基于文本信息的深度强化学习交互式推荐方法及系统
US7774227B2 (en) Method and system utilizing online analytical processing (OLAP) for making predictions about business locations
WO2020147594A1 (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
Li et al. Topological influence-aware recommendation on social networks
CN108920503A (zh) 一种基于社交网络信任度的微视频个性化推荐算法
CN107545471B (zh) 一种基于高斯混合的大数据智能推荐方法
CN109410001B (zh) 一种商品推荐方法、系统、电子设备和存储介质
CN112100512A (zh) 一种基于用户聚类和项目关联分析的协同过滤推荐方法
Yu et al. A user-based cross domain collaborative filtering algorithm based on a linear decomposition model
Liang et al. Collaborative filtering based on information-theoretic co-clustering
Peng et al. GC–HGNN: A global-context supported hypergraph neural network for enhancing session-based recommendation
Sun et al. Leveraging friend and group information to improve social recommender system
Gao et al. Neural collaborative learning for user preference discovery from biased behavior sequences
Yin et al. An efficient recommendation algorithm based on heterogeneous information network
Alsalama A hybrid recommendation system based on association rules
Hassan et al. Performance analysis of neural networks-based multi-criteria recommender systems
Akansha et al. User product recommendation system using KNN-means and singular value decomposition
CN106651461A (zh) 基于灰理论的电影个性化推荐方法
Tripathi et al. Recommending restaurants: A collaborative filtering approach
Zeng et al. Collaborative filtering via heterogeneous neural networks
Zhang et al. Multi-view dynamic heterogeneous information network embedding
CN116911949A (zh) 基于边界排名损失和邻域感知图神经网络的物品推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant