CN107577710A - 基于异构信息网络的推荐方法及装置 - Google Patents
基于异构信息网络的推荐方法及装置 Download PDFInfo
- Publication number
- CN107577710A CN107577710A CN201710647593.4A CN201710647593A CN107577710A CN 107577710 A CN107577710 A CN 107577710A CN 201710647593 A CN201710647593 A CN 201710647593A CN 107577710 A CN107577710 A CN 107577710A
- Authority
- CN
- China
- Prior art keywords
- user
- item
- matrix
- information network
- heterogeneous information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims abstract description 154
- 238000010586 diagram Methods 0.000 claims abstract description 24
- 238000012546 transfer Methods 0.000 claims description 22
- 230000007704 transition Effects 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 4
- 230000004927 fusion Effects 0.000 description 10
- 230000006872 improvement Effects 0.000 description 8
- 238000005295 random walk Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 235000014102 seafood Nutrition 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于异构信息网络的推荐方法及装置,通过将异构信息网络的概要图划分为若干个子图,每一所述子图对应一元图,基于每一所述若干个用户‑项目相似性矩阵,然后对每一所述用户‑项目相似性矩阵进行融合,并构造用户‑项目评分方程,并通过优化所述目标函数,根据已知评分的样本对所述用户‑项目评分方程进行训练,获得所述用户‑项目评分方程的参数,从而预测用户对每一项目的评分,将所述评分符合预设条件的项目推荐给所述用户,能有效解决现有技术使用元路径分析用户和项目相似性语义覆盖不全面的问题,充分考虑特征之间的关联性,从而为用户推荐有用的商品。
Description
技术领域
本发明涉及数据挖掘领域,尤其涉及一种基于异构信息网络的推荐方法及装 置。
背景技术
随着现代社会的发展,大型的商业推荐系统中的实体的类型越来越丰富。例 如,在亚马逊的商务系统中,产品分为各种不同的类别及其包含的各种信息,比 如不同的品牌以及用户对产品的评价。因此,在实际的生活中,我们需要在推荐 系统中考虑不同信息所包含的丰富语义。现有技术通常采用异构信息网络中的元 路径来分析不同实体类型之间的语义联系性,从而向用户推荐有用的商品。
但是,通过元路径分析用户-物品或用户-用户相似性的方法存在语义覆盖不 全面的问题。例如,如图1所示的异构信息网络中,当采用路径用户-评价-单词 -评价-用户获取用户之间的相似性时,由于两个用户都对海鲜进行了评价,因此 可以得到一种联系性。但是,上述路径并未覆盖两个用户对同样的商铺进行评价、 在同一城市的联系性,因此,现有技术通过元路径进行语义分析的方案并不能完 整覆盖各种相似性,从而不能推荐符合用户需求的商品。再者,通过元路径的方 法获得相似性矩阵后,再认知不同路径的权重,从而将不同路径获得的相似性进 行融合。但是,这种融合方式没有充分考虑每条路径包含的隐藏特征,而且,相 似性矩阵非常稀疏,并不利于最终的融合。为了解决上述问题,现有技术将每个 相似性矩阵进行分解,然后利用隐藏的特征重新构造形成一个新的相似性矩阵,再将新的相似性矩阵进行融合。这种方式解决了相似性矩阵的稀疏问题,但是在 融合过程中没有充分利用隐藏特征的联系性。
发明内容
本发明实施例的目的是提供一种基于异构信息网络的推荐方法及装置,能有 效解决现有技术使用元路径分析用户和项目相似性语义覆盖不全面的问题,充分 考虑特征之间的关联性,从而为用户推荐有用的商品。
为实现上述目的,本发明实施例提供了一种基于异构信息网络的推荐方法, 包括步骤:
获取多个实体的信息构建异构信息网络,并根据所述多个实体的类型构建所 述异构信息网络的概要图;其中,所述异构信息网络中的节点与实体一一对应;
将异构信息网络的概要图划分为若干个子图,每一所述子图对应一元图,分 别计算每一所述元图的转移矩阵;其中,所述子图包括预设的实体类型;
根据每一所述元图的转移矩阵,获得每一所述元图对应的用户-项目相似性 矩阵,将每一所述用户-项目相似性矩阵进行融合,并构造用户-项目评分方程;
基于所述用户-项目评分方程,构造目标函数,通过优化所述目标函数,根 据已知评分的样本对所述用户-项目评分方程进行训练,获得所述用户-项目评分 方程的参数;其中,所述样本包括任一用户和任一项目;
将所述用户-项目评分方程的参数代入所述用户-项目评分方程中,预测用户 对每一项目的评分,将所述评分符合预设条件的项目推荐给所述用户。
与现有技术相比,本发明公开的基于异构信息网络的推荐方法通过将异构信 息网络的概要图划分为若干个子图,每一所述子图对应一元图,分别计算每一所 述元图的转移矩阵,从而获得若干个用户-项目相似性矩阵,然后对每一所述用 户-项目相似性矩阵进行融合,并构造用户-项目评分方程,然后基于所述用户- 项目评分方程,构造目标函数,通过优化所述目标函数,根据已知评分的样本对 所述用户-项目评分方程进行训练,获得所述用户-项目评分方程的参数,将所述 用户-项目评分方程的参数代入所述用户-项目评分方程中,预测用户对每一项目 的评分,将所述评分符合预设条件的项目推荐给所述用户,能有效解决现有技术 使用元路径分析用户和项目相似性语义覆盖不全面的问题,充分考虑特征之间的 关联性,从而为用户推荐有用的商品。
作为上述方案的改进,当所述元图包括至少两条路径时,通过邻接矩阵的点 积和乘积运算获得每一元图的转移矩阵。
作为上述方案的改进,当所述元图包括一条路径时,通过将所述路径中每两 个类型之间的邻接矩阵进行乘积运算获得所述元图的转移矩阵;
当所述元图包括若干分支路径和一条公用路径,分别计算每一分支路径的转 移矩阵,将所述分支路径的转移矩阵进行点积运算获得每一所述分支路径的总转 移矩阵,将所述分支路径的总转移矩阵与所述公用路径中每两个类型之间的邻接 矩阵进行乘积运算,从而获得所述元图的转移矩阵。
作为上述方案的改进,获取多个实体的信息构建异构信息网络具体为:
获取用户信息、项目信息、用户对项目的评分信息、用户对项目的评价信息 及项目类别信息,基于所述用户信息、项目信息、用户对项目的评分信息、用户 对项目的评价信息及项目类别信息构建异构信息网络。
作为上述方案的改进,将每一所述用户-项目相似性矩阵进行融合具体为:
根据不同的所述元图,对不同的所述用户-项目相似性矩阵分配不同的权重, 从而将每一所述用户-项目相似性矩阵进行融合。
作为上述方案的改进,将每一所述用户-项目相似性矩阵进行融合具体为:
将每一所述用户-项目相似性矩阵进行分解获得用户因子矩阵和项目因子矩 阵;
将每一用户因子矩阵和对应的项目因子矩阵进行乘积运算获得新的所述用 户-项目相似性矩阵,对不同的所述用户-项目相似性矩阵分配不同的权重,从而 将每一所述用户-项目相似性矩阵进行融合。
作为上述方案的改进,将每一所述用户-项目相似性矩阵进行分解获得用户 因子矩阵和项目因子矩阵具体为:
通过以下优化模型将所述用户-项目相似性矩阵进行降维处理后获得所述用 户因子矩阵和项目因子矩阵:
其中,当Ω=1时,[PΩ(X)]ij=Xij,λu和λb是用于防止过拟 合的L2范数正则化的超参数;U和B分别是用户因子矩阵和项目因子矩阵。
作为上述方案的改进,,所述目标函数为均值方差损失函数:
其中,N为已知评分的样本数,yn为样本的已知评分,对应样本的预测评 分。
作为上述方案的改进,通过Hetesim算法计算每一所述元图的相似性矩阵。
本发明实施例还提供了一种基于异构信息网络的推荐装置,包括:
异构信息网络构造模块,用于获取多个实体的信息构建异构信息网络,并根 据所述多个实体的类型构建所述异构信息网络的概要图;其中,所述异构信息网 络中的节点与实体一一对应;
转移矩阵计算模块,用于将异构信息网络的概要图划分为若干个子图,每一 所述子图对应一元图,分别计算每一所述元图的转移矩阵;其中,所述子图包括 预设的实体类型;
用户-项目评分方程构造模块,用于根据每一所述元图的转移矩阵,获得每 一所述元图对应的用户-项目相似性矩阵,将每一所述用户-项目相似性矩阵进行 融合,并构造用户-项目评分方程;
参数训练模块,用于基于所述用户-项目评分方程,构造目标函数,通过优 化所述目标函数,根据已知评分的样本对所述用户-项目评分方程进行训练,获 得所述用户-项目评分方程的参数;其中,所述样本包括任一用户和任一项目;
推荐模块,用于将所述用户-项目评分方程的参数代入所述用户-项目评分方 程中,预测用户对每一项目的评分,将所述评分符合预设条件的项目推荐给所述 用户。
与现有技术相比,本发明公开的基于异构信息网络的推荐装置通过转移矩阵 计算模块将异构信息网络的概要图划分为若干个子图,每一所述子图对应一元图, 然后通过用户-项目评分方程构造模块分别计算每一所述元图的转移矩阵,从而 获得若干个用户-项目相似性矩阵,然后对每一所述用户-项目相似性矩阵进行融 合,并构造用户-项目评分方程,然后通过参数训练模块基于所述用户-项目评分 方程,构造目标函数,通过优化所述目标函数,根据已知评分的样本对所述用户 -项目评分方程进行训练,获得所述用户-项目评分方程的参数,再通过推荐模块 将所述用户-项目评分方程的参数代入所述用户-项目评分方程中,预测用户对每 一项目的评分,将所述评分符合预设条件的项目推荐给所述用户,能有效解决现 有技术使用元路径分析用户和项目相似性语义覆盖不全面的问题,充分考虑特征 之间的关联性,从而为用户推荐有用的商品。
附图说明
图1是基于实体信息建立的异构信息网络的拓扑示意图。
图2是本发明实施例1提供的一种基于异构信息网络的推荐方法的流程示意 图。
图3是基于图1的异构信息网络建立的概要图。
图4是基于图3的多个元图的优选实施例示意图。
图5是本发明实施例2提供的一种基于异构信息网络的推荐装置的结构示意 图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、 完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的 实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前 提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图2,是本发明实施例1提供的一种基于异构信息网络的推荐方法的流 程示意图,包括步骤:
S1、获取多个实体的信息构建异构信息网络,并根据所述多个实体的类型构 建所述异构信息网络的概要图;其中,所述异构信息网络中的节点与实体一一对 应;
其中,信息网络,Information Network,可以用一个有向图G=(V,E)来 表示,其中V代表节点Object,E代表边Edge。并且用映射函数φ:V→A来表 示每一Object v∈V属于Object类型集合A:φ(v)∈A,用映射函数Ψ:E→R。 表示每条边e∈E属于边的类型集合R:ψ(e)∈R。应该说明的是,如果两条边连 接的起始节点和终止节点的type都相同,则这两条边是同一种类型。特别的, 如果|A|>1或者|R|>1,即节点的类型和边的类型大于1时,则该信息网络为异 构信息网络,Heterogeneous Information Network,简称HIN,否则为同构信息 网络,Homogeneous Information Network。异构信息网络的概要图即用类型表 示的异构信息网络TG=(A,R),如图3所示为图1对应的异构信息网络的概要图。
优选地,步骤S1中获取多个实体的信息构建异构信息网络具体为:
获取用户信息、项目信息、用户对项目的评分信息、用户对项目的评价信息 及项目类别信息,基于所述用户信息、项目信息、用户对项目的评分信息、用户 对项目的评价信息及项目类别信息构建异构信息网络。
S2、将异构信息网络的概要图划分为若干个子图,每一所述子图对应一元图, 分别计算每一所述元图的转移矩阵;其中,所述子图包括预设的实体类型;
例如,Ts=(As,Rs)是异构信息网络概要图TG=(A,R)的子图,其中,As属于 A,Rs属于R。可以理解的,所述元图为包括一入度为0度的源节点和一出度为0 度的目标节点的有向无环图。如图4所示,M1,…,M6是一优选实施例的多个元 图,上述元图的源节点均为用户类型,目标节点均为商品类型。其中,不同的元 图所包含的语义信息也有所不同。例如,M1代表的是用户对商品的垢面关系,M2 代表不同用户购买同一商品的关系。
此外,在给定异构信息网络G=(V,E)和概要图TG,元路径P=(A1A2…Al)的转 移矩阵为类型的邻接矩阵的乘积CP=WA1A2·WA2A3…WAl-1Al。例如,对于图4中的元 图M3,其对应的转移矩阵为其中WUB为类型U和类型B之间 的邻接矩阵。
S3、根据每一所述元图的转移矩阵,获得每一所述元图对应的用户-项目相 似性矩阵,将每一所述用户-项目相似性矩阵进行融合,并构造用户-项目评分方 程;
优选地,在该步骤中,还可采用异步双向随机游走的相关度计算方法获取用 户-项目的相似度矩阵,这就是所谓的“HeteSim”算法。具体为,分别从元图的 源节点和目标节点出发,源节点沿着指定的元图进行随机游走,目标节点沿着同 一元图的逆向随机游走,计算它们到达元图上每一位置对应节点的概率,采用算 术平均的方法计算源节点和目标节点在元图上每一节点相遇的总概率,则获得源 节点和目标节点的相似度。与现有技术不同的是,现有的HeteSim算法是应用于 元路径,而本方案是应用于元图,具有更好的稳定性和更强的语义覆盖性。
S4、基于所述用户-项目评分方程,构造目标函数,通过优化所述目标函数, 根据已知评分的样本对所述用户-项目评分方程进行训练,获得所述用户-项目评 分方程的参数;其中,所述样本包括任一用户和任一项目;
优选地,所述目标函数为其中,N为已知评分的样本数,yn为样本的已知评分,对应样本的预测评分。进一步地,为了防止过拟合,可在 目标函数中加入惩罚项。
此外,该步骤中的所述样本包括任一用户和任一项目,即代表用户-项目的 对应关系,其存在该用户对该项目的评分信息或该用户对该项目的预测评分信息。
S5、将所述用户-项目评分方程的参数代入所述用户-项目评分方程中,预测 用户对每一项目的评分,将所述评分符合预设条件的项目推荐给所述用户。
在步骤S5中,可以降序的方式对项目的评分进行排序,将排在最靠前的一 个或多个项目推荐给所述用户。
因此,基于上述方案,通过将异构信息网络的概要图划分为若干个子图,每 一所述子图对应一元图,分别计算每一所述元图的转移矩阵,从而获得若干个用 户-项目相似性矩阵,然后对每一所述用户-项目相似性矩阵进行融合,并构造用 户-项目评分方程,然后基于所述用户-项目评分方程,构造目标函数,通过优化 所述目标函数,根据已知评分的样本对所述用户-项目评分方程进行训练,获得 所述用户-项目评分方程的参数,将所述用户-项目评分方程的参数代入所述用户 -项目评分方程中,预测用户对每一项目的评分,将所述评分符合预设条件的项 目推荐给所述用户,由于本方案提出的元图能包含更丰富的语义信息,因此本方 案能有效解决现有技术使用元路径分析用户和项目相似性语义覆盖不全面的问 题,充分考虑特征之间的关联性,从而为用户推荐有用的商品。
需要说明的是,当所述元图包括至少两条路径时,通过邻接矩阵的点积和乘 积运算获得每一元图的转移矩阵。具体的,当所述元图包括包括若干分支路径和 一公用路径,分别计算每一分支路径的转移矩阵,将所述分支路径的转移矩阵进 行点积运算获得每一所述分支路径的总转移矩阵,将所述分支路径的总转移矩阵 与所述公用路径中每两个类型之间的邻接矩阵进行乘积运算,从而获得所述元图 的转移矩阵。如图5所示的元图M6,其可包含两条路径,分别为(U,R,A,R,U, B)以及(U,R,B,R,U,B),其中分支路径(R,A,R)表示两条评价(Reviews) 提及同一方面(Aspect),分支路径(R,B,R)表示两条评价(Reviews)对应 同一商品(Business),因此可采用先计算分支路径的点乘积,再计算元图的两 条路径的乘积。具体的算法如图4所示,其中,CP1为分支路径(R,A,R)的转 移矩阵,CP2为分支路径(R,B,R)的转移矩阵,然后计算CP1和CP2的点积,接 着与公用路径(U,-,-,-,U,B)中每两个类型之间的邻接矩阵进行乘积运算, 从而获得元图M6的转移矩阵,具体的算法如下所示:
CSr=CP1⊙CP2
在异构信息网络结构中,每个元图对最终的用户-项目评分方程具有不同的 影响,因此需要按照一定的权重进行融合,以得到较为良好的推荐效果。在一优 选实施例中,步骤S3中将每一所述用户-项目相似性矩阵进行融合可采用多种融 合算法,可先通过关系抽取算法得到权值,然后根据同一框架结构将各个元图所 对应的相似度矩阵进行融合。优选地,元图可采用网络融合、效用矩阵融合、特 征融合和划分融合方式进行融合。其中,网络融合最直接的方法是计算网络节点 之间的平均交互网络,将每个元路径从网络阶段进行加权求和得到目标关系;效 用矩阵融合是对所有元图的模块性函数的加权和最大化,它考虑了每条元路径所 对应的关系矩阵的度分布。
除了上述根据不同的所述元图,对不同的所述用户-项目相似性矩阵分配不 同的权重,从而将每一所述用户-项目相似性矩阵进行融合,另一种对用户-项目 相似性矩阵进行融合的方式为:
将每一所述用户-项目相似性矩阵进行分解获得用户因子矩阵和项目因子矩 阵;
将每一用户因子矩阵和对应的项目因子矩阵进行乘积运算获得新的所述用 户-项目相似性矩阵,对不同的所述用户-项目相似性矩阵分配不同的权重,从而 将每一所述用户-项目相似性矩阵进行融合。
其中,将每一所述用户-项目相似性矩阵进行分解获得用户因子矩阵和项目 因子矩阵具体为:
通过以下优化模型将所述用户-项目相似性矩阵进行降维处理后获得所述用 户因子矩阵和项目因子矩阵:
其中,当Ω=1时,[PΩ(X)]ij=Xij,λu和λb是用于防止过拟 合的L2范数正则化的超参数;U和B分别是用户因子矩阵和项目因子矩阵。
上述优化模型的求解可采用梯度下降或随机梯度下降的方式进行求解获得 所述用户因子矩阵和项目因子矩阵。
优选地,对所述用户-项目相似性矩阵进行分解还可采用奇异值分解和非负 矩阵分解的方式。
此外,预测的准确度是评分推荐系统中最常用的评价指标,该指标衡量的是 推荐算法预测用户对项目的评分和实际用户评分的“接近”程度。在本方案中, 可采用计算平均绝对误差的方法进行准确度的预测,也可通过平均平方误差、均
方根误差方法进行准确度的预测。其中,均方根误差方法具体为:
其中,Rtest是所有的训练集,为用户ui对项目bj的预测评分,Rij为用户 ui对项目bj的已标记评分。
参见图5,是本发明实施例2提供的一种基于异构信息网络的推荐装置的结 构示意图,包括:
异构信息网络构造模块101,用于获取多个实体的信息构建异构信息网络, 并根据所述多个实体的类型构建所述异构信息网络的概要图;其中,所述异构信 息网络中的节点与实体一一对应;
转移矩阵计算模块102,用于将异构信息网络的概要图划分为若干个子图, 每一所述子图对应一元图,分别计算每一所述元图的转移矩阵;其中,所述子图 包括预设的实体类型;
用户-项目评分方程构造模块103,用于根据每一所述元图的转移矩阵,获得 每一所述元图对应的用户-项目相似性矩阵,将每一所述用户-项目相似性矩阵进 行融合,并构造用户-项目评分方程;
参数训练模块104,用于基于所述用户-项目评分方程,构造目标函数,通过 优化所述目标函数,根据已知评分的样本对所述用户-项目评分方程进行训练, 获得所述用户-项目评分方程的参数;其中,所述样本包括任一用户和任一项目;
推荐模块105,用于将所述用户-项目评分方程的参数代入所述用户-项目评 分方程中,预测用户对每一项目的评分,将所述评分符合预设条件的项目推荐给 所述用户。
优选地,所述多个实体的信息包括获取用户信息、项目信息、用户对项目的 评分信息、用户对项目的评价信息及项目类别信息,基于所述用户信息、项目信 息、用户对项目的评分信息、用户对项目的评价信息及项目类别信息。
其中,需要说明的是,当所述元图包括至少两条路径时,通过邻接矩阵的点 积和乘积运算获得每一元图的转移矩阵。具体的,当所述元图包括至少两条路径 时,其中,所述路径包括若干分支路径和一公用路径,分别计算每一分支路径的 转移矩阵,将所述分支路径的转移矩阵进行点积运算获得每一所述分支路径的总 转移矩阵,将所述分支路径的总转移矩阵与所述公用路径中每两个类型之间的邻 接矩阵进行乘积运算,从而获得所述元图的转移矩阵。
优选地,所述用户-项目评分方程构造模块103可采用异步双向随机游走的 相关度计算方法获取用户-项目的相似度矩阵,这就是所谓的“HeteSim”算法。
优选地,所述目标函数为其中,N为已知评分的样本数,yn为样本的已知评分,对应样本的预测评分。进一步地,为了防止过拟合,可在 目标函数中加入惩罚项。
优选地,用户-项目评分方程构造模块103可通过对不同的所述用户-项目相 似性矩阵分配不同的权重,从而将每一所述用户-项目相似性矩阵进行融合。此 外,另一种融合方式具体为:
将每一所述用户-项目相似性矩阵进行分解获得用户因子矩阵和项目因子矩 阵;
将每一用户因子矩阵和对应的项目因子矩阵进行乘积运算获得新的所述用 户-项目相似性矩阵,对不同的所述用户-项目相似性矩阵分配不同的权重,从而 将每一所述用户-项目相似性矩阵进行融合。
其中,将每一所述用户-项目相似性矩阵进行分解获得用户因子矩阵和项目 因子矩阵具体为:
通过以下优化模型将所述用户-项目相似性矩阵进行降维处理后获得所述用 户因子矩阵和项目因子矩阵:
其中,当Ω=1时,[PΩ(X)]ij=Xij,λu和λb是用于防止过拟 合的L2范数正则化的超参数;U和B分别是用户因子矩阵和项目因子矩阵。
本发明实施例中的基于异构信息网络的推荐装置实施过程和工作原理可参 考上述对基于异构信息网络的推荐方法的具体描述,在此不再赘述。
综上,本发明实施例提供了一种基于异构信息网络的推荐方法及装置,通过 将异构信息网络的概要图划分为若干个子图,每一所述子图对应一元图,分别计 算每一所述元图的转移矩阵,从而获得若干个用户-项目相似性矩阵,然后对每 一所述用户-项目相似性矩阵进行融合,并构造用户-项目评分方程,然后基于所 述用户-项目评分方程,构造目标函数,通过优化所述目标函数,根据已知评分 的样本对所述用户-项目评分方程进行训练,获得所述用户-项目评分方程的参数, 将所述用户-项目评分方程的参数代入所述用户-项目评分方程中,预测用户对每 一项目的评分,将所述评分符合预设条件的项目推荐给所述用户,能有效解决现 有技术使用元路径分析用户和项目相似性语义覆盖不全面的问题,充分考虑特征 之间的关联性,从而为用户推荐有用的商品。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术 人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改 进和润饰也视为本发明的保护范围。
Claims (10)
1.一种基于异构信息网络的推荐方法,其特征在于,包括步骤:
获取多个实体的信息构建异构信息网络,并根据所述多个实体的类型构建所述异构信息网络的概要图;其中,所述异构信息网络中的节点与实体一一对应;
将异构信息网络的概要图划分为若干个子图,每一所述子图对应一元图,分别计算每一所述元图的转移矩阵;其中,所述子图包括预设的实体类型;
根据每一所述元图的转移矩阵,获得每一所述元图对应的用户-项目相似性矩阵,将每一所述用户-项目相似性矩阵进行融合,并构造用户-项目评分方程;
基于所述用户-项目评分方程,构造目标函数,通过优化所述目标函数,根据已知评分的样本对所述用户-项目评分方程进行训练,获得所述用户-项目评分方程的参数;其中,所述样本包括任一用户和任一项目;
将所述用户-项目评分方程的参数代入所述用户-项目评分方程中,预测用户对每一项目的评分,将所述评分符合预设条件的项目推荐给所述用户。
2.如权利要求1所述的基于异构信息网络的推荐方法,其特征在于,当任一所述元图包括至少两条路径时,通过邻接矩阵的点积和乘积运算获得每一元图的转移矩阵。
3.如权利要求2所述的基于异构信息网络的推荐方法,其特征在于,当任一所述元图包括一条路径时,通过将所述路径中每两个类型之间的邻接矩阵进行乘积运算获得所述元图的转移矩阵;
当任一所述元图包括若干分支路径和一条公用路径,分别计算每一分支路径的转移矩阵,将所述分支路径的转移矩阵进行点积运算获得每一所述分支路径的总转移矩阵,将所述分支路径的总转移矩阵与所述公用路径中每两个类型之间的邻接矩阵进行乘积运算,从而获得所述元图的转移矩阵。
4.如权利要求1所述的基于异构信息网络的推荐方法,其特征在于,获取多个实体的信息构建异构信息网络具体为:
获取用户信息、项目信息、用户对项目的评分信息、用户对项目的评价信息及项目类别信息,基于所述用户信息、项目信息、用户对项目的评分信息、用户对项目的评价信息及项目类别信息构建异构信息网络。
5.如权利要求1所述的基于异构信息网络的推荐方法,其特征在于,将每一所述用户-项目相似性矩阵进行融合具体为:
根据不同的所述元图,对不同的所述用户-项目相似性矩阵分配不同的权重,从而将每一所述用户-项目相似性矩阵进行融合。
6.如权利要求1所述的基于异构信息网络的推荐方法,其特征在于,将每一所述用户-项目相似性矩阵进行融合具体为:
将每一所述用户-项目相似性矩阵进行分解获得用户因子矩阵和项目因子矩阵;
将每一用户因子矩阵和对应的项目因子矩阵进行乘积运算获得新的所述用户-项目相似性矩阵,对不同的所述用户-项目相似性矩阵分配不同的权重,从而将每一所述用户-项目相似性矩阵进行融合。
7.如权利要求6所述的基于异构信息网络的推荐方法,其特征在于,将每一所述用户-项目相似性矩阵进行分解获得用户因子矩阵和项目因子矩阵具体为:
通过以下优化模型将所述用户-项目相似性矩阵进行降维处理后获得所述用户因子矩阵和项目因子矩阵:
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>P</mi>
<mi>&Omega;</mi>
</msub>
<mrow>
<mo>(</mo>
<msup>
<mi>UB</mi>
<mi>T</mi>
</msup>
<mo>-</mo>
<mi>R</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
<mo>+</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mi>u</mi>
</msub>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mi>U</mi>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
<mo>+</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mi>b</mi>
</msub>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mi>B</mi>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
</mrow>
其中,当Ω=1时,[PΩ(X)]ij=Xij,λu和λb是用于防止过拟合的L2范数正则化的超参数;U和B分别是用户因子矩阵和项目因子矩阵。
8.如权利要求1所述的基于异构信息网络的推荐方法,其特征在于,所述目标函数为均值方差损失函数:
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<msup>
<mi>y</mi>
<mi>n</mi>
</msup>
<mo>-</mo>
<mover>
<msup>
<mi>y</mi>
<mi>n</mi>
</msup>
<mo>^</mo>
</mover>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
其中,N为已知评分的样本数,yn为样本的已知评分,对应样本的预测评分。
9.如权利要求1所述的基于异构信息网络的推荐方法,其特征在于,通过Hetesim算法计算每一所述元图的相似性矩阵。
10.一种基于异构信息网络的推荐装置,其特征在于,包括:
异构信息网络构造模块,用于获取多个实体的信息构建异构信息网络,并根据所述多个实体的类型构建所述异构信息网络的概要图;其中,所述异构信息网络中的节点与实体一一对应;
转移矩阵计算模块,用于将异构信息网络的概要图划分为若干个子图,每一所述子图对应一元图,分别计算每一所述元图的转移矩阵;其中,所述子图包括预设的实体类型;
用户-项目评分方程构造模块,用于根据每一所述元图的转移矩阵,获得每一所述元图对应的用户-项目相似性矩阵,将每一所述用户-项目相似性矩阵进行融合,并构造用户-项目评分方程;
参数训练模块,用于基于所述用户-项目评分方程,构造目标函数,通过优化所述目标函数,根据已知评分的样本对所述用户-项目评分方程进行训练,获得所述用户-项目评分方程的参数;其中,所述样本包括任一用户和任一项目;
推荐模块,用于将所述用户-项目评分方程的参数代入所述用户-项目评分方程中,预测用户对每一项目的评分,将所述评分符合预设条件的项目推荐给所述用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710647593.4A CN107577710B (zh) | 2017-08-01 | 2017-08-01 | 基于异构信息网络的推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710647593.4A CN107577710B (zh) | 2017-08-01 | 2017-08-01 | 基于异构信息网络的推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107577710A true CN107577710A (zh) | 2018-01-12 |
CN107577710B CN107577710B (zh) | 2020-06-19 |
Family
ID=61034127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710647593.4A Active CN107577710B (zh) | 2017-08-01 | 2017-08-01 | 基于异构信息网络的推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107577710B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985830A (zh) * | 2018-07-05 | 2018-12-11 | 北京邮电大学 | 基于异质信息网络的推荐评分方法、装置 |
CN109685630A (zh) * | 2019-01-09 | 2019-04-26 | 苏州大学 | 电子商务团购推荐方法及系统 |
CN109710835A (zh) * | 2018-11-15 | 2019-05-03 | 中国人民解放军国防科技大学 | 一种带有时间权重的异构信息网络推荐方法 |
CN111444395A (zh) * | 2019-01-16 | 2020-07-24 | 阿里巴巴集团控股有限公司 | 获取实体间关系表达的方法、系统和设备、广告召回系统 |
CN111459990A (zh) * | 2020-03-31 | 2020-07-28 | 腾讯科技(深圳)有限公司 | 对象处理方法、系统及计算机可读存储介质和计算机设备 |
CN111815396A (zh) * | 2020-06-04 | 2020-10-23 | 清华大学 | 基于元图的产品筛选方法、系统、设备及存储介质 |
CN112749805A (zh) * | 2021-01-15 | 2021-05-04 | 浙江工业大学 | 一种基于多种实体关系的在线课程推荐方法 |
CN113822687A (zh) * | 2020-06-19 | 2021-12-21 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、设备和存储介质 |
CN113836395A (zh) * | 2021-08-30 | 2021-12-24 | 河南大学 | 一种基于异构信息网络的服务开发者按需推荐方法及系统 |
CN117708821A (zh) * | 2024-02-06 | 2024-03-15 | 山东省计算中心(国家超级计算济南中心) | 基于异构图嵌入的勒索软件检测方法、系统、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100031338A1 (en) * | 2006-11-01 | 2010-02-04 | Poore Douglas A | Collaboration gateway |
CN104077351A (zh) * | 2014-05-26 | 2014-10-01 | 东北师范大学 | 基于异构信息网络的内容提供方法及系统 |
CN106354862A (zh) * | 2016-09-06 | 2017-01-25 | 山东大学 | 一种异构网络中多维个性化推荐方法 |
KR101713831B1 (ko) * | 2016-07-26 | 2017-03-09 | 한국과학기술정보연구원 | 문서추천장치 및 방법 |
CN106503028A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推荐方法和系统 |
-
2017
- 2017-08-01 CN CN201710647593.4A patent/CN107577710B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100031338A1 (en) * | 2006-11-01 | 2010-02-04 | Poore Douglas A | Collaboration gateway |
CN104077351A (zh) * | 2014-05-26 | 2014-10-01 | 东北师范大学 | 基于异构信息网络的内容提供方法及系统 |
CN106503028A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推荐方法和系统 |
KR101713831B1 (ko) * | 2016-07-26 | 2017-03-09 | 한국과학기술정보연구원 | 문서추천장치 및 방법 |
CN106354862A (zh) * | 2016-09-06 | 2017-01-25 | 山东大学 | 一种异构网络中多维个性化推荐方法 |
Non-Patent Citations (1)
Title |
---|
YANGQIU SONG: "recent development of heterogeneous information networks:from meta-paths to meta-graphs", 《HTTP://WWW.CSE.UST.HK/~YQSONG/》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985830A (zh) * | 2018-07-05 | 2018-12-11 | 北京邮电大学 | 基于异质信息网络的推荐评分方法、装置 |
CN108985830B (zh) * | 2018-07-05 | 2021-03-02 | 北京邮电大学 | 基于异质信息网络的推荐评分方法、装置 |
CN109710835A (zh) * | 2018-11-15 | 2019-05-03 | 中国人民解放军国防科技大学 | 一种带有时间权重的异构信息网络推荐方法 |
CN109710835B (zh) * | 2018-11-15 | 2020-12-29 | 中国人民解放军国防科技大学 | 一种带有时间权重的异构信息网络推荐方法 |
CN109685630B (zh) * | 2019-01-09 | 2020-10-27 | 苏州大学 | 电子商务团购推荐方法及系统 |
CN109685630A (zh) * | 2019-01-09 | 2019-04-26 | 苏州大学 | 电子商务团购推荐方法及系统 |
CN111444395B (zh) * | 2019-01-16 | 2023-05-16 | 阿里巴巴集团控股有限公司 | 获取实体间关系表达的方法、系统和设备、广告召回系统 |
CN111444395A (zh) * | 2019-01-16 | 2020-07-24 | 阿里巴巴集团控股有限公司 | 获取实体间关系表达的方法、系统和设备、广告召回系统 |
CN111459990A (zh) * | 2020-03-31 | 2020-07-28 | 腾讯科技(深圳)有限公司 | 对象处理方法、系统及计算机可读存储介质和计算机设备 |
CN111815396A (zh) * | 2020-06-04 | 2020-10-23 | 清华大学 | 基于元图的产品筛选方法、系统、设备及存储介质 |
CN111815396B (zh) * | 2020-06-04 | 2024-05-31 | 清华大学 | 基于元图的产品筛选方法、系统、设备及存储介质 |
CN113822687A (zh) * | 2020-06-19 | 2021-12-21 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、设备和存储介质 |
CN112749805A (zh) * | 2021-01-15 | 2021-05-04 | 浙江工业大学 | 一种基于多种实体关系的在线课程推荐方法 |
CN112749805B (zh) * | 2021-01-15 | 2024-02-13 | 浙江工业大学 | 一种基于多种实体关系的在线课程推荐方法 |
CN113836395A (zh) * | 2021-08-30 | 2021-12-24 | 河南大学 | 一种基于异构信息网络的服务开发者按需推荐方法及系统 |
CN117708821A (zh) * | 2024-02-06 | 2024-03-15 | 山东省计算中心(国家超级计算济南中心) | 基于异构图嵌入的勒索软件检测方法、系统、设备及介质 |
CN117708821B (zh) * | 2024-02-06 | 2024-04-30 | 山东省计算中心(国家超级计算济南中心) | 基于异构图嵌入的勒索软件检测方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107577710B (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107577710B (zh) | 基于异构信息网络的推荐方法及装置 | |
Li et al. | Hierarchical bipartite graph neural networks: Towards large-scale e-commerce applications | |
Mo et al. | Identifying node importance based on evidence theory in complex networks | |
CN107562795A (zh) | 基于异构信息网络的推荐方法及装置 | |
CN108960719B (zh) | 选品方法和装置以及计算机可读存储介质 | |
CN111507796A (zh) | 一种基于知识图谱的网上商城商品推荐方法 | |
CN110245285B (zh) | 一种基于异构信息网络的个性化推荐方法 | |
CN111125530A (zh) | 一种基于多类型特征深度学习的信息流推荐方法 | |
CN111582538A (zh) | 一种基于图神经网络的社群价值预测方法及系统 | |
CN102326160A (zh) | 用于对产生于数据库的数据群集的方法和系统 | |
KR102520651B1 (ko) | 독립적 상품추천 서비스 구축시스템 및 이를 이용한 상품추천 서비스 제공방법 | |
CN109584006A (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
CN115860880B (zh) | 基于多层异质图卷积模型的个性化商品推荐方法及系统 | |
Li et al. | Learning user preferences across multiple aspects for merchant recommendation | |
Rabbi et al. | An Approximation For Monitoring The Efficiency Of Cooperative Across Diverse Network Aspects | |
Hassan et al. | Performance analysis of neural networks-based multi-criteria recommender systems | |
Roozbahani et al. | A systematic survey on multi-relational community detection | |
Hassan et al. | Improving prediction accuracy of multi-criteria recommender systems using adaptive genetic algorithms | |
Ren et al. | A co-attention based multi-modal fusion network for review helpfulness prediction | |
CN116340643B (zh) | 对象推荐的调整方法及装置、存储介质、电子设备 | |
CN104572623A (zh) | 一种在线lda模型的高效数据总结分析方法 | |
CN108345620A (zh) | 品牌信息处理方法、装置、存储介质及电子设备 | |
Pennacchioli et al. | Overlap versus partition: marketing classification and customer profiling in complex networks of products | |
CN110457572B (zh) | 基于图网络的商品信息推荐方法及电子设备 | |
CN112785372B (zh) | 一种基于语义关系的智能推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |