CN112950324B - 一种知识图谱辅助的成对排序个性化电商推荐方法及系统 - Google Patents

一种知识图谱辅助的成对排序个性化电商推荐方法及系统 Download PDF

Info

Publication number
CN112950324B
CN112950324B CN202110278391.3A CN202110278391A CN112950324B CN 112950324 B CN112950324 B CN 112950324B CN 202110278391 A CN202110278391 A CN 202110278391A CN 112950324 B CN112950324 B CN 112950324B
Authority
CN
China
Prior art keywords
commodity
user
data
entity
negative sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110278391.3A
Other languages
English (en)
Other versions
CN112950324A (zh
Inventor
许国良
李家浩
雒江涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Mofei Technology Co.,Ltd.
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202110278391.3A priority Critical patent/CN112950324B/zh
Publication of CN112950324A publication Critical patent/CN112950324A/zh
Application granted granted Critical
Publication of CN112950324B publication Critical patent/CN112950324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

发明属于大数据挖掘领域,具体涉一种知识图谱辅助的成对排序个性化电商推荐方法及系统,方法包括获取原始数据,对原始数据进行预处理,并利用处理后的原始数据构建知识图谱;从获取的数据中抽取目标用户的负样本,通过负样本构建输入数据;构建个性化推荐模型,将通过负样本构建的输入数据作为输入,进行训练;将目标用户的实时数据经过预处理并提取负样本,构成输入数据输入个性化推荐模型,个性化推荐模型输出针对目标用户的商品推荐列表;本发明解决了传统成对排序算法随机抽取负样本导致模型收敛速度缓慢、推荐精度不高等问题。

Description

一种知识图谱辅助的成对排序个性化电商推荐方法及系统
技术领域
本发明属于大数据挖掘领域,具体涉一种知识图谱辅助的成对排序个性化电商推荐方法及系统。
背景技术
随着社会的发展,新兴技术其实己经颠覆了人们的传统生活形式,特别是在购物领域变化特点显著。最早的集市到随后的大型商店、大型超市,更进一步演变成现在巨大规模的电子商务,商品数量也从几百种迅速增加到了万种以上,而现在更多达几亿种,因为传统的购物环境发了巨变,一般的人们不会有足够的精力和时间再在传统购物中货比三家,因此国内外几乎所有的电商平台均使用了推荐功能,并取得了较好的效果。数据显示,亚马逊至少有35%的销售来自于推荐算法,Netflix曾宣称有60%的用户是通过推荐系统来找到自己感兴趣的视频和电影的,著名新闻阅读网站Digg使用推荐系统后,用户digg总数提高了40%,用户的好友数平均增加24%。这表明在各种各样的信息系统中,推荐系统都有着举足轻重的地位,并在各大领域中都取得了重大的成功。
虽然传统推荐系统能够掌握用户的个人习惯,兴趣爱好并能满足用户追求私人定制的需求而在电商领域被广泛使用并取得了巨大成功。但随着大数据时代的到来,传统推荐系统在挖掘数据价值上存在的问题也正在限制着其性能的发挥。特别地,在传统的基于成对排序的个性化推荐算法中,仅仅考虑了用户根据自身偏好对商品做出是否购买的决策。然而,在真实场景下,不仅用户自身的偏好能影响用户对商品做出决策,商品之间的功能互补关系也是用户对商品做出决策的重要因素。另一方面,用户对商品的隐式反馈记录仅仅能反映用户所喜欢的商品,而用户不喜欢的商品被隐藏在大量的未与用户交互的商品中,因此推荐模型缺乏负样本的训练。因此,传统推荐系统往往会有,推荐精度不高,推荐结果单一,模型收敛缓慢等问题。为解决以上问题,本发明提出了一种知识图谱辅助的成对排序个性化电商推荐方法,该方法可以有效缓解在传统成对排序个性化推荐方法中,随机抽取负样本导致模型收敛速度缓慢、推荐精度不高、推荐结果单一等问题,此外引入知识图谱还可以提高推荐结果的可解释性。
发明内容
为解决以上现有技术存在的问题,本发明提出一种知识图谱辅助的成对排序个性化电商推荐方法,具体包括以下步骤:
S1:获取原始数据,对原始数据进行预处理,并利用处理后的原始数据构建知识图谱;;
S2:从获取的数据中抽取目标用户的负样本,通过负样本构建输入数据;
S3:构建个性化推荐模型,将通过负样本构建的输入数据作为输入,进行训练;
S4、将目标用户的实时数据经过预处理并提取负样本,构成输入数据输入个性化推荐模型,个性化推荐模型输出针对目标用户的商品推荐列表。
进一步的,对用户数据进行预处理以及知识图谱构建的过程包括:
对用户以及商品数据进行清洗,删除无效数据和异常数据,得到所有用户集U以及商品集I;
通过用户对商品的购买信息构建用户商品交互矩阵R=[rui]m×n,其中rui=1表明用户u购买过商品i,反之rui=0表明用户u未购买过商品i;
商品被一起购买的数据构建商品与商品的功能互补矩阵H=[hkv]n×n,其中hkv=1表明商品v与商品k被一起购买过,反之hkv=0表明商品v与商品k未被一起购买过;
利用商品元数据通过知识图谱抽取出商品知识,并通过与已构建的公开知识库,自底向上地构建商品知识图谱,将商品知识图谱与用户商品交互矩阵融合构成最终知识图谱
Figure BDA0002976292270000031
其中
Figure BDA0002976292270000032
为实体间关系集合,ε=U∪I∪K为所有实体集合,K为除用户实体以及商品实体之外的额外实体集合,m为所有用户数,n为所有商品数。
进一步的,从获取的数据中抽取目标用户的负样本包括:
将负样本的抽样过程建模为马尔科夫决策过程,定义为
Figure BDA0002976292270000033
目标是学习到一种智能的负采样策略;
状态St定义为对于给定用户u,在探索知识图谱的第t步时,所访问到的知识图谱商品实体et时的状态,表示为二元组(u,et);
动作at定义为在当前状态St到达下一个状态St+1时的单位路径选择操作,且at不选择已探索路径,其中探索的单位路径定义为p0=i→e′→j,i与j是知识图谱中的商品实体,e′是同时与i,j相连的除用户实体与商品实体之外的额外实体;
转移概率表示在当前状态St下采取动作at能到达下一个状态St+1的概率,设置为1;
给定状态St时的奖励函数
Figure BDA0002976292270000034
定义为:
Figure BDA0002976292270000035
策略的价值函数vπ(s)为策略π的累计折损奖励的期望,通过最大化价值函数vπ(s)学习到最优策略π;
其中,
Figure BDA0002976292270000036
为在探索知识图谱过程中的状态集合,
Figure BDA0002976292270000037
为探索知识图谱过程中的动作集合,
Figure BDA0002976292270000038
为状态转移概率矩阵,
Figure BDA0002976292270000039
为奖励函数;
Figure BDA00029762922700000310
为用户u与商品et的特征向量的内积,
Figure BDA00029762922700000311
为商品i与商品et的特征向量的内积。
进一步的,在抽取负样本时,为减少模型复杂度,对当前节点的邻接点集
Figure BDA00029762922700000312
中随机选取包含n1个实体节点的子集
Figure BDA00029762922700000313
计算邻接点子集
Figure BDA00029762922700000314
中各节点与当前节点e的相似性分数,对相似性评分进行排名,并选取评分由高到低排名前n2个邻接实体节点作为当前节点的邻居节点,再计算当前状态St下,访问到邻居节点为负样本的概率。
进一步的,在评估当前状态St下访问到的商品实体et为高质量负样本的概率时,一次探索动作采取的单位路径包括知识图谱中的两跳,当前状态St下访问到的商品实体et为高质量负样本的概率表示为:
Figure BDA0002976292270000043
其中,
Figure BDA0002976292270000044
表示商品实体节点et为负样本的概率,概率
Figure BDA0002976292270000045
表征额外实体et-1′∈K对用户决策的重要性,
Figure BDA0002976292270000046
表示与实体et-1′相连的商品实体节点et为负样本的概率。
进一步的,负样本抽样模型的损失函数表示为:
Figure BDA0002976292270000041
其中,T为模型超参数,表示探索单位路径的长度;ΘS为负样本抽样模块参数向量;
Figure BDA0002976292270000042
为给定参数ΘS下实体et+1为负样本的概率;O+为用户的正反馈集合;γ为奖励衰减因子;
Figure BDA0002976292270000047
为奖励函数。
进一步的,通过负样本构建输入数据包括:
将用户u以及其已经被其购买过的商品i、其负样本商品j,形成用户偏序数据(u,i,j);
对于每件商品k,通过功能互补矩阵H=[hkv]n×n,构建功能互补性偏序矩阵Ck=[cvw](n-1)×(n-1),其中cvw=1表明对于商品k而言,商品v比商品w具有更好的功能互补性,cvw=0表明对于商品k而言,商品w比商品v具有更好的功能互补性,其他情况为无效数据,形成功能互补性偏序数据(k,v,w);
将用户偏序数据以及商品功能互补性偏序数据作为数据对作为个性化推荐模块的输入。
进一步的,个性化推荐模型的损失函数表示为:
Figure BDA0002976292270000051
其中,DS为用户偏序部分训练集;ZS为功能互补性偏序部分训练集;
Figure BDA0002976292270000052
和β为模型超参数,ΘR为模型求解的所有参数;
Figure BDA0002976292270000053
为商品k与商品v的互补性评分;
Figure BDA0002976292270000054
为商品k与商品w的互补性评分,
Figure BDA0002976292270000055
为用户u对商品i的偏好评分,
Figure BDA0002976292270000056
为用户u对商品j的偏好评分,σ为sigmoid函数。
本发明还提出一种知识图谱辅助的成对排序个性化电商推荐系统,包括原始数据获取模块、个性化推荐模块、负样本抽取模块以及优化模块,所述负样本抽取模块包括图表示学习单元、邻居节点选择模块以及图注意模块,其中:
数据获取模块,用于获取原始数据,并利用处理后的原始数据构建知识图谱;原始数据包括电商平台用户与商品的历史反馈数据、丰富的商品元数据,所述知识图谱包括用户与商品的历史反馈信息、商品的属性信息;
个性化推荐模块,用于以输入优化单元的数据作为输入,为目标用户提供推荐的商品列表;
图表示学习单元,用于根据输入的数据学习得到知识图谱中所有节点的向量表示;
邻居节点选择模块,用于根据图表示学习单元得到实体的向量表示,从当前实体节点的邻居节点中随机选择n1个实体节点,计算n1个实体节点与当前实体节点的相似性分数,并选择其中n2个分数最高的作为当前节点的邻居节点集合,降低模型复杂度;
图注意模块,用于计算当前节点的邻居节点集合中的节点为当前节点的负样本的概率,并将集合中概率最高的节点作为负样本;
优化模块,用于根据负样本抽取模块获取的负样本,构建输入数据,即将偏序关系数据(u,i,j)以及功能互补关系数据(k,v,w)作为个性化推荐模块输入,其中u为给定用户,i为用户u已经购买过的商品,j为抽样模块采样的高质量负样本商品,v为与商品k一起被购买过的商品,w为随机抽取的未与商品k一起被购买过的商品。
本发明的有益效果:
1)本发明将商品功能互补性融入到传统成对排序个性化电商推荐算法中,不仅考虑了用户偏好对用户决策的影响,也考虑了商品功能上的互补关系对用户决策的影响,提升了电商推荐的准确性以及多样性。
2)本发明利用丰富的商品元数据、用户商品交互数据以及公开知识库构建知识图谱,并引入强化学习思想,设计了一种知识感知的抽样模块,通过探索知识图谱获取高质量的负样本,解决了传统成对排序算法随机抽取负样本导致模型收敛速度缓慢、推荐精度不高等问题。此外,通过分析探索知识图谱的路径还可以有助于提升推荐结果的可解释性。
附图说明
图1为本发明方法的步骤示意图;
图2为本发明方法的总体架构图;
图3为本发明方法构建电影知识图谱;
图4为本发明方法构建互补性偏序矩阵图;
图5为本发明方法知识感知负抽样探索过程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出一种知识图谱辅助的成对排序个性化电商推荐方法,其特征在于,如图1,包括以下步骤:
S1:获取原始数据,对原始数据进行预处理,并利用处理后的原始数据构建知识图谱;;
S2:从获取的数据中抽取目标用户的负样本,通过负样本构建输入数据;
S3:构建个性化推荐模型,将通过负样本构建的输入数据作为输入,进行训练;
S4、将目标用户的实时数据经过预处理并提取基于负样本的输入数据输入个性化推荐模型,个性化推荐模型输出针对目标用户的商品推荐列表。
如图2模型系统框架图所示,所述推荐模型由推荐模块以及抽样模块两个部分组成,构建以及训练推荐模型的过程包括:
S1:获取原始数据,对原始数据进行预处理;所述原始数据包括电商平台用户与商品的历史反馈数据、丰富的商品元数据,并利用处理后的原始数据构建知识图谱;所诉知识图谱包含用户与商品的历史反馈信息,同时包含商品的属性信息以及外部知识信息。
S2:构建一种融合商品功能互补性的成对排序个性化推荐模块,学习用户与商品的特征向量,从而预测将商品推荐给目标用户的概率,形成为目标用户推荐的商品列表。
S3:引入强化学习思想,将推荐模块中负样本的抽取过程建模为马尔科夫决策过程,构建一种基于知识感知的抽样模块,为推荐模块提供高质量的负样本。
S4:固定抽样模块参数,将偏序关系数据(u,i,j)以及功能互补关系数据(i,k,v)作为推荐模块输入,训练推荐模块更新其参数。所述(u,i,j)与(i,k,v)中,u为给定用户,i为用户u已经购买过的商品,j为抽样模块采样的高质量负样本商品,k为与商品i一起被购买过的商品,v为随机抽取的未与商品i一起被购买过的商品。
S5:固定推荐模块参数,抽样模块从用户u以及已经被其购买过的商品i出发,通过在知识图谱中一系列的决策寻找可能的高质量负样本商品,并让推荐模块对抽样模块的决策进行评估,以从推荐模块处获取最多奖励为目的,训练抽样模块更新其参数。
S6:通过计算模型的损失函数进行迭代,整个模型损失包含推荐模块损失和抽样模块损失,当超过最大训练轮次或损失最小时完成模型训练。
在本实施例中,对用户数据进行预处理过程包括:
对用户以及商品数据进行清洗,删除无效数据和异常数据,得到所有用户集U以及商品集I;
通过用户对商品的购买信息构建用户商品交互矩阵R=[rui]m×n,其中rui=1表明用户u购买过商品i,反之rui=0表明用户u未购买过商品i;
商品被一起购买的数据构建商品与商品的功能互补矩阵H=[hkv]n×n,其中hkv=1表明商品v与商品k被一起购买过,反之hkv=0表明商品v与商品k未被一起购买过;
如图3所示,以利用本发明构建电影知识图谱为例,电影知识图谱的构建一方面利用电影元数据抽取出电影相关知识,另一方面通过连接现有公开知识库,自底向上地构建电影知识图谱,最后将电影知识图谱与用户电影交互矩阵融合构成最终知识图谱
Figure BDA0002976292270000081
其中
Figure BDA0002976292270000082
为实体间关系集合,ε=U∪I∪K为所有实体集合,U为用户实体,相当于图3中的用户,I为商品实体,相当于图3中的电影,K为除用户实体以及商品实体之外的额外实体集合,相当于图3中的其他实体,在图3的实施例中,其他实体可以是导演、主演、编剧等实体,图3中的电影相当于商品实体,m为所有用户数,n为所有电影数,以图3为例,给出四名用户与五部电影的关系,其中第一位用户与3部电影存在反馈关系,在这三部电影中有两部电影的导演是对象A且主演是对象B,另外一部电影的其中一个主演也是对象B。
构建一种融合商品功能互补性的成对排序个性化推荐模块的过程包括:
用户偏序部分以及功能互补性偏序部分:用户偏序部分,固定抽样模块参数,将用户u以及已经被其购买过的商品i组成的二元对(u,i)作为抽样模块的输入,输出对推荐模块而言高质量的负样本商品j,形成用户偏序训练数据(u,i,j)∈DS,DS为用户偏序部分训练集,所述高质量负样本商品j表征的是,与正样本商品i非常相似,且用户u不喜欢的商品,其可以为推荐模块提供较大的梯度,显著改善推荐模块参数;
如图4所示,功能互补性偏序部分,对于每件商品k,通过功能互补矩阵H=[hkv]n×n,构建功能互补性偏序矩阵Ck=[cvw](n-1)×(n-1),其中cvw=1表明对于商品k而言,商品v比商品w具有更好的功能互补性,cvw=0表明对于商品k而言,商品w比商品v具有更好的功能互补性,其他情况为无效数据,形成功能互补性偏序训练数据(k,v,w)∈ZS,ZS为功能互补性偏序部分训练集;
最后将用户偏序数据以及商品功能互补性偏序数据两部分一起输入训练推荐模块。
计算物品互补性时,输入是三元组(k,v,w),该三元组表示对k来说,v对k的互补性比w对k的互补性强。通过与k一起被购买的信息可以找到v,那没有与k一起被购买的就物品就是w,对每对一起被购买的k、v,都由很多w,本发明通过将矩阵分解的目的是让这种关系更明确。
在本实施例中,负样本的抽样过程包括:
将负样本的抽样过程建模为马尔科夫决策过程,定义为
Figure BDA0002976292270000091
其中
Figure BDA0002976292270000092
为在探索知识图谱过程中的状态集合,
Figure BDA0002976292270000093
为探索知识图谱过程中的动作集合,
Figure BDA0002976292270000094
为状态转移概率矩阵,
Figure BDA0002976292270000095
为奖励函数;
状态St定义为对于给定用户u,在探索知识图谱的第t步时,所访问到的知识图谱商品实体et时的状态,表示为二元组(u,et);
动作at定义为在当前状态St到达下一个状态St+1时的单位路径选择操作,且at不选择已探索路径;
转移概率表示在当前状态St下采取动作at能到达下一个状态St+1的概率,设置为1;给定状态St时的奖励函数定义为下式:
Figure BDA0002976292270000096
其中,
Figure BDA0002976292270000101
为用户u与商品et的特征向量的内积,
Figure BDA0002976292270000102
为商品i与商品et的特征向量的内积;
最优策略的价值函数vπ(s)定义为策略π的累计折损奖励的期望,满足下式:
Figure BDA0002976292270000103
其中,γ为奖励衰减因子,通过最大化价值函数vπ(s)可以学习到最优策略π。
本发明中的负样本是指在,与用户青睐的商品十分类似但是用户没有选择的一类商品,负样本商品的生成过程中,包括以下步骤:
使用GraphSage网络学习知识图谱中每个节点的向量表示,为下游探索任务做准备,其节点更新公式为:
Figure BDA0002976292270000104
其中,
Figure BDA0002976292270000105
为知识图谱中当前实体节点第l层的向量表示,dl为当前实体节点向量表示的维度。
Figure BDA0002976292270000106
为模型提取邻居实体节点有用信息的权重参数,||为向量拼接符,ρ为非线性激活函数LeakyReLU,
Figure BDA0002976292270000107
为当前实体节点的邻接点所传播的信息;
针对流行节点的邻接点过多,遍历所有邻接点会使模型计算开销过大的问题,从当前节点e的邻接点集
Figure BDA0002976292270000108
中随机选取包含n1个实体节点的子集
Figure BDA0002976292270000109
然后计算邻接点子集
Figure BDA00029762922700001010
中各节点与当前节点e的相似性分数,计算方式如下:
Figure BDA00029762922700001011
其中,
Figure BDA00029762922700001013
为当前节点的向量表示与其邻接点向量表示的内积;对相似性评分进行排名,并选取评分由高到低排名前n2个邻接实体节点作为最终的邻接实体节点集合
Figure BDA00029762922700001012
如图5所示,知识感知负抽样探索过程是训练抽样策略时,发现高质量负样本的过程,从正样本出发,一步一步的向外部探索,直到获得负样本。本实施例中,从图中与用户u1交互的商品i3作为初始状态出发,一次探索动作采取的单位路径包含知识图谱中的两跳,所以其计算公式包含两个部分为:
Figure BDA0002976292270000116
其中
Figure BDA0002976292270000118
表示商品实体节点i1为负样本的概率,概率
Figure BDA0002976292270000117
表征额外实体e2∈K对用户决策的重要性,
Figure BDA0002976292270000119
表示与实体e2相连的商品实体节点i1为负样本的概率,将概率最高的商品实体节点作为高质量负样本的输出。
最后推荐模块部分损失函数为:
Figure BDA0002976292270000111
其中,
Figure BDA0002976292270000112
以及β为模型超参数,ΘR为模型求解的所有参数,
Figure BDA0002976292270000113
为商品k与商品v的互补性评分,
Figure BDA0002976292270000114
为用户u对商品i的偏好评分。抽样模块部分损失函数为:
Figure BDA0002976292270000115
T为模型超参数,表示探索单位路径的长度,ΘS为抽样模块参数。
本发明还提出一种知识图谱辅助的成对排序个性化电商推荐系统,包括原始数据获取模块、个性化推荐模块、负样本抽取模块以及优化模块,所述负样本抽取模块包括图表示学习单元、邻居节点选择模块以及图注意模块,其中:
数据获取模块,用于获取原始数据,并利用处理后的原始数据构建知识图谱;原始数据包括电商平台用户与商品的历史反馈数据、丰富的商品元数据,所述知识图谱包括用户与商品的历史反馈信息、商品的属性信息;
个性化推荐模块,用于以输入优化单元的数据作为输入,为目标用户提供推荐的商品列表;
图表示学习单元,用于根据输入的数据学习得到知识图谱中所有节点的向量表示;
邻居节点选择模块,用于根据图表示学习单元得到实体的向量表示,从当前实体节点的邻居节点中随机选择n1个实体节点,计算n1个实体节点与当前实体节点的相似性分数,并选择其中n2个分数最高的作为当前节点的邻居节点集合;
图注意模块,用于计算当前节点的邻居节点集合中的节点为当前节点的负样本的概率,并将集合中概率最高的节点作为负样本;
优化模块,用于根据负样本抽取模块获取的负样本,构建输入数据,即将偏序关系数据(u,i,j)以及功能互补关系数据(k,v,w)作为个性化推荐模块输入,其中u为给定用户,i为用户u已经购买过的商品,j为抽样模块采样的高质量负样本商品,v为与商品k一起被购买过的商品,w为随机抽取的未与商品k一起被购买过的商品。
本发明推荐系统中通过个性化推荐模块与负样本抽取模块交替进行训练,优化推荐系统,并在优化完成后,输入目标用户,为目标用户生成推荐列表。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种知识图谱辅助的成对排序个性化电商推荐方法,其特征在于,包括以下步骤:
S1:获取原始数据,对原始数据进行预处理,并利用处理后的原始数据构建知识图谱,具体包括以下步骤:
对用户以及商品数据进行清洗,删除无效数据和异常数据,得到所有用户集U以及商品集I;
通过用户对商品的购买信息构建用户商品交互矩阵R=[rui]m×n,其中rui=1表明用户u购买过商品i,反之rui=0表明用户u未购买过商品i;
商品被一起购买的数据构建商品与商品的功能互补矩阵H=[hkv]n×n,其中hkv=1表明商品v与商品k被一起购买过,反之hkv=0表明商品v与商品k未被一起购买过;
利用商品元数据通过知识图谱抽取出商品知识,并通过与已构建的公开知识库,自底向上地构建商品知识图谱,将商品知识图谱与用户商品交互矩阵融合构成最终知识图谱
Figure FDA0003595772320000011
其中
Figure FDA0003595772320000012
为实体间关系集合,ε=U∪I∪K为所有实体集合,K为除用户实体以及商品实体之外的额外实体集合,m为所有用户数,n为所有商品数;
S2:从获取的数据中抽取目标用户的负样本,具体包括以下步骤:
将负样本的抽样过程建模为马尔科夫决策过程,定义为
Figure FDA0003595772320000013
目标是学习到一种智能的负采样策略;
状态St定义为对于给定用户u,在探索知识图谱的第t步时,所访问到的知识图谱商品实体et时的状态,表示为二元组(u,et);
动作at定义为在当前状态St到达下一个状态St+1时的单位路径选择操作,且at不选择已探索路径,其中探索的单位路径定义为p0=i→e′→j,i与j是知识图谱中的商品实体,e′是同时与i,j相连的除用户实体与商品实体之外的额外实体;
转移概率表示在当前状态St下采取动作at能到达下一个状态St+1的概率,设置为1;
给定状态St时的奖励函数
Figure FDA0003595772320000021
定义为:
Figure FDA0003595772320000022
策略的价值函数vπ(s)为策略π的累计折损奖励的期望,通过最大化价值函数vπ(s)学习到最优策略π;
其中,
Figure FDA0003595772320000023
为在探索知识图谱过程中的状态集合,
Figure FDA0003595772320000024
为探索知识图谱过程中的动作集合,
Figure FDA0003595772320000025
为状态转移概率矩阵,
Figure FDA0003595772320000026
为奖励函数;
Figure FDA0003595772320000027
为用户u与商品et的特征向量的内积,
Figure FDA0003595772320000028
为商品i与商品et的特征向量的内积;
在评估当前状态St下访问到的商品实体et为高质量负样本的概率时,一次探索动作采取的单位路径包括知识图谱中的两跳,当前状态St下访问到的商品实体et为高质量负样本的概率表示为:
Figure FDA00035957723200000212
其中,
Figure FDA00035957723200000213
表示商品实体节点et为负样本的概率,概率
Figure FDA00035957723200000214
表征额外实体et-1′∈K对用户决策的重要性,
Figure FDA00035957723200000215
表示与实体et-1′相连的商品实体节点et为负样本的概率;
负样本抽样模型的损失函数表示为:
Figure FDA0003595772320000029
其中,T为模型超参数,表示探索单位路径的长度;ΘS为负样本抽样模块参数向量;
Figure FDA00035957723200000210
为给定参数ΘS下实体et+1为负样本的概率;O+为用户的正反馈集合;γ为奖励衰减因子;
Figure FDA00035957723200000211
为奖励函数;
通过负样本构建输入数据,具体包括:
将用户u以及其已经被其购买过的商品i、其负样本商品j,形成用户偏序数据(u,i,j);
对于每件商品k,通过功能互补矩阵H=[hkv]n×n,构建功能互补性偏序矩阵Ck=[cvw](n-1)×(n-1),其中cvw=1表明对于商品k而言,商品v比商品w具有更好的功能互补性,cvw=0表明对于商品k而言,商品w比商品v具有更好的功能互补性,其他情况为无效数据,形成功能互补性偏序数据(k,v,w);
将用户偏序数据以及商品功能互补性偏序数据作为数据对作为个性化推荐模块的输入;
S3:构建个性化推荐模型,将通过负样本构建的输入数据作为输入,进行训练;个性化推荐模型的损失函数表示为:
Figure FDA0003595772320000031
其中,DS为用户偏序部分训练集;ZS为功能互补性偏序部分训练集;
Figure FDA0003595772320000032
和β为模型超参数,ΘR为模型求解的所有参数;
Figure FDA0003595772320000033
为商品k与商品v的互补性评分;
Figure FDA0003595772320000034
为商品k与商品w的互补性评分,
Figure FDA0003595772320000035
为用户u对商品i的偏好评分,
Figure FDA0003595772320000036
为用户u对商品j的偏好评分,σ为sigmoid函数;
S4、将目标用户的实时数据经过预处理并提取负样本,构成输入数据输入个性化推荐模型,个性化推荐模型输出针对目标用户的商品推荐列表。
2.根据权利要求1所述的一种知识图谱辅助的成对排序个性化电商推荐方法,其特征在于,最优策略的价值函数vπ(s)表示为:
Figure FDA0003595772320000037
其中,γ为奖励衰减因子,T为探索的步数。
3.根据权利要求1所述的一种知识图谱辅助的成对排序个性化电商推荐方法,其特征在于,在抽取负样本时,为减少模型复杂度,对当前节点的邻接点集
Figure FDA0003595772320000038
中随机选取包含n1个实体节点的子集
Figure FDA0003595772320000039
计算邻接点子集
Figure FDA00035957723200000310
中各节点与当前节点e的相似性分数,对相似性评分进行排名,并选取评分由高到低排名前n2个邻接实体节点作为当前节点的邻居节点,再计算当前状态St下,访问到邻居节点为负样本的概率。
4.一种知识图谱辅助的成对排序个性化电商推荐系统,其特征在于,该系统用于实现权利要求1所述的一种知识图谱辅助的成对排序个性化电商推荐方法,包括原始数据获取模块、个性化推荐模块、负样本抽取模块以及优化模块,所述负样本抽取模块包括图表示学习单元、邻居节点选择模块以及图注意模块,其中:
数据获取模块,用于获取原始数据,并利用处理后的原始数据构建知识图谱;原始数据包括电商平台用户与商品的历史反馈数据、丰富的商品元数据,所述知识图谱包括用户与商品的历史反馈信息、商品的属性信息;
个性化推荐模块,用于以输入优化单元的数据作为输入,为目标用户提供推荐的商品列表;
图表示学习单元,用于根据输入的数据学习得到知识图谱中所有节点的向量表示;
邻居节点选择模块,用于根据图表示学习单元得到实体的向量表示,从当前实体节点的邻居节点中随机选择n1个实体节点,计算n1个实体节点与当前实体节点的相似性分数,并选择其中n2个分数最高的作为当前节点的邻居节点集合,降低模型复杂度;
图注意模块,用于计算当前节点的邻居节点集合中的节点为当前节点的负样本的概率,并将集合中概率最高的节点作为负样本;
优化模块,用于根据负样本抽取模块获取的负样本,构建输入数据,即将偏序关系数据(u,i,j)以及功能互补关系数据(k,v,w)作为个性化推荐模块输入,其中u为给定用户,i为用户u已经购买过的商品,j为抽样模块采样的高质量负样本商品,v为与商品k一起被购买过的商品,w为随机抽取的未与商品k一起被购买过的商品。
CN202110278391.3A 2021-03-15 2021-03-15 一种知识图谱辅助的成对排序个性化电商推荐方法及系统 Active CN112950324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110278391.3A CN112950324B (zh) 2021-03-15 2021-03-15 一种知识图谱辅助的成对排序个性化电商推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110278391.3A CN112950324B (zh) 2021-03-15 2021-03-15 一种知识图谱辅助的成对排序个性化电商推荐方法及系统

Publications (2)

Publication Number Publication Date
CN112950324A CN112950324A (zh) 2021-06-11
CN112950324B true CN112950324B (zh) 2022-06-03

Family

ID=76229977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110278391.3A Active CN112950324B (zh) 2021-03-15 2021-03-15 一种知识图谱辅助的成对排序个性化电商推荐方法及系统

Country Status (1)

Country Link
CN (1) CN112950324B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409121B (zh) * 2021-06-29 2022-02-15 南京财经大学 一种基于异构图表达学习的跨境电商推荐方法
CN113360772B (zh) * 2021-07-02 2022-09-09 中国科学技术大学 一种可解释性推荐模型训练方法与装置
CN113342995B (zh) * 2021-07-05 2022-12-02 成都信息工程大学 一种基于路径语义和特征提取的负样本提取方法
CN113297338B (zh) * 2021-07-27 2022-03-29 平安科技(深圳)有限公司 产品推荐路径生成方法、装置、设备及存储介质
CN113780097B (zh) * 2021-08-17 2023-12-01 北京数慧时空信息技术有限公司 基于知识图谱和深度学习的耕地提取方法
CN113743991A (zh) * 2021-09-03 2021-12-03 上海幻电信息科技有限公司 生命周期价值预测方法及装置
CN113836417A (zh) * 2021-09-26 2021-12-24 北京爱奇艺科技有限公司 一种负样本的确定方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008334A (zh) * 2019-12-04 2020-04-14 华中科技大学 基于局部成对排序和全局决策融合的Top-K推荐方法和系统
CN111061856A (zh) * 2019-06-06 2020-04-24 北京理工大学 一种基于知识感知的新闻推荐方法
US10745274B1 (en) * 2016-08-01 2020-08-18 Omeros Corporation Nucleic acids encoding antibodies specifically binding to MASP-3
CN111859142A (zh) * 2020-07-28 2020-10-30 山东大学 一种基于互联互通家居平台的跨设备迁移推荐系统及其工作方法
CN112232925A (zh) * 2020-11-02 2021-01-15 哈尔滨工程大学 一种融合知识图谱对商品进行个性化推荐的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150166676A1 (en) * 2011-04-08 2015-06-18 Omeros Corporation Methods for Treating Conditions Associated with MASP-2 Dependent Complement Activation
US10664757B2 (en) * 2015-09-16 2020-05-26 International Business Machines Corporation Cognitive operations based on empirically constructed knowledge graphs
CN109189937B (zh) * 2018-08-22 2021-02-09 创新先进技术有限公司 一种特征关系推荐方法及装置、一种计算设备及存储介质
US11397897B2 (en) * 2019-09-10 2022-07-26 Abbas Ameri Knowledge currency

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10745274B1 (en) * 2016-08-01 2020-08-18 Omeros Corporation Nucleic acids encoding antibodies specifically binding to MASP-3
CN111061856A (zh) * 2019-06-06 2020-04-24 北京理工大学 一种基于知识感知的新闻推荐方法
CN111008334A (zh) * 2019-12-04 2020-04-14 华中科技大学 基于局部成对排序和全局决策融合的Top-K推荐方法和系统
CN111859142A (zh) * 2020-07-28 2020-10-30 山东大学 一种基于互联互通家居平台的跨设备迁移推荐系统及其工作方法
CN112232925A (zh) * 2020-11-02 2021-01-15 哈尔滨工程大学 一种融合知识图谱对商品进行个性化推荐的方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Reinforced Negative Sampling over Knowledge Graph for Recommendation;Xiang Wang 等;《WWW"20》;20200424;第1-11页 *
基于Pairwise排序学习的因子分解推荐算法;周俊宇等;《计算机应用与软件》;20160615(第06期);第255-259页 *
基于图表示学习的会话感知推荐模型;曾义夫等;《计算机研究与发展》;20200315(第03期);第590-603页 *
基于知识图谱嵌入与多神经网络的序列推荐算法;沈冬东等;《计算机工程与科学》;20200915(第09期);第1661-1669页 *
基于联合物品搭配度的推荐算法框架;姚静天等;《上海理工大学学报》;20170215(第01期);第42-50页 *
基于重排序的迭代式实体对齐;曾维新等;《计算机研究与发展》;20200707(第07期);第1460-1471页 *

Also Published As

Publication number Publication date
CN112950324A (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN112950324B (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN111523047B (zh) 基于图神经网络的多关系协同过滤算法
CN112232925A (zh) 一种融合知识图谱对商品进行个性化推荐的方法
CN109190030B (zh) 融合node2vec和深度神经网络的隐式反馈推荐方法
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
CN113256367B (zh) 用户行为历史数据的商品推荐方法、系统、设备及介质
CN112231583B (zh) 基于动态兴趣组标识和生成对抗网络的电商推荐方法
CN114036406A (zh) 一种基于图对比学习和社交网络增强的推荐方法及系统
CN112115377A (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN112364976A (zh) 基于会话推荐系统的用户偏好预测方法
CN113918832B (zh) 基于社交关系的图卷积协同过滤推荐系统
CN113918833B (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN111949885B (zh) 一种面向旅游景点的个性化推荐方法
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN113505294A (zh) 一种融合元路径的异质网络表示推荐算法
CN112948625A (zh) 一种基于属性异质信息网络嵌入的电影推荐方法
CN114997476A (zh) 一种融合商品关联关系的商品预测方法
Zhang et al. Knowledge graph driven recommendation model of graph neural network
CN113590976A (zh) 一种空间自适应图卷积网络的推荐方法
CN116385077A (zh) 一种基于行为感知融合图卷积网络的多行为推荐系统
Chen et al. Poverty/investment slow distribution effect analysis based on Hopfield neural network
CN116452293A (zh) 一种融合物品受众特征的深度学习推荐方法及系统
CN113744023B (zh) 一种基于图卷积网络的双通道协同过滤推荐方法
CN114519600A (zh) 一种融合相邻节点方差的图神经网络ctr预估算法
CN112686736B (zh) 一种系统推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230815

Address after: Room 202, 2nd Floor, Building 4, Kengkou Electronic Digital Base, No. 9 Huaxi Road, Liwan District, Guangzhou City, Guangdong Province, 510145

Patentee after: Guangzhou Mofei Technology Co.,Ltd.

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

TR01 Transfer of patent right