CN114240539B - 一种基于Tucker分解和知识图谱的商品推荐方法 - Google Patents

一种基于Tucker分解和知识图谱的商品推荐方法 Download PDF

Info

Publication number
CN114240539B
CN114240539B CN202111419472.7A CN202111419472A CN114240539B CN 114240539 B CN114240539 B CN 114240539B CN 202111419472 A CN202111419472 A CN 202111419472A CN 114240539 B CN114240539 B CN 114240539B
Authority
CN
China
Prior art keywords
commodity
recommendation
knowledge
database
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111419472.7A
Other languages
English (en)
Other versions
CN114240539A (zh
Inventor
曹扬
杨波
李少松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202111419472.7A priority Critical patent/CN114240539B/zh
Publication of CN114240539A publication Critical patent/CN114240539A/zh
Application granted granted Critical
Publication of CN114240539B publication Critical patent/CN114240539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries

Abstract

本发明公开一种基于Tucker分解和知识图谱的商品推荐方法,属于信息推荐技术领域,先构建推荐学习数据库、知识图谱数据库和联系数据表;初始化得到各用户、商品、实体和关系的特征向量;然后分别计算获得商品特征向量和偏好特征向量,结合用户特征向量采用Tucker分解的逆运算学习推荐系统信息,提取三元组采用Tucker分解的逆运算学习知识图谱信息,分别得到对应的得分函数;以推荐学习数据库和知识图谱数据库为训练集进行训练,使用训练后的模型对用户进行top‑N的商品推荐。本发明将知识图谱补全任务与推荐系统任务进行联合学习,并利用Tucker分解的逆运算计算推荐系统得分,从而提高了推荐结果。

Description

一种基于Tucker分解和知识图谱的商品推荐方法
技术领域
本发明属于信息推荐技术领域,具体涉及一种基于Tucker分解和知识图谱的商品推荐方法。
背景技术
目前,将知识图谱引入推荐系统逐渐成为一种趋势。知识图谱中丰富的实体信息和关系信息可以帮助推荐系统更深层次地理解用户与商品之间的关系,从而提供更精确的推荐结果。
知识图谱本质上是一个三元组的集合,其中三元组的形式为<头实体,关系,尾实体>。每个三元组代表着现实生活中的一个事实,比如三元组<Joss Whedon,director of,The Avengers>代表“乔斯·韦登是复仇者联盟的导演”这项事实。知识图谱补全任务是知识图谱领域的一项重要任务,它是对知识图谱中有缺失的三元组进行补全。现存的一些将知识图谱补全任务和推荐系统任务相结合的模型存在一些问题,主要为采用的知识图谱补全模型过于简单,通过该方法学习到的知识图谱中实体和关系的表示,会缺失一些信息,而且在推荐模块中往往使用向量之间的内积来计算商品对于用户的推荐得分,这种简单的方法无法充分使推荐系统学习到用户和商品的表示。
发明内容
针对上述现有技术中存在的技术问题,本发明提出了一种基于Tucker分解和知识图谱的商品推荐方法,将知识图谱补全任务与推荐系统任务进行联合学习,并利用Tucker分解(高阶奇异值分解)的逆运算获得推荐得分,从而提高了推荐结果。
本发明具体技术方案如下:
一种基于Tucker分解和知识图谱的商品推荐方法,其特征在于,包括以下步骤:
步骤1:根据以往用户与商品的交互记录构建推荐学习数据库;构建由多个以<头实体,关系,尾实体>形式存在的三元组构成并包含推荐学习数据库中所有商品的信息的知识图谱数据库,其中头实体和尾实体均属于实体;根据推荐学习数据库的商品和商品唯一对应的实体构建联系数据表;
步骤2:基于推荐学习数据库构造并初始化维度为d1的用户特征向量u,初始化各商品的原有特征向量i′及知识图谱数据库中对应各实体的特征向量e和各关系的特征向量r;
步骤3:基于联系数据表提取与原有特征向量i'唯一对应的特征向量e,记作对应特征向量e';基于原有特征向量i'和对应特征向量e'构建对应商品特征表示的函数,获得初始化的维度为d3的商品特征向量i,具体为:
Figure BDA0003376706130000021
alphar=softmax(m1) (2)
Figure BDA0003376706130000022
Figure BDA0003376706130000023
其中,alphar、m1和m2均为无具体含义的计算中间变量;softmax(·)代表归一化指数函数;σ代表激活函数;||代表向量之间的连接操作;
Figure BDA0003376706130000024
Figure BDA0003376706130000025
为权重矩阵;
Figure BDA0003376706130000026
Figure BDA0003376706130000027
为偏移向量;
步骤4:基于知识图谱数据库中所有的关系,构建偏好特征表示的函数,获得维度为d2的偏好特征向量p,具体为:
p=alphakgR (5)
Figure BDA0003376706130000028
其中,alphakg为无具体含义的计算中间变量;R为知识图谱数据库中所有关系的特征向量r的集合;Q为权重向量;
Figure BDA0003376706130000029
Figure BDA00033767061300000210
为权重矩阵;Bkg为偏移向量;
步骤5:根据用户特征向量u、商品特征向量i和偏好特征向量p,采用Tucker分解的逆运算学习推荐系统的信息,得到得分函数φr(u,p,i):
φr(u,p,i)=Wr×123i (7)
其中,Wr为推荐系统的维度为d1×d2×d3的核心张量;×n,n=1,2,3为张量之间的第n模式积;
步骤6:基于知识图谱数据库提取所有包含对应特征向量e'的三元组,记作对应三元组,之后根据对应三元组,采用Tucker分解的逆运算学习知识图谱的信息,得到得分函数φkg(eh,r,et):
φkg(eh,r,et)=σ(Wkg×1eh×23et) (8)
其中,eh和et分别代表对应三元组中维度为de的头实体的特征向量和尾实体的特征向量,并且eh和et中至少一个为特征向量e';r代表对应三元组中维度为dr的关系的特征向量;Wkg为知识图谱的维度为de×dr×de的核心张量;
步骤7:基于推荐系统的得分函数φr(u,p,i)和知识图谱的得分函数φkg(eh,r,et),分别以推荐学习数据库和知识图谱数据库为训练集进行训练,进而使用训练后的模型对用户进行top-N的商品推荐。
进一步地,步骤3中公式(3)和(4)的激活函数σ为tanh函数。
进一步地,步骤4中公式(6)和步骤6中公式(8)的激活函数σ为sigmoid函数。
本发明的有益效果为:
本发明提供了一种基于Tucker分解和知识图谱的商品推荐方法,将知识图谱补全任务与推荐系统任务进行联合学习,并利用Tucker分解的逆运算计算推荐系统得分,从而提高了推荐结果;特别地,将知识图谱中的关系信息以“偏好”的概念融入至推荐系统的得分计算之中,不仅对用户的行为模式有了更深刻的挖掘,而且还更加充分地利用了知识图谱中所蕴含的信息,在提高推荐精准度的同时,为推荐结果提供了可解释性。
附图说明
图1为本发明提出的基于Tucker分解和知识图谱的商品推荐方法所采用的模型结构。
具体实施方式
为使本发明的目的、技术方案和优点更加清晰,结合以下具体实施例,并参照附图,对本发明做进一步的说明。
下述非限制性实施例可以使本领域的普通技术人员更全面的理解本发明,但不以任何方式限制本发明。
实施例1
本实施例提出了一种基于Tucker分解和知识图谱的商品推荐方法,基于如图1所示的由推荐系统模块和知识图谱模块构成的模型实现,所述推荐系统模块包括商品特征向量生成模块和偏好特征向量生成模块。
所述商品推荐方法包括以下步骤:
步骤1:根据以往用户与商品的交互记录构建推荐学习数据库,其中交互的方式可以为某一用户点击过某一商品;构建由多个以<头实体,关系,尾实体>形式存在的三元组构成并包含推荐学习数据库中所有商品的信息的知识图谱数据库,其中头实体和尾实体均属于实体;由于知识图谱数据库中与商品唯一对应的实体的现实含义就是商品本身,因此依靠这种对应关系构建商品与实体的联系数据表,旨在从知识图谱数据库中找到与商品唯一对应实体的编号,即根据推荐学习数据库的商品和商品唯一对应的实体构建联系数据表;
步骤2:基于推荐学习数据库构造并初始化维度为d1的用户特征向量u,初始化各商品的原有特征向量i'、知识图谱数据库中对应各实体的特征向量e和各关系的特征向量r;
步骤3:基于联系数据表提取与原有特征向量i'唯一对应的特征向量e,记作对应特征向量e';在推荐系统模块的商品特征向量生成模块中,通过注意力制学习商品特征向量i,即基于原有特征向量i'和对应特征向量e'构建对应商品特征表示的函数,获得初始化的维度为d3的商品特征向量i,具体为:
Figure BDA0003376706130000041
alphar=softmax(m1) (2)
Figure BDA0003376706130000042
Figure BDA0003376706130000043
其中,alphar、m1和m2均为无具体含义的计算中间变量;softmax(·)代表归一化指数函数;σ代表激活函数,本实施例采用tanh函数;||代表向量之间的连接操作;
Figure BDA0003376706130000044
Figure BDA0003376706130000045
为权重矩阵;
Figure BDA0003376706130000046
Figure BDA0003376706130000047
为偏移向量;
步骤4:在推荐系统模块的偏好特征向量生成模块中,通过注意力制学习偏好特征向量p,即基于知识图谱数据库中所有的关系构建偏好特征表示的函数,获得维度为d2的偏好特征向量p,具体为:
p=alphakgR (5)
Figure BDA0003376706130000051
其中,alphakg为无具体含义的计算中间变量;R为知识图谱数据库中所有关系的特征向量r的集合;Q为权重向量;
Figure BDA0003376706130000052
Figure BDA0003376706130000053
为权重矩阵;Bkg为偏移向量;本实施例采用的激活函数σ为sigmoid函数;
步骤5:对于推荐系统模块,根据用户特征向量u、商品特征向量i和偏好特征向量p,采用Tucker分解的逆运算学习推荐系统模块的信息,得到得分函数φr(u,p,i):
φr(u,p,i)=Wr×123i (7)
其中,Wr为维度为d1×d2×d3的推荐系统模块核心张量,为包含了推荐系统模块中所有特定关系信息的共享池,共享池中的特定关系信息会根据不同关系嵌入向量中的参数进行线性组合,从而得出预测的得分;×n,n=1,2,3为张量之间的第n模式积;
步骤6:基于知识图谱数据库提取所有包含对应特征向量e'的三元组,记作对应三元组,根据对应三元组采用Tucker分解的逆运算学习知识图谱模块的信息,得到得分函数φkg(eh,r,et):
φkg(eh,r,et)=σ(Wkg×1eh×23et) (8)
其中,eh和et分别代表对应三元组中维度为de的头实体的特征向量和尾实体的特征向量,并且eh和et中至少一个为特征向量e';r代表对应三元组中维度为dr的关系的特征向量;Wkg为维度为de×dr×de的知识图谱模块核心张量;本实施例采用的激活函数σ为sigmoid函数;
步骤7:基于推荐系统模块的得分函数φr(u,p,i)和知识图谱模块的得分函数φkg(eh,r,et),分别以推荐学习数据库和知识图谱为训练集,对由推荐系统模块和知识图谱模块构成的模型进行训练,进而使用训练后的模型对用户进行top-N的商品推荐,具体过程为:
对于推荐系统模块,采用负采用技术计算推荐系统模块损失函数,对推荐学习数据库中每一个由用户u和商品i构成的正样本(u,i),在每轮训练中随机获得一个包含用户u的负样本(u,i*),经步骤3~5的方法分别获得正样本(u,i)的得分函数φr(u,p,i)和负样本(u,i*)的得分函数φr(u,p*,i*),进而推荐系统模块损失函数
Figure BDA0003376706130000061
(采用BPR lossfunction(贝叶斯个性化排序损失函数))为:
Figure BDA0003376706130000062
其中,
Figure BDA0003376706130000063
为推荐学习数据库的正样本集合;
Figure BDA0003376706130000064
为对应的负样本集合;本实施例采用的激活函数σ为sigmoid函数;
对于知识图谱模块,同样采用负采用技术计算知识图谱模块损失函数,对知识图谱数据库中每一个包含头实体的特征向量eh和关系的特征向量r的三元组为正样本<eh,r,et>,采用的负样本<eh,r,et*>包含头实体的特征向量eh和关系的特征向量r,并以除正样本<eh,r,et>中尾实体以外的其他实体作为尾实体,经步骤6的方法分别获得正样本<eh,r,et>的得分函数φkg(eh,r,et)和负样本<eh,r,et*>的得分函数
Figure BDA0003376706130000065
进而知识图谱模块损失函数
Figure BDA0003376706130000066
(采用BCE loss function(二分类交叉熵损失函数))为:
Figure BDA0003376706130000067
其中,ne为知识图谱数据库中的实体总数;
Figure BDA0003376706130000068
为知识图谱数据库的正样本集合;
Figure BDA0003376706130000069
为对应的负样本集合;Ykg为标签的集合,若为正样本,y的值为1,否则为0;
对由推荐系统模块和知识图谱模块构成的模型进行训练,并使用pytorch框架中的Adam优化器来优化目标函数
Figure BDA00033767061300000610
Figure BDA00033767061300000611
其中,λ为超参数,以平衡推荐系统模块和知识图谱模块两个任务;
最后基于目标函数
Figure BDA00033767061300000612
使用训练后的模型对用户进行top-N推荐,完成商品推荐。

Claims (3)

1.一种基于Tucker分解和知识图谱的商品推荐方法,其特征在于,包括以下步骤:
步骤1:根据以往用户与商品的交互记录构建推荐学习数据库;构建由多个以<头实体,关系,尾实体>形式存在的三元组构成并包含推荐学习数据库中所有商品的信息的知识图谱数据库,其中头实体和尾实体均属于实体;根据推荐学习数据库的商品和商品唯一对应的实体构建联系数据表;
步骤2:基于推荐学习数据库构造并初始化维度为d1的用户特征向量u,初始化各商品的原有特征向量i′及知识图谱数据库中对应各实体的特征向量e和各关系的特征向量r;
步骤3:基于联系数据表提取与原有特征向量i'唯一对应的特征向量e,记作对应特征向量e';基于原有特征向量i'和对应特征向量e'构建对应商品特征表示的函数,获得初始化的维度为d3的商品特征向量i,具体为:
Figure FDA0003376706120000011
alphar=softmax(m1) (2)
Figure FDA0003376706120000012
Figure FDA0003376706120000013
其中,alphar、m1和m2均为无具体含义的计算中间变量;softmax(·)代表归一化指数函数;σ代表激活函数;||代表向量之间的连接操作;
Figure FDA0003376706120000014
Figure FDA0003376706120000015
为权重矩阵;
Figure FDA0003376706120000016
Figure FDA0003376706120000017
为偏移向量;
步骤4:基于知识图谱数据库中所有的关系,构建偏好特征表示的函数,获得维度为d2的偏好特征向量p,具体为:
p=alphakgR (5)
Figure FDA0003376706120000018
其中,alphakg为无具体含义的计算中间变量;R为知识图谱数据库中所有关系的特征向量r的集合;Q为权重向量;
Figure FDA0003376706120000021
Figure FDA0003376706120000022
为权重矩阵;Bkg为偏移向量;
步骤5:根据用户特征向量u、商品特征向量i和偏好特征向量p,采用Tucker分解的逆运算学习推荐系统的信息,得到得分函数φr(u,p,i):
φr(u,p,i)=Wr×123i (7)
其中,Wr为推荐系统的维度为d1×d2×d3的核心张量;×n,n=1,2,3为张量之间的第n模式积;
步骤6:基于知识图谱数据库提取所有包含对应特征向量e'的三元组,记作对应三元组,之后根据对应三元组,采用Tucker分解的逆运算学习知识图谱的信息,得到得分函数φkg(eh,r,et):
φkg(eh,r,et)=σ(Wkg×1eh×23et) (8)
其中,eh和et分别代表对应三元组中维度为de的头实体的特征向量和尾实体的特征向量,并且eh和et中至少一个为特征向量e';r代表对应三元组中维度为dr的关系的特征向量;Wkg为知识图谱的维度为de×dr×de的核心张量;
步骤7:基于推荐系统的得分函数φr(u,p,i)和知识图谱的得分函数φkg(eh,r,et),分别以推荐学习数据库和知识图谱数据库为训练集进行训练,进而使用训练后的模型对用户进行top-N的商品推荐。
2.根据权利要求1所述基于Tucker分解和知识图谱的商品推荐方法,其特征在于,步骤3中公式(3)和(4)的激活函数σ为tanh函数。
3.根据权利要求1所述基于Tucker分解和知识图谱的商品推荐方法,其特征在于,步骤4中公式(6)和步骤6中公式(8)的激活函数σ为sigmoid函数。
CN202111419472.7A 2021-11-26 2021-11-26 一种基于Tucker分解和知识图谱的商品推荐方法 Active CN114240539B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111419472.7A CN114240539B (zh) 2021-11-26 2021-11-26 一种基于Tucker分解和知识图谱的商品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111419472.7A CN114240539B (zh) 2021-11-26 2021-11-26 一种基于Tucker分解和知识图谱的商品推荐方法

Publications (2)

Publication Number Publication Date
CN114240539A CN114240539A (zh) 2022-03-25
CN114240539B true CN114240539B (zh) 2022-08-02

Family

ID=80751267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111419472.7A Active CN114240539B (zh) 2021-11-26 2021-11-26 一种基于Tucker分解和知识图谱的商品推荐方法

Country Status (1)

Country Link
CN (1) CN114240539B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115439197A (zh) * 2022-11-09 2022-12-06 广州科拓科技有限公司 基于知识图谱深度学习的电子商务推荐方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507796A (zh) * 2020-04-07 2020-08-07 桂林电子科技大学 一种基于知识图谱的网上商城商品推荐方法
CN112232925A (zh) * 2020-11-02 2021-01-15 哈尔滨工程大学 一种融合知识图谱对商品进行个性化推荐的方法
CN112488791A (zh) * 2020-11-30 2021-03-12 中国传媒大学 一种基于知识图谱卷积算法的个性化推荐方法
CN113158033A (zh) * 2021-03-19 2021-07-23 浙江工业大学 一种基于知识图谱偏好传播的协同推荐模型构建方法
CN113342994A (zh) * 2021-07-05 2021-09-03 成都信息工程大学 一种基于无采样协作知识图网络的推荐系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11514333B2 (en) * 2018-04-30 2022-11-29 Meta Platforms, Inc. Combining machine-learning and social data to generate personalized recommendations
US20210365818A1 (en) * 2020-05-20 2021-11-25 Samsung Electronics Co., Ltd. System and method for explainable embedding-based recommendation system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507796A (zh) * 2020-04-07 2020-08-07 桂林电子科技大学 一种基于知识图谱的网上商城商品推荐方法
CN112232925A (zh) * 2020-11-02 2021-01-15 哈尔滨工程大学 一种融合知识图谱对商品进行个性化推荐的方法
CN112488791A (zh) * 2020-11-30 2021-03-12 中国传媒大学 一种基于知识图谱卷积算法的个性化推荐方法
CN113158033A (zh) * 2021-03-19 2021-07-23 浙江工业大学 一种基于知识图谱偏好传播的协同推荐模型构建方法
CN113342994A (zh) * 2021-07-05 2021-09-03 成都信息工程大学 一种基于无采样协作知识图网络的推荐系统

Also Published As

Publication number Publication date
CN114240539A (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN112232925A (zh) 一种融合知识图谱对商品进行个性化推荐的方法
CN109840595B (zh) 一种基于群体学习行为特征的知识追踪方法
CN112967112B (zh) 一种自注意力机制和图神经网络的电商推荐方法
CN109523021A (zh) 一种基于长短时记忆网络的动态网络结构预测方法
CN113065974B (zh) 一种基于动态网络表示学习的链路预测方法
CN111191099B (zh) 一种基于社交媒体的用户活动类型识别方法
CN114639483A (zh) 一种基于图神经网络的电子病历检索方法及装置
CN114201684A (zh) 一种基于知识图谱的自适应学习资源推荐方法及系统
CN114240539B (zh) 一种基于Tucker分解和知识图谱的商品推荐方法
Lu et al. CMKT: Concept map driven knowledge tracing
CN114385801A (zh) 一种基于分层细化lstm网络的知识追踪方法及系统
CN115840853A (zh) 一种基于知识图谱和图注意力网络的课程推荐系统
CN116431821A (zh) 基于常识感知的知识图谱补全方法及问答系统
CN113361928B (zh) 一种基于异构图注意力网络的众包任务推荐方法
CN115631008B (zh) 商品推荐方法、装置、设备及介质
CN115982373A (zh) 结合多级交互式对比学习的知识图谱推荐方法
CN115545833A (zh) 一种基于用户社交信息的推荐方法及系统
CN114911879A (zh) 一种基于图注意力网络的刑事案件知识图谱关系推理方法
CN115063251A (zh) 基于关系强度与反馈机制的社交传播动态网络表示方法
CN111400602A (zh) 一种基于个性化推荐的在线学习系统和方法
Wang et al. Gaskt: A graph-based attentive knowledge-search model for knowledge tracing
CN111581382B (zh) 问答社区中的热门问题的预测方法及系统
CN117350903A (zh) 一种面向认知诊断的多模态去偏方法
Tan et al. A Course Recommendation System Based on Collaborative Filtering Algorithm
CN117612615A (zh) 一种基于同分异构体Mixup增强的分子属性预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant