CN112149004B

CN112149004B - 一种基于协同知识图谱的个性化推荐方法

Info

Publication number: CN112149004B
Application number: CN202011187518.2A
Authority: CN
Inventors: 黄庆明; 李朝鹏; 许倩倩; 姜阳邦彦; 操晓春
Original assignee: Institute of Computing Technology of CAS
Current assignee: Institute of Computing Technology of CAS
Priority date: 2020-10-30
Filing date: 2020-10-30
Publication date: 2022-10-25
Anticipated expiration: 2040-10-30
Also published as: CN112149004A

Abstract

本发明提供一种基于知识图谱的个性化推荐方法，包括：S1、将用户集中的用户与物品集中的物品的历史交互数据和原有知识图谱结合到协同知识图谱中，在所述协同知识图谱中将用户与其交互物品在知识图谱中对应的实体使用有向边进行连接；S2、用四元数向量表示协同知识图谱中的每一个实体和关系；S3、采用注意力机制将实体的四元数嵌入沿着协同知识图谱的路径进行偏好传播与聚合；S4、基于完成偏好传播与聚合后的协同知识图谱，构建偏好分数预测函数计算每个用户与不同物品的偏好分数；S5、采用损失函数联合优化协同知识图谱的嵌入和偏好分数预测函数；S6、采用优化后的偏好分数预测函数预测用户对新物品的偏好分数，得到针对用户的新物品推荐列表。

Description

一种基于协同知识图谱的个性化推荐方法

技术领域

本发明涉及多媒体领域和自然语言处理领域，具体来说涉及知识图谱的个性化推荐领域，更具体地说，涉及一种基于协同知识图谱的个性化推荐方法。

背景技术

随着互联网的迅速发展，人们可获得的数据量呈指数级别增长，面对信息过载，用户很难从众多候选物品中挑选出自己真正感兴趣的物品。为了改善用户体验，给用户提供个性化的建议，推荐系统得到广泛应用。推荐系统中最为常用的算法是协同过滤算法，它根据历史的用户-物品交互信息计算用户相似度，从而进行推荐。这种算法通常是有效的，但是当历史用户-物品交互信息比较稀疏以及面对冷启动问题时，其性能大打折扣。为此，研究人员使用混合的推荐算法，将用户或物品的辅助信息引入协同过滤算法，作为对稀疏交互数据的补充，从而提高推荐算法的性能。

在多种多样的辅助信息中，知识图谱基于其易于获取、语义信息丰富、结构优良的有点，受到研究人员的广泛关注。将知识图谱引入推荐系统，利用其丰富的语义信息对用户-物品交互信息进行补充，有利于提高推荐结果的准确性；此外，知识图谱的连接结构，也有助于推荐结果的多样性和可解释性。现有的基于知识图谱的推荐算法通常可以分为基于嵌入的方法、基于路径的方法和混合的方法，但是这两种方法均存在一些缺陷，下面分别进行说明：

基于嵌入的方法使用知识图谱得到的物品嵌入作为物品特征，如结合物品的文本信息嵌入、图像信息嵌入和知识图谱结构信息嵌入作为物品的最终嵌入，从而进行推荐，这样的方法灵活性很高，但是其使用的嵌入算法更关注图谱补全等任务，而不是推荐任务，因此推荐效果的提升有限。基于路径的方法利用知识图谱中的连接路径显式地为推荐提供额外信息，如基于知识图谱中的连接结构，学习元路径的表示，从而描述用户-物品交互，这种方法非常直观，但是严重依赖预先定义好的有效的元路径和领域知识，因此其使用受到限制。

综合以上描述可知，混合的方法以知识图谱中的连接结构为指导信息，设计偏好传播机制对学习到的嵌入进行更新，从而得到更合理的用户和物品表示。其中，例如有人提出的模拟水波的传播形式，将用户偏好信息沿着知识图谱的路径进行显式传播，从而对用户和物品进行建模；或者在统一的用户-物品知识图谱上度量高阶关系辅助推荐算法。以上方法虽然对推荐算法的性能有所提升，但是现有的基于知识图谱的推荐算法使用实数向量表示用户、物品、实体和关系，其表达能力有限，且不具备内在的反对称性，因此会限制知识图谱种实体和关系之间的建模，影响最终的推荐效果。

发明内容

因此，本发明的目的在于克服上述现有技术的缺陷，提供一种新个性化推荐方法，即通过引入四元数，基于协同知识图谱的个性化推荐方法。

本发明提供一种基于知识图谱的个性化推荐方法，用于为用户进行新物品推荐，包括：S1、将用户集中的用户与物品集中的物品的历史交互数据和原有知识图谱结合到协同知识图谱中，在所述协同知识图谱中将用户与其交互物品在知识图谱中对应的实体使用有向边进行连接；S2、用四元数向量表示协同知识图谱中的每一个实体和关系；S3、采用注意力机制将实体的四元数嵌入沿着协同知识图谱的路径进行偏好传播与聚合；S4、基于完成偏好传播与聚合后的协同知识图谱，构建偏好分数预测函数计算每个用户与不同物品的偏好分数；S5、采用损失函数联合优化协同知识图谱的嵌入和偏好分数预测函数；S6、采用优化后的偏好分数预测函数预测用户对新物品的偏好分数，得到针对用户的新物品推荐列表。

优选的，在所述协同知识图谱中，所述实体包括用户集中的用户、物品集中的物品、原有知识图谱中的其他原有实体；所述关系包括用户与物品的历史双向交互关系和原有知识图谱中的其他原有关系。

在本发明的一些实施例中，所述步骤S2包括:

S21、用四元数向量表示协同知识图谱中的实体和关系，其中，协同知识图谱中包含多个由头实体、关系、尾实体组成的三元组，每个三元组中的头实体、关系、尾实体均用四元数向量表示，得到其各自对应的初始四元数嵌入；头实体的初始四元数向量表示为：w_h＝a_h+b_hi+c_hj+d_hk，其中，h表示头实体，a_h、b_h、c_h、d_h为维度为l的实数向量，i，j，k为虚数单位数，满足汉密尔顿规则i²＝j²＝k²＝ijk＝-1；尾实体的初始四元数向量表示为：w_t＝a_t+b_ti+c_tj+d_tk，其中，t表示尾实体，a_t、b_t、c_t、d_t为维度为l的实数向量；关系的初始四元数向量表示：w_r＝a_r+b_ri+c_rj+d_rk，其中，r表示关系，a_r、b_r、c_r、d_r为维度为l的实数向量。

S22、求取三元组中关系的初始四元数嵌入对应的共轭四元数嵌入，并分别对关系的初始四元数嵌入以及其对应共轭四元数嵌入进行标准化；其中，所述关系的初始四元数嵌入对应的共轭四元数嵌入为：

对关系的初始四元数嵌入和对应共轭四元数嵌入通过如下方式进行标准化：

其中，

是标准化的关系初始四元数嵌入，

是标准化的关系共轭四元数嵌入，a′_r，b′_r，c′_r，d′_r是标准化的关系初始四元数嵌入对应的实数向量，

是标准化的关系共轭四元数嵌入对应的实数向量，|w_r|与

分别表示w_r与

的模长。

S23、使用汉密尔顿乘积对头实体的初始四元数嵌入和尾实体的初始四元数嵌入进行旋转，分别获得旋转后的头实体的四元数嵌入和旋转后的尾实体的四元数嵌入；在本发明的一些实施例中，通过如下方式对头实体和尾实体进行旋转：

计算头实体的初始四元数嵌入与标准化的关系的共轭四元数嵌入之间的汉密尔顿乘积，获得旋转后的头实体的四元数嵌入：

其中w′_h表示旋转后的头实体四元数嵌入，a′_h，b′_h，c′_h，d′_h表示旋转后的头实体四元数嵌入对应的实数向量，⊙表示两个实数向量之间的哈达马乘积。

计算尾实体的初始四元数嵌入与标准化的关系的共轭四元数嵌入之间的汉密尔顿乘积，获得旋转后的尾实体的四元数嵌入：

其中，w′_t表示旋转后的尾实体四元数嵌入，a′_t，b′_t，c′_t，d′_t表示旋转后的尾实体四元数嵌入对应的实数向量。

S24、计算旋转后的头实体的四元数嵌入与旋转后的尾实体的四元数嵌入之间的内积以度量该头实体和尾实体所在三元组的可信度；在本发明的一些实施例中，通过如下方式计算三元组的可信度：

其中，g(h，r，t)表示三元组可信度分数计算函数。

S25、在协同知识图谱中随机抽取实体替换已存在的三元组中的尾实体以构建多个新的三元组，基于构建的新的三元组和协同知识图谱中已存在的三元组对协同知识图谱的损失函数进行更新，以使协同知识图谱中已存在的三元组的可信度高于新构建的三元组；在本发明的一些实施例中，通过如下方式对协同知识图谱的损失函数进行更新：

其中，

表示协同知识图谱损失函数，(h，r，t)表示协同知识图谱总已经存在的三元组，(h，r，t′)表示新的三元组，ln表示对数函数，σ表示sigmoid激活函数，

是由协同知识图谱中已有三元组和新的三元组组成的针对协同知识图谱学习四元数嵌入的训练集，

表示协同知识图谱。

在本发明的一些实施例中，所述步骤S3包括：

S31、使用双曲正切激活函数tanh激活旋转后的头实体四元数嵌入和旋转后的尾实体四元数嵌入，并计算三元组注意力分数以度量过关系从尾实体传播到头实体的偏好信息：

其中，π(h，r，t)表示三元组(h，r，t)的注意力分数。

S32、对三元组的注意力分数进行归一化处理，得到归一化后的注意力分数：

其中，exp表示以自然常数e为底数的指数函数，

表示实体h的邻居三元组集合，r′和t′表示该集合中任意一个三元组中的关系和尾实体。

S33、采用归一化后的三元组注意力分数计算所有头实体的邻居三元组表示的线性组合，以捕获头实体的一阶结构信息的四元数嵌入实现偏好传播：

其中，

表示头实体h的一阶结构信息的四元数嵌入。

S34、将所有头实体的初始四元数嵌入与其邻居三元组的四元数嵌入进行聚合，获得聚合后的头实体通过偏好传播增强的四元数嵌入：

其中，

表示头实体h通过偏好传播增强的四元数嵌入，

表示该四元数嵌入对应的实数向量，LeakyRelu是激活函数，P₁、P₂是可训练的四元数权重矩阵，且P₁＝A₁+B₁i+C₁j+D₁k，P₂＝A₂+B₂i+C₂j+D₂k，其中

是大小为l′×l的二维实数矩阵。

在本发明的一些实施例中，所述步骤S4包括：

S41、从所有头实体通过偏好传播增强的四元数嵌入组成的集合中筛选出用户通过偏好传播增强的四元数嵌入以及物品通过偏好传播增强的四元数嵌入，然后分别计算用户和物品的最终四元数嵌入。

其中，连接用户的初始四元数嵌入与用户通过偏好传播增强的四元数嵌入获得用户最终的四元数嵌入：

其中，

表示用户u的最终四元数嵌入，w_u表示用户u的初始四元数嵌入，

表示用户u通过偏好传播增强的四元数嵌入，||表示两个四元数之间的连接操作，[·，·]表示两个实数向量之间的连接操作。

连接物品的初始四元数嵌入与物品通过偏好传播增强的四元数嵌入获得物品最终的四元数嵌入：

其中，

表示物品v的最终四元数嵌入，w_v表示物品v的初始四元数嵌入.

表示物品v通过偏好传播增强的四元数嵌入；

S42、根据用户和物品的最终四元数嵌入计算用户对物品的偏好程度：

其中，

表示偏好分数预测函数。

S43、采用损失函数对偏好分数进行优化以使用户对其产生交互的物品的偏好预测分数高于其未产生交互的物品的偏好预测分数：

其中，

表示损失函数，

是由已观测到的用户-物品交互构成的训练集，

表示用户集，

表示物品集，m表示用户已产生交互的物品，n表示用户未产生交互的物品；

在本发明的一些实施例中，所述步骤S5包括使用如下优化方式联合优化协同知识图谱的嵌入和偏好分数预测函数：

其中，

是L₂正则化项，且

其中Θ＝{W，P₁，P₂}，W表示协同知识图谱涉及的所有四元数嵌入组成的集合，λ₁是协同知识图谱的损失函数的权重，λ₂是正则化项的权重；使用Adam优化器，交替优化

和

直至收敛。

与现有技术相比，本发明的优点在于：现有的基于知识图谱的推荐算法仅使用实数向量对用户和物品进行建模，其表达能力较弱，不具备内在的反对称性质。本发明使用四元数向量表示用户、物品、实体和关系，并使用汉密尔顿乘积对三元组内的头实体和尾实体进行语义匹配，结合注意力机制使用户偏好信息进行传播和聚合。一方面，基于四元数的知识图谱嵌入过程，获得保留语义信息且具有内在反对称性的用户、物品、实体和关系嵌入，有效提高嵌入的表达能力，提高推荐性能。另一方面，利用注意力机制使偏好信息沿协同知识图谱的三元组路径进行传播，利用加法-乘法双交互聚合方式使原始嵌入与邻居信息嵌入充分交互，可以将用户和物品嵌入基于偏好信息进一步细化和更新，从而得到更适合个性化推荐的用户和物品嵌入。

具体实施方式

为了使本发明的目的，技术方案及优点更加清楚明白，以下通过具体实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

发明人在进行基于知识图谱的推荐算法研究时，发现现有技术存在的嵌入表达能力有限且不具备内在反对称性质的缺陷是由仅使用实数向量建模导致的，实数向量在欧氏空间中的内积无法建模关系的反对称性。为了解决该缺陷，发明人引入四元数向量表示用户、物品和关系，并使用汉密尔顿乘积在超复数空间中对实体和关系进行语义匹配。

本发明的目的是针对现有基于知识图谱的个性化推荐技术仅使用实数向量进行建模，得到的嵌入表达能力有限且不具备内在反对称性质的问题，提出一种使用四元数和其汉密尔顿乘积对用户、物品以及知识图谱中的实体和关系建模的方法，利用四元数强大的表达能力和汉密尔顿乘积内在的反对称性质进行协同知识图谱嵌入，并结合注意力机制进行偏好传播，进一步提高推荐的效果。

下面结合实施例详细说明本发明。

根据本发明的一个实施例，提出一种基于协同知识图谱的个性化推荐方法，概括来说，包括步骤S1、S2、S3、S4、S5、S6，下面详细说明每个步骤，四元数表示即为四元数嵌入，在后面的描述中不再区分。

在步骤S1中，将用户集中的用户与物品集中的物品的历史交互数据和原有知识图谱结合到统一的协同知识图谱中，在所述协同知识图谱中将用户与其交互物品在知识图谱中对应的实体使用有向边进行连接；具体来说，根据用户-物品历史交互数据Y(用户集合记作

物品集合记作

)和原有知识图谱

将用户与其交互物品在原有知识图谱中对应的实体使用有向边进行连接。在不同的数据领域中，推荐的对象不一样，例如，以用户-电影推荐为例，用户和其交互过的电影直接使用两条有向边进行连接，分别为用户观看电影和电影被用户观看，从而构建统一的用户-物品知识图谱

称为协同知识图谱。在建立的协同知识图谱中，实体包括用户、物品和知识图谱中的其他原有实体，关系包括用户-物品的双向交互关系和知识图谱其他原有关系。例如，以电影推荐为例，初始数据包括用户的电影观看记录和电影的知识图谱，用户的电影观看记录中包含用户实体、电影实体；电影的知识图谱中包含电影实体、导演人员实体、演员人员实体、厂商实体等实体。则在构建后的协同知识图谱中，实体包括用户、电影、导演、主演、厂商等实体；用户的电影观看记录中本身包括用户观看电影和电影被用户观看的关系，即观看关系和被观看关系，电影的知识图谱本身包括导演关系、被导演关系等关系。则在构建后的协同知识图谱中，关系包括观看、被观看、导演、被导演等关系。

在步骤S2中，基于四元数进行协同知识图谱嵌入，用四元数向量表示协同知识图谱中的每一个实体和关系；根据本发明的一个实施例，以用户、物品和知识图谱中的三元组为例进行说明，包括如下步骤：

S21、使用四元数向量表示协同知识图谱中的实体和关系，其中，对于协同知识图谱中由头实体、关系、尾实体组成的三元组(h，r，t)，头实体h、尾实体t、关系r的初始四元数表示(或叫初始四元数嵌入)分别为：w_h＝a_h+b_hi+c_hj+d_hk，w_t＝a_t+b_ti+c_tj+d_tk以及w_r＝a_r+b_ri+c_rj+d_rk。其中，a_*，b_*，c_*，d_*为维度为l的实数向量，i，j，k为虚数单位数，且满足汉密尔顿规则i²＝j²＝k²＝ijk＝-1；

S22、对关系r的初始四元数嵌入w_r，求取其共轭四元数嵌入，即实部对应向量不变，虚部对应向量取相反数，可得关系r的共轭四元数嵌入为

分别对w_r和

进行标准化，去除其尺度影响，得到标准化的关系初始四元数嵌入

和标准化的关系共轭四元数嵌入

其中括号内的分量分别表示一个实部和i，j，k三个虚部对应的实数向量，即a′_r，b′_r，c′_r，d′_r是标准化的关系初始四元数嵌入对应的实数向量，

是标准化的关系共轭四元数嵌入对应的实数向量，|w_r|和

分别表示w_r与

的模长：

S23、使用汉密尔顿乘积对头实体和尾实体进行旋转，具体地，计算头实体的初始四元数嵌入w_h与标准化的关系初始四元数嵌入

之间的汉密尔顿乘积，获得旋转后的头实体表示w′_h，其中括号内的分量同样分别表示一个实部和i，j，k三个虚部对应的实数向量，即a′_h，b′_h，c′_h，d′_h表示旋转后的头实体四元数嵌入对应的实数向量：

其中⊙表示两个实数向量之间的哈达马乘积。同时，按照同样的方式计算尾实体的初始四元数嵌入w_t与标准化的关系共轭四元数嵌入

之间的汉密尔顿乘积，获得旋转后的尾实体表示w′_t，其中括号内的分量同样分别表示一个实部和i，j，k三个虚部对应的实数向量，即a′_t，b′_t，c′_t，d′_t表示旋转后的尾实体四元数嵌入对应的实数向量：

S24、使用三元组可信度分数计算函数g(h，r，t)，计算旋转过后的头实体嵌入w′_h和尾实体嵌入w′_t之间的内积来度量三元组内头实体和尾实体之间的匹配程度，作为三元组可信度分数：

S25：在协同知识图谱中随机抽取实体t′对已存在的三元组(h，r，t)中的尾实体t进行替换，从而构建不存在于该协同知识图谱的三元组(h，r，t′)，根据本发明的一个实施例，基于如下协同知识图谱损失函数

进行优化，使协同知识图谱中存在的三元组(h，r，t)的可信度分数g(h，r，t)高于不存在的三元组(h，r，t′)的可信度分数g(h，r，t′)：

其中，

表示协同知识图谱，ln表示对数函数，σ表示sigmoid激活函数。

在步骤S3中，采用注意力机制将实体的四元数嵌入沿着协同知识图谱的路径进行偏好传播与聚合，根据本发明的一个实施例，所述步骤S3包括：

S31、使用双曲正切激活函数tanh函数激活旋转后的头实体四元数嵌入和尾实体四元数嵌入，并计算二者内积作为三元组路径(h，r，t)的注意力分数，用于指示多少偏好信息应该通过关系r从尾实体t传播到头实体h：

S32、使用归一化指数函数对以上注意力分数进行归一化，其中exp(·)表示以自然常数e为底数的指数函数，

表示实体h的邻居三元组集合，r′和t′表示该集合中任意一个三元组中的关系和尾实体，得到归一化后的注意力分数

S33、使用归一化后的注意力分数计算头实体h的邻居三元组表示的线性组合，用以捕获其一阶结构信息的四元数嵌入，实现基于注意力机制的偏好传播过程，记作

S34、以实体h为对象，将其初始四元数嵌入w_h与其邻居三元组集合的四元数嵌入

聚合为维度l′的四元数向量

为了充分地融合这两种嵌入，采用结合加法和乘法的双交互聚合方式，实现聚合过程：

其中，

表示头实体h通过偏好传播增强的四元数嵌入，

是大小为l′×l的二维实数矩阵，l′和l是根据具体数据领域进行随机设置的参数。因为每一个实体都作为头实体出现在一部分三元组中，也作为尾实体出现在另一部分三元组中，所以只要以头实体为中心进行聚合，就可以对所有实体进行更新。

在步骤S4中，基于完成偏好传播与聚合后的协同知识图谱，构建偏好分数预测函数计算每个用户与不同物品的偏好分数；根据本发明的一个实施例，所述步骤S4包括：

S41、通过前述实施例的过程，对于每个用户和物品最终可以得到其原始四元数嵌入和通过偏好传播增强的四元数嵌入，因为协同知识图谱中的头实体有可能是用户、也有可能是物品，举例而言，协同知识图谱中有甲乙丙丁四位用户，有手机、钱包等物品，有购买、被购买、厂商等关系。这些用户和物品都是实体，都既可以作为头实体，也可以作为尾实体，因此，既对于用户u有

对于物品v有

为了获得用户-物品偏好预测分数，首先连接用户u的两种四元数嵌入作为其最终表示：

其中||表示两个四元数之间的连接操作，即分别连接其对应的实数部分和虚数部分；[·，·]表示两个实数向量之间的连接操作。相似地，通过如下方式获得物品v的最终表示

S42、由于四元数丰富的表达能力，根据本发明的一个实施例，使用简单的内积，作为偏好分数预测函数

计算用户u对物品v的偏好程度：

S43：关于用户u，对其产生交互的物品i的偏好预测分数

应当高于其未产生交互的物品j的偏好预测分数

使用如下损失函数

进行优化：

其中，

表示损失函数，

是由已观测到的用户-物品交互构成的训练集，

表示用户集，

，

表示用户u对商品m的偏好预测分数，

表示用户u对商品n的偏好预测分数，ln表示对数函数，σ表示sigmoid激活函数。

在步骤S5中，采用损失函数联合优化协同知识图谱的嵌入和偏好分数预测函数；根据本发明的一个实施例，所述步骤S5包括：

S51、使用L₂正则化预防过拟合，记作

其中Θ＝{W，P₁，P₂}，包含所有的四元数嵌入和可训练参数，W表示协同知识图谱涉及的所有四元数嵌入组成的集合；

S52、使用λ₁，λ₂控制四元数协同知识图谱嵌入和正则化项的权重，设计如下的完整损失函数：

其中，λ₁是协同知识图谱的损失函数的权重，λ₂是正则化项的权重，λ₁和λ₂均是根据具体应用的数据领域随机设置的参数；

S53：使用Adam优化器，交替优化

和

直至收敛。

在步骤S6中，采用优化后的偏好分数预测函数预测用户对新物品的偏好分数，并将新物品按照用户对其的偏好分数进行降序排列，得到针对用户的新物品推荐列表。具体地，依次计算用户和其所有未交互物品的偏好预测分数，并按降序排列，得到用户感兴趣物品推荐列表。

本发明通过引入四元数对协同知识图谱嵌入；在技术效果上，将涉及到的用户、物品、实体、关系表示为超复数空间中的四元数向量，并使用汉密尔顿乘积结合关系旋转头实体和尾实体，学习到表达能力更强的、充分保留语义信息的四元数嵌入；此外，结合注意力机制的四元数嵌入偏好传播及聚合，基于三元组路径的不同获得不同的注意力分数对邻居节点的四元数进行加权，从而捕获带有结构信息和邻居偏好信息的四元数嵌入，结合加法-乘法双交互聚合方式得到与邻居信息充分交互后的四元数嵌入。现有的基于知识图谱的推荐算法仅使用实数向量对用户和物品进行建模，其表达能力较弱，不具备内在的反对称性质。本发明使用四元数向量表示用户、物品、实体和关系，并使用汉密尔顿乘积对三元组内的头实体和尾实体进行语义匹配，结合注意力机制使用户偏好信息进行传播和聚合。一方面，基于四元数的知识图谱嵌入过程，获得保留语义信息且具有内在反对称性的用户、物品、实体和关系嵌入，有效提高嵌入的表达能力，提高推荐性能。另一方面，利用注意力机制使偏好信息沿协同知识图谱的三元组路径进行传播，利用加法-乘法双交互聚合方式使原始嵌入与邻居信息嵌入充分交互，可以将用户和物品嵌入基于偏好信息进一步细化和更新，从而得到更适合个性化推荐的用户和物品嵌入。

需要说明的是，虽然上文按照特定顺序描述了各个步骤，但是并不意味着必须按照上述特定顺序来执行各个步骤，实际上，这些步骤中的一些可以并发执行，甚至改变顺序，只要能够实现所需要的功能即可。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种基于知识图谱的个性化推荐方法，用于为用户进行新物品推荐，其特征在于，包括：

S1、将用户集中的用户与物品集中的物品的历史交互数据和原有知识图谱结合到协同知识图谱中，在所述协同知识图谱中将用户与其交互物品在知识图谱中对应的实体使用有向边进行连接；

S2、用四元数向量表示协同知识图谱中的每一个实体和关系；

S3、采用注意力机制将实体的四元数嵌入沿着协同知识图谱的路径进行偏好传播与聚合；

S4、基于完成偏好传播与聚合后的协同知识图谱，构建偏好分数预测函数计算每个用户与不同物品的偏好分数；

S5、采用损失函数联合优化协同知识图谱的嵌入和偏好分数预测函数；

S6、采用优化后的偏好分数预测函数预测用户对新物品的偏好分数，得到针对用户的新物品推荐列表。

2.根据权利要求1所述的一种基于知识图谱的个性化推荐方法，其特征在于，在所述协同知识图谱中，所述实体包括用户集中的用户、物品集中的物品、原有知识图谱中的其他原有实体；所述关系包括用户与物品的历史双向交互关系和原有知识图谱中的其他原有关系。

3.根据权利要求2所述的一种基于知识图谱的个性化推荐方法，其特征在于，所述步骤S2包括:

S21、用四元数向量表示协同知识图谱中的实体和关系，其中，协同知识图谱中包含多个由头实体、关系、尾实体组成的三元组，每个三元组中的头实体、关系、尾实体均用四元数向量表示，得到其各自对应的初始四元数嵌入；

S22、求取三元组中关系的初始四元数嵌入对应的共轭四元数嵌入，并分别对关系的初始四元数嵌入以及其对应共轭四元数嵌入进行标准化；

S23、使用汉密尔顿乘积对头实体的初始四元数嵌入和尾实体的初始四元数嵌入进行旋转，分别获得旋转后的头实体的四元数嵌入和旋转后的尾实体的四元数嵌入；

S24、计算旋转后的头实体的四元数嵌入与旋转后的尾实体的四元数嵌入之间的内积以度量该头实体和尾实体所在三元组的可信度；

S25、在协同知识图谱中随机抽取实体替换已存在的三元组中的尾实体以构建多个新的三元组，基于构建的新的三元组和协同知识图谱中已存在的三元组对协同知识图谱的损失函数进行更新，以使协同知识图谱中已存在的三元组的可信度高于新构建的三元组。

4.根据权利要求3所述的一种基于知识图谱的个性化推荐方法，其特征在于，所述步骤S21中:

头实体的初始四元数向量表示为:w_h＝a_h+b_hi+c_hj+d_hk，其中，h表示头实体，a_h、b_h、c_h、d_h为维度为l的实数向量，i,j,k为虚数单位数，满足汉密尔顿规则i²＝j²＝k²＝ijk＝-1；

尾实体的初始四元数向量表示为：w_t＝a_t+b_ti+c_tj+d_tk，其中，t表示尾实体，a_t、b_t、c_t、d_t为维度为l的实数向量；

关系的初始四元数向量表示：w_r＝a_r+b_ri+c_rj+d_rk，其中，r表示关系，a_r、b_r、c_r、d_r为维度为l的实数向量。

5.根据权利要求4所述的一种基于知识图谱的个性化推荐方法，其特征在于，在所述步骤S22中：

所述关系的初始四元数嵌入对应的共轭四元数嵌入为：

其中，

是标准化的关系初始四元数嵌入，

是标准化的关系共轭四元数嵌入，a′_r,b′_r,c′_r,d′_r是标准化的关系初始四元数嵌入对应的实数向量，

是标准化的关系共轭四元数嵌入对应的实数向量，|w_r|与

分别表示w_r与

的模长。

6.根据权利要求5所述的一种基于知识图谱的个性化推荐方法，其特征在于，在所述步骤S23中，通过如下方式对头实体和尾实体进行旋转：

计算头实体的初始四元数嵌入与标准化的关系的四元数嵌入之间的汉密尔顿乘积，获得旋转后的头实体的四元数嵌入：

其中w′_h表示旋转后的头实体四元数嵌入，a′_h,b′_h,c′_h,d′_h表示旋转后的头实体四元数嵌入对应的实数向量，⊙表示两个实数向量之间的哈达马乘积；

计算尾实体的初始四元数嵌入与标准化的关系的四元数共轭嵌入之间的汉密尔顿乘积，获得旋转后的尾实体的四元数嵌入：

其中，w′_t表示旋转后的尾实体四元数嵌入，a′_t,b′_t,c′_t,d′_t表示旋转后的尾实体四元数嵌入对应的实数向量。

7.根据权利要求6所述的一种基于知识图谱的个性化推荐方法，其特征在于，在所述步骤S24中，通过如下方式计算三元组的可信度：

其中，g(h,r,t)表示三元组可信度分数计算函数。

8.根据权利要求7所述的一种基于知识图谱的个性化推荐方法，其特征在于，在所述步骤S25中，通过如下方式对协同知识图谱的损失函数进行更新：

其中，

表示协同知识图谱损失函数，(h,r,t)表示协同知识图谱总已经存在的三元组，(h,r,t′)表示新的三元组，ln表示对数函数，σ表示sigmoid激活函数，

表示协同知识图谱。

9.根据权利要求8所述的一种基于知识图谱的个性化推荐方法，其特征在于，所述步骤S3包括：

其中，π(h,r,t)表示三元组(h,r,t)的注意力分数；

其中，exp表示以自然常数e为底数的指数函数，

表示实体h的邻居三元组集合，r′和t′表示该集合中任意一个三元组中的关系和尾实体；

其中，

表示头实体h的一阶结构信息的四元数嵌入；

其中，

表示头实体h通过偏好传播增强的四元数嵌入，

是大小为l′×l的二维实数矩阵。

10.根据权利要求9所述的一种基于知识图谱的个性化推荐方法，其特征在于，所述步骤S4包括：

S41、从所有头实体通过偏好传播增强的四元数嵌入组成的集合中筛选出用户通过偏好传播增强的四元数嵌入以及物品通过偏好传播增强的四元数嵌入，

连接用户的初始四元数嵌入与用户通过偏好传播增强的四元数嵌入获得用户最终的四元数嵌入：

其中，

表示用户u通过偏好传播增强的四元数嵌入，||表示两个四元数之间的连接操作，[·,·]表示两个实数向量之间的连接操作；

其中，

表示物品v的最终四元数嵌入，w_v表示物品v的初始四元数嵌入，

表示物品v通过偏好传播增强的四元数嵌入；

其中，

表示偏好分数预测函数；

其中，

表示损失函数，

是由已观测到的用户-物品交互构成的训练集，

表示用户集，

表示物品集，m表示用户已产生交互的物品，n表示用户未产生交互的物品。

11.根据权利要求10所述的一种基于知识图谱的个性化推荐方法，其特征在于，所述步骤S5包括使用如下优化方式联合优化协同知识图谱的嵌入和偏好分数预测函数：

其中，

是L2正则化项，且

其中Θ＝{W,P₁,P₂}，W表示协同知识图谱涉及的所有四元数嵌入组成的集合，λ₁是协同知识图谱的损失函数的权重，λ₂是正则化项的权重；

使用Adam优化器，交替优化

和

直至收敛。

12.一种计算机可读存储介质，其特征在于，其上包含有计算机程序，所述计算机程序可被处理器执行以实现权利要求1至11任一所述方法的步骤。

13.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现如权利要求1至11中任一项所述方法的步骤。