CN113051404B

CN113051404B - 一种基于张量分解的知识推理方法、装置、设备

Info

Publication number: CN113051404B
Application number: CN202110024807.9A
Authority: CN
Inventors: 陶建华; 邵朋朋; 刘通; 杨国花; 张大伟
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2021-01-08
Filing date: 2021-01-08
Publication date: 2024-02-06
Anticipated expiration: 2041-01-08
Also published as: CN113051404A

Abstract

本申请实施例涉及数据处理技术领域，具体涉及一种基于张量分解的知识推理方法、装置、设备，旨在提高时序知识推理任务的准确率。所述方法包括：对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间；对多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料；将训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；使用训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

Description

一种基于张量分解的知识推理方法、装置、设备

技术领域

本申请实施例涉及数据处理技术领域，具体而言，涉及一种基于张量分解的知识推理方法、装置、设备。

背景技术

近年来，知识推理任务是一项较为重要的研究任务，在知识图谱补全、搜索系统、问答系统以及推荐系统中都有重要的作用。现有技术中，主要是通过对知识图谱进行三元组建模，完成对三元组中缺失实体的推理预测，同时为了表达出知识的时序性，研究人员在静态知识推理方法的基础上将时序信息和实体或关系进行关联，以进行时序知识推理工作。

现有技术中在进行知识推理工作时，依赖于静态知识图谱，而静态知识图谱中有一部分的知识的时效性会随时间发生改变，即它只在某一个时间段内或者某个时间节点有效，而现有技术中进行推理工作时假设知识图谱中的知识一直是正确的，忽略了对推理知识至关重要的知识的有效时间范围，因此导致推理的准确率较低。

发明内容

本申请实施例提供一种基于张量分解的知识推理方法、装置、设备，旨在提高时序知识推理任务的准确率。

本申请实施例第一方面提供一种基于张量分解的知识推理方法，所述方法包括：

对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，所述多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间；

对所述多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料；

将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；

使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

可选地，对时序知识图谱数据集中的数据进行提取，得到多个四元组数据，包括：

对所述时序知识图谱数据集中的实体集、关系集以及时间集进行提取；

由所述实体集、关系集以及时间集组成所述多组四元组数据，所述多组四元组数据中的每组四元组数据为：头实体，关系，尾实体，时间；

为所述多组四元组数据中的每组四元组数据增加其逆关系的四元组数据，其中，所述逆关系的四元组数据为：尾实体，关系^-1，头实体，时间。

可选地，对所述多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料，包括：

将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的任一元素进行标注，作为标签元素；

将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的头实体、时序关系、尾实体和时序信息进行初始化表示；

计算所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的核心张量以及非时序关系，将所述核心张量以及非时序关系进行初始化表示，得到处理好的四元组数据。

可选地，将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型，所述基于张量分解的时序知识推理模型及其变体模型的构建及训练过程包括：

对Tucker分解进行扩展，得到对时序四元组的Tucker分解，进而得到所述时序知识推理模型及其变体模型的初始形式；

将所述时序知识推理模型及其变体模型中的时序信息与关系进行关联表达出三元组的时序性，得到所述时序知识推理模型及其变体模型的最终形式；

根据目标函数对所述时序知识推理模型及其变体模型分别进行训练，得到所述训练好的时序知识推理模型及其变体模型。

可选地，对Tucker分解进行扩展，得到对时序四元组的Tucker分解，进而得到所述时序知识推理模型及其变体模型的初始形式，是按照以下公式实现的：

TuckERT：

TuckERTNT：

其中，TuckERT表示时序知识推理模型，TuckERTNT表示时序知识推理模型的变体模型，E表示实体，R表示关系，T表示时间信息，NT是 non-temporal(非时序信息)的缩写，表示张量值，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，1表示非时序信息。

可选地，其特征在于将所述时序知识推理模型及其变体模型中的时序信息与关系进行关联表达出三元组的时序性，得到所述时序知识推理模型及其变体模型的最终形式，是按照以下公式实现的：

TuckERT：

TuckERTNT：

其中，TuckERT表示时序知识推理模型，TuckERTNT表示时序知识推理模型的变体模型，E表示实体，R表示关系，T表示时间信息，NT是 non-temporal(非时序信息)的缩写，表示张量值，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，⊙表示元素级别的乘法， e_r⊙e_t表示关系融合了时间信息，/>表示关系融合了时间信息和非时序信息。

可选地，根据目标函数对所述时序知识推理模型及其变体模型分别进行训练，得到所述训练好的时序知识推理模型及其变体模型，所述目标函数为：

其中，(s,r,o,t)为正样本，(s,r,o′,t)为负样本，表示正样本分数，/>表示负样本分数，T表示时间信息个数，/>表示第i个时间信息，λ和 α为尺度参数，‖·‖_p表示l_p范数，‖·‖^q表示范数的q次方，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示。

可选地，使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果，包括：

将需要进行推理的四元组数据分别输入训练好的时序知识推理模型及其变体模型中，所述需要进行推理的四元组数据中的任意一项元素是未知的；

将时序知识图谱中的备选结果带入所述时序知识推理模型及其变体模型进行评分，选取分数最高的候选结果作为所述最终的推理结果。

本申请实施例第二方面提供一种基于张量分解的知识推理装置，所述装置包括：

四元组数据提取模块，用于对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，所述多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间；

数据处理模块，用于对所述多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料；

模型训练模块，用于将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；

推理任务执行模块，用于使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

可选地，所述四元组数据提取模块包括：

数据提取子模块，用于对所述时序知识图谱数据集中的实体集、关系集以及时间集进行提取；

四元组数据组成子模块，用于由所述实体集、关系集以及时间集组成所述多组四元组数据，所述多组四元组数据中的每组四元组数据为：头实体，关系，尾实体，时间；

逆关系添加子模块，用于为所述多组四元组数据中的每组四元组数据增加其逆关系的四元组数据，其中，所述逆关系的四元组数据为：尾实体，关系^-1，头实体，时间。

可选地，所述数据处理模块包括：

数据标注子模块，用于将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的任一元素进行标注，作为标签元素；

第一初始化表示子模块，用于将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的头实体、时序关系、尾实体和时序信息进行初始化表示；

第二初始化表示子模块，用于计算所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的核心张量以及非时序关系，将所述核心张量以及非时序关系进行初始化表示，得到处理好的四元组数据。

TuckERT：

TuckERTNT：

其中，TuckERT表示时序知识推理模型，TuckERTNT表示时序知识推理模型的变体模型，E表示实体，R表示关系，T表示时间信息，NT是non-temporal (非时序信息)的缩写，表示张量值，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，1表示非时序信息。

可选地，将所述时序知识推理模型及其变体模型中的时序信息与关系进行关联表达出三元组的时序性，得到所述时序知识推理模型及其变体模型的最终形式，是按照以下公式实现的：

TuckERT：

TuckERTNT：

其中，TuckERT表示时序知识推理模型，TuckERTNT表示时序知识推理模型的变体模型，E表示实体，R表示关系，T表示时间信息，NT是non-temporal (非时序信息)的缩写，表示张量值，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，⊙表示元素级别的乘法，e_r⊙e_t表示关系融合了时间信息，/>表示关系融合了时间信息和非时序信息。

其中，(s,r,o,t)为正样本，(s,r,o′,t)为负样本，表示正样本分数，/>表示负样本分数，T表示时间信息个数，/>表示第i个时间信息，λ和 α为尺度参数，‖·‖_p表示l_p范数，‖·‖q表示范数的q次方，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示。

可选地，所述推理任务执行模块包括：

四元组数据输入子模块，用于将需要进行推理的四元组数据分别输入训练好的时序知识推理模型及其变体模型中，所述需要进行推理的四元组数据中的任意一项元素是未知的；

结果获得子模块，用于将时序知识图谱中的备选结果带入所述时序知识推理模型及其变体模型进行评分，选取分数最高的候选结果作为所述最终的推理结果。

本申请实施例第三方面提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现本申请第一方面所述的方法的步骤。

采用本申请提供的基于张量分解的知识推理方法，首先对时序知识图谱数据集中数据进行提取，得到多组四元组数据，其中每组四元组数据中包含了头实体、关系、尾实体以及时间，对这多组四元组数据进行标注及处理，得到处理好的四元组数据，将处理好的四元组数据作为训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型，使用训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。本申请中从知识图谱数据集中提取出了四元组数据，利用四元组数据训练时序知识推理模型及其变体模型，以实现时序知识推理任务，本申请提出了时序知识推理模型及其变体模型，可以适应不同情况下的时序知识推理任务，另外本申请提出的推理模型及其变体模型够早了时序光滑约束和正则化项，使得模型具有了较强的表达能力且可避免模型过拟合，从而提高模型对四元组的辨别能力，进而提升了时序知识推理任务的准确率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提出的一种基于张量分解的知识推理方法的流程图；

图2是本申请一实施例提出的模型评分结果图；

图3是本申请一实施例提出的一种基于张量分解的知识推理装置的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

参考图1，图1是本申请一实施例提出的基于张量分解的知识推理方法的流程图。如图1所示，该方法包括以下步骤：

S11：对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，所述多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间。

本实施例中，知识图谱是将各种知识通过可视化图谱展示出来的一种方式，知识图谱中包含了各种实体和实体之间的关系，时序知识图谱中还包含了各个实体与关系对应的时间信息，时序知识图谱数据集就是时序知识图谱中包含的数据的集合。

本实施例中，对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，所述多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间的具体步骤为：

S11-1：对所述时序知识图谱数据集中的实体集、关系集以及时间集进行提取。

本实施例中，时序知识图谱数据集中包含了实体集、关系集以及时间集，实体集中包含了各个命名实体，关系集中包含了各个命名实体之间的关系，时间集中包含了与各个命名实体，关系对应的时间信息。根据知识图谱中表示出的各个实体之间的关系以及其对应的时间，从实体集、关系集以及时间集中提取出相应的实体，关系以及对应的时间。

示例地，实体可以是地名、人名、职业、身份等，关系可以是从属关系、亲属关系、位置关系等，时间可以是一个年份，也可以具体到月份，具体到谋日甚至某个时刻，可以自行设定。

S11-2：由所述实体集、关系集以及时间集组成所述多组四元组数据，所述多组四元组数据中的每组四元组数据为：头实体，关系，尾实体，时间。

本实施例中，实体，关系以及时间可以组成多组四元组数据，四元组数据的结构是(头实体，关系，尾实体，时间)，这多组四元组数据是根据时序知识图谱中的信息进行组合的。

示例地，时序知识图谱中有显示了2008年至2016年之间阳光中学的校长是张三，则可通过该知识得到四元组数据(张三，校长，阳光中学，2008-2016)。

S11-3：为所述多组四元组数据中的每组四元组数据增加其逆关系的四元组数据，其中，所述逆关系的四元组数据为：尾实体，关系^-1，头实体，时间。

本实施例中，关系^-1表示逆关系，为了增加样本的多样性，可以利用数据增广技术，为每个四元组数据增加其逆关系的四元组，具体是将每个四元素数据的头实体与尾实体进行对调，将之间的关系进行适应性改变，时间一般不需要改变。增加样本的多样性，有利于提升训练效果，增强模型的性能。

示例地，若原四元组数据为(李梅，领导，王东，2010-2013)，该四元组数据的逆关系的四元组数据为(王东，被领导，李梅，2010-2013)。

S12：对所述多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料。

本实施例中，对提取到的四元组数据进行预处理的具体步骤为：

S12-1：将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的任一元素进行标注，作为标签元素。

本实施例中，需要对四元组数据及其逆关系的四元组数据中的任一元素进行标注，标注方式可以自行设定，被标注的元素成为标签元素。四元组数据中的头实体、关系、尾实体、时间都可以作为标签元素。

示例地，可以将四元组数据标注为(头实体，关系，尾实体*，时间)，这个四元组数据中的尾实体就是标签元素。

S12-2：将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的头实体、时序关系、尾实体和时序信息进行初始化表示。

本实施例中，初始化表示，就是将这些数据转化为向量的形式，这样就可以输入模型中，对模型进训练。时序关系是会随着时间变化的关系，例如一个人不同时期的职业，一个国家不同时期的领导人等。时序信息是就是各个实体和关系对应的时间信息。

S12-3：计算所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的核心张量以及非时序关系，将所述核心张量以及非时序关系进行初始化表示，得到处理好的四元组数据。

本实施例中，核心张量具体来说是核心张量参数，每一组四元组数据都有一个核心张量参数，不同的四元组数据的核心张量参数是不同的。非时序关系是不随着时间变化而改变的关系。

示例地，核心张量参数可以使用Tucker分解进行计算，Tucker分解是一种常用的张量分解方法，分解出的核心张量参数可记为非时序关系可以是中国属于亚洲，地球属于银河系等不会随时间变化而改变的关系。

S13：将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型。

本实施例中，将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型的具体步骤为：

S13-1：对Tucker分解进行扩展，得到对时序四元组的Tucker分解，进而得到所述时序知识推理模型及其变体模型的初始形式。

本实施例中，Tucker分解是一种常用的张量分解方法，对Tucker分解进行扩展，得到对时序四元组的Tucker分解，进而得到所述时序知识推理模型及其变体模型的初始形式是按照以下公式实现的：

TuckERT：

TuckERTNT：

本实施例中，该公式的具体推导步骤为：

首先在普通的Tucker分解中加入时序信息以进行扩展，得到对时序四元组的Tucker分解，可以表示为：

其中E代表实体，R代表关系，T代表时间信息。

进而根据该式得到推理模型的具体形式，即TuckerT模型：其中e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，该模型只包含了时序知识。

时序知识图谱中除了时序知识以外，可能还有部分静态知识即非时序信息，为了将这些静态知识融入模型中，可在对时序四元组的Tucker分解中加入静态知识，可表示为：

其中，1代表非时序信息。

进而根据该式得到变体模型TuckerTNT的具体形式：

S13-2：将所述时序知识推理模型及其变体模型中的时序信息与关系进行关联表达出三元组的时序性，得到所述时序知识推理模型及其变体模型的最终形式。

本实施例中，四元组中的实体和关系都包含着时序信息，因此将具有时序性的关系可以分解成关系和时序信息，或将具有时序性的实体分解成实体和时序信息，具体可以表示为：

其中表示张量值，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，⊙表示元素级别的乘法，e_s⊙e_t表示头实体融合了时间信息，e_r⊙e_t表示关系融合了时间信息，e_o⊙e_t表示尾实体融合了时间信息。

因此，在具体的实施过程中，采用分解的逆过程，将时序信息与实体或关系关联来表达出四元组的时序性，及推理模型及变体模型的最终形式：

TuckERT：

TuckERTNT：

S13-3：根据目标函数对所述时序知识推理模型及其变体模型分别进行训练，得到所述训练好的时序知识推理模型及其变体模型。

本实施例中，根据目标函数对所述时序知识推理模型及其变体模型分别进行训练，得到所述训练好的时序知识推理模型及其变体模型，所述目标函数为：

本目标函数中包含有四元组的分数函数，用于为模型识别四元组的结果进行打分，还包括了对时序信息的光滑约束，还包括了对实体、关系和时序信息施加的正则化约束。

其中，四元组的分数函数为：

其中，表示样本的总得分，(s,r,o,t)为正样本，(s,r,o′,t)为负样本，/>为正样本分数，/>为负样本分数。

时序信息光滑约束表示为：

其中，为光滑约束，‖·‖_p表示l_p范数，‖·‖^q表示范数的q次方，λ为尺度参数，T表示时间信息的个数，/>表示第i个时间信息。

本实施例中，相邻的时间节点具有相似的浅层表示，通过对时序信息施加光滑约束，可以保证模型的稳定性，提高模型的识别准确率。

正则化约束函数为：

其中，表示在(E,R,E,T)上施加的函数，‖·‖_p表示l_p范数， ‖·‖^q表示范数的q次方，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示。

本实施例中，在分解出的实体、关系和时序信息上施加正则化约束，可以避免过拟合的发生。

S14：使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

本实施例中，得到S13中训练好的时序知识推理模型及其变体模型之后，就可以使用这两个模型执行预测任务，具体的步骤是：

S13-1：将需要进行推理的四元组数据分别输入训练好的时序知识推理模型及其变体模型中，所述需要进行推理的四元组数据中的任意一项元素是未知的。

本实施例中，将缺失了任意一项元素的四元组数据输入到训练好的时序知识推理模型及其变体模型中，即可进行推理任务。

示例地，当训练数据中的四元组数据为(头实体，关系，尾实体*，时间)时，可以见得，尾实体上有标注，为标签数据，利用该类型的四元组数据训练好了时序知识推理模型及其变体模型之后，输入新的四元组数据 (头实体，关系，x,时间)，此时时序知识推理模型及其变体模型就可以推理出x代表的元素内容。

S13-2：将时序知识图谱中的备选结果带入所述时序知识推理模型及其变体模型进行评分，选取分数最高的候选结果作为所述最终的推理结果。

本实施例中，在输入需要预测结果的四元组数据时，训练好的时序知识推理模型及其变体模型会根据四元组数据的信息从时序知识图谱中获得备选的结果，对这些备选结果进行打分，得到最终的推理结果。

示例地，输入(阳光中学，校长，x，2008-2016)，上述模型从时序知识图谱中得到了两个备选结果：张三，李四，上述模型对这两个候选结果进行打分，张三的得分较高，则可以根据头实体，关系和时间推理出x为张三。上述模型可以根据训练中标注的元素不同而推理新输入四元组数据中不同的元素。例如将头实体标注为标签元素，就可推理出四元组数据中缺失的头实体。

本实施例的另一个方面中，在训练好了时序知识推理模型及其变体模型之后，可以评价两个模型的推理性能。

具体的，利用MRR和Hits@n，n＝1,3,10来评价模型的推理性能，MRR和 Hits@n，n＝1,3,10是评价模型性能的方法。

其相应的表达式为：

MRR:

Hits@n:

其中，其中，k_f,o和k_f,s分别表示当模型推理出的结果为头实体或尾实体时，头实体的排名和尾实体的排名，test表示样本个数。如表2所示，图2是本申请一实施例提出的模型评分结果图，其中MRR,Hits@1,Hits@3,Hits@10,都是评价模型性能的方法，ICEWS14和ICEWS05-15是两种时序知识图谱。

如图2所示，本实施例在ICEWS14和ICEWS05-15两个时序知识图谱数据集上，进行本发明所提出的模型与现有的知识推理模型De-SimplE和 TNTComplEx的对比实验，结果展示出模型TuckERT和TuckERTNT在时序知识推理任务上得到的评分都都高于现有的De-SimplE和TNTComplEx模型。

基于同一发明构思，本申请一实施例提供一种基于张量分解的知识推理装置。参考图3，图3是本申请一实施例提出的基于张量分解的知识推理装置300 的示意图。如图3所示，该装置包括：

四元组数据提取模块301，用于对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，所述多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间；

数据处理模块302，用于对所述多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料；

模型训练模块303，用于将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；

推理任务执行模块304，用于使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

可选地，所述四元组数据提取模块包括：

可选地，所述数据处理模块包括：

TuckERT：

TuckERTNT：

TuckERT：

TuckERTNT：

其中，TuckERT表示时序知识推理模型，TuckERTNT表示时序知识推理模型的变体模型，E表示实体，R表示关系，T表示时间信息，NT是non-temporal 的缩写，表示非时序信息，表示张量值，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，⊙表示元素级别的乘法，e_r⊙e_t表示关系融合了时间信息，/>表示关系融合了时间信息和非时序信息。

可选地，所述推理任务执行模块包括：

基于同一发明构思，本申请另一实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现本申请上述任一实施例所述的一种基于张量分解的知识推理方法中的步骤。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种基于张量分解的知识推理方法、装置、设备，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种基于张量分解的知识推理方法，其特征在于，所述方法包括：

对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，所述多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间，所述头实体和所述尾实体分别是以下至少一者:地名、人名、职业、身份，所述关系是以下至少一者：从属关系、亲属关系、位置关系；所述时间是以下至少一者：年份、月份、日、时刻；

对所述多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料，包括：将所述多组四元组数据中的每组四元组数据的任一元素进行标注，作为标签元素；将所述多组四元组数据中的每组四元组数据中的头实体、时序关系、尾实体和时序信息进行初始化表示；计算所述多组四元组数据中的每组四元组数据中的核心张量以及非时序关系，将所述核心张量以及非时序关系进行初始化表示，得到处理好的四元组数据；所述时序关系是随着时间变化的关系，所述时序信息是各个实体和关系对应的时间信息；所述核心张量是使用张量分解方法从一组四元组数据中分解出的核心张量参数；所述非时序关系是不随着时间变化而改变的关系；

使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果，包括：在标签元素是头实体被标注为标签元素的情况下，最终的推理结果为需要进行推理的四元组数据中缺失的头实体；在标签元素是尾实体被标注为标签元素的情况下，最终的推理结果为需要进行推理的四元组数据中缺失的尾实体；所述预测任务，包括推理出任意一项元素缺失的四元组数据中，缺失的元素；

所述时序知识推理模型及其变体模型是根据目标函数进行训练的，所述目标函数用于为四元组结果进行打分；所述目标函数包括对所述时序信息的光滑约束，以及对实体、所述关系和所述时序信息施加的正则化约束。

2.根据权利要求1所述的方法，其特征在于，对时序知识图谱数据集中的数据进行提取，得到多个四元组数据，包括：

3.根据权利要求1所述的方法，其特征在于，对所述多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料，包括：

4.根据权利要求1所述的方法，其特征在于，将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型，所述基于张量分解的时序知识推理模型及其变体模型的构建及训练过程包括：

5.根据权利要求4所述的方法，其特征在于，对Tucker分解进行扩展，得到对时序四元组的Tucker分解，进而得到所述时序知识推理模型及其变体模型的初始形式，是按照以下公式实现的：

TuckERT：

TuckERTNT：

其中，TuckERT表示时序知识推理模型，TuckERTNT表示时序知识推理模型的变体模型，E表示实体，R表示关系，T表示时间信息，NT是非时序信息non-temporal的缩写，表示张量值，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，1表示非时序信息。

6.根据权利要求4所述的方法，其特征在于，将所述时序知识推理模型及其变体模型中的时序信息与关系进行关联表达出三元组的时序性，得到所述时序知识推理模型及其变体模型的最终形式，是按照以下公式实现的：

TuckERT：

TuckERTNT：

其中，TuckERT表示时序知识推理模型，TuckERTNT表示时序知识推理模型的变体模型，E表示实体，R表示关系，T表示时间信息，NT是非时序信息non-temporal的缩写，表示张量值，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示，⊙表示元素级别的乘法，e_r⊙e_t表示关系融合了时间信息，/>表示关系融合了时间信息和非时序信息。

7.根据权利要求4所述的方法，其特征在于，根据目标函数对所述时序知识推理模型及其变体模型分别进行训练，得到所述训练好的时序知识推理模型及其变体模型，所述目标函数为：

其中，(s,r,o,t)为正样本，(s,r,o′,t)为负样本，表示正样本分数，/>表示负样本分数，T表示时间信息个数，/>表示第i个时间信息，λ和α为尺度参数，‖·‖_p表示l_p范数，‖·‖^q表示范数的q次方，e_s，e_r，e_o，e_t分别为头实体，关系，尾实体和时间信息的浅层表示。

8.根据权利要求1所述的方法，其特征在于，使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果，包括：

9.一种基于张量分解的知识推理装置，其特征在于，所述装置包括：

四元组数据提取模块，用于对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，所述多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间，所述头实体和所述尾实体分别是以下至少一者:地名、人名、职业、身份，所述关系是以下至少一者：从属关系、亲属关系、位置关系；所述时间是以下至少一者：年份、月份、日、时刻；

数据处理模块，用于对所述多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料，包括：将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的任一元素进行标注，作为标签元素；将所述多组四元组数据中的每组四元组数据中的头实体、时序关系、尾实体和时序信息进行初始化表示；计算所述多组四元组数据中的每组四元组数据中的核心张量以及非时序关系，将所述核心张量以及非时序关系进行初始化表示，得到处理好的四元组数据；所述时序关系是随着时间变化的关系，所述时序信息是各个实体和关系对应的时间信息；所述核心张量是使用张量分解方法从一组四元组数据中分解出的核心张量参数；所述非时序关系是不随着时间变化而改变的关系；

模型训练模块，用于将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；所述时序知识推理模型及其变体模型是根据目标函数进行训练的，所述目标函数用于为四元组结果进行打分；所述目标函数包括对所述时序信息的光滑约束，以及对实体、所述关系和所述时序信息施加的正则化约束；

推理任务执行模块，用于使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果，包括：在标签元素是头实体被标注为标签元素的情况下，最终的推理结果为需要进行推理的四元组数据中缺失的头实体；在标签元素是尾实体被标注为标签元素的情况下，最终的推理结果为需要进行推理的四元组数据中缺失的尾实体；所述预测任务，包括推理出任意一项元素缺失的四元组数据中，缺失的元素。

10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时，实现如权利要求1至8任一所述的方法的步骤。