CN113869516B

CN113869516B - 知识图谱嵌入模型训练方法、装置、电子设备及介质

Info

Publication number: CN113869516B
Application number: CN202111472336.4A
Authority: CN
Inventors: 吴定明; 周钰棋; 陆克中; 詹金颖
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2021-12-06
Filing date: 2021-12-06
Publication date: 2022-05-20
Anticipated expiration: 2041-12-06
Also published as: CN113869516A

Abstract

本申请实施例公开了一种知识图谱嵌入表示模型训练方法。该方法包括：获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示；将所述更新向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。以上技术方案中从多维度选择节点的邻接节点，并将节点与其邻接节点之间的关联信息进行聚合作为节点的向量表示，使模型在训练时可以学习到更丰富的信息，从而使得到的节点的嵌入式表示具有更优的空间和文本辨别能力。

Description

知识图谱嵌入模型训练方法、装置、电子设备及介质

技术领域

本申请实施例涉及知识图谱嵌入技术领域，尤其涉及一种知识图谱嵌入表示模型训练方法、装置、电子设备及介质。

背景技术

所谓知识图谱（Knowledge Graph，KG），即揭示实体之间关系的语义网络，它利用图结构形式化的描述并存储现实世界复杂的事物及其相互关系。目前，许多大型知识图谱都采用（头实体，关系，尾实体）形式的三元组来描述事物和关系。虽然这种表示方式可以有效地表示结构化数据，而且易于人们理解，但是，随着知识图谱规模的不断扩大，三元组的符号性却使得直接操作知识图谱变得困难。为了能高效地操作和使用知识图谱，研究人员尝试将实体和关系表示为低维连续向量，从而方便计算机理解和计算。

为了得到表达能力更强的嵌入表示，研究人员将知识图谱中的附加信息加入实体的嵌入式表示中。但现有技术依然存在一个不足：目前得到的实体嵌入表示无法同时保留实体的空间信息和文本信息，也就意味着，人们无法利用这些嵌入表示来同时从空间和文本的角度区分不同的实体。

发明内容

本申请实施例提供一种知识图谱嵌入表示模型训练方法、装置、电子设备及介质，可以使模型生成的嵌入表示能同时从空间和文本的角度将知识图谱中不同的实体区分开来。

在一个实施例中，本申请实施例提供了一种知识图谱嵌入表示模型训练方法，所述方法包括：

获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体；

通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示；

将所述更新向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。

在一个实施例中，本申请实施例提供了一种知识图谱嵌入表示模型训练装置，其特征在于，该装置包括：

第一关联向量确定装置，用于获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体；

第一聚合结果确定模块，用于通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示；

第一模型训练模块，用于将所述更新向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。

在一个实施例中，本申请实施例提供了一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，所述一个或多个处理器实现如本申请任一实施例所述的知识图谱嵌入表示模型训练方法。

在一个实施例中，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本申请任一实施例所述的知识图谱嵌入表示模型训练方法。

本申请实施例通过以下方法得到了节点的嵌入式表示：获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体；通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示；将所述更新向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。以上技术方案中从多维度选择节点的邻接节点，并将节点与其邻接节点之间的关联信息进行聚合作为节点的向量表示，使模型在训练时可以学习到更丰富的信息，从而使得到的节点的嵌入式表示具有更优的空间和文本辨别能力，从而更准确的从空间和文本的角度将不同实体区分开来。

附图说明

图1是本申请实施例提供的实体空间位置示意图；

图2是本申请实施例提供的实体向量表示示意图；

图3是本申请一种实施例提供的知识图谱嵌入表示模型训练方法流程图；

图4是本申请另一种实施例提供的知识图谱嵌入表示模型训练方法流程图；

图5是本申请又一种实施例提供的知识图谱嵌入表示模型训练方法流程图；

图6是本申请一种实施例提供的知识图谱嵌入表示模型训练装置结构框图；

图7是本申请一种实施例提供的电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请在实施例中作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部结构。

在描述实施例之前，先对现有技术的缺陷进行说明。以图1和图2为例。图1是本申请实施例提供的实体空间位置示意图。如图1所示，图1中圆圈和方框所示的四个实体的空间相对位置是摘取自DBpedia数据集的实体在地图中的位置。其中实体p1, p2, p3均为学校，属于同类实体，实体 p4则为车站。

图2是本申请实施例提供的实体向量表示示意图。从图2可以看出，p1和p4的向量表示是通过多个方框表示，p2和p3的向量表示是通过多个圆圈表示的，而实际上p1, p2,p3为同一类实体，p4为另一类实体，所以可以看出现有技术得到的向量表示不能有效划分不同类别的实体。正是因为有些实体（如p3和p4）地理（空间）相距较近但文本差异大，有些实体（如p1和p3）文本相似但在地理（空间）上相距相远，想要准确的区分这些实体，就必须要求实体嵌入表示具备空间-文本感知能力。所以本申请实施例提供了一种知识图谱嵌入表示模型用于解决上述问题。

图3是本申请一种实施例提供的知识图谱嵌入表示模型训练方法流程图，本实施例可适用于根据实体的嵌入表示将地理位置相距较远、文本描述不相关的实体区分开，尤其是具备空间坐标的实体。该方法可以由本申请实施例所提供的知识图谱嵌入表示模型训练装置执行，该装置可以由软件和/或硬件的方式来实现，并可集成于电子设备中。

如图3所示，本申请实施例中提供的知识图谱嵌入表示模型训练方法可包括以下步骤：

S310、获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体。

在知识图谱中通常通过节点表征实体，节点与节点之间的连线表征实体与实体之间的关系。所以本申请实施例中用节点来表示知识图谱中的实体。

知识图谱中有多个节点，当前节点可以是从多个节点中随机选出的一个节点，所有节点都遍历一遍。

本申请实施例中，当前节点的邻接节点，可以是知识图谱结构中与当前节点直接相连的邻接节点，也可以是在空间地理位置上与当前节点距离最近的预设数量的邻接节点，也可以是二者的组合。

其中，在空间地理位置上与当前节点距离最近的邻接节点的预设数量可以根据实际需求人为设定，也可以根据算法计算得到。在一个具体的例子中，可以根据当前节点与其他节点的坐标信息，计算当前节点与其他节点之间的欧式距离，设置一个距离阈值，将与当前节点的欧式距离小于距离阈值的其他节点作为当前节点在空间地理位置上的邻接节点。除此之外，还可以根据K-Means算法，按照节点之间的距离大小，将所有节点自动划分为K个簇，使簇内的节点尽量紧密的连在一起，而簇间的距离尽量的大，以此得到当前节点在空间地理位置上的预设数量的邻接节点。需要说明的是，每个节点在知识图谱结构中直接相连的邻接节点，以及在空间地理位置上预设数量的邻接节点的数量可能不相同。

进一步的，节点的初始向量表示是指没有对节点的向量表示进行更新之前，节点的原始向量表示。本申请实施例中可以通过如下方法计算节点的初始向量表示：首先使用Word2Vec模型对节点文本信息的关键字进行编码，得到节点的文本向量。对有坐标的节点使用Space2Vec模型来获得节点的空间向量，若节点没有坐标，则将其空间向量构建为全零向量。然后将节点的文本向量和空间向量进行拼接，拼接后的向量即为该节点的初始向量表示。

本申请实施例将节点的空间信息和文本信息纳入节点的向量表示中，使模型通过学习各个节点的向量表示得到的各个节点的嵌入表示具有更优的空间和文本辨别能力，从而更准确的从空间和文本的角度将不同实体区分开来。

当前节点和邻接节点之间的第一关联向量，是指可以表示当前节点和其邻接节点之间关联信息的向量，其中关联信息包含了当前节点和其邻接节点之间的相对地理位置关系信息以及语义关联性信息。第一关联向量可以根据当前节点和邻接节点的初始向量表示，以及当前节点和邻接节点之间的空间距离和文本相似度运算得到。

S320、通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示。

其中，聚合函数可以根据需求定义。第一关联聚合结果中包含当前节点与其所有邻接节点的关联信息。更新向量表示，是指用第一关联聚合结果替换当前节点的初始向量表示后，当前节点的当前向量表示。节点的更新向量表示中包含了该节点与所有邻接节点的关联信息。

本申请实施例通过用第一关联聚合结果替换当前节点的初始向量表示，将当前节点与其所有邻接节点之间关联信息传递给当前节点，使后续的模型训练中，模型通过学习各个节点的向量表示从而得到的各个节点的嵌入表示具有更优的空间和文本辨别能力，可以更准确的从空间和文本的角度将不同实体区分开来。

本申请实施例中，可以根据如下聚合函数计算当前节点与所有邻接节点之间的第一关联聚合结果：

；

其中，

表示当前节点与所有邻接节点之间的第一关联聚合结果，

表示按维度取最大元素操作，

是一个非线性激活函数，

是一个可训练的权重矩阵,

表示当前节点u和其邻接节点v之间的第一关联向量。

S330、将所述更新向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。

对知识图谱中的所有节点更新向量表示后，将所有更新向量表示输入嵌入表示模型中，通过随机梯度下降法最小化损失函数调整参数，最后得到节点最优的嵌入式表示。

本申请实施例中可以将空间-文本感知的图神经网络（Spatial-Textual-awareGraph Neural Networks，ST-GNNs）作为嵌入表示模型进行训练。

本申请实施例中，所述根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量，包括：

将当前节点和邻接节点的初始向量表示进行拼接，得到第一拼接向量；

根据当前节点和邻接节点之间的空间邻近度和文本相似度，确定当前节点和邻接节点之间的关联信息；

将所述关联信息与所述第一拼接向量相乘，得到当前节点和邻接节点之间的第一关联向量。

可以理解的，当前节点和邻接节点的第一拼接向量是根据当前节点和邻接节点的初始向量表示进行拼接得到的。在一个具体的例子中，若当前节点的初始向量为（1,1），其邻接节点的初始向量为（2,2），则将（1,1）和（2,2）进行拼接，得到向量（1,1,2,2），则（1,1,2,2）即为当前节点和其邻接节点的第一拼接向量。

当前节点和邻接节点之间的空间邻近度表示当前节点和其邻接节点之间的距离的远近，当前节点和邻接节点之间的文本相似度表示当前节点和其邻接节点之间的语义是否相近，当前节点和邻接节点之间的关联信息包含了当前节点和其邻接节点之间的相对地理位置关系信息以及语义关联性信息。

当前节点和邻接节点之间的空间邻近度可以通过如下公式计算得到：

；

其中

表示当前节点

和其邻接节点

之间归一化后的欧式距离，取值范围为

。如果节点

和

在空间上距离很近，比如空间距离小于

（本申请实施例中将

设置为0.1），那么它们之间的空间邻近度就会比较大。若空间距离大于

，则将它们之间的空间邻近度设置为一个较小的值，比如

。若节点

和

中至少存在一个节点没有空间坐标，那么它们之间的空间邻近度也为

。

当前节点和邻接节点之间的文本相似度可以通过如下公式计算得到：

；

其中

是节点

和

的文本向量的余弦相似度。

当前节点和邻接节点之间的关联信息可以通过如下公式计算得到：

；

其中，

为当前节点和邻接节点之间的空间邻近度，

为当前节点和邻接节点之间的文本相似度。

则当前节点和邻接节点之间的第一关联向量可以通过如下公式计算得到：

；

其中，

为当前节点和邻接节点之间的关联信息，

为当前节点和邻接节点的第一拼接向量。

本申请实施例通过以下方法得到了节点的嵌入式表示：获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体；通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示；将所述更新向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。以上技术方案中从多维度选择节点的邻接节点，并将节点与其邻接节点之间的关联信息进行聚合作为节点的向量表示，使模型在训练时可以学习到更丰富的信息，从而使得到的节点的嵌入式表示具有更优的空间和文本辨别能力，从而更准确的从空间和文本的角度将不同节点区分开来。

图4是本申请另一种实施例提供的知识图谱嵌入表示模型训练方法流程图，本实施例以上述实施例为基础进行优化，具体优化如下：

S410、获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体。

S420、通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示。

S430、根据当前节点和邻接节点的更新向量表示，确定当前节点和邻接节点之间的第二关联向量。

S440、通过聚合函数将所述第二关联向量进行聚合，得到当前节点与所有邻接节点之间的第二关联聚合结果，并将所述第二关联聚合结果作为当前节点的最终向量表示。

S450、将所述最终向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。

由于S420中节点的更新向量表示中包含了该节点与其所有邻接节点的关联信息，那么S430中根据当前节点和邻接节点的更新向量表示，确定的第二关联向量中包含了当前节点与其邻接的邻接节点之间的关联信息。

第二关联向量可以根据当前节点和邻接节点的更新向量表示，以及当前节点和邻接节点之间的空间距离和文本相似度运算得到。

进一步的，第二关联聚合结果中包含当前节点与其所有邻接的邻接节点的关联信息。

本申请实施例中，所述根据当前节点和邻接节点的更新向量表示，确定当前节点和邻接节点之间的第二关联向量，包括：

将当前节点和邻接节点的更新向量表示进行拼接，得到第二拼接向量；

将所述关联信息与所述第二拼接向量相乘，得到当前节点和邻接节点之间的第二关联向量。

可以理解的，得到第二拼接向量与得到第一拼接向量所使用的拼接方式相同，区别在于第一拼接向量是根据当前节点和邻接节点的初始向量表示得到的，而第二拼接向量是根据当前节点和邻接节点的更新向量表示得到的。

本申请实施例通过以下方法得到节点的嵌入表示：根据当前节点和邻接节点的更新向量表示，确定当前节点和邻接节点之间的第二关联向量；通过聚合函数将所述第二关联向量进行聚合，得到当前节点与所有邻接节点之间的第二关联聚合结果，并将所述第二关联聚合结果作为当前节点的最终向量表示；将所述最终向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。以上技术方案通过两轮的聚合，将节点两跳以内的邻接节点的信息纳入节点的嵌入表示中，使模型在训练时可以学习到节点与其更多邻接节点之间的关联信息，从而根据这些关联信息得到具有更优的空间和文本辨别能力的节点的嵌入表示，从而更准确的从空间和文本的角度将不同节点区分开来。

图5是本申请又一种实施例提供的知识图谱嵌入表示模型训练方法流程图，本实施例以上述实施例为基础进行优化，具体优化如下：

S510、获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体。

S520、通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示。

S530、根据当前节点和邻接节点的更新向量表示，确定当前节点和邻接节点之间的第二关联向量。

S540、通过聚合函数将所述第二关联向量进行聚合，得到当前节点与所有邻接节点之间的第二关联聚合结果，并将所述第二关联聚合结果作为当前节点的最终向量表示。

S550、确定各节点的正样本集和负样本集。

S560、根据各节点的正样本集和负样本集定义损失函数。

S570、确定使损失函数达到最小值时的最优参数，并根据最优参数构建知识图谱嵌入表示模型，以用于确定各节点的嵌入表示。

知识图谱中的每一个节点都对应一个正样本集和负样本集，嵌入表示模型根据每个节点的正负样本集中各节点的最终向量表示进行训练。嵌入表示模型的训练过程是最小化损失函数的过程，通过以最小化损失函数为目标，利用随机梯度下降法优化损失函数中的参数，并根据最优参数构建知识图谱嵌入表示模型，以用于确定各节点的嵌入表示。

损失函数可以根据实际需求进行定义。本申请实施例中，可以通过以下公式对损失函数进行定义：

；

其中

表示sigmoid函数，

表示在由节点

的正采样得到的点集

上的正采样分布，节点

是节点

的正样本集中的样本，

是正样本的个数。

表示负采样，节点

是节点

的负样本集中的样本，

是每个正样本对应的负样本个数。

该损失函数L的目标是使在空间和文本上相近的节点具有相似的嵌入表示，而空间距离较远或语义不相关的节点的嵌入表示在向量空间中距离较远。

本申请实施例中，确定各节点的正样本集和负样本集，包括：

确定知识图谱中各节点之间连线的归一化权重，通过各节点在知识图谱中带权随机游走预设长度，生成各节点的正样本集；

若节点为地点节点，则根据该节点与其他地点节点的空间邻近度确定该节点的负样本集；

若节点为非地点节点，则从知识图谱中的其他所有节点中随机选取节点构成该节点的负样本集；若节点负样本集中的样本已经在该节点的正样本集中，则在该节点的负样本集中舍弃该样本，并重新进行选取。

将知识图谱表达为

，其中V表示节点集合，E表示边的集合。给定一条边

，赋予它一个权重

，该权重计算如下：

如果节点

和

都是地点节点，设置空间邻近度阈值

和文本相似度阈值

。若

和

之间的空间邻近度不小于

，且

和

之间文本相似度不小于

，则连接节点

和

的边的权重

可通过以下公式表达：

；

否则，通过以下公式进行表达：

；

其中，

和

可以根据实验效果进行设置。

如果节点

和

中至少有一个不是地点节点，则

。

在所有边的权重按照上述过程计算之后，对于每个节点

，将与它相连的所有边上的权重归一化为[0, 1]。

将权重归一化后，对于每个节点

，其所对应的正样本集是通过其在知识图谱结构中进行带权随机游走固定长度后生成。

本申请实施例中，

可以为0.9，

可以为0.6，

可以为100，

可以为10，随机游走固定长度可以为5。

在得到节点

的正样本集后，其所对应的负样本可以通过以下方式产生：如果

是一个地点节点，令

表示一个地点节点集合，集合中的地点节点

与

之间的空间相似度小于

，节点

的负样本可以从该集合

中随机均匀地选择出来。如果

不是一个地点节点，则可以从知识图谱中的其他所有节点中随机选取节点构成节点

的负样本集。在负采样的过程中，如果节点

生成的负样本存在于其正样本集合中，那么该负样本就舍弃掉再重新选择。

本申请实施例在构建节点的负样本集时，采用了一种空间距离感知的负样本采样策略，将地点节点之间的空间距离作为负样本采样过程中的重要考虑因素，以此保证负样本不仅在语义上与正样本不同，而且在空间上也区别于正样本，从而使模型学习训练的结果更加符合预期。

需要说明的是，若在模型训练前所述聚合过程只进行一次，即只得到当前节点的更新向量表示，其后续节点的正负样本集的确定方式与上述所述的节点的正负样本集的确定方式相同，区别仅在于，若在模型训练前所述聚合过程只进行一次，得到各节点的更新向量表示，则嵌入表示模型根据每个节点的正负样本集中各节点的更新向量表示进行训练，若进行两次聚合过程，则在两次聚合得到各节点的最终向量表示之后，嵌入表示模型根据每个节点的正负样本集中各节点的最终向量表示进行训练。

本申请实施例通过以下方法对嵌入表示模型进行训练：确定各节点的正样本集和负样本集；根据各节点的正样本集和负样本集定义损失函数；确定使损失函数达到最小值时的最优参数，并根据最优参数构建知识图谱嵌入表示模型，以用于确定各节点的嵌入表示。模型根据正负样本集学习样本之间空间距离以及语义上的信息，使在空间距离和文本语义上相近的节点具有相似的嵌入表示，而空间距离较远或语义不相关的节点的嵌入表示在向量空间中距离较远，即可以从空间和文本的角度将相差较大的节点区分开。

图6是本申请一种实施例提供的知识图谱嵌入表示模型训练装置结构框图，该装置可执行本申请任意实施例所提供的知识图谱嵌入表示模型训练方法，具备执行方法相应的功能模块和有益效果。如图6所示，该装置可以包括：

第一关联向量确定模块610，用于获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体。

第一聚合结果确定模块620，用于通过聚合函数将所述第一关联向量进行聚合，得到当前节点与所有邻接节点之间的第一关联聚合结果，并将所述第一关联聚合结果作为当前节点的更新向量表示。

第一模型训练模块630，用于将所述更新向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。

本申请实施例中，所述装置还包括：

第二关联向量确定模块，用于根据当前节点和邻接节点的更新向量表示，确定当前节点和邻接节点之间的第二关联向量。

第二聚合结果确定模块，用于通过聚合函数将所述第二关联向量进行聚合，得到当前节点与所有邻接节点之间的第二关联聚合结果，并将所述第二关联聚合结果作为当前节点的最终向量表示。

第二模型训练模块，用于将所述最终向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。

本申请实施例中，所述当前节点的邻接节点，包括在知识图谱结构中与当前节点直接相连的邻接节点，和/或，在空间地理位置上与当前节点距离最近的预设数量的邻接节点。

本申请实施例中，所述第一关联向量确定模块610，具体用于：

本申请实施例中，所述第二关联向量确定模块，具体用于：

本申请实施例中，所述第一模型训练模块630，包括：

样本集确定单元，用于确定各节点的正样本集和负样本集；

损失函数确定单元，用于根据各节点的正样本集和负样本集定义损失函数；

嵌入表示确定单元，用于确定使损失函数达到最小值时的最优参数，并根据最优参数构建知识图谱嵌入表示模型，以用于确定各节点的嵌入表示。

本申请实施例中，所述样本集确定单元，具体用于：

产品可执行本申请实施例所提供的知识图谱嵌入表示模型训练方法，具备执行方法相应的功能模块和有益效果。

图7是本申请一种实施例提供的电子设备的结构示意图。图7示出了适于用来实现本申请实施例的示例性电子设备712的框图。图7显示的电子设备712仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示，电子设备712可以包括：一个或多个处理器716；存储器728，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器716执行，使得所述一个或多个处理器716实现本申请实施例所提供的知识图谱嵌入表示模型训练方法，包括：

电子设备712的组件可以包括但不限于：一个或者多个处理器716，存储器728，连接不同设备组件（包括存储器728和处理器716）的总线718。

总线718表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构（ISA）总线，微通道体系结构（MAC）总线，处理型ISA总线、视频电子标准协会（VESA）局域总线以及外围组件互连（PCI）总线。

电子设备712典型地包括多种计算机设备可读存储介质。这些存储介质可以是任何能够被电子设备712访问的可用存储介质，包括易失性和非易失性存储介质，可移动的和不可移动的存储介质。

存储器728可以包括易失性存储器形式的计算机设备可读存储介质，例如随机存取存储器（RAM）730和/或高速缓存存储器732。电子设备712可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机设备存储介质。仅作为举例，存储系统734可以用于读写不可移动的、非易失性磁存储介质（图7未显示，通常称为“硬盘驱动器”）。尽管7中未示出，可以提供用于对可移动非易失性磁盘（例如“软盘”）读写的磁盘驱动器，以及对可移动非易失性光盘（例如CD-ROM, DVD-ROM或者其它光存储介质）读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据存储介质接口与总线718相连。存储器728可以包括至少一个程序产品，该程序产品具有一组（例如至少一个）程序模块，这些程序模块被配置以执行本申请各实施例的功能。

具有一组（至少一个）程序模块742的程序/实用工具740，可以存储在例如存储器728中，这样的程序模块742包括但不限于操作设备、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块742通常执行本申请所描述的实施例中的功能和/或方法。

电子设备712也可以与一个或多个外部设备714和/或显示器724等通信，还可与一个或者多个使得用户能与该电子设备712交互的设备通信，和/或与使得该电子设备712能与一个或多个其它计算设备进行通信的任何设备（例如网卡，调制解调器等等）通信。这种通信可以通过输入/输出（I/O）接口722进行。并且，电子设备712还可以通过网络适配器720与一个或者多个网络（例如局域网（LAN），广域网（WAN）和/或公共网络，例如因特网）通信。如图7所示，网络适配器720通过总线718与电子设备712的其它模块通信。应当明白，尽管图7中未示出，可以结合电子设备712使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID设备、磁带驱动器以及数据备份存储设备等。

处理器716通过运行存储在存储器728中的多个程序中其他程序的至少一个，从而执行各种功能应用以及数据处理，例如实现本申请实施例所提供的知识图谱嵌入表示模型训练方法。

本申请一种实施例提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行本申请实施例所提供的知识图谱嵌入表示模型训练方法，包括：

本申请实施例的计算机存储介质，可以采用一个或多个计算机可读的存储介质的任意组合。计算机可读存储介质可以是计算机可读信号存储介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的设备、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器（RAM）、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请实施例中，计算机可读存储介质可以是任何包含或存储程序的有形存储介质，该程序可以被指令执行设备、装置或者器件使用或者与其结合使用。

计算机可读的信号存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号存储介质还可以是计算机可读存储介质以外的任何计算机可读存储介质，该计算机可读存储介质可以发送、传播或者传输用于由指令执行设备、装置或者器件使用或者与其结合使用的程序。

计算机可读存储介质上包含的程序代码可以用任何适当的存储介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或设备上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

注意，上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

1.一种知识图谱嵌入表示模型训练方法，其特征在于，所述方法包括：

获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量，包括：

将所述关联信息与所述第一拼接向量相乘，得到当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体；

2.根据权利要求1所述的方法，其特征在于，所述将所述第一关联聚合结果作为当前节点的更新向量表示之后，还包括：

根据当前节点和邻接节点的更新向量表示，确定当前节点和邻接节点之间的第二关联向量；

通过聚合函数将所述第二关联向量进行聚合，得到当前节点与所有邻接节点之间的第二关联聚合结果，并将所述第二关联聚合结果作为当前节点的最终向量表示；

将所述最终向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示。

3.根据权利要求1或2所述的方法，其特征在于，所述当前节点的邻接节点，包括在知识图谱结构中与当前节点直接相连的邻接节点，和/或，在空间地理位置上与当前节点距离最近的预设数量的邻接节点。

4.根据权利要求2所述的方法，其特征在于，所述根据当前节点和邻接节点的更新向量表示，确定当前节点和邻接节点之间的第二关联向量，包括：

5.根据权利要求2所述的方法，其特征在于，所述将所述最终向量表示输入知识图谱嵌入表示模型中，得到各节点的嵌入表示，包括：

确定各节点的正样本集和负样本集；

根据各节点的正样本集和负样本集定义损失函数；

确定使损失函数达到最小值时的最优参数，并根据最优参数构建知识图谱嵌入表示模型，以用于确定各节点的嵌入表示。

6.根据权利要求5所述的方法，其特征在于，所述确定各节点的正样本集和负样本集，包括：

7.一种知识图谱嵌入表示模型训练装置，其特征在于，所述装置包括：

第一关联向量确定模块，用于获取知识图谱中当前节点的邻接节点，根据当前节点和邻接节点的初始向量表示，确定当前节点和邻接节点之间的第一关联向量；其中，所述节点用于表征知识图谱中的实体；

所述第一关联向量确定模块，具体用于：将当前节点和邻接节点的初始向量表示进行拼接，得到第一拼接向量；根据当前节点和邻接节点之间的空间邻近度和文本相似度，确定当前节点和邻接节点之间的关联信息；将所述关联信息与所述第一拼接向量相乘，得到当前节点和邻接节点之间的第一关联向量；

8.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，所述一个或多个处理器实现如权利要求1-6中任一项所述的知识图谱嵌入表示模型训练方法。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-6中任一项所述的知识图谱嵌入表示模型训练方法。