CN113761223A

CN113761223A - 一种采用注意力机制的循环神经嵌入表示方法

Info

Publication number: CN113761223A
Application number: CN202110998520.6A
Authority: CN
Inventors: 胡余强; 刘琳岚
Original assignee: Nanchang Hangkong University
Current assignee: Nanchang Hangkong University
Priority date: 2021-08-27
Filing date: 2021-08-27
Publication date: 2021-12-07
Anticipated expiration: 2041-08-27
Also published as: CN113761223B

Abstract

本发明公开了一种采用注意力机制的循环神经嵌入表示方法，包括如下步骤：S1，构建基于随机游走的方法对知识图谱中以三元组中两实体为两端进行多跳路径的提取，多跳路径包括关系路径和实体路径；S2，利用循环神经网络在序列中的良好效果，进而将多跳实体路径嵌入表示成其对应的多跳实体路径向量，多跳关系路径嵌入表示成其对应的多跳关系路径向量，根据注意力机制用来实现对以知识图谱中三元组两端构成的实体子图和关系子图的向量表示。本发明利用RNN实现对知识图谱的向量表示，实现对知识图谱全局特征的提取，提出了Att‑RNN模型，解决了现有技术难以兼顾基于知识图谱特征表示的时间和空间的简单性和全局特征信息的表征的问题。

Description

一种采用注意力机制的循环神经嵌入表示方法

技术领域

本发明涉及知识图谱嵌入表示技术领域，特别是涉及一种采用注意力机制的循环神经嵌入表示方法。

背景技术

目前，知识图谱表示学习技术取得了巨大的进步，表示学习可以是利用机器学习实现知识图谱中实体和关系的低维稠密向量表示。大致分为基于翻译模型、双线性模型、基于神经网络模型和图嵌入模型。

图嵌入包括节点嵌入，边嵌入和整图嵌入。其中Node2vec、deepWalk和RDF2Vec将Skip-gram扩展到图数据，对序列中节点之间的高阶相似性进行建模。LINE和SDNE考虑到图中有大量节点间的连接是缺失的情况，采用节点的二阶相似性作为一阶相似性的补充，即利用两节点共有的邻居节点来表征它们的相似性。

然而，上述知识图谱嵌入表示方法中，通常很难兼顾基于知识图谱特征表示的时间和空间的简单性和全局特征信息的表征。

发明内容

针对上述问题，本发明的目的在于提出一种采用注意力机制的循环神经嵌入表示方法，以解决现有技术难以兼顾基于知识图谱特征表示的时间和空间的简单性和全局特征信息的表征的问题。

本发明采用的技术方案如下：一种采用注意力机制的循环神经嵌入表示方法，包括如下步骤：

S1，构建基于随机游走的方法对知识图谱中以三元组中两实体为两端进行多跳路径的提取，多跳路径包括关系路径和实体路径；

S2，利用循环神经网络(RNN)在序列中的良好效果，进而将多跳实体路径嵌入表示成其对应的多跳实体路径向量，多跳关系路径嵌入表示成其对应的多跳关系路径向量，根据注意力机制用来实现对以知识图谱中三元组两端构成的实体子图和关系子图的向量表示。

其中，步骤S1具体包括：

S11，定义相关概念，其中包括子图、关系子图、实体子图、多跳实体路径、多跳关系路径和三元组基本概念的描述；

S12，序列获取，利用随机游走获取多跳实体序列和多跳关系序列，以序列作为循环神经网络的输入；

S13，序列向量表示，利用循环神经网络在序列中良好的表现以实现多跳序列的表示向量。

其中，步骤S2中根据注意力机制用来实现对以知识图谱中三元组两端构成的实体子图和关系子图的向量表示，其向量表示的过程为：

子图向量表示，使用注意力机制得到子图中多跳序列与三元组之间的相关性权重，获取最后的多跳序列构成的关系子图和实体子图的向量表示。

根据本发明提供的采用注意力机制的循环神经嵌入表示方法，采用基于注意力机制的循环神经网络的知识图谱表示模型(Att-RNN模型)，用来实现对以知识图谱中三元组两端构成的实体子图和关系子图的向量表示。本发明首先利用RNN实现对知识图谱的向量表示，实现对知识图谱全局特征的提取，提出了Att-RNN模型，解决了现有技术难以兼顾基于知识图谱特征表示的时间和空间的简单性和全局特征信息的表征的问题。

附图说明

图1为采用注意力机制的循环神经网络的知识图谱表示模型示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种采用注意力机制的循环神经嵌入表示方法，首先采用随机游走的方法对知识图谱中以三元组中两实体为基础进行多跳路径的提取，多跳路径包括关系路径和实体路径；然后利用循环神经网络在序列中的良好效果，进而将多跳实体路径嵌入表示成其对应的多跳实体路径向量，多跳关系路径嵌入表示成其对应的多跳关系路径向量，根据注意力机制用来实现对以知识图谱中三元组两端构成的实体子图和关系子图的向量表示，其具体的实施方式如下：

第一步：概念定义

知识图谱

表示为

其中ε为实体集合、

为关系集合。三元组记为

中，其中h,t∈ε分别记为头实体和尾实体，

记为关系。三元组中关系元素构成的多跳关系序列集合记为

三元组中实体元素构成的多跳实体序列集合记为

三元组

对应的关系子图

实体子图

定义如下:

定义1：关系子图

实体子图

实体子图是由实体路径组成的集合，关系子图是由关系路径组成的集合，定义为

其中

为单跳序列，多跳关系子图

其中多跳关系序列

多跳实体子图

其中多跳实体序列

且

表示跳数，其中多跳序列中又可分为多跳关系序列以及多跳实体序列。

定义2：子图相似性：同一关系子图中不同多跳关系序列之间的相似性描述或者同一实体子图中不同多跳实体序列之间的相似性描述。对于子图

子图相似性取决于实体子图

中的多跳实体序列和

的单跳实体序列π_ht0之间的相似性和关系子图

中的多跳实体序列和

的单跳关系序列r₀之间的相似性。

第二步：利用双向随机游走获取实体序列和关系序列

由于

中r₀和π_ht0的获取相对简单，关系子图

和实体子图

构建的问题的关键是在知识图谱中获取给定两实体之间的多跳序列。这里采用双向随机游走的方法来得到基于两实体之间的多跳关系序列和实体序列。但这样做过于复杂导致效率很低，因此要获取给定的两实体之间的序列，可以基于实验的基础上选择最优的

其原因如下:第一，多跳数目增加导致多跳序列会成指数形式的增长；第二，太长的多跳序列导致与对应单跳序列中实体和关系的相关性大大降低影响实验结果。因此，在实际构建社区时往往会设置序列最大跳数

(综合考虑获取多跳序列集合的获取时间和子图序列相似性，通过实验找到最优的

)。

第三步：利用RNN获取序列的表示向量

为了在嵌入向量空间计算

和

之间的相似性，需要先计算子图中

中每条序列的嵌入向量。如图1中，RNN模型由三层组成。在第一个隐藏层，其输入为多跳关系序列或者是多跳实体序列。第一个隐藏层的隐藏状态根据下式进行计算:

多跳关系子图

其中多跳序列

多跳实体子图

其中多跳实体序列

且

表示跳数；

其中，Xt表示输入多跳序列

或者多跳实体序列

中第t个元素的嵌入向量，U1和W1表示第一层的权重系数矩阵，

和

表示第t阶和第

阶的状态，σ为非线性激活函数。

第二层是学习多跳关系序列和多跳实体序列中相互的依赖关系。由于有些知识图谱多跳序列

可能是较大，第二层将系数p(2)设为4。该层状态根据下式计算:

其中U2和W2为第二层的权重系数矩阵。

为了获得序列中实体和实体或者关系和关系之间的交互，在RNN的输出层增加了奇偶阶之间的交互连接，分别对应于实体和实体或者关系和关系。最后，多跳序列π_i(π_ri或者π_hti)的嵌入向量等于输出层最后一阶的输出:

其中W_r和W_e分别表示对应于相应所在的权重系数矩阵，

和

分别是第二层在第T-1和第T阶的状态，σ为输出层的激活函数。

第四步：使用注意力机制得到子图中多跳序列与三元组之间的相关性权重

考虑到注意力机制对于上述问题能很好的进行解决，在这通过RNN得到的序列嵌入向量得到子图

中多跳序列(关系序列和实体序列)的嵌入向量为π1,π2,..,,πi,...,πq，三元组的嵌入关系向量为r₀和嵌入实体向量为π_ht0,用抽象字母x代替方便计算。多跳序列与三元组之间的相关性权重通过下式进行计算:

其中[π_i；x]表示向量π_i和向量x的垂直相接，其中

W表示间接矩阵和b_a为偏置值。a＝[a₁，a₂，、、、，a_q]为对应多跳序列的相关权重向量。

因此三元组子图的向量表示为下式:

根据上述的采用注意力机制的循环神经嵌入表示方法，采用基于注意力机制的循环神经网络的知识图谱表示模型(Att-RNN模型)，用来实现对以知识图谱中三元组两端构成的实体子图和关系子图的向量表示。本发明首先利用RNN实现对知识图谱的向量表示，实现对知识图谱全局特征的提取，提出了Att-RNN模型，解决了现有技术难以兼顾基于知识图谱特征表示的时间和空间的简单性和全局特征信息的表征的问题。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种采用注意力机制的循环神经嵌入表示方法，其特征在于，包括如下步骤：

S2，利用循环神经网络在序列中的良好效果，进而将多跳实体路径嵌入表示成其对应的多跳实体路径向量，多跳关系路径嵌入表示成其对应的多跳关系路径向量，根据注意力机制用来实现对以知识图谱中三元组两端构成的实体子图和关系子图的向量表示。

2.根据权利要求1所述的采用注意力机制的循环神经嵌入表示方法，其特征在于，步骤S1具体包括：

3.根据权利要求1所述的采用注意力机制的循环神经嵌入表示方法，其特征在于，步骤S2中根据注意力机制用来实现对以知识图谱中三元组两端构成的实体子图和关系子图的向量表示，其向量表示的过程为：