CN112541589B

CN112541589B - 基于ahe对齐超平面的文本知识嵌入方法

Info

Publication number: CN112541589B
Application number: CN202011520861.4A
Authority: CN
Inventors: 汪璟玢; 张旺
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2022-10-14
Anticipated expiration: 2040-12-21
Also published as: CN112541589A

Abstract

本发明涉及一种基于AHE对齐超平面的文本知识嵌入方法，包括以下步骤：步骤S1:对数据集进行预训练词向量，获得文本描述的精确表示；步骤S2:采用AHE对齐超平面策略，将文本向量与内部向量对齐为统一的隐含层维度，并分别对头尾实体进行文本超平面投影，获得交互增强的表示向量,并将其应用至知识库基础模型中。解决了传统文本联合学习模型对文本描述引入的不精确性和不灵活性，进一步有效提高知识图谱补全效果。

Description

基于AHE对齐超平面的文本知识嵌入方法

技术领域

本发明涉及知识图谱领域，具体涉及一种基于AHE对齐超平面的文本知识嵌入方法。

背景技术

现有的方法在文本描述的利用上已经有了一定的成功，但仍然存在一些问题。在DKRL^]中，每一个实体分别关联了结构表示向量和描述表示向量，但是其最终的联合模型采用的是简单的一阶约束来同时学习两类向量，这无法有效地捕获文本与三元组的相关性。Han等人的SSP方法改进了这一点，通过建立头尾描述特定的语义超平面来投影内部结构的得分，并在内部结构得分和投影得分之间通过λ超参数权衡二者，这在某种程度上是能够精确捕获的，但其性能依赖于头尾描述信息的语义组成函数，这影响了模型的可扩展性。另外，二者的文本描述向量与结构表示向量都是联合学习的，文本向量的学习通常需要深层神经网络的支持，这产生了很长的训练周期，而结构表示向量往往不需要这一点，联合学习的方法无法在训练时长和训练精度上有一个很好的折衷。

发明内容

有鉴于此，本发明的目的在于提供一种基于AHE对齐超平面的文本知识嵌入方法，解决了传统文本联合学习模型对文本描述引入的不精确性和不灵活性，进一步有效提高知识图谱补全效果。

为实现上述目的，本发明采用如下技术方案：

一种基于AHE对齐超平面的文本知识嵌入方法，包括以下步骤：

步骤S1:对数据集进行预训练词向量，获得文本描述的精确表示；

步骤S2:采用AHE对齐超平面策略，将文本向量与内部向量对齐为统一的隐含层维度，并分别对头尾实体进行文本超平面投影，获得交互增强的表示向量,并将其应用至知识库基础模型中。

进一步的，所述数据集包括FB-Text数据集和WN9-Text数据集。

进一步的，对于FB-Text数据集，采用word2vec框架中为Freebase实体提供的预训练词向量，具体的预训练词向量通过在Google News Dataset上使用skip-gram模型训练得到，并应用l₂范数获得向量的归一化表示。

进一步的，对于WN9-Text数据集，采用AutoExtend框架，具体的使用预训练的300维Golve词向量，当Golve中不存在对应的含义嵌入时，AutoExtend将为这样的同义词生成值为0的初始化向量，并应用l₂范数获得向量的归一化表示。

进一步的，所述步骤S2具体为：

步骤S21:对于一个三元组(s,r,o)，通过步骤S1得到它们文本描述向量s_w(o_w)，以及通过随机初始化的方法得到内部结构向量s_i(o_i)；

步骤S22:利用AHE对齐过程将s_w(o_w)对齐到与s_i(o_i)统一的空间中，得到s_new(o_new)；

步骤S23:通过s_i(o_i)在s_new(o_new)的超平面投影，建模它们之间的交互，得到s'(o')；

步骤S24:将得到的s'(o')输入到原始模型的得分函数中，得到融合文本描述信息的新得分。

进一步的，所述AHE对齐过程包括直接映射和串联映射

具体地，设全连接权重M和偏移量b，则直接映射方法的公式如下：

e_new＝M·e_w+b (2)

串联映射具体为，对于输入e_w和e_i，利用拼接函数将二者在纵向进行拼接，得到新的向量，然后经过全连接层提取它们的联合特征，公式如下：

e_new＝M·concat(e_w；e_i)+b (3)。

进一步的，所述超平面投影具体为：

将新的文本向量e_new视为正交特征，并将内部表示向量投影到文本向量的超平面上，对于头尾实体采用一致的操作；

给定实体内部表示向量e_i，将e_new视为超平面的法向量，则新的实体向量的计算过程如下：

其中，

为点在法向量的投影强度，

为法向投影向量；一个向量的投影通常被分解为法向和切向方向，切向方向就是投影的结果，即由公式(5)得到新的头尾实体向量即：

进一步的，所述知识库基础模型包括传统翻译模型TransE、语义匹配模型DistMult以及旋转翻译模型RotatE。

进一步的，所述传统翻译模型TransE、语义匹配模型DistMult以及旋转翻译模型RotatE得分函数分别为

TransE:f_r(s,o)＝||s+r-t||₁ (6)

DistMult:f_r(s,o)＝s^Tdiag(r) o (7)

RotatE:f_r(s,o)＝||sor-o||₁ (8)

对于RotatE，对其实部和虚部的表示分别进行了AHE步骤，即e₁'＝AHE(e₁,e_w)和e₂'＝AHE(e₂,e_w)，其中e₁和e₂分别表示RotatE复数嵌入的实部和虚部；

扩展后的各模型，分别命名为AHE-TransE，AHE-DistMult和AHE-RotatE，其得分函数分别定义为：

AHE-TransE:f_r(s,o)＝||AHE(s)+r-AHE(o)||₁ (9)

AHE-DistMult:f_r(s,o)＝AHE(s)^Tdiag(r)AHE(o) (10)

AHE-RotatE:f_r(s,o)＝||AHE(s)or-AHE(o)||₁ (11)。

进一步的，所述原始模型的损失函数采用RotatE中的自对抗负采样损失函数，其公式如下：

其中p(s′_n,r,o′_n)表示负采样三元组的概率分布，它是三元组特定的概率分布，即：

超参数α表示采样温度。

本发明与现有技术相比具有以下有益效果：

1、本发明解决了传统文本联合学习模型对文本描述引入的不精确性和不灵活性，有效提高知识图谱补全效果；

2、本发明采用预训练语言向量充分建模文本描述的语义特征，并为此提出了两种简单的对齐策略，在不影响模型鲁棒性的前提下，对齐了文本表示和内部结构表示；

3、本发明将内部结构表示投影到文本的超平面中，得到了文本联合的实体表示，达到了扩展基础模型的目的。

附图说明

图1是本发明一实施例中AHE的总体结构图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

请参照图1，本发明提供一种基于AHE对齐超平面的文本知识嵌入方法，包括以下步骤：

在本实施例中，表1为本实施例的相关符号定义；

在本实施例中，采用文本建模策略，对于FB-Text数据集，采用word2vec框架中为Freebase实体提供的预训练词向量(1000维)，具体的预训练词向量通过在Google NewsDataset上使用skip-gram模型训练得到，并应用l₂范数获得向量的归一化表示。

对于WN9-Text数据集，采用AutoExtend框架，具体的使用预训练的300维Golve词向量，当Golve中不存在对应的含义嵌入时，AutoExtend将为这样的同义词生成值为0的初始化向量，并应用l₂范数获得向量的归一化表示。

在本实施例中，AHE对齐超平面策略具体为：对于一个三元组(s,r,o)，通过步骤S1得到它们文本描述向量s_w(o_w)，以及通过随机初始化的方法得到内部结构向量s_i(o_i)；利用AHE对齐过程将s_w(o_w)对齐到与s_i(o_i)统一的空间中，得到s_new(o_new)；通过s_i(o_i)在s_new(o_new)的超平面投影，建模它们之间的交互，得到s'(o')；将得到的s'(o')输入到原始模型的得分函数中，得到融合文本描述信息的新得分。

优选的，AHE对齐过程包括直接映射和串联映射

a)直接映射。一种简单迅速得到确定维度向量的方法。具体地，假设全连接权重M和偏移量b，则直接映射方法的公式如下：

e_new＝M·e_w+b (2)

b)串联映射。全连接的方法可以达到迅速改变维度的目的，但这样无法确保信息之间的充分交互，为此，我们提出采用串联映射的方法。具体地，对于输入e_w和e_i，我们利用拼接函数将二者在纵向进行拼接，得到新的向量，然后经过全连接层提取它们的联合特征，公式如下：

e_new＝M·concat(e_w；e_i)+b

(3)

优选的，为了保持AHE策略的简洁性和易扩展性，不采用卷积的方法建模二者的交互，其缘由在于卷积会给特征联合过程带来了昂贵的计算复杂度，从而影响模型的性能。

在本实施例中，所述超平面投影具体为：

其中，

为点在法向量的投影强度，

在本实施例中，在三个不同种类的表示学习模型下尝试应用AHE策略，分别是传统翻译模型TransE^[3]、语义匹配模型DistMult^[4]以及旋转翻译模型RotatE^[5]，它们的得分函数如下：

TransE:f_r(s,o)＝||s+r-t||₁ (6)

DistMult:f_r(s,o)＝s^Tdiag(r) o (7)

RotatE:f_r(s,o)＝||sor-o||₁ (8)

AHE-TransE:f_r(s,o)＝||AHE(s)+r-AHE(o)||₁ (9)

AHE-DistMult:f_r(s,o)＝AHE(s)^Tdiag(r)AHE(o) (10)

AHE-RotatE:f_r(s,o)＝||AHE(s)or-AHE(o)||₁ (11)。

优选的，在本实施中，损失函数采用RotatE中的自对抗负采样损失函数，其公式如下：

超参数α表示采样温度。

实施例1：

本实施例，为验证本发明的有效性，在数据集FB-Text和WN9-Text上进行了知识图谱补全，每个数据集都划分成了训练集和测试集。

对于测试集中的每一个三元组，利用知识图谱中的全部实体，去替换其尾实体或者头实体(不同时替换)，来产生全新的三元组，并利用新的得分f_r(s,o)对其进行评分。在对这些得分降序排列之后，获得原始三元组在一次查询中的排名次序。采用平均排名(MeanRank，MR)和排名小于等于N的测试三元组比例(Hits@N，N＝1,3,10)以及平均排名倒数(Mean Reciprocal Rank，MRR)作为评估指标。较低的MR和较高的Hits@N、MRR都意味着模型有更好的性能。

在本实施例中，使用Adam作为优化算法，并使用栅格检索法来寻找最适合的超参，参考Sun等人的设置，本模型需要调整的超参数及其范围如表1所示。

表1 AHE的超参数和范围

本发明实现的三个扩展模型，最终的调参结果如表2所示。对于DistMult族模型，可能会使用N3正则化策略，本文统一设置正则化系数为2e-6。

表2 AHE调参结果

得到高评估指标的模型F之后，将模型应用于G中，遍历G中的所有实体和关系，组合成(s,r,？)的查询对，同时过滤掉已经出现在G中的查询，最后得到的集合作为查询集。对于查询集中的每一个查询，通过F预测出它对应的尾实体o，这样每一个查询都得到了补全，变成了三元组，将它们加入G，最后得到W。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种基于AHE对齐超平面的文本知识嵌入方法，其特征在于，包括以下步骤：

步骤S2:采用AHE对齐超平面策略，将文本向量与内部向量对齐为统一的隐含层维度，并分别对头尾实体进行文本超平面投影，获得交互增强的表示向量,并将其应用至知识库基础模型中；

所述步骤S2具体为：

步骤S24:将得到的s'(o')输入到知识库基础模型的得分函数中，得到融合文本描述信息的新得分；

所述超平面投影具体为：

其中，

为点在法向量的投影强度，

所述知识库基础模型包括传统翻译模型TransE、语义匹配模型DistMult以及旋转翻译模型RotatE；

所述传统翻译模型TransE、语义匹配模型DistMult以及旋转翻译模型RotatE得分函数分别为

TransE:f_r(s,o)＝||s+r-t||₁ (6)

DistMult:f_r(s,o)＝s^Τdiag(r)o (7)

AHE-TransE:f_r(s,o)＝||AHE(s)+r-AHE(o)||₁ (9)

AHE-DistMult:f_r(s,o)＝AHE(s)^Τdiag(r)AHE(o) (10)

2.根据权利要求1所述的基于AHE对齐超平面的文本知识嵌入方法，其特征在于，所述数据集包括FB-Text数据集和WN9-Text数据集。

3.根据权利要求2所述的基于AHE对齐超平面的文本知识嵌入方法，其特征在于，对于FB-Text数据集，采用word2vec框架中为Freebase实体提供的预训练词向量，具体的预训练词向量通过在Google News Dataset上使用skip-gram模型训练得到，并应用l₂范数获得向量的归一化表示。

4.根据权利要求2所述的基于AHE对齐超平面的文本知识嵌入方法，其特征在于，对于WN9-Text数据集，采用AutoExtend框架，具体的使用预训练的300维Golve词向量，当Golve中不存在对应的含义嵌入时，AutoExtend将为这样的同义词生成值为0的初始化向量，并应用l₂范数获得向量的归一化表示。

5.根据权利要求1所述的基于AHE对齐超平面的文本知识嵌入方法，其特征在于，所述AHE对齐过程包括直接映射和串联映射

e_new＝M·e_w+b (2)

e_new＝M·concat(e_w；e_i)+b (3)。

6.根据权利要求1所述的基于AHE对齐超平面的文本知识嵌入方法，其特征在于，所述知识库基础模型的损失函数采用RotatE中的自对抗负采样损失函数，其公式如下：

超参数α表示采样温度。