CN115292509A

CN115292509A - 基于多粒度注意力网络的图立方链接预测方法

Info

Publication number: CN115292509A
Application number: CN202210757940.XA
Authority: CN
Inventors: 庞俊; 刘小琪; 任亮; 林晓丽; 张鸿; 张晓龙; 李波
Original assignee: Wuhan University of Science and Engineering WUSE
Current assignee: Wuhan University of Science and Engineering WUSE
Priority date: 2022-06-29
Filing date: 2022-06-29
Publication date: 2022-11-04

Abstract

本发明公开了一种基于多粒度注意力网络的图立方链接预测方法，包括：对待补全的图立方进行加载，获得图立方中的实体和关系；对加载的实体和关系进行初始化，得到初始实体嵌入向量和初始关系嵌入向量；将初始实体嵌入向量和初始关系嵌入向量输入多头自注意力神经网络中，更新各多元关系的实体嵌入向量和关系嵌入向量；将更新后的实体嵌入向量和关系嵌入向量输入到HPMG模型中进行训练；通过评分模块对每个多元关系评分，根据评分指标来判断多元关系的评分结果是否正确：若正确，则将正确的多元关系添加到图立方中，补全图立方，若错误，则将错误的多元关系舍弃。本发明从多粒度的角度对多元关系进行评分，提升了链接预测的准确率。

Description

基于多粒度注意力网络的图立方链接预测方法

技术领域

本发明涉及图立方技术领域，具体涉及一种基于多粒度注意力网络的图立方链接预测方法。

背景技术

知识图谱补全是改善知识图谱质量的核心问题，而在知识图谱中进行链接预测是图谱补全的有效方法。现有的知识图谱链接预测大多数仅仅考虑预测二元关系，然而现实生活中的关系往往是多元的。包含多元关系的图可以称为知识超图，为突出知识超图的立体性，本发明称知识超图为图立方。其中每一个多元关系可以由超边建模，图立方链接预测旨在预测超图中缺失的多元关系，以实现图立方补全、改善图谱质量。

现有图立方链接预测大量使用了基于嵌入表示模型的方法，这类方法的优点是可以将复杂的数据结构映射到欧式空间，转化为向量化表示，更容易发现关联关系，完成推理。现有方法的一种思路是将多元关系转化为多个二元关系建模，但是这样建模多元关系中的实体建模存在先后、主次之分；还有一种思路是直接建模多元关系，这种模型中虽然关系已经是多维度建模，但是没有考虑2到m-1维度的多元关系表达，因此在预测中会缺失大量少于m维的关系。

发明内容

本发明为了克服以上技术的不足，提供了一种基于多粒度注意力网络的图立方链接预测方法。

术语解释:

1、HPMG：Knowledge Hypergraph Link Prediction based on Multi-GranularAttention Network，基于多粒度神经网络的图立方预测。

2、ATT：Attention module，注意力模块。

3、MFF：Multi-feature fusion，多特征融合。

4、MRR：Mean Reciprocal Rank，平均倒数排名。

本发明首先通过二维卷积分别学习每个关系粗粒度的超边特征和δ-细粒度的实体特征，然后基于上一步获取的粗粒度特征、δ-细粒度特征分别进行粗粒度评分和δ-细粒度评分，最后对得到的粗粒度评分和δ-细粒度评分结果进行加权求和操作，计算出每个关系的最终评分，完成链接预测。进一步引入了一种基于注意力机制的多特征融合方法MFF，完成HPMG模型中m个实体的细粒度特征融合任务，进一步提升链接预测准确率。

本发明克服其技术问题所采用的技术方案是：

一种基于多粒度注意力网络的图立方链接预测方法，其特征在于，用于对图立方中的未知多元关系进行推理预测，至少包括步骤：

S1、对待补全的图立方进行加载，获得图立方中的实体和关系；

S2、对步骤S1加载获得的实体和关系进行初始化，得到初始实体嵌入向量和初始关系嵌入向量；

S3、将步骤S2得到的初始实体嵌入向量和初始关系嵌入向量输入多头自注意力神经网络中，更新各多元关系的实体嵌入向量和各多元关系的关系嵌入向量；

S4、将步骤S3更新后的实体嵌入向量和关系嵌入向量输入到HPMG模型中进行训练，所述HPMG模型至少包括粗粒度评分模块、δ-细粒度评分模块和评分模块，通过所述粗粒度评分模块学习每个关系粗粒度的超边特征并进行粗粒度评分，通过所述δ-细粒度评分模块学习每个关系δ-细粒度的实体特征并进行细粒度评分，将粗粒度评分与细粒度评分进行加权求和得到各多元关系成立的评分；

S5、通过评分模块对每个多元关系进行评分，得出预测结果，根据评分指标来判断多元关系的评分结果是否正确：若正确，则将正确的多元关系添加到图立方中，补全图立方，若错误，则将错误的多元关系舍弃。

进一步地，设图立方是由节点和超边组成的图，其中，节点也叫做实体，超边也叫做多元关系，图立方记作：

KHG＝{H，F}

上式中，H＝{h₁，h₂，...，h_|H|}，表示KHG中实体的集合，|H|表示KHG所含实体的数量；F＝{f₁，f₂，...，f_|F|}，表示多元关系的集合，即超边的集合，|F|表示KHG所含超边的数量；任意一条多元关系f都对应一个元组f＝(h₁，h₂，...，h_m，r)，其中，m表示多元关系f所含实体的数量，即m是多元关系的元数，m为正整数，r表示关系。

进一步地，步骤S3具体包括：

首先对多元关系包含的所有初始实体嵌入向量和初始关系嵌入向量进行串联操作，得到f＝(h₁，h₂，...，h_m，r)，以获取含多元关系内部语义信息的关系和实体的嵌入表示；

然后通过多头自注意力神经网络学习f内部语义差别并更新f，得到更新后的多元关系中实体嵌入向量和关系嵌入向量F_all，计算过程如等式(1)和等式(2)所示：

F_all＝M_self-att(fW_n) (1)

上式中，

均表示权重矩阵，n∈(1，...，5)，矩阵F_all分别与权重矩阵相乘得到K_n，Q_n，V_n；

上式中，M_self-att表示自注意力神经网络计算函数，W⁰为参数矩阵，d_k表示K的维数，Concat为向量拼接操作。

进一步地，步骤S4中，粗粒度评分模块用于学习多元关系包含的所有实体(h₁，h₂，...，h_m)与关系r之间的联系，以获取更丰富的超边语义特征；通过粗粒度评分模块进行粗粒度评分具体包括：

将经过多头自注意力神经网络更新后的F_all输入到二维卷积神经网络，进行标准化处理后使用ReLU非线性激活函数进行处理，从而得到一组超关系特征矩阵Fea_Coa，计算过程如等式(3)：

Fea_Coa＝σ(BN(conv2(F_all)) (3)

上式中，BN(·)为BatchNorm2d函数，σ(·)为非线性激活函数ReLU，conv2(·)表示卷积核大小为(m+1)*3的二维卷积操作；

然后，计算多元关系f的粗粒度评分：将超关系特征矩阵Fea_Coa按列展开后输入到全连接神经网络，计算出粗粒度评分mScore，计算过程如等式(4)所示：

mScore＝FCN₁(Flatten(Fea_Coa)) (4)

上式中，Flatten表示将张量按列展开，FCN₁表示全连接操作。

进一步地，步骤S4中，δ-细粒度评分模块用于对具有m个实体的多元关系从1细粒度到δ细粒度的学习，δ＝m-1；通过δ-细粒度评分模块对i细粒度进行细粒度评分具体包括如下，i＝1，2，...，δ：

首先，分别串联经过多头自注意力神经网络更新后的多元关系嵌入向量，包括实体的不同粒度组合Com(h_j)_i和关系r，记作

其中，

Com(h_j)_i表示m元关系的i粒度实体组合；

然后，为了获取多元关系f实体的i维特征，将

输入一个二维卷积神经网络，经过标准化并使用ReLU非线性激活函数进行处理，从而得到实体的不同粒度组合Com(h_j)_i基于关系r的特征

计算过程如等式(5)所示：

上式中，conv2′为卷积核大小为(i+1)*3的二维卷积操作；

接着，完成

的特征融合，使用最小值特征融合方法对上一步得到的

组特征分别进行特征融合，计算过程如等式(6)所示：

上式中min()表示取所有

每个维度的最小值作为该维度的结果

最后，计算f的i-细粒度评分，将每个

按列展开后输入到全连接神经网络计算出i-细粒度评分Score_i，计算过程如等式(7)所示：

上式中，FCN₂为全连接操作。

进一步地，所述HPMG模型还包括用于对δ-细粒度评分模块进行优化的优化模块。

进一步地，在步骤S4之后、步骤S5之前，还包括步骤S4′：

所述优化模块采用基于注意力模块ATT的多特征融合方法，即MFF，将步骤S4中的δ-细粒度评分模块卷积后得到的多个实体特征输入MFF中进行特征融合，融合后的特征输入全连接神经网络得到各细粒度评分。

进一步地，步骤S4′中，通过注意力模块ATT得到总体注意力特征图谱具体包括如下：

通过全局注意力分支提取输入特征的全局特征注意力，全局特征注意力提取过程如等式(8)所示，通过全局平均池化和全连接操作获得特征的全局注意力；首先使用全局平均池化操作将原始输入特征压缩成一维参数，该一维参数获得了原始特征的全局视野，然后采用第一个全连接层FCN₃对重要性进行预测，得到重要性参数，最后用ReLU激活，并输入全连接层FCN₄以恢复原始特征的维度，最终得到的X_g包含了原始特征全局的重要性；

X_g＝B(FCN₄(σ(FCN₃(GAP(X))))) (8)

上式中，GAP为全局平均池化操作，FCN₃和FCN₄均为全连接操作；

通过局部注意力分支提取输入特征的局部特征注意力，局部特征注意力提取是通过点卷积PWConv来获取特征的局部注意力，其计算过程如等式(9)所示，将原始输入特征X输入两层卷积神经网络，两层中间使用ReLU函数进行激活；首先采用核大小为C/r×C×1×1的点卷积PWConv₁减少通道数，然后再通过核大小为C×C/r×1×1的点卷积PWConv₂卷积恢复通道数，最终得到的X_l可以保留、突出显示特征的细微细节；

X_l＝B(PWConv₂(σ(B(PWConv₁(X))))) (9)

上式中，B(.)为批标准化函数；

最后，将上述的全局注意力和局部注意力通过广播求和后经过Sigmoid函数激活得到权重值，利用该权重值对原始输入特征X做注意力操作后将各通道特征通过求平均的操作得到仅有一通道的输出X′，如式(10)所示；

上式中，F_att(.)为全局注意力计算函数，λ为Sigmoid函数，

为广播求和操作，

为对应元素相乘，avg为求各个通道的平均。

进一步地，步骤S4′中，通过多特征融合方法MFF进行特征融合具体包括：

设有α＝C_m ⁱ个特征需要融合，先将任意两个特征进行融合，然后将上一步的融合结果与第三个特征进行融合，如此循环操作，直至融合完第α个特征为止，其计算过程如等式(11)所示；

上式中，MFF(.)为多特征融合函数，F_f表示两特征融合函数，其具体计算过程如式(12)所示；

上式中，

种

表示i细粒度下基于实体的第b个特征和第c个特征，F_att(.)为注意力函数，用于求得注意力矩阵，其具体计算过程如式(13)所示；

上式中，FCN₃和FCN₄为全连接操作。

进一步地，步骤S5中，判断多元关系的评分结果是否正确，具体包括如下：

在进行预测时，已知一个多元关系的集合F，设f为测试集F_test中任意一个正例，对于f中任意位置上的一个实体，用其他的所有非此元素的实体替代，得到该关系的一组负例，然后从这些负例中删除已被F包含的正例，得到候选样本；接着，将上一步得到的候选样本和原始正例f输入HPMG模型获取评分，评分函数如式(14)所示；根据评分进行排名，从而获取正例f的名次rank；根据rank计算的方法不同，采用Hit@n或MRR两者中的任意一种评分方法；

上式中，w_k为权重参数，通过神经网络训练得到，Hit@k表示排名前k的所有正例样本的比率，即测试集中排名进入前k的正例关系的数目除以测试集所有关系的数目，其计算公式如等式(15)所示，Hit@k取值范围为[0，1]，值越大，表明推理算法效果越好；

上式中，rank(f)≤n？1：0为判别排名是否进入前n的条件表达式，若成立则结果为1，否则为0；count(F_test)表示测试集包含的关系的总数；

MRR表示平均导数排名，计算每个正例名次的倒数的平均值，其计算公式如等式(16)所示，MRR取值范围为[0，1]，值越大，效果越好；

其中，n取1和10。

本发明的有益效果是：

本发明提出了图立方多元关系表示模型，得到一个包含多个实体的多元组来表示多元关系。在建模时考虑了图立方中多元关系的平等性；提出了基于多粒度神经网络的超边预测模型HPMG，从不同粒度联合完成图立方的学习和预测。充分考虑了图立方中不同维度多元关系的整体性；提出了基于多粒度注意力网络的图立方链接预测模型，引入一种基于注意力机制的多特征融合方法MFF对HPMG进行优化，结合全局注意力和局部注意力实现了不同特征的有区分融合，提升了模型预测性能。

附图说明

图1是本发明所述的基于多粒度注意力网络的图立方链接预测方法的流程图。

图2是本发明所述的基于多粒度注意力网络的图立方链接预测方法使用的模块的结构框图。

图3是本发明的HPMG模型原理示意图。

图4是本发明的多特征融合方法MFF中注意力模块ATT原理示意图。

图5是本发明的多特征融合方法MFF原理图。

具体实施方式

为了便于本领域人员更好的理解本发明，下面结合附图和具体实施例对本发明做进一步详细说明，下述仅是示例性的不限定本发明的保护范围。

本发明提供了一种基于多粒度注意力网络的图立方链接预测方法，用于对图立方中的未知多元关系进行推理预测，如图1～图5所示。

其中，图1为本发明所述的基于多粒度注意力网络的图立方链接预测方法的流程图。图2为本发明所述的基于多粒度注意力网络的图立方链接预测方法使用的模块的结构框图。图3为HPMG模型原理示意图，首先通过二维卷积分别学习每个关系粗粒度的超边特征和δ-细粒度的实体特征，然后基于上一步获取的粗、δ-细粒度特征分别进行粗粒度评估和δ-细粒度评分，最后对得到的粗、δ-细粒度评分结果进行加权求和操作，计算出每个关系的最终评分，完成链接预测。图4描述了本发明的多特征融合方法MFF中注意力模块ATT原理，ATT模型主要包括三步：获取局部特征注意力、获取全局特征注意力以及得到总体注意力特征图谱。图5为本发明的多特征融合方法MFF原理示意图，MFF模型使用ATT模块得到两特征和的特征图，然后分别加权得到融合后的特征。

本实施例所述的基于多粒度注意力网络的图立方链接预测方法，具体包括如下步骤：

步骤S1、对待补全的图立方进行加载，获得图立方中的实体和关系。

具体地，本实施例所使用的图立方以文本的形式存储，并通过数据加载函数将图立方以多元关系的形式加载到HPMG模型中进行处理，多元关系之间可能存在相同的超边或实体，通过这些相同的超边与实体，多元关系与多元关系之间就构成了联系，从而组成了一整个图立方，其中包含了丰富的语义信息，能够反应现实中包含的事实。

设图立方是由节点和超边组成的图，其中，节点也叫做实体，超边也叫做多元关系，图立方记作：

KHG＝{H，F}

步骤S2、对步骤S1加载获得的实体和关系进行初始化，得到初始实体嵌入向量和初始关系嵌入向量。

在加载图立方之后，需要对其中的实体和关系进行初始化，将它们转化为嵌入向量。具体的初始化方式类似于词嵌入的处理方法，根据词的数量和定义的维度来得到一个词矩阵，将词矩阵与随机初始化的嵌入矩阵相乘得到词嵌入向量。本发明根据实体信息和关系信息初始化出类似于词矩阵的实体矩阵和关系矩阵，然后将它们与随机初始化的矩阵相乘得到它们的初始实体嵌入向量和初始关系嵌入向量。这样就将图立方中的实体和关系嵌入到连续向量空间，从而在方便计算的同时保留图立方中的结构信息，通过嵌入表示将复杂的数据结构转化为向量化的表示，可以为后续工作的开展提供便利。在进行图立方推理时，实体和关系的嵌入表示可以通过将图结构中隐含的关联信息映射到欧氏空间，使得原本难以发现的关联关系变得显而易见，使用实体嵌入向量和关系嵌入向量进行推理的图立方链接预测，就能够更好的完成推理的任务并预测出位置的实体和关系。

步骤S3、将步骤S2得到的初始实体嵌入向量和初始关系嵌入向量输入多头自注意力神经网络中，更新各多元关系的实体嵌入向量和各多元关系的关系嵌入向量。

具体地，首先对多元关系包含的所有初始实体嵌入向量和初始关系嵌入向量进行串联操作，得到f＝(h₁，h₂，...，h_m，r)，以获取含多元关系内部语义信息的关系和实体的嵌入表示；

F_all＝M_self-att(fW_n)(1)

上式中，

步骤S4、将步骤S3更新后的实体嵌入向量和关系嵌入向量输入到HPMG模型中进行训练，所述HPMG模型至少包括粗粒度评分模块、δ-细粒度评分模块和评分模块，通过所述粗粒度评分模块学习每个关系粗粒度的超边特征并进行粗粒度评分，通过所述δ-细粒度评分模块学习每个关系δ-细粒度的实体特征并进行细粒度评分，将粗粒度评分与细粒度评分进行加权求和得到各多元关系成立的评分。

(1)对于多元关系的粗粒度评分。

粗粒度评分模块用于学习多元关系包含的所有实体(h₁，h₂，...，h_m)与关系r之间的联系，以获取更丰富的超边语义特征。关系包含的所有实体、关系之间一般存在着联系，将它们进行整体学习，不仅可以实现所有实体之间信息的互补，还可以使用所有实体的特征对关系信息进行更新。

通过粗粒度评分模块进行粗粒度评分具体包括：

Fea_Coa＝σ(BN(conv2(F_all)) (3)

mScore＝FCN₁(Flatten(Fea_Coa)) (4)

上式中，Flatten表示将张量按列展开，FCN₁表示全连接操作。

(2)对于多元关系的细粒度评分。

δ-细粒度评分模块用于对具有m个实体的多元关系从1细粒度到δ细粒度的学习，δ＝m-1；获取更丰富的实体语义特征。多元关系包含的不同粒度的实体一般也与关系分别存在着联系，分别对它们进行学习，可以根据实体的特性进一步更新实体的表示。

通过δ-细粒度评分模块对i细粒度进行细粒度评分具体包括如下，i＝1，2，...，δ：

其中，

Com(h_j)_i表示m元关系的i粒度实体组合；

然后，为了获取多元关系f实体的i维特征，将

计算过程如等式(5)所示：

上式中，conv2′为卷积核大小为(i+1)*3的二维卷积操作；

接着，完成

的特征融合，使用最小值特征融合方法对上一步得到的

组特征分别进行特征融合，计算过程如等式(6)所示：

上式中min()表示取所有

每个维度的最小值作为该维度的结果

最后，计算f的i-细粒度评分，将每个

上式中，FCN₂为全连接操作。

步骤S4′、所述HPMG模型还包括用于对δ-细粒度评分模块进行优化的优化模块，所述优化模块采用基于注意力模块ATT的多特征融合方法，即MFF，将步骤S4中的δ-细粒度评分模块卷积后得到的多个实体特征输入MFF中进行特征融合，融合后的特征输入全连接神经网络得到各细粒度评分。

(1)通过注意力模块ATT得到总体注意力特征图谱的过程概括为：首先将输入特征通过复制扩充为通道数为C的特征表示；然后通过全局注意力分支和局部注意力分支分别提取输入特征的全局特征注意力和局部注意力；将上一步得到的全局注意力和局部注意力进行相加操作，并输入Sigmoid函数计算出注意力权重；接着将上一步计算出的注意力权重和原始输入特征X相乘通过对通道求平均的操作得到特征图X′。

通过注意力模块ATT得到总体注意力特征图谱具体包括如下：

通过全局注意力分支提取输入特征的全局特征注意力，全局特征注意力提取过程如等式(8)所示，通过全局平均池化和全连接操作获得特征的全局注意力；首先使用全局平均池化操作将原始输入特征压缩成一维参数，该一维参数获得了原始特征的全局视野，感受区域更广，然后采用第一个全连接层FCN₃对重要性进行预测，得到重要性参数，最后用ReLU激活，并输入全连接层FCN₄以恢复原始特征的维度，最终得到的X_g包含了原始特征全局的重要性；

X_g＝B(FCN₄(σ(FCN₃(GAP(X))))) (8)

X_l＝B(PWConv₂(σ(B(PWConv₁(X))))) (9)

上式中，B(.)为批标准化函数；

上式中，Fatt(.)为全局注意力计算函数，λ为Sigmoid函数，

为广播求和操作，

为对应元素相乘，avg为求各个通道的平均。

(2)通过多特征融合方法MFF进行特征融合具体包括：

上式中，

和

上式中，FCN₃和FCN₄为全连接操作。

下面以2-细粒度为例先介绍两个特征融合的方法，Fea_i-2表示特征

表示

和

的融合特征。

不失一般性，设已知两个特征

和

首先将这两个特征求和得到初始特征集。然后，将上一步集成的结果输入注意力模块ATT，得到融合

和

的特征图。接着利用该特征图对

和

分别加权融合，最终得到融合

和

的特征表示

其计算过程如下式所示。

步骤S5、通过评分模块对每个多元关系进行评分，得出预测结果，根据评分指标来判断多元关系的评分结果是否正确：若正确，则将正确的多元关系添加到图立方中，补全图立方，若错误，则将错误的多元关系舍弃。

本实施例中，判断多元关系的评分结果是否正确，具体包括如下：

其中，n取1和10。

以上仅描述了本发明的基本原理和优选实施方式，本领域人员可以根据上述描述做出许多变化和改进，这些变化和改进应该属于本发明的保护范围。