CN116894097A

CN116894097A - 一种基于超图建模的知识图谱标签预测方法

Info

Publication number: CN116894097A
Application number: CN202311126726.5A
Authority: CN
Inventors: 杨柳; 李国辉; 陈庭轩; 龙军; 黄金彩
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2023-09-04
Filing date: 2023-09-04
Publication date: 2023-10-17
Anticipated expiration: 2043-09-04
Also published as: CN116894097B

Abstract

本发明提供了一种基于超图建模的知识图谱标签预测方法，具体包括：选取知识图谱；将知识图谱的原有节点集按节点的度排序生成排序节点集；通过KNN算法和K‑Means算法聚类获得超边集合，生成超图；得到超边的特征嵌入矩阵后通过自注意力机制对超边的特征嵌入矩阵进行修正得到修正后的特征嵌入矩阵，获得超边所具有的超图模体以及对应的超图模体出现的频数，生成超边的超图模体嵌入矩阵；基于修正后的特征嵌入矩阵和超边的超图模体嵌入矩阵生成超边嵌入矩阵；基于超边嵌入矩阵计算标签的预测概率，准确预测出超边的标签信息。

Description

一种基于超图建模的知识图谱标签预测方法

技术领域

本发明涉及知识图谱技术领域，具体涉及一种基于超图建模的知识图谱标签预测方法。

背景技术

知识图谱中包含大量信息例如学者、论文、机构、期刊等相关学术实体的信息，挖掘其中隐藏的学术关系对学者了解科研发展动态，为学者科研提供学术服务起到重要作用，能积极推动国家科学技术的发展。如何从知识图谱海量的、高质量的科技大数据中挖掘出有效的信息，为相关的科技应用提供服务支撑是众多科研机构以及科研人员的研究热点。

传统的实体关系挖掘一般是针对实体对之间存在的关系进行，但现实世界中很多的关系是超越成对关系的，例如论文存在的互引关系、合作作者关系等，简单地用节点间的成对关系来描述复杂网络会造成标签预测的准确度低下，进而不适用于上游的推荐任务。同时现有知识图谱中节点之间存在着错综复杂的交互关系，目前的一些推荐算法大都基于节点本身的信息进行标签预测任务，而忽略了复杂网络中存在着的特定的连接结构对标签预测的影响，导致标签预测结果不准确。

综上所述，急需一种知识图谱标签预测方法以解决现有技术中存在的问题。

发明内容

本发明目的在于提供一种基于超图建模的知识图谱标签预测方法，技术方案如下：

一种基于超图建模的知识图谱标签预测方法，包括以下步骤：

步骤S1、生成知识图谱对应的超图，具体是：选取知识图谱；将知识图谱的原有节点集按节点的度排序生成排序节点集；通过KNN算法和K-Means算法聚类获得超边集合，生成超图；

步骤S2、生成超边嵌入矩阵，具体是：对超图中超边内部的节点所代表的特征向量做连接操作，得到当前超边的特征嵌入矩阵；通过自注意力机制对超边的特征嵌入矩阵进行修正得到修正后的特征嵌入矩阵；获得超边所具有的超图模体以及对应的超图模体出现的频数，生成超边的超图模体嵌入矩阵；基于修正后的特征嵌入矩阵和超边的超图模体嵌入矩阵生成超边嵌入矩阵；

步骤S3、基于超边嵌入矩阵计算标签的预测概率。

优选的，所述步骤S1具体包括如下步骤：

步骤S1-1、选取知识图谱，计算知识图谱中每个节点的出入度之和作为对应节点的度，再将节点按照节点的度降序排序，生成排序节点集，如下：

；

其中：表示排序节点集中的第/>个节点，/>表示排序节点集中节点的总数量；表示第/>个节点的度；

步骤S1-2、从排序节点集中按照节点的度从大到小依次选择节点，采用KNN算法获得每个节点的/>个邻居节点，生成超边直至超边数量达到设定阈值，如下：

；

其中，表示通过KNN算法获得的第/>个节点对应的超边；

步骤S1-3、通过K-Means算法对排序节点集的所有节点进行聚类，每一个簇构成一条新的超边；针对每个节点，欧式距离最近个簇作为该节点的相邻超边，汇总得到超边集合，如下：

；

其中：，/>表示通过K-Means算法对排序节点集/>所有节点进行聚类获得的簇，/>表示离第/>个节点第/>近的簇，/>，/>为第/>个节点所具有的簇的总数；/>表示包含第/>个节点的超边集合；

步骤S1-4、汇总步骤S1-3得到的所有节点的超边集合，生成超图。

优选的，步骤S2具体包括如下步骤：

步骤S2-1、对超图中超边内部的节点所代表的特征向量做连接操作，得到当前超边的特征嵌入矩阵，如下：

；

其中，表示超边中第/>个节点的嵌入向量，/>表示超边/>中节点的总数量；/>表示超边/>的特征嵌入矩阵；

步骤S2-2、采取自注意力机制对超边的特征嵌入矩阵进行修正得到修正后的特征嵌入矩阵/>，如下：

；

其中：表示查询矩阵，/>；/>表示关键词矩阵，/>表示关键词矩阵/>的转置矩阵，/>；/>表示价值矩阵，/>；/>表示掩码矩阵；/>分别表示第一参数矩阵、第二参数矩阵以及第三参数矩阵；

步骤S2-3、获得超边所具有的超图模体以及对应的超图模体出现的频数，生成超边的超图模体嵌入矩阵，具体包括：

①利用三条连接超边的连接结构形成超图模体；

②计算超边所包含的超图模体的出现次数/>，如下：

；

其中：，函数/>用于判断三条超边/>间的连接结构属于哪种超图模体，函数/>用于判断超边/>间的连接结构是否是超图模体/>；/>表示超图中存在的超边数量；

步骤S2-4、根据下式生成超边的超图模体嵌入矩阵/>：

；

其中：表示超边/>中编号为/>的超图模体出现的次数；/>表示超边/>中编号为/>的超图模体出现的次数；/>表示编号为/>的超图模体的嵌入表示；/>表示超边所具有的超图模体类别数；

步骤S2-5、基于修正后的特征嵌入矩阵和超边的超图模体嵌入矩阵生成超边所对应的超边嵌入矩阵/>如下：

；

其中：表示参数（是一个可学习的参数），取值范围为/>。

优选的，步骤S3基于线图卷积的输出计算超边所对应标签的预测概率，如下：

将超边视为超节点，采取连接操作捕获超节点的相关性，其表达式如下：

；

其中：表示连接所有超节点得到的初始嵌入表示；

利用线图卷积对超节点的初始嵌入表示进行/>次的消息传递过程优化所有超节点的嵌入表示得到/>，其表达式如下：

；

其中：表示第/>层的超节点嵌入表示；/>是参数矩阵（是一个可学习的参数矩阵）；/>，/>是线图的邻接矩阵，/>是一个单位矩阵；/>是线图的节点度矩阵，/>表示/>的逆矩阵；

对每层获得的嵌入表示进行平均，得到超节点的最终嵌入表示：

；

利用线图卷积的输出以及函数得到超边/>所对应标签的预测概率如下：

。

优选的，步骤S3中包括基于超图卷积的输出计算所有超边所对应标签的预测概率，具体是：获取超图的节点度矩阵和超边度矩阵；通过节点-超边-节点传递方式来聚合超图中存在的全局信息，得到包含超图结构信息的超图卷积某层排序节点的嵌入向量，在经过消息传递过程后获得排序节点最终的嵌入向量；基于排序节点最终的嵌入向量计算标签的预测概率。

优选的，步骤S3具体包括如下步骤：

步骤S3-1、通过以下表达式获取超图的节点度矩阵和超边度矩阵/>：

；

其中：和/>都是对角矩阵，/>表示超图中节点的数量，/>表示超图中存在的超边数量；如果超边/>包含节点/>，那么/>，否则/>；

步骤S3-2、采取连接操作捕获所有节点的相关性，其表达式如下：

；

其中：表示连接所有节点得到的初始嵌入表示；

通过节点-超边-节点传递方式来聚合超图中存在的全局信息，经过次的传递得到优化后的节点嵌入向量/>，如下：

；

其中：代表非线性的激活函数，/>表示第一参数，/>表示超边重要性的权重矩阵，/>表示超图的邻接矩阵，/>表示超图邻接矩阵的转置矩阵；

对每层获得的嵌入进行平均，得到所有节点的最终嵌入向量：

；

基于所有节点的最终嵌入向量将相应超边内的节点求平均处理得到所有超边的最终嵌入表示/>；

步骤S3-3、基于超图卷积的输出计算超边所对应标签的预测概率，如下：

；

其中：表示超边/>所对应的标签的预测概率，/>为超边/>对应的最终嵌入表示。

优选的，步骤S3中还包括通过基于超图卷积计算的预测概率和基于线图卷积计算的预测概率/>得到超边/>所对应标签的最终预测概率/>，其表达式如下：

。

优选的，还包括通过下式计算损失函数：

；

其中：是超边/>所对应的真实标签的one-hot向量。

应用本发明的技术方案，具有以下有益效果：

（1）本发明提供的基于超图建模的知识图谱标签预测方法在原有知识图谱的基础上采用KNN算法和K-Means算法聚类获得超边集合生成超图，并进一步生成超边嵌入矩阵，在得到包含超图结构信息的超图卷积某层排序节点的嵌入向量后继续获得节点嵌入向量，最后基于节点嵌入向量计算标签的预测概率，准确预测出超边的标签信息。

（2）本发明提供的基于超图建模的知识图谱标签预测方法通过基于节点度，通过KNN算法和K-Means算法选择度较大的顶点来生成超边，在尽可能保留原始知识图谱图结构信息的基础上降低生成的超图的规模，同时得到更高质量的超图结构。具体而言，如果普通知识图谱中存在一些较为孤立的顶点，由于孤立点的节点度较小，根据本发明提出的根据节点度排序的超图构建步骤，从孤立点进行超边的构建优先级靠后，在已经构建出的超边达到阈值时，不再针对某些孤立点利用KNN算法进行超边的构建，使得获得的超图是具有良好的图结构。本发明提供的基于超图建模的知识图谱标签预测方法生成的超图不会过于庞大，并能充分利用普通知识图谱已有的拓扑结构信息。

（3）本发明考虑到不同节点对超边的贡献不同，同时超边的连接结构也存在一定的信息，采取自注意力机制以及超图模体对超边的特征嵌入矩阵进行修正。具体而言，通过对超图中超边内部的节点所代表的特征向量做连接操作，得到当前超边的特征嵌入矩阵，利用自注意力机制对超边的特征嵌入矩阵进行修改得到修正后的超边的特征嵌入矩阵；通过超边所具有的超图模体以及对应的超图模体出现的频数，生成超边的超图模体嵌入矩阵；最后根据修正后的超边的特征嵌入矩阵和超边的超图模体嵌入矩阵生成超边的嵌入矩阵，以提升算法的表征能力，有效地利用超边所包含的信息，提高知识图谱标签预测的准确性。

（4）本发明通过设置掩码矩阵解决超边矩阵嵌入过程中由于超边存在多个节点且不同超边内部的节点数量不同导致超边嵌入矩阵大小不一致，且存在不相关信息的问题，有效地提高了后续的知识图谱标签预测的准确性，同时减少了算力成本。

除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照具体实施例，对本发明作进一步详细的说明。

具体实施方式

为了便于理解本发明，下面将对本发明进行更全面的描述，并给出了本发明的较佳实施例。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

实施例：

步骤S1、生成知识图谱对应的超图，具体是：选取知识图谱；将知识图谱的原有节点集按节点的度排序生成排序节点集；通过KNN算法和K-Means算法聚类获得超边集合，生成超图。具体如下：

；

其中：表示排序节点集中的第i/>个节点，/>表示排序节点集中节点的总数量；表示第/>个节点的度；

步骤S1-2、从排序节点集中按照节点的度从大到小依次选择节点，采用KNN算法获得每个节点的个邻居节点，生成超边直至超边数量达到设定阈值，如下：

；

其中，表示通过KNN算法获得的第/>个节点对应的超边；

；

步骤S1-4、汇总步骤S1-3得到的所有节点的超边集合，得到汇总后的超边集合，生成超图/>；

；

其中：表示包含第/>个节点的超边集合，/>，/>表示排序节点集中节点的总数量。

步骤S2、生成超边嵌入矩阵，具体是：对超图中超边内部的节点所代表的特征向量做连接操作，得到当前超边的特征嵌入矩阵；通过自注意力机制对超边的特征嵌入矩阵进行修正得到修正后的特征嵌入矩阵；获得超边所具有的超图模体以及对应的超图模体出现的频数，生成超边的超图模体嵌入矩阵；基于修正后的特征嵌入矩阵和超边的超图模体嵌入矩阵生成超边嵌入矩阵。具体如下：

步骤S2-1：对超图中超边内部的节点所代表的特征向量做连接操作，得到当前超边的特征嵌入矩阵，如下：

；

其中，表示超边中第/>个节点的嵌入向量，/>表示超边/>中节点的总数量；/>表示超边/>的特征嵌入矩阵。

进一步地，为了考虑节点的差异性，即不同节点对超边的重要性不同，继续下列步骤：

；

①利用三条连接超边的连接结构形成超图模体，假设存在三条超边，通过以下7个集合是否为空来判断三条超边间的连接模式属于何种模体：（1）；（2）/>；（3）/>；（4）/>；（5）；（6）/>；（7）/>，其中/>表示求集合的交集，/>表示求集合差集。

超图模体可以用7位二进制向量进行表示，如果集合不为空，则对应位置的值为1，否则为0。现实数据集中可能会存在重复超边，所以只排除对称的以及不存在连接结构的超图模体。

②计算超边所包含的超图模体/>的出现次数/>，如下：

；

其中：，函数/>用于判断三条超边/>间的连接结构属于哪种超图模体，函数/>用于判断超边/>间的连接结构是否是超图模体/>；/>表示超于中存在的超边数量；；

步骤S2-4、根据下式生成超边的超图模体嵌入矩阵：

；

步骤S2-5、基于修正后的特征嵌入矩阵和超边的超图模体嵌入矩阵生成超边所对应的超边嵌入矩阵/>如下

；

其中：表示参数，取值范围为/>；

步骤S3、计算标签的预测概率，具体是：

基于线图卷积的输出计算超边所对应标签的预测概率，如下：

；

其中：表示连接所有超节点得到的初始嵌入表示；

；

其中：表示第/>层的超节点嵌入表示；/>是参数矩阵；/>，/>是线图的邻接矩阵，/>是一个单位矩阵；/>是线图的节点度矩阵，/>表示/>的逆矩阵；如果超边和/>存在交集，则/>；/>；

；

。

基于超图卷积的输出计算超边所对应标签的预测概率，具体是：获取超图的节点度矩阵和超边度矩阵；通过节点-超边-节点传递方式来聚合超图中存在的全局信息，得到包含超图结构信息的超图卷积某层排序节点的嵌入向量，在经过消息传递过程后获得排序节点最终的嵌入向量；基于排序节点最终的嵌入向量计算标签的预测概率。具体包括以下步骤：

步骤S3-1、超图能被表示成一个邻接矩阵，通过超图中节点与超边间存在的关联关系，通过以下表达式获取超图的节点度矩阵/>和超边度矩阵/>：

；

其中：表示连接所有节点得到的初始嵌入表示；

；

其中：代表非线性的激活函数，例如/>或/>；/>表示第一参数，表示超边重要性的权重矩阵，/>表示超图的邻接矩阵，/>表示超图邻接矩阵的转置矩阵；

；

通过基于超图卷积计算的预测概率和基于线图卷积计算的预测概率/>得到超边/>所对应标签的最终预测概率/>（即本发明线图卷积+超图卷积方法），其表达式如下：

。

除此之外，还包括通过下式计算损失函数：

；

其中：是超边/>所对应的真实标签的one-hot向量。

应用本实施例的方案，采取了三个与学术网络相关的数据集，CoauthorshipCora、CoauthorshipDBLP、CocitationPubmed。CoauthorshipCora、CoauthorshipDBLP数据集描述的是合作作者间的关联关系，CocitationPubmed描述的是论文间的引用关系。上述三个数据集只给出了节点的标签信息，本发明将超边中多数节点的标签设置为超边的标签，采取分层抽样的做法将数据集按照8：2划分为训练/测试集，数据集的统计情况如表1所示：

表1：数据集统计情况

在实验的训练过程中，本发明采取超参数设置如下：节点嵌入向量的维度设置为100，超图模体嵌入向量的维度设置为100，小批量的批量大小设置为100，模型的深度设置为4，初始学习率设置为0.001，L2正则化取值为1e-5。为了确保实验结果的公平，本发明在对比模型也采取上述相同的设置。

为了验证本发明提出模型的有效性，采取超边标签预测的准确率作为模型的评价指标，并且本发明采取如下四个基线模型作为对比模型：①NARM：一种基于RNN的模型，它对顺序行为进行建模生成预测结果；②SR-GNN：一种基于会话的图神经网络推荐方法，应用门控卷积层来学习项目转换，进而实现会话推荐；③HGNN：一种用于数据表示学习的超图神经网络框架，该框架可以在超图结构中编码高阶数据相关性；④DHCN：一种利用超图卷积网络来改进会话推荐的方法。

实验结果如表2所示：

表2 超边标签预测的准确率实验结果

通过表2可知，本发明方案最优。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的之内，所作的修改、等同替换、改进等，均包含在本发明的保护范围之内。

Claims

1.一种基于超图建模的知识图谱标签预测方法，其特征在于，包括以下步骤：

步骤S3、基于超边嵌入矩阵计算标签的预测概率。

2.根据权利要求1所述的基于超图建模的知识图谱标签预测方法，其特征在于，所述步骤S1具体包括如下步骤：

；

其中：表示排序节点集中的第/>个节点，/>表示排序节点集中节点的总数量；/>表示第/>个节点的度；

；

其中，表示通过KNN算法获得的第/>个节点对应的超边；

；

3.根据权利要求2所述的基于超图建模的知识图谱标签预测方法，其特征在于，步骤S2具体包括如下步骤：

；

其中：表示查询矩阵，/>； />表示关键词矩阵，/>表示关键词矩阵/>的转置矩阵，/>；/>表示价值矩阵，/>；/>表示掩码矩阵；/>分别表示第一参数矩阵、第二参数矩阵以及第三参数矩阵；

①利用三条连接超边的连接结构形成超图模体；

②计算超边所包含的超图模体/>的出现次数/>，如下：

；

其中：，函数/>用于判断三条超边/>间的连接结构属于哪种超图模体，函数/>用于判断超边间的连接结构是否是超图模体/>；/>表示超图中存在的超边数量；

步骤S2-4、根据下式生成超边的超图模体嵌入矩阵/>：

；

其中：表示超边/>中编号为/>的超图模体出现的次数；/>表示超边/>中编号为的超图模体出现的次数；/>表示编号为/>的超图模体的嵌入表示；/>表示超边/>所具有的超图模体类别数；

；

其中：表示参数，取值范围为/>。

4.根据权利要求3所述的基于超图建模的知识图谱标签预测方法，其特征在于，步骤S3基于线图卷积的输出计算超边所对应标签的预测概率，如下：

；

其中：表示连接所有超节点得到的初始嵌入表示；

；

其中：表示第/>层的超节点嵌入表示；/>是参数矩阵；/>，/>是线图的邻接矩阵，/>是一个单位矩阵；/>是线图的节点度矩阵，/>表示/>的逆矩阵；

；

利用线图卷积的输出以及函数得到超边/>所对应标签的预测概率/>如下：

。

5.根据权利要求3或4所述的基于超图建模的知识图谱标签预测方法，其特征在于，步骤S3中包括基于超图卷积的输出计算所有超边所对应标签的预测概率，具体是：获取超图的节点度矩阵和超边度矩阵；通过节点-超边-节点传递方式来聚合超图中存在的全局信息，得到包含超图结构信息的超图卷积某层排序节点的嵌入向量，在经过消息传递过程后获得排序节点最终的嵌入向量；基于排序节点最终的嵌入向量计算标签的预测概率。

6.根据权利要求5所述的基于超图建模的知识图谱标签预测方法，其特征在于，步骤S3具体包括如下步骤：

；

其中：表示连接所有节点得到的初始嵌入表示；

；

7.根据权利要求6所述的基于超图建模的知识图谱标签预测方法，其特征在于，步骤S3中还包括通过基于超图卷积计算的预测概率和基于线图卷积计算的预测概率/>得到超边/>所对应标签的最终预测概率/>，其表达式如下：

。

8.根据权利要求7所述的基于超图建模的知识图谱标签预测方法，其特征在于，还包括通过下式计算损失函数：

；

其中：是超边/>所对应的真实标签的one-hot向量。