CN114861917A

CN114861917A - 贝叶斯小样本学习的知识图谱推理模型、系统及推理方法

Info

Publication number: CN114861917A
Application number: CN202210490127.0A
Authority: CN
Inventors: 赵峰; 闫成; 金海�
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2022-04-29
Filing date: 2022-04-29
Publication date: 2022-08-05
Also published as: US20230351153A1

Abstract

本发明涉及一种贝叶斯小样本学习的知识图谱推理模型、系统及推理方法，所述方法至少包括：对知识图谱中的实体和关系进行高斯分布的建模以降低知识图谱的不确定性；将每个实体作为一个任务，以模拟动态知识图谱中新出现实体的元训练过程进行任务采样；基于图神经网络构建元学习器并进行随机推理；训练所述元学习器以使用支持集来表示新出现实体。本发明经过训练的模型具有快速适应的能力，无需重新训练就能推断出新的事实或出现的实体。

Description

贝叶斯小样本学习的知识图谱推理模型、系统及推理方法

技术领域

本发明涉及知识图谱推理模型技术领域，尤其涉及贝叶斯小样本学习的知识图谱推理模型、系统及推理方法。

背景技术

大规模知识图谱，如YAGO，NELL，Wikidata，包含大量的事实知识。作为许多应用的背景，随着知识图谱推理的快速发展，知识图谱推理在推荐系统、问题回答等方面的广泛应用也引起了越来越多的关注。知识图谱推理旨在从现有的知识图谱中推断出新的事实，知识图谱通常被建模为一个链接预测问题，以预测一个查询三元组的新实体或关系。

有许多不同的研究对知识图谱推理做出了实质性的贡献，最流行的方法之一是基于知识图嵌入方法，该方法将整个知识图谱映射到多维空间，通过各种向量运算操作来计算三元组的得分并预测新的三元组。因为知识图谱嵌入方法的简单性和高精度，使得它受到了高度的重视，但现有的知识图谱嵌入推理仍有一定的局限性。

事实上，知识不是静态的，而是随着时间动态发展的。因此，知识图谱随时间而变化，因为新知识出现或旧知识变得过时。例如，多年来，每天大约有200个实体出现在DBpedia中。在这里，提出知识图谱嵌入推理的两个挑战：第一，可扩展性差，知识图谱嵌入方法这种直推式的方法很难处理新出现的实体；因为当一个新的实体出现时，需要从头开始重新训练整个模型。直推式的方法依赖于实体和关系的表示，并且缺乏如归纳法能够泛化到不可见实体的能力。第二，由于时间的累积效应，长尾分布的现象在知识图谱中是十分常见的，大多数的实体只有与原有知识图谱很少的相关联的三元组。然而，直推式的方法假设每一个实体都有充足的训练数据，导致了表示层面上的不确定性以及推理上的不可靠性；并且知识图谱都是由众包和智能抽取构成的，往往会存在着一些噪音或者二义性问题，也导致了知识图谱的不确定性。

例如，中国专利CN112084344A公开了一种知识图谱推理方法，包括：获取待补全的初始知识图谱数据，初始知识图谱数据包括多组初始数据组，初始数据组仅包括头实体和实体关系；根据初始知识图谱数据，调用知识图谱推理模型得到补全后的目标知识图谱数据，知识图谱推理模型是基于强化学习预先训练得到的模型，目标知识谱图数据中的每组目标数据组均包括头实体、实体关系和尾实体。该专利的实施例通过调用基于强化学习训练得到的知识图谱推理模型对初始知识图谱进行知识推理，没有考虑时间的变化，采用多次训练来完善知识图谱。

因此，如何高效处理知识图谱中新出现的实体，以及考虑知识推理中的不确定性，是本发明的核心问题。

此外，一方面由于对本领域技术人员的理解存在差异；另一方面由于申请人做出本发明时研究了大量文献和专利，但篇幅所限并未详细罗列所有的细节与内容，然而这绝非本发明不具备这些现有技术的特征，相反本发明已经具备现有技术的所有特征，而且申请人保留在背景技术中增加相关现有技术之权利。

发明内容

现有技术中的知识图谱推理模型存在不确定性，导致训练样本出现长尾分布的现象。而现有的表示学习方法都属于直推式方法，难以扩展到不可见的实体上，因此本发明提出了一种基于小样本学习的贝叶斯归纳式推理方法。为了实现可扩展性，将利用元学习对不可见实体进行归纳推理。本发明还构建了贝叶斯图神经网络作为元学习器，将知识从原有的知识图谱推断到不可见实体。经过训练的知识图谱推理模型具有快速适应的能力，并且无需重新训练就能推断出新的事实或出现的实体。本发明对知识图谱中的不确定性进行建模，将所有实体和关系建模为高斯分布模型。此外，由于新出现的实体往往具有很高的不确定性，本发明将贝叶斯图神经网络这种可以估计的不确定性的模型纳入元学习器的设计中，完成现实动态场景中的具有不确定性知识图谱推理。

在真实世界的知识图谱中，少数的实体拥有着数据极多的相关联三元组，而大多数实体只有少量三元组，这种邻居数量分布不均的现象被称为长尾分布现象。

针对现有技术之不足，本发明提供了一种贝叶斯小样本学习的知识图谱推理方法，所述方法至少包括：

基于知识图谱中的实体和关系建立高斯分布模型以降低知识图谱的不确定性；

将每个实体作为一个任务，以模拟动态知识图谱中新出现实体的元训练过程进行任务采样；

基于图神经网络构建元学习器并进行随机推理；

训练所述元学习器以使用支持集来表示新出现实体。

本发明能够将知识从原有的知识图谱推断到不可见实体。经过训练的知识图谱推理模型具有快速适应的能力，无需重新训练就能推断出新的事实或出现的实体。此外，由于新出现的实体往往具有很高的不确定性，本发明将贝叶斯图神经网络这种可以估计的不确定性的模型纳入元学习器中，完成现实动态场景中的具有不确定性知识图谱推理。

优选地，基于知识图谱中的实体和关系建立高斯分布模型的步骤包括：

将头实体、关系、尾实体表示为：

μ表示实体或关系在向量空间中的位置，∑表示协方差，其大小与关系或实体的不确定性成正相关；

将头实体到尾实体的转换表示为

基于KL散度定义得分函数并用于计算三元组的信度。

通过计算三元组的信度，能够优化元学习器的参数。

优选地，所述用于计算三元组的信度的得分函数为：

s(e_h，r，e_t)＝KL(P_r，P_e)，

其中，s表示三元组的得分函数，e_h表示头实体，r表示关系，e_t表示尾实体，P_r表示关系分部，P_e表示转换分布。

优选地，以模拟动态知识图谱中新出现实体的元训练过程进行任务采样的步骤至少包括：

将原始数据集至少划分为含有模拟新出现实体元训练集和含有真实新出现实体的元测试集；

基于所述元训练集的元训练过程对模拟的新出现实体进行采样；

基于得分函数使查询集的三元组分数最大化。

优选地，基于图神经网络构建元学习器的步骤至少包括：

基于贝叶斯神经网络和知识图谱中的关系构建元学习器，

所述元学习器表示为：

其中，f(θ)表示权值，B表示贝叶斯神经网络，

表示------。

基于权值f(θ)遵循贝叶斯神经网络学习先验分布来建模并推理新兴实体的不确定性。

本发明中的元学习器，有能力使用支持集来表示真正的新实体，而无需进行微调或重新培训。

优选地，训练所述元学习器的步骤至少包括：

基于查询集和负例查询集计算损失函数中的梯度，从而基于梯度下降数据更新并优化知识图谱推理模型的参数；

以支持集S_i作为输入，e′_i的表示作为输出来进行元学习器的训练，

其中，f(θ)表示权值，S_i表示支持集，e′_i表示新出现实体。

优选地，训练所述元学习器的步骤还包括：

最小化先验分布和后验分布的KL散度：

使得目标函数表示为：

其中，q(θ)表示用来对Pr(θ)进行拟合的假设分布，Pr(θ)表示参数的真实分布，Pr(D|θ)表示训练数据集的分布。

使用KL散度作为得分函数来计算知识图谱三元组的可靠性即信度。随着这些高斯分布的后验收敛于训练，知识图谱中的不确定性也会减少并被拟合。

优选地，在所述元训练集M_tr中的新出现实体，包含：

相应的支持集

和

查询集

其中，n(e′_i)表示新出现实体的相邻三元组数量，N表示小样本的大小，e′_i表示新出现实体。

本发明还提供一种贝叶斯小样本学习的知识图谱推理系统，至少包括处理器，所述处理器被配置为:

基于图神经网络构建元学习器并进行随机推理；

训练所述元学习器以使用支持集来表示新出现实体。

本发明还提供一种贝叶斯小样本学习的知识图谱推理模型，所述知识图谱推理模型至少包括：

基于知识图谱中的实体和关系建立高斯分布模型；和

基于图神经网络构建的元学习器。

附图说明

图1是本发明提供的一种知识推理模型的推理方法的逻辑示意图。

附图标记列表

1：支持集；2：查询集；3：第一知识图谱；4：第二知识图谱；5：元学习器；6：新出现实体。

具体实施方式

下面结合附图进行详细说明。

本发明提供一种贝叶斯小样本学习的知识图谱推理方法、系统及推理模型。本发明还提供一种能够允许本发明的贝叶斯小样本学习的知识图谱推理方法的电子设备。

本发明中的电子设备是指能够运行贝叶斯小样本学习的知识图谱推理程序的电子设备，例如服务器、计算机、移动式计算机、智能手机、专用处理器等等。

本发明中的电子设备至少包括处理器和存储器，处理器能够运行贝叶斯小样本学习的知识图谱推理方法的编码信息。存储器用于存储知识图谱推理方法的编码信息。

本发明中的贝叶斯小样本学习的知识图谱推理系统，至少包括处理器，处理器能够运行贝叶斯小样本学习的知识图谱推理程序。

本发明中的处理器，还可以是专用集成芯片、微处理器等等能够运行知识图谱推理方法的编码信息的电子元件。

本发明的知识图谱推理系统，还可以包括第一计算单元、采样计算单元和第二计算单元。

第一计算单元为能够基于知识图谱中的实体和关系建立高斯分布模型的处理器或专用集成芯片。

采样计算单元为能够执行模拟动态知识图谱中新出现实体的元训练过程并进行任务采样的步骤的处理器或专用集成芯片。即，采样计算单元能够运行实现模拟动态的新出现实体并实现任务采样的步骤的编码信息。

第二计算单元也称为元学习器，为能够运行元学习器的表示函数和实现推理过程的编码信息的处理器或专用集成芯片。

第一计算单元与第二计算单元通过至少一个数据连接端口建立数据传输关系。第一计算单元还设置有数据输入端口，用于接收知识图谱中的实体、关系、尾实体等数据。

采样计算单元与第一计算单元通过至少一个数据传输端口建立数据传输关系，以接收第一计算单元发送采样数据。采用数据例如是动态出现的新出现实体。

采样计算单元与第二计算单元通过至少一个数据传输端口建立数据传输关系，以向第二计算单元发送的高斯分布模型。

知识图谱推理系统还包括存储单元，至少用于存储与知识图谱推理过程相关的数据、函数、输出结果等信息。存储模块例如是RAM、ROM、磁盘、芯片等存储介质。存储单元与第一计算单元通过至少一个数据传输端口建立数据传输关系，使得第一计算单元能够从存储单元调取所需要的高斯分布模型数据。存储单元与第二计算单元通过至少一个数据传输端口建立数据传输关系，使得第一计算单元能够从存储单元调取所需要的元学习器表示函数、得分函数、损失函数和目标函数等，以进行元学习器的训练和实际的知识图谱推理。

存储单元的存储信息中，函数至少包括高斯分布模型、元学习器表示函数、得分函数、损失函数和目标函数。数据至少包括支持集、查询集、负例查询集和参数。输出结果至少包括新出现实体。

本发明中的贝叶斯小样本学习的知识图谱推理方法，如图1所示，方法至少包括：

S1：基于知识图谱中的实体和关系建立高斯分布模型以降低知识图谱的不确定性；

S2：将每个实体作为一个任务，以模拟动态知识图谱中新出现实体的元训练过程并进行任务采样；

S3：基于图神经网络构建元学习器并进行随机推理；

S4：训练所述元学习器以使用支持集来表示新出现实体。

本发明对各个步骤进行详细的说明。

基于知识图谱中的实体和关系建立高斯分布模型，是指将知识图谱本身实体关系链接数据学习为结构向量表示。具体而言，是将知识图谱中的实体以及关系建模为概率分布的表示形式，而不是一个实数的向量化表示，以用来拟合知识图谱中的不确定性。

假设每个实体和关系在知识图谱遵循某种高斯分布，从而允许近似统计不确定性，将头实体、关系、尾实体表示为：

μ表示实体或关系在向量空间中的位置，∑表示协方差，其大小与关系或实体的不确定性成正相关。

将头实体到尾实体的转换表示为

在表示层，该转换使关系分布P_r和转换分布P_e尽可能接近。

基于KL散度定义得分函数并用于计算三元组的信度。

KL散度(Kullback-Leibler divergence)是两个概率分布P和Q差别的非对称性的度量。

用于计算三元组的信度的得分函数为：

s(e_h，r，e_t)＝KL(P_r，P_e)，

本发明以模拟动态知识图谱中新出现实体的元训练过程进行任务采样。

如图1所示，将已观测的第一知识图谱3转换为含有新出现实体的第二知识图谱4。

任务划分，即基于任务采样的元训练过程来模拟动态知识图谱中出现的实体。具体地，将原始数据集至少划分为含有模拟新出现实体元训练集和含有真实新出现实体的元测试集。

基于元训练集的元训练过程对模拟的新出现实体进行采样。如图1所示，在元训练的过程中，每一个训练任务都会出现一些新出现的实体e′_i。每个新实体都含有相应的支持集1和查询集2。支持集表示为：

查询集表示为：

支持集是指：与实体e相关联的N个三元组集合作为支持集，支持集将作为元学习器的输入来获取实体e的嵌入表示。与实体相关联的N个三元组将作为支持集，其余剩下的三元组将全部作为查询集。

在元训练过程中进行任务采样的目的是，采用支持集和元学习器f_θ表示新出现的实体e′_i，然后用得分函数使查询集上的三元组分数最大化。

表示三元组最大化时的得分函数。

本发明中，元训练过程是元学习框架的一部分。元学习框架分为元训练和元测试两个部分，在元训练过程中对元学习器中的参数进行训练并更新，其中元学习器将元训练过程中的支持集作为输入，输出节点的表示，再通过查询集中的数据对元学习器中的参数进行更新。

任务采样旨在将原有的数据集分成支持集和查询集两个部分。在本任务中，先是通过将支持集输入到元学习器中得到输出，再通过查询集中的数据计算输出的误差并完成对参数的更新。

f_θ是以支持集作为输入的函数，指的就是元学习器。元学习器是以支持集作为输入的函数。

基于图神经网络构建元学习器，目的是迁移在原先知识图谱中的知识通过支持集转移到新出现实体上。由于图神经网络具有捕捉图结构的能力，本发明选择图神经网络作为元学习器。本发明中，元学习器可以聚集实体的异构邻居，并输出新新出现实体的表示。在元训练集M_tr上研究元学习器，然后在元测试集M_te上对训练后的元学习器进行评估更新。

元学习器是元学习框架的主要部分，主要的作用是完成对元知识的提取。在本发明中，元学习器是基于图神经网络设计的。如图1所示，元学习器5以支持集作为输入，将输出实体的嵌入表示，再通过查询集计算误差，实现对元学习器中参数的更新。

然而知识图谱与传统的图结构不同的是，知识图谱中的边代表关系，这和实体节点具有相同的重要程度。由于新出现实体的高度不确定性以及知识图谱与传统图结构的差异，本发明将贝叶斯神经网络和知识图谱中的关系边引入到图神经网络的设计中。

S31：基于贝叶斯神经网络和知识图谱中的关系构建元学习器。

S32：元学习器表示为：

其中，f(θ)表示权值，B表示贝叶斯神经网络，

表示与实体e′_i相连的关系-实体对的个数。

通常，传递信息将通过线性神经网络或中的权重矩阵进行转换。然而，由于新出现实体的推理具有很高的不确定性，本发明基于权值f(θ)遵循贝叶斯神经网络学习先验分布来建模并推理新兴实体的不确定性。元学习器经过训练，知识图谱推理模型可以学习贝叶斯后验分布的变分近似。由于贝叶斯神经网络的权值不确定性，元学习器的输出也是随机变量，能够实现随机推理。

本发明中，采用元训练集训练所述元学习器。经过元训练集的充分训练，元学习器学习到的知识图谱推理模型能够求解元测试集中的真实新实体。在元学习器训练完成的情况下，元学习器能够使用支持集来表示真正的新实体，而无需进行微调或重新培训。

采用元训练集训练元学习器的步骤如下所述。

每个查询集只包含正三元组Q_i＝{(e′_i，r，e)|e∈E′}。

在元训练过程中，针对更新参数的查询集，为查询集构造负例查询集。构造负例查询集为：

负例查询集中包含的都是错误的三元组。查询集中都是正确的三元组。构造负例查询集的目的是在损失函数中，能够提高模型对负例的识别能力。

具体地，将正确三元组中某一个元素替换为任意其他的元素，目的是让模型能够区分正例和负例。

查询集表示为：

与实体相关联的N个三元组将作为支持集，其余剩下的三元组将全部作为查询集。查询集是用来更新模型参数的。

查询集更新参数的原理：通过最大化查询集中三元组的得分函数，计算损失函数中的梯度，进行梯度下降来更新模型参数。

损失函数表示：

损失函数是更新模型参数的依据，通过计算损失函数的梯度，并且对参数进行梯度下降以达到更新参数的目的。

对于新出现实体e′_i的查询，元学习器以支持集S_i作为输入，e′_i的表示作为输出。即

元学习器的权值f_θ从后验分布中采样，通过后验抽样保证了不确定性，实现了随机推理。

由于后验分布Pr(θ|D)难以求解，本发明采用变分方法，利用由参数θ定义的分布q_θ逼近真实后验分布Pr(θ|D)。本发明通过最小化先验分布和后验分布的KL散度，将求后验分布的问题转化为求最优参数θ的优化问题。

最小化先验分布和后验分布的KL散度的步骤包括：

使得目标函数表示为：

经过元训练集的充分训练，学习后的模型能够求解元测试集中的真实新出现实体。在元测试中，每个新出现的实体也有自己的支持集和查询集。在元学习器完成训练的情况下，元学习器使用它的支持集来表示真正的新出现实体，无需进行微调或再训练。

在所述元训练集M_tr中的新出现实体，包含：

相应的支持集

和

查询集

元学习器经过元训练集M_tr的充分训练，学习到的知识推理模型能够求解元测试集M_te中的真实新兴实体。在元测试中，每个新出现的实体也有自己的支持集和查询集。在元学习器完成训练后，元学习器有能力使用它的支持集来对真正的新出现实体进行表示，不需要进行微调。

本发明还提供一种贝叶斯小样本学习的知识图谱推理模型，知识图谱推理模型至少包括：

基于知识图谱中的实体和关系建立高斯分布模型；和

基于图神经网络构建的元学习器。

元学习器表示为：

其中，f(θ)表示权值，B表示贝叶斯神经网络，

表示与实体e′_i相连的关系-实体对的个数。

如图1所示，元学习器5以支持集S_i作为输入，e′_i的表示作为输出来进行元学习器的训练。

其中，f(θ)表示权值，S_i表示支持集1，e′_i表示新出现实体6。

知识图谱推理模型还包括损失函数。在训练元学习器的过程中，基于查询集和负例查询集计算损失函数中的梯度，从而基于梯度下降数据更新并优化知识图谱推理模型的参数。

其中，知识图谱推理模型还包括目标函数：

本发明的知识图谱推理模型还包括得分函数，用于计算三元组的信度。

知识图谱推理模型的实施原理如下所述。

首先将知识图谱中的实体和关系都建模为高斯分布的形式以拟合不确定性。该方法主要基于元学习框架来实施，包括元训练和元测试两个部分。

知识图谱推理模型需要经过元训练过程。在元训练过程中，数据集被分为了支持集和查询集。为了学习到数据集中的元知识，将某个新出现实体的支持集输入到元学习器中后，能够得到当前实体的嵌入表示。将当前的表示带入到查询集中计算三元组的得分，并且对元学习器的参数进行梯度优化，得到学习好的参数。

在元训练过程结束后，得到优化的参数，即可以将知识图谱模型直接部署到真实场景中，将实体的相关联三元组，也就是元测试过程中的支持集，输入元学习器中得到新出现实体的嵌入表示。然后基于当前的嵌入表示完成推理任务。

需要注意的是，上述具体实施例是示例性的，本领域技术人员可以在本发明公开内容的启发下想出各种解决方案，而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白，本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。本发明说明书包含多项发明构思，诸如“优选地”、“根据一个优选实施方式”或“可选地”均表示相应段落公开了一个独立的构思，申请人保留根据每项发明构思提出分案申请的权利。