CN113312920B

CN113312920B - 基于图对比学习的验证方法、系统、设备和存储介质

Info

Publication number: CN113312920B
Application number: CN202110680673.6A
Authority: CN
Inventors: 陈洪辉; 蔡飞; 陈翀昊; 郑建明; 潘志强; 毛彦颖; 张鑫; 宋城宇; 江苗; 王祎童; 王梦如
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2021-06-18
Filing date: 2021-06-18
Publication date: 2024-02-02
Anticipated expiration: 2041-06-18
Also published as: CN113312920A

Abstract

本申请涉及一种基于图对比学习的验证方法、系统、设备和存储介质，该方法包括：首先构造一个实体图来捕捉证据之间的关系；然后采用无监督图对比任务训练图卷积编码器，以保持图特征传播后的独有实体信息；然后利用聚合的实体特征增强声明证据对的表示，并在嵌入空间中应用有监督的对比任务将同类样本推近，将不同类的样本推离；最后基于声明证据对的特征表示对比来预测声明的标签分布。本发明实施例能够利用多个对比任务来缓解图神经网络在特征传播过程中节点特征的丢失，并且能够学习到不同标签的声明证据对中具有区别性的特征表示；并通过使用无监督的图对比子任务来解决以往基于图的方法中节点特征丢失的问题，提高声明验证的准确率。

Description

基于图对比学习的验证方法、系统、设备和存储介质

技术领域

本申请涉及信息技术领域，特别是涉及一种基于图对比学习的验证方法、系统、设备和存储介质。

背景技术

事实验证的目标是根据从维基百科文章中检索到的证据来验证一个给定声明的真实性。这项任务的关键挑战是如何学习到一个较好的声明-证据对的特征表示，这对于生成预测标签至关重要。现有的研究主要利用声明与证据之间的语义相似性来区分不同的语义关系，如支持、反驳或信息不足。然而，由于部分否定词的存在，一些语义相似的声明和证据常常却拥有相反的真实性标签。因此，我们认为一个好的事实验证模型应该学习到具有区分性的特征表示，特别是针对于部分具有不同的标签但是语义上相似的声明-证据对。另外，以往的基于图神经网络的方法虽然能够很好地处理需要多个证据进行验证的声明，但其模型性能往往受到节点特征过平滑的限制，其容易导致节点信息的丢失。

基于图的模型还是无法避免节点特征过度平滑的问题，即原实体节点在经过几轮信息传播后，失去其独特的节点信息；此外，以往的监督训练由于训练次数有限，容易出现过拟合问题。这些方法通常是由标签来监督的，较少在样本中探索潜在的监督信号；最终致了对于声明验证的准确率较低。

发明内容

基于此，有必要针对上述技术问题，提供一种基于图对比学习的验证方法、系统、计算机设备和存储介质。

第一方面，本发明实施例提供了一种基于图对比学习的验证方法，包括以下步骤：

对待验证的声明进行检索，获取所述声明的证据集；

使用命名实体识别工具提取所述证据集中包含的实体节点，通过所述实体节点之间的语义关系，构造由所述实体节点组成的实体图；

基于所述实体图，利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示；

利用无监督的图对比任务来训练所述实体图对应的图卷积编码器，使得所述实体图在更新中保留区别性的实体节点特征；

将所述实体节点特征输入到监督对比任务中，使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对，推开不同类的声明证据对；

根据所述声明证据对的对比，对所述声明的标签进行验证。

进一步的，所述基于所述实体图，利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示，包括：

将所述证据集中的句子连接为序列证据文本，然后将所述序列证据文本与所述声明连接，形成输入序列；

基于所述输入序列，采用双向注意层来增强所述声明和所述证据集的特征交叉互动，生成所述声明和所述证据集的增强单词表示；

利用与实体相关联的证据中的文本跨度来生成初始实体节点表示，用于所述实体图的推理过程；

在所述输入序列内，将文本跨度内的单词平均池化和最大池化结果进行拼接，并输入到一个多层感知器生成所述实体特征表示。

进一步的，所述利用无监督的图对比任务来训练所述实体图对应的图卷积编码器，使得所述实体图在更新中保留区别性的实体节点特征，包括：

对所述实体图和所述实体图的关系矩阵，利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示，将所述特征向量表示视为局部特征表示；

利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示，并将所述图表示视为全局特征表示：

使用区分器来生成局部-全局特征对的概率分数，量化所述局部特征表示和所述全局特征表示之间的相互信息；

通过随机变换改变所述实体特征表示，利用腐蚀函数来构造负样本，基于噪声对比目标，在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器。

进一步的，所述将所述实体节点特征输入到监督对比任务中，使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对，推开不同类的声明证据对，包括：

使用图卷积编码器集成相邻的所述实体特征表示，将所述声明证据对和所述实体特征表示进行实体节点的增强；

利用基于注意力机制的特征聚合器来聚合所述实体特征表示，突出显示与所述声明相关的关键实体信息；

将所述声明的词特征的平均池化结果作为查询向量，并计算所述声明与所述实体节点的注意力分数，根据权重聚合实体特征对所述实体图进行聚合；

对所述声明证据对进行索引，通过监督对比损失函数来调整所述图卷积编码器，实现所述实体节点特征输入到监督对比任务中。

另一方面，本发明实施例还提供了一种基于图对比学习的验证系统，包括：

证据集检索模块，用于对待验证的声明进行检索，获取所述声明的证据集；

实体图模块，用于使用命名实体识别工具提取所述证据集中包含的实体节点，通过所述实体节点之间的语义关系，构造由所述实体节点组成的实体图；

特征表示模块，用于基于所述实体图，利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示；

无监督对比模块，用于利用无监督的图对比任务来训练所述实体图对应的图卷积编码器，使得所述实体图在更新中保留区别性的实体节点特征；

有监督对比模块，用于将所述实体节点特征输入到监督对比任务中，使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对，推开不同类的声明证据对；

标签验证模块，用于根据所述声明证据对的对比，对所述声明的标签进行验证。

进一步的，所述特征表示模块包括文本编码单元，所述文本编码单元用于：

进一步的，所述无监督对比模块包括特征扩展单元，所述特征扩展单元用于：

进一步的，所述有监督对比模块包括编码器微调单元，所述编码器微调单元用于：

本发明实施例还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

对待验证的声明进行检索，获取所述声明的证据集；

根据所述声明证据对的对比，对所述声明的标签进行验证。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

对待验证的声明进行检索，获取所述声明的证据集；

根据所述声明证据对的对比，对所述声明的标签进行验证。

本申请的有益效果是：本发明实施例公开了一种基于图对比学习的验证方法、系统、设备和存储介质，该方法首先并对所述声明进行检索证据，并在证据中提取出实体，并构建实体图来捕获证据间的语义关联，然后利用一个无监督的图对比任务来训练图卷积编码器以便于在图更新中保留特有的实体节点特征。在利用聚合的实体特征生成实体增强的声明证据对，然后将它们输入到设计好的监督对比任务中，使得编码器能够在向量嵌入空间中拉近同一类的声明证据对并且推开不同类的声明证据对，最后基于声明证据对的特征表示对比来预测声明的标签分布。本发明实施例能够利用多个对比任务来缓解图神经网络在特征传播过程中节点特征的丢失，并且能够学习到不同标签的声明证据对中具有区别性的特征表示；并通过使用无监督的图对比子任务来解决以往基于图的方法中节点特征丢失的问题。利用带有标签的对比式监督任务微调我们的编码器，使得编码器能够在特征空间中区分开不同类别的声明证据对，最终提高声明验证的准确率。

附图说明

图1为一个实施例中基于图对比学习的验证方法的流程示意图；

图2为一个实施例中声明和证据集进行文本编码的流程示意图；

图3为一个实施例中无监督的图对比学习的流程示意图；

图4为一个实施例中有监督的样本对比的流程示意图；

图5为一个实施例中基于图对比学习的验证系统的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

信息爆炸很容易使人们陷入虚假新闻和误导性的说法。因此，新闻/声明验证，特别是自动的验证，一直是信息检索领域的热门话题。针对这一目标，事实验证任务被提出，该任务通过从可信任的语料库检索出证据并进行推理，以验证给定声明的真实性。在事实验证中，真实性是由三个给定的标签来衡量的，分别是“支持”、“反驳”或“信息不足”，这三个标签分别表示检索到的证据是否能够支持/反驳该声明，或者该声明是不可验证的。直观地说，处理事实验证的常用方法是将其转换为自然语言推理任务即基于声明要求与证据语义相似性的标签预测。这种方法大致可以分为三类，即基于整体的方法、基于个体的方法和基于结构的方法，基于整体的方法将所有证据句视为一个整体，得到相似度得分；基于个体的方法首先计算每个证据的个体相似性，然后再整合到最终得分中；而基于结构的方法采用图神经网络捕捉证据句的结构关系。

在一个实施例中，如图1所示，提供了一种事实验证方法，该方法包括以下步骤：

步骤101，对待验证的声明进行检索，获取所述声明的证据集；

步骤102，使用命名实体识别工具提取所述证据集中包含的实体节点，通过所述实体节点之间的语义关系，构造由所述实体节点组成的实体图；

步骤103，基于所述实体图，利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示；

步骤104，利用无监督的图对比任务来训练所述实体图对应的图卷积编码器，使得所述实体图在更新中保留区别性的实体节点特征；

步骤105，将所述实体节点特征输入到监督对比任务中，使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对，推开不同类的声明证据对；

步骤106，根据所述声明证据对的对比，对所述声明的标签进行验证。

具体地，利用对比子任务学习图中唯一的实体表示，并在特征嵌入空间中分离不同标签的证据-声明对。特别地，在给定检索到的证据的情况下，我们首先构造一个实体图来捕捉证据的关键特征和语义关系，并由BERT编码以获得实体节点的初始表示。其次，为了突出图推理中每个实体节点的唯一性，本实施例设计了一个对比的无监督子任务来训练图编码器，目的在于最大化图的局部节点特征和全局图特征之间的互信息量。此外，本实施例引入对比标签监督子任务，通过微调编码器使其能够区分具有不同真实性标签但语义相似的声明证据对的特征表示，即拉近同一类事例的距离，推开不同类事例的距离。最后，我们应用实体信息增强后的声明-证据对的表示来预测标签。

其中，本实施例首先并对所述声明进行检索证据，并在证据中提取出实体，并构建实体图来捕获证据间的语义关联，然后利用一个无监督的图对比任务来训练图卷积编码器以便于在图更新中保留特有的实体节点特征。在利用聚合的实体特征生成实体增强的声明证据对，然后将它们输入到设计好的监督对比任务中，使得编码器能够在向量嵌入空间中拉近同一类的声明证据对并且推开不同类的声明证据对，最后基于声明证据对的特征表示对比来预测声明的标签分布。本发明实施例能够利用多个对比任务来缓解图神经网络在特征传播过程中节点特征的丢失，并且能够学习到不同标签的声明证据对中具有区别性的特征表示；并通过使用无监督的图对比子任务来解决以往基于图的方法中节点特征丢失的问题。利用带有标签的对比式监督任务微调我们的编码器，使得编码器能够在特征空间中区分开不同类别的声明证据对，最终提高声明验证的准确率。

在一个实施例中，如图2所示，对声明和证据集进行文本编码具体包括：

步骤201，将所述证据集中的句子连接为序列证据文本，然后将所述序列证据文本与所述声明连接，形成输入序列；

步骤202，基于所述输入序列，采用双向注意层来增强所述声明和所述证据集的特征交叉互动，生成所述声明和所述证据集的增强单词表示；

步骤203，利用与实体相关联的证据中的文本跨度来生成初始实体节点表示，用于所述实体图的推理过程；

步骤204，在所述输入序列内，将文本跨度内的单词平均池化和最大池化结果进行拼接，并输入到一个多层感知器生成所述实体特征表示。

具体地，对于文本编码，我们采用BERT模型来生成声明和证据中的词语的特征表示。具体来说，将证据集中的句子连接为序列证据文本s'，然后将其与声明c连接，形成输入序列s：我们还采用了双向注意层来增强声明和证据之间的特征交叉互动，从而生成声明和证据的增强单词表示为和x_s＝[x₁，…，x_L2]。之后，我们利用与实体相关联的证据中的文本跨度来生成初始实体节点表示，这将用于下一步基于图的推理过程。将文本跨度内的单词平均池化和最大池化结果进行拼接，然后将其输入到一个多层感知器以生成实体特征表示，如B＝[e₁，…，e_n]。

在一个实施例中，如图3所示，无监督的图对比学习的流程包括：

步骤301，对所述实体图和所述实体图的关系矩阵，利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示，将所述特征向量表示视为局部特征表示；

步骤302，利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示，并将所述图表示视为全局特征表示：

步骤303，使用区分器来生成局部-全局特征对的概率分数，量化所述局部特征表示和所述全局特征表示之间的相互信息；

步骤304，通过随机变换改变所述实体特征表示，利用腐蚀函数来构造负样本，基于噪声对比目标，在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器。

具体地，以往的基于图的声明验证方法通常采用图卷积算法对相邻节点特征进行聚合，然后采用一个融合层生成最终的图表示。然而，该算法在多轮特征传播后容易产生相似的节点表示，从而丢失独有的节点信息，进而影响下一步预测的性能。本实施例设计了一个子任务在无监督环境下来学习图卷积编码器，它基于最大化图的局部-全局互信息的思想。具体而言，给定一个实体图以及它的关系矩阵，我们首先利用单层的图卷积编码器，对每一个实体生成一个高维的特征向量表示h_i，其可以被视为一个局部特征；然后，利用平均池化函数将上述每个节点的局部特征表示汇总为图表示g，并将其视为全局特征：为了量化g和h_i之间的互信息，再使用了一个区分器来生成局部-全局特征对(h_i，g)的概率分数；本实施例利用一个腐蚀函数c来构造负样本，腐蚀函数指的是行扰动，通过随机变换改变原来的实体特征。最后，本实施例基于一个噪声对比目标，在所述实体特征表示对应的正负样本之间使用一个标准的二元交叉熵损失来训练的图卷积编码器。

在一个实施例中，如图4所示，有监督的样本对比的过程包括：

步骤401，使用图卷积编码器集成相邻的所述实体特征表示，将所述声明证据对和所述实体特征表示进行实体节点的增强；

步骤402，利用基于注意力机制的特征聚合器来聚合所述实体特征表示，突出显示与所述声明相关的关键实体信息；

步骤403，将所述声明的词特征的平均池化结果作为查询向量，并计算所述声明与所述实体节点的注意力分数，根据权重聚合实体特征对所述实体图进行聚合；

步骤404，对所述声明证据对进行索引，通过监督对比损失函数来调整所述图卷积编码器，实现所述实体节点特征输入到监督对比任务中。

具体的，除了使用上述无监督对比任务学习图编码器外，本实施例还设计了一个有监督任务来微调图编码器以及基于BRET的编码器。在这里，本实施例的目标是鼓励编码器学习不同类别样本的区别特征表示。首先使用图编码器来集成相邻特征，并将第t轮特征传播后的实体特征表示；为了突出显示与声明相关的关键实体信息，采用基于注意力机制的特征聚合器来聚合实体特征。具体而言，本实施例使用声明的词特征的平均池化结果作为查询向量，并计算其与实体节点的注意力分数；然后，使用softmax函数来获得归一化后的权重；最后，根据权重聚合实体特征从而得到实体图的表示。对于监督对比任务，给定一批N个声明证据对组成的样本[z₁，...z_N]及其对应的标签{y₁，…，y_N}。定义i∈I≡{1，...N}作为上述样本的索引，我们采用监督对比损失函数来微调我们的编码器。

应该理解的是，虽然上述流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种基于图对比学习的验证系统，包括：

实体图模块，用于使用命名实体识别工具提取所述证据集中包含的实体节点，通过所述实体节点之间的语义关系，构造由所述实体节点组成的实体图：

在一个实施例中，所述特征表示模块包括文本编码单元，所述文本编码单元用于：

在一个实施例中，所述无监督对比模块包括特征扩展单元，所述特征扩展单元用于：

在一个实施例中，所述有监督对比模块包括编码器微调单元，所述编码器微调单元用于：

关于基于图对比学习的验证系统的具体限定可以参见上文中对于基于图对比学习的验证方法的限定，在此不再赘述。上述基于图对比学习的验证系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

图6示出了一个实施例中计算机设备的内部结构图。该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现权限异常检测方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行权限异常检测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，如图6所示，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

对待验证的声明进行检索，获取所述声明的证据集；

根据所述声明证据对的对比，对所述声明的标签进行验证。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

对待验证的声明进行检索，获取所述声明的证据集；

根据所述声明证据对的对比，对所述声明的标签进行验证。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于图对比学习的验证方法，其特征在于，包括以下步骤：

对待验证的声明进行检索，获取所述声明的证据集；

根据所述声明证据对的对比，对所述声明的标签进行验证；

所述利用无监督的图对比任务来训练所述实体图对应的图卷积编码器，使得所述实体图在更新中保留区别性的实体节点特征，包括：

通过随机变换改变所述实体特征表示，利用腐蚀函数来构造负样本，基于噪声对比目标，在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器；

所述将所述实体节点特征输入到监督对比任务中，使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对，推开不同类的声明证据对，包括：

2.根据权利要求1所述的基于图对比学习的验证方法，其特征在于，所述基于所述实体图，利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示，包括：

3.一种基于图对比学习的验证系统，其特征在于，包括：

标签验证模块，用于根据所述声明证据对的对比，对所述声明的标签进行验证；

所述无监督对比模块包括特征扩展单元，所述特征扩展单元用于：

所述有监督对比模块包括编码器微调单元，所述编码器微调单元用于：

4.根据权利要求3所述的基于图对比学习的验证系统，其特征在于，所述特征表示模块包括文本编码单元，所述文本编码单元用于：

5.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至2中任一项所述方法的步骤。

6.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至2中任一项所述的方法的步骤。