CN113312920B - 基于图对比学习的验证方法、系统、设备和存储介质 - Google Patents
基于图对比学习的验证方法、系统、设备和存储介质 Download PDFInfo
- Publication number
- CN113312920B CN113312920B CN202110680673.6A CN202110680673A CN113312920B CN 113312920 B CN113312920 B CN 113312920B CN 202110680673 A CN202110680673 A CN 202110680673A CN 113312920 B CN113312920 B CN 113312920B
- Authority
- CN
- China
- Prior art keywords
- entity
- graph
- evidence
- representation
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012795 verification Methods 0.000 title claims abstract description 39
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 238000010586 diagram Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000011176 pooling Methods 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 28
- 239000010410 layer Substances 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 19
- 230000004931 aggregating effect Effects 0.000 claims description 16
- 238000012935 Averaging Methods 0.000 claims description 9
- 230000007797 corrosion Effects 0.000 claims description 9
- 238000005260 corrosion Methods 0.000 claims description 9
- 230000002708 enhancing effect Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 239000002356 single layer Substances 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 9
- 230000002776 aggregation Effects 0.000 claims description 8
- 238000004220 aggregation Methods 0.000 claims description 8
- 238000005096 rolling process Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 abstract description 5
- 238000009826 distribution Methods 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 abstract 1
- 230000005856 abnormality Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000000225 bioluminescence resonance energy transfer Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种基于图对比学习的验证方法、系统、设备和存储介质,该方法包括:首先构造一个实体图来捕捉证据之间的关系;然后采用无监督图对比任务训练图卷积编码器,以保持图特征传播后的独有实体信息;然后利用聚合的实体特征增强声明证据对的表示,并在嵌入空间中应用有监督的对比任务将同类样本推近,将不同类的样本推离;最后基于声明证据对的特征表示对比来预测声明的标签分布。本发明实施例能够利用多个对比任务来缓解图神经网络在特征传播过程中节点特征的丢失,并且能够学习到不同标签的声明证据对中具有区别性的特征表示;并通过使用无监督的图对比子任务来解决以往基于图的方法中节点特征丢失的问题,提高声明验证的准确率。
Description
技术领域
本申请涉及信息技术领域,特别是涉及一种基于图对比学习的验证方法、系统、设备和存储介质。
背景技术
事实验证的目标是根据从维基百科文章中检索到的证据来验证一个给定声明的真实性。这项任务的关键挑战是如何学习到一个较好的声明-证据对的特征表示,这对于生成预测标签至关重要。现有的研究主要利用声明与证据之间的语义相似性来区分不同的语义关系,如支持、反驳或信息不足。然而,由于部分否定词的存在,一些语义相似的声明和证据常常却拥有相反的真实性标签。因此,我们认为一个好的事实验证模型应该学习到具有区分性的特征表示,特别是针对于部分具有不同的标签但是语义上相似的声明-证据对。另外,以往的基于图神经网络的方法虽然能够很好地处理需要多个证据进行验证的声明,但其模型性能往往受到节点特征过平滑的限制,其容易导致节点信息的丢失。
基于图的模型还是无法避免节点特征过度平滑的问题,即原实体节点在经过几轮信息传播后,失去其独特的节点信息;此外,以往的监督训练由于训练次数有限,容易出现过拟合问题。这些方法通常是由标签来监督的,较少在样本中探索潜在的监督信号;最终致了对于声明验证的准确率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种基于图对比学习的验证方法、系统、计算机设备和存储介质。
第一方面,本发明实施例提供了一种基于图对比学习的验证方法,包括以下步骤:
对待验证的声明进行检索,获取所述声明的证据集;
使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
根据所述声明证据对的对比,对所述声明的标签进行验证。
进一步的,所述基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示,包括:
将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
进一步的,所述利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征,包括:
对所述实体图和所述实体图的关系矩阵,利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示,将所述特征向量表示视为局部特征表示;
利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示,并将所述图表示视为全局特征表示:
使用区分器来生成局部-全局特征对的概率分数,量化所述局部特征表示和所述全局特征表示之间的相互信息;
通过随机变换改变所述实体特征表示,利用腐蚀函数来构造负样本,基于噪声对比目标,在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器。
进一步的,所述将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对,包括:
使用图卷积编码器集成相邻的所述实体特征表示,将所述声明证据对和所述实体特征表示进行实体节点的增强;
利用基于注意力机制的特征聚合器来聚合所述实体特征表示,突出显示与所述声明相关的关键实体信息;
将所述声明的词特征的平均池化结果作为查询向量,并计算所述声明与所述实体节点的注意力分数,根据权重聚合实体特征对所述实体图进行聚合;
对所述声明证据对进行索引,通过监督对比损失函数来调整所述图卷积编码器,实现所述实体节点特征输入到监督对比任务中。
另一方面,本发明实施例还提供了一种基于图对比学习的验证系统,包括:
证据集检索模块,用于对待验证的声明进行检索,获取所述声明的证据集;
实体图模块,用于使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
特征表示模块,用于基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
无监督对比模块,用于利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
有监督对比模块,用于将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
标签验证模块,用于根据所述声明证据对的对比,对所述声明的标签进行验证。
进一步的,所述特征表示模块包括文本编码单元,所述文本编码单元用于:
将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
进一步的,所述无监督对比模块包括特征扩展单元,所述特征扩展单元用于:
对所述实体图和所述实体图的关系矩阵,利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示,将所述特征向量表示视为局部特征表示;
利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示,并将所述图表示视为全局特征表示:
使用区分器来生成局部-全局特征对的概率分数,量化所述局部特征表示和所述全局特征表示之间的相互信息;
通过随机变换改变所述实体特征表示,利用腐蚀函数来构造负样本,基于噪声对比目标,在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器。
进一步的,所述有监督对比模块包括编码器微调单元,所述编码器微调单元用于:
使用图卷积编码器集成相邻的所述实体特征表示,将所述声明证据对和所述实体特征表示进行实体节点的增强;
利用基于注意力机制的特征聚合器来聚合所述实体特征表示,突出显示与所述声明相关的关键实体信息;
将所述声明的词特征的平均池化结果作为查询向量,并计算所述声明与所述实体节点的注意力分数,根据权重聚合实体特征对所述实体图进行聚合;
对所述声明证据对进行索引,通过监督对比损失函数来调整所述图卷积编码器,实现所述实体节点特征输入到监督对比任务中。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
对待验证的声明进行检索,获取所述声明的证据集;
使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
根据所述声明证据对的对比,对所述声明的标签进行验证。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
对待验证的声明进行检索,获取所述声明的证据集;
使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
根据所述声明证据对的对比,对所述声明的标签进行验证。
本申请的有益效果是:本发明实施例公开了一种基于图对比学习的验证方法、系统、设备和存储介质,该方法首先并对所述声明进行检索证据,并在证据中提取出实体,并构建实体图来捕获证据间的语义关联,然后利用一个无监督的图对比任务来训练图卷积编码器以便于在图更新中保留特有的实体节点特征。在利用聚合的实体特征生成实体增强的声明证据对,然后将它们输入到设计好的监督对比任务中,使得编码器能够在向量嵌入空间中拉近同一类的声明证据对并且推开不同类的声明证据对,最后基于声明证据对的特征表示对比来预测声明的标签分布。本发明实施例能够利用多个对比任务来缓解图神经网络在特征传播过程中节点特征的丢失,并且能够学习到不同标签的声明证据对中具有区别性的特征表示;并通过使用无监督的图对比子任务来解决以往基于图的方法中节点特征丢失的问题。利用带有标签的对比式监督任务微调我们的编码器,使得编码器能够在特征空间中区分开不同类别的声明证据对,最终提高声明验证的准确率。
附图说明
图1为一个实施例中基于图对比学习的验证方法的流程示意图;
图2为一个实施例中声明和证据集进行文本编码的流程示意图;
图3为一个实施例中无监督的图对比学习的流程示意图;
图4为一个实施例中有监督的样本对比的流程示意图;
图5为一个实施例中基于图对比学习的验证系统的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
信息爆炸很容易使人们陷入虚假新闻和误导性的说法。因此,新闻/声明验证,特别是自动的验证,一直是信息检索领域的热门话题。针对这一目标,事实验证任务被提出,该任务通过从可信任的语料库检索出证据并进行推理,以验证给定声明的真实性。在事实验证中,真实性是由三个给定的标签来衡量的,分别是“支持”、“反驳”或“信息不足”,这三个标签分别表示检索到的证据是否能够支持/反驳该声明,或者该声明是不可验证的。直观地说,处理事实验证的常用方法是将其转换为自然语言推理任务即基于声明要求与证据语义相似性的标签预测。这种方法大致可以分为三类,即基于整体的方法、基于个体的方法和基于结构的方法,基于整体的方法将所有证据句视为一个整体,得到相似度得分;基于个体的方法首先计算每个证据的个体相似性,然后再整合到最终得分中;而基于结构的方法采用图神经网络捕捉证据句的结构关系。
在一个实施例中,如图1所示,提供了一种事实验证方法,该方法包括以下步骤:
步骤101,对待验证的声明进行检索,获取所述声明的证据集;
步骤102,使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
步骤103,基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
步骤104,利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
步骤105,将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
步骤106,根据所述声明证据对的对比,对所述声明的标签进行验证。
具体地,利用对比子任务学习图中唯一的实体表示,并在特征嵌入空间中分离不同标签的证据-声明对。特别地,在给定检索到的证据的情况下,我们首先构造一个实体图来捕捉证据的关键特征和语义关系,并由BERT编码以获得实体节点的初始表示。其次,为了突出图推理中每个实体节点的唯一性,本实施例设计了一个对比的无监督子任务来训练图编码器,目的在于最大化图的局部节点特征和全局图特征之间的互信息量。此外,本实施例引入对比标签监督子任务,通过微调编码器使其能够区分具有不同真实性标签但语义相似的声明证据对的特征表示,即拉近同一类事例的距离,推开不同类事例的距离。最后,我们应用实体信息增强后的声明-证据对的表示来预测标签。
其中,本实施例首先并对所述声明进行检索证据,并在证据中提取出实体,并构建实体图来捕获证据间的语义关联,然后利用一个无监督的图对比任务来训练图卷积编码器以便于在图更新中保留特有的实体节点特征。在利用聚合的实体特征生成实体增强的声明证据对,然后将它们输入到设计好的监督对比任务中,使得编码器能够在向量嵌入空间中拉近同一类的声明证据对并且推开不同类的声明证据对,最后基于声明证据对的特征表示对比来预测声明的标签分布。本发明实施例能够利用多个对比任务来缓解图神经网络在特征传播过程中节点特征的丢失,并且能够学习到不同标签的声明证据对中具有区别性的特征表示;并通过使用无监督的图对比子任务来解决以往基于图的方法中节点特征丢失的问题。利用带有标签的对比式监督任务微调我们的编码器,使得编码器能够在特征空间中区分开不同类别的声明证据对,最终提高声明验证的准确率。
在一个实施例中,如图2所示,对声明和证据集进行文本编码具体包括:
步骤201,将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
步骤202,基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
步骤203,利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
步骤204,在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
具体地,对于文本编码,我们采用BERT模型来生成声明和证据中的词语的特征表示。具体来说,将证据集中的句子连接为序列证据文本s',然后将其与声明c连接,形成输入序列s:我们还采用了双向注意层来增强声明和证据之间的特征交叉互动,从而生成声明和证据的增强单词表示为和xs=[x1,…,xL2]。之后,我们利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,这将用于下一步基于图的推理过程。将文本跨度内的单词平均池化和最大池化结果进行拼接,然后将其输入到一个多层感知器以生成实体特征表示,如B=[e1,…,en]。
在一个实施例中,如图3所示,无监督的图对比学习的流程包括:
步骤301,对所述实体图和所述实体图的关系矩阵,利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示,将所述特征向量表示视为局部特征表示;
步骤302,利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示,并将所述图表示视为全局特征表示:
步骤303,使用区分器来生成局部-全局特征对的概率分数,量化所述局部特征表示和所述全局特征表示之间的相互信息;
步骤304,通过随机变换改变所述实体特征表示,利用腐蚀函数来构造负样本,基于噪声对比目标,在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器。
具体地,以往的基于图的声明验证方法通常采用图卷积算法对相邻节点特征进行聚合,然后采用一个融合层生成最终的图表示。然而,该算法在多轮特征传播后容易产生相似的节点表示,从而丢失独有的节点信息,进而影响下一步预测的性能。本实施例设计了一个子任务在无监督环境下来学习图卷积编码器,它基于最大化图的局部-全局互信息的思想。具体而言,给定一个实体图以及它的关系矩阵,我们首先利用单层的图卷积编码器,对每一个实体生成一个高维的特征向量表示hi,其可以被视为一个局部特征;然后,利用平均池化函数将上述每个节点的局部特征表示汇总为图表示g,并将其视为全局特征:为了量化g和hi之间的互信息,再使用了一个区分器来生成局部-全局特征对(hi,g)的概率分数;本实施例利用一个腐蚀函数c来构造负样本,腐蚀函数指的是行扰动,通过随机变换改变原来的实体特征。最后,本实施例基于一个噪声对比目标,在所述实体特征表示对应的正负样本之间使用一个标准的二元交叉熵损失来训练的图卷积编码器。
在一个实施例中,如图4所示,有监督的样本对比的过程包括:
步骤401,使用图卷积编码器集成相邻的所述实体特征表示,将所述声明证据对和所述实体特征表示进行实体节点的增强;
步骤402,利用基于注意力机制的特征聚合器来聚合所述实体特征表示,突出显示与所述声明相关的关键实体信息;
步骤403,将所述声明的词特征的平均池化结果作为查询向量,并计算所述声明与所述实体节点的注意力分数,根据权重聚合实体特征对所述实体图进行聚合;
步骤404,对所述声明证据对进行索引,通过监督对比损失函数来调整所述图卷积编码器,实现所述实体节点特征输入到监督对比任务中。
具体的,除了使用上述无监督对比任务学习图编码器外,本实施例还设计了一个有监督任务来微调图编码器以及基于BRET的编码器。在这里,本实施例的目标是鼓励编码器学习不同类别样本的区别特征表示。首先使用图编码器来集成相邻特征,并将第t轮特征传播后的实体特征表示;为了突出显示与声明相关的关键实体信息,采用基于注意力机制的特征聚合器来聚合实体特征。具体而言,本实施例使用声明的词特征的平均池化结果作为查询向量,并计算其与实体节点的注意力分数;然后,使用softmax函数来获得归一化后的权重;最后,根据权重聚合实体特征从而得到实体图的表示。对于监督对比任务,给定一批N个声明证据对组成的样本[z1,...zN]及其对应的标签{y1,…,yN}。定义i∈I≡{1,...N}作为上述样本的索引,我们采用监督对比损失函数来微调我们的编码器。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种基于图对比学习的验证系统,包括:
证据集检索模块,用于对待验证的声明进行检索,获取所述声明的证据集;
实体图模块,用于使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图:
特征表示模块,用于基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
无监督对比模块,用于利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
有监督对比模块,用于将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
标签验证模块,用于根据所述声明证据对的对比,对所述声明的标签进行验证。
在一个实施例中,所述特征表示模块包括文本编码单元,所述文本编码单元用于:
将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
在一个实施例中,所述无监督对比模块包括特征扩展单元,所述特征扩展单元用于:
对所述实体图和所述实体图的关系矩阵,利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示,将所述特征向量表示视为局部特征表示;
利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示,并将所述图表示视为全局特征表示:
使用区分器来生成局部-全局特征对的概率分数,量化所述局部特征表示和所述全局特征表示之间的相互信息;
通过随机变换改变所述实体特征表示,利用腐蚀函数来构造负样本,基于噪声对比目标,在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器。
在一个实施例中,所述有监督对比模块包括编码器微调单元,所述编码器微调单元用于:
使用图卷积编码器集成相邻的所述实体特征表示,将所述声明证据对和所述实体特征表示进行实体节点的增强;
利用基于注意力机制的特征聚合器来聚合所述实体特征表示,突出显示与所述声明相关的关键实体信息;
将所述声明的词特征的平均池化结果作为查询向量,并计算所述声明与所述实体节点的注意力分数,根据权重聚合实体特征对所述实体图进行聚合;
对所述声明证据对进行索引,通过监督对比损失函数来调整所述图卷积编码器,实现所述实体节点特征输入到监督对比任务中。
关于基于图对比学习的验证系统的具体限定可以参见上文中对于基于图对比学习的验证方法的限定,在此不再赘述。上述基于图对比学习的验证系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图6示出了一个实施例中计算机设备的内部结构图。该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现权限异常检测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行权限异常检测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,如图6所示,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
对待验证的声明进行检索,获取所述声明的证据集;
使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
根据所述声明证据对的对比,对所述声明的标签进行验证。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对所述实体图和所述实体图的关系矩阵,利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示,将所述特征向量表示视为局部特征表示;
利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示,并将所述图表示视为全局特征表示:
使用区分器来生成局部-全局特征对的概率分数,量化所述局部特征表示和所述全局特征表示之间的相互信息;
通过随机变换改变所述实体特征表示,利用腐蚀函数来构造负样本,基于噪声对比目标,在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
使用图卷积编码器集成相邻的所述实体特征表示,将所述声明证据对和所述实体特征表示进行实体节点的增强;
利用基于注意力机制的特征聚合器来聚合所述实体特征表示,突出显示与所述声明相关的关键实体信息;
将所述声明的词特征的平均池化结果作为查询向量,并计算所述声明与所述实体节点的注意力分数,根据权重聚合实体特征对所述实体图进行聚合;
对所述声明证据对进行索引,通过监督对比损失函数来调整所述图卷积编码器,实现所述实体节点特征输入到监督对比任务中。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
对待验证的声明进行检索,获取所述声明的证据集;
使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
根据所述声明证据对的对比,对所述声明的标签进行验证。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对所述实体图和所述实体图的关系矩阵,利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示,将所述特征向量表示视为局部特征表示;
利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示,并将所述图表示视为全局特征表示:
使用区分器来生成局部-全局特征对的概率分数,量化所述局部特征表示和所述全局特征表示之间的相互信息;
通过随机变换改变所述实体特征表示,利用腐蚀函数来构造负样本,基于噪声对比目标,在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
使用图卷积编码器集成相邻的所述实体特征表示,将所述声明证据对和所述实体特征表示进行实体节点的增强;
利用基于注意力机制的特征聚合器来聚合所述实体特征表示,突出显示与所述声明相关的关键实体信息;
将所述声明的词特征的平均池化结果作为查询向量,并计算所述声明与所述实体节点的注意力分数,根据权重聚合实体特征对所述实体图进行聚合;
对所述声明证据对进行索引,通过监督对比损失函数来调整所述图卷积编码器,实现所述实体节点特征输入到监督对比任务中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (6)
1.一种基于图对比学习的验证方法,其特征在于,包括以下步骤:
对待验证的声明进行检索,获取所述声明的证据集;
使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
根据所述声明证据对的对比,对所述声明的标签进行验证;
所述利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征,包括:
对所述实体图和所述实体图的关系矩阵,利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示,将所述特征向量表示视为局部特征表示;
利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示,并将所述图表示视为全局特征表示:
使用区分器来生成局部-全局特征对的概率分数,量化所述局部特征表示和所述全局特征表示之间的相互信息;
通过随机变换改变所述实体特征表示,利用腐蚀函数来构造负样本,基于噪声对比目标,在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器;
所述将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对,包括:
使用图卷积编码器集成相邻的所述实体特征表示,将所述声明证据对和所述实体特征表示进行实体节点的增强;
利用基于注意力机制的特征聚合器来聚合所述实体特征表示,突出显示与所述声明相关的关键实体信息;
将所述声明的词特征的平均池化结果作为查询向量,并计算所述声明与所述实体节点的注意力分数,根据权重聚合实体特征对所述实体图进行聚合;
对所述声明证据对进行索引,通过监督对比损失函数来调整所述图卷积编码器,实现所述实体节点特征输入到监督对比任务中。
2.根据权利要求1所述的基于图对比学习的验证方法,其特征在于,所述基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示,包括:
将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
3.一种基于图对比学习的验证系统,其特征在于,包括:
证据集检索模块,用于对待验证的声明进行检索,获取所述声明的证据集;
实体图模块,用于使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
特征表示模块,用于基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
无监督对比模块,用于利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
有监督对比模块,用于将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
标签验证模块,用于根据所述声明证据对的对比,对所述声明的标签进行验证;
所述无监督对比模块包括特征扩展单元,所述特征扩展单元用于:
对所述实体图和所述实体图的关系矩阵,利用单层的图卷积编码器通过所述实体节点生成高维的特征向量表示,将所述特征向量表示视为局部特征表示;
利用平均池化函数将每个所述实体节点的局部特征表示汇总为图表示,并将所述图表示视为全局特征表示:
使用区分器来生成局部-全局特征对的概率分数,量化所述局部特征表示和所述全局特征表示之间的相互信息;
通过随机变换改变所述实体特征表示,利用腐蚀函数来构造负样本,基于噪声对比目标,在所述实体特征表示对应的正负样本之间使用二元交叉熵损失训练所述图卷积编码器;
所述有监督对比模块包括编码器微调单元,所述编码器微调单元用于:
使用图卷积编码器集成相邻的所述实体特征表示,将所述声明证据对和所述实体特征表示进行实体节点的增强;
利用基于注意力机制的特征聚合器来聚合所述实体特征表示,突出显示与所述声明相关的关键实体信息;
将所述声明的词特征的平均池化结果作为查询向量,并计算所述声明与所述实体节点的注意力分数,根据权重聚合实体特征对所述实体图进行聚合;
对所述声明证据对进行索引,通过监督对比损失函数来调整所述图卷积编码器,实现所述实体节点特征输入到监督对比任务中。
4.根据权利要求3所述的基于图对比学习的验证系统,其特征在于,所述特征表示模块包括文本编码单元,所述文本编码单元用于:
将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
5.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至2中任一项所述方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至2中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110680673.6A CN113312920B (zh) | 2021-06-18 | 2021-06-18 | 基于图对比学习的验证方法、系统、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110680673.6A CN113312920B (zh) | 2021-06-18 | 2021-06-18 | 基于图对比学习的验证方法、系统、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113312920A CN113312920A (zh) | 2021-08-27 |
CN113312920B true CN113312920B (zh) | 2024-02-02 |
Family
ID=77379337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110680673.6A Active CN113312920B (zh) | 2021-06-18 | 2021-06-18 | 基于图对比学习的验证方法、系统、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113312920B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925211B (zh) * | 2022-04-13 | 2024-08-06 | 东南大学 | 一种面向表格型数据的事实验证方法 |
CN116383239B (zh) * | 2023-06-06 | 2023-08-15 | 中国人民解放军国防科技大学 | 一种基于混合证据的事实验证方法、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685653A (zh) * | 2019-01-21 | 2019-04-26 | 北京工业大学 | 一种融合深度信念网络和孤立森林算法的信贷风险监测的方法 |
CN110516697A (zh) * | 2019-07-15 | 2019-11-29 | 清华大学 | 基于证据图聚合与推理的声明验证方法及系统 |
CN112396185A (zh) * | 2021-01-21 | 2021-02-23 | 中国人民解放军国防科技大学 | 一种事实验证方法、系统、计算机设备和存储介质 |
CN112765961A (zh) * | 2021-01-13 | 2021-05-07 | 中国人民解放军国防科技大学 | 一种基于实体图神经网络推理的事实验证方法及其系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11449684B2 (en) * | 2019-09-25 | 2022-09-20 | Google Llc | Contrastive pre-training for language tasks |
-
2021
- 2021-06-18 CN CN202110680673.6A patent/CN113312920B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685653A (zh) * | 2019-01-21 | 2019-04-26 | 北京工业大学 | 一种融合深度信念网络和孤立森林算法的信贷风险监测的方法 |
CN110516697A (zh) * | 2019-07-15 | 2019-11-29 | 清华大学 | 基于证据图聚合与推理的声明验证方法及系统 |
CN112765961A (zh) * | 2021-01-13 | 2021-05-07 | 中国人民解放军国防科技大学 | 一种基于实体图神经网络推理的事实验证方法及其系统 |
CN112396185A (zh) * | 2021-01-21 | 2021-02-23 | 中国人民解放军国防科技大学 | 一种事实验证方法、系统、计算机设备和存储介质 |
Non-Patent Citations (5)
Title |
---|
Finding Streams in Knowledge Graphs to Support Fact Checking;Prashant Shiralkar等;2017 IEEE International Conference on Data Mining (ICDM);全文 * |
基于依存分析的开放式中文实体关系抽取方法;李明耀;杨静;;计算机工程(第06期);全文 * |
基于实体图神经网络的事实核实方法;陈翀昊;黄周捷;蔡飞;余权;郑建明;陈洪辉;;指挥信息系统与技术(第03期);全文 * |
基于深度神经网络的中文命名实体识别;张海楠;伍大勇;刘悦;程学旗;;中文信息学报(第04期);全文 * |
基于监督学习自动编码器图像重构;张赛;芮挺;李华兵;方虎生;;江苏科技信息(第28期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113312920A (zh) | 2021-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033068B (zh) | 基于注意力机制的用于阅读理解的方法、装置和电子设备 | |
Nandwani et al. | A primal dual formulation for deep learning with constraints | |
Lytvyn et al. | Methods of building intelligent decision support systems based on adaptive ontology | |
US7606784B2 (en) | Uncertainty management in a decision-making system | |
US10803108B2 (en) | Facilitation of domain and client-specific application program interface recommendations | |
CN111767409A (zh) | 一种基于多头自注意力机制的实体关系抽取方法 | |
CN113392651B (zh) | 训练词权重模型及提取核心词的方法、装置、设备和介质 | |
US11520993B2 (en) | Word-overlap-based clustering cross-modal retrieval | |
CN113312920B (zh) | 基于图对比学习的验证方法、系统、设备和存储介质 | |
CN107103363B (zh) | 一种基于lda的软件故障专家系统的构建方法 | |
CN111428525A (zh) | 隐式篇章关系识别方法、系统及可读存储介质 | |
US10853385B1 (en) | Systems and methods for formatting data using a recurrent neural network | |
US20190188276A1 (en) | Facilitation of domain and client-specific application program interface recommendations | |
CN109918647A (zh) | 一种安全领域命名实体识别方法及神经网络模型 | |
Vilamala et al. | DeepProbCEP: A neuro-symbolic approach for complex event processing in adversarial settings | |
CN112508177A (zh) | 一种网络结构搜索方法、装置、电子设备及存储介质 | |
Moskovitch | Multivariate temporal data analysis‐a review | |
Ma | Artificial Intelligence‐Assisted Decision‐Making Method for Legal Judgment Based on Deep Neural Network | |
CN117668244A (zh) | 威胁情报数据的处理方法和计算机可读存储介质 | |
Chen et al. | Uncertainty measurement and attribute reduction algorithm based on kernel similarity rough set model | |
CN113704466A (zh) | 基于迭代网络的文本多标签分类方法、装置及电子设备 | |
Cai et al. | Modeling of Failure Prediction Bayesian Network with Divide‐and‐Conquer Principle | |
Chen et al. | A multi-source heterogeneous spatial big data fusion method based on multiple similarity and voting decision | |
Stavropoulos et al. | Optimizing complex event forecasting | |
Yang et al. | A subsequent words recommendation scheme for chinese input method based on deep reinforcement learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |