CN112765961A - 一种基于实体图神经网络推理的事实验证方法及其系统 - Google Patents

一种基于实体图神经网络推理的事实验证方法及其系统 Download PDF

Info

Publication number
CN112765961A
CN112765961A CN202110044980.5A CN202110044980A CN112765961A CN 112765961 A CN112765961 A CN 112765961A CN 202110044980 A CN202110044980 A CN 202110044980A CN 112765961 A CN112765961 A CN 112765961A
Authority
CN
China
Prior art keywords
statement
entity
neural network
vector
evidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110044980.5A
Other languages
English (en)
Inventor
陈洪辉
陈翀昊
蔡飞
陈皖玉
郑建明
邵太华
郭昱普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110044980.5A priority Critical patent/CN112765961A/zh
Publication of CN112765961A publication Critical patent/CN112765961A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于实体图神经网络的推理模型(RoEG),利用实体级别的信息来获取细粒度的特征,并利用图注意力神经网络机制来实现推理过程。具体来说,为了捕获证据间的语义关联,RoEG首先引入实体作为图节点并构造三种类型的边。然后利用一个选择门机制来限制信息的传播,并利用图神经网络机制实现实体特征的更新传播。最后利用一个基于注意力机制的特征聚合器来聚合实体特征以辅助标签预测任务。通过在一个大型基准数据集上的进行实验,结果表明了模型的有效性,在标签准确率和得分上击败了目前的最优基准模型。特别是在需要多条证据共同作用作出判断的困难验证集上,相比最优模型有了很大的提升;随着实体数量的增加,RoEG具有更佳的性能表现。

Description

一种基于实体图神经网络推理的事实验证方法及其系统
技术领域
本发明属于一种事实验证方法,具体是涉及到一种基于实体图神经网络推理的事实验证方法及其系统。
背景技术
随着信息爆炸,人们饱受假新闻和误导信息的困扰。自动识别信息的真实性成为越来越重要的研究问题。事实验证通过基于提取得到的信息的推理来验证陈述的真实性,其能够将给定的陈述进行标签的分类,包括支持、反对以及信息不足三种,分别表示了提取的证据是否可以支持陈述的说法,或者是无法进行判断。
现有的事实验证主要可以分为两个类别,一个是基于自然语言推断的方法,另一个是基于图的方法。前一种方法通过构建陈述-证据对,然后利用交互式匹配模型来预测标签,他们通常将所有的证据结合成一个文本序列然后进行特征的提取。而基于图的模型主要利用不同的证据句子来构建图结构。但是上述方法的缺点在于句子级别的信息,容易忽视了细微的信息表示,如地点时间和人名等。并且现有方法主要还是利用黑盒结构来聚合句子级别的信息,不能够明确的模型化人类的推理过程,比如寻找一条推理的路径。
发明内容
本发明通过引入了实体级别的信息来进行证据特征的提取并构建推理图,以解决背景技术中所记载的问题。
本发明首先提供了一种基于实体图神经网络推理的事实验证方法,参见图3,包括以下步骤:
S1:根据给出的陈述提取陈述中的关键词,使用关键词选择证据并根据证据和关键词计算得到关键词向量。
证据提取主要包括文档检索和证据选择两个阶段,以给定的的陈述和如维基百科、百度百科等文档文库作为输入,来得到与陈述相关的证据句子。
本发明首先使用句法分析工具来提取给定的陈述中的实体,将实体作为关键词来检索得到相关性最高的几篇文档。然后,过滤掉不存在于离线维基百科文档中的文档结果。(由于数据集中采用的离线版本维基百科文档与我们使用在线版本的有一定的差异。)在证据选择阶段,本发明利用BERT作为检索模型来计算给定的陈述和检索的文章中的句子之间的相似度。训练阶段采用负样本策略,可以用以下公式表示:
LRe=∑max(0,1+Sn-Sp)
其中,LRe表示这个模块的损失;Sn和Sp分别是负样本和正样本的得分。在训练阶段本发明选择与某条陈述具有最高相似度的五条句子作为证据。
对于文本向量编码,本发明将给定的陈述和其相关的证据进行拼接,并将这样的陈述-证据序列输入预训练BERT来获取陈述的词向量表示
Figure BDA0002896880610000021
相关证据的词向量表示
Figure BDA0002896880610000022
和通过BERT的[cls]输出获得整个序列的向量表示
Figure BDA0002896880610000023
其中L1是陈述的长度,L2证据的长度,d1是BERT中隐藏层状态的维度。
对于实体编码,由于每个实体是通过命名实体工具得到,本发明利用与实体相关的文本跨度来计算实体的向量表示。首先建立一个二元矩阵Mij,当Mij=1时,表示为第j个单词出现第i个实体的文本跨度。通过上文获取的单词的字典V和二元矩阵Mij得到实体的向量表示:即保留与实体相关的字典中的相关行,然后计算这些行中单词向量的最大池化值和平均池化值,并将其拼接得到实体的表示E=[e1,…eN],其中,
Figure BDA0002896880610000024
N表示实体的数量,2d2表示拼接得到的实体的维度。
S2:将陈述和证据进行拼接构建陈述证据序列并获取陈述证据序列向量;将所述关键词作为所述证据的图节点并连接所述图节点形成图的边从而构建实体图。
为构建实体图的边关系,首先根据不同文章将证据进行分组:本发明采用了一个命名实体识别工具BERT来提取证据中的实体。这些实体被视为图节点,至于图的边则根据实体类别设计了三种边:句子级别链接、上下文级别链接以及文字级别链接。句子级别链接为出现在同一个句子中的两两实体之间的链接。上下文级别链接为出现不同的文章中的相同实体之间的链接。文章级别链接为由出现在文章题目中的中心实体与该文章中其他实体间的链接。不同类别的边表示了在推理过程中不同的信息流动方式。参见图1,图1中线条1、线条2和线条3分别表示句子级别链接、上下文级别链接以及文字级别链接。如图1所示,“The Rodney King riots took place in the most populous country in the USA”,通过构建基于实体的推理路径,“the Rodeny King riot→Los Angeles County→LosAngeles→the USA”可以辅助最后的判断。
S3:以所述关键词向量、所述实体图和所述陈述证据序列向量作为实体图神经网络的输入,得到预测标签。
得到实体向量表示后,利用图注意力神经网络来进行节点信息的传播,以此作为以信息推理的方式。本发明首先设计了一个选择门m来识别与给定陈述相关的实体,从而实体信息的传播被限制在由相关实体组成的子图之中,这样的选择过程由以下公式得到:
c=MeanPooling(C)
Figure BDA0002896880610000025
m=σ([γ1,…γN])
E′=[m1e1,…mNeN]
通过计算选择门m和初始的实体向量,相关的实体信息被保留下来。然后,第t步的信息过程可以描述为:
Figure BDA0002896880610000031
作为实体在t-1层的向量表示,由基于图的关系推理,本发明首先计算由边连接的实体i与实体j之间的注意力得分αij。其中,
Figure BDA0002896880610000032
Figure BDA0002896880610000033
表示线性投影参数,αij表示节点i的传递给相邻节点信息的比例。每个实体节点总和它相关的矩阵列值,形成该节点新的实体状态:
Figure BDA0002896880610000034
其中:
Figure BDA0002896880610000035
Figure BDA0002896880610000036
Figure BDA0002896880610000037
其中βi表示了节点i的所有邻居构成的集合。在得到更新后的实体特征
Figure BDA0002896880610000038
之后,利用注意力聚合机制来聚合来自不同节点的信息,用陈述句子的的向量表示作为隐向量来得到聚合后实体向量表示
Figure BDA0002896880610000039
Figure BDA00028968806100000310
Figure BDA00028968806100000311
Figure BDA00028968806100000312
最后,利用融合层来将聚合后的实体和上文得到序列信息s进行拼接作为最后的特征,并利用一个全连接层来得到最后预测的标签L:
L=argmax(softmax(ReLU(W[a,s]+b)))
其中,
Figure BDA00028968806100000313
b∈Rp×1作为参数矩阵,p是预测类别的数量。
S4:通过预测标签对事实进行验证。
依托于上述方法,本发明还提供了一种基于实体图神经网络推理的事实验证系统,包括处理器、存储器以及存储于存储器中的可执行程序,处理器执行所述可执行程序时实现上述任一所述的步骤。
参见图2,图2为可执行程序的整个框架。
本发明提出的RoEG在大规模基准数据集上进行了实验,实验的结果表明本发明提出的提出的实体图模型在评价指标得分和标签预测准确率优于一些具有竞争力的基准模型。特别是在困难验证集,即需要多个证据才能做出判断的陈述组成的验证集,RoEG较基准模型的准确率有了极大的提升。本模型随着实体数量增加具有更好的表现。
总体来说,本发明引进实体做为推理过程中信息的携带者,帮助模型捕获细粒度信息;设计的基于实体图的推理方法,可以模型化人类的推理过程;模型效果超过基准模型,特别是对于需要多个证据进行推断的陈述集合。
附图说明
图1为本发明构建的实体图的边的三个类型示意图;
图2为本发明RoEG模型的总体框架图;
图3为本发明一种基于实体图神经网络推理的事实验证方法流程图。
具体实施方式
本实施例在FEVER数据集上进行实验。FEVER数据集是一种专门针对事实验证任务的基准数据集,其共含有185445条陈述和相关的证据集。表1展示了具体的数据分布。本实施例采用标签准确率(LA)和FEVER得分作为评价指标,标签准确率表示了陈述分类的准确率,而FEVER得分表示在至少提供一条完全正确的证据的情况下的标签准确率。除此以外,本实施例还建立了困难验证集来测试模型的推理能力,其由原验证集中需要多个证据来做出推断的陈述组成,共有10298个样本组成,约占了51%的验证集数量。在数据分析中本实施例发现超过一半的例子中,实体提取的数量小于20。因此本实施例分别建立了两种实体增强验证集,其中每个例子所提取出的实体数量分别超过10(entityenhanced@10)和20(entity enhanced@20)。这两种实体增强验证集分别由86%和38%的原验证集构成。
在实验中,本实施例将模型与其他五个表现优异的基准模型进行性能的比较,分别是:Athene,它是一种ESIM模型并且通过注意力机制来聚合陈述—证据对特征;UNC NL,它是一种基于神经语义匹配网络的模型并且以陈述和多个证据集合作为特征;UCL MRG,它是一种基于卷积神经网络的模型并通过注意力机制来聚合陈述—证据对特征;GEAR,它是一种基于图的神经网络模型通过注意力机制来结合证据句子;BERT-Concat,它是一种基于BERT微调的序列分类模型,以陈述和多个证据集合作为特征。
在图的构建阶段,本实施例将图中实体数量的最大值设为40,在编码阶段,本实施例利用BERT-base-uncased做为模型的编码器。其中输入陈述—证据集对最大序列长度设置为256,并且限制陈述的最大长度为16而证据的最大长度为240。本实施例将BERT隐藏层的维度大小d1设为768,实体的隐藏状态维度d2设置为384。在训练阶段,模型通过最小化交叉熵损失函数,并采用一个初始学习率3e-4,L2权重衰减值3e-5的Adam优化器。
表1
Figure BDA0002896880610000051
为了验证RoEG模型能够超过有竞争力的基准模型,本实施例在表2上展示了所有讨论模型的表现。首先,对于基准模型,可以看到基于BERT编码的模型如GREA,B-ERT-Concat相比较于之前的方法都要明显的提升。而其中基于图结构的模型GEAR在所有的评价指标上超过了非图结构的BERT-Concat模型,显示了图结构在信息推理上的能力。
将本实施例的模型RoEG与最好的基准模型GEAR进行比较,RoEG在FEVRE得分上具有更佳的表现,并且取得了一个较高的标签准确率。具体而言,相较于GEAR,其FEVER得分提升了0.41%。除此以外,RoEG显示了在验证集上0.59%和2.55%的提升。这样明显的提升可以表面,细粒度的实体特征加强了关键信息的表征,而通过实体间的边关系进一步加强了信息流动在不同的边之间。
表2模型表现
Figure BDA0002896880610000052
由于GEAR和BERT-concat是表2中表现最优异的两个模型,并且基于BERT编码,所以在本实施例在之后仅考虑这两个模型作为比较。为了验证RoEG对于需要多条证据来判断的陈述的效果相比较于其他模型,本实施例在困难验证集上测试了三个模型的多证据推理能力(包括RoEG),并把结果展示在表3中。可以看出,与之前相反,非图结构的BERT-cooncat模型在表现上优于图结构的模型GEAR,具体的在标签准确率和FEVER得分上提升了4.95%和4.89%。这些不同说明BERT-concat拥有更好的稳定性来保持一个较优的表现,而GEAR没有显示图结构在多证据推理上的能力。而将我们的RoEG与最佳模型BERT-concat进行比较,RoEG在两个指标上都优于后者,具体来说,RoEG提升了5.46%的标签准确率和4.87%的FEVRE得分。这表明了实体图的结构特征,即可以携带更细粒度的信息并且其边关系不仅可以帮助实现信息推理的过程,而这种推理过程有助于多个证据的陈述判断。将RoEG模型与另一图结构模型GEAR相比提升更为明显,更说明了RoEG模型的鲁棒性是优于GEAR的。
表3模型在困难验证集上性能的比较
方法 LA
GEAR 62.31
Bert-concat 67.26
RoEG 72.72
本实施例在两个实体增强验证集(Entity enhacned@10,Entity enhacned@20)和原验证集上进行了实验。如表4所示,随着实体数量的增长,RoEG模型的性能也在同时增长,特别是在验证集Entityenhacned@20上,较其他验证集提升了至少1.62%的标签准确率。这说明了实体信息在在事实验证任务具有重要的作用,因为随着实体数量的增长,基于实体边的推理路径随之增加,本实施例可以利用高质量的实体进行图的推理,除此以外可以发现在原验证集和Entityenhacned@10验证集上,模型在推理层数为2的情况下相较于层数为1提升了至少1.1%的标签准确率,说明特定层数的推理可以帮助实体更好的聚合来自其邻居的信息,以辅助做出最后的推断。
表4模型原验证集和实体加强验证集上的标签准确率
Figure BDA0002896880610000061
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于实体图神经网络推理的事实验证方法,其特征在于,包括以下步骤:
根据给出的陈述提取所述陈述中的关键词,使用所述关键词选择证据并根据所述证据和所述关键词计算得到关键词向量;
将陈述和证据进行拼接构建陈述证据序列并获取陈述证据序列向量;将所述关键词作为所述证据的图节点并连接所述图节点形成图的边从而构建实体图;
以所述关键词向量、所述实体图和所述陈述证据序列向量作为实体图神经网络的输入,得到预测标签;
通过预测标签对事实进行验证。
2.根据权利要求1所述的一种基于实体图神经网络推理的事实验证方法,其特征在于,使用句法分析工具提取所述陈述中的关键词。
3.根据权利要求1所述的一种基于实体图神经网络推理的事实验证方法,其特征在于,将所述陈述证据序列输入训练后的BERT模型得到所述陈述证据序列向量。
4.根据权利要求3所述的一种基于实体图神经网络推理的事实验证方法,其特征在于,通过负样本策略对BERT模型进行训练,负样本策略公式为:
LRe=∑max(0,1+Sn-Sp)
其中,LRe表示这个模块的损失;Sn和Sp分别是负样本和正样本的得分。
5.根据权利要求1所述的一种基于实体图神经网络推理的事实验证方法,其特征在于,得到关键词向量的步骤为:
将所述陈述证据序列输入训练后的BERT模型得到陈述向量和证据向量;
构建以所述证据和所述关键词组成的二元矩阵;
通过所述二元矩阵和所述证据向量得到关键词向量。
6.根据权利要求1所述的一种基于实体图神经网络推理的事实验证方法,其特征在于,通过实体图神经网络得到预测标签的步骤为:
设计选择门,从所述关键词中选择与陈述相关的关键词;
根据所述与陈述相关的关键词、所述实体图以及所述关键词向量得到与陈述相关的关键词向量;
采用注意力聚合机制聚合所述与陈述相关的关键词向量得到聚合关键词向量;
通过融合层融合所述聚合关键词向量以及所述所述陈述证据序列向量得到预测特征;
将所述预测特征输入全连接层得到预测标签。
7.根据权利要求6所述的一种基于实体图神经网络推理的事实验证方法,其特征在于,所述选择过程通过以下公式实现:
c=MeanPooling(C)
Figure FDA0002896880600000021
m=σ([γ1,…γN])
E′=[m1e1,…mNeN]
其中,C为陈述向量,Wg为线性处理矩阵,σ为sigmoid激活函数,E=[e1,…eN]为关键词向量。
8.根据权利要求7所述的一种基于实体图神经网络推理的事实验证方法,其特征在于,所述聚合关键词向量表示为:
Figure FDA0002896880600000022
Figure FDA0002896880600000023
Figure FDA0002896880600000024
其中,
Figure FDA0002896880600000025
表示与陈述相关的关键词向量。
9.根据权利要求8所述的一种基于实体图神经网络推理的事实验证方法,其特征在于,所述预测标签表示为:
L=argmax(softmax(ReLU(W[a,s]+b)))
其中,s为所述陈述证据序列向量,b为参数矩阵。
10.一种基于实体图神经网络推理的事实验证系统,包括处理器、存储器以及存储于存储器中的可执行程序,其特征在于,处理器执行所述可执行程序时实现如权利要求1-9任一所述的步骤。
CN202110044980.5A 2021-01-13 2021-01-13 一种基于实体图神经网络推理的事实验证方法及其系统 Pending CN112765961A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110044980.5A CN112765961A (zh) 2021-01-13 2021-01-13 一种基于实体图神经网络推理的事实验证方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110044980.5A CN112765961A (zh) 2021-01-13 2021-01-13 一种基于实体图神经网络推理的事实验证方法及其系统

Publications (1)

Publication Number Publication Date
CN112765961A true CN112765961A (zh) 2021-05-07

Family

ID=75700306

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110044980.5A Pending CN112765961A (zh) 2021-01-13 2021-01-13 一种基于实体图神经网络推理的事实验证方法及其系统

Country Status (1)

Country Link
CN (1) CN112765961A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113282726A (zh) * 2021-05-27 2021-08-20 成都数之联科技有限公司 数据处理方法及系统及装置及介质及数据分析方法
CN113312920A (zh) * 2021-06-18 2021-08-27 中国人民解放军国防科技大学 基于图对比学习的验证方法、系统、设备和存储介质
CN113837384A (zh) * 2021-08-19 2021-12-24 东南大学 一种基于深度交互推理模型的事实检测方法
CN116383239A (zh) * 2023-06-06 2023-07-04 中国人民解放军国防科技大学 一种基于混合证据的事实验证方法、系统及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516697A (zh) * 2019-07-15 2019-11-29 清华大学 基于证据图聚合与推理的声明验证方法及系统
CN111428026A (zh) * 2020-02-20 2020-07-17 西安电子科技大学 一种多标签文本分类处理方法及系统、信息数据处理终端

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516697A (zh) * 2019-07-15 2019-11-29 清华大学 基于证据图聚合与推理的声明验证方法及系统
CN111428026A (zh) * 2020-02-20 2020-07-17 西安电子科技大学 一种多标签文本分类处理方法及系统、信息数据处理终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈翀昊 等: ""基于实体图神经网络的事实核实方法"", 《指挥信息系统与技术》, vol. 11, no. 3, pages 17 - 21 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113282726A (zh) * 2021-05-27 2021-08-20 成都数之联科技有限公司 数据处理方法及系统及装置及介质及数据分析方法
CN113312920A (zh) * 2021-06-18 2021-08-27 中国人民解放军国防科技大学 基于图对比学习的验证方法、系统、设备和存储介质
CN113312920B (zh) * 2021-06-18 2024-02-02 中国人民解放军国防科技大学 基于图对比学习的验证方法、系统、设备和存储介质
CN113837384A (zh) * 2021-08-19 2021-12-24 东南大学 一种基于深度交互推理模型的事实检测方法
CN116383239A (zh) * 2023-06-06 2023-07-04 中国人民解放军国防科技大学 一种基于混合证据的事实验证方法、系统及存储介质
CN116383239B (zh) * 2023-06-06 2023-08-15 中国人民解放军国防科技大学 一种基于混合证据的事实验证方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN110245229B (zh) 一种基于数据增强的深度学习主题情感分类方法
CN112765961A (zh) 一种基于实体图神经网络推理的事实验证方法及其系统
CN112507699B (zh) 一种基于图卷积网络的远程监督关系抽取方法
CN108132927B (zh) 一种融合图结构与节点关联的关键词提取方法
Zhao et al. Representation Learning for Measuring Entity Relatedness with Rich Information.
CN111177382B (zh) 基于FastText算法的智能法条推荐辅助系统
CN109992784B (zh) 一种融合多模态信息的异构网络构建和距离度量方法
CN109597995A (zh) 一种基于bm25加权结合词向量的文本表示方法
Reyes-Galaviz et al. A supervised gradient-based learning algorithm for optimized entity resolution
CN113392209A (zh) 一种基于人工智能的文本聚类方法、相关设备及存储介质
CN111344695A (zh) 促进特定于域和客户端的应用程序接口推荐
CN115952292B (zh) 多标签分类方法、装置及计算机可读介质
Gasmi et al. Cold-start cybersecurity ontology population using information extraction with LSTM
CN115238040A (zh) 一种钢铁材料学知识图谱构建方法及系统
CN114239828A (zh) 一种基于因果关系的供应链事理图谱构建方法
CN114265935A (zh) 一种基于文本挖掘的科技项目立项管理辅助决策方法及系统
Jin et al. Multi-label sentiment analysis base on BERT with modified TF-IDF
Elangovan et al. Adaptive Particle Grey Wolf optimizer with deep learning-based sentiment analysis on online product reviews
Hashemzadeh et al. Improving keyword extraction in multilingual texts.
CN111274494A (zh) 结合深度学习和协同过滤技术的复合标签推荐方法
CN110299194A (zh) 基于综合特征表示与改进宽深度模型的相似病例推荐方法
CN112579583B (zh) 一种面向事实检测的证据与声明联合抽取方法
Vrolijk et al. Ontojob: Automated ontology learning from labor market data
CN112966507A (zh) 构建识别模型及攻击识别方法、装置、设备及存储介质
CN117076659A (zh) 一种基于bert的两阶段排序的类案检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination