CN113779190B - 事件因果关系识别方法、装置、电子设备与存储介质 - Google Patents

事件因果关系识别方法、装置、电子设备与存储介质 Download PDF

Info

Publication number
CN113779190B
CN113779190B CN202110819756.9A CN202110819756A CN113779190B CN 113779190 B CN113779190 B CN 113779190B CN 202110819756 A CN202110819756 A CN 202110819756A CN 113779190 B CN113779190 B CN 113779190B
Authority
CN
China
Prior art keywords
knowledge
event
representation
causal relationship
event pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110819756.9A
Other languages
English (en)
Other versions
CN113779190A (zh
Inventor
陈玉博
刘康
赵军
曹鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN202110819756.9A priority Critical patent/CN113779190B/zh
Publication of CN113779190A publication Critical patent/CN113779190A/zh
Application granted granted Critical
Publication of CN113779190B publication Critical patent/CN113779190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种事件因果关系识别方法、装置、电子设备与存储介质,所述方法包括:基于待识别的事件对所在的文本,确定所述事件对的上下文表示;将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的。本发明提供的方法、装置、电子设备与存储介质,能够充分挖掘事件对之间的因果关系信息,避免显式线索缺乏导致事件因果关系无法识别的问题,极大地提高事件因果关系识别的准确性。

Description

事件因果关系识别方法、装置、电子设备与存储介质
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种事件因果关系识别方法、装置、电子设备与存储介质。
背景技术
随着互联网的大规模发展,信息的获取变得越来越容易,人们几乎无时无刻都会接触涉及各个领域的海量信息,比如体育、娱乐、军事等领域的新闻。然而这些信息一般都是无序、杂乱、非结构的,并且存在一定程度的信息冗余。如何在计算机的辅助下,从海量信息中发现感兴趣的事件是亟需解决的问题。事件因果关系识别(Event CausalityIdentification,ECI)技术正是解决这一问题的有力手段。
事件因果关系识别是事件关系抽取的一个独立的子任务,主要研究如何从非结构化的文本中抽取出事件的关系。事件因果关系识别的目标是判断两个事件在给定的文本中是否存在因果关系。例如,给定文本“The earthquake generated a tsunami.”,一个理想的事件因果关系识别系统应该能够预测出“earthquake”和“tsunami”存在因果关系。
然而,由于事件因果表达多样化,在很多情况下往往缺乏显式的线索来表明事件的因果关系。例如,在这句话“Global warming worsened,and tsunami strengthened.”中,“global warming”和“tsunami”之间存在因果关系,但缺乏因果关系线索指示词。在这种情况下,现有的事件因果关系识别系统往往无法识别出事件之间存在因果关系。
发明内容
本发明提供一种事件因果关系识别方法、装置、电子设备与存储介质,用以解决现有技术中无法识别事件因果关系的缺陷,实现事件因果关系的准确识别。
本发明提供一种事件因果关系识别方法,包括:
基于待识别的事件对所在的文本,确定所述事件对的上下文表示;
将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;
其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的。
根据本发明提供的一种事件因果关系识别方法,所述因果关系识别模型包括编码网络和识别网络;
所述将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系,包括:
基于所述编码网络,对所述描述性知识进行编码,得到所述事件对的描述性知识表示;
基于所述编码网络,对所述关联性知识进行编码,得到所述事件对的关联性知识表示;
基于所述识别网络,对所述上下文表示、所述描述性知识表示和所述关联性知识表示进行因果关系识别,得到所述事件对的因果关系。
根据本发明提供的一种事件因果关系识别方法,所述基于所述编码网络,对所述关联性知识进行编码,得到所述事件对的关联性知识表示,包括:
计算所述关联性知识中各个事件之间的相关性,并基于所述各个事件之间的相关性构建关联图;
基于所述编码网络中的图卷积神经网络,学习所述关联图中各个节点之间的隐式关系,得到所述事件对的关联性知识表示。
根据本发明提供的一种事件因果关系识别方法,所述基于所述识别网络,对所述上下文表示、所述描述性知识表示和所述关联性知识表示进行因果关系识别,得到所述事件对的因果关系,包括:
对所述上下文表示、所述描述性知识表示和所述关联性知识表示进行特征融合,得到所述事件对的最终表示;
基于所述最终表示以及所述识别网络,对所述最终表示进行因果关系识别,得到所述事件对的因果关系。
根据本发明提供的一种事件因果关系识别方法,所述关联性知识是基于如下步骤确定的:
基于外部知识库,确定所述事件对中两个事件分别对应的节点之间的最短多跳路径;
基于所述最短多跳路径,确定所述事件对的关联性知识。
根据本发明提供的一种事件因果关系识别方法,所述描述性知识是基于如下步骤确定的:
在外部知识库中检索所述事件对的描述性知识;
若所述外部知识库中存在所述描述性知识,则从所述外部知识库中获取所述事件对的描述性知识;
若所述外部知识库中不存在所述描述性知识,则基于生成模型生成所述事件对的描述性知识。
根据本发明提供的一种事件因果关系识别方法,所述基于待识别的事件对所在的文本,确定所述事件对的上下文表示,包括:
基于预训练语言模型以及所述文本,对所述事件对进行编码,得到所述事件对的上下文表示。
本发明还提供一种事件因果关系识别装置,包括:
确定模块,用于基于待识别的事件对所在的文本,确定所述事件对的上下文表示;
识别模块,用于将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;
其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述事件因果关系识别方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述事件因果关系识别方法的步骤。
本发明提供的事件因果关系识别方法、装置、电子设备与存储介质,获取事件对的上下文表示,并借助与事件对相关的描述性知识和关联性知识进行事件对的因果关系识别,从而能够充分挖掘事件对之间的因果关系信息,得到事件对的因果关系,进而避免显式线索缺乏导致事件因果关系无法识别的问题,极大地提高了事件因果关系识别的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的事件因果关系识别方法的流程示意图之一;
图2是本发明提供的事件因果关系识别方法的流程示意图之二;
图3是本发明提供的事件因果关系识别方法的示例图;
图4是本发明提供的事件因果关系识别装置的结构示意图;
图5是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种事件因果关系识别方法。图1是本发明提供的事件因果关系识别方法的流程示意图之一,如图1所示,该方法包括:
步骤110,基于待识别的事件对所在的文本,确定事件对的上下文表示。
具体地,待识别的事件对即需要进行因果关系识别的事件对,事件对所在的文本即包含该事件对的上下文信息的文本,该文本可以是网络爬虫或者其他手段进行数据抓取得到的,也可以是人为输入的,还可以是将采集所得的音频进行语音转写后得到的,本发明实施例对此不作具体限定。
在确定待识别的事件对之后,即可基于文本中包含的上下文信息,对该事件对进行上下文编码,进而得到该事件对的上下文表示。此处,上下文编码具体可以通过长短期记忆网络(Long Short-Term Memory,LSTM)、循环神经网络(Recurrent Neural Network,RNN)、预训练语言模型等神经网络结构实现,本发明实施例对此不作具体限定。
步骤120,将事件对的上下文表示,以及与事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到因果关系识别模型输出的事件对的因果关系;
其中,因果关系识别模型是基于样本事件对的上下文表示,与样本事件对相关的样本描述性知识和样本关联性知识,以及样本事件对的因果关系训练得到的。
具体地,考虑到当非结构文本中缺乏显式的线索来表明事件的因果关系时,现有的事件因果关系识别系统往往无法识别出事件之间存在因果关系。针对这一问题,本发明实施例借助外部的背景知识来进行因果关系识别,在外部的背景知识的引导下,因果关系识别模型能够识别隐式的事件因果关系。外部的背景知识可以分为两种,一种是事件的描述性知识,另一种是事件的关联性知识。事件的描述性知识主要帮助模型更好地理解事件是什么,而事件的关联性知识主要帮助模型理解事件之间的关系。
在获取到事件对的上下文表示,以及与事件对相关的描述性知识和关联性知识之后,可以将这三部分信息都输入到因果关系识别模型中进行因果关系识别,使得因果关系识别模型能够充分挖掘事件因果关系,进而得到准确的识别结果,即事件对中两个事件之间的因果关系。此处,因果关系识别模型可以直接根据输入的上下文表示、描述性知识和关联性知识进行因果关系识别,也可以先对描述性知识和关联性知识进行编码,再根据编码后的描述性知识和关联性知识以及上下文表示进行因果关系识别,本发明实施例对此不作具体限定。因果关系可以包括是否存在因果关系,也可以包括因果关系的方向性,例如,事件A导致事件B,还可以包括其他与因果关系有关的信息。
另外,在执行步骤120之前,还需要预先训练得到因果关系识别模型,具体可通过如下方式训练得到因果关系识别模型:首先,收集大量样本事件对,并确定这些样本事件对的上下文表示,与样本事件对相关的样本描述性知识和样本关联性知识,以及样本事件对的因果关系。随即,基于样本事件对的上下文表示,以及对应的样本描述性知识、样本关联性知识和因果关系对初始模型进行训练,从而得到因果关系识别模型。其中,初始模型可以是单一神经网络模型,也可以是多个神经网络模型的组合。
本发明实施例提供的方法,通过获取事件对的上下文表示,并借助与事件对相关的描述性知识和关联性知识进行事件对的因果关系识别,从而能够充分挖掘事件对之间的因果关系信息,得到事件对的因果关系,进而避免显式线索缺乏导致事件因果关系无法识别的问题,极大地提高了事件因果关系识别的准确性。
基于上述任一实施例,因果关系识别模型包括编码网络和识别网络;
步骤120包括:
基于编码网络,对描述性知识进行编码,得到事件对的描述性知识表示;
基于编码网络,对关联性知识进行编码,得到事件对的关联性知识表示;
基于识别网络,对上下文表示、描述性知识表示和关联性知识表示进行因果关系识别,得到事件对的因果关系。
具体地,为了进一步提高因果关系识别模型的性能,可以设置因果关系识别模型包括编码网络和识别网络,在此基础上,将事件对的上下文表示,以及与事件对相关的描述性知识和关联性知识输入到因果关系识别模型之后,首先由编码网络分别对描述性知识和关联性知识进行编码,从而得到事件对的描述性知识表示和关联性知识表示,随即将该描述性知识表示、关联性知识表示和事件对的上下文表示都输入到识别网络中,识别网络结合这三部分信息进行因果关系识别,最终得到事件对的因果关系。
此处,编码网络可以是单一神经网络,此时对描述性知识和关联性知识进行编码是同一神经网络实现的,也可以是多个神经网络模型的组合,此时可以采用不同的神经网络分别对描述性知识和关联性知识进行编码,本发明实施例对此不作具体限定。事件对的因果关系可以是识别网络分别对上下文表示、描述性知识表示和关联性知识表示进行因果关系识别,再将三者的识别结果进行加权求和得到,也可以是先对上下文表示、描述性知识表示和关联性知识表示进行融合,再根据融合结果进行因果关系识别得到。
基于上述任一实施例,基于编码网络,对关联性知识进行编码,得到事件对的关联性知识表示,包括:
计算关联性知识中各个事件之间的相关性,并基于各个事件之间的相关性构建关联图;
基于编码网络中的图卷积神经网络,学习关联图中各个节点之间的隐式关系,得到事件对的关联性知识表示。
具体地,考虑到事件的关联性知识在外部知识库中是以多跳的路径存在,在该路径上可能包含与事件因果关系无关的知识,直接利用该路径进行因果推理并不是最优的。因此,本发明实施例在利用事件的关联性知识时,首先计算关联性知识中所涉及到的各个事件之间的相关性,随即将各个事件作为节点,并根据各个事件之间的相关性进行连边,由此得到关联图,最后利用编码网络中的图卷积神经网络,不断学习关联图中各个节点之间隐式的关联关系,从而得到事件对的关联性知识表示。
可以理解的是,关联图中的各个节点对应各个事件,各条边表征对应的两个节点之间存在关联关系,如果在关联图中任意两个节点之间没有边,则表明这两个节点之间不存在关联关系。通过利用图卷积神经网络不断学习关联图的结构信息,可以完善各个节点之间隐式的关联关系,并排除掉无关节点的干扰,从而可以得到准确的关联性知识表示进行后续的因果关系识别,进而缓解多跳路径上无关知识对于因果关系识别的影响。
基于上述任一实施例,基于识别网络,对上下文表示、描述性知识表示和关联性知识表示进行因果关系识别,得到事件对的因果关系,包括:
对上下文表示、描述性知识表示和关联性知识表示进行特征融合,得到事件对的最终表示;
基于最终表示以及识别网络,对最终表示进行因果关系识别,得到事件对的因果关系。
具体地,为了有效结合事件对的上下文表示、描述性知识表示和关联性知识表示,进而进一步提升因果关系识别的准确性,可以通过如下方式得到事件对的因果关系:
首先,对事件对的上下文表示、描述性知识表示和关联性知识表示进行特征融合,得到该事件对的最终表示,此处,具体的特征融合方式可以是直接将上下文表示、描述性知识表示和关联性知识表示这三者拼接在一起,也可以是对上下文表示、描述性知识表示和关联性知识表示进行加权融合,本发明实施例对此不作具体限定;随即,将该事件对的最终表示输入到因果关系识别模型中的识别网络,识别网络对最终表示进行因果关系识别,从而得到事件对的因果关系。
基于上述任一实施例,关联性知识是基于如下步骤确定的:
基于外部知识库,确定事件对中两个事件分别对应的节点之间的最短多跳路径;
基于最短多跳路径,确定事件对的关联性知识。
具体地,考虑到在外部知识库中,事件对中两个事件分别对应的节点之间可能存在多条多跳路径,为了减少不必要的计算量,本发明实施例首先从外部知识库中检索出这两个节点之间的多跳路径,根据检索结果确定出这两个节点之间的最短多跳路径,随即将该最短多跳路径作为事件对的关联性知识,用于后续的因果关系推理。
基于上述任一实施例,为了利用事件的关联性知识,本发明实施例首先从外部知识库中获取事件对对应节点之间的最短多跳路径,基于此最短多跳路径,计算各个节点之间的相关性并由此构建关联图,随即利用编码网络中的图卷积神经网络,自动地学习关联图的结构信息,并对关联图不断进行迭代优化,直到得到最优的关联图结构,再在该关联图结构上进行多跳地因果推理,得到事件对的关联性知识表示。其计算公式如下所示:
sij=(tanh(Wpmi))TWb(tanh(Wcmj))
其中,sij表示第i个节点和第j个节点之间的相似度,Wp,Wb,Wc,Wr均表示用于线性变换的参数矩阵,mi表示第i个节点的特征表示,表示第i个节点被选作根节点的分数。
其中,Pij表示第i个节点和第j个节点之间边的权重,Lij表示拉普拉斯矩阵第i行第j列的元素,表示拉普拉斯矩阵变形后的第i行第j列的元素,δi,j表示克罗内克算子,表示邻接矩阵第i行第j列的元素。
其中,表示第l层图网络的参数,/>表示第j个节点的初始表示和前l-1层第j个节点拼接后的表示,/>表示第l层图网络的偏置参数,/>表示事件e1的关联性知识表示,/>表示事件e2的关联性知识表示,/>表示事件对的关联性知识表示。
基于上述任一实施例,描述性知识是基于如下步骤确定的:
在外部知识库中检索事件对的描述性知识;
若外部知识库中存在描述性知识,则从外部知识库中获取事件对的描述性知识;
若外部知识库中不存在描述性知识,则基于生成模型生成事件对的描述性知识。
具体地,考虑到外部知识库的不完备性,外部知识库中可能存在不包含事件的描述性知识的情况,对此,本发明实施例采用检索和生成混合的方式来获取事件对的描述性知识,首先在外部知识库中检索事件对的描述性知识,在此基础上,即可根据检索结果确定出外部知识库中是否存在该描述性知识:如果外部知识库中存在事件对的描述性知识,则可以直接从外部知识库中获取该描述性知识;如果外部知识库中不存在事件对的描述性知识,则可以基于生成模型生成事件对的描述性知识。此处,生成模型可以是预训练的COMET(Commonsense Transformers)模型。
基于上述任一实施例,在获得事件对的描述性知识后,由于事件的描述性知识是子图的形式,可以使用编码网络中的图卷积神经网络编码事件对的描述性知识,进而得到事件对的描述性知识表示。其计算公式如下所示:
其中,表示图网络第l层中第i个节点的表示,ρ()表示激活函数,/>表示邻接矩阵第i行第j列元素,/>表示图网络中第l层权重参数,/>表示图网络第l-1层中第j个节点的表示,/>表示第l层图网络的偏置参数,/>表示事件e1的描述性知识表示,表示事件e2的描述性知识表示,/>表示事件对的描述性知识表示。
基于上述任一实施例,步骤110包括:
基于预训练语言模型以及文本,对事件对进行编码,得到事件对的上下文表示。
具体地,考虑到预训练语言模型对于事件因果关系识别任务是效果最优的编码器,本发明实施例在确定待识别的事件对之后,将该事件对所在的文本输入到预训练语言模型中,预训练语言模型对该事件对进行上下文编码,进而得到该事件对的上下文表示。此处,预训练语言模型可以是GPT(Generative Pre-Training)模型、ELMO(Embeddings fromLanguage Models)模型、BERT(Bidirectional Encoder Representation fromTransformers)模型等,本发明实施例对此不作具体限定。
基于上述任一实施例,给定待识别的事件对(e1,e2)以及所在的文本,首先将起始标志位[CLS]和终止标志位[SEP]分别放在文本每一行的开头和结尾,然后使用BERT模型编码上下文,进而得到该事件对的上下文表示。其计算公式如下所示:
其中,表示事件对的上下文表示,h[CLS]表示起始标志位的上下文表示,表示事件e1的上下文表示,/>表示事件e2的上下文表示。
基于上述任一实施例,在获得事件对的上下文表示、描述性知识表示和关联性知识表示之后,可以这三种特征表示拼接在一起,从而得到该事件对的最终表示,随即,因果关系识别模型中的识别网络对该最终表示进行因果关系识别,从而得到该事件对的因果关系。其计算公式如下所示:
其中,表示事件对的最终表示,Ws表示可学习的权重矩阵,bs表示偏置项,softmax()表示激活函数,/>表示因果关系识别结果。
基于上述任一实施例,当获取到训练数据之后,可以利用训练数据以及优化目标函数对初始模型进行训练,从而得到因果关系识别模型。因果关系识别模型的优化目标函数为:
其中,表示模型预测的事件对的因果关系,/>表示实际的事件对的因果关系,s表示事件对所在的文本,D表示训练集,Es表示文本s中的事件集合。
基于上述任一实施例,图2是本发明提供的事件因果关系识别方法的流程示意图之二,如图2所示,该方法主要包括上下文编码、事件对的描述性知识获取和编码、事件对的关联性知识获取和编码、特征融合以及因果关系识别五个步骤。该方法的具体流程如下:首先,获取文本数据,包括事件对所在的文本以及外部知识库中的文本,随即,根据事件对所在的文本以及预训练语言模型,对该事件对进行上下文编码,得到事件对的上下文表示,并根据文本数据获取事件对的描述性知识和关联性知识,分别对该描述性知识和该关联性知识进行编码,得到事件对的描述性知识表示和关联性知识表示,在此基础上,对事件对的上下文表示、描述性知识表示和关联性知识表示进行特征融合,得到事件对的最终表示,再基于该最终表示进行因果关系识别,从而得到事件对的识别结果。
基于上述任一实施例,考虑到事件对的描述性知识是以图结构的形式存在,在编码事件的描述性知识时需要建模这个图结构,并且由于外部知识库的不完备性,知识库中可能不包含事件的描述性知识。另外,事件的关联性知识是以多跳的路径存在,在这条路径上可能包含事件因果关系无关的知识,直接利用多跳路径进行推理并不是最优的。因此,本发明在利用事件的描述性知识和事件的关联性知识时,需要解决以上问题。
图3是本发明提供的事件因果关系识别方法的示例图,在图3所示的示例中,事件对为“global warming”和“tsunami”,事件对所在的文本为“Global warming worsened,and tsunami strengthened.”。该方法在上下文编码阶段,根据文本以及基于深度Transformer的BERT模型,对事件对进行上下文编码,得到事件对的上下文表示;在描述图引入阶段,通过在ConceptNet知识库中检索事件对的描述性知识,或者基于现有知识以及生成模型生成事件对的描述性知识,得到事件对的描述性知识,并基于此构建描述图,再对描述图进行编码,得到事件对的描述性知识表示;
在关联图引入阶段,通过在知识库中获取到事件对之间的最短多跳路径,基于这个路径构建关联图,并自动地学习关联图的结构信息,对关联图不断进行迭代精炼,直到得到最优的关联图结构,再在该关联图结构上进行因果推理,最终得到事件对的关联性知识表示;在此基础上,可以将事件对的上下文表示、描述性知识表示和关联性知识表示拼接在一起,得到事件对的最终表示,再基于最终表示进行因果关系识别,即可得到“globalwarming”和“tsunami”之间的因果关系。
基于上述任一实施例,为了克服现有技术存在的缺陷,本发明针对在非结构文本中进行事件因果关系识别的问题,利用隐式结构归纳网络对事件因果关系识别数据进行建模,从而得到因果关系识别模型,该模型能够利用外部的背景知识提升事件因果关系识别的性能。
本发明提供的事件因果关系识别方法包括如下步骤:
步骤1:对事件对所在的文本进行处理,使得文本转成预训练语言模型的输入形式后输入到该模型中,利用该模型对事件对进行上下文编码,得到事件对的上下文表示;
步骤2:采用检索和生成混合的方式来获取事件对的描述性知识,并对其进行编码得到事件对的描述性知识表示;
步骤3:从外部的知识库中获取事件的关联性知识,基于该类知识进行多跳推理得到事件对的关联性知识表示;
步骤4:将事件对的上下文表示、描述性知识表示和关联性知识表示融合形成事件对的最终表示;
步骤5:基于最终表示以及识别网络,对最终表示进行因果关系识别,得到事件对的因果关系。
为了说明本发明提供方法的有效性,本发明实施例做了实验来验证该方法的性能:使用EventStoryLine数据集和Causal-TimeBank数据集作为训练和测试语料。EventStoryLine数据集包含258篇文档,5334个事件以及1770个有因果关系的事件对;Causal-TimeBank数据集包含184篇文档,6813个事件以及318个有因果关系的事件对。通过对比已有方法和本方法的效果来说明其有效性。在EventStoryLine数据集上的对比结果如表1所示,在Causal-TimeBank数据集上的对比结果如表2所示:
表1
表2
其中,P、R、F1为三个评价指标,分别代表精确率、召回率、精确率和召回率的调和均值,*表示根据显著性检验方法所得的p值为0.05。
从上图的实验结果可以看到,基于隐式结构归纳网络的事件因果关系识别的方法在EventStoryLine数据集和Causal-TimeBank数据集上的表现超过了已有方法,这表明该方法能够有效地利用外部的背景知识提升事件因果关系识别的性能。
基于上述任一实施例,本发明实施例提供了一种事件因果关系识别系统,该系统包括:上下文编码模块,使用预训练语言模型对事件对进行上下文编码,得到事件对的上下文表示;描述图归纳模块,首先使用检索和生成混合的方法从外部的知识库中得到事件对的描述性知识,由于事件对的描述性知识是以图结构的形式存在的,可以使用图卷积神经网络进行编码,得到事件对的描述性知识表示;关联图归纳模块,首先从外部的知识库中检索得到事件对之间的最短多跳路径,基于此路径构建关联图,自动地学习关联图的结构信息,并对关联图不断进行迭代优化,直到得到最优的关联图结构,再在该关联图结构上进行因果推理,最终得到事件对的关联性知识表示;特征融合模块,将事件对的上下文表示、描述性知识表示和关联性知识表示拼接在一起,得到事件对的最终表示,再基于最终表示进行因果关系识别。
下面对本发明提供的事件因果关系识别装置进行描述,下文描述的事件因果关系识别装置与上文描述的事件因果关系识别方法可相互对应参照。
基于上述任一实施例,本发明实施例提供了一种事件因果关系识别装置。图4是本发明提供的事件因果关系识别装置的结构示意图,该装置包括:
确定模块410,用于基于待识别的事件对所在的文本,确定事件对的上下文表示;
识别模块420,用于将事件对的上下文表示,以及与事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到因果关系识别模型输出的事件对的因果关系;
其中,因果关系识别模型是基于样本事件对的上下文表示,与样本事件对相关的样本描述性知识和样本关联性知识,以及样本事件对的因果关系训练得到的。
本发明实施例提供的装置,通过获取事件对的上下文表示,并借助与事件对相关的描述性知识和关联性知识进行事件对的因果关系识别,从而能够充分挖掘事件对之间的因果关系信息,得到事件对的因果关系,进而避免显式线索缺乏导致事件因果关系无法识别的问题,极大地提高了事件因果关系识别的准确性。
基于上述任一实施例,因果关系识别模型包括编码网络和识别网络;
识别模块420包括:
描述编码单元,用于基于编码网络,对描述性知识进行编码,得到事件对的描述性知识表示;
关联编码单元,用于基于编码网络,对关联性知识进行编码,得到事件对的关联性知识表示;
因果识别单元,用于基于识别网络,对上下文表示、描述性知识表示和关联性知识表示进行因果关系识别,得到事件对的因果关系。
基于上述任一实施例,关联编码单元用于:
计算关联性知识中各个事件之间的相关性,并基于各个事件之间的相关性构建关联图;
基于编码网络中的图卷积神经网络,学习关联图中各个节点之间的隐式关系,得到事件对的关联性知识表示。
基于上述任一实施例,因果识别单元用于:
对上下文表示、描述性知识表示和关联性知识表示进行特征融合,得到事件对的最终表示;
基于最终表示以及识别网络,对最终表示进行因果关系识别,得到事件对的因果关系。
基于上述任一实施例,关联性知识是基于如下步骤确定的:
基于外部知识库,确定事件对中两个事件分别对应的节点之间的最短多跳路径;
基于最短多跳路径,确定事件对的关联性知识。
基于上述任一实施例,描述性知识是基于如下步骤确定的:
在外部知识库中检索事件对的描述性知识;
若外部知识库中存在描述性知识,则从外部知识库中获取事件对的描述性知识;
若外部知识库中不存在描述性知识,则基于生成模型生成事件对的描述性知识。
基于上述任一实施例,确定模块410用于:
基于预训练语言模型以及文本,对事件对进行编码,得到事件对的上下文表示。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行事件因果关系识别方法,该方法包括:基于待识别的事件对所在的文本,确定事件对的上下文表示;将事件对的上下文表示,以及与事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到因果关系识别模型输出的事件对的因果关系;其中,因果关系识别模型是基于样本事件对的上下文表示,与样本事件对相关的样本描述性知识和样本关联性知识,以及样本事件对的因果关系训练得到的。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的事件因果关系识别方法,该方法包括:基于待识别的事件对所在的文本,确定事件对的上下文表示;将事件对的上下文表示,以及与事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到因果关系识别模型输出的事件对的因果关系;其中,因果关系识别模型是基于样本事件对的上下文表示,与样本事件对相关的样本描述性知识和样本关联性知识,以及样本事件对的因果关系训练得到的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的事件因果关系识别方法,该方法包括:基于待识别的事件对所在的文本,确定事件对的上下文表示;将事件对的上下文表示,以及与事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到因果关系识别模型输出的事件对的因果关系;其中,因果关系识别模型是基于样本事件对的上下文表示,与样本事件对相关的样本描述性知识和样本关联性知识,以及样本事件对的因果关系训练得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种事件因果关系识别方法,其特征在于,包括:
基于待识别的事件对所在的文本,确定所述事件对的上下文表示;
将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;
其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的;
所述因果关系识别模型包括编码网络和识别网络;
所述将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系,包括:
基于所述编码网络,对所述描述性知识进行编码,得到所述事件对的描述性知识表示;
基于所述编码网络,对所述关联性知识进行编码,得到所述事件对的关联性知识表示;
基于所述识别网络,对所述上下文表示、所述描述性知识表示和所述关联性知识表示进行因果关系识别,得到所述事件对的因果关系;
所述基于所述编码网络,对所述关联性知识进行编码,得到所述事件对的关联性知识表示,包括:
计算所述关联性知识中各个事件之间的相关性,并基于所述各个事件之间的相关性构建关联图;
基于所述编码网络中的图卷积神经网络,学习所述关联图中各个节点之间的隐式关系,得到所述事件对的关联性知识表示;
所述描述性知识是基于如下步骤确定的:
在外部知识库中检索所述事件对的描述性知识;
若所述外部知识库中存在所述描述性知识,则从所述外部知识库中获取所述事件对的描述性知识;
若所述外部知识库中不存在所述描述性知识,则基于生成模型生成所述事件对的描述性知识。
2.根据权利要求1所述的事件因果关系识别方法,其特征在于,所述基于所述识别网络,对所述上下文表示、所述描述性知识表示和所述关联性知识表示进行因果关系识别,得到所述事件对的因果关系,包括:
对所述上下文表示、所述描述性知识表示和所述关联性知识表示进行特征融合,得到所述事件对的最终表示;
基于所述最终表示以及所述识别网络,对所述最终表示进行因果关系识别,得到所述事件对的因果关系。
3.根据权利要求1所述的事件因果关系识别方法,其特征在于,所述关联性知识是基于如下步骤确定的:
基于外部知识库,确定所述事件对中两个事件分别对应的节点之间的最短多跳路径;
基于所述最短多跳路径,确定所述事件对的关联性知识。
4.根据权利要求1至3中任一项所述的事件因果关系识别方法,其特征在于,所述基于待识别的事件对所在的文本,确定所述事件对的上下文表示,包括:
基于预训练语言模型以及所述文本,对所述事件对进行编码,得到所述事件对的上下文表示。
5.一种事件因果关系识别装置,其特征在于,包括:
确定模块,用于基于待识别的事件对所在的文本,确定所述事件对的上下文表示;
识别模块,用于将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;
其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的;
所述因果关系识别模型包括编码网络和识别网络;
所述将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系,包括:
基于所述编码网络,对所述描述性知识进行编码,得到所述事件对的描述性知识表示;
基于所述编码网络,对所述关联性知识进行编码,得到所述事件对的关联性知识表示;
基于所述识别网络,对所述上下文表示、所述描述性知识表示和所述关联性知识表示进行因果关系识别,得到所述事件对的因果关系;
所述基于所述编码网络,对所述关联性知识进行编码,得到所述事件对的关联性知识表示,包括:
计算所述关联性知识中各个事件之间的相关性,并基于所述各个事件之间的相关性构建关联图;
基于所述编码网络中的图卷积神经网络,学习所述关联图中各个节点之间的隐式关系,得到所述事件对的关联性知识表示;
所述描述性知识是基于如下步骤确定的:
在外部知识库中检索所述事件对的描述性知识;
若所述外部知识库中存在所述描述性知识,则从所述外部知识库中获取所述事件对的描述性知识;
若所述外部知识库中不存在所述描述性知识,则基于生成模型生成所述事件对的描述性知识。
6.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述事件因果关系识别方法的步骤。
7.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述事件因果关系识别方法的步骤。
CN202110819756.9A 2021-07-20 2021-07-20 事件因果关系识别方法、装置、电子设备与存储介质 Active CN113779190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110819756.9A CN113779190B (zh) 2021-07-20 2021-07-20 事件因果关系识别方法、装置、电子设备与存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110819756.9A CN113779190B (zh) 2021-07-20 2021-07-20 事件因果关系识别方法、装置、电子设备与存储介质

Publications (2)

Publication Number Publication Date
CN113779190A CN113779190A (zh) 2021-12-10
CN113779190B true CN113779190B (zh) 2023-08-18

Family

ID=78836135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110819756.9A Active CN113779190B (zh) 2021-07-20 2021-07-20 事件因果关系识别方法、装置、电子设备与存储介质

Country Status (1)

Country Link
CN (1) CN113779190B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114357022B (zh) * 2021-12-23 2024-05-07 北京中视广信科技有限公司 一种基于事件关系发现的媒体内容关联挖掘方法
CN117350386B (zh) * 2023-12-04 2024-03-19 南京信息工程大学 一种事件溯因推理方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109791569A (zh) * 2016-10-05 2019-05-21 国立研究开发法人情报通信研究机构 因果关系识别装置及用于其的计算机程序
CN109977237A (zh) * 2019-05-27 2019-07-05 南京擎盾信息科技有限公司 一种面向法律领域的动态法律事件图谱构建方法
CN111581396A (zh) * 2020-05-06 2020-08-25 西安交通大学 一种基于多维特征融合与依存句法的事件图谱构建系统及方法
CN111709244A (zh) * 2019-11-20 2020-09-25 中共南通市委政法委员会 一种用于矛盾纠纷事件因果关系识别的深度学习方法
CN111797233A (zh) * 2020-06-12 2020-10-20 南京擎盾信息科技有限公司 基于垂直领域的事件链结构识别的方法和装置
CN111881688A (zh) * 2020-08-11 2020-11-03 中国科学院自动化研究所 基于屏蔽泛化机制的事件因果关系识别方法、系统、装置
CN112287996A (zh) * 2020-10-27 2021-01-29 南京莱斯信息技术股份有限公司 一种基于机器学习的重大事件关键因子挖掘方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11483326B2 (en) * 2019-08-30 2022-10-25 Palo Alto Networks, Inc. Context informed abnormal endpoint behavior detection
US20210103611A1 (en) * 2019-10-03 2021-04-08 Adobe Inc. Context-based organization of digital media

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109791569A (zh) * 2016-10-05 2019-05-21 国立研究开发法人情报通信研究机构 因果关系识别装置及用于其的计算机程序
CN109977237A (zh) * 2019-05-27 2019-07-05 南京擎盾信息科技有限公司 一种面向法律领域的动态法律事件图谱构建方法
CN111709244A (zh) * 2019-11-20 2020-09-25 中共南通市委政法委员会 一种用于矛盾纠纷事件因果关系识别的深度学习方法
CN111581396A (zh) * 2020-05-06 2020-08-25 西安交通大学 一种基于多维特征融合与依存句法的事件图谱构建系统及方法
CN111797233A (zh) * 2020-06-12 2020-10-20 南京擎盾信息科技有限公司 基于垂直领域的事件链结构识别的方法和装置
CN111881688A (zh) * 2020-08-11 2020-11-03 中国科学院自动化研究所 基于屏蔽泛化机制的事件因果关系识别方法、系统、装置
CN112287996A (zh) * 2020-10-27 2021-01-29 南京莱斯信息技术股份有限公司 一种基于机器学习的重大事件关键因子挖掘方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于双层CNN-BiGRU-CRF的事件因果关系抽取;郑巧夺 等;《计算机工程》;58-64,72 *

Also Published As

Publication number Publication date
CN113779190A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN112528672B (zh) 一种基于图卷积神经网络的方面级情感分析方法及装置
CN108363790B (zh) 用于对评论进行评估的方法、装置、设备和存储介质
Liu et al. Tree-structured decoding for solving math word problems
JP7253593B2 (ja) 意味解析モデルのトレーニング方法及び装置、電子機器並びに記憶媒体
CN111444320B (zh) 文本检索方法、装置、计算机设备和存储介质
CN111914067B (zh) 中文文本匹配方法及系统
CN110096567B (zh) 基于qa知识库推理的多轮对话回复选择方法、系统
CN110737758A (zh) 用于生成模型的方法和装置
CN110276071B (zh) 一种文本匹配方法、装置、计算机设备及存储介质
CN104615589A (zh) 训练命名实体识别模型的方法、命名实体识别方法及装置
CN111382255A (zh) 用于问答处理的方法、装置、设备和介质
CN110990555B (zh) 端到端检索式对话方法与系统及计算机设备
CN113779190B (zh) 事件因果关系识别方法、装置、电子设备与存储介质
CN108536735B (zh) 基于多通道自编码器的多模态词汇表示方法与系统
CN110678882A (zh) 使用机器学习从电子文档选择回答跨距
CN111966811A (zh) 意图识别和槽填充方法、装置、可读存储介质及终端设备
CN117421595A (zh) 一种基于深度学习技术的系统日志异常检测方法及系统
CN111241843B (zh) 基于复合神经网络的语义关系推断系统和方法
CN113343692B (zh) 搜索意图的识别方法、模型训练方法、装置、介质及设备
CN117521814A (zh) 一种基于多模态输入和知识图谱的问答方法及装置
CN117076608A (zh) 一种基于文本动态跨度的整合外部事件知识的脚本事件预测方法及装置
Chandra et al. An Enhanced Deep Learning Model for Duplicate Question Detection on Quora Question pairs using Siamese LSTM
US20230111052A1 (en) Self-learning annotations to generate rules to be utilized by rule-based system
CN114239555A (zh) 一种关键词提取模型的训练方法及相关装置
CN114065769A (zh) 情感原因对抽取模型的训练方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant