CN112580346B

CN112580346B - 事件抽取方法、装置、计算机设备和存储介质

Info

Publication number: CN112580346B
Application number: CN202011285003.6A
Authority: CN
Inventors: 赵正锐; 刘进步; 费加磊
Original assignee: Shenzhen Zhuiyi Technology Co Ltd
Current assignee: Shenzhen Zhuiyi Technology Co Ltd
Priority date: 2020-11-17
Filing date: 2020-11-17
Publication date: 2022-05-06
Anticipated expiration: 2040-11-17
Also published as: CN112580346A

Abstract

本申请涉及一种事件抽取方法、装置、计算机设备和存储介质。所述方法包括：获取待进行事件抽取的目标文本；将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率；根据所述论元角色识别概率识别得到所述目标分词对应的目标论元角色；根据所述事件类型识别概率识别得到初始事件类型集合；从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型，以根据所述目标论元角色以及所述目标事件类型得到所述目标文本对应的事件抽取结果。采用本方法能够提高事件抽取准确度。

Description

事件抽取方法、装置、计算机设备和存储介质

技术领域

本申请涉及信息处理技术领域，特别是涉及一种事件抽取方法、装置、计算机设备和存储介质。

背景技术

随着科学技术的发展，在很多情况下都需要对文本进行信息提取，以确定文本所包含的信息。例如可以对文本进行事件抽取(Event extraction)，事件抽取技术可以通过识别特定类型的事件，并进行相关信息的确定和抽取，得到结构化的事件信息。

传统技术中，在进行事件抽取时，一般是先进行触发词抽取以及事件类型识别任务，然后再进行论元抽取以及论元角色识别任务，然而经常存在事件抽取准确度低的情况。

发明内容

基于此，有必要针对上述技术问题，提供一种能够事件抽取方法、装置、计算机设备和存储介质。

一种事件抽取方法，所述方法包括：获取待进行事件抽取的目标文本；将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率；根据所述论元角色识别概率识别得到所述目标分词对应的目标论元角色；根据所述事件类型识别概率识别得到初始事件类型集合；从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型，以根据所述目标论元角色以及所述目标事件类型得到所述目标文本对应的事件抽取结果。

在一些实施例中，所述事件抽取联合模型包括文本编码模型、事件类型识别模型以及论元角色识别模型，所述将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率包括：将所述目标文本输入到所述文本编码模型中，所述文本编码模型对所述目标文本对应的各个目标分词进行编码，得到各个所述目标分词分别对应的分词编码向量；将所述目标分词分别对应的分词编码向量输入到所述事件类型识别模型中，得到各个所述目标分词分别对应的事件类型识别概率；将所述目标分词对应的分词编码向量输入到所述论元角色识别模型中，得到各个所述目标分词分别对应的论元角色识别概率。

在一些实施例中，所述论元角色识别概率包括所述目标分词为候选论元角色的头指针的概率以及为所述候选论元角色的尾指针的概率，所述方法还包括：若所述目标分词为所述候选论元角色的头指针的概率大于第一阈值，则确定所述目标分词为所述候选论元角色的头指针；若所述目标分词为所述候选论元角色的尾指针的概率大于第二阈值，则确定所述目标分词为所述候选论元角色的尾指针；根据所述候选论元角色的头指针以及所述候选论元角色的尾指针确定目标论元片段。

在一些实施例中，所述事件类型识别概率包括所述目标分词为候选事件类型的头指针的概率以及为所述候选事件类型的尾指针的概率，所述根据所述事件类型识别概率识别得到初始事件类型集合包括：根据所述目标分词为候选事件类型的头指针的概率，获取所述目标论元片段的起始点对应的头指针所对应的头事件类型集合；根据所述目标分词为所述候选事件类型的尾指针的概率，获取所述目标论元片段的终止点对应的尾指针所对应的尾事件类型集合；根据所述头事件类型集合以及尾事件类型集合确定所述目标论元片段对应的初始事件类型集合。

在一些实施例中，所述根据所述目标分词为候选事件类型的头指针的概率，获取所述目标论元片段的起始点对应的头指针所对应的头事件类型集合包括：若所述目标分词为候选事件类型的头指针的概率大于第三阈值，则确定所述目标分词为所述候选事件类型的头指针；确定与所述目标论元片段的起始点的距离小于第一距离的目标分词，作为第一邻近分词；将以所述第一邻近分词为头指针的候选事件类型作为头事件类型，得到头事件类型集合。

在一些实施例中，所述根据所述目标分词为候选事件类型的尾指针的概率，获取所述目标论元片段的终止点对应的尾指针所对应的尾事件类型集合包括：若所述目标分词为候选事件类型的尾指针的概率大于第四阈值，则确定所述目标分词为所述候选事件类型的尾指针；确定与所述目标论元片段的终止点的距离小于第二距离的目标分词，作为第二邻近分词；将以所述第二邻近分词为尾指针的候选事件类型作为尾事件类型，得到尾事件类型集合。

在一些实施例中，所述根据所述头事件类型集合以及尾事件类型集合确定所述目标论元片段对应的初始事件类型集合包括：将所述头事件类型集合中的事件类型与所述尾事件类型集合中的事件类型进行对比；将对比一致的事件类型作为初始事件类型，得到所述目标论元片段对应的初始事件类型集合。

在一些实施例中，所述从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型包括：获取预设的事件类型与论元角色的匹配关系；根据所述事件类型与论元角色的匹配关系，将所述初始事件类型集合中，与所述目标论元角色匹配的事件类型作为目标事件类型。

一种事件抽取装置，所述装置包括：目标文本获取模块，用于获取待进行事件抽取的目标文本；处理模块，用于将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率；论元角色得到模块，用于根据所述论元角色识别概率识别得到所述目标分词对应的目标论元角色；初始事件类型集合得到模块，用于根据所述事件类型识别概率识别得到初始事件类型集合；事件抽取结果得到模块，用于从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型，以根据所述目标论元角色以及所述目标事件类型得到所述目标文本对应的事件抽取结果。

在一些实施例中，所述事件抽取联合模型包括文本编码模型、事件类型识别模型以及论元角色识别模型，所述处理模块包括：分词编码向量得到单元，用于将所述目标文本输入到所述文本编码模型中，所述文本编码模型对所述目标文本对应的各个目标分词进行编码，得到各个所述目标分词分别对应的分词编码向量；事件类型识别概率得到单元，用于将所述目标分词分别对应的分词编码向量输入到所述事件类型识别模型中，得到各个所述目标分词分别对应的事件类型识别概率；论元角色识别概率得到单元，用于将所述目标分词对应的分词编码向量输入到所述论元角色识别模型中，得到各个所述目标分词分别对应的论元角色识别概率。

在一些实施例中，所述论元角色识别概率包括所述目标分词为候选论元角色的头指针的概率以及为所述候选论元角色的尾指针的概率，所述装置还包括：头指针确定模块，用于若所述目标分词为所述候选论元角色的头指针的概率大于第一阈值，则确定所述目标分词为所述候选论元角色的头指针；尾指针确定模块，用于若所述目标分词为所述候选论元角色的尾指针的概率大于第二阈值，则确定所述目标分词为所述候选论元角色的尾指针；目标论元片段确定模块，用于根据所述候选论元角色的头指针以及所述候选论元角色的尾指针确定目标论元片段。

在一些实施例中，所述事件类型识别概率包括所述目标分词为候选事件类型的头指针的概率以及为所述候选事件类型的尾指针的概率，所述初始事件类型集合得到模块包括：头事件类型集合获取单元，用于根据所述目标分词为候选事件类型的头指针的概率，获取所述目标论元片段的起始点对应的头指针所对应的头事件类型集合；尾事件类型集合获取单元，用于根据所述目标分词为所述候选事件类型的尾指针的概率，获取所述目标论元片段的终止点对应的尾指针所对应的尾事件类型集合；初始事件类型集合确定单元，用于根据所述头事件类型集合以及尾事件类型集合确定所述目标论元片段对应的初始事件类型集合。

在一些实施例中，所述头事件类型集合获取单元用于：若所述目标分词为候选事件类型的头指针的概率大于第三阈值，则确定所述目标分词为所述候选事件类型的头指针；确定与所述目标论元片段的起始点的距离小于第一距离的目标分词，作为第一邻近分词；将以所述第一邻近分词为头指针的候选事件类型作为头事件类型，得到头事件类型集合。

在一些实施例中，所述尾事件类型集合获取单元用于：若所述目标分词为候选事件类型的尾指针的概率大于第四阈值，则确定所述目标分词为所述候选事件类型的尾指针；确定与所述目标论元片段的终止点的距离小于第二距离的目标分词，作为第二邻近分词；将以所述第二邻近分词为尾指针的候选事件类型作为尾事件类型，得到尾事件类型集合。

在一些实施例中，所述初始事件类型集合确定单元用于：将所述头事件类型集合中的事件类型与所述尾事件类型集合中的事件类型进行对比；将对比一致的事件类型作为初始事件类型，得到所述目标论元片段对应的初始事件类型集合。

在一些实施例中，所述事件抽取结果得到模块用于：获取预设的事件类型与论元角色的匹配关系；根据所述事件类型与论元角色的匹配关系，将所述初始事件类型集合中，与所述目标论元角色匹配的事件类型作为目标事件类型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：获取待进行事件抽取的目标文本；将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率；根据所述论元角色识别概率识别得到所述目标分词对应的目标论元角色；根据所述事件类型识别概率识别得到初始事件类型集合；从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型，以根据所述目标论元角色以及所述目标事件类型得到所述目标文本对应的事件抽取结果。

在一些实施例中，所述论元角色识别概率包括所述目标分词为候选论元角色的头指针的概率以及为所述候选论元角色的尾指针的概率，所述计算机程序还使得所述处理器执行以下步骤：若所述目标分词为所述候选论元角色的头指针的概率大于第一阈值，则确定所述目标分词为所述候选论元角色的头指针；若所述目标分词为所述候选论元角色的尾指针的概率大于第二阈值，则确定所述目标分词为所述候选论元角色的尾指针；根据所述候选论元角色的头指针以及所述候选论元角色的尾指针确定目标论元片段。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：获取待进行事件抽取的目标文本；将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率；根据所述论元角色识别概率识别得到所述目标分词对应的目标论元角色；根据所述事件类型识别概率识别得到初始事件类型集合；从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型，以根据所述目标论元角色以及所述目标事件类型得到所述目标文本对应的事件抽取结果。

上述事件抽取方法、装置、计算机设备和存储介质，由于可以基于事件抽取联合模型得到目标文本中各个目标分词分别对应的事件类型识别概率以及论元角色识别概率，再基于论元角色识别概率识别得到所述目标分词对应的目标论元角色，因此可以准确得到对应的论元角色，而且事件类型识别概率以及论元角色识别概率是联合得到的，在确定目标分词对应的目标论元角色时，结合目标论元角色从基于事件类型识别概率识别得到初始事件类型集合中获取得到目标事件类型，能够提高得到目标事件类型的准确度，因此提高了事件抽取结果的准确度。

附图说明

图1为一个实施例中事件抽取方法的应用环境图；

图2为一个实施例中事件抽取方法的流程示意图；

图3为一个实施例中事件将目标文本输入到事件抽取联合模型中进行处理，得到目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率的流程示意图；

图4为一个实施例中根据事件类型识别概率识别得到初始事件类型集合的流程示意图；

图5A为一个实施例中得到事件类型识别模型的识别原理示意图；

图5B为一个实施例中得到论元角色识别模型的识别原理示意图；

图6为一个实施例中事件抽取装置的结构框图；

图7为一个实施例中事件处理模块的结构框图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的事件抽取方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。终端102可以接收用户的文本编辑操作，得到目标文本，终端102将目标文本上传至服务器104，服务器104执行本申请实施例提供的事件抽取方法，得到事件抽取结果。服务器可以基于事件抽取结果构建知识库。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一些实施例中，得到事件抽取结果后，可以将事件抽取结果的各个信息对应存储，例如可以建立知识图谱，当接收到搜索请求时，可以根据搜索请求中的搜索词在知识图谱中进行搜索，得到搜索结果，将搜索结果返回至搜索请求对应的终端。

在一个实施例中，如图2所示，提供了一种事件抽取方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤S202，获取待进行事件抽取的目标文本。

其中，事件可以是指某个时间，一个或多个动作在一定地域范围内的发生或是状态的变化。事件抽取可以从包含有事件信息的非结构化文本中，将事件触发词与事件论元以结构化的形式呈现出来。事件抽取主要包括事件检测与分类(又称事件识别)和事件论元角色抽取(又称事件元素识别)两个任务。对于事件的检测与分类，可以预先给定待抽取的候选事件类型，例如候选的事件类型可以包括攻击事件、诉讼事件以及会议事件。事件论元(Event argument)是事件的各个要素，可以包括实体描述、时间表达式和属性值。一类事件中的所包括的角色是预先定义好的，而在具体的事件实例中事件论元会有所不同。事件论元角色抽取即是检测出事件的论元，并分配其在事件中的相应角色。例如，攻击事件的事件论元角色(role)可以为攻击者或者被攻击者。目标文本可以是中文文本。

例如，假设定义“袭击”事件为候选事件类型之一，针对自然语言文本“A 在B地点发生的袭击事件中受伤”，事件抽取的任务可以是识别出触发词“袭击”，表示表达的事件类型为“袭击”，并且识别出事件论元“A”在此袭击事件中充当的角色为“受害者”、“B地点”在此袭击事件中充当的角色为“地点”。

具体地，服务器响应于事件抽取指令，获取目标文本。例如，服务器可以接收对某个新闻网站上的新闻进行事件抽取的指令，获取该新闻网站上新闻的标题或者新闻的摘要，作为待进行事件抽取的文本。

步骤S204，将目标文本输入到事件抽取联合模型中进行处理，得到目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率。

其中，事件抽取联合模型是用于进行事件抽取的模型，事件抽取联合模型可以是神经网络模型。事件抽取联合模型可以包括编码模型以及解码模型，解码模型可以进一步包括事件类型识别模型以及论元角色识别模型。编码模型用于对文本进行编码，得到编码向量，事件类型识别模型以及论元角色识别模型分别获取编码得到的向量进行解码。

目标分词是指对目标文本进行分词所得到的词，分词是将连续的字序列按照一定的规范重新组合成词序列的过程，分词的方法可以是基于字符串匹配的分词方法、基于理解的分词方法或者基于统计的分词方法的至少一个，例如，假设目标文本为“A在B地点发生的袭击事件中受伤”，则分词后所得的词序列可以表示为“A/在/B地点/发生/的/袭击事件/中/受伤/”，其中的“A”以及“在” 等为目标分词。

具体地，服务器可以将目标文本输入到事件抽取联合模型中，事件抽取联合模型基于编码模型，融合目标文本中的上下文信息，对目标文本中的各个目标分词进行编码，得到每个目标分词分别对应的分词编码向量。服务器将目标分词分别对应的分词编码向量组成的分词编码向量序列输入到事件类型识别模型中，得到各个目标分词分别对应的事件类型识别概率。服务器将目标分词分别对应的分词编码向量组成的分词编码向量序列输入到论元角色识别模型中，得到各个目标分词分别对应的论元角色识别概率。例如，可以得到目标分词C 为各个候选的论元角色的概率以及目标分词C为各个候选的事件类型的概率。

步骤S206，根据论元角色识别概率识别得到目标分词对应的目标论元角色。

具体地，可以将所对应的论元角色识别概率最大的论元角色作为目标分词对应的目标论元角色，也可以是将所对应的论元角色识别概率大于预设概率阈值的论元角色作为目标分词对应的目标论元角色。例如候选的论元角色可以有多个，可以得到目标分词分别属于各个候选的论元角色的概率，将所对应的论元角色识别概率大于预设概率阈值的候选论元角色作为目标分词对应的目标论元角色。举个例子，假设候选的论元角色有3个：J1、J2以及J3，得到目标分词C为候选论元角色J1的概率为0.05，目标分词C为候选论元角色J2的概率为0.15，目标分词C为候选论元角色J3的概率为0.8，概率阈值为0.7，由于候选论元角色J3的概率0.8大于概率阈值0.7，故可以得到目标分词C的目标论元角色为J3。

步骤S208，根据事件类型识别概率识别得到初始事件类型集合。

具体地，初始事件类型是初步筛选得到的事件类型。服务器可以根据事件类型识别概率选取多个初始事件类型，组成事件类型集合，多个是指至少两个。服务器可以是将满足筛选条件的事件类型作为目标分词对应的初始事件类型。筛选条件包括事件类型识别概率大于预设概率阈值，或者事件类型识别概率的排序在预设排序之前的事件类型的至少一个，事件类型识别概率是按照从大到小的顺序排序的。例如，假设有8个候选事件类型，则可以获取事件类型识别概率中概率在前5的事件类型，作为初步筛选得到的事件类型。

步骤S210，从初始事件类型集合中筛选得到与目标论元角色匹配的目标事件类型，以根据目标论元角色以及目标事件类型得到目标文本对应的事件抽取结果。

具体地，由于已经得到目标论元角色，因此服务器可以获取与目标论元角色匹配的类型，作为目标事件类型。事件抽取结果可以包括目标论元角色以及目标事件类型。

在一些实施例中，服务器可以获取预设的事件类型与论元角色的匹配关系；根据事件类型与论元角色的匹配关系，将初始事件类型集合中，与目标论元角色匹配的事件类型作为目标事件类型。

具体地，可以预先设置各个候选的事件类型与候选的论元角色的匹配关系。例如设置攻击事件类型所对应的论元角色包括攻击者与受害者。因此，得到目标论元角色时，可以将初始事件类型集合中，与目标论元角色匹配的事件类型作为目标事件类型。例如，假设得到目标论元角色为攻击者，而初始事件类型集合中包括攻击事件以及诉讼事件，则攻击者所匹配的事件类型为攻击事件，即目标事件类型为攻击事件。

上述事件抽取方法中，由于可以基于事件抽取联合模型得到目标文本中各个目标分词分别对应的事件类型识别概率以及论元角色识别概率，再基于论元角色识别概率识别得到目标分词对应的目标论元角色，因此可以准确得到对应的论元角色，而且事件类型识别概率以及论元角色识别概率是联合得到的，在确定目标分词对应的目标论元角色时，结合目标论元角色从基于事件类型识别概率识别得到初始事件类型集合中获取得到目标事件类型，能够提高得到目标事件类型的准确度，因此提高了事件抽取结果的准确度。

在一个实施例中，如图3所示，事件抽取联合模型包括文本编码模型、事件类型识别模型以及论元角色识别模型，步骤S204即将目标文本输入到事件抽取联合模型中进行处理，得到目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率包括：

步骤S302，将目标文本输入到文本编码模型中，文本编码模型对目标文本对应的各个目标分词进行编码，得到各个目标分词分别对应的分词编码向量。

文本编码模型用于对文本进行编码，可以是预训练BERT(Bidirectional EncoderRepresentations from Transformers)编码模型。例如可以采用针对中文优化的开源预训练模型Roberta-WWM-ext-large。该模型在BERT基础上发展改进而来，引入了整词掩码(Whole Word Masking)，避免了中文语境中词汇固定搭配降低掩码语言模型的学习难度。同时加入了更长的语料，并删除了下句预测(Next Sentence Prediction)训练任务。

文本编码模型对目标文本对应的各个目标分词进行编码，得到各个目标分词分别对应的分词编码向量。例如输入的中文句子包括N个分词(x₀,x₁,…x_N)，编码模型从(x₀,x₁,…x_N)中抽取特征，输出包含上下文信息的表达 (x′₀,x′₁,…x′_N)，以便于后续下游任务的使用。举个实际的例子，假设一个目标文本中有10个目标分词，则可以输出10个目标分词中每个目标分词分别对应的编码向量，即输出10个分词编码向量。

步骤S304，将目标分词分别对应的分词编码向量输入到事件类型识别模型中，得到各个目标分词分别对应的事件类型识别概率。

具体地，服务器可以按照目标分词的顺序，将目标分词分别对应的分词编码向量组成分词编码向量序列，输入到事件类型识别模型中，得到每个目标分词属于每个事件类型的概率，即事件类型识别概率。

步骤S306，将目标分词对应的分词编码向量输入到论元角色识别模型中，得到各个目标分词分别对应的论元角色识别概率。

具体地，服务器可以按照目标分词的顺序，将目标分词分别对应的分词编码向量组成分词编码向量序列，输入到论元角色识别模型中，得到每个目标分词属于每个论元角色的概率，即论元角色识别概率。

本申请实施例中，论元角色识别模型与事件类型识别模型是共享文本编码模型的。并分别基于文本编码向量得到各自所要得到的概率，因此可以反映出子任务的关联性，相互提升子任务的效果。这样可以避免分阶段进行，导致上游的错误会传递到下游任务，导致错误传播，而且不能反映出子任务的相关性的情况。即本申请实施例中的模型是基于联合框架的事件抽取模型，把事件类型也当作事件论元的标签，同一事件论元对应论元角色和事件类型两级标签，采用联合抽取模型同时得到论元角色和事件类型

在一些实施例中，文本编码模型、事件类型识别模型以及论元角色识别模型是联合训练得到的。在模型训练时，可以基于论元角色识别模型所对应的损失值对论元角色识别模型的模型参数进行调整，基于事件类型识别模型所对应的损失值对事件类型识别模型的模型参数进行调整。在调整文本编码模型中，可以根据论元角色识别模型所对应的损失值计算得到第一参数下降梯度，以及根据事件类型识别模型所对应的损失值计算得到的第二参数下降梯度，将第一参数下降梯度以及第二参数下降梯度的和，作为文本编码模型的模型参数的下降梯度，根据该下降梯度对文本编码模型的模型参数进行调整，使得文本模型的参数是朝着使事件类型识别模型的识别准确度以及论元角色识别模型的识别准确度提高的方向调整的，提高了文本编码模型编码得到的向量的准确度。

在一些实施例中，可以采用公式(1)计算模型损失值。

其中公式5中γ为超参数，

和

分别代表负例和正例的概率，K为正例样本数，L为负例样本数，m是正例相似度和负例相似度之间的距离，L_uni表示模型损失值。

在一些实施例中，可以采用Circle Loss计算模型损失值，Circle Loss损失函数提供了一个统一的视角将传统的Triplet Loss、CE Loss(sigmoid cross entropy loss)以及其他变种统一了起来。Triplet Loss是深度学习中的一种损失函数，用于训练差异性较小的样本，如人脸等，Feed数据包括锚(Anchor) 示例、正(Positive)示例、负(Negative)示例，通过优化锚示例与正示例的距离小于锚示例与负示例的距离，实现样本的相似性计算。Circle Loss优化目标从构建一个分开空间的超平面，进一步推至更大的类间距离和更小的更内距离，在正样本和负样本概率构建的空间上形成一个类似圆形分布，其中L_circle表示模型损失值，公式2中γ为超参数，

和

分别代表负例和正例的概率，K 为正例样本数，L为负例样本数，m是正例相似度和负例相似度之间的距离，

以及

可以是预设的权重系数。

Circle Loss主要是区分正例相似度和负例相似度之间的差值，让一个样本属于它自己类的概率尽量大，可以不关注正负样本的分布，采用Circle Loss也可以缓解样本不均衡的问题。

在一些实施例中，论元角色识别概率包括目标分词为候选论元角色的头指针的概率以及为候选论元角色的尾指针的概率，事件抽取方法还包括：若目标分词为候选论元角色的头指针的概率大于第一阈值，则确定目标分词为候选论元角色的头指针；若目标分词为候选论元角色的尾指针的概率大于第二阈值，则确定目标分词为候选论元角色的尾指针；根据候选论元角色的头指针以及候选论元角色的尾指针确定目标论元片段。

其中，论元角色识别模型是基于机器阅读理解(Machine ReadingComprehension,MRC)的指针网络(Pointer Network)，对论元角色分别行二分类输出头指针的概率和尾指针的概率，第一阈值和第二阈值可以根据需要设置，例如可以是0.8。对于候选论元角色，如果目标分词为该论元角色的头指针的概率大于第一阈值，则该目标分词为该候选论元角色的头指针，对于候选论元角色，如果目标分词为该论元角色的尾指针的概率大于第二阈值，则该目标分词为该候选论元角色的尾指针。当一个候选论元角色对应有头指针以及为尾指针时，则可以将从头指针到尾指针之间的文本为该候选论元角色的论元片段，同时该候选论元角色为该目标文本中存在的论元角色，即为目标论元角色。可以理解，对于一个候选论元角色，如果不存在大于第一阈值的目标分词或者不存在大于第二阈值的目标分词，则可以确认该候选论元角色不是目标文本中存在的论元角色。

在一些实施例中，如图4所示，事件类型识别概率包括目标分词为候选事件类型的头指针的概率以及为候选事件类型的尾指针的概率，根据事件类型识别概率识别得到初始事件类型集合包括：

步骤S402，根据目标分词为候选事件类型的头指针的概率，获取目标论元片段的起始点对应的头指针所对应的头事件类型集合。

其中，事件类型识别模型是基于机器阅读理解(Machine ReadingComprehension,MRC)的指针网络(Pointer Network)，对事件类型行二分类输出头指针的概率和尾指针的概率。头事件类型集合包括该头指针所对应的头事件，可以为一个或多个。例如可以将目标分词为候选事件类型的头指针的概率中，概率大于第三阈值的候选事件类型加入到头事件类型集合中。目标论元片段的起始点是该目标论元片段的第一个分词，起始点对应的头指针所对应的头事件类型集合，可以是与该起始点的距离小于第一距离的分词为头指针时，所对应的候选事件类型。

在一些实施例中，根据目标分词为候选事件类型的头指针的概率，获取目标论元片段的起始点对应的头指针所对应的头事件类型集合包括：若目标分词为候选事件类型的头指针的概率大于第三阈值，则确定目标分词为候选事件类型的头指针；确定与目标论元片段的起始点的距离小于第一距离的目标分词，作为第一邻近分词；将以第一邻近分词为头指针的候选事件类型作为头事件类型，得到头事件类型集合。

其中，第三阈值可以根据需要设置，例如可以是0.8。对于一个目标分词C，如果该分词为A候选事件类型的尾指针的概率为0.9，则确定该目标分词为A 候选事件类型的概率大于第三阈值，确定该目标分词C为A候选事件类型的头指针。

第一距离可以根据需要设置，例如可以是间隔两个分词。举个例子，对于目标文本“A/在/B地点/发生/的/袭击事件/中/受伤/”，假设起始点是“发生”，第一距离是2个分词。则第一邻近分词包括“B地点”、“发生”以及“的”。如果“B地点”为某个候选事件类型的头指针，则将该候选事件类型加入到头事件类型集合中。

步骤S404，根据目标分词为候选事件类型的尾指针的概率，获取目标论元片段的终止点对应的尾指针所对应的尾事件类型集合。

尾事件类型集合包括尾指针所对应的事件类型，可以为一个或多个。例如可以将目标分词为候选事件类型的尾指针的概率中，概率大于第四阈值的候选事件类型加入到尾事件类型集合中。目标论元片段的终止点是该目标论元片段的最后一个分词，终止点对应的尾指针所对应的尾事件类型集合，可以是与该终止点的距离小于第二距离的分词为尾指针时，所对应的候选事件类型。

在一些实施例中，根据目标分词为候选事件类型的尾指针的概率，获取目标论元片段的终止点对应的尾指针所对应的尾事件类型集合包括：若目标分词为候选事件类型的尾指针的概率大于第四阈值，则确定目标分词为候选事件类型的尾指针；确定与目标论元片段的终止点的距离小于第二距离的目标分词，作为第二邻近分词；将以第二邻近分词为尾指针的候选事件类型作为尾事件类型，得到尾事件类型集合。

其中，第四阈值可以根据需要设置，例如可以是0.8。对于一个目标分词C，如果该分词为G候选事件类型的尾指针的概率为0.9，则确定该目标分词为A 候选事件类型的概率大于第四阈值，确定该目标分词C为G候选事件类型的尾指针。

第二距离可以根据需要设置，例如可以是间隔三个分词。举个例子，对应 “A/在/B地点/发生/的/袭击事件/中/受伤/”，假设终止点是“受伤”，第一距离是2个分词。则第二邻近分词包括“袭击事件”、“中”以及“受伤”。

如果“袭击事件”为某个候选事件类型的尾指针，则将该候选事件类型加入到尾事件类型集合中。

步骤S406，根据头事件类型集合以及尾事件类型集合确定目标论元片段对应的初始事件类型集合。

具体地，可以将头事件类型集合中的事件类型与尾事件类型集合中的事件类型进行对比；将对比一致的事件类型作为初始事件类型，得到目标论元片段对应的初始事件类型集合。例如假设头事件类型集合中包括三个候选事件类型： a1、a2以及a3，尾事件类型集合中包括三个候选事件类型：a1、a3以及a4，则通过对比，可以确定头事件类型集合与尾事件类型集合中相同的候选事件类型包括a1以及a3，则初始事件类型集合包括a1以及a3。

在一些实施例中，对于一个文本，可以获取论元角色识别模型输出的头指针和尾指针的数量，选取数量多的来确定论元角色和论元片段。例如，如果头指针的数量多于尾指针的数量，选取头指针作为论元片段的起始点，同时可以确定论元角色。论元片段的结束点选取位于起始点之后的尾指针，进而确定了论元片段。然后，对于事件类型识别模型，可以先找到距离论元片段起始点相隔两个分词内的头指针，获取这些头指针对应的候选事件类型，确定事件类型集合一，再找到论元片段结束点相隔两个分词内的尾指针，获取尾指针对应的候选事件类型，确定事件类型集合二，取这两个集合的交集作为此论元片段的初始事件类型集合。然后根据预定义的事件类型及对应的论元角色，过滤掉候选事件类型集合中与论元角色不匹配的事件类型。最终可以确定论元片段对应的论元角色和事件类型。

本申请实施例中，通过对事件类型和事件论元分别进行二分类输出头指针和尾指针，解决了论元角色重叠问题，同时能够进行多片段以及多类别抽取。例如，可以基于机器阅读理解(MRC)的指针网络实现从分词(Token)特征到论元片段、事件类型以及论元角色的映射。对于每一个Token，它的每种事件类型以及论元角色都会分别对应头尾两个输出结果，表示该Token是否为论元对应的该事件类型的起始点和结束点，以及论元角色的起始点和结束点。这样的输出层方案可以很方便的处理论元角色以及事件类型之间嵌套情况。例如事件类型识别概率以及论元角色识别概率可以用公式(3)至(6)计算得到，

其中x′_i为Token的特征表示，t为事件类型，r为论元角色，s为论元片段的起始点，e为论元片段的结束点，σ为sigmoid函数。

表示第i个Token，属于第j个事件类型且为头指针的概率，

表示第i个Token，属于第j个事件类型且为尾指针的概率，

表示第i个Token，属于第j个论元角色且为头指针的概率，

表示第i个Token，属于第j个论元角色且为尾指针的概率。其中概率的范围为[0,1]，当此值大于某一个阈值时，例如0.8时，重新赋值为1，否则为 0。

赋值后值为1，表示该目标分词为第j个事件类型的头指针。

赋值后值为1，表示该目标分词为第j个事件类型的尾指针。

赋值后值为1，表示该目标分词为第j个论元角色的头指针，

赋值后值为1，表示该目标分词为第j 个论元角色的尾指针。

例如，对于目标文本“8月21日，在瑞士巴塞尔举行世界羽毛球锦标赛”，则得到的结果可以如图5A以及图5B所示。其中“Shared Bert”表示事件类型识别模型以及论元角色识别模型共享文本编码模型，Role Extractor表示论元角色识别模型，Event TypeExtractor表示事件类型识别模型。

本申请实施例提供的事件抽取结果可以应用于知识库构建、智能风控、智能投研、舆情监控等人工智能领域。

应该理解的是，虽然上述流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种事件抽取装置，包括：目标文本获取模块602、处理模块604、论元角色得到模块606、初始事件类型集合得到模块608和事件抽取结果得到模块610，其中：

目标文本获取模块602，用于获取待进行事件抽取的目标文本；

处理模块604，用于将目标文本输入到事件抽取联合模型中进行处理，得到目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率；

论元角色得到模块606，用于根据论元角色识别概率识别得到目标分词对应的目标论元角色；

初始事件类型集合得到模块608，用于根据事件类型识别概率识别得到初始事件类型集合；

事件抽取结果得到模块610，用于从初始事件类型集合中筛选得到与目标论元角色匹配的目标事件类型，以根据目标论元角色以及目标事件类型得到目标文本对应的事件抽取结果。

在一些实施例中，如图7所示，事件抽取联合模型包括文本编码模型、事件类型识别模型以及论元角色识别模型，处理模块604包括：

分词编码向量得到单元702，用于将目标文本输入到文本编码模型中，文本编码模型对目标文本对应的各个目标分词进行编码，得到各个目标分词分别对应的分词编码向量；

事件类型识别概率得到单元704，用于将目标分词分别对应的分词编码向量输入到事件类型识别模型中，得到各个目标分词分别对应的事件类型识别概率；

论元角色识别概率得到单元706，用于将目标分词对应的分词编码向量输入到论元角色识别模型中，得到各个目标分词分别对应的论元角色识别概率。

在一些实施例中，论元角色识别概率包括目标分词为候选论元角色的头指针的概率以及为候选论元角色的尾指针的概率，装置还包括：头指针确定模块，用于若目标分词为候选论元角色的头指针的概率大于第一阈值，则确定目标分词为候选论元角色的头指针；尾指针确定模块，用于若目标分词为候选论元角色的尾指针的概率大于第二阈值，则确定目标分词为候选论元角色的尾指针；目标论元片段确定模块，用于根据候选论元角色的头指针以及候选论元角色的尾指针确定目标论元片段。

在一些实施例中，事件类型识别概率包括目标分词为候选事件类型的头指针的概率以及为候选事件类型的尾指针的概率，初始事件类型集合得到模块包括：头事件类型集合获取单元，用于根据目标分词为候选事件类型的头指针的概率，获取目标论元片段的起始点对应的头指针所对应的头事件类型集合；尾事件类型集合获取单元，用于根据目标分词为候选事件类型的尾指针的概率，获取目标论元片段的终止点对应的尾指针所对应的尾事件类型集合；初始事件类型集合确定单元，用于根据头事件类型集合以及尾事件类型集合确定目标论元片段对应的初始事件类型集合。

在一些实施例中，头事件类型集合获取单元用于：若目标分词为候选事件类型的头指针的概率大于第三阈值，则确定目标分词为候选事件类型的头指针；确定与目标论元片段的起始点的距离小于第一距离的目标分词，作为第一邻近分词；将以第一邻近分词为头指针的候选事件类型作为头事件类型，得到头事件类型集合。

在一些实施例中，尾事件类型集合获取单元用于：若目标分词为候选事件类型的尾指针的概率大于第四阈值，则确定目标分词为候选事件类型的尾指针；确定与目标论元片段的终止点的距离小于第二距离的目标分词，作为第二邻近分词；将以第二邻近分词为尾指针的候选事件类型作为尾事件类型，得到尾事件类型集合。

在一些实施例中，初始事件类型集合确定单元用于：将头事件类型集合中的事件类型与尾事件类型集合中的事件类型进行对比；将对比一致的事件类型作为初始事件类型，得到目标论元片段对应的初始事件类型集合。

在一些实施例中，事件抽取结果得到模块用于：获取预设的事件类型与论元角色的匹配关系；根据事件类型与论元角色的匹配关系，将初始事件类型集合中，与目标论元角色匹配的事件类型作为目标事件类型。

关于事件抽取装置的具体限定可以参见上文中对于事件抽取方法的限定，在此不再赘述。上述事件抽取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储事件抽取数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种事件抽取方法。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述事件抽取方法的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述事件抽取方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM) 或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种事件抽取方法，其特征在于，所述方法包括：

获取待进行事件抽取的目标文本；

将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率；

根据所述论元角色识别概率识别得到所述目标分词对应的目标论元角色；

根据所述事件类型识别概率识别得到初始事件类型集合；

从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型，以根据所述目标论元角色以及所述目标事件类型得到所述目标文本对应的事件抽取结果。

2.根据权利要求1所述的方法，其特征在于，所述事件抽取联合模型包括文本编码模型、事件类型识别模型以及论元角色识别模型，所述将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率包括：

将所述目标文本输入到所述文本编码模型中，所述文本编码模型对所述目标文本对应的各个目标分词进行编码，得到各个所述目标分词分别对应的分词编码向量；

将所述目标分词分别对应的分词编码向量输入到所述事件类型识别模型中，得到各个所述目标分词分别对应的事件类型识别概率；

将所述目标分词对应的分词编码向量输入到所述论元角色识别模型中，得到各个所述目标分词分别对应的论元角色识别概率。

3.根据权利要求1所述的方法，其特征在于，所述论元角色识别概率包括所述目标分词为候选论元角色的头指针的概率以及为所述候选论元角色的尾指针的概率，所述方法还包括：

若所述目标分词为所述候选论元角色的头指针的概率大于第一阈值，则确定所述目标分词为所述候选论元角色的头指针；

若所述目标分词为所述候选论元角色的尾指针的概率大于第二阈值，则确定所述目标分词为所述候选论元角色的尾指针；

根据所述候选论元角色的头指针以及所述候选论元角色的尾指针确定目标论元片段。

4.根据权利要求3所述的方法，其特征在于，所述事件类型识别概率包括所述目标分词为候选事件类型的头指针的概率以及为所述候选事件类型的尾指针的概率，所述根据所述事件类型识别概率识别得到初始事件类型集合包括：

根据所述目标分词为候选事件类型的头指针的概率，获取所述目标论元片段的起始点对应的头指针所对应的头事件类型集合；

根据所述目标分词为所述候选事件类型的尾指针的概率，获取所述目标论元片段的终止点对应的尾指针所对应的尾事件类型集合；

根据所述头事件类型集合以及所述尾事件类型集合确定所述目标论元片段对应的初始事件类型集合。

5.根据权利要求4所述的方法，其特征在于，所述根据所述目标分词为候选事件类型的头指针的概率，获取所述目标论元片段的起始点对应的头指针所对应的头事件类型集合包括：

若所述目标分词为候选事件类型的头指针的概率大于第三阈值，则确定所述目标分词为所述候选事件类型的头指针；

确定与所述目标论元片段的起始点的距离小于第一距离的目标分词，作为第一邻近分词；

将以所述第一邻近分词为头指针的候选事件类型作为头事件类型，得到头事件类型集合。

6.根据权利要求4所述的方法，其特征在于，所述根据所述目标分词为候选事件类型的尾指针的概率，获取所述目标论元片段的终止点对应的尾指针所对应的尾事件类型集合包括：

若所述目标分词为候选事件类型的尾指针的概率大于第四阈值，则确定所述目标分词为所述候选事件类型的尾指针；

确定与所述目标论元片段的终止点的距离小于第二距离的目标分词，作为第二邻近分词；

将以所述第二邻近分词为尾指针的候选事件类型作为尾事件类型，得到尾事件类型集合。

7.根据权利要求4所述的方法，其特征在于，所述根据所述头事件类型集合以及尾事件类型集合确定所述目标论元片段对应的初始事件类型集合包括：

将所述头事件类型集合中的事件类型与所述尾事件类型集合中的事件类型进行对比；

将对比一致的事件类型作为初始事件类型，得到所述目标论元片段对应的初始事件类型集合。

8.根据权利要求1所述的方法，其特征在于，所述从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型包括：

获取预设的事件类型与论元角色的匹配关系；

根据所述事件类型与论元角色的匹配关系，将所述初始事件类型集合中，与所述目标论元角色匹配的事件类型作为目标事件类型。

9.一种事件抽取装置，其特征在于，所述装置包括：

目标文本获取模块，用于获取待进行事件抽取的目标文本；

处理模块，用于将所述目标文本输入到事件抽取联合模型中进行处理，得到所述目标文本中，各个目标分词分别对应的事件类型识别概率以及论元角色识别概率；

论元角色得到模块，用于根据所述论元角色识别概率识别得到所述目标分词对应的目标论元角色；

初始事件类型集合得到模块，用于根据所述事件类型识别概率识别得到初始事件类型集合；

事件抽取结果得到模块，用于从所述初始事件类型集合中筛选得到与所述目标论元角色匹配的目标事件类型，以根据所述目标论元角色以及所述目标事件类型得到所述目标文本对应的事件抽取结果。

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。