CN114330366A

CN114330366A - 事件抽取方法及相关装置、电子设备和存储介质

Info

Publication number: CN114330366A
Application number: CN202111650051.5A
Authority: CN
Inventors: 吴啟超
Original assignee: Iflytek South China Artificial Intelligence Research Institute Guangzhou Co ltd
Current assignee: Iflytek South China Artificial Intelligence Research Institute Guangzhou Co ltd
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2022-04-12

Abstract

本申请公开了一种事件抽取方法及相关装置、电子设备和存储介质，其中，事件抽取方法包括：提取篇章文本的篇章语义表示；基于篇章语义表示在篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元；基于篇章语义表示和各候选事件论元的论元语义表示分别在篇章文本进行共指预测，得到各候选事件论元的共指论元集合；分别基于各候选事件论元的参考论元集合和共指论元集合，选择至少一个候选事件论元作为目标事件角色的目标事件论元；其中，候选事件论元的参考论元集合包括候选事件论元以外的其他候选事件论元。上述方案，能够提升事件抽取效果，即使面对长篇章文本，也能够尽可能地减少诸如多抽论元等问题。

Description

事件抽取方法及相关装置、电子设备和存储介质

技术领域

本申请涉及自然语言理解技术领域，特别是涉及一种事件抽取方法及相关装置、电子设备和存储介质。

背景技术

近年来，人工智能技术在自然语义理解领域蓬勃发展，被广泛应用于日常生活、工作等方方面面，为人们提供了极大的便利。示例性地，在客服场景中，通过电话热线形式，可以受理客户各种咨询、投诉、建议等，有助于提升客户满意度。此外，在诸如政务服务、商务办公等其他场景中，也有类似应用，在此不再一一举例。

在此其中，一种典型应用是抽取篇章文本中与事件相关的内容，如涉及到的事件类型、事件角色，以及事件论元等，在此基础上，基于事件类型和事件论元，生成事件描述，以作为诸如客服沟通的总结。然而，在现实场景中，篇章文本一般较长，如一通完整对话往往会持续几十轮甚至更多，在此情况下，通常会造成多抽论元等问题，从而影响事件抽取效果。有鉴于此，如何提升事件抽取效果成为亟待解决的问题。

发明内容

本申请主要解决的技术问题是提供一种事件抽取方法及相关装置、电子设备和存储介质，能够提升事件抽取效果，即使面对长篇章文本，也能够尽可能地减少诸如多抽论元等问题。

为了解决上述技术问题，本申请第一方面提供了一种事件抽取方法，包括：提取篇章文本的篇章语义表示；其中，篇章语义表示包括篇章文本中各个字符的第一字符表示，篇章文本涉及若干事件类型；基于篇章语义表示在篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元；其中，各事件类型分别对应有若干候选事件角色，目标事件角色从若干候选事件角色选择得到；基于篇章语义表示和各候选事件论元的论元语义表示分别在篇章文本进行共指预测，得到各候选事件论元的共指论元集合；分别基于各候选事件论元的参考论元集合和共指论元集合，选择至少一个候选事件论元作为目标事件角色的目标事件论元；其中，候选事件论元的参考论元集合包括候选事件论元以外的其他候选事件论元。

为了解决上述技术问题，本申请第二方面提供了一种事件抽取装置，包括：篇章语义提取模块、事件论元预测模块、共指论元预测模块和目标论元优化模块，篇章语义提取模块，用于提取篇章文本的篇章语义表示；其中，篇章语义表示包括篇章文本中各个字符的第一字符表示，篇章文本涉及若干事件类型；事件论元预测模块，用于基于篇章语义表示在篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元；其中，各事件类型分别对应有若干候选事件角色，目标事件角色从若干候选事件角色选择得到；共指论元预测模块，用于基于篇章语义表示和各候选事件论元的论元语义表示分别在篇章文本进行共指预测，得到各候选事件论元的共指论元集合；目标论元优化模块，用于分别基于各候选事件论元的参考论元集合和共指论元集合，选择至少一个候选事件论元作为目标事件角色的目标事件论元；其中，候选事件论元的参考论元集合包括候选事件论元以外的其他候选事件论元。

为了解决上述技术问题，本申请第三方面提供了一种电子设备，包括相互耦接的存储器和处理器，存储器中存储有程序指令，处理器用于执行程序指令以实现上述第一方面中的事件抽取方法。

为了解决上述技术问题，本申请第四方面提供了一种计算机可读存储介质，存储有能够被处理器运行的程序指令，程序指令用于实现上述第一方面中的事件抽取方法。

上述方案，通过提取篇章文本的篇章语义表示，且篇章语义表示包括篇章文本中各个字符的第一字符表示，篇章文本涉及若干事件类型，基于此再基于篇章语义表示在篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元，且各事件类型分别对应有若干候选事件角色，目标事件角色从若干候选事件角色选择得到，并基于篇章语义表示和各候选事件论元的论元语义表示分别在篇章文本进行共指预测，得到各候选事件论元的共指论元集合，在此基础上，分别基于各候选事件论元的参考论元集合和共指论元集合，选择至少一个候选事件论元作为目标事件角色的目标事件论元，且候选事件论元的参考论元集合包括候选事件论元以外的其他候选事件论元，即在事件抽取过程中，能够预测得到各个候选事件论元的共指论元集合，并对于各个候选事件论元，基于其共指论元集合以及参考论元集合，来确定其是否作为目标事件角色的目标事件论元，从而能够通过共指关系优化判断事件论元抽取结果，进而能够大大减少诸如多抽论元等问题，提升事件抽取效果。

附图说明

图1是本申请事件抽取方法一实施例的流程示意图；

图2是图1中步骤S11一实施例的流程示意图；

图3是图1中步骤S12一实施例的流程示意图；

图4是本申请事件抽取装置一实施例的框架示意图；

图5是本申请电子设备一实施例的框架示意图；

图6是本申请计算机可读存储介质一实施例的框架示意图。

具体实施方式

下面结合说明书附图，对本申请实施例的方案进行详细说明。

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、接口、技术之类的具体细节，以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。

请参阅图1，图1是本申请事件抽取方法一实施例的流程示意图。

具体而言，可以包括如下步骤：

步骤S11：提取篇章文本的篇章语义表示。

本公开实施例中，篇章语义表示包括篇章文本中各个字符的第一字符表示，篇章文本涉及若干事件类型。需要说明的是，本申请公开实施例所指的篇章文本并不限于对语音通话进行语音识别而产生的文本，也可以是文字交互过程中所产生的文本，在此不做限定。

在一个实施场景中，可以通过诸如BERT(Bidirectional EncoderRepresentation from Transformers，即双向Transformer的Encoder)等预训练语言模型对篇章文本进行语义提取，得到篇章语义表示。具体提取过程，可以参阅诸如BERT等预训练语言模型的技术细节，在此不再赘述。

在一个实施场景中，为了进一步提升篇章语义表示的准确性，篇章语义表示可以是基于第一提取网络和第二提取网络分别提取到的第一篇章表示和第二篇章表示融合得到，第一提取网络和第二提取网络基于分别对样本文本提取到的第一样本表示和第二样本表示之间的相对差异联合训练得到。需要说明的是，相对差异可以采用诸如KL散度等相对熵度量，具体可以参阅下述相关描述，在此暂不赘述。此外，第一提取网络和第二提取网络可以采用相同或相似的网络结构，且两者的网络参数不尽相同或完全不同。示例性地，可以采用两个网络参数不同的BERT分别作为第一提取网络和第二提取网络。上述方式，通过第一提取网络和第二提取网络分别对篇章文本进行语义提取，得到第一篇章表示和第二篇章表示，并将第一篇章表示和第二篇章表示融合得到篇章语义表示，且第一提取网络和第二提取网络基于分别对样本文本提取到的第一样本表示和第二样本表示之间的相对差异联合训练得到，故能够提升篇章语义表示的鲁棒性，从而有利于提升后续事件抽取的鲁棒性，使得即使篇章文本在不影响语义前提下略微调整的情况下，也能够尽可能地保持事件抽取结果与原抽取结果一致。

在一个实施场景中，篇章文本所涉及的事件类型可以为一个，当然，也可以有两个、三个、四个等等，在此不做限定。示例性地，某一篇章文本既可能涉及事件类型“消费纠纷”，也可能涉及事件类型“打架斗殴”。其他情况可以以此类推，在此不再一一举例。

在一个实施场景中，篇章文本所涉及的若干事件类型可以包含于预设事件集合，预设事件集合可以包括未知事件和若干种预设事件，且未知事件和预设事件分别对应设有各自的候选事件角色，未知事件对应的候选事件角色可以从各预设事件对应的候选事件角色抽象得到。也就是说，未知事件对应的候选事件角色可以在各预设事件对应的候选事件角色的基础上，剔除各预设事件特有角色，从而可以获取到与各预设事件无关的通用角色，即可作为未知事件对应的候选事件角色。示例性地，未知事件对应的候选事件角色可以包括但不限于：“时间”、“地点”、“机构人物”、“涉及事物”、“涉及金额”等，在此不做限定。上述方式，篇章文本涉及若干事件类型包含于预设事件集合，预设事件集合包括未知事件和若干种预设事件，且未知事件和预设事件分别对应设有各自的候选事件角色，未知事件对应的候选事件角色从各预设事件对应的候选事件角色抽象得到，能够在事件抽取过程中，兼容未知事件类型，有利于进一步提升事件抽取效果。

步骤S12：基于篇章语义表示在篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元。

本公开实施例中，各事件类型分别对应有若干候选事件角色，目标事件角色从若干候选事件角色选择得到。示例性地，以事件类型“消费纠纷”为例，其可以对应有如下候选事件角色：“消费纠纷-发生时间”、“消费纠纷-发生地点”、“消费纠纷-投诉方”、“消费纠纷-涉及事物”、“消费纠纷-金额”等，在此不做限定。其他事件类型可以以此类推，在此不再一一举例。

在一个实施场景中，每次可以在若干候选事件角色中选择一个尚未被选择的候选事件角色，作为目标事件角色。示例性地，仍以事件类型“消费纠纷”为例，第一次可以选择候选事件角色“消费纠纷-发生时间”作为目标事件角色，待抽取得到该目标事件角色的目标事件论元之后，第二次可以选择候选事件角色“消费纠纷-发生地点”作为目标事件角色，待抽取得到该目标事件角色的目标事件论元之后，第三次可以选择候选事件角色“消费纠纷-投诉方”作为目标事件角色，以此类推，直至所有候选事件角色全部选择完毕。需要说明的是，在篇章文本涉及多个事件类型的情况下，可以先选择一个未被选择的事件类型，再逐个选择该事件类型对应的若干候选事件角色分别作为目标事件角色，以抽取该目标事件角色的目标事件论元，在抽取得到该事件类型对应的各个候选事件角色的目标事件论元之后，可以再选择一个未被选择的事件类型，并在该事件类型下进行论元抽取，以此类推，直至所有事件类型均完成论元抽取。

在一个实施场景中，可以基于目标事件角色，采用诸如机器阅读理解(MachineReading Comprehension，MRC)对篇章文本进行论元抽取，得到该目标事件角色的若干候选事件论元。

在一个实施场景中，区别于前述方式，论元预测可以基于目标事件角色的静态描述文本和动态描述文本执行，且如前所述，在事件抽取过程中，依次预测各个候选事件角色的目标事件论元。基于静态角色描述文本和动态角色描述文本进行论元预测的具体过程，可以参阅下述相关描述，在此暂不赘述。需要说明的是，静态角色描述文本可以基于与目标事件角色相关的词语预先构建得到，动态角色描述文本可以基于已经预测到的目标事件论元对事件类型的事件动态描述模板更新得到。上述方式，基于目标事件角色的静态角色描述文本和动态角色描述文本执行论元预测，能够在事件抽取过程中，加入静态约束和动态约束，有利于进一步减少多抽论元等问题，提升事件抽取效果。

在一个具体的实施场景中，对于静态角色描述文本而言，可以在大量通话文本中，通过统计分析获得与角色关联度较高的词汇，将这些词汇组合即可得到该角色的静态角色描述文本。需要说明的是，关联度可以通过词汇和角色的共现频率、词汇的特殊性来度量，共现频率和特殊性越高，关联度就越高。请参阅表1，表1以事件类型“消费纠纷”为例，示例性地给出了事件类型“消费纠纷”对应的各个候选事件角色的静态角色描述文本。

表1 事件类型“消费纠纷”对应的各个候选事件角色的静态角色描述文本

在一个具体的实施场景中，事件类型的事件动态描述模板包括事件类型各候选事件角色的预置模板文本，且动态角色描述文本由事件动态描述模板中预置模板文本，替换为已经预测到且属于相同候选事件角色的目标事件论元而得到。请参阅表2，表2仍以事件类型“消费纠纷”为例，示例性地给出了事件类型“消费纠纷”的事件动态描述模板。如表2所示，事件动态描述模板中，以预设符号(如，@)标记各个候选事件角色的预置模板文本。例如，候选事件角色“消费纠纷-购买时间”的预置模板文本为“@购买时间”，或者，候选事件角色“消费纠纷-购买地点”的预置模板文本为“@消费纠纷地点”。其他可以以此类推，在此不再一一举例。对于涉及事件类型“消费纠纷”的篇章文本“购买的金额为5000元的会员卡，与XX商场XX店铺产生消费纠纷，希望能退款”而言，第一次可以选择候选论元角色“消费纠纷-购买时间”作为目标论元角色，且由于第一次预测，故尚无已经预测到的目标事件论元，在此情况下，可以直接将事件动态描述模板作为动态角色描述文本，以此类推，第三次预测候选事件角色“消费纠纷-消费纠纷地点”的目标事件论元为“XX商场”，在此基础上，在第四次预测候选事件角色“消费纠纷-被举报方”时，可以将事件动态描述模板中候选事件角色“消费纠纷-被举报方”的预置模板文本“@消费纠纷地点”替换为“XX商场”，类似地，在第四次预测候选事件角色“消费纠纷-被举报方”的目标事件论元为“XX商铺”，在此基础上，在第五次预测候选事件角色“消费纠纷-涉及的金额”时，可以将事件动态描述模板中已经预测出论元的候选事件角色“消费纠纷-被举报方”的预置模板文本“@被举报方”和候选事件角色“消费纠纷-消费纠纷地点”的预置模板文本“@消费纠纷地点”分别替换为“XX商铺”和“XX商场”。以此类推，在此不再一一举例。

表2 事件类型“消费纠纷”的事件动态描述模板

需要说明的是，在进行替换时，被替换的预置模板文本所属事件动态描述模板所对应的事件类型，与替换的目标事件论元对应的候选事件角色所属的事件类型，两者需保持一致。上述方式，事件类型的事件动态描述模板包括事件类型的各候选事件角色的预置模板文本；其中，动态角色描述文本由事件动态描述模板中预置模板文本，替换为已经预测到且属于相同候选事件角色的目标事件论元而得到，故能够在每次论元预测时保持动态角色描述文本的动态更新，从而能够根据历史预测的其他角色的论元结果作为额外的关联知识和约束条件，进而有利于尽可能地减少多抽论元的问题，有利于提升论元抽取效果。

步骤S13：基于篇章语义表示和各候选事件论元的论元语义表示分别在篇章文本进行共指预测，得到各候选事件论元的共指论元集合。

需要说明的是，共指主要是指2个名词(包括代名词、名词短语等)指向真实世界中的同一参照体。此外，这种指代脱离上下文仍然可以成立。示例性地，“六月末”和“六月三十日”指向真实世界的同一参照物；或者，“合肥”和“安徽省会”指向真实世界的同一参照物，以此类推，在此不再一一举例。

具体而言，可以基于篇章语义表示和候选事件论元的论元语义表示进行预测，得到篇章文本中各字符的共指预测结果，且各个字符的共指预测结果包括字符分别属于候选事件论元的共指论元的起始字符和终止字符的可能性，在此基础上，可以再基于各个字符的共指预测结果，得到候选事件论元的共指论元集合。上述方式，通过预测各个字符的共指预测结果，且各个字符的共指预测结果包括字符分别属于候选事件论元的共指论元的起始字符和终止字符的可能性，能够提升共指预测的精确性。

在一个实施场景中，为了提升提取论元语义表示的效率，可以预先训练一个论元语义提取网络，论元语义提取网络可以包括但不限于卷积神经网络等，在此不做限定。需要说明的是，候选事件论元可以包含若干字符，为了便于描述，可以将第k个候选事件角色下的第m个候选事件论元记为

进一步地，可以将第k个候选事件角色下的第m个候选事件论元中第i个字符记为

在采用卷积神经网络提取论元语义表示的情况下，第k个候选事件角色下的第m个候选事件论元的论元语义表示

可以表示为：

上述公式(1)和公式(2)中，

表示第k个候选事件角色下的第m个候选事件论元的文本长度，

表示第k个候选事件角色下的第m个候选事件论元中第i个字符的编码表示。

在一个实施场景中，具体可以将篇章语义表示作为机器阅读理解(MRC)的document表示，并将候选事件论元的论元语义表示作为机器阅读理解的query表示，通过query进行询问，在document中寻求其中某个片段作为和候选事件论元具有关系的其他论元结果。为了便于描述，仍以第k个候选事件角色下的第m个候选事件论元为例，可以对论元语义表示按长度维度进行最大池化，作为该候选事件论元新的论元语义表示

具体可以表示为：

在此基础上，可以预测得到字符分别属于候选事件论元的共指论元的起始字符和终止字符的概率值

和

上述公式(4)和公式(5)中，

表示机器阅读理解的网络参数，可以在训练过程中进行调整。

表示篇章文本的篇章语义表示。

表示篇章文本中第i个字符属于候选事件论元的共指论元的起始字符的概率值，

表示篇章文本中第i个字符属于候选事件论元的共指论元的终止字符的概率值。此外，l_通表示篇章文本的文本长度。

在一个实施场景中，可以将大于共指论元阈值(如，0)的

和

对应于篇章文本中的字符位置作为候选事件论元

的共指论元的起始位置和终止位置。在此基础上，对于每一个起始位置，可以选择位于该起始位置之后且与该起始位置最接近的终止位置，并将篇章文本中从该起始位置至选择到的终止位置的文本片段，作为候选事件论元的共指论元，从而可以将获取到的文本片段的集合，作为候选事件论元的共指论元集合。

在一个实施场景中，在机器阅读理解的训练过程中，可以计算预测的共指论元的起始位置概率和终止位置概率，分别与真实的共指论元的起始位置和终止位置之间的交叉熵Loss_coref：

上述公式(8)中，

为篇章文本中第i个字符是否为第k个候选事件角色下的第m个候选事件论元的共指论元的起始位置判断标记，若是则其值为1，否则为0，

为篇章文本中第i个字符是否为第k个候选事件角色下的第m个候选事件论元的共指论元的终止位置判断标记，若是则其值为1，否则为0。上述损失的具体含义，可以参阅交叉熵损失的技术细节，在此不再赘述。

步骤S14：分别基于各候选事件论元的参考论元集合和共指论元集合，选择至少一个候选事件论元作为目标事件角色的目标事件论元。

本公开实施例中，候选事件论元的参考论元集合包括候选事件论元以外的其他候选事件论元。为了便于描述，可以将第k个候选事件角色下第m个候选事件论元记为

在第k个候选事件角色下除了

的其他原有候选事件论元的集合即为参考论元集合

上述公式(9)中，

为第k个候选事件角色下抽取到的候选事件论元的总数，

为第k个候选事件角色下抽取到的第n个候选事件论元。此外，进一步地，可以将第k个候选事件角色下第m个候选事件论元的共指论元集合记为

上述公式(10)中，

为第k个候选事件角色下抽取到的第m个候选事件论元的共指论元集合所包含的共指论元总数，

为其中第n个共指论元。其他情况可以以此类推，在此不再一一举例。

在一个实施场景中，可以分别基于各候选事件论元的参考论元集合和共指论元集合是否存在交集，选择保留或剔除候选事件论元，并基于保留的候选事件论元，得到目标事件角色的目标事件论元。仍以第k个候选事件角色下第m个候选事件论元

为例，若其共指论元集合

和参考论元集合

不为空集，则可以认为第k个候选事件角色下第m个候选事件论元

与该角色下其他论元存在共指关系，故可以保留该候选事件论元

作为目标事件论元；反之，若其共指论元集合

和参考论元集合

为空集，则可以认为第k个候选事件角色下第m个候选事件论元

与该角色下其他论元不存在共指关系，故可以剔除该候选事件论元

不将其作为目标事件论元。此外，第k个候选事件角色下其他候选事件论元可以以此类推，在此不再一一举例。至此即可将所有保留下来的候选事件论元，作为第k个候选事件角色下的目标事件论元。上述方式，分别基于各候选事件论元的参考论元集合和共指论元集合是否存在交集，选择保留或剔除候选事件论元，再基于保留的候选事件论元，得到目标事件角色的目标事件论元，故能够共指论元集合和参考论元集合之间是否存在交集，来决定是否保留候选事件论元作为目标事件论元，有利于大大减低论元优化的复杂度，提升事件抽取效率。

在一个实施场景中，若在论元优化过程中，该候选事件角色下所有候选事件论元均被剔除，则可以基于各候选事件论元分别在篇章文本的出现频率，选择至少一个候选事件论元，作为目标事件角色的目标事件论元。示例性地，可以选择出现频率最高的候选事件论元作为目标事件角色的目标事件论元；当然，也可以将出现频率按照由高到低的顺序进行排序，并选择排在前预设序位(如前2位、前3位等)的候选事件论元作为目标事件角色的目标事件论元。上述方式，在所有候选事件论元均被剔除的情况下，基于各候选事件论元分别在篇章文本的出现频率，选择至少一个候选事件论元，作为目标事件角色的目标事件论元，能够有利于提升论元抽取的鲁棒性。

请参阅图2，图2是图1中步骤S11一实施例的流程示意图。具体而言，图2是在篇章语义表示基于第一提取网络和第二提取网络分别提取到的第一篇章表示和第二篇章表示融合得到的情况下，具体的流程示意图。本公开实施例具体可以包括如下步骤：

步骤S21：对篇章文本进行命名实体识别，得到若干候选实体和各候选实体的词性。

在一个实施场景中，可以采用诸如LAC(Lexical Analysis of Chinese)、结巴分词等命名实体工具对篇章文本进行命名实体识别，得到若干候选实体和各候选实体的词性。需要说明的是，命名实体识别的具体过程，可以参阅前述LAC、结巴分词等命名实体工具的技术细节，在此不再赘述。此外，请结合参阅表3，表3是词性和专名类别标签一实施例的对照表。

表3 词性和专名类别标签一实施例的对照表

步骤S22：基于预打标模型和各候选实体的词性进行论元预估，得到篇章文本中预估事件论元。

在一个实施场景中，预打标模型恶意包括若干预设事件角色的映射规则，且每种预设事件角色的映射规则定义有与预设事件角色相关的词性和/或词语。示例性地，对于标签“per”(即人名)而言，可以定义映射规则"PER”->"机构人物"，即词性“人名”相关的预设事件角色为“机构人物”；或者，对于标签“loc”(即地名)而言，可以定义映射规则"LOC"->"地点"，即词性“地名”相关的预设事件角色为“地点”；或者，对于标签“org”(即机构名)而言，可以定义映射规则"ORG"->"机构人物"，即词性“机构名”相关的预设事件角色为“机构人物”；或者，对于标签“time”(即时间)而言，可以定义映射规则"TIME"->"时间"，即词性“时间”相关的预设事件角色为“时间”；或者，对于标签“nz”(即其他专名)而言，可以定义映射规则“nz”->“事物”，即词性“其他专名”相关的预设事件角色为“事物”；或者，对于标签“vn”(即名动词)而言，可以定义映射规则“vn”->“事物”，即词性“名动词”相关的预设事件角色为“事物”；或者，对于标签“m”(即数量词)而言，可以定义若其前或后片段包含“元|块|亿|万|千|百|十|文”，则可以确定映射为预设事件角色“金额”；或者，对于标签“m”(即数量词)而言，可以定义若其前或后片段包含“人”，则可以确定映射为预设事件角色“人数”；或者，对于标签“m”(即数量词)而言，可以定义若其前或后片段包含“年|月|日|时|分|秒|星期|周”且不包含汉字数字，则可以确定映射为预设事件角色“时间”；或者，若片段包含“退款|退货|换货|退押金|退换”，则可以确定映射为预设事件角色“消费纠纷-触发词”。其他情况可以以此类推，在此不再一一举例。上述方式，预打标模型包括若干预设事件角色的映射规则，每种预设事件角色的映射规则定义有与预设事件角色相关的词性和/或词语，能够通用实体领域先验知识引入到后续事件抽取过程中，辅助后续事件抽取，有利于在一定程度上缓解事件抽取论元漏检的问题，提升事件抽取效果。

步骤S23：基于各个字符是否属于预估事件论元进行语义提取，得到篇章文本的篇章表示。

具体而言，可以分别基于各个字符的字符嵌入表示、位置嵌入表示和片段嵌入表示，得到字符的输入嵌入表示，且在字符属于预估事件论元的情况下，字符的片段嵌入表示为第一嵌入表示(如，1)，在字符不属于预估事件论元的情况下，字符的片段嵌入表示为第二嵌入表示(如，0)，再基于各个字符的输入嵌入表示进行语义提取，得到篇章文本的篇章表示。示例性地，可以采用BERT作为语义提取的网络模型。需要说明的是，BERT利用了多头注意力机制，相对于LSTM(即Long Short Term Memory，即长短期记忆网络)而言，其语义特征提取能力、长距离捕获能力更强。为了便于描述，可以将篇章文本记为

其中，l_通表示篇章文本的文本长度，对于每个字符

其输入嵌入表示

可以表示为：

上述公式(11)中，WE表示字符嵌入，可以通过字符查表操作得到，PE表示位置嵌入，由字符在篇章文本中的位置决定，SE为片段嵌入，如前所述由字符是否属于预估事件论元确定。在此之后，即可将篇章文本中所有字符的输入嵌入表示进行拼接，得到篇章文本的输入嵌入表示

基于此即可将上述篇章文本的输入嵌入表示

输入至BERT等预训练语言模型的L个堆叠块，且每个块包含一个自注意力层和前馈网络连接层，则第l个堆叠块的输出

可以表示为：

上述公式(13)中，FNN为前馈神经网络，dropout为随机丢弃网络函数，是指在深度学习网络的训练过程中，按照一定的概率将一部分神经网络单元暂时从网络中丢弃，multihead(Q,K,V)为多头注意力函数，Q,K,V分别对应注意力query输入、key输入和value输入，每个堆叠块中的前向神经网络子层和多头注意力子层都带有残差连接结构和归一化结构，并以最后一个堆叠块的输出

作为篇章文本的篇章表示。为了便于描述，可以表示为

其中，

为篇章文本中第i个字符的表示。

本公开实施例中，在利用第一提取网络执行语义提取的情况下，篇章表示为第一篇章表示，在利用第二提取网络执行语义提取的情况下，篇章表示为第二篇章表示，此外如前所述，第一提取网络和第二提取网络基于分别对样本文本提取到的第一样本表示和第二样本表示之间的相对差异联合训练得到。也就是说，可以采用对比学习来提升篇章表示的鲁棒性。对比学习的标准流程是同一个样本通过不同的数据扩增手段得到的结果视为正样本对，然后就是通过loss来缩小正样本的距离，为了提高语义泛化性。

在一个实施场景中，基于第一样本表示相对于第二样本表示的相对熵，得到第一损失，并基于第二样本表示相对于第一样本表示的相对熵，得到第二损失，在此基础上，可以基于第一损失和第二损失，调整第一提取网络和第二提取网络两者的网络参数。需要说明的是，上述相对熵可以采用诸如KL散度等损失函数来进行度量，具体可以参阅下述相关描述，在此暂不赘述。上述方式，通过计算第一样本表示和第二样本表示之间的相对熵，并以此来调整第一提取网络和第二提取网络两者的网络参数，能够通过对比学习，提升鲁棒性，从而使得篇章文本内的局部内容即使发生不影响语义的细微调整，也不会对后续事件抽取造成影响，进而能够有利于提升事件抽取的整体鲁棒性。

在一个实施场景中，可以采用“dropout两次”的方式作为数据扩增手段来得到同一个篇章文本输入的不同篇章表示，并将它们视为正样本对。具体而言，如前所述，可以采用两个自带dropout的提取网络(即第一提取网络和第二提取网络)，分别获取第一样本表示和第二样本表示，为了便于描述，可以分别记为

和

此外，为了便于后续处理，可以分别对第一样本表示和第二样本表示在篇章文本的长度维度进行归一化操作，得到归一化后的第一样本表示

和第二样本表示

在此基础上，可以采用KL散度度量第一样本表示相对于第二样本表示的相对熵，得到第一损失

并采用KL散度度量第二样本表示相对于第一样本表示的相对熵，得到第二损失

上述公式(16)和公式(17)中，

表示

中第i个字符的表示，

表示

中第i个字符的表示，将上述两者平均即可得到对比学习的最终损失Loss_cont：

在此基础上，通过最终损失Loss_cont反向传播机制，对最终损失Loss_cont进行减少，进而优化上述第一提取网络和第二提取网络，直至训练收敛。在此之后，即可利用第一提取网络提取第一篇章表示，并利用第二提取网络提取第二篇章表示。上述方式，通过对篇章文本进行命名实体识别，得到若干候选实体和各候选实体的词性，并基于预打标模型和各候选实体的词性进行论元预估，得到篇章文本中预估事件论元，以及基于各个字符是否属于预估事件论元进行语义提取，得到篇章文本的篇章表示，且在利用第一提取网络执行语义提取的情况下，篇章表示为第一篇章表示，在利用第二提取网络执行语义提取的情况下，篇章表示为第二篇章表示，故能够通用实体领域先验知识引入到后续事件抽取过程中，辅助后续事件抽取，有利于在一定程度上缓解事件抽取论元漏检的问题，提升事件抽取效果。

步骤S24：将第一篇章表示和第二篇章表示进行融合，得到篇章文本的融合语义表示。

本公开实施例中，融合语义表示可以包括各个字符的第二字符表示。为了便于描述，可以将第一篇章表示记为

并将第二篇章表示记为

在此基础上，可以将第一篇章表示

和第二篇章表示

在字符维度进行相加并求平均，得到平均篇章表示H_通，为了便于后续操作，还可以进一步将平均篇章表示H_通在长度维度上进行平均池化，得到篇章文本的融合语义表示

上述公式(20)中，

表示H_通中第i个字符的表示。此外，在得到融合语义表示

即可预测篇章文本所涉及到的事件类型。具体而言，可以将融合语义表示

经过线性变换，将向量维度从原有数目变为预设事件集合中预设事件类型的总数，得到文本分类表示

上述公式(21)中，

n_h表征融合语义表示

的向量维度，n_event表示预设事件集合中预设事件类型的总数，且W_CLS可以在训练过程中调整。在此基础上，文本分类表示

可以归一化(如，sigmoid等)至0至1范围内，得到归一化后的文本分类表示

上述公式(22)中，归一化后的文本分类表示

向量维度为预设事件集合中事件总数，其中，

为

中第j个预设事件类型对应的预测概率，且若

大于阈值T_CLS(如，可以设置为0.5)，则可以判断篇章文本涉及第j个预设事件类型，反之，若

所有位置处的预测概率均不大于阈值T_CLS，则可以认为篇章文本涉及未知事件。需要说明的是，在训练过程中，可以计算预测得到的事件类型和真实标注的事件类型之间的差异，得到事件类型分类损失Loss_CLS，具体可以通过计算归一化后的文本分类表示与篇章文本真实标注的事件类型的独热编码之间的交叉熵，得到上述事件类型分类损失LOss_CLs：

上述公式(23)中，N_e表示事件类型的数目，

为第j个事件类型是否为篇章文本真实标注的事件类型判断标记，若是则其值等于1，否则其值等于0。具体可以参阅诸如交叉熵等损失函数的技术细节，在此不再赘述。

步骤S25：将各个事件类型分别对应的预设类型表示进行融合，得到篇章文本的事件类型表示。

具体而言，各个事件类型分别对应的预设类型表示可以通过查表操作得到，为了便于描述，可以将第j个事件类型对应的预设类型表示记为c_j：

c_j＝I_jW_event……(24)

上述公式(24)中，I_j∈[0,n_event]为事件类型的索引值，其中，0对应于未知事件，

通过查表操作即可获取W_event中第I_j行的向量，作为事件类型对应的预设类型表示。需要说明的是，W_event可以在训练过程中进行调整。在此基础上，可以将各个事件类型分别对应的预设类型表示进行平均，即可得到篇章文本的事件类型表示c：

上述公式(25)中，s_event为篇章文本所涉及的各个事件类型的集合，

为篇章文本所涉及的事件类型的总数。

步骤S26：基于事件类型表示和融合语义表示进行融合，得到篇章语义表示。

具体而言，可以获取各个字符的第二字符表示的均值和方差，并基于事件类型表示预测得到融合权重和融合偏置，在此基础上，对于各个字符，可以基于字符的第二字符表示、均值和方差进行标准化，得到字符的标准字符表示，再将融合权重对字符的标准字符表示的加权结果与融合偏置之和，作为字符的第一字符表示，即可将各个字符的第一字符表示的组合，作为篇章语义表示。上述方式，通过在字符级别实现字符语义表示与事件类型表示的融合，能够在后续事件抽取过程中，从语义层面进一步参考篇章文本所涉及到的各个事件类型，从而能够将事件类型识别结果显示地编码到事件论元抽取模型中，进而能够显示地对事件类型识别和事件论元抽取两个环节联合建模，有利于大大减少级联误差，提升事件抽取效果。

在一个实施场景中，为了便于描述，可以将篇章文本中各个字符的第二字符表示

的均值记为μ，方差记为σ，融合权重记为γ_c，融合偏置记为β_c，则对于第一字符表示

可以表示为：

γ_c＝W_γc+b_γβ_c＝W_βc+b_β……(28)

上述公式(26)、(27)和(28)中，W_γ、W_β、b_γ、b_β均可以在训练过程中进行调整。此外，

表示第i个字符的标准字符表示。

上述方案，通过通用实体领域先验知识引入到后续事件抽取过程中，辅助后续事件抽取，有利于在一定程度上缓解事件抽取论元漏检的问题，提升事件抽取效果，而将事件类型识别结果显示地编码到事件论元抽取模型中，进而能够显示地对事件类型识别和事件论元抽取两个环节联合建模，有利于大大减少级联误差，提升事件抽取效果。

请参阅图3，图3是图1中步骤S12一实施例的流程示意图。具体而言，图3是基于目标事件角色的静态角色描述文本和动态角色描述文本执行论元预测一实施例的流程示意图。本公开实施例可以包括如下步骤：

步骤S31：基于静态角色描述文本的第一语义表示、动态角色描述文本的第二语义表示分别和篇章语义表示进行预测，得到各个字符的第一预测结果和第二预测结果。

本公开实施例中，各个字符的第一预测结果包括字符分别属于目标事件角色的事件论元的起始字符和终止字符的第一概率，且各个字符的第二预测结果包括字符分别属于目标事件角色的事件论元的起始字符和终止字符的第二概率。

具体而言，为了便于描述，对于第k个候选事件角色而言，可以将其静态角色描述文本的第一语义表示记为

并将其动态角色描述文本的第二语义表示记为

上述公式(29)至(32)中，

和

分别表示第k个候选事件角色的静态角色描述文本和动态角色描述文本，且

分别表示静态角色描述文本、动态角色描述文本中第i个字符，

分别表示静态角色描述文本、动态角色描述文本中第i个字符的编码表示，

分别表示静态角色描述文本的文本长度和动态角色描述文本的文本长度。此外，如上述公式所述，可以通过卷积神经网络提取第一语义表示和第二语义表示，当然也可以采用其他网络来提取，在此不做限定。

在此基础上，可以采用机器阅读理解来预测得到各个字符的第一预测结果和第二预测结果。具体来说，可以将融合事件类型之后的篇章语义表示

作为MRC的document表示，并以

和

作为MRC的两种query表示，进行query询问，在篇章文本中寻找其中某个片段作为对应的答案，从而分别得到静态query的第一预测结果和动态query的第二预测结果。具体而言，可以表示为：

上述公式(33)至(38)中，

为第k个候选事件角色的静态角色描述文本内的第一语义表示按照长度维度进行最大池化的操作结果，

为第k个候选事件角色的动态角色描述文本内的第二语义表示按照长度维度进行最大池化的操作结果。在此基础上，

可以在训练过程中进行调整。经上述参数预测之后，即可得到第一预测结果中各个字符分别属于目标事件角色的事件论元的起始字符的第一起始概率

和各个字符分别属于目标事件角色的事件论元的终止字符的第一终止概率

以及第二预测结果中各个字符分别属于目标事件角色的事件论元的起始字符的第二起始概率

和各个字符分别属于目标事件角色的事件论元的终止字符的第二终止概率

步骤S32：基于各个字符的第一预测结果和第二预测结果，得到属于目标事件角色的若干候选事件论元。

在一个实施场景中，对于各个字符，可以将字符属于目标事件角色的事件论元的起始字符的第一概率和第二概率进行加权，得到字符的第一加权概率，并将字符属于目标事件角色的事件论元的终止字符的第一概率和第二概率进行加权，得到字符的第二加权概率，在此基础上，即可基于各个字符的第一加权概率和第二加权概率，得到属于目标事件角色的若干候选事件论元。上述方式，通过加权处理第一概率和第二概率，得到加权概率，在此基础上进行论元抽取，能够结合静态和动态两方面进行论元抽取，有利于大大减少多抽论元的问题，提升事件抽取效果。

在一个具体的实施场景中，加权处理时的权重可以根据实际应用需要进行调整，如在静态query的预测结果比较可靠的情况下，可以设置第一预测结果的权重高于第二预测结果的权重；或者，在动态query的预测结果比较可靠的情况下，可以设置第二预测结果的权重高于第一预测结果的权重；或者，静态query和动态query两者的预测结果均比较可靠的情况下，可以设置第一预测结果的权重等于第二预测结果的权重，在此不做限定。

在一个具体的实施场景中，为了便于计算，两者的权重可以均为0.5，也就是说取两者的平均值。在此情况下，第一加权概率

和第二加权概率

可以分别表示为：

上述公式(39)至(42)中，

为第k个候选事件角色在篇章文本中第i个字符的论元答案片段起始位置预测概率(即第一加权概率)，

为第k个候选事件角色在篇章文本中第i个字符的论元答案片段终止位置预测概率(即第二加权概率)。在此基础上，可以将大于论元答案阈值(如，0)的

和

对应于篇章文本中的字符位置作为候选事件论元的起始位置和终止位置。具体而言，对于任一起始位置的字符而言，可以选择位于其后且距离该字符最近的终止位置的字符，并将该起始位置的字符至选择的字符的文本片段，作为候选事件论元，以此类推，即可得到从篇章文本中抽取得到候选事件角色的若干候选事件论元。

需要说明的是，由于论元答案片段的起始位置和终止位置按不同角色分别计算，互相独立不产生冲突，所以天然地能解决不同角色间论元答案嵌套的问题，通过计算模型预测的论元答案片段起始和终止位置概率和真实的论元答案片段起始和终止位置之间的距离，获得事件论元抽取损失Loss_EE。具体地，可以计算预测的论元起始位置和终止位置的概率值和真实标注的论元起始位置和终止位置之间的交叉熵，得到上述事件论元抽取损失Loss_EE：

上述公式(43)中，

表示第k个候选事件角色在篇章文本中第i个字符是否真实标注为论元起始位置的判断标记，若是则其值为1，否则其值为0；类似地，

表示第k个候选事件角色在篇章文本中第i个字符是否真实标注为论元终止位置的判断标记，若是则其值为1，否则其值为0。具体计算过程，可以参阅交叉熵等等损失函数的技术细节，在此不再赘述。

在一个实施场景中，不同于前述直接对篇章文本整体抽取候选事件论元，在基于静态角色描述文本的第一语义表示、动态角色描述文本的第二语义表示分别和篇章语义表示进行预测之前，还可以先基于预设滑窗划分篇章文本，得到若干子文本。示例性地，预设滑窗的窗长可以设置为512(即长度为512个字符)，步长为256(即每次滑动256个字符)，当然也可以设置为其他数值，在此不做限定。在此基础上，可以对于各个子文本，基于第一语义表示、第二语义表示分别和子文本的文本语义表示进行预测，得到子文本中各个字符的第一预测结果和第二预测结果，并基于子文本中各个字符的第一预测结果和第二预测结果，得到子文本中属于目标事件角色的预测事件论元，从而基于各子文本中的预测事件论元进行后处理，得到若干候选事件论元。例如，可以将各子文本中的预测事件论元进行检查，若预测事件论元存在重叠(如，某一预测事件论元为另一预测事件论元的一部分)，则可以将两个预测事件论元的并集，作为候选事件论元。以前述预设滑窗为例，由于不同的篇章子文本有一半长度是重叠的，这样可以使对篇章子文本进行编码时，可以看到上下相邻两个篇章子文本的上下文信息，基于滑动窗口的机器阅读理解方法，只需要寻找论元答案片段的起始位置和终止位置，而不需要关注论元答案片段内部位置，能在一定程度上缓解长论元容易从中间断开的问题，有利于进一步提升事件抽取效果。

上述方案，基于静态角色描述文本的第一语义表示、动态角色描述文本的第二语义表示分别和篇章语义表示进行预测，得到各个字符的第一预测结果和第二预测结果，并基于各个字符的第一预测结果和第二预测结果，得到属于目标事件角色的若干候选事件论元，从而能够结合统计先验知识和历史论元预测两方面共同进行论元预测，有利于大大减少多抽论元的问题，提升论元抽取效果。

请参阅图4，图4是本申请事件抽取装置40一实施例的框架示意图。事件抽取装置40包括：篇章语义提取模块41、事件论元预测模块42、共指论元预测模块43和目标论元优化模块44，篇章语义提取模块41，用于提取篇章文本的篇章语义表示；其中，篇章语义表示包括篇章文本中各个字符的第一字符表示，篇章文本涉及若干事件类型；事件论元预测模块42，用于基于篇章语义表示在篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元；其中，各事件类型分别对应有若干候选事件角色，目标事件角色从若干候选事件角色选择得到；共指论元预测模块43，用于基于篇章语义表示和各候选事件论元的论元语义表示分别在篇章文本进行共指预测，得到各候选事件论元的共指论元集合；目标论元优化模块44，用于分别基于各候选事件论元的参考论元集合和共指论元集合，选择至少一个候选事件论元作为目标事件角色的目标事件论元；其中，候选事件论元的参考论元集合包括候选事件论元以外的其他候选事件论元。

上述方案，在事件抽取过程中，能够预测得到各个候选事件论元的共指论元集合，并对于各个候选事件论元，基于其共指论元集合以及参考论元集合，来确定其是否作为目标事件角色的目标事件论元，从而能够通过共指关系优化判断事件论元抽取结果，进而能够大大减少诸如多抽论元等问题，提升事件抽取效果。

在一些公开实施例中，共指论元预测模块43包括共指预测子模块，用于基于篇章语义表示和候选事件论元的论元语义表示进行预测，得到各个字符的共指预测结果；其中，各个字符的共指预测结果包括字符分别属于候选事件论元的共指论元的起始字符和终止字符的可能性；共指论元预测模块43包括集合获取子模块，用于基于各个字符的共指预测结果，得到候选事件论元的共指论元集合。

在一些公开实施例中，目标论元优化模块44包括论元选择子模块，用于分别基于各候选事件论元的参考论元集合和共指论元集合是否存在交集，选择保留或剔除候选事件论元；目标论元优化模块44包括论元获取子模块，用于基于保留的候选事件论元，得到目标事件角色的目标事件论元。

在一些公开实施例中，目标论元优化模块44包括论元重选子模块，用于响应于所有候选事件论元均被剔除，基于各候选事件论元分别在篇章文本的出现频率，选择至少一个候选事件论元，作为目标事件角色的目标事件论元。

在一些公开实施例中，论元预测基于目标事件角色的静态角色描述文本和动态角色描述文本执行，且在事件抽取过程中，依次预测各候选事件角色的目标事件论元；其中，静态角色描述文本基于与目标事件角色相关的词语预先构建得到，动态角色描述文本基于已经预测到的目标事件论元对事件类型的事件动态描述模板更新得到。

在一些公开实施例中，事件类型的事件动态描述模板包括事件类型的各候选事件角色的预置模板文本；其中，动态角色描述文本由事件动态描述模板中预置模板文本，替换为已经预测到且属于相同候选事件角色的目标事件论元而得到。

在一些公开实施例中，事件论元预测模块42包括预测结果获取子模块，用于基于静态角色描述文本的第一语义表示、动态角色描述文本的第二语义表示分别和篇章语义表示进行预测，得到各个字符的第一预测结果和第二预测结果；事件论元预测模块42包括预测结果融合子模块，用于基于各个字符的第一预测结果和第二预测结果，得到属于目标事件角色的若干候选事件论元；其中，各个字符的第一预测结果包括字符分别属于目标事件角色的事件论元的起始字符和终止字符的第一概率，且各个字符的第二预测结果包括字符分别属于目标事件角色的事件论元的起始字符和终止字符的第二概率。

在一些公开实施例中，预测结果融合子模块包括概率加权单元，用于对于各个字符，将字符属于目标事件角色的事件论元的起始字符的第一概率和第二概率进行加权，得到字符的第一加权概率，并将字符属于目标事件角色的事件论元的终止字符的第一概率和第二概率进行加权，得到字符的第二加权概率；预测结果融合子模块包括论元确定单元，用于基于各个字符的第一加权概率和第二加权概率，得到属于目标事件角色的若干候选事件论元。

在一些公开实施例中，事件论元预测模块42包括篇章文本划分子模块，用于基于预设滑窗划分篇章文本，得到若干子文本；预测结果获取子模块具体用于对于各个子文本，基于第一语义表示、第二语义表示分别和子文本的文本语义表示进行预测，得到子文本中各个字符的第一预测结果和第二预测结果；预测结果融合子模块具体用于基于子文本中各个字符的第一预测结果和第二预测结果，得到子文本中属于目标事件角色的预测事件论元；以及基于各子文本中的预测事件论元进行后处理，得到若干候选事件论元。

在一些公开实施例中，篇章语义表示基于第一提取网络和第二提取网络分别提取到的第一篇章表示和第二篇章表示融合得到，第一提取网络和第二提取网络基于分别对样本文本提取到的第一样本表示和第二样本表示之间的相对差异联合训练得到。

在一些公开实施例中，事件抽取装置40包括提取网络训练模块，提取网络训练模块包括损失计算子模块，用于基于第一样本表示相对于第二样本表示的相对熵，得到第一损失，并基于第二样本表示相对于第一样本表示的相对熵，得到第二损失；提取网络训练模块包括参数调整子模块，用于基于第一损失和第二损失，调整第一提取网络和第二提取网络两者的网络参数。

在一些公开实施例中，事件抽取装置40包括篇章表示提取模块，用于提取第一篇章表示或第二篇章表示，篇章表示提取模块包括命名实体识别子模块，用于对篇章文本进行命名实体识别，得到若干候选实体和各候选实体的词性；篇章表示提取模块包括论元预估子模块，用于基于预打标模型和各候选实体的词性进行论元预估，得到篇章文本中预估事件论元；篇章表示提取模块包括语义提取子模块，用于基于各个字符是否属于预估事件论元进行语义提取，得到篇章文本的篇章表示；其中，在利用第一提取网络执行语义提取的情况下，篇章表示为第一篇章表示，在利用第二提取网络执行语义提取的情况下，篇章表示为第二篇章表示。

在一些公开实施例中，预打标模型包括若干预设事件角色的映射规则，每种预设事件角色的映射规则定义有与预设事件角色相关的词性和/或词语。

在一些公开实施例中，语义提取子模块包括嵌入表示单元，用于分别基于各个字符的字符嵌入表示、位置嵌入表示和片段嵌入表示，得到字符的输入嵌入表示；其中，在字符属于预估事件论元的情况下，字符的片段嵌入表示为第一嵌入表示，在字符不属于预估事件论元的情况下，字符的片段嵌入表示为第二嵌入表示；语义提取子模块包括表示提取单元，用于基于各个字符的输入嵌入表示进行语义提取，得到篇章文本的篇章表示。

在一些公开实施例中，事件抽取装置40还包括表示融合模块，表示融合模块包括第一融合子模块，用于将第一篇章表示和第二篇章表示进行融合，得到篇章文本的融合语义表示；其中，融合语义表示包括各个字符的第二字符表示；表示融合模块包括第二融合子模块，用于将各个事件类型分别对应的预设类型表示进行融合，得到篇章文本的事件类型表示；表示融合模块包括第三融合子模块，用于基于事件类型表示和融合语义表示进行融合，得到篇章语义表示。

在一些公开实施例中，第三融合子模块包括参数获取单元，用于获取各个字符的第二字符表示的均值和方差，并基于事件类型表示预测得到融合权重和融合偏置；第三融合子模块包括标准化单元，用于对于各个字符，基于字符的第二字符表示、均值和方差进行标准化，得到字符的标准字符表示；第三融合子模块包括融合单元，用于将融合权重对字符的标准字符表示的加权结果与融合偏置之和，作为字符的第一字符表示。

在一些公开实施例中，篇章文本涉及若干事件类型包含于预设事件集合，预设事件集合包括未知事件和若干种预设事件，且未知事件和预设事件分别对应设有各自的候选事件角色，未知事件对应的候选事件角色从各预设事件对应的候选事件角色抽象得到。

请参阅图5，图5是本申请电子设备50一实施例的框架示意图。电子设备50包括相互耦接的存储器51和处理器52，存储器51中存储有程序指令，处理器52用于执行程序指令以实现上述任一事件抽取方法实施例中的步骤。具体地，电子设备50可以包括但不限于：台式计算机、笔记本电脑、服务器、手机、平板电脑等等，在此不做限定。

具体而言，处理器52用于控制其自身以及存储器51以实现上述任一事件抽取方法实施例中的步骤。处理器52还可以称为CPU(Central Processing Unit，中央处理单元)。处理器52可能是一种集成电路芯片，具有信号的处理能力。处理器52还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器52可以由集成电路芯片共同实现。

请参阅图6，图6是本申请计算机可读存储介质60一实施例的框架示意图。计算机可读存储介质60存储有能够被处理器运行的程序指令61，程序指令61用于实现上述任一事件抽取方法实施例中的步骤。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考，为了简洁，本文不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种事件抽取方法，其特征在于，包括：

提取篇章文本的篇章语义表示；其中，所述篇章语义表示包括所述篇章文本中各个字符的第一字符表示，所述篇章文本涉及若干事件类型；

基于所述篇章语义表示在所述篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元；其中，各所述事件类型分别对应有若干候选事件角色，所述目标事件角色从所述若干候选事件角色选择得到；

基于所述篇章语义表示和各所述候选事件论元的论元语义表示分别在所述篇章文本进行共指预测，得到各所述候选事件论元的共指论元集合；

分别基于各所述候选事件论元的参考论元集合和共指论元集合，选择至少一个所述候选事件论元作为所述目标事件角色的目标事件论元；其中，所述候选事件论元的参考论元集合包括所述候选事件论元以外的其他所述候选事件论元。

2.根据权利要求1所述的方法，其特征在于，所述基于所述篇章语义表示和各所述候选事件论元的论元语义表示分别在所述篇章文本进行共指预测，得到各所述候选事件论元的共指论元集合，包括：

基于所述篇章语义表示和所述候选事件论元的论元语义表示进行预测，得到所述各个字符的共指预测结果；其中，各个所述字符的共指预测结果包括所述字符分别属于所述候选事件论元的共指论元的起始字符和终止字符的可能性；

基于所述各个字符的共指预测结果，得到所述候选事件论元的共指论元集合。

3.根据权利要求1所述的方法，其特征在于，所述分别基于各所述候选事件论元的参考论元集合和共指论元集合，选择至少一个所述候选事件论元作为所述目标事件角色的目标事件论元，包括：

分别基于各所述候选事件论元的参考论元集合和共指论元集合是否存在交集，选择保留或剔除所述候选事件论元；

基于保留的候选事件论元，得到所述目标事件角色的目标事件论元。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

响应于所有所述候选事件论元均被剔除，基于各所述候选事件论元分别在所述篇章文本的出现频率，选择至少一个所述候选事件论元，作为所述目标事件角色的目标事件论元。

5.根据权利要求1所述的方法，其特征在于，所述论元预测基于所述目标事件角色的静态角色描述文本和动态角色描述文本执行，且在事件抽取过程中，依次预测各所述候选事件角色的目标事件论元；

其中，所述静态角色描述文本基于与所述目标事件角色相关的词语预先构建得到，所述动态角色描述文本基于已经预测到的目标事件论元对所述事件类型的事件动态描述模板更新得到。

6.根据权利要求5所述的方法，其特征在于，所述事件类型的事件动态描述模板包括所述事件类型的各所述候选事件角色的预置模板文本；

其中，所述动态角色描述文本由所述事件动态描述模板中所述预置模板文本，替换为已经预测到且属于相同所述候选事件角色的目标事件论元而得到。

7.根据权利要求5所述的方法，其特征在于，所述基于所述篇章语义表示在所述篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元，包括：

基于所述静态角色描述文本的第一语义表示、所述动态角色描述文本的第二语义表示分别和所述篇章语义表示进行预测，得到各个字符的第一预测结果和第二预测结果；

基于所述各个字符的第一预测结果和第二预测结果，得到属于所述目标事件角色的若干候选事件论元；

其中，各个所述字符的第一预测结果包括所述字符分别属于所述目标事件角色的事件论元的起始字符和终止字符的第一概率，且各个所述字符的第二预测结果包括所述字符分别属于所述目标事件角色的事件论元的起始字符和终止字符的第二概率。

8.根据权利要求7所述的方法，其特征在于，所述基于所述各个字符的第一预测结果和第二预测结果，得到属于所述目标事件角色的若干候选事件论元，包括：

对于所述各个字符，将所述字符属于所述目标事件角色的事件论元的起始字符的第一概率和第二概率进行加权，得到所述字符的第一加权概率，并将所述字符属于所述目标事件角色的事件论元的终止字符的第一概率和第二概率进行加权，得到所述字符的第二加权概率；

基于所述各个字符的第一加权概率和第二加权概率，得到属于所述目标事件角色的若干候选事件论元。

9.根据权利要求7所述的方法，其特征在于，在所述基于所述静态角色描述文本的第一语义表示、所述动态角色描述文本的第二语义表示分别和所述篇章语义表示进行预测，得到各个字符的第一预测结果和第二预测结果之前，所述方法还包括：

基于预设滑窗划分所述篇章文本，得到若干子文本；

所述基于所述静态角色描述文本的第一语义表示、所述动态角色描述文本的第二语义表示分别和所述篇章语义表示进行预测，得到各个字符的第一预测结果和第二预测结果，包括：

对于各个所述子文本，基于所述第一语义表示、所述第二语义表示分别和所述子文本的文本语义表示进行预测，得到所述子文本中各个字符的第一预测结果和第二预测结果；

所述基于所述各个字符的第一预测结果和第二预测结果，得到属于所述目标事件角色的若干候选事件论元，包括：

基于所述子文本中各个字符的第一预测结果和第二预测结果，得到所述子文本中属于所述目标事件角色的预测事件论元；

基于各所述子文本中的预测事件论元进行后处理，得到所述若干候选事件论元。

10.根据权利要求1所述的方法，其特征在于，所述篇章语义表示基于第一提取网络和第二提取网络分别提取到的第一篇章表示和第二篇章表示融合得到，所述第一提取网络和所述第二提取网络基于分别对样本文本提取到的第一样本表示和第二样本表示之间的相对差异联合训练得到。

11.根据权利要求10所述的方法，其特征在于，所述第一提取网络和所述第二提取网络的训练步骤包括：

基于所述第一样本表示相对于所述第二样本表示的相对熵，得到第一损失，并基于所述第二样本表示相对于所述第一样本表示的相对熵，得到第二损失；

基于所述第一损失和所述第二损失，调整所述第一提取网络和所述第二提取网络两者的网络参数。

12.根据权利要求10所述的方法，其特征在于，所述第一篇章表示或所述第二篇章表示的提取步骤包括：

对所述篇章文本进行命名实体识别，得到若干候选实体和各所述候选实体的词性；

基于预打标模型和各所述候选实体的词性进行论元预估，得到所述篇章文本中预估事件论元；

基于所述各个字符是否属于所述预估事件论元进行语义提取，得到所述篇章文本的篇章表示；

其中，在利用所述第一提取网络执行所述语义提取的情况下，所述篇章表示为所述第一篇章表示，在利用所述第二提取网络执行所述语义提取的情况下，所述篇章表示为所述第二篇章表示。

13.根据权利要求12所述的方法，其特征在于，所述预打标模型包括若干预设事件角色的映射规则，每种所述预设事件角色的映射规则定义有与所述预设事件角色相关的词性和/或词语。

14.根据权利要求12所述的方法，其特征在于，所述基于所述各个字符是否属于所述预估事件论元进行语义提取，得到所述篇章文本的篇章表示，包括：

分别基于所述各个字符的字符嵌入表示、位置嵌入表示和片段嵌入表示，得到所述字符的输入嵌入表示；其中，在所述字符属于所述预估事件论元的情况下，所述字符的片段嵌入表示为第一嵌入表示，在所述字符不属于所述预估事件论元的情况下，所述字符的片段嵌入表示为第二嵌入表示；

基于所述各个字符的输入嵌入表示进行语义提取，得到所述篇章文本的篇章表示。

15.根据权利要求10所述的方法，其特征在于，所述第一篇章表示和所述第二篇章表示的融合步骤包括：

将所述第一篇章表示和所述第二篇章表示进行融合，得到所述篇章文本的融合语义表示；其中，所述融合语义表示包括所述各个字符的第二字符表示；

将各个所述事件类型分别对应的预设类型表示进行融合，得到所述篇章文本的事件类型表示；

基于所述事件类型表示和所述融合语义表示进行融合，得到所述篇章语义表示。

16.根据权利要求15所述的方法，其特征在于，所述基于所述事件类型表示和所述融合语义表示进行融合，得到所述篇章语义表示，包括：

获取所述各个字符的第二字符表示的均值和方差，并基于所述事件类型表示预测得到融合权重和融合偏置；

对于各个所述字符，基于所述字符的第二字符表示、所述均值和所述方差进行标准化，得到所述字符的标准字符表示；

将所述融合权重对所述字符的标准字符表示的加权结果与所述融合偏置之和，作为所述字符的第一字符表示。

17.根据权利要求1所述的方法，其特征在于，篇章文本涉及若干事件类型包含于预设事件集合，所述预设事件集合包括未知事件和若干种预设事件，且所述未知事件和所述预设事件分别对应设有各自的候选事件角色，所述未知事件对应的候选事件角色从各所述预设事件对应的候选事件角色抽象得到。

18.一种事件抽取装置，其特征在于，包括：

篇章语义提取模块，用于提取篇章文本的篇章语义表示；其中，所述篇章语义表示包括所述篇章文本中各个字符的第一字符表示，所述篇章文本涉及若干事件类型；

事件论元预测模块，用于基于所述篇章语义表示在所述篇章文本进行论元预测，得到属于目标事件角色的若干候选事件论元；其中，各所述事件类型分别对应有若干候选事件角色，所述目标事件角色从所述若干候选事件角色选择得到；

共指论元预测模块，用于基于所述篇章语义表示和各所述候选事件论元的论元语义表示分别在所述篇章文本进行共指预测，得到各所述候选事件论元的共指论元集合；

目标论元优化模块，用于分别基于各所述候选事件论元的参考论元集合和共指论元集合，选择至少一个所述候选事件论元作为所述目标事件角色的目标事件论元；其中，所述候选事件论元的参考论元集合包括所述候选事件论元以外的其他所述候选事件论元。

19.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现权利要求1至17任一项所述的事件抽取方法。

20.一种计算机可读存储介质，其特征在于，存储有能够被处理器运行的程序指令，所述程序指令用于实现权利要求1至17任一所述的事件抽取方法。