CN116341519A

CN116341519A - 基于背景知识的事件因果关系抽取方法、装置及存储介质

Info

Publication number: CN116341519A
Application number: CN202310259295.3A
Authority: CN
Inventors: 魏晓; 黄晨阳
Original assignee: University of Shanghai for Science and Technology
Current assignee: University of Shanghai for Science and Technology
Priority date: 2023-03-16
Filing date: 2023-03-16
Publication date: 2023-06-27

Abstract

本发明涉及一种基于背景知识的事件因果关系抽取方法、装置及存储介质，步骤如下：对输入的句子预处理，得到表示事件的词语；对知识图谱中邻居知识节点进行筛选，保留与事件因果关系抽取任务相关的节点；基于相关邻居节点对事件的背景知识表示进行编码，构建事件的背景知识表示向量；将句子输入预训练语言模型，得到词语的词向量表示，并将其与背景知识表示向量进行融合；将融合后的向量输入神经网络模型，为句子中的词语分配因果语义角色标签，实现事件因果关系的抽取。本发明能够抽取文本蕴含的隐式事件因果关系，快速发现事件之间的因果关联，将复杂的法律文本内容通过事件间的因果关系进行简化表示，为司法行业从业者提供便利。

Description

基于背景知识的事件因果关系抽取方法、装置及存储介质

技术领域

本发明涉及自然语言处理与深度学习技术领域，尤其是涉及一种基于事件背景知识的司法案件事件因果关系抽取方法。

背景技术

随着人工智能技术的快速发展，其被应用在越来越多的领域及场景之中，而智慧法律也成为了当前的一个热门研究课题。在一个司法案件文本中，往往包含大量的事件因果关系。通过抽取事件间的因果关系，不仅能够将复杂的法律文本利用事件间的因果关联进行简化，而且还能够协助相关人员根据事件间的因果关系对案件的关键信息作出判断，从而更好的理解案件的发展过程。

目前，对事件因果关系抽取的方法可以大致分为基于模式匹配的方法和基于机器学习的方法。基于模式匹配的方法通过对文本进行分析归纳，构造常见的句法模板对事件之间的因果关系进行抽取。虽然这类方法在面向特定领域的任务中取得了较好的效果，但是这类方法所构造出的句法模板无法覆盖所有可能的句法结构，并且难以推广至其他领域，适用性较低。虽然目前基于机器学习的方法取得了较为良好的效果，但是这些方法往往仅在识别显式的事件因果关系上表现较好，当文本中缺少“因为”、“导致”等表示因果关联的词语时，模型难以像人类一样基于事件间的背景知识推理出事件间潜藏的隐式事件因果关系。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于事件背景知识的司法案件事件因果关系抽取方法。

本发明的目的可以通过以下技术方案来实现：

作为本发明的第一方面，提供一种基于背景知识的事件因果关系抽取方法，具体包括以下步骤：

输入句子，对句子进行预处理，得到句子中表示事件的词语；

对知识图谱中与事件相关联的邻居知识节点进行筛选，保留与事件因果关系抽取任务相关的邻居节点；

基于相关邻居节点对事件的背景知识表示进行编码，构建事件的背景知识表示向量；

将句子输入预训练语言模型，得到句子中词语的词向量表示，将词向量表示与背景知识表示向量进行融合；

将融合后的语义信息增强向量输入下游神经网络模型，为句子中的每个词语分配相应的因果语义角色标签，实现事件因果关系的抽取。

进一步的，所述对句子进行预处理，得到其中表示事件的词语，具体步骤包括：

基于专家知识构建面向司法领域的停用词表；

使用分词工具包对输入句子进行分词处理，得到分词后句子S的词语集合W；

对句子中的词语进行词性分析，得到词性集合POS；

结合构建的停用词表与词语的词性对词语集合W中的词语进行过滤，选择其中能够表示事件的词语集合E。

进一步的，所述对知识图谱中与事件相关联的邻居知识节点进行筛选，保留与事件因果关系抽取任务相关的邻居节点的具体步骤包括：

对于事件词语集合E＝{e₁，e₂，...，e_m}中的事件e_i，在知识图谱中检索与事件e_i相关联的邻居节点；

基于节点间的关系对邻居节点进行过滤，仅保留与事件节点之间具有事件因果关系抽取任务相关关系的邻居节点；

按照知识图谱中节点间的关联强度保留与事件e_i相关性最高的前n个邻居节点{N₁，N₂，N₃，...N_n}与其对应的关联权重{W₁，W₂，W₃，...W_n}。

进一步的，所述基于相关邻居节点对事件的背景知识表示进行编码，构建事件的背景知识表示向量的具体步骤包括：

对于事件e_i的邻居节点N_j，计算该节点在事件e_i的背景知识表示中的权重占比α_j；

从知识图谱的词向量表中获取邻居节点N_j对应的词向量表示v_j；

基于得到的权重占比α_j与词向量表示v_j，计算节点N_j在背景知识编码任务中的知识表示k_j；

重复上述步骤，获得事件e_i所有邻居节点的知识表示集合K；

基于事件e_i的邻居节点知识表示集合K对e_i进行背景知识编码，得到e_i的背景知识表示

进一步的，所述将句子输入预训练语言模型，得到句子中词语的词向量表示，将词向量表示与背景知识表示向量进行融合的具体步骤包括：

将句子输入预训练完成的语言模型中，获取句子中每个词语的词向量表示

将每个词语的词向量表示

与其对应的背景知识表示/>

融合，得到词语的语义信息增强向量表示F_i。

进一步的，若当前词语无法表示一个事件，则将其对应的背景知识表示向量

设置为全0向量。

进一步的，所述将融合后的语义信息增强向量输入下游神经网络模型，为句子中的每个词语分配相应的因果语义角色标签，实现事件因果关系的抽取的具体步骤包括：

对得到的句中每个词语对应的语义信息增强向量进行拼接整合，形成整个句子的特征向量矩阵；

将得到的句子特征向量矩阵作为下层双向长短时记忆神经网络模型的输入，获取基于句子上下文特征的语义向量矩阵；

将获得的语义向量矩阵作为下游条件随机场模型的输入，通过条件随机场模型对句子中每个词语对应的因果语义角色标签序列进行打分，获得给定输入序列的全局最优标签链；

为句子中的每个词语选择得分最高的因果语义角色标签，输出句子以及其中每个词语对应的因果语义角色标签，完成事件因果关系抽取任务。

进一步的，所述因果语义角色标签分为原因、结果以及其他。

作为本发明的第二方面，提供一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上任一项所述的事件因果关系抽取方法。

作为本发明的第三方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上任一项所述的事件因果关系抽取方法的步骤。

与现有技术相比，本发明具有以下有益效果：

本发明提出一种基于事件背景知识的司法案件事件因果关系抽取方法。首先从句子中获得表示事件的词语；对于每个事件词语，在知识图谱中获取与其相关联的邻居知识节点并进行筛选；保留与事件因果关系抽取任务相关程度最高的前n个邻居节点，基于相关节点对该事件的背景知识表示进行编码；并将词语的背景知识表示向量与从预训练语言模型中获得的词向量相融合，得到词语的语义信息增强向量；在此基础上，结合双向长短时记忆神经网络与条件随机场获得句子中每个词语的因果语义角色标签，实现事件因果关系的抽取。有助于在文本中缺少显式因果关联词的情况下，对其中蕴含的隐式事件因果关系进行抽取，快速发现事件之间的因果关联，将复杂的法律文本内容通过事件间的因果关系进行简化表示，为司法行业的相关从业者提供便利。

附图说明

图1是本发明的一种基于事件背景知识的司法案件事件因果关系抽取方法的流程示意图；

图2是对句子中的事件进行背景知识编码的示意图；

图3是司法案件事件因果关系抽取整体模型结构；

图4为本发明提供的示例性实施例示出的电子设备的示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

实施例一

如图1所示，为本发明的基于事件背景知识的司法案件事件因果关系抽取方法的流程示意图，具体包括以下步骤：

步骤A：对输入的句子进行预处理，得到其中表示事件的词语；

步骤A的具体步骤如下：

步骤A1：基于专家知识构建面向司法领域的停用词表；

步骤A2：使用开源中文分词工具包对输入句子进行分词处理，得到分词后句子S的词语集合W＝{w₁，w₂，...，w_k}；

其中，w_j表示分词后词语集合中的第j个词语；

步骤A3：对句子中的词语进行词性分析，得到词性集合POS＝{pos₁，pos₂，...，pos_k}；

其中，pos_i表示词语集合中第i个词语所对应的词性；

步骤A4：结合步骤A1中构建的停用词表与词语的词性对词语集合W中的词语进行过滤，选择其中能够表示事件的词语集合E＝{e₁，e₂，...，e_m}；

其中，e_i表示句子中的第i个事件词语。

步骤B：对知识图谱中与事件相关联的邻居知识节点进行筛选，保留与事件因果关系抽取任务相关的节点；

步骤B的具体步骤如下：

步骤B1：对于事件词语集合E＝{e₁，e₂，...，e_m}中的事件e_i，在知识图谱中检索与其相关联的邻居节点；

步骤B2：基于节点间的关系对邻居节点进行过滤，仅保留与事件节点之间具有“造成”、“导致”等事件因果关系抽取任务相关关系的邻居节点；

步骤B3：按照知识图谱中节点间的关联强度保留与事件e_i相关性最高的前n个邻居节点{N₁，N₂，N₃，...N_n}与其对应的关联权重{W₁，W₂，W₃，...W_n}。

步骤C：基于相关邻居节点对事件的背景知识表示进行编码，构建事件的背景知识表示向量；

步骤C的具体步骤如下：

步骤C1：对于事件e_i的邻居节点N_j，计算该节点在事件e_i的背景知识表示中的权重占比α_j；

其中，计算权重占比α_j的公式为：

W_j表示当前邻居节点N_j与事件e_i在知识图谱中的关联权重；

步骤C2：从知识图谱的词向量表中获取邻居节点N_j对应的词向量表示v_j；

步骤C3：基于步骤C1中得到的权重占比α_j与步骤C2中得到的词向量表示v_j，计算节点N_j在背景知识编码任务中的知识表示k_j；

其中，计算知识表示k_j的公式为：

k_j＝α_jv_j

步骤C4：重复步骤C1-C3，获得事件e_i所有邻居节点的知识表示集合K＝{k₁,k₂,k₃,…k_n}；

步骤C5：基于事件e_i的邻居节点知识表示集合K对e_i进行背景知识编码，得到e_i的背景知识表示

其中，计算

的公式为：

步骤D：将句子输入预训练语言模型，得到句子中词语的词向量表示，并将其与背景知识表示向量进行融合；

步骤D的具体步骤如下：

步骤D1：将句子输入预训练完成的语言模型中，获取句子中每个词语的词向量表示

其中，下标i表示这是句子中的第i个词语；

步骤D2：将每个词语的词向量表示

与其对应的背景知识表示/>

融合，得到词语的语义信息增强向量表示F_i；

步骤D3：特别地，若当前词语无法表示一个事件，则将其对应的背景知识表示向量

设置为全0向量。

步骤E：将融合后的语义信息增强向量输入下游神经网络模型，为句子中的每个词语分配相应的因果语义角色标签，实现事件因果关系的抽取；

步骤E的具体步骤如下：

步骤E1：对步骤D中得到的句中每个词语对应的语义信息增强向量进行拼接整合，形成整个句子的特征向量矩阵；

步骤E2：将步骤E1中得到的句子特征向量矩阵作为下层双向长短时记忆神经网络模型的输入，获取基于句子上下文特征的语义向量矩阵；

步骤E3：将步骤E2中获得的语义向量矩阵作为下游条件随机场模型的输入，通过条件随机场模型对句子中每个词语可能对应的因果语义角色标签序列进行打分，获得给定输入序列的全局最优标签链；

步骤E4：特别地，我们将因果语义角色标签分为“原因”、“结果”以及“其他”；

步骤E5：为句子中的每个词语选择得分最高的因果语义角色标签，输出句子以及其中每个词语对应的因果语义角色标签，完成事件因果关系抽取任务。

综上所述，本发明通过知识图谱对句子中包含的事件进行背景知识编码，为事件词语添加背景知识表示特征，并结合预训练语言模型得到词语的语义信息增强向量表示。在此基础之上，利用双向长短时记忆神经网络与条件随机场为句子中的词语分配因果语义角色标签，对司法案件文本句子中的事件因果关系进行抽取。有助于在文本中缺少显式因果关联词的情况下，对其中蕴含的隐式事件因果关系进行抽取，快速发现事件之间的因果关联，将复杂的法律文本内容通过事件间的因果关系进行简化表示，为司法行业的相关从业者提供便利。

实施例2

作为本发明的第二方面，本申请还提供一种电子设备，包括：一个或多个处理器11；存储器12，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器11执行，使得所述一个或多个处理器11实现如上述基于事件背景知识的司法案件事件因果关系抽取方法。如图4所示，为本发明实施例提供的事件因果关系抽取方法所在任意具备数据处理能力的设备的一种硬件结构图，除了图3所示的处理器11、存储器12以及接口13之外，实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能，还可以包括其他硬件，对此不再赘述。

实施例3

作为本发明的第三方面，本申请还提供一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现如上述事件因果关系抽取方法。所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元，例如硬盘或内存。所述计算机可读存储介质也可以是外部存储设备，例如所述设备上配备的插接式硬盘、智能存储卡(Smart Media Card，SMC)、SD卡、闪存卡(Flash Card)等。进一步的，所述计算机可读存储介还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据，还可以用于暂时地存储已经输出或者将要输出的数据。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种基于背景知识的事件因果关系抽取方法，其特征在于，具体包括以下步骤：

2.根据权利要求1所述的一种基于背景知识的事件因果关系抽取方法，其特征在于，所述对句子进行预处理，得到其中表示事件的词语，具体步骤包括：

基于专家知识构建面向司法领域的停用词表；

对句子中的词语进行词性分析，得到词性集合POS；

3.根据权利要求1所述的一种基于背景知识的事件因果关系抽取方法，其特征在于，所述对知识图谱中与事件相关联的邻居知识节点进行筛选，保留与事件因果关系抽取任务相关的邻居节点的具体步骤包括：

对于事件词语集合E＝{e₁,e₂,…,e_m}中的事件e_i，在知识图谱中检索与事件e_i相关联的邻居节点；

按照知识图谱中节点间的关联强度保留与事件e_i相关性最高的前n个邻居节点{N₁,N₂,N₃,…N_n}与其对应的关联权重{W₁,W₂,W₃,…W_n}。

4.根据权利要求1所述的一种基于背景知识的事件因果关系抽取方法，其特征在于，所述基于相关邻居节点对事件的背景知识表示进行编码，构建事件的背景知识表示向量的具体步骤包括：

重复上述步骤，获得事件e_i所有邻居节点的知识表示集合K；

5.根据权利要求1所述的一种基于背景知识的事件因果关系抽取方法，其特征在于，所述将句子输入预训练语言模型，得到句子中词语的词向量表示，将词向量表示与背景知识表示向量进行融合的具体步骤包括：

将每个词语的词向量表示

与其对应的背景知识表示/>

融合，得到词语的语义信息增强向量表示F_i。

6.根据权利要求5所述的一种基于背景知识的事件因果关系抽取方法，其特征在于，若当前词语无法表示一个事件，则将其对应的背景知识表示向量

设置为全0向量。

7.根据权利要求1所述的一种基于背景知识的事件因果关系抽取方法，其特征在于，所述将融合后的语义信息增强向量输入下游神经网络模型，为句子中的每个词语分配相应的因果语义角色标签，实现事件因果关系的抽取的具体步骤包括：

8.根据权利要求7所述的一种基于背景知识的事件因果关系抽取方法，其特征在于，所述因果语义角色标签分为原因、结果以及其他。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-8任一项所述的事件因果关系抽取方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的事件因果关系抽取方法的步骤。