CN113360648A

CN113360648A - 基于相关性图学习的案由分类方法及系统

Info

Publication number: CN113360648A
Application number: CN202110621009.4A
Authority: CN
Inventors: 尹义龙; 侯文杰; 袭肖明; 张浩杰; 马明珠; 王子欣; 朱桂萍
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2021-06-03
Filing date: 2021-06-03
Publication date: 2021-09-07

Abstract

本发明公开了基于相关性图学习的案由分类方法及系统，获取待分类的案由；对待分类的案由进行处理，获得待分类案由的特征向量；从每个已知案由分类标签对应的K个聚类中心中，随机抽取N个聚类中心，得到每个已知案由分类标签对应的N个聚类中心；基于M种已知案由分类标签对应的已抽取的M*N个聚类中心，和待分类案由的特征向量，构建构造图；将构造图，输入到训练后的图卷积神经网络中，得到待分类案由的分类结果。本发明提出使用相关性图学习的方法来使用其他案由来辅助完成当前案由的分析分类，更容易加入先验知识，适当考虑了不同案由之间的相似性与差异性，充分模拟了人类的经验系统，提高了案由分析分类的效果。

Description

基于相关性图学习的案由分类方法及系统

技术领域

本发明涉及案由分析分类技术领域，特别是涉及基于相关性图学习的案由分类方法及系统。

背景技术

本部分的陈述仅仅是提到了与本发明相关的背景技术，并不必然构成现有技术。

案由是指法律案件的具体内容或者具体事项，案由分析分类是指对一条案由进行分析，然后准确地得到这条案由所属的类别。如今，我国每年约产生几千万条案件，很多情况下都是靠法务工作者去对案件进行分类的，这样需要耗费巨大的人力和物力，而且分类结果往往会存在一定的误差。为了摆脱使用人工对法律案件进行分类的现状，引入了使用计算机来对法律案件进行分类的方法，使用计算机来对案由进行分类可以大大提高分类的速度和精度。因此，发明一种案由分析分类系统对于提高案由分类的精度和效率具有极为重要的意义。

现有的专利和发表的论文中，大家都是用自然语言处理(NLP)的方法来完成对案由的分析分类，常用的自然语言处理方法有：TextCNN、HBiGRU、HBiLSTM等。自然语言处理的方法得到的模型具有较强的学习能力，而且具有理想的分类效果，大致能够满足现实需求。

我们知道现在发生的每一条案件，很有可能之前也发生过相同或相似的案件，法务专家之所以被称为专家，是因为他们有丰富的经验，当看到一条新的案由时，能够使用自己积累的经验，快速准确地对这条新案由进行分析分类。例如：之前发生过一起盗窃类的案件，当我们再看到相似的案件描述时，我们会不由自主地想到它属于盗窃案；当我们看到一起谋杀案件的描述时，我们考虑到它完全不同于盗窃案，所以我们会排除它属于盗窃案的可能。所以其他案由的描述能够辅助我们进行当前案由的分析分类，但是现有自然语言处理的方法都是对每一条案由单独进行分析分类，并没有考虑不同案由之间的相似性与差异性，没有使用其他案由来辅助完成当前案由的分析分类，没有模拟人类的经验系统，所以分类效果较差。

近年来，大家都是用自然语言处理(NLP)的方法来完成对案由的分析分类，但是现有自然语言处理的方法都是对每一条案由单独进行分析分类，并没有考虑不同案由之间的相似性与差异性，没有使用其他案由来辅助完成当前案由的分析分类，没有模拟人类的经验系统，所以分类效果较差。因此，如何使用其他案由来辅助完成当前案由的分析分类，提高案由分析分类的效果，是目前本领域技术人员需要解决的技术问题。

发明内容

为了解决现有技术的不足，本发明提供了基于相关性图学习的案由分类方法及系统；该发明提出使用相关性图学习的方法来使用其他案由来辅助完成当前案由的分析分类，更容易加入先验知识，适当考虑了不同案由之间的相似性与差异性，充分模拟了人类的经验系统，提高了案由分析分类的效果。

第一方面，本发明提供了基于相关性图学习的案由分类方法；

基于相关性图学习的案由分类方法，包括：

获取待分类的案由；

对待分类的案由进行处理，获得待分类案由的特征向量；

从每个已知案由分类标签对应的K个聚类中心中，随机抽取N个聚类中心，得到每个已知案由分类标签对应的N个聚类中心；基于M种已知案由分类标签对应的已抽取的M*N个聚类中心，和待分类案由的特征向量，构建构造图；其中，K、M和N均为正整数；

将构造图，输入到训练后的图卷积神经网络中，得到待分类案由的分类结果。

第二方面，本发明提供了基于相关性图学习的案由分类系统；

基于相关性图学习的案由分类系统，包括：

获取模块，其被配置为：获取待分类的案由；

特征提取模块，其被配置为：对待分类的案由进行处理，获得待分类案由的特征向量；

构造图构建模块，其被配置为：从每个已知案由分类标签对应的K个聚类中心中，随机抽取N个聚类中心，得到每个已知案由分类标签对应的N个聚类中心；基于M种已知案由分类标签对应的已抽取的M*N个聚类中心，和待分类案由的特征向量，构建构造图；其中，K、M和N均为正整数；

分类模块，其被配置为：将构造图，输入到训练后的图卷积神经网络中，得到待分类案由的分类结果。

第三方面，本发明还提供了一种电子设备，包括：一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序；其中，处理器与存储器连接，上述一个或多个计算机程序被存储在存储器中，当电子设备运行时，该处理器执行该存储器存储的一个或多个计算机程序，以使电子设备执行上述第一方面所述的方法。

第四方面，本发明还提供了一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成第一方面所述的方法。

与现有技术相比，本发明的有益效果是：

本发明提出使用相关性图学习的方法来使用其他案由来辅助完成当前案由的分析分类，更容易加入先验知识，适当考虑了不同案由之间的相似性与差异性，充分模拟了人类的经验系统，提高了案由分析分类的效果。

基于相关性图学习的模型的方法具有以下优点：(1)对于噪声具有较好的鲁棒性。(2)模型参数量，训练速度快。与基于自然语言处理的方法不同，该类模型参数量很少，训练速度快，便于部署并且可以快速实现。(3)从建模的角度来说，该类方法更容易加入先验知识。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明基于相关性图学习的案由分析分类方法流程图；

图2为本发明中对案由进行处理，获得对应的特征向量的说明图；

图3为本发明获取每一类案由的聚类中心的说明图；

图4为本发明使用图网络对案由类别进行预测的说明图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例一

本实施例提供了基于相关性图学习的案由分类方法；

如图1所示，基于相关性图学习的案由分类方法，包括：

S101：获取待分类的案由；

S102：对待分类的案由进行处理，获得待分类案由的特征向量；

S103：从每个已知案由分类标签对应的K个聚类中心中，随机抽取N个聚类中心，得到每个已知案由分类标签对应的N个聚类中心；

基于M种已知案由分类标签对应的已抽取的M*N个聚类中心，和待分类案由的特征向量，构建构造图；其中，K、M和N均为正整数；

S104：将构造图，输入到训练后的图卷积神经网络中，得到待分类案由的分类结果。

在本申请中，N＝K/2。

进一步地，如图2所示，所述S102：对待分类的案由进行处理，获得待分类案由的特征向量；具体包括：

S1021：对待分类的案由去除标点符号；将去除标点符号后的文本进行分词处理；将分词后的结果进行词频统计；将词频统计后的词汇，按照词频从大到小的顺序进行排序；按照排序后的词频，给每个单词分配一个数字ID编码；将所有数字ID编码按照词频排序的顺序进行拼接，得到待分类案由的向量；

S1022：对待分类案由的向量，提取特征向量。

进一步地，对待分类案由的向量，提取特征向量；是通过非线性模型来实现，其中，非线性模型，具体是指：

Y＝β₀+β₁X+β₂X²+β₃X³+μ

X＝{x₁,x₂,x₃,...,x_n}

其中，X代表每一条案由经过数据预处理之后能够得到向量，x₁,x₂,x₃,...,x_n代表向量中不同维度的值，β₀,β₁,β₂,β₃,μ代表模型的参数值，Y代表经过非线性模型之后的输出特征向量。

每一条案由经过数据预处理之后能够得到一条向量，将这些向量放到非线性模型中，得到具有相同维度的输出特征向量；其中用到的非线性模型得到的输出与输入存在不可解释的关系，即输入与输出不能在空间坐标系中直接表示。

进一步地，如图3所示，所述S103：从每个已知案由分类标签对应的K个聚类中心中，随机抽取N个聚类中心，得到每个已知案由分类标签对应的N个聚类中心；其中K个聚类中心，是通过如下步骤获取的：

对每个已知案由分类标签的案由进行处理，得到每个已知案由分类标签的案由特征向量；

将每类已知案由分类标签的所有案由特征向量进行聚类，得到每类已知案由分类标签的K个聚类中心。

其中，对每个已知案由分类标签的案由进行处理，得到每个已知案由分类标签的特征向量；具体处理过程与对待分类的案由进行处理，获得待分类案由的特征向量的具体步骤是一致的，此处不再赘述。

示例性的，聚类采用K-means聚类；每个聚类中心都具有代表性；其中，K-means聚类是一种迭代聚类的方法，首先将所有数据预分成K组，随机取出每一组中的一个样本作为聚类中心，计算每个样本与不同聚类中心的距离，将每个样本划分到与它最近的聚类中心所在的组，然后求每一组的中心，然后使用中心点当作该组的聚类中心，重复执行上述操作，直至每一组的中心点不再发生变化。

示例性的，已知案由分类标签的案由，构造方法为：

获取大量的案由，请专业法务工作者为每条案由打上标签，然后将所有的案由分成训练集和测试集，二者的比例为7：3，并且保证每一份中各类案由的数量平衡；基于训练集和测试集，用于对图卷积神经网络进行训练。

进一步地，所述S103：基于M种已知案由分类标签对应的已抽取的M*N个聚类中心，和待分类案由的特征向量，构建构造图；具体包括：

基于M种已知案由分类标签对应的已抽取的M*N个聚类中心，将M*N个聚类中心中每个聚类中心视为图的节点，将待分类案由的特征向量也视为图的节点，计算节点与节点之间的相似度，将相似度高于设定阈值的两个节点进行连线，所述连线作为两个节点之间的边，得到构造图；

根据构造图，得到构造图的特征矩阵和邻接矩阵。

其中，构造图的特征矩阵，是指：已知一个图由许多点以及连接点的边构成。每个点都有一个特征向量来表示这个点的特征，假设一共有M个节点，每个节点的特征向量维度为N，则构造图的特征矩阵的大小是M*N，每一行代表一个节点的特征向量。

其中，构造图的邻接矩阵，是指：如果两个节点的相似度大于阈值，则认为两个节点有边，且边的值是相似度值；如果两个节点的相似度小于阈值，则认为这两个节点没有边，且边的值为0。假设一共有M个节点，则构造图的邻接矩阵的大小是M*M，邻接矩阵中第(i，j)个元素代表第i个节点和第j个节点的边值。

图的邻接矩阵的获得方法具体为：

A_ij＝sin(X_i,X_j)＝sin((x_i1,x_i2,x_i3...x_in),(x_j1,x_j2,x_j3...x_jn))

其中，A_ij代表邻接矩阵中第i行、第j列和第j行、第i列的元素值，即图中第i个节点和第j个节点之间的相似性；X_i,X_j分别代表图中第i个节点和第j个节点的特征向量；x_in代表第i个节点的第n个维度的值；Sin表示求两个向量的余弦相似度。

进一步地，如图4所示，所述S104：将构造图，输入到训练后的图卷积神经网络中，得到待分类案由的分类结果；具体包括：

S1041：将构造图的特征矩阵和邻接矩阵，输入到训练后的图卷积神经网络中，图卷积神经网络包括两层相互连接的图卷积层，其中，第一图卷积层对构造图的特征矩阵和邻接矩阵进行处理，得到更新后的特征矩阵；

S1042：第二图卷积层对邻接矩阵和更新后的特征矩阵进行处理，得到待分类案由节点的预测类别。

其中，训练后的图卷积神经网络的训练过程包括：

构建训练集，其中，训练集包括已知案由分类标签的案由；

对训练集的案由进行特征提取；对训练集的特征向量处理得到构造图的特征矩阵和邻接矩阵；

将训练集的构造图的特征矩阵和邻接矩阵，输入到图卷积神经网络中，对网络进行训练，得到训练后的图卷积神经网络。

示例性的，所述S104：将构造图，输入到图卷积神经网络中，得到待分类案由的分类结果；具体包括：

假设一共有N类案由，则一共随机取出N*(K/2)个聚类中心，图中的节点数是1+N*(K/2)；假设目标案由的特征向量和聚类中心的维度都是M0，使用两层的图卷积神经网络，第一层的参数矩阵是W1(M0，M1),第二层的参数矩阵是W2(M1，1)。

经过第一层图卷积神经网络后，每个节点的维度变成M1

X’＝A*X*W1

经过第二层图卷积神经网络后，每个节点的维度变成1，即每个节点的类别X”＝A*X’*W2

其中，X表示图中所有节点的初始特征矩阵；

X’表示图中所有节点的经过第一个卷积层之后特征矩阵；

X”表示图中所有节点的经过第二个卷积层之后特征矩阵；

A表示图中的边矩阵(即邻接矩阵)；

W1表示图网络的第一层的参数矩阵；

W2表示图网络的第二层的参数矩阵。

本发明获取大量的案由，构造案由数据集；对训练集中的案由进行处理，分别获得对应的特征向量；将每一类案由中的所有案由的特征向量进行K-means聚类，每一类案由都可以得到K个不同的聚类中心，并且每个聚类中心都足够具有代表性；对要预测的案由进行处理，获得其对应的特征向量；随机取出每类的聚类中心，与要预测案由的特征向量构成图；使用图卷积神经网络完成对要预测案由的分类。本发明提出使用相关性图学习的方法来使用其他案由来辅助完成当前案由的分析分类，更容易加入先验知识，适当考虑了不同案由之间的相似性与差异性，充分模拟了人类的经验系统，提高了案由分析分类的效果。

实施例二

本实施例提供了基于相关性图学习的案由分类系统；

基于相关性图学习的案由分类系统，包括：

获取模块，其被配置为：获取待分类的案由；

此处需要说明的是，上述获取模块、特征提取模块、构造图构建模块和分类模块对应于实施例一中的步骤S101至S104，上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

上述实施例中对各个实施例的描述各有侧重，某个实施例中没有详述的部分可以参见其他实施例的相关描述。

所提出的系统，可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的，例如上述模块的划分，仅仅为一种逻辑功能划分，实际实现时，可以有另外的划分方式，例如多个模块可以结合或者可以集成到另外一个系统，或一些特征可以忽略，或不执行。

实施例三

本实施例还提供了一种电子设备，包括：一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序；其中，处理器与存储器连接，上述一个或多个计算机程序被存储在存储器中，当电子设备运行时，该处理器执行该存储器存储的一个或多个计算机程序，以使电子设备执行上述实施例一所述的方法。

应理解，本实施例中，处理器可以是中央处理单元CPU，处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC，现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如，存储器还可以存储设备类型的信息。

在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。

实施例一中的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本领域普通技术人员可以意识到，结合本实施例描述的各示例的单元及算法步骤，能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

实施例四

本实施例还提供了一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例一所述的方法。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于相关性图学习的案由分类方法，其特征是，包括：

获取待分类的案由；

对待分类的案由进行处理，获得待分类案由的特征向量；

2.如权利要求1所述的基于相关性图学习的案由分类方法，其特征是，对待分类的案由进行处理，获得待分类案由的特征向量；具体包括：

对待分类的案由去除标点符号；将去除标点符号后的文本进行分词处理；将分词后的结果进行词频统计；将词频统计后的词汇，按照词频从大到小的顺序进行排序；按照排序后的词频，给每个单词分配一个数字ID编码；将所有数字ID编码按照词频排序的顺序进行拼接，得到待分类案由的向量；

对待分类案由的向量，提取特征向量。

3.如权利要求1所述的基于相关性图学习的案由分类方法，其特征是，从每个已知案由分类标签对应的K个聚类中心中，随机抽取N个聚类中心，得到每个已知案由分类标签对应的N个聚类中心；其中K个聚类中心，是通过如下步骤获取的：

4.如权利要求3所述的基于相关性图学习的案由分类方法，其特征是，聚类采用K-means聚类；每个聚类中心都具有代表性；其中，K-means聚类是一种迭代聚类的方法，首先将所有数据预分成K组，随机取出每一组中的一个样本作为聚类中心，计算每个样本与不同聚类中心的距离，将每个样本划分到与它最近的聚类中心所在的组，然后求每一组的中心，然后使用中心点当作该组的聚类中心，重复执行上述操作，直至每一组的中心点不再发生变化。

5.如权利要求1所述的基于相关性图学习的案由分类方法，其特征是，基于M种已知案由分类标签对应的已抽取的M*N个聚类中心，和待分类案由的特征向量，构建构造图；具体包括：

根据构造图，得到构造图的特征矩阵和邻接矩阵。

6.如权利要求5所述的基于相关性图学习的案由分类方法，其特征是，

构造图的特征矩阵，是指：已知一个图由许多点以及连接点的边构成；每个点都有一个特征向量来表示这个点的特征，假设一共有M个节点，每个节点的特征向量维度为N，则构造图的特征矩阵的大小是M*N，每一行代表一个节点的特征向量；

构造图的邻接矩阵，是指：如果两个节点的相似度大于阈值，则认为两个节点有边，且边的值是相似度值；如果两个节点的相似度小于阈值，则认为这两个节点没有边，且边的值为0；假设一共有M个节点，则构造图的邻接矩阵的大小是N*N，邻接矩阵中第(i，j)个元素代表第i个节点和第j个节点的边值。

7.如权利要求1所述的基于相关性图学习的案由分类方法，其特征是，

将构造图，输入到训练后的图卷积神经网络中，得到待分类案由的分类结果；具体包括：

将构造图的特征矩阵和邻接矩阵，输入到训练后的图卷积神经网络中，图卷积神经网络包括两层相互连接的图卷积层，其中，第一图卷积层对构造图的特征矩阵和邻接矩阵进行处理，得到更新后的特征矩阵；

第二图卷积层对邻接矩阵和更新后的特征矩阵进行处理，得到待分类案由节点的预测类别。

8.基于相关性图学习的案由分类系统，其特征是，包括：

获取模块，其被配置为：获取待分类的案由；

9.一种电子设备，其特征是，包括：一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序；其中，处理器与存储器连接，上述一个或多个计算机程序被存储在存储器中，当电子设备运行时，该处理器执行该存储器存储的一个或多个计算机程序，以使电子设备执行上述权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征是，用于存储计算机指令，所述计算机指令被处理器执行时，完成权利要求1-7任一项所述的方法。