CN112508269A

CN112508269A - 法律判决预测方法及系统

Info

Publication number: CN112508269A
Application number: CN202011405120.1A
Authority: CN
Inventors: 刘淇; 陈恩红; 岳立楠; 金斌斌; 武晗; 张凯
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2021-03-16

Abstract

本发明公开了一种法律判决预测方法及系统，根据案件事实描述及其相关法条、罪名和刑期数据，按照子任务之间的拓扑关系，依次的从案件事实中分离犯罪情节，即定罪情节和量刑情节，然后建模不同的犯罪情节与相应的子任务之间的关系，从而模拟人类法官的判案过程，相比于现有技术而言，极大地提高了预测结果的准确性。

Description

法律判决预测方法及系统

技术领域

本发明涉及机器学习和基于法律文本分析的智慧司法领域，尤其涉及一种法律判决预测方法。

背景技术

法律判决预测旨在基于案件事实描述，自动预测判决结果，包括相关罪名，法条和刑期等。它是建设智慧法院系统的基础技术，深入研究该技术，不仅能够提升法律从业者的工作效率，而且可以为缺乏法律知识的人群提供快速优质的法律指导及援助。

目前，法律判决预测主要涉及三个子任务：即相关罪名，法条和刑期的预测。针对以上三个任务的预测方法主要有以下两种：

1)基于单个任务的判决预测：

目前，基于单个任务的判决预测方法，主要着重建模案件事实描述和法律知识之间的关系，将罪名属性，法条语义等相关法律知识与案件事实描述相结合，分别预测三个子任务的结果，这种方法通过学习大量标注数据，可以在单个任务上取得不错的效果，但是这种方法忽略子任务之间的拓扑关系，即法官在处理案件的时候，通常是先确定相关法条和罪名，最后在法条和罪名的基础上，确定刑期。

2)基于多个任务的联合预测：

在考虑到子任务之间的拓扑关系之后，有学者提出利用这种关系，采用多任务学习模型对这三个子任务进行联合建模，该类技术主要可以分为以下两类模型：基于拓扑关系的和基于任务之间验证关系的多任务学习模型。基于拓扑关系的多任务学习模型主要是利用法官在处理案件时的决定罪名，法条和刑期的顺序来建模子任务之间的关系。基于任务之间验证关系的多任务学习模型主要是考虑到后续任务同样会对先前的任务造成影响，因此通过建模这种验证关系可以进一步优化多任务学习模型。

然而，上述方法在建模判决预测的过程中，主要挖掘的是整个案件事实描述对所有任务的影响，但是，实际的判决过程是十分复杂且细粒度的，法官是根据案件事实中不同的犯罪情节来决定不同的裁决和量刑，具体来讲，在这个细粒度的判决过程中，法官会首先根据定罪情节确定相关的法条和罪名，之后根据法定量刑情节和酌定量刑情节来确定相关的刑期。因此，采用现有的判决预测方法，难以精准地捕捉不同的犯罪情节从而预测相应的子任务。

发明内容

本发明的目的是提供一种法律判决预测方法及系统，通过从案件事实中分离定罪和量刑情节，然后根据这些情节来预测相应的任务，来提高预测结果的准确性。

本发明的目的是通过以下技术方案实现的：

一种法律判决预测方法，包括：

获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集；

提取案件事实描述的表征向量，并以此预测相关罪名；

通过预测的罪名从数据集中提取罪名对应的文本描述，并从文本描述中提取罪名表征向量，再结合案件事实描述的表征向量进行定罪情节的分离，获得定罪情节向量和量刑情节向量；

通过定罪情节向量预测相关的法条，并从数据集中提取法条对应的文本描述，进而提取法条表征向量；

结合法条表征向量与量刑情节向量进行量刑情节的分离，获得法定量刑情节向量和酌定量刑情节向量，从而预测相应的刑期，最终结合数据集中的刑期区间集合确定刑期区间。

由上述本发明提供的技术方案可以看出，根据案件事实描述及其相关法条、罪名和刑期数据，按照子任务之间的拓扑关系，依次的从案件事实中分离犯罪情节，即定罪情节和量刑情节，然后建模不同的犯罪情节与相应的子任务之间的关系，从而模拟人类法官的判案过程，相比于现有技术而言，极大地提高了预测结果的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种法律判决预测方法的流程图；

图2为本发明实施例提供的一种法律判决预测系统的示意图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。

本发明实施例提供一种法律判决预测方法，如图1所示，其主要包括如下步骤：

步骤1、获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集。

本发明实施例中，所述案件事实描述为文本信息，其表示为

其中每一元素表示一个词，l_d为词数目。

罪名集合表示为Y_c＝{c₁，...，c_n}，其中的任一罪名c_i的文本描述为

文本描述中的每一元素表示一个词，l_c为词数目，i＝1,…,n。

法条集合表示为Y_a＝{a₁，...，a_m}，其中的任一法条a_j的文本描述为

文本描述中的每一元素表示一个词，l_a为词数目，j＝1,…,m。

刑期区间集合表示为Y_t＝{t₁，...，t_k}，其中每一元素表示一个刑期区间。

如表1所示，提供了数据集的中的数据信息及相关的符号表示。

表1数据信息及相关的符号表示

上述数据信息可以通过从中国裁判文书网上获取。

本发明实施例的目的是利用步骤1所获得的相关数据，学习一个分类器ξ，来预测可能的罪名，法条和刑期，即

步骤2、提取案件事实描述的表征向量，并以此预测相关罪名。

本发明实施例中，使用双向门控循环单元将案件事实描述转换为低维的语义表征。

首先，将案件事实描述

中的每一个词分别映射到一个低维稠密的向量空间，得到对应的词嵌入序列

案件事实描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量。

之后，将词嵌入序列输入到双向门控循环单元中，得到案件事实描述的表征向量H^d：

H^d＝Bi-GRU(E^d)

其中，Bi-GRU表示双向门控循环单元，

为双向门控循环单元隐藏层向量，其中的每一元素表示一个表征向量，d_s表示双向门控循环单元的隐层维度。

之后，对案件事实描述的表征向量H^d进行平均池化，得到最终的表示向量

其中，l_d为案件事实描述中的词数目。

最后，利用一个基于softmax的仿射变换来预测最相关的罪名

其中，

表示所有罪名的概率分布，c_i表示任一罪名，n为罪名总数；W_c与b_c为基于softmax的仿射变换中的权重与偏置参数。

步骤3、通过预测的罪名从数据集中提取罪名对应的文本描述，并从文本描述中提取罪名表征向量，再结合案件事实描述的表征向量进行定罪情节的分离，获得定罪情节向量和量刑情节向量。

根据步骤2预测得到的罪名

在罪名集中进行查询，得到的罪名

的文本描述，

将其中每一个词分别映射到一个低维稠密的向量空间，得到对应的词嵌入序列

文本描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量。

之后，将词嵌入序列输入到双向门控循环单元中，得到罪名表征向量

法官在处理案件的时候，往往是根据案件事实中的定罪情节来确定法条，根据量刑情节来确定刑期，其中，定罪情节是案件事实中符合某个罪名定义的事实部分，换言之，定罪情节为案件事实描述与某个罪名定义之间的相似的文本描述，而不相似的文本描述则为量刑情节。

本发明实施例中，设计了一个犯罪情节分离模块，对于罪名表征向量与案件事实描述的表征向量，通过定罪情节的分离，得到定罪情节向量和量刑情节向量，步骤包括：

计算案件事实描述的表征向量H^d和罪名表征向量

之间的相关性矩阵D：

其中，

是一个可学习的参数。

之后，利用注意力机制算法得到包含罪名表征向量的事实表示向量

其中，softmax(.)为逻辑回归函数。

最后，对案件事实描述的表征向量H^d和事实表示向量

应用向量拒识操作，得到两个向量之间相似的部分

与不相似的部分

上述式子中，H^d被分解为平行向量

和垂直向量

可以被看作案件事实和罪名定义之间相似的部分，即定罪情节向量，

可以被看作案件事实和罪名定义之间不相似的部分，即量刑情节向量。

步骤4、通过定罪情节向量预测相关的法条，并从数据集中提取法条对应的文本描述，进而提取法条表征向量。

本发明实施例中，对定罪情节向量

进行平均池化，得到最终的表示向量f⁺：

其中，l_d为案件事实描述中的词数目；

利用一个基于softmax的仿射变换来预测最相关的法条

其中，

表示所有法条的概率分布，a_j表示任一法条；W_a与b_a为基于softmax的仿射变换中的权重与偏置参数。

根据预测到的法条

在法条集中进行查询，得到的法条定义的文本描述

将其中的每一个词分别映射到一个低维稠密的向量空间，得到对应的词嵌入序列

之后，将词嵌入序列输入到双向门控循环单元中，得到法条表征向量

本发明实施例上述方案中，双向门控循环单元针对案件事实描述、罪名文本描述、法条文本描述的处理原理是相同的。

步骤5、结合法条表征向量与量刑情节向量进行量刑情节的分离，获得法定量刑情节向量和酌定量刑情节向量，从而预测相应的刑期。

法官在处理案件的时候，是根据量刑情节来确定刑期的，量刑情节又分为法定量刑情节和酌定量刑情节，其中，法定量刑情节是案件事实中符合某个法条量刑定义的事实部分，换言之，法定量刑情节为案件事实描述与某个法条量刑定义之间的相似的文本描述，而不相似的文本描述则为酌定量刑情节；对于法条表征向量与量刑情节向量，通过量刑情节的分离，得到法定量刑情节向量和酌定量刑情节向量，从而预测相应的刑期，步骤包括：

计算法条表征向量

与量刑情节向量

之间的相关性矩阵：

其中，

是一个可学习的参数。

之后，利用注意力机制算法得到包含法条表征向量的事实表示向量F：

对量刑情节向量

和事实表示向量F应用向量拒识操作，得到两个向量之间相似部分

与不相似的部分

上述式子中，量刑情节向量

被分解为平行向量

和垂直向量

可以被看作定罪情节和法条定义之间相似的部分，即法定量刑情节向量，

可以被看作定罪情节和法条定义之间不相似的部分，即酌定量刑情节向量。

对于法定量刑情节向量

酌定量刑情节向量

各自进行平均池化，得到各自的最终表示向量

最后，利用一个基于softmax的仿射变换来预测最相关刑期：

其中，W_t与b_t为基于softmax的仿射变换中的权重与偏置参数。

根据预测到的刑期在刑期区间集合中进行查询，得到对应的刑期区间

本领域技术人员可以理解，前文所涉及的三个基于softmax的仿射变换原理是相同的，区别在于其内部的权重与偏置参数能需要根据情况做适应性的调整，具体的调整方式可参照现有技术实现。

本发明实施例上述方案，根据案件事实描述及其相关法条、罪名和刑期数据，按照子任务之间的拓扑关系，依次的从案件事实中分离犯罪情节，即定罪情节和量刑情节，然后建模不同的犯罪情节与相应的子任务之间的关系，从而模拟人类法官的判案过程，相比于现有技术而言，极大地提高了预测结果的准确性。在实际应用中，上述方案可以为缺乏法律知识的人群提供快速优质的法律指导及援助；可以提升法律从业者的工作效率；还可以基于上述方案的原理对初入法律行业的用户进行培训工作，或者基于上述方案的结果对用户的能力进行考核等。

本发明另一实施例还提供一种法律判决预测系统，该系统主要用于实现前述的方法，如图2所示，该系统主要包括：

数据获取模块，用于获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集；

编码器，用于提取案件事实描述的表征向量；

定罪情节分离模块，用于根据事实描述的表征向量预测相关罪名，通过预测的罪名从数据集中提取罪名对应的文本描述，并从文本描述中提取罪名表征向量，再结合案件事实描述的表征向量进行定罪情节的分离，获得定罪情节向量和量刑情节向量；

量刑情节分离模块，通过定罪情节向量预测相关的法条，并从数据集中提取法条对应的文本描述，进而提取法条表征向量；结合法条表征向量与量刑情节向量进行量刑情节的分离，获得法定量刑情节向量和酌定量刑情节向量；

刑期预测模块，用于根据法定量刑情节向量和酌定量刑情节向量，预测相应的刑期，最终结合数据集中的刑期区间集合确定刑期区间。

该系统各个模块的具体实现方式在前面的方法实施例中已经做了详细的介绍，故不再赘述。

在具体的应用中，上述系统可以部署在实体硬件设备中，自动的对指定案件事实描述进行预测。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将系统的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，上述实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。