CN111815485A

CN111815485A - 一种基于深度学习bert模型的量刑预测方法和装置

Info

Publication number: CN111815485A
Application number: CN202010535575.9A
Authority: CN
Inventors: 霍天翔; 胡振; 程慧芳; 于婧悦; 隋娟; 刘小龙; 段广宇
Original assignee: China Judicial Big Data Research Institute Co ltd
Current assignee: China Judicial Big Data Research Institute Co ltd
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2020-10-23

Abstract

本发明涉及一种基于深度学习BERT模型的量刑预测方法和装置。该方法包括：从裁判文书中抽取出审判的省份、犯罪事实文本及数值；将抽取出的犯罪事实文本和数值转化为向量；其中犯罪事实文本利用BERT模型转化为向量；利用犯罪事实文本的向量，以真实的审判罪名为标签，训练罪名分类模型；利用犯罪事实文本的向量及数值的向量，以实际的刑期为标签，训练初步的刑期预测模型；根据省份和由罪名分类模型得到的罪名，对初步的刑期预测模型进行微调，得到不同省份和罪名的多个刑期预测模型；然后基于罪名分类模型和刑期预测模型进行刑期预测。本发明能够通过案件情节要素自动给出预测的刑期，并在此基础上给出实际判决的偏离度预测结果。

Description

一种基于深度学习BERT模型的量刑预测方法和装置

技术领域

本发明涉及一种自动根据犯罪事实计算刑期的方法，具体涉及一种基于深度学习BERT模型的量刑预测及量刑偏离度评价方法和装置，属于人工智能领域。

背景技术

现有的司法实践中，刑事裁决及量刑主要是通过对案件中的情节要素进行梳理，根据法官经验，参考量刑标准及大量的相似判例，对案件进行定罪量刑。对于量刑的偏离度评价则需要参考更多的相似判例中的量刑情况，需要大量的人力进行评估，效率极低，且由于人带有一定的主观性，无法给出准确的偏离数值。

在司法大数据建设的背景下，目前的审判案例数目已经有了一定量的积累，且23类常见罪名的判例更加丰富，这23类常见罪名为：1交通肇事罪、2故意伤害罪、3强奸罪、4非法拘禁罪、5抢劫罪、6盗窃罪、7诈骗罪、8抢夺罪、9职务侵占罪、10敲诈勒索罪、11妨害公务罪、12聚众斗殴、13寻衅滋事罪、14掩饰隐瞒犯罪所得、犯罪所得收益罪、15走私、贩卖、运输、制造毒品罪、16危险驾驶罪、17非法吸收公众存款罪、18集资诈骗罪、19信用卡诈骗罪、20合同诈骗罪、21非法持有毒品罪、22容留他人吸毒罪、23引诱、容留、介绍卖淫罪。深度学习模型可以有效地利用历史案件数据进行模型训练，海量的数据可以保障模型在各种情况下的鲁棒性和适应性。目前已有通过卷积神经网络和循环神经网络提取文本特征，用于罪名、法条、刑期及罚金的预测。基于大量的判例事实，这些模型已经有了一定的准确性，但仍存在可以提升的空间。

发明内容

本发明的主要目的在于提供一种针对常见罪名犯罪的量刑预测方案，能够通过案件情节要素自动给出预测的刑期，并在此基础上给出实际判决的偏离度预测方案。

本发明采用的技术方案如下：

一种基于深度学习BERT模型的量刑预测模型构建方法，包括以下步骤：

从裁判文书中抽取出审判的省份、犯罪事实文本及数值；

将抽取出的犯罪事实文本和数值转化为向量；其中犯罪事实文本利用BERT模型转化为向量；

利用犯罪事实文本的向量，以真实的审判罪名为标签，训练罪名分类模型；

利用犯罪事实文本的向量及数值的向量，以实际的刑期为标签，训练初步的刑期预测模型；

根据省份和由罪名分类模型得到的罪名，对初步的刑期预测模型进行微调，得到不同省份和罪名的多个刑期预测模型。

进一步地，所述犯罪事实文本包括公诉机关认为和本院认为两部分文本内容，通过BERT模型将两部分文本内容分别转换为句向量；所述数值包括金钱数额、毒品质量及酒精浓度；所述数值采用以下方式之一转化为向量：

方式1：将各数值精确到小数点后两位，之后从最低位向最高位进行遍历，依次将各位上的值填入16维的向量中，不足补零；

方式2：根据量刑指导意见中的数值进行阶段划分，并将各数值替换为对应的阶段。

进一步地，所述初步的刑期预测模型的损失函数定义为：

其中，_i为神经网络的输出向量，i＝0,1,2,…n，n＝302，i＝0表示无罪，i＝301表示无期、i＝302表示死刑；

p(y_i)表示刑期为i个月的概率；q(i)＝f(|T-i|)，T为实际的刑期，q(i)为T-i的绝对值的函数，是在非负区间单调递增的任意函数。

一种基于深度学习BERT模型的量刑预测模型构建装置，其包括：

文书抽取单元，用于从裁判文书中抽取出审判的省份、犯罪事实文本及数值；

转化向量单元，用于将抽取出的犯罪事实文本和数值转化为向量；其中犯罪事实文本利用BERT模型转化为向量；

罪名分类模型训练单元，用于利用犯罪事实文本的向量，以真实的审判罪名为标签，训练罪名分类模型；

刑期预测模型训练单元，用于利用犯罪事实文本的向量及数值的向量，以实际的刑期为标签，训练初步的刑期预测模型；然后根据省份和由罪名分类模型得到的罪名，对初步的刑期预测模型进行微调，得到不同省份和罪名的多个刑期预测模型。

一种基于深度学习BERT模型的量刑预测方法，基于本发明方法得到的罪名分类模型和刑期预测模型进行刑期预测，包括以下步骤：

从待预测的犯罪事实中抽取出犯罪事实文本及数值，并转化为向量；

将犯罪事实文本的向量输入罪名分类模型，得到预测的罪名；

根据罪名和省份选择刑期预测模型，将犯罪事实文本及数值的向量输入选择的刑期预测模型，得到预测的刑期。

进一步地，还包括偏离度评价步骤，该步骤将预测的刑期与法官判决刑期进行对比以得到偏离度，所述偏离度的计算公式如下：

其中bias为偏离度，T_m为预测的刑期，T_l为法官判断的刑期，x是根据罪名及案情的不同法官所拥有的自由裁量权的月数。

一种基于深度学习BERT模型的量刑预测装置，基于本发明方法得到的罪名分类模型和刑期预测模型进行刑期预测，包括以下单元：

抽取单元，用于从待预测的犯罪事实中抽取出犯罪事实文本及数值；

转化向量单元，用于将抽取的犯罪事实文本及数值转化为向量；其中犯罪事实文本利用BERT模型转化为向量；

罪名预测单元，用于将犯罪事实文本的向量输入罪名分类模型，得到预测的罪名；

刑期预测单元，用于根据罪名和省份选择刑期预测模型，将犯罪事实文本及数值的向量输入选择的刑期预测模型，得到预测的刑期。

进一步地，还包括偏离度评价单元，用于将预测的刑期与法官判决刑期进行对比以得到偏离度，所述偏离度的计算公式如下：

本发明的有益效果如下：

1)本发明能够通过案件情节要素自动给出预测的刑期(如23种常见罪名犯罪的预测的刑期)，并在此基础上给出实际判决的偏离度预测结果。

2)法官能够通过本发明对某一案件给出的预测刑期作为参考，进行常见案件的判决。

3)采用本发明能够替代人工进行大量文书的翻阅，从而减轻法官负担。

附图说明

图1是本发明方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

本发明的一个实施例提供一种基于深度学习BERT模型的量刑预测方法，具体步骤如下：

步骤(1)：收集大量法律领域内文本，进行BERT模型的预训练。

收集大量法律领域内文本，训练得到适应法律文本的BERT(BidirectionalEncoder Representation from Transformers)语言模型。BERT模型是通过多层注意力机制堆叠而成的深度神经网络，对文本特征提取在多项任务上已经超越了其他的网络的性能。训练完成后，该模型可以将文本转化为向量。

步骤(2)：由于裁判文书格式规整，可以使用规则匹配和简单模型抽取的方式从裁判文书中提取出如下内容：

a)审判省份；

b)公诉机关认为和本院认为两部分文本内容；

c)涉及财产、赔偿等案件中的金额、涉及毒品案件中的质量及交通肇事危险驾驶案件中的酒精等数值、数额。之后将数值进行换算，金额换算为人民币元作为单位，毒品质量按毒品种类换算为海洛因并以克作为单位，血液中的酒精含量以毫克/100毫升作为单位。

步骤(3)：对步骤(2)中的金钱数额、毒品质量及酒精浓度进行转换，变成一个16维的向量，具体方法为将各数值精确到小数点后两位，之后从最低位向最高位进行遍历，依次将各位上的值填入向量中，不足补零。

步骤(4)：通过BERT模型将公诉机关认为和本院认为两部分内容分别转换为句向量，初始化一个神经网络，将句向量作为该神经网络的输入，以真实的审判罪名作为标签，训练出一个罪名预测的模型。以下称为罪名分类模型。其中神经网络可以是卷积神经网络、全连接神经网络等。

步骤(5)：初始化一个神经网络，通过BERT模型将公诉机关认为和本院认为两部分内容分别转换为句向量，同金钱数额、毒品质量及酒精浓度通过步骤(3)转换得到的三个向量一起作为输入，输入神经网络，将实际的刑期作为标签，损失函数使用Loss＝∑_ip(y_i)q(i)训练网络模型，q(i)使用系数为正的一次函数。其中神经网络可以是卷积神经网络、全连接神经网络等。

上述损失函数定义为：

其中[y₀、y₁、y₂…y_i…y_n](其中n＝302)为神经网络的输出向量，上式中

表示刑期为i个月的概率，其中i＝0表示无罪，i＝301表示无期、i＝302表示死刑。T为实际的刑期，则q(i)＝f(|T-i|)，q(i)为T-i的绝对值的函数，这个函数可以是在非负区间单调递增的任何函数，在实际调参过程中为了网络效率采用了一次函数、二次函数和指数函数。该损失函数的目的主要是增加了整个网络在预测的刑期与实际刑期相差较大时反向传播的梯度，通过该损失函数向神经网络传递一般分类问题中并不存在的类与类之间的间距信息。

步骤(6)：将文书根据省份和罪名分开，对步骤(5)得到的模型进行进一步的微调，得到不同省份和罪名的刑期预测模型。

步骤(7)：在进行量刑预测和评价偏离度时，将待预测的犯罪事实部分输入步骤(4)中的罪名分类模型，得到预测罪名，之后根据罪名和省份选择步骤(6)中微调后的刑期预测模型，将犯罪事实和通过步骤(3)中的方法得到的3个向量一起输入微调后的刑期预测模型，得到预测的刑期。之后和法官判定的刑期对比，得到偏离度。偏离度计算公式如下：

其中bias为偏离度，T_m为模型判断的刑期，T_l为法官判断的刑期，x是根据罪名及案情的不同法官所拥有的自由裁量权的月数。因为不同的法官判案习惯风格都不相同，对实际数据进行查看后相似案情上刑期差别在1-6个月的数据量不少，模型和法律专业人员都无法区分其中的差别，因此过于严格的评价没有意义，在实际使用中，一般取x为3个月。

本发明的另一个实施例具体步骤为：

步骤(1)：收集大量法律领域内文本，进行BERT模型的预训练。

a)审判省份；

b)公诉机关认为和本院认为两部分文本内容；

步骤(3)：将金钱数额、毒品质量及酒精浓度根据量刑指导意见中的数值进行阶段划分并替换为对应的阶段，例如酒精浓度可以划分为0-20mg/100ml，20-80mg/100ml，80-200mg/100ml，200mg/100ml以上这4个阶段，并替换原文中的数值。

步骤(5)：初始化一个神经网络，通过BERT模型将公诉机关认为和本院认为两部分内容分别转换为句向量，输入神经网络，将实际的刑期作为标签，损失函数使用Loss＝∑_ip(y_i)q(i)训练网络模型，q(i)使用系数为正的一次函数。其中神经网络可以是卷积神经网络、全连接神经网络等。

步骤(7)：在进行量刑预测和评价偏离度时，将待预测的犯罪事实部分输入步骤(4)中的罪名分类模型，得到预测罪名。之后和法官判定的刑期对比，得到偏离度。偏离度计算方法同前。

本发明的另一个实施例提供一种基于深度学习BERT模型的量刑预测模型构建装置，其包括：

文书抽取单元，用于从裁判文书中抽取出审判的省份、犯罪事实文本及数值(金额、重量及浓度等)；

本发明的另一个实施例提供一种基于深度学习BERT模型的量刑预测装置，其基于本发明方法得到的罪名分类模型和刑期预测模型进行刑期预测，包括以下单元：

该基于深度学习BERT模型的量刑预测装置还包括偏离度评价单元，用于将预测的刑期与法官判决刑期进行对比以得到偏离度，对法官判决进行评价。

本发明的另一个实施例提供一种电子装置(计算机、服务器、智能手机等)，其包括存储器和处理器，所述存储器存储计算机程序，所述计算机程序被配置为由所述处理器执行，所述计算机程序包括用于执行本发明方法中各步骤的指令。

本发明的另一个实施例提供一种计算机可读存储介质(如ROM/RAM、磁盘、光盘)，所述计算机可读存储介质存储计算机程序，所述计算机程序被计算机执行时，实现本发明方法的各个步骤。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于深度学习BERT模型的量刑预测模型构建方法，其特征在于，包括以下步骤：

从裁判文书中抽取出审判的省份、犯罪事实文本及数值；

2.根据权利要求1所述的方法，其特征在于，所述犯罪事实文本包括公诉机关认为和本院认为两部分文本内容，通过BERT模型将两部分文本内容分别转换为句向量；所述数值包括金钱数额、毒品质量及酒精浓度；所述数值采用以下方式之一转化为向量：

3.根据权利要求1所述的方法，其特征在于，所述初步的刑期预测模型的损失函数定义为：

4.一种基于深度学习BERT模型的量刑预测模型构建装置，其特征在于，包括：

5.一种基于深度学习BERT模型的量刑预测方法，其特征在于，基于权利要求1～3中任一权利要求所述方法得到的罪名分类模型和刑期预测模型进行刑期预测，包括以下步骤：

6.根据权利要求5所述的方法，其特征在于，其特征在于，还包括偏离度评价步骤，该步骤将预测的刑期与法官判决刑期进行对比以得到偏离度，所述偏离度的计算公式如下：

7.一种基于深度学习BERT模型的量刑预测装置，其特征在于，基于权利要求1～3中任一权利要求所述方法得到的罪名分类模型和刑期预测模型进行刑期预测，包括以下单元：

8.根据权利要求7所述的装置，其特征在于，还包括偏离度评价单元，用于将预测的刑期与法官判决刑期进行对比以得到偏离度，所述偏离度的计算公式如下：

9.一种电子装置，其特征在于，包括存储器和处理器，所述存储器存储计算机程序，所述计算机程序被配置为由所述处理器执行，所述计算机程序包括用于执行权利要求1～3、5～6中任一权利要求所述方法的指令，或者包括。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储计算机程序，所述计算机程序被计算机执行时，实现权利要求1～3、5～6中任一权利要求所述的方法。