CN109376963A - 一种基于神经网络的刑事案件罪名法条联合预测方法 - Google Patents

一种基于神经网络的刑事案件罪名法条联合预测方法 Download PDF

Info

Publication number
CN109376963A
CN109376963A CN201811505663.3A CN201811505663A CN109376963A CN 109376963 A CN109376963 A CN 109376963A CN 201811505663 A CN201811505663 A CN 201811505663A CN 109376963 A CN109376963 A CN 109376963A
Authority
CN
China
Prior art keywords
law article
charge
neural network
prediction
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811505663.3A
Other languages
English (en)
Other versions
CN109376963B (zh
Inventor
王世晞
张亮
徐建忠
李娇娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Shiping Information & Technology Co Ltd
Original Assignee
Hangzhou Shiping Information & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Shiping Information & Technology Co Ltd filed Critical Hangzhou Shiping Information & Technology Co Ltd
Priority to CN201811505663.3A priority Critical patent/CN109376963B/zh
Publication of CN109376963A publication Critical patent/CN109376963A/zh
Application granted granted Critical
Publication of CN109376963B publication Critical patent/CN109376963B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Alarm Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于神经网络的刑事案件罪名法条联合预测方法,包括以下步骤:步骤一、构建训练数据集:爬取标准的刑事裁定书,获取案情描述与对应罪名以及相关法条作为训练数据;案情描述对应的罪名为一项或者多项,相关法条也为一项或者多项,将每个罪名和每个法条都映射为一个唯一的整数作为其编码;步骤二、采用多层感知机构建神经网络联合预测模型并通过训练数据集对其进行训练;步骤三、通过训练之后的神经网络联合预测模型对刑事案件罪名进行预测。本发明能够提高预测模型在法条预测以及罪名预测两方面的准确率,进而给司法审判提供可靠的参考,提升司法的自动化和智能化程度。

Description

一种基于神经网络的刑事案件罪名法条联合预测方法
技术领域
本发明涉及司法智能化领域,涉及一种基于神经网络的刑事案件罪名法条联合预测方法。
背景技术
目前,刑事案件的罪名预测一般被看作是一个文本分类问题:案情描述作为待分类文本,而其对应的罪名作为相应的分类标签,然后训练一个SVM或者神经网络模型进行分类。现有的模型大多只能专注于一个任务,比如一个神经网络只进行罪名预测或者只进行法条预测,然而,在现实当中,许多任务实际是可以同时进行的。另外,有些任务的解决能够帮助解决另一个任务:考虑法官在进行定罪时,先对照法条判断嫌疑人触犯了哪些法条,再进行定罪,往往会更加准确。然而现有的罪名预测以及法条预测方法很难考虑到任务间的协同促进。
发明内容
本发明的目的在于针对上述现有技术中的问题,提供一种基于神经网络的刑事案件罪名法条联合预测方法,能够提高模型在法条预测和罪名预测两方面的准确率。
为了实现上述目的,本发明采用的技术方案包括以下步骤:
步骤一、构建训练数据集:爬取标准的刑事裁定书,获取案情描述与对应罪名以及相关法条作为训练数据;案情描述对应的罪名为一项或者多项,相关法条也为一项或者多项,将每个罪名和每个法条都映射为一个唯一的整数作为其编码;
步骤二、采用多层感知机构建神经网络联合预测模型并通过训练数据集对其进行训练;
步骤三、通过训练之后的神经网络联合预测模型对刑事案件罪名进行预测。
优选的,步骤一所述标准的刑事裁定书从中国裁判文书网中进行爬取。
优选的,步骤二所述神经网络联合预测模型的具体构建方法如下:
步骤2-1)对案情描述分词,并映射为词向量,形成词向量序列;
步骤2-2)提取词向量序列的特征,得到案情描述的特征向量q;
步骤2-3)通过两层前馈神经网络得到特征向量q的向量表示g;
步骤2-4)在特征向量q的向量表示g上,每一维使用sigmoid激活函数得到其对应法条的概率,设定预测法条概率的阈值,选择概率大于该阈值的法条作为预测法条;
步骤2-5)将步骤2-2)得到的特征向量q与步骤2-3)得到的向量表示g拼接得到新的特征向量k,新的特征向量k通过两层前馈神经网络和sigmoid激活函数得到相应罪名的概率,设定预测罪名概率的阈值,选择概率大于该阈值的法条作为预测罪名。
所述的步骤2-1)中分词采用清华大学设计的开源工具thulac,映射直接跟随模型训练。
所述的步骤2-2)通过一维卷积神经网络提取词向量序列的特征。
所述的步骤2-4)中设定预测法条概率的阈值为0.5。
所述的步骤2-5)中设定预测罪名概率的阈值为0.5。
与现有技术相比,本发明具有如下的有益效果:采用向量拼接的方式提供了一套端到端的罪名与法条联合预测框架,爬取标准的刑事裁定书构建训练数据集,案情描述对应的罪名可以为一项或者多项,相关法条也可以为一项或者多项,采用多层感知机构建神经网络联合预测模型并通过训练数据集对其进行训练,该方法能够提高预测模型在法条预测以及罪名预测两方面的准确率。进而给法官提供可靠的参考,提升司法自动化和智能化程度。
进一步的,构建神经网络联合预测模型时,通过一维卷积神经网络提取词向量序列的特征,这里也可以使用其他特征提取网络,比如使用LSTM提取时序特征。但是,在该任务上,相比于其他网络结构,如循环神经网络,卷积神经网络在提取特征时更加直接有效。
附图说明
图1本发明联合预测方法的流程示意图。
具体实施方式
下面结合附图对本发明做进一步的详细说明。
参见图1,本发明基于神经网络的刑事案件罪名法条联合预测方法,包括以下步骤:
步骤1)构建训练数据集:从中国裁判文书网中爬取刑事裁定书,获取案情描述和对应罪名以及相关法条作为训练数据;在这里,案情描述对应的罪名可以有多项,相关法条也可以有多项。之后将每个罪名和每个法条都映射为一个唯一的整数作为其编码。
步骤2)构建并训练神经网络联合预测模型。
神经网络联合预测模型的具体构建方法包括:
步骤2-1)对案情描述分词,并映射为词向量;分词采用的是清华大学开源工具thulac,由于该任务中词向量和领域有关,不使用预训练的词向量,该映射直接跟随模型训练。
步骤2-2)在步骤2-1)得到的词向量序列上做一维卷积神经网络提取特征,得到案情描述的特征向量q。也可使用其他特征提取网络,比如使用LSTM提取时序特征。但是,在该任务上,相比于其他网络结构,如循环神经网络,卷积神经网络在提取特征更加直接有效。
步骤2-3)通过两层前馈神经网络得到特征向量q的向量表示g,g即为法条预测的logit;
步骤2-4)在步骤2-3)得到的向量表示g上,每一维使用sigmoid激活函数得到其对应法条的概率,选择对应概率大于0.5的法条当作预测法条;
步骤2-5)将步骤2-2)得到的特征向量q以及步骤2-4)得到的向量表示g进行拼接,得到新的特征向量k,k通过两层前馈神经网络和sigmoid激活函数得到相应罪名的概率,选择对应概率大于0.5的罪名当作预测罪名。
本发明针对一般文本分类方法在刑事案件罪名预测以及法条预测场景下的弊端,提出了一种法条和罪名联合预测的模型,能够提高模型在法条预测和罪名预测两方面的准确率。

Claims (7)

1.一种基于神经网络的刑事案件罪名法条联合预测方法,其特征在于,包括以下步骤:
步骤一、构建训练数据集:爬取标准的刑事裁定书,获取案情描述与对应罪名以及相关法条作为训练数据;案情描述对应的罪名为一项或者多项,相关法条也为一项或者多项,将每个罪名和每个法条都映射为一个唯一的整数作为其编码;
步骤二、采用多层感知机构建神经网络联合预测模型并通过训练数据集对其进行训练;
步骤三、通过训练之后的神经网络联合预测模型对刑事案件罪名进行预测。
2.根据权利要求1所述基于神经网络的刑事案件罪名法条联合预测方法,其特征在于:步骤一所述标准的刑事裁定书从中国裁判文书网中进行爬取。
3.根据权利要求1所述基于神经网络的刑事案件罪名法条联合预测方法,其特征在于,步骤二所述神经网络联合预测模型的具体构建方法如下:
步骤2-1)对案情描述分词,并映射为词向量,形成词向量序列;
步骤2-2)提取词向量序列的特征,得到案情描述的特征向量q;
步骤2-3)通过两层前馈神经网络得到特征向量q的向量表示g;
步骤2-4)在特征向量q的向量表示g上,每一维使用sigmoid激活函数得到其对应法条的概率,设定预测法条概率的阈值,选择概率大于该阈值的法条作为预测法条;
步骤2-5)将步骤2-2)得到的特征向量q与步骤2-3)得到的向量表示g拼接得到新的特征向量k,新的特征向量k通过两层前馈神经网络和sigmoid激活函数得到相应罪名的概率,设定预测罪名概率的阈值,选择概率大于该阈值的法条作为预测罪名。
4.根据权利要求3所述基于神经网络的刑事案件罪名法条联合预测方法,其特征在于:所述的步骤2-1)中分词采用清华大学设计的开源工具thulac,映射直接跟随模型训练。
5.根据权利要求3所述基于神经网络的刑事案件罪名法条联合预测方法,其特征在于:所述的步骤2-2)通过一维卷积神经网络提取词向量序列的特征。
6.根据权利要求3所述基于神经网络的刑事案件罪名法条联合预测方法,其特征在于:所述的步骤2-4)中设定预测法条概率的阈值为0.5。
7.根据权利要求3所述基于神经网络的刑事案件罪名法条联合预测方法,其特征在于:所述的步骤2-5)中设定预测罪名概率的阈值为0.5。
CN201811505663.3A 2018-12-10 2018-12-10 一种基于神经网络的刑事案件罪名法条联合预测方法 Active CN109376963B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811505663.3A CN109376963B (zh) 2018-12-10 2018-12-10 一种基于神经网络的刑事案件罪名法条联合预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811505663.3A CN109376963B (zh) 2018-12-10 2018-12-10 一种基于神经网络的刑事案件罪名法条联合预测方法

Publications (2)

Publication Number Publication Date
CN109376963A true CN109376963A (zh) 2019-02-22
CN109376963B CN109376963B (zh) 2022-04-08

Family

ID=65373134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811505663.3A Active CN109376963B (zh) 2018-12-10 2018-12-10 一种基于神经网络的刑事案件罪名法条联合预测方法

Country Status (1)

Country Link
CN (1) CN109376963B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109933789A (zh) * 2019-02-27 2019-06-25 中国地质大学(武汉) 一种基于神经网络的司法领域关系抽取方法及系统
CN110188192A (zh) * 2019-04-16 2019-08-30 西安电子科技大学 一种多任务网络构建与多尺度的罪名法条联合预测方法
CN110717843A (zh) * 2019-10-21 2020-01-21 南京大学 一种可复用的法条推荐框架
CN110750635A (zh) * 2019-10-21 2020-02-04 南京大学 一种基于联合深度学习模型的法条推荐方法
CN111126057A (zh) * 2019-12-09 2020-05-08 航天科工网络信息发展有限公司 一种分级神经网络的案件情节精准量刑系统
CN111460817A (zh) * 2020-03-30 2020-07-28 中南大学 一种刑事法律文书相关法条的推荐方法和系统
CN111460100A (zh) * 2020-03-30 2020-07-28 中南大学 一种刑事法律文书罪名的推荐方法和系统
CN111611340A (zh) * 2019-02-26 2020-09-01 广州慧睿思通信息科技有限公司 信息抽取方法、装置、计算机设备和存储介质
CN112101559A (zh) * 2020-09-04 2020-12-18 中国航天科工集团第二研究院 一种基于机器学习的案件罪名推断方法
CN112613294A (zh) * 2019-09-19 2021-04-06 北京国双科技有限公司 法律文书裁判结果的检验方法及装置
CN114091462A (zh) * 2022-01-14 2022-02-25 深圳航天科创实业有限公司 基于案件事实混合编码面向刑事案件风险互学习评估方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021897A (zh) * 2017-12-11 2018-05-11 北京小米移动软件有限公司 图片问答方法及装置
CN108133436A (zh) * 2017-11-23 2018-06-08 科大讯飞股份有限公司 自动判案方法及系统
CN108846384A (zh) * 2018-07-09 2018-11-20 北京邮电大学 融合视频感知的多任务协同识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133436A (zh) * 2017-11-23 2018-06-08 科大讯飞股份有限公司 自动判案方法及系统
CN108021897A (zh) * 2017-12-11 2018-05-11 北京小米移动软件有限公司 图片问答方法及装置
CN108846384A (zh) * 2018-07-09 2018-11-20 北京邮电大学 融合视频感知的多任务协同识别方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ALEXANDER H. MILLER 等: "Key-Value Memory Networks for Directly Reading Documents", 《ARXIV》 *
BINGFENG LUO 等: "Learning to Predict Charges for Criminal Cases with Legal Basis", 《ARXIV》 *
FEW-SHOT CHARGE PREDICTION WITH DISCRIMINATIVE LEGAL ATTRIBUTES: "Zikun Hu 等", 《PROCEEDINGS OF THE 27TH INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS》 *
HAOXI ZHONG 等: "Legal Judgment Prediction via Topological Learning", 《RESEARCHGATE》 *
YATIAN SHEN 等: "Legal Article-Aware End-To-End Memory Network for Charge Prediction", 《CSAE2018》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611340A (zh) * 2019-02-26 2020-09-01 广州慧睿思通信息科技有限公司 信息抽取方法、装置、计算机设备和存储介质
CN109933789A (zh) * 2019-02-27 2019-06-25 中国地质大学(武汉) 一种基于神经网络的司法领域关系抽取方法及系统
CN109933789B (zh) * 2019-02-27 2021-04-13 中国地质大学(武汉) 一种基于神经网络的司法领域关系抽取方法及系统
CN110188192A (zh) * 2019-04-16 2019-08-30 西安电子科技大学 一种多任务网络构建与多尺度的罪名法条联合预测方法
CN110188192B (zh) * 2019-04-16 2023-01-31 西安电子科技大学 一种多任务网络构建与多尺度的罪名法条联合预测方法
CN112613294A (zh) * 2019-09-19 2021-04-06 北京国双科技有限公司 法律文书裁判结果的检验方法及装置
CN110717843A (zh) * 2019-10-21 2020-01-21 南京大学 一种可复用的法条推荐框架
CN110750635A (zh) * 2019-10-21 2020-02-04 南京大学 一种基于联合深度学习模型的法条推荐方法
CN110750635B (zh) * 2019-10-21 2023-12-15 南京大学 一种基于联合深度学习模型的法条推荐方法
CN111126057A (zh) * 2019-12-09 2020-05-08 航天科工网络信息发展有限公司 一种分级神经网络的案件情节精准量刑系统
CN111126057B (zh) * 2019-12-09 2023-08-01 航天科工网络信息发展有限公司 一种分级神经网络的案件情节精准量刑系统
CN111460100A (zh) * 2020-03-30 2020-07-28 中南大学 一种刑事法律文书罪名的推荐方法和系统
CN111460817A (zh) * 2020-03-30 2020-07-28 中南大学 一种刑事法律文书相关法条的推荐方法和系统
CN112101559A (zh) * 2020-09-04 2020-12-18 中国航天科工集团第二研究院 一种基于机器学习的案件罪名推断方法
CN112101559B (zh) * 2020-09-04 2023-08-04 中国航天科工集团第二研究院 一种基于机器学习的案件罪名推断方法
CN114091462A (zh) * 2022-01-14 2022-02-25 深圳航天科创实业有限公司 基于案件事实混合编码面向刑事案件风险互学习评估方法

Also Published As

Publication number Publication date
CN109376963B (zh) 2022-04-08

Similar Documents

Publication Publication Date Title
CN109376963A (zh) 一种基于神经网络的刑事案件罪名法条联合预测方法
JP2018536236A (ja) 低解像度リモートセンシング画像を用いた移動車両の検出及び分析
CN110334272A (zh) 基于知识图谱的智能问答方法、装置及计算机存储介质
CN110532417A (zh) 基于深度哈希的图像检索方法、装置及终端设备
Hsieh et al. Convolutional neural network for automated classification of jointed plain concrete pavement conditions
CN114912612A (zh) 鸟类识别方法、装置、计算机设备及存储介质
CN113807399A (zh) 一种神经网络训练方法、检测方法以及装置
CN113516227B (zh) 一种基于联邦学习的神经网络训练方法及设备
CN113590874B (zh) 一种视频定位方法及装置、模型训练方法及设备
CN112819024B (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
CN110059646A (zh) 训练动作规划模型的方法及目标搜索方法
CN115907009A (zh) 一种自动驾驶感知模型的迁移方法、装置、设备和介质
Lu et al. An improved target detection method based on multiscale features fusion
CN114715145B (zh) 一种轨迹预测方法、装置、设备及自动驾驶车辆
CN107437083A (zh) 一种自适应池化的视频行为识别方法
CN115131604A (zh) 一种多标签图像分类方法、装置、电子设备及存储介质
US20230245429A1 (en) Method and apparatus for training lane line detection model, electronic device and storage medium
CN109376964A (zh) 一种基于记忆神经网络的刑事案件罪名预测方法
Maqsood et al. An autonomous decision-making framework for gait recognition systems against adversarial attack using reinforcement learning
Zhou et al. Lightweight unmanned aerial vehicle video object detection based on spatial‐temporal correlation
Zhang et al. Vehicle detection and tracking for 511 traffic cameras with U-shaped dual attention inception neural networks and spatial-temporal map
Chen et al. Smartphone based outdoor navigation and obstacle avoidance system for the visually impaired
Falahat et al. Maize tassel detection and counting using a YOLOv5-based model
Huang et al. UAV aerial image target detection based on BLUR-YOLO
Zhou et al. Automatic fault instance segmentation based on mask propagation neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant