CN112508269A - 法律判决预测方法及系统 - Google Patents
法律判决预测方法及系统 Download PDFInfo
- Publication number
- CN112508269A CN112508269A CN202011405120.1A CN202011405120A CN112508269A CN 112508269 A CN112508269 A CN 112508269A CN 202011405120 A CN202011405120 A CN 202011405120A CN 112508269 A CN112508269 A CN 112508269A
- Authority
- CN
- China
- Prior art keywords
- criminal
- vector
- legal
- plot
- case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 239000013598 vector Substances 0.000 claims description 156
- 238000012512 characterization method Methods 0.000 claims description 18
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 13
- 230000002457 bidirectional effect Effects 0.000 claims description 12
- 238000000926 separation method Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 9
- 239000013604 expression vector Substances 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Technology Law (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种法律判决预测方法及系统,根据案件事实描述及其相关法条、罪名和刑期数据,按照子任务之间的拓扑关系,依次的从案件事实中分离犯罪情节,即定罪情节和量刑情节,然后建模不同的犯罪情节与相应的子任务之间的关系,从而模拟人类法官的判案过程,相比于现有技术而言,极大地提高了预测结果的准确性。
Description
技术领域
本发明涉及机器学习和基于法律文本分析的智慧司法领域,尤其涉及一种法律判决预测方法。
背景技术
法律判决预测旨在基于案件事实描述,自动预测判决结果,包括相关罪名,法条和刑期等。它是建设智慧法院系统的基础技术,深入研究该技术,不仅能够提升法律从业者的工作效率,而且可以为缺乏法律知识的人群提供快速优质的法律指导及援助。
目前,法律判决预测主要涉及三个子任务:即相关罪名,法条和刑期的预测。针对以上三个任务的预测方法主要有以下两种:
1)基于单个任务的判决预测:
目前,基于单个任务的判决预测方法,主要着重建模案件事实描述和法律知识之间的关系,将罪名属性,法条语义等相关法律知识与案件事实描述相结合,分别预测三个子任务的结果,这种方法通过学习大量标注数据,可以在单个任务上取得不错的效果,但是这种方法忽略子任务之间的拓扑关系,即法官在处理案件的时候,通常是先确定相关法条和罪名,最后在法条和罪名的基础上,确定刑期。
2)基于多个任务的联合预测:
在考虑到子任务之间的拓扑关系之后,有学者提出利用这种关系,采用多任务学习模型对这三个子任务进行联合建模,该类技术主要可以分为以下两类模型:基于拓扑关系的和基于任务之间验证关系的多任务学习模型。基于拓扑关系的多任务学习模型主要是利用法官在处理案件时的决定罪名,法条和刑期的顺序来建模子任务之间的关系。基于任务之间验证关系的多任务学习模型主要是考虑到后续任务同样会对先前的任务造成影响,因此通过建模这种验证关系可以进一步优化多任务学习模型。
然而,上述方法在建模判决预测的过程中,主要挖掘的是整个案件事实描述对所有任务的影响,但是,实际的判决过程是十分复杂且细粒度的,法官是根据案件事实中不同的犯罪情节来决定不同的裁决和量刑,具体来讲,在这个细粒度的判决过程中,法官会首先根据定罪情节确定相关的法条和罪名,之后根据法定量刑情节和酌定量刑情节来确定相关的刑期。因此,采用现有的判决预测方法,难以精准地捕捉不同的犯罪情节从而预测相应的子任务。
发明内容
本发明的目的是提供一种法律判决预测方法及系统,通过从案件事实中分离定罪和量刑情节,然后根据这些情节来预测相应的任务,来提高预测结果的准确性。
本发明的目的是通过以下技术方案实现的:
一种法律判决预测方法,包括:
获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集;
提取案件事实描述的表征向量,并以此预测相关罪名;
通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量;
通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量;
结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间。
由上述本发明提供的技术方案可以看出,根据案件事实描述及其相关法条、罪名和刑期数据,按照子任务之间的拓扑关系,依次的从案件事实中分离犯罪情节,即定罪情节和量刑情节,然后建模不同的犯罪情节与相应的子任务之间的关系,从而模拟人类法官的判案过程,相比于现有技术而言,极大地提高了预测结果的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种法律判决预测方法的流程图;
图2为本发明实施例提供的一种法律判决预测系统的示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种法律判决预测方法,如图1所示,其主要包括如下步骤:
步骤1、获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集。
刑期区间集合表示为Yt={t1,...,tk},其中每一元素表示一个刑期区间。
如表1所示,提供了数据集的中的数据信息及相关的符号表示。
表1数据信息及相关的符号表示
上述数据信息可以通过从中国裁判文书网上获取。
步骤2、提取案件事实描述的表征向量,并以此预测相关罪名。
本发明实施例中,使用双向门控循环单元将案件事实描述转换为低维的语义表征。
之后,将词嵌入序列输入到双向门控循环单元中,得到案件事实描述的表征向量Hd:
Hd=Bi-GRU(Ed)
其中,ld为案件事实描述中的词数目。
步骤3、通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量。
根据步骤2预测得到的罪名在罪名集中进行查询,得到的罪名的文本描述,将其中每一个词分别映射到一个低维稠密的向量空间,得到对应的词嵌入序列文本描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量。
法官在处理案件的时候,往往是根据案件事实中的定罪情节来确定法条,根据量刑情节来确定刑期,其中,定罪情节是案件事实中符合某个罪名定义的事实部分,换言之,定罪情节为案件事实描述与某个罪名定义之间的相似的文本描述,而不相似的文本描述则为量刑情节。
本发明实施例中,设计了一个犯罪情节分离模块,对于罪名表征向量与案件事实描述的表征向量,通过定罪情节的分离,得到定罪情节向量和量刑情节向量,步骤包括:
其中,softmax(.)为逻辑回归函数。
步骤4、通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量。
其中,ld为案件事实描述中的词数目;
本发明实施例上述方案中,双向门控循环单元针对案件事实描述、罪名文本描述、法条文本描述的处理原理是相同的。
步骤5、结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期。
法官在处理案件的时候,是根据量刑情节来确定刑期的,量刑情节又分为法定量刑情节和酌定量刑情节,其中,法定量刑情节是案件事实中符合某个法条量刑定义的事实部分,换言之,法定量刑情节为案件事实描述与某个法条量刑定义之间的相似的文本描述,而不相似的文本描述则为酌定量刑情节;对于法条表征向量与量刑情节向量,通过量刑情节的分离,得到法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期,步骤包括:
之后,利用注意力机制算法得到包含法条表征向量的事实表示向量F:
最后,利用一个基于softmax的仿射变换来预测最相关刑期:
其中,Wt与bt为基于softmax的仿射变换中的权重与偏置参数。
本领域技术人员可以理解,前文所涉及的三个基于softmax的仿射变换原理是相同的,区别在于其内部的权重与偏置参数能需要根据情况做适应性的调整,具体的调整方式可参照现有技术实现。
本发明实施例上述方案,根据案件事实描述及其相关法条、罪名和刑期数据,按照子任务之间的拓扑关系,依次的从案件事实中分离犯罪情节,即定罪情节和量刑情节,然后建模不同的犯罪情节与相应的子任务之间的关系,从而模拟人类法官的判案过程,相比于现有技术而言,极大地提高了预测结果的准确性。在实际应用中,上述方案可以为缺乏法律知识的人群提供快速优质的法律指导及援助;可以提升法律从业者的工作效率;还可以基于上述方案的原理对初入法律行业的用户进行培训工作,或者基于上述方案的结果对用户的能力进行考核等。
本发明另一实施例还提供一种法律判决预测系统,该系统主要用于实现前述的方法,如图2所示,该系统主要包括:
数据获取模块,用于获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集;
编码器,用于提取案件事实描述的表征向量;
定罪情节分离模块,用于根据事实描述的表征向量预测相关罪名,通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量;
量刑情节分离模块,通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量;结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量;
刑期预测模块,用于根据法定量刑情节向量和酌定量刑情节向量,预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间。
该系统各个模块的具体实现方式在前面的方法实施例中已经做了详细的介绍,故不再赘述。
在具体的应用中,上述系统可以部署在实体硬件设备中,自动的对指定案件事实描述进行预测。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (10)
1.一种法律判决预测方法,其特征在于,包括:
获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集;
提取案件事实描述的表征向量,并以此预测相关罪名;
通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量;
通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量;
结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间。
9.根据权利要求1所述的一种法律判决预测方法,其特征在于,所述结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间包括:
其中,W是一个可学习的参数;
之后,利用注意力机制算法得到包含法条表征向量的事实表示向量F:
再利用一个基于softmax的仿射变换来预测最相关刑期:
其中,Wt与bt为基于softmax的仿射变换中的权重与偏置参数;
最后,根据预测到的刑期在刑期区间集合中进行查询,得到对应的刑期区间。
10.一种法律判决预测系统,其特征在于,用于实现权利要求1~9任一项所述的方法,该系统包括:
数据获取模块,用于获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集;
编码器,用于提取案件事实描述的表征向量;
定罪情节分离模块,用于根据事实描述的表征向量预测相关罪名,通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量;
量刑情节分离模块,通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量;结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量;
刑期预测模块,用于根据法定量刑情节向量和酌定量刑情节向量,预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011405120.1A CN112508269A (zh) | 2020-12-03 | 2020-12-03 | 法律判决预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011405120.1A CN112508269A (zh) | 2020-12-03 | 2020-12-03 | 法律判决预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112508269A true CN112508269A (zh) | 2021-03-16 |
Family
ID=74969941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011405120.1A Pending CN112508269A (zh) | 2020-12-03 | 2020-12-03 | 法律判决预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112508269A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113487453A (zh) * | 2021-06-07 | 2021-10-08 | 山东大学 | 基于犯罪要素的法律判决预测方法及系统 |
CN113505937A (zh) * | 2021-07-26 | 2021-10-15 | 江西理工大学 | 一种基于多视角编码器的法律判决预测系统及方法 |
CN113901781A (zh) * | 2021-09-15 | 2022-01-07 | 昆明理工大学 | 融合分段编码与仿射机制的相似案例匹配方法 |
CN116011428A (zh) * | 2023-03-22 | 2023-04-25 | 中国科学院大学 | 民事案件信息抽取与判决预测的方法、装置、介质和设备 |
-
2020
- 2020-12-03 CN CN202011405120.1A patent/CN112508269A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113487453A (zh) * | 2021-06-07 | 2021-10-08 | 山东大学 | 基于犯罪要素的法律判决预测方法及系统 |
CN113487453B (zh) * | 2021-06-07 | 2023-12-05 | 山东大学 | 基于犯罪要素的法律判决预测方法及系统 |
CN113505937A (zh) * | 2021-07-26 | 2021-10-15 | 江西理工大学 | 一种基于多视角编码器的法律判决预测系统及方法 |
CN113901781A (zh) * | 2021-09-15 | 2022-01-07 | 昆明理工大学 | 融合分段编码与仿射机制的相似案例匹配方法 |
CN113901781B (zh) * | 2021-09-15 | 2024-04-26 | 昆明理工大学 | 融合分段编码与仿射机制的相似案例匹配方法 |
CN116011428A (zh) * | 2023-03-22 | 2023-04-25 | 中国科学院大学 | 民事案件信息抽取与判决预测的方法、装置、介质和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112508269A (zh) | 法律判决预测方法及系统 | |
Arnaldo et al. | Building predictive models via feature synthesis | |
Li et al. | Using text mining and sentiment analysis for online forums hotspot detection and forecast | |
US20140161322A1 (en) | System and method for activity recognition | |
CN110188192B (zh) | 一种多任务网络构建与多尺度的罪名法条联合预测方法 | |
CN112579778A (zh) | 基于多层次的特征注意力的方面级情感分类方法 | |
CN111079985A (zh) | 一种基于bert并融合可区分属性特征的刑事案件刑期预测方法 | |
CN113704546A (zh) | 基于空间时序特征的视频自然语言文本检索方法 | |
Cao et al. | CNN-LSTM coupled model for prediction of waterworks operation data | |
CN110705490B (zh) | 视觉情感识别方法 | |
CN113127716B (zh) | 一种基于显著性图的情感时间序列异常检测方法 | |
Li et al. | Learning to learn relation for important people detection in still images | |
CN115828112A (zh) | 一种故障事件的响应方法、装置、电子设备及存储介质 | |
KR20200010672A (ko) | 딥러닝을 이용한 스마트 상품 검색 방법 및 시스템 | |
CN105809119A (zh) | 一种基于稀疏低秩结构多任务学习的行为识别方法 | |
CN113688635A (zh) | 一种基于语义相似度的类案推荐方法 | |
Caicedo et al. | Multimodal fusion for image retrieval using matrix factorization | |
KR102119083B1 (ko) | 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체 | |
CN112364852B (zh) | 融合全局信息的动作视频段提取方法 | |
CN116561446A (zh) | 多模态项目推荐方法、系统及设备和存储介质 | |
Annam et al. | Emotion-Aware Music Recommendations: A Transfer Learning Approach Using Facial Expressions | |
CN113836262B (zh) | 多角度民事案件判决预测方法 | |
Das et al. | A comparative analysis and study of a fast parallel cnn based deepfake video detection model with feature selection (fpc-dfm) | |
Li et al. | [Retracted] Human Sports Action and Ideological and PoliticalEvaluation by Lightweight Deep Learning Model | |
Uniyal et al. | Employing DL-Based Algorithm for Gender and Age Identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |