CN112508269A - 法律判决预测方法及系统 - Google Patents

法律判决预测方法及系统 Download PDF

Info

Publication number
CN112508269A
CN112508269A CN202011405120.1A CN202011405120A CN112508269A CN 112508269 A CN112508269 A CN 112508269A CN 202011405120 A CN202011405120 A CN 202011405120A CN 112508269 A CN112508269 A CN 112508269A
Authority
CN
China
Prior art keywords
criminal
vector
legal
plot
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011405120.1A
Other languages
English (en)
Inventor
刘淇
陈恩红
岳立楠
金斌斌
武晗
张凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202011405120.1A priority Critical patent/CN112508269A/zh
Publication of CN112508269A publication Critical patent/CN112508269A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种法律判决预测方法及系统,根据案件事实描述及其相关法条、罪名和刑期数据,按照子任务之间的拓扑关系,依次的从案件事实中分离犯罪情节,即定罪情节和量刑情节,然后建模不同的犯罪情节与相应的子任务之间的关系,从而模拟人类法官的判案过程,相比于现有技术而言,极大地提高了预测结果的准确性。

Description

法律判决预测方法及系统
技术领域
本发明涉及机器学习和基于法律文本分析的智慧司法领域,尤其涉及一种法律判决预测方法。
背景技术
法律判决预测旨在基于案件事实描述,自动预测判决结果,包括相关罪名,法条和刑期等。它是建设智慧法院系统的基础技术,深入研究该技术,不仅能够提升法律从业者的工作效率,而且可以为缺乏法律知识的人群提供快速优质的法律指导及援助。
目前,法律判决预测主要涉及三个子任务:即相关罪名,法条和刑期的预测。针对以上三个任务的预测方法主要有以下两种:
1)基于单个任务的判决预测:
目前,基于单个任务的判决预测方法,主要着重建模案件事实描述和法律知识之间的关系,将罪名属性,法条语义等相关法律知识与案件事实描述相结合,分别预测三个子任务的结果,这种方法通过学习大量标注数据,可以在单个任务上取得不错的效果,但是这种方法忽略子任务之间的拓扑关系,即法官在处理案件的时候,通常是先确定相关法条和罪名,最后在法条和罪名的基础上,确定刑期。
2)基于多个任务的联合预测:
在考虑到子任务之间的拓扑关系之后,有学者提出利用这种关系,采用多任务学习模型对这三个子任务进行联合建模,该类技术主要可以分为以下两类模型:基于拓扑关系的和基于任务之间验证关系的多任务学习模型。基于拓扑关系的多任务学习模型主要是利用法官在处理案件时的决定罪名,法条和刑期的顺序来建模子任务之间的关系。基于任务之间验证关系的多任务学习模型主要是考虑到后续任务同样会对先前的任务造成影响,因此通过建模这种验证关系可以进一步优化多任务学习模型。
然而,上述方法在建模判决预测的过程中,主要挖掘的是整个案件事实描述对所有任务的影响,但是,实际的判决过程是十分复杂且细粒度的,法官是根据案件事实中不同的犯罪情节来决定不同的裁决和量刑,具体来讲,在这个细粒度的判决过程中,法官会首先根据定罪情节确定相关的法条和罪名,之后根据法定量刑情节和酌定量刑情节来确定相关的刑期。因此,采用现有的判决预测方法,难以精准地捕捉不同的犯罪情节从而预测相应的子任务。
发明内容
本发明的目的是提供一种法律判决预测方法及系统,通过从案件事实中分离定罪和量刑情节,然后根据这些情节来预测相应的任务,来提高预测结果的准确性。
本发明的目的是通过以下技术方案实现的:
一种法律判决预测方法,包括:
获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集;
提取案件事实描述的表征向量,并以此预测相关罪名;
通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量;
通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量;
结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间。
由上述本发明提供的技术方案可以看出,根据案件事实描述及其相关法条、罪名和刑期数据,按照子任务之间的拓扑关系,依次的从案件事实中分离犯罪情节,即定罪情节和量刑情节,然后建模不同的犯罪情节与相应的子任务之间的关系,从而模拟人类法官的判案过程,相比于现有技术而言,极大地提高了预测结果的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种法律判决预测方法的流程图;
图2为本发明实施例提供的一种法律判决预测系统的示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种法律判决预测方法,如图1所示,其主要包括如下步骤:
步骤1、获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集。
本发明实施例中,所述案件事实描述为文本信息,其表示为
Figure BDA0002813832380000031
其中每一元素表示一个词,ld为词数目。
罪名集合表示为Yc={c1,...,cn},其中的任一罪名ci的文本描述为
Figure BDA0002813832380000032
文本描述中的每一元素表示一个词,lc为词数目,i=1,…,n。
法条集合表示为Ya={a1,...,am},其中的任一法条aj的文本描述为
Figure BDA0002813832380000033
文本描述中的每一元素表示一个词,la为词数目,j=1,…,m。
刑期区间集合表示为Yt={t1,...,tk},其中每一元素表示一个刑期区间。
如表1所示,提供了数据集的中的数据信息及相关的符号表示。
Figure BDA0002813832380000034
Figure BDA0002813832380000041
表1数据信息及相关的符号表示
上述数据信息可以通过从中国裁判文书网上获取。
本发明实施例的目的是利用步骤1所获得的相关数据,学习一个分类器ξ,来预测可能的罪名,法条和刑期,即
Figure BDA0002813832380000042
步骤2、提取案件事实描述的表征向量,并以此预测相关罪名。
本发明实施例中,使用双向门控循环单元将案件事实描述转换为低维的语义表征。
首先,将案件事实描述
Figure BDA0002813832380000043
中的每一个词分别映射到一个低维稠密的向量空间,得到对应的词嵌入序列
Figure BDA0002813832380000044
案件事实描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量。
之后,将词嵌入序列输入到双向门控循环单元中,得到案件事实描述的表征向量Hd
Hd=Bi-GRU(Ed)
其中,Bi-GRU表示双向门控循环单元,
Figure BDA0002813832380000045
为双向门控循环单元隐藏层向量,其中的每一元素表示一个表征向量,ds表示双向门控循环单元的隐层维度。
之后,对案件事实描述的表征向量Hd进行平均池化,得到最终的表示向量
Figure BDA0002813832380000046
Figure BDA0002813832380000047
其中,ld为案件事实描述中的词数目。
最后,利用一个基于softmax的仿射变换来预测最相关的罪名
Figure BDA0002813832380000048
Figure BDA0002813832380000049
Figure BDA00028138323800000410
其中,
Figure BDA00028138323800000411
表示所有罪名的概率分布,ci表示任一罪名,n为罪名总数;Wc与bc为基于softmax的仿射变换中的权重与偏置参数。
步骤3、通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量。
根据步骤2预测得到的罪名
Figure BDA0002813832380000051
在罪名集中进行查询,得到的罪名
Figure BDA0002813832380000052
的文本描述,
Figure BDA0002813832380000053
将其中每一个词分别映射到一个低维稠密的向量空间,得到对应的词嵌入序列
Figure BDA0002813832380000054
文本描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量。
之后,将词嵌入序列输入到双向门控循环单元中,得到罪名表征向量
Figure BDA0002813832380000055
Figure BDA0002813832380000056
法官在处理案件的时候,往往是根据案件事实中的定罪情节来确定法条,根据量刑情节来确定刑期,其中,定罪情节是案件事实中符合某个罪名定义的事实部分,换言之,定罪情节为案件事实描述与某个罪名定义之间的相似的文本描述,而不相似的文本描述则为量刑情节。
本发明实施例中,设计了一个犯罪情节分离模块,对于罪名表征向量与案件事实描述的表征向量,通过定罪情节的分离,得到定罪情节向量和量刑情节向量,步骤包括:
计算案件事实描述的表征向量Hd和罪名表征向量
Figure BDA0002813832380000057
之间的相关性矩阵D:
Figure BDA0002813832380000058
其中,
Figure BDA0002813832380000059
是一个可学习的参数。
之后,利用注意力机制算法得到包含罪名表征向量的事实表示向量
Figure BDA00028138323800000510
Figure BDA00028138323800000511
其中,softmax(.)为逻辑回归函数。
最后,对案件事实描述的表征向量Hd和事实表示向量
Figure BDA00028138323800000512
应用向量拒识操作,得到两个向量之间相似的部分
Figure BDA00028138323800000513
与不相似的部分
Figure BDA00028138323800000514
Figure BDA00028138323800000515
Figure BDA00028138323800000516
上述式子中,Hd被分解为平行向量
Figure BDA00028138323800000517
和垂直向量
Figure BDA00028138323800000518
Figure BDA00028138323800000519
可以被看作案件事实和罪名定义之间相似的部分,即定罪情节向量,
Figure BDA00028138323800000520
可以被看作案件事实和罪名定义之间不相似的部分,即量刑情节向量。
步骤4、通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量。
本发明实施例中,对定罪情节向量
Figure BDA0002813832380000061
进行平均池化,得到最终的表示向量f+
Figure BDA0002813832380000062
其中,ld为案件事实描述中的词数目;
利用一个基于softmax的仿射变换来预测最相关的法条
Figure BDA0002813832380000063
Figure BDA0002813832380000064
Figure BDA0002813832380000065
其中,
Figure BDA0002813832380000066
表示所有法条的概率分布,aj表示任一法条;Wa与ba为基于softmax的仿射变换中的权重与偏置参数。
根据预测到的法条
Figure BDA0002813832380000067
在法条集中进行查询,得到的法条定义的文本描述
Figure BDA0002813832380000068
将其中的每一个词分别映射到一个低维稠密的向量空间,得到对应的词嵌入序列
Figure BDA0002813832380000069
文本描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量。
之后,将词嵌入序列输入到双向门控循环单元中,得到法条表征向量
Figure BDA00028138323800000610
Figure BDA00028138323800000611
本发明实施例上述方案中,双向门控循环单元针对案件事实描述、罪名文本描述、法条文本描述的处理原理是相同的。
步骤5、结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期。
法官在处理案件的时候,是根据量刑情节来确定刑期的,量刑情节又分为法定量刑情节和酌定量刑情节,其中,法定量刑情节是案件事实中符合某个法条量刑定义的事实部分,换言之,法定量刑情节为案件事实描述与某个法条量刑定义之间的相似的文本描述,而不相似的文本描述则为酌定量刑情节;对于法条表征向量与量刑情节向量,通过量刑情节的分离,得到法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期,步骤包括:
计算法条表征向量
Figure BDA00028138323800000612
与量刑情节向量
Figure BDA00028138323800000613
之间的相关性矩阵:
Figure BDA0002813832380000071
其中,
Figure BDA0002813832380000072
是一个可学习的参数。
之后,利用注意力机制算法得到包含法条表征向量的事实表示向量F:
Figure BDA0002813832380000073
对量刑情节向量
Figure BDA0002813832380000074
和事实表示向量F应用向量拒识操作,得到两个向量之间相似部分
Figure BDA0002813832380000075
与不相似的部分
Figure BDA0002813832380000076
Figure BDA0002813832380000077
Figure BDA0002813832380000078
上述式子中,量刑情节向量
Figure BDA0002813832380000079
被分解为平行向量
Figure BDA00028138323800000710
和垂直向量
Figure BDA00028138323800000711
Figure BDA00028138323800000712
可以被看作定罪情节和法条定义之间相似的部分,即法定量刑情节向量,
Figure BDA00028138323800000713
可以被看作定罪情节和法条定义之间不相似的部分,即酌定量刑情节向量。
对于法定量刑情节向量
Figure BDA00028138323800000714
酌定量刑情节向量
Figure BDA00028138323800000715
各自进行平均池化,得到各自的最终表示向量
Figure BDA00028138323800000716
最后,利用一个基于softmax的仿射变换来预测最相关刑期:
Figure BDA00028138323800000717
其中,Wt与bt为基于softmax的仿射变换中的权重与偏置参数。
根据预测到的刑期在刑期区间集合中进行查询,得到对应的刑期区间
Figure BDA00028138323800000718
本领域技术人员可以理解,前文所涉及的三个基于softmax的仿射变换原理是相同的,区别在于其内部的权重与偏置参数能需要根据情况做适应性的调整,具体的调整方式可参照现有技术实现。
本发明实施例上述方案,根据案件事实描述及其相关法条、罪名和刑期数据,按照子任务之间的拓扑关系,依次的从案件事实中分离犯罪情节,即定罪情节和量刑情节,然后建模不同的犯罪情节与相应的子任务之间的关系,从而模拟人类法官的判案过程,相比于现有技术而言,极大地提高了预测结果的准确性。在实际应用中,上述方案可以为缺乏法律知识的人群提供快速优质的法律指导及援助;可以提升法律从业者的工作效率;还可以基于上述方案的原理对初入法律行业的用户进行培训工作,或者基于上述方案的结果对用户的能力进行考核等。
本发明另一实施例还提供一种法律判决预测系统,该系统主要用于实现前述的方法,如图2所示,该系统主要包括:
数据获取模块,用于获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集;
编码器,用于提取案件事实描述的表征向量;
定罪情节分离模块,用于根据事实描述的表征向量预测相关罪名,通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量;
量刑情节分离模块,通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量;结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量;
刑期预测模块,用于根据法定量刑情节向量和酌定量刑情节向量,预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间。
该系统各个模块的具体实现方式在前面的方法实施例中已经做了详细的介绍,故不再赘述。
在具体的应用中,上述系统可以部署在实体硬件设备中,自动的对指定案件事实描述进行预测。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (10)

1.一种法律判决预测方法,其特征在于,包括:
获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集;
提取案件事实描述的表征向量,并以此预测相关罪名;
通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量;
通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量;
结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间。
2.根据权利要求1所述的一种法律判决预测方法,其特征在于,
所述案件事实描述表示为
Figure FDA0002813832370000011
其中每一元素表示一个词,ld为词数目;
罪名集合表示为Yc={c1,...,cn},其中的任一罪名ci的文本描述为
Figure FDA0002813832370000012
文本描述中的每一元素表示一个词,lc为词数目,i=1,…,n;
法条集合表示为Ya={a1,...,am},其中的任一法条aj的文本描述为
Figure FDA0002813832370000013
文本描述中的每一元素表示一个词,la为词数目,j=1,…,m;
刑期区间集合表示为Yt={t1,...,tk},其中每一元素表示一个刑期区间。
3.根据权利要求1所述的一种法律判决预测方法,其特征在于,提取案件事实描述的表征向量的步骤包括:
将案件事实描述
Figure FDA0002813832370000014
中的每一个词分别映射到向量空间,得到对应的词嵌入序列
Figure FDA0002813832370000015
案件事实描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量;
之后,将词嵌入序列输入到双向门控循环单元中,得到案件事实描述的表征向量Hd
Hd=Bi-GRU(Ed)
其中,Bi-GRU表示双向门控循环单元,
Figure FDA0002813832370000021
其中的每一元素表示一个表征向量,ld为案件事实描述中的词数目。
4.根据权利要求1所述的一种法律判决预测方法,其特征在于,所述预测相关罪名的步骤包括:
对案件事实描述的表征向量Hd进行平均池化,得到最终的表示向量hd
Figure FDA0002813832370000022
其中,ld为案件事实描述中的词数目;
利用一个基于softmax的仿射变换来预测最相关的罪名
Figure FDA0002813832370000023
Figure FDA0002813832370000024
Figure FDA0002813832370000025
其中,
Figure FDA0002813832370000026
表示所有罪名的概率分布,ci表示任一罪名,n为罪名总数;Wc与bc为基于softmax的仿射变换中的权重与偏置参数。
5.根据权利要求1所述的一种法律判决预测方法,其特征在于,提取罪名表征向量的步骤包括:
将预测的罪名
Figure FDA0002813832370000027
的文本描述
Figure FDA0002813832370000028
中每一个词分别映射到向量空间,得到对应的词嵌入序列
Figure FDA0002813832370000029
文本描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量;
之后,将词嵌入序列输入到双向门控循环单元中,得到罪名表征向量
Figure FDA00028138323700000210
Figure FDA00028138323700000211
其中,Bi-GRU表示双向门控循环单元。
6.根据权利要求1所述的一种法律判决预测方法,其特征在于,结合罪名表征向量与案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量的步骤包括:
计算案件事实描述的表征向量Hd和罪名表征向量
Figure FDA00028138323700000212
之间的相关性矩阵D:
Figure FDA00028138323700000213
其中,Wf是一个可学习的参数;
之后,利用注意力机制算法得到包含罪名表征向量的事实表示向量
Figure FDA00028138323700000214
Figure FDA00028138323700000215
最后,对案件事实描述的表征向量Hd和事实表示向量
Figure FDA0002813832370000031
应用向量拒识操作,得到两个向量之间相似的部分
Figure FDA0002813832370000032
与不相似的部分
Figure FDA0002813832370000033
Figure FDA0002813832370000034
Figure FDA0002813832370000035
上述式子中,
Figure FDA0002813832370000036
为定罪情节向量,
Figure FDA0002813832370000037
为量刑情节向量。
7.根据权利要求1所述的一种法律判决预测方法,其特征在于,所述通过定罪情节向量预测相关的法条包括:
对定罪情节向量
Figure FDA0002813832370000038
进行平均池化,得到最终的表示向量f+
Figure FDA0002813832370000039
其中,ld为案件事实描述中的词数目;
利用一个基于softmax的仿射变换来预测最相关的法条
Figure FDA00028138323700000310
Figure FDA00028138323700000311
Figure FDA00028138323700000312
其中,
Figure FDA00028138323700000313
表示所有法条的概率分布,aj表示任一法条,m为法条总数;Wa与ba为基于softmax的仿射变换中的权重与偏置参数。
8.根据权利要求1所述的一种法律判决预测方法,其特征在于,所述提取法条表征向量的步骤包括:
将预测的法条
Figure FDA00028138323700000314
的文本描述
Figure FDA00028138323700000315
中每一个词分别映射到向量空间,得到对应的词嵌入序列
Figure FDA00028138323700000316
文本描述与词嵌入序列中的每一元素各自表示一个词、一个词对应的向量;
之后,将词嵌入序列输入到双向门控循环单元中,得到法条表征向量
Figure FDA00028138323700000317
Figure FDA00028138323700000318
其中,Bi-GRU表示双向门控循环单元。
9.根据权利要求1所述的一种法律判决预测方法,其特征在于,所述结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量,从而预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间包括:
计算法条表征向量
Figure FDA00028138323700000319
与量刑情节向量
Figure FDA00028138323700000320
之间的相关性矩阵:
Figure FDA0002813832370000041
其中,W是一个可学习的参数;
之后,利用注意力机制算法得到包含法条表征向量的事实表示向量F:
Figure FDA0002813832370000042
对量刑情节向量
Figure FDA0002813832370000043
和事实表示向量F应用向量拒识操作,得到两个向量之间相似部分
Figure FDA0002813832370000044
与不相似的部分
Figure FDA0002813832370000045
Figure FDA0002813832370000046
Figure FDA0002813832370000047
其中,
Figure FDA0002813832370000048
为法定量刑情节向量,
Figure FDA0002813832370000049
为酌定量刑情节向量;
对于法定量刑情节向量
Figure FDA00028138323700000410
酌定量刑情节向量
Figure FDA00028138323700000411
各自进行平均池化,得到各自的最终表示向量
Figure FDA00028138323700000412
再利用一个基于softmax的仿射变换来预测最相关刑期:
Figure FDA00028138323700000413
其中,Wt与bt为基于softmax的仿射变换中的权重与偏置参数;
最后,根据预测到的刑期在刑期区间集合中进行查询,得到对应的刑期区间。
10.一种法律判决预测系统,其特征在于,用于实现权利要求1~9任一项所述的方法,该系统包括:
数据获取模块,用于获取包含案件事实描述、罪名集合及其文本描述、法条集合及其文本描述、以及刑期区间集合的数据集;
编码器,用于提取案件事实描述的表征向量;
定罪情节分离模块,用于根据事实描述的表征向量预测相关罪名,通过预测的罪名从数据集中提取罪名对应的文本描述,并从文本描述中提取罪名表征向量,再结合案件事实描述的表征向量进行定罪情节的分离,获得定罪情节向量和量刑情节向量;
量刑情节分离模块,通过定罪情节向量预测相关的法条,并从数据集中提取法条对应的文本描述,进而提取法条表征向量;结合法条表征向量与量刑情节向量进行量刑情节的分离,获得法定量刑情节向量和酌定量刑情节向量;
刑期预测模块,用于根据法定量刑情节向量和酌定量刑情节向量,预测相应的刑期,最终结合数据集中的刑期区间集合确定刑期区间。
CN202011405120.1A 2020-12-03 2020-12-03 法律判决预测方法及系统 Pending CN112508269A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011405120.1A CN112508269A (zh) 2020-12-03 2020-12-03 法律判决预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011405120.1A CN112508269A (zh) 2020-12-03 2020-12-03 法律判决预测方法及系统

Publications (1)

Publication Number Publication Date
CN112508269A true CN112508269A (zh) 2021-03-16

Family

ID=74969941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011405120.1A Pending CN112508269A (zh) 2020-12-03 2020-12-03 法律判决预测方法及系统

Country Status (1)

Country Link
CN (1) CN112508269A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487453A (zh) * 2021-06-07 2021-10-08 山东大学 基于犯罪要素的法律判决预测方法及系统
CN113505937A (zh) * 2021-07-26 2021-10-15 江西理工大学 一种基于多视角编码器的法律判决预测系统及方法
CN113901781A (zh) * 2021-09-15 2022-01-07 昆明理工大学 融合分段编码与仿射机制的相似案例匹配方法
CN116011428A (zh) * 2023-03-22 2023-04-25 中国科学院大学 民事案件信息抽取与判决预测的方法、装置、介质和设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487453A (zh) * 2021-06-07 2021-10-08 山东大学 基于犯罪要素的法律判决预测方法及系统
CN113487453B (zh) * 2021-06-07 2023-12-05 山东大学 基于犯罪要素的法律判决预测方法及系统
CN113505937A (zh) * 2021-07-26 2021-10-15 江西理工大学 一种基于多视角编码器的法律判决预测系统及方法
CN113901781A (zh) * 2021-09-15 2022-01-07 昆明理工大学 融合分段编码与仿射机制的相似案例匹配方法
CN113901781B (zh) * 2021-09-15 2024-04-26 昆明理工大学 融合分段编码与仿射机制的相似案例匹配方法
CN116011428A (zh) * 2023-03-22 2023-04-25 中国科学院大学 民事案件信息抽取与判决预测的方法、装置、介质和设备

Similar Documents

Publication Publication Date Title
CN112508269A (zh) 法律判决预测方法及系统
Arnaldo et al. Building predictive models via feature synthesis
Li et al. Using text mining and sentiment analysis for online forums hotspot detection and forecast
US20140161322A1 (en) System and method for activity recognition
CN110188192B (zh) 一种多任务网络构建与多尺度的罪名法条联合预测方法
CN112579778A (zh) 基于多层次的特征注意力的方面级情感分类方法
CN111079985A (zh) 一种基于bert并融合可区分属性特征的刑事案件刑期预测方法
CN113704546A (zh) 基于空间时序特征的视频自然语言文本检索方法
Cao et al. CNN-LSTM coupled model for prediction of waterworks operation data
CN110705490B (zh) 视觉情感识别方法
CN113127716B (zh) 一种基于显著性图的情感时间序列异常检测方法
Li et al. Learning to learn relation for important people detection in still images
CN115828112A (zh) 一种故障事件的响应方法、装置、电子设备及存储介质
KR20200010672A (ko) 딥러닝을 이용한 스마트 상품 검색 방법 및 시스템
CN105809119A (zh) 一种基于稀疏低秩结构多任务学习的行为识别方法
CN113688635A (zh) 一种基于语义相似度的类案推荐方法
Caicedo et al. Multimodal fusion for image retrieval using matrix factorization
KR102119083B1 (ko) 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체
CN112364852B (zh) 融合全局信息的动作视频段提取方法
CN116561446A (zh) 多模态项目推荐方法、系统及设备和存储介质
Annam et al. Emotion-Aware Music Recommendations: A Transfer Learning Approach Using Facial Expressions
CN113836262B (zh) 多角度民事案件判决预测方法
Das et al. A comparative analysis and study of a fast parallel cnn based deepfake video detection model with feature selection (fpc-dfm)
Li et al. [Retracted] Human Sports Action and Ideological and PoliticalEvaluation by Lightweight Deep Learning Model
Uniyal et al. Employing DL-Based Algorithm for Gender and Age Identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination