CN112269878B - 可解释法律判决预测方法、装置、电子设备及存储介质 - Google Patents
可解释法律判决预测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112269878B CN112269878B CN202011203734.1A CN202011203734A CN112269878B CN 112269878 B CN112269878 B CN 112269878B CN 202011203734 A CN202011203734 A CN 202011203734A CN 112269878 B CN112269878 B CN 112269878B
- Authority
- CN
- China
- Prior art keywords
- concept
- legal
- concepts
- tree
- prediction result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 230000007246 mechanism Effects 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims description 14
- 230000006399 behavior Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000003542 behavioural effect Effects 0.000 claims description 2
- 238000012937 correction Methods 0.000 abstract description 3
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 13
- 208000014674 injury Diseases 0.000 description 10
- 208000027418 Wounds and injury Diseases 0.000 description 6
- 230000006378 damage Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000008450 motivation Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 238000009937 brining Methods 0.000 description 3
- 239000003962 counterfeit drug Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 239000006187 pill Substances 0.000 description 3
- 206010062717 Increased upper airway secretion Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 229940126601 medicinal product Drugs 0.000 description 2
- 208000026435 phlegm Diseases 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及自然语言处理领域,尤其是涉及司法与人工智能技术交叉应用,提出了基于庭审合议机制的可解释法律判决预测方法、装置、电子设备及存储介质。所述方法包括获取待处理的法律文书文本信息;分别通过概念树分类器和多分类器,对所述待处理的法律文书文本信息进行分析处理,输出第一法律判决预测结果和第二法律判决预测结果;若二者预测结果一致,则接受当前预测结果;若不一致,则启用庭审合议机制;通过多个仲裁树分类器,对所述第二预测结果信息进行投票分析处理,按少数服从多数原则确定最终的预测结果。本发明不仅具有从特征到概念层次的可解释性,而且通过修正机制在原模型的基础上进一步提高了分类正确率。
Description
技术领域
本发明属于自然语言处理领域,尤其是涉及司法与人工智能技术交叉应用,提出了基于庭审合议机制的可解释法律判决预测方法、装置、电子设备及存储介质。
背景技术
在司法领域,人工智能系统不仅能有效为法律工作者提供法律辅助,而且对普通人来说,也能迅速而有效地解决日常生活中遇到的一些法律问题。法律人工系统在为普通人服务的同时,其普法作用能够提升公民的法律素养,进而有利于维持社会秩序。
法律判决预测(Legal Judgment Prediction)的目标是根据法律文书中的事实部分来对判决的结果进行预测,该项技术对于司法判决来说是一项非常重要的技术。
由于法律领域的文本具有高度的专业性,涉及到复杂的法律条文以及规则。法律判决预测任务显然无法接受“黑箱”模型,无法解释的黑箱模型与法律的核心特征(严谨性)相冲突。这也是虽然目前深度学习模型在法律任务中取得很好效果,但是很多司法领域专家依然无法接受这些方法的原因。
发明内容
本发明的发明目的在于:为了克服现有技术中的至少一个不足,提出了基于庭审合议机制的可解释法律判决预测方法、装置、电子设备及存储介质。
本申请实施例的目的之一在于提供基于庭审合议机制的可解释法律判决预测方法,应用于电子设备,所述方法可包括以下步骤:
S100:获取待处理的法律文书文本信息;
S200:通过经概念树训练过的概念树分类器,对所述待处理的法律文书文本信息进行分析处理,输出第一法律判决预测结果;所述概念树可由法律文书样本信息的特征构造所得;
S300:通过直接经法律文书样本信息训练过的多分类器,对所述待处理的法律文书文本信息进行分析处理,输出第二法律判决预测结果;
S400:将所述第一法律判决预测结果与所述第二法律判决预测结果进行核对,若二者预测结果一致,则接受当前预测结果,输出所述第一法律判决预测结果或所述第二法律判决预测结果;
若二者预测结果不一致,则启用庭审合议机制;
S500,庭审合议机制:通过多个经仲裁树训练过的仲裁树分类器,对经所述多分类器处理后输出的所述第二法律判决预测结果信息进行投票分析处理,可按少数服从多数原则确定最终的预测结果;所述仲裁树的结构与所述概念树的结构相同。
本申请实施例的目的之二在于提供基于庭审合议机制的可解释法律判决预测装置,所述装置可包括以下模块:
信息获取模块:用于获取待处理的法律文书文本信息;
概念树分类器:所述概念树分类器为通过概念树训练过的分类器,用于对所述待处理的法律文书文本信息进行分析处理,输出第一法律判决预测结果;所述概念树由法律文书样本信息的特征构造所得;
多分类器:所述多分类器为通过经法律文书样本信息训练过的分类器,用于对所述待处理的法律文书文本信息进行分析处理,输出第二法律判决预测结果;
概念核对模块:用于将所述第一法律判决预测结果与所述第二法律判决预测结果进行核对,若二者预测结果一致,则接受当前预测结果,输出所述第一法律判决预测结果或所述第二法律判决预测结果;若二者预测结果不一致,则启用庭审合议机制;
仲裁树分类器:所述仲裁树分类器为通过多个经仲裁树训练过的分类器,用于执行庭审合议机制,对经所述多分类器处理后输出的所述第二法律判决预测结果信息进行投票分析处理,按少数服从多数原则确定最终的预测结果;所述仲裁树的结构与所述概念树的结构相同。
本申请实施例的目的之三在于提供一种电子设备,所述电子设备可包括存储器和处理器,所述存储器可存储有能够被所述处理器执行的可执行指令,所述可执行指令被所述处理器执行时,能够实现本申请实施例的目的之一中的基于庭审合议机制的可解释法律判决预测方法。
本申请实施例的目的之四在于提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理执行时,可实现本申请实施例的目的之一中的基于庭审合议机制的可解释法律判决预测方法。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明提出了一种具有核对修正机制的可解释性法律判决预测方法,这种方法不仅符合法律“主客观相符合”的原则,而且模拟了司法判决的主要流程:起诉(多分类器)——庭审(概念树对多分类器预测结果进行核对)——合议(仲裁树)。本方法不仅具有从特征到概念层次的可解释性,而且通过修正机制在原模型的基础上进一步提高了分类正确率。
同时,本发明提供了一个模型组合框架,根据实际情况,本发明的三个部分:多分类器部分、概念树部分以及仲裁树部分所采用的模型可以灵活调整,这使得本发明或能成为一种具有通用性的可解释分类预测方法和装置。
附图说明
本发明将通过实施例并参照附图的方式说明,其中:
图1为本发明实施例提供的可解释法律判决预测方法的处理流程图。
图2为本发明实施例提供的预测结果一致时的一种流程示意图。
图3为本发明实施例提供的预测结果不一致时的一种流程示意图。
图4为本发明实施例提供的概念树与仲裁树的结构示意图。
图5为本发明实施例提供的可解释法律判决预测装置的结构示意图。
图6为本发明实施例提供的预测结果一致时的工作示意图。
图7为本发明实施例提供的预测结果不一致时的工作示意图。
图8为本发明实施例提供的可解释法律判决预测电子设备的结构示意图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
法律判决预测任务需要遵守法律规则,而在司法裁决过程中的一个重要原则是“主观与客观相符合”的原则,“主观”指犯罪动机,“客观”指某种违法行为以及行为所造成的影响等因素。这些“主观”与客观的概念使不同类型的案件得以被区分。
本发明在处理法律文本多分类任务中,根据这些概念构建概念树,并训练分类器,同时概念树可以对多分类器的预测结果进行检查核对。当概念树分类器与多分类器预测结果一致时,可以增加预测结果的可信度,而当二者预测结果发生冲突时,通过模拟司法活动中的庭审合议机制,即仲裁树分类器进行处理,可以提高模型分类的正确率以及可解释性,也符合司法活动中“主观与客观相符合”的原则。
实施例一,基于庭审合议机制的可解释法律判决预测方法,应用于电子设备,如图1所示,所述方法主要包括S100-S500等几个步骤。
步骤S100:获取待处理的法律文书文本信息。
步骤S200:通过经概念树训练过的概念树分类器,对所述待处理的法律文书文本信息进行分析处理,输出第一法律判决预测结果。
本发明中所述概念树由法律文书样本信息的特征构造所得。一般的,所述概念树可根据专业知识或先验信息手动设置,也可以自动抽取能对法律文书样本信息进行粗粒度划分的特征信息,形成特征域,并基于特征域进行聚类操作构建概念树。概念树在结构上类似于决策树,概念树的每次分枝代表一种使不同类型案件之间相互区分开来的概念。
由于法律条文内容包含了客观结果要件、主观动机要件,罪行的成立必须具备这两大要件,如故意伤害罪对应的《中华人民共和国刑法》第二百三十四条:故意伤害他人身体的,处三年以下有期徒刑、拘役或者管制……。其客观结果是伤害他人身体,主观动机为这种伤害是故意的,在上述条件下,构成故意伤害罪将其转化为条件语句:
if伤害他人身体(客观结果)and故意(主观动机)then构成故意伤害罪。
我国《刑法》第二百三十二条规定:故意杀人的,处死刑、无期徒刑或者十年以上有期徒刑。在上述条件下,构成故意伤害罪将其转化为条件语句:
if杀人and故意then构成故意杀人罪。
然而故意伤害与故意杀人所造成的结果都有可能是受害人受伤或者死亡,所以当这种情况出现时,条件语句会变得更复杂:
if对他人身体造成伤害and故意and无杀人动机then构成故意伤害罪,若有杀人动机则构成故意杀人罪。
概念树的分枝过程是一种对案件的由粗粒度到细粒度的划分过程,这种过程符合人类对事物的认知逻辑,每一次分枝都代表一个可以对案件类型进行区分的概念,可以看作一个分类条件,每一条完整路径都可以转换成上述对案件定性的条件语句,它可以看作是规则的集合。在一个实施例中,根据先验得到的概念树结构的每个分枝训练分类器,每个分类器都学习到了当前分枝对应的概念。
本发明中,可利用概念树根据概念推导相应的预测结果,还可根据预测结果推导相应的概念。为实现特征层面的模型可解释性,可引入SHAP工具达到从特征到概念层面的可解释性文本分类结果
如图4所示,本发明中所述概念树可至少包含三级,其中,第一级包含表示案件类型的概念;第二级包含表示行为类型的概念;第三级包含表示行为性质的概念。该实施例中第一级包括“伤害他人身体、涉及腐败行为、非法经营”等三种案件类型的概念。
其中伤害他人身体类的第二级包括杀人、伤人等两种行为;其第三级又根据过失、故意等两种行为性质进行了分类。
涉及腐败行为的第二级包括贪污、贿赂相关等两种行为;其第三级又根据行贿、受贿等两种行为性质进行了分类,贪污类没有进行第三级分类。
非法经营的第二级包括非法药物食品相关、药物食品以外非法商品等两种行为;其第三级又根据具体的行为性质分了四类。
需说明的是,图4仅为一种概念树/仲裁树的例子,本领域技术人员可按此逻辑构造其他所需的概念树/仲裁树。
步骤S200中,通过所述概念树分类器对所述待处理的法律文书文本信息进行特征选择,并根据所述概念树的每次分枝方式划分所述待处理的法律文书文本信息,所述概念树分类器的每个分枝位置处均由一个子分类器,用以区分相应概念,经每级分析处理后输出第一法律判决预测结果。
本发明步骤S300中:通过直接经法律文书样本信息训练过的多分类器,对所述待处理的法律文书文本信息进行分析处理,输出第二法律判决预测结果;训练所述多分类器时采用的特征选择方式可与训练概念树分类器时的特征选择方式一样,利用相同的特征选择方式直接基于法律文书样本信息进行训练,不通过概念树进行训练。
本发明步骤S400中:如图2所示,将所述第一法律判决预测结果与所述第二法律判决预测结果进行核对,若二者预测结果一致,则接受当前预测结果,输出所述第一法律判决预测结果或所述第二法律判决预测结果。如图3所示,若二者预测结果不一致,则启用庭审合议机制。
实施例1:所述第一法律判决预测结果包括第一案件结果;所述第二法律判决预测结果包括第二案件结果;步骤S400中,将所述第一案件结果与所述第二案件结果进行核对,若所述第一案件结果与所述第二案件结果中的概念均一致,则接受当前预测结果,输出所述第一案件结果或所述第二案件结果;若所述第一案件结果与所述第二案件结果中的概念有至少一个不一致,则启用庭审合议机制。
实施例2:所述第一法律判决预测结果包括第一案件结果和包含多个概念的第一概念簇;所述第二法律判决预测结果包括第二案件结果和包含多个概念的第二概念簇;步骤S400中,将所述第一概念簇与所述第二概念簇进行核对,若所述第一概念簇与所述第二概念簇中的概念均一致,则接受当前预测结果,输出所述第一案件结果或所述第二案件结果;若所述第一概念簇与所述第二概念簇中的概念有至少一个不一致,则启用庭审合议机制。
实施例3:所述第一法律判决预测结果包括第一案件结果和包含多个概念的第一概念簇;所述第二法律判决预测结果包括第二案件结果;步骤S400中,根据所述概念树的结构推导出所述第二案件结果所对应的概念,得到第二概念簇;遍历核对所述第一概念簇与所述第二概念簇,若所述第一概念簇与所述第二概念簇中的概念均一致,则接受当前预测结果,输出所述第一案件结果或所述第二案件结果;若所述第一概念簇与所述第二概念簇中的概念有至少一个不一致,则启用庭审合议机制。
一般的,所述第二概念簇均可采用实施例3中的方法得到,即根据所述概念树的结构推导出所述第二案件结果所对应的概念得到所述第二概念簇。
本发明步骤S500中,所述庭审合议机制可包括:通过多个经仲裁树训练过的仲裁树分类器,对经所述多分类器处理后输出的所述第二法律判决预测结果信息进行投票分析处理,按少数服从多数原则确定最终的预测结果。
本发明中所述仲裁树可通过从构造所述概念树所采用的法律文书样本信息中随机抽取部分数据来构造所得;所述仲裁树的结构需与所述概念树的结构相同:所述仲裁树分类器的特征选择规则可异于所述概念树分类器的特征选择规则;所述仲裁树分类器的训练方式可与所述概念树分类器的训练方式相同。所述概念树的数量一般为一棵,而仲裁树的数量一般为多棵。
具体的,所述庭审合议机制可包括以下过程:
S501,遍历核对所述第一法律判决预测结果对应的第一概念簇与所述第二法律判决预测结果对应的第二概念簇;
S502,当所述第一概念簇中的概念与所述第二概念簇中的概念不一致时,标记该概念;
S503,通过多个经仲裁树训练过的仲裁树分类器,对所述待处理的法律文书文本信息进行分析处理,输出多个仲裁概念簇;
S504,根据被标记的概念在所述第一概念簇或第二概念簇中的结构位置,提取多个所述仲裁概念簇中相应结构位置的概念,并按少数服从多数原则,将被标记的概念修改为所提取出的概念中数量最多的概念;
S505,继续遍历核对下一层所述第一概念簇中的概念与所述第二概念簇中的概念,直到所有所述第一概念簇与所述第二概念簇中的概念全部一致后,根据所述概念树推导出最终的预测结果。
进一步的,还可包括S506:在遍历核对的过程中,若当前簇包含多个表示案件类型的概念时,则标记该概念,在多个所述仲裁概念簇中提取出多个与该标记的概念所对应的结构位置的概念,并按少数服从多数原则,将被标记的概念修改为所提取出的概念中数量最多的概念,使得当前簇中仅包含一种案件。
本发明可选的算法流程示意如下:
输入:文本t
如图6所示,图6为当多分类器与概念树分类器预测结果一致时的一个工作示意图。获取的待处理的法律文书文本信息内容为:“新密市人民检察院指控,2013年12月份以来,被告人王某某在没有取得《医疗机构制剂许可证》、《药品生产许可证》、“熄风止颤胶囊”、“熄风止颤丸”、“化痰通脉丸”制剂批准文号及药品批准文号的情况下,从禹州市购置中药材及胶囊壳、塑料瓶等用品,在位于新密市北密新路11排1号“伟凡中医诊所”内,私自加工生产“熄风止颤胶囊”180瓶、“熄风止颤丸”6大袋(300小袋/大袋,9g/小袋)、“化痰通脉丸”20瓶进行销售。至2014年9月29日案发,现场扣押“熄风止颤胶囊”18瓶、“熄风止颤丸”一大袋(内装300小袋)、“化痰通脉丸”14瓶,其余三种药物制品已销售。经新密市医药、食品监督管理局调查认定上述三种药物制品均为假药”。
图6的实施例中,多分类器输出的预测结果为“生产销售假药”,三层概念分支均与概念树分类器的概念一致,因此判定预测结果为真,该法律文本的案件结果为生产销售假药。
如图7所示,图7为当多分类器与概念树分类器预测结果不一致时的一个工作示意图。获取的待处理的法律文书文本信息内容为:“廊坊市人民检察院指控,被告人聂振宇与其女友牛某甲同为三河市塔金属汽车部件有限公司员工。2014年8月15日,被告人聂振宇因工作原因与被害人牛某甲发生矛盾。当日晚20时许,被告人聂振宇与被害人牛某甲来到三河市燕郊开发区星河皓月一期小区内,二人发生争吵。后当二人行至该小区S5号楼3单元北侧楼下时,被害人牛某甲提出与聂振宇分手,被告人聂振宇遂将被害人牛某甲按倒在地并用手将其掐死。经鉴定,死者牛某甲系生前被他人扼颈致死。后被告人聂振宇于2014年8月16日16时50分许,在其姐聂某的陪同下,到三河市公安局高楼派出所投案。针对上述指控,公诉人当庭提供了证人证言、现场勘查笔录、鉴定意见、书证、物证及被告人聂振宇在侦查机关的供述等证据。公诉机关认为,被告人聂振宇之行为已触犯《中华人民共和国刑法》第二百三十二条之规定,应当以故意杀人罪追究其刑事责任。被告人聂振宇犯罪后主动投案,如实供述自己罪行,系自首,适用《中华人民共和国刑法》第六十七条之规定。提请本院依法判处。”
图7的实施例中,多分类器输出的预测结果为“过失致人死亡”,而其第三级概念分支与概念树分类器的概念不一致,启动庭审合议机制,通过3个仲裁树分类器分别进行预测,在3个仲裁预测结果中,按少数服从多数的原则,最终判定该法律文书的案件结果为故意杀人。
实施例二,基于庭审合议机制的可解释法律判决预测装置,如图5所示,所述装置至少包括信息获取模块、概念树分类器、多分类器、概念核对模块和仲裁树分类器等。
所述信息获取模块:可用于获取待处理的法律文书文本信息。
所述概念树分类器:所述概念树分类器为通过概念树训练过的分类器,可用于对所述待处理的法律文书文本信息进行分析处理,输出第一法律判决预测结果;所述概念树由法律文书样本信息的特征构造所得。所述概念树分类器能够完成如实施例一中描述的S200步骤。
所述多分类器:所述多分类器为通过经法律文书样本信息训练过的分类器,可用于对所述待处理的法律文书文本信息进行分析处理,输出第二法律判决预测结果。所述多分类器能够完成如实施例一中描述的S300步骤。
所述概念核对模块:可用于将所述第一法律判决预测结果与所述第二法律判决预测结果进行核对,若二者预测结果一致,则接受当前预测结果,输出所述第一法律判决预测结果或所述第二法律判决预测结果;若二者预测结果不一致,则启用庭审合议机制。所述概念核对模块能够完成如实施例一中描述的S400步骤。
所述仲裁树分类器:所述仲裁树分类器为通过多个经仲裁树训练过的分类器,可用于执行庭审合议机制,对经所述多分类器处理后输出的所述第二法律判决预测结果信息进行投票分析处理,按少数服从多数原则确定最终的预测结果;所述仲裁树的结构与所述概念树的结构相同。所述仲裁树分类器能够完成如实施例一中描述的S500步骤。
实施例三,一种电子设备,如图8所示,所述电子设备包括存储器和处理器,所述存储器存储有能够被所述处理器执行的可执行指令,所述可执行指令被所述处理器执行时,能够实现实施例一中描述的基于庭审合议机制的可解释法律判决预测方法。
其中,存储器、处理器以及其他相关元件相互之间直接或间接地通信连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述处理器用于执行所述存储器中存储的可执行指令模块,例如所述基于庭审合议机制的可解释法律判决预测装置所包括的软件功能模块及计算机程序等。
该存储器可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器用于存储程序,所述处理器在接收到执行指令后,执行所述程序。
该处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
实施例四,一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理执行时,能够实现实施例一中描述的基于庭审合议机制的可解释法律判决预测方法。
综上所述,本发明提出了可解释法律判决预测方法、装置、电子设备及存储介质。该方法是一种具有核对修正机制的可解释性法律判决预测方法,在获取待处理的法律文书文本信息后;分别通过概念树分类器和多分类器,对所述待处理的法律文书文本信息进行分析处理,输出第一法律判决预测结果和第二法律判决预测结果;若二者预测结果一致,则接受当前预测结果;若不一致,则启用庭审合议机制;通过多个仲裁树分类器,对所述第二法律判决预测结果信息进行投票分析处理,按少数服从多数原则确定最终的预测结果。
这种方法不仅符合法律“主客观相符合”的原则,而且模拟了司法判决的主要流程:起诉(多分类器)——庭审(概念树对多分类器预测结果进行核对)——合议(仲裁树)。本方法不仅具有从特征到概念层次的可解释性,而且通过修正机制在原模型的基础上进一步提高了分类正确率。同时,本发明提供了一个模型组合框架,根据实际情况,本发明的三个部分:多分类器部分、概念树部分以及仲裁树部分所采用的模型可以灵活调整,这使得本发明或能成为一种具有通用性的可解释分类预测方法和装置。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.基于庭审合议机制的可解释法律判决预测方法,其特征在于,所述方法包括以下步骤:
S100:获取待处理的法律文书文本信息;
S200:通过经概念树训练过的概念树分类器,对所述待处理的法律文书文本信息进行分析处理,输出第一法律判决预测结果;所述概念树由法律文书样本信息的特征构造所得;所述第一法律判决预测结果包括第一案件结果和包含多个概念的第一概念簇;
S300:通过直接经法律文书样本信息训练过的多分类器,对所述待处理的法律文书文本信息进行分析处理,输出第二法律判决预测结果;
S400:将所述第一法律判决预测结果与所述第二法律判决预测结果进行核对,若二者预测结果一致,则接受当前预测结果,输出所述第一法律判决预测结果或所述第二法律判决预测结果;若二者预测结果不一致,则启用庭审合议机制;
S500,庭审合议机制:通过多个经仲裁树训练过的仲裁树分类器,对经所述多分类器处理后输出的所述第二法律判决预测结果信息进行投票分析处理,按少数服从多数原则确定最终的预测结果;所述仲裁树的结构与所述概念树的结构相同。
2.根据权利要求1所述的基于庭审合议机制的可解释法律判决预测方法,其特征在于:
所述第二法律判决预测结果包括第二案件结果和包含多个概念的第二概念簇;
步骤S400中,将所述第一概念簇与所述第二概念簇进行核对,若所述第一概念簇与所述第二概念簇中的概念均一致,则接受当前预测结果,输出所述第一案件结果或所述第二案件结果;
若所述第一概念簇与所述第二概念簇中的概念有至少一个不一致,则启用庭审合议机制。
3.根据权利要求1所述的基于庭审合议机制的可解释法律判决预测方法,其特征在于:
所述第二法律判决预测结果包括第二案件结果;
步骤S400中,根据所述概念树的结构推导出所述第二案件结果所对应的概念,得到第二概念簇;遍历核对所述第一概念簇与所述第二概念簇,若所述第一概念簇与所述第二概念簇中的概念均一致,则接受当前预测结果,输出所述第一案件结果或所述第二案件结果;
若所述第一概念簇与所述第二概念簇中的概念有至少一个不一致,则启用庭审合议机制。
4.根据权利要求1-3中任一项所述的基于庭审合议机制的可解释法律判决预测方法,其特征在于,所述庭审合议机制包括以下过程:
遍历核对所述第一法律判决预测结果对应的第一概念簇与所述第二法律判决预测结果对应的第二概念簇;
当所述第一概念簇中的概念与所述第二概念簇中的概念不一致时,标记该概念;
通过多个经仲裁树训练过的仲裁树分类器,对所述待处理的法律文书文本信息进行分析处理,输出多个仲裁概念簇;
根据被标记的概念在所述第一概念簇或第二概念簇中的结构位置,提取多个所述仲裁概念簇中相应结构位置的概念,并按少数服从多数原则,将被标记的概念修改为所提取出的概念中数量最多的概念;
继续遍历核对下一层所述第一概念簇中的概念与所述第二概念簇中的概念,直到所有所述第一概念簇与所述第二概念簇中的概念全部一致后,根据所述概念树推导出最终的预测结果。
5.根据权利要求4所述的基于庭审合议机制的可解释法律判决预测方法,其特征在于:在遍历核对的过程中,若当前簇包含多个表示案件类型的概念时,则标记该概念,在多个所述仲裁概念簇中提取出多个与该标记的概念所对应的结构位置的概念,并按少数服从多数原则,将被标记的概念修改为所提取出的概念中数量最多的概念,使得当前簇中仅包含一种案件。
6.根据权利要求1所述的基于庭审合议机制的可解释法律判决预测方法,其特征在于:所述概念树和所述仲裁树的结构至少包含三级;
第一级包含表示案件类型的概念;
第二级包含表示行为类型的概念;
第三级包含表示行为性质的概念。
7.根据权利要求1所述的基于庭审合议机制的可解释法律判决预测方法,其特征在于:
所述仲裁树通过从构造所述概念树所采用的法律文书样本信息中随机抽取部分数据来构造所得;
所述仲裁树的结构与所述概念树的结构相同;
所述仲裁树分类器的特征选择规则异于所述概念树分类器的特征选择规则;
所述仲裁树分类器的训练方式与所述概念树分类器的训练方式相同。
8.基于庭审合议机制的可解释法律判决预测装置,其特征在于,所述装置包括:
信息获取模块:用于获取待处理的法律文书文本信息;
概念树分类器:所述概念树分类器为通过概念树训练过的分类器,用于对所述待处理的法律文书文本信息进行分析处理,输出第一法律判决预测结果;所述概念树由法律文书样本信息的特征构造所得;所述第一法律判决预测结果包括第一案件结果和包含多个概念的第一概念簇;
多分类器:所述多分类器为通过经法律文书样本信息训练过的分类器,用于对所述待处理的法律文书文本信息进行分析处理,输出第二法律判决预测结果;
概念核对模块:用于将所述第一法律判决预测结果与所述第二法律判决预测结果进行核对,若二者预测结果一致,则接受当前预测结果,输出所述第一法律判决预测结果或所述第二法律判决预测结果;若二者预测结果不一致,则启用庭审合议机制;
仲裁树分类器:所述仲裁树分类器为通过多个经仲裁树训练过的分类器,用于执行庭审合议机制,对经所述多分类器处理后输出的所述第二法律判决预测结果信息进行投票分析处理,按少数服从多数原则确定最终的预测结果;所述仲裁树的结构与所述概念树的结构相同。
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有能够被所述处理器执行的可执行指令,所述可执行指令被所述处理器执行时,能够实现如权利要求1-7任意一项所述的基于庭审合议机制的可解释法律判决预测方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理执行时,实现如权利要求1-7任意一项所述的基于庭审合议机制的可解释法律判决预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011203734.1A CN112269878B (zh) | 2020-11-02 | 2020-11-02 | 可解释法律判决预测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011203734.1A CN112269878B (zh) | 2020-11-02 | 2020-11-02 | 可解释法律判决预测方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112269878A CN112269878A (zh) | 2021-01-26 |
CN112269878B true CN112269878B (zh) | 2024-03-26 |
Family
ID=74344584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011203734.1A Active CN112269878B (zh) | 2020-11-02 | 2020-11-02 | 可解释法律判决预测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112269878B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101571870A (zh) * | 2009-06-09 | 2009-11-04 | 北京航空航天大学 | 一种基于概念聚类的用户兴趣建模方法 |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN106611189A (zh) * | 2016-06-28 | 2017-05-03 | 四川用联信息技术有限公司 | 标准化多维代价敏感决策树的集成分类器构建方法 |
CN108776706A (zh) * | 2018-06-13 | 2018-11-09 | 北京信息科技大学 | 一种基于本体的专利技术主题聚类方法 |
CN110443420A (zh) * | 2019-08-05 | 2019-11-12 | 山东农业大学 | 一种基于机器学习的作物产量预测方法 |
CN110751316A (zh) * | 2019-09-26 | 2020-02-04 | 平安科技(深圳)有限公司 | 一种裁决结果预测方法、装置及终端设备 |
CN110888943A (zh) * | 2019-11-08 | 2020-03-17 | 太极计算机股份有限公司 | 基于微模板的法院裁判文书辅助生成的方法和系统 |
CN111046931A (zh) * | 2019-12-02 | 2020-04-21 | 北京交通大学 | 一种基于随机森林的道岔故障诊断方法 |
CN111714118A (zh) * | 2020-06-08 | 2020-09-29 | 北京航天自动控制研究所 | 一种基于集成学习的脑认知模型融合方法 |
CN111784191A (zh) * | 2020-07-17 | 2020-10-16 | 塔盾信息技术(上海)有限公司 | 一种基于工业智能的安全管理辅助决策系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100076799A1 (en) * | 2008-09-25 | 2010-03-25 | Air Products And Chemicals, Inc. | System and method for using classification trees to predict rare events |
US9836455B2 (en) * | 2011-02-23 | 2017-12-05 | New York University | Apparatus, method and computer-accessible medium for explaining classifications of documents |
-
2020
- 2020-11-02 CN CN202011203734.1A patent/CN112269878B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101571870A (zh) * | 2009-06-09 | 2009-11-04 | 北京航空航天大学 | 一种基于概念聚类的用户兴趣建模方法 |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN106611189A (zh) * | 2016-06-28 | 2017-05-03 | 四川用联信息技术有限公司 | 标准化多维代价敏感决策树的集成分类器构建方法 |
CN108776706A (zh) * | 2018-06-13 | 2018-11-09 | 北京信息科技大学 | 一种基于本体的专利技术主题聚类方法 |
CN110443420A (zh) * | 2019-08-05 | 2019-11-12 | 山东农业大学 | 一种基于机器学习的作物产量预测方法 |
CN110751316A (zh) * | 2019-09-26 | 2020-02-04 | 平安科技(深圳)有限公司 | 一种裁决结果预测方法、装置及终端设备 |
CN110888943A (zh) * | 2019-11-08 | 2020-03-17 | 太极计算机股份有限公司 | 基于微模板的法院裁判文书辅助生成的方法和系统 |
CN111046931A (zh) * | 2019-12-02 | 2020-04-21 | 北京交通大学 | 一种基于随机森林的道岔故障诊断方法 |
CN111714118A (zh) * | 2020-06-08 | 2020-09-29 | 北京航天自动控制研究所 | 一种基于集成学习的脑认知模型融合方法 |
CN111784191A (zh) * | 2020-07-17 | 2020-10-16 | 塔盾信息技术(上海)有限公司 | 一种基于工业智能的安全管理辅助决策系统 |
Non-Patent Citations (4)
Title |
---|
Data-Empowered Argumentation for Dialectically Explainable Predictions;Oana Cocarascu et al.;《 ECAI 2020: 24TH EUROPEAN CONFERENCE ON ARTIFICIAL INTELLIGENCE》;2449 - 2456 * |
基于本体实现对网页文本的自动主题分类;刘娇蛟 等;《计算机工程》(第11期);95-97 * |
现代情报检索模型理论比较与发展研究;刘伟成;《图书情报知识》(第03期);8-12 * |
面向法律文书的量刑预测方法研究;谭红叶 等;《中文信息学报》(第03期);111-118 * |
Also Published As
Publication number | Publication date |
---|---|
CN112269878A (zh) | 2021-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Di Minin et al. | A framework for investigating illegal wildlife trade on social media with machine learning | |
Roberts | Abolition constitutionalism | |
US20170097983A1 (en) | Data analysis system, data analysis method, data analysis program, and storage medium | |
US9858533B2 (en) | Data analysis computer system and method for conversion of predictive models to equivalent ones | |
Hacker | A legal framework for AI training data—from first principles to the Artificial Intelligence Act | |
CN108052504A (zh) | 数学主观题解答结果的结构分析方法及系统 | |
Anagnostou et al. | Poverty, pandemics, and wildlife crime | |
JPWO2017199445A1 (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
Parikh et al. | Holy cow! Beef ban, political technologies, and Brahmanical supremacy in Modi’s India | |
Ganokratanaa et al. | Decision support system for diagnosing diseases in dogs from behaviors using text mining technique | |
Lu et al. | On the distinction between unethical and selfish behavior | |
Boratto et al. | Advancing interdisciplinary research on illegal wildlife trade using a conservation criminology framework | |
Chowdhury et al. | Imputation of missing healthcare data | |
Casacuberta et al. | Using Dreyfus’ legacy to understand justice in algorithm-based processes | |
Hadjigeorgiou et al. | A systematic review into expert knowledge elicitation methods for emerging food and feed risk identification | |
CN112269878B (zh) | 可解释法律判决预测方法、装置、电子设备及存储介质 | |
Hunter et al. | A framework for the efficient and ethical use of artificial intelligence in the criminal justice system | |
Lapostol Piderit et al. | Algorithmic Transparency from the South: Examining the state of algorithmic transparency in Chile's public administration algorithms | |
Spencer et al. | Criminology and animality: Stupidity and the anthropological machine | |
Santoso et al. | Application of Data Mining Classification for Covid-19 Infected Status Using Algortima Naïve Method: Application of Data Mining Classification for Covid-19 Infected Status Using Algortima Naïve Method | |
Sedlmeier | Associative learning and frequency judgements: The PASS model. | |
Grice et al. | A simple and transparent alternative to logistic regression | |
Willmore | Codes of practice: communicating between science and law | |
Barton | Artificial intelligence: designing a legal platform to prevent and resolve legal problems | |
Tavakolnia | Making Animals Visible in Sustainability Accounting with Critical Look at Financial Valuation. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |