CN109426905B - 一种刑事文书量刑偏离的判定方法及装置 - Google Patents
一种刑事文书量刑偏离的判定方法及装置 Download PDFInfo
- Publication number
- CN109426905B CN109426905B CN201710754390.5A CN201710754390A CN109426905B CN 109426905 B CN109426905 B CN 109426905B CN 201710754390 A CN201710754390 A CN 201710754390A CN 109426905 B CN109426905 B CN 109426905B
- Authority
- CN
- China
- Prior art keywords
- criminal
- document
- characteristic
- dimension
- crime
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000009826 distribution Methods 0.000 claims abstract description 99
- 238000012163 sequencing technique Methods 0.000 claims description 43
- 238000003860 storage Methods 0.000 claims description 18
- 238000005259 measurement Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000011840 criminal investigation Methods 0.000 abstract description 14
- 230000002265 prevention Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 230000007123 defense Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000011835 investigation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 206010011878 Deafness Diseases 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 238000004141 dimensional analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种刑事文书量刑偏离的判定方法及装置,涉及计算机技术领域,主要目的在于从不同维度对刑事文书类案进行量刑偏离判定,提高量刑偏离判定的准确度,本发明的主要技术方案为:获取与刑事文书样本相似的刑事文书类案;从所述刑事文书类案中提取涉及定罪量刑的维度特征;统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况;根据所述分布情况对所述刑事文书样本中各个涉及定罪量刑的维度特征对应特征值进行量刑偏离的判定。本发明主要用于相似刑事文书量刑偏离的判定。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种刑事文书量刑偏离的判定方法及装置。
背景技术
刑事文书是指公安(含国家安全机关)、检察、法院、司法行政等机关依法制作或发布的有关处理刑事案件的具有法律效力或法律意义的司法公文。通常法官在进行刑事案件审理的过程中,对于定罪量刑具有一定的自由裁判权,当需要执行自由裁判权时,法官可以使用两种解决方式,一种是向其他审理过类似案件的法官请教,但是该方法主观性较强,并且无法保证判决和大部分的类似案件判决的一致性,进而可能降低法官案件审理的工作效率;另一种是通过文书网站进行关键词检索类似刑事案件,但是现有的文书检索网站根本无法推送满足法官检索需求的刑事文书。同样的,当刑事辩护律师不确定自己承办的案件是否应当为当事人做自首辩护以减轻罪行时,也需要参考文书网站推送类似的刑事案件。
当法官接收到推送的刑事文书类案后,会参考推送的刑事文书类案中的判决来确定所审理刑事案件的定罪量刑,或者判断所审理刑事案件的定罪量刑是否偏离。
现有的刑事文书量刑偏离的判定方法主要是通过法官查看逐个查看推送的刑事文书类案中的判决记录,并根据每篇刑事文书类案中的判决记录结合个人经验,确定所审理刑事案件的量刑范围,然而通过上述方法来判定刑事文书类案量刑是否偏离需要法官逐个查看推送的刑事文书类案中的判决记录,并对判决记录逐个进行对比来判定类案量刑是否偏离,耗费了大量的工作时间,同时也得不到满意的判定结果。
发明内容
有鉴于此,本发明提供一种刑事文书量刑偏离的判定方法及装置,主要目的在于从不同维度对刑事文书类案进行量刑偏离判定,提高量刑偏离判定的准确度。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明实施例提供了一种刑事文书量刑偏离的判定方法,包括:
获取与刑事文书样本相似的刑事文书类案;
从所述刑事文书类案中提取涉及定罪量刑的维度特征;
统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况;
根据所述分布情况对所述刑事文书样本中各个涉及定罪量刑的维度特征对应特征值进行量刑偏离的判定。
进一步地,在所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况之前,所述方法还包括:
获取所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的数据类型。
进一步地,当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为数值型时,所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况包括:
统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同数值的特征值进行排序;
为排序后的特征值设置小于指定数量的安全窗口,滑动所述安全窗口,计算每次滑动后所述安全窗口内所对应特征值集合的方差;
选取所述方差最小值的安全窗口内所对应特征值的分布范围作为安全分布范围。
进一步地,所述根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定包括:
通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否在所述安全分布范围内,对所刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;
若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不在安全分布范围内,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;
否则,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
进一步地,当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为文本型时,所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况包括:
统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同文本的特征值进行归类;
选取属于同一类别特征值占所有特征值的比例超过预设阈值对应的特征值作为安全特征值。
进一步地,所述根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定包括:
通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否为所述安全特征值,对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;
若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不是安全特征值,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;
否则,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
进一步地,所述获取与刑事文书样本相似的刑事文书类案包括:
将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
从所述刑事文书检索库中选取与刑事文书样本相似的刑事文书类案。
进一步地,所述将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配包括:
从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述第二刑事文书集合中每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:
将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述按照所述最终排序结果将待推送刑事文书作为输出的推送文书包括:
判断所述待推送刑事文书的数量是否大于指定数量;
若是,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
否则,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
为了实现上述目的,根据本发明的另一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的刑事文书量刑偏离的判定方法。
为了实现上述目的,根据本发明的另一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的刑事文书量刑偏离的判定方法。
另一方面,本发明实施例还提供了一种刑事文书量刑偏离的判定装置,包括:
第一获取单元,用于获取指定数量与刑事文书样本相似的刑事文书类案;
提取单元,用于从所述刑事文书类案中提取涉及定罪量刑的维度特征;
统计单元,用于统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况;
判定单元,用于根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定。
进一步地,所述装置还包括:
第二获取单元,用于获取所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的数据类型。
进一步地,当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为数值型时,所述统计单元包括:
第一统计模块,用于统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同数值的特征值进行排序;
计算模块,用于为排序后的特征值设置小于指定数量的安全窗口,滑动所述安全窗口,计算每次滑动后所述安全窗口内所对应特征值集合的方差;
第一选取模块,用于选取所述方差最小值的安全窗口内所对应特征值的分布范围作为安全分布范围。
进一步地,所述判定单元包括:
比对模块,用于通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否在所述安全分布范围内,对所述刑事文书样本中对应涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;
判定模块,用于若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不在安全分布范围内,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;
所述判定模块,还用于若所述刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值在安全分布范围内,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
进一步地,当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为文本型时,所述统计单元包括:
第二统计模块,用于统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同文本的特征值进行归类;
第三选取模块,用于选取属于同一类别特征值占所有特征值的比例超过预设阈值对应的特征值作为安全特征值。
进一步地,所述判定单元包括:
比对模块,用于通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否为所述安全特征值,对所述刑事文书样本中涉及定罪量刑的某一维度特征对应特征值进行量刑偏离的判定;
判定模块,用于若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不是安全特征值,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;
所述判定模块,还用于若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是安全特征值,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
进一步地,所述第一获取单元包括:
匹配模块,用于将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
第二选取模块,用于从所述刑事文书检索库中选取指定数量与刑事文书样本相似的刑事文书类案。
进一步地,所述匹配模块,具体用于从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
所述匹配模块,具体还用于从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
所述匹配模块,具体还用于将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述第二刑事文书集合中每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述第二选取模块,具体用于将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
所述第二选取模块,具体还用于当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
所述第二选取模块,具体还用于根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
所述选取模块,具体还用于按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述第二选取模块,具体还用于判断所述待推送刑事文书的数量是否大于指定数量;
所述第二选取模块,具体还用于若所述待推送刑事文书的数量大于指定数量,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
所述第二选取模块,具体还用于若所述待推送刑事文书的数量不大于指定数量,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例提供的一种刑事文书量刑偏离的判定方法及装置,首先获取指定数量与刑事文书样本形似的刑事文书类案,然后从刑事文书类案中提取涉及定罪量刑的维度特征,通过查看刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况,对刑事文书样本中各个维度特征对应的特征值进行量刑偏离的判定,能够快速判断刑事文书样本的定罪量刑是否偏离于刑事文书类案的定罪量刑,进一步为用户提供参考。与现有技术中通过逐个查看每篇推送的刑事文书类案中的判决记录来进行刑事文书量刑偏离的判定方法相比,本发明实施例通过获取指定数量与刑事文书样本相似的刑事文书类案,该刑事文书类案可以从多维度获取与刑事文书样本相匹配,保证了获取到的刑事文书类案具有较高的参考价值,通过从刑事文书类案中提取涉及定罪量刑的维度特征,能够得到涉及定罪量刑的维度特征对应特征值的分布情况,进而将刑事文书样本中涉及定罪量刑的维度特征对应特征值直接与统计刑事文书类案中涉及定罪量刑的维度特征对应特征值所得到的分布情况进行比对,无需用户逐个查找每篇刑事文书类案中涉及定罪量刑的各个维度特征以及逐个比对各个维度特征对应的特征值,节省了刑事文书量刑偏离的判定时间,从而准确判定刑事文书样本的定罪量刑是否偏离,同时提高了判定结果的准确度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的一种刑事文书量刑偏离的判定方法流程图;
图2为本发明实施例提供的另一种刑事文书量刑偏离的判定方法流程图;
图3为本发明实施例提供的另一种刑事文书量刑偏离的判定方法流程图;
图4为本发明实施例提供的一种刑事文书量刑偏离的判定装置的组成框图;
图5为本发明实施例提供的另一种刑事文书量刑偏离的判定装置的组成框图;
图6为本发明实施例提供的另一种刑事文书量刑偏离的判定装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种刑事文书量刑偏离的判定方法,如图1所示,该方法通过查看刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况,对刑事文书样本中各个维度特征对应的特征值进行量刑偏离的判定,能够快速判断刑事文书样本中某一维度特征对应特征值的定罪量刑是否偏离于刑事文书类案的定罪量刑,对此本发明实施例提供以下具体步骤:
101、获取与刑事文书样本相似的刑事文书类案。
其中,刑事文书类案为与刑事文书样本中多维度特征对应的特征值匹配的刑事文书案件,通常情况下,一篇刑事文书中会包括多个维度特征,如罪名、主刑刑种、是否聋哑人、是否正当防卫、数罪并罚等,当然对于不同刑事案件所侧重的维度特征可能不相同。
可以理解的是,上述刑事文书类案可以为刑事文书检索库推送的刑事文书,这里的刑事文书检索库中的刑事文书可以通过网络爬虫爬取各个文书网站进行获取,还可以通过其他文书检索系统进行获取,本发明实施例对刑事文书检索库中的刑事文书获取方式不进行限定。
对于本发明实施例,通常情况会首先从刑事文书检索库中筛选出与刑事文书样本中“罪名”维度特征对应的特征值相匹配的第一刑事文书集合,当然这里的第一刑事文书集合中一般都会包括大量的刑事文书,然后再从第一刑事文书集合中筛选出与刑事文书样本中“犯罪主体数量”以及“主从犯关系”维度特征对应的特征值相匹配的第二刑事文书集合,当然这里的第二刑事文书集合中一般也会包括大量的刑事文书,再将刑事文书样本中各个量刑情节维度特征对应的特征值与第二刑事文书集合中每篇刑事文书中相应维度特征对应的特征值进行匹配,进而得到与刑事文书样本相似的刑事文书类案。
在实际应用中,可以发现通过筛选得到符合条件的第二刑事文书集合中仍然会存在很多篇,如500篇以上与刑事文书样本相应维度特征对应的特征值相匹配的刑事文书类案,本发明实施例为了进一步保证获取到刑事文书类案的质量,将刑事文书样本中各个量刑情节维度特征对应的特征值与每篇待推送刑事文书中相应维度特征对应的特征值进行匹配,这里的量刑情节维度特征集合是刑事文书全部维度特征集合的一个子集,量刑情节维度特征集合中的维度特征都与量刑情节相关,可以包括刑事能力责任、正当防卫、紧急避险等维度特征,这样在通过对各个量刑情节维度特征进行匹配后,可能还会存在100篇左右与刑事文书样本中8个以上维度特征对应的特征值相匹配的刑事文书,存在20篇左右与刑事文书样本中10个以上维度特征对应的特征值相匹配的刑事文书,通常情况下,存在维度特征对应的特征值相匹配的数量越多,说明该刑事文书与刑事文书样本的相似度越高。
为了保证查找到相似度较高的刑事文书类案,本发明实施例在将刑事文书样本中各个量刑情节维度特征对应的特征值与每篇待推送刑事文书中相应维度特征对应的特征值进行匹配之后,进一步对进行量刑情节维度特征对应的特征值相匹配的刑事文书类案进行排序,从而获取排序结果靠前的指定数量的刑事文书类案,这里可以有以下两种排序方式:
一种是将各待推送刑事文书按照与刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;当两篇以上待推送刑事文书与刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;根据最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果。而当两篇以上刑事文书类案的最高基础得分相同的情况下,还可以进一步对最高基础得分相同的刑事文书类案进行全文相似度匹配,进而优先获取全文相似度匹配结果靠前推送的刑事文书类案。
另一种是将各待推送刑事文书按照与刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;当待推送刑事文书与刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,将每篇量刑情节维度特征匹配数量相同的待推送刑事文书与刑事文书样本进行全文相似度匹配;根据全文相似度匹配由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果。
需要说明的是,上述按照最终排序结果获取排名靠前推送的刑事文书类案的时候,由于刑事文书类案的数量不确定,可能会获取到大量推送的刑事文书类案,本发明实施例进一步对获取的刑事文书数量进行限定,判断刑事文书类案的数量是否大于指定数量,这里的指定数量不进行限定,优选20篇左右,如果是,按照最终排序结果选取指定数量的送刑事文书类案作为输出的推送文书,其余的刑事文书不进行推送,从而获取到指定数量的刑事文书类案,否则,按照最终排序结果将所有待推送刑事文书作为输出的推送文书。
优选的,上面提到的量刑情节维度特征为犯罪主体的量刑情节维度特征,也即,在初始排序时,先分别确定各待推送刑事文书的犯罪主体的量刑情节维度特征与刑事文书样本中犯罪主体的量刑情节维度特征匹配相一致的数量,之后将各待推送刑事文书按照与刑事文书样本中犯罪主体的匹配相一致量刑情节维度特征的数量由多至少进行排序;而在最终排序时,对于两篇以上待推送刑事文书与刑事文书样本中犯罪主体的匹配相一致量刑情节维度特征的数量相同时,查找每篇犯罪主体的量刑情节维度特征匹配数量相同的待推送刑事文书的犯罪主体量刑情节维度特征的最高基础得分,并按最高基础得分对与刑事文书样本中犯罪主体的匹配相一致量刑情节维度特征的数量相同的待推送刑事文书排序。由于都是按照犯罪主体的量刑情节维度特征进行判断,所获得的最终排序结果中越靠前的待推送刑事文书与刑事文书样本相似度越高,推送结果越精准。
当然,对第二刑事文书集合还可以有其他的排序方式,例如,可以是将各待推送刑事文书按照与刑事文书样本中匹配相一致维度特征的数量由多至少进行排序,当两篇以上待推送刑事文书与刑事文书样本中匹配相一致维度特征的数量相同时,对其中每篇维度特征匹配数量相同的刑事文书类案与刑事文书样本进行全文相似度匹配,进而根据全文相似度匹配由高至低对维度特征匹配数量相同的刑事文书类案进行排序,得到最终排序结果。还可以是将各待推送刑事文书按照与刑事文书样本中匹配相一致维度特征的数量由多至少进行排序,当两篇以上待推送刑事文书与刑事文书样本中匹配相一致维度特征的数量相同时,查找每篇维度特征匹配数量相同的刑事文书类案中匹配相一致的维度特征的最高基础得分,进而根据最高基础得分由高至低对维度特征匹配数量相同的刑事文书类案进行排序,得到最终排序结果。根据本申请公开内容的启示,本领域技术人员还可以得出很多种其他排序方式,本实施例不一一列举。
对于本发明实施例,由于推送的刑事文书类案为从多维度特征与刑事文书样本相匹配的刑事文书,通过获取与刑事文书样本相似的刑事文书类案,能够保证获取的刑事文书类案对于刑事文书样本具有较高的参考价值。
102、从所述刑事文书类案中提取涉及定罪量刑的维度特征。
由于不同维度特征能够反应刑事文书中不同的方面的内容,有的用户更侧重于查找维度特征为刑事责任年龄匹配结果相同的刑事文书,有的用户更侧重于查找维度特征为是否自首匹配结果相同的刑事文书,对于本发明实施例更侧重于查找涉及定罪量刑维度特征相匹配的刑事文书,例如,主刑刑期、附加刑罚金、主刑刑种、缓刑考验期以及是否缓刑等维度特征均涉及到罪犯定罪量刑的内容,进一步从步骤101中获取的刑事文书类案中提取涉及定罪量刑的维度特征。
103、统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况。
对于本发明实施例,不同刑事文书类案中涉及定罪量刑的某一维度特征对应的特征值有所不同,如a刑事文书中记录的主刑刑期为一年,而b刑事文书中记录的主刑刑期为5年,a刑事文书中记录的是否缓刑为“是”,而b刑事文书中记录的是否缓刑为“否”,本发明实施例通过刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况,能够了解涉及定罪量刑的各个维度特征对应的特征值,例如,刑事文书类案中是否缓刑维度特征对应特征值有两种情况,一种为“是”,一种为“否”,本发明实施例可以通过统计特征值对应两种情况的占比来评估该维度特征的分布情况,而对于可能存在多种情况特征值对应的维度特征,也可以通过统计特征值对应多种情况的占比来评估该维度特征的分布情况,本发明实施例不进行限定。
104、根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定。
对于本发明实施例,由于刑事文书类案通常从多维度特征与刑事文书样本相匹配,因此,刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况可以作为刑事文书样本中各个维度特征取值的参考,这里的各个维度特征通常为主观确定的维度特征,如刑事文书样本中涉及法官判决的维度特征,进而通过分布情况可以对刑事文书样本中涉及定罪量刑的维度特征对应特征值进行量刑偏离的判定。
针对本发明的实施例提供的一种刑事文书量刑偏离的判定方法,首先获取与刑事文书样本形似的刑事文书类案,然后从刑事文书类案中提取涉及定罪量刑的维度特征,通过查看刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况,对刑事文书样本中各个维度特征对应的特征值进行量刑偏离的判定,能够快速判断刑事文书样本的定罪量刑是否偏离于刑事文书类案的定罪量刑,进一步为用户提供参考。与现有技术中通过逐个查看每篇推送的刑事文书类案中的判决记录来进行刑事文书量刑偏离的判定方法相比,本发明实施例通过获取指定数量与刑事文书样本相似的刑事文书类案,该刑事文书类案可以从多维度获取与刑事文书样本相匹配,保证了获取到的刑事文书类案具有较高的参考价值,通过从刑事文书类案中提取涉及定罪量刑的维度特征,能够得到涉及定罪量刑的维度特征对应特征值的分布情况,进而将刑事文书样本中涉及定罪量刑的维度特征对应特征值直接与统计刑事文书类案中涉及定罪量刑的维度特征对应特征值所得到的分布情况进行比对,无需用户逐个查找每篇刑事文书类案中涉及定罪量刑的各个维度特征以及逐个比对各个维度特征对应的特征值,节省了刑事文书量刑偏离的判定时间,从而准确判定刑事文书样本的定罪量刑是否偏离,同时提高了判定结果的准确度。
以下为了更加详细地说明本发明提出的一种刑事文书量刑偏离的判定方法,特别是当涉及定罪量刑的某一维度特征对应特征值的数据类型为数值型时,如何统计刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况的步骤,本发明实施例还提供了另一种刑事文书量刑偏离的判定方法,如图2所示,该方法的具体的步骤包括:
201、将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配。
其中,刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果,这里的多维度为刑事文书的多个维度特征,例如,对于一篇刑事文书可以包括如下维度特征:罪名、主刑刑种、是否聋哑人、是否正当防卫、数罪并罚等,当然对于不同刑事案件所侧重的维度特征可能不相同,本发明实施例对维度特征的数量不进行限定。
可以理解的是,上述刑事文书检索库中的刑事文书可以通过网络爬虫爬取各个文书网站进行获取,还可以通过其他文书检索系统进行获取,本发明实施例对刑事文书检索库中的刑事文书获取方式不进行限定。
具体从多维度解析刑事文书的方法可以通过预先生成的文书解析系统对获取到的每篇刑事文书进行多维度解析,这里的文书解析系统主要用于提取刑事文书中不同的维度特征,进而解析不同维度特征得到维度特征对应的特征值,得到刑事文书的多维度解析结果。例如,对于一篇刑事文书提取到的维度特征有:罪名,刑事责任能力、是否正当防卫以及是否自首,不同维度特征对应的特征值有:罪名为贪污罪,刑事责任能力为限制刑事能力的精神病人,是否正当防卫为是,是否自首为是。
通过将刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配,能够提供不同刑事文书更全面的维度特征信息,这些维度特征信息用于反映刑事文书不同方面所侧重的内容,进而通过刑事文书检索库可以用户查找到刑事文书更全面的维度特征信息。
202、从所述刑事文书检索库中选取与刑事文书样本相似的刑事文书类案。
对于刑事文书检索库中的刑事文书与刑事文书样本中存在维度特征对应的特征值相匹配的情况,存在维度特征相匹配的数量越多,说明该刑事文书与刑事文书样本的相似度越高,对于本发明实施例,通常会优先从刑事文书检索库中筛选出与刑事文书样本中“罪名”、“犯罪主体数量”以及“主从犯关系”维度特征对应特征值匹配相一致的刑事文书类案优先筛选出来,然后再将刑事文书样本中其余各个维度特征对应的特征值与第二刑事文书集合中每篇刑事文书中相应维度特征对应的特征值进行匹配,从而根据匹配的维度特征数量来考虑是否优先推送该刑事文书类案。
203、从所述刑事文书类案中提取涉及定罪量刑的维度特征。
对于本发明实施例,可以预先确定所需要参考的刑事文书类案中涉及定罪量刑的维度特征,例如需要参考的涉及定罪量刑的维度特征为主刑刑种维度特征,进一步从每篇刑事文书类案中筛选出涉及定罪量刑的维度特征对应的特征值。
204、当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为数值型时,统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同数值的特征值进行排序。
其中,某一维度特征对应特征值的数据类型为数值型,说明该维度特征对应特征值为数字形式,例如,主刑刑期、附加刑罚金以及缓刑考验期维度特征,上述维度特征为时间或者金额等数字形式。
对于数值型维度特征对应的特征值,在统计刑事文书类案中用户需要参考涉及定罪量刑的维度特征对应的特征值之后,并对不同数值的特征值进行排序,例如,统计得到50篇刑事文书类案中主刑刑期维度特征对应的特征值,以月为最小单位对50个特征值由低到高进行排序,排序后的特征值分别为a1-a50,其中,a1为最小的特征值,a50为最大的特征值。
205、为排序后的特征值设置小于指定数量的安全窗口,滑动所述安全窗口,计算每次滑动后所述安全窗口内所对应特征值集合的方差。
由于排序后的特征值涉及到所有刑事文书类案中相应维度特征对应的特征值,通常情况下为了保证刑事文书样本量刑偏离判定的精确度,会为排序后的特征值设置小于指定数量的安全窗口,例如指定数量为50篇刑事文书类案,若置信度为90%,则安全窗口对应的区间中始终容纳[50*0.9]个数,安全窗口的大小设置为45,则对应安全窗口为[ai,aj],其中ai与aj为排序后的50篇刑事文书样本中相应维度特征对应的特征值,并且aj的特征值大于ai的特征值,j-i为45,具体安全窗口的大小跟设置的置信度有关,本发明实施例对安全窗口的大小不进行限定。
为了合理选取安全窗口内对应的特征值的分布范围,进一步滑动安全窗口,每次滑动安全窗口后窗口内所对应特征值有所改变,并计算每次滑动后安全窗口内所对应特征值集合的方差,从而根据方差来判断每次滑动后安全窗口内所对应特征值的波动程度。
206、选取所述方差最小值的安全窗口内所对应特征值的分布范围作为安全分布范围。
对于本发明实施例,方差越小说明该安全窗口内所对应特征值的波动较小,方差越大说明该安全窗口内所对应特征值的波动较大,通常情况下,在选取安全分布范围的时候会考虑特征值分布的稳定性,特征值分布的越稳定,说明特征值在该安全窗内的分布比较密集,因此,本发明实施例选取方差最小值的安全窗口内所对应特征值的分布范围作为安全分布范围。
207、通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否在所述安全分布范围内,对所刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定。
由于安全分布范围是通过统计指定数量刑事文书类案中涉及定罪量刑维度特征对应特征值的分布情况,该安全分布范围具有一定的参考价值,进一步通过比对刑事文书样本中涉及定罪量刑的某一维度特征对应的维度特征是否在安全分布范围内,能够辅助判断刑事文书样本在涉及定罪量刑的某一维度特征对应的特征值是否存在量刑偏离。
208a、若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不在安全分布范围内,则判定所述刑事文书样在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离。
对于刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值不在安全分布范围内,说明刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值偏离安全范围,判定刑事文书样本在涉及定罪量刑的该维度特征对应的特征值存在量刑偏离,以供用户参考,用户可以相应根据偏离情况来考虑是否调整刑事文书样本中涉及定罪量刑维度特征对应的特征值,通常情况,如果偏离值较大,可以将涉及定罪量刑维度特征对应的特征值调整靠近安全分布范围,如果偏离值较小,可以无需调整涉及定罪量刑维度特征对应的特征值。
相应地,与步骤208a对应的有步骤208b、若所述刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值在安全分布范围内,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
对于刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值在安全分布范围内,说明刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值处于安全范围,判定刑事文书样本在该维度特征对应的特征值不存在量刑偏离,以供用户参考,通常情况下用户无需调整刑事文书样本中涉及定罪量刑的该维度特征对应的特征值。
针对本发明实施例提供的另一种刑事文书量刑偏离的判定方法,当需要了解涉及定罪量刑的某一维度特征对应特征值为数值型数据时,通过设置安全分布范围来判断刑事文书样本中涉及定罪量刑的某一维度特征对应特征值是否在安全分布范围来进行量刑偏离的判定,无需用户逐个查找每篇刑事文书类案中涉及定罪量刑的某一维度特征以及逐个比对该维度特征对应的特征值,节省了刑事文书量刑偏离的判定时间,从而准确判定刑事文书样本的定罪量刑是否偏离,同时提高了判定结果的准确度。
以下为了更加详细地说明本发明提出的一种刑事文书量刑偏离的判定方法,特别是当涉及定罪量刑的某一维度特征对应特征值的数据类型为文本型时,如何统计刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况的步骤,本发明实施例还提供了另一种刑事文书量刑偏离的判定方法,如图3所示,该方法的具体的步骤包括:
301、将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配。
本步骤中的具体实现方式与步骤201的具体实现方式相同,在此不进行赘述。
302、从所述刑事文书检索库中选取与刑事文书样本相似的刑事文书类案。
在步骤202的基础上,需要说明的是,通常情况下,与刑事文书样本中其余各个维度特征对应的特征值与相匹配的维度特征数量越多,说明刑事文书类案与刑事文书样本的相似度越高,这里如果推送的刑事文书类案数量过多,可以优先选取指定数量与刑事文书样本相似度高的刑事文书类案。
303、从所述刑事文书类案中提取涉及定罪量刑的维度特征。
对于刑事文书检索库中的刑事文书与刑事文书样本中存在维度特征对应的特征值相匹配的时候,通常情况下,存在维度特征相匹配的数量越多,说明该刑事文书与刑事文书样本的相似度越高,对于本发明实施例,优先从刑事文书检索库中选取相似度高的刑事文书类案。
304、当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为文本型时,统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同文本的特征值进行归类。
其中,某一维度特征对应特征值的数据类型为文本型,说明该维度特征对应特征值为文本形式,例如,主刑刑种以及是否缓刑维度特征,上述维度特征为具体刑种或者是否等文字形式。
对于文本型维度特征对应的特征值,在统计刑事文书类案中用户需要参考涉及定罪量刑的维度特征对应的特征值之后,并对不同文字的特征值进行归类,例如,统计得到50篇刑事文书类案中主刑刑期维度特征对应的特征值,其中主刑刑种为管制的特征值为10篇刑事文书类案,主刑刑种为拘役的特征值为30篇刑事文书类案,主刑刑种为有期徒刑的特征值为10篇刑事文书类案,主刑刑种为无期徒刑的特征值为0篇刑事文书类案,主刑刑种为死刑的特征值为0篇刑事文书类案。
305、选取属于同一类别特征值占所有特征值的比例超过预设阈值对应的特征值作为安全特征值。
由于归类后的特征值涉及到所有刑事文书类案中相应维度特征对应的特征值,通常情况下为了保证刑事文书样本量刑偏离判定的精确度,会选取属于同一类别特征值占所有特征值的比例超过预设阈值对应的特征值作为安全特征值,这里预设预置通常占所有特征值的比例高于其他特征值占所有特征值的比例,通常选取比例超过一半对应的特征值作为安全特征值。
306、通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否为所述安全特征值,对所刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定。
由于安全特征值是通过统计指定数量刑事文书类案中涉及定罪量刑维度特征对应特征值的占比情况,该安全特征值具有一定的参考价值,进一步通过比对刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值是否为安全特征值,能够辅助判断刑事文书样本是否属于偏离案件。
307a、若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不是安全特征值,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离。
对于刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值不是安全特征值,说明刑事文书样本中涉及定罪量刑维度特征对应的特征值偏离安全特征值,判定刑事文书样本属于偏离案件,以供用户参考,用户可以相应根据偏离情况来考虑是否调整刑事文书样本中涉及定罪量刑维度特征对应的特征值,通常情况,如果安全特征值占比较高,则说明特征值参考价值较高,可以将涉及定罪量刑维度特征对应的特征值调整为安全特征值,如果安全特征值占比刚超过一半,可以无需调整涉及定罪量刑维度特征对应的特征值。
相应地,与步骤307a对应的有步骤307b、若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是安全特征值,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
对于刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值为安全特征值,说明刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值属于安全特征值,判定刑事文书样本在涉及定罪量刑的某一维度特征对应的特征值不存在量刑偏离,以供用户参考,通常情况下用户无需调整刑事文书样本中涉及定罪量刑的该维度特征对应的特征值。
针对本发明实施例提供的另一种刑事文书量刑偏离的判定方法,当需要了解涉及定罪量刑的某一维度特征对应特征值为文本型数据时,通过确定的安全特征值来判断刑事文书样本中涉及定罪量刑的某一维度特征对应特征值是否为安全特征值来进行量刑偏离的判定,无需用户逐个查找每篇刑事文书类案中涉及定罪量刑的某一维度特征以及逐个比对该维度特征对应的特征值,节省了刑事文书量刑偏离的判定时间,从而准确判定刑事文书样本的定罪量刑是否偏离,同时提高了判定结果的准确度。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的刑事文书量刑偏离的判定方法。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的刑事文书量刑偏离的判定方法。
进一步的,作为对上述图1所示方法的实现,本发明另一实施例还提供了一种刑事文书量刑偏离的判定装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。该装置用于从不同维度对刑事文书类案进行量刑偏离判定,提高量刑偏离判定的准确度,具体如图4所示,该装置包括:
第一获取单元31,可以用于获取指定数量与刑事文书样本相似的刑事文书类案;
提取单元32,可以用于从所述刑事文书类案中提取涉及定罪量刑的维度特征;
统计单元33,可以用于统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况;
判定单元34,可以用于根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定。
针对本发明的实施例提供了一种刑事文书量刑偏离的判定装置,首先获取与刑事文书样本形似的刑事文书类案,然后从刑事文书类案中提取涉及定罪量刑的维度特征,通过查看刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况,对刑事文书样本中各个维度特征对应的特征值进行量刑偏离的判定,能够快速判断刑事文书样本的定罪量刑是否偏离于刑事文书类案的定罪量刑,进一步为用户提供参考。与现有技术中通过逐个查看每篇推送的刑事文书类案中的判决记录来进行刑事文书量刑偏离的判定方法相比,本发明实施例通过获取指定数量与刑事文书样本相似的刑事文书类案,该刑事文书类案可以从多维度获取与刑事文书样本相匹配,保证了获取到的刑事文书类案具有较高的参考价值,通过从刑事文书类案中提取涉及定罪量刑的维度特征,能够得到涉及定罪量刑的维度特征对应特征值的分布情况,进而将刑事文书样本中涉及定罪量刑的维度特征对应特征值直接与统计刑事文书类案中涉及定罪量刑的维度特征对应特征值所得到的分布情况进行比对,无需用户逐个查找每篇刑事文书类案中涉及定罪量刑的各个维度特征以及逐个比对各个维度特征对应的特征值,节省了刑事文书量刑偏离的判定时间,从而准确判定刑事文书样本的定罪量刑是否偏离,同时提高了判定结果的准确度。
进一步的,作为对上述图2所示方法的实现,本发明另一实施例还提供了一种刑事文书量刑偏离的判定装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图5所示,
所述装置还包括:第二获取单元35,可以用于获取所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的数据类型。
进一步地,所述第一获取单元31包括:
匹配模块311,可以用于将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
第二选取模块312,可以用于从所述刑事文书检索库中选取指定数量与刑事文书样本相似的刑事文书类案。
进一步地,所述匹配模块311,具体可以用于从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
所述匹配模块311,具体还可以用于从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
所述匹配模块311,具体还可以用于将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述第二刑事文书集合中每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述第二选取模块312,具体可以用于将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
所述第二选取模块312,具体还可以用于当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
所述第二选取模块312,具体还可以用于根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
所述第二选取模块312,具体还可以用于按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述第二选取模块312,具体还可以用于判断所述待推送刑事文书的数量是否大于指定数量;
所述第二选取模块312,具体还可以用于若所述待推送刑事文书的数量大于指定数量,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
所述第二选取模块312,具体还可以用于若所述待推送刑事文书的数量不大于指定数量,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
进一步地,当所述涉及定罪量刑的维度特征对应特征值的数据类型为数值型时,所述统计单元33包括:
第一统计模块331,可以用于统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同数值的特征值进行排序;
计算模块332,可以用于为排序后的特征值设置小于指定数量的安全窗口,滑动所述安全窗口,计算每次滑动后所述安全窗口内所对应特征值集合的方差;
第一选取模块333,可以用于选取所述方差最小值的安全窗口内所对应特征值的分布范围作为安全分布范围。
进一步地,所述判定单元34包括:
比对模块341,可以用于通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否在所述安全分布范围内,对所刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;
判定模块342,可以用于若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不在安全分布范围内,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;
所述判定模块342,还可以用于若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值在安全分布范围内,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
针对本发明实施例提供的另一种刑事文书量刑偏离的判定装置,当需要了解涉及定罪量刑的某一维度特征对应特征值为数值型数据时,通过设置安全分布范围来判断刑事文书样本中涉及定罪量刑的某一维度特征对应特征值是否在安全分布范围来进行量刑偏离的判定,无需用户逐个查找每篇刑事文书类案中涉及定罪量刑的某一维度特征以及逐个比对该维度特征对应的特征值,节省了刑事文书量刑偏离的判定时间,从而准确判定刑事文书样本的定罪量刑是否偏离,同时提高了判定结果的准确度。
作为对上述图3所示方法的实现,本发明另一实施例还提供了一种刑事文书量刑偏离的判定装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图6所示,
所述装置还包括:第二获取单元35,可以用于获取所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的数据类型。
进一步地,所述获取单元31包括:
匹配模块311,可以用于将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
第二选取模块312,可以用于从所述刑事文书检索库中选取指定数量与刑事文书样本相似的刑事文书类案;
进一步地,所述匹配模块311,具体可以用于从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
所述匹配模块311,具体还可以用于从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
所述匹配模块311,具体还可以用于将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述第二刑事文书集合中每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述第二选取模块312,具体可以用于将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
所述第二选取模块312,具体还可以用于当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
所述第二选取模块312,具体还可以用于根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
所述第二选取模块312,具体还可以用于按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述第二选取模块312,具体还可以用于判断所述待推送刑事文书的数量是否大于指定数量;
所述第二选取模块312,具体还可以用于若所述待推送刑事文书的数量大于指定数量,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
所述第二选取模块312,具体还可以用于若所述待推送刑事文书的数量不大于指定数量,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
进一步地,当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为文本型时,所述统计单元33包括:
第二统计模块334,可以用于统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同文本的特征值进行归类;
第三选取模块335,可以用于选取属于同一类别特征值占所有特征值的比例超过预设阈值对应的特征值作为安全特征值。
进一步地,所述判定单元34包括:
比对模块341,可以用于通过比对所述刑事文书样本中涉及定罪量刑的某一维度特征对应的特征值是否为所述安全特征值,对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;
判定模块342,可以用于若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不是安全特征值,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;
所述判定模块342,还可以用于若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是安全特征值,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
针对本发明实施例提供的另一种刑事文书量刑偏离的判定装置,当需要了解涉及定罪量刑的某一维度特征对应特征值为文本型数据时,通过确定的安全特征值来判断刑事文书样本中涉及定罪量刑的某一维度特征对应特征值是否为安全特征值来进行量刑偏离的判定,无需用户逐个查找每篇刑事文书类案中涉及定罪量刑的某一维度特征以及逐个比对该维度特征对应的特征值,节省了刑事文书量刑偏离的判定时间,从而准确判定刑事文书样本的定罪量刑是否偏离,同时提高了判定结果的准确度。
所述刑事文书量刑偏离的判定装置包括处理器和存储器,上述第一获取单元31、提取单元32、统计单元33和判定单元34等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来从不同维度对刑事文书类案进行量刑偏离判定,提高量刑偏离判定的准确度。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述刑事文书量刑偏离的判定方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述刑事文书量刑偏离的判定方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
一种刑事文书量刑偏离的判定方法,包括:获取与刑事文书样本相似的刑事文书类案;从所述刑事文书类案中提取涉及定罪量刑的维度特征;统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况;根据所述分布情况对所述刑事文书样本中各个涉及定罪量刑的维度特征对应特征值进行量刑偏离的判定。
进一步地,在所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况之前,所述方法还包括:获取所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的数据类型。
进一步地,当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为数值型时,所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况包括:统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同数值的特征值进行排序;为排序后的特征值设置小于指定数量的安全窗口,滑动所述安全窗口,计算每次滑动后所述安全窗口内所对应特征值集合的方差;选取所述方差最小值的安全窗口内所对应特征值的分布范围作为安全分布范围。
进一步地,所述根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定包括:通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否在所述安全分布范围内,对所刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不在安全分布范围内,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;否则,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
进一步地,当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为文本型时,所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况包括:统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同文本的特征值进行归类;选取属于同一类别特征值占所有特征值的比例超过预设阈值对应的特征值作为安全特征值。
进一步地,所述根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定包括:通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否为所述安全特征值,对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不是安全特征值,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;否则,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
进一步地,所述获取与刑事文书样本相似的刑事文书类案包括:将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;从所述刑事文书检索库中选取与刑事文书样本相似的刑事文书类案。
进一步地,所述将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配包括:从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述第二刑事文书集合中每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述按照所述最终排序结果将待推送刑事文书作为输出的推送文书包括:判断所述待推送刑事文书的数量是否大于指定数量;若是,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;否则,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取与刑事文书样本相似的刑事文书类案;从所述刑事文书类案中提取涉及定罪量刑的维度特征;统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况;根据所述分布情况对所述刑事文书样本中各个涉及定罪量刑的维度特征对应特征值进行量刑偏离的判定。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (12)
1.一种刑事文书量刑偏离的判定方法,其特征在于,包括:
获取与刑事文书样本相似的刑事文书类案;
从所述刑事文书类案中提取涉及定罪量刑的维度特征;
统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,通过统计特征值对应多种情况的占比得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况;
当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为数值型时,所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况包括:统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同数值的特征值进行排序;为排序后的特征值设置小于指定数量的安全窗口,滑动所述安全窗口,计算每次滑动后所述安全窗口内所对应特征值集合的方差;选取所述方差最小值的安全窗口内所对应特征值的分布范围作为安全分布范围;
根据所述分布情况中的安全分布范围或安全特征值对所述刑事文书样本中各个涉及定罪量刑的维度特征对应特征值进行量刑偏离的判定。
2.根据权利要求1所述的方法,其特征在于,在所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况之前,所述方法还包括:
获取所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的数据类型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定包括:
通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否在所述安全分布范围内,对所刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;
若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不在安全分布范围内,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;
否则,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
4.根据权利要求2所述的方法,其特征在于,当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为文本型时,所述统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况包括:
统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同文本的特征值进行归类;
选取属于同一类别特征值占所有特征值的比例超过预设阈值对应的特征值作为安全特征值。
5.根据权利要求4所述的方法,其特征在于,所述根据所述分布情况对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定包括:
通过比对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值是否为所述安全特征值,对所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应特征值进行量刑偏离的判定;
若所述刑事文书样本中涉及定罪量刑的所述某一维度特征对应的特征值不是安全特征值,则判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值存在量刑偏离;
否则,判定所述刑事文书样本在涉及定罪量刑的所述某一维度特征对应的特征值不存在量刑偏离。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述获取与刑事文书样本相似的刑事文书类案包括:
将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
从所述刑事文书检索库中选取与刑事文书样本相似的刑事文书类案。
7.根据权利要求6所述的方法,其特征在于,所述将所述刑事文书样本与刑事文书检索库中的不同刑事文书进行多维度匹配包括:
从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述第二刑事文书集合中每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
8.根据权利要求7所述的方法,其特征在于,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:
将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
9.根据权利要求8所述的方法,其特征在于,所述按照所述最终排序结果将待推送刑事文书作为输出的推送文书包括:
判断所述待推送刑事文书的数量是否大于指定数量;
若是,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
否则,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
10.一种刑事文书量刑偏离的判定装置,其特征在于,包括:
第一获取单元,用于获取指定数量与刑事文书样本相似的刑事文书类案;
提取单元,用于从所述刑事文书类案中提取涉及定罪量刑的维度特征;
统计单元,用于统计所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值,通过统计特征值对应多种情况的占比得到所述刑事文书类案中涉及定罪量刑的各个维度特征对应特征值的分布情况;
当所述涉及定罪量刑的某一维度特征对应特征值的数据类型为数值型时,所述统计单元包括:第一统计模块,用于统计刑事文书类案中各个类案在涉及定罪量刑的所述某一维度特征对应的特征值,并对不同数值的特征值进行排序;计算模块,用于为排序后的特征值设置小于指定数量的安全窗口,滑动所述安全窗口,计算每次滑动后所述安全窗口内所对应特征值集合的方差;第一选取模块,用于选取所述方差最小值的安全窗口内所对应特征值的分布范围作为安全分布范围;
判定单元,用于根据所述分布情况中的安全分布范围或安全特征值对所述刑事文书样本中涉及定罪量刑的各个维度特征对应特征值进行量刑偏离的判定。
11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求9中任意一项所述的刑事文书量刑偏离的判定方法。
12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至权利要求9中任意一项所述的刑事文书量刑偏离的判定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710754390.5A CN109426905B (zh) | 2017-08-29 | 2017-08-29 | 一种刑事文书量刑偏离的判定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710754390.5A CN109426905B (zh) | 2017-08-29 | 2017-08-29 | 一种刑事文书量刑偏离的判定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109426905A CN109426905A (zh) | 2019-03-05 |
CN109426905B true CN109426905B (zh) | 2022-03-18 |
Family
ID=65502564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710754390.5A Active CN109426905B (zh) | 2017-08-29 | 2017-08-29 | 一种刑事文书量刑偏离的判定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109426905B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472048A (zh) * | 2019-07-19 | 2019-11-19 | 平安科技(深圳)有限公司 | 一种辅助判决方法、装置及终端设备 |
CN110738039B (zh) * | 2019-09-03 | 2023-04-07 | 平安科技(深圳)有限公司 | 一种案件辅助信息的提示方法、装置、存储介质和服务器 |
CN112561219A (zh) * | 2019-09-25 | 2021-03-26 | 北京国双科技有限公司 | 裁判文书的处理方法、装置、计算机设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187927A (zh) * | 2007-12-17 | 2008-05-28 | 电子科技大学 | 一种刑事案件的串并案智能分析方法 |
US7522060B1 (en) * | 2005-04-25 | 2009-04-21 | Anytransactions, Inc. | Graduated sanction/progressive response system and method for automated monitoring, scheduling and notification |
CN101567069A (zh) * | 2009-05-27 | 2009-10-28 | 瑞迪法证风险管理科技(北京)有限公司 | 一种法律风险测评数据处理方法和查询系统 |
CN106815207A (zh) * | 2015-12-01 | 2017-06-09 | 北京国双科技有限公司 | 用于法律裁判文书的信息处理方法及装置 |
CN106991092A (zh) * | 2016-01-20 | 2017-07-28 | 阿里巴巴集团控股有限公司 | 基于大数据挖掘相似裁判文书的方法和设备 |
CN107092929A (zh) * | 2017-04-19 | 2017-08-25 | 广州可度析信息科技有限公司 | 基于聚类技术的刑事犯罪案件关联串并方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090271238A1 (en) * | 2008-04-04 | 2009-10-29 | Eagle Intelligence Llc | System and method of managing a workflow within and between a criminal case management side and a criminal intelligence management side in the justice and public safety domain |
-
2017
- 2017-08-29 CN CN201710754390.5A patent/CN109426905B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7522060B1 (en) * | 2005-04-25 | 2009-04-21 | Anytransactions, Inc. | Graduated sanction/progressive response system and method for automated monitoring, scheduling and notification |
CN101187927A (zh) * | 2007-12-17 | 2008-05-28 | 电子科技大学 | 一种刑事案件的串并案智能分析方法 |
CN101567069A (zh) * | 2009-05-27 | 2009-10-28 | 瑞迪法证风险管理科技(北京)有限公司 | 一种法律风险测评数据处理方法和查询系统 |
CN106815207A (zh) * | 2015-12-01 | 2017-06-09 | 北京国双科技有限公司 | 用于法律裁判文书的信息处理方法及装置 |
CN106991092A (zh) * | 2016-01-20 | 2017-07-28 | 阿里巴巴集团控股有限公司 | 基于大数据挖掘相似裁判文书的方法和设备 |
CN107092929A (zh) * | 2017-04-19 | 2017-08-25 | 广州可度析信息科技有限公司 | 基于聚类技术的刑事犯罪案件关联串并方法及系统 |
Non-Patent Citations (1)
Title |
---|
计算机辅助量刑系统的设想;许伟雄;许伟凌;;《电脑知识与技术》;20180225(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109426905A (zh) | 2019-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509482B (zh) | 问题分类方法、装置、计算机设备和存储介质 | |
CN109426905B (zh) | 一种刑事文书量刑偏离的判定方法及装置 | |
CN108038627B (zh) | 一种对象评估方法及装置 | |
CN110019785B (zh) | 一种文本分类方法及装置 | |
US20080282184A1 (en) | Information handling | |
CN108446295B (zh) | 信息检索方法、装置、计算机设备和存储介质 | |
CN111428466B (zh) | 法律文书解析方法及装置 | |
CN110032721B (zh) | 一种裁判文书推送方法及装置 | |
CN111506727A (zh) | 文本内容类别获取方法、装置、计算机设备和存储介质 | |
CN114139539A (zh) | 企业社会责任指标量化方法、系统及应用 | |
CN117195250A (zh) | 一种数据安全管理方法及系统 | |
CN107908649B (zh) | 一种文本分类的控制方法 | |
Howard et al. | The effect of ethnicity, gender, eye color and wavelength on the biometric menagerie | |
CN112199388A (zh) | 陌电识别方法、装置、电子设备及存储介质 | |
CN114817518B (zh) | 基于大数据档案识别的证照办理方法、系统及介质 | |
CN111428041B (zh) | 案件摘要生成方法、装置、系统和存储介质 | |
Balasubramanian et al. | Leaders or followers? A temporal analysis of tweets from IRA trolls | |
US20170293863A1 (en) | Data analysis system, and control method, program, and recording medium therefor | |
CN111881170B (zh) | 时效性查询内容字段挖掘方法、装置、设备和存储介质 | |
CN114021716A (zh) | 一种模型训练的方法、系统及电子设备 | |
Ghawi et al. | Analysis of country mentions in the debates of the un security council | |
CN113129057A (zh) | 软件造价信息的处理方法、装置、计算机设备及存储介质 | |
CN112668302A (zh) | 虚假诉讼的判断方法及装置 | |
de Jongh et al. | Performance evaluation of automated fingerprint identification systems for specific conditions observed in casework using simulated fingermarks | |
CN110909533B (zh) | 资源主题判定方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |