CN110019697A - 一种刑事文书的推送方法及装置 - Google Patents

一种刑事文书的推送方法及装置 Download PDF

Info

Publication number
CN110019697A
CN110019697A CN201710754384.XA CN201710754384A CN110019697A CN 110019697 A CN110019697 A CN 110019697A CN 201710754384 A CN201710754384 A CN 201710754384A CN 110019697 A CN110019697 A CN 110019697A
Authority
CN
China
Prior art keywords
criminal
document
push
sample
dimensional characteristics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710754384.XA
Other languages
English (en)
Inventor
石鹏
赵健
付梦娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710754384.XA priority Critical patent/CN110019697A/zh
Publication of CN110019697A publication Critical patent/CN110019697A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种刑事文书的推送方法及装置,涉及计算机技术领域,主要目的在于从多维度进行相似刑事文书的匹配,提高刑事文书推送的精准度,本发明的主要技术方案为:响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果;将所述刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;从所述刑事文书检索库中选取指定数量匹配结果符合预设条件的刑事文书作为输出的推送文书。本发明主要用于相似刑事文书的推送。

Description

一种刑事文书的推送方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种刑事文书的推送方法及装置。
背景技术
刑事文书是指公安(含国家安全机关)、检察、法院、司法行政等机关依法制作或发布的有关处理刑事案件的具有法律效力或法律意义的司法公文。通常法官在进行刑事案件审理的过程中,对于定罪量刑具有一定的自由裁判权,当需要执行自由裁判权时,法官可以使用两种解决方式,一种是向其他审理过类似案件的法官请教,但是该方法主观性较强,并且无法保证判决和大部分的类似案件判决的一致性,进而可能降低法官案件审理的工作效率;另一种是通过文书网站进行关键词检索类似刑事案件,但是现有的文书检索网站根本无法推送满足法官检索需求的刑事文书。同样的,当刑事辩护律师不确定自己承办的案件是否应当为当事人做自首辩护以减轻罪行时,也需要参考文书网站推送类似的刑事案件。
现有的刑事文书的推送方法主要是在用户输入关键词进行查询后,检索系统对输入的关键词进行查询,并与检索库中的刑事文书依次匹配后,将匹配结果靠前的若干刑事文书推送给用户,然而,通过关键词匹配方法仅仅是获取关键词匹配一致的刑事文书推送给用户,关键词并不能体现刑事文书的所有内容,使得推送的刑事文书往往不符合用户需求,参考价值较低。
发明内容
有鉴于此,本发明提供一种刑事文书的推送方法及装置,主要目的在于从多维度进行相似刑事文书的匹配,提高刑事文书推送的精准度。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明实施例提供了一种刑事文书的推送方法,包括:
响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果;
将所述刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
进一步地,所述刑事文书检索库通过如下步骤建立:
通过网络爬虫获取不同刑事文书,并将不同刑事文书存储至刑事文书库中;
从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果;
根据刑事文书库中每篇刑事文书的多维度解析结果,建立刑事文书检索库。
进一步地,所述从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果包括:
根据所述每篇刑事文书的文书特征确定所述每篇刑事文书对应的多个维度特征;
从所述刑事文书库中的每篇刑事文书中提取出各个维度特征对应的特征值,获取每篇刑事文书的多维度解析结果。
进一步地,所述将所述刑事文书样本的解析结果与所述刑事文书检索库中不同刑事文书的解析结果进行多维度匹配包括:
从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:
将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述按照所述最终排序结果将待推送刑事文书作为输出的推送文书包括:
判断所述待推送刑事文书的数量是否大于指定数量;
若是,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
否则,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
进一步地,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:
将所述待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
当所述待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,将每篇量刑情节维度特征匹配数量相同的待推送刑事文书与所述刑事文书样本进行全文相似度匹配;
根据所述全文相似度匹配由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
选取所述最终排序结果靠前的指定数量的待推送刑事文书作为输出的推送文书。
为了实现上述目的,根据本发明的另一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的刑事文书的推送方法。
为了实现上述目的,根据本发明的另一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的刑事文书的推送方法。
另一方面,本发明实施例还提供了一种刑事文书的推送装置,包括:
解析单元,用于响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果;
匹配单元,用于将所述刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
选取单元,用于从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
进一步地,所述刑事文书检索库通过建立单元建立,所述建立单元包括:
存储模块,用于通过网络爬虫获取不同刑事文书,并将不同刑事文书存储至刑事文书库中;
解析模块,用于从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果;
建立模块,用于根据刑事文书库中每篇刑事文书的多维度解析结果,建立刑事文书检索库。
进一步地,所述解析模块,具体用于根据所述刑事文书的文书特征确定所述刑事文书对应的多个维度特征;
所述解析模块,具体还用于从所述刑事文书库中的每篇刑事文书中提取出各个维度特征对应的特征值,获取每篇刑事文书的多维度解析结果。
进一步地,所述匹配单元包括:
第一筛选模块,用于从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
第二筛选模块,用于从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
第一匹配模块,用于将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述选取单元包括:
第一排序模块,用于将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
查找模块,用于当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
第二排序模块,用于根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
第一选取模块,用于按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述第一选取模块,具体用于判断所述待推送刑事文书的数量是否大于指定数量;
所述第一选取模块,具体还用于所述待推送刑事文书的数量大于指定数量,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
所述第一选取模块,具体还用于所述待推送刑事文书的数量小于或等于指定数量,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
进一步地,所述选取单元还包括:
第三排序模块,用于将所述待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
第二匹配模块,用于当所述待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,将每篇量刑情节维度特征匹配数量相同的待推送刑事文书与所述刑事文书样本进行全文相似度匹配;
第四排序模块,用于根据所述全文相似度匹配由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
第二选取模块,用于选取所述最终排序结果靠前的指定数量的待推送刑事文书作为输出的推送文书。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例提供的一种刑事文书的推送方法及装置,通过刑事文书检索库来存储不同刑事文书的多维度解析结果,以便于当用户发送推送请求时,先从多维度解析推送请求携带的刑事文书样本,进而将刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,从而提高待推送刑事文书与刑事文书样本的相似度,进一步从刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为推送文书,保证推送的刑事文书符合用户需求。与现有技术中通过关键词匹配来实现刑事文书的推送方法相比,本发明实施例通过预先创建包含有不同刑事文书多维度解析结果的刑事文书检索库,能够提供不同刑事文书更全面的维度特征信息,当用户通过刑事文书检索库请求推送与刑事文书样本相似的刑事文书时,无需用户费力输入任何关键词,通过将刑事文书样本与刑事文书检索库中存储的不同刑事文书进行多维度匹配,可以从多维度获取与刑事文书样本相匹配的待推送刑事文书,大幅度提高了推送刑事文书的准确度,使得推送的刑事文书更具有参考性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的一种刑事文书的推送方法流程图;
图2为本发明实施例提供的刑事文书检索库建立方法流程图;
图3为本发明实施例提供的另一种刑事文书的推送方法流程图;
图4为本发明实施例提供的一种刑事文书的推送装置的组成框图;
图5为本发明实施例提供的另一种刑事文书的推送装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种刑事文书的推送方法,如图1所示,该方法通过将刑事文书样本与包含有不同刑事文书多维度解析结果刑事文书检索库中的刑事文书进行多维度匹配,得到推送准确度更高的刑事文书,使得推送的刑事文书更具有参考性,对此本发明实施例提供以下具体步骤:
101、响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果。
其中,推送请求为用户发送的需要请求推送与刑事文书样本相似的刑事文书,并且该推送请求会携带有刑事文书样本,这里的刑事文书样本通常为用户在实际刑事案件中遇到问题的刑事文书,此时需要检索系统为用户推送与刑事文书样本相似的案例进行参考,在接收到用户的推送请求后,为了可以从多维度找到与刑事文书样本相似的案例,进一步从多维度解析刑事文书样本,得到刑事文书样本的解析结果。
具体从多维度解析刑事文书的方法可以通过预先生成的文书解析系统对获取到的每篇刑事文书进行多维度解析,这里的文书解析系统主要用于提取刑事文书中不同的维度特征,进而解析各个维度特征得到维度特征对应的特征值,得到刑事文书的多维度解析结果。例如,对于一篇刑事文书提取到的维度特征有:罪名,刑事责任能力、是否正当防卫以及是否自首,各个维度特征对应的特征值有:罪名为贪污罪,刑事责任能力为限制刑事能力的精神病人,是否正当防卫为是,是否自首为是。
本发明实施例通过多维度解析刑事文书样本,能够提供刑事文书样本更全面的维度特征信息,进而方便用户了解刑事文书样内容。
102、将所述刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配。
其中,刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果,这里的多维度为刑事文书的多个维度特征,例如,对于一篇刑事文书可以包括如下维度特征:罪名、主刑刑种、是否聋哑人、是否正当防卫、数罪并罚等,当然对于不同刑事案件所侧重的维度特征可能不相同,本发明实施例对维度特征的数量不进行限定。
可理解的是,本发明实施例中的刑事文书检索库包含有不同刑事文书多维度解析结果,能够提供不同刑事文书更全面的维度特征信息,这些维度特征信息用于反映刑事文书不同方面所侧重的内容,进而通过刑事文书检索库可以用户查找到刑事文书更全面的维度特征信息。
需要说明的是,上述刑事文书检索库中的刑事文书可以通过网络爬虫爬取各个文书网站进行获取,还可以通过其他文书检索系统进行获取,本发明实施例对刑事文书检索库中的刑事文书获取方式不进行限定。
由于解析结果为从各个维度特征来描述刑事文书,每一个维度特征对应有相应的特征值,这里每个维度特征对应的特征值能够从不同方面反映刑事文书样本的内容,本发明实施例主要将刑事文书样本中各个维度特征对应的特征值与刑事文书检索库中每篇刑事文书中相应维度特征对应的特征值相匹配,例如刑事文书样本中罪名维度特征对应的特征值为故意伤人,而刑事文书检索库中某一篇刑事文书中相应罪名维度特征对应的特征值也为故意伤人,则说明该刑事文书检索库中某一篇刑事文书在罪名维度特征对应的特征值与刑事文书样本中的罪名维度特征相匹配,同理对于刑事文书中的其他维度特征采用相同的匹配方式。
对于本发明实施例,通过将刑事文书的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,进一步从刑事文书检索库中不同刑事文书的解析结果中找到与刑事文书样本的解析结果多维度相匹配的刑事文书,相匹配维度特征的数量越多,说明与刑事文书样本的匹配度越高,具有更高的推送价值。
103、从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
其中,匹配结果可以为刑事文书与刑事文书样本所有维度特征对应的特征值均不匹配,说明该刑事文书与刑事文书样本的相似度很低,还可以为刑事文书与刑事文书样本中部分维度特征对应的特征值相匹配,说明该刑事文书与刑事文书样本有一定的相似度,还可以为刑事文书与刑事文书样本中所有维度特征相匹配,则说明该刑事文书与刑事文书样本的相似度较高。需要说明的是,通常情况会首先从刑事文书检索库中筛选出与刑事文书样本中“罪名”维度特征对应的特征值相匹配的第一刑事文书集合,当然这里的第一刑事文书集合中一般都会包括大量的刑事文书,然后再从第一刑事文书集合中筛选出与刑事文书样本中“犯罪主体数量”以及“主从犯关系”维度特征对应的特征值相匹配的第二刑事文书集合,当然这里的第二刑事文书集合中一般也会包括大量的刑事文书,再将刑事文书样本中其余各个维度特征对应的特征值与第二刑事文书集合中每篇刑事文书中相应维度特征对应的特征值进行匹配,进而得到与刑事文书样本相似的刑事文书类案。
在得到第二刑事文书集合后,优选如下两种对待推送刑事文书进行排序的方式:
一种是将各待推送刑事文书按照与刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;当两篇以上待推送刑事文书与刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;根据最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果。
另一种是将各待推送刑事文书按照与刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;当待推送刑事文书与刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,将每篇量刑情节维度特征匹配数量相同的待推送刑事文书与刑事文书样本进行全文相似度匹配;根据全文相似度匹配由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果。
当然,对第二刑事文书集合还可以有其他的排序方式,例如,可以是将各待推送刑事文书按照与刑事文书样本中匹配相一致维度特征的数量由多至少进行排序,当两篇以上待推送刑事文书与刑事文书样本中匹配相一致维度特征的数量相同时,对其中每篇维度特征匹配数量相同的刑事文书类案与刑事文书样本进行全文相似度匹配,进而根据全文相似度匹配由高至低对维度特征匹配数量相同的刑事文书类案进行排序,得到最终排序结果。还可以是将各待推送刑事文书按照与刑事文书样本中匹配相一致维度特征的数量由多至少进行排序,当两篇以上待推送刑事文书与刑事文书样本中匹配相一致维度特征的数量相同时,查找每篇维度特征匹配数量相同的刑事文书类案中匹配相一致的维度特征的最高基础得分,进而根据最高基础得分由高至低对维度特征匹配数量相同的刑事文书类案进行排序,得到最终排序结果。根据本申请公开内容的启示,本领域技术人员还可以得出很多种其他排序方式,本实施例不一一列举
针对本发明的实施例提供的一种刑事文书的推送方法,通过刑事文书检索库来存储不同刑事文书的多维度解析结果,以便于当用户发送推送请求时,先从多维度解析推送请求携带的刑事文书样本,进而将刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,从而提高待推送刑事文书与刑事文书样本的相似度,进一步从刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为推送文书,保证推送的刑事文书符合用户需求。与现有技术中通过关键词匹配来实现刑事文书的推送方法相比,本发明实施例通过预先创建包含有不同刑事文书多维度解析结果的刑事文书检索库,能够提供不同刑事文书更全面的维度特征信息,当用户通过刑事文书检索库请求推送与刑事文书样本相似的刑事文书时,无需用户费力输入任何关键词,通过将刑事文书样本与刑事文书检索库中存储的不同刑事文书进行多维度匹配,可以从多维度获取与刑事文书样本相匹配的待推送刑事文书,大幅度提高了推送刑事文书的准确度,使得推送的刑事文书更具有参考性。
以下为了更加详细地说明本发明提出的一种刑事文书的推送方法,尤其是刑事文书检索库的建立步骤,如图2所示,建立刑事文书检索库方法的具体的步骤包括:
201、通过网络爬虫获取不同刑事文书,并将不同刑事文书存储至刑事文书库中。
其中,网络爬虫是按照一定的规则,自动地抓取万维网信息的程序或者脚本,它通常以一个页面的URL为入口,爬取该页面中的URL链接,并不断的从当前页面上抽取新的URL链接放入到待爬取队列,直到满足系统设置的停止条件。
通过网络爬虫可以自动爬取到不同文书网站或者文书检索网站中的刑事文书,进一步将爬取到的刑事文书存储到刑事文书库中,这里的刑事文书库相当于刑事文书集合,汇集了不同文书网站以及不同文书检索网站内的刑事文书,以便于后续用户从该刑事文书集合中查找相似文书。
202、从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果。
由于刑事文书是司法文书中的一种,也对应有相应的文书特征,如在叙写刑事类案件的案情叙述时,要求写明作案的时间、地点、作案人和被告人、作案的目的、动机、情节、手段以及证据等内容,如在第一审刑事判决书叙写事实时,应当写明案件发生的时间、地点、被告人的动机、目的、手段、实施行为的过程、危害结果以及被告人在案发后的表现等内容,虽然不同刑事文书的内容有所不同,但对应维度特征大体是相同的,通常情况下,每篇刑事文书至少包括但不限于以下维度特征的多个或全部:犯罪罪名、主刑刑种、刑事责任能力、是否为精神病人、是否为聋哑人、是否为正当防卫、是否为紧急避险、是否为自首、是否为立功、刑事责任年龄、是否为数罪并罚、是否为共同犯罪等,因此在进行多维度刑事文书解析的过程中,首先需要根据刑事文书的文书特征确定刑事文书对应的多个维度特征,当然本发明实施例对于不同刑事文书中的维度特征数量不进行限定,对于简单的刑事文书可以确定较少数量的维度特征,对于复杂的刑事文书可以确定较多数量的维度特征,具体可以根据用户所需要检索的刑事文书内容进行确定。另外,由于每个维度特征对应的特征值可能相同也可能不同,例如有的刑事文书中刑事责任能力维度特征对应的特征值为限制刑事责任能力人,有的刑事文书中刑事责任能力维度特征对应的特征值为完全无刑事责任能力人,然后从刑事文书库中的每篇刑事文书中提取出各个维度特征对应的特征值,从而获取每篇刑事文书的多维度解析结果。
203、根据刑事文书库中每篇刑事文书的多维度解析结果,建立刑事文书检索库。
在解析得到刑事文书库中每篇刑事文书的多维度解析结果后,将每篇刑事文书的多维度解析结果存储至刑事文书检索库中,该刑事文书检索库能够从各个维度特征描述每篇刑事文书的内容,示例性的,如表1所示,这里为了便于展示,表1中仅仅示出了刑事文书检索库中5篇刑事文书中部分维度特征的解析结果,并非的刑事文书检索库中全部刑事文书以及全部的维度特征。
表1 刑事文书检索库
序号 罪名 主刑刑种 自首 共同犯罪 数罪并罚 犯罪形态
1 抢劫 拘役 主犯 犯罪未遂
2 盗窃 管制 从犯 犯罪预备
3 杀人 无期徒刑 主犯 犯罪中止
4 贿赂 有期徒刑 主犯 犯罪未遂
5 贪污 有期徒刑 从犯 犯罪既遂
…… …… …… …… …… …… ……
对于本发明实施例,通过建立刑事文书检索库,能够提供不同刑事文书更全面的维度特征信息,这些维度特征信息用于反映刑事文书不同方面所侧重的内容,进而通过刑事文书检索库可以用户查找到刑事文书更全面的维度特征信息。
以下为了更加详细地说明本发明提出的一种刑事文书的推送方法,特别是从刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书的步骤,本发明实施例还提供了另一种刑事文书的推送方法,如图3所示,该方法的具体的步骤包括:
301、响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果。
其中,推送请求为用户发送的需要请求推送与刑事文书样本相似的刑事文书,并且该推送请求会携带有刑事文书样本,这里的刑事文书样本通常为用户在实际刑事案件中遇到问题的刑事文书,此时需要检索系统为用户推送与刑事文书样本相似的案例进行参考。
对于本发明实施例,从多维度解析刑事文书样本的解析方法与步骤202采用相同的解析方式相同,同样是通过提取刑事文书样本中不同的维度特征以及找出不同的维度特征对应的特征值来解析刑事文书样本,在此不进行赘述。
302、从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合。
由于刑事文书中各个维度特征对应的特征值能够反应刑事文书不同方面的内容,而罪名维度特征属于刑事文书中比较重要的维度特征,本发明实施例首先通过将刑事文书样本中罪名维度特征对应的特征值与刑事文书检索库中每篇刑事文书中相应罪名维度特征对应的特征值进行匹配,查找与刑事文书样本中罪名维度特征匹配相一致的第一刑事文书集合,进而为用户提供更具有参考价值的刑事文书。
303、从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书。
由于第一刑事文书集合中的刑事文书通常数量较多,进一步保证推送给用户相似度高的刑事文书,本发明实施例从第一刑事文书集合中筛选出与刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,从而将第二刑事文书集合中的刑事文书作为待推送刑事文书。
304、将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
需要说明的是,在实际应用中,可以发现通过步骤302以及步骤303对刑事文书检索库中刑事文书进行筛选后会得到符合条件的第二刑事文书集合,而第二刑事文书集合中可能会存500篇以上与刑事文书样本相应维度特征对应的特征值相匹配的待推送刑事文书,本发明实施例为了进一步保证刑事文书的推送质量,将刑事文书样本中各个量刑情节维度特征对应的特征值与所述每篇待推送刑事文书中相应维度特征对应的特征值进行匹配,这里的量刑情节维度特征集合是刑事文书全部维度特征集合的一个子集,量刑情节维度特征集合中的维度特征都与量刑情节相关,可以包括刑事能力责任、正当防卫、紧急避险等维度特征,这样在通过对各个量刑情节维度特征进行匹配后,可能会存在100篇左右与刑事文书样本中8个以上维度特征对应的特征值相匹配的刑事文书,存在20篇左右与刑事文书样本中10个以上维度特征对应的特征值相匹配的刑事文书,通常情况下,存在维度特征对应的特征值相匹配的数量越多,说明该刑事文书与刑事文书样本的相似度越高。
305、从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
对于本发明实施例,为了保证查找到相似度较高的刑事文书,本发明实施例需要对匹配结果符合预设条件的刑事文书进行排序,从而根据排序结果靠前指定数量刑事文书进行推送,这里可以有以下两种排序推送方式:
由于匹配相一致量刑情节维度特征的数量越多相似度通常越高,一种排序方式是首先将各待推送刑事文书按照与刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果,而当两篇以上待推送刑事文书与刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分,这里的基础得分通常为根据刑事文书实际应用中在不同类型刑事文书中重要性而设置的,本发明实施例不进行限定,进而根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果,按照最终排序结果将待推送刑事文书作为输出的推送文书。而当两篇以上刑事文书的最高基础得分相同的情况下,还可以对最高基础得分相同的刑事文书进一步进行全文相似度匹配,进而优先推送全文相似度匹配结果靠前的刑事文书。
另一种排序方式也是首先将待推送刑事文书按照与刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果,而当待推送刑事文书与刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,将每篇量刑情节维度特征匹配数量相同的待推送刑事文书与刑事文书样本进行全文相似度匹配,具体可以根据刑事文书中的分词、词间距等特征对刑事文书全文进行匹配,得到全文相似度匹配分数,进而根据全文相似度匹配由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果,按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
优选的,上面提到的量刑情节维度特征为犯罪主体的量刑情节维度特征,也即,在初始排序时,先分别确定各待推送刑事文书的犯罪主体的量刑情节维度特征与刑事文书样本中犯罪主体的量刑情节维度特征匹配相一致的数量,之后将各待推送刑事文书按照与刑事文书样本中犯罪主体的匹配相一致量刑情节维度特征的数量由多至少进行排序;而在最终排序时,对于两篇以上待推送刑事文书与刑事文书样本中犯罪主体的匹配相一致量刑情节维度特征的数量相同时,查找每篇犯罪主体的量刑情节维度特征匹配数量相同的待推送刑事文书的犯罪主体量刑情节维度特征的最高基础得分,并按最高基础得分对与刑事文书样本中犯罪主体的匹配相一致量刑情节维度特征的数量相同的待推送刑事文书排序。由于都是按照犯罪主体的量刑情节维度特征进行判断,所获得的最终排序结果中越靠前的待推送刑事文书与刑事文书样本相似度越高,推送结果越精准。
需要说明的是,上述按照最终排序结果将待推送刑事文书作为输出的推送文书的时候,由于推送文书的数量不确定,可能会大于指定数量也可能小于指定数量,本发明实施例进一步判断待推送刑事文书的数量是否大于指定数量,如果是,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书,其余的刑事文书不进行推送,否则,按照最终排序结果将所有待推送刑事文书作为输出的推送文书。
本发明对预设数量的设置不进行限定,通常可以根据刑事文书检索库中存在与刑事文书样本中不同数量维度特征对应的特征值相匹配的刑事文书数量多少来确定,数量过多或数量过少都不是理想状态,优选在通过预设数量的维度特征对应的特征值与刑事文书样本中维度特征对应的特征值相匹配的情况下,能够保证从刑事文书检索库中筛选出的待推送刑事文书数量在20至100篇之间。
本发明实施例通过选取指定数量的待推送刑事文书作为输出的推送文书,进一步对待推送刑事文书进行筛选,将筛选后的刑事文书作为输出的推送文书,提高了推送文书与刑事文书样本相似的准确的,为用户提供参考价值更高的刑事文书。
针对本发明实施例提供的另一种刑事文书的推送方法,通过刑事文书检索库来存储不同刑事文书的多维度解析结果,以便于当用户发送推送请求时,先从多维度解析推送请求携带的刑事文书样本,进而将刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,从而提高待推送刑事文书与刑事文书样本的相似度,进一步从刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为推送文书,保证推送的刑事文书符合用户需求。与现有技术中通过关键词匹配来实现刑事文书的推送方法相比,本发明实施例通过预先创建包含有不同刑事文书多维度解析结果的刑事文书检索库,能够提供不同刑事文书更全面的维度特征信息,当用户通过刑事文书检索库请求推送与刑事文书样本相似的刑事文书时,无需用户费力输入任何关键词,通过将刑事文书样本与刑事文书检索库中存储的不同刑事文书进行多维度匹配,可以从多维度获取与刑事文书样本相匹配的待推送刑事文书,大幅度提高了推送刑事文书的准确度,使得推送的刑事文书更具有参考性。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的刑事文书的推送方法。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的刑事文书的推送方法。
进一步的,作为对上述图1所示方法的实现,本发明另一实施例还提供了一种刑事文书的推送装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。该装置用于从多维度进行相似刑事文书的匹配,提高刑事文书推送的精准度具体如图4所示,该装置包括:
解析单元41,可以用于响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果;
匹配单元42,可以用于将所述刑事文书样本的解析结果与所述刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
选取单元43,可以用于从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
针对本发明的实施例提供了一种刑事文书的推送装置,通过刑事文书检索库来存储不同刑事文书的多维度解析结果,以便于当用户发送推送请求时,先从多维度解析推送请求携带的刑事文书样本,进而将刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,从而提高待推送刑事文书与刑事文书样本的相似度,进一步从刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为推送文书,保证推送的刑事文书符合用户需求。与现有技术中通过关键词匹配来实现刑事文书的推送方法相比,本发明实施例通过预先创建包含有不同刑事文书多维度解析结果的刑事文书检索库,能够提供不同刑事文书更全面的维度特征信息,当用户通过刑事文书检索库请求推送与刑事文书样本相似的刑事文书时,无需用户费力输入任何关键词,通过将刑事文书样本与刑事文书检索库中存储的不同刑事文书进行多维度匹配,可以从多维度获取与刑事文书样本相匹配的待推送刑事文书,大幅度提高了推送刑事文书的准确度,使得推送的刑事文书更具有参考性。
进一步的,如图5所示,所述刑事文书检索库可以通过建立单元44进行建立,所述建立单元44包括:
存储模块441,可以用于通过网络爬虫获取不同刑事文书,并将不同刑事文书存储至刑事文书库中;
解析模块442,可以用于从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果;
建立模块443,可以用于根据刑事文书库中每篇刑事文书的多维度解析结果,建立刑事文书检索库。
进一步地,所述解析模块442,具体可以用于根据所述刑事文书的文书特征确定所述刑事文书对应的多个维度特征;
所述解析模块442,具体还可以用于从所述刑事文书库中的每篇刑事文书中提取出各个维度特征对应的特征值,获取每篇刑事文书的多维度解析结果。
进一步地,所述匹配单元42包括:
第一筛选模块421,可以用于从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
第二筛选模块422,可以用于从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
第一匹配模块423,可以用于将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述选取单元43包括:
第一排序模块431,可以用于将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
查找模块432,可以用于当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
第二排序模块433,可以用于根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
第一选取模块434,可以用于按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述第一选取模块434,具体可以用于判断所述待推送刑事文书的数量是否大于指定数量;
所述第一选取模块434,具体还可以用于所述待推送刑事文书的数量大于指定数量,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
所述第一选取模块434,具体还可以用于所述待推送刑事文书的数量小于或等于指定数量,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
进一步地,所述选取单元43还包括:
第三排序模块435,可以用于将所述待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
第二匹配模块436,可以用于当所述待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,将每篇量刑情节维度特征匹配数量相同的待推送刑事文书与所述刑事文书样本进行全文相似度匹配;
第四排序模块437,可以用于根据所述全文相似度匹配由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
第二选取模块438,可以用于按照最终排序结果将待推送刑事文书作为输出的推送文书。
所述第二选取模块438,具体可以用于判断所述待推送刑事文书的数量是否大于指定数量;
所述第二选取模块438,具体还可以用于所述待推送刑事文书的数量大于指定数量,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
所述第二选取模块438,具体还可以用于所述待推送刑事文书的数量小于或等于指定数量,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
针对本发明实施例提供的另一种刑事文书的推送装置,通过刑事文书检索库来存储不同刑事文书的多维度解析结果,以便于当用户发送推送请求时,先从多维度解析推送请求携带的刑事文书样本,进而将刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,从而提高待推送刑事文书与刑事文书样本的相似度,进一步从刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为推送文书,保证推送的刑事文书符合用户需求。与现有技术中通过关键词匹配来实现刑事文书的推送方法相比,本发明实施例通过预先创建包含有不同刑事文书多维度解析结果的刑事文书检索库,能够提供不同刑事文书更全面的维度特征信息,当用户通过刑事文书检索库请求推送与刑事文书样本相似的刑事文书时,无需用户费力输入任何关键词,通过将刑事文书样本与刑事文书检索库中存储的不同刑事文书进行多维度匹配,可以从多维度获取与刑事文书样本相匹配的待推送刑事文书,大幅度提高了推送刑事文书的准确度,使得推送的刑事文书更具有参考性。
所述刑事文书的推送装置包括处理器和存储器,上述解析单元41、匹配单元41和选取单元43等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来从多维度进行相似刑事文书的匹配,提高刑事文书推送的精准度。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述刑事文书的推送方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述刑事文书的推送方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
一种刑事文书的推送方法,包括:响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果;将所述刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
进一步地,所述刑事文书检索库通过如下步骤建立:通过网络爬虫获取不同刑事文书,并将不同刑事文书存储至刑事文书库中;从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果;根据刑事文书库中每篇刑事文书的多维度解析结果,建立刑事文书检索库。
进一步地,所述从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果包括:根据所述每篇刑事文书的文书特征确定所述每篇刑事文书对应的多个维度特征;从所述刑事文书库中的每篇刑事文书中提取出各个维度特征对应的特征值,获取每篇刑事文书的多维度解析结果。
进一步地,所述将所述刑事文书样本的解析结果与所述刑事文书检索库中不同刑事文书的解析结果进行多维度匹配包括:从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
进一步地,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
进一步地,所述按照所述最终排序结果将待推送刑事文书作为输出的推送文书包括:判断所述待推送刑事文书的数量是否大于指定数量;若是,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;否则,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
进一步地,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:将所述待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;当所述待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,将每篇量刑情节维度特征匹配数量相同的待推送刑事文书与所述刑事文书样本进行全文相似度匹配;根据所述全文相似度匹配由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;选取所述最终排序结果靠前的指定数量的待推送刑事文书作为输出的推送文书。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果;将所述刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种刑事文书的推送方法,其特征在于,包括:
响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果;
将所述刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
2.根据权利要求1所述的方法,其特征在于,所述刑事文书检索库通过如下步骤建立:
通过网络爬虫获取不同刑事文书,并将不同刑事文书存储至刑事文书库中;
从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果;
根据刑事文书库中每篇刑事文书的多维度解析结果,建立刑事文书检索库。
3.根据权利要求2所述的方法,其特征在于,所述从多维度解析所述刑事文书库中的每篇刑事文书,获取每篇刑事文书的多维度解析结果包括:
根据所述每篇刑事文书的文书特征确定所述每篇刑事文书对应的多个维度特征;
从所述刑事文书库中的每篇刑事文书中提取出各个维度特征对应的特征值,获取每篇刑事文书的多维度解析结果。
4.根据权利要求1所述的方法,其特征在于,所述将所述刑事文书样本的解析结果与所述刑事文书检索库中不同刑事文书的解析结果进行多维度匹配包括:
从所述刑事文书检索库中筛选出与所述刑事文书样本中罪名维度特征对应的特征值相匹配的第一刑事文书集合;
从所述第一刑事文书集合中筛选出与所述刑事文书样本中犯罪主体数量以及主从犯关系维度特征对应的特征值相匹配的第二刑事文书集合,第二刑事文书集合中的刑事文书为待推送刑事文书;
将所述刑事文书样本中各个量刑情节维度特征对应的特征值与所述每篇待推送刑事文书中相应维度特征对应的特征值进行匹配。
5.根据权利要求4所述的方法,其特征在于,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:
将各待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
当两篇以上待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,查找每篇量刑情节维度特征匹配数量相同的待推送刑事文书的量刑情节维度特征的最高基础得分;
根据所述最高基础得分由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
6.根据权利要求4所述的方法,其特征在于,所述从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书包括:
将所述待推送刑事文书按照与所述刑事文书样本中匹配相一致量刑情节维度特征的数量由多至少进行排序,得到初始排序结果;
当所述待推送刑事文书与所述刑事文书样本中匹配相一致量刑情节维度特征的数量相同时,将每篇量刑情节维度特征匹配数量相同的待推送刑事文书与所述刑事文书样本进行全文相似度匹配;
根据所述全文相似度匹配由高至低对量刑情节维度特征匹配数量相同的待推送刑事文书进行排序,得到最终排序结果;
按照所述最终排序结果将待推送刑事文书作为输出的推送文书。
7.根据权利要求5或6所述的方法,其特征在于,所述按照所述最终排序结果将待推送刑事文书作为输出的推送文书包括:
判断所述待推送刑事文书的数量是否大于指定数量;
若是,按照所述最终排序结果选取指定数量的待推送刑事文书作为输出的推送文书;
否则,按照所述最终排序结果将所有待推送刑事文书作为输出的推送文书。
8.一种刑事文书的推送装置,其特征在于,包括:
解析单元,用于响应于用户发送的推送请求,从多维度解析所述推送请求携带的刑事文书样本,得到刑事文书样本的解析结果;
匹配单元,用于将所述刑事文书样本的解析结果与刑事文书检索库中不同刑事文书的解析结果进行多维度匹配,所述刑事文书检索库中记录有从多维度解析不同刑事文书的解析结果;
选取单元,用于从所述刑事文书检索库中选取匹配结果符合预设条件的刑事文书作为输出的推送文书。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求7中任意一项所述的刑事文书的推送方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至权利要求7中任意一项所述的刑事文书的推送方法。
CN201710754384.XA 2017-08-29 2017-08-29 一种刑事文书的推送方法及装置 Pending CN110019697A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710754384.XA CN110019697A (zh) 2017-08-29 2017-08-29 一种刑事文书的推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710754384.XA CN110019697A (zh) 2017-08-29 2017-08-29 一种刑事文书的推送方法及装置

Publications (1)

Publication Number Publication Date
CN110019697A true CN110019697A (zh) 2019-07-16

Family

ID=67186148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710754384.XA Pending CN110019697A (zh) 2017-08-29 2017-08-29 一种刑事文书的推送方法及装置

Country Status (1)

Country Link
CN (1) CN110019697A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625626A (zh) * 2020-07-30 2020-09-04 杭州识度科技有限公司 一种基于多维度语义联合建模的多用户案例检索系统
CN112579763A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 一种文书的推送方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070073641A1 (en) * 2005-09-23 2007-03-29 Redcarpet, Inc. Method and system for improving search results
CN101187927A (zh) * 2007-12-17 2008-05-28 电子科技大学 一种刑事案件的串并案智能分析方法
US20130211820A1 (en) * 2012-02-15 2013-08-15 Electronics And Telecommunications Research Institute Apparatus and method for interpreting korean keyword search phrase
CN106815261A (zh) * 2015-12-01 2017-06-09 北京国双科技有限公司 裁判文书处理方法和装置
CN106991092A (zh) * 2016-01-20 2017-07-28 阿里巴巴集团控股有限公司 基于大数据挖掘相似裁判文书的方法和设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070073641A1 (en) * 2005-09-23 2007-03-29 Redcarpet, Inc. Method and system for improving search results
CN101187927A (zh) * 2007-12-17 2008-05-28 电子科技大学 一种刑事案件的串并案智能分析方法
US20130211820A1 (en) * 2012-02-15 2013-08-15 Electronics And Telecommunications Research Institute Apparatus and method for interpreting korean keyword search phrase
CN106815261A (zh) * 2015-12-01 2017-06-09 北京国双科技有限公司 裁判文书处理方法和装置
CN106991092A (zh) * 2016-01-20 2017-07-28 阿里巴巴集团控股有限公司 基于大数据挖掘相似裁判文书的方法和设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579763A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 一种文书的推送方法及装置
CN111625626A (zh) * 2020-07-30 2020-09-04 杭州识度科技有限公司 一种基于多维度语义联合建模的多用户案例检索系统
CN111625626B (zh) * 2020-07-30 2020-12-18 杭州识度科技有限公司 一种基于多维度语义联合建模的多用户案例检索系统

Similar Documents

Publication Publication Date Title
US9449271B2 (en) Classifying resources using a deep network
CN110019785B (zh) 一种文本分类方法及装置
WO2020020287A1 (zh) 一种获取文本相似度的方法、装置、设备及可读存储介质
Bouadjenek et al. Using social annotations to enhance document representation for personalized search
Story et al. Which apps have privacy policies? an analysis of over one million google play store apps
Sanchez et al. Easing legal news monitoring with learning to rank and BERT
Setty et al. Truth be told: Fake news detection using user reactions on reddit
US7788284B2 (en) System and method for knowledge based search system
Guo et al. Automatic feature generation on heterogeneous graph for music recommendation
Nwala et al. Bootstrapping web archive collections from social media
CN104615723B (zh) 查询词权重值的确定方法和装置
CN110032721A (zh) 一种裁判文书推送方法及装置
Yulianti et al. Tweet‐biased summarization
CN110019697A (zh) 一种刑事文书的推送方法及装置
CN110019670A (zh) 一种文本检索方法及装置
He et al. Finding camouflaged needle in a haystack? pornographic products detection via berrypicking tree model
CN110020134A (zh) 一种知识服务信息的推送方法、系统、存储介质和处理器
CN109117434A (zh) 裁判文书检索方法、装置、存储介质及处理器
CN109426905A (zh) 一种刑事文书量刑偏离的判定方法及装置
CN105786929B (zh) 一种信息监测方法及装置
Xu et al. Measuring semantic relatedness between flickr images: from a social tag based view
Bordea et al. Benchmarking domain-specific expert search using workshop program committees
Mic et al. Accelerating metric filtering by improving bounds on estimated distances
Singh et al. Improved discovery of rating fake for cellular apps
CN104809165A (zh) 一种多媒体文件相关度的确定方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20190716

RJ01 Rejection of invention patent application after publication