CN114048308B - 一种类案检索报告生成的方法及装置 - Google Patents
一种类案检索报告生成的方法及装置 Download PDFInfo
- Publication number
- CN114048308B CN114048308B CN202111293990.9A CN202111293990A CN114048308B CN 114048308 B CN114048308 B CN 114048308B CN 202111293990 A CN202111293990 A CN 202111293990A CN 114048308 B CN114048308 B CN 114048308B
- Authority
- CN
- China
- Prior art keywords
- case
- retrieval
- referee
- result
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000001149 cognitive effect Effects 0.000 claims abstract description 57
- 238000004458 analytical method Methods 0.000 claims abstract description 47
- 230000019771 cognition Effects 0.000 claims abstract description 30
- 238000011156 evaluation Methods 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000009960 carding Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000007704 transition Effects 0.000 claims description 2
- 230000002596 correlated effect Effects 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000010835 comparative analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种类案检索报告生成的方法及装置。其中方法包括:从类案检索系统获取检索人员信息、检索法院信息、类案检索系统信息、检索案件基本信息、检索内容及结果裁判文书;利用案件要素认知模块对检索内容和结果裁判文书进行案件要素认知;基于认知的案件要素,对检索内容和结果裁判文书进行相似性综合评价;基于认知的案件要素,对检索内容和结果裁判文书进行案例裁判参考分析;根据预先准备好的可定制的类案检索报告模板,关联上述相关内容和结果,生成类案检索报告。本发明的有益效果在于:采用本发明提供的方案,可有效提升法官类案检索报告制作的效率。
Description
技术领域
本发明涉及自然语言处理领域,特别是涉及一种类案检索报告生成的方法及装置。
背景技术
类案检索制度对于统一法律适用,提升司法公信具有重要的现实意义。随着《关于统一法律适用加强类案检索的指导意见(试行)》发布和《最高人民法院关于完善统一法律适用标准工作机制的意见》出台,标志着我国类案检索制度初步建立。该项制度的落实还有赖于类案检索报告制作和运用机制的完善。目前类案检索报告制作主要还是靠法官手动完成,需要进行多个文书之间的比对分析,同时还需要进行多次复制、粘贴、修改工作,过程繁琐,费时费力,严重影响到法官的工作质效。因此,如何利用人工智能等现代化技术助力类案检索报告制作,提升报告制作效率是亟待解决的问题。同时考虑到目前类案检索系统研制厂家较多,能够提供一个通用的类案检索报告生成技术为多个类案检索系统所共用,也是一个紧迫需求。
发明内容
为了有效解决上述问题,本发明提供一种类案检索报告生成的方法及装置,能够基于从类案检索系统获取到的检索人员信息、检索法院信息、类案检索系统信息、检索案件基本信息、检索内容及检索结果,快速生成类案检索报告,法官可以在此报告基础上进行二次编辑修改,进而有效提升法官制作类案检索报告的质效。
本发明提供了一种类案检索报告生成的方法,包括:
步骤一:从类案检索系统获取检索人员信息、检索法院信息、检索系统信息、检索案件基本信息、检索内容及结果裁判文书。
步骤二:利用案件要素认知模块对检索内容和结果裁判文书进行案件要素认知。
步骤三:基于认知的案件要素,对检索内容和结果裁判文书进行相似性综合评价。
步骤四:基于认知的案件要素,对检索内容和结果裁判文书进行案例裁判参考分析。
步骤五;根据预先准备好的可定制的类案检索报告模板,关联上述步骤一至四的相关内容和结果,生成类案检索报告。
所述步骤一中的类案检索系统不仅包含法院自己研制的类案检索系统,也包含目前法院内网在用的各厂家研制的类案检索系统。上述类案检索系统为了能够支持本发明获取相关信息,需要进行接口改造,以便能够从类案检索系统获取相关信息,即能够收集上述相关信息并通过调用本方法提供的数据采集接口及时传输数据给本方法。
所述步骤一中从类案检索系统获取检索人员信息、检索法院信息、类案检索系统信息、检索案件基本信息、检索内容及结果裁判文书,其中检索内容和结果裁判文书是必需项。其它信息可以为空,为空信息将不在检索报告中出现。其中检索人员信息和检索法院信息是用来采集当前开展类案检索的人员及检索案件所属法院信息;其中类案检索系统信息是用来采集本次检索报告是来自哪个类案检索系统;检索案件基本信息是用来采集本次类案检索报告关联到的案件信息;检索内容是在类案检索系统进行类案检索的内容信息,可以是一段案情或者一篇前置文书;结果裁判文书是类案检索系统检索出来的相似性较高的一些裁判文书。
所述步骤二中的案件要素认知模块,用于实现案件要素的快速精准认知。案件要素认知模块的一个可选的实现方案包括:对于标题、案号、文书来源、审理程序、审理法院、裁判日期等要素采用正则表达式进行快速认知,正则表达式由技术人员基于法律专家提供的正则素材整理生成;对于事实特征、诉讼请求、适用法条、争议焦点、本院认为、裁判观点、裁判结果等主要通过已构建的训练好的BERT+BILSTM+CRF模型进行快速认知。
所述步骤二中利用案件要素认知模块对检索内容和结果裁判文书进行案件要素认知,其中要认知的案件要素一个可选列表包括:标题、案号、文书来源(包括指导案例、公报案例、参考案例、典型案例等)、审理程序(包括一审、二审、再审等)、审理法院、裁判日期、事实特征、诉讼请求(刑事案件除外)、适用法条、争议焦点、本院认为、裁判要旨、裁判结果。
所述步骤三中基于认知的案件要素,对检索内容和结果裁判文书进行相似性综合评价,具体包括:针对检索内容面向事实特征、适用法条、争议焦点的认知的案件要素与结果裁判文书面向事实特征、适用法条、争议焦点的认知的案件要素进行匹配性分析;同时根据上述案件要素的匹配情况通过计算给出每个裁判文书的相似性打分。
所述步骤四中基于认知的案件要素,对检索内容和结果裁判文书进行案例裁判参考分析,具体包括,针对检索内容面向本院认为、裁判观点、裁判结果的认知的案件要素与结果裁判文书中面向本院认为、裁判观点、裁判结果的认知的案件要素通过案例裁判参考分析模型进行对比分析,形成案例裁判参考分析结果。案例裁判参考分析模型面向各案由通过梳理法官办案中开展案例裁判参考的关注点和知识点进行建模。
所述步骤五中的类案检索报告模板由基础模板和各法院的定制化模板组成。基础模板基于最高法相关规定例如《关于统一法律适用加强类案检索的指导意见(试行)》,结合多个法律专家的检索报告制作建议整理而成,定制化模板是各法院在基础模板之上结合自己的个性化需求修改而成。基础模板主体包括检索内容、相似性分析、案例裁判参考分析、检索结果汇总信息等。检索结果汇总信息主要包括检索结果的标题、案号、审理法院、审理时间、案件来源、本院查明、裁判结果、事实特征、适用法条等内容。
本发明还提供一种采用上述方法的类案检索报告生成的装置,其包括:
信息获取模块,用于从类案检索系统至少获取检索内容及结果裁判文书;
要素认知模块,用于从信息获取模块获取到相关信息后,通过调用案件要素认知模块,对检索内容和检索结果裁判文书进行案件要素认知,并将认知的案件要素发送至相似性评价模块和裁判参考分析模块;
相似性评价模块,用于基于要素认知模块发送过来的认知要素,对检索内容和结果裁判文书进行相似性综合评价,相似性综合评价结果供报告生成模块使用;
裁判参考分析模块,用于基于要素认知模块发送过来的认知要素,对检索内容和结果裁判文书进行案例裁判参考分析,案例裁判参考分析结果供报告生成模块使用;
报告生成模块,用于根据预先准备好的定制化的类案检索报告模板,关联相关内容和结果,生成类案检索报告。
本发明的有益效果在于:采用本发明提供的方案,可有效提升法官类案检索报告制作的效率。
附图说明
此处的附图是用来提供对本发明的进一步理解,构成本发明的一部分内容,与本发明的实施例一起用于解释本发明,但不构成对本发明的限定。在附图中:
图1是本发明实施例提供的一种类案检索报告生成方法的流程示意图;
图2是本发明实施例提供的另一种类案检索报告生成方法的流程示意图;
图3是本发明实施例提供的一种类案检索报告生成装置的组成示意图。
具体实施方式
为了便于理解本发明,下面将结合附图和具体实施例对本发明进行进一步描述。需要说明的是,本申请的实施例及实施例中的特征在互相不冲突的情况下可以相互组合。
需要说明的是,本发明的包含范围并不受限于下面公开的具体实施例。下述的具体实施例仅用于说明本申请而不用于限制本申请的范围。
除另行说明外,本申请所使用的术语的含义与本领域普通技术人员通常所理解的含义相同。
图1是本发明实施例提供的一种类案检索报告生成方法的流程示意图。参照图1,本发明实施例提供的一种类案检索报告生成方法,具体包括:
S101、从类案检索系统获取检索人员信息、检索法院信息、检索系统信息、检索案件基本信息、检索内容及结果裁判文书。其中检索内容和结果裁判文书是必需项,其它信息可以为空,为空项不会在检索报告中显示。本步骤中提到的类案检索系统不只包含法院自己研制的类案检索系统,目前法院内网在用的各厂家研制的类案检索系统也包含在内。上述类案检索系统为了能够支持本方法获取上述的相关信息,需要进行适当改造,具备收集上述相关信息并通过调用本系统的数据采集接口及时传输信息给本方法。
S102、利用案件要素认知模块对检索内容和结果裁判文书进行案件要素认知。其中案件要素认知模块用于实现案件要素的快速精准认知。案件要素认知分两种情况:对于标题、案号、文书来源、审理程序、审理法院、裁判日期等通过正则表达式进行快速认知,编写正则表达式主要由技术人员基于法律人员提供的正则素材来实现;对于事实特征、诉讼请求、适用法条、争议焦点、本院认为、裁判观点、裁判结果等通过已构建训练好的BERT+BILSTM+CRF模型进行快速认知。其中要认知的案件要素一个可选列表包括:标题、案号、文书来源(指导案例、公报案例、参考案例、典型案例等)、审理程序(一审、二审、再审等)、审理法院、裁判日期、事实特征、诉讼请求(刑事案件除外)、适用法条、争议焦点、本院认为、裁判要旨、裁判结果。
所述BERT+BILSTM+CRF模型中,首先通过BERT语言模型进行文本特征提取获得向量矩阵;然后通过BILSTM模型进行认知要素识别;最后通过CRF模型对BILSTM模型的识别结果进行状态转移矩阵处理,得到一个全局最优结果。通过利用BERT语言模型可以解决在文本特征表示的一词多义问题,结合BILSTM模型充分学习上下文信息的特点以及CRF模型提取全局最优结果,可以实现案件要素的快速精准认知。
S103、基于认知的案件要素,对检索内容和结果裁判文书进行相似性综合评价。进行相似性综合评价具体包括:针对检索内容面向事实特征、适用法条、争议焦点的认知的案件要素与结果裁判文书面向事实特征、适用法条、争议焦点的认知的要素进行匹配性分析,匹配的标识为1,不匹配的标识为0;同时根据上述要素的匹配情况通过计算给出每个裁判文书的相似性打分。
其中,一种可选的相似性打分计算公式如下:
其中,Score(Q,d)表示检索内容Q与结果裁判文书d的相似性计算得分。n为检索内容Q中包含的认知的要素个数,qi为检索内容Q中包含的第i个认知要素,Wi为该认知要素qi的权重,R(qi,d)为该认知要素qi与结果裁判文书d的相关性分数。
Wi的计算公式具体如下:
其中,N表示本地裁判文书库的总个数,dfi表示包含认知要素qi的历史文书个数。
可选的,R(qi,d)的计算公式具体如下:
其中,ki为认知要素qi的专家给定分值,默认为1,对于一些比较重要的认知要素可以设置为1-10之间的分值,分值越高说明影响越大,dl为d中认知的要素个数,n为检索内容Q中包含的认知要素个数。
S104、基于认知的案件要素,对检索内容和结果裁判文书进行案例裁判参考分析。进行案例裁判参考分析具体包括,针对检索内容面向本院认为、裁判观点、裁判结果的认知的案件要素与结果裁判文书中面向本院认为、裁判观点、裁判结果的认知的要素通过案例裁判参考分析模型进行对比分析,形成案例裁判参考分析结果。
其中,一种可选的案例裁判参考分析模型为:针对本院认为部分,对提取的共性和个性的事实要素和法律适用要素进行统计分析和展现;针对裁判观点部分,对提取到的裁判观点的支持情况进行统计分析及对具体观点下各文书的摘要进行展现;针对裁判结果部分,面向刑事类案件,从各文书的定罪和量刑结果进行对比分析;面向非刑事类案件,从各文书对共性和个性的诉请支持与否进行对比分析。
S105、根据预先准备好的可定制的类案检索报告模板,关联上述相关内容和结果,生成类案检索报告。类案检索报告模板由基础模板和各法院的定制化模板组成。基础模板基于最高法《关于统一法律适用加强类案检索的指导意见(试行)》相关指导意见,结合多个法律专家的制作意见整理而成,定制化模板是各法院在基础模板之上结合自己的个性化需求修改而成。基础模板主体包括检索内容、相似性分析、裁判参考分析、检索结果汇总信息等。检索结果汇总信息主要包括检索结果中的标题、案号、审理法院、审理时间、案件来源、本院查明、裁判结果、事实特征、适用法条等内容。
图2是本发明实施例提供的另一种类案检索报告生成方法的流程示意图。参照图2,本发明实施例提供的另一种类案检索报告生成方法,具体包括:
S201、从类案检索系统获取检索人员信息、检索法院信息、类案检索系统信息、检索案件基本信息、检索内容及结果案号列表。这里获取结果案号列表而不获取结果裁判文书,一方面可以有效减少对网络带宽压力;另一方面可以减少类案检索系统应用压力,适合网络压力本身已经比较大或类案检索系统应用压力已经比较大的场景使用。上述提到的获取信息中检索内容和结果案号列表是必需项,其它信息可以为空,为空项不会在检索报告中显示。本步骤中提到的类案检索系统不仅包括法院自己研制的类案检索系统,也包括目前法院内网在用的各厂家研制的类案检索系统。上述类案检索系统为了能够支持本发明获取上述的相关信息,需要进行适配改造,具备收集上述相关信息并通过调用本系统的数据采集接口及时传输数据给本系统。
S202、基于检索结果案号列表从本地文书库中获取结果裁判文书。上述本地文书库预先收集存储了比较完备的裁判文书,通过使用案号信息进行检索,可以获取到相关的结果裁判文书。
S203、利用案件要素认知模块对检索内容和结果裁判文书进行案件要素认知。其中案件要素认知模块用于实现案件要素的快速精准认知。案件要素认知有两个途径:对于标题、案号、文书来源、审理程序、审理法院、裁判日期等通过正则表达式进行快速认知,通过编写正则表达式来实现;对于事实特征、诉讼请求、适用法条、争议焦点、本院认为、裁判观点、裁判结果等通过已构建训练好的BERT+BILSTM+CRF模型进行快速认知。其中要认知的案件要素一个可选列表包括:标题、案号、文书来源(指导案例、公报案例、参考案例、典型案例等)、审理程序(一审、二审、再审等)、审理法院、裁判日期、事实特征、诉讼请求(刑事案件除外)、适用法条、争议焦点、本院认为、裁判要旨、裁判结果。
S204、基于认知的案件要素,对检索内容和结果裁判文书进行相似性综合评价。进行相似性综合评价具体包括:针对检索内容面向事实特征、适用法条、争议焦点的认知的案件要素与结果裁判文书中面向事实特征、适用法条、争议焦点的认知的案件要素进行匹配性分析,匹配的标识为1,不匹配的标识为0;同时根据上述要素的匹配情况通过计算给出每个裁判文书的相似性打分。其中,一种可选的相似性打分计算公式如下:
其中,Score(Q,d)表示检索内容Q与结果裁判文书d的相似性计算得分。n为检索内容Q中包含的认知的要素个数,qi为检索内容Q中包含的第i个认知要素,Wi为该认知要素qi的权重,R(qi,d)为该认知要素qi与结果裁判文书d的相关性分数。
Wi的计算公式具体如下:
其中,N表示本地裁判文书库的总个数,dfi表示包含认知要素qi的历史文书个数。
可选的,R(qi,d)的计算公式具体如下:
其中,ki为认知要素qi的专家给定分值,默认为1,对于一些比较重要的认知要素可以设置为1-10之间的分值,分值越高说明影响越大,dl为d中认知的要素个数,n为检索内容Q中包含的认知要素个数。
S205、基于认知的案件要素,对检索内容和结果裁判文书进行案例裁判参考分析。进行案例裁判参考分析具体包括,针对检索内容面向本院认为、裁判观点、裁判结果的认知的案件要素与结果裁判文书面向本院认为、裁判观点、裁判结果的认知的案件要素通过案例裁判参考分析模型进行对比分析,形成案例裁判参考分析结果。案例裁判参考分析模型面向各案由通过梳理法官办案中开展案例裁判参考的关注点和知识点进行建模。
S206、根据预先准备好的可定制的类案检索报告模板,关联上述相关内容和结果,生成类案检索报告。类案检索报告模板由基础模板和各法院的定制化模板组成。基础模板基于最高法《关于统一法律适用加强类案检索的指导意见(试行)》相关指导意见,结合多个法律专家的制作意见整理而成,定制化模板是各法院在基础模板之上结合自己的个性化需求修改而成。基础模板主体包括检索内容、相似性分析、裁判参考分析、检索结果汇总信息等。检索结果汇总信息主要包括检索结果中的标题、案号、审理法院、审理时间、案件来源、本院查明、裁判结果、事实特征、适用法条等内容。
图3是本发明实施例提供的一种类案检索报告生成装置的组成示意图。参照图3,本发明实施例提供的一种类案检索报告生成装置,具体包括:
S301、信息获取模块。该模块用来从类案检索系统获取检索人员信息、检索法院信息、类案检索系统信息、类案检索案件基本信息、检索内容及结果裁判文书,对信息进行规整处理,使来自不同类案检索系统的不同格式数据规整为同一格式数据,以方便后续使用。
S302、要素认知模块。该模块从信息获取模块获取到相关信息后,通过调用模块内部的案件要素认知模块,对检索内容和检索结果裁判文书进行案件要素认知,然后把认知的案件要素送给相似性评价模块和裁判参考分析模块使用。
S303、相似性评价模块。该模块基于要素认知模块发送过来的认知要素,对检索内容和结果裁判文书进行相似性综合评价,供报告生成模块使用。
S304、裁判参考分析模块。该模块基于要素认知模块发送过来的认知要素,对检索内容和结果裁判文书进行案例裁判参考分析,分析结果供报告生成模块使用。
S305、报告生成模块。该模块根据预先准备好的定制化的类案检索报告模板,关联上述相关内容和结果,生成类案检索报告。
本发明的另一实施例提供一种类案检索报告生成的电子设备,其包括一个或多个处理器、存储装置及存储在所述存储装置中一个或多个可在所述处理器上运行的计算机程序。当所述一个或多个程序被所述一个或多个处理器执行时,能够实现上述类案检索报告生成。
本发明的另一实施例提供了一种可读存储介质,在其上存储了实现上述类案检索报告生成的计算机程序,所述程序执行时实现上述基于案情比对的类案检索类案检索报告生成。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由上述技术任意组合后所形成的技术方案。应指出,对于本技术领域的技术人员而言,在不脱离本发明原理的前提下,做出的若干改进和润饰,均视为本发明的包含范围。
Claims (7)
1.一种类案检索报告生成的方法,其特征在于,包括以下步骤:
从类案检索系统获取检索人员信息、检索法院信息、检索系统信息、检索案件基本信息、检索内容及结果裁判文书;
利用案件要素认知模块对检索内容和结果裁判文书进行案件要素认知;
基于认知的案件要素,对检索内容和结果裁判文书进行相似性综合评价;
基于认知的案件要素,对检索内容和结果裁判文书进行案例裁判参考分析;
根据预先准备好的定制化的类案检索报告模板,关联上述步骤中的相关内容和结果,生成类案检索报告;
所述案件要素包括:标题、案号、文书来源、审理程序、审理法院、裁判日期、事实特征、诉讼请求、适用法条、争议焦点、本院认为、裁判要旨、裁判结果;对于标题、案号、文书来源、审理程序、审理法院、裁判日期,所述案件要素认知模块采用正则表达式进行快速认知,正则表达式由技术人员基于法律专家提供的正则素材整理生成;对于事实特征、诉讼请求、适用法条、争议焦点、本院认为、裁判观点、裁判结果,所述案件要素认知模块通过已构建的训练好的BERT+BILSTM+CRF模型进行快速认知;
所述BERT+BILSTM+CRF模型中,首先通过BERT语言模型进行文本特征提取获得向量矩阵;然后通过BILSTM模型进行认知要素识别;最后通过CRF模型对BILSTM模型的识别结果进行状态转移矩阵处理,得到一个全局最优结果;
所述基于认知的案件要素,对检索内容和结果裁判文书进行相似性综合评价,包括:针对检索内容面向事实特征、适用法条、争议焦点的认知的案件要素与结果裁判文书面向事实特征、适用法条、争议焦点的认知的案件要素进行匹配性分析;同时根据上述案件要素的匹配情况通过计算给出每个裁判文书的相似性打分;
所述相似性打分的计算公式如下:
其中,Score(Q,d)表示检索内容Q与结果裁判文书d的相似性计算得分;n为检索内容Q中包含的认知的要素个数,qi为检索内容Q中包含的第i个认知要素,Wi为该认知要素qi的权重,R(qi,d)为该认知要素qi与结果裁判文书d的相关性分数;
Wi的计算公式具体如下:
其中,N表示本地裁判文书库的总个数,dfi表示包含认知要素qi的历史文书个数;
R(qi,d)的计算公式具体如下:
其中,ki为认知要素qi的专家给定分值,默认为1,对于一些比较重要的认知要素设置为1-10之间的分值,分值越高说明影响越大,dl为d中认知的要素个数,n为检索内容Q中包含的认知要素个数;
所述基于认知的案件要素,对检索内容和结果裁判文书进行案例裁判参考分析,包括:针对检索内容面向本院认为、裁判观点、裁判结果的认知的案件要素与结果裁判文书中面向本院认为、裁判观点、裁判结果的认知的案件要素通过案例裁判参考分析模型进行对比分析,形成案例裁判参考分析结果;案例裁判参考分析模型面向各案由通过梳理法官办案中开展案例裁判参考的关注点和知识点进行建模。
2.根据权利要求1所述的方法,其特征在于,所述类案检索系统包含法院自己研制的类案检索系统,以及法院内网在用的各厂家研制的类案检索系统,并对类案检索系统进行接口改造以便能够从类案检索系统获取相关信息。
3.根据权利要求1所述的方法,其特征在于,所述从类案检索系统获取检索人员信息、检索法院信息、检索系统信息、检索案件基本信息、检索内容及结果裁判文书,其中检索内容及结果裁判文书为必需项;检索人员信息和检索法院信息是当前开展类案检索的人员及检索案件所属法院信息;类案检索系统信息是指本次检索报告来自哪个类案检索系统;检索案件基本信息是本次类案检索报告关联到的案件信息;检索内容是在类案检索系统进行类案检索的内容信息,其是一段案情或者一篇前置文书;结果裁判文书是类案检索系统检索出来的相似性高的裁判文书。
4.根据权利要求1所述的方法,其特征在于,所述类案检索报告模板由基础模板和各法院的定制化模板组成;定制化模板是各法院在基础模板之上结合自己的个性化需求修改而成;基础模板包括检索内容、相似性分析、案例裁判参考分析、检索结果汇总信息,其中检索结果汇总信息包括检索结果的标题、案号、审理法院、审理时间、案件来源、本院查明、裁判结果、事实特征、适用法条。
5.一种采用权利要求1~4中任一权利要求所述方法的类案检索报告生成的装置,其特征在于,包括:
信息获取模块,用于从类案检索系统至少获取检索内容及结果裁判文书;
要素认知模块,用于从信息获取模块获取到相关信息后,通过调用案件要素认知模块,对检索内容和检索结果裁判文书进行案件要素认知,并将认知的案件要素发送至相似性评价模块和裁判参考分析模块;
相似性评价模块,用于基于要素认知模块发送过来的认知要素,对检索内容和结果裁判文书进行相似性综合评价,相似性综合评价结果供报告生成模块使用;
裁判参考分析模块,用于基于要素认知模块发送过来的认知要素,对检索内容和结果裁判文书进行案例裁判参考分析,案例裁判参考分析结果供报告生成模块使用;
报告生成模块,用于根据预先准备好的定制化的类案检索报告模板,关联相关内容和结果,生成类案检索报告。
6.一种电子设备,其特征在于,包括一个或多个处理器、存储装置及存储在所述存储装置中一个或多个可在所述处理器上运行的计算机程序,所述计算机程序包括用于执行权利要求1~4中任一权利要求所述方法的指令。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现权利要求1~4中任一权利要求所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111293990.9A CN114048308B (zh) | 2021-11-03 | 2021-11-03 | 一种类案检索报告生成的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111293990.9A CN114048308B (zh) | 2021-11-03 | 2021-11-03 | 一种类案检索报告生成的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114048308A CN114048308A (zh) | 2022-02-15 |
CN114048308B true CN114048308B (zh) | 2022-08-16 |
Family
ID=80207070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111293990.9A Active CN114048308B (zh) | 2021-11-03 | 2021-11-03 | 一种类案检索报告生成的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114048308B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116340348B (zh) * | 2023-03-30 | 2023-09-05 | 南北联合信息科技有限公司 | 一种法律事务处理前的量化评估检索方法 |
CN116822477B (zh) * | 2023-05-16 | 2024-04-30 | 浙江法之道信息技术有限公司 | 一种法律文书自动生成系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038091A (zh) * | 2017-10-30 | 2018-05-15 | 上海思贤信息技术股份有限公司 | 一种基于图的裁判文书案件相似计算与检索方法及系统 |
CN108764824A (zh) * | 2018-05-15 | 2018-11-06 | 张民元 | 法律服务报告的生成系统和方法 |
CN110059193A (zh) * | 2019-06-21 | 2019-07-26 | 南京擎盾信息科技有限公司 | 基于法律语义件与文书大数据统计分析的法律咨询系统 |
CN110928994A (zh) * | 2019-11-28 | 2020-03-27 | 北京华宇元典信息服务有限公司 | 相似案例检索方法、相似案例检索装置和电子设备 |
CN112561744A (zh) * | 2019-09-25 | 2021-03-26 | 北京国双科技有限公司 | 一种类似案件的检索报告的生成方法及装置 |
CN113486158A (zh) * | 2021-09-08 | 2021-10-08 | 中国司法大数据研究院有限公司 | 基于案情比对的类案检索方法、装置、设备及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9734241B2 (en) * | 2004-06-23 | 2017-08-15 | Lexisnexis, A Division Of Reed Elsevier Inc. | Computerized system and method for creating aggregate profile reports regarding litigants, attorneys, law firms, judges, and cases by type and by court from court docket records |
WO2017091825A1 (en) * | 2015-11-29 | 2017-06-01 | Vatbox, Ltd. | System and method for automatic validation |
CN108197163B (zh) * | 2017-12-14 | 2021-08-10 | 上海银江智慧智能化技术有限公司 | 一种基于裁判文书的结构化处理方法 |
CA3168488A1 (en) * | 2020-01-21 | 2021-07-29 | Ancestry.Com Operations Inc. | Joint extraction of named entities and relations from text using machine learning models |
CN111368098B (zh) * | 2020-03-31 | 2023-04-07 | 杭州实在智能科技有限公司 | 一种基于情景化的法律咨询评估系统 |
CN111783420A (zh) * | 2020-06-19 | 2020-10-16 | 上海交通大学 | 基于bert模型的抗诉书要素抽取方法、系统、介质及设备 |
CN111858940B (zh) * | 2020-07-27 | 2023-07-25 | 湘潭大学 | 一种基于多头注意力的法律案例相似度计算方法及系统 |
-
2021
- 2021-11-03 CN CN202111293990.9A patent/CN114048308B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038091A (zh) * | 2017-10-30 | 2018-05-15 | 上海思贤信息技术股份有限公司 | 一种基于图的裁判文书案件相似计算与检索方法及系统 |
CN108764824A (zh) * | 2018-05-15 | 2018-11-06 | 张民元 | 法律服务报告的生成系统和方法 |
CN110059193A (zh) * | 2019-06-21 | 2019-07-26 | 南京擎盾信息科技有限公司 | 基于法律语义件与文书大数据统计分析的法律咨询系统 |
CN112561744A (zh) * | 2019-09-25 | 2021-03-26 | 北京国双科技有限公司 | 一种类似案件的检索报告的生成方法及装置 |
CN110928994A (zh) * | 2019-11-28 | 2020-03-27 | 北京华宇元典信息服务有限公司 | 相似案例检索方法、相似案例检索装置和电子设备 |
CN113486158A (zh) * | 2021-09-08 | 2021-10-08 | 中国司法大数据研究院有限公司 | 基于案情比对的类案检索方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114048308A (zh) | 2022-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108563773B (zh) | 基于知识图谱的法律条文精准搜索排序方法 | |
KR101661198B1 (ko) | 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 | |
CN114048308B (zh) | 一种类案检索报告生成的方法及装置 | |
US10942977B2 (en) | Systems and methods for targeting, reviewing, and presenting online social network data by evidence context | |
CN104537116B (zh) | 一种基于标签的图书搜索方法 | |
US20040249808A1 (en) | Query expansion using query logs | |
CN103927358A (zh) | 文本检索方法及系统 | |
CN109308321A (zh) | 一种知识问答方法、知识问答系统及计算机可读存储介质 | |
CN110941612A (zh) | 基于关联数据的自治数据湖构建系统及方法 | |
CN103488752B (zh) | 一种poi智能检索的检索方法 | |
US20110191335A1 (en) | Method and system for conducting legal research using clustering analytics | |
CN110362596A (zh) | 一种文本抽取信息结构化数据处理的控制方法及装置 | |
CN113723853A (zh) | 岗位胜任力需求数据处理方法及装置 | |
CN112380868A (zh) | 一种基于事件三元组的信访目的多分类装置及其方法 | |
CN112328773A (zh) | 基于知识图谱的问答实现方法和系统 | |
CN116561264A (zh) | 一种基于知识图谱的智能问答系统的构建方法 | |
CN113220951A (zh) | 一种基于智能内容的医学临床支持方法和系统 | |
CN105631032B (zh) | 基于抽象语义推荐的问答知识库建立方法、装置及系统 | |
Dorn et al. | Meta-search in human resource management | |
US20140012854A1 (en) | Method or system for semantic categorization | |
Demartini et al. | A model for ranking entities and its application to wikipedia | |
CN112269877A (zh) | 数据标注方法及装置 | |
Nadig et al. | Database search vs. information retrieval: A novel method for studying natural language querying of semi-structured data | |
Chen et al. | Research and Design of Knowledge System Construction System Based on Natural Language Processing | |
CN114152444B (zh) | 一种发动机台架安装和排故的便携式辅助系统及使用方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |