CN110390083B - 近似案件的推送方法、装置、计算机设备和存储介质 - Google Patents
近似案件的推送方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110390083B CN110390083B CN201910520103.3A CN201910520103A CN110390083B CN 110390083 B CN110390083 B CN 110390083B CN 201910520103 A CN201910520103 A CN 201910520103A CN 110390083 B CN110390083 B CN 110390083B
- Authority
- CN
- China
- Prior art keywords
- case
- vector
- factor
- historical
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 239000013598 vector Substances 0.000 claims abstract description 306
- 238000004590 computer program Methods 0.000 claims description 24
- 230000006835 compression Effects 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/182—Alternative dispute resolution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及大数据领域中一种近似案件的推送方法、装置、计算机设备和存储介质。所述方法包括:获取当前案件的案件标识,根据所述案件标识提取对应的案件关键信息;利用所述案件关键信息计算所述案件标识对应的当前案件向量;将所述当前案件向量与大数据平台中历史案件向量进行比对,得到所述当前案件与历史案件之间的相似度;当所述相似度达到阈值时,将对应的历史案件标记为近似案件;将所述近似案件的裁决书推送至终端。采用本方法能够有效提高裁决书生成效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种近似案件的推送方法、装置、计算机设备和存储介质。
背景技术
仲裁作为一种非诉纠纷解决方式,与诉讼方式不同。仲裁是当事人自愿将诉争事由提交给中立的第三方裁判的争议解决方式。在线仲裁的推出,为当事人申请案件仲裁提供了方便。在线仲裁时,仲裁员根据远程庭审的情况会给出相应的裁决意见。随着在线仲裁的案件逐步增多,如何帮助仲裁员快速给出相应的裁决意见,提高裁决书生成效率成为目前需要解决的一个技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够有效提高裁决书生成效率的近似案件的推送方法、装置、计算机设备和存储介质。
一种近似案件的推送方法,所述方法包括:
获取当前案件的案件标识,根据所述案件标识提取对应的案件关键信息;
利用所述案件关键信息计算所述案件标识对应的当前案件向量;
将所述当前案件向量与大数据平台中历史案件向量进行比对,得到所述当前案件与历史案件之间的相似度;
当所述相似度达到阈值时,将对应的历史案件标记为近似案件;
将所述近似案件的裁决书推送至终端。
在其中一个实施例中,所述利用所述案件关键信息计算所述案件标识对应的当前案件向量包括:
利用所述案件关键信息计算所述案件标识对应的待生成裁决书的文本向量;
在所述案件关键信息中进行因子抽取,利用抽取到的因子计算所述案件标识对应的待生成裁决书的因子向量;
利用所述文本向量与所述因子向量生成所述案件标识对应的当前案件向量。
在其中一个实施例中,所述在所述案件关键信息中进行因子抽取,利用抽取到的因子计算所述案件标识对应的因子向量包括:
获取与所述案件标识对应的案件类型;
调用与所述案件类型对应的因子文件,所述因子文件中记录了多种因子对应的关键字以及因子条件;
利用所述关键字在所述案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对,得到因子比对结果;
根据因子比对结果生成与所述案件标识对应的因子向量。
在其中一个实施例中,所述根据因子比对结果生成与所述案件标识对应的因子向量包括:
获取所述案件关键信息中各组成部分对应的权重;
根据所述权重对各组成部分对应的因子比对结果进行修正;
利用修正后的因子比对结果生成与所述案件标识对应的因子向量。
在其中一个实施例中,所述方法还包括:
对大数据平台中多个历史案件向量进行压缩,得到压缩后的历史案件向量;
将当前案件向量进行压缩,得到压缩后的当前案件向量;
所述将所述当前案件向量在大数据平台中多个历史案件向量进行比对包括:
将所述压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。
在其中一个实施例中,在所述将所述压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对之后,所述方法还包括:
将所述压缩后的当前案件向量与多个压缩后的历史案件向量比对后所得到的相似度标记为第一相似度;
当所述第一相似度达到第一阈值时,将对应的历史案件标记为初步近似案件;
获取所述初步近似案件对应的历史案件向量;
将所述当前案件向量与多个初步近似案件对应的历史案件向量分别进行比对,得到当前案件与多个初步近似案件之间的第二相似度;
当所述第二相似度达到第二阈值时,将所述初步近似案件标记为近似案件。
一种近似案件的推送装置,所述装置包括:
获取模块,用于获取当前案件的案件标识,根据所述案件标识提取对应的案件关键信息;
向量计算模块,用于利用所述案件关键信息计算所述案件标识对应的当前案件向量;
向量比对模块,用于将所述当前案件向量与大数据平台中历史案件向量进行比对,得到所述当前案件与历史案件之间的相似度;当所述相似度达到阈值时,将对应的历史案件标记为近似案件;
推送模块,用于将所述近似案件的裁决书推送至终端。
在其中一个实施例中,所述装置还包括:
向量压缩模块,用于对大数据平台中多个历史案件向量进行压缩,得到压缩后的历史案件向量;将当前案件向量进行压缩,得到压缩后的当前案件向量;所述向量比对模块还用于将所述压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
上述近似案件的推送方法、装置、计算机设备和存储介质,服务器根据案件标识提取对应的案件关键信息,利用案件关键信息可以计算出与案件标识对应的当前案件向量。通过将当前案件向量与大数据平台中的多个历史案件向量进行比对,由此可以得到当前案件与多个历史案件之间的相似度。当相似度达到阈值时,服务器可以将对应的历史案件标记为近似案件,从而能够在海量的历史案件中快速准确的搜索到近似案件。将近似案件的裁决书推送至仲裁员对应的终端,进而可以帮助仲裁员快速给出仲裁意见,不仅为仲裁员提供了方便,也促进了仲裁书生成效率的提高。
附图说明
图1为一个实施例中近似案件的推送方法的应用场景图;
图2为一个实施例中近似案件的推送方法的流程示意图;
图3为一个实施例中利用案件关键信息计算案件标识对应的当前案件向量步骤的流程示意图;
图4为另一个实施例中近似案件的推送方法的流程示意图;
图5为一个实施例中近似案件的推送装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的近似案件的推送方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种近似案件的推送方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取当前案件的案件标识,根据案件标识提取对应的案件关键信息。
在线仲裁包括多个仲裁环节,如立案环节、庭前准备环节、庭审环节、裁决环节等。服务器在每个仲裁环节均采集相应的案件信息,生成与案件标识对应的电子卷宗。电子卷宗中包括案件基础信息与案件关键信息等。其中,案件基础信息包括:申请人信息、被申请人信息、案号、仲裁庭概况、申请人仲裁请求、事实与理由、被申请人答辩意见等。案件关键信息包括争议焦点、案由、案件事实、仲裁请求等。在庭审环节结束之后,进入裁决环节。在裁决环节中,服务器可以在大数据平台中搜索与当前案件相近似的历史案件。
步骤204,利用案件关键信息计算案件标识对应的当前案件向量。
步骤206,将当前案件向量在大数据平台中历史案件向量进行比对,得到当前案件与历史案件之间的相似度。
在裁决环节中,仲裁员需要根据争议焦点、案由、案件事实、仲裁请求等案件关键信息来制作相应的裁决书。争议焦点、案由、案件事实、仲裁请求等作为裁决书的组成部分,也可以从整体上反映仲裁案件的情况。因此,服务器可以利用案件关键信息与历史案件的裁决书进行比对,以便检索相应的近似案件。
服务器可以利用案件关键信息生成案件标识对应的待生成裁决书对应的向量,该向量也可以称为当前案件向量。案件向量包括文本向量与因子向量。其中,服务器利用案件关键信息生成与案件标识对应的文本向量以及因子向量。文本向量可以是当前案件待生成的裁决书所对应的文本向量。因子向量可以是当前案件待生成的裁决书所对应的因子向量。服务器将文本向量与因子向量进行拼接,生成与案件标识对应的向量,即当前案件向量。
其中,文本向量只能反映裁决书的文字特征,而裁决书是法律文件,需要进一步从法律层面来反映案件特征。服务器上预先建立了多种案件类型对应的因子,不同的因子对应不同的因子条件。服务器利用关键字在案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对。服务器利用因子比对结果,生成与案件标识对应的因子向量。
大数据平台中预先存储了多个历史案件向量。该历史案件向量可以是利用历史案件对应的裁决书(也可以称为历史裁决书)计算出的。历史案件向量也包括反映文字特征的文本向量以及反映法律特征的因子向量。
步骤208,当相似度达到阈值时,将对应的历史案件标记为近似案件。
步骤210,将近似案件的裁决书推送至终端。
服务器将当前案件向量与大数据平台中的多个历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。当相似度达到阈值时,服务器将相应的历史案件标记为近似案件。由于当前案件向量与历史案件向量中不仅包含了文字特征,也包含了与案件相应的法律特征,通过向量比对,由此能够在海量的历史案件中准确得到当前案件的近似案件。服务器将近似案件的裁决书发送至仲裁员对应的终端。
本实施例中,服务器根据案件标识提取对应的案件关键信息,利用案件关键信息可以计算出与案件标识对应的当前案件向量。通过将当前案件向量与大数据平台中的多个历史案件向量进行比对,由此可以得到当前案件与多个历史案件之间的相似度。当相似度达到阈值时,服务器可以将对应的历史案件标记为近似案件,从而能够在海量的历史案件中快速准确的搜索到近似案件。将近似案件的裁决书推送至仲裁员对应的终端,进而可以帮助仲裁员快速给出仲裁意见,不仅为仲裁员提供了方便,也促进了仲裁书生成效率的提高。
在一个实施例中,如图3所示,利用案件关键信息计算案件标识对应的当前案件向量的步骤包括:
步骤302,利用案件关键信息计算案件标识对应的待生成裁决书的文本向量。
步骤304,在案件关键信息中进行因子抽取,利用抽取到的因子计算案件标识对应的待生成裁决书的因子向量。
步骤306,利用文本向量与因子向量生成案件标识对应的当前案件向量。
由于当前案件待生成裁决书中将会包含案件关键信息,因此可以利用案件关键信息计算待生成裁决书的向量,即当前案件向量。服务器可以预先对海量的历史案件的裁决书中的词语进行统计,以及获取人工定义的与法律相关的多种词语,构建相应的词库。案件关键信息可以包括多个段落,即争议焦点、案由、案件事实、仲裁请求等可以分别作为一个段落。每个段落中包括多个句子,每个句子中可以包括多个词语。在计算待生成裁决书的向量时,服务器可以先根据案件关键信息计算待生成裁决书的文本向量。其中,服务器针对当前案件的案件关键信息进行分词处理,根据每个词语在词库中出现的频率计算其相应的词频,以及逆词频,利用词频与逆词频计算待生成裁决书的文本向量,即当前案件对应的文本向量。文本向量可以反映当前案件待生成裁决书的文字特征。
服务器上预先存储了多种案件类型对应的因子文件。因子文件中记录了多种因子对应的关键字以及因子条件。例如,因子可以包括:交易行为、是否侵犯、非法侵占、故意侵权、是否牟利等,因子条件包括:是、否等。不同的因子对应不同的因子条件。服务器利用关键字在案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对,得到相应的因子比对结果。其中,服务器可以对从争议焦点、案由、案件事实、仲裁请求等抽取到的因子分别与因子条件进行比对。例如,当提取到的因子,与因子条件比对后,因子比对结果为是,则可以用1表示,因子比对结果为否,可以用0表示。争议焦点、案由、案件事实、仲裁请求等作为裁决书的组成部分,也可以从整体上反映仲裁案件的情况。争议焦点、案由、案件事实、仲裁请求等在裁决书中按照预设顺序进行排布,服务器可以根据该预设顺序对各个因子比对结果进行排列,生成多个维度的待生成裁决书对应的因子向量,即当前案件的因子向量。由于因子是根据法律术语进行提炼的,因此,因子向量能够反映与仲裁案件相应的法律特征。
服务器将待生成裁决书对应的文本向量与因子向量进行拼接,生成当前案件待生成裁决书对应的向量,即当前案件向量。其中,服务器可以在文本向量后拼接因子向量,生成当前案件向量。服务器也可以在因子向量后拼接文本向量,生成当前案件向量。
由于当前案件向量与历史案件向量中不仅包含了文本向量也包含了因子向量,其中文本向量反映了裁决书的文字特征,因子是根据法律术语提炼的,因子向量能够反映与案件相应的法律特征,通过向量比对,由此能够提高在海量的历史案件中搜索近似案件的成功率。
可以理解,如果大数据平台中暂未上传历史案件,当前案件是首次出现的仲裁案件时,则无需上述计算,可以直接由仲裁员根据案件信息制作相应的裁决书。
在一个实施例中,根据因子比对结果生成与案件标识对应的因子向量包括:获取案件关键信息中各组成部分对应的权重;根据权重对各组成部分对应的因子比对结果进行修正;利用修正后的因子比对结果生成与案件标识对应的因子向量。
案件关键信息包括多个组成部分,如争议焦点、案由、案件事实、仲裁请求等。其中,各组成部分对应近似案件搜索的重要程度各不相同。例如,事实与证据的重要程度要超过争议焦点的重要程度。为了能够在搜索近似案件时,案件关键信息中各部分内容的重要程度得到均衡,更有利于在大数据平台中搜索到近似案件,服务器可以预先配置案件关键信息中各组成部分对应的权重。服务器在得到因子比对结果之后,可以利用权重对各组成部分的因子比对结果进行修正。例如,可以通过将因子比对结果乘以相应的权重的方式,进行修正。例如,事实与证据的因子比对结果对应的权重为60%,仲裁请求的因子比对结果对应的权重为30%,争议焦点的因子比对结果对应的权重为10%。服务器利用修改后的因子比对结果生成与案件标识对应的当前案件的因子向量。
在一个实施例中,提供了一种近似案件的推送方法,如图4所示,该方法包括如下步骤:
步骤402,对大数据平台中多个历史案件向量进行压缩,得到压缩后的历史案件向量。
步骤404,获取当前案件的案件标识,根据案件标识提取对应的案件关键信息。
步骤406,利用案件关键信息计算案件标识对应的当前案件向量。
步骤408,将当前案件向量进行压缩,得到压缩后的当前案件向量。
步骤410,将压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。
步骤412,当相似度达到阈值时,将对应的历史案件标记为近似案件。
步骤414,将近似案件的裁决书推送至终端。
服务器可以参照上述实施例中提供的方式,预先对大数据平台中的历史案件的裁决书生成相应的历史案件向量。历史案件向量中包括反映文字特征的文本向量以及反映法律特征的因子向量。由于历史案件向量维度较多,比如可以达到数以千或万计的维度,由此导致服务器在进行向量比对时,运算量过大、运算耗时较长,降低了近似案件的搜索效率。
为了有效减少向量比对的运算量,提高近似案件的搜索效率,服务器可以对历史案件向量的维度进行第一次压缩。例如,将上万维度的历史案件向量压缩为16维或32维的历史案件向量。由于压缩后的历史案件向量采用的是小数,为了进一步简化运算量,服务器还需要对压缩后的历史案件向量进一步压缩(也可以称为第二次压缩),得到采用0、1表达的二值形式的向量。具体的,第一次压缩时,服务器可以采用深度学习模型对历史案件向量对向量维度进行压缩。在进行第二次压缩时,服务器可以对第一次压缩后的历史案件向量进行哈希计算,将小数形式的向量转换为0、1表达的向量。
服务器在需要针对当前案件搜索近似案件时,可以参照上述各个实施例中提供的方式,计算当前案件向量。服务器还可以采用上述向量压缩方式对当前案件向量进行压缩,得到压缩后的当前案件向量。
服务器将压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。当相似度达到阈值时,服务器将相应的历史案件标记为近似案件。由于当前案件向量与历史案件向量均经过了压缩处理,由此可以有效减少向量比对的运算量,提供近似案件的搜索效率。
考虑到采用上述方式对当前案件向量与历史案件向量进行压缩处理后,由于维度压缩,会导致部分特征损失,包括文本特征损失以及法律特征的损失,从而会使得近似案件搜索的准确性下降。
为了弥补之一损失,提供近似案件搜索的准确性,服务器在将压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对之后,还会对相应未压缩的向量进行比对。
在其中一个实施例中,在将压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对之后,该方法还包括:将压缩后的当前案件向量与多个压缩后的历史案件向量比对后所得到的相似度标记为第一相似度;当第一相似度达到第一阈值时,将对应的历史案件标记为初步近似案件;获取初步近似案件对应的历史案件向量;将当前案件向量与多个初步近似案件对应的历史案件向量分别进行比对,得到当前案件与多个初步近似案件之间的第二相似度;当第二相似度达到第二阈值时,将初步近似案件标记为近似案件。
相似度对应的阈值包括第一阈值和第二阈值。其中,第一阈值可以与第二阈值相同,也可以不同。服务器在将压缩后的当前案件向量与多个压缩后的历史案件向量比对后,可以将第一相似度达到第一阈值的历史案件标记为初步近似案件。也就是说,服务器可以通过压缩后的当前案件向量与压缩后的历史案件向量进行比对,能够在海量的历史案件中筛选出近似案件的范围,将该范围内的历史案件作为初步近似案件,再进一步进行近似案件搜索。
服务器将当前案件向量(即未被压缩的当前案件向量)与初步近似案件对应的历史案件向量(即未被压缩的历史案件向量)进行比对,得到当前案件与多个初步近似案件之间的第二相似度。也就是说,服务器在利用压缩后的向量进行比对,对近似案件进行筛选,有效减少了未压缩向量比对的运算量,能够有效提高近似案件的搜索效率。服务器利用未被压缩的当前案件向量与筛选出的历史案件向量进行比对(例如,可以是上万维度的案件向量之间进行比对),由于被比对的向量之间保留了所有的特征,从而能够有效提高相似案件搜索的准确性。
进一步的,服务区还可以对第二相似度进行排序,筛选出预设数量的近似案件,将筛选出的近似案件的裁决书作为搜索到的最近似裁决书发送至仲裁员对应的终端,以便仲裁员利用最近似裁决书能够快速有效的完成当前案件的裁决书。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种近似案件的推送装置,包括:获取模块502、向量计算模块504、向量比对模块506、推送模块508,其中:
获取模块502,用于获取当前案件的案件标识,根据案件标识提取对应的案件关键信息。
向量计算模块504,用于利用案件关键信息计算案件标识对应的当前案件向量。
向量比对模块506,用于将当前案件向量与大数据平台中历史案件向量进行比对,得到当前案件与历史案件之间的相似度;当相似度达到阈值时,将对应的历史案件标记为近似案件。
推送模块508,用于将近似案件的裁决书推送至终端。
在一个实施例中,向量计算模块还用于利用案件关键信息计算案件标识对应的待生成裁决书的文本向量;在案件关键信息中进行因子抽取,利用抽取到的因子计算案件标识对应的待生成裁决书的因子向量;利用文本向量与因子向量生成案件标识对应的当前案件向量。
在一个实施例中,向量计算模块还用于获取与案件标识对应的案件类型;调用与案件类型对应的因子文件,因子文件中记录了多种因子对应的关键字以及因子条件;利用关键字在案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对,得到因子比对结果;根据因子比对结果生成与案件标识对应的因子向量。
在一个实施例中,向量计算模块还用于获取案件关键信息中各组成部分对应的权重;根据权重对各组成部分对应的因子比对结果进行修正;利用修正后的因子比对结果生成与案件标识对应的因子向量。
在一个实施例中,该装置还包括:向量压缩模块,用于对大数据平台中多个历史案件向量进行压缩,得到压缩后的历史案件向量;将当前案件向量进行压缩,得到压缩后的当前案件向量;向量比对模块还用于将压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。
在一个实施例中,向量比对模块还用于将压缩后的当前案件向量与多个压缩后的历史案件向量比对后所得到的相似度标记为第一相似度;当第一相似度达到第一阈值时,将对应的历史案件标记为初步近似案件;获取初步近似案件对应的历史案件向量;将当前案件向量与多个初步近似案件对应的历史案件向量分别进行比对,得到当前案件与多个初步近似案件之间的第二相似度;当第二相似度达到第二阈值时,将初步近似案件标记为近似案件。
关于近似案件的推送装置的具体限定可以参见上文中对于近似案件的推送方法的限定,在此不再赘述。上述近似案件的推送装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储仲裁案件的电子卷宗等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种近似案件的推送方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取当前案件的案件标识,根据案件标识提取对应的案件关键信息;利用案件关键信息计算案件标识对应的当前案件向量;将当前案件向量与大数据平台中历史案件向量进行比对,得到当前案件与历史案件之间的相似度;当相似度达到阈值时,将对应的历史案件标记为近似案件;将近似案件的裁决书推送至终端。
在一个实施例中,该处理器执行计算机程序时还实现以下步骤:利用案件关键信息计算案件标识对应的待生成裁决书的文本向量;在案件关键信息中进行因子抽取,利用抽取到的因子计算案件标识对应的待生成裁决书的因子向量;利用文本向量与因子向量生成案件标识对应的当前案件向量。
在一个实施例中,该处理器执行计算机程序时还实现以下步骤:获取与案件标识对应的案件类型;调用与案件类型对应的因子文件,因子文件中记录了多种因子对应的关键字以及因子条件;利用关键字在案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对,得到因子比对结果;根据因子比对结果生成与案件标识对应的因子向量。
在一个实施例中,该处理器执行计算机程序时还实现以下步骤:获取案件关键信息中各组成部分对应的权重;根据权重对各组成部分对应的因子比对结果进行修正;利用修正后的因子比对结果生成与案件标识对应的因子向量。
在一个实施例中,该处理器执行计算机程序时还实现以下步骤:对大数据平台中多个历史案件向量进行压缩,得到压缩后的历史案件向量;将当前案件向量进行压缩,得到压缩后的当前案件向量;将当前案件向量在大数据平台中多个历史案件向量进行比对包括:将压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。
在一个实施例中,该处理器执行计算机程序时还实现以下步骤:将压缩后的当前案件向量与多个压缩后的历史案件向量比对后所得到的相似度标记为第一相似度;当第一相似度达到第一阈值时,将对应的历史案件标记为初步近似案件;获取初步近似案件对应的历史案件向量;将当前案件向量与多个初步近似案件对应的历史案件向量分别进行比对,得到当前案件与多个初步近似案件之间的第二相似度;当第二相似度达到第二阈值时,将初步近似案件标记为近似案件。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取当前案件的案件标识,根据案件标识提取对应的案件关键信息;利用案件关键信息计算案件标识对应的当前案件向量;将当前案件向量与大数据平台中历史案件向量进行比对,得到当前案件与历史案件之间的相似度;当相似度达到阈值时,将对应的历史案件标记为近似案件;将近似案件的裁决书推送至终端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:利用案件关键信息计算案件标识对应的待生成裁决书的文本向量;在案件关键信息中进行因子抽取,利用抽取到的因子计算案件标识对应的待生成裁决书的因子向量;利用文本向量与因子向量生成案件标识对应的当前案件向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取与案件标识对应的案件类型;调用与案件类型对应的因子文件,因子文件中记录了多种因子对应的关键字以及因子条件;利用关键字在案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对,得到因子比对结果;根据因子比对结果生成与案件标识对应的因子向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取案件关键信息中各组成部分对应的权重;根据权重对各组成部分对应的因子比对结果进行修正;利用修正后的因子比对结果生成与案件标识对应的因子向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对大数据平台中多个历史案件向量进行压缩,得到压缩后的历史案件向量;将当前案件向量进行压缩,得到压缩后的当前案件向量;将当前案件向量在大数据平台中多个历史案件向量进行比对包括:将压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将压缩后的当前案件向量与多个压缩后的历史案件向量比对后所得到的相似度标记为第一相似度;当第一相似度达到第一阈值时,将对应的历史案件标记为初步近似案件;获取初步近似案件对应的历史案件向量;将当前案件向量与多个初步近似案件对应的历史案件向量分别进行比对,得到当前案件与多个初步近似案件之间的第二相似度;当第二相似度达到第二阈值时,将初步近似案件标记为近似案件。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种近似案件的推送方法,所述方法包括:
获取当前案件的案件标识,根据所述案件标识提取对应的案件关键信息;
利用所述案件关键信息计算所述案件标识对应的当前案件向量,包括:利用关键字在所述案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对,根据因子比对结果生成与所述案件标识对应的因子向量,并对所述当前案件的案件关键信息进行分词处理,根据每个词语在词库中出现的频率计算其相应的词频,以及逆词频,利用词频与逆词频计算待生成裁决书的文本向量,将文本向量与因子向量进行拼接得到所述案件标识对应的当前案件向量;
将所述当前案件向量与大数据平台中历史案件向量进行比对,得到所述当前案件与历史案件之间的相似度;
当所述相似度达到阈值时,将对应的历史案件标记为近似案件;
将所述近似案件的裁决书推送至终端。
2.根据权利要求1所述的方法,其特征在于,所述利用所述案件关键信息计算所述案件标识对应的当前案件向量包括:
利用所述案件关键信息计算所述案件标识对应的待生成裁决书的文本向量;
在所述案件关键信息中进行因子抽取,利用抽取到的因子计算所述案件标识对应的待生成裁决书的因子向量;
利用所述文本向量与所述因子向量生成所述案件标识对应的当前案件向量。
3.根据权利要求2所述的方法,其特征在于,所述在所述案件关键信息中进行因子抽取,利用抽取到的因子计算所述案件标识对应的因子向量包括:
获取与所述案件标识对应的案件类型;
调用与所述案件类型对应的因子文件,所述因子文件中记录了多种因子对应的关键字以及因子条件;
利用所述关键字在所述案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对,得到因子比对结果;
根据因子比对结果生成与所述案件标识对应的因子向量。
4.根据权利要求3所述的方法,其特征在于,所述根据因子比对结果生成与所述案件标识对应的因子向量包括:
获取所述案件关键信息中各组成部分对应的权重;
根据所述权重对各组成部分对应的因子比对结果进行修正;
利用修正后的因子比对结果生成与所述案件标识对应的因子向量。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
对大数据平台中多个历史案件向量进行压缩,得到压缩后的历史案件向量;
将当前案件向量进行压缩,得到压缩后的当前案件向量;
所述将所述当前案件向量在大数据平台中多个历史案件向量进行比对包括:
将所述压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。
6.根据权利要求5所述的方法,其特征在于,在所述将所述压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对之后,所述方法还包括:
将所述压缩后的当前案件向量与多个压缩后的历史案件向量比对后所得到的相似度标记为第一相似度;
当所述第一相似度达到第一阈值时,将对应的历史案件标记为初步近似案件;
获取所述初步近似案件对应的历史案件向量;
将所述当前案件向量与多个初步近似案件对应的历史案件向量分别进行比对,得到当前案件与多个初步近似案件之间的第二相似度;
当所述第二相似度达到第二阈值时,将所述初步近似案件标记为近似案件。
7.一种近似案件的推送装置,其特征在于,所述装置包括:
获取模块,用于获取当前案件的案件标识,根据所述案件标识提取对应的案件关键信息;
向量计算模块,用于利用所述案件关键信息计算所述案件标识对应的当前案件向量,包括:利用关键字在所述案件关键信息中进行因子抽取,将抽取到的因子与因子条件进行比对,根据因子比对结果生成与所述案件标识对应的因子向量,并对所述当前案件的案件关键信息进行分词处理,根据每个词语在词库中出现的频率计算其相应的词频,以及逆词频,利用词频与逆词频计算待生成裁决书的文本向量,将文本向量与因子向量进行拼接得到所述案件标识对应的当前案件向量;
向量比对模块,用于将所述当前案件向量与大数据平台中历史案件向量进行比对,得到所述当前案件与历史案件之间的相似度;当所述相似度达到阈值时,将对应的历史案件标记为近似案件;
推送模块,用于将所述近似案件的裁决书推送至终端。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
向量压缩模块,用于对大数据平台中多个历史案件向量进行压缩,得到压缩后的历史案件向量;将当前案件向量进行压缩,得到压缩后的当前案件向量;所述向量比对模块还用于将所述压缩后的当前案件向量与大数据平台中多个压缩后的历史案件向量进行比对,得到当前案件与多个历史案件之间的相似度。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910520103.3A CN110390083B (zh) | 2019-06-17 | 2019-06-17 | 近似案件的推送方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910520103.3A CN110390083B (zh) | 2019-06-17 | 2019-06-17 | 近似案件的推送方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110390083A CN110390083A (zh) | 2019-10-29 |
CN110390083B true CN110390083B (zh) | 2023-12-22 |
Family
ID=68285420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910520103.3A Active CN110390083B (zh) | 2019-06-17 | 2019-06-17 | 近似案件的推送方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110390083B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144095B (zh) * | 2019-11-26 | 2024-04-05 | 方正璞华软件(武汉)股份有限公司 | 一种工伤案件裁决书的生成方法及装置 |
CN111144068A (zh) * | 2019-11-26 | 2020-05-12 | 方正璞华软件(武汉)股份有限公司 | 一种相似仲裁案件推荐方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330071A (zh) * | 2017-06-30 | 2017-11-07 | 北京神州泰岳软件股份有限公司 | 一种法律咨询信息智能答复方法及平台 |
CN109684628A (zh) * | 2018-11-23 | 2019-04-26 | 武汉烽火众智数字技术有限责任公司 | 基于案情语义分析的案件智能推送方法及系统 |
CN109697231A (zh) * | 2017-10-24 | 2019-04-30 | 北京国双科技有限公司 | 一种案件文书的显示方法、系统、存储介质和处理器 |
-
2019
- 2019-06-17 CN CN201910520103.3A patent/CN110390083B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330071A (zh) * | 2017-06-30 | 2017-11-07 | 北京神州泰岳软件股份有限公司 | 一种法律咨询信息智能答复方法及平台 |
CN109697231A (zh) * | 2017-10-24 | 2019-04-30 | 北京国双科技有限公司 | 一种案件文书的显示方法、系统、存储介质和处理器 |
CN109684628A (zh) * | 2018-11-23 | 2019-04-26 | 武汉烽火众智数字技术有限责任公司 | 基于案情语义分析的案件智能推送方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110390083A (zh) | 2019-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110362799B (zh) | 基于在线仲裁的裁决书生成处理方法、装置和计算机设备 | |
CN109829629B (zh) | 风险分析报告的生成方法、装置、计算机设备和存储介质 | |
CN109783604B (zh) | 基于少量样本的信息提取方法、装置和计算机设备 | |
CN110751533B (zh) | 产品画像生成方法、装置、计算机设备和存储介质 | |
CN110377558B (zh) | 文档查询方法、装置、计算机设备和存储介质 | |
CN109816200B (zh) | 任务推送方法、装置、计算机设备和存储介质 | |
CN110377631B (zh) | 案件信息处理方法、装置、计算机设备和存储介质 | |
US11461298B1 (en) | Scoring parameter generation for identity resolution | |
CN110738236B (zh) | 图像匹配方法、装置、计算机设备及存储介质 | |
WO2021043076A1 (zh) | 网络发布数据处理方法、装置、计算机设备和存储介质 | |
CN111984792A (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
CN110390083B (zh) | 近似案件的推送方法、装置、计算机设备和存储介质 | |
CN110135943B (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
CN110362542B (zh) | 核电站文件编码方法、装置、计算机设备和存储介质 | |
CN113807353B (zh) | 图像转换模型训练方法、装置、设备及存储介质 | |
CN109460541B (zh) | 词汇关系标注方法、装置、计算机设备和存储介质 | |
CN113590823A (zh) | 一种合同审批方法、装置、存储介质及电子设备 | |
CN110956195B (zh) | 图像匹配方法、装置、计算机设备及存储介质 | |
CN114693192A (zh) | 风控决策方法、装置、计算机设备和存储介质 | |
CN111680181A (zh) | 一种异常对象的识别方法及终端设备 | |
KR101724302B1 (ko) | 특허분쟁예보장치 및 그 방법 | |
CN109271564B (zh) | 保单查询方法及设备 | |
CN110532456B (zh) | 案件查询方法、装置、计算机设备和存储介质 | |
CN110533381B (zh) | 案件管辖权审核方法、装置、计算机设备和存储介质 | |
CN117216239A (zh) | 文本去重方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |