CN111539853A - 标准案由确定方法、装置和设备 - Google Patents

标准案由确定方法、装置和设备 Download PDF

Info

Publication number
CN111539853A
CN111539853A CN202010565166.3A CN202010565166A CN111539853A CN 111539853 A CN111539853 A CN 111539853A CN 202010565166 A CN202010565166 A CN 202010565166A CN 111539853 A CN111539853 A CN 111539853A
Authority
CN
China
Prior art keywords
case
standard
initial
standard case
routing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010565166.3A
Other languages
English (en)
Other versions
CN111539853B (zh
Inventor
朱标
章鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010565166.3A priority Critical patent/CN111539853B/zh
Priority to CN202011365076.6A priority patent/CN112365374B/zh
Publication of CN111539853A publication Critical patent/CN111539853A/zh
Application granted granted Critical
Publication of CN111539853B publication Critical patent/CN111539853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请的一个或多个实施例提出标准案由确定方法、装置和设备。该标准案由确定方法可以包括,对获取的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量。计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分。基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由。该方法还可以应用于基于区块链节点设备中,以使区块链节点设备可以调用上述区块链中发布的标准案由确定智能合约,确定与初始案由对应的标准案由。

Description

标准案由确定方法、装置和设备
技术领域
本申请涉及计算机技术,具体涉及标准案由确定方法、装置和设备。
背景技术
在众多领域中,尤其在金融领域,需要通过统计目标企业涉诉的次数,以及该目标企业涉诉的案由,来确定上述目标企业的诉讼风险。
在相关技术中,由于法律文书中的案由通常由人工进行录入,因此,针对同一种案件的案由可能会五花八门。而为了企业涉诉案由的统计方便,需要对同一类型案件的案由进行标准化,确定标准案由。
发明内容
有鉴于此,本申请至少公开一种标准案由确定方法,可以包括:
对获取的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量;
计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分;
基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由。
在示出的一实施例中,上述基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由,可以包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量输出,以由用户从上述N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
接收用户确定的上述目标标准案由,并将上述目标标准案由确定为与上述初始案由对应的标准案由。
在示出的一实施例中,上述基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由,可以包括:
从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
将上述目标标准案由确定为与初始案由对应的标准案由。
在示出的一实施例中,上述从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由,可以包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由作为输入,输入预先训练的标准案由确定网络中,得到目标标准案由;其中,上述标准案由确定网络为基于若干标注了真值的训练样本训练得到;上述训练样本的输入为若干标准案由;上述真值为目标标准案由。
在示出的一实施例中,上述从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由,可以包括:
从上述初始案由中提取若干第一关键词;
针对得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由,分别提取与各标准案由分别对应的第二关键词;
分别将上述各标准案由分别对应的第二关键词,与上述第一关键词进行匹配,得到与上述各标准案由分别对应的匹配度;
将上述匹配度中的最高匹配度对应的标准案由确定为满足预设条件的目标标准案由。
在示出的一实施例中,在对获取的初始案由进行向量化处理之前,上述方法还可以包括:
将上述初始案由与上述若干标准案由分别进行精准匹配;
将上述若干标准案由中,与上述初始案由精准匹配的标准案由确定为与上述初始案由对应的标准案由。
在示出的一实施例中,上述将上述初始案由与若干标准案由分别进行精准匹配,可以包括:
基于上述初始案由得到对应的第一哈希值;
分别基于若干标准案由,得到与各标准案由分别对应的第二哈希值;
分别确定上述第一哈希值,与上述各标准案由分别对应的第二哈希值是否一致;
将与上述第一哈希值一致的第二哈希值所对应的标准案由,确定为与上述初始案由精准匹配的标准案由。
在示出的一实施例中,上述对获取的初始案由进行向量化处理,可以包括:
对提取出的初始案由进行分词处理,得到与上述初始案由对应的分词集合;
在上述分词集合中,删除对标准案由的确定无意义的单词;
针对删除对标准案由的确定无意义的单词后的分词集合,进行向量化处理。
在示出的一实施例中,上述对标准案由的确定无意义的单词,可以包括以下中的任一或任几项:
高频词;停用词;特殊字符。
在示出的一实施例中,使用bow网络和/或word2vec网络进行向量化处理。
在示出的一实施例中,上述方法可以应用于区块链节点设备;其中,上述区块链中发布了标准案由确定智能合约;
上述对获取的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量;计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分;基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由,并将上述标准案由发布至上述区块链,包括:
响应于标准案由确定请求,向上述区块链发布调用上述标准案由确定智能合约的调用交易;其中,上述调用交易包括初始案由;
响应于上述调用交易,执行上述标准案由确定智能合约中的确定逻辑:
对上述初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量;
计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分;
基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由,并将上述标准案由发布至上述区块链。
本申请提出一种标准案由确定方法,可以包括:
对获取的复合初始案由进行拆分,得到若干初始案由;其中,上述复合初始案由可以包括若干初始案由;
针对上述若干初始案由中的各初始案由,执行上述任一实施例示出的标准案由确定方法,得到与上述各初始案由分别对应的标准案由;
基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由,可以包括:
针对与上述各初始案由分别对应的标准案由,进行相似性聚类,得到若干聚类集合;
基于上述聚类集合中可以包括的标准案由,确定与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述基于上述聚类集合中可以包括的标准案由,确定与上述复合初始案由对应的标准案由,可以包括:
输出可以包括的标准案由数量大于1的聚类集合中所可以包括的多个标准案由,以使用户针对上述多个标准案由进行选择合并,得到合并标准案由;
接收上述合并标准案由;
对上述合并标准案由,以及可以包括的标准案由数量为1的聚类集合中所可以包括的标准案由进行组合,得到与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述基于上述聚类集合中可以包括的标准案由,确定与上述复合初始案由对应的标准案由,可以包括:
对可以包括的标准案由数量大于1的聚类集合中所可以包括的多个标准案由进行选择合并,得到合并标准案由;
对上述合并标准案由,以及可以包括的标准案由数量为1的聚类集合中所可以包括的标准案由进行组合,得到与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述方法可以应用于区块链节点设备;其中,上述区块链中发布了标准案由确定智能合约;
上述对获取的复合初始案由进行拆分,得到若干初始案由;其中,上述复合初始案由包括若干初始案由;针对上述若干初始案由中的各初始案由,执行权利要求1-10任一上述的标准案由确定方法,得到与上述各初始案由分别对应的标准案由;基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由,包括:
响应于标准案由确定请求,向上述区块链发布调用上述标准案由确定智能合约的调用交易;其中,上述调用交易包括复合初始案由;
响应于上述调用交易,执行上述标准案由确定智能合约中的确定逻辑:
对上述复合初始案由进行拆分,得到若干初始案由;其中,上述复合初始案由包括若干初始案由;
针对上述若干初始案由中的各初始案由,执行权利要求1-10任一上述的标准案由确定方法,得到与上述各初始案由分别对应的标准案由;
基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由。
本申请提出一种标准案由确定装置,可以包括:
向量化处理模块,对获取的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量;
相似度评分计算模块,计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分;
标准案由确定模块,基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定模块,可以包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量输出,以由用户从上述N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
接收用户确定的上述目标标准案由,并将上述目标标准案由确定为与上述初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定模块,可以包括:
目标标准案由确定模块,从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
标准案由确定子模块,将上述目标标准案由确定为与初始案由对应的标准案由。
在示出的一实施例中,上述目标标准案由确定模块,可以包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由作为输入,输入预先训练的标准案由确定网络中,得到目标标准案由;其中,上述标准案由确定网络为基于若干标注了真值的训练样本训练得到;上述训练样本的输入为若干标准案由;上述真值为目标标准案由。
在示出的一实施例中,上述目标标准案由确定模块,可以包括:
关键词提取模块,从上述初始案由中提取若干第一关键词;
针对得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由,分别提取与各标准案由分别对应的第二关键词;
匹配模块,分别将上述各标准案由分别对应的第二关键词,与上述第一关键词进行匹配,得到与上述各标准案由分别对应的匹配度;
目标标准案由确定子模块,将上述匹配度中的最高匹配度对应的标准案由确定为满足预设条件的目标标准案由。
在示出的一实施例中,上述装置还可以包括:
精准匹配模块,将上述初始案由与上述若干标准案由分别进行精准匹配;
将上述若干标准案由中,与上述初始案由精准匹配的标准案由确定为与上述初始案由对应的标准案由。
在示出的一实施例中,上述精准匹配模块,还可以包括:
基于上述初始案由得到对应的第一哈希值;
分别基于若干标准案由,得到与各标准案由分别对应的第二哈希值;
分别确定上述第一哈希值,与上述各标准案由分别对应的第二哈希值是否一致;
将与上述第一哈希值一致的第二哈希值所对应的标准案由,确定为与上述初始案由精准匹配的标准案由。
在示出的一实施例中,上述向量化处理模块,可以包括:
对提取出的初始案由进行分词处理,得到与上述初始案由对应的分词集合;
在上述分词集合中,删除对标准案由的确定无意义的单词;
针对删除对标准案由的确定无意义的单词后的分词集合,进行向量化处理。
在示出的一实施例中,上述向量化处理模块,可以包括:
上述对标准案由的确定无意义的单词,可以包括以下中的任一或任几项:
高频词;停用词;特殊字符。
在示出的一实施例中,使用bow网络和/或word2vec网络进行向量化处理。
本申请提出一种标准案由确定装置,标准案由确定装置,可以包括:
拆分模块,对获取的复合初始案由进行拆分,得到若干初始案由;其中,上述复合初始案由可以包括若干初始案由;
标准案由确定模块,针对上述若干初始案由中的各初始案由,执行上述任一实施例公开的的标准案由确定方法,得到与上述各初始案由分别对应的标准案由;
基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定模块,可以包括:
相似性聚合模块,针对与上述各初始案由分别对应的标准案由,进行相似性聚类,得到若干聚类集合;
标准案由确定子模块,基于上述聚类集合中可以包括的标准案由,确定与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定子模块,可以包括:
输出可以包括的标准案由数量大于1的聚类集合中所可以包括的多个标准案由,以使用户针对上述多个标准案由进行选择合并,得到合并标准案由;
接收上述合并标准案由;
对上述合并标准案由,以及可以包括的标准案由数量为1的聚类集合中所可以包括的标准案由进行组合,得到与上述复合初始案由对应的标准案由。
上述标准案由确定子模块,可以包括:
对可以包括的标准案由数量大于1的聚类集合中所可以包括的多个标准案由进行选择合并,得到合并标准案由;
对上述合并标准案由,以及可以包括的标准案由数量为1的聚类集合中所可以包括的标准案由进行组合,得到与上述复合初始案由对应的标准案由。
由上述技术方案可知,一方面,由于本方案对获取出的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量;计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分;基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由,因此,可以对同一类型的初始案由进行标准化处理,达到方便统计案由的目的。
另一方面,由于上述设备可以对获取的复合初始案由进行拆分,得到若干初始案由,并采用上述任一实施例提出的标准案由确定方法,得到与上述若干初始案由分别对应的标准案由,然后,上述设备可以基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由,因此,可以对同一类型的复合初始案由进行标准化处理,达到方便统计案由的目的。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请一个或多个实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请示出的一种标准案由确定方法的方法流程图;
图2为本申请示出的一种标准案由确定方法的方法流程图;
图3为本申请示出的一种复合初始案由标准化处理流程图;
图4为本申请示出的一种标准案由确定装置的结构示意图;
图5为本申请示出的一种标准案由确定装置的结构示意图;
图6为本申请示出的一种标准案由确定设备的硬件结构图;
图7为本申请示出的一种标准案由确定设备的硬件结构图。
具体实施方式
下面将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的设备和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“上述”和“该”也旨在可以包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。还应当理解,本文中所使用的词语“如果”,取决于语境,可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请旨在至少提出一种标准案由确定方法,通过将获取出的初始案由进行向量化处理,并通过与若干标准案由模糊匹配,确定与上述初始案由对应的标准案由,从而可以对同一类型的初始案由进行标准化处理,达到方便统计案由的目的。
以下结合具体实施例对本申请记载的技术方案进行说明。
请参见图1,图1为本申请示出的一种标准案由确定方法的方法流程图。如图1所示,上述方法可以包括:
S102,对获取的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量;
S104,计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分;
S106,基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由。
上述标准案由确定方法可以以软件装置的形式搭载在任意终端设备中。例如,上述终端设备可以PC终端,移动终端,PAD终端等。可以理解的是,在实现上述方法时,通常需要上述终端设备提供算力。
以下以执行主体为搭载该方法的终端设备(以下简称“设备”)为例进行说明。
上述初始案由,具体可以是上述设备获取到的,需要进行标准化操作的案由。上述初始案由通常从法律文书中进行获取。上述法律文书可以是起诉书、裁判文书等文书,在此不作特别限定。
在一实施例中,为了更精准确定诉讼案由,可以从裁判文书中获取上述初始案由。在获取案由时,上述设备可以基于上述裁判文书,获取上述裁判文书中记载的初始案由的相关内容。
在实际应用中,在获取初始案由时,上述设备可以从裁判文书中找到可以包括特定字符的句子或短语,然后将上述句子或短语确定为上述初始案由。
例如,上述特定字符可以是“纠纷”。此时,在获取初始案由时,上述设备可以通过标点符号或空格字符等,对上述裁判文书进行分句处理。然后,上述设备可以针对每一分句,确定其是否可以包括特定字符“纠纷”,并将可以包括特定字符的句子或短语确定为上述初始案由。
在此需要说明的是,从裁判文书获取初始案由的方法还可以是其他方法,在此不作特别限定。
上述向量化处理,通常是通过向量化技术,将上述目标短语或句子转换为预设维度的向量的方法。
在一实施例中,上述向量化处理可以使用以下任一网络:
bow网络(词袋网络,Bag of words model);word2vec网络(词向量网络,wordvector)。
在利用bow网络进行向量化处理时,上述设备可以先对上述初始案由,以及上述若干标准案由进行分词处理。然后,上述设备可以针对得到的分词进行去重处理,并为去重处理后的单词进行编号。当针对去重处理后的单词进行编号后,上述设备可以基于编号后的单词构建词典。
在构建词典后,上述设备可以为上述初始案由创建一个案由向量。其中,上述案由向量的每一维可以对应上述词典中的一个单词。然后统计上述初始案由中可以包括的各单词的数量,并将上述数量填写入上述案由向量中与上述单词对应的位置。当填写完成上述初始案由可以包括的个单词的数量后,上述案由向量可以为上述初始案由对应的初始案由向量。
在利用word2vec网络进行向量化处理时,上述设备可以基于上述初始案由构建若干训练样本,训练cbow网络(连续词袋网络,Continue Bag of words model)或Skip-gram网络,直至该网络收敛。
当该网络收敛后,将上述初始案由可以包括的每一单词分别输入上述网络进行计算,并可以基于隐藏层中的计算结果,构建与上述单词对应的单词向量。在一实施例中,上述隐藏层可以是与输入层最近的隐藏层,或与输出层最近的隐藏层。
在确定上述初始案由可以包括的每一单词对应的词向量后,可以采用向量拼接,相加,相乘等方法对各单词对应的词向量进行融合,得到与上述初始案由对应的初始案由向量。
在此需要说明的是,针对初始案由进行向量化操作的方法还有很多,例如,基于doc2vec网络,one-hot网络等,在此不作穷尽列举。
上述标准案由,通常为标准案由库中的案由。其中,上述标准案由库可以为基于目前法律诉讼中涉及的标准案由所构建的案由库。
上述设备中可以获取与上述标准案由对应的标准案由向量。需要说明的是,上述标准案由向量可以是预先基于标准案由计算得到,或者在执行标准案由确定方法的过程中进行计算的,在此不作限定。
当得到用户发起的标准案由确定方法的指令后,上述设备可以先执行S102,对获取出的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量。
具体地,上述设备可以采用前述向量化处理方法对上述初始案由进行向量化处理(在此不详述),得到与上述初始案由对应的初始案由向量。
在得到上述初始案由向量后,上述设备可以继续执行上述S104,计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分。
在本步骤中,上述设备可以针对上述若干标准案由中的各标准案由执行以下步骤:
获取标准案由对应的标准案由向量。
然后计算上述初始案由向量,与上述标准案由向量之间的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分。
在此需要说明的是,在实际应用中,可以采用余弦距离、马氏距离、欧式距离等方法计算向量之间的相似度,在此不作限定。
上述相似度评分,具体可以在计算出的两个向量之间的距离后进行归一化得到。其中,归一化的方法在此不作限定。
在得到与上述若干标准案由中的各标准案由分别对应的相似度评分,上述设备可以基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由。其中,上述N为根据实际业务情形预先设定的阈值,在此不作限定。
由上述技术方案可知,由于本方案对获取出的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量;计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分;基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由,因此,可以对同一类型的初始案由进行标准化处理,达到方便统计案由的目的。
在一实施例中,在执行S106,基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由时,上述设备可以通过与用户进行交互完成标准案由确定。
在实际应用中,在得到与上述若干标准案由中的各标准案由分别对应的相似度评分后,上述设备可以将得到的相似度评分中,相似度评分最高的N个标准案由向量输出,以由用户从上述N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由。
例如,在得到与上述若干标准案由中的各标准案由分别对应的相似度评分后,上述设备可以将得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由,以及上述初始案由显示于与用户进行交互的界面中,供用户选择浏览。
上述用户在接收到上述设备输出的内容后,可以通过自身判断,从上述N个标准案由向量对应的标准案由中,选择最合适的目标标准案由,并将该目标标准案由输入至上述设备。
在此需要说明的是,一方面,在界面中展示案由的具体格式在此不作限定。另一方面,用户选择案由和输入案由的方式在此也不作限定。
当上述用户完成上述目标标准案由的输入后,上述设备可以接收该用户确定的上述目标标准案由,并将上述目标标准案由确定为与上述初始案由对应的标准案由。
在本实施例中,上述设备通过与用户进行交互完成标准案由确定,可以将用户选择的目标标准案由确定为与上述初始案由对应的标准案由。
在一实施例中,为了减少用户参与度,从而提升标准案由确定效率,在执行S106,基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由时,上述设备可以通过预设的标准案由策略完成标准案由确定。
在一种方式中,上述设备中可以配置有预先完成训练的标准案由确定网络。其中,上述标准案由确定网络为基于若干标注了真值的训练样本训练得到;上述训练样本的输入为若干标准案由;上述真值为目标标准案由。需要说明的是,上述标准案由确定网络的训练方式可以参照相关方法,在此不作详述。
在确定目标标准案由时,上述设备可以将得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由作为输入,输入预先训练的标准案由确定网络中,得到目标标准案由。
在实际应用中,上述设备可以基于上述N个标准案由向量构建对应的输入向量,然后将上述输入向量输入上述标准案由确定网络中进行计算,得到目标标准案由。
由于上述设备可以将得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由作为输入,输入预先训练的标准案由确定网络中,得到目标标准案由,因此,可以减少用户参与度,从而提升标准案由确定效率。
在另一种方式中,在确定目标标准案由时,上述设备可以从上述初始案由中提取若干第一关键词。
然后,上述设备可以针对得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由,分别提取与各标准案由分别对应的第二关键词。
接着,在提取到上述第一关键词,与上述第二关键词后,上述设备可以分别将上述各标准案由分别对应的第二关键词,与上述第一关键词进行匹配,得到与上述各标准案由分别对应的匹配度。
最后,在得到上述匹配度后,上述设备可以将上述匹配度中的最高匹配度对应的标准案由确定为满足预设条件的目标标准案由。
在此需要说明的是,在实际应用中,提取关键词时采用的方法可以是基于textrank算法,在此不作限定。
由于上述设备可以从初始案由和各标准案由中提取关键词,并计算初始案由对应的关键词和各标准案由分别对应的关键词之间的匹配度,在得到上述匹配度后,上述设备可以将上述匹配度中的最高匹配度对应的标准案由确定为满足预设条件的目标标准案由,因此,可以减少用户参与度,从而提升标准案由确定效率。
在一实施例中,为了提升标准案由确定效率,在对获取的初始案由进行向量化处理之前,上述设备可以针对上述初始案由进行精准匹配。
具体地,上述设备可以将上述初始案由与上述若干标准案由分别进行精准匹配,并将上述若干标准案由中,与上述初始案由精准匹配的标准案由确定为与上述初始案由对应的标准案由。
在一种方式中,在将上述初始案由与若干标准案由分别进行精准匹配时,上述设备可以分别将上述初始案由,与上述若干标准案由一一进行汉字匹配。
如果上述若干标准案由中,存在与上述初始案由完全一致的案由,则可以将该案由确定为与上述初始案由精准匹配的标准案由。
在另一种方式中,在将上述初始案由与若干标准案由分别进行精准匹配时,上述设备可以基于上述初始案由得到对应的第一哈希值。
然后,上述设备可以分别基于若干标准案由,得到与各标准案由分别对应的第二哈希值。
接着,在得到上述第一哈希值,与上述第二哈希值后,上述设备可以分别确定上述第一哈希值,与上述各标准案由分别对应的第二哈希值是否一致,并将与上述第一哈希值一致的第二哈希值所对应的标准案由,确定为与上述初始案由精准匹配的标准案由。
在此需要说明的是,进行精准匹配的方式还可以字符匹配等方法,在此不作穷尽时列举。
由于在对获取出的初始案由进行向量化处理之前,上述设备可以针对上述初始案由进行精准匹配,并将与上述初始案由精准匹配的标准案由,确定为与上述初始案由对应的标准案由,从而无需进行后续模糊匹配步骤,提升了标准案由确定效率。
在一实施例中,为了提升标准案由确定效率,在对初始案由进行向量化处理时,可以将初始案由中可以包括的对标准案由的确定无意义的单词。
具体地,在对初始案由进行向量化处理时,上述设备可以对获取出的初始案由进行分词处理,得到与上述初始案由对应的分词集合。然后,上述设备可以在上述分词集合中,删除对标准案由的确定无意义的单词。最后,上述设备可以针对删除对标准案由的确定无意义的单词后的分词集合,进行向量化处理。
其中,上述对标准案由的确定无意义的单词,可以包括以下中的任一或任几项:
高频词;停用词;特殊字符。
例如,上述设备可以将统计的在不同初始案由中出现频率较高的M个词,作为上述高频词(例如,法院、罪、权、的等等),在上述初始案由中删除上述高频词时,上述设备可以检测上述初始案由中是否可以包括上述高频词,并将出现的高频词进行删除。
再例如,上述设备可以将日期、停用词等无意义字符进行删除。例如,上述设备可以将“2016年12月4日葡萄酒”变为“葡萄酒”。
还例如,上述设备还可以去掉标点符号、非法字符等特殊字符。例如,上述设备可以将“!黄金。”处理后为“黄金”。
由于在对初始案由进行向量化处理时,可以将初始案由中可以包括的对标准案由的确定无意义的单词,因此,可以避免在模糊匹配中对该类单词进行匹配,从而提升标准案由确定效率。
在一实施例中,上述任一实施例公开的标准案由确定方法可以应用于区块链节点设备;其中,上述区块链中发布了标准案由确定智能合约。
该方法包括:
响应于标准案由确定请求,向上述区块链发布调用上述标准案由确定智能合约的调用交易;其中,上述调用交易包括初始案由;
响应于上述调用交易,执行上述标准案由确定智能合约中的确定逻辑,以根据上述任一实施例公开的标准案由确定方法确定与上述初始案由对应的标准案由。
以下先简单介绍一下区块链技术。
区块链技术,也被称之为分布式账本技术,是一种由若干台计算设备共同参与“记账”,共同维护一份完整的分布式数据库的新兴技术。由于区块链技术具有去中心化、公开透明、每台计算设备可以参与数据库记录、并且各计算设备之间可以快速的进行数据同步的特性,使得区块链技术已在众多的领域中广泛的进行应用。
区块链一般被划分为三种类型:公有链(Public Blockchain),私有链(PrivateBlockchain)和联盟链(Consortium Blockchain)。此外,还可以有上述多种类型的结合,比如私有链+联盟链、联盟链+公有链等。
其中,去中心化程度最高的是公有链。公有链以比特币、以太坊为代表,加入公有链的参与者(也可称为区块链中的节点)可以读取链上的数据记录、参与交易、以及竞争新区块的记账权等。而且,各节点可自由加入或者退出网络,并进行相关操作。
私有链则相反,该网络的写入权限由某个组织或者机构控制,数据读取权限受组织规定。简单来说,私有链可以为一个弱中心化系统,其对节点具有严格限制且节点数量较少。这种类型的区块链更适合于特定机构内部使用。
联盟链则是介于公有链以及私有链之间的区块链,可实现“部分去中心化”。联盟链中各个节点通常有与之相对应的实体机构或者组织;节点通过授权加入网络并组成利益相关联盟,共同维护区块链运行。
基于区块链的基本特性,区块链通常是由若干个区块构成。在这些区块中分别记录有与该区块的创建时刻对应的时间戳,所有的区块严格按照区块中记录的时间戳,构成一条在时间上有序的数据链条。
对于物理世界产生的真实数据,可以将其构建成区块链所支持的标准的交易(transaction)格式,然后发布至区块链,由区块链中的节点设备对收到的交易进行共识处理,并在达成共识后,由区块链中作为记账节点的节点设备,将这笔交易打包进区块,在区块链中进行持久化存证。
实际应用中,不论是公有链、私有链还是联盟链,都可能提供智能合约(Smartcontract)的功能。区块链上的智能合约是在区块链上可以被交易触发执行的合约。智能合约可以通过代码的形式定义。
以以太坊(一种开源的有智能合约功能的公共区块链平台)为例,支持用户在以太坊网络中创建并调用一些复杂的逻辑。以太坊作为一个可编程区块链,其核心是以太坊虚拟机(EVM),每个以太坊节点都可以运行EVM。EVM是一个图灵完备的虚拟机,通过它可以实现各种复杂的逻辑。用户在以太坊中发布和调用智能合约就是在EVM上运行的。实际上,EVM直接运行的是虚拟机代码(虚拟机字节码,下简称“字节码”),所以部署在区块链上的智能合约可以是字节码。
在本实施例中,上述区块链,具体可以是体可以是基于服务器或服务器集群构建的公有链(Public Blockchain),私有链(Private Blockchain)或联盟链(ConsortiumBlockchain)。
例如,上述区块链可以是基于公有链搭建的标准案由确定平台。
上述区块链节点设备可以至少包括初始案由提供方节点设备,以及标准案由确定方节点设备(例如,个人PC,PAD,台式机等)。
上述初始案由提供方,具体可以是将包括初始案由的裁判文书发布至上述区块链中的各类司法机构。
上述标准案由确定方,具体可以是任意有标准案由确定需求的确定方节点设备。例如,上述标准案由确定方节点设备可以是需要依据标准案由确定企业诉讼风险的各地金融监控方。还例如,上述标准案由确定方可以是需要统计案由的司法统计单位。再例如,上述标准案由确定方可以是企业内部的法务部门。
上述标准案由确定智能合约,具体可以是开发人员(例如,标准案由确定方的开发人员)根据上述任一实施例公开的标准案由确定方法开发的确定逻辑代码。该智能合约可以通过上述区块链中的任一节点设备预先发布至上述区块链中。
当上述标准案由确定方节点设备(以下简称设备)接受到外部触发的标准案由确定请求后(例如,用户通过交互界面触发的请求),可以向上述区块链发布调用上述标准案由确定智能合约的调用交易;其中,上述调用交易包括初始案由。
响应于上述调用交易,上述设备可以在本地虚拟机(EVM)中执行上述标准案由确定智能合约中的确定逻辑,以根据上述任一实施例公开的标准案由确定方法确定与上述初始案由对应的标准案由,并将上述标准案由发布至上述区块链,以使其他节点设备可以从本地状态数据库中获取上述标准案由。
由于上述区块链中发布了标准案由确定智能合约,并在需要确定标准案由时,上述区块链中的节点设备可以调用该智能合约中的确定逻辑以确定与初始案由对应的标准案由,因此,可以保证确定标准案由过程公开透明可审计,从而确保获得可靠的标准案由。
当上述标准案由确定方为需要依据标准案由确定企业诉讼风险的各地金融监控方时,各地金融监控方可以先筛选某企业一段时期内发送的诉讼法律文书。在筛选出该企业相关的法律文书后,可以将筛选出的法律文书提供至上述节点设备,以使上述节点设备获取上述筛选出的法律文书中包括的初始案由。
在获取初始案由后,上述节点设备可以将上述初始案由作为参数,构建调用标准案由确定智能合约的调用交易,以获取与上述初始案由对应的标准案由。
在确定标准案由,上述节点设备可以通过交互界面将上述标准案由提供至上述各地金融监控方,以使上述进入监控方可以基于上述标准案由进行企业诉讼风险分析。
实际应用中,从法律文书中获取的案由通常为由若干初始案由构成的复合初始案由,基于此,本申请还提出一种案由确定方法,该方法可以通过先对获取的复合初始案由进行拆分得到若干初始案由,然后再对各初始案由对应的标准案由进行组合,得到与上述复合初始案由对应的标准案由,从而对同一类型的复合初始案由进行标准化处理,达到方便统计案由的目的。
请参见图2,图2为本申请示出的一种标准案由确定方法的方法流程图,如图2所示,上述方法可以包括:
S202,对获取的复合初始案由进行拆分,得到若干初始案由;其中,上述复合初始案由可以包括若干初始案由;
S204,针对上述若干初始案由中的各初始案由,执行上述任一实施例提出的标准案由确定方法,得到与上述各初始案由分别对应的标准案由;
S206,基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由。
上述标准案由确定方法可以以软件装置的形式搭载在任意终端设备中。例如,上述终端设备可以PC终端,移动终端,PAD终端等。可以理解的是,在实现上述方法时,通常需要上述终端设备提供算力。
以下以执行主体为搭载该方法的终端设备(以下简称“设备”)为例进行说明。
上述复合初始案由,具体可以是上述设备获取到的,需要进行标准化操作的案由。上述复合初始案由具体可以是从法律文书中获取出的案由。其中,上述法律文书可以是起诉书、裁判文书等文书,在此不作特别限定。
在一实施例中,为了更精准确定诉讼案由,可以从裁判文书中获取上述初始案由。在获取案由时,上述设备可以基于上述裁判文书,获取上述裁判文书中记载的初始案由的相关内容。
上述复合初始案由通常遵循行文规律。其中,上述行为规律,可以是工作人员在编辑案由时的编辑规律。例如,当某一案件可以包括A、B、C三类纠纷时,工作人员通常会将该案件的案由编辑为A、B、C纠纷;或A、B与C纠纷(编辑方式在此不作限定)。
此时,当从该案对应的法律文书中获取到上述复合初始案由后,上述设备可以对上述复合初始案由进行拆分,得到若干初始案由。
在实际应用中,上述设备可以基于上述行文规律,通过识别特定符号(例如,顿号,逗号,分号等特定符号)或特定字符(例如,与、和、以及等特定字符),将上述复合初始案由分为若干个初始案由。
在得到若干初始案由后,上述设备可以采用上述任一实施例提出的标准案由确定方法,得到与上述若干初始案由分别对应的标准案由。
然后,上述设备可以基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由。
在上述技术方案中,由于上述设备可以对获取的复合初始案由进行拆分,得到若干初始案由,并采用上述任一实施例提出的标准案由确定方法,得到与上述若干初始案由分别对应的标准案由,然后,上述设备可以基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由,因此,可以对同一类型的复合初始案由进行标准化处理,达到方便统计案由的目的。
请参见图3,图3为本申请示出的一种复合初始案由标准化处理流程图。如图3所示,上述设备在接收到用户发起的标准化处理请求后,可以获取复合初始案由。
在获取到符合初始案由后,上述设备可以基于行为规律对上述复合初始案由进行拆分,得到若干初始案由。
在得到初始案由后,上述设备可以对上述初始案由,以及从标准案由库中获取的标准案由进行分词处理,并删除对标准化无意义的词。然后,上述设备可以将分词处理后的初始案由,与各标准案由分别进行精确匹配,并确定是否存在与初始案由精确匹配的标准案由。如果有,则将该案由确定为与初始案由对应的标准案由。
如果无,对各标准案由,与初始案由进行向量化得到标准案由向量,与初始案由向量,并分别计算各标准案由,与上述初始案由之间的相似度评分。
在得到各标准案由,与上述初始案由之间的相似度评分后,上述设备可以输出相似度评分最高的3个,以使用户选择合适的目标标准案由。
接收用户输入的目标标准案由,并将该目标标准案由确定为与初始案由对应的标准案由。
在得到上述复合初始案由拆分后得到的各初始案由分别对应的标准案由后,上述设备可以针对与上述各初始案由分别对应的标准案由,进行相似性聚类,得到若干聚类集合,并基于上述聚类集合中可以包括的标准案由,确定与上述复合初始案由对应的标准案由。需要说明的是,上述相似性聚合的方式可以采用K-means算法、模块度等方法,在此不作限定。
在一种方式中,在基于上述聚类集合中可以包括的标准案由,确定与上述复合初始案由对应的标准案由时,上述设备可以输出可以包括的标准案由数量大于1的聚类集合中所可以包括的多个标准案由,以使用户针对上述多个标准案由进行选择合并,得到合并标准案由。
例如,上述设备可以将上述多个标准案由通过与用户交互的界面向用户输出。上述用户在接收到上述多个标准案由后,可以对上述多个标准案由进行选择合并,得到合并标准案由,或从上述多个标准案由选择出最合适的目标标准案由,并将上述合并标准案由或上述目标标准案由输入上述设备。
在接收上述合并标准案由或上述目标标准案由后,上述设备可以对上述合并标准案由,以及可以包括的标准案由数量为1的聚类集合中所可以包括的标准案由进行组合,得到与上述复合初始案由对应的标准案由。
在此需要说明的是,上述组合方式可以是拼接,在此不作限定。
在另一种方式中,为了减少用户参与度,提升标准案由确定效率,上述选择合并的操作可以由设备自行完成。
在实际应用中,上述设备可以对可以包括的标准案由数量大于1的聚类集合中所可以包括的多个标准案由进行选择合并,得到合并标准案由。
在得到合并标准案由后,上述设备可以对上述合并标准案由,以及可以包括的标准案由数量为1的聚类集合中所可以包括的标准案由进行组合,得到与上述复合初始案由对应的标准案由。
在此需要说明的是,上述选择合并的方式可以是将上述多个标准案由进行拼接,或筛选出关键字进行拼接,在此不作限定。
在上述技术方案中,由于上述设备可以对获取的复合初始案由进行拆分,得到若干初始案由,并采用上述任一实施例提出的标准案由确定方法,得到与上述若干初始案由分别对应的标准案由,然后,上述设备可以基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由,因此,可以对同一类型的复合初始案由进行标准化处理,达到方便统计案由的目的。
在一实施例中,上述任一实施例公开的标准案由确定方法可以应用于区块链节点设备;其中,上述区块链中发布了标准案由确定智能合约。
上述方法包括:
响应于标准案由确定请求,向上述区块链发布调用上述标准案由确定智能合约的调用交易;其中,上述调用交易包括复合初始案由;
响应于上述调用交易,执行上述标准案由确定智能合约中的确定逻辑,以根据上述任一实施例公开的标准案由确定方法确定与上述符合初始案由对应的标准案由。
在本实施例中,上述区块链,具体可以是体可以是基于服务器或服务器集群构建的公有链(Public Blockchain),私有链(Private Blockchain)或联盟链(ConsortiumBlockchain)。
例如,上述区块链可以是基于公有链搭建的标准案由确定平台。
上述区块链节点设备可以至少包括初始案由提供方节点设备,以及标准案由确定方节点设备。
上述初始案由提供方节点设备,具体可以是将包括初始案由的裁判文书发布至上述区块链中的各类司法机构节点设备。
上述标准案由确定方节点设备,具体可以是任意有标准案由确定需求的确定方节点设备。在一实施例中,上述标准案由确定方可以是需要依据标准案由确定企业诉讼风险的各地金融监控方节点设备。
上述标准案由确定智能合约,具体可以是开发人员(例如,标准案由确定方的开发人员)根据上述任一实施例公开的标准案由确定方法开发的确定逻辑代码。该智能合约可以通过上述区块链中的任一节点设备预先发布至上述区块链中。
当上述标准案由确定方节点设备(以下简称设备)接受到外部触发的标准案由确定请求后(例如,用户通过交互界面触发的请求),可以向上述区块链发布调用上述标准案由确定智能合约的调用交易;其中,上述调用交易包括符合初始案由。
响应于上述调用交易,上述设备可以在本地虚拟机(EVM)中执行上述标准案由确定智能合约中的确定逻辑,以根据上述任一实施例公开的标准案由确定方法确定与上述复合初始案由对应的标准案由,并将上述标准案由发布至上述区块链,以使其他节点设备可以从本地状态数据库中获取上述标准案由。
由于上述区块链中发布了标准案由确定智能合约,并在需要确定标准案由时,上述区块链中的节点设备可以调用该智能合约中的确定逻辑以确定与初始案由对应的标准案由,因此,可以保证确定标准案由过程公开透明可审计,从而确保可以获得可靠的标准案由。
本申请还提出一种标准案由确定装置。请参见图4,图4为本申请示出的一种标准案由确定装置的结构示意图。
如图4所示,上述装置400可以包括:
向量化处理模块410,对获取的初始案由进行向量化处理,得到与上述初始案由对应的初始案由向量;
相似度评分计算模块420,计算上述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与上述若干标准案由中的各标准案由分别对应的相似度评分;
标准案由确定模块430,基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与上述初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定模块430,可以包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量输出,以由用户从上述N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
接收用户确定的上述目标标准案由,并将上述目标标准案由确定为与上述初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定模块430,可以包括:
目标标准案由确定模块,从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
标准案由确定子模块,将上述目标标准案由确定为与初始案由对应的标准案由。
在示出的一实施例中,上述目标标准案由确定模块,可以包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由作为输入,输入预先训练的标准案由确定网络中,得到目标标准案由;其中,上述标准案由确定网络为基于若干标注了真值的训练样本训练得到;上述训练样本的输入为若干标准案由;上述真值为目标标准案由。
在示出的一实施例中,上述目标标准案由确定模块,可以包括:
关键词提取模块,从上述初始案由中提取若干第一关键词;
针对得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由,分别提取与各标准案由分别对应的第二关键词;
匹配模块,分别将上述各标准案由分别对应的第二关键词,与上述第一关键词进行匹配,得到与上述各标准案由分别对应的匹配度;
目标标准案由确定子模块,将上述匹配度中的最高匹配度对应的标准案由确定为满足预设条件的目标标准案由。
在示出的一实施例中,上述装置400还可以包括:
精准匹配模块,将上述初始案由与上述若干标准案由分别进行精准匹配;
将上述若干标准案由中,与上述初始案由精准匹配的标准案由确定为与上述初始案由对应的标准案由。
在示出的一实施例中,上述精准匹配模块,还可以包括:
基于上述初始案由得到对应的第一哈希值;
分别基于若干标准案由,得到与各标准案由分别对应的第二哈希值;
分别确定上述第一哈希值,与上述各标准案由分别对应的第二哈希值是否一致;
将与上述第一哈希值一致的第二哈希值所对应的标准案由,确定为与上述初始案由精准匹配的标准案由。
在示出的一实施例中,上述向量化处理模块,可以包括:
对提取出的初始案由进行分词处理,得到与上述初始案由对应的分词集合;
在上述分词集合中,删除对标准案由的确定无意义的单词;
针对删除对标准案由的确定无意义的单词后的分词集合,进行向量化处理。
在示出的一实施例中,上述向量化处理模块,可以包括:
上述对标准案由的确定无意义的单词,可以包括以下中的任一或任几项:
高频词;停用词;特殊字符。
在示出的一实施例中,使用bow网络和/或word2vec网络进行向量化处理。
本申请还提出一种标准案由确定装置。请参见图5,图5为本申请示出的一种标准案由确定装置的结构示意图。
如图5所示,上述装置500可以包括:
拆分模块510,对获取的复合初始案由进行拆分,得到若干初始案由;其中,上述复合初始案由可以包括若干初始案由;
标准案由确定模块520,针对上述若干初始案由中的各初始案由,执行上述任一实施例示出的标准案由确定方法,得到与上述各初始案由分别对应的标准案由;
基于与上述各初始案由分别对应的标准案由,确定与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定模块520,可以包括:
相似性聚合模块521,针对与上述各初始案由分别对应的标准案由,进行相似性聚类,得到若干聚类集合;
标准案由确定子模块522,基于上述聚类集合中可以包括的标准案由,确定与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定子模块,可以包括:
输出可以包括的标准案由数量大于1的聚类集合中所可以包括的多个标准案由,以使用户针对上述多个标准案由进行选择合并,得到合并标准案由;
接收上述合并标准案由;
对上述合并标准案由,以及可以包括的标准案由数量为1的聚类集合中所可以包括的标准案由进行组合,得到与上述复合初始案由对应的标准案由。
在示出的一实施例中,上述标准案由确定子模块,可以包括:
对可以包括的标准案由数量大于1的聚类集合中所可以包括的多个标准案由进行选择合并,得到合并标准案由;
对上述合并标准案由,以及可以包括的标准案由数量为1的聚类集合中所可以包括的标准案由进行组合,得到与上述复合初始案由对应的标准案由。
本申请示出的标准案由确定装置的实施例可以应用于标准案由确定设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图6所示,图6为本申请示出的一种标准案由确定设备的硬件结构图,除了图6所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该电子设备的实际功能,还可以包括其他硬件,对此不再赘述。
请参考图6所示的一种设备,上述设备可以包括:处理器。
用于存储处理器可执行指令的存储器。
其中,上述处理器通过运行上述可执行指令以实现执行上述任一实施例示出的标准案由确定方法。
本申请示出的标准案由确定装置的实施例可以应用于标准案由确定设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图7所示,图7为本申请示出的一种标准案由确定设备的硬件结构图,除了图7所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该电子设备的实际功能,还可以包括其他硬件,对此不再赘述。
请参考图7所示的一种设备,上述设备可以包括:处理器。
用于存储处理器可执行指令的存储器。
其中,上述处理器通过运行上述可执行指令以实现执行上述任一实施例示出的标准案由确定方法。
本领域技术人员应明白,本申请一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本申请一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(可以包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例中,“和/或”表示至少具有两者中的其中一个,例如,“A和/或B”可以包括三种方案:A、B、以及“A和B”。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于数据处理设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的行为或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本申请中描述的主题及功能操作的实施例可以在以下中实现:数字电子电路、有形体现的计算机软件或固件、可以包括本申请中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本申请中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。
本申请中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。上述处理及逻辑流程还可以由专用逻辑电路—例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
适合用于执行计算机程序的计算机可以包括,例如通用和/或专用微处理器,或任何其他类型的中央处理单元。通常,中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件可以包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将可以包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏操纵台、全球定位系统(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备,仅举几例。
适合于存储计算机程序指令和数据的计算机可读介质可以包括所有形式的非易失性存储器、媒介和存储器设备,例如可以包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
虽然本申请包含许多具体实施细节,但是这些不应被解释为限制任何公开的范围或所要求保护的范围,而是主要用于描述特定公开的具体实施例的特征。本申请内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上上述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上仅为本申请一个或多个实施例的较佳实施例而已,并不用以限制本申请一个或多个实施例,凡在本申请一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请一个或多个实施例保护的范围之内。

Claims (32)

1.标准案由确定方法,包括:
对获取的初始案由进行向量化处理,得到与所述初始案由对应的初始案由向量;
计算所述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与所述若干标准案由中的各标准案由分别对应的相似度评分;
基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与所述初始案由对应的标准案由。
2.根据权利要求1所述方法,所述基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与所述初始案由对应的标准案由,包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量输出,以由用户从所述N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
接收用户确定的所述目标标准案由,并将所述目标标准案由确定为与所述初始案由对应的标准案由。
3.根据权利要求1所述方法,所述基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与所述初始案由对应的标准案由,包括:
从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
将所述目标标准案由确定为与初始案由对应的标准案由。
4.根据权利要求3所述的方法,所述从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由,包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由作为输入,输入预先训练的标准案由确定网络中,得到目标标准案由;其中,所述标准案由确定网络为基于若干标注了真值的训练样本训练得到;所述训练样本的输入为若干标准案由;所述真值为目标标准案由。
5.根据权利要求3所述的方法,所述从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由,包括:
从所述初始案由中提取若干第一关键词;
针对得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由,分别提取与各标准案由分别对应的第二关键词;
分别将所述各标准案由分别对应的第二关键词,与所述第一关键词进行匹配,得到与所述各标准案由分别对应的匹配度;
将所述匹配度中的最高匹配度对应的标准案由确定为满足预设条件的目标标准案由。
6.根据权利要求1所述的方法,在对获取的初始案由进行向量化处理之前,所述方法还包括:
将所述初始案由与所述若干标准案由分别进行精准匹配;
将所述若干标准案由中,与所述初始案由精准匹配的标准案由确定为与所述初始案由对应的标准案由。
7.根据权利要求6所述的方法,所述将所述初始案由与若干标准案由分别进行精准匹配,包括:
基于所述初始案由得到对应的第一哈希值;
分别基于若干标准案由,得到与各标准案由分别对应的第二哈希值;
分别确定所述第一哈希值,与所述各标准案由分别对应的第二哈希值是否一致;
将与所述第一哈希值一致的第二哈希值所对应的标准案由,确定为与所述初始案由精准匹配的标准案由。
8.根据权利要求1所述的方法,所述对获取的初始案由进行向量化处理,包括:
对提取出的初始案由进行分词处理,得到与所述初始案由对应的分词集合;
在所述分词集合中,删除对标准案由的确定无意义的单词;
针对删除对标准案由的确定无意义的单词后的分词集合,进行向量化处理。
9.根据权利要求8所述的方法,所述对标准案由的确定无意义的单词,包括以下中的任一或任几项:
高频词;停用词;特殊字符。
10.根据权利要求1所述的方法,使用bow网络和/或word2vec网络进行向量化处理。
11.根据权利要求1所述的方法,应用于区块链节点设备;其中,所述区块链中发布了标准案由确定智能合约;
所述对获取的初始案由进行向量化处理,得到与所述初始案由对应的初始案由向量;计算所述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与所述若干标准案由中的各标准案由分别对应的相似度评分;基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与所述初始案由对应的标准案由,并将所述标准案由发布至所述区块链,包括:
响应于标准案由确定请求,向所述区块链发布调用所述标准案由确定智能合约的调用交易;其中,所述调用交易包括初始案由;
响应于所述调用交易,执行所述标准案由确定智能合约中的确定逻辑:
对所述初始案由进行向量化处理,得到与所述初始案由对应的初始案由向量;
计算所述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与所述若干标准案由中的各标准案由分别对应的相似度评分;
基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与所述初始案由对应的标准案由,并将所述标准案由发布至所述区块链。
12.标准案由确定方法,包括:
对获取的复合初始案由进行拆分,得到若干初始案由;其中,所述复合初始案由包括若干初始案由;
针对所述若干初始案由中的各初始案由,执行权利要求1-10任一所述的标准案由确定方法,得到与所述各初始案由分别对应的标准案由;
基于与所述各初始案由分别对应的标准案由,确定与所述复合初始案由对应的标准案由。
13.根据权利要求12所述的方法,所述基于与所述各初始案由分别对应的标准案由,确定与所述复合初始案由对应的标准案由,包括:
针对与所述各初始案由分别对应的标准案由,进行相似性聚类,得到若干聚类集合;
基于所述聚类集合中包括的标准案由,确定与所述复合初始案由对应的标准案由。
14.根据权利要求13所述的方法,所述基于所述聚类集合中包括的标准案由,确定与所述复合初始案由对应的标准案由,包括:
输出包括的标准案由数量大于1的聚类集合中所包括的多个标准案由,以使用户针对所述多个标准案由进行选择合并,得到合并标准案由;
接收所述合并标准案由;
对所述合并标准案由,以及包括的标准案由数量为1的聚类集合中所包括的标准案由进行组合,得到与所述复合初始案由对应的标准案由。
15.根据权利要求13所述的方法,所述基于所述聚类集合中包括的标准案由,确定与所述复合初始案由对应的标准案由,包括:
对包括的标准案由数量大于1的聚类集合中所包括的多个标准案由进行选择合并,得到合并标准案由;
对所述合并标准案由,以及包括的标准案由数量为1的聚类集合中所包括的标准案由进行组合,得到与所述复合初始案由对应的标准案由。
16.根据权利要求12所述的方法,应用于区块链节点设备;其中,所述区块链中发布了标准案由确定智能合约;
所述对获取的复合初始案由进行拆分,得到若干初始案由;其中,所述复合初始案由包括若干初始案由;针对所述若干初始案由中的各初始案由,执行权利要求1-10任一所述的标准案由确定方法,得到与所述各初始案由分别对应的标准案由;基于与所述各初始案由分别对应的标准案由,确定与所述复合初始案由对应的标准案由,包括:
响应于标准案由确定请求,向所述区块链发布调用所述标准案由确定智能合约的调用交易;其中,所述调用交易包括复合初始案由;
响应于所述调用交易,执行所述标准案由确定智能合约中的确定逻辑:
对所述复合初始案由进行拆分,得到若干初始案由;其中,所述复合初始案由包括若干初始案由;
针对所述若干初始案由中的各初始案由,执行权利要求1-10任一所述的标准案由确定方法,得到与所述各初始案由分别对应的标准案由;
基于与所述各初始案由分别对应的标准案由,确定与所述复合初始案由对应的标准案由。
17.标准案由确定装置,包括:
向量化处理模块,对获取的初始案由进行向量化处理,得到与所述初始案由对应的初始案由向量;
相似度评分计算模块,计算所述初始案由向量,与若干标准案由分别对应的标准案由向量的相似度,得到与所述若干标准案由中的各标准案由分别对应的相似度评分;
标准案由确定模块,基于得到的相似度评分中,相似度评分最高的N个标准案由向量,确定与所述初始案由对应的标准案由。
18.根据权利要求17所述的装置,所述标准案由确定模块,包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量输出,以由用户从所述N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
接收用户确定的所述目标标准案由,并将所述目标标准案由确定为与所述初始案由对应的标准案由。
19.根据权利要求17所述的装置,所述标准案由确定模块,包括:
目标标准案由确定模块,从得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由中,确定满足预设条件的目标标准案由;
标准案由确定子模块,将所述目标标准案由确定为与初始案由对应的标准案由。
20.根据权利要求19所述的装置,所述目标标准案由确定模块,包括:
将得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由作为输入,输入预先训练的标准案由确定网络中,得到目标标准案由;其中,所述标准案由确定网络为基于若干标注了真值的训练样本训练得到;所述训练样本的输入为若干标准案由;所述真值为目标标准案由。
21.根据权利要求19所述的装置,所述目标标准案由确定模块,包括:
关键词提取模块,从所述初始案由中提取若干第一关键词;
针对得到的相似度评分中,相似度评分最高的N个标准案由向量分别对应的标准案由,分别提取与各标准案由分别对应的第二关键词;
匹配模块,分别将所述各标准案由分别对应的第二关键词,与所述第一关键词进行匹配,得到与所述各标准案由分别对应的匹配度;
目标标准案由确定子模块,将所述匹配度中的最高匹配度对应的标准案由确定为满足预设条件的目标标准案由。
22.根据权利要求17所述的装置,所述装置还包括:
精准匹配模块,将所述初始案由与所述若干标准案由分别进行精准匹配;
将所述若干标准案由中,与所述初始案由精准匹配的标准案由确定为与所述初始案由对应的标准案由。
23.根据权利要求22所述的装置,所述精准匹配模块,还包括:
基于所述初始案由得到对应的第一哈希值;
分别基于若干标准案由,得到与各标准案由分别对应的第二哈希值;
分别确定所述第一哈希值,与所述各标准案由分别对应的第二哈希值是否一致;
将与所述第一哈希值一致的第二哈希值所对应的标准案由,确定为与所述初始案由精准匹配的标准案由。
24.根据权利要求17所述的装置,所述向量化处理模块,包括:
对提取出的初始案由进行分词处理,得到与所述初始案由对应的分词集合;
在所述分词集合中,删除对标准案由的确定无意义的单词;
针对删除对标准案由的确定无意义的单词后的分词集合,进行向量化处理。
25.根据权利要求24所述的装置,所述向量化处理模块,包括:
所述对标准案由的确定无意义的单词,包括以下中的任一或任几项:
高频词;停用词;特殊字符。
26.根据权利要求17所述的装置,使用bow网络和/或word2vec网络进行向量化处理。
27.标准案由确定装置,包括:
拆分模块,对获取的复合初始案由进行拆分,得到若干初始案由;其中,所述复合初始案由包括若干初始案由;
标准案由确定模块,针对所述若干初始案由中的各初始案由,执行权利要求1-10任一所述的标准案由确定方法,得到与所述各初始案由分别对应的标准案由;
基于与所述各初始案由分别对应的标准案由,确定与所述复合初始案由对应的标准案由。
28.根据权利要求27所述的装置,所述标准案由确定模块,包括:
相似性聚合模块,针对与所述各初始案由分别对应的标准案由,进行相似性聚类,得到若干聚类集合;
标准案由确定子模块,基于所述聚类集合中包括的标准案由,确定与所述复合初始案由对应的标准案由。
29.根据权利要求28所述的装置,所述标准案由确定子模块,包括:
输出包括的标准案由数量大于1的聚类集合中所包括的多个标准案由,以使用户针对所述多个标准案由进行选择合并,得到合并标准案由;
接收所述合并标准案由;
对所述合并标准案由,以及包括的标准案由数量为1的聚类集合中所包括的标准案由进行组合,得到与所述复合初始案由对应的标准案由。
30.根据权利要求28所述的装置,所述标准案由确定子模块,包括:
对包括的标准案由数量大于1的聚类集合中所包括的多个标准案由进行选择合并,得到合并标准案由;
对所述合并标准案由,以及包括的标准案由数量为1的聚类集合中所包括的标准案由进行组合,得到与所述复合初始案由对应的标准案由。
31.标准案由确定设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-10中任一项所述的标准案由确定方法。
32.标准案由确定设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求12中任一项所述的标准案由确定方法。
CN202010565166.3A 2020-06-19 2020-06-19 标准案由确定方法、装置和设备 Active CN111539853B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010565166.3A CN111539853B (zh) 2020-06-19 2020-06-19 标准案由确定方法、装置和设备
CN202011365076.6A CN112365374B (zh) 2020-06-19 2020-06-19 标准案由确定方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010565166.3A CN111539853B (zh) 2020-06-19 2020-06-19 标准案由确定方法、装置和设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202011365076.6A Division CN112365374B (zh) 2020-06-19 2020-06-19 标准案由确定方法、装置和设备

Publications (2)

Publication Number Publication Date
CN111539853A true CN111539853A (zh) 2020-08-14
CN111539853B CN111539853B (zh) 2020-11-06

Family

ID=71979668

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202011365076.6A Active CN112365374B (zh) 2020-06-19 2020-06-19 标准案由确定方法、装置和设备
CN202010565166.3A Active CN111539853B (zh) 2020-06-19 2020-06-19 标准案由确定方法、装置和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202011365076.6A Active CN112365374B (zh) 2020-06-19 2020-06-19 标准案由确定方法、装置和设备

Country Status (1)

Country Link
CN (2) CN112365374B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686339A (zh) * 2021-03-11 2021-04-20 共道网络科技有限公司 一种基于起诉状的案由确定方法和装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008087A (zh) * 2014-06-05 2014-08-27 李梦依 一种针对具有标准格式的文案的自动排版方法和系统
CN107992554A (zh) * 2017-11-28 2018-05-04 北京百度网讯科技有限公司 提供问答信息的聚合结果的搜索方法和装置
CN108073565A (zh) * 2016-11-10 2018-05-25 株式会社Ntt都科摩 词语规范化的方法和设备及机器翻译方法和设备
CN108897770A (zh) * 2018-05-25 2018-11-27 南京大学 一种面向裁判文书的法条名称规范化及案由与法条的关联统计方法
CN109582955A (zh) * 2018-11-14 2019-04-05 金色熊猫有限公司 医疗术语的标准化方法、装置及介质
CN109582969A (zh) * 2018-12-04 2019-04-05 联想(北京)有限公司 实体匹配方法、装置及电子设备
CN110309295A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 生成裁判文书经审理查明段的方法及装置
CN110377730A (zh) * 2019-06-14 2019-10-25 平安科技(深圳)有限公司 案由分类方法、装置、计算机设备和存储介质
CN110472201A (zh) * 2019-07-26 2019-11-19 阿里巴巴集团控股有限公司 基于区块链的文本相似性检测方法及装置、电子设备
CN110674262A (zh) * 2019-10-16 2020-01-10 北京百度网讯科技有限公司 词语识别方法、装置、电子设备和介质
CN111143507A (zh) * 2019-12-05 2020-05-12 重庆兆光科技股份有限公司 一种基于复合式问题的阅读理解方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776654B (zh) * 2015-11-24 2021-01-22 北京国双科技有限公司 一种数据搜索方法及装置
CN105447169B (zh) * 2015-12-07 2019-02-12 百度在线网络技术(北京)有限公司 文献归一方法、文献搜索方法及对应装置
CN107784041A (zh) * 2016-08-31 2018-03-09 北京国双科技有限公司 裁判文书案由的获取方法和装置
US10885056B2 (en) * 2017-09-29 2021-01-05 Oracle International Corporation Data standardization techniques
CN108133045B (zh) * 2018-01-12 2020-07-24 广州杰赛科技股份有限公司 关键词提取方法与系统、关键词提取模型生成方法与系统
CN109460502A (zh) * 2018-09-14 2019-03-12 广州神马移动信息科技有限公司 答案聚类方法及其装置、电子设备、计算机可读介质
CN110941706A (zh) * 2018-09-21 2020-03-31 华为技术有限公司 答案确定方法及系统
CN110196893A (zh) * 2019-05-05 2019-09-03 平安科技(深圳)有限公司 基于文本相似度的非主观题阅卷方法、装置及存储介质
CN110287296A (zh) * 2019-05-21 2019-09-27 平安科技(深圳)有限公司 一种问题答案选取方法、装置、计算机设备及存储介质
CN111160017B (zh) * 2019-12-12 2021-09-03 中电金信软件有限公司 关键词抽取方法、话术评分方法以及话术推荐方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008087A (zh) * 2014-06-05 2014-08-27 李梦依 一种针对具有标准格式的文案的自动排版方法和系统
CN108073565A (zh) * 2016-11-10 2018-05-25 株式会社Ntt都科摩 词语规范化的方法和设备及机器翻译方法和设备
CN107992554A (zh) * 2017-11-28 2018-05-04 北京百度网讯科技有限公司 提供问答信息的聚合结果的搜索方法和装置
CN110309295A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 生成裁判文书经审理查明段的方法及装置
CN108897770A (zh) * 2018-05-25 2018-11-27 南京大学 一种面向裁判文书的法条名称规范化及案由与法条的关联统计方法
CN109582955A (zh) * 2018-11-14 2019-04-05 金色熊猫有限公司 医疗术语的标准化方法、装置及介质
CN109582969A (zh) * 2018-12-04 2019-04-05 联想(北京)有限公司 实体匹配方法、装置及电子设备
CN110377730A (zh) * 2019-06-14 2019-10-25 平安科技(深圳)有限公司 案由分类方法、装置、计算机设备和存储介质
CN110472201A (zh) * 2019-07-26 2019-11-19 阿里巴巴集团控股有限公司 基于区块链的文本相似性检测方法及装置、电子设备
CN110674262A (zh) * 2019-10-16 2020-01-10 北京百度网讯科技有限公司 词语识别方法、装置、电子设备和介质
CN111143507A (zh) * 2019-12-05 2020-05-12 重庆兆光科技股份有限公司 一种基于复合式问题的阅读理解方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《行政复议办案指南》编写组: "《行政复议办案指南》", 30 September 2008 *
杨秀璋 等: "《Python 网络数据爬取及分析从入门到精通 分析篇》", 30 June 2018, 北京航空航天大学出版社 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686339A (zh) * 2021-03-11 2021-04-20 共道网络科技有限公司 一种基于起诉状的案由确定方法和装置

Also Published As

Publication number Publication date
CN112365374A (zh) 2021-02-12
CN112365374B (zh) 2022-04-19
CN111539853B (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
CN109101620B (zh) 相似度计算方法、聚类方法、装置、存储介质及电子设备
US20170193086A1 (en) Methods, devices, and systems for constructing intelligent knowledge base
CN109299280B (zh) 短文本聚类分析方法、装置和终端设备
CN107480143A (zh) 基于上下文相关性的对话话题分割方法和系统
CN109241528A (zh) 一种量刑结果预测方法、装置、设备及存储介质
CN113688951B (zh) 视频数据处理方法以及装置
WO2020020287A1 (zh) 一种获取文本相似度的方法、装置、设备及可读存储介质
CN111291571A (zh) 语义纠错方法、电子设备及存储介质
CN107885716B (zh) 文本识别方法及装置
CN111460783A (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN111125118A (zh) 关联数据查询方法、装置、设备及介质
CN111539853B (zh) 标准案由确定方法、装置和设备
CN110232071A (zh) 药品数据的检索方法、装置及存储介质、电子装置
CN112257689A (zh) 人脸识别模型的训练和识别方法、存储介质及相关设备
CN108810640B (zh) 一种电视节目的推荐方法
CN111259975A (zh) 分类器的生成方法及装置、文本的分类方法及装置
CN113626618B (zh) 基于跨篇章事件提取的案件串联方法、装置及相关组件
CN112528646B (zh) 词向量生成方法、终端设备及计算机可读存储介质
CN115840808A (zh) 科技项目咨询方法、装置、服务器及计算机可读存储介质
CN114579766A (zh) 知识图谱构建方法、装置、设备、存储介质和程序产品
CN108388676A (zh) 一种基于模拟退火算法的模具数据匹配方法、装置及系统
CN113010642B (zh) 语义关系的识别方法、装置、电子设备及可读存储介质
CN106446696A (zh) 一种信息处理方法及电子设备
CN110457455B (zh) 一种三值逻辑问答咨询优化方法、系统、介质和设备
CN112541069A (zh) 一种结合关键词的文本匹配方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40035853

Country of ref document: HK