CN110941645B - 一种自动判定串案的方法、装置、存储介质及处理器 - Google Patents

一种自动判定串案的方法、装置、存储介质及处理器 Download PDF

Info

Publication number
CN110941645B
CN110941645B CN201811109043.8A CN201811109043A CN110941645B CN 110941645 B CN110941645 B CN 110941645B CN 201811109043 A CN201811109043 A CN 201811109043A CN 110941645 B CN110941645 B CN 110941645B
Authority
CN
China
Prior art keywords
case
string
similarity
judged
cases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811109043.8A
Other languages
English (en)
Other versions
CN110941645A (zh
Inventor
刘国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201811109043.8A priority Critical patent/CN110941645B/zh
Publication of CN110941645A publication Critical patent/CN110941645A/zh
Application granted granted Critical
Publication of CN110941645B publication Critical patent/CN110941645B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种自动判定串案的方法、装置、存储介质及处理器。该方法从串案关系数据库中筛选与待判定案件的当事人和案由相同的串案集合,并通过案情的相似度,对待判定案件与串案集合的串案关系存在与否进行进一步确定。由于串案集合中案件的当事人和案由相同且案情相似,可理解为一个串案集合对应于一个案情,因此,当串案集合对应的案情与待判定案件的案情的相似度满足要求时,可以确定串案集合中的各个案件与待判定案件存在串案关系。利用该方法,法院立案阶段依据待判定案件的当事人、案由和案情,即可在串案关系数据库中自动判定与待判定案件存在串案关系的案件,无需审理法官手动筛选判定串案,有效提升法官的办案效率。

Description

一种自动判定串案的方法、装置、存储介质及处理器
技术领域
本申请涉及大数据分析技术领域,尤其涉及一种自动判定串案的方法、装置、存储介质及处理器。
背景技术
随着互联网深入千家万户,融入社会生活的方方面面,涉网纠纷案件越来越多。例如互联网购物产品责任纠纷、互联网著作权权属侵权纠纷、互联网购物合同纠纷等。
每年大量的互联网纠纷促进了互联网法院的发展。2017年仅半年时间,某法院累计立案受理4825件,审结3422件,网上立案率85%,一审服判息诉率达98.5%,平均审理天数48天。可以预测,随着互联网法院推行以及智慧法院的建设,需要办理越来越多的涉网案件。
互联网法院每天接收来自全国的涉网案件,这些案件中有很多涉及同一被告、同一案由,并且案情相似的情况,例如很多消费者起诉某个互联网商家产生的购物纠纷等,这些系列案件便形成了串案。即串案是指一方当事人相同、案由相同且案情相似,为节约司法资源,法院统一审理的一系列案件。其中当事人相同是指被告相同或者第三人相同。
在传统的法院模式下,每个法院单独接收的串案数量可能较少,由审理法官手动办理逐个排查,这种情况在传统法院,涉及案件数量较少的情况下是可行的。
但是随着互联网法院和智慧法院的建设,互联网法院的资源有限,例如一个法院里面的审理法官是有限的,而承办的案件数量则大量增加,并且增加的数量远远大于法院的可分配资源。为了节省资源,利用互联网技术辅助办理涉网案件是智慧法院建设的关键点。以前需要审理法官手动办理案件,标记串案,随着案件数量的明显增多,如果继续由法官手动处理大量案件的话,出错的几率也随之增大,办案质量也得不到保证。
发明内容
为了解决现有技术存在的以上技术问题,本申请提供一种自动判定串案的方法、装置、存储介质及处理器,能够在立案时自动判定串案,不必人工手动筛选串案,有效提升办案效率。
本申请提供了如下技术方案:
本申请第一方面,提供一种自动判定串案的方法,包括:
判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合;所述串案集合中各个案件之间的当事人相同、案由相同且案情相似;所述串案集合中所有案件对应一个案情;
如果存在,则获得所述待判定案件的案情与所述串案集合对应的案情的相似度;
当所述相似度大于预设阈值时,确定所述待判定案件与所述串案集合中的案件形成串案。
作为一种可能的实现方式,在确定所述待判定案件与所述串案集合中的案件形成串案之后,还包括:
将所述待判定案件归入所述串案集合中形成新的串案集合。
作为一种可能的实现方式,如果判断串案关系数据库不存在与待判定案件的当事人和案由相同的串案集合时,还包括:
从案件数据库中查找与所述待判定案件的当事人和案由相同的疑似案件;所述案件数据库包括所有已经立案的案件;
获得所述待判定案件的案情与所述疑似案件的案情的相似度;
确定所述相似度大于所述预设阈值时,确定所述待判定案件与所述疑似案件形成串案;
将所述待判定案件和所述疑似案件形成串案集合,所述串案集合归入所述串案关系数据库。
作为一种可能的实现方式,所述获得所述待判定案件的案情与所述串案集合对应的案情的相似度,具体包括:
提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量;
提取所述串案集合对应的案情中的第二组关键词,获得所述第二组关键词词频对应的第二向量;所述第一组关键词和第二组关键词内容相同;
利用余弦定理获得所述第一向量和第二向量的相似度。
作为一种可能的实现方式,所述获得所述待判定案件的案情与所述疑似案件的案情的相似度,具体包括:
提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量;
提取所述疑似案件的起诉状中事实与理由的第三组关键词,获得所述第三组关键词词频对应的第三向量;所述第一组关键词和第三组关键词内容相同;
利用余弦定理获得所述第一向量和第三向量的相似度。
作为一种可能的实现方式,当判断存在至少两个串案集合:第一串案集合和第二串案集合;所述第一串案集合和所述第二串案集合中各个案件的当事人和案由均分别与所述待判定案件的当事人和案由相同时,
则获得所述待判定案件的案情与所述串案集合对应的案情的相似度,具体包括:
获得所述待判定案件的案情与所述第一串案集合对应的案情的第一相似度,以及,获得所述待判定案件的案情与所述第二串案集合对应的案情的第二相似度;
确定所述相似度大于预设阈值,具体包括:
确定所述第一相似度和/或第二相似度大于所述预设阈值;
确定所述待判定案件与所述串案集合中的案件形成串案,具体包括:
将所述待判定案件与相似度大的串案集合中的案件形成串案。
本申请第二方面,提供一种自动判定串案的装置,包括:
判定单元,用于判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合;所述串案集合中各个案件之间的当事人相同、案由相同且案情相似;所述串案集合中所有案件对应一个案情;
第一获得单元,用于当判定单元判定存在时,获得所述待判定案件的案情与所述串案集合对应的案情的相似度;
第一确定单元,用于当所述相似度大于预设阈值时,确定所述待判定案件与所述串案集合中的案件形成串案。
作为一种可能的实现方式,该装置还包括:
查找单元,用于从案件数据库中查找与所述待判定案件的当事人和案由相同的疑似案件;所述案件数据库包括所有已经立案的案件;
第二获得单元,用于获得所述待判定案件的案情与所述疑似案件的案情的相似度;
第二确定单元,用于确定所述相似度大于所述预设阈值时,确定所述待判定案件与所述疑似案件形成串案;
归类单元,用于将所述待判定案件和所述疑似案件形成串案集合,所述串案集合归入所述串案关系数据库。
本申请第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面提供的自动判定串案的方法。
本申请第四方面,提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行本申请第一方面提供的自动判定串案的方法。
与现有技术相比,本申请至少具有以下优点:
本申请实施例提供的自动判定串案的方法,从串案关系数据库中筛选与待判定案件的当事人和案由相同的串案集合,并通过案情的相似度,对待判定案件与串案集合的串案关系存在与否进行进一步确定。由于串案集合中案件的当事人和案由相同且案情相似,可理解为一个串案集合对应于一个案情,因此,当串案集合对应的案情与待判定案件的案情的相似度满足要求时,可以确定串案集合中的各个案件与待判定案件存在串案关系。由此可见,利用该方法,法院立案阶段依据待判定案件的当事人、案由和案情,即可在串案关系数据库中自动判定与待判定案件存在串案关系的案件,无需审理法官手动筛选判定串案,有效提升法官的办案效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的自动判定串案的方法流程图;
图2为本申请实施例提供的自动判定串案的方法流程图;
图3为本申请实施例提供的串案关系数据库的结构示意图;
图4为本申请实施例提供的自动判定串案的方法流程图;
图5为本申请实施例提供的自动判定串案的装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
法院将当事人相同、案由相同且案情相似的案件称为串案。为节省司法资源,对于存在串案关系的多个案件,可以由审理法官统一审理。因此,判定串案成为了审理法官审理串案的重要前提。
目前,判定串案需要由审理法官手动处理。例如,在案件数据库的海量案件数据中,寻找与待判定案件(可理解为法院最新立案的案件)的当事人相同的案件,可能这些寻找出的案件的数量依然很庞大,法官需要再进一步地人工比较这些案件与待判定案件的案由是否一致等。此外,案件案情的相似度比较复杂度更高,比较过程尤为繁琐。由此可见,由法官人工手动判定串案,不仅操作繁琐,同时十分耗费法官的时间和精力,影响法官办案的效率。
为解决以上问题,发明人经过研究,提出了一种自动判定串案的方法及装置,依据待判定案件的当事人、案由和案情,从串案关系数据库中筛选出与待判定案件的当事人和案由均相同,且案情相似度满足要求的串案集合。由此,确定串案集合的案件与待判定案件存在串案关系。
为便于理解本实施例的技术方案,下面结合附图对本申请实施例提供的自动判定串案的方法及装置分别进行介绍。
参见图1,该图为本申请实施例提供的自动判定串案的方法流程图。
如图1所示,本申请实施例提供的自动判定串案的方法,包括:
步骤101:判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合。
本实施例为确定与待判定案件存在串案关系的案件,本步骤依据待判定案件的当事人和案由,在串案关系数据库中初步确定可能与待判定案件存在串案关系的串案集合。
当事人是指案件的被告或第三人。当事人相同,具体是指被告相同,和/或第三人相同。
案由是人民法院对诉讼案件所涉及的法律关系的性质进行概括后形成的案件名称。
需要说明的是,本实施例中,串案关系数据库中存在一个或多个串案集合。每一个串案集合中,至少包括两个互为串案的案件,串案集合中各个案件之间的当事人相同、案由相同,且案情相似。需要特别说明的是,由于同一串案集合中各个案件之间的案情相似,在本申请实施例中,同一串案集合中的所有案件对应一个案情,即一个串案集合具有唯一对应的一个案情。
举例说明,串案关系数据库中存在串案集合A和串案集合B,其中,串案集合A的各个案件的当事人相同,案由相同,且案情相似,串案集合A对应第一案情;串案集合B的各个案件的当事人相同,案由相同,且案情相似,串案集合B对应第二案情。
经过判断,本步骤可能存在以下两种结果:
第一种,串案关系数据库中存在与待判定案件的当事人和案由相同的串案集合。也就是说,串案关系数据库中至少存在一个串案集合,其能够同时满足当事人与待判定案件的当事人相同,且案由与待判定案件的案由相同的要求。例如,串案集合A的当事人和案由与待判定案件的当事人和案由相同,即串案集合A的当事人与待判定案件的当事人相同,并且串案集合A的案由与待判定案件的案由相同,那么串案关系数据库中存在与待判定案件的当事人和案由相同的串案集合,即本示例中的串案集合A。
第二种,串案关系数据库中不存在与待判定案件的当事人和案由相同的串案集合。也就是说,串案关系数据库中,不存在任何一个串案集合能够同时满足当事人与待判定案件的当事人相同,且案由与待判定案件的案由相同的要求。
本实施例中,针对第一种判断情况,执行以下步骤完成串案的自动判断。下面对针对第一种判断情况进行进一步的描述。
步骤102:如果存在,则获得待判定案件的案情与串案集合对应的案情的相似度。
本步骤中提及的串案集合,均指步骤101中判断出的串案关系数据库中,与待判定案件的当事人和案由相同的串案集合。
一个串案集合具有唯一对应的一个案情。本步骤依据待判定案件的案情,对步骤101确定出的串案集合与待判定案件进行案情的比较,获得串案集合对应的案情与待判定案件的案情的相似度。
由于待判定案件起诉状的事实与理由中的关键词能够反映待判定案件的案情,因此关键词与串案集合对应的案情中的关键词的相似度,即可作为待判定案件的案情与串案集合对应的案情的相似度。
作为一种可选的实施方式,本步骤可以通过计算关键词的相似度,对应地获得待判定案件的案情与串案集合对应的案情的相似度。例如,可以从待判定案件的起诉状的事实与理由中,提取关键词例如“侵害著作权”、“侵害商标权”或“侵害作品发行权”等。将提取的关键词与串案集合对应的案情中的关键词进行比较,获得相似度。获得关键词相似度的方法有多种,例如,可以通过余弦定理计算关键词的相似度。利用余弦定理计算相似度的具体实施方式将在后续实施例中进行具体介绍。
步骤103:当相似度大于预设阈值时,确定待判定案件与串案集合中的案件形成串案。
由于预设阈值为设定的用于确定具有串案关系的案件案情的相似度限值,因此,当相似度大于预设阈值时,表明待判定案件的案情与串案集合对应的案情足够相似,进而可确定待判定案件与串案集合中的案件互为串案。
作为示例,如预设阈值为85%,当待判定案件的案情与串案集合对应的案情的相似度大于85%时,可确定待判定案件与串案集合中的案件形成串案;当待判定案件的案情与串案集合对应的案情的相似度小于或等于85%时,可确定串案集合中的案件与待判定案件不存在串案关系。
以上为本申请实施例提供的自动判定串案的方法。该方法首先判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合;如果存在,则获得所述待判定案件的案情与所述串案集合对应的案情的相似度;当所述相似度大于预设阈值时,确定所述待判定案件与所述串案集合中的案件形成串案。由此,该方法依据待判定案件的当事人、案由及案情,从串案关系数据库中确定出当事人和案由与待判定案件相同,且案情与待判定案件足够相似的案件,这些案件即与待判定案件互为串案。
由此可见,利用该方法,法院立案阶段依据待判定案件的当事人、案由和案情,即可在串案关系数据库中自动判定与待判定案件存在串案关系的案件,无需审理法官手动筛选并标记串案,有效提升了法官的办案效率。
在前述实施例中,当相似度大于预设阈值时,确定待判定案件与串案集合中的案件形成串案。进而,可选的,该方法还可包括:
步骤104:将待判定案件归入串案集合中,形成新的串案集合。
新的串案集合依然存储于串案关系数据库中。新增了一个案件后,新的串案集合数据量增加,串案关系更加丰富,新的串案集合可进一步用于判定与新的待判定案件是否存在串案关系。
在前述实施例提供的自动判定串案的方法中,串案关系数据库中可能存在与待判定案件的当事人和案由相同的一个或多个串案集合。基于前述实施例,本申请还提供了一种自动判定串案的方法,具体描述当步骤101判断串案关系数据库中,存在与待判定案件的当事人和案由相同的多个串案集合时,如何确定待判定案件的串案。
下面结合附图对该方法进行详细说明。参见图2,该图为本申请实施例提供的自动判定串案的方法流程图。
如图2所示,本申请实施例提供的自动判定串案的方法,包括:
步骤201:判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合。
本实施例中,步骤201与前述实施例中步骤101相同,关于步骤201的详细描述请参见前述实施例,此处不进行赘述。
步骤202:如果存在至少两个与待判定案件的当事人和案由均相同的串案集合,则分别获取各个串案集合对应的案情与待判定案件的案情的相似度。
步骤203:当存在相似度大于预设阈值时,确定待判定案件与相似度大的串案集合中的案件形成串案。
下面提供一具体示例,对该方法进行阐述。
请参见图3所示的串案关系数据库的结构示意图,串案关系数据库中存在第一串案集合和第二串案集合,第一串案集合中各个案件的当事人和案由分别与待判定案件的当事人和案由相同,第二串案集合中各个案件的当事人和案由分别与待判定案件的当事人和案由相同。
第一串案集合中包含互为串案的案件301,案件302,案件303和案件304,第一串案集合中各个案件对应于案情D1;第二串案集合中包含互为串案的案件305,案件306,案件307和案件308,第二串案集合中各个案件对应于案情D2。
获得待判定案件的案情与第一串案集合对应的案情D1的第一相似度,以及,获得待判定案件的案情与第二串案集合对应的案情D2的第二相似度。以预设阈值为85%为例,相似度大于预设阈值的情况可分为以下两种:
(1)第一相似度和第二相似度均大于预设阈值。
若第一相似度和第二相似度分别为87%和95%,则第一相似度和第二相似度均大于预设阈值,且第二相似度大。表明,待判定案件的案情与第二串案集合对应的案情D2更相似。即可确定待判定案件与案件305,案件306,案件307和案件308形成串案。
(2)第一相似度或第二相似度大于预设阈值。
若第一相似度为87%,第二相似度为60%,则第一相似度和第二相似度中,仅第一相似度大于预设阈值,因此可确定待判定案件与案件301,案件302,案件303和案件304形成串案。
若第二相似度为87%,第一相似度为60%,则第一相似度和第二相似度中,仅第二相似度大于预设阈值,因此可确定待判定案件与案件305,案件306,案件307和案件308形成串案。
以上为本申请实施例提供的自动判定串案的方法。当串案关系数据库中存在与待判定案件的当事人和案由均相同的多个串案集合时,分别获得各个串案集合对应的案情与待判定案件的案情的相似度,若仅有一个串案集合对应的相似度大于预设阈值,则该串案集合的案件与待判定案件形成串案;若多个串案集合对应的相似度大于预设阈值,则相似度大的串案集合的案件与待判定案件形成串案。
在前述实施例步骤102中提及一种通过余弦定理计算关键词相似度的实施方式。为便于理解,下面将对该具体实施方式进行举例说明。
步骤102获得待判定案件的案情与串案集合对应的案情的相似度,可以具体包括:
S1021:提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量。
S1022:提取所述串案集合对应的案情中的第二组关键词,获得所述第二组关键词词频对应的第二向量。
S1023:利用余弦定理获得所述第一向量和第二向量的相似度。
对上述步骤的实现进行具体举例说明:
从待判定案件的起诉状中提取的事实与理由的一组关键词,称之为第一组关键词,第一组关键词包括[侵害商标权,侵害著作权,侵害作品发行权,侵害外观设计专利权]。事实与理由中,第一组关键词中各个关键词出现的频率分别为1次、2次、2次和1次。因此,可由各个关键词词频得到对应的关键词词频向量[1,2,2,1],将其称为第一向量。
另外,还提取串案关系数据库中,与待判定案件的当事人和案由均相同的第一串案集合,其对应的案情的关键词称为第二组关键词。由于第一串案集合中各个案件的案情相似,可理解为各个案件对应于同一案情,因此,第一串案集合中任一案件的起诉状中事实与理由的关键词即可作为第一串案集合对应的案情的关键词。需要说明的是,“第一”和“第二”仅为区分两组关键词的提取来源,实际上第二组关键词与第一组关键词中各个关键词相同,各个关键词的词频可能存在差异。
第二组关键词包括[侵害商标权,侵害著作权,侵害作品发行权,侵害外观设计专利权],其在案件起诉状事实与理由中出现的频率分别为2次、1次、2次和1次。因此,可由各个关键词词频得到对应的关键词词频向量[2,1,2,1],将其称为第二向量。
在计算待判定案件的案情与串案集合对应的案情的相似度时,可将第一向量和第二向量理解为空间中具有方向性的两条线段,运用余弦定理计算第一向量和第二向量的在空间的夹角θ,由于夹角θ的大小与第一向量和第二向量的相似度存在对应关系,因此可根据夹角θ获得第一向量和第二向量的相似度。夹角θ越小表示相似度越高,夹角为0°表示两个向量完全一致;夹角θ为90°表示两个向量完全不同;夹角θ为180°,表示两个向量方向相反。
求解两个多维向量s1和s2的夹角θ的余弦公式如下:
Figure BDA0001808621310000111
式中,s1和s2均为n维向量,i为正整数,1≤i≤n,s1i表示向量s1的第i维的数值,s2i表示向量s2的第i维的数值。
根据公式(1),可以计算第一向量[1,2,2,1]和第二向量[2,1,2,1]的夹角余弦cosθ。计算公式如下:
Figure BDA0001808621310000112
cosθ越接近于1,即夹角θ越接近于0°,第一向量与第二向量的相似度越高;cosθ越接近于0,即夹角θ越接近于90°,第一向量与第二向量的相似度越低。可根据公式(2)计算的cosθ估算第一向量与第二向量的相似度为90%。
由此,获得待判定案件的案情与串案集合对应的案情的相似度为90%。
前述实施例提供的自动判定串案的方法中,主要对步骤101判断串案关系数据库中存在与待判定案件的当事人和案由相同的串案集合的情况下,如何自动判定串案进行了说明和描述。
下面,本申请还提供了另一种自动判定串案的方法,具体对步骤101判断串案关系数据库中不存在与待判定案件的当事人和案由相同的串案集合的情况下,如何自动判定串案进行详细描述。
参见图4,该图为本申请实施例提供的另一种自动判定串案的方法流程图。
如图4所示,本申请实施例提供的另一种自动判定串案的方法,包括:
步骤401:判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合。
本实施例中,步骤401与前述实施例中步骤101相同,关于步骤401的详细描述请参见前述实施例,此处不进行赘述。
步骤402:如果不存在,从案件数据库中查找与所述待判定案件的当事人和案由相同的疑似案件。
当串案关系数据库中不存在与待判定案件的当事人和案由相同的串案集时,为确定待判定案件的串案,还可以从案件数据库中查找可能与待判定案件互为串案的案件。
案件数据库中包括所有已经立案的案件,包含法院的已经立案的海量案件的数据信息。不同于步骤401中的串案关系数据库,案件数据库中并无串案集合,各个案件之间以及各个案件与待判定案件之间是否存在串案关系均属于未知状态。
下面提供两种本步骤的具体实施方式:
第一种实施方式为,首先从案件数据库中检索与待判定案件的当事人相同的第一疑似案件,以此过滤掉案件数据库中当事人与待判定案件不相同的案件,第一疑似案件可能为一个或多个案件;其后,从第一疑似案件中检索与待判定案件的案由相同的第二疑似案件,以此过滤掉第一疑似案件中案由与待判定案件不同的案件,第二疑似案件也可能为一个或多个案件。第二疑似案件即为案件数据库中当事人和案由均与待判定案件相同,案情与待判定案件可能相似的疑似案件。
第二种实施方式为,首先从案件数据库中检索与待判定案件的案由相同的第三疑似案件,以此过滤掉案件数据库中案由与待判定案件不相同的案件,第三疑似案件可能为一个或多个案件。其后,从第一疑似案件中检索与待判定案件的当事人相同的第四疑似案件,以此过滤掉第三疑似案件中当事人与待判定案件不同的案件,第四疑似案件也可能为一个或多个案件。第四疑似案件即为案件数据库中当事人和案由均与待判定案件相同,案情与待判定案件可能相似的疑似案件。
需要特别说明的是,本实施例中,疑似案件是对案件数据库中查找到与待判定案件的当事人和案由分别相同的案件的统称。由于查找到的案件与待判定案件的案情相似度还有待进一步确定,因此统称查找到的案件为待判定案件的疑似案件。
步骤403:获得所述待判定案件的案情与所述疑似案件的案情的相似度。
为进一步确定疑似案件是否为待判定案件的串案,本步骤可以通过对待判定案件的案情与疑似案件的案情进行比较,获取二者的相似度。
与前述实施例步骤102类似地,本步骤可以通过提取案件起诉状中事实与理由的关键词获得关键词的词频向量,再采用余弦定理计算待判定案件与疑似案件的关键词词频向量之间的夹角余弦,进而获得待判定案件与疑似案件的案情的相似度。
作为一具体示例,本步骤可包括:
S4031:提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量。
S4032:提取所述疑似案件的起诉状中事实与理由的第三组关键词,获得所述第三组关键词词频对应的第三向量。
需要说明的是,第一组关键词和第三组关键词内容相同。例如:第一组关键词包括[侵害商标权,侵害著作权,侵害作品发行权,侵害外观设计专利权],第三组关键词包括[侵害商标权,侵害著作权,侵害作品发行权,侵害外观设计专利权]。
S4033:利用余弦定理获得所述第一向量和第三向量的相似度。
S4031至S4033的具体实施过程与前述实施例S1021至S1023相似,详细描述可参见前述实施例以及公式(1)和公式(2),此处不加以赘述。
步骤404:确定所述相似度大于所述预设阈值时,确定所述待判定案件与所述疑似案件形成串案。
由于预设阈值为设定的用于确定具有串案关系的案件案情的相似度限值,因此,当相似度大于预设阈值时,表明待判定案件的案情与疑似案件的案情足够相似,进而可确定待判定案件与疑似案件互为串案。
步骤405:将所述待判定案件和所述疑似案件形成串案集合,所述串案集合归入所述串案关系数据库。
由于步骤404中,形成串案的待判定案件与疑似案件的当事人和案由相同,且案情相似度大于预设阈值,因此可认为待判定案件与疑似案件对应于同一案情。由此,待判定案件与疑似案件可以构成串案集合,串案集合中各个案件的当事人和案由相同,且各个案件对应于同一案情。
本实施例中,待判定案件和疑似案件构成的串案集合可进一步归入串案关系数据库,进而当需要为新的待判定案件查找串案时,可首先从串案关系数据库中查找是否存在与新的待判定案件存在串案关系的串案集合。
例如,本实施例中,待判定案件A1和疑似案件A2最终构成串案集合A,串案集合A中的各个案件的被告为B,案由为C,各个案件对应的案情为D。串案集合A归入串案关系数据库中。当需要为新的待判定案件A3查找串案时,首先从串案数据关系数据库中查找是否存在与A3存在串案关系的串案集合。如果新的待判定案件A3的被告为B,案由为C,且其案情与串案集合A对应的案情D的相似度大于预设阈值,则确定出新的待判定案件A3与串案集合A的各个案件形成串案。进一步地,还可将A3归入串案集合A中,使串案关系数据库的串案关系得以丰富,便利后续的串案判定。如果串案关系数据库中,不存在与新的待判定案件A3被告和案由相同的串案集合,则可重复执行步骤402。
以上为本申请实施例提供的自动判定串案的方法。该方法中,当判断串案关系数据库不存在与待判定案件的当事人和案由相同的串案集合时,从案件数据库中查找与待判定案件的当事人和案由相同的疑似案件,求得待判定案件的案情与疑似案件的案情的相似度。由于当相似度大于预设阈值时,表明待判定案件与疑似案件的案情足够相似,可理解为对应于同一案情,同时由于待判定案件与疑似案件的当事人和案由均相同,此时可确定待判定案件与疑似案件形成串案。最后,还可将待判定案件和疑似案件形成串案集合,串案集合归入串案关系数据库,便利后续的串案判定。
另外,需要说明的是,若本实施例中步骤402查找到的疑似案件为多个,则可以获取各个疑似案件的案情与待判定案件的案情的相似度,确定各个相似度是否大于预设阈值。若存在相似度大于预设阈值,则确定相似度大的案件与待判定案件存在串案关系。
本申请实施例还提供了一种自动判定串案的装置。下面结合附图对该装置进行描述和说明。
参见图5,该图为本申请实施例提供的自动判定串案的装置的结构示意图。
如图5所示,本申请实施例提供的自动判定串案的装置,包括:
判定单元501,用于判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合;
所述串案集合中案件的当事人和案由相同且案情相似;
第一获得单元502,用于当判定单元判定存在时,获得所述待判定案件的案情与所述串案集合对应的案情的相似度;
第一确定单元503,用于当所述相似度大于预设阈值时,确定所述待判定案件与所述串案集合中的案件形成串案。
以上为本申请实施例提供的自动判定串案的装置。该装置首先判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合;如果存在,则获得所述待判定案件的案情与所述串案集合对应的案情的相似度;当所述相似度大于预设阈值时,确定所述待判定案件与所述串案集合中的案件形成串案。由此,该装置依据待判定案件的当事人、案由及案情,从串案关系数据库中确定出当事人和案由与待判定案件相同,且案情与待判定案件足够相似的案件,这些案件即与待判定案件互为串案。
由此可见,利用该装置,法院立案阶段依据待判定案件的当事人、案由和案情,即可在串案关系数据库中自动判定与待判定案件存在串案关系的案件,无需审理法官手动筛选串案,有效提升了法官的办案效率。
另外,当判定单元501判断串案关系数据库不存在与待判定案件的当事人和案由相同的串案集合时,针对该情况,为自动判定串案,前述的装置中还可以包括:
查找单元,用于从案件数据库中查找与待判定案件的当事人和案由相同的疑似案件;
第二获得单元,用于获得所述待判定案件的案情与所述疑似案件的案情的相似度;
第二确定单元,用于确定所述相似度大于所述预设阈值时,确定所述待判定案件与所述疑似案件形成串案;
归类单元,用于将所述待判定案件和所述疑似案件形成串案集合,所述串案集合归入所述串案关系数据库。
可选的,第一获得单元502可以包括:
第一提取子单元,用于提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量;
第二提取子单元,用于提取所述串案集合对应的案情中的第二组关键词,获得所述第二组关键词词频对应的第二向量;所述第一组关键词和第二组关键词内容相同;
相似度第一获得子单元,用于利用余弦定理获得所述第一向量和第二向量的相似度。
可选的,第二获得单元可以包括:
第三提取单元,用于提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量;
第四提取单元,用于提取所述疑似案件的起诉状中事实与理由的第三组关键词,获得所述第三组关键词词频对应的第三向量;所述第一组关键词和第三组关键词内容相同;
相似度第二获得子单元,用于利用余弦定理获得所述第一向量和第三向量的相似度。
另外,上述自动判定串案的装置包括处理器和存储器,上述判定单元、第一获得单元和第一确定单元等单元均作为程序单元存储在存储器中。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。
本申请实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述自动判定串案的方法。
本申请进一步提供了一种处理器,该处理器用于运行程序,程序运行时执行前述实施例提供的自动判定串案的方法。由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来自动判定串案,提高办案效率。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合;
如果存在,则获得所述待判定案件的案情与所述串案集合对应的案情的相似度;
当所述相似度大于预设阈值时,确定所述待判定案件与所述串案集合中的案件形成串案。
在确定所述待判定案件与所述串案集合中的案件形成串案之后,将所述待判定案件归入所述串案集合中形成新的串案集合。
如果判断串案关系数据库不存在与待判定案件的当事人和案由相同的串案集合时:
从案件数据库中查找与待判定案件的当事人和案由相同的疑似案件;
获得所述待判定案件的案情与所述疑似案件的案情的相似度;
确定所述相似度大于所述预设阈值时,确定所述待判定案件与所述疑似案件形成串案;
将所述待判定案件和所述疑似案件形成串案集合,所述串案集合归入所述串案关系数据库。
获得所述待判定案件的案情与所述串案集合对应的案情的相似度,具体包括:
提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量;
提取所述串案集合对应的案情中的第二组关键词,获得所述第二组关键词词频对应的第二向量;所述第一组关键词和第二组关键词内容相同;
利用余弦定理获得所述第一向量和第二向量的相似度。
所述获得所述待判定案件的案情与所述疑似案件的案情的相似度,具体包括:
提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量;
提取所述疑似案件的起诉状中事实与理由的第三组关键词,获得所述第三组关键词词频对应的第三向量;所述第一组关键词和第三组关键词内容相同;
利用余弦定理获得所述第一向量和第三向量的相似度。
当判断存在至少两个串案集合:第一串案集合和第二串案集合;所述第一串案集合和第二串案集合中各个案件的当事人和案由均分别与所述待判定案件的当事人和案由相同时,
则获得所述待判定案件的案情与所述串案集合对应的案情的相似度,具体包括:
获得所述待判定案件的案情与所述第一串案集合对应的案情的第一相似度,以及,获得所述待判定案件的案情与所述第二串案集合对应的案情的第二相似度;
确定所述相似度大于预设阈值,具体包括:
确定所述第一相似度和/或第二相似度大于所述预设阈值;
确定所述待判定案件与所述串案集合中的案件形成串案,具体包括:
将所述待判定案件与相似度大对应的串案集合中的案件形成串案。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种自动判定串案的方法,其特征在于,包括:
判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合;所述串案集合中各个案件之间的当事人相同、案由相同且案情相似;所述串案集合中所有案件对应一个案情;
如果存在,则获得所述待判定案件的案情与所述串案集合对应的案情的相似度;
当所述相似度大于预设阈值时,确定所述待判定案件与所述串案集合中的案件形成串案;
如果判断串案关系数据库不存在与待判定案件的当事人和案由相同的串案集合时,还包括:
从案件数据库中查找与所述待判定案件的当事人和案由相同的疑似案件;所述案件数据库包括所有已经立案的案件;获得所述待判定案件的案情与所述疑似案件的案情的相似度;确定所述相似度大于所述预设阈值时,确定所述待判定案件与所述疑似案件形成串案;将所述待判定案件和所述疑似案件形成串案集合,所述串案集合归入所述串案关系数据库。
2.根据权利要求1所述的自动判定串案的方法,其特征在于,在确定所述待判定案件与所述串案集合中的案件形成串案之后,还包括:
将所述待判定案件归入所述串案集合中形成新的串案集合。
3.根据权利要求1所述的自动判定串案的方法,其特征在于,所述获得所述待判定案件的案情与所述串案集合对应的案情的相似度,具体包括:
提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量;
提取所述串案集合对应的案情中的第二组关键词,获得所述第二组关键词词频对应的第二向量;所述第一组关键词和第二组关键词内容相同;
利用余弦定理获得所述第一向量和第二向量的相似度。
4.根据权利要求1所述的自动判定串案的方法,其特征在于,所述获得所述待判定案件的案情与所述疑似案件的案情的相似度,具体包括:
提取所述待判定案件的起诉状中事实与理由的第一组关键词,获得所述第一组关键词词频对应的第一向量;
提取所述疑似案件的起诉状中事实与理由的第三组关键词,获得所述第三组关键词词频对应的第三向量;所述第一组关键词和第三组关键词内容相同;
利用余弦定理获得所述第一向量和第三向量的相似度。
5.根据权利要求1所述的自动判定串案的方法,其特征在于,当判断存在至少两个串案集合:第一串案集合和第二串案集合;所述第一串案集合和所述第二串案集合中各个案件的当事人和案由均分别与所述待判定案件的当事人和案由相同时,
则获得所述待判定案件的案情与所述串案集合对应的案情的相似度,具体包括:
获得所述待判定案件的案情与所述第一串案集合对应的案情的第一相似度,以及,获得所述待判定案件的案情与所述第二串案集合对应的案情的第二相似度;
确定所述相似度大于预设阈值,具体包括:
确定所述第一相似度和/或第二相似度大于所述预设阈值;
确定所述待判定案件与所述串案集合中的案件形成串案,具体包括:
将所述待判定案件与相似度大的串案集合中的案件形成串案。
6.一种自动判定串案的装置,其特征在于,包括:
判定单元,用于判断串案关系数据库是否存在与待判定案件的当事人和案由相同的串案集合;所述串案集合中各个案件之间的当事人相同、案由相同且案情相似;所述串案集合中所有案件对应一个案情;
第一获得单元,用于当判定单元判定存在时,获得所述待判定案件的案情与所述串案集合对应的案情的相似度;
第一确定单元,用于当所述相似度大于预设阈值时,确定所述待判定案件与所述串案集合中的案件形成串案;
查找单元,用于当所述判定单元判断串案关系数据库不存在与待判定案件的当事人和案由相同的串案集合时,从案件数据库中查找与所述待判定案件的当事人和案由相同的疑似案件;所述案件数据库包括所有已经立案的案件;
第二获得单元,用于获得所述待判定案件的案情与所述疑似案件的案情的相似度;
第二确定单元,用于确定所述相似度大于所述预设阈值时,确定所述待判定案件与所述疑似案件形成串案;
归类单元,用于将所述待判定案件和所述疑似案件形成串案集合,所述串案集合归入所述串案关系数据库。
7.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1至5中任一项所述的自动判定串案的方法。
8.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至5中任一项所述的自动判定串案的方法。
CN201811109043.8A 2018-09-21 2018-09-21 一种自动判定串案的方法、装置、存储介质及处理器 Active CN110941645B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811109043.8A CN110941645B (zh) 2018-09-21 2018-09-21 一种自动判定串案的方法、装置、存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811109043.8A CN110941645B (zh) 2018-09-21 2018-09-21 一种自动判定串案的方法、装置、存储介质及处理器

Publications (2)

Publication Number Publication Date
CN110941645A CN110941645A (zh) 2020-03-31
CN110941645B true CN110941645B (zh) 2023-04-07

Family

ID=69905392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811109043.8A Active CN110941645B (zh) 2018-09-21 2018-09-21 一种自动判定串案的方法、装置、存储介质及处理器

Country Status (1)

Country Link
CN (1) CN110941645B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407575B (zh) * 2021-05-14 2023-07-04 深圳市广电信义科技有限公司 一种基于多维度的案件合并方法、装置及存储介质
CN114677242A (zh) * 2021-07-16 2022-06-28 深圳云天励飞技术股份有限公司 案件的串并案方法、装置、电子设备及存储介质
CN113626618B (zh) * 2021-10-12 2022-02-15 深圳前海环融联易信息科技服务有限公司 基于跨篇章事件提取的案件串联方法、装置及相关组件

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4407272B2 (ja) * 2003-12-22 2010-02-03 富士ゼロックス株式会社 文書分類方法、文書分類装置及び文書分類プログラム
US9646081B1 (en) * 2014-06-30 2017-05-09 Open Text Corporation System and method to present a summarized task view in a case management system
CN105677727A (zh) * 2015-12-29 2016-06-15 上海律巢网络科技有限公司 数据检索及检索结果呈现方法和系统
CN106991092B (zh) * 2016-01-20 2021-11-05 阿里巴巴集团控股有限公司 基于大数据挖掘相似裁判文书的方法和设备
CN106127241A (zh) * 2016-06-17 2016-11-16 中国电子科技集团公司第二十八研究所 一种串并案分类方法及串并案分类系统
CN108038091B (zh) * 2017-10-30 2021-12-14 上海思贤信息技术股份有限公司 一种基于图的裁判文书案件相似计算与检索方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Chih Hao Ku et al.Natural language processing and e-Government: crime information extraction from heterogeneous data sources.《Proceedings of the 2008 international conference on Digital government research》.2008,第162–170页. *
韩宁 等.基于聚类分析的串并案研究.《中国人民公安大学学报(自然科学版)》.2012,(第71期),第53-58页. *

Also Published As

Publication number Publication date
CN110941645A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN110941645B (zh) 一种自动判定串案的方法、装置、存储介质及处理器
TW202029079A (zh) 異常群體識別方法及裝置
US11288266B2 (en) Candidate projection enumeration based query response generation
CN109255000B (zh) 一种标签数据的维度管理方法及装置
CN115577858B (zh) 基于区块链的碳排放量预测方法、装置及电子设备
CN110674360A (zh) 一种用于数据关联图谱的构建和数据的溯源方法和系统
WO2017092581A1 (zh) 一种用户数据共享的方法和设备
CN115879017A (zh) 一种电力敏感数据自动化分类分级方法、装置及存储介质
CN114239083B (zh) 一种基于图神经网络的高效状态寄存器识别方法
CN110689211A (zh) 网站服务能力的评估方法及装置
WO2021027086A1 (zh) 文本聚类的方法、设备和存储介质
CN109218211A (zh) 数据流的控制策略中阈值的调整方法、装置和设备
CN104794237B (zh) 网页信息处理方法及装置
WO2015074493A1 (zh) 一种低频点击的过滤方法、装置、计算机程序以及计算机可读介质
CN105787004A (zh) 一种文本分类方法及装置
CN110895703B (zh) 法律文书案由识别方法及装置
CN117312825A (zh) 一种目标行为检测方法、装置、电子设备及存储介质
CN116821903A (zh) 检测规则确定及恶意二进制文件检测方法、设备及介质
CN103995831A (zh) 基于物品间相似度的物品处理方法、系统和装置
CN104008334A (zh) 一种文件的聚类方法和设备
WO2023020508A1 (zh) 一种商品自动分类方法、装置及计算机设备
CN110941952A (zh) 一种完善审计分析模型的方法及装置
WO2021063072A1 (zh) 甄别虚假诉讼的方法、装置、存储介质及设备
CN114024912A (zh) 一种基于改造chameleon算法的网络流量应用识别分析方法及系统
CN113190666A (zh) 一种产业知识产权分析方法、系统、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant