CN117851608A - 案件图谱生成方法、装置、设备和介质 - Google Patents
案件图谱生成方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN117851608A CN117851608A CN202410021051.6A CN202410021051A CN117851608A CN 117851608 A CN117851608 A CN 117851608A CN 202410021051 A CN202410021051 A CN 202410021051A CN 117851608 A CN117851608 A CN 117851608A
- Authority
- CN
- China
- Prior art keywords
- case
- map
- association
- document
- case map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000003012 network analysis Methods 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及数据处理领域,尤其涉及一种案件图谱生成方法、装置、设备和介质,方法包括:获取搜索词对应的多个案情图谱,其中,每一案情图谱包括多个案情要素和多个案情要素关系;在多个案情图谱中,将包括相同的案情要素的案情图谱,作为第一关联案情图谱;确定第一关联案情图谱对应的第二关联案情图谱集,其中,第二关联案情图谱集包括至少一个第二关联案情图谱,且,第二关联案情图谱与对应的第一关联案情图谱存在至少一个相同的案情信息;根据第一关联案情图谱、第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到搜索词对应的包括案件关联网络的案件图谱。本申请可以确定各案件之间的关系。
Description
技术领域
本申请涉及数据处理的技术领域,尤其是涉及一种案件图谱生成方法、装置、设备和介质。
背景技术
案情图谱在法律领域具有很大的必要性。首先,案情图谱能够提供更加全面和准确的信息,帮助法律行业人员更好地了解案件的背景、相关法规和司法实践,从而做出更科学、更准确的决策。其次,案情图谱还可以通过自然语言处理技术,自动对法律文书进行分类和归纳,方便律师快速查找和获取所需信息。进一步的,在司法实践中,案情图谱还可以帮助法官、警察更好地理解案件的相关信息,从而做出更公正、更合理的判断或判决。
目前,当办案人员需要通过法律文书来整理办案思路,从而推进案情进展时,常通过案情图谱实现。具体的,先从该案件对应的全部法律文书中,提取案情要素和案情要素关系,再以案情要素关系将案情要素连接,从而得到该案件对应的案情图谱。
但是,一个案件的案情图谱仅能反映该案件的各案情要素之间的关系,不能够确定案件与案件之间的关系。
故,如何基于案情图谱确定各案件之间的关系,是本领域技术人员亟待解决的技术问题。
发明内容
为了确定各案件之间的关系,本申请提供一种案件图谱生成方法、装置、设备和介质。
第一方面,本申请提供一种案件图谱生成方法,采用如下的技术方案:
一种案件图谱生成方法,包括:
获取搜索词对应的多个案情图谱,其中,每一所述案情图谱包括多个案情要素和多个案情要素关系;
在所述多个案情图谱中,将包括相同的所述案情要素的所述案情图谱,作为第一关联案情图谱;
确定所述第一关联案情图谱对应的第二关联案情图谱集,其中,所述第二关联案情图谱集包括至少一个第二关联案情图谱,且,所述第二关联案情图谱与对应的第一关联案情图谱存在至少一个相同的案情信息;
根据所述第一关联案情图谱、所述第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到所述搜索词对应的包括案件关联网络的案件图谱。
通过采用上述技术方案,获取搜索词对应的多个案情图谱,以确定可能为用户提供案情思路的案情图谱;在多个可能能够为用户提供案情思路的案情图谱中,将包括相同的案情要素的案情图谱,作为第一关联案情图谱,以初步确定存在主要关联的案件对应的案情图谱;确定第一关联案情图谱对应的第二关联案情图谱集,以确定存在次要关联的案件对应的案情图谱;基于存在主要关联的案件和存在次要关联的案件各自对应的案情图谱,可以得到能够表征用户所需案件之间的关系的案件图谱。
本申请在一较佳示例中可以进一步配置为:
在所述获取搜索词对应的多个案情图谱之前,还包括:
确定有效数据源,并基于所述有效数据源获取案件文档;
相应的,所述获取搜索词对应的多个案情图谱,包括:
对所述案件文档进行案情分析,得到所述多个案情图谱。
通过采用上述技术方案,确定有效数据源后,基于有效数据源获取案件文档,可以在部分数据源不可用时,不对不可用的数据源执行数据获取动作,从而对案件文档进行案情分析后,可以更快地得到多个案情图谱。
本申请在一较佳示例中可以进一步配置为:
所述对所述案件文档进行案情分析,得到所述多个案情图谱,包括:
针对每一所述案件文档,提取所述案件文档对应的案情要素和所述案情要素对应的至少一个案情要素关系;
针对每一所述案情要素关系,判断所述案件文档中是否存在目标时间节点,其中,所述目标时间节点为所述案情要素关系的发生时间;
若否,则基于所述剩余案件文档获取所述目标时间节点;
根据所述案情要素、所述案情要素关系和所述案情要素关系对应的所述目标时间节点,得到所述案件文档对应的所述案情图谱。
通过采用上述技术方案,针对每一案件文档,将案件文档中的案情要素和案情要素关系提取出来;通过判断案件文档中是否存在目标时间节点,来确定案件文档中每一案情要素关系对应的发生时间后,再根据所述案情要素、所述案情要素关系和所述案情要素关系对应的所述目标时间节点,可以更加准确地得到所述案件文档对应的所述案情图谱,相较于案情要素关系的发生时间被忽视所得到的案情图谱精准度更高。
本申请在一较佳示例中可以进一步配置为:每一所述案情图谱对应唯一案件标识,
所述根据所述第一关联案情图谱、所述第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到所述搜索词对应的包括案件关联网络的案件图谱,包括:
针对每一所述第一关联案情图谱,确定所述第一关联案情图谱与每一所述第二关联案情图谱之间的案件关系;
基于全部所述案件标识和全部所述案件关系,得到所述案件图谱。
通过采用上述技术方案,针对每一管理案情图谱,确定第一关联案情图谱和每一第二关联案情图谱之间的案件关系后,以案件标识作为图谱要素、案件关系作为图谱要素关系,得到案件图谱。
本申请在一较佳示例中可以进一步配置为:
所述基于全部所述案件标识和全部所述案件关系,得到所述案件图谱,包括:
确定每一所述案件标识对应的时间段;
基于全部所述案件标识、全部所述案件标识各自对应的时间段和全部所述案件关系,确定所述案件图谱。
通过采用上述技术方案,当不同案件发生的时间段不同时,上述不同案件之间可能存在不同的案件关系,故,本方案在确定每一案件标识对应的时间段后,再基于全部案件标识、全部案件标识各自对应的时间段和全部案件关系,可以得到更加准确的案件图谱。
第二方面,本申请提供一种案件图谱生成装置,采用如下的技术方案:
一种案件图谱生成装置,包括:
第一获取模块,用于获取搜索词对应的多个案情图谱,其中,每一所述案情图谱包括多个案情要素和多个案情要素关系;
第一确定模块,用于在所述多个案情图谱中,将包括相同的所述案情要素的所述案情图谱,作为第一关联案情图谱;
第二确定模块,用于确定所述第一关联案情图谱对应的第二关联案情图谱集,其中,所述第二关联案情图谱集包括至少一个第二关联案情图谱,且,所述第二关联案情图谱与对应的第一关联案情图谱存在至少一个相同的案情信息;
生成模块,用于根据所述第一关联案情图谱、所述第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到所述搜索词对应的包括案件关联网络的案件图谱。
本申请在一较佳示例中可以进一步配置为:
所述案件图谱生成装置,还包括:
第二获取模块,用于确定有效数据源,并基于所述有效数据源获取案件文档;
相应的,所述第一获取模块,在执行获取搜索词对应的多个案情图谱时,用于:
对所述案件文档进行案情分析,得到所述多个案情图谱。
本申请在一较佳示例中可以进一步配置为:
所述第一获取模块,在执行对所述案件文档进行案情分析,得到所述多个案情图谱时,用于:
针对每一所述案件文档,提取所述案件文档对应的案情要素和所述案情要素对应的至少一个案情要素关系;
针对每一所述案情要素关系,判断所述案件文档中是否存在目标时间节点,其中,所述目标时间节点为所述案情要素关系的发生时间;
若否,则基于所述剩余案件文档获取所述目标时间节点;
根据所述案情要素、所述案情要素关系和所述案情要素关系对应的所述目标时间节点,得到所述案件文档对应的所述案情图谱。
第三方面,本申请提供一种电子设备,采用如下的技术方案:
至少一个处理器;
存储器;
至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行如第一方面任一项所述的案件图谱生成方法。
第四方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令所述计算机执行如第一方面任一项所述的案件图谱生成方法。
综上所述,本申请至少包括以下有益技术效果:
获取搜索词对应的多个案情图谱,以确定可能为用户提供案情思路的案情图谱;在多个可能能够为用户提供案情思路的案情图谱中,将包括相同的案情要素的案情图谱,作为第一关联案情图谱,以初步确定存在主要关联的案件对应的案情图谱;确定第一关联案情图谱对应的第二关联案情图谱集,以确定存在次要关联的案件对应的案情图谱;基于存在主要关联的案件和存在次要关联的案件各自对应的案情图谱,可以得到能够表征用户所需案件之间的关系的案件图谱。
附图说明
图1为本申请实施例提供的一种案件图谱生成方法的应用场景示意图。
图2为本申请实施例提供的一种案件图谱生成方法的流程示意图。
图3为本申请实施例提供的一种案件图谱生成装置的结构示意图。
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
以下结合附图1至附图4对本申请作进一步详细说明。
本具体实施例仅仅是对本申请的解释,其并不是对本申请的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本申请的范围内都受到专利法的保护。
为使本申请实施例的目的、技术方案和优点更加清楚,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
下面结合说明书附图对本申请实施例作进一步详细描述。
本申请实施例提供了一种案件图谱生成方法,由电子设备执行,该电子设备可以为服务器也可以为终端设备,其中,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此,该终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例在此不做限制。
如图1所示,当用户存在案件图谱的参考需求时,向用户端输入包括参考需求的搜索词;用户端接收到搜索词后将搜索词发送至电子设备;电子设备基于搜索词和案件文档库生成案件图谱,其中,案件文档数据库包括大量案件文档;电子设备将案件图谱发送至用户端;用户直接利用用户端接收到的案件图谱。
如图2所示,该方法包括步骤S101至步骤S104,其中:
步骤S101:获取搜索词对应的多个案情图谱,其中,每一案情图谱包括多个案情要素和多个案情要素关系。
搜索词可以为人名、案件名称、时间段和案件手段等特征。案情要素为人名、编码等任一能够表征人员身份的标识信息;案情要素关系表征案情要素与案情要素之间发生的事件类型,事件类型可以为交易、碰面、会面等人员社交情况。
步骤S102:在多个案情图谱中,将包括相同的案情要素的案情图谱,作为第一关联案情图谱。
具体的,针对每一案情图谱,确定该案情图谱对应的案情要素集,其中,案情要素集包括该案情图谱对应的多个案情要素;基于全部案情要素集,确定高频案情要素组,其中,高频案情要素组包括多个高频案情要素与上述多个高频案情要素各自对应的频次,高频案情要素存在于至少两个案情要素集中;将上述多个高频案情要素进行全组合,得到多个高频组,高频组包括至少一个高频案情要素,需要了解的是,全组合是指从m个元素中任取x(0<x≤m)个元素所有的可能性,计算方法通常涉及组合数学中的组合数;确定每一高频组对应的案情图谱组,其中,案情图谱组包括若干高频案情图谱,高频案情图谱对应的高频组包括上述至少一个高频案情要素;去除案情图谱组中为空的案情图谱组,得到目标案情图谱组,每一目标案情图谱组包括若干目标案情图谱;将目标案情图谱作为第一关联案情图谱。
步骤S103:确定第一关联案情图谱对应的第二关联案情图谱集,其中,第二关联案情图谱集包括至少一个第二关联案情图谱,且,第二关联案情图谱与对应的第一关联案情图谱存在至少一个相同的案情信息。
案情信息为高频案情要素和/或高频案情要素关系。
步骤S104:根据第一关联案情图谱、第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到搜索词对应的包括案件关联网络的案件图谱。
其中,案件关联网络分析表征对搜索词对应的全部案件文档进行分析,以构建案件关联网络,从而获取上述全部案件文档各自对应的案件之间的关系。需要了解的是,图谱包括要素和要素关系两种元素,要素关系用于连接互相关联的两种要素;案件图谱包括搜索词对应的案件关联网络与上述多个案情图谱;案件关联网络以将案件标识作为图谱的要素,以第一关联案情图谱对应的案件标识和第二关联案情图谱对应的案件标识作为图谱的要素关系;第一关联案情图谱对应的案件标识与该第一关联案情图谱对应的第二关联案情图谱对应的案件标识,通过该第一关联案情图谱与该第二关联案情图谱之间的案件关系相连。
在上述步骤S104之后,还可以包括:电子设备将上述案件图谱发送至搜索词对应的用户端;用户端接收上述案件图谱,并以案件关联网络形式在用户端对应的显示设备上进行显示;且,用户端在显示过程中实时监测详细阅读指令,其中,当用户存在详细阅读需求时会点击显示屏幕上的任一要素,此时用户端生成关于该要素的详细阅读指令,详细阅读指令包括目标案件标识,目标案件标识为该要素对应的案件标识;用户端基于上述目标案件标识调取多个案情图谱中的目标案情图谱,并附目标案情图谱进行显示,以完成用户与用户端之间的交互,其中,目标案情图谱为目标案件标识对应的案情图谱。
在本申请实施例中,获取搜索词对应的多个案情图谱,以确定可能为用户提供案情思路的案情图谱;在多个可能能够为用户提供案情思路的案情图谱中,将包括相同的案情要素的案情图谱,作为第一关联案情图谱,以初步确定存在主要关联的案件对应的案情图谱;确定第一关联案情图谱对应的第二关联案情图谱集,以确定存在次要关联的案件对应的案情图谱;基于存在主要关联的案件和存在次要关联的案件各自对应的案情图谱,可以得到能够表征用户所需案件之间的关系的案件图谱。
本申请实施例的一种可能的实现方式,在步骤S101,获取搜索词对应的多个案情图谱之前,还可以包括:
确定有效数据源,并基于有效数据源获取案件文档;
相应的,步骤S101,获取搜索词对应的多个案情图谱,具体可以包括:
对案件文档进行案情分析,得到多个案情图谱。
具体的,获取用户身份信息,并基于用户身份信息,在多个预设数据源中,确定该用户身份信息存在访问权限的有效数据源,其中,上述多个预设数据源分别对应不同保密等级,需要注意的是,不同用户身份信息对案件文档的访问权限不同,同一案件当保密等级不同时其案件文档也存在不同,有效数据源对应的保密等级不大于用户身份信息对应的访问权限;获取该有效数据源下的案件文档;对案件文档进行案情分析,得到多个案情图谱。
在本申请实施例中,确定有效数据源后,基于有效数据源获取案件文档,可以在部分数据源不可用时,不对不可用的数据源执行数据获取动作,从而对案件文档进行案情分析后,可以更快地得到多个案情图谱。
本申请实施例的一种可能的实现方式,对案件文档进行案情分析,得到多个案情图谱,具体可以包括:
针对每一案件文档,提取案件文档对应的案情要素和案情要素对应的至少一个案情要素关系;
针对每一案情要素关系,判断案件文档中是否存在目标时间节点,其中,目标时间节点为案情要素关系的发生时间;
若否,则基于剩余案件文档获取目标时间节点;
根据案情要素、案情要素关系和案情要素关系对应的目标时间节点,得到案件文档对应的案情图谱。
具体的,针对每一案件文档,提取案件文档中包括的全部案情要素;将上述全部案情要素进行全组合,得到多个案情要素组合,其中,每一案情要素组合包括两个案情要素;针对每一案情要素组合,在该案情要素组合对应的案件文档中,确定该案情要素组合对应的案情要素关系,并基于语义分析判断该案情要素组合对应的案件文档中是否存在目标时间节点,其中,目标时间节点为上述案情要素关系的发生时间;若是,则表明案件文档中存在案情要素关系的发生时间,此时直接提取该发生时间,并将该发生时间作为目标时间节点即可;若否,则表明案件文档中不存在该案情要素关系的发生时间,需要通过其他途径获取上述发生时间;本方案通过在剩余案件文档中确定该案情要素关系所在位置,并于上述所在位置的周围段落对案情要素关系对应的时间节点进行搜索,并实时记录当前搜索次数,其中,周围段落为预设段落数量内的段落,例如,所在位置为段落4,预设段落数量为3,则周围段落为段落1至段落7;判断当前搜索次数是否大于预设搜索次数阈值,若是,则停止搜索并进行报错,若否,则继续搜索直至得到目标时间节点;基于目标时间节点对案情要素关系进行优化,得到目标案情要素关系;基于目标案情要素关系、案情要素得到案情图谱。
在本申请实施例中,针对每一案件文档,将案件文档中的案情要素和案情要素关系提取出来;通过判断案件文档中是否存在目标时间节点,来确定案件文档中每一案情要素关系对应的发生时间后,再根据案情要素、案情要素关系和案情要素关系对应的目标时间节点,可以更加准确地得到案件文档对应的案情图谱,相较于案情要素关系的发生时间被忽视所得到的案情图谱精准度更高。
本申请实施例的一种可能的实现方式,每一案情图谱对应唯一案件标识,步骤S104,根据第一关联案情图谱、第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到搜索词对应的包括案件关联网络的案件图谱,具体可以包括:
针对每一第一关联案情图谱,确定第一关联案情图谱与每一第二关联案情图谱之间的案件关系;
基于全部案件标识和全部案件关系,得到案件图谱。
确定第一关联案情图谱与每一第二关联案情图谱之间的案件关系,具体可以包括:确定第一管理案情图谱与每一第二关联案情图谱之间的相似信息,其中,相似信息为案情要素或案情要素关系;针对每一第二关联案情图谱,判断该第二关联案情图谱对应的相似信息是否为案情要素;若是,则确定案件关系为存在相同案情要素;若否,则确定案件关系为存在相同案情要素关系;将案件关系作为图谱的要素关系、将案件标识作为图谱的要素,以得到案件图谱。
在本申请实施例中,针对每一管理案情图谱,确定第一关联案情图谱和每一第二关联案情图谱之间的案件关系后,以案件标识作为图谱要素、案件关系作为图谱要素关系,得到案件图谱。
本申请实施例的一种可能的实现方式,基于全部案件标识和全部案件关系,得到案件图谱,具体可以包括:
确定每一案件标识对应的时间段;
基于全部案件标识、全部案件标识各自对应的时间段和全部案件关系,确定案件图谱。
具体的,确定每一案件标识对应案件的开始时间与结案时间,并将开始时间与结案时间之间的时间,作为该案件标识对应的时间段;确定上述全部案件关系各自对应的案件标识组,其中,案件标识组包括两个案件标识;针对每一案件标识组,利用上述两个案件标识各自对应的时间段,对该案件标识组对应的案件关系进行优化,得到目标案件关系;将目标案件关系作为图谱的要素关系、将案件标识作为图谱的要素,以得到案件图谱。
在本申请实施例中,当不同案件发生的时间段不同时,上述不同案件之间可能存在不同的案件关系,故,本方案在确定每一案件标识对应的时间段后,再基于全部案件标识、全部案件标识各自对应的时间段和全部案件关系,可以得到更加准确的案件图谱。
上述实施例从方法流程的角度介绍一种案件图谱生成方法,下述实施例从虚拟模块或者虚拟单元的角度介绍了一种案件图谱生成装置,具体详见下述实施例。
本申请实施例提供一种案件图谱生成装置,如图3所示,该案件图谱生成装置,具体可以包括:
第一获取模块201,用于获取搜索词对应的多个案情图谱,其中,每一案情图谱包括多个案情要素和多个案情要素关系;
第一确定模块202,用于在多个案情图谱中,将包括相同的案情要素的案情图谱,作为第一关联案情图谱;
第二确定模块203,用于确定第一关联案情图谱对应的第二关联案情图谱集,其中,第二关联案情图谱集包括至少一个第二关联案情图谱,且,第二关联案情图谱与对应的第一关联案情图谱存在至少一个相同的案情信息;
生成模块204,用于根据第一关联案情图谱、第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到搜索词对应的包括案件关联网络的案件图谱。
本申请实施例的一种可能的实现方式,案件图谱生成装置,还包括:
第二获取模块,用于确定有效数据源,并基于有效数据源获取案件文档;
相应的,第一获取模块201,在执行获取搜索词对应的多个案情图谱时,用于:
对案件文档进行案情分析,得到多个案情图谱。
本申请实施例的一种可能的实现方式,第一获取模块201,在执行对案件文档进行案情分析,得到多个案情图谱时,用于:
针对每一案件文档,提取案件文档对应的案情要素和案情要素对应的至少一个案情要素关系;
针对每一案情要素关系,判断案件文档中是否存在目标时间节点,其中,目标时间节点为案情要素关系的发生时间;
若否,则基于剩余案件文档获取目标时间节点;
根据案情要素、案情要素关系和案情要素关系对应的目标时间节点,得到案件文档对应的案情图谱。
本申请实施例的一种可能的实现方式,每一案情图谱对应唯一案件标识,生成模块204,在执行根据第一关联案情图谱、第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到搜索词对应的包括案件关联网络的案件图谱时,用于:
针对每一第一关联案情图谱,确定第一关联案情图谱与每一第二关联案情图谱之间的案件关系;
基于全部案件标识和全部案件关系,得到案件图谱。
本申请实施例的一种可能的实现方式,生成模块204,在执行基于全部案件标识和全部案件关系,得到案件图谱时,用于:
确定每一案件标识对应的时间段;
基于全部案件标识、全部案件标识各自对应的时间段和全部案件关系,确定案件图谱。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的一种案件图谱生成装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例中提供了一种电子设备,如图4所示,图4所示的电子设备包括:处理器301和存储器303。其中,处理器301和存储器303相连,如通过总线302相连。可选地,电子设备还可以包括收发器304。需要说明的是,实际应用中收发器304不限于一个,该电子设备的结构并不构成对本申请实施例的限定。
处理器301可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线302可包括一通路,在上述组件之间传送信息。总线302可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一型的总线。
存储器303可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器303用于存储执行本申请方案的应用程序代码,并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。还可以为服务器等。图4示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。与相关技术相比,本申请实施例获取搜索词对应的多个案情图谱,以确定可能为用户提供案情思路的案情图谱;在多个可能能够为用户提供案情思路的案情图谱中,将包括相同的案情要素的案情图谱,作为第一关联案情图谱,以初步确定存在主要关联的案件对应的案情图谱;确定第一关联案情图谱对应的第二关联案情图谱集,以确定存在次要关联的案件对应的案情图谱;基于存在主要关联的案件和存在次要关联的案件各自对应的案情图谱,可以得到能够表征用户所需案件之间的关系的案件图谱。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种案件图谱生成方法,其特征在于,包括:
获取搜索词对应的多个案情图谱,其中,每一所述案情图谱包括多个案情要素和多个案情要素关系;
在所述多个案情图谱中,将包括相同的所述案情要素的所述案情图谱,作为第一关联案情图谱;
确定所述第一关联案情图谱对应的第二关联案情图谱集,其中,所述第二关联案情图谱集包括至少一个第二关联案情图谱,且,所述第二关联案情图谱与对应的第一关联案情图谱存在至少一个相同的案情信息;
根据所述第一关联案情图谱、所述第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到所述搜索词对应的包括案件关联网络的案件图谱。
2.根据权利要求1所述的案件图谱生成方法,其特征在于,在所述获取搜索词对应的多个案情图谱之前,还包括:
确定有效数据源,并基于所述有效数据源获取案件文档;
相应的,所述获取搜索词对应的多个案情图谱,包括:
对所述案件文档进行案情分析,得到所述多个案情图谱。
3.根据权利要求2所述的案件图谱生成方法,其特征在于,所述对所述案件文档进行案情分析,得到所述多个案情图谱,包括:
针对每一所述案件文档,提取所述案件文档对应的案情要素和所述案情要素对应的至少一个案情要素关系;
针对每一所述案情要素关系,判断所述案件文档中是否存在目标时间节点,其中,所述目标时间节点为所述案情要素关系的发生时间;
若否,则基于所述剩余案件文档获取所述目标时间节点;
根据所述案情要素、所述案情要素关系和所述案情要素关系对应的所述目标时间节点,得到所述案件文档对应的所述案情图谱。
4.根据权利要求1所述的案件图谱生成方法,其特征在于,每一所述案情图谱对应唯一案件标识,
所述根据所述第一关联案情图谱、所述第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到所述搜索词对应的包括案件关联网络的案件图谱,包括:
针对每一所述第一关联案情图谱,确定所述第一关联案情图谱与每一所述第二关联案情图谱之间的案件关系;
基于全部所述案件标识和全部所述案件关系,得到所述案件图谱。
5.根据权利要求4所述的案件图谱生成方法,其特征在于,所述基于全部所述案件标识和全部所述案件关系,得到所述案件图谱,包括:
确定每一所述案件标识对应的时间段;
基于全部所述案件标识、全部所述案件标识各自对应的时间段和全部所述案件关系,确定所述案件图谱。
6.一种案件图谱生成装置,其特征在于,包括:
第一获取模块,用于获取搜索词对应的多个案情图谱,其中,每一所述案情图谱包括多个案情要素和多个案情要素关系;
第一确定模块,用于在所述多个案情图谱中,将包括相同的所述案情要素的所述案情图谱,作为第一关联案情图谱;
第二确定模块,用于确定所述第一关联案情图谱对应的第二关联案情图谱集,其中,所述第二关联案情图谱集包括至少一个第二关联案情图谱,且,所述第二关联案情图谱与对应的第一关联案情图谱存在至少一个相同的案情信息;
生成模块,用于根据所述第一关联案情图谱、所述第一关联案情图谱对应的第二关联案情图谱集,进行案件关联网络分析,得到所述搜索词对应的包括案件关联网络的案件图谱。
7.根据权利要求6所述的案件图谱生成装置,其特征在于,所述案件图谱生成装置,还包括:
第二获取模块,用于确定有效数据源,并基于所述有效数据源获取案件文档;
相应的,所述第一获取模块,在执行获取搜索词对应的多个案情图谱时,用于:
对所述案件文档进行案情分析,得到所述多个案情图谱。
8.根据权利要求6所述的案件图谱生成装置,其特征在于,所述第一获取模块,在执行对所述案件文档进行案情分析,得到所述多个案情图谱时,用于:
针对每一所述案件文档,提取所述案件文档对应的案情要素和所述案情要素对应的至少一个案情要素关系;
针对每一所述案情要素关系,判断所述案件文档中是否存在目标时间节点,其中,所述目标时间节点为所述案情要素关系的发生时间;
若否,则基于所述剩余案件文档获取所述目标时间节点;
根据所述案情要素、所述案情要素关系和所述案情要素关系对应的所述目标时间节点,得到所述案件文档对应的所述案情图谱。
9.一种电子设备,其特征在于,包括:
至少一个处理器;
存储器;
至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行权利要求1~5任一项所述的案件图谱生成装置方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令所述计算机执行权利要求1~5任一项所述的案件图谱生成装置方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410021051.6A CN117851608B (zh) | 2024-01-06 | 2024-01-06 | 案件图谱生成方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410021051.6A CN117851608B (zh) | 2024-01-06 | 2024-01-06 | 案件图谱生成方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117851608A true CN117851608A (zh) | 2024-04-09 |
CN117851608B CN117851608B (zh) | 2024-07-05 |
Family
ID=90539854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410021051.6A Active CN117851608B (zh) | 2024-01-06 | 2024-01-06 | 案件图谱生成方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117851608B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148701A (zh) * | 2020-09-23 | 2020-12-29 | 平安直通咨询有限公司上海分公司 | 一种文件检索的方法及设备 |
US20220121695A1 (en) * | 2020-01-08 | 2022-04-21 | Ping An Technology (Shenzhen) Co., Ltd. | Knowledge graph-based case retrieval method, device and equipment, and storage medium |
WO2022083093A1 (zh) * | 2020-10-23 | 2022-04-28 | 平安科技(深圳)有限公司 | 图谱中的概率计算方法、装置、计算机设备及存储介质 |
CN114547257A (zh) * | 2022-04-25 | 2022-05-27 | 湖南工商大学 | 类案匹配方法、装置、计算机设备及存储介质 |
CN114547383A (zh) * | 2022-02-24 | 2022-05-27 | 恒安嘉新(北京)科技股份公司 | 一种案件串并图谱的生成方法、装置、设备及介质 |
CN116484828A (zh) * | 2022-12-30 | 2023-07-25 | 中国政法大学 | 相似案情确定方法、装置、设备、介质和程序产品 |
-
2024
- 2024-01-06 CN CN202410021051.6A patent/CN117851608B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220121695A1 (en) * | 2020-01-08 | 2022-04-21 | Ping An Technology (Shenzhen) Co., Ltd. | Knowledge graph-based case retrieval method, device and equipment, and storage medium |
CN112148701A (zh) * | 2020-09-23 | 2020-12-29 | 平安直通咨询有限公司上海分公司 | 一种文件检索的方法及设备 |
WO2022083093A1 (zh) * | 2020-10-23 | 2022-04-28 | 平安科技(深圳)有限公司 | 图谱中的概率计算方法、装置、计算机设备及存储介质 |
CN114547383A (zh) * | 2022-02-24 | 2022-05-27 | 恒安嘉新(北京)科技股份公司 | 一种案件串并图谱的生成方法、装置、设备及介质 |
CN114547257A (zh) * | 2022-04-25 | 2022-05-27 | 湖南工商大学 | 类案匹配方法、装置、计算机设备及存储介质 |
CN116484828A (zh) * | 2022-12-30 | 2023-07-25 | 中国政法大学 | 相似案情确定方法、装置、设备、介质和程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN117851608B (zh) | 2024-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111898643B (zh) | 一种语义匹配方法及装置 | |
CN109345417B (zh) | 基于身份认证的业务人员的在线考核方法及终端设备 | |
CN110275965B (zh) | 假新闻检测方法、电子装置及计算机可读存储介质 | |
CN110196834A (zh) | 一种用于数据项、文件、数据库的对标方法和系统 | |
CN114116973A (zh) | 多文档的文本查重方法、电子设备及存储介质 | |
CN110008345A (zh) | 平台服务商行业数据聚合分析方法、装置、介质和设备 | |
CN110618999A (zh) | 数据的查询方法及装置、计算机存储介质、电子设备 | |
CN110287338B (zh) | 行业热点确定方法、装置、设备和介质 | |
CN116361552A (zh) | 校园图书检索方法、装置、设备及可读存储介质 | |
CN114662772A (zh) | 交通噪音预警方法、模型训练方法、装置、设备及介质 | |
CN110895587B (zh) | 用于确定目标用户的方法和装置 | |
CN117851608B (zh) | 案件图谱生成方法、装置、设备和介质 | |
CN116797156A (zh) | 一种审查方法、装置、设备及存储介质 | |
CN115080552A (zh) | 数据质量评价方法、装置、设备和计算机可读存储介质 | |
CN111859985B (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
JP6060039B2 (ja) | 特定地点名称判定装置、特定地点名称判定方法、及び特定地点名称判定プログラム | |
CN106528577B (zh) | 一种设置待清理文件的方法和装置 | |
CN114492413B (zh) | 文本校对方法、装置和电子设备 | |
CN114817929B (zh) | 物联网漏洞动态追踪和处理方法、装置、电子设备及介质 | |
CN110674363B (zh) | 接口服务之间的相似匹配方法、装置及电子设备 | |
CN108763363B (zh) | 一种检验待写入记录的方法及装置 | |
CN114610683A (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN117311641A (zh) | 多形式数据储存的智能交互系统、方法、电子设备及介质 | |
CN116578617A (zh) | 基于数据分析的企业数字化服务方法、装置、设备和介质 | |
CN114580396A (zh) | 一种确定请求事件发生地址的方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |