CN110688495B - 一种事件信息的知识图谱模型构建方法、装置、存储介质 - Google Patents
一种事件信息的知识图谱模型构建方法、装置、存储介质 Download PDFInfo
- Publication number
- CN110688495B CN110688495B CN201911247703.3A CN201911247703A CN110688495B CN 110688495 B CN110688495 B CN 110688495B CN 201911247703 A CN201911247703 A CN 201911247703A CN 110688495 B CN110688495 B CN 110688495B
- Authority
- CN
- China
- Prior art keywords
- entity
- event
- special
- knowledge graph
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种事件信息的知识图谱模型构建方法、装置、存储介质,将公共安全业务处理流程中的突发警情事件、案事件等特殊事件描述为一种在公共安全业务领域知识图谱中具备“事件编号、开始时间、结束时间、事发地点、事件内容”等多方面属性数据的特殊事件“实体”对象,在处理流程中按需将这类特殊事件进行归档处理时,将每类特殊事件“实体”对象与其他人、事、地、物、组织等“实体”对象一起存储在图数据库中,构造公共安全业务领域知识图谱。本发明依据特殊事件的业务特性为“实体”对象建立与之相关的业务类别静态标签,通过对历史数据或实时数据的关联数据碰撞运算建立特殊事件“实体”对象与其他关联“实体”对象之间的“关系”。
Description
技术领域
本发明涉及但不限于知识图谱领域,更具体地说,涉及一种事件信息的知识图谱模型构建方法、装置、存储介质。
背景技术
知识图谱最初是由谷歌提出用来优化搜索引擎的技术,在不断发展中外延也一度扩大。盘点目前知识图谱的发展,其已经助力了很多热门的人工智能场景的应用,例如语音助手、聊天机器人、智能问答等。
从使用的范围来讲,知识图谱分为通用知识图谱和领域知识图谱,其中,通用知识图谱主要应用于面向互联网的搜索、推荐、问答等业务场景;通用知识图谱强调的是广度,数据也多来自于互联网,很难形成完整的全局性的针对本体层的统一管理。而在越来越多的垂直领域中,知识图谱也被广泛应用,已经成为了基础数据服务,为上层智能应用提供基础设施支撑。
领域知识图谱通常需要依靠特定行业的数据来构建,具有特定的行业意义。领域知识图谱中,实体的属性与数据模式往往比较丰富,需要考虑到不同的业务场景与使用人员。
中国专利“CN109918452一种数据处理的方法、装置、计算机存储介质及终端”针对公共安全领域数据和业务特点,设计了一种基于“实体-关系-事件”的数据模型,该发明中通过引入事件数据,解决通用知识图谱用于公共安全业务场景的重边问题,且利用事件数据计算和挖掘出更多潜在的关系,提升公共安全知识图谱的分析效率。但该发明中公开的技术方案,针对领域知识图谱对实体时序性属性的建模还存在缺失,其将事件(event)设计为在图数据库中存储的“实体、关系”之外的第三类对象,将事件设计为存储在使用(Key-Value)为核心的NoSQL数据库中,并通过基于NoSQL数据库建立事件的二级索引来满足对事件对象的检索需求。然而,在公共安全业务中实际包含2类事件数据:一种是由各类采集设备实时采集捕获的海量动态时序性事件数据、一种是在公共安全业务处理流程中按需归档处理的静态特殊事件(突发警情事件、案事件)数据。
该发明公开的技术方案由于只考虑了动态时序性事件数据的处理办法,而没有考虑按需归档处理的静态特殊事件数据的处理,而后者恰恰是突发警情事件分析和案事件分析中最常见的业务需求。这样一来,在需要进行大规模“实体-关系-事件”关联计算的应用场景时,特别是在只需要对静态特殊事件进行关联计算的应用场景时,由于“实体-关系-事件”的数据模型分别涉及存储“实体-关系”数据的图数据库和存储“事件”数据的NoSQL数据库,将不得不在图数据库查询与NoSQL数据库关联查询计算中来回切换,并需要对特殊事件数据进行重复实时碰撞运算,严重影响“实体-关系-事件”的知识图谱分析效率。
发明内容
本发明要解决的技术问题在于,针对现有技术只考虑了动态时序性事件数据的处理办法,严重影响“实体-关系-事件”的知识图谱分析效率,提供一种考虑静态特殊归档事件数据的处理,从而完成特殊事件在知识领域图谱中的实体建模。
本发明解决其技术问题所采用的技术方案是:构造一种事件信息的知识图谱模型构建方法,包括以下步骤:
获取公共安全业务数据,并建立领域知识图谱图数据库;其中,将所述公共安全业务数据中包括的事件信息按特性,建立在领域知识图谱中表示的“实体”模型;
基于建立的“实体”模型,在对特殊事件进行归档业务处理时,针对每一项特殊事件,创建“实体”对象,并进一步做存储;
针对已创建的“实体”对象,进行数据碰撞分析,其中,通过时空碰撞积分规则模型,在通过该模型得到的积分值超出预设的积分阈值,且当前分析到的对应特殊事件“实体”对象与其他“实体”对象之间存在关联时,在领域知识图谱图数据库中建立特殊事件“实体”对象与相关“实体”对象的“关系”;
通过为公共安全业务处理流程中的特殊事件建立知识图谱模型,通过将这些特殊事件视为“实体”,完成特殊事件在领域知识图谱中的实体建模,通过在图数据库中建立的“实体-关系-事件”的数据模型,避免了在图数据库中与NoSQL数据库进行关联查询计算的来回切换,有效的提高了“实体-关系-事件”的知识图谱分析效率。
进一步的,在将每一项特殊事件的“实体”对象存储到图数据库时,基于特殊事件的业务特性,对每一个“实体”对象进行静态业务标签的设置。
基于每项特殊事件的业务特性为对应特殊事件“实体”对象打上业务类别静态标签,进一步考虑在进行按需归档处理的静态特殊事件的处理,且由于静态特殊事件时突发警情事件分析和案事件分析中最常见的业务需求,进一步为后续的聚类统计分析做下预先的准备工作。
进一步的,在创建完成特殊事件“实体”对象后,针对每一个特殊事件“实体”对象所包括的事件编号、开始时间、结束时间、事发地点和事件内容信息,定义其属性值,并存储在当前创建的实体对象中。
通过将特殊事件相关的“事件编号、开始时间、结束时间、事发地点和事件内容信息”信息设置为“实体”的属性,从而利于特殊事件在领域知识图谱中的实体建模。
进一步的,在进行数据碰撞分析时,基于相关时空数据碰撞技战法的特征评估模型对数据碰撞结果进行评分,一旦得分超出预设阈值,则在领域知识图谱数据库中为相关的特殊事件“实体”建立连接到其他相关“实体”对象之间的各类特殊“边”,从而建立了特殊事件“实体”与其他相关“实体”对象之间的“关系”。
通过定期执行的历史数据、实时数据碰撞分析任务,发现、建立特殊事件“实体”与其他人、事、地、物、组织等“实体”对象之间的“关系”,从而定期扩展、更新、丰富领域知识图谱的内容,进一步为后续各种基于领域知识图谱的业务智能技战法算法模型的开发奠定基础。
进一步的,所述数据碰撞分析包括串并案碰撞分析、案事件重点人关联碰撞分析、案事件时空关联碰撞分析。
本发明公开的一种事件信息的知识图谱模型构建装置,包括以下模块:
模型建立模块,用于获取公共安全业务数据,并建立领域知识图谱图数据库;其中,将所述公共安全业务数据中包括的事件信息按特性,建立在领域知识图谱中表示的“实体”模型;
对象创建模块,用于基于建立的“实体”模型,在对特殊事件进行归档业务处理时,针对每一项特殊事件,创建“实体”对象,并进一步做存储;
关联分析模块,用于针对已创建的“实体”对象,进行数据碰撞分析,其中,通过时空碰撞积分规则模型,在通过该模型得到的积分值超出预设的积分阈值,且当前分析到的对应特殊事件的“实体”对象与其他“实体”对象之间存在关联时,在领域知识图谱图数据库中建立“实体”对象与相关“实体”对象的关联。
进一步的,所述对象创建模块中还包括静态业务标签设置模块;所述静态业务标签设置模块用于在将每一项特殊事件的“实体”对象存储到图数据库时,对每一个“实体”对象进行静态业务标签的设置。
进一步的,所述对象创建模块中还包括属性设置模块;所述属性设置模块用于在创建完成“实体”对象后,针对每一个“实体”对象所包括的事件编号、开始时间、结束时间、事发地点和事件内容,定义其属性值,并存储在当前创建的实体对象中。
进一步的,所述关联分析模块中还包括特殊“边”建立模块;所述特殊“边”建立模块用于在进行数据碰撞分析时,基于积分阈值,且根据每个“实体”对象的属性值,进行关联性分析,在领域知识图谱数据库中为对应特殊事件“实体”建立连接到相关的实体对象之间的各类特殊“边”,从而建立了特殊事件“实体”与其他相关的实体对象之间的“关系”。
本发明公开的一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器加载并执行时,实现如上述知识图谱模型构建方法中的执行步骤。
在本发明所述的一种事件信息的知识图谱模型构建方法、装置、存储介质中,将公共安全业务处理流程中的突发警情事件、案事件等特殊事件描述为一种在公共安全业务领域知识图谱中具备“事件编号、开始时间、结束时间、事发地点、事件内容”等多方面属性数据的特殊事件“实体”对象,在处理流程中按需将这类特殊事件进行归档处理时,将每类特殊事件“实体”对象与其他人、事、地、物、组织等“实体”对象一起存储在图数据库中,构造公共安全业务领域知识图谱。
实施本发明的一种事件信息的知识图谱模型构建方法、装置、存储介质,具有以下有益效果:
1、通过将公共安全业务中产生的特殊事件视为一项单独的“实体”对象,建立特殊事件在领域知识图谱中的实体数据模型,并通过数据碰撞分析得到实体对象与关联对象之间的联系,在领域知识图谱数据库中建立“实体-关系-事件”的数据模型,避免了在图数据库中与NoSQL数据库进行关联查询计算的来回切换,有效的提高了“实体-关系-事件”的知识图谱分析效率;
2、通过对不同的特殊事件“实体”对象设置业务类别静态标签,有效的在进行突发警情事件分析和案事件分析过程中,筛选出静态特殊事件数据,提高后续执行聚类分析统计分析的效率;
3、通过执行历史数据、实时数据碰撞分析,发现、建立特殊事件“实体”与其他人、事、地、物、组织等“实体”对象之间的关系,从而定期扩展、更新、丰富领域知识图谱的内容,为后续各种基于领域知识图谱的业务智能技战算法模型的开发奠定基础。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明公开的一种事件信息的知识图谱模型构建方法的执行步骤;
图2是本发明公开的一种事件信息的知识图谱模型构建装置的系统结构图;
图3是利用本发明公开的方法或装置构建的知识图谱示例图;
图4是吸毒贩毒判别技战法的积分评估模型示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是处于描述特定实施例的目的,而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其他情况,否则单数形式地“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用地术语“和/或”是指相关联列出的项中的一个或者多个的任何组合以及所有可能组合,并且包括这些组合。
本申请主要用于数据处理装置,该数据处理装置可以是传统数据处理装置、大型存储系统、台式电脑、笔记本电脑、平板电脑、掌上电脑、智能收集、便携式数字播放器、智能手表以及智能手环等,本申请对此不做限制。
需要说明的是,本申请中涉及到的领域知识图谱图数据库,是以“图”这种数据结构存储和查询数据,它的数据模型主要是以基于知识图谱构建的节点,以及节点与节点之间的边来表现存储数据之间的关联关系,相比于传统的关系数据库的优点是可以快速解决复杂的关系问题,例如社会网络中人与人之间的关系,类似于QQ、微信等建立的社交网络空间。
领域知识图谱图数据库中所包括的节点包括实体定义,边即代表了实体关系的定义,在建立所述领域知识图谱图数据库后,基于数据碰撞分析,通过建立“实体-关系-事件”实体模型,进一步构建出一个“实体”对象的关系网络。
需要说明的是,实体是知识图谱中的最基本元素,不同的实体间存在不同的实体关系,实体表示具有可区别性且独立存在的某种事物,世界万物由具体事物组成,如某一个人、某一个城市、某一种植物等、某一种商品等等,在此指代的是实体。实体关系指的是两个实体之间的联系。实体含有属性,例如“面积、人口、首都”等,本发明中所指的实体属性指的是实体所包括的“事件编号、开始时间、结束时间、事发地点、事件内容”等信息。属性值指的是,实体所含有的属性所指向的实际内容,例如实体“突发警情事件”的属性“开始时间”指向属性值“2019年12月1日”。
举例来说,如图3所示的知识图谱,图中的圆圈均分别代表一个实体,举例来说实体“张三”,张三含有属性居住地、手机号码和所属工作组织,而张三的属性为居住地的属性值为“武汉市武昌区梅苑小区1栋1单元101”,属性为手机号码的属性值为“185****05”,属性为所属工作组织的属性值为“武汉市***公司”。
请参考图1,其为本发明公开的一种事件信息的知识图谱模型构建方法的执行步骤,整个执行过程主要分为以下几项步骤:
首先,建立领域知识图谱图数据库;具体的:为公共安全业务建立领域知识图谱图数据库,将业务中包括的人、事、地、物、组织、案事件、案战法分别按其特性建立在领域知识图谱中表示的“实体”模型;
其次,在进行事件归档处理时,在图数据库中创建事件实体,并填充事件属性数据;其中,依据业务特性设置事件的静态业务标签,进一步更新领域知识图谱图数据库中存储的事件数据;具体的:基于建立的“实体”模型,在进行突发警情事件、案事件等特殊事件的归档业务处理流程时,除了完成业务处理流程中的规定动作外,同步在图数据库中,针对每一项特殊事件,创建“实体”对象,并将“事件编号、开始时间、结束时间、事发地点、事件内容”等信息作为“实体”对象的属性,定义每一个“实体”对象的属性值,并将其存储在图数据库中的特殊事件“实体”对象中;其中:
由于突发警情事件、案事件等特殊事件在公共安全业务中具有其独特的业务特性(如:交通违法事件、侵财类案件、伤人刑事案件等),在将这类特殊事件“实体”存储到图数据库时,可同步为其设置相关的静态业务标签(如:闯红灯、偷盗、抢劫等),为后续的聚类分析、统计业务做支撑;
在每一次发生突发警情事件、案事件等特殊事件,进行事件归档业务处理时,重复上述几项步骤,更新领域知识图谱图数据库中的数据。
其次,在事件归档处理完成后,定期执行历史/实时数据碰撞任务,进一步发现、建立事件实体于其他人、事、地、物、组织等实体之间的关系模型;具体的:在执行数据碰撞任务时,包括进行串并案碰撞分析、案事件重点人关系碰撞分析、案事件时空关联碰撞分析时,通过设定的时空碰撞积分规则模型;一旦发现超出积分阈值且与某些特殊事件相关的嫌疑人或受害人、关联案事件、案发地、嫌疑证物、嫌疑群体性组织,则在领域知识图谱数据库中为这些特殊事件“实体”建立连接到相关的人、事、地、物、组织等实体对象之间的各类特殊“边”,进一步建立了特殊事件“实体”与其他人、事、地、物、组织等“实体”之间的“关系”;其中:
基于当前建立的“实体”对象与对象之间的“关系”,特别是将特殊事件也作为一种“实体”在领域知识图谱图数据库中建模,进一步将领域知识图谱图数据库中存储的“实体”模型转变为“实体-关系-事件”的数据模型,在进行重复实时碰撞运算时,仅需在领域知识图谱图数据库中进行关联查询计算,提高了“实体-关系-事件”的知识图谱分析效率。
最后,重复上述步骤,对建立的领域知识图谱图数据库中存储的内容进行定期的更新。
本发明公开的一种事件信息的知识图谱模型构建方法,考虑了在按需归档处理的静态特殊事件数据的处理,进一步满足了突发警情事件、案事件分析的特殊事件业务需求,在进行大规模“实体-关系-事件”关联计算时,在进行静态特殊事件处理的时候,通过为特殊实体对象设置静态业务标签,在对其进行关联计算时,直接在图数据库中进行关联查询计算,进一步实现了对特殊事件数据的重复实时碰撞运算,进一步提高了“实体-关系-事件”的知识图谱分析效率;通过对历史数据或实时数据进行关联数据碰撞运算,发现并建立了这些特殊事件“实体”对象与其他人、事、地、物、组织等“实体”对象之间的关系。
请参考图2,其为本发明公开的一种事件信息的知识图谱模型构建装置,该装置具体包括以下模块:
模型建立模块L1用于获取公共安全业务数据,并建立领域知识图谱图数据库;其中,将所述公共安全业务数据中包括的事件信息按特性,建立在领域知识图谱中表示的“实体”模型;
对象创建模块L2用于基于建立的“实体”模型,在对特殊事件进行归档业务处理时,针对每一项特殊事件,创建“实体”对象,并进一步做存储;其中:
该模块中还包括静态业务标签设置模块L21和属性设置模块L22;
所述静态业务标签设置模块L21用于在将每一项特殊事件的“实体”对象存储到图数据库时,基于特殊事件的业务特性,对每一个“实体”对象进行静态业务标签的设置;
所述属性设置模块L22用于在创建完成“实体”对象后,针对每一个“实体”对象所包括的事件编号、开始时间、结束时间、事发地点和事件内容,定义其属性值,并存储在当前创建的实体对象中。
关联分析模块L3用于针对已创建的“实体”对象,进行数据碰撞分析,其中,通过时空碰撞积分规则模型,在通过该模型得到的积分值超出预设的积分阈值,且当前分析到的对应特殊事件的“实体”对象与其他“实体”对象之间存在关联时,在领域知识图谱图数据库中建立“实体”对象与相关“实体”对象的关联;其中,所述关联分析模块L3中还包括特殊“边”建立模块L31;
所述特殊“边”建立模块L31用于在进行数据碰撞分析时,基于积分阈值,且根据每个“实体”对象的属性值,进行关联性分析,在领域知识图谱数据库中为对应特殊事件“实体”建立连接到相关的实体对象之间的各类特殊“边”,从而建立了特殊事件“实体”与其他相关的实体对象之间的“关系”。
本发明公开的一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器加载并执行时,实现上述的知识图谱模型构建方法,进一步完成对特殊事件数据的实时碰撞运算,发现并建立这些实体对象与其他人、事、物、地、组织等实体对象之间的关系,在图数据库中建立了“实体-关系-事件”模型,在进行实时碰撞运算时,有效的提高知识图谱的分析效率。
当前所述存储介质可以是数据处理装置的内部存储单元,例如数据处理装置的硬盘或内存。计算机可读存储介质也可以是数据处理装置的外部存储设备,例如数据处理装置上配置的插接式硬盘,智能存储卡、安全数据卡、闪存卡等。进一步的,所述存储介质还可以即包括数据处理装置的内部存储的那元也包括外部存储设备。所述存储介质可用于存储计算机程序以及数据处理装置所需的其他程序和数据。所述存储介质还可以用于占时存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本发明中所公开的实施例描述的各示例的功能模块以及处理步骤,其能够以电子硬件、计算机软件或者二者的结合来实现,为了更清楚的说明硬件和软件的可互换性,在上述说明中已经按照功能一般性的描述了各功能模块的组成及处理步骤,这些功能究竟以硬件还是软件方式来实现,取决于技术方案的特定应用和设计约束条件,专业技术人员可以对每个特定的应用来使用不同的知识图谱构建方法来实现所描述的处理步骤或功能,但这种实现不应认为超出本申请的范围。
请参考图3,该图中,圆圈代表“实体”,所属“实体”为包括:人、地、事、物、组织、案事件等类型的“实体”;有箭头的连接线代表“实体”与“实体”的对应连接关系导向,其中,关系是有方向的,而有的“关系”是单向的,有的“关系”是双向的;实线“关系”表示从数据中直接提取出来的显性“关系”;虚线“关系”表示从时空数据碰撞中推导出来的隐性“关系”。
每一个“实体”具备其对应的“属性”,如归档事件“实体”在存储时,实际也存储了“事件编号、开始事件、结束事件、事发地点、事件内容”等多方面的属性数据,上述所有的数据均会存储在“图数据库”中;
当前在建立完成这个图数据库之后,后续在进行技战法、聚类分析算法、统计分析算法时,均可以基于当前构建的领域知识图谱来进行查询运算;
图中带“?”号的关系,是相关技战法推导出来的“疑似”关系;例如张三与重点人王五之间为推导出来的“疑似”同谋关系,李四与张三之间为推导出来的“疑似”合伙人关系;
从图中可知,由于张三与王五近期均存在多次乘坐同一趟火车的行为(其为显性行为关系),当前通过时空碰撞事件分析,推导出两者之间可能某种隐性的关联关系;在通过时空碰撞事件分析,得出张三与李四之间由于存在多次通话的隐性关系,且他们都与同一家公司相关,一个是这家公司的客户,一个是这家公司的职工,当前可推导出两者之间也可能存在某种隐性的关联关系;在当前发生一项策划诈骗案件,且王五为该案件的主导人,通过前述的分析结果,进一步判断得到两种情况,张三可能也参与到当前的诈骗案件,其也是嫌疑人之一;或者张三只是碰巧在乘车过程中,遇到的王五,他们之间只是单纯的同行关系,张三并没有参与到诈骗案件;如李四与王五为夫妻,那么通过前述的推导过程,进一步可以将李四列入合伙人的推测结果。
请参考图4,其为吸毒贩毒判别技战法的积分评估模型示意图,下面以一个简化的吸毒贩毒判别技战法的时空碰撞积分评估模型(公式(1))为例,对本发明的有益效果进行具体说明:
其中,公式(1)中的xi代表某个具体特征规则的评分值(此例中共有如表1所示的5个规则(x1~x5),下表中与频次相关的规则也有其预设阈值,简单起见这里不做具体描述,可以简单理解为在这些特征规则的识别算法中,会对相关的时空数据进行碰撞运算,如果统计结果超出预设频次阈值,则认为满足该特征规则,当前的频次阈值,可以按照实际的需求进行灵活设置);wi代表具体特征规则对应的评分权重值;z为实际评分值。
本实施例中通过将上述所有的特征规则进行组合,进一步整体表现该吸毒贩毒判别技战法z的实际评分,考察每个待分析主体人的标签类别(本实施例中将标签类别分别设定为疑似贩毒者、普通人、吸毒人员,这3种类别),该模型下基于积分阈值,进行主体人的标签类别判断规则如下:
1、若z<25,则判定分析主体人“实体”标签为“普通人”;
2、若25≤z≤65,则判定分析主体人“实体”标签为“吸毒人员”;
3、若z>65,则判定分析主体人“实体”标签为“疑似贩毒者”。
现假设在前述的领域知识图谱图数据库中,已经存储了3个较有代表性的武汉本地人(张三、李四和王五)“实体”数据,以及张三、李四、王五的基础社交关系网络,在对图4分析之后,可知:
当前知道除了李四的父母在云南昆明定居外,张三、王五都没有亲属在云南暂住(特征规则x3的判断依据)。在对张三、王五相关联的“强制戒毒”案事件,进行多次归档处理后,假定当多次强制戒毒复吸超过3次,则触发特征规则x4(具体可参见表1),当前其实已基本可确定张三、王五均为吸毒人员。
通过业务数据时空碰撞,发现张三、李四都曾多次坐飞机前往云南,但张三返程时很少坐飞机,这符合疑似贩毒者的行为特征(说明特征规则x1、x2相组合非常具有代表性),而李四因为有亲属在云南暂住,且经常乘坐飞机从云南返程,李四的行为特征比较符合正常人的行为模式;
另外,通过业务数据时空碰撞,还发现已知“吸毒人员”王五多次与同为“吸毒人员”且无亲属关系和业务往来的张三通话,且在1年内10次与张三在同一时空出现,并且张三在1年内与其他具有“吸毒人员”标签人员在同一时空出现的频次共计110次,这也说明张三有重大“疑似贩毒者”嫌疑,也进一步确定了王五是“吸毒人员”的事实。
一般在这个时候,通过对“疑似贩毒者”张三及相关“吸毒人员”进行实时布控,一旦成功布控且当场抓获其贩毒现场交易,则会更新领域知识图谱图数据库中存储的数据,将张三、王五与相关的归档事件“实体”建立关联“关系”。
表1
可见在图数据库中,基于将一种具备“事件编号、开始时间、结束时间、事发地点、事件内容”等多方面属性数据的特殊事件“实体”对象,可以通过历史数据和时空碰撞事件分析,进一步发现、建立相关实体对象之间的隐性“关系”,通过当前构建的领域知识图谱有效的进行推理和查询运行,提高“实体-关系-事件”的知识图谱分析效率。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (10)
1.一种事件信息的知识图谱模型构建方法,其特征在于,包括以下步骤:
获取公共安全业务数据,并建立领域知识图谱图数据库;其中,将所述公共安全业务数据中包括的事件信息按特性,建立在领域知识图谱中表示的“实体”模型;
基于建立的“实体”模型,在对特殊事件进行归档业务处理时,针对每一项特殊事件,创建“实体”对象,并进一步做存储;其中,对每一个已创建的“实体”对象,进行静态业务标签的设置;
针对已创建的“实体”对象,进行数据碰撞分析,其中,通过时空碰撞积分规则模型,在通过该模型得到的积分值超出预设的积分阈值,且当前分析到的对应特殊事件的“实体”对象与其他“实体”对象之间存在关联时,在领域知识图谱图数据库中建立“实体”对象与相关“实体”对象的“关系”;
基于当前建立的实体对象与对象之间的关系,进一步将领域知识图谱图数据库中存储的“实体”模型转变为“实体-关系-事件”的数据模型,在进行重复实时碰撞运算时,仅需在领域知识图谱图数据库中进行关联查询计算,提高了“实体-关系-事件”的知识图谱分析效率。
2.根据权利要求1所述的知识图谱模型构建方法,其特征在于,在将每一项特殊事件的“实体”对象存储到领域知识图谱图数据库时,基于特殊事件的业务特性,对每一个“实体”对象进行静态业务标签的设置。
3.根据权利要求1所述的知识图谱模型构建方法,其特征在于,在创建完成“实体”对象后,确定每一个“实体”对象所包括的事件编号、开始时间、结束时间、事发地点和事件内容信息,定义其属性值,并存储在当前创建的实体对象中。
4.根据权利要求3所述的知识图谱模型构建方法,其特征在于,在进行数据碰撞分析时,基于积分阈值,且根据每个“实体”对象的属性值,进行关联性分析,在领域知识图谱数据库中为对应特殊事件“实体”建立连接到相关的实体对象之间的各类特殊“边”,从而建立了特殊事件“实体”与其他相关的实体对象之间的“关系”。
5.根据权利要求4所述的知识图谱模型构建方法,其特征在于,所述数据碰撞分析包括串并案碰撞分析、案事件重点人关联碰撞分析、案事件时空关联碰撞分析。
6.一种事件信息的知识图谱模型构建装置,其特征在于,包括以下模块:
模型建立模块,用于获取公共安全业务数据,并建立领域知识图谱图数据库;其中,将所述公共安全业务数据中包括的事件信息按特性,建立在领域知识图谱中表示的“实体”模型;
对象创建模块,用于基于建立的“实体”模型,在对特殊事件进行归档业务处理时,针对每一项特殊事件,创建“实体”对象,并进一步做存储;
关联分析模块,用于针对已创建的“实体”对象,进行数据碰撞分析,其中,通过时空碰撞积分规则模型,在通过该模型得到的积分值超出预设的积分阈值,且当前分析到的对应特殊事件的“实体”对象与其他“实体”对象之间存在关联时,在领域知识图谱图数据库中建立“实体”对象与相关“实体”对象的关联。
7.根据权利要求6所述的知识图谱模型构建装置,其特征在于,所述对象创建模块中还包括静态业务标签设置模块;所述静态业务标签设置模块用于在将每一项特殊事件的“实体”对象存储到图数据库时,基于特殊事件的业务特性,对每一个“实体”对象进行静态业务标签的设置。
8.根据权利要求6所述的知识图谱模型构建装置,其特征在于,所述对象创建模块中还包括属性设置模块;所述属性设置模块用于在创建完成“实体”对象后,针对每一个“实体”对象所包括的事件编号、开始时间、结束时间、事发地点和事件内容,定义其属性值,并存储在当前创建的实体对象中。
9.根据权利要求8所述的知识图谱模型构建装置,其特征在于,所述关联分析模块中还包括特殊“边”建立模块;所述特殊“边”建立模块用于在进行数据碰撞分析时,基于积分阈值,且根据每个“实体”对象的属性值,进行关联性分析,在领域知识图谱数据库中为对应特殊事件“实体”建立连接到相关的实体对象之间的各类特殊“边”,从而建立了特殊事件“实体”与其他相关的实体对象之间的“关系”。
10.一种存储介质,其特征在于,所述存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器加载并执行时,实现如上权利要求1-5任一项所述的知识图谱模型构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911247703.3A CN110688495B (zh) | 2019-12-09 | 2019-12-09 | 一种事件信息的知识图谱模型构建方法、装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911247703.3A CN110688495B (zh) | 2019-12-09 | 2019-12-09 | 一种事件信息的知识图谱模型构建方法、装置、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110688495A CN110688495A (zh) | 2020-01-14 |
CN110688495B true CN110688495B (zh) | 2020-04-24 |
Family
ID=69117731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911247703.3A Active CN110688495B (zh) | 2019-12-09 | 2019-12-09 | 一种事件信息的知识图谱模型构建方法、装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110688495B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460080B (zh) * | 2020-03-25 | 2022-04-22 | 中国人民解放军国防科技大学 | 用于开源数据热度分析的事件图谱构建与查询方法及系统 |
CN111582488A (zh) * | 2020-04-23 | 2020-08-25 | 傲林科技有限公司 | 一种事件推演方法及装置 |
CN111523003A (zh) * | 2020-04-27 | 2020-08-11 | 北京图特摩斯科技有限公司 | 一种以时序动态图谱为核心的数据应用方法及平台 |
CN111522967B (zh) * | 2020-04-27 | 2023-09-15 | 北京百度网讯科技有限公司 | 知识图谱构建方法、装置、设备以及存储介质 |
CN111475602B (zh) * | 2020-06-23 | 2020-10-16 | 成都数联铭品科技有限公司 | 多版本知识图谱的存储方法、装置、存储介质及电子设备 |
CN111782710B (zh) * | 2020-06-30 | 2023-07-25 | 北京百度网讯科技有限公司 | 数据存储方法、装置、计算设备和介质 |
CN111930860A (zh) * | 2020-08-14 | 2020-11-13 | 广州大学 | 多维数据关联与分析方法、装置、存储介质和计算机设备 |
CN111966870A (zh) * | 2020-08-14 | 2020-11-20 | 深圳市万物云科技有限公司 | 一种基于图数据库的社区关系实时构建方法及其相关组件 |
CN112231488A (zh) * | 2020-09-22 | 2021-01-15 | 京东城市(北京)数字科技有限公司 | 数据处理的方法、装置、设备及计算机可读存储介质 |
CN112507036A (zh) * | 2020-11-30 | 2021-03-16 | 武汉烽火众智数字技术有限责任公司 | 一种知识图谱可视化分析方法 |
CN112445889A (zh) * | 2020-11-30 | 2021-03-05 | 杭州海康威视数字技术股份有限公司 | 存储数据、检索数据的方法及相关设备 |
CN112559762A (zh) * | 2020-12-09 | 2021-03-26 | 中电科新型智慧城市研究院有限公司 | 一种公共安全知识图谱构建方法、装置及可读存储介质 |
CN112446823B (zh) * | 2021-02-01 | 2021-04-27 | 武汉中科通达高新技术股份有限公司 | 监控图像展示方法和装置 |
CN113268492B (zh) * | 2021-04-09 | 2022-06-14 | 厦门攸信信息技术有限公司 | 一种基于时空知识图谱的风险溯源方法、系统及装置 |
CN115510196A (zh) * | 2021-06-07 | 2022-12-23 | 马上消费金融股份有限公司 | 知识图谱的构建方法、问答方法、装置和存储介质 |
CN115563287B (zh) * | 2022-12-02 | 2023-03-17 | 中科雨辰科技有限公司 | 一种获取关联对象的数据处理系统 |
CN115905291B (zh) * | 2022-12-12 | 2024-02-23 | 广州南方智能技术有限公司 | 基于图的数据处理方法、装置及存储介质 |
CN117235289B (zh) * | 2023-11-16 | 2024-02-27 | 国网浙江省电力有限公司 | 一种面向场景化决策需求的领域图谱模型的处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897273A (zh) * | 2017-04-12 | 2017-06-27 | 福州大学 | 一种基于知识图谱的网络安全动态预警方法 |
CN109919194A (zh) * | 2019-01-31 | 2019-06-21 | 北京明略软件系统有限公司 | 一种事件中人物身份识别方法、系统、终端和存储介质 |
CN110472226A (zh) * | 2019-07-03 | 2019-11-19 | 五邑大学 | 一种基于知识图谱的网络安全态势预测方法及装置 |
CN110489520A (zh) * | 2019-07-08 | 2019-11-22 | 平安科技(深圳)有限公司 | 基于知识图谱的事件处理方法、装置、设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10423614B2 (en) * | 2016-11-08 | 2019-09-24 | International Business Machines Corporation | Determining the significance of an event in the context of a natural language query |
US20190188332A1 (en) * | 2017-12-15 | 2019-06-20 | Mito.AI AS | System of dynamic knowledge graph based on probabalistic cardinalities for timestamped event streams |
-
2019
- 2019-12-09 CN CN201911247703.3A patent/CN110688495B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897273A (zh) * | 2017-04-12 | 2017-06-27 | 福州大学 | 一种基于知识图谱的网络安全动态预警方法 |
CN109919194A (zh) * | 2019-01-31 | 2019-06-21 | 北京明略软件系统有限公司 | 一种事件中人物身份识别方法、系统、终端和存储介质 |
CN110472226A (zh) * | 2019-07-03 | 2019-11-19 | 五邑大学 | 一种基于知识图谱的网络安全态势预测方法及装置 |
CN110489520A (zh) * | 2019-07-08 | 2019-11-22 | 平安科技(深圳)有限公司 | 基于知识图谱的事件处理方法、装置、设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
Predicting the co-evolution of event and Knowledge Graphs;Cristobal Esteban等;《2016 19th International Conference on Information Fusion》;20160708;第1-8页 * |
知识图谱的发展与构建;李涛等;《南京理工大学学报》;20170309;第41卷(第1期);第22-34页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110688495A (zh) | 2020-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110688495B (zh) | 一种事件信息的知识图谱模型构建方法、装置、存储介质 | |
US9760642B2 (en) | System and method of reduction of irrelevant information during search | |
CN111241305A (zh) | 数据处理方法和装置、电子设备及计算机可读存储介质 | |
CN109189867A (zh) | 基于公司知识图谱的关系发现方法、装置及存储介质 | |
CN111427968A (zh) | 一种基于知识图谱的重点人员全息档案构建方法及装置 | |
CN111787090A (zh) | 一种基于区块链技术的智慧法治平台 | |
CN111026874A (zh) | 知识图谱的数据处理方法及服务器 | |
CN111930868A (zh) | 一种基于多维数据采集的大数据行为轨迹分析方法 | |
US9344518B2 (en) | Facilitation of social interactions | |
CN112487208B (zh) | 一种网络安全数据关联分析方法、装置、设备及存储介质 | |
CN110457505A (zh) | 基于图数据库进行关系挖掘的方法和装置 | |
CN110888930A (zh) | 基于知识图谱的金融知识查询服务接口设计与实现方法 | |
Ding et al. | Massive heterogeneous sensor data management in the Internet of Things | |
CN109800251A (zh) | 一种关系发现方法和装置、计算机可读存储介质 | |
CN112925899B (zh) | 排序模型建立方法、案件线索推荐方法、装置及介质 | |
CN109710628A (zh) | 信息处理方法及装置、系统、计算机及可读存储介质 | |
CN103810248A (zh) | 基于照片查找人际关系的方法和装置 | |
CN109753541A (zh) | 一种关系网络构建方法和装置、计算机可读存储介质 | |
CN109829821A (zh) | 一种数字资产地址转移异常的处理方法、装置及系统 | |
WO2021114615A1 (zh) | 行为风险识别的可视化方法、装置、设备及存储介质 | |
CN111385143A (zh) | 一种警务情报云平台 | |
CN116662342A (zh) | 一种基于知识图谱的异构数据融合索引系统及装置 | |
Krishnamoorthy et al. | Representing and managing the context of a situation | |
CN116028467A (zh) | 智能服务大数据建模方法、系统、存储介质及计算机设备 | |
CN111414364B (zh) | 用户信息生成方法、装置、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |