CN116776984B - 一种基于知识图谱的灾害链推理预测方法及系统 - Google Patents
一种基于知识图谱的灾害链推理预测方法及系统 Download PDFInfo
- Publication number
- CN116776984B CN116776984B CN202310841633.4A CN202310841633A CN116776984B CN 116776984 B CN116776984 B CN 116776984B CN 202310841633 A CN202310841633 A CN 202310841633A CN 116776984 B CN116776984 B CN 116776984B
- Authority
- CN
- China
- Prior art keywords
- disaster
- event
- node
- entity
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 230000004927 fusion Effects 0.000 claims abstract description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 27
- 238000005065 mining Methods 0.000 claims abstract description 27
- 230000008878 coupling Effects 0.000 claims abstract description 18
- 238000010168 coupling process Methods 0.000 claims abstract description 18
- 238000005859 coupling reaction Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims description 56
- 239000003607 modifier Substances 0.000 claims description 25
- 238000010276 construction Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 240000006053 Garcinia mangostana Species 0.000 description 28
- 235000017048 Garcinia mangostana Nutrition 0.000 description 28
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 19
- 238000011161 development Methods 0.000 description 11
- 230000018109 developmental process Effects 0.000 description 11
- 235000004936 Bromus mango Nutrition 0.000 description 9
- 241001093152 Mangifera Species 0.000 description 9
- 235000014826 Mangifera indica Nutrition 0.000 description 9
- 235000009184 Spondias indica Nutrition 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 238000009825 accumulation Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000004576 sand Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于知识图谱的灾害链推理预测方法及系统,方法包括:构建灾害事件知识图谱的本体模型;通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;将融合后的实体信息存储至图数据库并基于本体模型,构建灾害事件知识图谱;将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱;根据灾害链知识图谱,构建灾害链知识图谱对应的贝叶斯网络模型;根据贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定待预测事件节点处于目标状态的概率。旨在挖掘灾害事件的完整链路,以及对链路中的事件节点的状态进行概率预测。
Description
技术领域
本发明涉及自然灾害技术领域,尤其涉及一种基于知识图谱的灾害链推理预测方法及系统。
背景技术
相较于单一灾害事件,灾害链事件往往具有更高的不确定性,其演化和发展难以预测与控制。随着大数据技术的不断发展,暴雨灾害相关数据,如专家经验知识、历史案例资料、相关统计数据以及实时现场信息等,快速增长。通过对这些数据进行提取与分析,可以有效表达暴雨灾害链中灾害与灾害间的关联关系、灾害事件的属性信息如灾害发生的时间、地点以及强度等信息,获取暴雨灾害相关领域知识,为暴雨灾害链的表达提供了新的思路。
对于灾害链的挖掘与分析,现有研究主要集中在案例分析、复杂网络建模、知识图谱构建三方面。前两种方法都较为依赖大量先验知识和专家经验,且一定程度上简化了灾害链模型,不够客观、全面;现有自然灾害领域知识图谱研究多侧重于利用本体模型或知识图谱实现知识的形式化表达、多源异构数据的整合以及规则语义推理,较少从灾害链的角度出发探究灾害事件的演化过程,难以实现灾害链中各次生灾害以及灾情影响进行的风险预测。
发明内容
有鉴于此,本发明提供一种基于知识图谱的灾害链推理预测方法及系统。旨在挖掘灾害事件的完整链路关系,以及对链路关系中的事件节点的状态进行概率预测。
本发明实施例提供了一种基于知识图谱的灾害链推理预测方法,所述方法包括:
构建灾害事件知识图谱的本体模型:G=(Event(Con,Rel,Prop,Ins)),其中,Event表示一次暴雨灾害事件过程,Con表示概念,Rel表示关系,Prop表示属性,Ins表示具体实例;
通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;
将融合后的实体信息存储至图数据库并基于所述本体模型,构建灾害事件知识图谱;
将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱;
根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型;
根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率。
可选地,所述构建灾害事件知识图谱的本体模型,包括:
根据自然灾害和受影响的承灾体,确定灾害事件的概念层;
根据概念与概念间、概念与实例间以及实例与实例间的语义关系,确定灾害事件的关系层;
根据自然灾害和受影响的承灾体的属性信息,确定灾害事件的属性层;
根据所述概念层、所述关系层、所述属性层和具体实例,构建灾害事件知识图谱的本体模型G=(Event(Con,Rel,Prop,Ins))。
可选地,所述通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合,包括:
根据构建的触发词语料库,确定文本数据中的有效单句;
通过依存句法分析,标注所述有效单句中的各个词语,以及所述各个词语的序号、词性和依存关系;
计算所述各个词语分别与所述有效单句中的核心动词之间的综合语义距离和语义评分;
在词语为所述有效单句中的非触发词的情况下,将该词语的综合语义距离确定为自身的语义评分;
根据词语在所述有效单句中的位置、词性和语义评分,提取动词之前区域范围内和之后区域范围内符合第一词性要求,且语义评分最低的词语作为三元组的主体实体词和客体实体词,以及,提取符合第二词性要求,且语义评分最低的词语作为时空实体词;
根据提取的实体词,将句法树中符合词性要求的所述提取的实体词下属子节点确定为所述提取的实体词的修饰词;
将提取的所述主体实体词、所述客体实体词和对应动词按照预设语义关系存储为实体三元组,以及,将实体词的修饰词存储为程度属性,以及将时空实体词和自身的修饰词标准化为实体的时空属性;
对时间、地点以及名称属性相同的实体词进行去重操作,以及,在多个实体词的时空属性相同,名称不同的情况下,对所述多个实体词进行中文分词,计算各自的TF-IDF值以将所述多个实体词进行向量化,通过聚类算法对进行向量化的所述多个实体词进行聚类融合。
可选地,所述将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱,包括:
根据所述灾害事件知识图谱的本体模型,确定多个灾害事件知识图谱中各个事件节点所属于的概念层;
将所述多个灾害事件知识图谱中在概念层相同的事件节点进行合并并删除重复边处理,获得所述灾害事件的灾害链知识图谱。
可选地,所述将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱,包括:
通过聚类算法,对多个灾害事件知识图谱中的各个事件节点进行聚类;
将经过聚类的所述多个灾害事件知识图谱中相同的事件节点进行合并并删除重复边处理,获得所述灾害事件的灾害链知识图谱。
可选地,所述根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型,包括:
将所述灾害链知识图谱中的事件节点集合映射为贝叶斯网络中的节点集合;
基于所述灾害链知识图谱中的事件节点属性确定贝叶斯网络中各个节点的条件概率信息;
将所述灾害链知识图谱中的事件节点之间的关系映射为贝叶斯网络的有向边集合;
根据确定的所述贝叶斯网络中的节点集合、所述贝叶斯网络中各个节点的条件概率信息和所述贝叶斯网络的有向边集合,构建与所述灾害链知识图谱对应的贝叶斯网络模型。
可选地,所述基于所述灾害链知识图谱中的事件节点属性确定贝叶斯网络中各个节点的条件概率信息,包括:
根据所述灾害链知识图谱中的事件节点属性,获取对应的历史灾害数据;
根据所述历史灾害数据,确定所述事件节点属性的条件概率信息;
将所述条件概率信息确定为贝叶斯网络中对应节点的条件概率信息。
可选地,所述根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率,包括:
根据待预测事件节点,确定所述待预测事件节点的父节点;
根据所述待预测事件节点的父节点,获取所述待预测事件节点的父节点中状态已知的父节点;
根据所述状态已知的父节点和所述贝叶斯网络模型,确定所述待预测事件节点处于目标状态的概率。
本发明第二方面提供一种基于知识图谱的灾害链推理预测系统,所述系统包括:
本体模型构建模块,用于构建灾害事件知识图谱的本体模型:G=(Event(Con,Rel,Prop,Ins)),其中,Event表示一次暴雨灾害事件过程,Con表示概念,Rel表示关系,Prop表示属性,Ins表示具体实例;
实体信息提取与知识融合模块,用于通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;
知识图谱构建模块,用于将融合后的实体信息存储至图数据库并基于所述本体模型,构建灾害事件知识图谱;
灾害链挖掘模块,用于将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱;
贝叶斯网络模型构建模块,用于根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型;
灾害事件预测模块,用于根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率。
针对在先技术,本发明具备如下优点:
本发明实施例提供的一种基于知识图谱的灾害链推理预测方法。首先构建灾害事件知识图谱的本体模型:G=(Event(Con,Rel,Prop,Ins));通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;将融合后的实体信息存储至图数据库并基于所述本体模型,构建灾害事件知识图谱;根据构建的灾害事件知识图谱的本体模型,通过本体模型中事件节点的概念层将多个灾害事件知识图谱进行耦合,从而挖掘到灾害事件的完整灾害链发展路径,以此构建灾害事件的灾害链知识图谱;根据挖掘到的灾害链知识图谱,构建与灾害链知识图谱对应的贝叶斯网络模型;将灾害链知识图谱任意一个事件节点确定为待预测事件节点,在该待预测事件节点的父节点的状态已知的情况下,通过构建的贝叶斯网络模型进行求解可以确定该待预测事件节点达到用户关注的目标状态的概率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种基于知识图谱的灾害链推理预测方法的流程图;
图2为本发明实施例提供的一种基于知识图谱的灾害链推理预测方法中知识图谱构建的示意图;
图3为本发明实施例提供的一种基于知识图谱的灾害链推理预测方法中知识图谱耦合的示意图;
图4为本发明实施例提供的一种基于知识图谱的灾害链推理预测方法中待预测事件节点处于目标状态的概率预测的示意图;
图5为本发明实施例提供的一种基于知识图谱的灾害链推理预测方法中暴雨灾害事件的概念层的示意图;
图6为本发明实施例提供的一种基于知识图谱的灾害链推理预测方法中本体模型的示意图;
图7为本发明实施例提供的一种基于知识图谱的灾害链推理预测系统的示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。
图1为本发明实施例提供的一种基于知识图谱的灾害链推理预测方法的流程图,如图1所示,该方法包括:
步骤S101:构建灾害事件知识图谱的本体模型:G=(Event(Con,Rel,Prop,Ins)),其中,Event表示一次暴雨灾害事件过程,Con表示概念,Rel表示关系,Prop表示属性,Ins表示具体实例;
步骤S102:通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;
步骤S103:将融合后的实体信息存储至图数据库并基于所述本体模型,构建灾害事件知识图谱;
步骤S104:将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱;
步骤S105:根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型;
步骤S106:根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率。
在本发明的实施例中,本发明预先构建灾害事件知识图谱的本体模型,本体模型是一种对概念及关系进行形式化规范说明的可共享的概念框架,在自然灾害领域多运用于信息的集成和规则的推理。各种主要灾害事件具有明显的链式反应特点,发生的主要灾害事件中,该主要灾害事件作为直接或间接因素往往易引发一系列次生或衍生灾害,并造成事故发生和严重灾情,如暴雨灾害、台风灾害等主要灾害事件。因此,本发明不同于以往侧重于概念间关系的以静态实体为核心的知识图谱(如通过三元组侧重于描绘某一次暴雨灾害实体与雨量、地点、时间、灾情信息等实体之间的语义关联),本发明构建的是侧重于描绘演变历程的以动态事件为核心的暴雨灾害链知识图谱(如通过“导致”关系描绘整个暴雨灾害事件的发展,包括其自身的属性特点外,还能展示其下一演化事件(崩滑流)的属性特点,从而得到表征动态事件的灾害事件知识图谱)。由此本发明首先创建一个灾害事件知识图谱的本体模型,定义形式为:G=(Event(Con,Rel,Prop,Ins))。其中,Event表示一次暴雨灾害事件过程,包括多个灾害事件,如暴雨灾害事件引发内涝、滑坡,造成房屋倒塌,引起人员伤亡的整个过程,该暴雨灾害事件过程包含了暴雨、内涝、滑坡、房屋倒塌、人员伤亡共5个灾害事件;每个暴雨灾害事件过程均包括自身的Con、Rel、Prop、Ins属性;Con表示对应灾害事件过程中灾害事件的概念,是一系列具有相同特征的事物的总称,如在一个灾害事件过程中包括水浸灾害事件,则该水浸灾害事件的概念Con为内涝概念;Rel表示关系,用于表示对应暴雨灾害事件过程中灾害事件之间的关联关系,如在一次暴雨灾害事件过程中包括强降雨灾害事件和内涝灾害事件,该强降雨灾害事件的下一个节点为内涝灾害事件,则该内涝灾害与该强降雨灾害事件的关系Rel为导致;Prop表示灾害事件的属性,通过多组属性表征概念的性质和固有特性;Ins表示具体实例,也就是对应暴雨灾害事件过程中灾害事件对应的具体实例,如对应于5月2日发生在A地的强降雨灾害事件。为便于后续描述和理解,后续均以暴雨这一主要灾害事件进行描述,如基于暴雨这一主要灾害事件进行灾害链知识图谱挖掘,基于暴雨灾害链知识图谱构建对应的贝叶斯网络模型,并基于挖掘的灾害链知识图谱构建对应的贝叶斯网络模型,以对挖掘的灾害链知识图谱中的事件节点处于目标状态的概率进行预测。应当理解的是本发明同样可以适用基于台风等主要灾害事件进行灾害链知识图谱的挖掘,并基于台风灾害链知识图谱构建对应的贝叶斯网络模型,以及基于挖掘的灾害链知识图谱构建对应的贝叶斯网络模型,以对挖掘的灾害链知识图谱中的事件节点处于目标状态的概率进行预测。
在本发明的实施例中,在预先构建好灾害事件知识图谱的本体模型后,如预先构建好暴雨灾害事件知识图谱的本体模型后,通过对与暴雨灾害事件相关的文本数据进行依存句法分析,提取出其中的暴雨灾害事件实体信息,通过K-means聚类算法将相同含义的实体信息进行知识融合,将融合后的实体信息存储至Neo4j图数据库中,图数据库将基于存储至其中的融合后的实体信息和本体模型构建出该文本数据对应的一个具体暴雨灾害事件的知识图谱。如图2所示,图2示出了构建的一个暴雨灾害事件的知识图谱示例。
在本发明的实施例中,对于暴雨灾害事件、台风灾害事件等这些主要灾害事件具有明显的链式反应特点,一次暴雨灾害事件中,暴雨作为直接或间接因素往往易引发一系列次生或衍生灾害的发生,并造成事故发生和严重灾情。因此,本发明通过与上述相同的实施方式,可以基于多个与暴雨灾害事件相关的文本数据构建多个暴雨灾害事件的知识图谱。在构建好多个暴雨灾害事件的知识图谱后,通过将构建好的多个暴雨灾害事件的知识图谱进行耦合,从而挖掘到对于暴雨灾害事件所可能导致的整个灾害发展链路关系。例如,暴雨灾害事件可能导致内涝、滑坡灾害等的发生,以及可能造成人员伤亡、道路堵塞等的发生,但一个具体的暴雨灾害事件导致所有可能的次生或衍生灾害发生的可能性较低,因此本发明通过将大量的暴雨灾害事件的知识图谱进行耦合,可以挖掘到完整的暴雨灾害事件所可能造成的所有次生或衍生灾害,也就是暴雨灾害事件所可能导致的整个灾害发展链路关系。
在本发明中,所述将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱,包括:根据所述灾害事件知识图谱的本体模型,确定多个灾害事件知识图谱中各个事件节点所属于的概念层;将所述多个灾害事件知识图谱中在概念层相同的事件节点进行合并并删除重复边处理,获得所述灾害事件的灾害链知识图谱。
在本发明的实施例中,步骤S104的一种实施方式为:由于在灾害事件的知识图谱中,在多个事件节点的名称存在不同的情况下,可能所属于的事件类型是相同的,为了能够将多个灾害事件的知识谱图中的这类事件节点进行耦合,也就是将属于相同事件类型的事件节点进行合并,并删除重复边的事件节点,以获得暴雨灾害事件所可能导致的整个次生和衍生灾害的发展链路关系。本发明基于事件节点的概念层对相同事件类型的事件节点进行合并。如在一个灾害事件的知识图谱中的一个水浸事件节点,以及在另一个灾害事件的知识图谱中的一个内涝事件节点,这两个事件节点虽然名称不同,但都属于概念层中的内涝灾害,因此可以对其进行合并。如图3所示,图3示出了两个灾害事件的知识图谱进行耦合的流程,以挖掘暴雨灾害事件的灾害链知识图谱,具体地:对于Ei大暴雨灾害事件过程对应的知识图谱和Ej降雨灾害事件过程对应的知识图谱,根据灾害事件知识图谱的本体模型中的概念层,确定Ei大暴雨灾害事件过程对应的知识图谱中的节点大暴雨和Ej降雨灾害事件过程对应的知识图谱中的节点降雨同属于暴雨灾害这一概念类,因此将两者合并为节点暴雨,删除重复的边;并且确定Ei大暴雨灾害事件过程对应的知识图谱中的事件节点滑坡和Ej降雨灾害事件过程对应的知识图谱中的事件节点滑坡同属于滑坡灾害这一概念类,因此将两者合并为事件节点滑坡,删除重复的边;并且确定对于Ei大暴雨灾害事件过程对应的知识图谱中的事件节点内涝和Ej降雨灾害事件过程对应的知识图谱中的事件节点水浸同属于内涝灾害这一概念类,因此将两者合并为事件节点内涝,并删除重复的边;并且确定对于Ei大暴雨灾害事件过程对应的知识图谱中的事件节点人员死亡和Ej降雨灾害事件过程对应的知识图谱中的事件节点人员死亡同属于受影响的承灾体人这一概念类,因此将两者合并为人员死亡,并删除重复的边,由此可以挖掘到暴雨灾害事件的灾害链知识图谱,如图3所示的Eij。应当理解是上述示例为了便于描述只是简单的将两个暴雨灾害事件的知识图谱进行合并,以挖掘暴雨灾害事件的灾害链知识图谱,而实际上可以将大量的暴雨灾害事件的知识图谱进行合并耦合,以挖掘到暴雨灾害事件所可能导致的整个次生和衍生灾害的发展链路关系。
在本发明的实施例中,如图2所示的暴雨灾害事件知识图谱,该暴雨灾害事件知识图谱对应的本体模型G=(Event(Con,Rel,Prop,Ins))中只包括一个暴雨灾害事件过程。在该暴雨灾害事件过程Event中,对于实例Ins包括滑坡节点对应的具体实例Ins1(如5月2日发生在A地的滑坡灾害事件)、水浸节点对应的具体实例Ins2、人员死亡节点对应的具体实例Ins3、农田受淹节点对应的具体实例Ins4、降雨节点对应的具体实例Ins5;在该暴雨灾害事件过程Event中,对于属性Prop包括滑坡节点对应的具体实例的相关属性信息Prop1(如5月2日发生在A地的滑坡灾害事件的严重程度为轻微等)、水浸节点对应的具体实例的相关属性信息Prop2、人员死亡节点对应的具体实例的相关属性信息Prop3、农田受淹节点对应的具体实例的相关属性信息Prop4、降雨节点对应的具体实例的相关属性信息Prop5;在该暴雨灾害事件过程Event中,对于关系Rel包括滑坡节点与上下关联节点之间的关系Rel1、水浸节点与上下关联节点之间的关系Rel2、人员死亡节点与上下关联节点之间的关系Rel3、农田淹没节点与上下关联节点之间的关系Rel4、降雨节点与上下关联节点之间的关系Rel5;在该暴雨灾害事件过程Event中,对于概念Con包括概念Con1表示滑坡节点的概念滑坡灾害、概念Con2表示水浸节点的概念内涝灾害、概念Con3表示人员死亡节点的概念受影响的承灾体人、概念Con4表示农田受淹节点的概念受影响的承灾体农林牧渔设施、概念Con5表示降雨节点的概念暴雨灾害。
在本发明的实施例中,如图3所示的暴雨灾害链知识图谱,挖掘该暴雨灾害链知识图谱所用到的本体模型G=(Event(Con,Rel,Prop,Ins))中将包括两个暴雨灾害事件过程,分别为暴雨灾害事件过程Ei和暴雨灾害事件过程Ej。在基于该本体模型进行灾害链知识图谱的挖掘过程中,该两个暴雨灾害事件过程各自对应的暴雨灾害事件知识图谱将进行耦合,从而得到暴雨灾害链知识图谱。在该暴雨灾害链知识图谱中将包括该两个暴雨灾害事件过程中所涉及的实例Ins、属性Prop、关系Rel和概念Con。其中,对于该暴雨灾害链知识图谱中的实例Ins包括合并后的滑坡节点中的实例Insi1(来自暴雨灾害事件过程Ei中的滑坡节点的实例)和实例Insj1(来自暴雨灾害事件过程Ej中的滑坡节点的实例)、合并后的内涝节点中的实例Insi2(来自暴雨灾害事件过程Ei中的内涝节点的实例)和实例Insj2(来自暴雨灾害事件过程Ej中的水浸节点的实例)、合并后的人员死亡节点中的实例Insi3(来自暴雨灾害事件过程Ei中的人员死亡节点的实例)和实例Insj3(来自暴雨灾害事件过程Ej中的人员死亡节点的实例)、农田受淹节点中的实例Insj4(来自暴雨灾害事件过程Ej中的农田受淹节点的实例)、交通堵塞节点中的实例Insi5(来自暴雨灾害事件过程Ei中的交通堵塞节点的实例)、房屋倒塌节点中的实例Insi6(来自暴雨灾害事件过程Ei中的房屋倒塌节点的实例)、合并后的暴雨节点中的实例Insi7(来自暴雨灾害事件过程Ei中的大暴雨节点的实例)和实例Insj7(来自暴雨灾害事件过程Ej中的降雨节点的实例)。
对于该暴雨灾害链知识图谱中的属性Prop包括合并后的滑坡节点的属性Propi1(来自暴雨灾害事件过程Ei中的滑坡节点的属性)和属性Propj1(来自暴雨灾害事件过程Ej中的滑坡节点的属性)、合并后的内涝节点中的属性Propi2(来自暴雨灾害事件过程Ei中的内涝节点的属性)和属性Propj2(来自暴雨灾害事件过程Ej中的水浸节点的属性)、合并后的人员死亡节点中的属性Propi3(来自暴雨灾害事件过程Ei中的人员死亡节点的属性)和属性Propj3(来自暴雨灾害事件过程Ej中的人员死亡节点的属性)、农田受淹节点中的属性Propj4(来自暴雨灾害事件过程Ej中的农田受淹节点的属性)、交通堵塞节点中的属性Propi5(来自暴雨灾害事件过程Ei中的交通堵塞节点的属性)、房屋倒塌节点中的属性Propi6(来自暴雨灾害事件过程Ei中的房屋倒塌节点的属性)、合并后的暴雨节点中的属性Propi7(来自暴雨灾害事件过程Ei中的大暴雨节点的属性)和属性Propj7(来自暴雨灾害事件过程Ej中的降雨节点的属性)。
对于该暴雨灾害链知识图谱中的关系Rel包括合并后的滑坡节点与上下节点之间的关系Relij1、合并后的内涝节点与上下节点之间的关系Relij2、合并后的人员死亡节点与上下节点之间的关系Relij3、农田受淹节点与上下节点之间的关系Relij4、交通堵塞节点与上下节点之间的关系Relij5、房屋倒塌节点与上下节点之间的关系Relij6、合并后的暴雨节点与上下节点之间的关系Relij7。由于一个节点与上下节点之间的关系是固定的,因此一个事件节点与上下节点只会存在相对应的一个关系,如暴雨节点与滑坡节点之间为暴雨导致滑坡的关系,而一个节点的属性和实例可能存在多个,如暴雨节点可以是发生在A地A时刻的级别为一级的暴雨节点和发生在B地B时刻的级别为二级的暴雨节点合并得到的一个暴雨节点,则该暴雨节点将存在两个实例和两个属性。因此,在暴雨灾害链知识图谱中,一个灾害事件节点与上下节点之间的关系是固定的,而一个灾害事件节点所包括的实例和属性均可以具有多个。
对于该暴雨灾害链知识图谱中的概念Con包括合并后的滑坡节点的概念Conij1、合并后的内涝节点的概念Conij2、合并后的人员死亡节点的概念Conij3、农田受淹节点的概念Conij4、交通堵塞节点的概念Conij5、房屋倒塌节点的概念Conij6、合并后的暴雨节点的概念Conij7。多个节点能进行合并时,表明进行合并的该多个节点的概念是相同的,因此在暴雨灾害链知识图谱中,一个灾害事件节点对应的概念只有一个。
在本发明的实施例中,在通过挖掘获得暴雨灾害事件的灾害链知识图谱后,为了能够对灾害链知识图谱中的待预测事件节点处于目标状态的概率进行预测,本发明基于挖掘获得的灾害链知识图谱构建对应的贝叶斯网络模型。通过构建的贝叶斯网络模型对待预测事件节点处于目标状态的概率进行预测。其中,所述待预测事件节点可以是挖掘获得的灾害链知识图谱中的任意一个事件节点,待预测事件节点的目标状态可根据实际应用场景进行确定,如在待预测事件节点为内涝灾害时,可以将淹没深度达到15cm作为待预测事件节点的目标状态,或将严重程度为中等作为待预测事件节点的目标状态,也就是基于该内涝灾害的当前实际所处于的场景和状态,预测该内涝灾害最终淹没深度达到15cm的概率,或预测该内涝灾害最终严重程度达到中等级别的概率。
在本发明中,所述将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱,包括:通过聚类算法,对多个灾害事件知识图谱中的各个事件节点进行聚类;将经过聚类的所述多个灾害事件知识图谱中相同的事件节点进行合并并删除重复边处理,获得所述灾害事件的灾害链知识图谱。
在本发明的实施例中,步骤S104的另一实施方式为:由于在灾害事件的知识图谱中,在多个事件节点的名称存在不同的情况下,可能所属于的事件类型是相同的,同时在同一个灾害事件知识图谱中不会存在多个事件节点属于相同的事件类型,因此为了能够将多个灾害事件的知识谱图中的这类事件节点进行耦合,也就是将属于相同事件类型的事件节点进行合并,并删除重复边的事件节点,以获得暴雨灾害事件所可能导致的整个次生和衍生灾害的发展链路关系。本发明通过聚类算法对将用于进行灾害链挖掘的多个灾害事件知识图谱进行聚类处理,对于属于同一事件类型的事件节点将被聚类为相同名称,然后再对经过聚类处理的多个灾害链知识图谱进行相同事件节点的合并,并对重复的边进行删除处理。如在一个灾害事件的知识图谱中的一个水浸事件节点,以及在另一个灾害事件的知识图谱中的一个内涝事件节点,这两个事件节点虽然名称不同,但都属于内涝灾害,因此在对该两个灾害事件知识图谱进行聚类处理后,该两个事件节点将会统一名称为内涝,从而可在后续进行相同名称事件节点的合并,并对重复的边进行删除处理,从而挖掘到灾害链知识图谱。
在本发明中,所述根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型,包括:将所述灾害链知识图谱中的事件节点集合映射为贝叶斯网络中的节点集合;基于所述灾害链知识图谱中的事件节点属性确定贝叶斯网络中各个节点的条件概率信息;将所述灾害链知识图谱中的事件节点之间的关系映射为贝叶斯网络的有向边集合;根据确定的所述贝叶斯网络中的节点集合、所述贝叶斯网络中各个节点的条件概率信息和所述贝叶斯网络的有向边集合,构建与所述灾害链知识图谱对应的贝叶斯网络模型。
在本发明的实施例中,本发明通过将挖掘的灾害链知识图谱构建对应的贝叶斯网络,以对灾害链知识图谱中的事件节点处于目标状态的概率进行预测。具体地,贝叶斯网络模型的组成结构包括节点集合,节点与节点之间关系构成的有向边集合,以及各个节点的条件概率信息。而本发明中挖掘到的以本体模型进行表示的灾害链知识图谱,其中包括各个事件节点,以及各个事件节点之间的关系。因此,本发明将灾害链知识图谱中的事件节点集合映射为贝叶斯网络中的节点集合,并将灾害链知识图谱中的事件节点之间的关系映射为贝叶斯网络中由节点与节点之间的关系组成的有向边集合。在映射好贝叶斯网络中的节点集合和有向边结合后,基于灾害链知识图谱中的事件节点属性确定贝叶斯网络中各个节点的条件概率信息。由此,在确定好对应的贝叶斯网络的中的节点集合、贝叶斯网络中各个节点的条件概率信息和贝叶斯网络的有向边集合,即可构建与灾害链知识图谱对应的贝叶斯网络模型。其中灾害链知识图谱对应的贝叶斯网络模型的表示为:E=(e,r,p)→BN=(N,R,P),其中,E为灾害事件合并后的灾害链,e为事件节点,r为事件节点间的关系,p为事件节点属性。BN为贝叶斯网络,N为贝叶斯网络节点集合,由事件节点e1,e2,…,en映射组成,R为有向边集合,由灾害事件合并后的灾害链的链路信息r映射组成;P为节点条件概率信息,通过获取的历史灾害数据中的事件节点属性p进行参数学习获得。
在本发明中,所述基于所述灾害链知识图谱中的事件节点属性确定贝叶斯网络中各个节点的条件概率信息,包括:根据所述灾害链知识图谱中的事件节点属性,获取对应的历史灾害数据;根据所述历史灾害数据,确定所述事件节点属性的条件概率信息;将所述条件概率信息确定为贝叶斯网络中对应节点的条件概率信息。
在本发明的实施例中,根据挖掘的灾害链知识图谱中的各个事件节点的属性,获取到对应的历史灾害数据,通过对获取到的历史灾害数据进行统计计算,可求解到挖掘的灾害链知识图谱中的各个事件节点的属性所对应的条件概率信息,将求解到的灾害链知识图谱中的各个事件节点的属性所对应的条件概率信息确定为贝叶斯网络中对应节点的条件概率信息。具体地,由于将灾害链知识图谱的事件节点集合映射为了贝叶斯网络中的节点集合,因此灾害链知识图谱中的每个事件节点在贝叶斯网络中具有相对应的节点,在求解到一个事件节点的属性所对应的条件概率信息后,即可将该条件概率信息确定为与该一个事件节点所对应的贝叶斯网络中的一个节点的条件概率信息。
应当理解是,由于灾害链知识图谱中一个事件节点可能由多个事件节点合并获得,因此该一个事件节点对于同一种属性信息可能有多个不同的具体属性值存在,因此对于不同的具体属性值,通过对历史灾害数据的统计计算,将求解到分别与该不同的具体属性值相对应的多个条件概率信息,此时针对贝叶斯网络中与该一个事件节点对应的节点同样也就具有多个条件概率信息。根据待预测事件节点的目标状态,对于贝叶斯网络中包括多个条件概率信息的一个节点,可以选择与该目标状态相对应的条件概率信息对待预测事件节点处于目标状态的概率预测。例如,在预测一个待预测的内涝灾害事件节点处于淹没深度为15cm的目标状态的概率时,在灾害链知识图谱中内涝事件节点对应的淹没深度属性包括10cm,15cm,20cm,则在求解该内涝事件节点的条件概率信息时,将求解到该三个淹没深度分别相对应的三个条件概率信息,此时贝叶斯网络模型中与该内涝事件节点对应的节点的条件概率信息也就将有三个条件概率信息,在通过贝叶斯网络模型对该待预测事件节点处于该目标状态的概率进行预测时,则选择淹没深度属性为15cm对应的条件概率信息对该待预测事件节点处于该目标状态的概率进行预测。
在本发明的实施例中,在完成灾害链知识图谱对应的贝叶斯网络模型构建后,确定当前需要进行状态预测的待预测事件节点以及所需要进行预测的目标状态,然后获取到该待预测灾害事件的父节点,根据父节点的已知状态,通过构建的贝叶斯网络模型对待预测事件节点处于目标状态的概率进行求解,以预测获得该待预测事件节点处于目标状态的概率。
在本发明中,所述根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率,包括:根据待预测事件节点,确定所述待预测事件节点的父节点;根据所述待预测事件节点的父节点,获取所述待预测事件节点的父节点中状态已知的父节点;根据所述状态已知的父节点和所述贝叶斯网络模型,确定所述待预测事件节点处于目标状态的概率。
在本发明的实施例中,对于不同类型的灾害事件对应的父节点不同,如对于内涝灾害,其父节点为暴雨,对于农田淹没,其父节点为内涝等,因此对于不同的灾害事件具有不同的父节点,本发明首先根据待预测事件节点在灾害链知识图谱中的位置,确定该待预测事件节点的父节点。根据确定的待预测事件节点的父节点,获取该待预测事件节点的父节点的已知状态。然后通过待预测事件节点的父节点的已知状态和贝叶斯网络模型对待预测事件节点处于目标状态的概率进行求解。示例地,在挖掘的暴雨灾害事件的灾害链知识图谱中,对于一个事件节点ey及其父节点集合ex={exi|i=1,2,…,n},在父节点状态已知,且构成证据集合的情况下,各父节点的状态可表示为集合SE={sEk|k=1,2,…,n},待预测事件节点ey的状态可表示为sPk,则此时ey处于状态sP2的概率可由如下公式(1)计算确定:
其中,k表示节点具有k种状态,sEk表示父节点的第k种状态,sPk为待预测节点的第k种状态;P(ey=sP2|ex1=sE1,ex2=sE2,...,exi=sEk,...,exn=sEn)表示已知父节点状态组合时,子节点ey处于sP2状态的条件概率;P(ey=sP2,ex1=sE1,ex2=sE2,...,exi=sEk,...,exn=sEn)为父节点的各个状态已知和子节点ey处于sP2状态的联合概率;P(ex1=sE1,ex2=sE2,...,exi=sEk,...,exn=sEn)为父节点的各个状态已知的联合概率。
在本发明的实施例中,EM算法(Expectation-Maximization algorithm最大期望算法)作为通过迭代进行极大似然估计的算法,常用于包含隐变量或缺失数据的概率模型进行参数估计。由于获取的历史灾害数据不可避免地包含缺失值,因此通过EM算法对历史数据进行参数学习将获得灾害链知识图谱的条件概率表,该条件概率表中将包括该灾害链知识图谱中各个事件节点在对应属性下的条件概率信息。在得到的条件概率的基础上,利用观测到的证据,也就是待预测事件父节点的已知状态,可以推理得到灾害链中各事件节点处于目标状态的发生概率。如图4所示暴雨(降雨强度Strength和降雨历时Duration)导致崩滑流Landslide发生的网络结构以及训练得到的条件概率表。在父节点Strength取s3状态和Duration取s2状态的条件下推理Landslide取s3的概率,由于证据已知,则此时上述公式(1)中的分母在本示例中为P(Strength=s3,Duration=s2)=1,此时P(Landslide=s3)=P(Landslide=s3,Strength=s3,Duration=s2)。同时通过贝叶斯网络的链式法则,联合概率分布P(Landslide,Strength,Duration)=P(Landslide|Strength,Duration)P(Strength)P(Duration)可以很容易由非根节点的条件概率以及根节点的边缘概率进行计算获得,如图4所示,P(Landslide=s3|Strength=s3,Duration=s2)的值为图中圈出的值0.372549,而此时基于观测得到的证据可知,P(Strength=s3)=1(已经发生,概率为1),P(Duration=s2)=1。
在本发明中,所述构建灾害事件知识图谱的本体模型,包括:根据自然灾害和受影响的承灾体,确定灾害事件的概念层;根据概念与概念间、概念与实例间以及实例与实例间的语义关系,确定灾害事件的关系层;
根据自然灾害和受影响的承灾体的属性信息,确定灾害事件的属性层;根据所述概念层、所述关系层、所述属性层和具体实例,构建灾害事件知识图谱的本体模型G=(Event(Con,Rel,Prop,Ins))。
在本发明的实施例中,灾害事件知识图谱的本体模型中的概念是对各种灾害和灾情影响进行抽象而形成的知识表达,是本体模型中的核心元素。因此,本发明首先确定灾害事件知识图谱的本体模型中的概念分类以及层级关系。本发明主要针对暴雨灾害事件,对于暴雨灾害事件的概念分为自然灾害和受影响的承灾体,根据自然灾害和受影响的承灾体确定灾害事件的概念层,该概念层中的自然灾害包括:洪涝灾害、台风灾害、暴雨灾害、大风灾害等13类,受影响的承灾体包括人、财产、房屋及构筑物、交通运输设施设备等9类,具体概念层所包括的自然灾害和受影响的承灾体如图5所示。
一次暴雨灾害事件往往会引发一系列连锁反应,在确定暴雨灾害事件中各类次生灾害和灾情影响的基础上,需要进一步识别其关联关系。因此,暴雨灾害事件知识图谱的本体模型中的关系包括概念与概念间、概念与实例间以及实例与实例间的语义关系,以清晰刻画暴雨灾害事件的发展与演化,如表1所示,表1示出了概念与概念间、概念与实例间以及实例与实例间的语义关系,具体为一个概念为另一个概念的子类,一个具体发生的灾害事件为一个概念的实例,一个事件导致另一个事件的发生或一个事件影响承灾体,一个事件伴随另一个事件发生。
在暴雨灾害事件中,掌握各种灾害和承灾体影响的时空信息和属性值有助于了解灾害事件的全貌和内在演化机理。因此,暴雨灾害事件知识图谱的本体模型中的属性包括专题属性如名称、类型、灾害或承灾体影响程度等,时空属性如开始和结束时间、所处地点。如表2所示,表2示出了事件的属性描述,包括专题属性中的名称编号、类型、类型标号、程度,包括时空属性中的开始时间、结束时间、地点。
在本发明的实施例中,通过暴雨灾害事件的核心概念确定、语义关系设计以及事件属性描述构建灾害事件知识图谱的本体模型G=(Event(Con,Rel,Prop,Ins)),自顶向下搭建暴雨灾害事件知识图谱的模型层,为实体数据层的映射奠定理论框架基础。暴雨灾害事件的本体模型的结构示意图如图6所示。
在本发明中,所述通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合,包括:根据构建的触发词语料库,确定文本数据中的有效单句;通过依存句法分析,标注所述有效单句中的各个词语,以及所述各个词语的序号、词性和依存关系;计算所述各个词语分别与所述有效单句中的核心动词之间的综合语义距离和语义评分;在词语为所述有效单句中的非触发词的情况下,将该词语的综合语义距离确定为自身的语义评分;根据词语在所述有效单句中的位置、词性和语义评分,提取动词之前区域范围内和之后区域范围内符合第一词性要求,且语义评分最低的词语作为三元组的主体实体词和客体实体词,以及,提取符合第二词性要求,且语义评分最低的词语作为时空实体词;根据提取的实体词,将句法树中符合词性要求的所述提取的实体词下属子节点确定为所述提取的实体词的修饰词;将提取的所述主体实体词、所述客体实体词和对应动词按照预设语义关系存储为实体三元组,以及,将实体词的修饰词存储为程度属性,以及将时空实体词和自身的修饰词标准化为实体的时空属性;对时间、地点以及名称属性相同的实体词进行去重操作,以及,在多个实体词的时空属性相同,名称不同的情况下,对所述多个实体词进行中文分词,计算各自的TF-IDF值以将所述多个实体词进行向量化,通过聚类算法对进行向量化的所述多个实体词进行聚类融合。
在本发明的实施例中,首先构建触发词语料库,该触发词语料库中包括大量提前预设的与暴雨灾害事件相关度高的词语及其权重值。
在本发明的实施例中,依存句法分析是自然语言处理中的关键技术之一,通过识别句子中词汇之间的相互依存关系,返回一个依存句法树。本发明主要采用Hanlp对待分析句子进行词性标注、句法分析等。词性标注主要用于标注语句中每个词语的词性,常见词性有名词(n)、形容词(a)、动词(v)、数词(m)、地名(ns)、时间(t)等;依存句法分析主要用于分析语句中词语与词语之间的语法关系,并将其表示为树形结构,常见的类型有主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)、状中结构(ADV)、动补结构(CMP)等。
在本发明的实施例中,包括触发词的语料库的构建如下过程:
以一定数量的暴雨灾害气候公报、灾害新闻报道等作为基础语料,根据语句中所涵盖的灾害事件的信息量,通过人工标注的方式对基础文本数据中的各个语句进行分级。根据所涵盖的暴雨灾害事件的信息量,即语句与暴雨灾害事件的相关程度,将语句分为1级、2级和3级。如“2017年6月中下旬,我市北部出现强降雨天气,局部路段有积水。”这一语句中包含明确的暴雨灾害事件信息,标为1级;如“气温、降水和日照时数资料来自省气象信息中心整编资料。”这一语句涵盖的暴雨灾害事件信息量非常少,标为3级。
基于基础文本中所有语句的等级,为不同等级的语句进行赋值。将1-3级的语句分别赋值为AD1、AD2和AD3。统计词语在基础语料中的频次,并结合语句的等级赋值,确定该词语的权重值,具体计算公式如下公式2所示。
其中,WEIGHT(ti)为词语ti的权重,tf(ti,Dk)为词语ti在语句Dk中出现的频次,ADn为语句Dn的等级分值。基于得到的所有词语的权重,将权重值高于1.01的词语确定为触发词存储至触发词词典,并构建专有名词词典与程度指示词词典,分别存储暴雨灾害事件专有名词和灾害程度词,从而获得暴雨灾害事件的语料库,如表3和表4所示,示出了暴雨灾害事件语料库中词语的所属类别、词性、权重值以及示例。
通过对文本数据进行解析,在该文本数据的句子中包括触发词时,将该句子确定为有效单句。将有效单句输入到HanLP模型进行计算,确定有效单句中的核心动词。通过依存句法分析,标注有效单句中的词语LEMMA、序号ID、词性POSTAG、依存关系DEPREL,计算词语与核心动词之间的语序距离SQD、语义距离DED、综合语义距离DIS、语义评分SCORE,具体计算公式为:SQD=|word.ID-core.ID|;DED=len(corePath)+len(wordPath)-2len(lcaPath);DIS=a*SQD+b*DED;
其中,word.ID为词语word的序号,也就是属于有效单句中的第几个词语;core.ID为有效单句中核心动词core的序号;len(corePath)为核心动词core结点到句法树根结点的路径长度,通过两者的词语序号相减即可获得路径长度;len(wordPath)为词语word结点到句法树根结点的路径长度;len(lcaPath)指词语word的最低公共祖先到核心动词core的路径长度,也就是两个词语到核心动词具有两条路径,两条路径相交的一个词语即为该两个词语的最低公共祖先,len(lcaPath)则表示该最低公共祖先到核心动词core的路径长度;a、b为权重系数,在本发明中取1:10;WEIGHT为词语word在触发词语料库中的权重。
在本发明的实施例中,为提高后续实体词抽取的准确性,在有效单句中的词语为触发词,且WEIGHT不等于0时,直接将该词语的语义评分作为自身的语义评分;在有效单句中的词语为触发词,且WEIGHT等于0,则SCORE等于0;在有效单句中的词语为非触发词,则将该词语的总和语义距离确定为自身的语义评分。这是因为触发词是与暴雨灾害相关性较高的词语,即使这类触发词距离核心动词较远,也可以获得较高的语义评分,从而使得后续有更高的可能性抽取到这样的触发词,从而提供实体词抽取的准确性。由此,对于示例“2018年9月15日,超强台风山竹导致深圳市普降大暴雨,引发山体滑坡,造成树木倒伏1.7万多棵。”的语义评分将表示为表5。
根据词语在有效单句中的位置、词性和语义评分,提取动词之前区域范围内和动词之后区域范围内符合第一词性要求,且语义评分最低的词语作为三元组的主体实体词和客体实体词。其中,所述第一词性包括名词(n)、其他专名(nz)、名动词(vn)词性中的任意一者。根据词语在有效单句中的位置、词性和语义评分,提取动词之前区域范围内和动词之后区域范围内符合提取符合第二词性要求,且语义评分最低的词语作为时空实体词。其中,第二词性包括时间词性(t)、地名词性(ns)。
示例地,继续沿用上述示例,在动词“导致”之前的词性为名词(n)的词语包括“台风(1.83)”、“山竹(0.92)”,由于“山竹”的语义评分最低,因此选择“山竹”作为三元组的主体实体词,基于相同的实施方式,则客体实体词为“大暴雨(1.92)”,从而抽取得到三元组<山竹,导致,大暴雨>。
在提取到主体实体词、客体实体词和时空实体词后,构建有效单句的句法树,确定各个实体词的下属子节点,并根据词性要求筛选出各个实体词下属子节点中的修饰词,以对提取到的各个实体词进行修饰,将实体词在句法树中符合词性要求的下属子节点作为修饰词,该词性要求包括形容词(a)、区别词(b)、名词(n)。继续沿用上述示例,“山竹”在句法树中的符合词性要求的子节点包括“超强”、“台风”,因此将该两者作为“山竹”的修饰词。其中,对于时间实体词对应的修饰词的词性要求为时间词性,对于空间实体词对应的修饰词的词性要求为空间词性。
在提取到将主体实体词、客体实体词和对应动词后,将提取的主体实体词、客体实体词设置ID识别码,并以<实体,关系,实体>和<实体,属性,属性值>的三元组形式存储至Neo4j图数据库中,如<暴雨,导致,内涝>三元组。其中,所述预设语义关系表征的是将确定的三元组中的动词进行统一表示,例如对于三元组中的导致、引发、造成等动词,均以导致进行表示。将筛选出的各个主体实体词和客体实体词的修饰词存储为各自对应的实体词的程度属性,同时将时空实体词和自身的修饰词标准化为主体实体词和客体实体词的时空属性。
示例地,以文本“2018年9月15日,超强台风山竹导致深圳市普降大暴雨,引发山体滑坡,造成树木倒伏1.7万多棵。”为例对所述抽取方法进行说明。
由于文本中包含语料库中的触发词“导致”“引发”“造成”“倒伏”,则将该语句确定为有效单句。通过句法分析,确定有效单句中的核心动词为“导致”,并计算每个词语的语义评分SCORE。确定文本中动词的主客体,如动词“导致”之前的词性为名词(n)的词语包括“台风(1.83)”、“山竹(0.92)”,其中“山竹(0.92)”的语义评分最小,从而选择“山竹”作为三元组的主体实体词;动词“导致”之后的词性为名词(n)的词语包括“大暴雨(1.92)”、“山体滑坡(2.17)”、“树木(3.51)”,其中“大暴雨(1.92)”语义评分最小,从而选择“大暴雨”作为三元组的客体实体词。由此,抽取得到三元组<山竹,导致,大暴雨>。同理,对于动词“普降”可以抽取得到<山竹,普降,大暴雨>,对于动词“引发”可以抽取得到<山竹,引发,山体滑坡>,对于动词“造成”可以抽取得到<山竹,造成,树木>,对于动词“倒伏”可以抽取得到<山竹,倒伏,Null>(三元组缺失,删除)。对于知识融合,由于示例文本中的“山竹”具有相同的时空属性,将其认定为同一事件实体,“大暴雨”事件实体也是一样,因此可以对得到的<山竹,导致,大暴雨>,<山竹,普降,大暴雨>,<山竹,引发,山体滑坡>,<山竹,造成,树木>三元组中的冗余实体进行去重,按照设计的语义关系,可以标准化为<山竹,导致,大暴雨>,<山竹,导致,山体滑坡>,<山竹,导致,树木>三个三元组,其中山竹是同一实体。而对于可能存在的情况,如“此次暴雨造成严重内涝,据统计共出现100处不同程度的积水”。抽取到<暴雨,造成,内涝>、<暴雨,出现,积水>2个三元组,对“暴雨”实体进行去重,而对于“内涝”和“积水”,由于在抽取的所有实体聚类结果中,“内涝”和“积水”属于同一类“内涝”,实际上是同一暴雨灾害事件中,同一实体的不同表述,将其进行融合为“内涝”,按照设计的语义关系进行标准化可得:<暴雨,导致,内涝>1个三元组。
在本发明的实施例中,空间实体词的标准化指的是根据“国家的标准行政区划分json文件,将一些错误的地名或存在缺漏的情况进行补充,保证名称的规范性。如:“2018年9月16—17日,我市普遍出现了8-11级大风,大风区主要位于南沙区。”对于抽取到的南沙区,可以通过行政区划文件对其进行补全为“广东省广州市南沙区”。而对于时间实体词及其修饰词的标准化指的是按照预设的属性标准化为“x年x月x日”,得到“Start_time-开始时间”为“2018年9月16日”,“End_time-结束时间”为“2018年9月17日”。
由于在一个有效单句中一个实体词可能会出现多次,同时也可能以不同的表述方式出现多次,如果将这些所有的实体词均用于构建实体三元组,将导致原本属于同一实体的多个实体构成多个三元组,从而导致暴雨灾害事件的知识图谱构建的准确性降低。此时,本发明将时间、地点、名称属性相同的主客体实体词进行去重操作,也就是在多个三元组中,该多个三元组中的主体实体词的时间、地点、名称属性均相同,同时该多个三元组中的客体实体词的时间、地点、名称属性也均相同,此时本发明对该多个三元组进行去重操作,只保留一个三元组。而在多个实体词的时空属性相同,而名称不同的情况下,对所述多个实体词进行中文分词,计算各自的TF-IDF值,以此将该多个实体词进行向量化,然后通过聚类算法对进行向量化后的该多个实体词进行聚类融合,例如暴雨、雷暴天气、大暴雨等,通过本发明的上述实施方式将会聚类融合为暴雨这一种实体词,在构建三元组时,对于有效单句中的暴雨、雷暴天气、大暴雨描述都将以暴雨这一名称的实体词进行三元组的构建,同时对于具有特殊名称的自然灾害,如台风山竹,在通过本发明的上述实施方式也将会被聚类融合为山竹这一名称的实体词进行三元组的构建。
示例地,对文本数据:“台风山竹导致树木倒伏,因树木倒伏死亡3人。山竹还造成多处积涝,路段水浸造成严重交通堵塞。”进行知识抽取获得:“台风山竹—树木倒伏、树木倒伏—人死亡、山竹—积涝、水浸—交通堵塞”。其中,将时间、地点以及名称属性相同的实体“树木倒伏”认为是同一实体,对“树木倒伏”进行去重,得到“台风山竹—树木倒伏—人死亡”。此外,将时间、地点属性相同,在名称的表述上存在差异的实体“台风山竹”“山竹”,以及,“积涝”“水浸”,实际上是相同含义的实体进行融合。“台风山竹”、“山竹”同属于概念类“台风灾害”,可融合为“山竹”;“积涝”“水浸”同属于概念类“洪涝灾害”的下层子概念“内涝灾害”,可融合为“内涝”,最终得到“山竹—内涝—交通堵塞”。
在本发明的实施例中,为衡量构建的贝叶斯网络模型推理预测的准确性,引入评价标准Brier指标对预测结果进行评价,具体表现形式如下:
其中,N为待评价变量节点个数,M为变量节点对应的状态个数,pij表示变量节点处于某一状态的预测概率值,oij表示变量节点的实际状态取值。在当前变量节点的状态取值恰好为该变量的实际取值,oij=1,否则oij=0。Brier是贝叶斯网络中待评价变量节点预测偏差的平均值,体现了模型推理预测的可靠性。当Brier∈[0,2],认为模型预测结果的准确性符合要求,且Brier越小代表模型预测效果越好。
本发明实施例提供的一种基于知识图谱的灾害链推理预测方法。首先构建灾害事件知识图谱的本体模型:G=(Event(Con,Rel,Prop,Ins));通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;将融合后的实体信息存储至图数据库并基于所述本体模型,构建灾害事件知识图谱;根据构建的灾害事件知识图谱的本体模型,通过本体模型中事件节点的概念层将多个灾害事件知识图谱进行耦合,从而挖掘到灾害事件的完整灾害链发展路径,从而构建灾害事件的灾害链知识图谱;根据挖掘到的灾害链知识图谱,构建与灾害链知识图谱对应的贝叶斯网络模型;将灾害链知识图谱任意一个事件节点确定为待预测事件节点,在该待预测事件节点的父节点的状态已知的情况下,通过构建的贝叶斯网络模型进行求解可以确定该待预测事件节点达到用户关注的目标状态的概率。由此,通过本体构建、知识提取、融合与存储,构建暴雨灾害链知识图谱,在图谱构建的基础上利用事件节点聚类以及灾害链路耦合实现灾害链的挖掘。通过挖掘得到的暴雨灾害链构建贝叶斯网络模型,通过参数学习确定构建的贝叶斯网络模型中各个节点的条件概率信息以实现推理预测,最后对贝叶斯网络模型进行评价。
本发明第二方面提供一种基于知识图谱的灾害链推理预测系统,如图7所示,所述系统700包括:
本体模型构建模块701,用于构建灾害事件知识图谱的本体模型:G=(Event(Con,Rel,Prop,Ins)),其中,Event表示一次暴雨灾害事件过程,Con表示概念,Rel表示关系,Prop表示属性,Ins表示具体实例;
实体信息提取与知识融合模块702,用于通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;
知识图谱构建模块703,用于将融合后的实体信息存储至图数据库并基于所述本体模型,构建灾害事件知识图谱;
灾害链挖掘模块704,用于将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱;
贝叶斯网络模型构建模块705,用于根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型;
灾害事件预测模块706,用于根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率。
可选地,所述本体模型构建模块,包括:
概念层确定模块,用于根据自然灾害和受影响的承灾体,确定灾害事件的概念层;
关系层确定模块,用于根据概念与概念间、概念与实例间以及实例与实例间的语义关系,确定灾害事件的关系层;
属性层确定模块,用于根据自然灾害和受影响的承灾体的属性信息,确定灾害事件的属性层;
本体模型构建子模块,用于根据所述概念层、所述关系层、所述属性层和具体实例,构建灾害事件知识图谱的本体模型G=(Event(Con,Rel,Prop,Ins))。
可选地,所述实体信息提取与知识融合模块,包括:
有效单句确定模块,用于根据构建的触发词语料库,确定文本数据中的有效单句;
依存句法分析模块,用于通过依存句法分析,标注所述有效单句中的各个词语,以及所述各个词语的序号、词性和依存关系;
语义评分与语义距离计算模块,用于计算所述各个词语分别与所述有效单句中的核心动词之间的综合语义距离和语义评分;
语义评分确定模块,用于在词语为所述有效单句中的非触发词的情况下,将该词语的综合语义距离确定为自身的语义评分;
实体词提取模块,用于根据词语在所述有效单句中的位置、词性和语义评分,提取动词之前区域范围内和之后区域范围内符合第一词性要求,且语义评分最低的词语作为三元组的主体实体词和客体实体词,以及,提取符合第二词性要求,且语义评分最低的词语作为时空实体词;
修饰词提取模块,用于根据提取的实体词,将句法树中符合词性要求的所述提取的实体词下属子节点确定为所述提取的实体词的修饰词;
三元组构建模块,用于将提取的所述主体实体词、所述客体实体词和对应动词按照预设语义关系存储为实体三元组,以及,将实体词的修饰词存储为程度属性,以及将时空实体词和自身的修饰词标准化为实体的时空属性;
聚类融合模块,用于对时间、地点以及名称属性相同的实体词进行去重操作,以及,在多个实体词的时空属性相同,名称不同的情况下,对所述多个实体词进行中文分词,计算各自的TF-IDF值以将所述多个实体词进行向量化,通过聚类算法对进行向量化的所述多个实体词进行聚类融合。
可选地,所述灾害链挖掘模块,包括:
事件节点的概念层确定模块,用于根据所述灾害事件知识图谱的本体模型,确定多个灾害事件知识图谱中各个事件节点所属于的概念层;
灾害链挖掘子模块,用于将所述多个灾害事件知识图谱中在概念层相同的事件节点进行合并并删除重复边处理,获得所述灾害事件的灾害链知识图谱。
可选地,所述贝叶斯网络模型构建模块,包括:
节点集合确定模块,用于将所述灾害链知识图谱中的事件节点集合映射为贝叶斯网络中的节点集合;
条件概率信息确定模块,用于基于所述灾害链知识图谱中的事件节点属性确定贝叶斯网络中各个节点的条件概率信息;
有向边集合确定模块,用于将所述灾害链知识图谱中的事件节点之间的关系映射为贝叶斯网络的有向边集合;
贝叶斯网络模型构建子模块,用于根据确定的所述贝叶斯网络中的节点集合、所述贝叶斯网络中各个节点的条件概率信息和所述贝叶斯网络的有向边集合,构建与所述灾害链知识图谱对应的贝叶斯网络模型。
可选地,所述条件概率信息确定模块,包括:
历史灾害数据获取模块,用于根据所述灾害链知识图谱中的事件节点属性,获取对应的历史灾害数据;
第一条件概率信息确定模块,用于根据所述历史灾害数据,确定所述事件节点属性的条件概率信息;
第二条件概率信息确定模块,用于将所述条件概率信息确定为贝叶斯网络中对应节点的条件概率信息。
可选地,所述灾害事件预测模块,包括:
预测事件节点的父节点确定模块,用于根据待预测事件节点,确定所述待预测事件节点的父节点;
状态已知的父节点确定模块,用于根据所述待预测事件节点的父节点,获取所述待预测事件节点的父节点中状态已知的父节点;
灾害事件预测子模块,用于根据所述状态已知的父节点和所述贝叶斯网络模型,确定所述待预测事件节点处于目标状态的概率。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (8)
1.一种基于知识图谱的灾害链推理预测方法,其特征在于,所述方法包括:
构建灾害事件知识图谱的本体模型:G=(Event(Con,Rel,Prop,Ins)),其中,Event表示一次暴雨灾害事件过程,Con表示概念,Rel表示关系,Prop表示属性,Ins表示具体实例;
通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;
将融合后的实体信息存储至图数据库并基于所述本体模型,构建灾害事件知识图谱;
将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱;
根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型;
根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率;
其中,所述通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合,包括:
根据构建的触发词语料库,确定文本数据中的有效单句;
通过依存句法分析,标注所述有效单句中的各个词语,以及所述各个词语的序号、词性和依存关系;
计算所述各个词语分别与所述有效单句中的核心动词之间的综合语义距离和语义评分;
在词语为所述有效单句中的非触发词的情况下,将该词语的综合语义距离确定为自身的语义评分;
根据词语在所述有效单句中的位置、词性和语义评分,提取动词之前区域范围内和之后区域范围内符合第一词性要求,且语义评分最低的词语作为三元组的主体实体词和客体实体词,以及,提取符合第二词性要求,且语义评分最低的词语作为时空实体词,其中,所述第一词性包括名词、其他专名、名动词的词性中的任意一者,所述第二词性包括时间词性、地名词性;
根据提取的实体词,将句法树中符合词性要求的所述提取的实体词下属子节点确定为所述提取的实体词的修饰词;
将提取的所述主体实体词、所述客体实体词和对应动词按照预设语义关系存储为实体三元组,以及,将实体词的修饰词存储为程度属性,以及将时空实体词和自身的修饰词标准化为实体的时空属性;
对时间、地点以及名称属性相同的实体词进行去重操作,以及,在多个实体词的时空属性相同,名称不同的情况下,对所述多个实体词进行中文分词,计算各自的TF-IDF值以将所述多个实体词进行向量化,通过聚类算法对进行向量化的所述多个实体词进行聚类融合。
2.根据权利要求1所述的一种基于知识图谱的灾害链推理预测方法,其特征在于,所述构建灾害事件知识图谱的本体模型,包括:
根据自然灾害和受影响的承灾体,确定灾害事件的概念层;
根据概念与概念间、概念与实例间以及实例与实例间的语义关系,确定灾害事件的关系层;
根据自然灾害和受影响的承灾体的属性信息,确定灾害事件的属性层;
根据所述概念层、所述关系层、所述属性层和具体实例,构建灾害事件知识图谱的本体模型G=(Event(Con,Rel,Prop,Ins))。
3.根据权利要求1所述的一种基于知识图谱的灾害链推理预测方法,其特征在于,所述将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱,包括:
根据所述灾害事件知识图谱的本体模型,确定多个灾害事件知识图谱中各个事件节点所属于的概念层;
将所述多个灾害事件知识图谱中在概念层相同的事件节点进行合并并删除重复边处理,获得所述灾害事件的灾害链知识图谱。
4.根据权利要求1所述的一种基于知识图谱的灾害链推理预测方法,其特征在于,所述将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱,包括:
通过聚类算法,对多个灾害事件知识图谱中的各个事件节点进行聚类;
将经过聚类的所述多个灾害事件知识图谱中相同的事件节点进行合并并删除重复边处理,获得所述灾害事件的灾害链知识图谱。
5.根据权利要求1所述的一种基于知识图谱的灾害链推理预测方法,其特征在于,所述根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型,包括:
将所述灾害链知识图谱中的事件节点集合映射为贝叶斯网络中的节点集合;
基于所述灾害链知识图谱中的事件节点属性确定贝叶斯网络中各个节点的条件概率信息;
将所述灾害链知识图谱中的事件节点之间的关系映射为贝叶斯网络的有向边集合;
根据确定的所述贝叶斯网络中的节点集合、所述贝叶斯网络中各个节点的条件概率信息和所述贝叶斯网络的有向边集合,构建与所述灾害链知识图谱对应的贝叶斯网络模型。
6.根据权利要求5所述的一种基于知识图谱的灾害链推理预测方法,其特征在于,所述基于所述灾害链知识图谱中的事件节点属性确定贝叶斯网络中各个节点的条件概率信息,包括:
根据所述灾害链知识图谱中的事件节点属性,获取对应的历史灾害数据;
根据所述历史灾害数据,确定所述事件节点属性的条件概率信息;
将所述条件概率信息确定为贝叶斯网络中对应节点的条件概率信息。
7.根据权利要求1所述的一种基于知识图谱的灾害链推理预测方法,其特征在于,所述根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率,包括:
根据待预测事件节点,确定所述待预测事件节点的父节点;
根据所述待预测事件节点的父节点,获取所述待预测事件节点的父节点中状态已知的父节点;
根据所述状态已知的父节点和所述贝叶斯网络模型,确定所述待预测事件节点处于目标状态的概率。
8.一种基于知识图谱的灾害链推理预测系统,其特征在于,所述系统包括:
本体模型构建模块,用于构建灾害事件知识图谱的本体模型:G=(Event(Con,Rel,Prop,Ins)),其中,Event表示一次暴雨灾害事件过程,Con表示概念,Rel表示关系,Prop表示属性,Ins表示具体实例;
实体信息提取与知识融合模块,用于通过对文本数据进行依存句法分析,提取灾害事件的实体信息,并通过聚类算法将相同含义的实体信息进行知识融合;
知识图谱构建模块,用于将融合后的实体信息存储至图数据库并基于所述本体模型,构建灾害事件知识图谱;
灾害链挖掘模块,用于将多个灾害事件知识图谱进行耦合,挖掘灾害事件的灾害链知识图谱;
贝叶斯网络模型构建模块,用于根据所述灾害链知识图谱,构建所述灾害链知识图谱对应的贝叶斯网络模型;
灾害事件预测模块,用于根据所述贝叶斯网络模型和待预测事件节点的已知父节点状态集合,确定所述待预测事件节点处于目标状态的概率;
所述实体信息提取与知识融合模块,包括:
有效单句确定模块,用于根据构建的触发词语料库,确定文本数据中的有效单句;
依存句法分析模块,用于通过依存句法分析,标注所述有效单句中的各个词语,以及所述各个词语的序号、词性和依存关系;
语义评分与语义距离计算模块,用于计算所述各个词语分别与所述有效单句中的核心动词之间的综合语义距离和语义评分;
语义评分确定模块,用于在词语为所述有效单句中的非触发词的情况下,将该词语的综合语义距离确定为自身的语义评分;
实体词提取模块,用于根据词语在所述有效单句中的位置、词性和语义评分,提取动词之前区域范围内和之后区域范围内符合第一词性要求,且语义评分最低的词语作为三元组的主体实体词和客体实体词,以及,提取符合第二词性要求,且语义评分最低的词语作为时空实体词,其中,所述第一词性包括名词、其他专名、名动词的词性中的任意一者,所述第二词性包括时间词性、地名词性;
修饰词提取模块,用于根据提取的实体词,将句法树中符合词性要求的所述提取的实体词下属子节点确定为所述提取的实体词的修饰词;
三元组构建模块,用于将提取的所述主体实体词、所述客体实体词和对应动词按照预设语义关系存储为实体三元组,以及,将实体词的修饰词存储为程度属性,以及将时空实体词和自身的修饰词标准化为实体的时空属性;
聚类融合模块,用于对时间、地点以及名称属性相同的实体词进行去重操作,以及,在多个实体词的时空属性相同,名称不同的情况下,对所述多个实体词进行中文分词,计算各自的TF-IDF值以将所述多个实体词进行向量化,通过聚类算法对进行向量化的所述多个实体词进行聚类融合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310841633.4A CN116776984B (zh) | 2023-07-10 | 2023-07-10 | 一种基于知识图谱的灾害链推理预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310841633.4A CN116776984B (zh) | 2023-07-10 | 2023-07-10 | 一种基于知识图谱的灾害链推理预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116776984A CN116776984A (zh) | 2023-09-19 |
CN116776984B true CN116776984B (zh) | 2024-03-19 |
Family
ID=87989495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310841633.4A Active CN116776984B (zh) | 2023-07-10 | 2023-07-10 | 一种基于知识图谱的灾害链推理预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116776984B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109992672A (zh) * | 2019-04-11 | 2019-07-09 | 华北科技学院 | 基于灾害场景的知识图谱构建方法 |
CN111798355A (zh) * | 2020-07-01 | 2020-10-20 | 北京大学 | 一种城市公共安全事件链形式化组织方法及事件链数据库 |
CN112215458A (zh) * | 2020-09-01 | 2021-01-12 | 青岛海信网络科技股份有限公司 | 灾害分析方法和电子设备 |
CN112365078A (zh) * | 2020-11-23 | 2021-02-12 | 南京莱斯信息技术股份有限公司 | 一种基于灾害链的多灾种耦合与次生衍生演化预测系统 |
WO2022115938A1 (en) * | 2020-12-03 | 2022-06-09 | Riskthinking.Ai Inc. | Systems and methods with classification standard for computer models to measure and manage radical risk using machine learning and scenario generation |
CN114692874A (zh) * | 2022-03-29 | 2022-07-01 | 中国地质大学(武汉) | 一种面向地质灾害领域的知识图谱自动化构建方法及系统 |
CN114692875A (zh) * | 2022-04-12 | 2022-07-01 | 华北电力大学 | 一种故障诊断用gis知识图谱的构建方法 |
CN114860960A (zh) * | 2022-07-11 | 2022-08-05 | 南京师范大学 | 一种基于文本挖掘的洪涝型Natech灾害事件知识图谱构建方法 |
CN115114455A (zh) * | 2022-07-04 | 2022-09-27 | 电子科技大学 | 一种基于本体的多粒度城市暴雨内涝知识图谱构建方法 |
CN115225304A (zh) * | 2022-03-24 | 2022-10-21 | 国家计算机网络与信息安全管理中心 | 一种基于概率图模型的网络攻击路径预测方法及系统 |
CN115660926A (zh) * | 2022-11-14 | 2023-01-31 | 上海市气象灾害防御技术中心(上海市防雷中心) | 基于频繁模式挖掘的城市气象灾害致灾因子识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11914674B2 (en) * | 2011-09-24 | 2024-02-27 | Z Advanced Computing, Inc. | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
-
2023
- 2023-07-10 CN CN202310841633.4A patent/CN116776984B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109992672A (zh) * | 2019-04-11 | 2019-07-09 | 华北科技学院 | 基于灾害场景的知识图谱构建方法 |
CN111798355A (zh) * | 2020-07-01 | 2020-10-20 | 北京大学 | 一种城市公共安全事件链形式化组织方法及事件链数据库 |
CN112215458A (zh) * | 2020-09-01 | 2021-01-12 | 青岛海信网络科技股份有限公司 | 灾害分析方法和电子设备 |
CN112365078A (zh) * | 2020-11-23 | 2021-02-12 | 南京莱斯信息技术股份有限公司 | 一种基于灾害链的多灾种耦合与次生衍生演化预测系统 |
WO2022115938A1 (en) * | 2020-12-03 | 2022-06-09 | Riskthinking.Ai Inc. | Systems and methods with classification standard for computer models to measure and manage radical risk using machine learning and scenario generation |
CN115225304A (zh) * | 2022-03-24 | 2022-10-21 | 国家计算机网络与信息安全管理中心 | 一种基于概率图模型的网络攻击路径预测方法及系统 |
CN114692874A (zh) * | 2022-03-29 | 2022-07-01 | 中国地质大学(武汉) | 一种面向地质灾害领域的知识图谱自动化构建方法及系统 |
CN114692875A (zh) * | 2022-04-12 | 2022-07-01 | 华北电力大学 | 一种故障诊断用gis知识图谱的构建方法 |
CN115114455A (zh) * | 2022-07-04 | 2022-09-27 | 电子科技大学 | 一种基于本体的多粒度城市暴雨内涝知识图谱构建方法 |
CN114860960A (zh) * | 2022-07-11 | 2022-08-05 | 南京师范大学 | 一种基于文本挖掘的洪涝型Natech灾害事件知识图谱构建方法 |
CN115660926A (zh) * | 2022-11-14 | 2023-01-31 | 上海市气象灾害防御技术中心(上海市防雷中心) | 基于频繁模式挖掘的城市气象灾害致灾因子识别方法 |
Non-Patent Citations (3)
Title |
---|
Key Disaster-Causing Factors Chains on Urban Flood Risk Based on Bayesian Network;Shanqing Huang et al;《Land》;第1-21页 * |
基于文本挖掘的灾害多级联动分析与预测研究;刘晓;《中国优秀博士学位论文全文数据库 工程科技Ⅰ辑》;第B026-19页 * |
自然灾害应急知识图谱构建方法研究;杜志强 等;《武汉大学学报(信息科学版)》;第1344-1355页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116776984A (zh) | 2023-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710625B (zh) | 一种专题知识自动挖掘系统及方法 | |
Xie et al. | Deduction of sudden rainstorm scenarios: integrating decision makers' emotions, dynamic Bayesian network and DS evidence theory | |
CN110674840B (zh) | 一种多方证据关联模型构建方法和证据链提取方法及装置 | |
CN111798355B (zh) | 一种城市公共安全事件链形式化组织方法及事件链数据库 | |
CN108388559A (zh) | 地理空间应用下的命名实体识别方法及系统、计算机程序 | |
Xiao et al. | Predicting spatio-temporal man-made slope failures induced by rainfall in Hong Kong using machine learning techniques | |
CN109543764A (zh) | 一种基于智能语义感知的预警信息合法性检测方法及检测系统 | |
CN114282534A (zh) | 一种基于要素信息抽取的气象灾害事件聚合方法 | |
Deng et al. | [Retracted] Risk Assessment and Prediction of Rainstorm and Flood Disaster Based on Henan Province, China | |
Li et al. | Prediction of power outage quantity of distribution network users under typhoon disaster based on random forest and important variables | |
Fu et al. | Extracting historical flood locations from news media data by the named entity recognition (NER) model to assess urban flood susceptibility | |
CN114821976A (zh) | 一种多要素岩溶塌陷的智能预报系统 | |
CN114118524A (zh) | 一种基于知识推理的设备状态综合分析方法 | |
CN116776984B (zh) | 一种基于知识图谱的灾害链推理预测方法及系统 | |
Ekmekcioğlu et al. | Developing meta-heuristic optimization based ensemble machine learning algorithms for hydraulic efficiency assessment of storm water grate inlets | |
CN115965020A (zh) | 一种面向广域地理信息知识图谱构建的知识抽取方法 | |
CN105912637A (zh) | 一种基于知识的用户兴趣挖崛方法 | |
CN111737976B (zh) | 一种旱灾风险预测方法及系统 | |
Han et al. | Mining Spatial-Temporal Frequent Patterns of Natural Disasters in China Based on Textual Records | |
CN113256160A (zh) | 一种以监测数据驱动的综合管廊运维动态风险评价方法 | |
Klepac et al. | A case study and parametric analysis of predicting hurricane-induced building damage using data-driven machine learning approach | |
Xiao et al. | Research on fault-environment association rules of distribution network based on improved Apriori algorithm | |
Wang et al. | Hazard assessment of debris flow based on infinite irrelevance method and probabilistic neural network coupling Model | |
Wang et al. | An Attribute-based Model to Retrieve Storm Surge Disaster Cases. | |
CN115409433B (zh) | 基于深度nlp的社区重点人员画像分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |