CN116010612A - 流域防洪知识图谱构建方法、装置及电子设备 - Google Patents
流域防洪知识图谱构建方法、装置及电子设备 Download PDFInfo
- Publication number
- CN116010612A CN116010612A CN202211583246.7A CN202211583246A CN116010612A CN 116010612 A CN116010612 A CN 116010612A CN 202211583246 A CN202211583246 A CN 202211583246A CN 116010612 A CN116010612 A CN 116010612A
- Authority
- CN
- China
- Prior art keywords
- data
- knowledge
- flood control
- entity
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 claims description 47
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 13
- 238000007726 management method Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 9
- 238000013075 data extraction Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000004927 fusion Effects 0.000 description 8
- 230000000007 visual effect Effects 0.000 description 7
- 238000012549 training Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000007599 discharging Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- 230000008961 swelling Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101150026173 ARG2 gene Proteins 0.000 description 1
- 101100260702 Mus musculus Tinagl1 gene Proteins 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 101150088826 arg1 gene Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种流域防洪知识图谱构建方法、装置及电子设备,基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性;基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性;基于预设的图数据库,生成知识数据的知识图谱;其中,知识图谱中用节点表征实体,知识图谱中用节点间的连线表征实体间的关联关系。采用本发明可以提高构建知识图谱的效率和准确性,从而满足流域防洪的相关应用需求。
Description
技术领域
本发明涉及流域防洪技术领域,尤其是涉及一种流域防洪知识图谱构建方法、装置及电子设备。
背景技术
防洪工作事关人民群众的生命财产安全以及经济社会的稳定发展,随着我国水利工程的迅猛发展和工程建设水平的不断提高,水利工程建设不断增加,由此不断积累下来的大量分散的水利数据却未能被很好地统一收集整理、进而广泛运用于防洪工作中,而历史洪水特征、洪水调度方案、水文气象数据、调度规则、流域河湖、防洪工程信息等水利数据的明晰程度,必然会影响整个流域的防洪工作水平及工作效率,因此急需通过新技术建立一套流域防洪知识图谱构建方法,提升水利行业的知识利用率以及知识获取效率。
现如今,对于流域防洪知识图谱的构建,还没有一套科学高效、适用于流域防洪的构建方法,当前常用的构建方法主要包括:
(1)基于专家经验的抽象映射方法。即:基于专家对流域防洪的理解,依靠专家经验对领域内结构化、半结构化、非结构化数据的抽象映射,能完整地表达知识内容。但是该方法无法适应当前数据规模不断扩张的信息化时代,人工成本高、工作效率低。
(2)基于机器学习构建的方法。即:利用各类机器学习方法进行实体、关系、属性的训练识别以实现知识抽取、知识融合,进而形成知识图谱。该方法虽然逐渐被各领域广泛使用,但是对于水利领域来说,当前能够获取的实体、关系、属性同类型文件、数据量较少,不足以支撑训练识别模型所需要的大量数据集,从而导致训练精度不佳、识别准确度不满足流域防洪需要。
综上,虽然目前知识图谱构建的方法有很多,但各种方法对于流域防洪技术领域来说存在成本高、数据需求量大等不同的缺陷,现亟需一种科学合理、切实有效的流域防洪知识图谱构建方法。
发明内容
有鉴于此,本发明的目的在于提供一种流域防洪知识图谱构建方法、装置及电子设备,以缓解相关技术中存在的上述问题,从而满足流域防洪的相关应用需求。
第一方面,本发明实施例提供了一种流域防洪知识图谱构建方法,所述方法包括:基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个所述防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性;基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,所述知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性;基于预设的图数据库,生成所述知识数据的知识图谱;其中,所述知识图谱中用节点表征实体,所述知识图谱中用节点间的连线表征实体间的关联关系。
第二方面,本发明实施例还提供一种流域防洪知识图谱构建装置,所述装置包括:顶层模型构建模块,用于基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个所述防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性;知识数据提取模块,用于基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,所述知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性;知识图谱生成模块,用于基于预设的图数据库,生成所述知识数据的知识图谱;其中,所述知识图谱中用节点表征实体,所述知识图谱中用节点间的连线表征实体间的关联关系。
第三方面,本发明实施例还提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现上述流域防洪知识图谱构建方法。
本发明实施例提供的一种流域防洪知识图谱构建方法、装置及电子设备,基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性;基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性;基于预设的图数据库,生成知识数据的知识图谱;其中,知识图谱中用节点表征实体,知识图谱中用节点间的连线表征实体间的关联关系。采用上述技术可以提高构建知识图谱的效率和准确性,从而满足流域防洪的相关应用需求。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种流域防洪知识图谱构建方法的流程示意图;
图2为本发明实施例中一种流域防洪知识图谱构建方法的示例图;
图3为本发明实施例中业务规则库顶层模型的示例图;
图4为本发明实施例中知识图谱可视化展示图;
图5为本发明实施例中一种流域防洪知识图谱构建装置的结构示意图;
图6为本发明实施例中一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,对于流域防洪知识图谱的构建,还没有一套科学高效、适用于流域防洪的构建方法,当前常用的构建方法主要包括:
(1)基于专家经验的抽象映射方法。即:基于专家对流域防洪的理解,依靠专家经验对领域内结构化、半结构化、非结构化数据的抽象映射,能完整地表达知识内容。但是该方法无法适应当前数据规模不断扩张的信息化时代,人工成本高、工作效率低。
(2)基于机器学习构建的方法。即:利用各类机器学习方法进行实体、关系、属性的训练识别以实现知识抽取、知识融合,进而形成知识图谱。该方法虽然逐渐被各领域广泛使用,但是对于水利领域来说,当前能够获取的实体、关系、属性同类型文件、数据量较少,不足以支撑训练识别模型所需要的大量数据集,从而导致训练精度不佳、识别准确度不满足流域防洪需要。综上,虽然目前知识图谱构建的方法有很多,但各种方法对于流域防洪技术领域来说存在成本高、数据需求量大等不同的缺陷,现亟需一种科学合理、切实有效的流域防洪知识图谱构建方法。
基于此,本发明实施提供的一种流域防洪知识图谱构建方法、装置及电子设备,可以缓解相关技术中存在的上述问题,从而满足流域防洪的相关应用需求。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种流域防洪知识图谱构建方法进行详细介绍,参见图1所示,该方法可以包括以下步骤:
步骤S102,基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性。
上述多个防洪知识库的类型可根据实际需要自定义,对此不进行限定。
上述实体在流域防洪技术领域中具体可以指水利对象(如水库、水电站等)、水库防洪调度业务规则、水库控制参量等,对此不进行限定。相应地,不同实体间可能还存在一定的关联关系,且每个实体和每个关联关系均具有各自的属性。此外,有的实体还具有相应的子实体,实体之间、子实体之间、实体与子实体之间均存在关联关系,每个实体、每个子实体、每个关联关系均有各自的属性。
例如,在一定的水库防洪调度业务规则下需要对水库的下泄流量进行控制,此时作为其中一个实体的水库防洪调度业务规则通过洪水状态(即关联关系)与作为另一个实体的涨退情况关联,水库防洪调度业务规则的属性具体可以为规则编号、规则名称、所属水库编号等,该指定涨退情况的属性具体可以为控制站点名称、所属规则编号、判断类型、判断条件、判断数量等,该关联关系的属性可以为洪水状态名称(其属性值可以为涨水、退水或其他情况);作为一个实体的涨退情况通过控制水库下泄流量(即关联关系)与作为另一个实体的水库下泄流量关联,涨退情况的属性具体可以为控制站点名称、所属规则编号、判断类型、判断条件、判断数量等,该指定水库下泄流量的属性具体可以为控制水库下泄流量值、控制库水位值等,该关联关系的属性可以为控制名称、控制编号等。
在确定需要建立的目标流域防洪知识库类型后,可分别为每个防洪知识库构建相应的顶层模型,从而可用不同顶层模型来表征不同防洪知识库的知识数据的数据特征(如实体数据、关联关系数据和属性数据各自的数据来源、数据存储格式等),以便后续可通过对应顶层模型提取所需的具有相应的数据特征的知识数据。
步骤S104,基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性。
上述防洪数据文件可以通过对目标流域范围内的相关防洪资料进行处理得到的,其文件的格式可以为csv、txt等,对此不进行限定。资料处理的方式具体可以包括文字信息识别、图片信息识别、添加标注信息、统计分析、数据格式转换等,对此不进行限定。
步骤S106,基于预设的图数据库,生成知识数据的知识图谱;其中,知识图谱中用节点表征实体,知识图谱中用节点间的连线表征实体间的关联关系。
为了更直观地表征出实体间的关联关系,可通过图数据库为知识数据中的实体、关联关系和属性生成相应的图对象(包括实体对应的实体图对象、关联关系对应的关系图对象、属性对应的属性图对象),之后将每个实体图对象作为一个节点以表征一个实体,在具有关联关系的两个实体各自对应的节点之间建立一条连线(即与一个关系图对象对应)以表征一个关联关系,从而生成一个知识图谱。
本发明实施例提供的一种流域防洪知识图谱构建方法,基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性;基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性;基于预设的图数据库,生成知识数据的知识图谱;其中,知识图谱中用节点表征实体,知识图谱中用节点间的连线表征实体间的关联关系。采用上述技术可以提高构建知识图谱的效率和准确性,从而满足流域防洪的相关应用需求。
作为一种可能的实施方式,上述多个防洪知识库可以包括水利对象关联关系库、业务规则库、专家经验库和历史场景库;上述步骤S102(即基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型)可以包括:
(11)基于水利对象关联关系库构建第一顶层模型;其中,水利对象关联关系库的实体包括防洪工程、水文监测站点和防洪保护对象。
对于水利对象关联关系库来说,实体概念主要包括防洪工程(其子实体可以为水库、堤防、大型水闸、蓄滞洪区等)、水文监测站点(其子实体可以为雨量站、水文站、水位站等)、防洪保护对象等。
(12)基于业务规则库构建第二顶层模型;其中,业务规则库的实体、关联关系和属性均与已有的水库防洪调度规则对应。
上述业务规则具体可以指水库防洪调度业务的规则,可通过对目标流域内已有的水库防洪调度规则进行整理分析从而得到上述业务规则库。对于业务规则库来说,实体概念主要包括水库防洪调度对应的控制站点、控泄条件、控制下泄流量等,关联关系主要包括控制指标、涨水、退水、其他情况(如与涨水和退水对应的水位稳定的情况)、控制水库下泄流量以及其他关联关系(如“且”、“或”等逻辑关系)等,属性主要包括控制站点的相关属性(如控制站点名称、控制站点所在河流、控制站点的类型为水文站还是水电站等)、控泄条件的所属方案名称、水库名称、站点名称、流量(或时间段涨率、库水位等)、数值判断类型等。
(13)基于专家经验库构建第三顶层模型;其中,专家经验库的实体包括决策指标、专家经验规则和控泄流量。
可通过整理分析历史洪水关键参数、水库防洪调度规则、水库实际防洪调度过程、专家咨询信息等内容,从而得到上述专家经验库。对于专家经验库来说,实体概念主要包括决策指标、专家经验规则(如根据专家经验自定义的水库防洪调度规则等)、控泄流量等。
(14)基于历史场景库构建第四顶层模型;其中,历史场景库的实体、关联关系和属性均与历史洪水场景对应。
对于历史场景库来说,实体概念主要包括历史洪水的名称、降雨特征(其子实体可以为时间、雨强、分布范围等)、洪峰特征(其子实体可以为历时、峰形、遭遇情况、洪水演进等)等,其中洪水演进的子实体可以为断面流量、流速、保证水位、警戒水位等。
此外,上述多个防洪知识库还可以包括预报调度方案库。相应地,还可基于预报调度方案库构建第五顶层模型;其中,预报调度方案库的实体、关联关系和属性均与已有的洪水预报方案、流域防洪调度方案对应。
采用上述为防洪知识库构建顶层模型的操作方式,可以实现对目标流域范围内水利对象(如水系、河湖、水库、堤防等)及其关联关系,以及目标流域范围内发生过的历史洪水场景、预报调度方案、专家经验、水库调度规则等相关知识的量化表示。
作为一种可能的实施方式,上述步骤S104(即基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据)之前,上述流域防洪知识图谱构建方法还可以包括:通过上述图数据库以csv文件的形式存储每个顶层模型的内容。
在得到上述多个顶层模型后,可将各个顶层模型的内容在图数据库中进行存储,例如,通过图数据库以csv文件的形式存储每个顶层模型的内容,通过定义csv文件本身数据结构的方式使实体、关联关系和属性具象化,有利于后期知识的有效分类与抽取。此外,还可根据实际需要通过图数据库为每个顶层模型的内容生成相应的模型图。
作为一种可能的实施方式,上述流域防洪知识图谱构建方法还可以包括:
(21)获取目标流域对应的基础防洪资料;其中,基础防洪资料包括气象水文资料、河道及湖泊防洪资料、防洪工程现状资料、防洪非工程现状资料、经济社会状况资料、防洪规划资料、防汛管理资料。
示例性地,可收集、整理目标流域范围内防洪有关的基本资料作为目标流域对应的基础防洪资料,包括气象水文资料(如洪水传播速度、各河段洪水传播时间等资料,着重收集历史上曾出现的典型洪水等)、河道及湖泊防洪资料、防洪工程现状资料(如堤防、水库、蓄滞洪区、河道治理工程、河流上的大型水闸、分洪道等工程的已建的防洪工程数据库,流域重要控制断面和大中型水库、堤防、水闸等水利工程数据,骨干水库工程水库特性资料、调度规程以及历史运行数据等现状资料)、防洪非工程现状资料(如流域或区域暴雨洪水监测以及预报预警系统、通信网络系统、蓄滞洪区人员安全转移预案、防洪减灾设施管理、政策法规等资料)、经济社会状况资料(如流域或区域内各防洪保护区、蓄滞洪区、行洪区经济社会现状指标,及经济社会发展对防洪减灾的要求等资料)、防洪规划资料(如防洪标准、设计洪水、防洪规划方案等)、防汛管理资料(如经批准的防御洪水方案,防汛管理制度,防汛管理条例、政策、法规等)。
(22)将基础防洪资料划分成结构化数据、半结构化数据和非结构化数据。
示例性地,接续前例,可将前述收集、整理的基础防洪资料按照数据结构类别进一步划分成结构化数据(如MySQL、SQL Server等关系型数据库的数据)、半结构化数据(如从期刊、网络搜索引擎、行业垂直网站中获取到的数据)和非结构化数据(如WORD、PDF、EXCEL等格式的文件以及视频、图片、音频文件等)。
(23)通过预先编写的Python脚本分别对结构化数据、半结构化数据和非结构化数据进行处理,得到多个防洪数据文件;其中,多个防洪数据文件包括结构化数据对应的第一csv文件、半结构化数据对应的第二csv文件和非结构化数据对应的txt文件。
示例性地,对于PDF格式文件及图片格式文件,可通过提前写好的Python脚本执行以下操作:获取指定文件夹中的原始文件,利用PIL及fitz库将获取到的原始文件统一转换为png文件;通过文字检测模型(如ch_PP-OCRv3_det模型等)对每个png文件中的中文文字进行检测定位,通过文字识别模型(如densenet_lite_136-fc模型等)对png文件中的中文文字进行识别并输出识别结果,利用Cnocr库通过Cnocr()函数新建任务为每个原始文件的识别结果生成相应的文件名与该原始文件的文件名相同的txt文件。此外,还可人工为每个原始文件对应的文字识别结果加入相应的换行符,从而提升文字识别结果的可读性。
示例性地,对于Word格式文件,可通过提前写好的Python脚本执行以下操作:使用docx库,利用其Document()函数读取相应的Word格式文件;对于读取的每个Word格式文件,均可利用write(data)将该Word格式文件的每个段落中的文字写入相应的文件名与该Word格式文件的文件名相同的txt文件;对于写入文字后的每个txt文件,利用para._p.getnext()以及ele.tag[-3:]=='tbl'判断该txt文件中是否存在表格,若存在,则分别遍历该txt文件中存在的每个表格,并在每个表格中的各行之间填充换行符,在每个表格中的各cell(即单元格)之间填充空格,最终按照统一格式导出每个表格的内容。
示例性地,对于关系型数据库的数据,可利用关系型数据库对应的Python包以及Pandas等扩展包编写Python脚本,之后通过该Python脚本执行以下操作:从关系型数据库的数据中统一提取出数据表,对于提取出的每个数据表,均按照该数据表的结构将该数据表中的数据写入到文件名与数据表的名称相同的csv文件。
示例性地,对于从期刊、网络搜索引擎、行业垂直网站中获取到的网页,可通过提前写好的Python脚本执行以下操作:通过Requests、Parsel等库提取网页中有用的文字,并将提取出的文字内容以csv格式进行存储,从而得到相应的csv文件。
示例性地,对于由上述PDF格式文件、上述图片格式文件和上述Word格式文件对应生成的每个上述txt文件,均可进一步将该txt文件导出为可被图数据库利用的csv文件;而生成的txt文件中的知识大多在原始文件中以表格的形式存在,在确定需要包含所需数据的表格之后,可利用readlines()以及split()编写Python脚本,从而通过编写的Python脚本将txt文件中的表格部分统一提取为csv文件,以便进行后续知识提取;对txt文件中以段落文字存在的知识,则需要在后续知识提取时进行单独处理。
作为一种可能的实施方式,上述步骤S104(即基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据)可以包括:
(31)通过预设文本标注工具对上述txt文件的段落中存在的第一知识数据进行标注,并为标注后的知识数据生成相应的标注文件;其中,标注文件中以不同行字段分别记录不同实体、不同关联关系和不同属性。
示例性地,可利用Brat将txt文件的段落中存在的实体、关联关系、属性标注出来,标注后即生成.ann格式的标注文件,标注文件中的内容可以包括多个行字段,根据行字段是用于记录实体、关联关系还是属性,行字段的呈现形式可以包括以下三种:
“实体(T)+编号对应实体类型名称起始字符位置结束字符位置标注内容+/n”;
“属性(A)+编号对应属性类型名称对应实体编号+/n”;
“关系(R)+对应排序对应关系名称Arg1:起点对应实体排序Arg2:终点对应实体排序+/n”;
上述对应排序具体可根据对应关系名称的语义关系进行确定,例如,对于实体为调度规则的情形,调度规则名称为实体的其中一个属性,对于名为“百色水库防洪调度规则”的一个调度规则来说,用字段“T1调度规则9 19百色水库防洪调度规则/n”表征将该调度规则作为一个实体,用字段“A1调度规则名称T1/n”表征该调度规则的调度规则名称为“百色水库防洪调度规则”,对于该调度规则在涨水时触发调度机制的某一判断条件,用字段“R10涨水Arg1:T1 Arg2:T6/n”表征该调度规则的调度规则名称为“百色水库防洪调度规则”且该调度规则与该调度判断条件具有关联关系。
(32)通过上述Python脚本从所述标注文件中提取出所需的第二知识数据,并将所述第二知识数据存储成第三csv文件;其中,所述第三csv文件包括所述第二知识数据中每个实体和每个属性各自的唯一标识。
示例性地,接续前例,可按照上述行字段的呈现形式编写Python脚本,从而通过编写的Python脚本从上述标注文件中提取出所需的内容(即上述第二知识数据),并将提取的内容保存至csv文件;该csv文件中,对应实体类型名称相同的行字段属于同一实体,非同行字段中同一实体的属性信息使用关系建立关联,每个关联关系的对应关系名称采用的是具有该关联关系的两个实体的对应属性类型名称的具体内容(即属性信息),且属性信息相同的行字段属于同一实体;为了便于查看该csv文件中的内容,该csv文件中可按照“唯一编号,知识类别(即实体/关系/属性),知识类型名称,知识内容,(属性)所属实体/关系编号,(关系)起始实体编号,(关系)终点实体编号”的格式对任意存在关联关系的两个实体进行保存。
作为一种可能的实施方式,上述图数据库可以包括上述知识数据的每个实体、每个关联关系和每个属性各自对应的图对象;上述步骤S104(即基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据)还可以包括:从上述第一csv文件、上述第二csv文件和上述第三csv文件中读取出所需的第三知识数据,并应用第三知识数据的实体、关联关系和属性更新上述图数据库中的图对象。
示例性地,接续前例,csv文件的第一行为各列的表头(即实体、关联关系或属性名称),csv文件的第二行及之后的行为需要存储的知识。以上述图数据库采用Neo4j数据库为例,可编写对应的Python脚本,从而通过编写的Python脚本进行以下操作:调用py2neo库使用Graph()连接本地或服务器上的Neo4j数据库,使用NodeMatcher()建立用于访问Neo4j数据库节点的链接,RelationshipMatcher()建立用于访问Neo4j数据库中节点间连线(即关系)的链接,使用csv.reader()读取出csv文件中的知识数据。
此外,由于csv文件中的同行数据中可能同时包括同一实体的属性信息以及与该实体相关的关联关系信息,因而可引入图数据库的动态更新机制以避免图数据库中存在过多重复的图对象。
例如,可通过预先编写的Python脚本执行以下操作:在使用csv.reader()读取csv文件时,对于正在读取的csv文件中的每一行数据,均采用预先构建的判断函数list(matcher.match('节点名',属性名1=data[i][属性1所在位置],属性名2=data[i][属性2所在位置],....))判断图数据库中是否存在与该行数据所包含的实体和/或属性对应匹配的节点,如果存在,则更新匹配节点的属性信息,如果不存在,则使用Node()添加节点及其属性信息并使用graph.create(node)在图数据库中添加新的节点。
再例如,还可通过预先编写的Python脚本执行以下操作:在使用csv.reader()读取csv文件时,对于正在读取的csv文件中的每一行数据,均采用预先构建的判断函数list(relationship_matcher.match((起始节点,目标节点),r_type='关系名称'))判断图数据库中是否存在与该行数据所包含的关联关系对应匹配的图对象(即节点间的连线),如果不存在,则使用Relationship(起始节点,'关系名称',目标节点)添加关系信息,使用graph.create(r)在图数据库中添加起始节点与目标节点间的连线。
作为一种可能的实施方式,上述步骤S104(即基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据)之后,上述流域防洪知识图谱构建方法还可以包括:按照预设规则对所述知识数据中的实体、关联关系和属性进行融合,并应用融合后的数据更新所述多个顶层模型。
示例性地,在知识提取的过程中由于数据源不同,对同一实体的概念描述会出现同名异意或同意异名的情况,首先需要明确正在提取的实体的概念,判断与已提取出的实体之间的语义相似程度,在知识提取过程中人工进行相关实体、关联关系和属性的融合,并根据融合后得到的实体、关联关系和属性调整相应的顶层模型以实现顶层模型的更新。
作为一种可能的实施方式,上述流域防洪知识图谱构建方法还可以包括:基于上述图数据库,可视化展示上述知识图谱。
示例性地,以上述图数据库采用Neo4j数据库为例,可使用Neo4j数据库中的GraphDatabase.driver()为一个flask框架的可视化后台认证并链接Neo4j数据库,从而使可视化后台可正常访问Neo4j数据库,利用driver.session().run('CYPHER查询语句').values()获取Neo4j数据库中需要展示的知识,再对获取的知识数据进行结构处理以得到可视化前端能够展示的格式,并将结构处理后得到的数据以jsonify(elements={"nodes":nodes,"edges":edges})的形式返回给可视化后台,nodes包含需要展示的知识中的所有节点及其属性,edges包含需要展示的知识中的所有关联关系及其属性。以可视化前端使用React框架为例,可在可视化前端中引入组件库CytoscapeJs,使用CytoscapeComponent进行知识图谱展示,图谱中不同节点的样式、关系样式、点击样式等使用.selector().css()进行设置,图谱中各节点的属性信息使用qtip插件进行弹框展示。
为了便于理解,在此以目标流域为珠江流域为例对上述流域防洪知识图谱构建方法进行示例性描述如下。参见图2所示,上述流域防洪知识图谱构建方法可以按照以下操作方式进行:
步骤一,基于预先确认需要建立的珠江流域防洪知识库,珠江流域水利知识顶层模型构建。
根据当前收集到的资料以及需求,确认需要建立的知识库类型,从而建立水利对象关联关系库、业务规则库、专家经验库、历史场景库和预报调度方案库。以建立业务规则库为例,可按照水库防洪调度业务的规则逻辑将水库防洪调度规则拆分为:防洪调度规则名称、所属水库、涨退情况、控制水库下泄流量等实体,规则编号、规则名称、所属水库编号、控制站点名称、判断类型、判断条件、判断数量、控制水库下泄流量、控制库水位等属性,以及涨水、退水、其他情况、控制水库下泄流量等关联关系;之后建立业务规则库的顶层模型(例如图3所示,图3中用不在长虚线矩形框内的实线矩形框代表实体,图3中用位于实体右侧且在长虚线矩形框内的实线矩形框代表属性,图3中用位于实体与长虚线矩形框之间的短虚线矩形框代表关联关系),按照该顶层模型所包含的实体、关联关系和属性将该模型存储至图数据库中。
步骤二,根据顶层模型结构提取知识。
经过调研,将收集到的流域范围内防洪有关的水利对象基本资料、气象水文资料、河道及湖泊防洪相关资料、防洪工程现状资料、防洪非工程措施现状资料、经济社会状况资料、防洪规划资料、防汛管理资料等在各分类的基础之上再初步分为结构化、半结构化、非结构化三种资料类型,并使用对应的已编写的Python脚本的资料处理方法,将需要处理的文件分别放入指定的文件夹中,直接运行脚本即可,输出的处理过后的资料为csv文件或txt文件。利用Brat按照构建的顶层模型从处理后得到的txt格式文件中标记出实体、关系以及对应的属性;向提前编写的对应知识提取Python脚本输入csv文件的绝对路径,从而通过该Python脚本从处理后得到的csv文件中提取出相应的知识。
步骤三,对同名异意或同意异名的知识进行知识融合。
不同数据来源的知识提取完毕后,还需要人工检查以判断提取出来的知识中是否有同名异意或同意异名的实体、关联关系或属性出现,并及时进行知识融合处理。
步骤四,知识存储。
通过提前编写的Python脚本将步骤三得到的知识存储到图数据库中。
步骤五,知识可视化。
打开预先建立的知识可视化对应的网络链接,即可查看步骤四中保存的知识。例如图4所示的知识图谱可视化展示图,在上方搜索栏中可对图数据库进行知识搜索,三个输入框分别用于输入起始实体名称、输入关系(即关联关系)、终点实体名称;当三个输入框为空时,搜索结果为用户权限内的所有知识;当仅用于输入起始实体名称的输入框不为空时,搜索结果为用户权限内与输入的起始实体名称相关联的所有一级知识;当仅用于输入起始实体名称的输入框和用于输入关系的输入框均不为空时,搜索结果为用户权限内与输入的起始实体名称相关联的与输入的关系对应的连续六级以内的知识;当三个输入框均不为空时,搜索结果为用户权限内与输入的起始实体名称、关系和终点实体名称对应的知识,以及与该知识相关联的连续五级以内的关联知识。另外,可对用户选中的关系及实体的进行突出显示(如设置成高亮色、添加特殊符号等),可对用户点击的实体后将弹出实体包含的属性信息,双击实体将自动搜索该实体后一级关联知识的内容。
上述操作方式中,各个步骤已通过Python脚本进行编程,可直接通过向Python脚本输入指定参数(包括csv文件的名称、csv文件的地址等)进行知识的生成与知识图谱的存储,并通过B/S架构系统开发实现知识图谱的可视化展示,最终建立了切实可用的流域防洪知识图谱构建方案,相关用户可直接进行操作和使用。
上述流域防洪知识图谱构建方法与现有技术相比具有以下优点:
1、时间成本低、可靠度高、避免作业人员长时间重复性工作,收集资料统一处理及知识提取与可视化应用更为便捷,能够提高工作效率。
2、最终形成的顶层模型、经过处理后的资料以及提取后的知识等成果的运用程度高。
3、知识更加完备,通过知识库分类、顶层模型构建后提取的知识更加清晰、全面、丰富。
4、知识显示更为直观,可视化程度更高,与实际流域防洪应用的结合度更高,知识内容更为精准。
5、结合传统流域、防洪相关关系型数据库、相关信息的管理、对流域防洪知识的提取更为全面规范、方便核查校对,为流域防洪知识的融合提供有效、全方位的帮助。
6、验证的有效性,通过提取结果确定的知识可以通过可视化集成展示、不同来源知识的融合,进行实际的验证和调整,并反向完善顶层模型,使得最终知识更为真实有效,结果更为客观全面。
综上所述,上述流域防洪知识图谱构建方法信息完备、实现方便、可视化程度高、可操作性强、可靠性强,大幅度提高了流域防洪知识图谱构建的效率,节约了时间成本,而且能确保满足流域防洪知识应用的各项要求。
基于上述流域防洪知识图谱构建方法,本发明实施例还提供一种流域防洪知识图谱构建装置,参见图5所示,该装置可以包括以下模块:
顶层模型构建模块502,可以用于基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个所述防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性。
知识数据提取模块504,可以用于基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,所述知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性。
知识图谱生成模块506,可以用于基于预设的图数据库,生成所述知识数据的知识图谱;其中,所述知识图谱中用节点表征实体,所述知识图谱中用节点间的连线表征实体间的关联关系。
本发明实施例提供的一种流域防洪知识图谱构建装置,基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性;基于多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性;基于预设的图数据库,生成知识数据的知识图谱;其中,知识图谱中用节点表征实体,知识图谱中用节点间的连线表征实体间的关联关系。采用上述技术可以提高构建知识图谱的效率和准确性,从而满足流域防洪的相关应用需求。
上述多个防洪知识库可以包括水利对象关联关系库、业务规则库、专家经验库和历史场景库;上述顶层模型构建模块502还可以用于:基于所述水利对象关联关系库构建第一顶层模型;其中,所述水利对象关联关系库的实体包括防洪工程、水文监测站点和防洪保护对象;基于所述业务规则库构建第二顶层模型;其中,所述业务规则库的实体、关联关系和属性均与已有的水库防洪调度规则对应;基于所述专家经验库构建第三顶层模型;其中,所述专家经验库的实体包括决策指标、专家经验规则和控泄流量;基于所述历史场景库构建第四顶层模型;其中,所述历史场景库的实体、关联关系和属性均与历史洪水场景对应。
参见图5所示,该装置还可以包括:
存储模块508,可以用于通过所述图数据库以csv文件的形式存储每个所述顶层模型的内容。
处理模块510,可以用于获取所述目标流域对应的基础防洪资料;其中,所述基础防洪资料包括气象水文资料、河道及湖泊防洪资料、防洪工程现状资料、防洪非工程现状资料、经济社会状况资料、防洪规划资料、防汛管理资料;将所述基础防洪资料划分成结构化数据、半结构化数据和非结构化数据;通过预先编写的Python脚本分别对所述结构化数据、所述半结构化数据和所述非结构化数据进行处理,得到所述多个防洪数据文件;其中,所述多个防洪数据文件包括所述结构化数据对应的第一csv文件、所述半结构化数据对应的第二csv文件和所述非结构化数据对应的txt文件。
上述知识数据提取模块504还可以用于:通过预设文本标注工具对所述txt文件的段落中存在的第一知识数据进行标注,并为标注后的知识数据生成相应的标注文件;其中,所述标注文件中以不同行字段分别记录不同实体、不同关联关系和不同属性;通过所述Python脚本从所述标注文件中提取出所需的第二知识数据,并将所述第二知识数据存储成第三csv文件;其中,所述第三csv文件包括所述第二知识数据中每个实体和每个属性各自的唯一标识。
上述图数据库可以包括所述知识数据的每个实体、每个关联关系和每个属性各自对应的图对象;上述知识数据提取模块504还可以用于:从所述第一csv文件、所述第二csv文件和所述第三csv文件中读取出所需的第三知识数据,并应用所述第三知识数据的实体、关联关系和属性更新所述图数据库中的图对象。
参见图5所示,该装置还可以包括:
知识图谱展示模块512,可以用于基于所述图数据库,可视化展示所述知识图谱。
融合模块514,可以用于按照预设规则对所述知识数据中的实体、关联关系和属性进行融合,并应用融合后的数据更新所述多个顶层模型。
本发明实施例所提供的流域防洪知识图谱装置,其实现原理及产生的技术效果和前述流域防洪知识图谱构建方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例还提供了一种电子设备,如图6所示,为该电子设备的结构示意图,其中,该电子设备包括处理器61和存储器60,该存储器60存储有能够被该处理器61执行的计算机可执行指令,该处理器61执行该计算机可执行指令以实现上述流域防洪知识图谱构建方法。
在图6示出的实施方式中,该电子设备还包括总线62和通信接口63,其中,处理器61、通信接口63和存储器60通过总线62连接。
其中,存储器60可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线62可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线62可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器61可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器61中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器61可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器61读取存储器中的信息,结合其硬件完成前述实施例的流域防洪知识图谱构建方法的步骤。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种流域防洪知识图谱构建方法,其特征在于,所述方法包括:
基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个所述防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性;
基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,所述知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性;
基于预设的图数据库,生成所述知识数据的知识图谱;其中,所述知识图谱中用节点表征实体,所述知识图谱中用节点间的连线表征实体间的关联关系。
2.根据权利要求1所述的方法,其特征在于,所述多个防洪知识库包括水利对象关联关系库、业务规则库、专家经验库和历史场景库;基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型的步骤包括:
基于所述水利对象关联关系库构建第一顶层模型;其中,所述水利对象关联关系库的实体包括流域、水系、河流、湖泊、防洪工程、水文监测站点和防洪保护对象;
基于所述业务规则库构建第二顶层模型;其中,所述业务规则库的实体、关联关系和属性均与已有的水库防洪调度规则对应;
基于所述专家经验库构建第三顶层模型;其中,所述专家经验库的实体包括决策指标、专家经验规则和控泄流量;
基于所述历史场景库构建第四顶层模型;其中,所述历史场景库的实体、关联关系和属性均与历史洪水场景对应。
3.根据权利要求1所述的方法,其特征在于,基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据的步骤之前,所述方法还包括:
通过所述图数据库以csv文件的形式存储每个所述顶层模型的内容。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标流域对应的基础防洪资料;其中,所述基础防洪资料包括气象水文资料、河道及湖泊防洪资料、防洪工程现状资料、防洪非工程现状资料、经济社会状况资料、防洪规划资料、防汛管理资料;
将所述基础防洪资料划分成结构化数据、半结构化数据和非结构化数据;
通过预先编写的Python脚本分别对所述结构化数据、所述半结构化数据和所述非结构化数据进行处理,得到所述多个防洪数据文件;其中,所述多个防洪数据文件包括所述结构化数据对应的第一csv文件、所述半结构化数据对应的第二csv文件和所述非结构化数据对应的txt文件。
5.根据权利要求4所述的方法,其特征在于,基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据的步骤包括:
通过预设文本标注工具对所述txt文件的段落中存在的第一知识数据进行标注,并为标注后的知识数据生成相应的标注文件;其中,所述标注文件中以不同行字段分别记录不同实体、不同关联关系和不同属性;
通过所述Python脚本从所述标注文件中提取出所需的第二知识数据,并将所述第二知识数据存储成第三csv文件;其中,所述第三csv文件包括所述第二知识数据中每个实体和每个属性各自的唯一标识。
6.根据权利要求5所述的方法,其特征在于,所述图数据库包括所述知识数据的每个实体、每个关联关系和每个属性各自对应的图对象;基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据的步骤还包括:
从所述第一csv文件、所述第二csv文件和所述第三csv文件中读取出所需的第三知识数据,并应用所述第三知识数据的实体、关联关系和属性更新所述图数据库中的图对象。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述图数据库,可视化展示所述知识图谱。
8.根据权利要求1所述的方法,其特征在于,基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据的步骤之后,所述方法还包括:
按照预设规则对所述知识数据中的实体、关联关系和属性进行融合,并应用融合后的数据更新所述多个顶层模型。
9.一种流域防洪知识图谱构建装置,其特征在于,所述装置包括:
顶层模型构建模块,用于基于预先确认需要建立的目标流域的多个防洪知识库,构建多个顶层模型;其中,每个所述防洪知识库包括各自的实体和实体间的关联关系,每个实体和每个关联关系均具有各自的属性;
知识数据提取模块,用于基于所述多个顶层模型,从预先处理的多个防洪数据文件中提取所需的知识数据;其中,所述知识数据包括实体、实体间的关联关系以及每个实体和每个关联关系各自的属性;
知识图谱生成模块,用于基于预设的图数据库,生成所述知识数据的知识图谱;其中,所述知识图谱中用节点表征实体,所述知识图谱中用节点间的连线表征实体间的关联关系。
10.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至8任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211583246.7A CN116010612A (zh) | 2022-12-09 | 2022-12-09 | 流域防洪知识图谱构建方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211583246.7A CN116010612A (zh) | 2022-12-09 | 2022-12-09 | 流域防洪知识图谱构建方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116010612A true CN116010612A (zh) | 2023-04-25 |
Family
ID=86020900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211583246.7A Pending CN116010612A (zh) | 2022-12-09 | 2022-12-09 | 流域防洪知识图谱构建方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116010612A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116431835A (zh) * | 2023-06-06 | 2023-07-14 | 中汽数据(天津)有限公司 | 汽车认证领域自动化知识图谱构建方法、设备和介质 |
CN117009452A (zh) * | 2023-07-25 | 2023-11-07 | 浪潮智慧科技有限公司 | 一种水文业务数据获取方法、设备及介质 |
CN117473103A (zh) * | 2023-11-20 | 2024-01-30 | 水利部信息中心(水利部水文水资源监测预报中心) | 基于知识图谱的洪水预报方法、系统、存储介质及设备 |
US20240070578A1 (en) * | 2021-06-28 | 2024-02-29 | Shanghai Huaxing Digital Technology Co Ltd | Engineering facility scheduling method and system, and engineering facility |
CN117993499A (zh) * | 2024-04-03 | 2024-05-07 | 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) | 一种流域防洪四预平台的多模态知识图谱构建方法 |
CN118211701A (zh) * | 2024-03-07 | 2024-06-18 | 中国长江电力股份有限公司 | 一种基于水调来水预测的电站防洪预警方法及系统 |
CN118485230A (zh) * | 2024-04-11 | 2024-08-13 | 广东省水利水电科学研究院 | 一种水资源综合规划知识图谱构建与地图联动方法及装置 |
CN119809387A (zh) * | 2025-03-11 | 2025-04-11 | 华南理工大学 | 面向智慧水利的ai知识库构建方法及系统 |
-
2022
- 2022-12-09 CN CN202211583246.7A patent/CN116010612A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240070578A1 (en) * | 2021-06-28 | 2024-02-29 | Shanghai Huaxing Digital Technology Co Ltd | Engineering facility scheduling method and system, and engineering facility |
CN116431835A (zh) * | 2023-06-06 | 2023-07-14 | 中汽数据(天津)有限公司 | 汽车认证领域自动化知识图谱构建方法、设备和介质 |
CN116431835B (zh) * | 2023-06-06 | 2023-09-15 | 中汽数据(天津)有限公司 | 汽车认证领域自动化知识图谱构建方法、设备和介质 |
CN117009452A (zh) * | 2023-07-25 | 2023-11-07 | 浪潮智慧科技有限公司 | 一种水文业务数据获取方法、设备及介质 |
CN117473103A (zh) * | 2023-11-20 | 2024-01-30 | 水利部信息中心(水利部水文水资源监测预报中心) | 基于知识图谱的洪水预报方法、系统、存储介质及设备 |
CN118211701A (zh) * | 2024-03-07 | 2024-06-18 | 中国长江电力股份有限公司 | 一种基于水调来水预测的电站防洪预警方法及系统 |
CN117993499A (zh) * | 2024-04-03 | 2024-05-07 | 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) | 一种流域防洪四预平台的多模态知识图谱构建方法 |
CN117993499B (zh) * | 2024-04-03 | 2024-06-04 | 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) | 一种流域防洪四预平台的多模态知识图谱构建方法 |
CN118485230A (zh) * | 2024-04-11 | 2024-08-13 | 广东省水利水电科学研究院 | 一种水资源综合规划知识图谱构建与地图联动方法及装置 |
CN119809387A (zh) * | 2025-03-11 | 2025-04-11 | 华南理工大学 | 面向智慧水利的ai知识库构建方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116010612A (zh) | 流域防洪知识图谱构建方法、装置及电子设备 | |
US20230162051A1 (en) | Method, device and apparatus for execution of automated machine learning process | |
CN115358201B (zh) | 一种期货领域的投研报告处理方法和系统 | |
CN111553556A (zh) | 业务数据分析方法、装置、计算机设备及存储介质 | |
CN115982329A (zh) | 一种工程施工方案编制依据的智能生成方法及系统 | |
Xiang et al. | Flood Markup Language–A standards-based exchange language for flood risk communication | |
Seedah et al. | Ontology for querying heterogeneous data sources in freight transportation | |
CN119807447A (zh) | 一种档案检索方法、系统、产品及可读存储介质 | |
CN112308464B (zh) | 业务流程数据处理方法和装置 | |
CN113609842A (zh) | 一种获取景区评论数据、旅行体验评价的方法 | |
CN118586489A (zh) | 一种面向安全生产应急管理的知识图谱构建方法 | |
CN116244963A (zh) | 基于大数据的石油测井预测方法以及预测装置 | |
CN117235219A (zh) | 一种基于防汛需求的水库知识智能问答系统 | |
CN115688729A (zh) | 一种输变电工程造价数据集成管理系统及其方法 | |
CN116340534A (zh) | 一种识别新能源异常数据的知识图谱构建方法和系统 | |
Li et al. | Information extraction for semantic enrichment of BIM for bridges | |
CN111914538B (zh) | 一种航道通告信息智能空间匹配方法及系统 | |
CN115017251A (zh) | 一种用于智慧城市的标准映射地图建立方法及系统 | |
CN112668836A (zh) | 一种面向风险图谱的关联风险证据高效挖掘与监控方法和装置 | |
Lina | OpenBridgeGraph: Integrating Open Government Data for Bridge Management | |
CN117648912B (zh) | 一种识别多格式电子表格源数据的方法 | |
CN119577196B (zh) | 基于多维数据校验的企业股权图谱构建方法及存储介质 | |
CN118657139B (zh) | 基于位置信息及版式匹配的表格信息抽取方法及系统 | |
Liu et al. | Journal of intelligent systems: Predictive models for overall health of hydroelectric equipment based on multi-measurement point output | |
Kurita et al. | International polymer processing: Evaluation of thermal contact resistance of molten resin–mold interface during high-thermal-conductivity polyphenylene sulfide filling in injection molding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |