CN117009452A - 一种水文业务数据获取方法、设备及介质 - Google Patents
一种水文业务数据获取方法、设备及介质 Download PDFInfo
- Publication number
- CN117009452A CN117009452A CN202310919437.4A CN202310919437A CN117009452A CN 117009452 A CN117009452 A CN 117009452A CN 202310919437 A CN202310919437 A CN 202310919437A CN 117009452 A CN117009452 A CN 117009452A
- Authority
- CN
- China
- Prior art keywords
- hydrologic
- knowledge
- data
- entity
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000000007 visual effect Effects 0.000 claims abstract description 8
- 238000013499 data model Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 11
- 238000007726 management method Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000003673 groundwater Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008521 reorganization Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Abstract
本申请公开了一种水文业务数据获取方法、设备及介质,方法包括:确定水文业务数据对应的存储类型,根据存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识;其中,存储类型包括结构化存储和非结构化存储;对水文知识进行识别,以得到水文知识对应的实体三元组和属性三元组;根据实体三元组和属性三元组,对水文知识进行可视化建模,得到水文知识图谱;生成水文知识图谱对应的检索索引,在接收到用户发送的水文业务数据请求后,根据检索索引,获取水文业务数据请求对应的水文业务数据。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种水文业务数据获取方法、设备及介质。
背景技术
随着水文业务应用系统的建设,水文行业积累了大量的数据,包括结构化数据和非结构化数据。结构化数据主要存储于雨水情监测系统、地下水监测系统、站网管理系统等应用数据库中,非结构化数据包括站网整编资料、雨水情报告、水质报告、水资源监测报告等文档资料以及互联网信息资料。
目前,水文管理单位大多数采用建设水文大数据中心的方式,对各类水文业务数据进行汇聚治理,但是水文大数据中心仅是对水文业务数据的简单整合,并未对水文业务中涉及的水文站、水库、湖泊、河流等各类实体对象进行数据的融合与关系分析。通过水文大数据中心获取到水文业务数据后,对数据进行价值挖掘较为困难,数据价值无法最大化。
发明内容
为了解决上述问题,本申请提出了一种水文业务数据获取方法,包括:
确定水文业务数据对应的存储类型,根据所述存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识;其中,所述存储类型包括结构化存储和非结构化存储;
对所述水文知识进行识别,以得到所述水文知识对应的实体三元组和属性三元组;
根据所述实体三元组和所述属性三元组,对所述水文知识进行可视化建模,得到水文知识图谱;
生成所述水文知识图谱对应的检索索引,在接收到用户发送的水文业务数据请求后,根据所述检索索引,获取所述水文业务数据请求对应的水文业务数据。
在本申请的一种实现方式中,确定水文业务数据对应的存储类型,根据所述存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识,具体包括:
根据所述水文业务数据对应的数据源,确定所述水文业务数据对应的存储类型;
针对所述存储类型为结构化存储的水文业务数据,构建与水文业务相关联的水文本体模型和水文本体数据模型,并根据所述水文本体模型和所述水文本体数据模型,从预设的水文数据库中抽取相应的水文知识;
针对所述存储类型为非结构化存储的水文业务数据,根据所述水文本体模型和所述水文本体数据模型,构建用于抽取水文知识的抽取规则和水文词典,并根据所述抽取规则和所述水文词典,从预设的水文文档中抽取相应的水文知识。
在本申请的一种实现方式中,构建与水文业务相关联的水文本体模型和水文本体数据模型,具体包括:
确定与水文业务相关联的水文实体以及各水文实体之间的关系,根据所述水文实体和所述关系,构建所述水文业务对应的水文本体模型;
确定各所述水文实体对应的数据属性,根据所述数据属性,构建所述水文实体对应的水文本体数据模型。
在本申请的一种实现方式中,对所述水文知识进行识别,以得到所述水文知识对应的实体三元组和属性三元组,具体包括:
对所述水文知识进行识别,以从所述水文知识中提取到所述水文实体、所述关系和所述数据属性;
针对每个水文实体,确定所述水文实体和与所述水文实体之间存在关联的其他水文实体,以及所述水文实体和所述其他水文实体之间的关系;
按照所述水文实体、所述关系和所述其他水文实体的第一链接顺序,构建所述水文知识对应的实体三元组;
确定所述水文实体对应的数据属性以及所述数据属性对应的数据数据属性值,按照所述水文实体、所述数据属性和所述数据属性值的第二链接顺序,构建所述水文知识对应的属性三元组。
在本申请的一种实现方式中,根据所述实体三元组和所述属性三元组,对所述水文知识进行可视化建模,得到水文知识图谱,具体包括:
调用预设的图形数据库接口,将所述实体三元组和所述属性三元组中的水文实体转换为实体节点,所述属性三元组中的数据属性值转换为属性值节点,以及,将所述实体三元组中的关系作为连接相邻实体节点的边,所述属性三元组中的数据属性作为连接所述实体节点和所述属性值节点的边;
将所述实体节点、所述属性值节点和所述边存储到预设的图形数据库中,以对所述水文知识进行可视化,得到所述水文知识图谱。
在本申请的一种实现方式中,生成所述水文知识图谱对应的检索索引,具体包括:
将所述水文知识图谱中的实体节点名称作为索引名称,针对每个实体节点,确定所述实体节点对应的数据属性,并将所述数据属性作为所述实体节点对应的索引域;
确定所述数据属性对应的索引域类型,根据所述索引域类型,生成所述数据属性对应的域标识符;
根据所述索引名称、所述索引域和所述域标识符,生成所述水文知识图谱对应的检索索引。
在本申请的一种实现方式中,根据所述抽取规则和所述水文词典,从预设的水文文档中抽取相应的水文知识之后,所述方法还包括:
将抽取到的水文知识与所述水文知识图谱中存储的水文知识进行对比,以确定需存储至所述水文知识图谱中的指定水文知识;
对所述指定水文知识进行审核,并在审核通过后,确定所述指定水文知识对应的指定实体三元组和指定属性三元组;
根据所述指定实体三元组和所述指定属性三元组,对所述水文知识图谱进行更新。
在本申请的一种实现方式中,所述水文实体至少包括以下任意一项或多项:水文站点实体、水文位置实体和水文管理要素实体;
所述数据属性至少包括以下任意一项或多项:水文站点代码、水文站点名称、水文站点类型、水文站点经度、水文站点纬度、水文站点站址、设站年月、始报年月。
本申请实施例提供了一种水文业务数据获取设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一项所述的一种水文业务数据获取方法。
本申请实施例提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为执行如上述任一项所述的一种水文业务数据获取方法。
通过本申请提出的一种水文业务数据获取方法能够带来如下有益效果:
根据水文业务数据的存储类型对水文知识进行抽取,所抽取到的水文知识来自于不同类型的数据源,提高了水文数据多样性。通过实体三元组和属性三元组构建水文知识图谱,能够直观展示水文相关对象以及对象之间的关系,深度挖掘了水文数据价值,为水文业务工作者业务决策提供支撑。根据水文知识图谱生成相应的检索索引,能够提高水文业务数据的检索效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种水文业务数据获取方法的流程示意图;
图2为本申请实施例提供的一种水文知识图谱示意图;
图3为本申请实施例提供的一种水文业务数据获取设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
如图1所示,本申请实施例提供的一种水文业务数据获取方法,包括:
S101:确定水文业务数据对应的存储类型,根据存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识;其中,存储类型包括结构化存储和非结构化存储。
水文业务数据指的是水文相关资料以及水文业务应用系统运行过程中产生的数据,包括结构化数据和非结构化数据。其中,结构化数据主要以结构化存储的形式存储于雨水情监测系统、地下水监测系统、站网管理系统等水文数据库中。非结构化数据存包括站网整编资料、雨水情报告、水质报告、水资源监测报告等文档资料以及互联网信息资料,数据以非结构化存储的形式存储于上述数据载体中。
本申请实施例可根据水文数据和水文业务的整体知识架构对水文数据源中的水文知识进行抽取,不同存储类型的水文业务数据所对应的水文知识抽取方式也存在不同。服务器可根据存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识。其中,水文数据源指的是上述用于存储结构化数据和非结构化数据的数据源。
在一个实施例中,水文业务数据所在的数据源包括水文数据库和水文文档,根据数据源,可确定水文业务数据对应的存储类型。其中,存储于水文数据库中的水文业务数据对应的存储类型为结构化存储,存储于水文文档中的水文业务数据对应的存储类型为非结构化存储。对于结构化数据来说,可采用自顶向下的方式来构建知识图谱,即先确定知识模型后进行知识抽取,而对于非结构化数据来说,可采用自底向上的方式构建知识图谱,即先抽取知识再对知识模型进行填充。
具体地,针对结构化数据,构建与水文业务相关联的水文本体模型和水文本体数据模型,并根据水文本体模型和水文本体数据模型,从预设的水文数据库中抽取相应的水文知识。
水文本体模型主要用于描述不同水文实体之间的关系,水文实体至少包括以下任意一项或多项:水文站点实体、水文位置实体和水文管理要素实体。水文站点实体指的是水文站,水文位置实体指的是水文站所在位置,比如行政区划、流域、河流等,水文管理要素实体指的是水文站的管理要素,比如管理单位、上级测站等。在构建水文本体模型时,首先,服务器需确定与水文业务相关联的水文实体以及各水文实体之间的关系,根据水文实体和关系,构建水文业务对应的水文本体模型。比如,水文本体模型的架构为水文站-所在位置-行政区划、水文站-所在流域-流域、水文站-所属河流-河流、水文站-所在湖泊-湖泊、水文站-所属水库-水库、水文站-所属管理单位-单位、水文站-上级测站-水文站等。
水文本体数据模型主要用于描述水文实体的数据属性,数据属性至少包括以下任意一项或多项:水文站点代码、水文站点名称、水文站点类型、水文站点经度、水文站点纬度、水文站点站址、设站年月、始报年月。根据各水文实体对应的数据属性,可构建出相应的水文本体数据模型。
在得到水文本体模型和水文本体数据模型后,服务器可根据上述模型,将水文知识从水文数据库中抽取到Hbase中进行存储。
针对非结构化数据,可根据结构化数据处理过程中已经得到的水文本体模型和水文本体数据模型,构建用于抽取水文知识的抽取规则和水文词典,抽取规则可用于定义如何抽取水文实体和水文关系,水文词典可用于所需抽取的数据属性,结合自然语言处理技术,便可根据抽取规则和水文词典,从预设的水文文档中抽取相应的水文知识。
待从水文文档等非结构化数据源中抽取到水文知识后,需将抽取到的水文知识存储到Hbase中。
S102:对水文知识进行识别,以得到水文知识对应的实体三元组和属性三元组。
Hbase用于存储从不同数据源中抽取到的水文知识,针对Hbase中存储的水文知识,通过对水文知识进行识别,可得到水文知识对应的实体三元组和属性三元组。
具体地,对水文知识进行识别,以从水文知识中提取到水文实体、关系和数据属性。针对每个水文实体,确定水文实体和与水文实体之间存在关联的其他水文实体,以及水文实体和其他水文实体之间的关系,然后,按照水文实体、关系和所他水文实体的第一链接顺序,构建水文知识对应的实体三元组。实体三元组的结构为水文实体-关系-水文实体。
进一步地,确定水文实体对应的数据属性以及数据属性对应的数据数据属性值,按照水文实体、数据属性和数据属性值的第二链接顺序,构建水文知识对应的属性三元组。属性三元组的结构为水文实体-数据属性-数据属性值。
S103:根据实体三元组和属性三元组,对水文知识进行可视化建模,得到水文知识图谱。
在得到实体三元组和属性三元组后,需要以图数据的形式存储三元组数据,实现水文知识的可视化建模,从而得到相应的水文知识图谱。
具体地,调用预设的图形数据库接口,比如JanusGraph接口,将实体三元组和属性三元组中的水文实体转换为实体节点,属性三元组中的数据属性值转换为属性值节点,以及,将实体三元组中的关系作为连接相邻实体节点的边,属性三元组中的数据属性作为连接实体节点和属性值节点的边。
进一步地,将实体节点、属性值节点和边存储到预设的图形数据库中,以对水文知识进行可视化,得到水文知识图谱。如图2所示的一种水文知识图谱示意图,知识图谱节点不仅可以表示水文实体,还可表示数据属性值,而连接不同节点的边既可以表示水文实体之间的关系,比如,所属位置、所属水库等,还可以表示数据属性,比如流域面积、水文站类型等。
由于非结构化数据是在结构化数据处理过程中已得到的模型基础上进行的知识抽取,从水文文档中抽取到水文知识后,需要将上述水文知识与现有知识图谱进行合并。
具体地,将抽取到的水文知识与水文知识图谱中存储的水文知识进行对比,从而确定出需存储至水文知识图谱中的指定水文知识。指定水文知识指的是水文知识图谱中不存在的水文知识,或是已经存在但需填充完整的水文知识。
进一步地,对指定水文知识进行审核,在确定指定水文知识无误且审核通过后,确定指定水文知识对应的指定实体三元组和指定属性三元组,然后根据指定实体三元组和指定属性三元组,对水文知识图谱进行更新。也就是,对已经存在的水文实体、关系和数据属性进行补充,或是对不存在的水文实体、关系和数据属性进行增加。
通过实体三元组和属性三元组,对水文实体、水文实体关系、数据属性和数据属性值进行了融合加工,提高了水文业务数据的直观性,更便于展示各类实体对象和属性对象之间的关系,有利于水文数据价值的深度挖掘。
需要说明的是,在水文知识图谱构建完成后,可通过Gephi Toolkit可视化技术,通过导入图数据、对图数据进行过滤、设置展示布局、设置颜色、设置节点大小等方法,实现直观地展示各类水文站、水库、湖泊、河流等各类水文实体及其之间的关系。
S104:生成水文知识图谱对应的检索索引,在接收到用户发送的水文业务数据请求后,根据检索索引,获取水文业务数据请求对应的水文业务数据。
在得到水文知识图谱后,可通过检索索引优化水文业务数据的检索效率。基于ElasticSearch搜索引擎,将水文知识图谱中的实体节点名称作为索引名称,针对每个实体节点,确定实体节点对应的数据属性,并将数据属性作为实体节点对应的索引域。在确定出索引名称和索引域后,确定数据属性对应的索引域类型,根据索引域类型,生成数据属性对应的域标识符。如此,根据索引名称、索引域和域标识符,生成水文知识图谱对应的检索索引。
在进行水文业务数据检索时,接收到用户发送的水文业务数据请求后,可通过检索索引,快速定位到索引名称对应的实体节点和索引域对应的数据属性,最终获取到水文业务数据请求对应的水文业务数据。本申请实施例获取到的水文业务数据不再是单一数据,其能够反映不同的水文实体之间的关系和数据属性,深度挖掘了水文数据价值,同时为水文业务工作者业务决策提供支撑。
以上为本申请提出的方法实施例。基于同样的思路,本申请的一些实施例还提供了上述方法对应的设备和非易失性计算机存储介质。
图3为本申请实施例提供的一种水文业务数据获取设备的结构示意图。如图3所示,包括:
至少一个处理器;以及,
至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
确定水文业务数据对应的存储类型,根据存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识;其中,存储类型包括结构化存储和非结构化存储;
对水文知识进行识别,以得到水文知识对应的实体三元组和属性三元组;
根据实体三元组和属性三元组,对水文知识进行可视化建模,得到水文知识图谱;
生成水文知识图谱对应的检索索引,在接收到用户发送的水文业务数据请求后,根据检索索引,获取水文业务数据请求对应的水文业务数据。
本申请实施例提供了一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:
确定水文业务数据对应的存储类型,根据存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识;其中,存储类型包括结构化存储和非结构化存储;
对水文知识进行识别,以得到水文知识对应的实体三元组和属性三元组;
根据实体三元组和属性三元组,对水文知识进行可视化建模,得到水文知识图谱;
生成水文知识图谱对应的检索索引,在接收到用户发送的水文业务数据请求后,根据检索索引,获取水文业务数据请求对应的水文业务数据。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种水文业务数据获取方法,其特征在于,所述方法包括:
确定水文业务数据对应的存储类型,根据所述存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识;其中,所述存储类型包括结构化存储和非结构化存储;
对所述水文知识进行识别,以得到所述水文知识对应的实体三元组和属性三元组;
根据所述实体三元组和所述属性三元组,对所述水文知识进行可视化建模,得到水文知识图谱;
生成所述水文知识图谱对应的检索索引,在接收到用户发送的水文业务数据请求后,根据所述检索索引,获取所述水文业务数据请求对应的水文业务数据。
2.根据权利要求1所述的一种水文业务数据获取方法,其特征在于,确定水文业务数据对应的存储类型,根据所述存储类型对应的指定方式,从预设的水文数据源中抽取与水文业务相关的水文知识,具体包括:
根据所述水文业务数据对应的数据源,确定所述水文业务数据对应的存储类型;
针对所述存储类型为结构化存储的水文业务数据,构建与水文业务相关联的水文本体模型和水文本体数据模型,并根据所述水文本体模型和所述水文本体数据模型,从预设的水文数据库中抽取相应的水文知识;
针对所述存储类型为非结构化存储的水文业务数据,根据所述水文本体模型和所述水文本体数据模型,构建用于抽取水文知识的抽取规则和水文词典,并根据所述抽取规则和所述水文词典,从预设的水文文档中抽取相应的水文知识。
3.根据权利要求2所述的一种水文业务数据获取方法,其特征在于,构建与水文业务相关联的水文本体模型和水文本体数据模型,具体包括:
确定与水文业务相关联的水文实体以及各水文实体之间的关系,根据所述水文实体和所述关系,构建所述水文业务对应的水文本体模型;
确定各所述水文实体对应的数据属性,根据所述数据属性,构建所述水文实体对应的水文本体数据模型。
4.根据权利要求1所述的一种水文业务数据获取方法,其特征在于,对所述水文知识进行识别,以得到所述水文知识对应的实体三元组和属性三元组,具体包括:
对所述水文知识进行识别,以从所述水文知识中提取到所述水文实体、所述关系和所述数据属性;
针对每个水文实体,确定所述水文实体和与所述水文实体之间存在关联的其他水文实体,以及所述水文实体和所述其他水文实体之间的关系;
按照所述水文实体、所述关系和所述其他水文实体的第一链接顺序,构建所述水文知识对应的实体三元组;
确定所述水文实体对应的数据属性以及所述数据属性对应的数据数据属性值,按照所述水文实体、所述数据属性和所述数据属性值的第二链接顺序,构建所述水文知识对应的属性三元组。
5.根据权利要求1所述的一种水文业务数据获取方法,其特征在于,根据所述实体三元组和所述属性三元组,对所述水文知识进行可视化建模,得到水文知识图谱,具体包括:
调用预设的图形数据库接口,将所述实体三元组和所述属性三元组中的水文实体转换为实体节点,所述属性三元组中的数据属性值转换为属性值节点,以及,将所述实体三元组中的关系作为连接相邻实体节点的边,所述属性三元组中的数据属性作为连接所述实体节点和所述属性值节点的边;
将所述实体节点、所述属性值节点和所述边存储到预设的图形数据库中,以对所述水文知识进行可视化,得到所述水文知识图谱。
6.根据权利要求5所述的一种水文业务数据获取方法,其特征在于,生成所述水文知识图谱对应的检索索引,具体包括:
将所述水文知识图谱中的实体节点名称作为索引名称,针对每个实体节点,确定所述实体节点对应的数据属性,并将所述数据属性作为所述实体节点对应的索引域;
确定所述数据属性对应的索引域类型,根据所述索引域类型,生成所述数据属性对应的域标识符;
根据所述索引名称、所述索引域和所述域标识符,生成所述水文知识图谱对应的检索索引。
7.根据权利要求2所述的一种水文业务数据获取方法,其特征在于,根据所述抽取规则和所述水文词典,从预设的水文文档中抽取相应的水文知识之后,所述方法还包括:
将抽取到的水文知识与所述水文知识图谱中存储的水文知识进行对比,以确定需存储至所述水文知识图谱中的指定水文知识;
对所述指定水文知识进行审核,并在审核通过后,确定所述指定水文知识对应的指定实体三元组和指定属性三元组;
根据所述指定实体三元组和所述指定属性三元组,对所述水文知识图谱进行更新。
8.根据权利要求3所述的一种水文业务数据获取方法,其特征在于,所述水文实体至少包括以下任意一项或多项:水文站点实体、水文位置实体和水文管理要素实体;
所述数据属性至少包括以下任意一项或多项:水文站点代码、水文站点名称、水文站点类型、水文站点经度、水文站点纬度、水文站点站址、设站年月、始报年月。
9.一种水文业务数据获取设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8任一项所述的一种水文业务数据获取方法。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
如权利要求1-8任一项所述的一种水文业务数据获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310919437.4A CN117009452A (zh) | 2023-07-25 | 2023-07-25 | 一种水文业务数据获取方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310919437.4A CN117009452A (zh) | 2023-07-25 | 2023-07-25 | 一种水文业务数据获取方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117009452A true CN117009452A (zh) | 2023-11-07 |
Family
ID=88566664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310919437.4A Pending CN117009452A (zh) | 2023-07-25 | 2023-07-25 | 一种水文业务数据获取方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117009452A (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110543571A (zh) * | 2019-08-07 | 2019-12-06 | 北京市天元网络技术股份有限公司 | 用于水利信息化的知识图谱构建方法以及装置 |
CN111522960A (zh) * | 2020-03-16 | 2020-08-11 | 河海大学 | 一种水知识概念图谱模型构建方法 |
CN112182330A (zh) * | 2020-09-23 | 2021-01-05 | 创新奇智(成都)科技有限公司 | 知识图谱构建方法、装置、电子设备及计算机存储介质 |
CN112765300A (zh) * | 2021-01-26 | 2021-05-07 | 河海大学 | 基于ArcGIS空间数据的水利对象关系图谱构建方法 |
CN113157947A (zh) * | 2021-05-20 | 2021-07-23 | 中国工商银行股份有限公司 | 知识图谱的构建方法、工具、装置和服务器 |
CN113190687A (zh) * | 2021-05-08 | 2021-07-30 | 上海爱数信息技术股份有限公司 | 知识图谱的确定方法、装置、计算机设备及存储介质 |
CN113590835A (zh) * | 2021-07-28 | 2021-11-02 | 上海致景信息科技有限公司 | 纺织行业数据的知识图谱构建方法、装置及处理器 |
CN113918725A (zh) * | 2021-08-31 | 2022-01-11 | 南京中禹智慧水利研究院有限公司 | 一种水务领域知识图谱的构建方法 |
CN114116915A (zh) * | 2021-10-28 | 2022-03-01 | 天津大学 | 一种基于三维数字平台的水利工程智能图谱系统 |
CN114841601A (zh) * | 2022-05-24 | 2022-08-02 | 保定金迪地下管线探测工程有限公司 | 一种排口水污染动态溯源分析方法及系统 |
CN115759459A (zh) * | 2022-12-01 | 2023-03-07 | 长江水利委员会水文局 | 一种雨水工情耦合的流域洪水流量集合概率智能预报方法 |
CN115795056A (zh) * | 2023-01-04 | 2023-03-14 | 中国电子科技集团公司第十五研究所 | 非结构化信息构建知识图谱的方法、服务器及存储介质 |
CN116010612A (zh) * | 2022-12-09 | 2023-04-25 | 中水珠江规划勘测设计有限公司 | 流域防洪知识图谱构建方法、装置及电子设备 |
CN116361479A (zh) * | 2023-01-16 | 2023-06-30 | 四创科技有限公司 | 一种基于知识图谱的水质溯源分析方法及终端 |
CN116383395A (zh) * | 2022-12-27 | 2023-07-04 | 中国水利水电科学研究院 | 一种水文模型领域知识图谱的构建方法 |
-
2023
- 2023-07-25 CN CN202310919437.4A patent/CN117009452A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110543571A (zh) * | 2019-08-07 | 2019-12-06 | 北京市天元网络技术股份有限公司 | 用于水利信息化的知识图谱构建方法以及装置 |
CN111522960A (zh) * | 2020-03-16 | 2020-08-11 | 河海大学 | 一种水知识概念图谱模型构建方法 |
CN112182330A (zh) * | 2020-09-23 | 2021-01-05 | 创新奇智(成都)科技有限公司 | 知识图谱构建方法、装置、电子设备及计算机存储介质 |
CN112765300A (zh) * | 2021-01-26 | 2021-05-07 | 河海大学 | 基于ArcGIS空间数据的水利对象关系图谱构建方法 |
CN113190687A (zh) * | 2021-05-08 | 2021-07-30 | 上海爱数信息技术股份有限公司 | 知识图谱的确定方法、装置、计算机设备及存储介质 |
CN113157947A (zh) * | 2021-05-20 | 2021-07-23 | 中国工商银行股份有限公司 | 知识图谱的构建方法、工具、装置和服务器 |
CN113590835A (zh) * | 2021-07-28 | 2021-11-02 | 上海致景信息科技有限公司 | 纺织行业数据的知识图谱构建方法、装置及处理器 |
CN113918725A (zh) * | 2021-08-31 | 2022-01-11 | 南京中禹智慧水利研究院有限公司 | 一种水务领域知识图谱的构建方法 |
CN114116915A (zh) * | 2021-10-28 | 2022-03-01 | 天津大学 | 一种基于三维数字平台的水利工程智能图谱系统 |
CN114841601A (zh) * | 2022-05-24 | 2022-08-02 | 保定金迪地下管线探测工程有限公司 | 一种排口水污染动态溯源分析方法及系统 |
CN115759459A (zh) * | 2022-12-01 | 2023-03-07 | 长江水利委员会水文局 | 一种雨水工情耦合的流域洪水流量集合概率智能预报方法 |
CN116010612A (zh) * | 2022-12-09 | 2023-04-25 | 中水珠江规划勘测设计有限公司 | 流域防洪知识图谱构建方法、装置及电子设备 |
CN116383395A (zh) * | 2022-12-27 | 2023-07-04 | 中国水利水电科学研究院 | 一种水文模型领域知识图谱的构建方法 |
CN115795056A (zh) * | 2023-01-04 | 2023-03-14 | 中国电子科技集团公司第十五研究所 | 非结构化信息构建知识图谱的方法、服务器及存储介质 |
CN116361479A (zh) * | 2023-01-16 | 2023-06-30 | 四创科技有限公司 | 一种基于知识图谱的水质溯源分析方法及终端 |
Non-Patent Citations (1)
Title |
---|
钱兵等: "智能运维之道 基于AI技术的应用实践", 31 January 2022, 机械工业出版社, pages: 41 - 50 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190301963A1 (en) | Processing data for predicting pipe failure | |
US11138243B2 (en) | Indexing geographic data | |
CN106709012A (zh) | 一种大数据分析方法及装置 | |
KR101809685B1 (ko) | 위치정제장치 및 그 방법 | |
CN110515968B (zh) | 用于输出信息的方法和装置 | |
CN111160867A (zh) | 大范围地域停车场大数据分析系统 | |
CN106547646B (zh) | 一种数据备份及恢复方法、数据备份及恢复装置 | |
KR102184048B1 (ko) | Gis 기반 토지 이용 계획 검토 시스템 및 방법 | |
Ashby et al. | Hydroviewer: A web application to localize global hydrologic forecasts | |
CN111177289A (zh) | 众源网络数据空间相关信息提取校验方法与系统 | |
Shbita et al. | Building spatio-temporal knowledge graphs from vectorized topographic historical maps | |
CN117009452A (zh) | 一种水文业务数据获取方法、设备及介质 | |
CN116127932A (zh) | 一种业务报表生成方法、设备及介质 | |
CN115018473A (zh) | 一种业务处理方法、装置、存储介质及设备 | |
CN110019225A (zh) | 数据处理的方法、装置、设备及介质 | |
Escoto et al. | Development of a digital twin for the monitoring of smart cities using open-source software | |
CN117056529A (zh) | 一种水文监测站数据的知识图谱构建方法、设备及介质 | |
CN110955760B (zh) | 判决结果的评价方法和相关装置 | |
CN112860725A (zh) | Sql自动生成方法和装置、存储介质及电子设备 | |
CN110134373A (zh) | 一种函数信息获取的方法以及装置 | |
Nas et al. | Analysis of Distribution Patterns in Mapping Cirebon Internet Service Facilities Using NNA Algorithm Based on Geographic Information Systems | |
Zarei et al. | Visualization of Local Municipal Satisfaction by Twitter Data Analysis | |
CN105101475A (zh) | 一种识别无线局域网wlan潜在用户的方法及装置 | |
Bianchi et al. | DIORAMA: Digital twIn fOR sustAinable Territorial Management | |
CN117971885A (zh) | 应用拓扑信息的查询方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |