CN111258961A - 基于无界大数据湖的水利要素数据采集查询方法和装置 - Google Patents

基于无界大数据湖的水利要素数据采集查询方法和装置 Download PDF

Info

Publication number
CN111258961A
CN111258961A CN202010026311.0A CN202010026311A CN111258961A CN 111258961 A CN111258961 A CN 111258961A CN 202010026311 A CN202010026311 A CN 202010026311A CN 111258961 A CN111258961 A CN 111258961A
Authority
CN
China
Prior art keywords
data
water conservancy
element data
association
searching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010026311.0A
Other languages
English (en)
Inventor
曾建生
刘翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Linkcm Technology Co ltd
Guang Dongshengshuiliting
Original Assignee
Guangzhou Linkcm Technology Co ltd
Guang Dongshengshuiliting
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Linkcm Technology Co ltd, Guang Dongshengshuiliting filed Critical Guangzhou Linkcm Technology Co ltd
Priority to CN202010026311.0A priority Critical patent/CN111258961A/zh
Publication of CN111258961A publication Critical patent/CN111258961A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Library & Information Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于无界大数据湖的水利要素数据采集查询方法、装置、计算机设备和存储介质,通过获取用户输入的关键字,并在水利数据湖中查找和该关键字有关联的目标水利要素数据,其中该水利数据湖存储有多个水利业务系统的水利要素数据和这些水利要素数据之间的通过多种关联得到的关系图谱,再将查询到的目标水利要素数据作为结果展示。相对于传统的只能在每个独立的水利业务系统中查询水利数据查询方式,本申请提供的方法可以在规范化存储多个水利业务系统的水利数据湖中,利用多种关联分析技术挖掘数据之间的关联关系,查找出相关的数据,打破了不同系统间的数据边界,实现水利全要素数据统一查询分析,提高了查找水利要素数据的效率。

Description

基于无界大数据湖的水利要素数据采集查询方法和装置
技术领域
本发明涉及水利技术领域,特别是涉及一种基于无界大数据湖的水利要素数据采集查询方法、装置、计算机设备和计算机可读存储介质。
背景技术
在水利行业中,通常需要对水利工程设施进行养护工作,以及对水利工程周边有关环境进行监控,因此需要从现场的监测设备采集数据,进行设施安全、环境安全、运行安全等方面的数据分析。分析的过程中通常需要对相关数据进行查询。在传统的数据查询中,通常是在每个不同的系统中查询,再将查询到的不同类型的数据进行分析,然而由于不同系统之间的数据结构各异,这种查询的过程比较繁琐,需要进行二次转换,不利于相关人员进行快速组合分析,例如不同河段的水文站点的数据属于不同系统,需要分别查询相关数据后,才可以进行整条河流水文计算。
因此,传统的水利要素数据查询方法存在查询效率低的缺陷。
发明内容
基于此,有必要针对传统技术查询效率低的技术问题,提供一种基于无界大数据湖的水利要素数据采集查询方法、装置、计算机设备和计算机可读存储介质。
一种基于无界大数据湖的水利要素数据采集查询方法,包括步骤:
获取用户输入的关键字;所述关键字包括待查询的水利要素数据的关键字;
在水利数据湖中查找与所述关键字有关联的目标水利要素数据;所述水利数据湖中存储有多个水利业务系统的水利要素数据以及所述水利要素数据之间的关系图谱;所述关系图谱根据所述水利要素数据之间的归属关联、空间关联中的至少一种得到;
将所述目标水利要素数据作为结果展示。
在一个实施例中,所述获取用户输入的关键字之前,还包括:
获取所述多个水利业务系统中的原始水利数据;
将所述原始水利数据按预设分类标准进行分类,得到分类后的水利数据;
对所述分类后的水利数据进行元数据抽取,得到所述水利要素数据;
根据所述归属关联、空间关联中的至少一种,对所述水利要素数据进行关联挖掘,根据挖掘出的关联关系得到所述水利要素数据之间的关系图谱;
根据所述水利要素数据以及所述关系图谱,得到所述水利数据湖。
在一个实施例中,所述将所述原始水利数据按预设分类标准进行分类,包括:
将所述原始水利数据中的建筑数据分类为静态数据;
将所述原始水利数据中按照时间序列产生的数据分类为观测数据;
将所述原始水利数据中的字段名称和取值说明分类为字段标准编码;
所述对所述水利数据进行元数据抽取,得到所述水利要素数据,包括:
抽取所述分类后的水利数据中的静态数据和字段标准编码,得到所述水利要素数据。
在一个实施例中,所述水利要素数据之间的归属关系包括数据之间的已知关联和元素关联;所述已知关联包括所述建筑的组成部分与所述建筑的关联,所述元素关联包括建筑中设施产生的观测数据与所述建筑中设施的关联;
所述水利要素数据之间的空间关联包括水利要素数据之间的行政区域关联和位置关联;所述行政区域关联包括所在行政区域相同以及行政区域有上下级关系的水利要素数据之间的关联,所述位置关联包括所述水利要素数据与产生所述水利要素数据的地理位置距离在预设范围内的其他水利要素数据的关联;
所述根据所述归属关联、空间关联中的至少一种,对所述水利要素数据进行关联挖掘,根据挖掘出的关联关系得到所述水利要素数据的关系图谱,包括:
查找所述水利要素数据中存在已知关联和/或元素关联的多个第一关联数据;
根据所述多个第一关联数据,得到所述水利要素数据的第一关系图谱;
查找所述水利要素数据中存在行政区域关联和/或位置关联的多个第二关联数据;
根据所述多个第二关联数据,得到所述水利要素数据的第二关系图谱;
根据所述第一关系图谱和第二关系图谱,得到所述水利要素数据的关系图谱。
在一个实施例中,所述查找所述水利要素数据中存在已知关联和/或元素关联的多个第一关联数据,包括:
获取所述建筑;
在所述水利要素数据中查找所述建筑对应的多个组成部分;
将所述多个组成部分与所述建筑进行关联,存储在所述关系图谱中;
和/或
获取所述建筑中设施的标识;
在所述分类后的水利数据中查找所述标识对应的多个观测数据;
将所述标识对应的多个观测数据与所述建筑中设施进行关联,存储在所述关系图谱中。
在一个实施例中,所述查找所述水利要素数据中存在行政区域关联和/或位置关联的多个第二关联数据,包括:
在所述水利要素数据中查找行政区域相同的多个建筑的水利要素数据;
将所述行政区域相同的多个建筑的水利要素数据进行关联,存储在所述关系图谱中;
和/或
获取所述建筑中目标设施的水利要素数据的位置信息;所述位置信息包括经纬度信息;
在所述水利要素数据中查找与所述建筑中目标设施的距离在预设范围内的多个其他设施的水利要素数据;
将所述多个其他建筑设施的水利要素数据与所述目标设施的水利要素数据进行关联,存储在所述关系图谱中。
在一个实施例中,所述在水利数据湖中查找与所述关键字有关联的目标水利要素数据,包括:
在所述水利数据湖中查找与所述关键字相关性最高的第一数据;
根据所述关系图谱,查找与所述第一数据相关的多个第二数据;所述关系图谱中包括多个所述水利要素数据之间的read-schema建模;
根据所述第一数据和第二数据,得到与所述关键字有关联的目标水利要素数据。
一种水利要素数据查询装置,包括:
获取模块,用于获取用户输入的关键字;所述关键字包括待查询的水利要素数据的关键字;
查找模块,用于在水利数据湖中查找与所述关键字有关联的目标水利要素数据;所述水利数据湖中存储有多个水利业务系统的水利要素数据以及所述水利要素数据之间的关系图谱;所述关系图谱根据所述水利要素数据之间的归属关联、空间关联中的至少一种得到;
展示模块,用于将所述目标水利要素数据作为结果展示。
一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于无界大数据湖的水利要素数据采集查询方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于无界大数据湖的水利要素数据采集查询方法。
上述基于无界大数据湖的水利要素数据采集查询方法、装置、计算机设备和存储介质,通过获取用户输入的关键字,并在水利数据湖中查找和该关键字有关联的目标水利要素数据,其中该水利数据湖存储有多个水利业务系统的水利要素数据和这些水利要素数据之间的通过多种关联得到的关系图谱,再将查询到的目标水利要素数据作为结果展示。相对于传统的只能在每个独立的水利业务系统中查询水利数据查询方式,本申请提供的方法可以在规范化存储多个水利业务系统的水利数据湖中,利用多种关联分析技术挖掘数据之间的关联关系,查找出相关的数据,打破了不同系统间的数据边界,实现水利全要素数据统一查询分析,提高了查找水利要素数据的效率。
附图说明
图1为一个实施例中基于无界大数据湖的水利要素数据采集查询方法的应用场景图;
图2为一个实施例中基于无界大数据湖的水利要素数据采集查询方法的流程示意图;
图3为一个实施例中关系图谱的界面示意图;
图4为一个实施例中查找与所述关键字有关联的目标水利要素数据步骤的流程示意图;
图5为一个实施例中水利要素数据查询装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的是,本发明实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本发明提供的基于无界大数据湖的水利要素数据采集查询方法,可以应用于如图1所示的应用场景中,图1为一个实施例中基于无界大数据湖的水利要素数据采集查询方法的应用场景图,其中,终端102通过网络与服务器104进行通信。终端102可以从服务器104中获取多个水利业务系统的水利要素数据信息,终端102也可以将这些水利要素数据信息存储在本地,当用户需要查找某个水利要素数据时,终端102可以调取本地或者服务器104的水利要素数据进行查询。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现,还可以是分布式的大数据集群服务器。
在一个实施例中,提供了一种基于无界大数据湖的水利要素数据采集查询方法,参考图2,图2为一个实施例中基于无界大数据湖的水利要素数据采集查询方法的流程示意图,以该方法应用于图1中的终端为例进行说明,该基于无界大数据湖的水利要素数据采集查询方法可以包括以下步骤:
步骤S101,获取用户输入的关键字;该关键字包括待查询的水利要素数据的关键字。
其中,用户输入的关键字可以是待查询的水利要素数据的关键字,例如水利枢纽、测压管、地区名或电站等关键字,用户可以在终端102中输入这些关键字,例如可以在数据库中输入,终端102可以根据这些关键字进行搜索。其中,水利要素数据可以包括水利行业的数据,例如水利枢纽,水文站等,也可以包括与水利行业有关联的其他数据,例如学校,医院等数据。
步骤S102,在水利数据湖中查找与上述关键字有关联的目标水利要素数据;水利数据湖中存储有多个水利业务系统的水利要素数据以及水利要素数据之间的关系图谱;关系图谱根据水利要素数据之间的归属关联、空间关联中的至少一种得到。
其中,水利数据湖可以是包含多个水利业务系统中的水利要素数据的数据库,其可以是分布式的大数据中心,该水利数据湖中还可以包括水利要素数据之间的关系图谱,该关系图谱可以包含有上述水利要素数据之间的关系信息,例如不同水利要素数据之间的共同点,该关系图谱可以将这些共同点进行关联,为挖掘查询提供基础,该关系图谱可以根据归属关联、空间关联中的至少一种得到。其中,归属关联可以是将上述多个水利业务系统中的水利要素数据,根据已知关系进行关联,例如某个水利枢纽的泄洪闸门等,或根据元素值进行关联,例如某个观测站采集的水利数据等。空间关联可以是根据行政区域对上述水利要素数据进行关联,例如相同地市、区县、村镇的数据进行关联等,或根据位置信息进行关联,例如根据水利枢纽的经纬度位置信息,将周边的监控摄像头、气象监测站等,与水利枢纽相关联等。终端102可以运用数据湖存储技术、全文索引技术和时空关联算法,对水利全要素数据进行标准化、集中存储,自动挖掘数据之间的关联关系,形成关系图谱,以便提供智能的分析查询、关联搜索等,终端102可以根据用户输入的关键字,查找出用户想要的水利要素数据,同时还可以根据上述关系图谱,对该水利要素数据进行关系挖掘和分析,查找出关联的数据,得到目标水利要素数据。
步骤S103,将目标水利要素数据作为结果展示。
其中,目标水利要素数据可以是终端102根据用户输入的关键字查找到的水利要素数据,和根据该水利要素数据进行智能关系挖掘得到的关联数据组成的数据。终端102可以在查询和关联挖掘完成后,将得到的目标水利要素数据作为结果展示给用户。其中,展示的形式不作限定,终端102可以以图形界面的形式展示,也可以以文本或表格方式展示。
上述基于无界大数据湖的水利要素数据采集查询方法,通过获取用户输入的关键字,并在水利数据湖中查找和该关键字有关联的目标水利要素数据,其中该水利数据湖存储有多个水利业务系统的水利要素数据和这些水利要素数据之间的通过多种关联得到的关系图谱,再将查询到的目标水利要素数据作为结果展示。相对于传统的只能在每个独立的水利业务系统中查询水利数据查询方式,本申请提供的方法可以在规范化存储多个水利业务系统的水利数据湖中,利用多种关联分析技术挖掘数据之间的关联关系,查找出相关的数据,打破了不同系统间的数据边界,实现水利全要素数据统一查询分析,提高了查找水利要素数据的效率。
在一个实施例中,获取用户输入的关键字之前,还包括:获取多个水利业务系统中的原始水利数据;将原始水利数据按预设分类标准进行分类,得到分类后的水利数据;对分类后的水利数据进行元数据抽取,得到水利要素数据;根据归属关联、空间关联中的至少一种,对水利要素数据进行关联挖掘,根据挖掘出的关联关系得到所述水利要素数据之间的关系图谱;根据水利要素数据以及关系图谱,得到水利数据湖。
本实施例中,终端102可以在用户输入搜索关键字前,首先抽象出一个水利数据湖的存储平台,该水利数据湖中可以存储有水利数据中的数据表信息、字段信息、实体信息等。终端102可以将多个水利业务系统中的原始水利数据按照设定标准进行分类,并可以对分类后的水利数据进行抽取,按照标准字段规范,进行存储,形成无界大数据中心,该大数据中心可以设置在云端,进行分布式存储。终端102还可以对这些水利要素数据进行智能关系挖掘,例如可以通过归属关联、空间关联中的至少一种对上述水利要素数据进行关联,形成水利要素数据之间的关系图谱,根据水利要素数据和上述关系图谱,可以得到水利数据湖。其中,归属关联可以是将上述多个水利业务系统中的水利要素数据,根据已知关系进行关联,例如某个水利枢纽的泄洪闸门等,或根据元素值进行关联,例如某个观测站采集的水利数据等,在一个实施例中,上述元素值可以存储在其采集时所在的数据库中,终端102可以将水利数据湖中的数据与上述元素值进行关联。空间关联可以是根据行政区域对上述水利要素数据进行关联,例如相同地市、区县、村镇的数据进行关联等,或根据位置信息进行关联,例如根据水利枢纽的经纬度位置信息,将周边的监控摄像头、气象监测站等,与水利枢纽相关联等。通过本实施例,终端102可以将多个不同水利业务系统中的水利要素数据进行整合分类存储,还可以建立水利要素数据之间的关系图谱,形成水利数据湖,可以让用户在查询水利要素数据时,不必在多个水利业务系统中多次查找,同时还可以在查找时联想出相关联的数据,极大提高了查询水利要素数据的效率。
在一个实施例中,将原始水利数据按预设分类标准进行分类,包括:将原始水利数据中的建筑数据分类为静态数据;将原始水利数据中按照时间序列产生的数据分类为观测数据;将原始水利数据中的字段名称和取值说明分类为字段标准编码;对水利数据进行元数据抽取,得到水利要素数据,包括:抽取分类后的水利数据中的静态数据和字段标准编码,得到水利要素数据。
本实施例中,原始水利数据的预设分类标准可以分为三类,可以是静态数据、观测数据和字段标准编码。其中静态数据可以是静态的或者很少改动的对象,例如POI(PointOf Interest,兴趣点)数据,如水利枢纽、学校、医院等建筑对象,这类型的数据变动较少;观测数据可以是观测站的时序数据,时序数据可以是按照时间序列产生的观测数据,例如水位记录、发电量记录等,这些数据可以归属于一种上述静态数据中的对象,例如水位数据可以归属于某个水位站或水文站;字段标准编码可以是用于规范水利要素数据中的字段名称、取值说明等,在上述水利数据湖中存储的数据,可以采用该字段标准编码。终端102可以将上述多个水利业务系统中的水利要素数据按照上述的分类标准进行分类,可以将其中的建筑类数据分类到静态数据中,其中建筑数据中还可以包含设施,例如水利枢纽,水文站等,也可以属于建筑;还可以将按照时间序列产生的数据分类为观测数据,例如水位记录等;还可以将字段名称和取值说明分类为字段标准编码,由于不同水利业务系统中,对同一个数据采用的命名方式和说明可能不同,因此在上述水利数据湖中,可以将这些代表同一数据的不同字段名称和取值说明采用统一的命名方式将其归类,分类到相应的字段标准编码中。终端102还可以对分类后的水利数据进行元数据抽取,得到水利要素数据,具体地,可以抽取上述分类后的水利数据中的静态数据,还可以抽取上述分类后的水利数据中的字段标准编码,作为水利要素数据,这些水利要素数据可以在进行关联后存储在上述水利数据湖中,而观测数据可以存储在其对应的水利业务系统的数据库中,还可以与上述水利要素数据进行关联。通过本实施例,将上述多个水利业务系统中的水利要素数据按照上述分类标准分类存储到水利数据湖中,使得多个水利业务系统中的数据可以更加规范进行存储,从而提高了在搜索时查找的效率。
在一个实施例中,水利要素数据之间的归属关系包括数据之间的已知关联和元素关联;已知关联包括建筑的组成部分与该建筑的关联,元素关联包括建筑中设施产生的观测数据与该建筑中设施的关联;水利要素数据之间的空间关联包括水利要素数据之间的行政区域关联和位置关联;行政区域关联包括所在行政区域相同以及行政区域有上下级关系的水利要素数据之间的关联,位置关联包括水利要素数据与产生水利要素数据的地理位置距离在预设范围内的其他水利要素数据的关联。
根据所述归属关联、空间关联中的至少一种,对水利要素数据进行关联挖掘,根据挖掘出的关联关系得到水利要素数据的关系图谱,包括:查找水利要素数据中存在已知关联和/或元素关联的多个第一关联数据;根据多个第一关联数据,得到水利要素数据的第一关系图谱;查找水利要素数据中存在行政区域关联和/或位置关联的多个第二关联数据;根据多个第二关联数据,得到水利要素数据的第二关系图谱;根据第一关系图谱和第二关系图谱,得到水利要素数据的关系图谱。
本实施例中,终端102可以基于上述水利数据湖中分类存储的数据模型,运用多种数据分析技术,深度挖掘数据之间的关联关系,形成数据关系图谱。终端102可以根据上述归属关联、空间关联中的至少一种,对上述分类后的水利要素数据进行关联。其中,归属关联可以包括已知关联和元素关联,已知关联可以是水利要素数据中的建筑的组成部分和该建筑的关联,例如泄洪闸门和水利枢纽,有着明确的已知归属关系,可以确定为已知关联,同时,基于已知关联还可以快速建立起可信任的基础数据图谱;元素关联可以是上述建筑中的设施产生的观测数据与该设施的关联,例如根据水文站的ID,将该ID对应的水文站的检测数据进行关联。空间关联可以包括行政区域关联和位置关联,行政区域关联可以是所在行政区域相同以及行政区域有上下级关系的水利要素数据之间的关联,例如可以是相同地市、区县、村镇的数据之间的关联;位置关联可以是水利要素数据和产生该水利要素数据的地理位置距离在预设范围内的其他水利要素数据的关联,例如可以根据水利枢纽的地理位置信息,和周边预设距离范围内的监控摄像头、气象监测站之间的关联,预设范围可以根据实际情况设定。
终端102可以在上述水利要素数据中查找和分类后的水利要素数据存在已知关联和/或元素关联的多个第一关联数据,其中第一关联数据可以是与一个水利要素数据有已知关联和/或元素关联的数据,例如可以根据水利枢纽,查找和该水利枢纽关联的水文站和/或该水利枢纽的观测数据等,终端102可以重复执行该步骤,将有上述关联关系的水利要素进行关联,可以通过上述分类后的水利要素数据和多个第一关联数据,形成第一关系图谱。终端102还可以在上述水利要素数据中查找和分类后的水利要素数据存在行政区域关联和/或位置关联的多个第二关联数据,例如可以根据水利枢纽,查找与该水利枢纽所在地市、区县、村镇相同的水利要素数据和查找与该水利枢纽的距离在预设范围内的其他水利要素数据的数据,如附近的气象观测站的数据,与该水利枢纽进行关联,终端102可以重复执行该步骤,将有上述关联关系的水利要素进行关联,可以通过上述分类后的水利要素数据和多个第二关联数据,形成第二关系图谱。终端102可以基于以上多种数据分析挖掘技术,对数据进行深度的挖掘和分析,得到上述第一关系图谱和第二关系图谱,即根据不同的关联关系得到的关系图谱,结合在一起,最终可以得到水利要素数据的关系图谱。通过本实施例,可以通过多种不同的关联条件将上述分类后的数据进行关联并形成关系图谱,可以在用户搜索时更好地对关键字进行关联数据的挖掘,提高了搜索水利要素数据的效率。
在一个实施例中,如图3所示,图3为一个实施例中关系图谱的界面示意图。终端102可以基于以上多种数据分析挖掘技术,例如可以是通过read-schema建模的方式,也可以是其他方式,对数据进行深度的挖掘和分析,最终形成数据之间的关系图谱。终端102可以基于水利工程对象,挖掘出与该水利工程对象相关的数据关系图谱,比如基于省水利大数据中心的数据,深度挖掘出地方水利枢纽的数据关系图谱。具体地,该图谱可以以地方水利枢纽为中心,然后可以根据已知关联挖掘出该枢纽的1-5号泄洪闸等数据并进行关联,还可以根据元素关联将一个水文站的观测数据,如流量、站点、经度、纬度等数据,与水文站进行关联,还可以根据行政区域关联,将相同行政区域的武江、北江等数据与该水利枢纽进行关联,还可以根据位置关联,将该地方水利枢纽附近的电站、监控摄像头拍摄的视频等数据与该地方水利枢纽进行关联。上述关联可以持续进行,当有新的水利要素数据存储时,可以将新的水利要素数据进行分类和关联。
在一个实施例中,查找水利要素数据中存在已知关联和/或元素关联的多个第一关联数据,包括:获取建筑;在水利要素数据中查找建筑对应的多个组成部分;将多个组成部分与建筑进行关联,存储在关系图谱中;和/或,获取建筑中设施的标识;在分类后的水利数据中查找标识对应的多个观测数据;将标识对应的多个观测数据与建筑中设施进行关联,存储在关系图谱中。
本实施例中,终端102可以通过已知关联的条件,在上述分类后的水利要素数据中查找存在已知关联的数据并进行关联。例如,终端102可以获取水利要素数据中的建筑数据,可以根据该建筑,在上述水利要素数据中查找该建筑对应的多个组成部分,将这些多个组成部分和该建筑进行关联,存储在关系图谱中,如可以根据水利枢纽,在水利要素数据中查找和该水利枢纽对应的组成部分,如泄洪闸门等,将多个该组成部分和水利枢纽进行关联,然后可以存储到关系图谱中,终端102可以重复执行该步骤,直到将上述水利要素数据中拥有已知关联关系的数据都进行关联。
终端102还可以通过元素关联的条件,在上述分类后的水利数据中查找存在元素关联的数据并进行关联。例如,终端102可以获取上述分类后的水利数据中的设施数据,该设施数据可以是包含在建筑数据中,终端102可以根据该设施,在上述分类后的水利数据中查找该设施对应的多个观测数据,将这些多个观测数据和该设施进行关联,存储在关系图谱中,上述观测数据可以存储在其对应的水利业务系统数据库中,终端102可以在将水利数据中的设施与存储在对应的水利业务系统数据库中的观测数据进行关联,如可以根据水文站,终端102可以获取该水文站的ID,根据水文站的ID在上述水利数据中查找存储在相应的水利业务系统数据库中的该水文站的多个观测数据,并与该水文站关联,存储在关系图谱中,终端102可以重复执行该步骤,直到将上述水利要素数据中拥有元素关联关系的数据都进行关联。通过本实施例,终端102可以根据建筑和建筑中的设施,根据已知关联和/或元素关联,查找与这些数据相关联的数据并进行关联存储,可以在用户搜索时更加快捷找到相关的数据,提高了搜索效率。
在一个实施例中,查找所述水利要素数据中存在行政区域关联和/或位置关联的多个第二关联数据,包括:在水利要素数据中查找行政区域相同的多个建筑的水利要素数据;将行政区域相同的多个建筑的水利要素数据进行关联,存储在关系图谱中;和/或,获取建筑中目标设施的水利要素数据的位置信息;位置信息包括经纬度信息;在水利要素数据中查找与建筑中目标设施的距离在预设范围内的多个其他设施的水利要素数据;将多个其他建筑设施的水利要素数据与目标设施的水利要素数据进行关联,存储在关系图谱中。
本实施例中,终端102可以通过行政区域关联的条件,在上述水利要素数据中查找存在行政区域关联的数据并进行关联。例如,终端102可以获取水利要素数据中的建筑数据,可以根据该建筑,在上述水利要素数据中查找该建筑所在行政区域相同的多个其他建筑的水利要素数据,将这些多个其他建筑的水利要素数据和该建筑进行关联,存储在关系图谱中,如可以根据水利枢纽,在水利要素数据中查找和该水利枢纽在同一行政区域内的江流数据,将多个该相同行政区域的水利要素数据和水利枢纽进行关联,然后可以存储到关系图谱中,终端102可以重复执行该步骤,直到将上述水利要素数据中拥有行政区域关联关系的数据都进行关联。
终端102还可以通过位置关联的条件,在上述水利要素数据中查找存在位置关联的数据并进行关联。例如,终端102可以获取水利要素数据中的设施数据,该设施数据可以是包含在建筑数据中,终端102可以根据该设施,在上述水利要素数据中查找与该设施的距离在预设范围内的多个其他设施的水利要素数据,将这些多个其他设施的水利要素数据和该设施进行关联,存储在关系图谱中,如可以根据水利枢纽,终端102可以获取该水利枢纽的经纬度,根据该经纬度在上述水利要素数据中查找距离该水利枢纽在预设范围内的多个水利要素数据,例如可以是水利枢纽附近的发电站等数据,并与该水文站关联,存储在关系图谱中,终端102可以重复执行该步骤,直到将上述水利要素数据中拥有位置关联关系的数据都进行关联。通过本实施例,终端102可以根据建筑和建筑中的设施,根据行政区域关联和/或位置关联,查找与这些数据相关联的数据并进行关联存储,可以在用户搜索时更加快捷找到相关的数据,提高了搜索效率。
在一个实施例中,在水利数据湖中查找与关键字有关联的目标水利要素数据,包括:在水利数据湖中查找与关键字相关性最高的第一数据;根据关系图谱,查找与第一数据相关的多个第二数据;关系图谱中包括多个水利要素数据之间的read-schema建模;根据第一数据和第二数据,得到与关键字有关联的目标水利要素数据。
本实施例中,第一数据可以是和用户输入的关键字关联性最高的数据,第二数据可以是和该关联性最高的数据存在关联关系的数据,第二数据可以是多个,目标水利要素数据可以包括上述第一数据和第二数据。终端102可以通过上述用户输入的关键字,在水利数据湖中查找和该关键字相关性最高的数据,该查找可以不局限于一个数据表,在查找到上述相关性最高的数据后,还可以基于上述深度挖掘得到的数据关系图谱,将该数据的关联数据进行推荐和展示,将上述相关性最高的数据及其关联数据,得到目标水利要素数据,比如用户查看水利工程对象,比如地方水利枢纽时,可关联展示出当前水位高度、近期发电数据、周边监控摄像头等信息。其中,上述查找可以是基于全文索引的技术进行的,上述关系图谱中的水利要素数据可以通过read-schema的方式建立水利要素数据的关系图谱,read-schema为读时模型,可以作用于数据汇聚存储到数据分析之间,数据先存储,然后在需要分析的时候再为数据设置关系,通过该方式,可以实现在关系图谱中水利要素数据的快速查找,上述关系图谱也可以通过其他方式建立。在一个实施例中,如图4所示,图4为一个实施例中查找与所述关键字有关联的目标水利要素数据步骤的流程示意图。第一数据可以是上述水利数据湖中的水利要素数据,也称为元数据,例如上述静态数据等,第二数据可以是根据静态数据的观测数据对应的水利业务系统数据库中查找到的观测数据,例如,第一数据可以是第一发电站,第二数据可以是该发电站的观测数据,该观测数据可以存储在相应的水利业务系统数据库中,该观测数据可以是发电量,终端102可以根据发电站与其观测数据的关联,在上述观测数据所在的水利业务系统数据库中查找具体的观测数据,例如可以是每天的发电量。通过本实施例,终端102可以在水利数据湖中查找用户想要查找的水利要素数据,同时还可以展示该水利要素数据的关联数据,不必在多个不同的水利业务系统中多次查找,提高了搜索水利要素数据的效率。
在一个实施例中,提供了一种水利要素数据查询装置,参考图5,图5为一个实施例中水利要素数据查询装置的结构框图,该水利要素数据查询装置可以包括:
获取模块400,用于获取用户输入的关键字;该关键字包括待查询的水利要素数据的关键字;
查找模块402,用于在水利数据湖中查找与关键字有关联的目标水利要素数据;水利数据湖中存储有多个水利业务系统的水利要素数据以及水利要素数据之间的关系图谱;关系图谱根据所述水利要素数据之间的归属关联、空间关联中的至少一种得到;
展示模块404,用于将目标水利要素数据作为结果展示。
本发明的水利要素数据查询装置与本发明的基于无界大数据湖的水利要素数据采集查询方法一一对应,关于水利要素数据查询装置的具体限定可以参见上文中对于基于无界大数据湖的水利要素数据采集查询方法的限定,在上述基于无界大数据湖的水利要素数据采集查询方法的实施例阐述的技术特征及其有益效果均适用于水利要素数据查询装置的实施例中,在此不再赘述。上述水利要素数据查询装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示,图6为一个实施例中计算机设备的内部结构图。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于无界大数据湖的水利要素数据采集查询方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上任一项实施例所述的基于无界大数据湖的水利要素数据采集查询方法。
本领域普通技术人员可以理解实现如上任一项实施例所述的基于无界大数据湖的水利要素数据采集查询方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得。
据此,在一个实施例中还提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如上任一项实施例所述的基于无界大数据湖的水利要素数据采集查询方法。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于无界大数据湖的水利要素数据采集查询方法,其特征在于,包括步骤:
获取用户输入的关键字;所述关键字包括待查询的水利要素数据的关键字;
在水利数据湖中查找与所述关键字有关联的目标水利要素数据;所述水利数据湖中存储有多个水利业务系统的水利要素数据以及所述水利要素数据之间的关系图谱;所述关系图谱根据所述水利要素数据之间的归属关联、空间关联中的至少一种得到;
将所述目标水利要素数据作为结果展示。
2.根据权利要求1所述的方法,其特征在于,所述获取用户输入的关键字之前,还包括:
获取所述多个水利业务系统中的原始水利数据;
将所述原始水利数据按预设分类标准进行分类,得到分类后的水利数据;
对所述分类后的水利数据进行元数据抽取,得到所述水利要素数据;
根据所述归属关联、空间关联中的至少一种,对所述水利要素数据进行关联挖掘,根据挖掘出的关联关系得到所述水利要素数据之间的关系图谱;
根据所述水利要素数据以及所述关系图谱,得到所述水利数据湖。
3.根据权利要求2所述的方法,其特征在于,所述将所述原始水利数据按预设分类标准进行分类,包括:
将所述原始水利数据中的建筑数据分类为静态数据;
将所述原始水利数据中按照时间序列产生的数据分类为观测数据;
将所述原始水利数据中的字段名称和取值说明分类为字段标准编码;
所述对所述水利数据进行元数据抽取,得到所述水利要素数据,包括:
抽取所述分类后的水利数据中的静态数据和字段标准编码,得到所述水利要素数据。
4.根据权利要求3所述的方法,其特征在于,所述水利要素数据之间的归属关联包括数据之间的已知关联和元素关联;所述已知关联包括所述建筑的组成部分与所述建筑的关联,所述元素关联包括建筑中设施产生的观测数据与所述建筑中设施的关联;
所述水利要素数据之间的空间关联包括水利要素数据之间的行政区域关联和位置关联;所述行政区域关联包括所在行政区域相同以及行政区域有上下级关系的水利要素数据之间的关联,所述位置关联包括所述水利要素数据与产生所述水利要素数据的地理位置距离在预设范围内的其他水利要素数据的关联;
所述根据所述归属关联、空间关联中的至少一种,对所述水利要素数据进行关联挖掘,根据挖掘出的关联关系得到所述水利要素数据的关系图谱,包括:
查找所述水利要素数据中存在已知关联和/或元素关联的多个第一关联数据;
根据所述多个第一关联数据,得到所述水利要素数据的第一关系图谱;
查找所述水利要素数据中存在行政区域关联和/或位置关联的多个第二关联数据;
根据所述多个第二关联数据,得到所述水利要素数据的第二关系图谱;
根据所述第一关系图谱和第二关系图谱,得到所述水利要素数据的关系图谱。
5.根据权利要求4所述的方法,其特征在于,所述查找所述水利要素数据中存在已知关联和/或元素关联的多个第一关联数据,包括:
获取所述建筑;
在所述水利要素数据中查找所述建筑对应的多个组成部分;
将所述多个组成部分与所述建筑进行关联,存储在所述关系图谱中;
和/或
获取所述建筑中设施的标识;
在所述分类后的水利数据中查找所述标识对应的多个观测数据;
将所述标识对应的多个观测数据与所述建筑中设施进行关联,存储在所述关系图谱中。
6.根据权利要求4所述的方法,其特征在于,所述查找所述水利要素数据中存在行政区域关联和/或位置关联的多个第二关联数据,包括:
在所述水利要素数据中查找行政区域相同的多个建筑的水利要素数据;
将所述行政区域相同的多个建筑的水利要素数据进行关联,存储在所述关系图谱中;
和/或
获取所述建筑中目标设施的水利要素数据的位置信息;所述位置信息包括经纬度信息;
在所述水利要素数据中查找与所述建筑中目标设施的距离在预设范围内的多个其他设施的水利要素数据;
将所述多个其他建筑设施的水利要素数据与所述目标设施的水利要素数据进行关联,存储在所述关系图谱中。
7.根据权利要求3所述的方法,其特征在于,所述在水利数据湖中查找与所述关键字有关联的目标水利要素数据,包括:
在所述水利数据湖中查找与所述关键字相关性最高的第一数据;
根据所述关系图谱,查找与所述第一数据相关的多个第二数据;所述关系图谱中包括多个所述水利要素数据之间的read-schema建模;
根据所述第一数据和第二数据,得到与所述关键字有关联的目标水利要素数据。
8.一种水利要素数据查询装置,其特征在于,包括:
获取模块,用于获取用户输入的关键字;所述关键字包括待查询的水利要素数据的关键字;
查找模块,用于在水利数据湖中查找与所述关键字有关联的目标水利要素数据;所述水利数据湖中存储有多个水利业务系统的水利要素数据以及所述水利要素数据之间的关系图谱;所述关系图谱根据所述水利要素数据之间的归属关联、空间关联中的至少一种得到;
展示模块,用于将所述目标水利要素数据作为结果展示。
9.一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的基于无界大数据湖的水利要素数据采集查询方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的基于无界大数据湖的水利要素数据采集查询方法的步骤。
CN202010026311.0A 2020-01-10 2020-01-10 基于无界大数据湖的水利要素数据采集查询方法和装置 Pending CN111258961A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010026311.0A CN111258961A (zh) 2020-01-10 2020-01-10 基于无界大数据湖的水利要素数据采集查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010026311.0A CN111258961A (zh) 2020-01-10 2020-01-10 基于无界大数据湖的水利要素数据采集查询方法和装置

Publications (1)

Publication Number Publication Date
CN111258961A true CN111258961A (zh) 2020-06-09

Family

ID=70946850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010026311.0A Pending CN111258961A (zh) 2020-01-10 2020-01-10 基于无界大数据湖的水利要素数据采集查询方法和装置

Country Status (1)

Country Link
CN (1) CN111258961A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515546A (zh) * 2021-07-12 2021-10-19 中国工商银行股份有限公司 数据处理方法、装置和服务器
CN113946721A (zh) * 2021-09-26 2022-01-18 北京锐安科技有限公司 数据查询方法、装置、设备及存储介质
CN114820960A (zh) * 2022-04-18 2022-07-29 北京百度网讯科技有限公司 构建图谱的方法、装置、设备和介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543571A (zh) * 2019-08-07 2019-12-06 北京市天元网络技术股份有限公司 用于水利信息化的知识图谱构建方法以及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543571A (zh) * 2019-08-07 2019-12-06 北京市天元网络技术股份有限公司 用于水利信息化的知识图谱构建方法以及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
葛召华等: "基于知识图谱的水利数据垂直搜索应用" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515546A (zh) * 2021-07-12 2021-10-19 中国工商银行股份有限公司 数据处理方法、装置和服务器
CN113946721A (zh) * 2021-09-26 2022-01-18 北京锐安科技有限公司 数据查询方法、装置、设备及存储介质
CN114820960A (zh) * 2022-04-18 2022-07-29 北京百度网讯科技有限公司 构建图谱的方法、装置、设备和介质
CN114820960B (zh) * 2022-04-18 2022-12-16 北京百度网讯科技有限公司 构建图谱的方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
Jurgens et al. Geolocation prediction in twitter using social networks: A critical analysis and review of current practice
CN111858820B (zh) 用地性质识别方法、装置、电子设备及存储介质
CN111258961A (zh) 基于无界大数据湖的水利要素数据采集查询方法和装置
CN110598204B (zh) 基于知识图谱的实体识别数据增强方法及系统
CN109886719B (zh) 基于网格的数据挖掘处理方法、装置和计算机设备
CN110569321B (zh) 基于城市地图的网格划分处理方法、装置和计算机设备
US10068178B2 (en) Methods and system for associating locations with annotations
CN105117853A (zh) 一种基于网格化的gis监察执法方法和系统
Telang et al. Detecting localized homogeneous anomalies over spatio-temporal data
CN111782980A (zh) 地图兴趣点的挖掘方法、装置、设备及存储介质
Zou et al. Deep learning for cross-domain data fusion in urban computing: Taxonomy, advances, and outlook
CN109871419B (zh) 一种地图显示方法及装置
CN110598122B (zh) 社交群体挖掘方法、装置、设备及存储介质
CN117033534A (zh) 地理信息处理方法、装置、计算机设备和存储介质
CN102446186B (zh) 中文地理编码及解码方法和装置
CN111930875A (zh) 一种环境数据的查询方法、装置、设备及介质
CN111783786A (zh) 图片的识别方法、系统、电子设备及存储介质
CN111382165A (zh) 一种移动国土管理系统
CN111339225A (zh) 一种面向城市地理空间数据动态更新的方法及系统
Li et al. Spatial Data Science
Delafontaine et al. Assessment of sliver polygons in geographical vector data
Shams et al. GraphLoc: A graph based approach for automatic detection of significant locations from GPS trajectory data
CN114969114A (zh) 水利信息快速检索方法、系统、计算机可读介质
Wang et al. Content-based image retrieval for construction site images: leveraging deep learning–based object detection
CN107180073B (zh) Poi推荐方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200609

RJ01 Rejection of invention patent application after publication