CN114860891A - 一种智慧管网时空图谱构建的方法及装置 - Google Patents

一种智慧管网时空图谱构建的方法及装置 Download PDF

Info

Publication number
CN114860891A
CN114860891A CN202210616189.1A CN202210616189A CN114860891A CN 114860891 A CN114860891 A CN 114860891A CN 202210616189 A CN202210616189 A CN 202210616189A CN 114860891 A CN114860891 A CN 114860891A
Authority
CN
China
Prior art keywords
space
time
pipe network
data
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210616189.1A
Other languages
English (en)
Inventor
任武
杨宝龙
张新建
李莉
吴志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Oil and Gas Pipeline Network Corp
Original Assignee
China Oil and Gas Pipeline Network Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Oil and Gas Pipeline Network Corp filed Critical China Oil and Gas Pipeline Network Corp
Priority to CN202210616189.1A priority Critical patent/CN114860891A/zh
Publication of CN114860891A publication Critical patent/CN114860891A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种智慧管网时空图谱构建的方法及装置。该方法包括:获取智慧管网时空数据,以建立智慧管网时空数据库;对智慧管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库;根据管网时空知识库构建智慧管网时空知识图谱;按照预设条件对智慧管网时空知识图谱进行更新和维护。本申请能通过构建智慧管网时空图谱解决目前智慧管网时空数据再实践和应用过程中,存在数据和知识孤岛,无法跨时空查询和分析的问题;有益于智慧管网时空数据的融合和共享,打破了现有技术中智慧管网时空数据融合和共享受到的制约。

Description

一种智慧管网时空图谱构建的方法及装置
技术领域
本申请涉及油气储运技术领域,具体地涉及一种智慧管网时空图谱构建的方法及装置。
背景技术
随着数字化转型和智慧管网建设,大量管道智慧感知设备布设到管道及周边,其中不乏大量北斗定位设备。随着国家大地坐标系等数据采集要求的标准化,高精度的管道时间和空间数据也加入了智慧管网大数据的数据湖中。“管网一张图”需要构建涵盖管道规划、建设、运营、维护等阶段,管网跨地理区域和空间范围的管网时空数据库,对管网时空数据管理和应用提出了更高的要求。
智慧管网时空数据是指针对管道、站场、LNG、储气库及附属设施,周边环境等管道业务对象,在空间位置、管网分布、连接关系、运营状态、业务发展、变化趋势等方面所产生或反映的,具有时空特性的数据。
目前智慧管网时空数据在实践和应用过程中,存在数据和知识孤岛,无法跨时空查询和分析。数据往往是以业务领域、阶段或部门为边界进行采集、存储和应用,数据和专业知识以孤岛形式存在于各个部门和系统中,对智慧管网和“管网一张图”而言,缺少跨业务、跨部门、跨时空的大数据的共享基础,是制约数据融合和共享的瓶颈。因此,现有技术中智慧管网存在时空数据无法进行融合和共享的问题。
发明内容
本申请实施例的目的是提供一种智慧管网时空图谱构建的方法及装置,用以解决现有技术中智慧管网存在时空数据无法进行融合和共享的问题。
为了实现上述目的,本申请第一方面提供一种智慧管网时空图谱构建的方法,包括:
获取智慧管网时空数据,以建立智慧管网时空数据库;
对智慧管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库;
根据管网时空知识库构建智慧管网时空知识图谱;
按照预设条件对智慧管网时空知识图谱进行更新和维护。
在本申请实施例中,获取智慧管网时空数据,以建立智慧管网时空数据库包括:
采集智慧管网时空数据;
对智慧管网时空数据进行梳理;
根据梳理后的智慧管网时空数据建立智慧管网时空数据库。
在本申请实施例中,智慧管网时空数据包括:
管道常规数据、时空针对性数据、外部公共时空数据。
在本申请实施例中,对智慧管网时空数据进行梳理包括以下中的至少一者:
通过设定数据规则对智慧管网时空数据进行梳理;
根据度量指标选择目标数据规则对智慧管网时空数据进行梳理。
在本申请实施例中,对智慧管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库包括:
通过知识抽取、空间或非空间关联,形成管网时空知识网络;
基于语义推理和空间计算实现知识重组,以形成智慧管网时空知识。
在本申请实施例中,对智慧管网时空数据库进行数据时空知识挖掘包括:
对管网时空规则进行识别提取;
对管网时空数据进行挖掘分析;
对管道大数据时空进行实时建模;
对智能时空数据进行预测推理;
对时空数据进行挂接融合。
在本申请实施例中,根据管网时空知识库构建智慧管网时空知识图谱包括:
根据管网时空知识库获取数据实体以及实体之间的关系;
根据实体和关系构建智慧管网时空概念图谱;
对智慧管网概念图谱进行实例化,以构建实例化图谱;
通过知识融合对实例化图谱进行质量优化,以得到智慧管网时空知识图谱。
在本申请实施例中,通过知识融合对实例化图谱进行质量优化包括以下中的至少一者:
对智慧管网时空知识图谱进行本体规范化;
对智慧管网时空知识图谱进行歧义消除和数据合并;
对智慧管网时空知识图谱的数据质量进行跟踪优化。
在本申请实施例中,按照预设条件对智慧管网时空知识图谱进行更新和维护包括以下中的至少一者:
在检测到产生新增数据的情况下,对所慧管网时空知识图谱进行更新和维护;
按照预设周期对智慧管网时空知识图谱进行更新和维护;
通过自动化工具对智慧管网时空知识图谱进行更新和维护。
本申请第二方面提供一种智慧管网时空图谱构建的装置,包括:
数据采集模块,被配置成获取智慧管网时空数据,以建立智慧管网时空数据库;
数据挖掘模块,被配置成对智慧管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库;
图谱构建模块,被配置成根据管网时空知识库构建智慧管网时空知识图谱;
更新维护模块,被配置成按照预设条件对智慧管网时空知识图谱进行更新和维护。
通过上述技术方案,获取智慧管网时空数据,以建立智慧管网时空数据库;再通过对智慧管网时空数据库进行时空知识挖掘,进一步得到管网时空知识库;根据时空知识库构建智慧管网时空知识图谱;最后按照预设条件对智慧管网时空知识图谱进行更新和维护。本申请的智慧管网时空图谱构建的方法解决了目前智慧管网时空数据再实践和应用过程中,存在数据和知识孤岛,无法跨时空查询和分析的问题;有益于智慧管网时空数据的融合和共享,打破了现有技术中智慧管网时空数据融合和共享受到的制约。
本申请实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本申请实施例,但并不构成对本申请实施例的限制。在附图中:
图1示意性示出了根据本申请实施例的一种智慧管网时空图谱构建的方法的流程示意图;
图2示意性示出了本申请实施例的一种构建智慧管网时空知识图谱的流程示意图;
图3示意性示出了根据本实施例的一种管道本体抽取示意图;
图4示意性示出了根据本实施例的一种图谱构建过程示意图;
图5示意性示出了根据本申请实施例的一种智慧管网时空图谱构建的装置的结构示意图;
图6示意性示出了根据本申请实施例的一种智慧管网时空图谱的构建系统结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解的是,此处所描述的具体实施方式仅用于说明和解释本申请实施例,并不用于限制本申请实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明,若本申请实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本申请实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
图1示意性示出了根据本申请实施例的一种智慧管网时空图谱构建的方法的流程示意图。如图1所示,本申请实施例提供一种智慧管网时空图谱构建的方法,该方法可以包括下列步骤。
步骤101、获取智慧管网时空数据,以建立智慧管网时空数据库;
在本申请实施例中,智慧管网时空数据是指针对管道、站场、LNG、储气库及附属设施,周边环境等管道业务对象,在空间位置、管网分布、连接关系、运营状态、业务发展、变化趋势等方面所产生或反映的,具有时空特性的数据。在一个示例中,需要获取的智慧管网时空数据可以包括三部分,分别为:管道常规数据、时空针对性数据、外部公共时空数据。处理器可以将获取的智慧管网时空数据进行处理,进一步利用处理后的智慧管网时空数据进一步建立智慧管网时空数据库。
步骤102、对管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库;
在本申请实施例中,需要对管网时空数据库进行数据时空知识挖掘,从而形成智慧管网时空知识,进一步建立管网时空知识库。在一个示例中,可以在管网时空数据库的基础上进行时空分析和知识挖掘,并利用统计工具和空间分析工具来进行,进行时空数据挖掘和分析,进一步建立时空知识引擎,从而输出管网时空知识,并最终通过管网时空知识建立管网时空知识库。具体而言,时空知识挖掘的途径包括但不限于:管网时空规则识别提取、管网时空数据挖掘分析、管道大数据时空实时建模、智能时空数据预测推理以及时空数据挂接融合。
步骤103、根据管网时空知识库构建智慧管网时空知识图谱;
在本申请实施例中,构建智慧管网时空知识图谱可以在时空知识库中规则、模型和知识的协助下,通过梳理智慧管网数据间的数据实体以及实体之间的连接关系,进一步构建各数据要素间的时空知识图谱。例如,构建管道、人员、组织、设备、环境、事件等数据要素间时空图谱。智慧管网时空知识图谱的构建可以分为四步:需求和原则的确认和准备、时空数据实体的识别、管网时空关系的确定、实体和关系的抽取。其中,时空数据实体包括但不限于:管道实体、空间实体、时间实体;管网时空关系包括但不限于:空间关系、时间关系、逻辑关系。
步骤104、按照预设条件对智慧管网时空知识图谱进行更新和维护。
在本申请实施例中,由于管网时空知识并非一成不变,在时空图谱的应用过程中,会在管道规划、施工、运行等各个阶段,因为各种原因,随着时间而发生变化,在实体、关系和属性值各方面都会发生改变,且不限于时空特征的变化。因此需要建立智慧管网时空知识库的动态感知与更新机制。具体来说,对智慧管网时空知识图谱的更新和维护的方法包括但不限于:增量数据触发的管网时空知识更新、时空知识库周期性更新、时空数据自动化感知更新。
通过上述技术方案,获取智慧管网时空数据,以建立智慧管网时空数据库;再通过对智慧管网时空数据库进行时空知识挖掘,进一步得到管网时空知识库;根据时空知识库构建智慧管网时空知识图谱;最后按照预设条件对智慧管网时空知识图谱进行更新和维护。本申请的智慧管网时空图谱构建的方法解决了目前智慧管网时空数据再实践和应用过程中,存在数据和知识孤岛,无法跨时空查询和分析的问题;有益于智慧管网时空数据的融合和共享,打破了现有技术中智慧管网时空数据融合和共享受到的制约。
在本申请实施例中,步骤101、获取智慧管网时空数据库,以建立智慧管网时空数据库可以包括:
采集智慧管网时空数据;
对智慧管网时空数据进行梳理;
根据梳理后的智慧管网时空数据建立智慧管网时空数据库。
具体地,在进行智慧管网时空数据采集时,对于没有完成管道业务系统的存储企业,可以采集三部分数据,包括:管道常规数据、时空针对性数据、外部公共时空数据。对于已经完成管道业务系统的储运企业,可以从例如管道生产系统、管道调度平台系统、管道资产完整性管理系统、管道公共数据平台、管道数据治理平台等系统数据库或数据湖中抽取数据。进一步对数据进行梳理,并根据梳理后的智慧管网时空数据建立智慧管网时空数据库。对采集数据进行梳理之后再建立数据库,有利于解决现有技术中存在的数据量大,冗余繁杂,无法准确定位高价值数据的问题。
在本申请实施例中,采集的智慧管网时空数据可以包括:管道常规数据、时空针对性数据、外部公共时空数据。
具体地,需要采集的三部分智慧管网时空数据中,第一部分管道常规数据包括:管道储运企业数据,例如组织架构、岗位人员、主数据、公共资源数据、物资台账等;管道基础数据,例如管道资产概况、管道本体、附属设施、环境社会等;管道业务数据,例如管道维抢修、保护、巡检、应急、调度、市场等数据,包括作业规范、流程文件、标准制度等;管道运行数据,例如智慧管网工控、感知设备采集的时序数据。第二部分采集的时空针对性数据指智慧管网业务中的时空针对性数据,至少包括:管道基础地理空间数据,例如管道中心线数据、管网拓扑关系、设施设备坐标里程数据、场站内部二三维模型数据等;历史数据:例如管道数字化恢复数据,数字化移交数据、历史图纸、文档等。第三部分外部公共时空数据为管道相关外部公共时空数据,包括:国家及行业空间地理测绘标准、授时规范、管道周边遥感影像、高程数据、气象水文数据、基础地理信息数据、河流道路数据、行政区划数据、媒体舆论数据、统计年谱、城市规划等。
在本申请实施例中,对智慧管网时空数据进行梳理可以包括以下中的至少一者:
通过设定数据规则对智慧管网时空数据进行梳理;
根据度量指标选择目标数据规则对智慧管网时空数据进行梳理。
具体地,由于管道数据采集渠道多样,部门规范常常不一致,因此需要将采集到的数据梳理到统一标准的时空数据库中。在一个示例中,可以通过设定数据规则对智慧管网时空数据进行梳理,从而实现采集数据的标准化。其中,数据规则可以预先设置,例如日期长度规定为“年-月-日”的八位数字、空间距离使用厘米、毫米、米、千米等公制单位。在另一个示例中,可以根据度量指标选择目标数据规则对智慧管网时空数据进行梳理。具体而言,对于时空属性无法预先定义的特定管道业务数据,则由专家根据专业流行度、接受度等度量指标,选择得分最好的规范进行标准化。例如防腐层类型、补口材料等应统一阈值。在进行数据梳理的过程中,还应充分发挥企业主数据和公共数据编码的作用,对数据项尽可能统一到标准的参数数据或阈值中。通过数据梳理,将采集的时空数据进行整理和标准化,规范到统一的管网时空数据框架中,能够更好地建立标准化的管网时空数据库。
在本申请实施例中,步骤102、对管网时空数据库进行数据时空挖掘,以得到管网时空知识库可以包括:
通过知识抽取、空间或非空间关联,形成管网时空知识网络;
基于语义推理和空间计算实现知识重组,以形成智慧管网时空知识。
具体地,知识抽取是指通过识别、理解、筛选、格式化,把数据集中的各个知识点抽取出来,以一定形式存入知识库中的过程。目的是增强信息的可使用性和可重用性,这个过程同时又可以看作对现有的非结构化信息的语义标注过程。空间关系主要指拓扑关系、方向关系及距离关系。对于管道而言,在线、离线等线性参考关系,管道腐蚀钟点方向等均属于空间关系。空间关系的抽取可以通过GIS计算模型和空间分析挖掘后得到的空间知识,转化为自然语言空间关系的语义转换和规则提取。在通过知识抽取、空间或非空间关联形成管网时空知识网络的基础上,依据管网时空知识网络中元素之间的语义关系进行语义推理,并结合利用空间原则优化地理空间信息分布式计算的空间计算方法,从而实现知识重组,并进一步形成智慧管网时空知识。
在本申请实施例中,对智慧管网时空数据进行数据时空知识挖掘包括以下中的至少一者:
对管网时空规则进行识别提取;
对管网时空数据进行挖掘分析;
对管道大数据时空进行实时建模;
对智能时空数据进行预测推理;
对时空数据进行挂接融合。
具体地,对管网时空规则进行识别提取是指:充分利用已有的专家经验,对专家知识进行采集和梳理,抽取管道数据时空规则,构建管网时空识别工具。对管网时空数据进行挖掘分析是指:结合GIS工具以及统计软件,从数据探索分析角度出发,获取管道数据的时空分布规律,并输出到管网时空知识库中。对管道大数据时空进行实时建模是指:借助大数据计算分析平台(如Spark、Hadoop等)的批处理和流计算能力,建立面向半结构化、非结构化数据的清洗、分词、空间化、标准化、一致性等处理模型和算法,实现对存量数据和增量数据的时空数据建模和分析,提供实时时空分析知识和分析引擎。对智能时空数据进行预测推理是指:对多源管道数据,如管道设计图、遥感影像、时序数据、现场音频、技术报告等多模态数据,在人工智能的辅助下,应用神经网络、深度学习、自然语言识别、机器学习等技术进行识别提取,构建时空数据知识轻量分析模型,为智能时空趋势预测提供依据。对时空数据进行挂接融合是指:通过数据关联和融合,为非时空数据添加时空知识特性。如针对非空间数据,可以通过添加地理标签,构建空间索引,空间术语识别等方法,进行非空间数据与已有空间数据的关联索引或关联查询。通过元数据分析、时间语句描述识别、时相分析等技术,为数据挂接时间戳或时间属性。
图2示意性示出了本申请实施例的一种构建智慧管网时空知识图谱的流程示意图,包括以下步骤:
步骤201、根据管网时空知识库获取数据实体以及实体之间的关系。
在构建智慧管网时空知识图谱之前,需要进行需求和原则的确认和准备。可选地,首次构建专业领域的知识图谱时,为避免后续图谱边界无法收敛、图谱实体和关系的粒度不一等问题,应预先对知识图谱构建业务需求和识别原则进行确认,明确图谱构建目的、选取合适的颗粒度、划分图谱范围和边界。例如,为保障构建的知识本体准确、无歧义、易维护,需要遵循的原则至少包括:业务为本,即从业务逻辑出发,管道业务岗位人员使用图谱能很容易的查询跟踪相关业务,预留未来业务变化需求;去粗存精,即冗余、关联度低的信息不应放在图谱中,放到传统数据库;轻便易用,即针对管道具体业务设计图谱,模型尽量轻量化,效率至上,不追求大而全;目标导向,即从图谱应用出发,反向过滤图谱模型中的无关节点、属性;协同规范,即涉及公共领域知识本体时,利用开源、通用公共知识体系,例如借助百科、LOD(Linked Open Data)设计概念分类体系,词条标签信息作为实体、属性类别等。再例如,本体设计的越为复杂,其维护成本就越高,管道知识本体设计粒度的确定需要满足的需求至少包括:推理需求,例如设计实体间的等价、传递关系或者属性间的互逆关系;多数据融合需求,即设置合适的粒度和容忍度,避免大量数据融合工作。数据质量需求,即本体应根据实际采集到的管道数据来确定本体粒度,避免因数据缺失或粒度不匹配而导致知识图谱稀疏,构建困难。
在本申请实施例中,数据实体即时空数据实体,时空数据实体至少包括管道实体、空间实体、时间实体三类。
其中,管道实体是指管道本体、管道输送介质、管道网格区域分布、管网特点等。管道实体包括:设备实体,例如管道附属设备、管道感知设备、管道维抢修物资、管道工控设备、场站泵炉阀机等设施、应急物资设备等;组织实体,例如与管道建设运营各环节相关的内外部企业、单位、组织、机构、部门、处室、协会等,如管道场站、调度中心、维抢修中心、检测中心、计量中心、运维中心、管理段、分公司、油气源、用户单位等;人员实体,例如人员岗位、角色等,如巡线工、维修工、调度员、输油工等;环境实体,例如地形、土地、天气、气候、水文、人文、经济、社会、道路、桥梁等管道周边环境类型;业务实体,例如业务流程、活动、事件、方案等,如风险识别工程、维抢修工程、巡检日程、管道交付、竣工验收方案、开挖事件等。
空间实体包括:行政实体,例如国家、省、市、区、县、乡等;重点关注区域,例如高后果区、穿跨越段等;特殊区域,例如无人区,冻土区,地质灾害易发区等;针对上述三类空间实体,还可针对性的定义实体的空间属性特征。例如,空间实体类型特征:点、线、面、体等;业务空间实体特征:管道中心线、场站模型、桩、管段等业务实体的空间特征,如坐标位置、空间分布、空间特征实体编码、上下游序号等。
时间实体包含时间区段以及时间状态等,时间区段例如“年”、“年月”。时间实体包含至少三类特征,第一:静态、实时、随机;第二:秒、分钟、小时;第三:天、周、旬、月、季、年。
在本实施例中,实体之间的关系即管网时空关系,管网时空关系包括空间关系、时间关系以及逻辑关系。
其中,空间关系主要指拓扑关系、方向关系及距离关系。对于管道而言,在线、离线等线性参考关系,管道腐蚀钟点方向等均属于空间关系。空间关系的抽取可以通过GIS计算模型和空间分析挖掘后得到的空间知识,转化为自然语言空间关系的语义转换和规则提取。空间关系包括空间拓扑关系:相等,相交,包含,被包含,邻接,相离,覆盖,被覆盖;空间方向关系:东,南,西,北,中,东北,西南,东南,西北等;空间距离定量关系:数值(以米等公制单位为参考阈值);空间距离定性关系:很远,较远,较近,无穷远,很近。
时间关系主要指数据实体的时变特征,例如管道全生命周期中的不同阶段规划、设计、建设、运维、改线、封存、废弃等各类实体间关系随时间动态变化的变化轨迹。常见的时间关系包括但不限于先后关系、版本关系、就近关系、周期关系、趋势关系。
逻辑关系主要指实体之间的隶属、包含、流动、等同、变更、互斥、因果、人事等非时空关系。例如分公司包括哪些管理处,某干线包括哪些支线等
步骤202、根据实体和关系构建智慧管网时空概念图谱。
在本实施例中,根据实体和关系构建智慧管网时空概念图谱首先需要对实体和关系进行抽取。在一个示例中,管道实体、关系和属性的抽取可以参照常用的基于无监督词典规则方法和基于有监督特征学习的方法进行。无监督词典规则首先需要采集构建智慧管网行业的术语字典,包括实体词表、关系词或属性词触发词表,之后通过专家人工观察管道特定的词汇术语出现的语法构成和模式,设计特定的提取规则以完成提取。正则表达式和规则模板是基于无监督词典方式进行匹配识别的主要方式。有监督特征学习的方法将识别任务转化成分类或者序列标注问题,即为输入的数据的标签(分类)问题。
图3示意性示出了根据本实施例的一种管道本体抽取的结构示意图。如图3所示,先依赖已有的结构化数据,通过D2R映射,表格及列表数据抽取方法映射到预先定义的Schema来快速冷启动。然后再利用封装器、图文识别模型等自动化抽取技术,从半结构化和非结构化数据中提取出结构化标签信息来补全知识图谱。由于与传统识别数据集相比,智慧管网时空场景中所面临的管网时空数据复杂多样,构建过程十分耗时耗力,且需要不断完善更新。因此,实体和关系的抽取过程可采用人工和机器互相配合,持续构建的方式进行。进一步地,根据抽取的实体和关系构建智慧管网时空概念图谱。
步骤203、对智慧管网概念图谱进行实例化,以构建实例化图谱。
在本实施例中,实例化图谱的构建需要遵循图谱构建理论。在一个示例中,知识图谱中最基本的语义单元用G节点1,关系,节点2的三元组形式表示。构建过程中,从管道基础数据中抽取实体、关系、属性、标签等构建管道知识图谱。之后,在基础知识图谱的基础上,为知识图谱中节点、关系添加空间实体、关系和特征,语义单元就变成了G节点1,关系,节点2,空间位置。当给定一个空间位置λ时,即可以得到空间知识图谱中的一个空间子图G(λ)。再进一步,为上述管道空间知识图谱,添加时间序列实体、时间关系等,语义单元就变成了G节点1,关系,节点2,空间位置,时间信息。当给定一个时间戳τ的时候,可以根据动态知识图谱G得到静态子图G(τ)。
具体而言,概念图谱及实例化图谱的确定需要根据构建智慧管网时空知识图谱的准备阶段所确认的原则和预先设定的本体的粒度来判定。定义的粒度需要根据实际需求进行设计,概念通常无法做到全面覆盖,往往需要很长的动态添加过程,实践中可以先定义常见、常用的概念作为第一个版本进行冷启动。实例通常是不可再分的最细粒度的信息承载单位。在一个示例中,对于首次构建的管道领域图谱,可以先从结构化数据入手,构建基本的管道实体、关系和属性特征。在另一个示例中,对于首次构建的管道领域图谱,可以参考管道数据治理平台中已有的数据分类元数据及主数据,经过分析导入。可选地,对于空间和时间知识图谱的构建过程,可参考其他公共开放的时间和空间相关图谱。具备初始的知识图谱之后,再逐步通过人工和自动化工具进行迭代更新,不断完善,并最终形成高质量的管网时空图谱和管网时空知识库。
步骤204、通过知识融合对实例化图谱进行质量优化,以得到智慧管网时空知识图谱。
在本实施例中,由于定义的粒度需要根据实际需求进行设计,且概念图谱通常无法做到全面覆盖,往往需要很长的动态添加过程,实践中可以先定义常见、常用的概念作为第一个版本进行冷启动。而实例化图谱通常是不可再分的最细粒度的信息承载单位。因此,需要对智慧管网概念图谱进行实例化,进一步构建实例化图谱。在构建好的实例化图谱的基础上,通过知识融合对实例化图谱进行质量优化,以得到智慧管网时空知识图谱。在一个示例中,可以逐步通过人工和自动化工具进行迭代更新,不断完善,并最终形成高质量的管网时空图谱和管网时空知识库。
在本申请实施例中,通过知识融合对实例化图谱进行质量优化,以得到智慧管网时空知识图谱包括以下中的至少一者:
对智慧管网时空知识图谱进行本体规范化;
对智慧管网时空知识图谱进行歧义消除和数据合并;
对智慧管网时空知识图谱的数据质量进行跟踪优化。
具体地,在一个示例中,可以通过对智慧管网时空知识图谱进行本体规范化,从而实现对实例化图谱的质量优化。具体而言,通过对智慧管网时空知识图谱进行本体规范化指的是定义概念实例和属性值的约束限制条件,避免因为缺少约束而引起的数据和知识混乱。例如属性的取值类型、取值范围、缺省值等。可以参照管道参考数据来进行规范化设计。在另一个示例中,可以通过对智慧管网时空知识图谱进行歧义消除和数据合并,从而实现对实例化图谱的质量优化。具体而言,语义消除歧义和合并是指数据来源不同,知识也描述存在一定的互补性和差异性。例如分类体系不统一、地理实体歧义、特征描述详略不同、实体关系冲突等信息冗余和不一致问题。在另一示例中,可以对智慧管网时空知识图谱的数据质量进行跟踪优化。具体而言,数据质量跟踪优化是指对多渠道采集的数据的内容和质量不一致性进行检查、清洗和对齐,使其内容具有时空和逻辑一致性。同一个时空范围内的业务流程或事件采集的数据项,内容应该符合业务参考阈值,时空属性或获得的时空知识也应符合实体、属性等时空关系和时空约束规则,通过图数据库检索和查询规则,跟踪发现时空冲突异常,提升数据质量。
图4示意性示出了根据本实施例的一种图谱构建过程示意图。如图4所示,在专家指导下基于多源知识建立领域本体模型,确定实体及其属性、关系等,形成拓展时间和空间维度的地理空间知识图谱的框架;对非空间数据和知识进行空间化处理,与相应的空间数据进行关联挂接。最后,面向应用需求,基于空间化的数据和知识,进行时空知识抽取与融合,形成时空知识图谱。其中,利用本体对时空知识相关概念、实体、关系进行语义表达是领域知识建模的核心。
在构建好智慧管网时空知识图谱的基础上,构建时空数据知识平台,提供可视化的时空数据查询、追溯和分析,支持时空知识推理,发现显性或隐性的时空知识,为智慧管网提供时空决策支撑。其中时空知识推理可以通过两种途径实现,在一个示例中,可以采用基于符号图的推理方式,即对构成的知识图谱,基于图模型算法来实现特定需求的分析和推理。例如:通过路径搜索算法获取两个或多个节点间的全部路径、最短路径、最小权重路径、油气输送最优路径。通过社群发现算法或中心性算法来计算运维中心和维抢修机构的空间布局。通过子图匹配算法来发现相似风险点等。通过图谱规则发现数据或时空知识的质量问题,来定位问题数据,同时跟踪修复问题时空属性数据和知识。在另一个示例中,可以采用基于统计模型的推理方式,即基于统计模型的推理主要是通过时间和空间相关的统计算法,以及神经网络、深度学习等人工智能算法等,进行时空知识的推理,发现隐性知识。这部分知识推理可以利用智慧管网时空知识分析引擎。例如利用空间和时间知识规则,从已有实体关系推理出新的实体关系,并进行逻辑冲突检测。再例如,利用统计规律、逻辑推理、模式归纳等机器学习方法,从知识图谱中发现新的实体关系。具体地,在一个示例中,业务推理示例:主题-流程-项目-事件:事件为在某个特定的时间和地点发生的事情,项目是一组相互紧密联系的事件集合,流程是指某一类项目所构成的业务类,主题是指一类业务流程所构成的业务域。空间推理示例:
Figure BDA0003674373550000171
时间推理示例:
Figure BDA0003674373550000172
Figure BDA0003674373550000173
组织推理示例:
Figure BDA0003674373550000174
Figure BDA0003674373550000175
在本申请实施例中,步骤104、按照预设条件对智慧管网时空知识图谱进行更新和维护包括以下中的至少一者:
在检测到产生新增数据的情况下,对智慧管网时空知识图谱进行更新和维护;
按照预设周期对智慧管网时空知识图谱进行更新和维护;
通过自动化工具对智慧管网时空知识图谱进行更新和维护。
具体地,根据不同的预设条件对智慧管网时空知识图谱进行更新和维护;在一个示例中,在检测到产生新增数据的情况下,对所慧管网时空知识图谱进行更新和维护。管道会不定期产生新增数据,如管道新建、改线、维修等业务所采集的数据移交、入库等;管道报废导致的数据退出等。这些增量数据在管道数据处理流程中已经有了一套较为完整的时空数据更新机制,时空知识库的更新只需要及时感知到这些新产生的增量数据,重新实例化,生成新时间版本的时空知识图谱,将其保存到时空知识库中,即可完成知识的更新。在另一个示例中,按照预设周期对智慧管网时空知识图谱进行更新和维护。由于管道事故、技术优化、标准发布、制度更新、业务变更等原因,需要周期性对时空数据采集的数据源,尤其是非结构化的管网时空数据,建立周期性更新机制。在另一个示例中,通过自动化工具对智慧管网时空知识图谱进行更新和维护。例如利用机器学习、图文识别等多模态识别技术,设置非结构化数据的自动化感知、更新流程和工具;针对管道监控流式数据、智慧管网感知设备采集的台账等结构化数据,通过大数据分析模型抽取感知、获取新的时空知识;利用爬虫、脚本工具实时从媒体、网站、微博等半结构化数据中,依据关键字爬取追踪管网时空知识最新时空变化趋势。在不同的预设条件下,通过以上方式对智慧管网时空知识图谱进行更新和维护,可以解决现目前智慧管网时空数据在实践和应用过程中,数据量大,冗余繁杂,无法准确定位高价值数据的问题,并且提高了数据精准性、及时性、真实性和可追溯性。
本申请的智慧管网时空图谱构建的方法解决了目前智慧管网时空数据再实践和应用过程中,存在数据和知识孤岛,无法跨时空查询和分析的问题;有益于智慧管网时空数据的融合和共享,打破了现有技术中智慧管网时空数据融合和共享受到的制约。
图5示意性示出了根据本申请实施例的一种智慧管网时空图谱构建的装置的模块示意图。如图5所示,本申请实施例提供一种智慧管网时空图谱构建的装置,可以包括:
数据采集模块501,被配置成获取智慧管网时空数据,以建立智慧管网时空数据库;
数据挖掘模块502,被配置成对智慧管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库;
图谱构建模块503,被配置成根据管网时空知识库构建智慧管网时空知识图谱;
更新维护模块504,被配置成按照预设条件对智慧管网时空知识图谱进行更新和维护。
在本申请实施例中,智慧管网时空数据是指针对管道、站场、LNG、储气库及附属设施,周边环境等管道业务对象,在空间位置、管网分布、连接关系、运营状态、业务发展、变化趋势等方面所产生或反映的,具有时空特性的数据。在一个示例中,需要获取的智慧管网时空数据可以包括三部分,分别为:管道常规数据、时空针对性数据、外部公共时空数据。数据采集模块501可以将获取的智慧管网时空数据进行处理,进一步利用处理后的智慧管网时空数据进一步建立智慧管网时空数据库。
在本申请实施例中,需要通过数据挖掘模块502对管网时空数据库进行数据时空知识挖掘,从而形成智慧管网时空知识,进一步建立管网时空知识库。在一个示例中,数据挖掘模块502可以在管网时空数据库的基础上进行时空分析和知识挖掘,并利用统计工具和空间分析工具来进行,进行时空数据挖掘和分析,进一步建立时空知识引擎,从而输出管网时空知识,并最终通过管网时空知识建立管网时空知识库。具体而言,时空知识挖掘的途径包括但不限于:管网时空规则识别提取、管网时空数据挖掘分析、管道大数据时空实时建模、智能时空数据预测推理以及时空数据挂接融合。
在本申请实施例中,构建智慧管网时空知识图谱可以在时空知识库中规则、模型和知识的协助下,利用图谱构建模块503通过梳理智慧管网数据间的数据实体以及实体之间的连接关系,进一步构建各数据要素间的时空知识图谱。例如,构建管道、人员、组织、设备、环境、事件等数据要素间时空图谱。智慧管网时空知识图谱的构建可以分为四步:需求和原则的确认和准备、时空数据实体的识别、管网时空关系的确定、实体和关系的抽取。其中,时空数据实体包括但不限于:管道实体、空间实体、时间实体;管网时空关系包括但不限于:空间关系、时间关系、逻辑关系。
在本申请实施例中,由于管网时空知识并非一成不变,在时空图谱的应用过程中,会在管道规划、施工、运行等各个阶段,因为各种原因,随着时间而发生变化,在实体、关系和属性值各方面都会发生改变,且不限于时空特征的变化。因此需要通过更新维护模块504建立智慧管网时空知识库的动态感知与更新机制。具体来说,更新维护模块504对智慧管网时空知识图谱的更新和维护的方法包括但不限于:增量数据触发的管网时空知识更新、时空知识库周期性更新、时空数据自动化感知更新。
通过上述技术方案,获取智慧管网时空数据,以建立智慧管网时空数据库;再通过对智慧管网时空数据库进行时空知识挖掘,进一步得到管网时空知识库;根据时空知识库构建智慧管网时空知识图谱;最后按照预设条件对智慧管网时空知识图谱进行更新和维护。本申请的智慧管网时空图谱构建的方法解决了目前智慧管网时空数据再实践和应用过程中,存在数据和知识孤岛,无法跨时空查询和分析的问题;有益于智慧管网时空数据的融合和共享,打破了现有技术中智慧管网时空数据融合和共享受到的制约。
在一具体实施例中,图6示意性示出了根据本申请实施例的一种智慧管网时空图谱的构建系统结构框图,包括:
601-管道数据采集模块:负责通过结构化数据接口工具,非结构化数据上传、导入工具等进行智慧管网数据采集,并提供数据管理工具进行智慧管网数据梳理,将梳理结果输入到管网时空数据库中。
602-管网时空数据库:存储梳理后的时空数据,以及时空数据与原始数据的链接关系。可以根据数据特点,分别采用关系型数据库、键值对数据库、图数据库等多种类型的数据库进行时空数据存储。
603-时空知识提取模块:负责对时空知识库中的时空知识进行在线和离线的提取和识别。输入时空知识库中导入的增量数据,结构化数据提供映射工具,半结构化数据提供各种封装器模板,非结构化数据充分利用在线或离线的分类识别模型。输出实体、关系、属性等知识图谱构建本体要素。
604-时空知识融合模块:对提取模块获得的时空知识本体进行知识融合,消除因分类体系不统一、地理实体歧义、特征描述详略不同、实体关系冲突等信息冗余和不一致问题,对实体、关系、属性知识进行去重、关联和合并。
605-管网时空知识库:存储经过时空知识提取得到的时空知识,包括知识图谱中概念、实例数据、图谱关系等,以及供图谱应用所依据的时空知识及索引。
106-规则模型算法库:存储时空分析规则、识别模型、图分析算法等,为知识提取、识别、优化、应用等需求,提供时空数据分析引擎和知识推理工具。规则、模型、算法可通过更新维护模块进行导入、编辑和版本管理。
607-知识应用模块:提供构建的时空知识图谱可视化展示、图表报告生成、智能查询、决策支持等知识相关应用。查询展示通过数据输入分析算法主要是通过后台计算资源,调用规则、模型、算法库中的分析引擎进行,并将结果查询展示出来。
608-更新维护模块:提供知识图谱实体、关系、属性以及规则、模型等的更新和维护工具,优化图谱实体和关系,提升数据和知识的实时性、准确性。
609-系统管理模块:负责提供用户管理,权限控制、系统安全、数据备份等信息系统功能维护管理。
610-数据存储模块:大量原始数据的存放平台库或数据湖。构建管道原始数据的数据湖。对于知识图谱构建而言,数据,尤其是原始数据,不一定需要集中存储到时空数据库,可存放在各业务系统的数据库或集团的数据湖中供调用,也采用大数据分布式存储的方式,或者结合智慧管网特点以云边端方式进行存储,只需要将数据索引关系存入到时空数据库中。
在一个实例中,以智慧管网时空知识调度决策推荐为例。
管道储运企业需要支撑上游油气开发企业、中间管道储运企业、下游用油气企业、行业监管、供应商的广泛互联。本实例重点关注上游油气源、中间管网分布运行、下游油气用户单位三方面的时空数据,结合知识图谱时空数据挖掘和图模型算法进行时空知识推理,在智慧管网调度决策领域,提供时空知识决策应用支持,利用时空规律和知识,将油气管道采、储、配、输、用等各环节的资源利用最大化。构建过程如下:
采集数据重点包括下面三方面的数据:
上游油气资源数据:涉及油气源头的机构、人员、设备、环境、运行等数据及其时空数据。包括炼化厂、油气田、集输管道及场站、LNG码头、介质类型、等。采集时应重点关注油气源的空间分布属性数据和时空运行记录数据。
中间管网储运企业数据:包括管道本体通达关系及时空分布数据,自身组织、运行、管容、计量等数据及时空特征。如每个管道主干和支线网络所途径的空间位置和拓扑关系,管道自身管径、管容、材质等运行规格,油气管道首站、储气库位置、管道出口分布规律等。
下游用户单位需求数据:对油气企业,如厂矿企业、重要单位、分销城燃、加油气站等油气用户市场数据及其时空分布特征数据进行采集,并对其历史需求量进行采集和记录。
数据采集完成后,建立管网调度时空数据库。并在此基础上进行管网调度时空分析和知识挖掘。利用统计工具和空间分析工具,进行时空数据挖掘和分析,建立时空知识引擎,输出管网时空知识。管网调度时空知识关注矩阵可参照表1:
表1
Figure BDA0003674373550000231
下一步,进行时空图谱构建。在时空知识规则、模板和原则的引导下,基于时空数据库设计并抽取时空实体、关系、属性和标签。先确定业务领域和范围,理清每类时空知识的内涵、来源和用途,设计知识本体模型,适当选取实体、属性及其关系的粒度,构建时空知识图谱。步骤可参考如下:
可在调度时空数据库中管道、机构、用户、场站、业务流程、储气库等等管道基础实体,添加设计参数、运行参数等基本属性特征,并依据业务特征和语义设计添加实体间的关联关系,形成初始的管网调度基础图谱和基础知识库。
在此基础上关联其起始位置、途径区域、连通方向、行政划分等空间实体,添加行政属性、区域属性、空间属性等,附加各实体之间的拓扑关系、方位关系、距离关系等空间关系,建立初始的空间知识图谱和空间知识库。
最后为全部实体通过时间关联和计算算法添加生效时间,变化趋势等时间实体。附加时间戳,时间段、年月日等时间属性,判定生成时间隶属、包含、异常等时间关系,形成初步的时空知识图谱和知识库。
初步的调度时空知识图谱形成后,继续根据调度业务需求,进行图谱质量提升,优化完善图谱实体、关系、属性设计,并调整数据采集和时空挖掘分析模型、规则,形成动态更新的管网调度时空知识库。
进一步的,可将上述过程通过信息系统来实现自动化和沉淀。构建调度决策知识库,建立可视化的知识图谱辅助决策系统,提供管网调度的时空知识应用。
例如:
管网一张图应用:在时空管网知识图谱和知识库的基础上,叠加地理信息可视化组件,构建全部管道网络的时空变化图、运行状态图等,还可以借助自然语言识别工具,提供基于管网时空知识库的智能问答查询功能,如“截至2020年,雄安新区境内的油气管道名称都有哪些?”,可通过在管网时空知识库中查询,“select管道名称from管网时空知识库where时间有效性<=2020年AND地理区域=雄安新区”的逻辑查询来实现。
基于管网通达性的“一张票坐到底”:可以基于管网调度时空知识库进行通达性判定和识别,形成面向用户运输服务的油气管网停靠站点清单和服务系统。用户可以只需要按起始站和终止站间里程、输送介质、时效来付费,采购“油气运输服务票”,来实现按需的油气运输服务。且可以在服务系统上实时查询油气运输时空状态,中间运输企业内部的调度细节。
管网末端配送区域优化:通过分析管网用户区域位置和时空需求规律知识,利用图分析算法,进行路径分析和距离分析,重新设计管网调度规则,优化新建管网路由设置,为管道储运企业合理的分配管网末端配送网络,更快的将油气服务输送到指定位置,将管网资源价值最大化。
在另一个实例中,以北斗智慧管网风险时空分析为例。
本实例的目标是提高对管道设计、施工、运行过程中的管道相关人、机、料、法、环的风险监控管理水平。实现思路如下:
采集管道基础数据和时空数据,并结合北斗精准定位数据采集技术和物联网感知设备,对管道、人员、机构、物料、设备、环境等方面进行持续识别、定位、监测,构建北斗智慧管网时空数据中心。
通过时空数据挖掘和分析,建立管道预警、决策时空分析模型,制定管道安全、质量、进度、成本的时空风险判定规则;基于AI算法和机器视觉技术,对人的不安全行为、物的不安全状态、环境的不安全因素等进行自动目标识别、跟踪,实现智能风险识别。构建北斗智慧管网知识库和知识引擎。
在此基础上,设计提取智慧管网风险识别的实体、关系、属性,包括上述的管道、人员、机构、物料、流程、设备、环境等领域。并进一步进行知识融合,构建基于北斗坐标位置信息的空间、时间知识本体。将上述实体、关系及属性升级至时空知识图谱。并结合实际应用需求,进行知识融合,对风险时空知识图谱的本体设计进行优化,提升时空风险识别的质量及准确性。同时借助人工智能及机器学习,提高知识图谱更新维护的自动化程度,逐步将人工判定干预频率降低,提升管道风险时空知识图谱的实时性支持。
进一步的,结合大数据平台和人工智能分析计算平台,提供实时智能预警算力,及时发现管道风险、违规操作及安全隐患,最终实现全方位智慧管网风险识别、监控。
应用于以下场景:
类似缺陷快速发现:通过子图匹配查询,查询特定时间段内,同批次缺陷设备、机构的业务活动范围及影响边界;某次小范围特殊环境灾害风险的快速定位等。
管道地质灾害变形监测:接入包括北斗地基增强站、北斗监测站、裂缝计、测斜仪、雨量计等设备的实时数据,以及数据自动化处理系统,采用实时和事后高精度解算、时空分析模型及算法等提供的时空知识分析引擎工具,提供监测点的时空演变模型。并结合时空图谱,提供数据发布查询和预测服务,自动关联生成动态工程图,实现监测点瞬变和徐变的位移变形情况的全天候、全天时监控。
高后果区动态跟踪:对人口密集、穿跨越、高价值构筑物等管道附近的管道高后果区,构建高后果区实体,对高后果区的基础数据、空间数据、时间数据等进行梳理和采集,结合时空数据库进行高后果区风险识别,进行时空知识挖掘,建立高后果区时空知识图谱。可视化的提供高后果区实时时空查询展示。可生成动态的管道高后果区的条带工程图,涵盖的管道埋深、管径、输送压力等管道基础知识,学校、铁路、社区、构筑物、地质灾害易发区等空间风险知识,以及风险区域和要素的动态变化趋势,辅助高风险区域的反演和预测。
在又一个实例中,以外部社会舆论数据中的管道风险识别和应急响应为例。
此场景重点是通过对外部数据源的自动监测和判定规则,通过知识抽取,结合时空知识图谱,进行风险的定位和响应。其实现过程如下:
通过专家和先验知识,设置社会舆论媒体数据中油气管道风险事件的采集关键词和判定规则。如对关注的“管道名称”、“风险类型”、“时间”、“地点”、“事件”、“危害结果”、“事件经过描述”等关键词进行多模态数据识别。并构建管道风险在实体、属性和关系的时空标签。
通过爬虫、自动化捕捉脚本、舆论热词搜索工具等,针对新闻、微博、博客、微视频等社会舆论进行常态化管道风险事件数据采集和过滤。触发设置的规则后,进一步借助人工对相关事件的文本、图片、视频等进行详细跟进采集,形成事件时空数据。
结合构建的时空数据图谱,进行关联分析,提供事件点的时空知识,并进行时空知识推理,提供上下游跟踪、历史反演、风险范围评价,维抢修方案推荐等。对事件决策过程中的时空知识进行整理,分析,更新实体、关系的时空属性和知识,添加到时空知识库中,为后续类似事件提供时空知识匹配分析支持。
基于以上具体实例,本申请至少有如下技术效果:
构建智慧管网知识图谱,对剔除智慧管网大数据中的繁冗或低价值信息,挖掘高价值数据,赋予非时空数据时空关联属性,发现和展示数据间的显性和隐性关联关系,尤其是空间关联关系、时间趋势关系,发挥时空价值,具有重要意义。
管道工业尤其是智慧管网应用中对时空数据中的空间和时序信息非常关注,构建智慧管网时空知识图谱,可以打通各个业务领域的管道知识孤岛,使时空数据发挥更大价值。同时通过时空知识图谱来提升智慧管网时空知识应用的精准度,为知识推理和应用提供时间和空间上的有效边界。
构建时空数据图谱,使得人员、机构、管道、环境、设备、业务等各个实体在数据模型,数据血缘、时空调度、建运维研等各方面的逻辑关系,空间逻辑关系,时效关系一览无余,对管道对象进行动态、真实、有效的可视化展示,发现和解决数据管理与数据生产口径不一致的问题,避免出现两张皮的低效管理模式。
基于时空知识图谱的知识推理和应用系统,可以为智慧管网业务提供多种维度的时空知识问答、知识推荐、知识类比、知识探索、数据质量追踪纠错服务,对管道业务事件进行时空关联和跟踪,提供场景定制化的智能、精准时空知识辅助决策。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种智慧管网时空图谱构建的方法,其特征在于,包括:
获取智慧管网时空数据,以建立智慧管网时空数据库;
对所述智慧管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库;
根据所述管网时空知识库构建智慧管网时空知识图谱;
按照预设条件对所述智慧管网时空知识图谱进行更新和维护。
2.根据权利要求1所述的方法,其特征在于,所述获取智慧管网时空数据,以建立智慧管网时空数据库包括:
采集所述智慧管网时空数据;
对所述智慧管网时空数据进行梳理;
根据梳理后的智慧管网时空数据建立所述智慧管网时空数据库。
3.根据权利要求2所述的方法,其特征在于,所述智慧管网时空数据包括:
管道常规数据、时空针对性数据、外部公共时空数据。
4.根据权利要求2所述的方法,其特征在于,所述对所述智慧管网时空数据进行梳理包括以下中的至少一者:
通过设定数据规则对所述智慧管网时空数据进行梳理;
根据度量指标选择目标数据规则对所述智慧管网时空数据进行梳理。
5.根据权利要求1所述的方法,其特征在于,所述对所述智慧管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库包括:
通过知识抽取、空间或非空间关联,形成管网时空知识网络;
基于语义推理和空间计算实现知识重组,以形成所述智慧管网时空知识。
6.根据权利要求1所述的方法,其特征在于,所述对所述智慧管网时空数据库进行数据时空知识挖掘包括:
对管网时空规则进行识别提取;
对管网时空数据进行挖掘分析;
对管道大数据时空进行实时建模;
对智能时空数据进行预测推理;
对时空数据进行挂接融合。
7.根据权利要求1所述的方法,其特征在于,所述根据所述管网时空知识库构建智慧管网时空知识图谱包括:
根据所述管网时空知识库获取数据实体以及所述实体之间的关系;
根据所述实体和所述关系构建智慧管网时空概念图谱;
对所述智慧管网概念图谱进行实例化,以构建实例化图谱;
通过知识融合对所述实例化图谱进行质量优化,以得到所述智慧管网时空知识图谱。
8.根据权利要求7所述的方法,其特征在于,所述通过知识融合对所述实例化图谱进行质量优化包括以下中的至少一者:
对所述智慧管网时空知识图谱进行本体规范化;
对所述智慧管网时空知识图谱进行歧义消除和数据合并;
对所述智慧管网时空知识图谱的数据质量进行跟踪优化。
9.根据权利要求1所述的方法,其特征在于,所述按照预设条件对所述智慧管网时空知识图谱进行更新和维护包括以下中的至少一者:
在检测到产生新增数据的情况下,对所述智慧管网时空知识图谱进行更新和维护;
按照预设周期对所述智慧管网时空知识图谱进行更新和维护;
通过自动化工具对所述智慧管网时空知识图谱进行更新和维护。
10.一种智慧管网时空图谱构建的装置,其特征在于,包括:
数据采集模块,被配置成获取智慧管网时空数据,以建立智慧管网时空数据库;
数据挖掘模块,被配置成对所述智慧管网时空数据库进行数据时空知识挖掘,以得到管网时空知识库;
图谱构建模块,被配置成根据所述管网时空知识库构建智慧管网时空知识图谱;
更新维护模块,被配置成按照预设条件对所述智慧管网时空知识图谱进行更新和维护。
CN202210616189.1A 2022-06-01 2022-06-01 一种智慧管网时空图谱构建的方法及装置 Pending CN114860891A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210616189.1A CN114860891A (zh) 2022-06-01 2022-06-01 一种智慧管网时空图谱构建的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210616189.1A CN114860891A (zh) 2022-06-01 2022-06-01 一种智慧管网时空图谱构建的方法及装置

Publications (1)

Publication Number Publication Date
CN114860891A true CN114860891A (zh) 2022-08-05

Family

ID=82641172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210616189.1A Pending CN114860891A (zh) 2022-06-01 2022-06-01 一种智慧管网时空图谱构建的方法及装置

Country Status (1)

Country Link
CN (1) CN114860891A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290366A (zh) * 2023-08-14 2023-12-26 中国船舶集团有限公司第七〇九研究所 一种不确定性态势时空知识图谱更新方法及系统
CN117973222A (zh) * 2024-02-29 2024-05-03 江西师范大学 一种基于知识图谱的尾矿库形变预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290366A (zh) * 2023-08-14 2023-12-26 中国船舶集团有限公司第七〇九研究所 一种不确定性态势时空知识图谱更新方法及系统
CN117290366B (zh) * 2023-08-14 2024-08-06 中国船舶集团有限公司第七〇九研究所 一种不确定性态势时空知识图谱更新方法及系统
CN117973222A (zh) * 2024-02-29 2024-05-03 江西师范大学 一种基于知识图谱的尾矿库形变预测方法
CN117973222B (zh) * 2024-02-29 2024-09-13 江西师范大学 一种基于知识图谱的尾矿库形变预测方法

Similar Documents

Publication Publication Date Title
CN116307757B (zh) 一种数据智能交互方法、交互系统、计算机设备及应用
CN110796470B (zh) 一种面向市场主体监管和服务的数据分析系统
Souza et al. City Information Modelling as a support decision tool for planning and management of cities: A systematic literature review and bibliometric analysis
CN112347222B (zh) 一种基于知识库推理的将非标准地址转换为标准地址的方法及系统
Chen et al. Construction automation: Research areas, industry concerns and suggestions for advancement
CN107679221B (zh) 面向减灾任务的时空数据获取与服务组合方案生成方法
CN114860891A (zh) 一种智慧管网时空图谱构建的方法及装置
Du et al. A method for matching crowd‐sourced and authoritative geospatial data
CN111160867A (zh) 大范围地域停车场大数据分析系统
CN111552820A (zh) 水工程调度数据处理方法及装置
CN114911908A (zh) 管网数据安全管理的方法及装置
CN113886596A (zh) 基于城市要素和多灾害融合的韧性城市知识图谱构建方法
Pandey et al. GIS: scope and benefits
CN118013825A (zh) 多层级多类型城市时空协同设计方法、系统、终端和介质
CN109753541A (zh) 一种关系网络构建方法和装置、计算机可读存储介质
CN113449120A (zh) 一种结合空间信息的管线安全综合监管方法
CN116701653A (zh) 基于知识图谱的加热炉数字孪生边缘方法、系统及装置
CN116050139A (zh) 一种多尺度国土空间规划实施监测方法及系统
CN114549044A (zh) 一种云数字园区系统
Chaturvedi Integration and management of time-dependent properties with semantic 3D city models
Guo et al. Research on digital management system of transport infrastructure in the era of big data
Corallo et al. Management of the maintenance process in social housing: A case study
CN115934749B (zh) 一种自然灾害综合风险普查数据一体化处理方法及应用
KR102699085B1 (ko) 부동산 통합 데이터베이스 구축 시스템
Munawar et al. Developing Business Intelligence Model in Creative Craft Industry To Support Acceleration of the Craft Exporter Industry In West Java

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination