CN113094516A - 一种基于多源数据融合的电网监控领域知识图谱构建方法 - Google Patents

一种基于多源数据融合的电网监控领域知识图谱构建方法 Download PDF

Info

Publication number
CN113094516A
CN113094516A CN202110457666.XA CN202110457666A CN113094516A CN 113094516 A CN113094516 A CN 113094516A CN 202110457666 A CN202110457666 A CN 202110457666A CN 113094516 A CN113094516 A CN 113094516A
Authority
CN
China
Prior art keywords
data
equipment
power grid
graph
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110457666.XA
Other languages
English (en)
Inventor
刘翌
杨垠彬
潘小辉
赵扬
张明
黄秋根
胡秦然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Southeast University
State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University, State Grid Jiangsu Electric Power Co Ltd filed Critical Southeast University
Priority to CN202110457666.XA priority Critical patent/CN113094516A/zh
Publication of CN113094516A publication Critical patent/CN113094516A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多源数据融合的电网监控领域知识图谱构建方法,包括如下步骤:(1)基于电网拓扑结构,构建基础的设备知识图谱;(2)基于电网监控业务的需求,确定需要补充的实体类别和数据的来源;(3)获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值;(4)确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成的多源数据融合设备知识图谱。本发明在以往设备知识图谱的基础上融入了多源的数据,提高了图谱的覆盖率和应用范围。

Description

一种基于多源数据融合的电网监控领域知识图谱构建方法
技术领域
本发明涉及电网监控领域和人工智能领域,尤其是一种基于多源数据融合的电网监控领域知识图谱构建方法。
背景技术
目前智能电网调度控制系统已实现了集中监控、综合智能告警等功能,为电网故障判断处置和设备监控运行提供了技术支撑。但面对日益增长的的电网运行监控信息,现有技术手段主要以标准化推理规则库为依据,不能穷尽和覆盖相关情况,并且监控数据存储在不同的数据库中,多源数据无法相互关联,于是电网监控领域引入了知识图谱来存储关联海量的数据。
知识图谱作为一种基于人工智能技术的知识组织与构建方法,将知识以三元组的形式进行表示,并存储在图数据库中。图数据库由“节点”和“边”组成,充分利用节点之间能够相互指向的特点将不同的信息联系起来,对于处理类似于电网拓扑结构这类网状数据模型具有天然的优势。
目前,知识图谱在电网监控领域的研究可以分为三个方面:设备知识图谱,案例图谱和业务逻辑图谱。其中设备图谱主要包含电网中不同设备的连接关系。案例图谱是对每次故障的记录。业务逻辑图谱是将监控系统以往的规则和经验进行整理和存储。但是现有的监控领域设备知识图谱大多依据电网拓扑结构,仅仅将厂站中的设备关联在一起,没有充分利用知识图谱扩展性强、关联性广的特点。因此如何使用知识图谱代替以往的多个数据库,在实现基本设备关联的基础上有效地融入更多的信息,进一步实现电力系统智能调度、智能监控,是构建电网监控领域知识图谱中亟待解决的问题。
国内外专家学者已对领域图谱的构建方法展开大量研究工作,大多数研究针对的是图谱构建中的某个环节或者特定领域的图谱构建方法,尚未对多源数据融合的电网监控领域设备知识图谱展开深入的探讨研究。
发明内容
本发明所要解决的技术问题在于,提供一种基于多源数据融合的电网监控领域知识图谱构建方法,能够将电网监控领域中多源的数据融合到知识图谱中,提高图谱的覆盖率和应用范围,满足监控领域“电网一张图”的需求。
为解决上述技术问题,本发明一种基于多源数据融合的电网监控领域知识图谱构建方法,包括如下步骤:
(1)基于电网拓扑结构,构建基础的设备知识图谱
(2)基于电网监控业务的需求,确定需要补充的实体类别和数据的来源;
(3)获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值;
(4)确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成的多源数据融合设备知识图谱。
优选的,步骤(1)具体为:
(11)根据业务需求,参照电网拓扑结构模型,设计设备图谱的连接结构;
(12)将结构中所需要的数据按照图谱所需的三元组形式进行整理;
(13)调用图数据库接口导入三元组,形成基础设备知识图谱。
优选的,步骤(2)具体为:
(21)针对电网监控领域所需信息,确定所需的数据分布在设备台账、变电站情况表和处置手册中,其中设备台账和变电站情况表中的数据是半结构化的表格数据,而处置手册中的数据是非结构化的文本数据;
(22)对于表格数据,通过搜索抓取对应的行或列获得需要的数据;非结构化的文本数据由于数据量较小(只有102个典型监控信息)且数据结构复杂,若通过人工标注再进行计算机抽取,会耗费大量人力且无法保证提取的准确率,因此,采用人工归纳的方法。
优选的,步骤(3)具体为:
(31)在设备台账中,设备电压等级、间隔类型、设备投运日期是设备的内在特征,所以可以作为旧图谱中设备节点的属性值;设备生产厂家是新的概念即新实体,所以需要创建新的节点;而设备生产时间是设备生产厂家和设备之间的关系,所以作为这两类节点的边;
(32)在变电站情况表中,变电站类型和变电站投运日期是变电站的内在特征,所以可作为旧图谱中变电站节点的属性值;保电场所、配网调控、运维驻地和检修单位是新概念即新实体,所以需要创建新节点;而检修时间是检修单位和变电站之间的关系,所以作为这两类节点的边;
(33)在处置手册中,信号触发原因和故障处理方法都是保护信号的内在特征,所以可以作为旧图谱中保护信号的属性值。
优选的,步骤(4)具体为:
(41)对于属性类而言,首先构建{实体:属性}的词典,例如{设备:设备电压等级};然后在图数据库中匹配到对应的实体,例如XX设备;最后将属性值添加到对应的节点中;
(42)对于节点类而言,直接在图数据库中创建新的节点;
(43)对于边类而言,首先构建{头实体,关系,尾实体}这样的三元组集合,例如{设备,生产时间,生产厂家};然后在图数据库中匹配到头实体和尾实体;最后将关系作为边连接的两类节点。
本发明的有益效果为:(1)本发明提出的多源数据融合知识图谱方法不仅考虑了电网拓扑结构相关的设备关联数据,还将其它与监控领域相关的数据如:设备台账、事件处置情况等整合在一起;(2)本发明提出的多源数据融合知识图谱方法相对于通用的设备知识图谱该模型不仅提高了图谱的覆盖率还拓宽了图谱的应用场景。
附图说明
图1为本发明的方法流程示意图。
图2为本发明电网监控领域基础设备知识图谱结构示意图。
图3为本发明多源数据来源和处理方法示意图。
图4为本发明判断数据类型的流程示意图。
图5为本发明构建图谱不同类的流程示意图。
图6为本发明基于多源数据融合的设备知识图谱示意图。
具体实施方式
如图1所示,一种基于多源数据融合的电网监控领域知识图谱构建方法,包括如下步骤:
(1)基于电网拓扑结构,构建基础的设备知识图谱;
(2)基于电网监控业务的需求,确定需要补充的实体类别和数据的来源;
(3)获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值;
(4)确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成的多源数据融合设备知识图谱。
下面对本发明技术方案进行详细说明:
步骤1:基于电网拓扑结构,构建基础的设备知识图谱,主要实施步骤如下所述:
(1)根据业务需求,参照电网拓扑结构模型,设计设备图谱的连接结构
(2)将结构中所需要的数据按照图谱所需的三元组形式进行整理;
(3)调用图数据库接口导入三元组,形成基础设备知识图谱,基础设备知识图谱的结构如图2所示。
步骤2:基于电网监控业务的需求,确定需要补充的实体类别和数据的来源,主要实施步骤如下所述:
(1)针对电网监控领域所需信息,确定所需的数据分布在设备台账、变电站情况表和处置手册中,其中设备台账和变电站情况表中的数据是半结构化的表格数据,而处置手册中的数据是非结构化的文本数据,数据来源和所需数据如图3所示;
(2)对于表格数据,通过搜索抓取对应的行或列获得需要的数据;非结构化的文本数据由于数据量较小(只有102个典型监控信息)且数据结构复杂,若通过人工标注再进行计算机抽取,会耗费大量人力且无法保证提取的准确率,因此,采用人工归纳的方法,数据处理方法如图3所示。
步骤3:获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值,具体实现步骤如下所述:
(1)在设备台账中,设备电压等级、间隔类型、设备投运日期是设备的内在特征,所以可以作为旧图谱中设备节点的属性值;设备生产厂家是新的概念即新实体,所以需要创建新的节点;而设备生产时间是设备生产厂家和设备之间的关系,所以作为这两类节点的边,设备台账数据的处理流程如图4所示;
(2)在变电站情况表中,变电站类型和变电站投运日期是变电站的内在特征,所以可作为旧图谱中变电站节点的属性值;保电场所、配网调控、运维驻地和检修单位是新概念即新实体,所以需要创建新节点;而检修时间是检修单位和变电站之间的关系,所以作为这两类节点的边,变电站情况表数据的处理方法如图4所示;
(3)在处置手册中,信号触发原因和故障处理方法都是保护信号的内在特征,所以可以作为旧图谱中保护信号的属性值,处置手册数据的处理方式如图4所示。
步骤4:确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成的多源数据融合设备知识图谱,具体实现步骤如下所述:
(1)对于属性类而言,首先构建{实体:属性}的词典,例如{设备:设备电压等级};然后在图数据库中匹配到对应的实体,例如XX设备;最后将属性值添加到对应的节点中,属性类的处理方法如图5所示;
(2)对于节点类而言,直接在图数据库中创建新的节点,节点类的处理方法如图5所示;
(3)对于边类而言,首先构建{头实体,关系,尾实体}这样的三元组集合,例如{设备,生产时间,生产厂家};然后在图数据库中匹配到头实体和尾实体;最后将关系作为边连接的两类节点,边类的处理方式如图5所示;
(4)通过将三元组数据导入Neo4j图数据库,形成多源数据融合的电网监控领域设备知识图谱,图谱结构如图6所示。

Claims (5)

1.一种基于多源数据融合的电网监控领域知识图谱构建方法,其特征在于,包括如下步骤:
(1)基于电网拓扑结构,构建基础的设备知识图谱;
(2)基于电网监控业务的需求,确定需要补充的实体类别和数据的来源;
(3)获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值;
(4)确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成多源数据融合设备知识图谱。
2.如权利要求1所述的基于多源数据融合的电网监控领域知识图谱构建方法,其特征在于,步骤(1)具体为:
(11)根据业务需求,参照电网拓扑结构模型,设计设备图谱的连接结构;
(12)将结构中所需要的数据按照图谱所需的三元组形式进行整理;
(13)调用图数据库接口导入三元组,形成基础设备知识图谱。
3.如权利要求1所述的基于多源数据融合的电网监控领域知识图谱构建方法,其特征在于,步骤(2)具体为:
(21)针对电网监控领域所需信息,确定所需的数据分布在设备台账、变电站情况表和处置手册中,其中设备台账和变电站情况表中的数据是半结构化的表格数据,而处置手册中的数据是非结构化的文本数据;
(22)对于表格数据,通过搜索抓取对应的行或列获得需要的数据;非结构化的文本数据采用人工归纳的方法。
4.如权利要求1所述的基于多源数据融合的电网监控领域知识图谱构建方法,其特征在于,步骤(3)具体为:
(31)在设备台账中,设备电压等级、间隔类型、设备投运日期作为旧图谱中设备节点的属性值;设备生产厂家需要创建新的节点;设备生产时间所以作为这两类节点的边;
(32)在变电站情况表中,变电站类型和变电站投运日期作为旧图谱中变电站节点的属性值;保电场所、配网调控、运维驻地和检修单位需要创建新节点;检修时间作为这两类节点的边;
(33)在处置手册中,信号触发原因和故障处理方法作为旧图谱中保护信号的属性值。
5.如权利要求1所述的基于多源数据融合的电网监控领域知识图谱构建方法,其特征在于,步骤(4)具体为:
(41)对于属性类而言,首先构建{实体:属性}的词典;然后在图数据库中匹配到对应的实体;最后将属性值添加到对应的节点中;
(42)对于节点类而言,直接在图数据库中创建新的节点;
(43)对于边类而言,首先构建{头实体,关系,尾实体}这样的三元组集合,;然后在图数据库中匹配到头实体和尾实体;最后将关系作为边连接的两类节点。
CN202110457666.XA 2021-04-27 2021-04-27 一种基于多源数据融合的电网监控领域知识图谱构建方法 Pending CN113094516A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110457666.XA CN113094516A (zh) 2021-04-27 2021-04-27 一种基于多源数据融合的电网监控领域知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110457666.XA CN113094516A (zh) 2021-04-27 2021-04-27 一种基于多源数据融合的电网监控领域知识图谱构建方法

Publications (1)

Publication Number Publication Date
CN113094516A true CN113094516A (zh) 2021-07-09

Family

ID=76680162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110457666.XA Pending CN113094516A (zh) 2021-04-27 2021-04-27 一种基于多源数据融合的电网监控领域知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN113094516A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779178A (zh) * 2021-09-13 2021-12-10 国网电子商务有限公司 基于知识图谱的数据存储方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018036239A1 (zh) * 2016-08-24 2018-03-01 慧科讯业有限公司 基于行业知识图谱数据库对互联网媒体事件进行监测的方法、装置和系统
WO2018072563A1 (zh) * 2016-10-18 2018-04-26 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN109840270A (zh) * 2018-12-23 2019-06-04 国网浙江省电力有限公司 一种基于Neo4j的电网设备信息管理方法
CN110727741A (zh) * 2019-09-29 2020-01-24 全球能源互联网研究院有限公司 一种电力系统的知识图谱构建方法及系统
CN110781249A (zh) * 2019-10-16 2020-02-11 华电国际电力股份有限公司技术服务分公司 基于知识图谱的火电厂多源数据融合方法与装置
CN111768077A (zh) * 2020-05-28 2020-10-13 国网浙江省电力有限公司绍兴供电公司 一种基于知识图谱的电网跳闸事件智能识别方法
CN112580831A (zh) * 2020-11-19 2021-03-30 国网江苏省电力有限公司信息通信分公司 一种基于知识图谱的电力通信网智能辅助运维方法及系统
CN112612902A (zh) * 2020-12-23 2021-04-06 国网浙江省电力有限公司电力科学研究院 一种电网主设备的知识图谱构建方法及设备
CN112685472A (zh) * 2020-12-28 2021-04-20 中国电力科学研究院有限公司 一种电网多站融合监控方法、装置、电子设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018036239A1 (zh) * 2016-08-24 2018-03-01 慧科讯业有限公司 基于行业知识图谱数据库对互联网媒体事件进行监测的方法、装置和系统
WO2018072563A1 (zh) * 2016-10-18 2018-04-26 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN109840270A (zh) * 2018-12-23 2019-06-04 国网浙江省电力有限公司 一种基于Neo4j的电网设备信息管理方法
CN110727741A (zh) * 2019-09-29 2020-01-24 全球能源互联网研究院有限公司 一种电力系统的知识图谱构建方法及系统
CN110781249A (zh) * 2019-10-16 2020-02-11 华电国际电力股份有限公司技术服务分公司 基于知识图谱的火电厂多源数据融合方法与装置
CN111768077A (zh) * 2020-05-28 2020-10-13 国网浙江省电力有限公司绍兴供电公司 一种基于知识图谱的电网跳闸事件智能识别方法
CN112580831A (zh) * 2020-11-19 2021-03-30 国网江苏省电力有限公司信息通信分公司 一种基于知识图谱的电力通信网智能辅助运维方法及系统
CN112612902A (zh) * 2020-12-23 2021-04-06 国网浙江省电力有限公司电力科学研究院 一种电网主设备的知识图谱构建方法及设备
CN112685472A (zh) * 2020-12-28 2021-04-20 中国电力科学研究院有限公司 一种电网多站融合监控方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
施正钗;郑俊翔;周泰斌;徐伟敏;郑微;: "基于语义分析的设备监控告警信息知识图谱构建研究", 浙江电力, no. 08, 25 August 2020 (2020-08-25) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779178A (zh) * 2021-09-13 2021-12-10 国网电子商务有限公司 基于知识图谱的数据存储方法和装置

Similar Documents

Publication Publication Date Title
CN113283704B (zh) 基于知识图谱的电网故障智能处置系统及方法
WO2023115842A1 (zh) 一种数据驱动的离线在线一体化配电网仿真系统及方法
CN109635127B (zh) 一种基于大数据技术的电力设备画像知识图谱构建方法
CN110674311A (zh) 一种基于知识图谱的电力资产异构数据融合方法
CN102522819B (zh) 智能变电站故障录波装置的录波模型建模方法
CN110795921B (zh) 一种智能变电站设备监控信息自动生成及校验方法
CN113553420B (zh) 基于知识图谱的电网故障处理规程推荐方法和系统
CN102779156B (zh) 数字化变电站中通信装置的数据库配置方法
CN105809260A (zh) 一种调度自动化系统监控信息点表智能生成方法
CN109284346A (zh) 一种基于云计算的配电网规划方法及装置
CN112685570B (zh) 一种基于多标签图的电网网架知识图谱的构建方法
CN109101685B (zh) 一种适用于综合能源管控系统的多介质能源设备建模方法
CN112948572A (zh) 通过知识图谱可视化展示电力系统设备信息与关系的方法
CN114548800A (zh) 基于电网知识图谱的未来态电网检修风险辨识方法及装置
CN106504115A (zh) 基于海量数据的水电生产实时信息处理系统和方法
CN111177323B (zh) 基于人工智能的停电计划非结构化数据提取与识别方法
CN115033704A (zh) 基于图数据库的配网故障预案知识图谱设计方法及系统
CN114201844A (zh) 一种基于iec61850标准的水电站全景建模方法
CN103488726A (zh) 基于web-service的建设电网统一数据平台的方法
CN108764750A (zh) 主配网模型建模及拓扑分析方法和系统
CN113094516A (zh) 一种基于多源数据融合的电网监控领域知识图谱构建方法
CN108230183A (zh) 一种基于时标量测的电网设备多维度综合告警的处理方法
CN107944659A (zh) 一种厂站监控系统报表自动生成方法与装置
CN101867185A (zh) 电力系统的pi测点自动维护系统及其维护方法
CN105468663A (zh) 一种基于云模型的智能决策电网知识库的搭建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 215 Shanghai Road, Nanjing, Jiangsu 210000

Applicant after: STATE GRID JIANGSU ELECTRIC POWER Co.,Ltd.

Applicant after: Southeast University

Address before: 210096, No. four archway, Xuanwu District, Jiangsu, Nanjing 2

Applicant before: SOUTHEAST University

Applicant before: State Grid Jiangsu Electric Power Co., Ltd