CN117829683A - 基于图对比学习的电力物联数据质量分析方法及系统 - Google Patents
基于图对比学习的电力物联数据质量分析方法及系统 Download PDFInfo
- Publication number
- CN117829683A CN117829683A CN202410238789.8A CN202410238789A CN117829683A CN 117829683 A CN117829683 A CN 117829683A CN 202410238789 A CN202410238789 A CN 202410238789A CN 117829683 A CN117829683 A CN 117829683A
- Authority
- CN
- China
- Prior art keywords
- graph
- data
- electric power
- quality
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 claims abstract description 89
- 238000013441 quality evaluation Methods 0.000 claims abstract description 23
- 238000005457 optimization Methods 0.000 claims abstract description 15
- 238000012546 transfer Methods 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 49
- 239000011159 matrix material Substances 0.000 claims description 34
- 238000009826 distribution Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 11
- 238000011156 evaluation Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000004931 aggregating effect Effects 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011158 quantitative evaluation Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明涉及基于图对比学习的电力物联数据质量分析方法及系统,利用电力数据质量评价指标体系建立特征依赖关系图,在此基础上依次利用特征传递优化和两种自适应随机图数据增强方法对特征依赖关系图进行处理,并通过图卷积神经网络提取数据特征,来训练基于图对比学习的电力数据质量分析模型,可以实现数据质量的综合分析,帮助海量电力物联数据可用性和有效性得到提升。
Description
技术领域
本发明涉及电力数据分析技术领域,具体为基于图对比学习的电力物联数据质量分析方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
电力系统运行时产生的状态监测数据、电能计量数据、历史运行数据等信息数量庞大、增长快速,呈现出大数据特征。在会对这部分数据进行分析时,传统的数据质量分析方法有定性法、定量法以及两者结合的综合评价法。
定性评价方法一般基于一定的评价准则与要求,根据评价的目的和用户对象的需求,从定性的角度来对数据质量进行描述与评价,如第三方评测法、用户反馈法,专家评议法等,但该类数据质量评价方法主观性较大,存在较大的误差。
定量评价方法是指按照数量分析方法,从客观量化角度对数据质量进行的优选与评价,如统计分析法、内容评分法等,该类方法较为固定,质量分析结果也存在一定误差。
综合方法将定性和定量两种方法结合起来,从两个角度对数据资源质量进行评价,如层次分析法、缺陷扣分法等,层次分析法也是目前最常用的方法,但只依赖单一方法无法满足电力系统海量数据的处理要求。为了满足需求并且提升数据质量分析与处理的智能化和自动化水平,灰色理论、熵权法以及人工神经网络等众多方法运用到电力数据质量分析领域,但此类方法都没有深入挖掘电力数据特征之间的相互依赖关系,存在数据处理能力差的问题。并且目前大多数结合人工智能的数据质量分析方法往往只停留在一维数据领域,无法深入挖掘数据之间的潜在联系,存在数据理解和认知能力差的局限性。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供基于图对比学习的电力物联数据质量分析方法及系统,利用电力数据质量评价指标体系建立特征依赖关系图,在此基础上依次利用特征传递优化和两种自适应随机图数据增强方法对特征依赖关系图进行处理,并通过图卷积神经网络提取数据特征,来训练基于图对比学习的电力数据质量分析模型,可以实现数据质量的综合分析,助力海量电力物联数据可用性和有效性的提升。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供基于图对比学习的电力物联数据质量分析方法,包括以下步骤:
定义图数据集,图数据集包含节点集、边集和加权邻接矩阵,以获取的电力物联时间序列数据作为节点集中的节点,数据特征间的依赖关系作为边集中的边,通过加权邻接矩阵,为图中的节点添加设定的质量评价指标作为特征信息,形成特征依赖关系图;
得到的特征依赖关系图利用删除边的方法和屏蔽节点特征的方法进行数据增强,并通过对应的图卷积网络提取特征信息;
以数据增强后得到的视图作为图对比学习的正样本,待检测数据的特征依赖关系图作为图对比学习的负样本,正样本和负样本经对比学习分别得到相应的输出,通过正样本和负样本之间的对比损失函数和监督损失函数的组合构造目标函数,得到质量分析结果,确定正样本和负样本所对应的数据质量分布情况。
进一步的,构造特征依赖关系图,选取电力物联时间序列数据作为图中的节点/>,数据特征间的依赖关系作为图中的边/>,通过加权邻接矩阵/>为图中的节点添加特征信息。
进一步的,通过加权邻接矩阵为图中的节点添加设定的质量评价指标作为特征信息,如下式所示:
;
其中,J表示准确性、K表示完整性、S表示有效性、C表示一致性、R表示冗余度。
进一步的,构造度矩阵表示节点的度,其中,/>为节点的加权邻接矩阵,假设图是无权重的,若/>,则/>,否则/>。
进一步的,通过特征传递优化加强特征依赖关系图的特征差异,特征关系网络的输出定义如下:
;
其中,是数据样本的矢量表示,/>是v-1次FTO处理后的样本数据,/>是v次FTO过程后的特征数据,表示第v-1层节点的信息被融合到第v层节点,α是信息反湮灭因子。
进一步的,删除边的方法,具体为:通过节点的度中心性计算边中心性/>,根据得到的边的重要性,删除设定概率的边,概率公式如下:
;
其中,为超参数,表示控制删除边的总体概率;/>为/>的最大值;/>为/>的平均值;/>为截止概率,用于限制概率的最大值。
进一步的,屏蔽节点特征的方法,具体为:在节点属性层面上,遮蔽节点特征中含有零的维度,采样一个随机向量,其中,/>为遮盖第i维节点特征的概率,将节点第d维的权重进行归一化得到表示特征的重要程度,如下式所示:
;
其中,,/>为/>的最大值;/>为/>的平均值,/>为控制特征增强整体大小的超参数。
进一步的,通过对应的图卷积网络提取特征信息,具体为:图卷积层将图节点的输入特征x与邻接矩阵融合,进行卷积运算得到提取的节点输出特征y,图卷积运算定义为:
;
其中,是图的卷积核。/>表示图卷积运算,/>是激活函数。
进一步的,通过正样本和负样本之间的对比损失函数和监督损失函数的组合构造目标函数,得到质量分析结果,具体为:
采用相对熵函数作为图对比学习的对比损失函数,最小化交叉熵函数作为图对比学习的监督损失函数,最终的目标函数定义为:
;
其中,为对比损失函数,/>为监督损失函数,/>为平衡两种损失的超参数,/>。
本发明的第二个方面提供基于图对比学习的电力物联数据质量分析系统,包括:
特征关系模块,被配置为:定义图数据集,图数据集包含节点集、边集和加权邻接矩阵,以获取的电力物联时间序列数据作为节点集中的节点,数据特征间的依赖关系作为边集中的边,通过加权邻接矩阵,为图中的节点添加设定的质量评价指标作为特征信息,形成特征依赖关系图;
数据增强模块,被配置为:得到的特征依赖关系图利用删除边的方法和屏蔽节点特征的方法进行数据增强,并通过对应的图卷积网络提取特征信息;
对比学习模块,被配置为:以数据增强后得到的视图作为图对比学习的正样本,待检测数据的特征依赖关系图作为图对比学习的负样本,正样本和负样本经对比学习分别得到相应的输出,通过正样本和负样本之间的对比损失函数和监督损失函数的组合构造目标函数,得到质量分析结果,确定正样本和负样本所对应的数据质量分布情况。
本发明的第三个方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述配基于图对比学习的电力物联数据质量分析方法中的步骤。
本发明的第四个方面提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述基于图对比学习的电力物联数据质量分析方法中的步骤。
与现有技术相比,以上一个或多个技术方案存在以下有益效果:
1、利用电力数据质量评价指标体系建立特征依赖关系图,在此基础上依次利用特征传递优化和两种自适应随机图数据增强方法对特征依赖关系图进行处理,并通过图卷积神经网络提取数据特征,来训练基于图对比学习的电力数据质量分析模型,可以实现数据质量的综合分析,帮助海量电力物联数据可用性和有效性得到提升。
2、基于电力数据质量评价指标体系、特征传递优化和自适应随机增强的电力物联数据特征依赖关系图生成及增强方法,能够有效挖掘电力数据之间的特征关系,避免了数据关联性不明确的问题。
3、通过聚合电力物联数据特征信息,结合对比损失和监督损失对数据质量进行综合评估,可以有效提高数据质量分析的精确度。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明一个或多个实施例提供的数据质量分析流程示意图;
图2是本发明一个或多个实施例提供的电力数据质量评价指标体系示意图;
图3是本发明一个或多个实施例提供的数据质量分析模型结构示意图;
图4是本发明一个或多个实施例提供的图卷积结构示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
电力泛在物联网数据包括发、输、变、配、用、调度六大环节,从数据的来源可将电网数据分为电网内部数据和电网外部数据,电网内部数据主要指来自于电网内部系统,如用采系统、营销系统、广域检测系统、生产管理系统、能量管理系统、客户服务系统、财务系统等数据。电网外部数据来源于GIS供应商、天气、授时、监管部分等外部服务数据。常见的电力物联数据类型有电网负荷数据、电压、电流和功率数据、设备监测数据、电能质量数据、天气数据、环境数据、用户行为数据、维护管理数据等。
优质的电力物联数据应该具备以下特点:
1.准确性:数据应该准确反映电力系统的实际状况,包括电网负荷、电压、电流、功率等参数。
2.实时性:数据应该及时更新,反映电力系统的最新状态,以便及时进行调控。
3.完整性:数据应该包含电力系统的各个方面,例如发电、输电、配电等环节的数据,以便全面分析电力系统的运行状况。
4.一致性:数据应该按照统一的标准进行采集和处理,以确保数据的一致性和可比性。
5.可靠性:数据应该来自可靠的数据源,例如传感器、监测设备等,以确保数据的可靠性和准确性。
6.安全性:数据应该采用安全的传输和存储方式,以保护数据的隐私和安全。
电力物联数据可以应用于电网调度和运行优化、设备健康监测和维护管理、电能质量管理、用户用电行为分析等多个方面,例如:通过实时监测电力系统的负荷、电压、电流、功率等参数,对电网进行调度和运行优化,可提高电网的供电质量和效率。
以下实施例给出基于图对比学习的电力物联数据质量分析方法及系统,使用特征依赖关系图构建、图数据增强、图卷积神经网络和图对比学习方法对电力物联数据进行质量分析。
实施例一:
如图1-图4所示,基于图对比学习的电力物联数据质量分析方法,包括以下步骤:
根据电力数据多维关键特征建立电力数据质量评价指标体系,作为该电力数据质量分析方法的评判标准;
为了捕获电力数据特征之间的相互依赖关系,以质量评价指标为特征信息构建特征依赖关系图,通过特征关系网络进行特征传递优化,以增强关系图的特征差异;
基于特征依赖关系图进行自适应随机的数据增强处理,通过图卷积网络提取特征信息并挖掘深层关联关系;
通过图对比学习方法构建数据质量分析模型,对电力物联数据质量进行综合分析。
利用电力数据质量评价指标体系建立特征依赖关系图,在此基础上依次利用特征传递优化和两种自适应随机图数据增强方法对特征依赖关系图进行处理,并通过图卷积神经网络提取数据特征,来训练基于图对比学习的电力数据质量分析模型,可以实现数据质量的综合分析,助力海量电力物联数据可用性和有效性的提升。
1)特征依赖关系图构建:以数据中台中,多个视角下的电力数据特征为出发点,根据电力数据多维关键特征建立电力数据质量评价指标体系,以质量评价指标为特征信息构建特征依赖关系图,并通过特征关系网络进行特征传递优化,作为数据质量分析模型的图数据基础。
2)图数据自适应随机增强:采用两种改进的图结构数据增强方法对特征依赖关系图进行自适应随机的数据增强,两种方法分别为:删除边和屏蔽节点特征。两种方法强调在随机增强数据的情况下尽可能保存图数据的结构和属性,以实现数据集的扩充。
3)特征提取:通过图卷积神经网络链接两种图数据增强方法,并对特征依赖关系图进行特征提取,聚合电力数据特征关系依赖图的特征信息并挖掘深层关联特征。
4)数据质量分析:基于图对比学习对数据质量进行分析,对于有效、可用的高质量数据构造的特征依赖关系图,将其通过数据增强得到的多个视图作为图对比学习的正样本,将待检测数据的特征依赖关系图作为图对比学习的负样本,二者进行对比学习,通过对比损失函数和监督损失函数的有效组合构造质量分析模型的目标函数,输出电力物联数据的质量分析结果。
本实施例中,数据质量分析方法整体流程图如图1所示。
步骤1:特征依赖关系图构建;为了描述电力数据间错综复杂的关联关系,挖掘数据质量划分中各个特性的相互关联性,本实施例从电力数据质量评价指标的建立出发,提出针对电力数据准确性、完整性、有效性、一致性和冗余度的数据质量评价指标体系,指标体系图如图2所示。
在指标体系的基础上,构造特征依赖关系图的具体步骤如下:
首先,定义一个图,其中/>为节点集,N为节点数;为边集,M为边数;/>表示加权邻接矩阵。选取电力物联时间序列数据作为图中的节点,数据特征间的依赖关系作为图中的边,通过加权邻接矩阵为图中的节点添加特征信息。
根据电力数据质量评价指标体系,对于电力物联数据,添加其特征属性如下:;其中,J表示准确性、K表示完整性、S表示有效性、C表示一致性、R表示冗余度。
构造度矩阵来表示节点的度,其中,/>为节点的加权邻接矩阵。假设图是无权重的,若/>,则/>,否则/>。
通过设计的特征关系网络增强邻接矩阵的特征差异,具体步骤如下:
当仅考虑样本中特征数据的特征关系时,根据特征关系对邻接矩阵A执行特征转移。
设为电力物联数据集/>中第j个特征数据的初始值,经过特征关系运算后,如下式所示:/>;其中,/>式在一次特征关系运算后/>的值,完整的数学描述如下所示:/>;该过程被定义为特征传递优化(FeatureTransferOptimization,FTO)。
该特征关系网络的输出定义如下:;其中,/>是数据样本的矢量表示,/>是v-1次FTO处理后的样本数据,/>是v次FTO过程后的特征数据。意味着第v-1层节点的信息被融合到第v层节点。α是信息反湮灭因子,它可以乘以第一代节点的值,以防止第一代信息被湮灭。
步骤2:依次采用两种改进的图结构数据增强方法对特征依赖关系图进行自适应随机的数据增强,两种方法分别为:删除边和屏蔽节点特征。两种方法强调在随机增强数据的情况下尽可能保存图数据的结构和属性,以实现数据集的扩充。
1)删除边:该方法首先通过节点的度中心性计算边中心性,根据得到的边的重要性,以一定概率删除不重要的边。
从输入图的边集E中采样修改的子集的概率集合定义如下:/>;其中:/>为增强视图中的边集;/>为删除边/>的概率,能反映边/>的重要性程度,能使增强方案以更高的概率删除不重要的边来保证图的结构完整。
在图中节点中心性是一种广泛使用的度量指标,用于量化图中节点的重要性。用边的中心性/>来表示2个相连节点间的重要性。设一个节点中心性度量/>,将边中心性定义为2个相邻节点中心性得分的平均值:/>;根据每条边的中心性计算出每条边的概率。由于节点的度中心性在数量级上会有不同,先设/>来减轻稠密节点的影响,然后进行归一化,将值转化为概率:/>;其中:/>为一个超参数,目的是控制删除边的总体概率;/>为/>的最大值;/>为/>的平均值;/>为截止概率,用于限制概率的最大值,因为过高的删除概率会严重损坏图结构。
2)屏蔽节点特征:在节点属性层面上,遮蔽节点特征中含有零的维度,首先采样一个随机向量,它的每个维度都是独立且服从伯努利分布的,即/>,其中/>为遮盖第i维节点特征的概率。生成的节点特征矩阵/>表达式如下:;其中:“;”表示拼接操作,“/>”表示元素积。对于稀疏的独热节点特征,例如节点i的第d维/>,计算维度d的权重如下:/>;其中:/>为衡量节点重要性的指标。节点特征/>不能直接计算每个独热编码值的出现次数,因此利用绝对值/>测量节点i在第d维特征值的大小:/>;最后将权重进行归一化得到表示特征的重要程度:/>:其中:/>,/>为/>的最大值;为/>的平均值,/>为控制特征增强整体大小的超参数。
最终在数据增强部分执行拓扑级和节点级属性增强生成多个增强视图。
步骤3:数据质量分析模型的结构如图3所示,分别在删除边和屏蔽节点特征的两种图数据增强之后设置图卷积层,以更好的挖掘电力数据的深层依赖关系。图卷积网络特征提取的具体步骤如下:
通过组合图的邻接矩阵A和度矩阵D可以获得图的归一化拉普拉斯矩阵L:;其中,/>是特征值矩阵,/>是特征向量矩阵,T是矩阵换位运算。
图卷积运算可以定义为:;其中,y是节点的输出特征,/>是图的卷积核。/>表示/>上的图卷积运算。x是节点的输入特征,/>是激活函数。
图卷积层的结构如图4所示,图卷积层将图节点的特征与邻接矩阵融合,得到提取的节点特征。x i和y i分别是第i个节点的输入和输出特征。
此外,为了融合节点特征和具有较大距离的相邻节点的特征,通过下式对进行切比雪夫多项式运算:/>;其中,/>是k阶切比雪夫多项式,/>是k阶特征的卷积核,/>是重新缩放到[-1,1]的/>。/>是/>的最大值,I是单位矩阵。
因此,图卷积层的最终公式定义为:。
在图卷积层中,提取距离不同的节点的特征并求和,以获得节点的输出特征。然后可以按顺序放置几个图卷积层来构建GCN,本实施例分别在删除边和屏蔽节点特征的两种图数据增强之后放置图卷积层,以更好地挖掘电力数据的深层依赖关系。
步骤4:基于图对比学习对数据质量进行分析,对于有效、可用的高质量数据构造的特征依赖关系图,将其通过数据增强得到的多个视图作为图对比学习的正样本,将待检测数据的特征依赖关系图作为图对比学习的负样本。在每个训练阶段,由于图数据增强模块的两种方法均为自适应随机删除图中的元素,通过正向传递将产生不同的子图样本,因此可以得到增强后的图特征矩阵和邻接矩阵。正样本和负样本经对比学习分别得到相应的输出:;其中,/>为模型自身的参数,/>和/>分别表示正样本和负样本所表示的数据质量分布。
图卷积网络通过数据的标签信息使得损失函数最小化来实现监督学习,我们增加定义了对比损失函数,并以合理的方式对二者进行组合。
采用相对熵函数(relative-entropyloss)作为图对比学习的对比损失函数(contrastiveloss),即用KL散度(Kullback-Leiblerdivergence,KLD)来进行正负样本之间的对比。KL散度是两个概率分布之间差别的非对称性度量,当两个分布越相似,KL散度越小。
对于正负样本的质量分析结果,本实施例希望二者的概率分布相近,从而减小模型对于噪声的抗扰能力,定义对比损失函数如下:;其中,。
同时,本模型通过最小化交叉熵函数(cross-entropyloss)作为图对比学习的监督损失函数来训练模型,即每个训练阶段,图的目标函数定义为正样本和负样本之间的平均交叉熵损失,如下式所示:
;
;
;
其中,正样本的质量分析结果为,负样本质量分析结果为/>,/>为数据的预期质量分析结果。
所以在每个训练阶段,同时使用监督损失和对比损失,本模型最终的目标函数定义为:;其中,/>为平衡两种损失的超参数,/>。数据质量分析模型的目标函数/>越小,代表待测电力物联数据的质量越高。
表1展示了本实施例提供的方法与其他三种方法,GCN(Graph ConvolutionNetwork,图卷积神经网络),GAT(图注意力网络)和GraphGAN(图卷积神经网络和生成对抗网络相结合的一种方法)在相同电力物联数据集上的性能比较结果,使用平均绝对百分比误差(MAPE)、平均绝对误差(MAE)、均方根误差(RMSE)和均方误差(MSE)四个指标来评估每种方法的数据质量分析性能。四个指标结果均进行标准化处理,值域范围均为,取值越趋近于0说明训练的误差越小,模型的质量分析性能越好。
表1性能比较结果表
性能比较结果显示,本发明的模型在数据质量分析方面效果更显著。
本实施例提出了一种基于图对比学习的电力物联数据质量分析方法,基于电力数据质量评价指标体系、特征传递优化和自适应随机增强的电力物联数据特征依赖关系图生成及增强方法,能够有效挖掘电力数据之间的特征关系,避免了数据关联性不明确的问题。
本实施例提出的基于图卷积神经网络和图对比学习的数据质量分析模型,采用图卷积神经网络聚合电力物联数据特征信息,通过图对比学习比较不同图数据样本之间的相似性和差异性,深入挖掘数据之间的关联关系,并结合对比损失和监督损失综合衡量模型性能,对数据质量进行更准确的评估计算,从而有效提高数据质量分析的精确度,助力海量电力物联数据可用性和有效性的提升。
实施例二:
基于图对比学习的电力物联数据质量分析系统,包括:
特征关系模块,被配置为:定义图数据集,图数据集包含节点集、边集和加权邻接矩阵,以获取的电力物联时间序列数据作为节点集中的节点,数据特征间的依赖关系作为边集中的边,通过加权邻接矩阵,为图中的节点添加设定的质量评价指标作为特征信息,形成特征依赖关系图;
数据增强模块,被配置为:得到的特征依赖关系图利用删除边的方法和屏蔽节点特征的方法进行数据增强,并通过对应的图卷积网络提取特征信息;
对比学习模块,被配置为:以数据增强后得到的视图作为图对比学习的正样本,待检测数据的特征依赖关系图作为图对比学习的负样本,正样本和负样本经对比学习分别得到相应的输出,通过正样本和负样本之间的对比损失函数和监督损失函数的组合构造目标函数,得到质量分析结果,确定正样本和负样本所对应的数据质量分布情况。
基于电力数据质量评价指标体系、特征传递优化和自适应随机增强的电力物联数据特征依赖关系图生成及增强方法,能够有效挖掘电力数据之间的特征关系,避免了数据关联性不明确的问题。聚合电力物联数据特征信息,结合对比损失和监督损失对数据质量进行综合评估,可以有效提高数据质量分析的精确度,助力海量电力物联数据可用性和有效性的提升。
实施例三:
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的基于图对比学习的电力物联数据质量分析方法中的步骤。
实施例四:
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的基于图对比学习的电力物联数据质量分析方法中的步骤。
以上实施例二至四中涉及的各步骤与实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于图对比学习的电力物联数据质量分析方法,其特征在于,包括以下步骤:
定义图数据集,图数据集包含节点集、边集和加权邻接矩阵,以获取的电力物联时间序列数据作为节点集中的节点,数据特征间的依赖关系作为边集中的边,通过加权邻接矩阵,为图中的节点添加设定的质量评价指标作为特征信息,形成特征依赖关系图;
得到的特征依赖关系图利用删除边的方法和屏蔽节点特征的方法进行数据增强,并通过对应的图卷积网络提取特征信息;
以数据增强后得到的视图作为图对比学习的正样本,待检测数据的特征依赖关系图作为图对比学习的负样本,正样本和负样本经对比学习分别得到相应的输出,通过正样本和负样本之间的对比损失函数和监督损失函数的组合构造目标函数,得到质量分析结果,确定正样本和负样本所对应的数据质量分布情况。
2.如权利要求1所述的基于图对比学习的电力物联数据质量分析方法,其特征在于,构造特征依赖关系图,选取电力物联时间序列数据作为图中的节点,数据特征间的依赖关系作为图中的边/>,通过加权邻接矩阵/>为图中的节点添加特征信息。
3.如权利要求1所述的基于图对比学习的电力物联数据质量分析方法,其特征在于,通过加权邻接矩阵为图中的节点添加设定的质量评价指标作为特征信息,如下式所示:
;
其中,J表示准确性、K表示完整性、S表示有效性、C表示一致性、R表示冗余度。
4.如权利要求1所述的基于图对比学习的电力物联数据质量分析方法,其特征在于,构造度矩阵表示节点的度,其中,/>为节点的加权邻接矩阵,假设图是无权重的,若/>,则/>,否则/>。
5.如权利要求1所述的基于图对比学习的电力物联数据质量分析方法,其特征在于,通过特征传递优化加强特征依赖关系图的特征差异,特征关系网络的输出定义如下:
;
其中,是数据样本的矢量表示,/>是v-1次FTO处理后的样本数据,/>是v次FTO过程后的特征数据,表示第v-1层节点的信息被融合到第v层节点,α是信息反湮灭因子。
6.如权利要求1所述的基于图对比学习的电力物联数据质量分析方法,其特征在于,删除边的方法,具体为:通过节点的度中心性计算边中心性/>,根据得到的边的重要性,删除设定概率的边,概率公式如下:
;
其中,为超参数,表示控制删除边的总体概率;/>为/>的最大值;/>为/>的平均值;为截止概率,用于限制概率的最大值。
7.如权利要求1所述的基于图对比学习的电力物联数据质量分析方法,其特征在于,屏蔽节点特征的方法,具体为:在节点属性层面上,遮蔽节点特征中含有零的维度,采样一个随机向量,其中,/>为遮盖第i维节点特征的概率,将节点第d维的权重进行归一化得到表示特征的重要程度,如下式所示:
;
其中,,/>为/>的最大值;/>为/>的平均值,/>为控制特征增强整体大小的超参数。
8.如权利要求1所述的基于图对比学习的电力物联数据质量分析方法,其特征在于,通过对应的图卷积网络提取特征信息,具体为:图卷积层将图节点的输入特征x与邻接矩阵融合,进行卷积运算得到提取的节点输出特征y,图卷积运算定义为:
;
其中,是图的卷积核,/>表示图卷积运算,/>是激活函数。
9.如权利要求1所述的基于图对比学习的电力物联数据质量分析方法,其特征在于,通过正样本和负样本之间的对比损失函数和监督损失函数的组合构造目标函数,得到质量分析结果,具体为:
采用相对熵函数作为图对比学习的对比损失函数,最小化交叉熵函数作为图对比学习的监督损失函数,最终的目标函数定义为:
;
其中,为对比损失函数,/>为监督损失函数,/>为平衡两种损失的超参数,。
10.基于图对比学习的电力物联数据质量分析系统,其特征在于,包括:
特征关系模块,被配置为:定义图数据集,图数据集包含节点集、边集和加权邻接矩阵,以获取的电力物联时间序列数据作为节点集中的节点,数据特征间的依赖关系作为边集中的边,通过加权邻接矩阵,为图中的节点添加设定的质量评价指标作为特征信息,形成特征依赖关系图;
数据增强模块,被配置为:得到的特征依赖关系图利用删除边的方法和屏蔽节点特征的方法进行数据增强,并通过对应的图卷积网络提取特征信息;
对比学习模块,被配置为:以数据增强后得到的视图作为图对比学习的正样本,待检测数据的特征依赖关系图作为图对比学习的负样本,正样本和负样本经对比学习分别得到相应的输出,通过正样本和负样本之间的对比损失函数和监督损失函数的组合构造目标函数,得到质量分析结果,确定正样本和负样本所对应的数据质量分布情况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410238789.8A CN117829683A (zh) | 2024-03-04 | 2024-03-04 | 基于图对比学习的电力物联数据质量分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410238789.8A CN117829683A (zh) | 2024-03-04 | 2024-03-04 | 基于图对比学习的电力物联数据质量分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117829683A true CN117829683A (zh) | 2024-04-05 |
Family
ID=90522898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410238789.8A Pending CN117829683A (zh) | 2024-03-04 | 2024-03-04 | 基于图对比学习的电力物联数据质量分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117829683A (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776856A (zh) * | 2018-04-20 | 2018-11-09 | 国家电网有限公司 | 一种基于溯源关系的电力台账数据校验方法及装置 |
CN112633889A (zh) * | 2020-11-12 | 2021-04-09 | 中科金审(北京)科技有限公司 | 一种企业基因测序系统及方法 |
CN112819308A (zh) * | 2021-01-23 | 2021-05-18 | 罗家德 | 一种基于双向图卷积神经网络的头部企业识别方法 |
CN113903031A (zh) * | 2021-09-13 | 2022-01-07 | 昆明理工大学 | 一种基于图卷积和对比学习的跨域语义分割方法 |
CN114298233A (zh) * | 2021-12-30 | 2022-04-08 | 华北电力大学(保定) | 基于高效注意力网络和师生迭代迁移学习的表情识别方法 |
CN114511024A (zh) * | 2022-01-28 | 2022-05-17 | 腾讯科技(深圳)有限公司 | 节点分类方法、装置、设备、介质和计算机程序产品 |
CN115358431A (zh) * | 2022-09-21 | 2022-11-18 | 国网上海市电力公司 | 一种基于低压线路档案数据的台区停电范围精准研判方法 |
CN115481682A (zh) * | 2022-09-11 | 2022-12-16 | 北京工业大学 | 一种基于监督对比学习与结构推断的图分类训练方法 |
WO2022267953A1 (zh) * | 2021-06-24 | 2022-12-29 | 浙江师范大学 | 基于多视图对比学习的引文网络图表示学习系统及方法 |
CN115545790A (zh) * | 2022-10-20 | 2022-12-30 | 北京宽客进化科技有限公司 | 价格数据预测方法、装置、电子设备及存储介质 |
US20230052865A1 (en) * | 2020-12-25 | 2023-02-16 | Zhejiang University | Molecular graph representation learning method based on contrastive learning |
CN115797041A (zh) * | 2021-09-08 | 2023-03-14 | 天翼电子商务有限公司 | 基于深度图半监督学习的金融信用评估方法 |
CN115983351A (zh) * | 2023-02-20 | 2023-04-18 | 思腾合力(天津)科技有限公司 | 一种基于对比学习的自监督图神经网络方法 |
CN116861923A (zh) * | 2023-04-04 | 2023-10-10 | 大连理工大学 | 多视图无监督图对比学习模型构建方法、系统、计算机、存储介质及应用 |
CN116992009A (zh) * | 2023-06-08 | 2023-11-03 | 华北电力大学 | 一种基于本体和知识图谱的继电保护缺陷文本质量评价方法 |
US20230375745A1 (en) * | 2022-05-17 | 2023-11-23 | Nanjing University Of Information Science & Technology | High-temperature disaster forecast method based on directed graph neural network |
CN117454269A (zh) * | 2023-11-02 | 2024-01-26 | 国网河南省电力公司电力科学研究院 | 一种电力系统暂态信号识别方法 |
CN117557127A (zh) * | 2023-09-27 | 2024-02-13 | 北京航空航天大学 | 电网调度系统支撑平台可靠性评估方法、系统及存储介质 |
-
2024
- 2024-03-04 CN CN202410238789.8A patent/CN117829683A/zh active Pending
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776856A (zh) * | 2018-04-20 | 2018-11-09 | 国家电网有限公司 | 一种基于溯源关系的电力台账数据校验方法及装置 |
CN112633889A (zh) * | 2020-11-12 | 2021-04-09 | 中科金审(北京)科技有限公司 | 一种企业基因测序系统及方法 |
US20230052865A1 (en) * | 2020-12-25 | 2023-02-16 | Zhejiang University | Molecular graph representation learning method based on contrastive learning |
CN112819308A (zh) * | 2021-01-23 | 2021-05-18 | 罗家德 | 一种基于双向图卷积神经网络的头部企业识别方法 |
WO2022267953A1 (zh) * | 2021-06-24 | 2022-12-29 | 浙江师范大学 | 基于多视图对比学习的引文网络图表示学习系统及方法 |
CN115797041A (zh) * | 2021-09-08 | 2023-03-14 | 天翼电子商务有限公司 | 基于深度图半监督学习的金融信用评估方法 |
CN113903031A (zh) * | 2021-09-13 | 2022-01-07 | 昆明理工大学 | 一种基于图卷积和对比学习的跨域语义分割方法 |
CN114298233A (zh) * | 2021-12-30 | 2022-04-08 | 华北电力大学(保定) | 基于高效注意力网络和师生迭代迁移学习的表情识别方法 |
CN114511024A (zh) * | 2022-01-28 | 2022-05-17 | 腾讯科技(深圳)有限公司 | 节点分类方法、装置、设备、介质和计算机程序产品 |
US20230375745A1 (en) * | 2022-05-17 | 2023-11-23 | Nanjing University Of Information Science & Technology | High-temperature disaster forecast method based on directed graph neural network |
CN115481682A (zh) * | 2022-09-11 | 2022-12-16 | 北京工业大学 | 一种基于监督对比学习与结构推断的图分类训练方法 |
CN115358431A (zh) * | 2022-09-21 | 2022-11-18 | 国网上海市电力公司 | 一种基于低压线路档案数据的台区停电范围精准研判方法 |
CN115545790A (zh) * | 2022-10-20 | 2022-12-30 | 北京宽客进化科技有限公司 | 价格数据预测方法、装置、电子设备及存储介质 |
CN115983351A (zh) * | 2023-02-20 | 2023-04-18 | 思腾合力(天津)科技有限公司 | 一种基于对比学习的自监督图神经网络方法 |
CN116861923A (zh) * | 2023-04-04 | 2023-10-10 | 大连理工大学 | 多视图无监督图对比学习模型构建方法、系统、计算机、存储介质及应用 |
CN116992009A (zh) * | 2023-06-08 | 2023-11-03 | 华北电力大学 | 一种基于本体和知识图谱的继电保护缺陷文本质量评价方法 |
CN117557127A (zh) * | 2023-09-27 | 2024-02-13 | 北京航空航天大学 | 电网调度系统支撑平台可靠性评估方法、系统及存储介质 |
CN117454269A (zh) * | 2023-11-02 | 2024-01-26 | 国网河南省电力公司电力科学研究院 | 一种电力系统暂态信号识别方法 |
Non-Patent Citations (2)
Title |
---|
李斯达: "基于对比学习的推荐系统投毒攻击检测方法", 《中国优秀博硕士学位论文全文数据库》, 31 May 2023 (2023-05-31), pages 16 - 24 * |
潘少明;王玉杰;种衍文;: "基于图卷积神经网络的跨域行人再识别", 华中科技大学学报(自然科学版), no. 09, 31 December 2020 (2020-12-31) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169628B (zh) | 一种基于大数据互信息属性约简的配电网可靠性评估方法 | |
CN116628220A (zh) | 基于关系图卷积神经网络的电力工作票生成方法及系统 | |
CN109784692A (zh) | 一种基于深度学习的快速安全约束经济调度方法 | |
CN117134507B (zh) | 基于智能群体关联的全站容性设备在线监测方法及系统 | |
CN114021483A (zh) | 基于时域特征与XGBoost的超短期风电功率预测方法 | |
El Maghraoui et al. | Smart energy management system: A comparative study of energy consumption prediction algorithms for a hotel building | |
Han et al. | Research on quality problems management of electric power equipment based on knowledge–data fusion method | |
Hou et al. | Spatial distribution assessment of power outage under typhoon disasters | |
CN116937559A (zh) | 基于循环神经网络和张量分解的电力系统负荷预测系统和方法 | |
CN117674119A (zh) | 电网运行风险评估方法、装置、计算机设备和存储介质 | |
Jeddi et al. | PDP-CNN: A deep learning model for post-hurricane reconnaissance of electricity infrastructure on resource-constrained embedded systems at the edge | |
Chen | Review on supervised and unsupervised learning techniques for electrical power systems: Algorithms and applications | |
Zhang et al. | Encoding time series as images: A robust and transferable framework for power system DIM identification combining rules and VGGNet | |
Daraeepour et al. | Day-ahead wind speed prediction by a Neural Network-based model | |
Gao et al. | A data mining method using deep learning for anomaly detection in cloud computing environment | |
CN113536508A (zh) | 一种制造网络节点分类方法及系统 | |
Qin et al. | A hybrid deep learning model for short‐term load forecasting of distribution networks integrating the channel attention mechanism | |
Tang et al. | Predicting typhoon-induced transmission line outages with coordination of static and dynamic data | |
ul Hassan et al. | Online static security assessment for cascading failure using stacked De-noising Auto-encoder | |
CN114298854B (zh) | 一种联合学习表示和对齐的弱监督用户身份链接方法 | |
CN117829683A (zh) | 基于图对比学习的电力物联数据质量分析方法及系统 | |
Wang et al. | Data-Driven Outage Restoration Time Prediction via Transfer Learning With Cluster Ensembles | |
CN106816871B (zh) | 一种电力系统状态相似性分析方法 | |
Li et al. | A comprehensive learning-based model for power load forecasting in smart grid | |
Li et al. | Prediction Algorithm of Wind Waterlogging Disaster in Distribution Network Based on Multi‐Source Data Fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |