CN114330440A - 基于模拟学习判别的分布式电源负荷异常识别方法及系统 - Google Patents

基于模拟学习判别的分布式电源负荷异常识别方法及系统 Download PDF

Info

Publication number
CN114330440A
CN114330440A CN202111626659.4A CN202111626659A CN114330440A CN 114330440 A CN114330440 A CN 114330440A CN 202111626659 A CN202111626659 A CN 202111626659A CN 114330440 A CN114330440 A CN 114330440A
Authority
CN
China
Prior art keywords
sample
data
real
distributed power
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111626659.4A
Other languages
English (en)
Other versions
CN114330440B (zh
Inventor
郭红霞
王兆军
李骁
李琮琮
郭亮
王者龙
刘丽君
王翠翠
孟玉洁
刘晓冬
刘志美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Original Assignee
Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marketing Service Center of State Grid Shandong Electric Power Co Ltd filed Critical Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Priority to CN202111626659.4A priority Critical patent/CN114330440B/zh
Publication of CN114330440A publication Critical patent/CN114330440A/zh
Application granted granted Critical
Publication of CN114330440B publication Critical patent/CN114330440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供了一种基于模拟学习判别的分布式电源负荷异常识别方法及系统;基于相关系统获取分布式电源负荷的相关采集数据,并根据发电类型与规模进行样本分类,基于各分簇样本集,分别采用单一正常真实样本数据集与聚合异常真实样本数据集为输入最小批次训练样本集,输入编码器生成编码数据,随后生成器基于编码数据生成复现样本数据,以反馈调参实现复现样本对真实样本数据拟合,并将真实样本与复现样本输入判别器,输出四分类判别结果,从而在保留各个分布式电源特征前提下,实现异常样本数据的模拟与共享学习,从而在新分布式电源负荷异常出现时,可有效实现异常识别。

Description

基于模拟学习判别的分布式电源负荷异常识别方法及系统
技术领域
本发明属于智能电力信息处理技术领域,具体涉及一种基于模拟学习判别的分布式电源负荷异常识别方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
分布式电源发电与传统同步机发电的负荷采集数据存在本质不同,传统根据电压、电流等实现负荷异常规律分析的方法难以适应于新故障判定形态。分布式电源发电模式不仅起/停不受电网控制,且以风能、太阳能、生物质能等为代表的绿色新能源发电方式,与自然条件、用户需求、政策法规、电力市场等诸多因素相关,负荷数据具有强随机性和波动性的特点,共性特征提取困难。随着新型电力系统建设的推进,新能源发电方式将导致大规模分布式电源并入电网,多类型电源聚合性、设备脆弱性与故障连锁性,导致分布式电源负荷异常识别滞后将严重影响电网故障快速隔离和自愈,进而严重影响电力系统的供电稳定性。
当前分布式电源大部分为分散式部署且单机容量小,样本关联特性多且异常样本数据量少,传统采用基于逻辑回归算法或基于深度学习(长短时神经网络等)的时序数据异常识别方法,难以拟合本地分布式电源的特性,且异常样本量少导致过拟合异常样本数据。
发明内容
本发明为了解决上述问题,提出了一种基于模拟学习判别的分布式电源负荷异常识别方法及系统,本发明能够在保证各分布式电源特性的条件下,对异常负荷小样本进行模拟和学习,并以识别性能可验证为目标提升分布式电源负荷异常识别效率。
根据一些实施例,本发明采用如下技术方案:
一种基于模拟学习判别的分布式电源负荷异常识别方法,包括以下步骤:
获取不同分布式电源的发电负荷数据、不同分布式电源的档案数据及电力交易数据,获取用户的生产数据及能耗数据和环境数据;
对发电负荷数据中由于电力交易、用户生产与能耗需求以及环境因素造成的不可用样本进行删除,以单位采集数据为样本例计数,并将剩余数据进行预处理,得到真实可用样本集;
基于不同的分布式电源发电模式及发电规模,对真实可用样本集进行分类,并按照分类簇对各簇异常样本进行标记,得到各分簇真实样本集,真实样本集按照比例分为训练真实样本集和测试真实样本集;
将各分簇训练真实样本集作为输入样本数据,利用编码器对其编码,利用生成器提取复现样本,固定编码器和生成器参数,将训练集的真实样本和复现样本输入判别器,输出分类为正常复现样本、正常真实样本、异常复现样本和异常真实样本的四分类,通过损失函数进行反馈调参,并以验证集进行模型分类验证,训练完成后,将判别器作为分布式电源负荷异常识别模型;
将测试真实样本集数据输入判别器,判断正确率与精确率是否满足要求,若否则返回上一步骤,若是则固定模型参数,并将判别器作为分布式电源负荷异常识别模型;
利用分布式电源负荷异常识别模型对分布式电源负荷异常进行判别,基于判别结果,对其中判定为可疑样本和预警样本识别结果进行现场情况核查。
作为可选择的实施方式,所述环境数据包括气象数据、节假日数据和相关政策法规数据。
作为可选择的实施方式,所述生成器为GAN生成器。
作为可选择的实施方式,将各分簇训练真实样本集作为输入样本数据时,基于分簇真实样本集进行数据定义及数据分布设定,具体包括:设定真实样本数据集存在满足独立且多元的正态分布,其隐含提取特征的后验分布,采用高斯分布对各分簇真实样本集的均值和方差进行拟合求解,获取均值和方差,所述隐含提取特征即为编码器输出的编码数据;
基于真实样本集数据,在样本数据复现阶段,根据隐含提取特征去拟合真实样本数据分布,采用隐含提取特征z表征样本x的隐含特征分布;
利用隐含特征的概率分布去近似在真实样本x的条件下提取z的条件分布概率,计算二者之间的KL散度表示的有效信息损失。
作为可选择的实施方式,利用编码器对其编码的具体过程包括:
基于分布式电源的正常真实样本集,选择每个分布式电源的历史采集样本数据集,并随机从中选择多个历史采集数据形成最小批次样本集,并将最小批次样本集数据输入编码器,基于编码器输出数据计算得损失函数;
基于分簇分布式电源的异常真实样本集,随机从中选择多个历史采集数据形成最小批次样本集,并将最小批次样本集数据输入编码器。
作为可选择的实施方式,利用生成器提取复现样本的具体过程包括:设定基于单例分布式电源样本的所有真实正常样本数据集提取的隐含特征满足先验正态分布N(0,I),随机选择特征编码Z,并输入生成器生成正常复现样本数据,并设置目标损失函数;
设定基于某一分簇样本的所有真实异常样本数据集提取的隐含特征满足先验正态分布N(0,I),随机选择特征编码Zp,并输入生成器,获取复现异常样本数据,并设置目标损失函数。
作为可选择的实施方式,通过损失函数进行反馈调参,并以验证集进行模型分类验证的具体过程包括:
将正常真实样本和异常真实样本、正常复现样本和异常复现样本输入判别器,输出正常复现样本、正常真实样本、异常复现样本和异常真实样本的四分类识别结果,并基于识别结果构建损失函数;
基于编码器、生成器和判别器的损失函数,调节模型的各类参数;
经过迭代调参反馈训练后,使用验证集对编码器、生成器和判别器进行测试,若验证结果不满足模型判别要求,则继续反馈调参;若验证结果满足模型判别要求,固定模型参数;
输出判别器的模型参数,将正常真实样本识别结果作为无异常判别结果,正常复现样本判别结果作为可疑样本,异常复现样本和异常真实样本识别结果作为异常样本,并进行预警。
一种基于模拟学习判别的分布式电源负荷异常识别系统,包括:
数据获取模块,被配置为获取不同分布式电源的发电负荷数据、不同分布式电源的档案数据及电力交易数据,获取用户的生产数据及能耗数据和环境数据;
样本构建模块,被配置为对发电负荷数据中由于电力交易、用户生产与能耗需求以及环境因素造成的不可用样本进行删除,以单位采集数据为样本例计数,并将剩余数据进行预处理,得到真实可用样本集;
样本分类模块,被配置为基于不同的分布式电源发电模式及发电规模,对真实可用样本集进行分类,并按照分类簇对各簇异常样本进行标记,得到各分簇真实样本集,真实样本集按照比例分为训练真实样本集和测试真实样本集;
模型构建和训练模块,被配置为将各分簇训练真实样本集作为输入样本数据,利用编码器对其编码,利用生成器提取复现样本,固定编码器和生成器参数,将训练集的真实样本和复现样本输入判别器,输出分类为正常复现样本、正常真实样本、异常复现样本和异常真实样本的四分类,通过损失函数进行反馈调参,并以验证集进行模型分类验证,训练完成后,将判别器作为分布式电源负荷异常识别模型;
优化模块,被配置为将测试真实样本集数据输入判别器,判断正确率与精确率是否满足要求,若否则返回上一模块,若是则固定模型参数,并将判别器作为分布式电源负荷异常识别模型;
判别模块,被配置为利用分布式电源负荷异常识别模型对分布式电源负荷异常进行判别,基于判别结果,对其中判定为可疑样本和预警样本识别结果进行现场情况核查。
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法中的步骤。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法中的步骤。
与现有技术相比,本发明的有益效果为:
本发明针对分布式电源负荷异常分析与共性特征提取困难的问题,采用编码器提取真实样本数据的数据分布特征,以生成器复现样本数据,随后以判别器对输入样本进行四分类识别,一方面通过拟合真实样本数据与复现样本数据,为生成器复现样本数据提供目标样本,降低模型的调参时间;另一方面判别器对样本进行四分类判别,区分正常复现样本、异常复现样本、正常真实样本和异常真实样本,模型训练完成后,判别器对真实样本与复现样本识别结果为随机判别,但会最大化区分正常类与异常类样本的数据分布,且复现样本将结合真实数据样本的分布结构及共享的异常数据特征,生成新的异常样本数据,从而丰富判别器的训练样本,在新的异常样本数据输入时,提升样本分类准确性。
本发明针对各个分布式电源异常样本数据量少导致判别过拟合的问题,不同于正常真实样本是按照单一分布式电源项目的正常真实样本历史数据隐含提取特征构建正态分布数据,从而在数据复现时可有效的包含各分布式电源的特殊因素及数据分布结构,由于单一分布式电源项目的异常真实样本数据少,且同簇分组的分布式电源异常判别具有共性信息,故基于同一分簇样本的所有异常真实样本集进行隐含特征提取,从而最大化共享分布式电源异常判别特性,并在新的异常样本产生时,可基于同簇异常特征共享实现异常样本的识别;
本发明针对当前分布式电源发电负荷异常难以基于传统的负荷异常判别方法进行远程判别的问题,采用编码器结合GAN训练分布式电源负荷异常识别模型,通过复现数据丰富训练集样本,并基于分簇分类别样本集提取特征,最大化正常样本与异常样本数据分布的差异性,从而提高了异常样本识别的正确率、灵敏度和特异度,保障新型电力系统安全运行。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本实施例提供的分布式电源负荷异常识别方法的整体流程图;
图2为本实施例提供的采用模拟学习判别构建分布式电源负荷异常识别模型流程图;
图3为本实施例提供的识别效果对比图。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例的基于模拟学习判别的分布式电源负荷异常识别方法,包括:
A.从用电信息采集系统生产数据库中获取已采集的各类分布式电源发电负荷数据,从营销业务应用系统获取各类分布式电源的档案数据及电力现货市场日交易数据,从企业相关系统获取其生产数据及能耗数据,从网络爬取历史气象数据、节假日数据、政策法规数据;
具体地,基于某省2020年1月至2021年11月的用电信息采集系统、营销业务应用系统以及企业相关系统中的记录,获取10万余个分布式电源项目的历史样本数据;
此处以太阳能光伏发电模式为例,样本采集特征部分示例如下:
表1太阳能光伏发电终端采集数据部分特征示例
Figure BDA0003438817720000091
Figure BDA0003438817720000101
B.基于相关记录对不可用样本进行删除,以日采集数据为样本例计数,并将剩余各类获取数据进行预处理,得到真实可用样本集;
具体示例,以自主启动/停运记录为例,某市某企业在2021年3月20日-3月25日其用电负荷需求降低,故自主关停分布式电源,删除样本6例;某市某光伏项目在2021年10月11日,由于市场电价+新能源补贴低于发电成本,故自主关停分布式电源,删除样本1例;
基于相关记录对不可用样本进行删除,并将剩余样本数据进行预处理,得到真实可用样本集;
C.基于不同的分布式电源发电模式及发电规模,对真实可用样本集进行分类,并按照分类簇对各簇异常样本进行标记,得到各分簇真实样本集,真实样本集按照比例分为训练真实样本集和测试真实样本集;
表2基于分布式电源发电模式以发电规模的部分分类示例
Figure BDA0003438817720000111
本实施例筛选可再生能源发电的太阳能光伏发电为例,基于其6类负荷分类筛选出5132个典型项目,获取异常样本数据1万余例,考虑光伏发电受自然条件影响大,其输出功率具有强随机性和波动性特定,故结合各类影响因素提取正常样本数据60万余例,即得到可用真实样本集数据为61万余例;
根据分布式电源发电模式及规模的不同,在可再生能源发电中,以太阳能光伏发电一类分簇真实样本集为例,利用分类簇对采集到的可用的631,583例样本进行分类,选取一簇真实样本集为102,539例样本,其中包含9,107例异常样本,93,432例正常样本,将正常样本集和异常样本集按照7:2:1比例分为训练真实样本集71,778例、验证真实样本集20,507例和测试真实样本集10,254例;
D.基于各分簇训练真实样本集作为输入样本数据,经过编码器(Encoder),输出编码数据,将编码数据输入GAN的生成器(Generator),输出复现样本,固定编码器和生成器参数,将训练集的真实样本和复现样本输入判别器(Discriminator),输出分类为正常复现样本、正常真实样本、异常复现样本和异常真实样本的四分类,通过损失函数进行反馈调参,并以验证集进行模型分类验证,训练完成后,输出判别器作为分布式电源负荷异常识别模型,如图2所示;
D1.基于分簇真实样本集的数据定义及数据分布设定;
设定真实样本数据集X={x1,x2,…xn}存在满足独立且多元的正态分布,其隐含提取特征的后验分布为q(Z|X),采用高斯分布对各分簇真实样本集的均值和方差进行拟合求解,获取均值和方差如下:
μk=f1(Xk) (1)
Figure BDA0003438817720000121
q(x,z)=q(x)q(z|x) (3)
其中,x表示某一真实样本数据,为d维向量的时序采集数据;z表示样本x的隐含提取特征,X和Z分别表示由样本x和样本隐含提取特征z构成的集合;k表示类别为k的分簇真实样本集,f1和f2表示基于真实样本数据统计获取的高斯分布拟合求取均值μk和方差
Figure BDA0003438817720000122
的公式,q(x)表示样本x满足正态分布的分布概率,q(z|x)表示在样本x的前提下,隐含提取特征为z的分布概率,q(x,z)表示x和z的联合分布概率;
所述隐含提取特征即为编码器输出的编码数据;
基于真实样本集数据X={x1,x2,…xn},在样本数据复现阶段,根据隐含提取特征去拟合真实样本数据分布,采用隐含提取特征z表征样本x的隐含特征分布:
Figure BDA0003438817720000131
Figure BDA0003438817720000132
其中,设定p(z)为满足标准正态的先验分布,表示复现样本x的数据特征分布概率,同时训练完成后的模型满足
Figure BDA0003438817720000133
的概率分布,表示在选取隐含提取特征z的前提下,复现样本
Figure BDA0003438817720000139
的分布概率;
Figure BDA0003438817720000134
表示复现样本
Figure BDA0003438817720000135
的分布概率;
Figure BDA0003438817720000136
表示
Figure BDA0003438817720000137
和z的联合分布概率密度;
利用概率分布p(Z)去近似q(Z|X),然后计算二者之间的KL散度表示的有效信息损失,得到:
Figure BDA0003438817720000138
D2.基于真实样本集数据,按照单例正常分布式电源样本数据和分簇异常分布式电源样本数据,分别输入编码器,生成编码数据,即隐含提取特征数据;
基于分布式电源的正常真实样本集,选择每个分布式电源的历史采集样本数据集,并随机从中选择n个历史采集数据形成最小批次样本集,并将最小批次样本集数据输入编码器
Z=Encoder(X) (7)
基于编码器输出数据计算得损失函数lossprior为:
Figure BDA0003438817720000141
基于分簇分布式电源的异常真实样本集,随机从中选择n个历史采集数据形成最小批次样本集,并将最小批次样本集数据输入编码器
Zp=Encoder(Xp) (9)
基于编码器输出数据计算得损失函数
Figure BDA0003438817720000142
为:
Figure BDA0003438817720000143
其中,xp表示异常真实样本,zp表示基于异常真实样本获取的隐含提取特征数据,Xp和Zp分别表示由样本xp和样本隐含提取特征zp构成的集合;
D3.将编码数据输入生成器,获取正常样本复现数据与异常样本复现数据;
训练过程中,设定基于单例分布式电源样本的所有真实正常样本数据集提取的隐含特征满足先验正态分布N(0,I),随机选择特征编码Z,并输入生成器生成正常复现样本数据,
Figure BDA0003438817720000144
正常真实样本数据x与正常复现数据
Figure BDA0003438817720000145
数据概率分布越近越好,故采用如下目标损失函数
Figure BDA0003438817720000146
Figure BDA0003438817720000147
设定基于某一分簇样本的所有真实异常样本数据集提取的隐含特征满足先验正态分布N(0,I),随机选择特征编码Zp,并输入生成器,获取复现异常样本数据,
Figure BDA0003438817720000151
异常真实样本数据xp与异常复现数据
Figure BDA0003438817720000152
数据概率分布越近越好,故采用如下目标损失函数
Figure BDA0003438817720000153
Figure BDA0003438817720000154
D4.将真实样本集(包含正常真实样本和异常真实样本)、复现样本集(包含正常复现样本和异常复现样本)输入判别器,输出正常复现样本、正常真实样本、异常复现样本和异常真实样本的四分类识别结果,并基于识别结果构建GAN的损失函数lossGAN
Figure BDA0003438817720000155
其中,Dis(X)表示对正常真实样本识别结果,
Figure BDA0003438817720000156
表示对正常复现样本识别结果,Dis(Xp)表示对异常真实样本识别结果,
Figure BDA0003438817720000157
表示对异常复现样本识别结果;Dec(p(z))表示基于正常真实样本的隐含提取特征z概率分布p(z),生成的正常复现样本;Dec(p(zp))表示基于异常真实样本的隐含提取特征zp概率分布p(zp),生成的异常复现样本;
D5.基于编码器、生成器和判别器的损失函数,调节模型的各类参数;
根据下列梯度进行反馈调节各模型参数
编码器梯度反馈调节参数如下:
Figure BDA0003438817720000161
其中,θEnc表示编码器调节参数集合;
生成器梯度反馈调节参数如下:
Figure BDA0003438817720000162
其中,θDec表示生成器调节参数集合;
判别器梯度反馈调节参数如下:
Figure BDA0003438817720000163
其中,θDis表示判别器调节参数集合;
D6.经过迭代调参反馈训练后,使用验证集对编码器、生成器和判别器进行测试,即判断编码器、生成器和判别器的损失函数是否均小于设定阈值,若验证结果不满足模型判别要求,则转至步骤D5继续反馈调参;若验证结果满足模型判别要求,固定模型参数;
D7.输出判别器的模型参数,将正常真实样本识别结果作为无异常判别结果,正常复现样本判别结果作为可疑样本,异常复现样本和异常真实样本识别结果作为异常样本,并进行预警;
E.将测试真实样本集数据输入判别器,判断正确率与精确率是否满足要求,若否则返回步骤D,若是则固定模型参数,并将判别器作为分布式电源负荷异常识别模型;
基于10,254例的测试真实样本集对分布式电源负荷异常识别模型的异常样本识别准确率与精确率进行测试,其中,包含正常样本9344例,异常样本910例,此时正常样本量大约为异常样本量的10倍,存在严重的样本不平衡问题。本实施例对比传统的逻辑回归识别方法和基于LSTM的时序数据识别方法的模型训练方法,为避免样本不平衡现象,抽取1/5的正常样本构建正常样本集进行5次模型训练,取训练结果均值作为测试结果;并选取基于GAN的识别方法、基于VAE+GAN的识别方法、基于特征共享的GAN识别方法及本文的正样本数据特征保持、异常样本特征共享的VAE+GAN的识别方法进行对比,基于10次测试均值获取对比结果如表3所示:
表3灵敏度与特异度测试结果对比
Figure BDA0003438817720000171
Figure BDA0003438817720000181
Figure BDA0003438817720000191
其中,正确率为识别正确样本/样本总量,灵敏度表示正样本的召回率,特异度表示负样本的召回率。
由表所示,本实施例所述方法均可有效识别正常样本和异常样本,且异常样本识别+可疑样本识别中全部包含实际异常的样本,且误判的正常样本量少,故可降低现场核查工作量。
F.基于分布式电源负荷异常识别模型识别的分布式电源负荷异常判别结果,对判定的可疑样本和异常样本识别结果进行现场情况核查,并基于核查结果反馈至步骤B,不断优化模型。
如图3所示,本实施例提供的方法,判别效果更好。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于模拟学习判别的分布式电源负荷异常识别方法,其特征是:包括以下步骤:
获取不同分布式电源的发电负荷数据、不同分布式电源的档案数据及电力交易数据,获取用户的生产数据及能耗数据和环境数据;
对发电负荷数据中由于电力交易、用户生产与能耗需求以及环境因素造成的不可用样本进行删除,以单位采集数据为样本例计数,并将剩余数据进行预处理,得到真实可用样本集;
基于不同的分布式电源发电模式及发电规模,对真实可用样本集进行分类,并按照分类簇对各簇异常样本进行标记,得到各分簇真实样本集,真实样本集按照比例分为训练真实样本集和测试真实样本集;
将各分簇训练真实样本集作为输入样本数据,利用编码器对其编码,利用生成器提取复现样本,固定编码器和生成器参数,将训练集的真实样本和复现样本输入判别器,输出分类为正常复现样本、正常真实样本、异常复现样本和异常真实样本的四分类,通过损失函数进行反馈调参,并以验证集进行模型分类验证,训练完成后,将判别器作为分布式电源负荷异常识别模型;
将测试真实样本集数据输入判别器,判断正确率与精确率是否满足要求,若否则返回上一步骤,若是则固定模型参数,并将判别器作为分布式电源负荷异常识别模型;
利用分布式电源负荷异常识别模型对分布式电源负荷异常进行判别,基于判别结果,对其中判定为可疑样本和预警样本识别结果进行现场情况核查。
2.如权利要求1所述的一种基于模拟学习判别的分布式电源负荷异常识别方法,其特征是:所述环境数据包括气象数据、节假日数据和相关政策法规数据。
3.如权利要求1所述的一种基于模拟学习判别的分布式电源负荷异常识别方法,其特征是:所述生成器为GAN生成器。
4.如权利要求1所述的一种基于模拟学习判别的分布式电源负荷异常识别方法,其特征是:将各分簇训练真实样本集作为输入样本数据时,基于分簇真实样本集进行数据定义及数据分布设定,具体包括:设定真实样本数据集存在满足独立且多元的正态分布,其隐含提取特征的后验分布,采用高斯分布对各分簇真实样本集的均值和方差进行拟合求解,获取均值和方差,所述隐含提取特征即为编码器输出的编码数据;
基于真实样本集数据,在样本数据复现阶段,根据隐含提取特征去拟合真实样本数据分布,采用隐含提取特征z表征样本x的隐含特征分布;
利用隐含特征的概率分布去近似在真实样本x的条件下提取z的条件分布概率,计算二者之间的KL散度表示的有效信息损失。
5.如权利要求1所述的一种基于模拟学习判别的分布式电源负荷异常识别方法,其特征是:利用编码器对其编码的具体过程包括:
基于分布式电源的正常真实样本集,选择每个分布式电源的历史采集样本数据集,并随机从中选择多个历史采集数据形成最小批次样本集,并将最小批次样本集数据输入编码器,基于编码器输出数据计算得损失函数;
基于分簇分布式电源的异常真实样本集,随机从中选择多个历史采集数据形成最小批次样本集,并将最小批次样本集数据输入编码器。
6.如权利要求1所述的一种基于模拟学习判别的分布式电源负荷异常识别方法,其特征是:利用生成器提取复现样本的具体过程包括:设定基于单例分布式电源样本的所有真实正常样本数据集提取的隐含特征满足先验正态分布N(0,I),随机选择特征编码Z,并输入生成器生成正常复现样本数据,并设置目标损失函数;
设定基于某一分簇样本的所有真实异常样本数据集提取的隐含特征满足先验正态分布N(0,I),随机选择特征编码Zp,并输入生成器,获取复现异常样本数据,并设置目标损失函数。
7.如权利要求1所述的一种基于模拟学习判别的分布式电源负荷异常识别方法,其特征是:通过损失函数进行反馈调参,并以验证集进行模型分类验证的具体过程包括:
将正常真实样本和异常真实样本、正常复现样本和异常复现样本输入判别器,输出正常复现样本、正常真实样本、异常复现样本和异常真实样本的四分类识别结果,并基于识别结果构建损失函数;
基于编码器、生成器和判别器的损失函数,调节模型的各类参数;
经过迭代调参反馈训练后,使用验证集对编码器、生成器和判别器进行测试,若验证结果不满足模型判别要求,则继续反馈调参;若验证结果满足模型判别要求,固定模型参数;
输出判别器的模型参数,将正常真实样本识别结果作为无异常判别结果,正常复现样本判别结果作为可疑样本,异常复现样本和异常真实样本识别结果作为异常样本,并进行预警。
8.一种基于模拟学习判别的分布式电源负荷异常识别系统,其特征是:包括:
数据获取模块,被配置为获取不同分布式电源的发电负荷数据、不同分布式电源的档案数据及电力交易数据,获取用户的生产数据及能耗数据和环境数据;
样本构建模块,被配置为对发电负荷数据中由于电力交易、用户生产与能耗需求以及环境因素造成的不可用样本进行删除,以单位采集数据为样本例计数,并将剩余数据进行预处理,得到真实可用样本集;
样本分类模块,被配置为基于不同的分布式电源发电模式及发电规模,对真实可用样本集进行分类,并按照分类簇对各簇异常样本进行标记,得到各分簇真实样本集,真实样本集按照比例分为训练真实样本集和测试真实样本集;
模型构建和训练模块,被配置为将各分簇训练真实样本集作为输入样本数据,利用编码器对其编码,利用生成器提取复现样本,固定编码器和生成器参数,将训练集的真实样本和复现样本输入判别器,输出分类为正常复现样本、正常真实样本、异常复现样本和异常真实样本的四分类,通过损失函数进行反馈调参,并以验证集进行模型分类验证,训练完成后,将判别器作为分布式电源负荷异常识别模型;
优化模块,被配置为将测试真实样本集数据输入判别器,判断正确率与精确率是否满足要求,若否则返回上一模块,若是则固定模型参数,并将判别器作为分布式电源负荷异常识别模型;
判别模块,被配置为利用分布式电源负荷异常识别模型对分布式电源负荷异常进行判别,基于判别结果,对其中判定为可疑样本和预警样本识别结果进行现场情况核查。
9.一种电子设备,其特征是:包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7中任一项所述的方法中的步骤。
10.一种计算机可读存储介质,其特征是:用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7中任一项所述的方法中的步骤。
CN202111626659.4A 2021-12-28 2021-12-28 基于模拟学习判别的分布式电源负荷异常识别方法及系统 Active CN114330440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111626659.4A CN114330440B (zh) 2021-12-28 2021-12-28 基于模拟学习判别的分布式电源负荷异常识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111626659.4A CN114330440B (zh) 2021-12-28 2021-12-28 基于模拟学习判别的分布式电源负荷异常识别方法及系统

Publications (2)

Publication Number Publication Date
CN114330440A true CN114330440A (zh) 2022-04-12
CN114330440B CN114330440B (zh) 2024-04-05

Family

ID=81014922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111626659.4A Active CN114330440B (zh) 2021-12-28 2021-12-28 基于模拟学习判别的分布式电源负荷异常识别方法及系统

Country Status (1)

Country Link
CN (1) CN114330440B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819665A (zh) * 2022-05-05 2022-07-29 国网江苏省电力有限公司南通供电分公司 一种基于分布式能源管理的异常预警方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991510A (zh) * 2019-11-25 2020-04-10 山大地纬软件股份有限公司 不平衡分类学习的泛化低压异常箱表关系识别方法及系统
WO2021139236A1 (zh) * 2020-06-30 2021-07-15 平安科技(深圳)有限公司 基于自编码器的异常检测方法、装置、设备及存储介质
CN113554624A (zh) * 2021-07-23 2021-10-26 深圳市人工智能与机器人研究院 异常检测方法、装置及计算机存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991510A (zh) * 2019-11-25 2020-04-10 山大地纬软件股份有限公司 不平衡分类学习的泛化低压异常箱表关系识别方法及系统
WO2021139236A1 (zh) * 2020-06-30 2021-07-15 平安科技(深圳)有限公司 基于自编码器的异常检测方法、装置、设备及存储介质
CN113554624A (zh) * 2021-07-23 2021-10-26 深圳市人工智能与机器人研究院 异常检测方法、装置及计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李端超;王松;黄太贵;程栩;许小龙;窦万春;: "基于大数据平台的电网线损与窃电预警分析关键技术", 电力系统保护与控制, no. 05, 7 March 2018 (2018-03-07) *
罗一凡;蒋传文;李春哲;薛金龙;: "考虑分布式电源入网的反窃电综合管理方法", 电器与能效管理技术, no. 04, 28 February 2015 (2015-02-28) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819665A (zh) * 2022-05-05 2022-07-29 国网江苏省电力有限公司南通供电分公司 一种基于分布式能源管理的异常预警方法及系统
CN114819665B (zh) * 2022-05-05 2023-04-18 国网江苏省电力有限公司南通供电分公司 一种基于分布式能源管理的异常预警方法及系统

Also Published As

Publication number Publication date
CN114330440B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
CN109543943B (zh) 一种基于大数据深度学习的电价稽查执行方法
WO2022110557A1 (zh) 一种台区户变关系异常诊断方法及装置
CN106845717B (zh) 一种基于多模型融合策略的能源效率评价方法
CN113792825B (zh) 一种用电信息采集设备故障分类模型训练方法及装置
CN111612650B (zh) 一种基于dtw距离的电力用户分群方法及系统
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN110879377B (zh) 基于深度信念网络的计量装置故障溯源方法
CN111126820A (zh) 反窃电方法及系统
CN110738232A (zh) 一种基于数据挖掘技术的电网电压越限成因诊断方法
CN112257784A (zh) 一种基于梯度提升决策树的窃电检测方法
CN114841268B (zh) 基于Transformer和LSTM融合算法的异常电力客户识别方法
CN115034485A (zh) 一种基于数据空间的风电功率区间预测方法及装置
CN112085108A (zh) 基于自动编码器及k均值聚类的光伏电站故障诊断算法
CN114330440B (zh) 基于模拟学习判别的分布式电源负荷异常识别方法及系统
CN106022640B (zh) 电量指数核对系统及方法
CN113094448B (zh) 住宅空置状态的分析方法及分析装置、电子设备
CN114186639A (zh) 基于双重加权朴素贝叶斯的电气事故分类方法
CN115035966B (zh) 基于主动学习和符号回归的超导体筛选方法、装置及设备
CN114676931B (zh) 一种基于数据中台技术的电量预测系统
CN112579847A (zh) 生产数据的处理方法和装置、存储介质及电子设备
CN115392710A (zh) 一种基于数据过滤的风电机组运行决策方法及系统
CN114626433A (zh) 一种智能电能表故障预测并分类方法、装置及系统
CN115598459A (zh) 一种配电网10kV馈线故障停电预测方法
CN117522211B (zh) 碳足迹信息采集方法及装置
CN117408394B (zh) 电力系统的碳排放因子预测方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant