CN113721113A - 一种基于半监督生成对抗网络的故障选线方法 - Google Patents

一种基于半监督生成对抗网络的故障选线方法 Download PDF

Info

Publication number
CN113721113A
CN113721113A CN202111024902.5A CN202111024902A CN113721113A CN 113721113 A CN113721113 A CN 113721113A CN 202111024902 A CN202111024902 A CN 202111024902A CN 113721113 A CN113721113 A CN 113721113A
Authority
CN
China
Prior art keywords
sample
model
discriminator
data
semi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111024902.5A
Other languages
English (en)
Other versions
CN113721113B (zh
Inventor
韦化
苏先昕
张玄
高维
张乐
李佩杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi University
Original Assignee
Guangxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi University filed Critical Guangxi University
Priority to CN202111024902.5A priority Critical patent/CN113721113B/zh
Publication of CN113721113A publication Critical patent/CN113721113A/zh
Application granted granted Critical
Publication of CN113721113B publication Critical patent/CN113721113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/08Locating faults in cables, transmission lines, or networks
    • G01R31/088Aspects of digital computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于半监督生成对抗网络的故障选线方法,包括如下步骤:S1.样本的采集以及数据预处理;S2.基于半监督深层对抗网络的故障选线模型构建;S3.半监督生成对抗网络模型的训练;S4.基于半监督生成对抗网络的故障选线模型的在线运行。本发明的方法能够仅使用少量有标签数据以及无标签数据进行训练,提取单相接地故障特征,即可获得较高的故障选线精度,解决了传统数据驱动故障选线方法在仅有少量样本的情况下训练困难的问题。

Description

一种基于半监督生成对抗网络的故障选线方法
技术领域
本发明属于电力系统技术领域,具体涉及一种基于半监督生成对抗网络的故障选线方法。
背景技术
在小电流接地系统中,单相接地故障是最常发生的故障,约占故障总数的80%。小电流接地系统发生单相接地故障时,故障点与线路不产生低阻抗的故障回路,因此故障线路没有明显区别于其他线路的故障特征,难以选出故障线路。
传统的故障选线方法根据使用的故障信号类型不同,可分为三类。它们分别为稳态法、暂态法和注入信号法。进一步地,由于上述方法所需的设备成本较高、易受干扰等问题,实践中难以达到令人满意的效果。因此有部分方法尝试使用数据驱动模型解决故障选线问题。例如,中国专利《一种小电流接地系统单相接地故障选线方法》(公开号CN109581137)和中国专利《一种基于LSTM的单相接地故障选线方法及系统》(申请号CN202110307110.2)等分别提出了使用深度信念网络和长短期记忆网络等数据驱动模型进行故障选线。这些方法虽然效果较好且训练稳定,能够从大量有标签故障样本中提取深层特征,在一定程度上提高了故障选线结果的可靠性。但是,数据驱动模型需要大量的有标签数据进行模型训练,该方法在仅有少量样本的情况下存在训练困难的问题,这导致许多无足量历史数据的变电站无法应用这些方法。
有标签样本不足的问题主要有两个方面的因素造成。第一是电力系统绝大多数时间都处于正常运行状态,故障的概率较小;第二是标签标记的成本较大,甚至是不可能的。因此,利用无标签样本中隐含的故障特征提升故障选线模型的精度是一条具有极大应用前景的技术路线。
生成对抗网络(Generative Adversarial Network,GAN)是由Goodfellow等人于2014年提出的一种基于非合作博弈理论的无监督生成式模型。自从被提出以来,该模型广泛应用于图片生成、数据增强等领域。半监督生成对抗网络(Semi-Supervised GenerativeAdversarial Networks,半监督生成对抗网络)是生成对抗网络的一种改进模型,它能够利用较少的有标签样本和无标签样本进行训练,最终获得性能达到先进水平的分类器,半监督生成对抗网络能够缓解小样本应用场景下深度学习算法训练困难等问题。
发明内容
本发明的目的在于针对现有技术中的上述问题,提供一种基于半监督生成对抗网络的故障选线方法,该方法能够仅使用少量有标签数据以及无标签数据进行训练,提取单相接地故障特征,即可获得较高的故障选线精度,能够解决传统数据驱动故障选线方法在仅有少量样本的情况下训练困难的问题。
为实现上述发明目的,本发明采用了如下技术方案:
一种基于半监督生成对抗网络的故障选线方法,包括如下步骤:
S1.样本的采集以及数据预处理:
采集和存储从变电站上传到调度系统的历史数据,从中提取出故障选线相关的电气参数并生成样本;
所述样本分为有标签样本和无标签样本,样本中包含了各线路的电气参数,所述电气参数包括三相电流、有功功率、无功功率和功率因数;
采用min-max归一化对所有样本的各电气参数分别进行处理,并将归一化处理后的数据输入半监督生成对抗网络;
S2.基于半监督深层对抗网络的故障选线模型构建:
半监督生成对抗网络包括生成器和判别器,所述生成器用于根据输入的随机噪声生成假数据;所述判别器用于区分输入数据的真假以及输入数据的类别;
所述生成器通过接收一个随机噪声,使用一维反卷积神经网络处理该随机噪声,输出一个与真实样本维度相同的假样本,并将包含有假样本、有标签样本和无标签样本的输入样本输送到所述判别器;
所述判别器与所述生成器通过不断地博弈训练,最终达到平衡,此时判别器对输入样本进行分类预测,使用一维卷积神经网络对输入样本进行特征提取,再通过全连接层对特征进行处理,最终获得模型对输入样本的分类结果,选择出该输入样本代表的故障线路,得到基于半监督深层对抗网络的故障选线模型;
S3.半监督生成对抗网络模型的训练:
特征匹配:以特征匹配作为生成器的损失函数,用于提升模型训练的稳定性;
历史均值:在生成器和判别器的损失函数中添加一项对模型参数的约束,在进行参数更新时,考虑过去的样本提供的信息,用于约束模型参数的波动,从而使模型在原有平衡点的附近寻找新的平衡点;
单侧标签平滑:使用单侧标签平滑技术对样本集标签进行处理,以减少对抗样本对模型的影响,得到改进后的半监督生成对抗网络的生成器以及判别器的损失函数;
采用基于半监督生成对抗网络的故障选线模型训练框架对半监督生成对抗网络进行训练;
S4.基于半监督生成对抗网络的故障选线模型的在线运行:
基于半监督生成对抗网络的故障选线模型架构包括离线训练和在线运行;在离线训练中,半监督生成对抗网络通过博弈训练达到平衡点,此时丢弃生成器,仅将判别器的参数迁移到基于半监督生成对抗网络的故障选线模型;在线运行中,将变电站实时采样的数据传输到调度系统,经过预处理后输入基于半监督生成对抗网络的故障选线模型,基于半监督生成对抗网络的故障选线模型对输入数据进行分类,从而判别出故障线路作为分类结果;
分类结果以及变电站实时采样的数据被存储到样本集的历史数据中,以此实现模型参数的不断更新。
进一步地,所述步骤S1中从中提取出故障选线相关的电气参数并生成样本的方法如下:
所述样本的格式如式(1)-(4):
lij=[I0ij Iaij Ibij Icij Pij Qij cosθij]T (1);
xi=[li1 li2 ... lin]T (2);
X=[x1 x2 ... xT] (3);
Figure BDA0003242947220000041
式中,lij表示线路j在第i时刻的电气数据;I0ij、Iaij、Ibij、Icij分别表示线路j在i时刻的零序电路、A相电流、B相电流、C相电流;Pij,Qij和cosθij分别表示线路j在第i时刻的有功功率、无功功率和功率因数;xi表示在i时刻n条线路的电气数据,i=1,2,…,T;T表示样本中包括断面的数量;n表示线路的数量;X表示预测样本,Y表示一个n维矢量,若X为有标签样本,则Y表示X所对应的标签;yj表示Y的第j个元素,yk表示Y的第k个元素,当某个样本的故障发生在线路k时,则Y的第k个元素为1;其余元素为0。
所述步骤S1中采用min-max归一化对所有样本的各电气参数分别进行处理的方法如下:
Figure BDA0003242947220000042
式中,a为需要归一化的电气参数;a'为电气参数a归一化后的输出;Amin为所有样本中a的最小值;Amax为所有样本中a的最大值。
进一步地,所述步骤S2中判别器对输入样本进行分类预测的方法如下:
对于N分类问题,判别器的输出层激活函数由sigmoid函数变为softmax函数,其输出为N+1维相量,其中第N+1维表示输入数据为假数据,判别器D对预测样本x的输出D(x)如式(6)所示;
D(x)=[r1 r2 ... rN rN+1] (6);
令判别器D预测样本x为第s类的概率为Ds(x),如式(7)所示:
Ds(x)=rs,s=1,2,...,N,N+1 (7);
式中,rs表示预测样本x为第s类的概率,s表示故障线路的标号;
所述步骤S2中所述判别器与所述生成器不断地博弈训练的方法如下:
博弈训练目标如式(8)-(10)所示:
Figure BDA0003242947220000051
Figure BDA0003242947220000052
L=Lsupervised+Lunsupervised (10);
式中,Lsupervised表示有监督项;Lunsupervised表示无监督项;L表示模型的博弈目标函数;x,y~pdata(x,y)和x~pdata(x,y)分别表示满足原始输入数据分布的有标签样本和无标签样本;x~G表示符合生成器概率分布的样本;pmodel表示模型输出的概率;x表示预测样本;y表示x对应的标签;
Figure BDA0003242947220000053
表示当x满足原始数据时的期望;
Figure BDA0003242947220000054
表示当x满足生成器概率分布时的期望;
有监督项在训练过程中不断最小化,使模型能够对真实数据的类别进行判断;无监督项迫使判别器不断地学习如何区别真实数据与假数据,在训练过程中,无监督项为判别器引入噪声;
若令判别器输出的正类概率为式(11),则无监督项为式(13),式(12)为判别器的监督项损失,式(13)为通常的生成对抗网络判别器的损失函数:
Figure BDA0003242947220000055
Figure BDA0003242947220000056
Figure BDA0003242947220000057
式中,Dreal(x)表示判别器输入为x时的输出;
Figure BDA0003242947220000058
表示当z满足给定噪声分布时的期望,z表示输入噪声;Dreal(G(z))表示当判别器输入为假数据时的输出;ys为x的实际标签,当x属于第s类时,ys=1,否则ys=0;
判别器的训练目标由以下三项构成:
(a)在有标签样本中,评估模型输出与样本的标签之间是否一致,其数学表达式如式(14)所示:
Figure BDA0003242947220000061
(b)在无标签样本中,评估模型输出是否为正例,即模型输出不能为第N+1类,其数学表达式如式(15)所示:
Figure BDA0003242947220000062
式中,Lunlabeled表示无标签项损失;
(c)在假数据集中,评估模型输入是否为反例,即模型输出应为第N+1类,其数学表达式如式(16)所示:
Figure BDA0003242947220000063
式中,Lfake表示假数据项损失;
Figure BDA0003242947220000064
表示当x满足生成器概率分布时的期望;
所述步骤S2中判别器对输入样本进行分类预测的方法如下:
判别器的输入样本格式为式(3):
X=[x1 x2 ... xT] (3);
式中,X表示1个样本,xi表示在i时刻n条线路的电气数据,i=1,2,…,T;T表示样本中包含的断面数量;n表示线路的数量;
判别器的输出为一个N+1维的向量,将式(14)-(16)三项合并,获得判别器的训练目标LD,如式(17)所示:
LD=Llabeled+ω(Lunlabeled+Lfake) (17);
式中,Llabeled表示有标签损失项;Lfake表示假数据项损失项;ω表示权重因子;
生成器的训练目标为式(18)所示:
LG=-Lfake (18);
式中LG表示生成器的训练目标函数。
进一步地,所述步骤S3中特征匹配的方法如下:
特征匹配将生成样本与真实样本分别输入到判别器中,以判别器中间层对两类样本的输出误差为损失值LG,其的数学表达式如式(19)所示:
Figure BDA0003242947220000071
式中,fσ(·)表示判别器的第σ层隐藏层的输出,为常用数学表达;z~pnoise表示满足随机噪声概率分布的序列,
Figure BDA0003242947220000072
表示当x满足原始数据时的期望;
Figure BDA0003242947220000073
表示当z满足随机噪声概率分布时的期望;G(z)表示生成器输入为z时的输出,在实际的训练中,以式(19)替代式(18)作为生成器的损失函数,用于提升模型训练的稳定性;
所述步骤S3中历史均值的方法如下:
参数历史均值在模型损失函数中的添加项ΔL如式(20)所示:
Figure BDA0003242947220000074
式中,θ表示模型当前的参数;θ(m)为模型参数在时刻m的值;M为需要考虑的时刻数量;
所述步骤S3中单侧标签平滑的方法如下:
将正类样本的硬标签设置为软标签α,反例样本的硬标签设置为软标签β,其中软标签α是在(0,1)中的一个接近0的较小值,软标签β是一个在(0,1)中的一个接近1的较大值;在单侧标签平滑技术将正例设置为0.9,反例设置为0,用于减小对抗样本对深度神经网络模型训练的影响,以提高训练的稳定性,得出改进后的半监督生成对抗网络的生成器的损失函数
Figure BDA0003242947220000075
和判别器的损失函数
Figure BDA0003242947220000076
分别如式(21)和式(22)所示:
Figure BDA0003242947220000077
Figure BDA0003242947220000081
相比于现有技术,本发明的优势在于:
本发明所提供的一种基于半监督生成对抗网络的故障选线方法,利用半监督生成对抗网络提取无标签样本中的故障信息,相比于其他数据驱动故障选线方法,本申请所提出的方法能够通过博弈训练从少量用标签样本和无标签样本中学习到鲁棒性更强的故障特征,从而提高故障选线模型的精度以及运行的稳定性。本发明提出的方法只需要少量无标签数据和有标签数据即可进行训练,具有应用门槛低、精度高等优点,具有大规模推广使用的前景。
结构上提出了使用半监督生成对抗网络对有标签和无标签样本中的故障特征进行提取,同时引入了对抗训练增强模型的鲁棒性,从而提升了故障选线的抗干扰能力。
附图说明
图1是本发明一种基于半监督生成对抗网络的故障选线模型实施流程图。
图2是本发明中半监督生成对抗网络的结构。
图3是本发明中判别器的神经网络结构。
图4是本发明中生成器的神经网络结构。
图5是本发明中基于半监督生成对抗网络的故障选线模型架构。
图6是本发明中可标注标签的故障。
图7是本发明中无法标注标签的故障。
具体实施方式
以下结合实施例及其附图对本发明技术方案作进一步非限制性的详细说明。
从调度历史数据中提取出的故障片段是无标签的。需要复盘完整的历史故障片段并根据“拉路法”的原理,给每个故障标记标签。如图6所示,line911断开后故障消失,可判定故障发生在line911上,line912和line913分别表示某小电流接地系统的线路;Va、Vb、Vc分别表示母线的三相电压。而如图7所示的故障片段,故障发生约20秒后自行消失,调度人员未进行任何操作。无法判断故障线路所在。
图7所示的故障情况在实际运行中并大量存在,这样的数据由于外部因素无法标注标签,因此不能用于监督学习的模型训练中。但这些数据事实上产生于单相接地故障稳定建立后,因此包含丰富的故障信息。而单相接地故障数据本身就十分难以获取,若直接丢弃这些无标签数据,会照成极大的浪费。因此,考虑如何利用这些无标签数据提升数据驱动选线模型的性能,是十分具有实践意义的思路。
在传统选线算法效果不佳而数据驱动选线模型需要大量有标签数据的情况下,本发明提出了基于半监督生成对抗网络(Semi-Supervised Generative AdversarialNetwork,半监督生成对抗网络)的小电流接地系统故障选线方法,本方法能够仅使用少量有标签数据以及无标签数据进行训练,提取单相接地故障特征,用于检测故障线路。
如图1所示,一种基于半监督生成对抗网络的故障选线方法,包括如下步骤:
S1.样本的采集以及数据预处理:
采集和存储从变电站上传到调度系统的历史数据,从中提取出故障选线相关的电气参数并生成样本;
所述样本分为有标签样本和无标签样本,样本中包含了各线路的电气参数,所述电气参数包括三相电流、有功功率、无功功率和功率因数;
采用min-max归一化对所有样本的各电气参数分别进行处理,并将归一化处理后的数据输入半监督生成对抗网络;
S2.基于半监督深层对抗网络的故障选线模型构建:
半监督生成对抗网络的结构如图2所示,半监督生成对抗网络包括生成器和判别器;生成器的神经网络结构如图4所示,生成器用于根据输入的随机噪声生成假数据;判别器的神经网络结构如图3所示,判别器用于区分输入数据的真假以及输入数据的类别;
所述生成器通过接收一个随机噪声,使用一维反卷积神经网络处理该随机噪声,输出一个与真实样本维度相同的假样本,并将包含有假样本、有标签样本和无标签样本的输入样本输送到所述判别器;
所述判别器与所述生成器通过不断地博弈训练,最终达到平衡,此时判别器对输入样本进行分类预测,使用一维卷积神经网络对输入样本进行特征提取,再通过全连接层对特征进行处理,最终获得模型对输入样本的分类结果,选择出该输入样本代表的故障线路,得到基于半监督深层对抗网络的故障选线模型;
S3.半监督生成对抗网络模型的训练:
特征匹配:以特征匹配作为生成器的损失函数,用于提升模型训练的稳定性;
历史均值:在生成器和判别器的损失函数中添加一项对模型参数的约束,在进行参数更新时,考虑过去的样本提供的信息,用于约束模型参数的波动,从而使模型在原有平衡点的附近寻找新的平衡点;
单侧标签平滑:使用单侧标签平滑技术对样本集标签进行处理,以减少对抗样本对模型的影响,得到改进后的半监督生成对抗网络的生成器以及判别器的损失函数;
采用基于半监督生成对抗网络的故障选线模型训练框架对半监督生成对抗网络进行训练;
S4.基于半监督生成对抗网络的故障选线模型的在线运行:
基于半监督生成对抗网络的故障选线模型架构如图5所示,基于半监督生成对抗网络的故障选线模型架构包括离线训练和在线运行;在离线训练中,半监督生成对抗网络通过博弈训练达到平衡点,此时丢弃生成器,仅将判别器的参数迁移到基于半监督生成对抗网络的故障选线模型;在线运行中,将变电站实时采样的数据传输到调度系统,经过预处理后输入基于半监督生成对抗网络的故障选线模型,基于半监督生成对抗网络的故障选线模型对输入数据进行分类,从而判别出故障线路作为分类结果;
分类结果以及变电站实时采样的数据被存储到样本集的历史数据中,以此实现模型参数的不断更新。
步骤S1中从中提取出故障选线相关的电气参数并生成样本的方法如下:
样本的格式如式(1)-(4):
lij=[I0ij Iaij Ibij Icij Pij Qij cosθij]T (1);
xi=[li1 li2 ... lin]T (2);
X=[x1 x2 ... xT] (3);
Figure BDA0003242947220000111
式中,lij表示线路j在第i时刻的电气数据;I0ij、Iaij、Ibij、Icij分别表示线路j在i时刻的零序电路、A相电流、B相电流、C相电流;Pij,Qij和cosθij分别表示线路j在第i时刻的有功功率、无功功率和功率因数;xi表示在i时刻n条线路的电气数据,i=1,2,…,T;T表示样本中包括断面的数量;n表示线路的数量;X表示预测样本,Y表示一个n维矢量,若X为有标签样本,则Y表示X所对应的标签;yj表示Y的第j个元素,yk表示Y的第k个元素,当某个样本的故障发生在线路k时,则Y的第k个元素为1;其余元素为0。
所述步骤S1中采用min-max归一化对所有样本的各电气参数分别进行处理的方法如下:
Figure BDA0003242947220000112
式中,a为需要归一化的电气参数;a'为电气参数a归一化后的输出;Amin为所有样本中a的最小值;Amax为所有样本中a的最大值。
步骤S2中判别器对输入样本进行分类预测的方法如下:
对于N分类问题,判别器的输出层激活函数由sigmoid函数变为softmax函数,其输出为N+1维相量,其中第N+1维表示输入数据为假数据,判别器D对预测样本x的输出D(x)如式(6)所示;
D(x)=[r1 r2 ... rN rN+1] (6);
令判别器D预测样本x为第s类的概率为Ds(x),如式(7)所示:
Ds(x)=rs,s=1,2,...,N,N+1 (7);
式中,rs表示预测样本x为第s类的概率,s表示故障线路的标号;
所述步骤S2中所述判别器与所述生成器不断地博弈训练的方法如下:
博弈训练目标如式(8)-(10)所示:
Figure BDA0003242947220000121
Figure BDA0003242947220000122
L=Lsupervised+Lunsupervised (10);
式中,Lsupervised表示有监督项;Lunsupervised表示无监督项;L表示模型的博弈目标函数;x,y~pdata(x,y)和x~pdata(x,y)分别表示满足原始输入数据分布的有标签样本和无标签样本;x~G表示符合生成器概率分布的样本;pmodel表示模型输出的概率;x表示预测样本;y表示x对应的标签;
Figure BDA0003242947220000123
表示当x满足原始数据时的期望;
Figure BDA0003242947220000124
表示当x满足生成器概率分布时的期望;
有监督项在训练过程中不断最小化,使模型能够对真实数据的类别进行判断;无监督项迫使判别器不断地学习如何区别真实数据与假数据,在训练过程中,无监督项为判别器引入噪声;
若令判别器输出的正类概率为式(11),则无监督项为式(13),式(12)为判别器的监督项损失,式(13)为通常的生成对抗网络判别器的损失函数:
Figure BDA0003242947220000131
Figure BDA0003242947220000132
Figure BDA0003242947220000133
式中,Dreal(x)表示判别器输入为x时的输出;
Figure BDA0003242947220000138
表示当z满足给定噪声分布时的期望,z表示输入噪声;Dreal(G(z))表示当判别器输入为假数据时的输出;ys为x的实际标签,当x属于第s类时,ys=1,否则ys=0;
判别器的训练目标由以下三项构成:
(a)在有标签样本中,评估模型输出与样本的标签之间是否一致,其数学表达式如式(14)所示:
Figure BDA0003242947220000134
(b)在无标签样本中,评估模型输出是否为正例,即模型输出不能为第N+1类,其数学表达式如式(15)所示:
Figure BDA0003242947220000135
式中,Lunlabeled表示无标签项损失;
(c)在假数据集中,评估模型输入是否为反例,即模型输出应为第N+1类,其数学表达式如式(16)所示:
Figure BDA0003242947220000136
式中,Lfake表示假数据项损失;
Figure BDA0003242947220000137
表示当x满足生成器概率分布时的期望;
所述步骤S2中判别器对输入样本进行分类预测的方法如下:
判别器的输入样本格式为式(3):
X=[x1 x2 ... xT] (3);
式中,X表示1个样本,xi表示在i时刻n条线路的电气数据,i=1,2,…,T;T表示样本中包含的断面数量;n表示线路的数量;
判别器的输出为一个N+1维的向量,判别器训练的最终目的是排除假数据的干扰,尽可能将真实数据正确地进行分类,即选择出该样本代表的故障线路;将式(14)-(16)三项合并,获得判别器的训练目标LD,如式(17)所示:
LD=Llabeled+ω(Lunlabeled+Lfake) (17);
式中,Llabeled表示有标签损失项;Lfake表示假数据项损失项;ω表示权重因子;
生成器的训练目标为式(18)所示:
LG=-Lfake (18);
式中LG表示生成器的训练目标函数。
步骤S3中特征匹配的方法如下:
特征匹配将生成样本与真实样本分别输入到判别器中,以判别器中间层对两类样本的输出误差为损失值LG,其的数学表达式如式(19)所示:
Figure BDA0003242947220000141
式中,fσ(·)表示判别器的第σ层隐藏层的输出,为常用数学表达;z~pnoise表示满足随机噪声概率分布的序列,
Figure BDA0003242947220000142
表示当x满足原始数据时的期望;
Figure BDA0003242947220000143
表示当z满足随机噪声概率分布时的期望;G(z)表示生成器输入为z时的输出,在实际的训练中,以式(19)替代式(18)作为生成器的损失函数,用于提升模型训练的稳定性;
所述步骤S3中历史均值的方法如下:
参数历史均值在模型损失函数中的添加项ΔL如式(20)所示:
Figure BDA0003242947220000144
式中,θ表示模型当前的参数;θ(m)为模型参数在时刻m的值;M为需要考虑的时刻数量;
所述步骤S3中单侧标签平滑的方法如下:
将正类样本的硬标签设置为软标签α,反例样本的硬标签设置为软标签β,其中软标签α是在(0,1)中的一个接近0的较小值,软标签β是一个在(0,1)中的一个接近1的较大值;在单侧标签平滑技术将正例设置为0.9,反例设置为0,用于减小对抗样本对深度神经网络模型训练的影响,以提高训练的稳定性,得出改进后的半监督生成对抗网络的生成器的损失函数
Figure BDA0003242947220000151
和判别器的损失函数
Figure BDA0003242947220000152
分别如式(21)和式(22)所示:
Figure BDA0003242947220000153
Figure BDA0003242947220000154
本方法具有如下优点:
1.本发明的模型通过生成器对判别器引入了适当的干扰,因此能够在小样本的情况下减少判别器的过拟合现象,从而实现在少量有标签样本的前提下提升分类器的准确率。
2.半监督生成对抗网络的判别器结构与传统GAN有较大不同,对于N分类问题,判别器的输出层激活函数由sigmoid函数变为softmax函数。
3.有监督项在训练过程中不断最小化,使模型能够对真实数据的类别进行判断。无监督项则迫使判别器不断地学习如何区别真实数据与假数据。在训练过程中,无监督项为判别器引入噪声,能够缓解由于有标签样本过少而造成的判别器过拟合现象。
4.与生成对抗网络一样,半监督生成对抗网络同样存在模型训练不稳定的问题。在优化的角度看,半监督生成对抗网络理论上需要生成器与判别器的性能达到平衡,即该平衡点为纳什均衡点。该平衡点并不是极值点,而是一个鞍点。目前基于梯度的模型参数更新算法主要是在高维求解空间中寻找极小值点,模型的求解需求与训练算法方向并不完全一致,导致了半监督生成对抗网络训练不稳定的问题。
5.故障选线问题实际上为多分类问题,需要高性能的判别器进行工作,本发明使用特征匹配、历史均值、单侧标签平滑的方法,用于改善半监督生成对抗网络的性能与训练稳定性,对判别器效果提升较明显。
6.半监督生成对抗网络存在着训练不稳定的问题,其原因之一是直接最大化判别器的输出,可能会使生成器对判别器的过度学习,从而导致训练迭代偏离平衡点。为了防止以上情况发生,本发明采用特征匹配来替代传统的生成器的损失函数,使模型的训练稳定性提升。
7.历史均值是在生成器和判别器的损失函数中添加一项对模型参数的约束。该技术主要用于应对训练过程中模型对历史参数灾难性遗忘的问题。在进行参数更新时,考虑过去的样本提供的信息能够避免模型参数大范围地波动,从而缓解半监督生成对抗网络训练中可能存在的模式崩溃问题。
特别地,本方法在选线模型的在线学习时能够发挥较大的作用。小电流接地系统发生变化时,较小的扰动可能导致模型平衡点明显偏移,使用参数历史均值能够约束模型参数的大范围波动,从而使模型在原有平衡点的附近寻找新的平衡点。
8.当数据在传输过程中发生细微扰动时,可能使模型对某个故障样本的标签预测发生错误,这些样本称为对抗样本。深度神经网络对对抗样本的敏感性极高,数量稀少的对抗样本可能就会使得模型训练效果大幅度下。因此,本发明使用单侧标签平滑技术对样本集标签进行处理,以减少对抗样本对模型的影响,降低半监督生成对抗网络训练的脆弱性。
9.与生成对抗网络一样,半监督生成对抗网络的训练需解决一个极小极大问题,该问题求解难度极高,实践应用中难以获得严格的解。因此使用训练框架对半监督生成对抗网络进行训练。
10.本发明的半监督生成对抗网络由生成器和判别器两个部分组成,它所用的数据集包括带标签数据、无标签数据与生成器生成的假数据,其中有标签数据与无标签数据均来自于真实的故障采样数据。对于生成器而言,它通过接收随机噪声序列,然后输出尽量与真实数据相似的假数据,从而达到迷惑判别器的作用。对于判别器而言,它需要尽可能地在生成器的干扰下,学习故障的深层特征,提高分类精度。生成器和判别器在不断地博弈中达到平衡,从而在仅使用少量有标签样本的情况下获得超过传统算法的精度。
基于半监督生成对抗网络的故障选线模型架构分为离线训练和在线运行,在离线训练中,半监督生成对抗网络通过博弈训练达到平衡点。此时丢弃生成器,仅将判别器的参数迁移到故障选线模型。在线运行中,现场采样数据传输到调度系统,经过预处理后输入故障选线模型,故障选线模型对输入数据进行分类,从而判别出故障线路。此外,分类的结果以及实时采样的数据集被存储到样本集中,以此实现模型参数的不断更新。该流程能够在一定程度上避免由于系统结构、运行方式的变化等因素而导致的选线精度劣化,确保模型长时间内保持较高精度运行。
为了证明本发明所提方法在小样本情况下的性能,此处选取了某小电流接地系统的历史数据对不同方法进行了5次测试,并计算出其平均测试精度,具体如下:
M0:本发明所提方法;
M1:有监督学习架构下的深度神经网络模型;
M2:半监督学习结构下的深度神经网络模型。
有标签样本数量 50 100 200 300 400 500 700 1000 1500 2000
M0 38% 52% 73% 81% 85% 84% 88% 89% 91% 91%
M1 35% 36% 35% 38% 41% 59% 60% 66% 81% 87%
M2 26% 29% 38% 44% 53% 61% 65% 61% 69% 73%
结果表明,本发明的方法在有标签样本数量较少时,能够获得远优于其他数据驱动模型的性能;在有标签样本数量较多时,也能获得有监督学习算法相当的性能。上述结果表明,本发明所提方法具有巨大的应用潜力。
以上所揭露的仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或变型,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于半监督生成对抗网络的故障选线方法,其特征在于,包括如下步骤:
S1.样本的采集以及数据预处理:
采集和存储从变电站上传到调度系统的历史数据,从中提取出故障选线相关的电气参数并生成样本;
所述样本分为有标签样本和无标签样本,样本中包含了各线路的电气参数,所述电气参数包括三相电流、有功功率、无功功率和功率因数;
采用min-max归一化对所有样本的各电气参数分别进行处理,并将归一化处理后的数据输入半监督生成对抗网络;
S2.基于半监督深层对抗网络的故障选线模型构建:
半监督生成对抗网络包括生成器和判别器,所述生成器用于根据输入的随机噪声生成假数据;所述判别器用于区分输入数据的真假以及输入数据的类别;
所述生成器通过接收一个随机噪声,使用一维反卷积神经网络处理该随机噪声,输出一个与真实样本维度相同的假样本,并将包含有假样本、有标签样本和无标签样本的输入样本输送到所述判别器;
所述判别器与所述生成器通过不断地博弈训练,最终达到平衡,此时判别器对输入样本进行分类预测,使用一维卷积神经网络对输入样本进行特征提取,再通过全连接层对特征进行处理,最终获得模型对输入样本的分类结果,选择出该输入样本代表的故障线路,得到基于半监督深层对抗网络的故障选线模型;
S3.半监督生成对抗网络模型的训练:
特征匹配:以特征匹配作为生成器的损失函数,用于提升模型训练的稳定性;
历史均值:在生成器和判别器的损失函数中添加一项对模型参数的约束,在进行参数更新时,考虑过去的样本提供的信息,用于约束模型参数的波动,从而使模型在原有平衡点的附近寻找新的平衡点;
单侧标签平滑:使用单侧标签平滑技术对样本集标签进行处理,以减少对抗样本对模型的影响,得到改进后的半监督生成对抗网络的生成器以及判别器的损失函数;
采用基于半监督生成对抗网络的故障选线模型训练框架对半监督生成对抗网络进行训练;
S4.基于半监督生成对抗网络的故障选线模型的在线运行:
基于半监督生成对抗网络的故障选线模型架构包括离线训练和在线运行;在离线训练中,半监督生成对抗网络通过博弈训练达到平衡点,此时丢弃生成器,仅将判别器的参数迁移到基于半监督生成对抗网络的故障选线模型;在线运行中,将变电站实时采样的数据传输到调度系统,经过预处理后输入基于半监督生成对抗网络的故障选线模型,基于半监督生成对抗网络的故障选线模型对输入数据进行分类,从而判别出故障线路作为分类结果;
分类结果以及变电站实时采样的数据被存储到样本集的历史数据中,以此实现模型参数的不断更新。
2.根据权利要求1所述的故障选线方法,其特征在于,所述步骤S1中从中提取出故障选线相关的电气参数并生成样本的方法如下:
所述样本的格式如式(1)-(4):
lij=[I0ij Iaij Ibij Icij Pij Qij cosθij]T (1);
xi=[li1 li2...lin]T (2);
X=[x1 x2...xT] (3);
Figure FDA0003242947210000031
式中,lij表示线路j在第i时刻的电气数据;I0ij、Iaij、Ibij、Icij分别表示线路j在i时刻的零序电路、A相电流、B相电流、C相电流;Pij,Qij和cosθij分别表示线路j在第i时刻的有功功率、无功功率和功率因数;xi表示在i时刻n条线路的电气数据,i=1,2,…,T;T表示样本中包括断面的数量;n表示线路的数量;X表示预测样本,Y表示一个n维矢量,若X为有标签样本,则Y表示X所对应的标签;yj表示Y的第j个元素,yk表示Y的第k个元素,当某个样本的故障发生在线路k时,则Y的第k个元素为1;其余元素为0;
所述步骤S1中采用min-max归一化对所有样本的各电气参数分别进行处理的方法如下:
Figure FDA0003242947210000032
式中,a为需要归一化的电气参数;a′为电气参数a归一化后的输出;Amin为所有样本中a的最小值;Amax为所有样本中a的最大值。
3.根据权利要求1所述的故障选线方法,其特征在于,所述步骤S2中判别器对输入样本进行分类预测的方法如下:
对于N分类问题,判别器的输出层激活函数由sigmoid函数变为softmax函数,其输出为N+1维相量,其中第N+1维表示输入数据为假数据,判别器D对预测样本x的输出D(x)如式(6)所示;
D(x)=[r1 r2...rN rN+1] (6);
令判别器D预测样本x为第s类的概率为Ds(x),如式(7)所示:
Ds(x)=rs,s=1,2,...,N,N+1 (7);
式中,rs表示预测样本x为第s类的概率,s表示故障线路的标号;
所述步骤S2中所述判别器与所述生成器不断地博弈训练的方法如下:
博弈训练目标如式(8)-(10)所示:
Figure FDA0003242947210000041
Figure FDA0003242947210000042
L=Lsupervised+Lunsupervised (10);
式中,Lsupervised表示有监督项;Lunsupervised表示无监督项;L表示模型的博弈目标函数;x,y~pdata(x,y)和x~pdata(x,y)分别表示满足原始输入数据分布的有标签样本和无标签样本;x~G表示符合生成器概率分布的样本;pmodel表示模型输出的概率;x表示预测样本;y表示x对应的标签;
Figure FDA0003242947210000043
表示当x满足原始数据时的期望;
Figure FDA0003242947210000044
表示当x满足生成器概率分布时的期望;
有监督项在训练过程中不断最小化,使模型能够对真实数据的类别进行判断;无监督项迫使判别器不断地学习如何区别真实数据与假数据,在训练过程中,无监督项为判别器引入噪声;
若令判别器输出的正类概率为式(11),则无监督项为式(13),式(12)为判别器的监督项损失,式(13)为通常的生成对抗网络判别器的损失函数:
Figure FDA0003242947210000045
Figure FDA0003242947210000046
Figure FDA0003242947210000051
式中,Dreal(x)表示判别器输入为x时的输出;
Figure FDA0003242947210000052
表示当z满足给定噪声分布时的期望,z表示输入噪声;Dreal(G(z))表示当判别器输入为假数据时的输出;ys为x的实际标签,当x属于第s类时,ys=1,否则ys=0;
判别器的训练目标由以下三项构成:
(a)在有标签样本中,评估模型输出与样本的标签之间是否一致,其数学表达式如式(14)所示:
Figure FDA0003242947210000053
(b)在无标签样本中,评估模型输出是否为正例,即模型输出不能为第N+1类,其数学表达式如式(15)所示:
Figure FDA0003242947210000054
式中,Lunlabeled表示无标签项损失;
(c)在假数据集中,评估模型输入是否为反例,即模型输出应为第N+1类,其数学表达式如式(16)所示:
Figure FDA0003242947210000055
式中,Lfake表示假数据项损失;
Figure FDA0003242947210000056
表示当x满足生成器概率分布时的期望;
所述步骤S2中判别器对输入样本进行分类预测的方法如下:
判别器的输入样本格式为式(3):
X=[x1 x2...xT] (3);
式中,X表示1个样本,xi表示在i时刻n条线路的电气数据,i=1,2,…,T;T表示样本中包含的断面数量;n表示线路的数量;
判别器的输出为一个N+1维的向量,将式(14)-(16)三项合并,获得判别器的训练目标LD,如式(17)所示:
LD=Llabeled+ω(Lunlabeled+Lfake) (17);
式中,Llabeled表示有标签损失项;Lfake表示假数据项损失项;ω表示权重因子;
生成器的训练目标为式(18)所示:
LG=-Lfake (18);
式中LG表示生成器的训练目标函数。
4.根据权利要求3所述的故障选线方法,其特征在于,所述步骤S3中特征匹配的方法如下:
特征匹配将生成样本与真实样本分别输入到判别器中,以判别器中间层对两类样本的输出误差为损失值LG,其的数学表达式如式(19)所示:
Figure FDA0003242947210000061
式中,fσ(·)表示判别器的第σ层隐藏层的输出,为常用数学表达;z~pnoise表示满足随机噪声概率分布的序列,
Figure FDA0003242947210000062
表示当x满足原始数据时的期望;
Figure FDA0003242947210000063
表示当z满足随机噪声概率分布时的期望;G(z)表示生成器输入为z时的输出,在实际的训练中,以式(19)替代式(18)作为生成器的损失函数,用于提升模型训练的稳定性;
所述步骤S3中历史均值的方法如下:
参数历史均值在模型损失函数中的添加项ΔL如式(20)所示:
Figure FDA0003242947210000064
式中,θ表示模型当前的参数;θ(m)为模型参数在时刻m的值;M为需要考虑的时刻数量;
所述步骤S3中单侧标签平滑的方法如下:
将正类样本的硬标签设置为软标签α,反例样本的硬标签设置为软标签β,其中软标签α是在(0,1)中的一个接近0的较小值,软标签β是一个在(0,1)中的一个接近1的较大值;在单侧标签平滑技术将正例设置为0.9,反例设置为0,用于减小对抗样本对深度神经网络模型训练的影响,以提高训练的稳定性,得出改进后的半监督生成对抗网络的生成器的损失函数
Figure FDA0003242947210000071
和判别器的损失函数
Figure FDA0003242947210000072
分别如式(21)和式(22)所示:
Figure FDA0003242947210000074
Figure FDA0003242947210000073
CN202111024902.5A 2021-09-02 2021-09-02 一种基于半监督生成对抗网络的故障选线方法 Active CN113721113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111024902.5A CN113721113B (zh) 2021-09-02 2021-09-02 一种基于半监督生成对抗网络的故障选线方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111024902.5A CN113721113B (zh) 2021-09-02 2021-09-02 一种基于半监督生成对抗网络的故障选线方法

Publications (2)

Publication Number Publication Date
CN113721113A true CN113721113A (zh) 2021-11-30
CN113721113B CN113721113B (zh) 2023-10-24

Family

ID=78680806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111024902.5A Active CN113721113B (zh) 2021-09-02 2021-09-02 一种基于半监督生成对抗网络的故障选线方法

Country Status (1)

Country Link
CN (1) CN113721113B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139587A (zh) * 2021-12-16 2022-03-04 吉林大学 一种基于半监督多次对抗网络的电子鼻气体种类识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019237240A1 (zh) * 2018-06-12 2019-12-19 中国科学院深圳先进技术研究院 一种增强型生成式对抗网络以及目标样本识别方法
CN110617966A (zh) * 2019-09-23 2019-12-27 江南大学 一种基于半监督生成对抗网络的轴承故障诊断方法
CN110823574A (zh) * 2019-09-30 2020-02-21 安徽富煌科技股份有限公司 一种基于半监督学习深度对抗网络的故障诊断方法
CN112039687A (zh) * 2020-07-14 2020-12-04 南京邮电大学 一种面向小样本特征的基于改进生成对抗网络的故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019237240A1 (zh) * 2018-06-12 2019-12-19 中国科学院深圳先进技术研究院 一种增强型生成式对抗网络以及目标样本识别方法
CN110617966A (zh) * 2019-09-23 2019-12-27 江南大学 一种基于半监督生成对抗网络的轴承故障诊断方法
CN110823574A (zh) * 2019-09-30 2020-02-21 安徽富煌科技股份有限公司 一种基于半监督学习深度对抗网络的故障诊断方法
CN112039687A (zh) * 2020-07-14 2020-12-04 南京邮电大学 一种面向小样本特征的基于改进生成对抗网络的故障诊断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
罗佳;黄晋英;: "生成式对抗网络研究综述", 仪器仪表学报, no. 03 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139587A (zh) * 2021-12-16 2022-03-04 吉林大学 一种基于半监督多次对抗网络的电子鼻气体种类识别方法

Also Published As

Publication number Publication date
CN113721113B (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
Shi et al. Artificial intelligence techniques for stability analysis and control in smart grids: Methodologies, applications, challenges and future directions
Wu et al. An adaptive deep transfer learning method for bearing fault diagnosis
CN110569925B (zh) 应用于电力设备运检的基于lstm的时序异常检测方法
CN114676742A (zh) 一种基于注意力机制和残差网络的电网异常用电检测方法
Li et al. PMU measurements based short-term voltage stability assessment of power systems via deep transfer learning
CN109255726A (zh) 一种混合智能技术的超短期风功率预测方法
CN115791174B (zh) 一种滚动轴承异常诊断方法、系统、电子设备及存储介质
CN113988215A (zh) 一种配电网计量柜状态检测方法及系统
Thomas et al. Neural architecture search algorithm to optimize deep transformer model for fault detection in electrical power distribution systems
CN113627091A (zh) 一种用于预测能源负荷的装置及方法
Syed et al. Detection of energy theft in smart grids using electricity consumption patterns
Fang et al. A data-driven method for online transient stability monitoring with vision-transformer networks
Gao et al. Model-driven architecture of extreme learning machine to extract power flow features
CN113721113B (zh) 一种基于半监督生成对抗网络的故障选线方法
Shukla et al. Deep learning techniques for transmission line fault classification–A comparative study
Santos et al. Performance analysis of a DNN classifier for power system events using an interpretability method
Zhou et al. Fault classification for on-board equipment of high-speed railway based on attention capsule network
Xu et al. Improved BLS based transformer fault diagnosis considering imbalanced samples
Liu et al. The research of spacecraft electrical characteristics identification and diagnosis using PCA feature extraction
Liu et al. Spacecraft electrical characteristics identification study based on offline FCM clustering and online SVM classifier
Yuan et al. A data-driven framework for power system event type identification via safe semi-supervised techniques
Shi et al. Integrated advance assessment of power system transient voltage and transient angle stability based on two-stage ensemble spatio-temporal graph neural network
Wang et al. An improved deep learning algorithm in enabling load data classification for power system
Adhikari et al. Real-Time Short-Term Voltage Stability Assessment using Temporal Convolutional Neural Network
Yu et al. Incremental object detection with image-level labels

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant