CN113721113A

CN113721113A - 一种基于半监督生成对抗网络的故障选线方法

Info

Publication number: CN113721113A
Application number: CN202111024902.5A
Authority: CN
Inventors: 韦化; 苏先昕; 张玄; 高维; 张乐; 李佩杰
Original assignee: Guangxi University
Current assignee: Guangxi University
Priority date: 2021-09-02
Filing date: 2021-09-02
Publication date: 2021-11-30
Anticipated expiration: 2041-09-02
Also published as: CN113721113B

Abstract

本发明公开了一种基于半监督生成对抗网络的故障选线方法，包括如下步骤：S1.样本的采集以及数据预处理；S2.基于半监督深层对抗网络的故障选线模型构建；S3.半监督生成对抗网络模型的训练；S4.基于半监督生成对抗网络的故障选线模型的在线运行。本发明的方法能够仅使用少量有标签数据以及无标签数据进行训练，提取单相接地故障特征，即可获得较高的故障选线精度，解决了传统数据驱动故障选线方法在仅有少量样本的情况下训练困难的问题。

Description

一种基于半监督生成对抗网络的故障选线方法

技术领域

本发明属于电力系统技术领域，具体涉及一种基于半监督生成对抗网络的故障选线方法。

背景技术

在小电流接地系统中，单相接地故障是最常发生的故障，约占故障总数的80％。小电流接地系统发生单相接地故障时，故障点与线路不产生低阻抗的故障回路，因此故障线路没有明显区别于其他线路的故障特征，难以选出故障线路。

传统的故障选线方法根据使用的故障信号类型不同，可分为三类。它们分别为稳态法、暂态法和注入信号法。进一步地，由于上述方法所需的设备成本较高、易受干扰等问题，实践中难以达到令人满意的效果。因此有部分方法尝试使用数据驱动模型解决故障选线问题。例如，中国专利《一种小电流接地系统单相接地故障选线方法》(公开号CN109581137)和中国专利《一种基于LSTM的单相接地故障选线方法及系统》(申请号CN202110307110.2)等分别提出了使用深度信念网络和长短期记忆网络等数据驱动模型进行故障选线。这些方法虽然效果较好且训练稳定，能够从大量有标签故障样本中提取深层特征，在一定程度上提高了故障选线结果的可靠性。但是，数据驱动模型需要大量的有标签数据进行模型训练，该方法在仅有少量样本的情况下存在训练困难的问题，这导致许多无足量历史数据的变电站无法应用这些方法。

有标签样本不足的问题主要有两个方面的因素造成。第一是电力系统绝大多数时间都处于正常运行状态，故障的概率较小；第二是标签标记的成本较大，甚至是不可能的。因此，利用无标签样本中隐含的故障特征提升故障选线模型的精度是一条具有极大应用前景的技术路线。

生成对抗网络(Generative Adversarial Network,GAN)是由Goodfellow等人于2014年提出的一种基于非合作博弈理论的无监督生成式模型。自从被提出以来，该模型广泛应用于图片生成、数据增强等领域。半监督生成对抗网络(Semi-Supervised GenerativeAdversarial Networks,半监督生成对抗网络)是生成对抗网络的一种改进模型，它能够利用较少的有标签样本和无标签样本进行训练，最终获得性能达到先进水平的分类器，半监督生成对抗网络能够缓解小样本应用场景下深度学习算法训练困难等问题。

发明内容

本发明的目的在于针对现有技术中的上述问题，提供一种基于半监督生成对抗网络的故障选线方法，该方法能够仅使用少量有标签数据以及无标签数据进行训练，提取单相接地故障特征，即可获得较高的故障选线精度，能够解决传统数据驱动故障选线方法在仅有少量样本的情况下训练困难的问题。

为实现上述发明目的，本发明采用了如下技术方案：

一种基于半监督生成对抗网络的故障选线方法，包括如下步骤：

S1.样本的采集以及数据预处理：

采集和存储从变电站上传到调度系统的历史数据，从中提取出故障选线相关的电气参数并生成样本；

所述样本分为有标签样本和无标签样本，样本中包含了各线路的电气参数，所述电气参数包括三相电流、有功功率、无功功率和功率因数；

采用min-max归一化对所有样本的各电气参数分别进行处理，并将归一化处理后的数据输入半监督生成对抗网络；

S2.基于半监督深层对抗网络的故障选线模型构建：

半监督生成对抗网络包括生成器和判别器，所述生成器用于根据输入的随机噪声生成假数据；所述判别器用于区分输入数据的真假以及输入数据的类别；

所述生成器通过接收一个随机噪声，使用一维反卷积神经网络处理该随机噪声，输出一个与真实样本维度相同的假样本，并将包含有假样本、有标签样本和无标签样本的输入样本输送到所述判别器；

所述判别器与所述生成器通过不断地博弈训练，最终达到平衡，此时判别器对输入样本进行分类预测，使用一维卷积神经网络对输入样本进行特征提取，再通过全连接层对特征进行处理，最终获得模型对输入样本的分类结果，选择出该输入样本代表的故障线路，得到基于半监督深层对抗网络的故障选线模型；

S3.半监督生成对抗网络模型的训练：

特征匹配：以特征匹配作为生成器的损失函数，用于提升模型训练的稳定性；

历史均值：在生成器和判别器的损失函数中添加一项对模型参数的约束，在进行参数更新时，考虑过去的样本提供的信息，用于约束模型参数的波动，从而使模型在原有平衡点的附近寻找新的平衡点；

单侧标签平滑：使用单侧标签平滑技术对样本集标签进行处理，以减少对抗样本对模型的影响，得到改进后的半监督生成对抗网络的生成器以及判别器的损失函数；

采用基于半监督生成对抗网络的故障选线模型训练框架对半监督生成对抗网络进行训练；

S4.基于半监督生成对抗网络的故障选线模型的在线运行：

基于半监督生成对抗网络的故障选线模型架构包括离线训练和在线运行；在离线训练中，半监督生成对抗网络通过博弈训练达到平衡点，此时丢弃生成器，仅将判别器的参数迁移到基于半监督生成对抗网络的故障选线模型；在线运行中，将变电站实时采样的数据传输到调度系统，经过预处理后输入基于半监督生成对抗网络的故障选线模型，基于半监督生成对抗网络的故障选线模型对输入数据进行分类，从而判别出故障线路作为分类结果；

分类结果以及变电站实时采样的数据被存储到样本集的历史数据中，以此实现模型参数的不断更新。

进一步地，所述步骤S1中从中提取出故障选线相关的电气参数并生成样本的方法如下：

所述样本的格式如式(1)-(4)：

l_ij＝[I_0ij I_aij I_bij I_cij P_ij Q_ij cosθ_ij]^T (1)；

x_i＝[l_i1 l_i2 ... l_in]^T (2)；

X＝[x₁ x₂ ... x_T] (3)；

式中，l_ij表示线路j在第i时刻的电气数据；I_0ij、I_aij、I_bij、I_cij分别表示线路j在i时刻的零序电路、A相电流、B相电流、C相电流；P_ij,Q_ij和cosθ_ij分别表示线路j在第i时刻的有功功率、无功功率和功率因数；x_i表示在i时刻n条线路的电气数据，i＝1,2，…，T；T表示样本中包括断面的数量；n表示线路的数量；X表示预测样本，Y表示一个n维矢量，若X为有标签样本，则Y表示X所对应的标签；y_j表示Y的第j个元素，y_k表示Y的第k个元素，当某个样本的故障发生在线路k时,则Y的第k个元素为1；其余元素为0。

所述步骤S1中采用min-max归一化对所有样本的各电气参数分别进行处理的方法如下：

式中，a为需要归一化的电气参数；a'为电气参数a归一化后的输出；A_min为所有样本中a的最小值；A_max为所有样本中a的最大值。

进一步地，所述步骤S2中判别器对输入样本进行分类预测的方法如下：

对于N分类问题，判别器的输出层激活函数由sigmoid函数变为softmax函数，其输出为N+1维相量，其中第N+1维表示输入数据为假数据，判别器D对预测样本x的输出D(x)如式(6)所示；

D(x)＝[r₁ r₂ ... r_N r_N+1] (6)；

令判别器D预测样本x为第s类的概率为D_s(x)，如式(7)所示：

D_s(x)＝r_s,s＝1,2,...,N,N+1 (7)；

式中，r_s表示预测样本x为第s类的概率，s表示故障线路的标号；

所述步骤S2中所述判别器与所述生成器不断地博弈训练的方法如下：

博弈训练目标如式(8)-(10)所示：

L＝L_supervised+L_unsupervised (10)；

式中，L_supervised表示有监督项；L_unsupervised表示无监督项；L表示模型的博弈目标函数；x,y～p_data(x,y)和x～p_data(x,y)分别表示满足原始输入数据分布的有标签样本和无标签样本；x～G表示符合生成器概率分布的样本；p_model表示模型输出的概率；x表示预测样本；y表示x对应的标签；

表示当x满足原始数据时的期望；

表示当x满足生成器概率分布时的期望；

有监督项在训练过程中不断最小化，使模型能够对真实数据的类别进行判断；无监督项迫使判别器不断地学习如何区别真实数据与假数据，在训练过程中，无监督项为判别器引入噪声；

若令判别器输出的正类概率为式(11)，则无监督项为式(13)，式(12)为判别器的监督项损失，式(13)为通常的生成对抗网络判别器的损失函数：

式中，D_real(x)表示判别器输入为x时的输出；

表示当z满足给定噪声分布时的期望，z表示输入噪声；D_real(G(z))表示当判别器输入为假数据时的输出；y_s为x的实际标签，当x属于第s类时，y_s＝1，否则y_s＝0；

判别器的训练目标由以下三项构成：

(a)在有标签样本中，评估模型输出与样本的标签之间是否一致，其数学表达式如式(14)所示：

(b)在无标签样本中，评估模型输出是否为正例，即模型输出不能为第N+1类，其数学表达式如式(15)所示：

式中，L_unlabeled表示无标签项损失；

(c)在假数据集中，评估模型输入是否为反例，即模型输出应为第N+1类，其数学表达式如式(16)所示：

式中，L_fake表示假数据项损失；

表示当x满足生成器概率分布时的期望；

所述步骤S2中判别器对输入样本进行分类预测的方法如下：

判别器的输入样本格式为式(3)：

X＝[x₁ x₂ ... x_T] (3)；

式中，X表示1个样本，x_i表示在i时刻n条线路的电气数据，i＝1,2，…，T；T表示样本中包含的断面数量；n表示线路的数量；

判别器的输出为一个N+1维的向量，将式(14)-(16)三项合并，获得判别器的训练目标L_D，如式(17)所示：

L_D＝L_labeled+ω(L_unlabeled+L_fake) (17)；

式中，L_labeled表示有标签损失项；L_fake表示假数据项损失项；ω表示权重因子；

生成器的训练目标为式(18)所示：

L_G＝-L_fake (18)；

式中L_G表示生成器的训练目标函数。

进一步地，所述步骤S3中特征匹配的方法如下：

特征匹配将生成样本与真实样本分别输入到判别器中，以判别器中间层对两类样本的输出误差为损失值L_G，其的数学表达式如式(19)所示：

式中，f_σ(·)表示判别器的第σ层隐藏层的输出，为常用数学表达；z～p_noise表示满足随机噪声概率分布的序列，

表示当x满足原始数据时的期望；

表示当z满足随机噪声概率分布时的期望；G(z)表示生成器输入为z时的输出，在实际的训练中，以式(19)替代式(18)作为生成器的损失函数，用于提升模型训练的稳定性；

所述步骤S3中历史均值的方法如下：

参数历史均值在模型损失函数中的添加项ΔL如式(20)所示：

式中，θ表示模型当前的参数；θ(m)为模型参数在时刻m的值；M为需要考虑的时刻数量；

所述步骤S3中单侧标签平滑的方法如下：

将正类样本的硬标签设置为软标签α，反例样本的硬标签设置为软标签β，其中软标签α是在(0,1)中的一个接近0的较小值，软标签β是一个在(0,1)中的一个接近1的较大值；在单侧标签平滑技术将正例设置为0.9，反例设置为0，用于减小对抗样本对深度神经网络模型训练的影响，以提高训练的稳定性，得出改进后的半监督生成对抗网络的生成器的损失函数

和判别器的损失函数

分别如式(21)和式(22)所示：

相比于现有技术，本发明的优势在于：

本发明所提供的一种基于半监督生成对抗网络的故障选线方法，利用半监督生成对抗网络提取无标签样本中的故障信息，相比于其他数据驱动故障选线方法，本申请所提出的方法能够通过博弈训练从少量用标签样本和无标签样本中学习到鲁棒性更强的故障特征，从而提高故障选线模型的精度以及运行的稳定性。本发明提出的方法只需要少量无标签数据和有标签数据即可进行训练，具有应用门槛低、精度高等优点，具有大规模推广使用的前景。

结构上提出了使用半监督生成对抗网络对有标签和无标签样本中的故障特征进行提取，同时引入了对抗训练增强模型的鲁棒性，从而提升了故障选线的抗干扰能力。

附图说明

图1是本发明一种基于半监督生成对抗网络的故障选线模型实施流程图。

图2是本发明中半监督生成对抗网络的结构。

图3是本发明中判别器的神经网络结构。

图4是本发明中生成器的神经网络结构。

图5是本发明中基于半监督生成对抗网络的故障选线模型架构。

图6是本发明中可标注标签的故障。

图7是本发明中无法标注标签的故障。

具体实施方式

以下结合实施例及其附图对本发明技术方案作进一步非限制性的详细说明。

从调度历史数据中提取出的故障片段是无标签的。需要复盘完整的历史故障片段并根据“拉路法”的原理，给每个故障标记标签。如图6所示，line911断开后故障消失，可判定故障发生在line911上，line912和line913分别表示某小电流接地系统的线路；Va、Vb、Vc分别表示母线的三相电压。而如图7所示的故障片段，故障发生约20秒后自行消失，调度人员未进行任何操作。无法判断故障线路所在。

图7所示的故障情况在实际运行中并大量存在，这样的数据由于外部因素无法标注标签，因此不能用于监督学习的模型训练中。但这些数据事实上产生于单相接地故障稳定建立后，因此包含丰富的故障信息。而单相接地故障数据本身就十分难以获取，若直接丢弃这些无标签数据，会照成极大的浪费。因此，考虑如何利用这些无标签数据提升数据驱动选线模型的性能，是十分具有实践意义的思路。

在传统选线算法效果不佳而数据驱动选线模型需要大量有标签数据的情况下，本发明提出了基于半监督生成对抗网络(Semi-Supervised Generative AdversarialNetwork,半监督生成对抗网络)的小电流接地系统故障选线方法，本方法能够仅使用少量有标签数据以及无标签数据进行训练，提取单相接地故障特征，用于检测故障线路。

如图1所示，一种基于半监督生成对抗网络的故障选线方法，包括如下步骤：

S1.样本的采集以及数据预处理：

S2.基于半监督深层对抗网络的故障选线模型构建：

半监督生成对抗网络的结构如图2所示，半监督生成对抗网络包括生成器和判别器；生成器的神经网络结构如图4所示，生成器用于根据输入的随机噪声生成假数据；判别器的神经网络结构如图3所示，判别器用于区分输入数据的真假以及输入数据的类别；

S3.半监督生成对抗网络模型的训练：

S4.基于半监督生成对抗网络的故障选线模型的在线运行：

基于半监督生成对抗网络的故障选线模型架构如图5所示，基于半监督生成对抗网络的故障选线模型架构包括离线训练和在线运行；在离线训练中，半监督生成对抗网络通过博弈训练达到平衡点，此时丢弃生成器，仅将判别器的参数迁移到基于半监督生成对抗网络的故障选线模型；在线运行中，将变电站实时采样的数据传输到调度系统，经过预处理后输入基于半监督生成对抗网络的故障选线模型，基于半监督生成对抗网络的故障选线模型对输入数据进行分类，从而判别出故障线路作为分类结果；

步骤S1中从中提取出故障选线相关的电气参数并生成样本的方法如下：

样本的格式如式(1)-(4)：

l_ij＝[I_0ij I_aij I_bij I_cij P_ij Q_ij cosθ_ij]^T (1)；

x_i＝[l_i1 l_i2 ... l_in]^T (2)；

X＝[x₁ x₂ ... x_T] (3)；

步骤S2中判别器对输入样本进行分类预测的方法如下：

D(x)＝[r₁ r₂ ... r_N r_N+1] (6)；

令判别器D预测样本x为第s类的概率为D_s(x)，如式(7)所示：

D_s(x)＝r_s,s＝1,2,...,N,N+1 (7)；

博弈训练目标如式(8)-(10)所示：

L＝L_supervised+L_unsupervised (10)；

表示当x满足原始数据时的期望；

表示当x满足生成器概率分布时的期望；

式中，D_real(x)表示判别器输入为x时的输出；

判别器的训练目标由以下三项构成：

式中，L_unlabeled表示无标签项损失；

式中，L_fake表示假数据项损失；

表示当x满足生成器概率分布时的期望；

所述步骤S2中判别器对输入样本进行分类预测的方法如下：

判别器的输入样本格式为式(3)：

X＝[x₁ x₂ ... x_T] (3)；

判别器的输出为一个N+1维的向量，判别器训练的最终目的是排除假数据的干扰，尽可能将真实数据正确地进行分类，即选择出该样本代表的故障线路；将式(14)-(16)三项合并，获得判别器的训练目标L_D，如式(17)所示：

L_D＝L_labeled+ω(L_unlabeled+L_fake) (17)；

生成器的训练目标为式(18)所示：

L_G＝-L_fake (18)；

式中L_G表示生成器的训练目标函数。

步骤S3中特征匹配的方法如下：

表示当x满足原始数据时的期望；

所述步骤S3中历史均值的方法如下：

参数历史均值在模型损失函数中的添加项ΔL如式(20)所示：

所述步骤S3中单侧标签平滑的方法如下：

和判别器的损失函数

分别如式(21)和式(22)所示：

本方法具有如下优点：

1.本发明的模型通过生成器对判别器引入了适当的干扰，因此能够在小样本的情况下减少判别器的过拟合现象，从而实现在少量有标签样本的前提下提升分类器的准确率。

2.半监督生成对抗网络的判别器结构与传统GAN有较大不同，对于N分类问题，判别器的输出层激活函数由sigmoid函数变为softmax函数。

3.有监督项在训练过程中不断最小化，使模型能够对真实数据的类别进行判断。无监督项则迫使判别器不断地学习如何区别真实数据与假数据。在训练过程中，无监督项为判别器引入噪声，能够缓解由于有标签样本过少而造成的判别器过拟合现象。

4.与生成对抗网络一样，半监督生成对抗网络同样存在模型训练不稳定的问题。在优化的角度看，半监督生成对抗网络理论上需要生成器与判别器的性能达到平衡，即该平衡点为纳什均衡点。该平衡点并不是极值点，而是一个鞍点。目前基于梯度的模型参数更新算法主要是在高维求解空间中寻找极小值点，模型的求解需求与训练算法方向并不完全一致，导致了半监督生成对抗网络训练不稳定的问题。

5.故障选线问题实际上为多分类问题，需要高性能的判别器进行工作，本发明使用特征匹配、历史均值、单侧标签平滑的方法，用于改善半监督生成对抗网络的性能与训练稳定性，对判别器效果提升较明显。

6.半监督生成对抗网络存在着训练不稳定的问题，其原因之一是直接最大化判别器的输出，可能会使生成器对判别器的过度学习，从而导致训练迭代偏离平衡点。为了防止以上情况发生，本发明采用特征匹配来替代传统的生成器的损失函数，使模型的训练稳定性提升。

7.历史均值是在生成器和判别器的损失函数中添加一项对模型参数的约束。该技术主要用于应对训练过程中模型对历史参数灾难性遗忘的问题。在进行参数更新时，考虑过去的样本提供的信息能够避免模型参数大范围地波动，从而缓解半监督生成对抗网络训练中可能存在的模式崩溃问题。

特别地，本方法在选线模型的在线学习时能够发挥较大的作用。小电流接地系统发生变化时，较小的扰动可能导致模型平衡点明显偏移，使用参数历史均值能够约束模型参数的大范围波动，从而使模型在原有平衡点的附近寻找新的平衡点。

8.当数据在传输过程中发生细微扰动时，可能使模型对某个故障样本的标签预测发生错误，这些样本称为对抗样本。深度神经网络对对抗样本的敏感性极高，数量稀少的对抗样本可能就会使得模型训练效果大幅度下。因此，本发明使用单侧标签平滑技术对样本集标签进行处理，以减少对抗样本对模型的影响，降低半监督生成对抗网络训练的脆弱性。

9.与生成对抗网络一样，半监督生成对抗网络的训练需解决一个极小极大问题，该问题求解难度极高，实践应用中难以获得严格的解。因此使用训练框架对半监督生成对抗网络进行训练。

10.本发明的半监督生成对抗网络由生成器和判别器两个部分组成，它所用的数据集包括带标签数据、无标签数据与生成器生成的假数据，其中有标签数据与无标签数据均来自于真实的故障采样数据。对于生成器而言，它通过接收随机噪声序列，然后输出尽量与真实数据相似的假数据，从而达到迷惑判别器的作用。对于判别器而言，它需要尽可能地在生成器的干扰下，学习故障的深层特征，提高分类精度。生成器和判别器在不断地博弈中达到平衡，从而在仅使用少量有标签样本的情况下获得超过传统算法的精度。

基于半监督生成对抗网络的故障选线模型架构分为离线训练和在线运行，在离线训练中，半监督生成对抗网络通过博弈训练达到平衡点。此时丢弃生成器，仅将判别器的参数迁移到故障选线模型。在线运行中，现场采样数据传输到调度系统，经过预处理后输入故障选线模型，故障选线模型对输入数据进行分类，从而判别出故障线路。此外，分类的结果以及实时采样的数据集被存储到样本集中，以此实现模型参数的不断更新。该流程能够在一定程度上避免由于系统结构、运行方式的变化等因素而导致的选线精度劣化，确保模型长时间内保持较高精度运行。

为了证明本发明所提方法在小样本情况下的性能，此处选取了某小电流接地系统的历史数据对不同方法进行了5次测试，并计算出其平均测试精度，具体如下：

M0：本发明所提方法；

M1：有监督学习架构下的深度神经网络模型；

M2：半监督学习结构下的深度神经网络模型。

有标签样本数量

50

100

200

300

400

500

700

1000

1500

2000

M0

38％

52％

73％

81％

85％

84％

88％

89％

91％

M1

35％

36％

35％

38％

41％

59％

60％

66％

81％

87％

M2

26％

29％

38％

44％

53％

61％

65％

61％

69％

73％

结果表明，本发明的方法在有标签样本数量较少时，能够获得远优于其他数据驱动模型的性能；在有标签样本数量较多时，也能获得有监督学习算法相当的性能。上述结果表明，本发明所提方法具有巨大的应用潜力。

以上所揭露的仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或变型，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于半监督生成对抗网络的故障选线方法，其特征在于，包括如下步骤：

S1.样本的采集以及数据预处理：

S2.基于半监督深层对抗网络的故障选线模型构建：

S3.半监督生成对抗网络模型的训练：

S4.基于半监督生成对抗网络的故障选线模型的在线运行：

2.根据权利要求1所述的故障选线方法，其特征在于，所述步骤S1中从中提取出故障选线相关的电气参数并生成样本的方法如下：

所述样本的格式如式(1)-(4)：

l_ij＝[I_0ij I_aij I_bij I_cij P_ij Q_ij cosθ_ij]^T (1)；

x_i＝[l_i1 l_i2...l_in]^T (2)；

X＝[x₁ x₂...x_T] (3)；

式中，l_ij表示线路j在第i时刻的电气数据；I_0ij、I_aij、I_bij、I_cij分别表示线路j在i时刻的零序电路、A相电流、B相电流、C相电流；P_ij,Q_ij和cosθ_ij分别表示线路j在第i时刻的有功功率、无功功率和功率因数；x_i表示在i时刻n条线路的电气数据，i＝1,2，…，T；T表示样本中包括断面的数量；n表示线路的数量；X表示预测样本，Y表示一个n维矢量，若X为有标签样本，则Y表示X所对应的标签；y_j表示Y的第j个元素，y_k表示Y的第k个元素，当某个样本的故障发生在线路k时,则Y的第k个元素为1；其余元素为0；