CN116484184A - 一种电力设备局部放电缺陷样本增强方法及装置 - Google Patents

一种电力设备局部放电缺陷样本增强方法及装置 Download PDF

Info

Publication number
CN116484184A
CN116484184A CN202310619573.1A CN202310619573A CN116484184A CN 116484184 A CN116484184 A CN 116484184A CN 202310619573 A CN202310619573 A CN 202310619573A CN 116484184 A CN116484184 A CN 116484184A
Authority
CN
China
Prior art keywords
data
sample
training
model
enhancement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310619573.1A
Other languages
English (en)
Inventor
陈义龙
孔令明
王勇
吉旺威
陈俊
许中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority to CN202310619573.1A priority Critical patent/CN116484184A/zh
Publication of CN116484184A publication Critical patent/CN116484184A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/12Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本申请提供的一种电力设备局部放电缺陷样本增强方法及装置,在对局部放电缺陷样本增强时,可以采集局部放电数据并对该数据进行归一化处理,得到待增强数据,接着可以确定数据样本增强模型,由于该数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对初始训练模型训练得到的,因此,将待增强数据输入至数据样本增强模型后,模型可以输出包含待增强数据的样本增强数据,其中,目标损失函数包括推土机距离和梯度惩罚函数,本申请的目标损失函数中推土机距离可以避免模型由于梯度爆炸和模式崩溃导致的训练不稳定,梯度惩罚函数可以使模型输出的梯度大小保持在一个合理的范围内,从而提高模型输出的样本增强数据的质量。

Description

一种电力设备局部放电缺陷样本增强方法及装置
技术领域
本申请涉及电子电力技术领域,尤其涉及一种电力设备局部放电缺陷样本增强方法及装置。
背景技术
在现代电力系统中,局部放电检测是诊断电力设备故障的有效方法,其可以通过数据驱动技术对数据内在的特征进行挖掘分析,并利用机器学习等方法进行故障诊断,由于数据驱动技术依赖于数据的数量与质量,而电力设备出现绝缘故障属于小样本事件,不同绝缘缺陷类别的样本数据集会出现不平衡情况,使得模型在网络训练学习时容易出现过拟合现象,制约了识别效果的准确度。
针对类别不平衡的数据学习问题,现有的主流解决方法是通过对数据集进行样本增强,以平衡数据集不同类别的分布,然而,传统的数据增强方法通过随机复制等方法反复复制少数类样本,模型在网络训练学习时性能较低,过拟合风险增大,因而复制得到的增强数据与原始的真实数据具有相似性,导致放电缺陷数据故障识别的准确度较低。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中通过传统的数据增强方法复制得到的增强数据与原始的真实数据具有相似性,导致放电缺陷数据故障识别的准确度较低的技术缺陷。
本申请提供了一种电力设备局部放电缺陷样本增强方法,所述方法包括:
采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对所述局部放电数据进行归一化处理,得到待增强数据;
确定数据样本增强模型,所述数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对所述初始训练模型进行训练得到的,所述目标损失函数是由判别器损失函数和生成器损失函数结合得到的;所述判别器损失函数包括推土机距离和梯度惩罚函数;
将所述待增强数据输入至所述数据样本增强模型中,得到所述数据样本增强模型输出的包含所述待增强数据的样本增强数据。
可选地,所述确定数据样本增强模型,包括:
将预先获取的真实样本数据划分为训练样本集和测试样本集;
构建初始训练模型,所述初始训练模型包括判别器和生成器;
将所述训练样本集中的训练样本依次输入至所述生成器中,得到所述生成器输出的预测样本增强数据;
将所述生成器输出的预测样本增强数据和所述训练样本输入到所述判别器中,得到所述判别器输出的所述预测样本增强数据和所述训练样本的判别结果;
以所述预测样本增强数据与所述训练样本之间的相似度不小于预设相似度阈值,所述预测样本增强数据和所述训练样本的判别结果的准确度不小于预设准确度阈值为目标,并利用目标损失函数对所述初始训练模型进行训练,得到目标训练模型;
利用所述测试样本集对所述目标训练模型进行迭代训练,直至所述目标训练模型满足预设训练结束条件,得到数据样本增强模型。
可选地,所述利用目标损失函数对所述初始训练模型进行训练,包括:
确定目标损失函数,所述目标损失函数是由判别器损失函数和生成器损失函数结合得到的;
利用所述判别器损失函数计算所述判别器输出的预测样本增强数据的判别结果与真实结果之间的准确度损失值;
基于所述准确度损失值更新所述判别器中的参数,以对所述判别器进行训练;
利用所述生成器损失函数根据更新参数后的判别器输出的判别结果,计算所述生成器输出的预测样本增强数据与所述训练样本之间的相似度损失值;
基于所述相似度损失值更新所述生成器中的参数,以对所述生成器进行训练。
可选地,所述判别器损失函数包括推土机距离和梯度惩罚函数;
所述利用所述判别器损失函数计算所述判别器输出的预测样本增强数据的判别结果与真实结果的准确度损失值,包括:
采用所述梯度惩罚函数对所述判别器的输出数据的梯度进行约束,并利用所述推土机距离计算所述判别器输出的预测样本增强数据的判别结果与真实结果的准确度损失值。
可选地,所述采用所述测试样本集对所述目标训练模型进行迭代训练,直至所述目标训练模型满足预设训练结束条件,得到数据样本增强模型,包括:
将预设的高斯噪声和所述测试样本集中的测试样本依次输入至所述目标训练模型,以使所述目标训练模型对所述测试样本进行样本增强并添加所述高斯噪音,得到所述目标训练模型输出的预测样本增强数据;
根据所述预测样本增强数据对所述目标训练模型进行评估,并根据评估结果判断所述目标训练模型是否满足预设训练结束条件;
若不满足,则返回所述利用目标损失函数对所述初始训练模型进行训练的步骤;
若满足,则将所述目标训练模型作为所述数据样本增强模型。
可选地,所述目标损失函数的计算公式,包括:
其中,为生成器损失函数,/>为判别器损失函数的推土机距离,/>为梯度惩罚函数,D(x)为判别器输出的判别结果,Pγ为训练样本数据分布,Pg为生成器生成的预测样本增强数据分布,/>分别表示从预测样本增强数据和训练样本数据分布中采样,λ为梯度惩罚函数的系数,/>为从训练样本数据和预测样本增强数据的随机线性插值中采样得到的数据,/>为随机插值后得到的数据分布,/>为计算得到的判别器对于预测样本增强x与训练样本y之间距离的期望值。
可选地,所述线性归一化函数的计算公式如下:
式中,x为局部放电数据中任一数据,x1为局部放电数据中最大的数据x2为局部放电数据中最大的数据,x为归一化处理后的待增强数据。
本申请还提供了一种电力设备局部放电缺陷样本增强装置,包括:
待增强数据获取模块,用于采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对所述局部放电数据进行归一化处理,得到待增强数据;
模型确定模块,用于确定数据样本增强模型,所述数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对所述初始训练模型进行训练得到的,所述目标损失函数是由判别器损失函数和生成器损失函数结合得到的;所述判别器损失函数包括推土机距离和梯度惩罚函数;
增强数据生成模块,用于将所述待增强数据输入至所述数据样本增强模型中,得到所述数据样本增强模型输出的包含所述待增强数据的样本增强数据。
本申请还提供一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述电力设备局部放电缺陷样本增强方法的步骤。
本申请还提供了一种计算机设备,包括:一个或多个处理器,以及存储器;
所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如上述实施例中任一项所述电力设备局部放电缺陷样本增强方法的步骤。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请提供的一种电力设备局部放电缺陷样本增强方法及装置,在对电力设备局部放电缺陷样本增强时,可以采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对局部放电数据进行归一化处理,得到待增强数据,接着可以确定数据样本增强模型,由于该数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对初始训练模型进行训练得到的,因此,将待增强数据输入至数据样本增强模型中后,可以得到数据样本增强模型输出的包含待增强数据的样本增强数据,其中,初始训练模型的目标损失函数由判别器损失函数和生成器损失函数结合得到的,并且,判别器损失函数包括推土机距离和梯度惩罚函数,本申请的目标损失函数采用推土机距离和梯度惩罚函数,推土机距离可以避免模型训练过程中由于梯度爆炸和模式崩溃导致的训练不稳定问题,同时梯度惩罚函数可以强制判别器输出的梯度大小保持在一个合理的范围内,从而提高模型的稳定性和训练效果,进而提高模型输出的样本增强数据的质量,以提高放电缺陷数据故障识别的准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种电力设备局部放电缺陷样本增强方法的流程示意图;
图2为本申请实施例提供的一种数据样本增强模型训练方法的流程示意图;
图3为本申请实施例提供的一种判别器以及生成器训练方法的流程示意图;
图4为本申请实施例提供的一种电力设备局部放电缺陷样本增强装置的结构示意图;
图5为本申请实施例提供的一种计算机设备的内部结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
针对类别不平衡的数据学习问题,现有的主流解决方法是通过对数据集进行样本增强,以平衡数据集不同类别的分布,然而,传统的数据增强方法通过随机复制等方法反复复制少数类样本,模型在网络训练学习时性能较低,过拟合风险增大,因而复制得到的增强数据与原始的真实数据具有相似性,导致放电缺陷数据故障识别的准确度较低。
基于此,本申请提出如下技术方案,具体参见下文:
在一个实施例中,如图1所示,图1为本申请实施例提供的一种电力设备局部放电缺陷样本增强方法的流程示意图;本申请提供了一种电力设备局部放电缺陷样本增强方法,所述方法可以包括:
S110:采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对局部放电数据进行归一化处理,得到待增强数据。
本步骤中,在对电力设备的局部放电数据进行样本增强时,可以先采集电力设备在绝缘故障时检测到的局部放电数据,接着可以采用线性归一化函数对局部放电数据进行归一化处理,将局部放电数据归一化到固定的范围内,得到待增强数据,使得各个不同的数据点之间具有可比性,以便将数据进行比较和分析。
其中,本申请的局部放电数据为电力设备中由于缺陷等原因导致的局部放电现象所产生的电信号数据,其通常由于绝缘材料的损伤、局部过电压等原因引起,并且在电力设备发生局部放电现象时,会产生瞬时的电信号,此时可以利用传感器或探头进行采集,本申请中对电力设备采集得到的局部放电数据以图像的形式呈现。
可以理解的是,不同类型的电力设备存在的缺陷类型不同,产生的局部放电数据的特征也各不相同,因此可以通过对局部放电数据进行分析来实现对电力设备中不同缺陷类型的诊断和预防维护,在本申请中,用于样本增强的局部放电数据的缺陷类型可以是悬浮电位缺陷、绝缘类放电缺陷、尖端电晕缺陷和微粒放电缺陷等缺陷类型,在此不做限制。
进一步地,在获取到局部放电数据后,本申请还可以对局部放电数据进行归一化处理,从而得到待增强数据,在这里归一化处理指的是将数据向量每个维度的数据映射到(0,1)或(-1,1)之间的区间,或者将数据向量的某个范数映射为1。可以理解的是,本申请中的局部放电数据的像素值为0~255范围内的整数,虽然可以直接将原数据的像素数据直接作为初始训练模型的训练数据,但可能给模型的训练过程带来一些问题,例如导致模型训练速度变慢、迭代次数过多导致收敛变慢等。因此,本申请可以通过归一化处理的方式来提升模型训练效率。
更进一步地,本申请还可以对待增强数据进行其他预处理操作,该预处理操作包括但不限于锐化处理、去噪处理等。其中,锐化处理是指补偿局部放电数据的缺陷图像的轮廓,增强缺陷图像的边缘及灰度跳变的部分,使缺陷图像变得清晰,其可分为空间域处理和频域处理两类。通过突出缺陷图像上地物的边缘、轮廓,或某些线性目标要素的特征,以提高地物边缘与周围像元之间的反差。去噪处理是指减少数据中噪声的过程,一般的,在待增强数据进行数字化和传输过程中常受到成像设备与外部环境噪声干扰等影响,即接收到的待增强数据中一般存在噪声,而这些噪声将成为待增强数据干扰的重要原因,通过对待增强数据进行去噪处理,以使待增强数据中的噪声去除,进一步提高待增强数据的真实性和准确性。
S120:确定数据样本增强模型。
本步骤中,通过S110获取待增强数据后,接着本申请可以确定数据样本增强模型,并通过该数据样本增强模型来对待增强数据进行样本增强,以得到相应的样本增强结果。
其中,本申请的数据样本增强模型指的是对输入的待增强数据进行样本增强并得到包含该待增强数据的样本增强数据的模型,该数据样本增强模型在进行模型训练时,可以将不同缺陷类型的真实样本数据作为训练样本,并将训练样本输入至预设的初始训练模型中进行前向传播以训练该模型,并在模型的反向传播过程中使用预设的目标损失函数对模型进行参数调优,当模型满足一定的训练条件或者参数的收敛条件时,如迭代次数达到设定值,视为训练完成,此时可以将训练完成的模型作为最终的数据样本增强模型。
可以理解的是,本申请中真实样本数据的样本数量较少,各种缺陷类型的样本数据极度不平均,导致在利用样本数据学习对电力设备的缺陷类型识别时的准确度不高,因此需要对各种缺陷类型的真实样本数据进行样本增强来平衡各种缺陷类型的样本数据分布,在此可以利用各种缺陷类型的样本数据的原有比例来选择真实样本数据数量,换而言之,缺陷数量越少的样本数据作为真实样本数据的样本数据越多,缺陷数量越多的样本数据作为真实样本数据的样本数据越少,以此来平衡各种缺陷类型的样本数据分布。
进一步地,本申请在利用目标损失函数对初始训练模型进行训练时,可以将目标函数设计为由判别器损失函数和生成器损失函数结合得到的,其中,判别器损失函数包括推土机距离和梯度惩罚函数;在这里的推土机距离可以避免模型训练过程中由于梯度爆炸和模式崩溃导致的训练不稳定问题,同时梯度惩罚函数可以强制初始训练模型种的判别器输出的梯度大小保持在一个合理的范围内,本申请使用目标损失函数对初始训练模型进行参数调优,可以提高模型的稳定性和训练效果,进而提高模型输出的样本增强数据的质量,以提高放电缺陷数据故障识别的准确度。
此外,本申请还可以将训练完成的数据样本增强模型进行存储,以便后续在进行样本增强时,可以直接调用预先存储的数据样本增强模型来对待增强样本进行样本增强操作,并且,本申请中的数据样本增强模型可以通过构建WGAN-GP模型(Wasserstein GANwith gradient penalty)来进行训练,WGAN-GP模型是一种生成对抗网络模型,其中包括判别器和生成器,在WGAN-GP中,生成器和判别器的目标为最小化或最大化一个距离度量,这可以更好地量化生成器生成的图像与原始图像之间的差异,在本申请中的初始训练模型的核心为利用推土机距离作为损失函数,通过梯度惩罚项来控制判别器的梯度范数,从而实现更加稳定和高质量的缺陷图像生成。
S130:将待增强数据输入至数据样本增强模型中,得到数据样本增强模型输出的包含待增强数据的样本增强数据。
本步骤中,通过S120确定数据样本增强模型后,本申请可以将待增强数据输入至样本增强模型中,并通过样本增强模型中来对待增强数据进行样本增强,由于该样本增强模型是以真实样本数据为训练样本,并利用目标损失函数来对预设的初始训练模型进行训练后得到的,因此,将待增强样本输入到样本增强模型中,便可以得到样本增强模型输出的样本增强数据。
可以理解的是,在利用样本增强模型对待增强数据进行样本增强时,可以相应选择样本数量的增强比例,而增强比例可以根据样本的不平衡率来调节,例如对于数量较少的缺陷样本数据,可以调高增强比例,反之,对于数量较多的缺陷样本数据,可以调低增强比例,在这里的增强比例可以是1:5、1:10或1:20等,在此不做限制。
上述实施例中,在对电力设备局部放电缺陷样本增强时,可以采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对局部放电数据进行归一化处理,得到待增强数据,接着可以确定数据样本增强模型,由于该数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对初始训练模型进行训练得到的,因此,将待增强数据输入至数据样本增强模型中后,可以得到数据样本增强模型输出的包含待增强数据的样本增强数据,其中,初始训练模型的目标损失函数由判别器损失函数和生成器损失函数结合得到的,并且,判别器损失函数包括推土机距离和梯度惩罚函数,本申请的目标损失函数采用推土机距离和梯度惩罚函数,推土机距离可以避免模型训练过程中由于梯度爆炸和模式崩溃导致的训练不稳定问题,同时梯度惩罚函数可以强制判别器输出的梯度大小保持在一个合理的范围内,从而提高模型的稳定性和训练效果,进而提高模型输出的样本增强数据的质量,以提高放电缺陷数据故障识别的准确度。
在一个实施例中,如图2所示,图2为本申请实施例提供的一种数据样本增强模型训练方法的流程示意图;图2中,S120确定样本增强模型,可以包括:
S121:将预先获取的真实样本数据划分为训练样本集和测试样本集。
S122:构建初始训练模型,该初始训练模型包括判别器和生成器。
S123:将训练样本集中的训练样本依次输入至生成器中,得到生成器输出的预测样本增强数据。
S124:将生成器输出的预测样本增强数据和训练样本输入到判别器中,得到判别器输出的预测样本增强数据和训练样本的判别结果。
S125:以预测样本增强数据与训练样本之间的相似度不小于预设相似度阈值,预测样本增强数据和训练样本的判别结果的准确度不小于预设准确度阈值为目标,并利用目标损失函数对初始训练模型进行训练,得到目标训练模型。
S126:利用测试样本集对目标训练模型进行迭代训练,直至目标训练模型满足预设训练结束条件,得到数据样本增强模型。
本实施例中,在确定样本增强模型时,可以通过对预设的初始训练模型进行改进和训练,在训练的过程中,可以先获取的真实样本数据,并划分为训练样本集和测试样本集,以对初始训练模型进行分阶段训练,接着可以基于WGAN-GP构建初始训练模型,该模型包括判别器和生成器,这样将训练样本集中的训练样本依次输入至生成器中,可以得到生成器输出的预测样本增强数据,以及将生成器输出的预测样本增强数据和训练样本输入到判别器中,可以得到判别器输出的预测样本增强数据和训练样本的判别结果,接着,本申请可以以预测样本增强数据与训练样本之间的相似度不小于预设相似度阈值,预测样本增强数据和训练样本的判别结果的准确度不小于预设准确度阈值为目标,并利用目标损失函数对初始训练模型进行训练,以此得到目标训练模型,最后,本申请还可以利用测试样本集对目标训练模型进行迭代训练,直至目标训练模型满足预设训练结束条件,得到数据样本增强模型。
可以理解的是,基于WGAN-GP构建得到的初始训练模型包括了判别器和生成器,训练初始训练模型即分别对判别器和生成器进行训练,直至判别器和生成器满足预设训练结束条件,其中,生成器的输入为真实样本数据,输出为与真实样本数据相似的预测样本增强数据,而判别器的输入可以是真实样本数据,也可以是生成器生成的预测样本增强数据,输出为一个数据标量,该数据标量表示为输入数据与真实样本数据的相似度,在此可以根据相似度判断该输入数据为真实样本数据的概率。
进一步地,在对生成器和判别器进行训练时,可以采用交替训练的方法,即以先训练判别器,再训练生成器为一周期进行训练,具体来说,每一周期进行训练时,可以先固定生成器的参数,并利用判别器损失函数对判别器进行训练并调参优化,然后再固定判别器的参数,并利用生成器损失函数对生成器进行训练并调参优化,这样可以避免训练过程中两个模型的梯度互相干扰。
其中,生成器以预测样本增强数据与训练样本之间的相似度不小于预设相似度阈值为训练目标,而判别器以预测样本增强数据和训练样本的判别结果的准确度不小于预设准确度阈值为目标,当生成器和判别器达到训练目标后,即可得到目标训练模型,接着可以利用测试样本集中的测试样本对目标训练模型进行迭代训练,直至目标训练模型满足预设训练结束条件,得到数据样本增强模型。
在一个实施例中,如图3所示,图3为本申请实施例提供的一种判别器以及生成器训练方法的流程示意图;图3中,S120或S125中利用目标损失函数对初始训练模型进行训练,可以包括:
S1221:确定目标损失函数,该目标损失函数是由判别器损失函数和生成器损失函数结合得到的。
S1222:利用判别器损失函数计算判别器输出的预测样本增强数据的判别结果与真实结果之间的准确度损失值。
S1223:基于准确度损失值更新判别器中的参数,以对判别器进行训练。
S1224:利用生成器损失函数根据更新参数后的判别器输出的判别结果,计算生成器输出的预测样本增强数据与训练样本之间的相似度损失值。
S1225:基于相似度损失值更新生成器中的参数,以对生成器进行训练。
本实施例中,在对初始训练模型进行训练时,可以以每一周期训练过程中判别器输出的对预测样本增强数据的判别结果趋近于真实结果为目标训练判别器,以生成器输出的预测样本增强数据与训练样本之间的相似度趋近于预设相似度为目标训练生成器,从而实现对初始训练模型的训练,得到数据样本增强模型。
具体地,在对初始训练模型中的判别器进行训练时,可以先确定判别器的判别器损失函数,以及固定生成器的参数,接着可以将训练样本集中的训练样本输入至生成器中,并得到生成器输出的预测样本增强数据,在得到预测样本增强数据后,可以将训练样本和预测样本增强数据输入至判别器损失函数中进行计算,得到预测样本增强数据的判别结果与真实结果之间的准确度损失值和梯度惩罚项,从而可以根据该准确度损失值和梯度惩罚项反向传播更新判别器的参数。
此外,在对初始训练模型中的生成器进行训练时,可以先确定生成器的生成器损失函数,以及固定更新后的判别器的参数,接着可以将训练样本集中的训练样本输入至生成器中,并得到生成器输出的预测样本增强数据,在得到预测样本增强数据后,可以将训练样本和预测样本增强数据输入至判别器中,以便得到判别器输出的训练样本与预测样本增强数据之间的判别结果,接着可以将判别结果和训练样本输入生成器损失函数中进行计算,得到预测样本增强数据与训练样本之间的相似度损失值和梯度惩罚项,从而可以根据该相似度损失值和梯度惩罚项反向传播更新生成器的参数。
在一个实施例中,S1222中利用判别器损失函数计算判别器输出的预测样本增强数据的判别结果与真实结果之间的准确度损失值,可以包括:
S2221:采用梯度惩罚函数对判别器的输出数据的梯度进行约束,并利用推土机距离计算判别器输出的预测样本增强数据的判别结果与真实结果的准确度损失值。
本实施例中,判别器损失函数包括推土机距离和梯度惩罚函数,在利用判别器损失函数计算预测样本增强数据的判别结果与真实结果之间的准确度损失值时,可以先通过梯度惩罚函数对判别器的输出数据的梯度进行约束,接着可以利用推土机距离对梯度约束后的输出数据进行计算,从而得到预测样本增强数据的判别结果与真实结果的准确度损失值。
可以理解的是,梯度惩罚函数可以约束判别器的输出数据的梯度,使其不超过1,从而避免训练过程中模型梯度爆炸和梯度消失,进而提高模型在生成增强数据时的质量和稳定性,而推土机距离可以评估预测样本增强数据与训练样本之间的距离,传统的距离度量方法(如KL散度、JS散度)存在一些缺陷,如不连续、不对称、无法处理不重叠的分布等。推土机距离则可以克服这些缺陷,在模型中可以度量到更合适的距离指标,使得生成的预测样本增强数据的真实性上有进一步的提升。
在一个实施例中,S126中采用测试样本集对目标训练模型进行迭代训练,直至目标训练模型满足预设训练结束条件,得到数据样本增强模型,可以包括:
S1261:将预设的高斯噪声和测试样本集中的测试样本依次输入至目标训练模型,以使目标训练模型对测试样本进行样本增强并添加高斯噪音,得到目标训练模型输出的预测样本增强数据。
S1262:根据预测样本增强数据对目标训练模型进行评估,并根据评估结果判断目标训练模型是否满足预设训练结束条件。
S1263:若不满足,则返回利用目标损失函数对初始训练模型进行训练的步骤。
S1264:若满足,则将目标训练模型作为数据样本增强模型。
本实施例中,可以将测试样本集中的测试样本依次输入至目标训练模型中进行迭代训练,在迭代训练过程中还可以加入高斯噪声,以增强目标训练模型生成的预测样本增强数据的多样性,在得到目标训练模型生成输出的预测样本增强数据后,可以对预测样本增强数据进行评估,并根据评估结果判断目标训练模型是否满足预设训练结束条件,若不满足,则可以返回至利用目标损失函数对初始训练模型进行训练的步骤,对目标训练模型进行训练,直至目标训练模型是否满足预设训练结束条件,其中,训练结束条件可以是依据实际情况确定,在此不作具体限制,例如可以是判断通过缺陷识别模型对预测样本增强数据识别的缺陷正确率是否达到预设阈值。
可以理解的是,这里的高斯噪声是一种服从高斯分布的随机噪声,具有平均值为0,方差为1的特点,在数据样本增强模型中,高斯噪声可以用于样本数据增强,通过在真实样本数据中添加高斯噪声来增加预测样本增强数据的多样性和鲁棒性,本申请在设置高斯噪声时,可以通过设置不同的均值和标准差来控制噪声的强度和分布。
在一个实施例中,S120或S125中目标损失函数的计算公式,可以包括:
其中,为生成器损失函数,/>为判别器损失函数的推土机距离,/>为梯度惩罚函数。
D(x)为判别器输出的判别结果,Pγ为训练样本数据分布,Pg为生成器生成的预测样本增强数据分布,和/>分别表示从预测样本增强数据和训练样本数据分布中采样,λ为梯度惩罚函数的系数,/>为从训练样本数据和预测样本增强数据的随机线性插值中采样得到的数据,/>为随机插值后得到的数据分布,/>为计算得到的判别器对于预测样本增强x与训练样本y之间距离的期望值。
本实施例中,在确定本申请的目标损失函数时,可以先确定推土机距离和梯度惩罚函数从而得到判别器损失函数,接着确定生成器损失函数,通过将判别器损失函数和生成器损失函数结合,即可得到数据样本增强模型的目标损失函数。
可以理解的是,本申请的目标损失函数中对每个真实样本数据独立施加梯度惩罚,可以有效提高数据样本增强模型的增强效果,从而解决传统模型存在的梯度消失和模型崩溃问题,大幅提升训练的稳定性和收敛速度,因此可以提高模型在网络训练学习时的性能,减少过拟合风险,为电力设备后续缺陷诊断提供数据支持。
在一个实施例中,S110中线性归一化函数的计算公式,可以包括:
式中,x为局部放电数据中任一数据,x1为局部放电数据中最大的数据x2为局部放电数据中最大的数据,x为归一化处理后的待增强数据。
本实施例中,在采集到电力设备在绝缘故障时检测到的局部放电数据后,可以对局部放电数据进行归一化处理,具体可以将局部放电数据的缺陷图像的像素值压缩到特定范围内,该特定范围可以是[0,1]范围,这样不仅可以便于后续的模型预测,还可以保证程序运行时收敛加快。
进一步地,在对局部放电数据进行归一化处理时,还可以将局部放电数据的缺陷图像的像素值压缩到[-1,1]范围内,在此归一化的具体范围可以根据局部放电数据的分布情况、算法的需求以及实际应用场景等因素进行选择,本申请中不做限制,当归一化的具体范围为[-1,1]时,具体公式可以表示如下:
下面对本申请实施例提供的电力设备局部放电缺陷样本增强装置进行描述,下文描述的电力设备局部放电缺陷样本增强装置与上文描述的电力设备局部放电缺陷样本增强方法可相互对应参照。
在一个实施例中,如图4所示,图4为本申请实施例提供的一种电力设备局部放电缺陷样本增强装置的结构示意图,可以包括待增强数据获取模块210、模型确定模块220和增强数据生成模块230,具体包括如下:
待增强数据获取模块210,用于采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对所述局部放电数据进行归一化处理,得到待增强数据。
模型确定模块220,用于确定数据样本增强模型,所述数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对所述初始训练模型进行训练得到的,所述目标损失函数是由判别器损失函数和生成器损失函数结合得到的;所述判别器损失函数包括推土机距离和梯度惩罚函数。
增强数据生成模块230,用于将所述待增强数据输入至所述数据样本增强模型中,得到所述数据样本增强模型输出的包含所述待增强数据的样本增强数据。
上述实施例中,在对电力设备局部放电缺陷样本增强时,可以采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对局部放电数据进行归一化处理,得到待增强数据,接着可以确定数据样本增强模型,由于该数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对初始训练模型进行训练得到的,因此,将待增强数据输入至数据样本增强模型中后,可以得到数据样本增强模型输出的包含待增强数据的样本增强数据,其中,初始训练模型的目标损失函数由判别器损失函数和生成器损失函数结合得到的,并且,判别器损失函数包括推土机距离和梯度惩罚函数,本申请的目标损失函数采用推土机距离和梯度惩罚函数,推土机距离可以避免模型训练过程中由于梯度爆炸和模式崩溃导致的训练不稳定问题,同时梯度惩罚函数可以强制判别器输出的梯度大小保持在一个合理的范围内,从而提高模型的稳定性和训练效果,进而提高模型输出的样本增强数据的质量,以提高放电缺陷数据故障识别的准确度。
在一个实施例中,本申请还提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述电力设备局部放电缺陷样本增强方法的步骤。
在一个实施例中,本申请还提供了一种计算机设备,所述计算机设备中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述电力设备局部放电缺陷样本增强方法的步骤。
示意性地,如图5所示,图5为本申请实施例提供的一种计算机设备的内部结构示意图,该计算机设备300可以被提供为一服务器。参照图4,计算机设备300包括处理组件302,其进一步包括一个或多个处理器,以及由存储器301所代表的存储器资源,用于存储可由处理组件302的执行的指令,例如应用程序。存储器301中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件302被配置为执行指令,以执行上述任意实施例的电力设备局部放电缺陷样本增强方法。
计算机设备300还可以包括一个电源组件303被配置为执行计算机设备300的电源管理,一个有线或无线网络接口304被配置为将计算机设备300连接到网络,和一个输入输出(I/O)接口305。计算机设备300可以操作基于存储在存储器301的操作系统,例如WindowsServer TM、Mac OS XTM、Unix TM、Linux TM、Free BSDTM或类似。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种电力设备局部放电缺陷样本增强方法,其特征在于,所述方法包括:
采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对所述局部放电数据进行归一化处理,得到待增强数据;
确定数据样本增强模型,所述数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对所述初始训练模型进行训练得到的,所述目标损失函数是由判别器损失函数和生成器损失函数结合得到的;所述判别器损失函数包括推土机距离和梯度惩罚函数;
将所述待增强数据输入至所述数据样本增强模型中,得到所述数据样本增强模型输出的包含所述待增强数据的样本增强数据。
2.根据权利要求1所述的电力设备局部放电缺陷样本增强方法,其特征在于,所述确定数据样本增强模型,包括:
将预先获取的真实样本数据划分为训练样本集和测试样本集;
构建初始训练模型,所述初始训练模型包括判别器和生成器;
将所述训练样本集中的训练样本依次输入至所述生成器中,得到所述生成器输出的预测样本增强数据;
将所述生成器输出的预测样本增强数据和所述训练样本输入到所述判别器中,得到所述判别器输出的所述预测样本增强数据和所述训练样本的判别结果;
以所述预测样本增强数据与所述训练样本之间的相似度不小于预设相似度阈值,所述预测样本增强数据和所述训练样本的判别结果的准确度不小于预设准确度阈值为目标,并利用目标损失函数对所述初始训练模型进行训练,得到目标训练模型;
利用所述测试样本集对所述目标训练模型进行迭代训练,直至所述目标训练模型满足预设训练结束条件,得到数据样本增强模型。
3.根据权利要求2所述的电力设备局部放电缺陷样本增强方法,其特征在于,所述利用目标损失函数对所述初始训练模型进行训练,包括:
确定目标损失函数,所述目标损失函数是由判别器损失函数和生成器损失函数结合得到的;
利用所述判别器损失函数计算所述判别器输出的预测样本增强数据的判别结果与真实结果之间的准确度损失值;
基于所述准确度损失值更新所述判别器中的参数,以对所述判别器进行训练;
利用所述生成器损失函数根据更新参数后的判别器输出的判别结果,计算所述生成器输出的预测样本增强数据与所述训练样本之间的相似度损失值;
基于所述相似度损失值更新所述生成器中的参数,以对所述生成器进行训练。
4.根据权利要求3所述的电力设备局部放电缺陷样本增强方法,其特征在于,所述判别器损失函数包括推土机距离和梯度惩罚函数;
所述利用所述判别器损失函数计算所述判别器输出的预测样本增强数据的判别结果与真实结果的准确度损失值,包括:
采用所述梯度惩罚函数对所述判别器的输出数据的梯度进行约束,并利用所述推土机距离计算所述判别器输出的预测样本增强数据的判别结果与真实结果的准确度损失值。
5.根据权利要求2所述的电力设备局部放电缺陷样本增强方法,其特征在于,所述采用所述测试样本集对所述目标训练模型进行迭代训练,直至所述目标训练模型满足预设训练结束条件,得到数据样本增强模型,包括:
将预设的高斯噪声和所述测试样本集中的测试样本依次输入至所述目标训练模型,以使所述目标训练模型对所述测试样本进行样本增强并添加所述高斯噪音,得到所述目标训练模型输出的预测样本增强数据;
根据所述预测样本增强数据对所述目标训练模型进行评估,并根据评估结果判断所述目标训练模型是否满足预设训练结束条件;
若不满足,则返回所述利用目标损失函数对所述初始训练模型进行训练的步骤;
若满足,则将所述目标训练模型作为所述数据样本增强模型。
6.根据权利要求1所述的电力设备局部放电缺陷样本增强方法,其特征在于,所述目标损失函数的计算公式,包括:
其中,为生成器损失函数,/>为判别器损失函数的推土机距离,/>为梯度惩罚函数,D(x)为判别器输出的判别结果,Pγ为训练样本数据分布,Pg为生成器生成的预测样本增强数据分布,/>和/>分别表示从预测样本增强数据和训练样本数据分布中采样,λ为梯度惩罚函数的系数,/>为从训练样本数据和预测样本增强数据的随机线性插值中采样得到的数据,/>为随机插值后得到的数据分布,/>为计算得到的判别器对于预测样本增强x与训练样本y之间距离的期望值。
7.根据权利要求1所述的电力设备局部放电缺陷样本增强方法,其特征在于,所述线性归一化函数的计算公式如下:
式中,x为局部放电数据中任一数据,x1为局部放电数据中最大的数据x2为局部放电数据中最大的数据,x为归一化处理后的待增强数据。
8.一种电力设备局部放电缺陷样本增强装置,其特征在于,包括:
待增强数据获取模块,用于采集电力设备在绝缘故障时检测到的局部放电数据,并采用线性归一化函数对所述局部放电数据进行归一化处理,得到待增强数据;
模型确定模块,用于确定数据样本增强模型,所述数据样本增强模型为将真实样本数据输入预设的初始训练模型,并利用目标损失函数对所述初始训练模型进行训练得到的,所述目标损失函数是由判别器损失函数和生成器损失函数结合得到的;所述判别器损失函数包括推土机距离和梯度惩罚函数;
增强数据生成模块,用于将所述待增强数据输入至所述数据样本增强模型中,得到所述数据样本增强模型输出的包含所述待增强数据的样本增强数据。
9.一种存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项所述电力设备局部放电缺陷样本增强方法的步骤。
10.一种计算机设备,其特征在于,包括:一个或多个处理器,以及存储器;
所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如权利要求1至7中任一项所述电力设备局部放电缺陷样本增强方法的步骤。
CN202310619573.1A 2023-05-29 2023-05-29 一种电力设备局部放电缺陷样本增强方法及装置 Pending CN116484184A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310619573.1A CN116484184A (zh) 2023-05-29 2023-05-29 一种电力设备局部放电缺陷样本增强方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310619573.1A CN116484184A (zh) 2023-05-29 2023-05-29 一种电力设备局部放电缺陷样本增强方法及装置

Publications (1)

Publication Number Publication Date
CN116484184A true CN116484184A (zh) 2023-07-25

Family

ID=87215837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310619573.1A Pending CN116484184A (zh) 2023-05-29 2023-05-29 一种电力设备局部放电缺陷样本增强方法及装置

Country Status (1)

Country Link
CN (1) CN116484184A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116663619A (zh) * 2023-07-31 2023-08-29 山东科技大学 基于gan网络的数据增强方法、设备以及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116663619A (zh) * 2023-07-31 2023-08-29 山东科技大学 基于gan网络的数据增强方法、设备以及介质
CN116663619B (zh) * 2023-07-31 2023-10-13 山东科技大学 基于gan网络的数据增强方法、设备以及介质

Similar Documents

Publication Publication Date Title
CN111967535B (zh) 一种储粮管理场景温度传感器故障诊断方法及其诊断装置
CN113567603A (zh) 色谱谱图的检测分析方法及电子设备
CN108829878B (zh) 一种工业实验数据异常点检测方法及装置
CN116484184A (zh) 一种电力设备局部放电缺陷样本增强方法及装置
CN112098756B (zh) 电磁兼容问题定位方法、装置、设备及存储介质
CN116402825B (zh) 轴承故障红外诊断方法、系统、电子设备及存储介质
CN115222727A (zh) 一种输电线路防外破目标识别方法
CN114254673A (zh) 一种基于去噪对抗自编码器的频谱异常检测方法
US10585130B2 (en) Noise spectrum analysis for electronic device
CN111783616A (zh) 一种基于数据驱动自学习的无损检测方法
CN117030129A (zh) 纸杯在线检漏方法及其系统
CN117484031A (zh) 光伏组件焊接加工设备
CN110135085B (zh) 基于自适应核密度估计辅助粒子滤波的疲劳裂纹评估方法
CN116612306A (zh) 基于计算机视觉的法兰盘智能对位方法及系统
CN116523871A (zh) 一种加工件缺陷检测方法、装置、电子设备及存储介质
CN113127342B (zh) 基于电网信息系统特征选择的缺陷预测方法及装置
CN112329535B (zh) 基于cnn的电力系统低频振荡模态特征的快速辨识方法
CN114783538A (zh) 一种煤炭灰分预测方法及装置
CN110473183B (zh) 一种面向可见光全链路仿真图像的评价方法、装置、电子设备和介质
RU2090928C1 (ru) Способ анализа сигналов о состоянии объекта
CN112508946A (zh) 一种基于对抗神经网络的电缆隧道异常检测方法
JP7390210B2 (ja) スペクトル処理装置及び方法
CN116754467B (zh) 一种天然橡胶老化性能的测评方法
CN117909691B (zh) 一种海洋工程设计数据的获取系统及方法
CN116758575A (zh) 一种基于虚拟化的智能硬件扫描方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination