CN117874615A - 一种基于深度数字孪生的光伏故障诊断方法以及系统 - Google Patents

一种基于深度数字孪生的光伏故障诊断方法以及系统 Download PDF

Info

Publication number
CN117874615A
CN117874615A CN202410048523.7A CN202410048523A CN117874615A CN 117874615 A CN117874615 A CN 117874615A CN 202410048523 A CN202410048523 A CN 202410048523A CN 117874615 A CN117874615 A CN 117874615A
Authority
CN
China
Prior art keywords
data
feature
training
photovoltaic
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410048523.7A
Other languages
English (en)
Inventor
齐咏生
刘思哲
李东泽
刘利强
李永亭
马然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia University of Technology
Original Assignee
Inner Mongolia University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia University of Technology filed Critical Inner Mongolia University of Technology
Priority to CN202410048523.7A priority Critical patent/CN117874615A/zh
Publication of CN117874615A publication Critical patent/CN117874615A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种基于深度数字孪生的光伏故障诊断方法以及系统,所述深度数字孪生的光伏故障诊断方法包括如下步骤:构建机理仿真模型后采集不平衡故障数据经过IGR特征自动选择筛选操作后,输入到深度数据模型进行学习,得到多样化补全数据,进行SSAE特征压缩实现诊断。本发明的基于深度数字孪生的光伏故障诊断方法以及系统可有效解决人为选择特征的偏见性,提高光伏系统的诊断效果,且克服了光伏故障诊断中典型数据不足的问题。

Description

一种基于深度数字孪生的光伏故障诊断方法以及系统
技术领域
本发明涉及光伏系统故障诊断领域,具体而言,涉及一种基于深度数字孪生的光伏故障诊断方法以及系统。
背景技术
太阳能光伏技术作为一种清洁、可再生的能源形式,在全球范围内正受到广泛关注和迅速发展。然而,太阳能光伏系统的性能稳定性和可靠性仍然是一个持续挑战,限制了其广泛应用。在长期运行中,光伏系统可能会受到多种因素的影响,如天气变化、组件老化、短路等,这些因素都可能导致系统产能下降,影响其经济性和环保性。
为了确保光伏系统的高效运行和可持续利用,系统监测和故障诊断变得至关重要。当前的光伏故障诊断方法主要分为以下几种:(1)基于阈值判定的传统方法。传统的光伏系统故障诊断方法依赖于设定电压、电流等特定参数的阈值范围来判断系统是否发生故障。这种方法的优点在于其反应速度迅捷,能够快速识别故障状态。然而,这种方法容易受到光伏组件老化、环境变化等因素的干扰,使其在实际应用中的稳定性和准确性受到一定的限制。(2)基于电压电流时间序列特性曲线数据的深度学习算法。该类研究尝试利用深度学习技术,特别是卷积神经网络(CNN)和循环神经网络(RNN),来分析光伏系统的电压和电流特性曲线的时间序列特征。该类方法能够捕捉到复杂的电压电流关系,从而提高故障诊断的准确性。然而,这些方法需要以整段或部分曲线作为输入数据,导致实时性不高。(3)基于多种序列数据提取的后电信号特征的机器学习算法。通过提取电压和电流的特征向量,然后利用这些特征向量进行故障诊断。这类方法具有良好的可扩展性和实用性,与(1)相比,可以学习到数据的分布,模型具有较高鲁棒性,并且受到光伏内部特征变化影响小,能够适应不同光伏系统的需求。与(2)相比,在诊断准确率近似时,并不依赖采集的电压电流等序列数据,可以在运行时采集,具有更好的时效性与泛化能力。其中自编码(AE)作为强大的特征压缩编码提取器,在对电信号构建的特征向量进行学习时取得了良好的效果。基于贝叶斯推理的稀疏自动编码器虚拟原位校准模型(SAE-VIC)实现对光伏热泵系统(PVT)的故障检测与标定,通过SAE替代了原始数学模型起到了良好的效果。应用于光伏列阵电信号故障诊断方法AE-ANN,首先通过AE对电信号进行无监督的特征学习,之后通过ANN实现有监督的故障诊断,并在位于阿尔及利亚的真实运行光伏系统上验证了算法的有效性。Dropout优化堆叠式自编码器(D-SAE)是一种光伏列阵故障诊断方法,实现了高级特征的自动编码,加速了模型的收敛。虽然基于电信号特征的诊断算法可以在光伏的故障诊断中取得较好的效果,但是在实际运行中,光伏系统的故障事件相对较少,而且故障数据的采集和记录往往受到时间、成本和可行性的限制。因此,故障数据的获取受到多种因素的限制,使得上述诊断算法在数据缺失的情况下,不能进行充分的训练,导致性能下降。
一方面,数字孪生技术,作为数字化的系统复制和仿真方法,可以有效的解决实际故障数据缺失问题,已经在各种工程领域取得了显著的进展。数字孪生技术允许我们创建实际系统的数字化副本,以模拟系统在不同工作条件下的行为。这种仿真方法可以生成大量的模拟数据,包括正常和故障状态下的数据,有效的解决了故障数据缺失的问题。数字孪生驱动的智能故障诊断方法常应用于滚动轴承,通过高保真数字孪生模型实现高效的数据生成,改善数据质量,提高诊断准确率。数字孪生辅助的增强元迁移学习方法可以对典型工况进行模拟实现故障状态下的数据生成,实现小于5%的模型误差。但是传统的机理仿真数字孪生常常受限于特定的条件和参数设置,导致产生的数据集不平衡和不完整,进而影响诊断模型的平衡性,导致诊断模型偏向学习多数类别,发生偏见错误。
另一方面,深度学习技术的迅猛发展为光伏系统监测和故障诊断提供了强大的工具。其强大的特征提取能力可以对数据中的特征进行自动采集,这使得它们在处理光伏系统的复杂数据时表现十分出色。其中GAN作为强大的深度学习生成器,可以对数据的分布特征进行有效提取,实现多样化的数据生成,提高故障诊断的准确率。改进的辅助分类器生成对抗网络(IACGAN)可以有效的增强回波信号时的特征图像提取能力,提高生成样本的质量。通过引入GAN框架,实现数据的插补与合成,生成样本改善数据集的质量。带有条件变分生成网络(CVAE-GAN)实现对多源信号的融合与生成,有效的解决故障诊断中样本不足,不平衡问题。虽然这些深度学习生成模型已被证明可以有效提升诊断准确性,但单独使用深度学习生成模型进行故障诊断会使模型缺乏可解释性,并且深度学习模型需要充足训练数据才能保证学习的有效性。
有鉴于此,特提出本发明。
发明内容
有鉴于此,本发明公开了一种基于深度数字孪生的光伏故障诊断方法以及系统,可有效解决人为选择特征的偏见性,提高光伏系统的诊断效果,且克服了光伏故障诊断中典型数据不足的问题,并通过机理建模与深度学习相结合给出了一种数字孪生模型的新型构建方式,最终为解决光伏系统的故障诊断问题提出了一种有效的方法,有较好的实用价值。
具体地,本发明是通过以下技术方案实现的:
本发明提供了一种基于数字孪生的光伏故障诊断方法,包括如下步骤:
构建机理仿真模型后采集不平衡故障数据经过IGR特征自动选择筛选操作后,输入到深度数据模型进行学习,得到多样化补全数据,进行SSAE特征压缩实现诊断。
本发明的光伏故障诊断方法基于现有技术中实际光伏故障数据不足,且当前光伏电信号采样受高频采样单元与人为选择特征影响,诊断效果较差;机理仿真数字孪生受限于特定的条件和参数设置,构建的数据集不平衡;深度网络生成模型需要足够的样本进行训练,缺少足够数据时模型泛化能力较差的问题,提出一种基于深度数字孪生的光伏系统智能故障诊断方法(DDT-IGSSAE)。
该方法的整个操作步骤是:
首先根据实物光伏系统建立其机理仿真模型,生成故障状态下系统运行数据,并构建数据集。之后设计一种深度数据模型—一维深度卷积生成对抗网络(1D-DCGAN),进一步捕捉机理仿真模型生成数据分布特征,以解决数据单一性问题。深度数据模型和机理仿真模型实现数据互补,既解决故障数据的生成问题,又克服各自数据不平衡及深度模型训练数据不足的问题。之后,将两模型生成数据进行融合,构建深度数字孪生模型。最后,提出一种IGSSAE的诊断网络,设计信息增益比(IGR)获取特征分类贡献,实现特征的自动选择和多级特征压缩,完成故障分类诊断。所提方法可有效解决人为选择特征的偏见性,提高光伏系统的诊断效果。本发明克服了光伏故障诊断中典型数据不足的问题,并通过机理建模与深度学习相结合给出了一种数字孪生模型的新型构建方式,最终为解决光伏系统的故障诊断问题提出了一种有效的方法,有较好的实用价值。
该诊断模型框架主要分成两个部分:深度数字孪生的构建(机理仿真模型和深度数据模型),实现多样化数据生成;通过将机理仿真模型与深度数据模型相结合实现互补,得到一种可以生成多样化数据的深度数字孪生(DDT)模型。该模型根据实物参数搭建机理仿真模型之后通过深度数据模型生成多样化样本,平衡数据集,实现DDT-IGSSAE诊断模型的更新。
优选地,构建机理仿真模型后采集不平衡故障数据的方法包括:
采用Simulink搭建一个并网的光伏系统仿真模型,对三种类型的故障进行模拟,分别为单个光伏组串中出现短路故障、单组串中光伏出现接地故障以及串对串连接产生故障;
对光照强度IR和温度T进行调整,得到不同参数条件下的不平衡故障数据,并根据电信号特征进行采集。
优选地,机理仿真模型产生的数据x′经过IGR自动选择筛选的方法,得到用于进入到深度数据模型的输入数据x,自动筛选的方法包括:
计算不平衡故障数据集的总体熵,如公式(8)所示:
其中H(D)是数据集的熵,c是类别的数量,pi是每个类别在数据集中的比例,对于每个特征,计算根据该特征划分数据集后的条件熵:
其中H(D|A)是条件熵,n是特征的取值数量,Di是根据特征A的第i和取值划分的子集,|Di|表示子集的代销,|D|代表总体数据集的大小,根据H(D)和H(D|A)计算信息增益IG(A):
IG(A)=H(D)-H(D|A) (10)
IG(A)代表了总体熵的降低程度,而固有信息量H(A)则是特征A本身的信息熵,用于度量特征的不确定性水平;
其中n是特征的取值数量,pj是特征A的第j个取值在数据集中的比例,根据求得的H(A)与IG(A)对信息增益IGR(A)比进行计算:
信息增益比(IGR)是信息增益IG(A)与特征的固有信息量H(A)之比。
因为机理仿真模型人为提取到的电信号数据并不是对光伏系统的故障诊断都能起到作用,其中部分电信号特征反而会作为噪声,影响故障诊断的效果。因此为了解决上述技术问题,提出将信息增益比(IGR)与堆叠稀疏自编码器(SSAE)相结合的方式,实现对光伏电信号数据的自动选择与多级特征提取并进行故障诊断。
本发明的方案通过预先经过机理仿真模型达到降低信号输入的噪声的效果,从而解决了本身IGR对噪声样本判别能力差,会对相关性判别结果造成影响的问题发生,可见本发明的方案之所以将两个模型与IGR联用形成特定的组合均是有一定的原因的。
为了更加适应于本发明的光伏系统的诊断技术领域,在上述IGR的过程中,增加了熵与样本类固有信息的衡量指标,如公式(11),这样将电信号样本中的单一特征A所占比例化为信息量与类别之间的关系,增强了IGR在电信好特征选择的适用性。
另外,在打分规则中融入诊断网络辅助选择,同时在IGR内通过公式(12)所得结果对电信号包含信息量进行类相关性打分,并嵌入诊断网络测试IGR最优参数选择数量,并实现特征的初步筛选,上述指标的建立均是根据本发明的特定领域进行特定设计的,现有技术是不涉及上述内容的。
该诊断模型采用信息增益比(IGR)对特征进行度量,IGR可以有效的衡量一个特征对于分类任务的贡献,而特征的固有信息量用于考虑特征本身的不确定性。因此,信息增益比(IGR)不仅考虑了特征对目标变量的分类能力,还关注了特征本身的复杂性,从而实现有效的特征自动选择。
优选地,输入数据x在深度数据模型进行学习的方法包括:
深度数据模型1D-DCGAN包括两个子网络,一维卷积生成器(1DGen)和一维卷积判别器(1DDisc),在设计的1DGen中通过两层尺度为1×3,通道数为32,64的卷积层,采用GELU作为激活函数,最后生成伪样本,其生成结果可表示如下:
其生成结果1DGen()可表示如下:
FEAT(X)=GELU(Conv(X)) (2)
XG=randn(k) (3)
1DGen(XG)=WG1(FEATG2(FEATG1(XG))))+bG1 (4)
其中XG为1DGen中输入的随机噪声数据,randn(k)表示初始随机生成k维故障数据,一维卷积采用Conv(x)表示,FEAT()表示高斯线性误差单元激活的特征提取模块,全连接层的权重与偏差采用W,b表示,最后生成伪样本,在1DDisc中,输入为真实样本数据,其采用与生成器相似结构的卷积层,最后输出样本和标签的判别结果。
优选地,还包括对深度数据模型进行优化的方法,具体参照如下公式(5)-(7),1DDisc(Xinput)=WD2(WD1(FEATD2(FEATD1(XD)))+bD1)+bD2 (5)
对1DGen和1DDisc进行对抗训练,其价值目标函数如下公式所示:
上式中第一项为常量,要让第二项尽量的小,达到让判别器判断不出真假的效果,也就是要使1DDisc(1DGEN(z))尽可能的大,从而达到训练效果,在判别器训练的过程中要让第二项尽可能的大,也就是1DDisc(1DGen(z))尽可能的小,这样才能让两项的期望尽可能的大,达到训练判别器判别能力的效果,在训练过程中采用自适应学习率的优化算法(Adam),根据损失函数的梯度来更新模型参数;
训练1D-DCGAN时,生成成序列数据设置为每50个epoch输出一次,随后,计算训练样本与生成结果的平均皮尔逊相关系数(r),确定生成样本的线性相关程度:
其中m表示样本数量,xi和yi分别是训练样本和生成结果中的第i个值,和/>分别是训练样本和生成结果的均值。当r大于0.8时,我们认为已经学习到了分布特征,此时,停止训练1D-DCGAN,并保存模型。
深度数据模型的构建是针对模型中产生的一维信号,将传统针对图像的二维卷积调整为一维卷积,并对卷积层数,通道数进行调整,构建新的网络结构,进而更好的学习数据中的非线性分布关系;采用皮尔逊指数确定原始数据与生成样本的分布特征是否匹配,从而判断停止训练,为确保生成器充分学习到数据分布,生成更有效且多样化的数据;将激活函数调整为高斯误差线性单元(GELU)更好的捕捉输入数据的复杂非线性关系。
深度数据模型1D-DCGAN可以学习数据中的复杂特征模式,生成更接近真实数据的特征。这对于构建数字孪生模型的准确性和可靠性非常重要。
优选地,进行SSAE特征压缩的方法包括:
SSAE由两个稀疏自编码器连接构成,其中第一个自编码器(SAE1)的输入样本(x)为深度数字孪生平衡好的数据集,对输入样本进行压缩表示encode()
feat1=encode(SAE1,x) (13)
x经过SAE1进行压缩得到更高级的特征表示feat1,损失函数采用均方误差(MSE)
MSE=(1/n)*∑(x-decode(SAE1,feat1))2 (14)
其中n为样本数量,decode()为解码函数,通过MSE对网络参数进行反向传播训练,在训练的过程中采用了L2权重正则化(L2R)和稀疏正则化(SR):
L2R=(λ/2))*∑(θ^2) (15)
其中λ为正则化参数,θ表示可学习权重参数;
其中β是用于控制稀疏正则化强度的正则化参数,ρ是期望的稀疏水平,代表神经元的目标激活概率,是神经元在训练期间的实际激活概率;
在第二个自编码器SAE2中,其输入为第一个自编码器的压缩特征feat1,通过SAE2编码的到的特征为:
feat2=encode(SAE2,feat1) (17)
在SAE2中对feat1进行进一步的编码压缩得到更高级别的特征feat2,进一步学习数据的非线性关系,在训练好SAE2后,采用feat2作为Softmax的输入,并映射到类别中,将IGR,SAE1,SAE2,Softmax连接在一起,搭建IGSSAE智能故障诊断框架。
本发明除了提供了一种光伏故障诊断方法,还提供了一种用于光伏故障诊断的诊断系统,包括:
采集模块:用于构建机理仿真模型后采集不平衡故障数据;
筛选模块:用于经过IGR特征自动选择筛选操作后,输入到深度数据模型进行学习,得到多样化补全数据;
压缩模块:用于进行SSAE特征压缩实现诊断。
总之,本发明有效的解决了仿真数字孪生可能受限于特定的条件和参数设置,导致产生的数据集不平衡和不完整性。通过结合机理仿真模型和深度数据模型,能够在数据集不平衡和不完整性的情况下学习到数据内部的非线性分布。这使得模型能够生成多样的样本,从而有效地补全模型生成的故障数据,减少对单独使用机理仿真模型产生的偏见影响,实现模型的更新。同时设计了一种信息增益堆叠稀疏自编器诊断网络结构,实现了特征的自动选择,有效解决了特征人为选择可能引起的偏见错误。采用稀疏自编码器(SSAE)进行训练和高级特征的压缩编码,成功解决了光伏系统的故障诊断问题,具有良好的实用价值。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了,附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制,而且在整个附图中,用相同的参考符号表示相同的部件,在附图中:
图1 深度数字孪生光伏系统故障诊断总体结构图;
图2 光伏机理模型;
图3 光伏故障设置图;
图4 1D-DCGAN深度数据模型结构图;
图5 根据IGR选择不同特征数得到的不同分类准确率结果图;
图6 1D-DCGAN深度数据模型对四类数据的生成结果图;
图7 IGR特征自动选择前后的t-SNE对比图;
图8 数据平衡前后准确率对比图;
图9 t-SNE对实验结果进行特征可视化对比图;
图10 验证稀疏、堆叠效果的混淆矩阵结果图;
图11 消融实验的十轮结果验证结果图;
图12 为本发明实施例提供的一种计算机设备的流程示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中,下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素,以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式,相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子,
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开,在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合,
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语,这些术语仅用来将同一类型的信息彼此区分开,例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息,取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”,
本发明主要针对实际工况下风电机组故障数据难以获取;现有数据增强方法针对一维数据特征提取效果不佳的问题。首先采用西储大学轴承故障平台数据集进行理论与算法的有效性验证;之后,在真实风机采集的运行数据上进行算法测试以说明本算法的实施过程。
实施例
如图1所示,本发明提出了一种基于深度数字孪生的光伏系统全新智能故障诊断方法。该框架主要分为2个部分:深度数字孪生的构建(机理仿真模型和深度数据模型),实现多样化数据生成;信息增益堆叠稀疏自编码器网络,用于光伏系统故障诊断。最后根据光伏实际运行数据指标结果对模型参数进行反馈调节。该方法的实现步骤如下:
A、深度数字孪生构建
1)光伏系统机理仿真模型的建立
在MATLAB中采用Simulink搭建一个并网的250kW的光伏系统仿真模型,实现对标准状态下的数据和故障状态下的数据进行模拟。机理仿真数字孪生如图2所示。
在该模型中主要对三种故障进行模拟,故障一是单个光伏组串中出现短路故障,故障二是单组串中光伏出现接地故障,故障三是串对串连接产生故障。如图3所示。
在同一工作状态下,光照强度(IR)的调整范围为100W/m2至1,000W/m2,温度(T)的调整范围为10℃至35℃。根据对IR和温度T进行调整,得到不同参数条件下的数据,以增强模型鲁棒性。并对数据的电信号特征进行采集。
2)深度数据模型构建
本发明在DCGAN网络结构基础上,设计了一种改进的1D-DCGAN网络。其结构如图4所示。
1D-DCGAN包括两个子网络,一维卷积生成器(1DGen)和一维卷积判别器(1DDisc)。进而有效的对筛选后的一维特征向量进行学习,在设计的1DGen中通过两层尺度为1×3,通道数为32,64的卷积层,采用GELU作为激活函数,最后生成伪样本,其生成结果可表示如下:
其生成结果1DGen()可表示如下:
FEAT(X)=GELU(Conv(X)) (2)
XG=randn(k) (3)
1DGen(XG)=WG1(FEATG2(FEATG1(XG))))+bG1 (4)
其中XG为1DGen中输入的随机噪声数据,randn(k)表示初始随机生成k维故障数据,一维卷积采用Conv(x)表示,FEAT()表示高斯线性误差单元激活的特征提取模块,全连接层的权重与偏差采用W,b表示,最后生成伪样本。在1DDisc中,输入为真实样本数据,其采用与生成器相似结构的卷积层,最后输出样本和标签的判别结果。
1DDisc(Xinput)=WD2(WD1(FEATD2(FEATD1(XD)))+bD1)+bD2 (5)
对1DGen和1DDisc进行对抗训练,其价值目标函数如下公式所示:
在生成器的训练过程中,式中第一项为常量,要让第二项/>尽量的小,达到让判别器判断不出真假的效果,也就是要使1DDisc(1DGen(z))尽可能的大,从而达到训练效果。在判别器训练的过程中要让第二项尽可能的大,也就是1DDisc(1DGen(z))尽可能的小,这样才能让两项的期望尽可能的大,达到训练判别器判别能力的效果。在训练过程中采用自适应学习率的优化算法(Adam),根据损失函数的梯度来更新模型参数。
在本实施例中,训练1D-DCGAN时,生成成序列数据设置为每50个epoch输出一次。随后,计算训练样本与生成结果的平均皮尔逊相关系数(r),确定生成样本的线性相关程度:
其中m表示样本数量,xi和yi分别是训练样本和生成结果中的第i个值,和/>分别是训练样本和生成结果的均值。当r大于0.8时,我们认为已经学习到了分布特征,此时,停止训练1D-DCGAN,并保存模型,1D-DCGAN网络整体参数如表1所示。
表1 1D-DCGAN网络结构参数
B、信息增益堆叠稀疏自编码器(IGSSAE)的构建
本实施例提出一种全新的信息增益堆叠稀疏自编码器(IGSSAE),将信息增益比(IGR)与堆叠稀疏自编码器(SSAE)相结合,实现对光伏电信号数据的自动选择与多级特征提取并进行故障诊断。
首先计算数据集总体熵(Entropy),熵用于衡量数据的不确定性,如公式(8)所示:
其中H(D)是数据集的熵,c是类别的数量,pi是每个类别在数据集中的比例。对于每个特征,计算根据该特征划分数据集后的条件熵(Conditional Entropy)。条件熵度量了在特征已知的情况下,目标变量的不确定性。
其中H(D|A)是条件熵,n是特征的取值数量,Di是根据特征A的第i和取值划分的子集,|Di|表示子集的代销,|D|代表总体数据集的大小。根据H(D)和H(D|A)计算信息增益IG(A)。
IG(A)=H(D)-H(D|A) (10)
在数据集中,当以特征A为依据进行划分时,IG(A)代表了总体熵的降低程度。而固有信息量H(A)则是特征A本身的信息熵,用于度量特征的不确定性水平。
其中n是特征的取值数量,pj是特征A的第j个取值在数据集中的比例。根据求得的H(A)与IG(A)对信息增益IGR(A)比进行计算:
信息增益比(IGR)是信息增益IG(A)与特征的固有信息量H(A)之比,IGR(A)提供了一种更全面的度量。
机理仿真模型产生数据(x′)经过IGR自动选择后,得到下级网络的输入数据(x)。之后,为了对自动选择后的样本x进行有效的故障诊断,提升数据分类性能,本实施例设计了一种SSAE网络结构,该网络可实现无监督特征提取并学习更高级的特征表示,强化分类效果从而提高光伏系统的智能故障诊断性能。
SSAE由两个稀疏自编码器连接构成,连接Softmax层实现数据分类。其中第一个自编码器(SAE1)的输入样本(x)为深度数字孪生平衡好的数据集,对输入样本进行压缩表示encode()
feat1=encode(SAE1,x) (13)
x经过SAE1进行压缩得到更高级的特征表示feat1,损失函数采用均方误差(MSE)
MSE=(1/n)*∑(x-decode(SAE1,feat1))2 (14)
其中n为样本数量,decode()为解码函数。通过MSE对网络参数进行反向传播训练,在训练的过程中采用了L2权重正则化(L2R)和稀疏正则化(SR)。其中L2权重正则化(L2R)的主要通过对权重参数进行限制,弱化不显著特征所占权重,防止模型在训练数据上过度拟合。
L2R=(λ/2)*∑(θ^2) (15)
其中λ为正则化参数在本发明中设置为0.004,控制正则化强度,θ表示可学习权重参数。
稀疏正则化(SR)的目标是使模型中的某些神经元更加稀疏,更少激活,提高模型的可解释性和鲁棒性,迫使模型选择对任务最有用的特征。
其中β是用于控制稀疏正则化强度的正则化参数,ρ是期望的稀疏水平,代表神经元的目标激活概率,是神经元在训练期间的实际激活概率。在本发明中β设置为4,ρ设置为0.15,通过约束神经元的激活度,稀疏正则化可以防止某些神经元在训练期间过度激活,从而减少过拟合的风险。
在第二个自编码器SAE2中,其输入为第一个自编码器的压缩特征feat1,通过SAE2编码的到的特征为
feat2=encode(SAE2,feat1) (17)
在SAE2中对feat1进行进一步的编码压缩得到更高级别的特征feat2,进一步学习数据的非线性关系。在训练好SAE2后,采用feat2作为Softmax的输入,并映射到类别中,将IGR,SAE1,SAE2,Softmax连接在一起,搭建IGSSAE智能故障诊断框架。IGSSAE的网络结构参数如表2所示。
表2 IGSSAE网络结构参数
应用例
上述实施例光伏系统的机理模型是依据真实250kW并网光伏电站搭建,根据机理模型对正常运行状态和三种故障运行状态的数据进行采集。光伏机理模型生成的每条样本,总模拟时间为0.4秒,设置故障在0.2秒时发生。测量时间为0.1秒至0.3秒,瞬态时间为0.1秒至0.2秒,故障发生时间为0.2秒至0.3秒。训练数据集A共包括600个实例,其中无故障案例100例(16.67%),组串内故障153例(25.5%),组串接地故障149例(24.83%),串与串之间的故障198例(33%)。每种工作状态各25条,共100例真实运行数据为测试数据集B,数据集组成如表3所示。
表3数据集A划分
A、IGR特征自动选择与验证阶段
由于采集的光伏板数量较多,时序数据中包含大量冗余信息,因此提取时序数据中的关键特征点,减少数据量,进而提高数据处理和分析效率,得到22维特征数据集。
步骤一:为提高深度数据模型生成效率,将提取到的特征通过IGSSAE的IGR模块对数据的相关性进行分析,进一步确定相关系数高的特征作为主要特征,特征的信息以及IGR见表4所示。
表4数据集信息及IGR结果Table.4Dataset information and IGR results
步骤二:通过IGR计算特征的类相关性,将22个特征按照相关性从大到小排序,从第一个特征开始进行实验,在原来特征的基础上每次多取一个,并在诊断网络上测试诊断分类效果如图5所示,当取前17维特征是效果最好,因此选择每条样本的前17维特征构建训练数据集C。
B、深度数据模型的数据集平衡阶段
步骤一:以训练数据集C作为1DDsic的训练样本输入,用于训练1DGen模型以生成更具有多样性的样本。图6为1D-DCGAN对数据的生成结果,每种工作状态取取4条生成样本作为示例。
步骤二:当生成结果的皮尔逊指数>0.8时,网络停止训练,通过1DGen对当前类别数据进行生成,并与真实样本进行对比。由图6生成结果可知,通过数据驱动的方式对数据分布特征进行学习,在模拟光伏系统的行为中具有良好的性能。通过深度数据数字孪生生成的样本,对不平衡的机理模型样本进行数据平衡,进而减少诊断网络中的模型偏见。平衡后的训练数据集D如表5所示。
表5数据集D划分
C、DDT-IGSSAE的消融实验验证阶段
步骤一:通过t-SNE特征降维可视化验证IGR特征自动选择效果。
在对IGR的数据筛选效果进行验证时,分别采用未筛选的数据集A和筛选后的数据集C作为网络输入,经过诊断网络SSAE实现故障诊断,通过t-SNE对比特诊筛选前后的特征提取分类结果,如图7所示。
通过使用IGR进行自动的特征选择,降低了维度并保留最重要的信息,减少了模型复杂性。通过t-SNE实现高维数据到低维空间的变换,更好的呈现了数据的内在分布关系,以便可视化数据并发现潜在的聚类结构,展现特征筛选的效果。由图7结果分析可知,IGR特征自动选择发挥了如下作用:
(1)类别差异性:每个类别中IGR更大的前17维特征存在更大类别差异性,在降维后数据点更容易在低维空间中分散成簇。
(2)噪声的减少:通过IGR排除了数据中不重要的特征,减少了数据中的噪声。
步骤二:验证深度数字孪生平衡模型效果。采用筛选特征后的训练数据集C和补全后的数据集D,通过SSAE实现光伏系统的智能故障诊断,并在测试集B上验证分类准确率,其中一轮结果验证结果混淆矩阵如图8所示。由图8可知,在通过DDT进行模型平衡后,光伏系统诊断效果有9%的提升,验证了模型的有效性。
步骤三:验证诊断网络SSAE性能。采用消融实现分别验证不采用稀疏的堆叠自编码器(Stacked AE,StAE),不采用堆叠的稀疏自编码器(Sparsity AE,SAE)和本发明算法SSAE。诊断效果的t-SNE的特征可视化结果如图9所示。
由图9可以看出单独采用SAE和StAE实现故障诊断时,不同类别数据有部分混叠在一起,边界划分不清晰,进而导致分类效果差。在本发明诊断方法SSAE中,数据经过两级特征提取并在训练过程中采用稀疏训练后,在验证数据集B上的聚类效果有显著的提升,4个类别的数据有明显的边界。类别内部的特征间距小,不同类别间距离大,除第3类和第4类中个别样本还存在混叠,其他样本分类效果良好。网络诊断准确率对应的混淆矩阵如图10所示。
图10中的(a),(b)分别为SAE和StAE在测试数据集B上的验证准确率。如图9(a),图10(a)所示单独使用SAE时第二类数据与第三类数据产生较多混叠,表明只通过一轮SAE不能很好的对数据的特征进行充分的压缩编码去噪。但SAE的结果与图9(b),图10(b)中StAE相比,虽然2,3类均产生混叠,但是效果明显优于StAE。在不参与训练的测试数据B进行验证,SAE对于新数据第2类识别准确率上有明显提升,验证了模型的稀疏训练可以有效的增加模型的泛化性。本发明算法诊断准确率混淆矩阵如图10(c)所示,与图9(c)中TSNE结果相对应,对每类数据均有良好的分类结果,并且总体诊断准确率达到98%,与单独使用堆叠和稀疏相比,均有较大提升,进一步验证了算法的有效性。
对消融实验内容进行十轮验证,平均准确率如表6所示,十轮准确率结果如图11所示,本发明方法十轮平均诊断准确率达到98.4%。
表6十轮平均准确率
本发明除了提供了上述基于深度数字孪生的光伏故障诊断方法,还提供了上述基于深度数字孪生的光伏故障诊断系统,具体包括:
采集模块:用于构建机理仿真模型后采集不平衡故障数据;
筛选模块:用于经过IGR特征自动选择筛选操作后,输入到深度数据模型进行学习,得到多样化补全数据;
压缩模块:用于进行SSAE特征压缩实现诊断。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
图12为本发明公开的一种计算机设备的结构示意图。参考图12所示,该计算机设备400,至少包括存储器402和处理器401;所述存储器402通过通信总线403和处理器连接,用于存储所述处理器401可执行的计算机指令,所述处理器401用于从所述存储器402读取计算机指令以实现上述任一实施例所述的方法的步骤。
对于上述装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部磁盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
最后应说明的是:虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。

Claims (9)

1.一种基于深度数字孪生的光伏故障诊断方法,其特征在于,包括如下步骤:
构建机理仿真模型后采集不平衡故障数据经过IGR特征自动选择筛选操作后,输入到深度数据模型进行学习,得到多样化补全数据,进行SSAE特征压缩实现诊断。
2.根据权利要求1所述的光伏故障诊断方法,其特征在于,构建机理仿真模型后采集不平衡故障数据的方法包括:
采用Simulink搭建一个并网的光伏系统仿真模型,对三种类型的故障进行模拟,分别为单个光伏组串中出现短路故障、单组串中光伏出现接地故障以及串对串连接产生故障;
对光照强度IR和温度T进行调整,得到不同参数条件下的不平衡故障数据,并根据电信号特征进行采集。
3.根据权利要求2所述的光伏故障诊断方法,其特征在于,机理仿真模型产生的数据x′经过所述IGR特征自动选择筛选的方法,得到用于进入到深度数据模型的输入数据x,自动选择筛选的方法包括:
计算不平衡故障数据集的总体熵,如公式(8)所示:
其中H(D)是数据集的熵,c是类别的数量,pi是每个类别在数据集中的比例,对于每个特征,计算根据该特征划分数据集后的条件熵:
其中H(D|A)是条件熵,n是特征的取值数量,Di是根据特征A的第i和取值划分的子集,|Di|表示子集的代销,|D|代表总体数据集的大小,根据H(D)和H(D|A)计算信息增益IG(A):
IG(A)=H(D)-H(D|A) (10)
IG(A)代表了总体熵的降低程度,而固有信息量H(A)则是特征A本身的信息熵,用于度量特征的不确定性水平;
其中n是特征的取值数量,pj是特征A的第j个取值在数据集中的比例,根据求得的H(A)与IG(A)对信息增益IGR(A)比进行计算:
信息增益比(IGR)是信息增益IG(A)与特征的固有信息量H(A)之比。
4.根据权利要求3所述的光伏故障诊断方法,其特征在于,输入数据x在深度数据模型进行学习的方法包括:
深度数据模型1D-DCGAN包括两个子网络,一维卷积生成器1DGen和一维卷积判别器1DDisc,在设计的1DGen中通过两层尺度为1×3,通道数为32,64的卷积层,采用GELU作为激活函数,最后生成伪样本,其生成结果表示如下:
其生成结果1DGen()表示如下:
FEAT(X)=GELU(Conv(X)) (2)
XG=randn(k) (3)
1DGen(XG)=WG1(FEATG2(FEATG1(Xa))))+bG1 (4)
其中XG为1DGen中输入的随机噪声数据,randn(k)表示初始随机生成k维故障数据,一维卷积采用Conv(x)表示,FEAT()表示高斯线性误差单元激活的特征提取模块,全连接层的权重与偏差采用W,b表示,最后生成伪样本,在1DDisc中,输入为真实样本数据,其采用与生成器相似结构的卷积层,最后输出样本和标签的判别结果。
5.根据权利要求3所述的光伏故障诊断方法,其特征在于,还包括对深度数据模型训练的方法,具体参照如下公式(5)-(7),
1DDisc(Xinput)=WD2(WD1(FEATD2(FEATD1(Xo)))+bD1)+bD2 (5)
对1DGen和1DDisc进行对抗训练,其价值目标函数如下公式所示:
上式中第一项为常量,要让第二项尽量的小,达到让判别器判断不出真假的效果,也就是要使1DDisc(1DGen(z))尽可能的大,从而达到训练效果,在判别器训练的过程中要让第二项尽可能的大,也就是1DDisc(1DGen(z))尽可能的小,这样才能让两项的期望尽可能的大,达到训练判别器判别能力的效果,在训练过程中采用自适应学习率的优化算法(Adam),根据损失函数的梯度来更新模型参数;
训练1D-DCGAN时,生成成序列数据设置为每50个epoch输出一次,随后,计算训练样本与生成结果的平均皮尔逊相关系数(r),确定生成样本的线性相关程度:
其中m表示样本数量,xi和yi分别是训练样本和生成结果中的第i个值,和/>分别是训练样本和生成结果的均值,当r大于0.8时停止训练1D-DCGAN并保存模型。
6.根据权利要求4所述的光伏故障诊断方法,其特征在于,进行SSAE特征压缩的方法包括:
SSAE由两个稀疏自编码器连接构成,其中第一个自编码器SAE1的输入样本x为深度数字孪生平衡好的数据集,对输入样本进行压缩表示encode()
feat1=encode(SAE1,x) (13)
x经过SAE1进行压缩得到更高级的特征表示feat1,损失函数采用均方误差(MSE)
MSE=(1/n)*∑(x-decode(SAE1,feat1))2 (14)
其中n为样本数量,decode()为解码函数,通过MSE对网络参数进行反向传播训练,在训练的过程中采用了L2权重正则化L2R和稀疏正则化SR:
L2R=(λ/2)*∑(θ^2) (15)
其中λ为正则化参数,θ表示可学习权重参数;
其中β是用于控制稀疏正则化强度的正则化参数,ρ是期望的稀疏水平,代表神经元的目标激活概率,是神经元在训练期间的实际激活概率;
在第二个自编码器SAE2中,其输入为第一个自编码器的压缩特征feat1,通过SAE2编码的到的特征为:
feat2=encode(SAE2,feat1) (17)
在SAE2中对feat1进行进一步的编码压缩得到更高级别的特征feat2,进一步学习数据的非线性关系,在训练好SAE2后,采用feat2作为Softmax的输入,并映射到类别中,将IGR,SAE1,SAE2,Softmax连接在一起,搭建IGSSAE智能故障诊断框架。
7.权利要求1-6任一项所述的光伏故障诊断方法的光伏故障诊断系统,其特征在于,包括:
采集模块:用于构建机理仿真模型后采集不平衡故障数据;
筛选模块:用于经过IGR特征自动选择筛选操作后,输入到深度数据模型进行学习,得到多样化补全数据;
压缩模块:用于进行SSAE特征压缩实现诊断。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-7任一所述方法的步骤。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述方法的步骤。
CN202410048523.7A 2024-01-12 2024-01-12 一种基于深度数字孪生的光伏故障诊断方法以及系统 Pending CN117874615A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410048523.7A CN117874615A (zh) 2024-01-12 2024-01-12 一种基于深度数字孪生的光伏故障诊断方法以及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410048523.7A CN117874615A (zh) 2024-01-12 2024-01-12 一种基于深度数字孪生的光伏故障诊断方法以及系统

Publications (1)

Publication Number Publication Date
CN117874615A true CN117874615A (zh) 2024-04-12

Family

ID=90582501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410048523.7A Pending CN117874615A (zh) 2024-01-12 2024-01-12 一种基于深度数字孪生的光伏故障诊断方法以及系统

Country Status (1)

Country Link
CN (1) CN117874615A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118133212A (zh) * 2024-05-07 2024-06-04 国网福建省电力有限公司 一种面向复杂不确定不平衡数据集的工控异常检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118133212A (zh) * 2024-05-07 2024-06-04 国网福建省电力有限公司 一种面向复杂不确定不平衡数据集的工控异常检测方法

Similar Documents

Publication Publication Date Title
CN109873610B (zh) 基于iv特性和深度残差网络的光伏阵列故障诊断方法
CN110555474A (zh) 一种基于半监督学习的光伏面板故障检测方法
CN109000930B (zh) 一种基于堆叠去噪自编码器的涡轮发动机性能退化评估方法
CN110542819B (zh) 一种基于半监督dbnc的变压器故障类型诊断方法
CN108062572A (zh) 一种基于DdAE深度学习模型的水电机组故障诊断方法与系统
CN110929847A (zh) 一种基于深度卷积神经网络的换流变压器故障诊断方法
CN112016395A (zh) 一种基于cgan-cnn的同步电机转子匝间短路故障判别方法
CN111967343A (zh) 基于简单神经网络和极端梯度提升模型融合的检测方法
CN117874615A (zh) 一种基于深度数字孪生的光伏故障诊断方法以及系统
CN114219147A (zh) 一种基于联邦学习的配电站故障预测方法
CN111046961B (zh) 基于双向长短时记忆单元和胶囊网络的故障分类方法
CN110879377B (zh) 基于深度信念网络的计量装置故障溯源方法
CN111695611B (zh) 一种蜂群优化核极限学习和稀疏表示机械故障识别方法
CN111310722B (zh) 一种基于改进神经网络的电力设备图像的故障识别方法
CN114970774B (zh) 一种智能变压器故障预测方法和装置
CN116842459B (zh) 一种基于小样本学习的电能计量故障诊断方法及诊断终端
CN114006370B (zh) 一种电力系统暂态稳定分析评估方法及系统
CN110837915A (zh) 一种基于混合集成深度学习的电力系统低压负荷点预测及概率预测方法
CN113379116A (zh) 基于聚类和卷积神经网络的台区线损预测方法
CN113850320A (zh) 基于改进支持向量机回归算法的变压器故障检测方法
CN116928038A (zh) 基于海上风电机组主轴承温度的故障预警方法及装置
CN114722923A (zh) 一种轻量型的机电设备故障诊断方法
CN114330486A (zh) 基于改进Wasserstein GAN的电力系统不良数据辨识方法
CN106529816B (zh) 电力线信道的调整方法和系统
CN113536662A (zh) 基于萤火虫优化LightGBM算法的电子式互感器误差状态预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination