CN117388703A - 基于改进深度残差的电容老化状态评估方法 - Google Patents
基于改进深度残差的电容老化状态评估方法 Download PDFInfo
- Publication number
- CN117388703A CN117388703A CN202311210467.4A CN202311210467A CN117388703A CN 117388703 A CN117388703 A CN 117388703A CN 202311210467 A CN202311210467 A CN 202311210467A CN 117388703 A CN117388703 A CN 117388703A
- Authority
- CN
- China
- Prior art keywords
- layer
- residual
- convolution
- model
- aging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000032683 aging Effects 0.000 title claims abstract description 106
- 239000003990 capacitor Substances 0.000 title claims abstract description 68
- 238000011156 evaluation Methods 0.000 title claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 26
- 230000007246 mechanism Effects 0.000 claims abstract description 24
- 238000011176 pooling Methods 0.000 claims abstract description 21
- 238000013210 evaluation model Methods 0.000 claims abstract description 15
- 238000003062 neural network model Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 29
- 230000004913 activation Effects 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 7
- 238000007499 fusion processing Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 description 11
- 238000000605 extraction Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/36—Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
- G01R31/367—Software therefor, e.g. for battery testing using modelling or look-up tables
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/36—Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
- G01R31/392—Determining battery ageing or deterioration, e.g. state of health
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Measurement Of Resistance Or Impedance (AREA)
Abstract
本发明提供一种基于改进深度残差的电容老化状态评估方法,其包括以下步骤:S1:根据子模块开关频率波形得到标准化时序老化特征数据集;S2:建立改进的深度残差卷积神经网络模型,由输入层、第一卷积下采样层、最大池化层、2个第一残差基本模块、N个第二残差基本模块和N个第一残差基本模块交替、注意力机制模块、全局平均池化层、拉平层依次连接组成;S3:建立基于改进深度残差的电容老化状态评估模型;S4:利用标准化时序老化特征数据集D对模型进行训练;S5:输入新的子模块开关频率波形,判断电容的老化状态。本发明对ResNet进行改进,引入了空洞卷积和注意力机制,并和长短时记忆网络相结合,提高了电容器的老化状态检测的准确率。
Description
技术领域
本发明涉及电力系统产品可靠性领域,尤其涉及一种基于改进深度残差的电容老化状态评估方法。
背景技术
在现代电子设备中,模块化多电平换流器(MMC)被广泛应用于电力电子系统中,用于储存和释放能量,平衡电力系统的电压和电流。然而,在长期运行过程中,由于工作环境中的温度、湿度、电气应力以及频率等因素的影响,MMC中的电容可能会发生老化,导致其性能下降甚至失效。因此,在线监测准确评估MMC电容的老化程度对于维护设备的性能和可靠性至关重要。
传统的电容老化检测方法通常通过实验测试和参数分析。一种常见的方法是通过对电容进行离线实验,测量其电容值、损耗因子、等效串联电阻等参数,然后通过对比实验结果与理论模型进行分析判断。然而,这种方法需要停电和拆卸电容,并且费时费力。这种方法需要将电容从电路中取下并停电。此外,该方法需要专业的实验设备和技术人员进行测试,且费时费力。参数分析是另一种常用的方法,可以通过在线监测电容的电容值、损耗因子、等效串联电阻等参数,并将测量结果与新电容的参数进行对比,以确定电容的老化程度。然而,通常情况下电容老化是一个渐进的过程,参数的变化是缓慢的,参数分析仅能提供电容的静态信息,不能准确捕捉到电容老化的动态过程。
为了克服传统方法的局限性,近年来,一些新的技术和方法正在被引入和研究,以提高电容老化检测的效率和准确性。其中,人工智能技术被广泛应用于电力系统的故障诊断和设备状态监测领域。卷积神经网络(CNN)和循环神经网络(RNN)等深度学习算法在信号处理和模式识别领域表现出色。这些算法可以自动提取输入数据中的特征,并通过学习大量数据进行模式识别和预测。通过引入人工智能技术,可以减少对人工经验的依赖,实现自动化的老化检测,并且可以处理大量数据,加快老化判断的速度。此外,该方法还能够降低老化检测的成本,减少对专业设备和人员的需求。但是,现有网络模型通常是为了追求更广泛的适用性,对于特定领域和设备就存在着不能充分提取输入特征信息的缺陷,目前对于模块化多电平换流器的电容老化状态评估就存在着这样的问题。
发明内容
为了克服了现有网络模型不能充分提取输入特征信息和传统方法不能实现对电容老化的自动化检测的问题,本发明提供了一种基于改进深度残差的电容老化状态评估方法,通过使用改进的深度残差卷积神经网络(ResNet)和长短时记忆网络(LSTM),结合与电容老化相关的开关频率波形,实现对电容老化程度的准确检测和评估,具有良好的准确性。
本发明提供一种基于改进深度残差的电容老化状态评估方法,包括:
S1:采集在线监测下使用多电平换流器柔性直流换流阀实际运行数据,获取子模块开关频率波形作为电容时序老化特征数据,对电容时序老化特征数据进行预处理,得到标准化时序老化特征数据集D并划分训练集与测试集;
S2:建立改进的深度残差卷积神经网络模型;
S21:使用标准化时序老化特征数据集D特征训练现有ResNet模型,确定现有ResNet模型参数;
S22:构建改进的ResNet模型;
S221:对残差基本块进行改进得到第一残差基本模块和第二残差基本模块;两者具体结构如下:
第一残差基本模块的具体结构为:当数据输入第一残差基本模块后分为3路,第一路为值等映射,即输入不进行任何改变直接作为输出结果;第二路为数据输入后依次经过第二卷积层、BN层、第一ReLU激活函数、第二卷积层BN层后输出结果;第3路输入经过空洞卷积层输出结果;将3路输出的结果经过线性融合处理后再输入至第二ReLU激活函数,将第二ReLU激活函数的输出作为第一残差基本模块的输出;
第二残差基本模块的具体结构为:当数据输入第二残差基本模块后也分为3路,第一路为经过1*1卷积模块输出结果;第二路为数据输入后依次经过第二卷积层、BN层、第一ReLU激活函数、第三卷积下采样层、BN层后输出结果;第3路输入经过空洞卷积层输出结果;将3路输出的结果经过线性融合处理后再输入至第二ReLU激活函数,将第二ReLU激活函数的输出作为第二残差基本模块的输出;
S222:引入注意力机制模块;
在最后的残差基本模块与全局平均池化层之间加入了注意力机制模块;
S223:改进后的ResNet模型结构如下:
由输入层、第一卷积下采样层(Conv)、最大池化层、2个第一残差基本模块、N个第二残差基本模块和N个第一残差基本模块交替、注意力机制模块、全局平均池化层、拉平层(Flatten层)依次连接组成;
S3:建立基于改进深度残差的电容老化状态评估模型;
将S2得到的改进的深度残差卷积神经网络模型、现有的长短时记忆网络、全连接层、softmax函数依次连接,将所述softmax函数得到的概率序列作为基于改进深度残差的电容老化状态评估模型的输出;
S4:利用标准化时序老化特征数据集D对基于改进深度残差的电容老化状态评估模型进行训练;
S5:输入新的子模块开关频率波形,判断电容的老化状态。
优选的,所述S223中改进的ResNet模型为ResNet-18模型,改进后的ResNet-18模型结构依次为:输入层、第一卷积下采样层、最大池化层、第一残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、注意力机制模块、全局平均池化层以及Flatten层依次连接组成。
优选的,所述改进后的ResNet-18模型中,第一卷积下采样层为大小为7*7的卷积后连接下采样步长为2的下采样,第一残差基本模块中的卷积层和第二残差基本模块中的第二卷积层都是大小为3*3的卷积层;第二残差基本模块中的第三卷积下采样层为大小3*3的卷积后连接下采样步长为2的下采样;第一残差基本模块和第二残差基本模块中的空洞卷积层都是大小为3*3的卷积层,且第一残差基本模块和第二残差基本模块中的第一ReLU激活函数和第二ReLU激活函数相同。
优选的,所述S1中对电容时序老化特征数据进行预处理包括:处理噪声、缺失数据和异常值,然后对预处理后的电容时序老化特征数据进行归一化处理,获得标准化时序老化特征数据集D,按照4:1的比例划分训练集和测试集。
优选的,所述S222中注意力机制模块采用置换注意力机制。
优选的,所述S4包括:
S41:将标准化时序老化特征数据集D中的训练集输入到基于改进深度残差的电容老化状态评估模型中,对所述电容老化模型进行训练,具体过程为:
训练集中电容的标准化时序老化特征数据输入到改进的深度残差卷积神经网络模型提取得到序列中的特征向量,再将特征向量输入到长短时记忆网络中进行序列建模;将序列建模输入到全连接层,全连接层的最后一层通过softmax函数激映射得到概率序列,在此过程中对全连接层进行dropout操作,得到最后的分类结果,将分类结果与真实结果进行交叉熵损失函数计算,通过反向传播对模型优化,直至损失函数满足终止条件,最后由softmax层输出结果;
S42:将测试集输入到模型中,以评估模型的性能和预测能力。
优选的,所述S41中损失函数采用交叉损失熵函数:
式中:A为样本数量;B为类别数;tab表示第a个样本是否属于第b个类别;yab为属于类别b的样本a的输出,即softmax的输出,它表示网络将样本a归为类别b的概率。
优选的,所述S41中以0.5的概率对全连接层节点进行Dropout操作。
与现有技术相比,本发明具有以下有益效果:
1、本发明对深度残差卷积神经网络进行改进,引入了空洞卷积,可以在不引入额外参数的情况下增加卷积核的感受野,这意味着可以更有效地提取大范围的特征,同时保持较少的模型参数,有助于减少模型的计算复杂度和过拟合的风险,使改进的ResNet模型更容易泛化到新的数据集。
2、本发明对深度残差卷积神经网络中的残差基本模块分成了两种,一种采用了原有的1*1卷积模块,另一种则采用了值等映射,使得1*1卷积模块用来进行特征的维度降低的,等值映射用来提取深度特征,两者相互结合进一步提高特征提取的能力。
3、本发明在深度残差卷积神经网络中还引入了注意力机制,可以对特征的深层信息挖掘并进行基于通道优化的特征重组。
4、本发明将改进的深度残差卷积神经网络(ResNet)和长短时记忆网络(LSTM)相结合,充分利用了ResNet在图像处理中出色的特征提取能力和LSTM在序列建模中的优势,使得模型能够更好地捕捉时序数据中的关键特征,更适用于电容器老化状态评估任务,提高了检测的准确率和性能。通过这种结合,模型能够更全面地理解时序数据中的信息,更准确地预测电容器的老化状态,提高了检测的准确率。。
5、本发明仅需要通过模块化多电平换流器中的子模块开关频率波形即可进行电容的老化状态诊断,空洞卷积可以更好地捕获图像中的细节和上下文信息,子模块开关频率波形获取简单,因此本发明不需要额外的传感器或测量设备,使得本发明既能提高特征提取的能力又易于实现。
附图说明
图1为本发明基于改进深度残差的电容老化状态评估方法的流程图;
图2为现有技术的ResNet-18的结构示意图;
图3为本发明实施例中改进后的ResNet-18的结构示意图;
图4为本发明在ResNet模型中引入的ShuffleAttention原理图;
图5为本发明LSTM的特征提取示意图;
图6为本发明基于改进深度残差的电容老化状态评估模型示意图;
图7为本发明基于改进深度残差的电容老化状态评估模型训练流程图。
具体实施方式
为更好的理解本发明的技术方案,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
本发明公开了一种基于改进深度残差的电容老化状态评估方法,尤其是用于模块化多电平变流器子模块,具体实施步骤如图1所示:
S1:采集在线监测下使用多电平换流器(MMC)的柔性直流换流阀实际运行数据,获取子模块开关频率波形作为电容时序老化特征数据,对电容时序老化特征数据进行预处理,得到标准化时序老化特征数据集D并划分训练集与测试集。
其中,对电容时序老化特征数据进行预处理包括:处理噪声、缺失数据和异常值等问题,然后对预处理后的电容时序老化特征数据进行归一化处理,获得标准化时序老化特征数据集D,按照4:1的比例划分训练集和测试集。
本实施例中,标准化时序老化特征数据集D共含1800个数据样本,其中子模块电容正常样本1000个,子模块电容值下降5%、10%、15%、20%的电容老化样本各200个,每个样本包含子模块0.025s的投切状态信息,按照4:1的比例划分训练集和测试集,因此训练集为1440个和测试集为360个。
本实施例中电容时序老化特征数据选择了子模块开关频率波形,实际上也可以采用电容电压或桥臂电流等波形作为时序老化特征数据。
S2:建立改进的深度残差卷积神经网络(ResNet)模型。
S21:使用标准化时序老化特征数据集D特征训练现有ResNet模型,确定现有ResNet模型参数。
S22:构建改进的ResNet模型。
传统ResNet模型由输入层、第一卷积下采样层、最大池化层(MaxPool)、残差模块、全局平均池化层依次连接组成。其中残差模块包含有多个残差基本模块,根据残差基本块的数量,目前常用的ResNet模型有ResNet-18模型、ResNet-50模型等。本发明中的卷积下采样层是指在卷积后连接一个下采样。
在传统ResNet模型的基础上得到改进的ResNet模型,改进主要包括:对现有的ResNet模型残差模块中的残差基本模块进行改进,并在最后的残差模块与全局平均池化层之间加入了注意力机制模块。
S221:对残差基本块进行改进得到第一残差基本模块和第二残差基本模块。
本发明对现有残差基本块的改进分为两种,分别称为第一残差基本模块和第二残差基本模块,两者具体结构如下:
第一残差基本模块的具体结构为:当数据输入第一残差基本模块后分为3路,第一路为值等映射,即输入不进行任何改变直接作为输出结果;第二路为数据输入后依次经过第二卷积层(Conv)、BN层(Batch Normalization,批量样本的归一化)、第一ReLU激活函数、第二卷积层(Conv)、BN层后输出结果;第3路输入经过空洞卷积层输出结果;将3路输出的结果经过线性融合处理后再输入至第二ReLU激活函数,将第二ReLU激活函数的输出作为第一残差基本模块的输出。
第二残差基本模块的具体结构为:当数据输入第二残差基本模块后也分为3路,第一路为经过1*1卷积模块输出结果;第二路为数据输入后依次经过第二卷积层(Conv)、BN层、第一ReLU激活函数、第三卷积下采样层、BN层后输出结果;第3路输入经过空洞卷积层输出结果;将3路输出的结果经过线性融合处理后再输入至第二ReLU激活函数,将第二ReLU激活函数的输出作为第二残差基本模块的输出。
可以看出,现有残差基本模块中都只是分成两路,不需要经过空洞卷积层,并且第一路都是采用1*1卷积模块,而本申请将残差模块分成了两种,一种采用了原有的1*1卷积模块,另一种则采用了值等映射,这样处理的目的是因为1*1卷积模块是用来进行特征的维度降低的,值等映射是用来提取深度特征的。传统的卷积操作使用固定的卷积核大小,一定程度上限制了感受野的大小。而空洞卷积在卷积核的采样点之间引入固定的间隔,使得卷积核感受野的大小得到扩展。通过增加卷积核的空洞率,可以扩大感受野。,空洞卷积可以在不引入额外参数的情况下增加感受野,有助于减少模型的计算复杂度且减小过拟合风险。空洞卷积可以更好地捕获图像中的细节和上下文信息,对于本发明使用子模块开关频率波形作为电容时序老化特征数据,可以提高特征提取的能力。通过引入空洞卷积,ResNet还可以更好地处理数据中的长程依赖关系,从而提高网络的表达能力和性能。因此对残差基本模块进行改进可以针对子模块开关频率波形作为电容时序老化特征数据时,提高特征提取能力,进一步提高整个模型的性能指标。
S222:引入注意力机制模块。
注意力机制模块可以对特征的深层信息挖掘并进行基于通道优化的特征重组。本实施例中注意力机制模块采用置换注意力机制(Shuffle Attention),在特征图的通道维度上引入交互信息,通过对通道进行重新排列和交换来增强特征图中通道之间的交互性,从而提高模型的表达能力和性能。本实施例中的Shuffle Attention通过通道分组、通道拆分和特征融合来实现通道重组,Shuffle Attention原理如图4所示,具体实现为:
从残差模块输入特征图,至少包括3个参数:通道数c,高度Height,宽度Width,还可以包括每一批的数量Batch。
通道分组:将输入的c个通道分成g个组(g必须是c的约数)。例如,如果c=64,可以将其分成8个组,每个组包含8个通道。
通道拆分:对于每个组,将组内的通道进行重新排列。这个过程可以使用随机的方式,也可以使用特定的规则来重排通道的顺序,以增加通道之间的交互。
特征融合:将经过通道洗牌的各组特征图进行连接或逐元素相加,以融合各组之间的交互信息。这个过程可以使用逐元素相乘或其他注意力融合机制来实现。
S223:改进后的ResNet模型结构。
根据S221和S222,得到改进后的ResNet模型结构如下:
由输入层、第一卷积下采样层(Conv)、最大池化层、2个第一残差基本模块、N个第二残差基本模块和N个第一残差基本模块交替、注意力机制模块、全局平均池化层、拉平层(Flatten层)依次连接组成。
下面具体的以对ResNet-18模型的改进为例,进行详细说明。现有ResNet-18模型如图2所示,残差模块中共包括8个残差基本模块,因此改进后的ResNet-18模型结构如图3所示,依次为:输入层、第一卷积下采样层、最大池化层、第一残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、注意力机制模块、全局平均池化层以及Flatten层依次连接组成。
其中,第一卷积下采样层为大小为7*7的卷积后连接下采样步长为2的下采样,第一残差基本模块中的卷积层和第二残差基本模块中的第二卷积层都是大小为3*3的卷积层;第二残差基本模块中的第三卷积下采样层为大小3*3的卷积后连接下采样步长为2的下采样。第一残差基本模块和第二残差基本模块中的空洞卷积层都是大小为3*3的卷积层。第一残差基本模块和第二残差基本模块中的第一ReLU激活函数和第二ReLU激活函数可以相同,也可以不同,本实施例选择了两者相同。Flatten层用于把卷积层输出的多维数据展成一个一维向量,用于后续长短时记忆网络(LSTM)的输入。
这里以3x224x224的输入为例,使用改进后的ResNet-18模型进行特征提取过程如下:首先输入数据后,经过第一卷积下采样层得到64x 112x112的数据,然后经过最大池化层得到64x56x56的数据,接着经过两个第一残差基本模块,因为第一残差基本模块中只有卷积因此数据大小不变,仍然是64x56x56的数据,然后经过第二残差基本模块,因为第二残差基本模块中含有第三卷积下采样层,因此输出128x28x28的数据,按此规则继续,经过第一残差基本模块数据大小不变、经过第二残差模块输出256x14x14的数据,经过第一残差基本模块数据大小不变、经过第二残差基本模块输出512x7x7的数据、经过第一残差基本模块数据大小不变,然后经过注意力机制模块,注意力机制模块不改变数据大小,经过全局平均池化层输出512x1x1的数据,最后通过Flatten层将其变成一维的512个数据。
S3:建立基于改进深度残差的电容老化状态评估模型。
基于改进深度残差的电容老化状态评估模型结构(简称为“改进后模型”)如图6所示,具体为:
将S2得到的改进的深度残差卷积神经网络(ResNet)模型、现有的长短时记忆网络(LSTM)、全连接层、softmax函数依次连接,将softmax函数得到的概率序列作为基于改进深度残差的电容老化状态评估模型的输出。
本发明中将改进的ResNet和LSTM结合,将改进的ResNet提取的特征序列作为LSTM的输入序列,其中改进的ResNet用于网络提取特征,LSTM负责记忆,充分利用了ResNet在图像处理中出色的特征提取能力和LSTM在序列建模中的优势,使得模型能够更好地捕捉时序数据中老化状态的动态变化。先使用卷积网络提取图形的“特征”达到了降维的效果。LSTM对特征的提取如图5所示,LSTM解决了RNN无法处理长距离的依赖的问题,还能够解决神经网络中常见的梯度爆炸或梯度消失等问题。本发明改进后的ResNet模型由于引入了空洞卷积以及对特征的深层信息挖掘并进行基于通道优化的特征重组,与传统ResNet相比可以更好地处理数据中的长程依赖关系,与适用于处理长距离依赖问题的LSTM相结合可以更好的利用数据中的长程依赖关系,从而提高评估电容器老化状态的准确度。
S4:利用标准化时序老化特征数据集D对基于改进深度残差的电容老化状态评估模型进行训练。
S41:将标准化时序老化特征数据集D中的训练集输入到基于改进深度残差的电容老化状态评估模型中,对电容老化模型进行训练,如图7所示,具体过程为:
训练集中电容的标准化时序老化特征数据输入到改进的深度残差卷积神经网络(ResNet)模型提取得到序列中的特征向量,再将特征向量输入到长短时记忆网络(LSTM)中进行序列建模;将序列建模输入到全连接层,全连接层的最后一层通过softmax函数激映射得到概率序列,在此过程中对全连接层进行dropout操作(随机丢弃),得到最后的分类结果,将分类结果与真实结果进行交叉熵损失函数计算(通过反向传播对模型优化),直至损失函数满足终止条件(趋于平稳),最后由softmax层输出结果。
本实施例中,以0.5的概率对节点进行Dropout操作,计算损失函数。若损失函数不满足终止条件,就使用随机梯度下降(SGD)训练电容老化模型的卷积核和偏置矩阵,更新其参数,继续上述计算,直至损失函数满足终止条件,得到训练好的模型。
其中,损失函数采用交叉损失熵函数:
式中:A为样本数量;B为类别数;tab表示第a个样本是否属于第b个类别;yab为属于类别b的样本a的输出,即softmax的输出,它表示网络将样本a归为类别b的概率。
本实施例中,直接将电容老化状态分为了2类,分别为:电容未老化、电容老化;因此类别数B就为2。
S42:将测试集输入到模型中,以评估模型的性能和预测能力。
将测试集输入到训练好的电容状态模型中进行测试,根据实际标注的电容老化程度数据,将模型的预测结果与真实值进行比较和评估,当达到预定的指标后即认为模型训练完成,否则继续对模型进行训练。
表1多个模型性能指标对比
模型名称 | 精确率/% | 召回率/% | 特异度/% |
RepVGG | 93.0 | 93.3 | 93.3 |
ResNet18 | 94.0 | 94.1 | 94.1 |
EffficientNet | 93.0 | 94.1 | 94.1 |
Mobilenetv3 | 95.0 | 95.3 | 95.3 |
改进后模型 | 95.5 | 95.6 | 95.6 |
进一步,为证明本发明的有效性,在同一实验环境下进行了多种模型的对比训练,模型包括:RepVGG、ResNet18、EffficientNet、Mobilenetv3、以及改进后模型。计算相应的模型性能指标,性能指标选择了精准率、召回率和特异度,用于评估模型的性能和预测能力。如表1所示,改进后模型精准率达95.5%,同时在检测召回率和检测特异度性能方面均具有最高的检测效果。
S5:输入新的子模块开关频率波形,判断电容的老化状态。
将新的子模块开关频率波形作为电容老化特征数据输入到基于改进深度残差的电容老化状态评估模型中,输出对电容老化状态的判断结果。
本发明仅需要子模块开关频率波形数据,就可以判断电容的老化状态,不再需要额外的传感器或测量设备,而且精准度高于现有的方法,使得电容老化状态的诊断更加便捷、精确,降低了电容老化状态的评估复杂度。
最后应说明的是:以上所述的各实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (8)
1.一种基于改进深度残差的电容老化状态评估方法,其特征在于:其包括以下步骤:
S1:采集在线监测下使用多电平换流器柔性直流换流阀实际运行数据,获取子模块开关频率波形作为电容时序老化特征数据,对电容时序老化特征数据进行预处理,得到标准化时序老化特征数据集D并划分训练集与测试集;
S2:建立改进的深度残差卷积神经网络模型;
S21:使用标准化时序老化特征数据集D特征训练现有ResNet模型,确定现有ResNet模型参数;
S22:构建改进的ResNet模型;
S221:对残差基本块进行改进得到第一残差基本模块和第二残差基本模块;两者具体结构如下:
第一残差基本模块的具体结构为:当数据输入第一残差基本模块后分为3路,第一路为值等映射,即输入不进行任何改变直接作为输出结果;第二路为数据输入后依次经过第二卷积层、BN层、第一ReLU激活函数、第二卷积层BN层后输出结果;第3路输入经过空洞卷积层输出结果;将3路输出的结果经过线性融合处理后再输入至第二ReLU激活函数,将第二ReLU激活函数的输出作为第一残差基本模块的输出;
第二残差基本模块的具体结构为:当数据输入第二残差基本模块后也分为3路,第一路为经过1*1卷积模块输出结果;第二路为数据输入后依次经过第二卷积层、BN层、第一ReLU激活函数、第三卷积下采样层、BN层后输出结果;第3路输入经过空洞卷积层输出结果;将3路输出的结果经过线性融合处理后再输入至第二ReLU激活函数,将第二ReLU激活函数的输出作为第二残差基本模块的输出;
S222:引入注意力机制模块;
在最后的残差基本模块与全局平均池化层之间加入了注意力机制模块;
S223:改进后的ResNet模型结构如下:
由输入层、第一卷积下采样层(Conv)、最大池化层、2个第一残差基本模块、N个第二残差基本模块和N个第一残差基本模块交替、注意力机制模块、全局平均池化层、拉平层(Flatten层)依次连接组成;
S3:建立基于改进深度残差的电容老化状态评估模型;
将S2得到的改进的深度残差卷积神经网络模型、现有的长短时记忆网络、全连接层、softmax函数依次连接,将所述softmax函数得到的概率序列作为基于改进深度残差的电容老化状态评估模型的输出;
S4:利用标准化时序老化特征数据集D对基于改进深度残差的电容老化状态评估模型进行训练;
S5:输入新的子模块开关频率波形,判断电容的老化状态。
2.根据权利要求1所述的基于改进深度残差的电容老化状态评估方法,其特征在于:所述S223中改进的ResNet模型为ResNet-18模型,改进后的ResNet-18模型结构依次为:输入层、第一卷积下采样层、最大池化层、第一残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、第二残差基本模块、第一残差基本模块、注意力机制模块、全局平均池化层以及Flatten层依次连接组成。
3.根据权利要求2所述的基于改进深度残差的电容老化状态评估方法,其特征在于:所述改进后的ResNet-18模型中,第一卷积下采样层为大小为7*7的卷积后连接下采样步长为2的下采样,第一残差基本模块中的卷积层和第二残差基本模块中的第二卷积层都是大小为3*3的卷积层;第二残差基本模块中的第三卷积下采样层为大小3*3的卷积后连接下采样步长为2的下采样;第一残差基本模块和第二残差基本模块中的空洞卷积层都是大小为3*3的卷积层,且第一残差基本模块和第二残差基本模块中的第一ReLU激活函数和第二ReLU激活函数相同。
4.根据权利要求1所述的基于改进深度残差的电容老化状态评估方法,其特征在于:所述S1中对电容时序老化特征数据进行预处理包括:处理噪声、缺失数据和异常值,然后对预处理后的电容时序老化特征数据进行归一化处理,获得标准化时序老化特征数据集D,按照4:1的比例划分训练集和测试集。
5.根据权利要求1所述的基于改进深度残差的电容老化状态评估方法,其特征在于:所述S222中注意力机制模块采用置换注意力机制。
6.根据权利要求1所述的基于改进深度残差的电容老化状态评估方法,其特征在于:所述S4包括:
S41:将标准化时序老化特征数据集D中的训练集输入到基于改进深度残差的电容老化状态评估模型中,对所述电容老化模型进行训练,具体过程为:
训练集中电容的标准化时序老化特征数据输入到改进的深度残差卷积神经网络模型提取得到序列中的特征向量,再将特征向量输入到长短时记忆网络中进行序列建模;将序列建模输入到全连接层,全连接层的最后一层通过softmax函数激映射得到概率序列,在此过程中对全连接层进行dropout操作,得到最后的分类结果,将分类结果与真实结果进行交叉熵损失函数计算,通过反向传播对模型优化,直至损失函数满足终止条件,最后由softmax层输出结果;
S42:将测试集输入到模型中,以评估模型的性能和预测能力。
7.根据权利要求6所述的基于改进深度残差的电容老化状态评估方法,其特征在于:所述S41中损失函数采用交叉损失熵函数:
式中:A为样本数量;B为类别数;tab表示第a个样本是否属于第b个类别;yab为属于类别b的样本a的输出,即softmax的输出,它表示网络将样本a归为类别b的概率。
8.根据权利要求6所述的基于改进深度残差的电容老化状态评估方法,其特征在于:所述S41中以0.5的概率对全连接层节点进行Dropout操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311210467.4A CN117388703A (zh) | 2023-09-19 | 2023-09-19 | 基于改进深度残差的电容老化状态评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311210467.4A CN117388703A (zh) | 2023-09-19 | 2023-09-19 | 基于改进深度残差的电容老化状态评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117388703A true CN117388703A (zh) | 2024-01-12 |
Family
ID=89436364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311210467.4A Pending CN117388703A (zh) | 2023-09-19 | 2023-09-19 | 基于改进深度残差的电容老化状态评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117388703A (zh) |
-
2023
- 2023-09-19 CN CN202311210467.4A patent/CN117388703A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN113358993B (zh) | 一种多电平变换器igbt的在线故障诊断方法及系统 | |
CN115630847A (zh) | 一种基于数据预测的收发组件检测方法、系统及存储介质 | |
CN106022352A (zh) | 基于支持向量机的潜油柱塞泵故障诊断方法 | |
CN115392782A (zh) | 一种核电厂工艺系统健康状态监测和诊断方法及系统 | |
CN115618732A (zh) | 核反应堆数字孪生关键参数自主优化数据反演方法 | |
CN116306806A (zh) | 故障诊断模型确定方法、装置及非易失性存储介质 | |
CN117273489A (zh) | 光伏状态评估方法及装置 | |
CN116295948A (zh) | 大温差环境下工业温度传感器的异常检测方法、系统及存储介质 | |
CN116011158A (zh) | 一种低压台区的拓扑识别方法、系统及装置 | |
CN107977672A (zh) | 基于海量数据并行运算的sf6设备二级故障诊断方法 | |
CN113820615B (zh) | 一种电池健康度检测方法与装置 | |
CN113533995B (zh) | 一种动力电池一致性检测方法 | |
CN105182219A (zh) | 一种基于汉明纠错码支持向量机的功率变换器故障分类方法 | |
CN114036647A (zh) | 一种基于实车数据的动力电池安全风险评估方法 | |
CN114330486A (zh) | 基于改进Wasserstein GAN的电力系统不良数据辨识方法 | |
CN116994641A (zh) | 一种半导体老化测试方法及其系统 | |
CN117388703A (zh) | 基于改进深度残差的电容老化状态评估方法 | |
CN112380763A (zh) | 一种基于数据挖掘的堆内构件可靠性分析系统及方法 | |
CN116662800A (zh) | 一种基于自适应注意力机制的滚动轴承故障诊断方法 | |
CN113204894B (zh) | 一种电能计量异常诊断模型的构建方法及应用 | |
CN113255771B (zh) | 基于多维异构差异分析的故障诊断方法及系统 | |
CN115935814A (zh) | 一种基于arima-svm模型的变压器故障预测方法 | |
CN112880726A (zh) | 基于变分模态分解样本熵的传感器故障诊断方法和装置 | |
CN113325317A (zh) | 基于改进rbf神经网络的动力电池故障诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |