CN116911150A

CN116911150A - 一种电磁能装备场云图预测方法

Info

Publication number: CN116911150A
Application number: CN202310256970.7A
Authority: CN
Inventors: 金亮; 尹振豪; 巩德鑫; 刘元凯; 张陈源
Original assignee: Hebei University of Technology
Current assignee: Hebei University of Technology
Priority date: 2023-03-16
Filing date: 2023-03-16
Publication date: 2023-10-20

Abstract

本发明提供了一种电磁能装备场云图预测方法，包括如下步骤：使用数值模拟方法对电磁能装备进行仿真建模，得到电磁能装备场云图数据集，并生成图片序列；将图片序列划分为训练集和测试集，并对图片序列进行数据预处理操作；搭建基于卷积神经网络和Transformer的电磁能装备场云图预测模型；将数据预处理后的图片序列输入到云图预测模型，对云图预测模型进行训练，使用训练好的云图预测模型，预测未来时刻的电磁能装备场时空分布特性云图，并根据预测结果进行模型的评价分析。本发明有益效果：将卷积神经网络与Transformer相结合，利用Transformer长距离特征捕获能力，充分提取电磁能装备场云图的时空特性，提高场时空特性云图的预测精度。

Description

一种电磁能装备场云图预测方法

技术领域

本发明属于数值模拟和深度学习领域，尤其是涉及一种电磁能装备场云图预测方法。

背景技术

研究电磁能装备的场分布特性是电磁综合性能分析与可靠性统一设计的基础。

实际工况下，电磁能装备涉及电磁热力耦合复杂的多物理场问题，现有的数值模拟方法很难实现电磁能装备多物理场强耦合问题的全真模拟。深度学习技术具有无需特征提取、适应性强、易于转换等优点。

卷积神经网络(ConvolutionalNeuralNetwork，CNN)是深度学习技术中最成功的一个分支，具有强大的空间特征提取能力，可以对电磁能装备场云图的空间特征进行有效提取。但是卷积神经网络由于存在固有局部性的局限性，在建立局部图像特征之间的远程依赖关系方面能力有限。

Transformer网络具有较强的长距离特征捕获能力，任务综合特征抽取能力，并行计算能力及运算效率，可以挖掘电磁能装备场云图时间序列信息之间的多种长距离关联性。

单纯的卷积神经网络擅长提取电磁能装备场云图的空间特征，如果将卷积神经网络用于预测具有时空特性的电磁能装备场云图，需耗费大量的时间成本且预测精度无法保证。

发明内容

有鉴于此，本发明旨在提出一种电磁能装备场云图预测方法，将CNN与Transformer网络结合，充分提取电磁能装备场云图的时空特征，实现电磁能装备的场云图高精度预测，降低数值模拟样本计算量需求和时间成本。

为达到上述目的，本发明的技术方案是这样实现的：

一种电磁能装备场云图预测方法，包括如下步骤：

S1：使用数值模拟方法对电磁能装备进行仿真建模，得到电磁能装备场云图数据集，并生成图片序列；

S2：将图片序列划分为训练集和测试集，并对图片序列进行数据预处理操作；

S3：搭建基于卷积神经网络和Transformer的电磁能装备场云图预测模型；

S4：将数据预处理后的图片序列输入到云图预测模型，对云图预测模型进行训练，使用训练好的云图预测模型，预测未来时刻的电磁能装备场时空分布特性云图，并根据预测结果进行模型的评价分析。

进一步的，步骤S2中，对图片序列进行数据预处理，包括对图片的归一化处理、灰度化、图片裁剪、图片旋转与平移；

所述对图片的归一化处理通常是将像素值简单缩放到[0,1]区间，其公式为：其中，x为图像像素点值，xmax、xmin分别为图像像素的最大与最小值。

进一步的，所述电磁能装备场云图预测模型包括编码器和解码器两部分；

通过电磁能装备场云图预测模型，预测未来时刻的电磁能装备场时空分布特性云图的过程如下：

A1：将使用卷积神经网络对输入的图片序列进行卷积操作，提取图片的空间特征，得到具有代表性的图片序列特征；

A2：将进行卷积操作后得到的图片序列特征进行位置顺序编码，并将位置顺序编码与特征图片序列按位相加，用于位置识别，建立长时间序列的依赖性；

A3：将具有时空特征的特征图片序列送入到Transformer网络，使用编码器得到更高级别的特征，使用解码器将编码器得到的高级特征解码；

A4：将解码后的特征图片输入到前馈神经网络以得到最终的预测结果。

进一步的，步骤A1中，对输入的图片序列进行卷积操作时，对每一时刻的图片经行四次卷积操作，将每一时刻的图片映射为d_model维的特征图片，图片序列每一次卷积操作后引入修正线性单元激活函数，以增强网络的非线性。

进一步的，所述Transformer网络中全部采用卷积自注意力机制，所述卷积自注意力机制不关注输入特征向量的位置关系；

使用编码器得到更高级别的特征的过程中，采用位置编码确定Transformer网路中的图片序列的相对位置信息，位置编码后的图片特征维度与经过四次卷积操作的图片特征维度相同；

将位置编码后的图片特征维度与相对应的经过四次卷积操作的图片特征维度相加，相加后的图片序列同时具备空间特征与相对位置信息。

进一步的，所述电磁能装备场云图预测模型的编码器由N个相同的子模块构成，每个子模块由两个子层组成；

所述编码器每个子模块的两个子层采用多头卷积自注意力机制和二维卷积前馈神经网络代替原始Transformer网络中的多头自注意力机制和前馈神经网络；

所述电磁能装备场云图预测模型的解码器由N个相同的子模块组成；

所述解码器每个子模块由三个子层组成，包括编码器两个相同的子层，以及在多头卷积自注意力机制层前，增加的卷积自注意力层。

进一步的，使用卷积自注意力机制，学习输入电磁能装备不同时刻下场云图序列特征之间相互作用关系；

使用卷积神经网络对键项矩阵和查询项矩阵进行卷积操作。

进一步的，所述多头卷积自注意力机制对每一时刻的电磁能场云图的特征并行h次注意力计算，将单一的卷积自注意力模块映射到多个不同的子空间，关注来自不同位置的子空间信息。

进一步的，在步骤S4中，对电磁能装备场云图预测模型进行训练时采用梯度下降算法计算网络的梯度和更新权重参数，选择均方误差作为损失函数来调整所有层的权重；同时采用自适应矩估计优化器作为最小化目标函数。

进一步的，对模型进行评价分析时，采用平均绝对误差和平均绝对百分比误差对预测误差进行分析。

相对于现有技术，本发明所述的一种电磁能装备场云图预测方法具有以下有益效果：

(1)将卷积神经网络与Transformer相结合，利用Transformer长距离特征捕获能力，充分提取电磁能装备场云图的时空特性，提高场时空特性云图的预测精度。

(2)建立基于卷积神经网络和Transformer的电磁能装备场云图预测模型,从而减少数值模拟方法的时间成本和计算量需求，甚至突破数值模拟方法在求解三维复杂电磁能装备场分布特性的瓶颈。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明实施例所述的电磁能装备场云图预测方法流程示意图；

图2为本发明实施例所述的电磁能装备场云图预测模型结构示意图；

图3为本发明实施例所述的多头卷积自注意力机制和卷积自注意力机制示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

下面将参考附图并结合实施例来详细说明本发明。

一种电磁能装备场云图预测方法，包括如下步骤：

使用数值模拟方法对电磁能装备进行仿真建模时，需对不同时刻下电磁能装备场的特性进行准确数值模拟，得到不同时刻下电磁能装备的场云图数据集；

将不同时刻下图片序列以一定比例划分为训练集和测试集。对图片序列进行数据预处理，包括对图片的归一化处理、灰度化、图片裁剪、图片旋转与平移等操作。其中，对图片的归一化处理通常是将像素值简单缩放到[0,1]区间，其公式为：

其中，x为图像像素点值，x_max、x_min分别为图像像素的最大与最小值。

电磁能装备场云图预测模型整体分为编码器和解码器两部分。首先利用卷积神经网络对输入的图片序列进行卷积操作，提取图片的空间特征，得到具有代表性的特征图片。然后将进行卷积操作后的序列特征图片进行位置编码，并与序列特征图片按位相加，用于位置识别，建立长时间序列的依赖性。将具有所述时空特征送入到Transformer网络，编码器用于得到更高级别的特征，解码器用于将编码器得到的高级特征解码。最后，将解码后的特征图输入到前馈神经网络以得到最终的预测结果。

对输入的图片序列进行卷积操作时，对每一时刻的图片经行四次卷积操作，每一次卷积操作后引入修正线性单元(ReLU)激活函数增强网络的非线性。每一时刻的场云图可以表示为H、W分别对应场云图的高度和宽度，3为场云图的通道数，i代表不同的时刻。经过四次卷积操作，将每一时刻的图片映射为d_model维的特征图片，即每一时刻的场云图表示为/>整体过程可以表示为/> 表示四层卷积映射，所有时刻的场云图具有相同的卷积网路结构/>且共享权重参数θ_F。

Transformer网络中全部采用注意力机制，注意力机制不关注输入特征向量的位置关系。所以采用位置编码保证输入Transformer网路中的图片序列的相对或绝对位置信息，位置编码后的图片特征维度与经过四次卷积操作的图片特征维度相同，因此两者可以按位进行相加，相加后的图片序列同时具备空间特征与相对位置信息。经过四次卷积操作的图片序列特征表示为H_i，则上述过程可以表示为Pos_Map_(i)表示位置编码所需的映射函数。

电磁能装备场云图预测模型的编码器由N个相同的子模块构成，每个子模块由两个子层组成。与原始Transformer网络不同之处为：电磁能装备场云图预测模型Transformer编码器每个子模块的两个子层采用多头卷积自注意力机制和二维卷积前馈神经网络代替原始Transformer网络中的多头自注意力机制和前馈神经网络。在两个子层的周围引入残差连接，经过残差连接的内部数据可以描述为：

Z′＝MultiHead(Z)+Z

Z_output＝FFN(Z′)+Z′

其中，Z_output和Z分别为整个编码器子模块的输出和输入特征矩阵，MultiHead(Z)表示多头卷积自注意力机制，FFN(Z′)表示二维卷积前馈神经网络，Z′为二维卷积前馈神经网络的输入矩阵。

输入编码器的特征序列表示为经过编码器后的特征序列可以表示为/>整个编码操作可以表示为/>

电磁能装备场云图预测模型的解码器同样由N个相同的子模块组成。解码器每个子模块由三个子层组成，除编码器两个相同的子层外，在多头卷积自注意力机制层之前增加了卷积自注意力层。输入解码器的特征序列为解码后的序列特征为/>则整个解码过程可以表示为/>

卷积自注意力机制可以很好地学习输入电磁能装备不同时刻下场云图序列特征之间相互作用关系。与自注意力机制不同，卷积自注意力机制利用卷积神经网络提取输入场特性云图的空间特性，在计算过程中引入卷积操作。对于输入序列特征对于不同时刻的图片序列特征，定义三个权重矩阵对输入序列特征U执行卷积操作得到查询项矩阵/>键项矩阵/> 值项矩阵/>具体计算公式为：

Q＝W^Q*U

K＝W^K*U

V＝W^V*U

式中，*表示卷积操作，

利用卷积神经网络对键项矩阵和查询项矩阵进行卷积操作，值项矩阵的计算方式不变，卷积自注意力机制的计算公式为：

式中，查询项矩阵Q，键项矩阵K，值项矩阵V本质上是对嵌入序列特征从d_model维到d_k维的映射，softmax函数将计算结果平滑至0-1区间，引入缩放因子以避免卷积运算数值过大，*代表卷积运算。

多头卷积自注意力机制对每一时刻的电磁能场云图的特征并行h次注意力计算，将单一的卷积自注意力模块映射到多个不同的子空间，允许模型共同关注来自不同位置的子空间信息，扩展了模型专注于不同特征的能力。多头卷积自注意力机制的计算公式为：

head_i＝Attention(Q_i，K_i，V_i)

MultiHead(Q，K，V)＝Concat(head₁，head₂，…，head_i)W^O

式中，head_i表示第i个头的注意力权重，Q_i、K_i、V_i表示第i个头的查询项矩阵、键项矩阵和值项矩阵，Concat表示拼接多个不同子空间的注意力分布，经过权重矩阵W^O线性变换得到最终的输出，*代表卷积运算。

解码器后的前馈神经网络由全连接神经网络组成，为保证网络可以映射复杂的非线性函数，引入ReLU激活函数。从解码器输出的场云图序列特征被并行地送入到前馈神经网络中，得到最终的预测结果。从解码器输出的特征序列表示为则这一过程可以描述为/> 其中/>代表前馈神经网络，/>代表最终的预测结果。

S4：将预处理后的图片序列输入到云图预测模型，对云图预测模型进行训练；

对电磁能装备场云图预测模型进行训练时采用梯度下降算法计算网络的梯度和更新权重参数，选择均方误差(MeanSquareError，MSE)作为损失函数来调整所有层的权重，损失函数的计算公式为：

其中，Loss为损失函数，和/>分别t+1时刻的真实值和预测值，N为样本个数。

采用自适应矩估计(AdaptiveMomentEstimation，Adam)优化器作为最小化目标函数，在收敛速度和计算效率方面具有很好的优势。Adam优化算法的迭代过程如下：

其中，t为迭代次数，初始值为0；f_t(w_t-1)为损失函数；w_t为权重参数；g_t为损失函数的梯度；m_t为一阶矩估计，m₀为0；v_t为二阶矩估计，v₀为0；为修正后的一阶矩估计；/>为修正后的二阶矩估计。

S5：使用训练好的云图预测模型，预测未来时刻的电磁能装备场时空分布特性云图，并根据预测结果进行模型的评价分析。

对模型进行评价分析时，采用平均绝对误差(MeanAbsoluteError)和平均绝对百分比误差(MeanAbsolutePercentageError，MAPE)对预测误差进行分析，计算公式如下：

式中，为模型预测输出，y为真实值，N为样本数量，平均绝对误差和平均绝对百分比误差越小，表示模型预测结果的精度越高。

工作过程一：

以40mm×50mm中口径轨道发射装置为研究对象，电枢质量为300g，电枢从0ms加速运动至3.0ms时间段内。根据发射试验中枢轨模型参数和激励条件，建立电磁轨道炮有限元仿真模型。将时间步设定为0.0015ms，以获得充足的样本数据。在电流恒定阶段(0.5ms～1.4ms)能够得到稳定数值模拟的600组磁场云图样本数据，其中500组磁场云图用于模型训练，100组磁场云图作为测试数据评估模型的性能。

为了保证网络训练时收敛加快，提高模型性能，需模型训练前进行图像预处理工作。从而消除无关信息，改善图像效果，突出图像特征，便于计算机进行识别和分析。由于电磁轨道炮的磁场云图将像素值简单缩放归一化到[0，1]区间，公式为

式中，x为图像像素点值，x_max、x_min分别为图像像素的最大与最小值。

考虑到每张图像分布位置与倾斜角度的不统一，该信息的差异与电磁轨道炮模型无直接关联，但会被网络作为特征进行提取并训练，最终会影响模型的性能。所以，需要对图像进行裁剪。

搭建基于卷积神经网络和Transformer的电磁轨道炮磁场云图预测模型，对输入的电磁轨道炮磁场云图序列进行卷积操作，对每一时刻的图片经行四次卷积操作，每一次卷积操作后引入批标准化(BatchNormalization)层和修正线性单元(ReLU)激活函数，批标准化层可以将输入到激活层中分散的数据标准化，起到优化网络的效果。采用位置编码保证输入Transformer网路中的图片序列的相对或绝对位置信息，这里位置编码采用正余弦函数，计算公式如下：

式中，pos代表序列长度，i代表特征向量的维度下标，d_model为特征长度。由于正弦和余弦函数具有周期性，位置编码的每个维度对应于不同周期的正余弦函数，从而产生独一的纹理位置信息，最终识别特征间的相对位置关系。

将预处理后的电磁轨道磁场云图数据输入到云图预测模型，对云图预测模型进行训练。学习率(Learningrate)是模型训练过程中的重要超参数，学习率过小或过大都不利于模型的训练，合适的学习率有助于加快模型的收敛。理想的学习率应该在训练初始阶段不可过小，以确保模型的收敛速度；当目标函数在最优值附近收敛时，学习率应逐渐递减，以避免振荡或不收敛。

本实施案例在Adam优化算法的基础上采用余弦退火算法自适应地调整学习率，使得学习率随着训练步数逐渐减少，动态变化学习率公式为：

式中，和/>代表学习率变化的范围，T_cur代表最近一次重启后经历的epoch数，T_i代表每个调整周期内epoch总数。

将训练好的云图预测模型预测未来时刻电磁轨道炮磁场时空分布特性云图，并根据预测结果进行模型的评价分析。

工作过程二：

以40mm×50mm中口径轨道发射装置为研究对象，电枢质量为300g，电枢从0ms加速运动至3.0ms时间段内。根据发射试验中枢轨模型参数和激励条件，建立电磁轨道炮有限元仿真模型。将时间步设定为0.0015ms，以获得充足的样本数据。在电流恒定阶段(0.5ms～1.4ms)能够得到稳定数值模拟的600组电流场云图样本数据，其中500组电流场云图用于模型训练，100组电流场云图作为测试数据评估模型的性能。

搭建基于卷积神经网络和Transformer的电磁轨道炮磁场云图预测模型，对输入的电磁轨道炮磁场云图序列进行卷积操作，对每一时刻的图片经行四次卷积操作，每一次卷积操作后引入批标准化(BatchNormalization)层和修正线性单元(ReLU)激活函数，批标准化层可以将输入到激活层中分散的数据标准化，起到优化网络的效果。采用位置编码保证输入Transformer网路中的图片序列的相对或绝对位置信息，这里位置编码采用独热编码。

将预处理后的电磁轨道电流场云图数据输入到云图预测模型，对云图预测模型进行训练。为抑制网络训练过程中出现的过拟合现象，引入TargetedDropout算法。TargetedDropout算法的核心思想是对神经元和权重的重要性进行排序，随机丢弃重要性较低的元素。其具体实现方法为：

1)剪枝操作：对参数化的神经网络W_a按照权重剪枝与单元剪枝的方法进行剪枝操作，寻找最优参数θ^*，在保留神经网络最高数量级的k个权重的同时使得损失函数ε(W(θ^*))尽可能少。权重剪枝和单元剪枝运算如下：

式中，ε(W(θ))为网络损失函数；W_c为网络权重矩阵；argmax-k为返回所有元素中最大的k个元素的函数；w_o为权重矩阵W第o列列向量；W_io为权重矩阵第i行，第o列元素；N_col、N_row分别代表参数矩阵列数与行数。

2)引入随机性：为将随机性引入这个过程，使用靶向比例γ和删除概率α。其中靶向比例γ表示Dropout候选权值为最小的γ|θ|个权重，并以删除概率α独立地去除候选集合中的权值。

TargetedDropout算法将事后剪枝策略结合到神经网络的训练过程中，可有效抑制模型的过拟合现象，提升模型的泛化水平。

将训练好的云图预测模型预测未来时刻电磁轨道炮电流场云图时空分布特性云图，并根据预测结果进行模型的评价分析。对模型进行评价分析时，采用平均绝对误差(MeanAbsoluteError)和平均绝对百分比误差(MeanAbsolutePercentageError，MAPE)对预测误差进行分析，计算公式如下：

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和系统，可以通过其它的方式实现。例如，以上所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。上述单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种电磁能装备场云图预测方法，其特征在于：

包括如下步骤：

2.根据权利要求1所述的一种电磁能装备场云图预测方法，其特征在于：

步骤S2中，对图片序列进行数据预处理，包括对图片的归一化处理、灰度化、图片裁剪、图片旋转与平移；

3.根据权利要求1所述的一种电磁能装备场云图预测方法，其特征在于：

所述电磁能装备场云图预测模型包括编码器和解码器两部分；

4.根据权利要求3所述的一种电磁能装备场云图预测方法，其特征在于：

步骤A1中，对输入的图片序列进行卷积操作时，对每一时刻的图片经行四次卷积操作，将每一时刻的图片映射为d_model维的特征图片，图片序列每一次卷积操作后引入修正线性单元激活函数，以增强网络的非线性。

5.根据权利要求3所述的一种电磁能装备场云图预测方法，其特征在于：

所述Transformer网络中全部采用卷积自注意力机制，所述卷积自注意力机制不关注输入特征向量的位置关系；

6.根据权利要求3所述的一种电磁能装备场云图预测方法，其特征在于：

所述电磁能装备场云图预测模型的编码器由N个相同的子模块构成，每个子模块由两个子层组成；

7.根据权利要求5所述的一种电磁能装备场云图预测方法，其特征在于：

使用卷积自注意力机制，学习输入电磁能装备不同时刻下场云图序列特征之间相互作用关系；

使用卷积神经网络对键项矩阵和查询项矩阵进行卷积操作。

8.根据权利要求6所述的一种电磁能装备场云图预测方法，其特征在于：

所述多头卷积自注意力机制对每一时刻的电磁能场云图的特征并行h次注意力计算，将单一的卷积自注意力模块映射到多个不同的子空间，关注来自不同位置的子空间信息。

9.根据权利要求1所述的一种电磁能装备场云图预测方法，其特征在于：

在步骤S4中，对电磁能装备场云图预测模型进行训练时采用梯度下降算法计算网络的梯度和更新权重参数，选择均方误差作为损失函数来调整所有层的权重；同时采用自适应矩估计优化器作为最小化目标函数。

10.根据权利要求1所述的一种电磁能装备场云图预测方法，其特征在于：

对模型进行评价分析时，采用平均绝对误差和平均绝对百分比误差对预测误差进行分析。