CN111428862A

CN111428862A - 一种极类不平衡时空联合对流初生短临预报方法

Info

Publication number: CN111428862A
Application number: CN202010186368.7A
Authority: CN
Inventors: 刘佑达; 陈建军; 张扬
Original assignee: CETC 14 Research Institute
Current assignee: CETC 14 Research Institute
Priority date: 2020-03-17
Filing date: 2020-03-17
Publication date: 2020-07-17
Anticipated expiration: 2040-03-17
Also published as: CN111428862B

Abstract

本发明公开了一种极类不平衡时空联合对流初生短临预报方法，包括以下步骤：提取多时次多通道气象卫星数据，与基于雷达观测的对流事件标签进行配准，生成训练数据和测试数据；对训练数据进行重采样提高包含对流云比例；对进行重采样的训练数据进行预处理；构建用于进行多通道卫星数据识别的神经网络；对总损失函数针对类不平衡进行优化；将预处理的训练数据输入神经网络进行训练，直至训练损失降低到阈值以下；对对流初生进行预测。本发明实现了对流初生短临预报，应用卷积神经网络实现卫星遥感范围内所有云目标的形态、运动的特征提取，配合神经网络可大幅降低对流初生短临预报问题的计算量，提高了对流初生短临预报方法的实时性、可移植性。

Description

一种极类不平衡时空联合对流初生短临预报方法

技术领域

本发明涉及气象领域，具体涉及对流初生短临预报方法。

背景技术

在气象领域中，强对流可能演变成大风、雷暴、强降水、龙卷风等多种灾害天气，对物流、航空、农业、能源等领域具有重大影响。对强对流的精细化、精准化预报对提高抗灾能力、挽回国民经济损失有重要意义。世界范围内已经对强对流的形成机理和预报预防开展了多年的研究。要进一步提高强对流的预报时效与准确性，需要针对强对流形成前的状态进行监测与预报，即关注对流的初生过程。对流初生是天气系统中积云向积雨云转变的事件，标志着后续将有强对流产生。实现对流初生的短临预报可将强对流衍生的灾害天气预报时效提前1～2小时，将大大延长气象灾害应对的决策与执行时间。对流初生短临预报是气象短临预报领域中的重要前沿问题，对提高强对流灾害预警时效与准确度具有重要意义。

对流初生短临预报需要监测积云，同时估计积云未来的运动趋势与强弱变化，进而判断积云生长成强对流云的时刻，建模复杂度高，预报时效要求达到2小时，导致预报精度难以提高。广泛分布的多普勒气象雷达对积云的观测能力较弱，观测范围受限。相比之下同步卫星可观测整个半球的气象信息，各种类型云目标均可捕捉，因此对流初生短临预报多采用卫星遥感数据作为预报输入。学术上对流初生短临预报包括积云目标识别、积云目标匹配、积云多目标跟踪、积云强度估计、对流初生预测、预测结果融合等步骤。每个步骤都可能引入误差，导致误差累计；且多目标跟踪、对流初生预测难度较大，对流初生短临预报的精度难以提高。

发明内容

本发明旨在提出一种卷积神经网络结构，提高卫星视野范围内的积云识别精度，有效挖掘极类不平衡的对流初生数据样本，同时学习所有积云的运动、形态与强度变化，提高对流初生短临预报的准确性，从而提高对流初生短临预报的时效与精度。

具体而言本发明提供了一种极类不平衡时空联合对流初生短临预报方法，其特征在于，所述对流初生短临预报方法包括以下步骤：

步骤S1：提取多时次多通道气象卫星数据，与基于雷达观测的对流事件标签进行配准，生成训练数据和测试数据；

步骤S2：对所述训练数据进行重采样提高包含对流云比例；

步骤S3：对所述进行重采样的训练数据进行预处理；

步骤S4：构建用于进行多通道卫星数据识别的神经网络；

步骤S5：对所述神经网络总损失函数针对类不平衡进行优化；

步骤S6：将所述预处理的训练数据输入所述神经网络进行训练，直至训练损失降低到阈值以下；

步骤S7：封装训练好的神经网络模型，输入卫星观测数据对未来某一时刻对流初生进行预测。

更进一步地，在步骤S2中，所述训练数据中包含对流云的样本记为正样本，将没有对流云的样本记为负样本；

随机抽取M＝[m×d/r]个样本，若M个样本中包含正样本个数少于md个，则再抽取M个样本，将其中的正样本与之前的正样本合并，重复直至正样本个数超过md个；其中，r是正样本真实占比，d是设定训练神经网络中输入的正样本比例最小值，m是单次训练的批个数。

更进一步地，在步骤S3中，还包括以下步骤；

步骤S31：输入多通道卫星数据与标签进行值归一化与尺寸归一化；

步骤S32：对输入的训练数据与标签同时进行数据增强，通过数据增强增加现有数据量；所述数据增强的方法包括将所述训练数据和标签进行平移、缩放和上下翻转。

在步骤S4中，所述神经网络包括主干网络和第一至第四上采样卷积层；

所述主干网络包括依次连接的第一至第五卷积组；

在数据输入所述第一卷积组前还设有降维卷积层，所述降维卷积层包括尺寸为1×1×1的卷积核，用于调整所述神经网络输入通道数，将输入数据样本的通道压缩到3；

所述第五卷积组的输出与所述第一上采样卷积层的输入连接；所述第一上采样卷积层的输出与所述第四卷积组的输出拼接，并与第二上采样卷积层的输入连接；第二上采样卷积层的输出与所述第三卷积组的输出拼接，并与第三上采样卷积层的输入连接；第三上采样卷积层的输出与所述第二卷积组的输出拼接，并与第四上采样卷积层的输入连接；第四上采样卷积层的输出与所述第一卷积组的输出拼接作为神经网络的最终结果输出。

更进一步地，在步骤S5中，所述总损失函数采用Focal loss进行极类不平衡补偿约束，所述极类不平衡补偿约束是：

其中，I为对流初生标签，

为输出的对流初生预报结果，i、j为横纵坐标索引，N为标签包含像素个数，α和γ为补偿系数。

更进一步地，在步骤S5中，则总损失函数为：

L＝λ₁L_focal+λ₂∑||ω||₂

其中，ω是网络权重，λ₁、λ₂表示分别表示Focal loss与权重约束的系数。

更进一步地，在步骤S5中，所述γ取值为5.0，所述α取0.25时，对流云目标在训练中得到有效补偿。

更进一步地，在步骤S6中，所述进行训练的过程中检测约束输出值，每训练1000次计算一次测试数据。

本发明与现有技术相比，其显著优点为：

本发明实现了端到端对流初生短临预报，应用三维卷积神经网络实现卫星遥感范围内所有云目标的形态、运动的时空特征提取，配合神经网络加速硬件可大幅降低对流初生短临预报问题的计算量，提高了对流初生短临预报方法的实时性、可移植性。

本发明有效利用时空上稀疏分布的初生对流样本，通过重采样提高正样本含量，并通过对神经网络中总损失函数针对类不平衡进行优化提高极类不平衡的对流初生短临预报的准确度。

附图说明

图1是本发明实施例提供的一种极类不平衡时空联合对流初生短临预报方法的流程示意图；

图2是本发明实施例提供的一种极类不平衡时空联合对流初生短临预报方法中对流初生估计网络结构。

具体实施方式

下面结合实施例及附图1-2对本发明作进一步详细的描述，但本发明的实施方式不限于此。

如附图1所示，下面对本发明详细流程进行进一步说明，本发明的目的是提供了一种极类不平衡时空联合对流初生短临预报方法，包括如下步骤：

步骤S2：对训练数据进行重采样提高包含对流云比例；

步骤S3：对进行重采样的训练数据进行预处理；

步骤S4：构建用于进行多通道卫星数据识别的神经网络；

步骤S5：对神经网络总损失函数针对类不平衡进行优化；

步骤S6：将预处理的训练数据输入神经网络进行训练，直至训练损失降低到阈值以下；

具体的，在步骤S1中，以葵花8号气象卫星为例，提取葵花8号气象卫星共计16通道的数据每个通道的气象卫星数据均是一个二维矩阵，二维矩阵中每个元素对应卫星图像中该元素所在位置的气象信息；气象卫星不同通道采集的气象信息分别是由可见光传感器采集的反射率和由红外传感器采集到亮度温度。并将多通道数据与基于雷达观测的对流事件标签进行匹配，生成数据样本。对流事件标签同样是二维矩阵，覆盖的经纬度范围与卫星数据相同，用于记录矩阵中各元素对应位置的对流事件。

从生成的数据样本中随机抽取70％作为训练数据，训练数据中包含有对流事件标签；抽取30％作为测试数据，测试数据不包含对流事件标签。

在步骤S2中，对训练数据进行重采样，重采样比例根据训练数据实际分布确定。

在训练数据采样方面通过数据重采样提高包含对流云比例。将包含对流云的样本记为正样本，将没有对流云的样本记为负样本。正样本真实占比为r，设定输入的训练数据正样本比例不低于d，单次训练的输入样本个数为m，则随机抽取M＝[m×d/r]个样本，[·]表示取整。若M个样本中包含正样本个数超过md个，则提取前md个正样本与前m(1-d)个负样本作为输入。若M个样本中包含正样本个数少于md个，则再抽取M个样本，将其中的正样本与之前的正样本合并，重复直至正样本个数超过md个。重采样可有效提高输入网络的正样本比例，进而增强网络对正样本特征的学习。

在步骤S3中，对输入的训练数据进行预处理还包括以下步骤：

具体的，首先对于多通道卫星数据的值进行归一化，由于输入的训练数据是卫星多通道的气象信息，不同通道的气象信息值域范围差异较大，可见光与近红外通道的气象信息取值为0～1，红外通道的气象信息取值在250～300，输入绝对值有重要意义，不能通过白平衡方式进行归一化，而采用绝对上下限进行近似归一化。

对于多通道卫星数据与标签的尺寸进行归一化，对多通道卫星数据通过最临近插值和线性插值缩放的方法将多通道卫星数据进行缩放，使多通道卫星数据与标签尺寸缩放至符合神经网络要求的尺寸。在本实施方式中，将多通道卫星数据与标签的尺寸缩放为224×224，以符合神经网络要求。

步骤S32：对输入的训练数据与标签同时进行数据增强，通过数据增强增加现有数据量。

总数据量较少会导致网络训练欠拟合，应通过数据增强增加现有数据量。数据增强方法包括平移、旋转、缩放、翻转和白平衡等方法。我国积云与对流云的运动存在宏观方向性，整体从东向西，因此数据增强应避免使用旋转和左右翻转的方式。对输入的训练数据与标签进行平移、缩放和上下翻转的方法均可用于数据增强。

此外，在一种实施方式中，还可以通过增加正交噪声的方法有效增加样本数量，提高样本多样性，甚至提高样本分类精度和泛化能力。对于积云识别，可添加时域和频域的正交噪声，噪声强度应低于信号强度的1/10。可显著增强样本多样性，扩充样本数量，提高信号关键特征的提取能力。

如附图2所示，在步骤S4中，为了实现多个云目标的形态强度和运动特征提取，需要同时学习卫星多通道数据的空间与时间跨度上的特征。输入的卫星数据包含时间T、图像尺寸H×W、通道C共4个维度，本发明采用3D卷积神经网络对时空特征进行联合分析。通常用于对流初生短临预报的卫星训练样本在数千到数万量级，相较于计算机图形学领域训练卷积神经网络的训练集大小差1～2个数量级；同时，考虑到卫星遥感影像中云的变化与光学照片中目标运动形态相似，可将经典目标运动识别问题预训练好的模型迁移到对流初生预报中。

本发明采用的神经网络是Encoder-Decoder结构，包括主干网与多个卷积层，主干网作为Encoder结构，多个卷积层是Decoder结构。主干网络采用3D ResNet预训练网络，预训练网络的总层数可选择101、152或200层，均有预训练好的网络参数可供迁移。3D ResNet包含依次连接的5组卷积，提供了不同尺度的时空特征。现有3D ResNet用于目标运动识别问题，输出为分类结果，而对流初生短临预报输出形式为未来不同时刻卫星可视范围内的对流初生概率分布，因此，3D ResNet无法直接应用于对流初生概率研究，本申请的发明人发现，通过对其网络结构进行调整，可以将其应用于对流初生概率研究。

预训练网络总层数为101、152或200层任一种中全连接层、softmax层和降采样层均设置在5组卷积中的固定位置，并具有固定层数。在本发明中，针对预训练网络进行调整，原预训练网络中的全连接层与softmax层均裁减不用，只保留5组卷积中卷积层和降采样层，各降采样层分别设置在5组卷积中最后一层；5组卷积分别为第一至第五卷积组，第一至第五卷积组的降采样层为别为maxpool、block1.x、block2.x、block3.x、block4.x。预训练网络支持输入图像尺寸为224×224×3，由于卫星遥感通道数多，例如葵花8号气象卫星具有16通道，风云4号气象卫星具有14通道；因此图像输入预训练网络的第一卷积组前增加卷积核尺寸为1×1×1的降维卷积层，用于调整预训练网络输入通道数，将输入数据样本的通道压缩到3。

在预训练网络中，将第一至第五卷积组的降采样层输出分别连接到Decoder结构中的多个卷积层，Decoder结构包括第一至第四上采样卷积层。block4.x输出数据输入第一上采样卷积层进行双线性插值的上采样；第一上采样卷积层的输出与block3.x的降采样输出结果进行拼接，拼接后的数据输入第二上采样卷积层进行双线性插值的上采样；第二上采样卷积层的输出与block2.x的降采样输出结果进行拼接，拼接后的数据输入第三上采样卷积层进行双线性插值的上采样；第三上采样卷积层的输出与block1.x的降采样输出结果进行拼接，拼接后的数据输入第四上采样卷积层进行双线性插值的上采样；第四上采样卷积层的输出与maxpool的输出结果进行拼接作为神经网络的最终结果输出。在本实施例中，block4.x输出已经降采样2⁵＝32倍，图像尺寸为7，然后通过第一上采样卷积层，由双线性插值为14，与block3.x降采样结果拼接，再通过第二上采样卷积层，由双线性插值为28，依次类推。

其中，双线性插值的上采样方法是每个像素点均参考周围4个像素进行线性插值。以原始图像I为例，其高记为H宽记为W为例，上采样2倍，则采样后图像J尺寸为2H╳2W。上采样图像的像素值J(x,y)取值方法为：

1)若x为偶数，y为偶数，J(x,y)＝I(x/2,y/2)；

2)若x为偶数，y为奇数，J(x,y)＝[I(x/2,(y-1)/2)+I(x/2,(y+1)/2)]/2；

3)若x为奇数，y为偶数，J(x,y)＝[I((x-1)/2,y/2)+I((x+1)/2,y/2)]/2；

4)若x为奇数，y为奇数，J(x,y)＝[I((x-1)/2,(y-1)/2)+I((x-1)/2,(y+1)/2)+I((x+1)/2,(y-1)/2)+I((x+1)/2,(y+1)/2)]/4。

拼接方法是对卷积层输出的多通道结果在通道维度上叠加。例如I1与I2均为不同卷积层输出结果，均为3维矩阵。I1形状记为[H1,W1,C1]，即有C1张尺寸为H1和W1的图像。I2形状记为[H2,W2,C2]。当且仅当H1＝H2、W1＝W2时，I1与I2才可以进行拼接。拼接后得到矩阵I形状应为[H,W,C]，其中H＝H1＝H2，W＝W1＝W2，C＝C1+C2。I的前C1张图像与I1相同，后C2张图像与I2相同，仅是矩阵结构拼接，矩阵值不变。

预训练的主干网仅需微调，因此2类组件的学习率不同。主干网的学习率可设置为未训练卷积层学习率的1/10。

在步骤S5中，对于类不平衡问题中卫星遥感数据绝大部分为地面、海洋、卷云等，可发展为初生对流的积云占比较少，因此难以学习目标特征。初生对流目标个数与背景、卷云、成熟对流目标相比可相差4个数量级。约束条件可针对类不平衡进行优化。通常约束条件为交叉熵，对于对流初生有无预报问题约束条件为：

其中，I为对流初生标签，

为输出的对流初生预报结果，i、j为横纵坐标索引，N为标签包含像素个数。

由I_i,j>0的个数远小于N，对于少量目标可增加约束权重，加强能产生对流云的影响。这里采用Focal loss进行极类不平衡补偿约束，对流初生预测网络输出的损失函数用于表征网络预测结果与真实对流事件在空间上的分布差异，所述对流初生预测网络输出的损失函数模型是：

其中，L_focal是对流初生预测网络输出的损失函数，α和γ为补偿系数。

该补偿方法对正负样本进行指数量级的平衡加权，大幅降低不同样本之间的差异。同时该约束条件也降低了识别准确率较高的样本，即降低了简单样本对网络的影响，让网络专注学习难学习的目标。在本实施例中，经过调试，γ取值为5.0，α取0.25时，对流云目标在训练中得到有效补偿。

对于极端类不平衡问题的学习过程中，不均匀样本可能导致网络迅速收敛到局部基值，输出为全零或全一，反映在网络权重上会导致权重分布失衡：部分权重发散到无穷大或权重分布收敛到{0,1}两个值上。可通过增加权重约束将权重分布限制在0附近。则总损失函数为：

L＝λ₁L_focal+λ₂∑||ω||₂ (3)

其中，ω是网络权重，λ₁表示总损失函数中Focal loss的系数，λ₂表示总损失函数中权重约束的系数。

在步骤S6中，将训练数据输入神经网络进行训练，训练方法使用Adam算法，学习率为0.001。训练过程中检测约束输出值，每训练1000次计算一次测试数据。当训练损失降低到阈值以下之后，若测试样本的损失函数也低于阈值，则跳转至步骤S7，否则继续训练。

在步骤S7中，封装训练好的神经网络模型，将网络参数量化、常量化，压缩成固定文件。并在实际生产环境中部署封装的模型，将当前时刻到前1小时内同步卫星获取的多通道气象卫星数据(同步卫星每10分钟记录一次数据，1小时合计6个记录数据)输入训练好的神经网络模型，即可获取表示未来某一时刻(该时刻在训练前确定，通常选择未来0-2小时内的时刻，超过2小时预报准确率可能过低)不同位置发生对流事件的概率的二维矩阵，从而实现对对流初生进行预测。

虽然上面结合本发明的优选实施例对本发明的原理进行了详细的描述，本领域技术人员应该理解，上述实施例仅是对本发明的示意性实现方式的解释，并非对本发明包含范围的限定。实施例中的细节并不构成对本发明范围的限制，在不背离本发明的精神和范围的情况下，任何基于本发明技术方案的等效变换、简单替换等显而易见的改变，均落在本发明保护范围之内。

Claims

1.一种极类不平衡时空联合对流初生短临预报方法，其特征在于，所述对流初生短临预报方法包括以下步骤：

步骤S2：对所述训练数据进行重采样提高包含对流云比例；

步骤S3：对所述进行重采样的训练数据进行预处理；

步骤S4：构建用于进行多通道卫星数据识别的神经网络；

2.根据权利要求1所述对流初生短临预报方法，其特征在于，在步骤S2中，所述训练数据中包含对流云的样本记为正样本，将没有对流云的样本记为负样本；

随机抽取M＝[m×d/r]个样本，若M个样本中包含正样本个数少于md个，则再抽取M个样本，将其中的正样本与之前的正样本合并，重复直至正样本个数超过md个；其中，r是正样本真实占比，d是设定训练神经网络中输入的正样本比例最小值，m是单次训练的输入样本个数。

3.根据权利要求1所述对流初生短临预报方法，其特征在于，在步骤S3中，还包括以下步骤；

4.根据权利要求1所述对流初生短临预报方法，其特征在于，在步骤S4中，所述神经网络包括主干网络和第一至第四上采样卷积层；

所述主干网络包括依次连接的第一至第五卷积组；

5.根据权利要求1所述对流初生短临预报方法，其特征在于，在步骤S5中，所述总损失函数采用Focalloss进行极类不平衡补偿约束，对流初生预测网络输出的损失函数用于表征网络预测结果与真实对流事件在空间上的分布差异，所述对流初生预测网络输出的损失函数模型是：

其中，L_focal是对流初生预测网络输出的损失函数，I是对流初生标签，

是输出的对流初生预报结果，i、j是横纵坐标索引，N是标签包含像素个数，α和γ是补偿系数。

6.根据权利要求5所述对流初生短临预报方法，其特征在于，在步骤S5中，则总损失函数为：

L＝λ₁L_focal+λ₂∑||ω||₂

其中，L是总损失函数，ω是网络权重，λ₁表示总损失函数中Focal loss的系数，λ₂表示总损失函数中权重约束的系数。

7.根据权利要求5所述对流初生短临预报方法，其特征在于，在步骤S5中，所述γ取值为5.0，所述α取0.25时，对流云目标在训练中得到有效补偿。

8.根据权利要求1所述对流初生短临预报方法，其特征在于，在步骤S6中，所述进行训练的过程中检测约束输出值，每训练1000次计算一次测试数据。