CN110568442B - 一种基于对抗外推神经网络的雷达回波外推方法 - Google Patents

一种基于对抗外推神经网络的雷达回波外推方法 Download PDF

Info

Publication number
CN110568442B
CN110568442B CN201910977797.3A CN201910977797A CN110568442B CN 110568442 B CN110568442 B CN 110568442B CN 201910977797 A CN201910977797 A CN 201910977797A CN 110568442 B CN110568442 B CN 110568442B
Authority
CN
China
Prior art keywords
layer
fra
seq
sequence
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910977797.3A
Other languages
English (en)
Other versions
CN110568442A (zh
Inventor
孙能立
李骞
敬金瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201910977797.3A priority Critical patent/CN110568442B/zh
Publication of CN110568442A publication Critical patent/CN110568442A/zh
Application granted granted Critical
Publication of CN110568442B publication Critical patent/CN110568442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/88Radar or analogous systems specially adapted for specific applications
    • G01S13/95Radar or analogous systems specially adapted for specific applications for meteorological use
    • G01S13/958Theoretical aspects
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/41Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • G01S7/417Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section involving the use of neural networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/41Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • G01S7/418Theoretical aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Electromagnetism (AREA)
  • Probability & Statistics with Applications (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明提供了一种基于对抗外推神经网络(Adversarial Extrapolation Neural Network,AENN)的雷达回波外推方法,包括:AENN离线训练:对给定的雷达数据集,通过数据预处理得到训练和测试样本集,初始化AENN网络和训练参数,利用训练样本集进行前向传播,并采用对抗性策略训练AENN;AENN在线预测:利用测试样本集对经过训练的条件生成器进行测试,得到预测的雷达回波图像。

Description

一种基于对抗外推神经网络的雷达回波外推方法
技术领域
本发明属于大气探测中地面气象观测技术领域,涉及一种基于对抗外推神经网络的雷达回波外推方法。
背景技术
对流天气临近预报是指短时内高时空分辨率的对流天气系统发生与演变过程的预报,准确、可靠且及时的预报对于防灾减灾、危险天气预警和保障国民生命财产安全等都具有重要意义。现有对流天气临近预报技术主要包括雷达回波外推预报技术、数值预报技术和概念模型预报技术等,其中雷达回波外推预报技术是对流天气临近预报的最基础手段和最有效途径。
雷达回波外推是根据已有历史雷达回波,预测未来回波的形状、位置、强度和运动信息等,以实现对对流天气系统的跟踪预报。传统的雷达回波外推方法主要包括质心追踪法、交叉相关法和光流法。质心追踪法通过计算连续的回波单体质心来确定移动矢量,进而预测未来回波位置。但质心追踪法使用范围局限于回波较强、范围较小的对流天气系统。交叉相关法将回波划分不同的追踪区域,计算相邻时刻区域之间的最优相关系数,进而确定区域间拟合关系以及实现预测。光流法通过计算连续回波的光流场得到运动矢量场,再基于运动矢量实现外推。然而,对流天气系统是动态复杂的系统,它具有作非线性运动(如旋转)、运动中有形变(如扩张和缩小)以及生消发展变化快等特征。传统雷达回波外推方法只假设回波简单线性演变,且对历史雷达回波资料利用率不足,无法有效预测回波的旋转变化和生消发展,具有精确度低、预报时效短等缺陷。
近期,深度学习技术在计算机视觉、语音识别和自然语言处理等领域得到广泛应用。深度学习本质就是通过构建合理的神经网络结构,使用一定的训练方法从大量数据中提取所需要的模型。在雷达回波外推问题中,具有大量的观测数据用以训练,长期积累的历史雷达回波数据也隐含了雷达回波变化规律,因此从深度学习的观点出发,可以通过训练合理的神经网络模型来解决这一难题。在众多神经网络模型中,生成对抗网络(GenerativeAdversarial Networks,GAN)通过生成器G(Generator)和判别器D(Discriminator)不断博弈,进而使G学习到数据的分布,是近年来复杂分布上无监督学习最具前景的方法之一。
基于GAN网络结构,为提高雷达回波外推的准确度和预报时效,针对雷达回波的运动变化特点,设计对抗外推神经网络(Adversarial Extrapolation Neural Network,AENN),该网络由条件生成器、回波帧判别器和回波序列判别器组成,条件生成器中间一层是卷积长短时记忆模型(Long-Short Term Memory,LSTM),它通过引入门结构和记忆单元来解决长期依赖问题,是目前被广泛用于解决序列学习问题的热门网络模型之一。
经过训练之后的条件生成器能够有效记忆回波非线性运动、生消变化等特征。训练网络使其从历史回波数据中充分学习雷达回波运动变化规律,对于提高雷达回波外推精确度和预报时效具有重要意义。
发明内容
发明目的:本发明所要解决的技术问题是针对现有的雷达回波外推方法的准确度低、预报时效短,提出了一种基于对抗外推神经网络的雷达回波外推方法,实现对雷达回波的外推预测,包括以下步骤:
步骤1,AENN离线训练:输入雷达数据集,对雷达数据集进行数据预处理,得到训练样本集和测试样本集,初始化AENN网络和训练参数,利用训练样本集采用对抗性策略训练AENN,得到训练过的条件生成器;
步骤2,AENN在线预测:将测试样本集输入经过步骤1获得的条件生成器中,得到预测的雷达回波外推图像。
步骤1包括以下步骤:
步骤1-1,数据预处理:对给定的多普勒天气雷达基数据,通过数据插值得到雷达回波强度等高平面显示CAPPI数据,将CAPPI数据转换为归一化灰度数据,基于归一化灰度数据集划分得到包含TrainsetSize组样本的训练样本集和一定数量的测试样本集;
步骤1-2,AENN初始化:根据AENN结构,构造条件生成器、回波帧判别器和回波序列判别器,其中条件生成器用于在输入的回波序列上产生对未来回波状况的预测,回波帧判别器用于将每个外推回波帧与对应的真实回波帧区分开来,回波序列判别器用于将整个外推回波序列与对应的真实回波序列区分开来,为离线训练阶段提供AENN的初始化模型;
步骤1-3,训练参数初始化:条件生成器、回波帧判别器和回波序列判别器均由Adam优化器训练,设置学习率λ、训练阶段每次输入的样本数量BatchSize和网络训练的最大迭代次数IterationMax;训练样本集的最大批训练次数
Figure BDA0002234209910000021
当前批训练次数和BatchNum当前迭代次数IterationNum均为1;
步骤1-4,训练样本读取:采用批训练的方式,每次训练时从步骤1-1获得的训练样本集中读取BatchSize组训练序列样本sequence;
步骤1-5,前向传播:对步骤1-4读取的每个训练序列样本sequence,条件生成器将训练序列样本sequence中输入序列input作为输入,前向传播输出预测回波序列;回波帧判别器将训练序列样本sequence中对照序列contrast的回波帧或预测回波序列中的预测回波帧作为输入,前向传播输出一个概率标量p1;回波序列判别器将训练序列样本sequence中输入序列input和预测回波序列作为输入,或将训练序列样本sequence作为输入,前向传播输出一个概率标量p2
步骤1-6,对抗性策略训练:每次训练AENN时首先训练回波帧判别器,再训练回波序列判别器,最后训练条件生成器,采用交替训练优化的方式,训练它们之中的任意一个时另外两个的参数保持不变,根据步骤1-5被训练网络前向传播得到的输出,计算相应的损失函数,根据损失函数计算被训练网络参数的梯度,利用随机梯度下降的方法更新参数,设置回波帧判别器、回波序列判别器和条件生成器的训练次数比;
步骤1-7,离线训练阶段控制:对离线神经网络训练阶段进行整体控制,分为以下三种情况:
如果训练样本集中仍存在未使用过的训练样本,即BatchNum<BatchMax,则返回步骤1-4继续读取BatchSize组训练样本,进行网络训练;
如果训练样本集中不存在未使用过的训练样本,即BatchNum=BatchMax,且当前网络迭代次数小于最大迭代次数,即IterationNum<IterationMax,则令BatchNum=1,返回步骤1-4继续读取BatchSize组训练样本,进行网络训练;
如果训练样本集中不存在未使用过的训练样本,即BatchNum=BatchMax,且网络迭代次数达到最大迭代次数,即IterationNum=IterationMax,则结束AENN离线训练阶段,此时条件生成器能够在输入的回波序列上产生对未来回波状况的预测。
步骤1-1包括以下步骤:
步骤1-1-1,数据插值:基于反距离加权法进行数据插值,通过坐标变换将多普勒天气雷达基数据的空间极坐标转化为空间直角坐标,并划分插值网格,再遍历所有空间直角坐标点,计算其对影响范围内所有插值网格点的权重和贡献值,最后遍历所有网格点,计算插值后网格点数据,得到CAPPI数据;
步骤1-1-2,数据转换:对步骤1-1-1数据插值得到的CAPPI数据,通过分辨率调整转化为分辨率256×256的数据,再通过数据映射和归一化将反射率数据转化为归一化灰度数据集;
步骤1-1-3,样本集划分:对步骤1-1-2得到的归一化灰度数据集按时间顺序排列,将数据分段划分为序列并汇总得到序列样本总集,再划分得到训练样本集和测试样本集。
步骤1-1-1包括以下步骤:
步骤1-1-1-1,坐标变换:通过坐标变换将多普勒天气雷达基数据的空间极坐标数据转化为空间直角坐标数据;多普勒天气雷达基数据根据空间极坐标确定空间位置,表示为(r,θ,φ),其中r表示坐标点到原点距离,θ表示仰角,φ表示方位角,将其变换为空间直角坐标(x,y,z),其中x表示水平橫坐标,y表示水平纵坐标,z表示垂直高度,变换公式如下:
Figure BDA0002234209910000031
Figure BDA0002234209910000032
Figure BDA0002234209910000033
其中,
Figure BDA0002234209910000034
R表示地球半径;
步骤1-1-1-2,划分插值网格:设定插值网格橫、纵坐标值域为[-480,480],网格分辨率为1,划分出分辨率为960×960的插值网格;
步骤1-1-1-3,计算权重和贡献值:遍历步骤1-1-1-1坐标变换后得到的每一空间直角坐标点,计算其对所有影响插值网格点的影响权重和贡献值,并存储于对应网格点的权重矩阵weight_mat rix和贡献值矩阵contribution_matrix中,其中,空间直角坐标点影响的插值网格点集表示为:
Figure BDA0002234209910000041
其中,(x′,y′)表示插值网格点坐标,height表示CAPPI高度,affect_radius表示影响半径;
基于反距离加权进行数据插值,则空间直角坐标点对网格点的影响权重w随两者距离增加指数级衰减,贡献值c则等于权重和坐标点数据值乘积,计算公式如下:
w=d-2
c=w×reflectivity
其中,d表示空间直角坐标点和网格点间的距离,reflectivi ty表示空间直角坐标点的反射率数据值;
步骤1-1-1-4,计算插值数据:对步骤1-1-1-2插值网格划分得到的每一插值网格点,CAPPI数据cappi_data计算公式如下:
Figure BDA0002234209910000042
步骤1-1-2包括以下步骤:
步骤1-1-2-1,分辨率调整:对步骤1-1-1-4数据插值得到的CAPPI数据,通过裁剪保留中间区域分辨率为480×480部分数据,再通过双线性插值方法将裁剪后数据分辨率调整至256×256,将分辨率调整后的反射率CAPPI数据记为adjustment_data;
步骤1-1-2-2,数据映射和归一化:对步骤1-1-2-1分辨率调整后得到的反射率数据adjustment_data,首先将回波反射率值剪裁为0~75dbz,然后将其映射为值域[0,255]的灰度pixel数据,再通过归一化处理得到归一化灰度数据χ,数据映射公式如下:
Figure BDA0002234209910000043
其中,
Figure BDA0002234209910000044
表示向下取整;
数据归一化公式为:
Figure BDA0002234209910000045
最终得到的归一化灰度数据χ特征数为1,分辨率为256×256。
步骤1-1-3包括以下步骤:
步骤1-1-3-1,序列划分:将所有经步骤1-1-2数据转换得到的归一化灰度数据χ汇总得到归一化灰度数据集,再将其中数据分段划分为序列,首先将数据按时间顺序排列,随后将每8个数据划分为一个序列sequence,其中,前5个数据作为输入序列input,后3个数据作为对照序列contrast,序列表示为:
sequence={input,contrast},
其中,input={χt-4t-3t-2t-1t},contrast={χt+5t+10t+15},χt-4t-3t-2t-1t表示输入序列input中第1到第5个数据,时间上连续;χt+5t+10t+15表示对照序列contrast中第1到第3个数据,时间上间隔为5;t-4,t-3,t-2,t-1,t,t+5,t+10,t+15分别表示数据χt-4t-3t-2t-1tt+5t+10t+15对应的时刻;输入序列input中第5个数据χt和对照序列contrast中第1个数据χt+5时间上间隔为5;后一序列与前一序列对应数据时间间隔为5;
序列总数count_of_sequence由如下公式确定:
Figure BDA0002234209910000051
其中,N表示归一化灰度数据集中数据总数;
步骤1-1-3-2,序列集划分:对步骤1-1-3-1序列划分得到的所有序列汇总为序列样本总集total_sequence_set,按照4:1的比例将序列样本总集中所有序列随机划分出训练样本集train_sequence_set、测试样本集test_sequence_set,最终训练样本集包含TrainsetSize组训练样本。
步骤1-2包括以下步骤:
步骤1-2-1,条件生成器构造:分别构造条件生成器的编码器、卷积长短时记忆模型和解码器三个部分;
步骤1-2-2,回波帧判别器和回波序列判别器构造。
步骤1-2-1包括以下步骤:
步骤1-2-1-1,编码器构造:编码器由3个卷积层构成,从前往后依次为第一个卷积层C1、第二个卷积层C2、第三个卷积层C3;
步骤1-2-1-2,卷积长短时记忆模型构造:卷积长短时记忆模型由两个ConvLSTM层构成,从前往后依次为第一个ConvLSTM层LSTM1、第二个ConvLSTM层LSTM2,LSTM1层包含8个单元
Figure BDA0002234209910000052
LSTM2层包含8个单元
Figure BDA0002234209910000053
T时刻的数据对应
Figure BDA0002234209910000054
Figure BDA0002234209910000055
Figure BDA0002234209910000061
的输出作为
Figure BDA0002234209910000062
的输入,每个单元的卷积核输出维度为128,卷积核宽度为3,卷积核中每个参数的初始值为
Figure BDA0002234209910000063
偏置均设为0,每个ConvLSTM单元输出特征图的宽度为32;
步骤1-2-1-3,解码器构造:解码器由3个反卷积层构成,从前往后依次为第一个反卷积层uC1、第二个反卷积层uC2、第三个反卷积层uC3;
步骤1-2-2包括以下步骤:
步骤1-2-2-1,回波帧判别器构造:
回波帧判别器包含第一个卷积层fra_Conv1、第二个卷积层fra_Conv2、第三个卷积层fra_Conv3、第四个卷积层fra_Conv4、第五个卷积层fra_Conv5和平均池化层fra_P;
步骤1-2-2-2,回波序列判别器构造;
步骤1-5包括以下步骤:
步骤1-5-1,条件生成器预测回波序列输出:在条件生成器中提取步骤1-4获得的输入图像序列{χt-4t-3t-2t-1t}特征,输出预测回波序列
Figure BDA0002234209910000064
步骤1-5-2,回波帧判别器概率标量计算:在回波帧判别器中提取预测回波帧
Figure BDA0002234209910000065
或对照回波帧(χn,n∈{t+5,t+10,t+15})特征,得到一个概率标量p1
步骤1-5-3,回波序列判别器概率标量计算:在回波序列判别器中提取真实回波序列{χt-4:tt+5,t+10,t+15}或假回波序列
Figure BDA0002234209910000066
特征,得到一个概率标量p2
步骤1-5-1包括以下步骤:
步骤1-5-1-1,网络层类型判断:用lg表示当前所处的条件生成器中的网络层,lg初始值为C1,判断网络层lg的类型,若lg∈{C1,C2,C3},则lg为卷积层,执行步骤1-5-1-2,若lg∈{LSTM1,LSTM2},执行步骤1-5-1-3,若lg∈{uC1,uC2,uC3},则lg为反卷积层,执行步骤1-5-1-4;
步骤1-5-1-2,编码器处理:此时有lg=lc,lc∈{C1,C2,C3},首先计算lc层的第j个输出特征图
Figure BDA0002234209910000067
将lc层的输入特征图集与该层的对应卷积核
Figure BDA0002234209910000068
相卷积,卷积结果加上lc层的第j个偏置参数
Figure BDA0002234209910000069
再经过ReLU激活函数处理,得到
Figure BDA00022342099100000610
计算公式如下所示:
Figure BDA00022342099100000611
其中,
Figure BDA00022342099100000612
表示lC层输入特征图集,同时也是lC-1层的输出特征图集,*表示矩阵卷积,若lC=C1,则
Figure BDA0002234209910000071
为回波帧χ;
各输入回波帧χt-4t-3t-2t-1t分别经过对应的编码器处理之后得到编码器的输出xt-4,xt-3,xt-2,xt-1,xt
步骤1-5-1-3,卷积长短时记忆模型处理:此时lg∈{LSTM1,LSTM2},T时刻T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15}数据对应LSTM1层单元
Figure BDA0002234209910000072
根据输入xT和T-1时刻T-1∈{t-4,t-3,t-2,t-1,t,t+5,t+10}数据对应LSTM1层单元
Figure BDA0002234209910000073
的内存单元、隐藏状态,不断更新自己的内存单元和隐藏状态,并输出隐藏状态;T时刻数据对应LSTM2层单元
Figure BDA0002234209910000074
根据输入和T-1时刻数据对应LSTM2层单元
Figure BDA0002234209910000075
的内存单元、隐藏状态,不断更新自己的内存单元和隐藏状态,并输出隐藏状态;当T=t-4时,前一时刻T-1的内存单元和隐藏状态均为0;更新过程由输入门、遗忘门、输出门控制,其中输入门控制输入和前一时刻隐藏状态的添加,遗忘门决定前一时刻内存单元的遗忘程度,输出门调节该时刻内存单元以输出该时刻隐藏状态;下面是
Figure BDA0002234209910000076
Figure BDA0002234209910000077
具体的前向传播过程:
Figure BDA0002234209910000078
将编码器的输出xT,xT∈{xt-4:t}作为输入,输出为
Figure BDA0002234209910000079
隐藏态h1 T,T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15},
Figure BDA00022342099100000710
前向传播公式如下:
Figure BDA00022342099100000711
Figure BDA00022342099100000712
Figure BDA00022342099100000713
Figure BDA00022342099100000714
Figure BDA00022342099100000715
其中,σ是sigmoid激活函数,tanh为双曲正切激活函数,*和
Figure BDA00022342099100000716
分别表示卷积运算和哈达玛积;
xT
Figure BDA00022342099100000717
的输入,
Figure BDA00022342099100000718
Figure BDA00022342099100000719
的存储单元,
Figure BDA00022342099100000720
Figure BDA00022342099100000721
的隐藏状态,
Figure BDA00022342099100000722
Figure BDA00022342099100000723
的输入门,
Figure BDA00022342099100000724
Figure BDA00022342099100000725
的遗忘门,
Figure BDA00022342099100000726
Figure BDA00022342099100000727
的输出门,宽度相同;
Figure BDA0002234209910000081
Figure BDA0002234209910000082
是与
Figure BDA0002234209910000083
有关的参数,分别是与xT卷积的卷积核、与
Figure BDA0002234209910000084
卷积的卷积核和偏置;
Figure BDA0002234209910000085
Figure BDA0002234209910000086
是与
Figure BDA0002234209910000087
有关的参数,分别是与xT卷积的卷积核、与
Figure BDA0002234209910000088
卷积的卷积核和偏置;
Figure BDA0002234209910000089
Figure BDA00022342099100000810
是与
Figure BDA00022342099100000811
有关的参数,分别是与xT卷积的卷积核、与
Figure BDA00022342099100000812
卷积的卷积核和偏置;
Figure BDA00022342099100000813
Figure BDA00022342099100000814
是与
Figure BDA00022342099100000815
有关的参数,分别是与xT卷积的卷积核、与
Figure BDA00022342099100000816
卷积的卷积核和偏置;
Figure BDA00022342099100000817
Figure BDA00022342099100000818
隐藏态h1 T,T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15}作为输入,当T∈{t+5,t+10,t+15},
Figure BDA00022342099100000819
输出隐藏态,
Figure BDA00022342099100000820
前向传播公式如下:
Figure BDA00022342099100000821
Figure BDA00022342099100000822
Figure BDA00022342099100000823
Figure BDA00022342099100000824
Figure BDA00022342099100000825
Figure BDA00022342099100000826
Figure BDA00022342099100000827
的输入,
Figure BDA00022342099100000828
Figure BDA00022342099100000829
的存储单元,
Figure BDA00022342099100000830
Figure BDA00022342099100000831
的隐藏状态,
Figure BDA00022342099100000832
Figure BDA00022342099100000833
的输入门,
Figure BDA00022342099100000834
Figure BDA00022342099100000835
的遗忘门,
Figure BDA00022342099100000836
Figure BDA00022342099100000837
的输出门,都是3维张量,宽度相同;
Figure BDA00022342099100000838
Figure BDA00022342099100000839
是与
Figure BDA00022342099100000840
有关的参数,分别是与
Figure BDA00022342099100000841
卷积的卷积核、与
Figure BDA00022342099100000842
卷积的卷积核和偏置;
Figure BDA00022342099100000843
Figure BDA00022342099100000844
是与
Figure BDA00022342099100000845
有关的参数,分别是与
Figure BDA00022342099100000846
卷积的卷积核、与
Figure BDA00022342099100000847
卷积的卷积核和偏置;
Figure BDA00022342099100000848
Figure BDA00022342099100000849
是与
Figure BDA00022342099100000850
有关的参数,分别是与
Figure BDA00022342099100000851
卷积的卷积核、与
Figure BDA00022342099100000852
卷积的卷积核和偏置;
Figure BDA00022342099100000853
Figure BDA00022342099100000854
是与
Figure BDA00022342099100000855
有关的参数,分别是与
Figure BDA00022342099100000856
卷积的卷积核、与
Figure BDA00022342099100000857
卷积的卷积核和偏置;
步骤1-5-1-4,解码器处理:此时有lg=luC,luC∈{uC1,uC2,uC3},首先计算luC层的第j个输出特征图
Figure BDA0002234209910000091
将luC层的输入特征图集与该层的对应反卷积核
Figure BDA0002234209910000092
进行反卷积,反卷积结果加上luC层的第j个偏置参数
Figure BDA0002234209910000093
再经过ReLU激活函数处理,得到
Figure BDA0002234209910000094
计算公式如下所示:
Figure BDA0002234209910000095
其中,
Figure BDA0002234209910000096
表示luC层输入特征图集,同时也是luC-1层的输出特征图集,
Figure BDA0002234209910000097
表示反卷积,若luC=uC1,则
Figure BDA0002234209910000098
为LSTM2隐藏态h2 T,T∈{t+5,t+10,t+15};
各输入LSTM2隐藏态h2 T,T∈{t+5,t+10,t+15}分别经过对应的解码器处理之后得到解码器的输出
Figure BDA0002234209910000099
即为条件生成器输出的预测回波序列;
步骤1-5-2包括以下步骤:
步骤1-5-2-1,网络层类型判断:用ld_fra表示当前所处的回波帧判别器中的网络层,ld_fra初始值为fra_Conv1,判断网络层ld_fra的类型,如果ld_fra∈{fra_Conv1,fra_Conv2,fra_Conv3,fra_Conv4,fra_Conv5},则ld_fra为卷积层,执行步骤1-5-2-2,若ld_fra为平均池化层fra_P,执行步骤1-5-2-3;
步骤1-5-2-2,卷积处理:
此时ld_fra∈{fra_Conv1,fra_Conv2,fra_Conv3,fra_Conv4,fra_Conv5},首先计算ld_fra层的第j个输出特征图
Figure BDA00022342099100000910
将ld_fra层的输入特征图集与该层的对应卷积核
Figure BDA00022342099100000911
相卷积,卷积结果加上ld_fra层的第j个偏置参数
Figure BDA00022342099100000912
再经过泄露率为0.2的带泄露修正线性单元Leaky ReLU激活函数处理,得到
Figure BDA00022342099100000913
计算公式如下所示:
Figure BDA00022342099100000914
其中,
Figure BDA00022342099100000915
表示ld_fra层输入特征图集,同时也是ld_fra-1层的输出特征图集,*表示矩阵卷积,若ld_fra=fra_Conv1,则
Figure BDA00022342099100000916
为预测回波帧
Figure BDA00022342099100000917
或对照回波帧(χn,n∈{t+5,t+10,t+15});
步骤1-5-2-3,平均池化处理:此时ld_fra=fra_P,算出fra_Conv5输出的第j个特征图平均值
Figure BDA0002234209910000101
最终得到向量
Figure BDA0002234209910000102
将此向量再经过Softmax激活函数处理,得到p1,0≤p1≤1;
步骤1-5-3包括以下步骤:
步骤1-5-3-1,网络层类型判断:用ld_seq表示当前所处的回波序列判别器中的网络层,ld_seq初始值为seq_Conv1,判断网络层ld_seq的类型,若ld_seq∈{seq_Conv1,seq_Conv2,seq_Conv3,seq_Conv4,seq_Conv5},则ld_seq为卷积层,执行步骤1-5-3-2,若ld_seq为平均池化层seq_P,执行步骤1-5-3-3;
步骤1-5-3-2,卷积处理:
此时ld_seq∈{seq_Conv1,seq_Conv2,seq_Conv3,seq_Conv4,seq_Conv5},首先计算ld_seq层的第j个输出特征图
Figure BDA0002234209910000103
将ld_seq层的输入特征图集与该层的对应卷积核
Figure BDA0002234209910000104
相卷积,卷积结果加上ld_seq层的第j个偏置参数
Figure BDA0002234209910000105
再经过泄露率为0.2的带泄露修正线性单元Leaky ReLU激活函数处理,得到
Figure BDA0002234209910000106
计算公式如下所示:
Figure BDA0002234209910000107
其中,
Figure BDA0002234209910000108
表示ld_seq层输入特征图集,同时也是ld_seq-1层的输出特征图集,*表示矩阵卷积,若ld_seq=seq_Conv1,则
Figure BDA0002234209910000109
为真实回波序列{χt-4:tt+5,t+10,t+15}或假回波序列
Figure BDA00022342099100001010
步骤1-5-3-3,平均池化处理:此时ld_seq=seq_P,算出seq_Conv5输出的第j个特征图平均值
Figure BDA00022342099100001011
最终得到向量
Figure BDA00022342099100001012
将此向量再经过Softmax激活函数处理,得到p2,0≤p2≤1;
步骤1-6包括以下步骤:
步骤1-6-1,回波帧判别器训练;
步骤1-6-2,回波序列判别器训练;
步骤1-6-3,条件生成器训练;
步骤1-6-4,用不同的更新率训练生成器和判别器,回波帧判别器、回波序列判别器和条件生成器的更新比为1:1:3,采用交替训练优化的方式,直到条件生成器可以在输入的回波序列上产生对未来回波状况的精确预测。
步骤2包括以下步骤:
步骤2-1,测试样本读取:将步骤1-1-3-2获得的测试样本集test_sequence_set输入经过训练的条件生成器中;
步骤2-3,前向传播:test_sequence_set经过条件生成器,得到最终的外推图像。
有益效果:基于对抗外推神经网络,在雷达回波数据集上进行训练,并利用训练好的网络进行雷达回波外推,有效提高了雷达回波外推的准确度和预报时效。
具体而言本发明与已有方法相比有以下优点:1、外推准确度高,与其他方法比较,本发明中对抗外推网络能够有效记忆回波非线性运动、生消变化等特征,精确度更高;2、外推时效长,可以通过调整网络结构增加预测序列输出数据帧数来进一步提高外推时效。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1为本发明流程图。
图2为对抗外推神经网络初始化模型结构图。
图3为训练序列样本和预测回波序列图。
图4为条件生成器构造图。
图5为编码器构造图。
图6为ConvLSTM构造图。
图7为解码器构造图。
图8为回波帧判别器或回波序列判别器构造图。
具体实施方式
如图1所示,本发明公开了一种基于对抗外推神经网络的雷达回波外推方法,包括以下步骤:
步骤1,AENN离线训练:输入雷达数据集,对雷达数据集进行数据预处理,得到训练样本集和测试样本集,初始化AENN网络和训练参数,利用训练样本集采用对抗性策略训练AENN,得到训练过的条件生成器;
步骤2,AENN在线预测:将测试样本集输入经过步骤1获得的条件生成器中,得到预测的雷达回波外推图像。
步骤1包括以下步骤:
步骤1-1,数据预处理;
步骤1-2,AENN初始化:如图2所示,为AENN的初始化模型结构图;
步骤1-3,训练参数初始化:条件生成器和两个判别器均由Adam优化器训练,学习率λ=0.0001,训练阶段每次输入的样本数量BatchSize=10,训练样本集的最大批训练次数
Figure BDA0002234209910000111
当前批训练次数BatchNum=1,网络训练的最大迭代次数IterationMax=40,当前迭代次数IterationNum=1;
步骤1-4,训练样本读取:采用批训练的方式,每次训练时从步骤1-1获得的训练样本集中读取BatchSize组训练序列样本sequence;
步骤1-5,前向传播:如图3所示,为训练序列样本和预测回波序列图,对步骤1-4读取的每个训练序列样本sequence,条件生成器将训练序列样本sequence中输入序列input作为输入,前向传播输出预测回波序列;回波帧判别器将训练序列样本sequence中对照序列contrast的回波帧或预测回波序列中的预测回波帧作为输入,前向传播输出一个概率标量p1;回波序列判别器将训练序列样本sequence中输入序列input和预测回波序列作为输入,或将训练序列样本sequence作为输入,前向传播输出一个概率标量p2
步骤1-6,对抗性策略训练:每次训练AENN时首先训练回波帧判别器,再训练回波序列判别器,最后训练条件生成器,采用交替训练优化的方式,训练它们之中的任意一个时另外两个的参数保持不变,根据步骤1-5被训练网络前向传播得到的输出,计算相应的损失函数,根据损失函数计算被训练网络参数的梯度,利用随机梯度下降的方法更新参数,设置回波帧判别器、回波序列判别器和条件生成器的训练次数比;
步骤1-7,离线训练阶段控制:对离线神经网络训练阶段进行整体控制。
步骤1-1数据预处理包括以下步骤:
步骤1-1-1,数据插值:基于反距离加权法进行数据插值,通过坐标变换将多普勒天气雷达基数据的空间极坐标转化为空间直角坐标,并划分插值网格,再遍历所有空间直角坐标点,计算其对影响范围内所有插值网格点的权重和贡献值,最后遍历所有网格点,计算插值后网格点数据,得到CAPPI数据;
步骤1-1-2,数据转换:对步骤1-1-1数据插值得到的CAPPI数据,通过分辨率调整转化为分辨率256×256的数据,再通过数据映射和归一化将反射率数据转化为归一化灰度数据;
步骤1-1-3,样本集划分:对步骤1-1-2得到的归一化灰度数据集按时间顺序排列,将数据分段划分为序列并汇总得到序列样本总集,再划分得到训练和测试样本集。
步骤1-1-1包括以下步骤:
步骤1-1-1-1,坐标变换:通过坐标变换将多普勒天气雷达基数据的空间极坐标数据转化为空间直角坐标数据;多普勒天气雷达基数据根据空间极坐标确定空间位置,表示为(r,θ,φ),其中r表示坐标点到原点距离,θ表示仰角,φ表示方位角,将其变换为空间直角坐标(x,y,z),其中x表示水平橫坐标,y表示水平纵坐标,z表示垂直高度,变换公式如下:
Figure BDA0002234209910000121
Figure BDA0002234209910000122
Figure BDA0002234209910000123
其中,
Figure BDA0002234209910000131
R表示地球半径;
步骤1-1-1-2,插值网格划分:设定插值网格橫、纵坐标值域为[-480,480],网格分辨率为1,划分出分辨率为960×960的插值网格;
步骤1-1-1-3,权重和贡献值计算:遍历步骤1-1-1-1坐标变换后得到的每一空间直角坐标点,计算其对所有影响插值网格点的影响权重和贡献值,并存储于对应网格点的权重矩阵weight_mat rix和贡献值矩阵contribution_matrix中,其中,空间直角坐标点影响的插值网格点集表示为:
Figure BDA0002234209910000132
其中,(x′,y′)表示插值网格点坐标,height表示CAPPI高度,affect_radius表示影响半径;
基于反距离加权进行数据插值,则空间直角坐标点对网格点的影响权重w随两者距离增加指数级衰减,贡献值c则等于权重和坐标点数据值乘积,计算公式如下:
w=d-2
c=w×reflectivity
其中,d表示空间直角坐标点和网格点间的距离,reflectivi ty表示空间直角坐标点的反射率数据值;
步骤1-1-1-4,插值数据计算:对步骤1-1-1-2插值网格划分得到的每一插值网格点,CAPPI数据cappi_data计算公式如下:
Figure BDA0002234209910000133
步骤1-1-2数据转换包括以下步骤:
步骤1-1-2-1,分辨率调整:对步骤1-1-1-4数据插值得到的CAPPI数据,通过裁剪保留中间区域分辨率为480×480部分数据,再通过双线性插值方法将裁剪后数据分辨率调整至256×256,将分辨率调整后的反射率CAPPI数据记为adjustment_data;
步骤1-1-2-2,数据映射和归一化:对步骤1-1-2-1分辨率调整后得到的反射率数据adjustment_data,首先将回波反射率值剪裁为0~75dbz,然后将其映射为值域[0,255]的灰度pixel数据,再通过归一化处理得到归一化灰度数据χ,数据映射公式如下:
Figure BDA0002234209910000141
其中,
Figure BDA0002234209910000142
表示向下取整;
数据归一化公式为:
Figure BDA0002234209910000143
最终得到的归一化灰度数据χ特征数为1,分辨率为256×256。
步骤1-1-3样本集划分包括以下步骤:
步骤1-1-3-1,序列划分:将所有经步骤1-1-2数据转换得到的归一化灰度数据χ汇总得到归一化灰度数据集,再将其中数据分段划分为序列;首先将数据按时间顺序排列,随后将每8个数据划分为一个序列sequence,其中,前5个数据作为输入序列input,后3个数据作为对照序列contrast,序列表示为:
sequence={input,contrast},
序列总数count_of_sequence由如下公式确定:
Figure BDA0002234209910000144
其中,N表示归一化灰度数据集中数据总数;
步骤1-1-3-2,序列集划分:对步骤1-1-3-1序列划分得到的所有序列汇总为序列样本总集total_sequence_set,按照4:1的比例将序列样本总集中所有序列随机划分出训练样本集train_sequence_set、测试样本集test_sequence_set,最终训练样本集包含TrainsetSize组训练样本。
步骤1-2包括以下步骤:
步骤1-2-1,条件生成器构造:如图4所示,为条件生成器构造图,分别构造条件生成器的编码器、卷积长短时记忆模型和解码器三个部分;
步骤1-2-2,回波帧判别器和回波序列判别器构造;
步骤1-2-1包括以下步骤:
步骤1-2-1-1,编码器构造:如图5所示,为编码器构造图,编码器由3个卷积层构成,从前往后依次为第一个卷积层C1、第二个卷积层C2、第三个卷积层C3;
使用Xavier初始化方法来初始化所有的卷积核参数,初始化公式如下所示:
定义参数所在层的输入维度为n,输出维度为m,那么参数将以均匀分布的方式在
Figure BDA0002234209910000145
的范围内进行初始化,并将所有偏置设为0;
对于卷积层C1,令C1层的输出特征图数量OutputMapsC1=32,C1层输出特征图的宽度OutputSizeC1=128,C1层卷积核宽度KernelSizeC1=5,C1层偏置参数biasC1均初始化为0,C1层的卷积核kC1的数量KernelNumberC1=32,卷积核中每一个参数的初始值为
Figure BDA0002234209910000151
对于卷积层C2,令C2层输出特征图数量OutputMapsC2=64,C2层输出特征图的宽度OutputSizeC2=64,C2层卷积核宽度KernelSizeC2=3,C2层偏置参数biasC2均初始化为0,C2层的卷积核kC2的数量KernelNumberC2=64,卷积核中每一个参数的初始值为
Figure BDA0002234209910000152
对于卷积层C3,令C3层输出特征图数量OutputMapsC3=128,C3层输出特征图的宽度OutputSizeC3=32,C3层卷积核宽度KernelSizeC3=3,C3层偏置参数biasC3均初始化为0,C3层的卷积核kC3的数量KernelNumberC3=128,卷积核中每一个参数的初始值为
Figure BDA0002234209910000153
步骤1-2-1-2,卷积长短时记忆模型构造:如图6所示,为ConvLSTM构造图,卷积长短时记忆模型由两个ConvLSTM层构成,从前往后依次为第一个ConvLSTM层LSTM1、第二个ConvLSTM层LSTM2,LSTM1层包含8个单元
Figure BDA0002234209910000154
LSTM2层包含8个单元
Figure BDA0002234209910000155
T时刻的数据对应
Figure BDA0002234209910000156
Figure BDA0002234209910000157
Figure BDA0002234209910000158
Figure BDA0002234209910000159
的输出作为
Figure BDA00022342099100001510
的输入,每个单元的卷积核输出维度为128,卷积核宽度为3,卷积核中每个参数的初始值为
Figure BDA00022342099100001511
偏置均设为0,每个ConvLSTM单元输出特征图的宽度为32;
步骤1-2-1-3,解码器构造:如图7所示,为解码器构造图,解码器由3个反卷积层构成,从前往后依次为第一个反卷积层uC1、第二个反卷积层uC2、第三个反卷积层uC3;
对于反卷积层uC1,令uC1层输出特征图数量OutputMapsuC1=64,uC1层输出特征图的宽度OutputSizeuC1=64,uC1层卷积核宽度KernelSizeuC1=3,uC1层偏置参数biasuC1均初始化为0,uC1层的卷积核kuC1的数量KernelNumberuC1=64,卷积核中每一个参数的初始值为
Figure BDA0002234209910000161
对于反卷积层uC2,令uC2层输出特征图数量OutputMapsuC2=32,uC2层输出特征图的宽度OutputSizeuC2=128,uC2层卷积核宽度KernelSizeuC2=3,uC2层偏置参数biasuC2均初始化为0,uC2层的卷积核kuC2的数量KernelNumberuC2=32,卷积核中每一个参数的初始值为
Figure BDA0002234209910000162
对于反卷积层uC3,令uC3层的输出特征图数量OutputMapsuC3=1,uC3层输出特征图的宽度OutputSizeuC3=256,uC3层卷积核宽度KernelSizeuC3=3,uC3层偏置参数biasuC3均初始化为0,uC3层的卷积核kuC3的数量KernelNumberuC3=1,卷积核中每一个参数的初始值为
Figure BDA0002234209910000163
步骤1-2-2包括以下步骤:
步骤1-2-2-1,回波帧判别器构造:如图8所示,为回波帧判别器构造图,回波帧判别器包含第一个卷积层fra_Conv1、第二个卷积层fra_Conv2、第三个卷积层fra_Conv3、第四个卷积层fra_Conv4、第五个卷积层fra_Conv5和平均池化层fra_P;
对于卷积层fra_Conv1,fra_Conv1层输出特征图数量OutputMaps fra_Conv1=32,fra_Conv1层输出特征图的宽度OutputSizefra_Conv1=128,fra_Conv1层卷积核宽度KernelSizefra_Conv1=5,fra_Conv1层偏置参数biasfra_Conv1均初始化为0,fra_Conv1层的卷积核kfra_Conv1的数量KernelNumberfra_Conv1=32,卷积核中每一个参数的初始值为
Figure BDA0002234209910000164
对于卷积层fra_Conv2,fra_Conv2层输出特征图数量OutputMapsfra_Conv2=64,fra_Conv2层输出特征图的宽度OutputSizefra_Conv2=64,fra_Conv2层卷积核宽度KernelSizefra_Conv2=3,fra_Conv2层偏置参数biasfra_Conv2均初始化为0,fra_Conv2层的卷积核kfra_Conv2的数量KernelNumberfra_Conv2=64,卷积核中每一个参数的初始值为
Figure BDA0002234209910000171
对于卷积层fra_Conv3,fra_Conv3层输出特征图数量OutputMapsfra_Conv3=128,fra_Conv3层输出特征图的宽度OutputSizefra_Conv3=32,fra_Conv3层卷积核宽度KernelSizefra_Conv3=3,fra_Conv3层偏置参数biasfra_Conv3均初始化为0,fra_Conv3层的卷积核kfra_Conv3的数量KernelNumberfra_Conv3=128,卷积核中每一个参数的初始值为
Figure BDA0002234209910000172
对于卷积层fra_Conv4,fra_Conv4层输出特征图数量OutputMapsfra_Conv4=256,fra_Conv4层输出特征图的宽度OutputSizefra_Conv4=16,fra_Conv4层卷积核宽度KernelSizefra_Conv4=3,fra_Conv4层偏置参数biasfra_Conv4均初始化为0,fra_Conv4层的卷积核kfra_Conv4的数量KernelNumberfra_Conv4=256,卷积核中每一个参数的初始值为
Figure BDA0002234209910000173
对于卷积层fra_Conv5,fra_Conv5层输出特征图数量OutputMapsfra_Conv5=512,fra_Conv5层输出特征图的宽度OutputSizefra_Conv5=8,fra_Conv5层卷积核宽度KernelSizefra_Conv5=3,fra_Conv5层偏置参数biasfra_Conv5均初始化为0,fra_Conv5层的卷积核kfra_Conv5的数量KernelNumberfra_Conv5=512,卷积核中每一个参数的初始值为
Figure BDA0002234209910000174
对于平均池化层fra_P,令fra_P层池化核宽度KernelSizefra_P=8,令fra_P层输出特征图数量OutputMapsfra_P=512,fra_P层输出特征图宽度OutputSizefra_P=1;
步骤1-2-2-2,回波序列判别器构造:如图8所示,为回波序列判别器构造图,回波序列判别器包含第一个卷积层seq_Conv1、第二个卷积层seq_Conv2、第三个卷积层seq_Conv3、第四个卷积层seq_Conv4、第五个卷积层seq_Conv5和平均池化层seq_P;
对卷积层seq_Conv1,seq_Conv1层输出特征图数量OutputMapsseq_Conv1=32,seq_Conv1层输出特征图宽度OutputSizeseq_Conv1=128,seq_Conv1层卷积核宽度KernelSizeseq_Conv1=5,seq_Conv1层偏置参数biasseq_Conv1均初始化为0,seq_Conv1层的卷积核kseq_Conv1的数量KernelNumberseq_Conv1=32,卷积核中每一个参数的初始值为
Figure BDA0002234209910000181
对卷积层seq_Conv2,seq_Conv2层输出特征图数量OutputMapsseq_Conv2=64,seq_Conv2层输出特征图的宽度OutputSizeseq_Conv2=64,seq_Conv2层卷积核宽度KernelSizeseq_Conv2=3,seq_Conv2层偏置参数biasseq_Conv2均初始化为0,seq_Conv2层的卷积核kseq_Conv2的数量KernelNumberseq_Conv2=64,卷积核中每一个参数的初始值为
Figure BDA0002234209910000182
对卷积层seq_Conv3,seq_Conv3层输出特征图数量OutputMapsseq_Conv3=128,seq_Conv3层输出特征图的宽度OutputSizeseq_Conv3=32,seq_Conv3层卷积核宽度KernelSizeseq_Conv3=3,seq_Conv3层偏置参数biasseq_Conv3均初始化为0,seq_Conv3层的卷积核kseq_Conv3的数量KernelNumberseq_Conv3=128,卷积核中每一个参数的初始值为
Figure BDA0002234209910000183
对卷积层seq_Conv4,seq_Conv4层输出特征图数量OutputMapsseq_Conv4=256,seq_Conv4层输出特征图的宽度OutputSizeseq_Conv4=16,seq_Conv4层卷积核宽度KernelSizeseq_Conv4=3,seq_Conv4层偏置参数biasseq_Conv4均初始化为0,seq_Conv4层的卷积核kseq_Conv4的数量KernelNumberseq_Conv4=256,卷积核中每一个参数的初始值为
Figure BDA0002234209910000191
对卷积层seq_Conv5,seq_Conv5层输出特征图数量OutputMapsseq_Conv5=512,seq_Conv5层输出特征图的宽度OutputSizeseq_Conv5=8,seq_Conv5层卷积核宽度KernelSizeseq_Conv5=3,seq_Conv5层偏置参数biasseq_Conv5均初始化为0,seq_Conv5层的卷积核kseq_Conv5的数量KernelNumberseq_Conv5=512,卷积核中每一个参数的初始值为
Figure BDA0002234209910000192
对平均池化层seq_P,seq_P层池化核宽度KernelSizeseq_P=8,seq_P层的输出特征图数量OutputMapsseq_P=512,seq_P层输出特征图的宽度OutputSizeseq_P=1;
步骤1-5包括以下步骤:
步骤1-5-1,条件生成器预测回波序列输出:在条件生成器中提取步骤1-4获得的输入图像序列{χt-4t-3t-2t-1t}特征,输出预测回波序列
Figure BDA0002234209910000193
如图4所示;
步骤1-5-1包括以下步骤:
步骤1-5-1-1,网络层类型判断:用lg表示当前所处的条件生成器中的网络层,lg初始值为C1,判断网络层lg的类型,若lg∈{C1,C2,C3},则lg为卷积层,执行步骤1-5-1-2,若lg∈{LSTM1,LSTM2},执行步骤1-5-1-3,若lg∈{uC1,uC2,uC3},则lg为反卷积层,执行步骤1-5-1-4;
步骤1-5-1-2,编码器处理:此时有lg=lc,lc∈{C1,C2,C3},首先计算lc层的第j个输出特征图
Figure BDA0002234209910000194
将lc层的输入特征图集与该层的对应卷积核
Figure BDA0002234209910000195
相卷积,卷积结果加上lc层的第j个偏置参数
Figure BDA0002234209910000196
再经过ReLU激活函数处理,得到
Figure BDA0002234209910000197
计算公式如下所示:
Figure BDA0002234209910000201
各输入回波帧χt-4t-3t-2t-1t分别经过对应的编码器处理之后得到编码器的输出xt-4,xt-3,xt-2,xt-1,xt
步骤1-5-1-3,卷积长短时记忆模型处理:此时lg∈{LSTM1,LSTM2},T时刻T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15}数据对应LSTM1层单元
Figure BDA0002234209910000202
根据输入xT和T-1时刻T-1∈{t-4,t-3,t-2,t-1,t,t+5,t+10}数据对应LSTM1层单元
Figure BDA0002234209910000203
的内存单元、隐藏状态,不断更新自己的内存单元和隐藏状态,并输出隐藏状态;T时刻数据对应LSTM2层单元
Figure BDA0002234209910000204
根据输入和T-1时刻数据对应LSTM2层单元
Figure BDA0002234209910000205
的内存单元、隐藏状态,不断更新自己的内存单元和隐藏状态,并输出隐藏状态;当T=t-4时,前一时刻T-1的内存单元和隐藏状态均为0;更新过程由输入门、遗忘门、输出门控制,其中输入门控制输入和前一时刻隐藏状态的添加,遗忘门决定内存单元的遗忘程度,输出门调节该时刻内存单元以输出该时刻隐藏状态;下面是
Figure BDA0002234209910000206
Figure BDA0002234209910000207
具体的前向传播过程:
Figure BDA0002234209910000208
将编码器的输出xT,xT∈{xt-4:t}作为输入,输出为
Figure BDA0002234209910000209
隐藏态h1 T,T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15},
Figure BDA00022342099100002010
前向传播公式如下:
Figure BDA00022342099100002011
Figure BDA00022342099100002012
Figure BDA00022342099100002013
Figure BDA00022342099100002014
Figure BDA00022342099100002015
Figure BDA00022342099100002016
Figure BDA00022342099100002017
隐藏态h1 T,T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15}作为输入,当T∈{t+5,t+10,t+15},
Figure BDA00022342099100002018
输出隐藏态,
Figure BDA00022342099100002019
前向传播公式如下:
Figure BDA0002234209910000211
Figure BDA0002234209910000212
Figure BDA0002234209910000213
Figure BDA0002234209910000214
Figure BDA0002234209910000215
步骤1-5-1-4,解码器处理:此时有lg=luC,luC∈{uC1,uC2,uC3},首先计算luC层的第j个输出特征图
Figure BDA0002234209910000216
将luC层的输入特征图集与该层的对应反卷积核
Figure BDA0002234209910000217
进行反卷积,反卷积结果加上luC层的第j个偏置参数
Figure BDA0002234209910000218
再经过ReLU激活函数处理,得到
Figure BDA0002234209910000219
计算公式如下所示:
Figure BDA00022342099100002110
其中,
Figure BDA00022342099100002111
表示luC层输入特征图集,同时也是luC-1层的输出特征图集,
Figure BDA00022342099100002112
表示反卷积,若luC=uC1,则
Figure BDA00022342099100002113
为LSTM2隐藏态h2 T,T∈{t+5,t+10,t+15};
各输入LSTM2隐藏态h2 T,T∈{t+5,t+10,t+15}分别经过对应的解码器处理之后得到解码器的输出
Figure BDA00022342099100002114
即为条件生成器输出的预测回波序列;
步骤1-5-2,回波帧判别器概率标量计算:在回波帧判别器中提取预测回波帧
Figure BDA00022342099100002115
或对照回波帧(χn,n∈{t+5,t+10,t+15})特征,得到一个概率标量p1
步骤1-5-2包括以下步骤:
步骤1-5-2-1,网络层类型判断:用ld_fra表示当前所处的回波帧判别器中的网络层,ld_fra初始值为fra_Conv1,判断网络层ld_fra的类型,若ld_fra∈{fra_Conv1,fra_Conv2,fra_Conv3,fra_Conv4,fra_Conv5},则ld_fra为卷积层,执行步骤1-5-2-2,若ld_fra为平均池化层fra_P,执行步骤1-5-2-3;
步骤1-5-2-2,卷积处理:
此时ld_fra∈{fra_Conv1,fra_Conv2,fra_Conv3,fra_Conv4,fra_Conv5},首先计算ld_fra层的第j个输出特征图
Figure BDA0002234209910000221
将ld_fra层的输入特征图集与该层的对应卷积核
Figure BDA0002234209910000222
相卷积,卷积结果加上ld_fra层的第j个偏置参数
Figure BDA0002234209910000223
再经过泄露率为0.2的带泄露修正线性单元Leaky ReLU激活函数处理,得到
Figure BDA0002234209910000224
计算公式如下所示:
Figure BDA0002234209910000225
其中,
Figure BDA0002234209910000226
表示ld_fra层输入特征图集,同时也是ld_fra-1层的输出特征图集,*表示矩阵卷积,若ld_fra=fra_Conv1,则
Figure BDA0002234209910000227
为预测回波帧
Figure BDA0002234209910000228
或对照回波帧(χn,n∈{t+5,t+10,t+15});
步骤1-5-2-3,平均池化处理:此时ld_fra=fra_P,算出fra_Conv5输出的第j个特征图平均值
Figure BDA0002234209910000229
最终得到向量
Figure BDA00022342099100002210
将此向量再经过Softmax激活函数处理,得到p1,0≤p1≤1;
步骤1-5-3,回波序列判别器概率标量计算:在回波序列判别器中提取真实回波序列{χt-4:tt+5,t+10,t+15}或假回波序列
Figure BDA00022342099100002211
特征,得到一个概率标量p2
步骤1-5-3包括以下步骤:
步骤1-5-3-1,网络层类型判断:用ld_seq表示当前所处的回波序列判别器中的网络层,ld_seq初始值为seq_Conv1,判断网络层ld_seq的类型,若ld_seq∈{seq_Conv1,seq_Conv2,seq_Conv3,seq_Conv4,seq_Conv5},则ld_seq为卷积层,执行步骤1-5-3-2,若ld_seq为平均池化层seq_P,执行步骤1-5-3-3;
步骤1-5-3-2,卷积处理:
此时ld_seq∈{seq_Conv1,seq_Conv2,seq_Conv3,seq_Conv4,seq_Conv5},首先计算ld_seq层的第j个输出特征图
Figure BDA00022342099100002212
将ld_seq层的输入特征图集与该层的对应卷积核
Figure BDA00022342099100002213
相卷积,卷积结果加上ld_seq层的第j个偏置参数
Figure BDA00022342099100002214
再经过泄露率为0.2的带泄露修正线性单元Leaky ReLU激活函数处理,得到
Figure BDA00022342099100002215
计算公式如下所示:
Figure BDA0002234209910000231
其中,
Figure BDA0002234209910000232
表示ld_seq层输入特征图集,同时也是ld_seq-1层的输出特征图集,*表示矩阵卷积,若ld_seq=seq_Conv1,则
Figure BDA0002234209910000233
为真实回波序列{χt-4:tt+5,t+10,t+15}或假回波序列
Figure BDA0002234209910000234
步骤1-5-3-3,平均池化处理:此时ld_seq=seq_P,算出seq_Conv5输出的第j个特征图平均值
Figure BDA0002234209910000235
最终得到向量
Figure BDA0002234209910000236
将此向量再经过Softmax激活函数处理,得到p2,0≤p2≤1;
步骤1-6包括以下步骤:
步骤1-6-1,回波帧判别器训练;
步骤1-6-2,回波序列判别器训练;
步骤1-6-3,条件生成器训练;
步骤1-6-4,用不同的更新率训练生成器和判别器,回波帧判别器、回波序列判别器和条件生成器的更新比为1:1:3,采用交替训练优化的方式,直到条件生成器可以在输入的回波序列上产生对未来回波状况的精确预测。
步骤1-6-1包括以下步骤:
步骤1-6-1-1,回波帧判别器的损失计算:经过步骤1-5-2,回波帧判别器的损失
Figure BDA0002234209910000237
为:
Figure BDA0002234209910000238
dfra表示回波帧判别器的输出,
Figure BDA00022342099100002313
为交叉熵损失函数,表达式为:
Figure BDA0002234209910000239
其中p是标签,值为0或1;
Figure BDA00022342099100002310
是逻辑回归;
步骤1-6-1-2,回波帧判别器网络参数梯度计算:通过求偏导计算步骤1-6-1-1得到的损失函数对每个网络参数的梯度
Figure BDA00022342099100002311
Figure BDA00022342099100002312
其中,步骤1-2-2-1构造的回波帧判别器中所有卷积核和偏置参数构成网络参数总体,θi表示第i个网络参数,i∈[1,nd_fra],nd_fra表示回波帧判别器参数总数;
步骤1-6-1-3,网络参数更新:用网络学习率λ乘以步骤1-6-1-2计算得到的网络参数梯度
Figure BDA0002234209910000241
得到网络参数修正项,将原网络参数和修正项相减即实现网络参数的更新,公式如下:
Figure BDA0002234209910000242
其中,θ′i表示更新后的网络参数;
步骤1-6-2包括以下步骤:
步骤1-6-2-1,回波序列判别器的损失计算:经过步骤1-5-3,回波序列判别器的损失
Figure BDA0002234209910000243
为:
Figure BDA0002234209910000244
dseq表示回波序列判别器的输出,
Figure BDA00022342099100002410
为交叉熵损失函数;
步骤1-6-2-2,回波序列判别器网络参数梯度计算:通过求偏导计算步骤1-6-2-1得到的损失函数对每个网络参数的梯度
Figure BDA0002234209910000245
Figure BDA0002234209910000246
其中,步骤1-2-2-2构造的回波序列判别器中所有卷积核和偏置参数构成网络参数总体,θi表示第i个网络参数,i∈[1,nd_seq],nd_seq表示回波序列判别器参数总数;
步骤1-6-2-3,网络参数更新:用网络学习率λ乘以步骤1-6-2-2计算得到的网络参数梯度
Figure BDA0002234209910000247
得到网络参数修正项,将原网络参数和修正项相减即实现网络参数的更新,公式如下:
Figure BDA0002234209910000248
其中,θ′i表示更新后的网络参数。
步骤1-6-3包括以下步骤:
步骤1-6-3-1,条件生成器的损失计算:经过步骤1-6-1和步骤1-6-2,条件生成器的损失
Figure BDA00022342099100002411
为:
Figure BDA0002234209910000249
其中,
Figure BDA00022342099100002514
为重建损失,为预测序列
Figure BDA0002234209910000251
和相应对照序列{χt+5t+10t+15}的均方误差和平均绝对误差之和:
Figure BDA0002234209910000252
Figure BDA0002234209910000253
表示BatchSize个序列样本的第n个序列样本中,时刻为T的数据的坐标为(i,j)的数据值,
Figure BDA0002234209910000254
表示BatchSize个序列样本的第n个序列样本前向传播得到的预测序列中,时刻为T的数据的坐标为(i,j)的数据值;
Figure BDA0002234209910000255
为回波帧对抗损失,表达式为:
Figure BDA0002234209910000256
其中,d'fra表示经过步骤1-6-1得到更新的回波帧判别器的输出;
Figure BDA0002234209910000257
为回波序列对抗损失,表达式为:
Figure BDA0002234209910000258
其中,d'seq表示经过步骤1-6-2得到更新的回波序列判别器的输出;
λ1、λ2和λ3分别是与重建损失
Figure BDA00022342099100002515
回波帧对抗损失
Figure BDA0002234209910000259
回波序列对抗损失
Figure BDA00022342099100002510
相对应的权重,λ1、λ2和λ3分别为1、0.003和0.003;
步骤1-6-3-2,条件生成器网络参数梯度计算:通过求偏导计算步骤1-6-3-1得到的损失函数对每个网络参数的梯度
Figure BDA00022342099100002511
Figure BDA00022342099100002512
其中,步骤1-2-1构造的条件生成器中所有卷积核和偏置参数构成网络参数总体,θi表示第i个网络参数,i∈[1,ng],ng表示条件生成器参数总数;
步骤1-6-3-3,更新网络参数:用网络学习率λ乘以步骤1-6-3-2计算得到的网络参数梯度
Figure BDA00022342099100002513
得到网络参数修正项,将原网络参数和修正项相减即实现网络参数的更新,公式如下:
Figure BDA0002234209910000261
其中,θ′i表示更新后的网络参数;
步骤2包括以下步骤:
步骤2-1,测试样本读取:将步骤1-1-3-2获得的测试样本集test_sequence_set输入经过训练的条件生成器中;
步骤2-3,前向传播:test_sequence_set经过条件生成器,得到最终的外推图像。
本发明提供了一种基于对抗外推神经网络的雷达回波外推方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (9)

1.一种基于对抗外推神经网络的雷达回波外推方法,其特征在于,包括以下步骤:
步骤1,AENN离线训练:输入雷达数据集,对雷达数据集进行数据预处理,得到训练样本集和测试样本集,初始化AENN网络和训练参数,利用训练样本集采用对抗性策略训练AENN,得到训练过的条件生成器;
步骤2,AENN在线预测:将测试样本集输入经过步骤1获得的条件生成器中,得到预测的雷达回波外推图像;
步骤1包括以下步骤:
步骤1-1,数据预处理:对给定的多普勒天气雷达基数据,通过数据插值得到雷达回波强度等高平面显示CAPPI数据,将CAPPI数据转换为归一化灰度数据,基于归一化灰度数据集划分得到包含TrainsetSize组样本的训练样本集和一定数量的测试样本集;
步骤1-2,AENN初始化:根据AENN结构,构造条件生成器、回波帧判别器和回波序列判别器,其中条件生成器用于在输入的回波序列上产生对未来回波状况的预测,回波帧判别器用于将每个外推回波帧与对应的真实回波帧区分开来,回波序列判别器用于将整个外推回波序列与对应的真实回波序列区分开来,为离线训练阶段提供AENN的初始化模型;
步骤1-3,训练参数初始化:条件生成器、回波帧判别器和回波序列判别器均由Adam优化器训练,设置学习率λ、训练阶段每次输入的样本数量BatchSize和网络训练的最大迭代次数IterationMax;训练样本集的最大批训练次数
Figure FDA0003103468760000011
当前批训练次数BatchNum和当前迭代次数IterationNum均为1;
步骤1-4,训练样本读取:采用批训练的方式,每次训练时从步骤1-1获得的训练样本集中读取BatchSize组训练序列样本sequence;
步骤1-5,前向传播:对步骤1-4读取的每个训练序列样本sequence,条件生成器将训练序列样本sequence中输入序列input作为输入,前向传播输出预测回波序列;回波帧判别器将训练序列样本sequence中对照序列contrast的回波帧或预测回波序列中的预测回波帧作为输入,前向传播输出一个概率标量p1;回波序列判别器将训练序列样本sequence中输入序列input和预测回波序列作为输入,或将训练序列样本sequence作为输入,前向传播输出一个概率标量p2
步骤1-6,对抗性策略训练:每次训练AENN时首先训练回波帧判别器,再训练回波序列判别器,最后训练条件生成器,采用交替训练优化的方式,训练它们之中的任意一个时另外两个的参数保持不变,根据步骤1-5被训练网络前向传播得到的输出,计算相应的损失函数,根据损失函数计算被训练网络参数的梯度,利用随机梯度下降的方法更新参数,设置回波帧判别器、回波序列判别器和条件生成器的训练次数比;
步骤1-7,离线训练阶段控制:对离线神经网络训练阶段进行整体控制,分为以下三种情况:
如果训练样本集中仍存在未使用过的训练样本,即BatchNum<BatchMax,则返回步骤1-4继续读取BatchSize组训练样本,进行网络训练;
如果训练样本集中不存在未使用过的训练样本,即BatchNum=BatchMax,且当前网络迭代次数小于最大迭代次数,即IterationNum<IterationMax,则令BatchNum=1,返回步骤1-4继续读取BatchSize组训练样本,进行网络训练;
如果训练样本集中不存在未使用过的训练样本,即BatchNum=BatchMax,且网络迭代次数达到最大迭代次数,即IterationNum=IterationMax,则结束AENN离线训练阶段,此时条件生成器能够在输入的回波序列上产生对未来回波状况的预测。
2.根据权利要求1所述的方法,其特征在于,步骤1-1包括以下步骤:
步骤1-1-1,数据插值:基于反距离加权法进行数据插值,通过坐标变换将多普勒天气雷达基数据的空间极坐标转化为空间直角坐标,并划分插值网格,再遍历所有空间直角坐标点,计算其对影响范围内所有插值网格点的权重和贡献值,最后遍历所有网格点,计算插值后网格点数据,得到CAPPI数据;
步骤1-1-2,数据转换:对步骤1-1-1数据插值得到的CAPPI数据,通过分辨率调整转化为分辨率256×256的数据,再通过数据映射和归一化将反射率数据转化为归一化灰度数据集;
步骤1-1-3,样本集划分:对步骤1-1-2得到的归一化灰度数据集按时间顺序排列,将数据分段划分为序列并汇总得到序列样本总集,再划分得到训练样本集和测试样本集。
3.根据权利要求2所述的方法,其特征在于,步骤1-1-1包括以下步骤:
步骤1-1-1-1,坐标变换:通过坐标变换将多普勒天气雷达基数据的空间极坐标数据转化为空间直角坐标数据;多普勒天气雷达基数据根据空间极坐标确定空间位置,表示为
Figure FDA0003103468760000031
其中r表示坐标点到原点距离,o表示仰角,φ表示方位角,将其变换为空间直角坐标(x,y,z),其中x表示水平橫坐标,y表示水平纵坐标,z表示垂直高度,变换公式如下:
Figure FDA0003103468760000032
Figure FDA0003103468760000033
Figure FDA0003103468760000034
其中,
Figure FDA0003103468760000035
R表示地球半径;
步骤1-1-1-2,划分插值网格:设定插值网格橫、纵坐标值域为[-480,480],网格分辨率为1,划分出分辨率为960×960的插值网格;
步骤1-1-1-3,计算权重和贡献值:遍历步骤1-1-1-1坐标变换后得到的每一空间直角坐标点,计算其对所有影响插值网格点的影响权重和贡献值,并存储于对应网格点的权重矩阵weight_mat rix和贡献值矩阵contribution_matrix中,其中,空间直角坐标点影响的插值网格点集表示为:
Figure FDA0003103468760000036
其中,(x′,y′)表示插值网格点坐标,height表示CAPPI高度,affect_radius表示影响半径;
基于反距离加权进行数据插值,则空间直角坐标点对网格点的影响权重w随两者距离增加指数级衰减,贡献值c则等于权重和坐标点数据值乘积,计算公式如下:
w=d-2
c=w×reflectivity
其中,d表示空间直角坐标点和网格点间的距离,reflectivi ty表示空间直角坐标点的反射率数据值;
步骤1-1-1-4,计算插值数据:对步骤1-1-1-2插值网格划分得到的每一插值网格点,CAPPI数据cappi_data计算公式如下:
Figure FDA0003103468760000041
4.根据权利要求3所述的方法,其特征在于,步骤1-1-2包括以下步骤:
步骤1-1-2-1,分辨率调整:对步骤1-1-1-4数据插值得到的CAPPI数据,通过裁剪保留中间区域分辨率为480×480部分数据,再通过双线性插值方法将裁剪后数据分辨率调整至256×256,将分辨率调整后的反射率CAPPI数据记为adjustment_data;
步骤1-1-2-2,数据映射和归一化:对步骤1-1-2-1分辨率调整后得到的反射率数据adjustment_data,首先将回波反射率值剪裁为0~75dbz,然后将其映射为值域[0,255]的灰度pixel数据,再通过归一化处理得到归一化灰度数据χ,数据映射公式如下:
Figure FDA0003103468760000042
其中,
Figure FDA0003103468760000043
表示向下取整;
数据归一化公式为:
Figure FDA0003103468760000044
最终得到的归一化灰度数据χ特征数为1,分辨率为256×256。
5.根据权利要求4所述的方法,其特征在于,步骤1-1-3包括以下步骤:
步骤1-1-3-1,序列划分:将所有经步骤1-1-2数据转换得到的归一化灰度数据χ汇总得到归一化灰度数据集,再将其中数据分段划分为序列,首先将数据按时间顺序排列,随后将每8个数据划分为一个序列sequence,其中,前5个数据作为输入序列input,后3个数据作为对照序列contrast,序列表示为:
sequence={input,contrast},
其中,input={χt-4t-3t-2t-1t},contrast={χt+5t+10t+15},χt-4t-3t-2t-1t表示输入序列input中第1到第5个数据,时间上连续;χt+5t+10t+15表示对照序列contrast中第1到第3个数据,时间上间隔为5;t-4,t-3,t-2,t-1,t,t+5,t+10,t+15分别表示数据χt-4t-3t-2t-1tt+5t+10t+15对应的时刻;输入序列input中第5个数据χt和对照序列contrast中第1个数据χt+5时间上间隔为5;后一序列与前一序列对应数据时间间隔为5;
序列总数count_of_sequence由如下公式确定:
Figure FDA0003103468760000051
其中,N表示归一化灰度数据集中数据总数;
步骤1-1-3-2,序列集划分:对步骤1-1-3-1序列划分得到的所有序列汇总为序列样本总集total_sequence_set,按照4:1的比例将序列样本总集中所有序列随机划分出训练样本集train_sequence_set、测试样本集test_sequence_set,最终训练样本集包含TrainsetSize组训练样本。
6.根据权利要求5所述的方法,其特征在于,步骤1-2包括以下步骤:
步骤1-2-1,条件生成器构造:分别构造条件生成器的编码器、卷积长短时记忆模型和解码器三个部分;
步骤1-2-2,回波帧判别器和回波序列判别器构造。
7.根据权利要求6所述的方法,其特征在于,步骤1-2-1包括以下步骤:
步骤1-2-1-1,编码器构造:编码器由3个卷积层构成,从前往后依次为第一个卷积层C1、第二个卷积层C2、第三个卷积层C3;
使用Xavier初始化方法来初始化所有的卷积核参数:
定义参数所在层的输入维度为n,输出维度为m,那么参数将以均匀分布的方式在
Figure FDA0003103468760000052
的范围内进行初始化,并将所有偏置设为0;
对于卷积层C1,令C1层的输出特征图数量OutputMapsC1=32,C1层输出特征图的宽度OutputSizeC1=128,C1层卷积核宽度KernelSizeC1=5,C1层偏置参数biasC1均初始化为0,C1层的卷积核kC1的数量KernelNumberC1=32,卷积核中每一个参数的初始值为
Figure FDA0003103468760000061
对于卷积层C2,令C2层输出特征图数量OutputMapsC2=64,C2层输出特征图的宽度OutputSizeC2=64,C2层卷积核宽度KernelSizeC2=3,C2层偏置参数biasC2均初始化为0,C2层的卷积核kC2的数量KernelNumberC2=64,卷积核中每一个参数的初始值为
Figure FDA0003103468760000062
对于卷积层C3,令C3层输出特征图数量OutputMapsC3=128,C3层输出特征图的宽度OutputSizeC3=32,C3层卷积核宽度KernelSizeC3=3,C3层偏置参数biasC3均初始化为0,C3层的卷积核kC3的数量KernelNumberC3=128,卷积核中每一个参数的初始值为
Figure FDA0003103468760000063
步骤1-2-1-2,卷积长短时记忆模型构造:卷积长短时记忆模型由两个ConvLSTM层构成,从前往后依次为第一个ConvLSTM层LSTM1、第二个ConvLSTM层LSTM2,LSTM1层包含8个单元
Figure FDA0003103468760000064
LSTM2层包含8个单元
Figure FDA0003103468760000065
T时刻的数据对应
Figure FDA0003103468760000066
Figure FDA0003103468760000067
T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15},
Figure FDA0003103468760000068
的输出作为
Figure FDA0003103468760000069
的输入,每个单元的卷积核输出维度为128,卷积核宽度为3,卷积核中每个参数的初始值为
Figure FDA00031034687600000610
偏置均设为0,
Figure FDA00031034687600000611
Figure FDA00031034687600000612
输出特征图的宽度为32;
步骤1-2-1-3,解码器构造:解码器由3个反卷积层构成,从前往后依次为第一个反卷积层uC1、第二个反卷积层uC2、第三个反卷积层uC3;
对于反卷积层uC1,令uC1层输出特征图数量OutputMapsuC1=64,uC1层输出特征图的宽度OutputSizeuC1=64,uC1层卷积核宽度KernelSizeuC1=3,uC1层偏置参数biasuC1均初始化为0,uC1层的卷积核kuC1的数量KernelNumberuC1=64,卷积核中每一个参数的初始值为
Figure FDA0003103468760000071
对于反卷积层uC2,令uC2层输出特征图数量OutputMapsuC2=32,uC2层输出特征图的宽度OutputSizeuC2=128,uC2层卷积核宽度KernelSizeuC2=3,uC2层偏置参数biasuC2均初始化为0,uC2层的卷积核kuC2的数量KernelNumberuC2=32,卷积核中每一个参数的初始值为
Figure FDA0003103468760000072
对于反卷积层uC3,令uC3层的输出特征图数量OutputMapsuC3=1,uC3层输出特征图的宽度OutputSizeuC3=256,uC3层卷积核宽度KernelSizeuC3=3,uC3层偏置参数biasuC3均初始化为0,uC3层的卷积核kuC3的数量KernelNumberuC3=1,卷积核中每一个参数的初始值为
Figure FDA0003103468760000073
8.根据权利要求7所述的方法,其特征在于,步骤1-2-2包括以下步骤:
步骤1-2-2-1,回波帧判别器构造:
回波帧判别器包含第一个卷积层fra_Conv1、第二个卷积层fra_Conv2、第三个卷积层fra_Conv3、第四个卷积层fra_Conv4、第五个卷积层fra_Conv5和平均池化层fra_P;
对于卷积层fra_Conv1,fra_Conv1层输出特征图数量OutputMapsfra_Conv1=32,fra_Conv1层输出特征图的宽度OutputSizefra_Conv1=128,fra_Conv1层卷积核宽度KernelSizefra_Conv1=5,fra_Conv1层偏置参数biasfra_Conv1均初始化为0,fra_Conv1层的卷积核kfra_Conv1的数量KernelNumberfra_Conv1=32,卷积核中每一个参数的初始值为
Figure FDA0003103468760000081
对于卷积层fra_Conv2,fra_Conv2层输出特征图数量OutputMapsfra_Conv2=64,fra_Conv2层输出特征图的宽度OutputSizefra_Conv2=64,fra_Conv2层卷积核宽度KernelSizefra_Conv2=3,fra_Conv2层偏置参数biasfra_Conv2均初始化为0,fra_Conv2层的卷积核kfra_Conv2的数量KernelNumberfra_Conv2=64,卷积核中每一个参数的初始值为
Figure FDA0003103468760000082
对于卷积层fra_Conv3,fra_Conv3层输出特征图数量OutputMapsfra_Conv3=128,fra_Conv3层输出特征图的宽度OutputSizefra_Conv3=32,fra_Conv3层卷积核宽度KernelSizefra_Conv3=3,fra_Conv3层偏置参数biasfra_Conv3均初始化为0,fra_Conv3层的卷积核kfra_Conv3的数量KernelNumberfra_Conv3=128,卷积核中每一个参数的初始值为
Figure FDA0003103468760000083
对于卷积层fra_Conv4,fra_Conv4层输出特征图数量OutputMapsfra_Conv4=256,fra_Conv4层输出特征图的宽度OutputSizefra_Conv4=16,fra_Conv4层卷积核宽度KernelSizefra_Conv4=3,fra_Conv4层偏置参数biasfra_Conv4均初始化为0,fra_Conv4层的卷积核kfra_Conv4的数量KernelNumberfra_Conv4=256,卷积核中每一个参数的初始值为
Figure FDA0003103468760000084
对于卷积层fra_Conv5,fra_Conv5层输出特征图数量OutputMapsfra_Conv5=512,fra_Conv5层输出特征图的宽度OutputSizefra_Conv5=8,fra_Conv5层卷积核宽度KernelSizefra_Conv5=3,fra_Conv5层偏置参数biasfra_Conv5均初始化为0,fra_Conv5层的卷积核kfra_Conv5的数量KernelNumberfra_Conv5=512,卷积核中每一个参数的初始值为
Figure FDA0003103468760000091
对于平均池化层fra_P,令fra_P层池化核宽度KernelSizefra_P=8,令fra_P层输出特征图数量OutputMapsfra_P=512,fra_P层输出特征图宽度OutputSizefra_P=1;
步骤1-2-2-2,回波序列判别器构造:
回波序列判别器包含第一个卷积层seq_Conv1、第二个卷积层seq_Conv2、第三个卷积层seq_Conv3、第四个卷积层seq_Conv4、第五个卷积层seq_Conv5和平均池化层seq_P;
对卷积层seq_Conv1,seq_Conv1层输出特征图数量OutputMapsseq_Conv1=32,seq_Conv1层输出特征图宽度OutputSizeseq_Conv1=128,seq_Conv1层卷积核宽度KernelSizeseq_Conv1=5,seq_Conv1层偏置参数biasseq_Conv1均初始化为0,seq_Conv1层的卷积核kseq_Conv1的数量KernelNumberseq_Conv1=32,卷积核中每一个参数的初始值为
Figure FDA0003103468760000092
对卷积层seq_Conv2,seq_Conv2层输出特征图数量OutputMapsseq_Conv2=64,seq_Conv2层输出特征图的宽度OutputSizeseq_Conv2=64,seq_Conv2层卷积核宽度KernelSizeseq_Conv2=3,seq_Conv2层偏置参数biasseq_Conv2均初始化为0,seq_Conv2层的卷积核kseq_Conv2的数量KernelNumberseq_Conv2=64,卷积核中每一个参数的初始值为
Figure FDA0003103468760000093
对卷积层seq_Conv3,seq_Conv3层输出特征图数量OutputMapsseq_Conv3=128,seq_Conv3层输出特征图的宽度OutputSizeseq_Conv3=32,seq_Conv3层卷积核宽度KernelSizeseq_Conv3=3,seq_Conv3层偏置参数biasseq_Conv3均初始化为0,seq_Conv3层的卷积核kseq_Conv3的数量KernelNumberseq_Conv3=128,卷积核中每一个参数的初始值为
Figure FDA0003103468760000101
对卷积层seq_Conv4,seq_Conv4层输出特征图数量OutputMapsseq_Conv4=256,seq_Conv4层输出特征图的宽度OutputSizeseq_Conv4=16,seq_Conv4层卷积核宽度KernelSizeseq_Conv4=3,seq_Conv4层偏置参数biasseq_Conv4均初始化为0,seq_Conv4层的卷积核kseq_Conv4的数量KernelNumberseq_Conv4=256,卷积核中每一个参数的初始值为
Figure FDA0003103468760000102
对卷积层seq_Conv5,seq_Conv5层输出特征图数量OutputMapsseq_Conv5=512,seq_Conv5层输出特征图的宽度OutputSizeseq_Conv5=8,seq_Conv5层卷积核宽度KernelSizeseq_Conv5=3,seq_Conv5层偏置参数biasseq_Conv5均初始化为0,seq_Conv5层的卷积核kseq_Conv5的数量KernelNumberseq_Conv5=512,卷积核中每一个参数的初始值为
Figure FDA0003103468760000103
对平均池化层seq_P,seq_P层池化核宽度KernelSizeseq_P=8,seq_P层的输出特征图数量OutputMapsseq_P=512,seq_P层输出特征图的宽度OutputSizeseq_P=1。
9.根据权利要求8所述的方法,其特征在于,步骤1-5包括以下步骤:
步骤1-5-1,条件生成器预测回波序列输出:在条件生成器中提取步骤1-4获得的输入图像序列{χt-4t-3t-2t-1t}特征,输出预测回波序列
Figure FDA0003103468760000104
步骤1-5-2,回波帧判别器概率标量计算:在回波帧判别器中提取预测回波帧
Figure FDA0003103468760000105
或对照回波帧(χn,n∈{t+5,t+10,t+15})特征,得到一个概率标量p1
步骤1-5-3,回波序列判别器概率标量计算:在回波序列判别器中提取真实回波序列{χt-4:tt+5,t+10,t+15}或假回波序列
Figure FDA0003103468760000111
特征,得到一个概率标量p2
步骤1-5-1包括以下步骤:
步骤1-5-1-1,网络层类型判断:用lg表示当前所处的条件生成器中的网络层,lg初始值为C1,判断网络层lg的类型,若lg∈{C1,C2,C3},则lg为卷积层,执行步骤1-5-1-2,若lg∈{LSTM1,LSTM2},执行步骤1-5-1-3,若lg∈{uC1,uC2,uC3},则lg为反卷积层,执行步骤1-5-1-4;
步骤1-5-1-2,编码器处理:此时有lg=lc,lc∈{C1,C2,C3},首先计算lc层的第j个输出特征图
Figure FDA0003103468760000112
将lc层的输入特征图集与该层的对应卷积核
Figure FDA0003103468760000113
相卷积,卷积结果加上lc层的第j个偏置参数
Figure FDA0003103468760000114
再经过ReLU激活函数处理,得到
Figure FDA0003103468760000115
计算公式如下所示:
Figure FDA0003103468760000116
其中,
Figure FDA0003103468760000117
表示lC层输入特征图集,同时也是lC-1层的输出特征图集,*表示矩阵卷积,若lC=C1,则
Figure FDA0003103468760000118
为回波帧即归一化灰度数据χ;
各输入回波帧χt-4t-3t-2t-1t分别经过对应的编码器处理之后得到编码器的输出xt-4,xt-3,xt-2,xt-1,xt
步骤1-5-1-3,卷积长短时记忆模型处理:此时lg∈{LSTM1,LSTM2},T时刻T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15}数据对应LSTM1层单元
Figure FDA0003103468760000119
根据输入xT和T-1时刻T-1∈{t-4,t-3,t-2,t-1,t,t+5,t+10}数据对应LSTM1层单元
Figure FDA00031034687600001110
的内存单元、隐藏状态,不断更新自己的内存单元和隐藏状态,并输出隐藏状态;T时刻数据对应LSTM2层单元
Figure FDA00031034687600001111
根据输入和T-1时刻数据对应LSTM2层单元
Figure FDA00031034687600001112
的内存单元、隐藏状态,不断更新自己的内存单元和隐藏状态,并输出隐藏状态;当T=t-4时,前一时刻T-1的内存单元和隐藏状态均为0;更新过程由输入门、遗忘门、输出门控制,其中输入门控制输入和前一时刻隐藏状态的添加,遗忘门决定前一时刻内存单元的遗忘程度,输出门调节该时刻内存单元以输出该时刻隐藏状态;下面是
Figure FDA0003103468760000121
Figure FDA0003103468760000122
具体的前向传播过程:
Figure FDA0003103468760000123
将编码器的输出xT,xT∈{xt-4:t}作为输入,输出为
Figure FDA0003103468760000124
隐藏状态h1 T,T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15},
Figure FDA0003103468760000125
前向传播公式如下:
Figure FDA0003103468760000126
Figure FDA0003103468760000127
Figure FDA0003103468760000128
Figure FDA0003103468760000129
Figure FDA00031034687600001210
其中,σ是sigmoid激活函数,tanh为双曲正切激活函数,*和
Figure FDA00031034687600001211
分别表示卷积运算和哈达玛积;
xT
Figure FDA00031034687600001212
的输入,
Figure FDA00031034687600001213
Figure FDA00031034687600001214
的存储单元,
Figure FDA00031034687600001215
Figure FDA00031034687600001216
的隐藏状态,
Figure FDA00031034687600001217
Figure FDA00031034687600001218
的输入门,
Figure FDA00031034687600001219
Figure FDA00031034687600001220
的遗忘门,
Figure FDA00031034687600001221
Figure FDA00031034687600001222
的输出门,宽度相同;
Figure FDA00031034687600001223
Figure FDA00031034687600001224
是与
Figure FDA00031034687600001225
有关的参数,分别是与xT卷积的卷积核、与
Figure FDA00031034687600001226
卷积的卷积核和偏置;
Figure FDA00031034687600001227
Figure FDA00031034687600001228
是与
Figure FDA00031034687600001229
有关的参数,分别是与xT卷积的卷积核、与
Figure FDA00031034687600001230
卷积的卷积核和偏置;
Figure FDA00031034687600001231
Figure FDA00031034687600001232
是与
Figure FDA00031034687600001233
有关的参数,分别是与xT卷积的卷积核、与
Figure FDA00031034687600001234
卷积的卷积核和偏置;
Figure FDA00031034687600001235
Figure FDA00031034687600001236
是与
Figure FDA00031034687600001237
有关的参数,分别是与xT卷积的卷积核、与
Figure FDA00031034687600001238
卷积的卷积核和偏置;
Figure FDA00031034687600001239
Figure FDA00031034687600001240
隐藏状态h1 T,T∈{t-4,t-3,t-2,t-1,t,t+5,t+10,t+15}作为输入,当T∈{t+5,t+10,t+15},
Figure FDA00031034687600001241
输出隐藏状态,
Figure FDA00031034687600001242
前向传播公式如下:
Figure FDA0003103468760000131
Figure FDA0003103468760000132
Figure FDA0003103468760000133
Figure FDA0003103468760000134
Figure FDA0003103468760000135
Figure FDA0003103468760000136
Figure FDA0003103468760000137
的输入,
Figure FDA0003103468760000138
Figure FDA0003103468760000139
的存储单元,
Figure FDA00031034687600001310
Figure FDA00031034687600001311
的隐藏状态,
Figure FDA00031034687600001312
Figure FDA00031034687600001313
的输入门,
Figure FDA00031034687600001314
Figure FDA00031034687600001315
的遗忘门,
Figure FDA00031034687600001316
Figure FDA00031034687600001317
的输出门,都是3维张量,宽度相同;
Figure FDA00031034687600001318
Figure FDA00031034687600001319
是与
Figure FDA00031034687600001320
有关的参数,分别是与
Figure FDA00031034687600001321
卷积的卷积核、与
Figure FDA00031034687600001322
卷积的卷积核和偏置;
Figure FDA00031034687600001323
Figure FDA00031034687600001324
是与
Figure FDA00031034687600001325
有关的参数,分别是与
Figure FDA00031034687600001326
卷积的卷积核、与
Figure FDA00031034687600001327
卷积的卷积核和偏置;
Figure FDA00031034687600001328
Figure FDA00031034687600001329
是与
Figure FDA00031034687600001330
有关的参数,分别是与
Figure FDA00031034687600001331
卷积的卷积核、与
Figure FDA00031034687600001332
卷积的卷积核和偏置;
Figure FDA00031034687600001333
Figure FDA00031034687600001334
是与
Figure FDA00031034687600001335
有关的参数,分别是与
Figure FDA00031034687600001336
卷积的卷积核、与
Figure FDA00031034687600001337
卷积的卷积核和偏置;
步骤1-5-1-4,解码器处理:此时有lg=luC,luC∈{uC1,uC2,uC3},首先计算luC层的第j个输出特征图
Figure FDA00031034687600001338
将luC层的输入特征图集与该层的对应反卷积核
Figure FDA00031034687600001339
进行反卷积,反卷积结果加上luC层的第j个偏置参数
Figure FDA00031034687600001340
再经过ReLU激活函数处理,得到
Figure FDA00031034687600001341
计算公式如下所示:
Figure FDA00031034687600001342
其中,
Figure FDA00031034687600001343
表示luC层输入特征图集,同时也是luC-1层的输出特征图集,
Figure FDA00031034687600001344
表示反卷积,若luC=uC1,则
Figure FDA00031034687600001345
为LSTM2隐藏状态h2 T,T∈{t+5,t+10,t+15};
各输入LSTM2隐藏状态h2 T,T∈{t+5,t+10,t+15}分别经过对应的解码器处理之后得到解码器的输出
Figure FDA00031034687600001346
即为条件生成器输出的预测回波序列;
步骤1-5-2包括以下步骤:
步骤1-5-2-1,网络层类型判断:用ld_fra表示当前所处的回波帧判别器中的网络层,ld_fra初始值为fra_Conv1,判断网络层ld_fra的类型,如果ld_fra∈{fra_Conv1,fra_Conv2,fra_Conv3,fra_Conv4,fra_Conv5},则ld_fra为卷积层,执行步骤1-5-2-2,若ld_fra为平均池化层fra_P,执行步骤1-5-2-3;
步骤1-5-2-2,卷积处理:
此时ld_fra∈{fra_Conv1,fra_Conv2,fra_Conv3,fra_Conv4,fra_Conv5},首先计算ld_fra层的第j个输出特征图
Figure FDA0003103468760000141
将ld_fra层的输入特征图集与该层的对应卷积核
Figure FDA0003103468760000142
相卷积,卷积结果加上ld_fra层的第j个偏置参数
Figure FDA0003103468760000143
再经过泄露率为0.2的带泄露修正线性单元Leaky ReLU激活函数处理,得到
Figure FDA0003103468760000144
计算公式如下所示:
Figure FDA0003103468760000145
其中,
Figure FDA0003103468760000146
表示ld_fra层输入特征图集,同时也是ld_fra-1层的输出特征图集,*表示矩阵卷积,若ld_fra=fra_Conv1,则
Figure FDA0003103468760000147
为预测回波帧
Figure FDA0003103468760000148
或对照回波帧(χn,n∈{t+5,t+10,t+15});
步骤1-5-2-3,平均池化处理:此时ld_fra=fra_P,算出fra_Conv5输出的第j个特征图平均值
Figure FDA0003103468760000149
最终得到向量
Figure FDA00031034687600001410
将此向量再经过Softmax激活函数处理,得到p1,0≤p1≤1;
步骤1-5-3包括以下步骤:
步骤1-5-3-1,网络层类型判断:用ld_seq表示当前所处的回波序列判别器中的网络层,ld_seq初始值为seq_Conv1,判断网络层ld_seq的类型,若ld_seq∈{seq_Conv1,seq_Conv2,seq_Conv3,seq_Conv4,seq_Conv5},则ld_seq为卷积层,执行步骤1-5-3-2,若ld_seq为平均池化层seq_P,执行步骤1-5-3-3;
步骤1-5-3-2,卷积处理:
此时ld_seq∈{seq_Conv1,seq_Conv2,seq_Conv3,seq_Conv4,seq_Conv5},首先计算ld_seq层的第j个输出特征图
Figure FDA0003103468760000151
将ld_seq层的输入特征图集与该层的对应卷积核
Figure FDA0003103468760000152
相卷积,卷积结果加上ld_seq层的第j个偏置参数
Figure FDA0003103468760000153
再经过泄露率为0.2的带泄露修正线性单元Leaky ReLU激活函数处理,得到
Figure FDA0003103468760000154
计算公式如下所示:
Figure FDA0003103468760000155
其中,
Figure FDA0003103468760000156
表示ld_seq层输入特征图集,同时也是ld_seq-1层的输出特征图集,*表示矩阵卷积,若ld_seq=seq_Conv1,则
Figure FDA0003103468760000157
为真实回波序列{χt-4:tt+5,t+10,t+15}或假回波序列
Figure FDA0003103468760000158
步骤1-5-3-3,平均池化处理:此时ld_seq=seq_P,算出seq_Conv5输出的第j个特征图平均值
Figure FDA0003103468760000159
最终得到向量
Figure FDA00031034687600001510
将此向量再经过Softmax激活函数处理,得到p2,0≤p2≤1;
步骤1-6包括以下步骤:
步骤1-6-1,回波帧判别器训练;
步骤1-6-2,回波序列判别器训练;
步骤1-6-3,条件生成器训练;
步骤1-6-4,用不同的更新率训练生成器和判别器,回波帧判别器、回波序列判别器和条件生成器的更新比为1:1:3,采用交替训练优化的方式,直到条件生成器可以在输入的回波序列上产生对未来回波状况的精确预测;
步骤1-6-1包括以下步骤:
步骤1-6-1-1,回波帧判别器的损失计算:经过步骤1-5-2,回波帧判别器的损失
Figure FDA00031034687600001511
为:
Figure FDA0003103468760000161
dfra表示回波帧判别器的输出,lbce为交叉熵损失函数,表达式为:
Figure FDA0003103468760000162
其中p是标签,值为0或1;
Figure FDA0003103468760000163
是逻辑回归;
步骤1-6-1-2,回波帧判别器网络参数梯度计算:通过求偏导计算步骤1-6-1-1得到的损失函数对每个网络参数的梯度
Figure FDA0003103468760000164
Figure FDA0003103468760000165
其中,步骤1-2-2-1构造的回波帧判别器中所有卷积核和偏置参数构成网络参数总体,θi表示第i个网络参数,i∈[1,nd_fra],nd_fra表示回波帧判别器参数总数;
步骤1-6-1-3,网络参数更新:用网络学习率λ乘以步骤1-6-1-2计算得到的网络参数梯度
Figure FDA0003103468760000166
得到网络参数修正项,将原网络参数和修正项相减即实现网络参数的更新,公式如下:
Figure FDA0003103468760000167
其中,θ′i表示更新后的网络参数;
步骤1-6-2包括以下步骤:
步骤1-6-2-1,回波序列判别器的损失计算:经过步骤1-5-3,回波序列判别器的损失
Figure FDA0003103468760000168
为:
Figure FDA0003103468760000169
dseq表示回波序列判别器的输出,lbce为交叉熵损失函数;
步骤1-6-2-2,回波序列判别器网络参数梯度计算:通过求偏导计算步骤1-6-2-1得到的损失函数对每个网络参数的梯度
Figure FDA00031034687600001610
Figure FDA0003103468760000171
其中,步骤1-2-2-2构造的回波序列判别器中所有卷积核和偏置参数构成网络参数总体,θi表示第i个网络参数,i∈[1,nd_seq],nd_seq表示回波序列判别器参数总数;
步骤1-6-2-3,网络参数更新:用网络学习率λ乘以步骤1-6-2-2计算得到的网络参数梯度
Figure FDA0003103468760000172
得到网络参数修正项,将原网络参数和修正项相减即实现网络参数的更新,公式如下:
Figure FDA0003103468760000173
其中,θ′i表示更新后的网络参数;
步骤1-6-3包括以下步骤:
步骤1-6-3-1,条件生成器的损失计算:经过步骤1-6-1和步骤1-6-2,条件生成器的损失lg为:
Figure FDA0003103468760000174
其中,lrec为重建损失,为预测序列
Figure FDA0003103468760000175
和相应对照序列{χt+5t+10t+15}的均方误差和平均绝对误差之和:
Figure FDA0003103468760000176
Figure FDA0003103468760000177
表示BatchSize个序列样本的第n个序列样本中,时刻为T的数据的坐标为(i,j)的数据值,
Figure FDA0003103468760000178
表示BatchSize个序列样本的第n个序列样本前向传播得到的预测序列中,时刻为T的数据的坐标为(i,j)的数据值;
Figure FDA0003103468760000179
为回波帧对抗损失,表达式为:
Figure FDA00031034687600001710
其中,d'fra表示经过步骤1-6-1得到更新的回波帧判别器的输出;
Figure FDA0003103468760000181
为回波序列对抗损失,表达式为:
Figure FDA0003103468760000182
其中,d'seq表示经过步骤1-6-2得到更新的回波序列判别器的输出;
z1、z2和z3分别是与重建损失lrec、回波帧对抗损失
Figure FDA0003103468760000183
回波序列对抗损失
Figure FDA0003103468760000184
相对应的权重;
步骤1-6-3-2,条件生成器网络参数梯度计算:通过求偏导计算步骤1-6-3-1得到的损失函数对每个网络参数的梯度
Figure FDA0003103468760000185
Figure FDA0003103468760000186
其中,步骤1-2-1构造的条件生成器中所有卷积核和偏置参数构成网络参数总体,θi表示第i个网络参数,i∈[1,ng],ng表示条件生成器参数总数;
步骤1-6-3-3,网络参数更新:用网络学习率λ乘以步骤1-6-3-2计算得到的网络参数梯度
Figure FDA0003103468760000187
得到网络参数修正项,将原网络参数和修正项相减即实现网络参数的更新,公式如下:
Figure FDA0003103468760000188
其中,θ′i表示更新后的网络参数;
步骤2包括以下步骤:
步骤2-1,测试样本读取:将步骤1-1-3-2获得的测试样本集test_sequence_set输入经过训练的条件生成器中;
步骤2-3,前向传播:test_sequence_set经过条件生成器,得到最终的外推图像。
CN201910977797.3A 2019-10-15 2019-10-15 一种基于对抗外推神经网络的雷达回波外推方法 Active CN110568442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910977797.3A CN110568442B (zh) 2019-10-15 2019-10-15 一种基于对抗外推神经网络的雷达回波外推方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910977797.3A CN110568442B (zh) 2019-10-15 2019-10-15 一种基于对抗外推神经网络的雷达回波外推方法

Publications (2)

Publication Number Publication Date
CN110568442A CN110568442A (zh) 2019-12-13
CN110568442B true CN110568442B (zh) 2021-08-20

Family

ID=68784931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910977797.3A Active CN110568442B (zh) 2019-10-15 2019-10-15 一种基于对抗外推神经网络的雷达回波外推方法

Country Status (1)

Country Link
CN (1) CN110568442B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111077523B (zh) * 2019-12-13 2021-12-21 南京航空航天大学 一种基于生成对抗网络的逆合成孔径雷达成像方法
CN111028260A (zh) * 2019-12-17 2020-04-17 上海眼控科技股份有限公司 图像预测方法、装置、计算机设备和存储介质
CN111239739A (zh) * 2020-01-10 2020-06-05 上海眼控科技股份有限公司 气象雷达回波图预测方法、装置、计算机设备和存储介质
CN111428575B (zh) * 2020-03-02 2022-03-04 武汉大学 一种基于孪生网络的针对模糊目标的跟踪方法
CN111796272B (zh) * 2020-06-08 2022-09-16 桂林电子科技大学 穿墙雷达人体图像序列的姿态实时识别方法及计算机设备
CN111915591B (zh) * 2020-08-03 2022-03-22 中国海洋大学 一种基于螺旋生成网络的高质量图像外推系统
CN112052763B (zh) * 2020-08-27 2024-02-09 西安电子科技大学 基于双向回顾生成对抗网络的视频异常事件检测方法
CN112446419B (zh) * 2020-10-29 2023-07-11 中山大学 基于注意力机制的时空神经网络雷达回波外推预报方法
CN112363140B (zh) * 2020-11-05 2024-04-05 南京叁云科技有限公司 一种基于循环神经网络的热力约束外推客观订正方法
CN113538307B (zh) * 2021-06-21 2023-06-20 陕西师范大学 基于多视角超分辨深度网络的合成孔径成像方法
CN114488070B (zh) * 2022-04-08 2022-07-19 北京弘象科技有限公司 一种基于深度学习模型的雷达回波外推方法和装置
CN115857060B (zh) * 2023-02-20 2023-05-09 国家海洋局北海预报中心((国家海洋局青岛海洋预报台)(国家海洋局青岛海洋环境监测中心站)) 基于分层生成对抗网络的短临降水预报方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886023A (zh) * 2017-02-27 2017-06-23 中国人民解放军理工大学 一种基于动态卷积神经网络的雷达回波外推方法
CN108427989A (zh) * 2018-06-12 2018-08-21 中国人民解放军国防科技大学 一种用于雷达回波外推的深度时空预测神经网络训练方法
CN108846409A (zh) * 2018-04-28 2018-11-20 中国人民解放军国防科技大学 基于循环动态卷积神经网络的雷达回波外推模型训练方法
CN109001736A (zh) * 2018-06-12 2018-12-14 中国人民解放军国防科技大学 一种基于深度时空预测神经网络的雷达回波外推方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886023A (zh) * 2017-02-27 2017-06-23 中国人民解放军理工大学 一种基于动态卷积神经网络的雷达回波外推方法
CN108846409A (zh) * 2018-04-28 2018-11-20 中国人民解放军国防科技大学 基于循环动态卷积神经网络的雷达回波外推模型训练方法
CN108427989A (zh) * 2018-06-12 2018-08-21 中国人民解放军国防科技大学 一种用于雷达回波外推的深度时空预测神经网络训练方法
CN109001736A (zh) * 2018-06-12 2018-12-14 中国人民解放军国防科技大学 一种基于深度时空预测神经网络的雷达回波外推方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Enforcing constraints for interpolation and extrapolation inGenerative Adversarial Networks;Panos Stinis 等;《Journal of Computational Physics》;20190725;1-18 *
Generative Adversarial Network-Based Frame Extrapolation for Video Coding;Jianping Lin 等;《2018 IEEE Visual Communications and Image Processing (VCIP)》;20181212;1-4 *
Generative Adversarial Networks Capabilities for Super-Resolution Reconstruction of Weather Radar Echo Images;Hongguang Chen 等;《Atmosphere》;20190916;1-18 *
MLC-LSTM: Exploiting the Spatiotemporal Correlation between Multi-Level Weather Radar Echoes for Echo Sequence Extrapolation;Jinrui Jing 等;《Sensors》;20190915;1-22 *
Spectral Gaps Extrapolation for Stepped-Frequency SAR via Generative Adversarial Networks;Lam Nguyen 等;《2019 IEEE Radar Conference (RadarConf)》;20190426;1-6 *
基于生成对抗网络GAN的人工智能临近预报方法研究;陈元昭 等;《大气科学学报》;20190328;第42卷(第2期);311-320 *

Also Published As

Publication number Publication date
CN110568442A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN110568442B (zh) 一种基于对抗外推神经网络的雷达回波外推方法
CN109001736B (zh) 一种基于深度时空预测神经网络的雷达回波外推方法
CN108427989B (zh) 一种用于雷达回波外推的深度时空预测神经网络训练方法
Zhang et al. A comprehensive wind speed prediction system based on Monte Carlo and artificial intelligence algorithms
Krasnopolsky et al. Complex hybrid models combining deterministic and machine learning components for numerical climate modeling and weather prediction
Zhang et al. Weather radar echo prediction method based on convolution neural network and long short-term memory networks for sustainable e-agriculture
CN112446419B (zh) 基于注意力机制的时空神经网络雷达回波外推预报方法
Sun et al. Prediction of short-time rainfall based on deep learning
CN107121679A (zh) 用于雷达回波外推的循环神经网络预测法及记忆单元结构
CN106920008A (zh) 一种基于改进粒子群优化bp神经网络的风电功率预测方法
CN104636985A (zh) 一种改进bp神经网络的输电线路无线电干扰预测方法
CN110456355B (zh) 一种基于长短时记忆和生成对抗网络的雷达回波外推方法
CN109635245A (zh) 一种鲁棒宽度学习系统
CN110059867A (zh) 一种swlstm结合gpr的风速预测方法
Mahesh et al. Forecasting El Niño with convolutional and recurrent neural networks
CN112381282B (zh) 基于宽度学习系统的光伏发电功率预测方法
CN115902806A (zh) 一种基于多模态的雷达回波外推方法
CN114611808A (zh) 一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法
CN116148796A (zh) 一种基于雷达图像外推的强对流天气临近预报方法
CN112363140B (zh) 一种基于循环神经网络的热力约束外推客观订正方法
CN117271979A (zh) 一种基于深度学习的赤道印度洋表层海流流速预测方法
Zhang et al. A deep learning method for real-time bias correction of wind field forecasts in the Western North Pacific
CN116681154A (zh) 一种基于emd-ao-delm的光伏功率计算方法
Chang et al. Neural network with multi-trend simulating transfer function for forecasting typhoon wave
CN113341419A (zh) 基于VAN-ConvLSTM的天气外推方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant