CN114611608B - 基于深度学习模型的海表面高度数值预报偏差订正方法 - Google Patents
基于深度学习模型的海表面高度数值预报偏差订正方法 Download PDFInfo
- Publication number
- CN114611608B CN114611608B CN202210248883.2A CN202210248883A CN114611608B CN 114611608 B CN114611608 B CN 114611608B CN 202210248883 A CN202210248883 A CN 202210248883A CN 114611608 B CN114611608 B CN 114611608B
- Authority
- CN
- China
- Prior art keywords
- model
- ssh
- feature
- data
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000013136 deep learning model Methods 0.000 title claims abstract description 13
- 238000009826 distribution Methods 0.000 claims abstract description 42
- 230000000694 effects Effects 0.000 claims abstract description 27
- 230000001788 irregular Effects 0.000 claims abstract description 26
- 238000012360 testing method Methods 0.000 claims abstract description 21
- 230000004927 fusion Effects 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000013507 mapping Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 230000015654 memory Effects 0.000 claims description 4
- 239000013535 sea water Substances 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000001932 seasonal effect Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 11
- 230000008859 change Effects 0.000 description 9
- 238000012417 linear regression Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000004075 alteration Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于深度学习模型的海表面高度数值预报偏差订正方法,数据预处理,建立数值预报数据与观测数据间的映射;构建SSH时序特征编码模型;构建SSH多层特征融合订正模型;训练模型并根据测试集结果进行调参;根据测试集评价模型订正效果。本发明通过SSH时序特征编码模型提取SSH非常规分布特征,结合多源要素特征进行时序性特征编码,利用多层特征融合订正模型将时序性特征编码与时空特征编码、订正前SSH相结合,拟合预报与真值之间复杂的非线性关系,拟合精度更高;增加了SSH时序特征编码模型对区域边界的关注度,提高了区域边界的订正效果。
Description
技术领域
本发明属于海洋数值预报模型中海平面高度预报产品的平差订正技术领域,尤其涉及基于深度学习模型的海表面高度数值预报偏差订正方法。
背景技术
海平面高度作为反映海洋环境变化的重要海洋要素之一,可以揭示海水温度盐度变化与海洋渔业、海洋生物发展、国防军事建设密切相关,针对海平面高度预报的研究工作十分重要。
现在主流的海平面高度预报模型多基于海洋数值模式,即在一定的初值和边值条件下,基于经验正交函数分析方法等建立方程求解,拟合海洋物理场,描述海洋要素变化规律。常用的海洋数值模式有HYCOM模式、POM模式、FVCOM模式等。海洋数值预报模型以过去和当前时刻的海水状态为初始状态,考虑海洋及其边界所受的各类作用,基于某种海洋数值模式,数值求解海水运动方程组,结合观测及同化数据,预报未来海洋现象及状态。由于数值模式并不能完全描述海洋的复杂物理过程,利用有限个离散点的值代替时空维度上连续的物理场这种离散的近似计算方式使得数值预报模型得预报结果与真实观测数据间存在一定的误差及系统偏差,因此在实际应用中还需要进行偏差订正,以提高预报精度。
传统的数值预报偏差订正方法,如模式输出统计(model output statistic,MOS)、贝叶斯模式平均(Bayesian ModelAveraging,BMA)等,利用样本信息采用线性回归建立统计关系,对数值预报结果进行平差,而海洋要素系统中存在的关系大多是复杂的非线性关系,并不能被线性回归捕捉。基于此,许多学者尝试使用机器学习方法,如随机森林、神经网络、LSTM等,无需考虑变量间的物理机制,采用纯数据驱动的方式拟合预报值与观测值之间的复杂非线性关系,被证实订正效果优于传统数值预报偏差订正方法。其中LSTM模型及其变体模型ConvLSTM、ST-LSTM等,由于其优越的时序关系捕捉能力,在气象及海洋要素的预报及偏差订正上应用较为广泛。但是由于海平面高度在不同时间会出现大片偏高区域和大片偏低区域,区域内部变化不大,但区域边界变化明显,因此区域边界处的预报结果与真实数据往往存在明显误差,LSTM对这种边界并不敏感,导致整体误差增大。
发明内容
有鉴于此,本发明提出了基于深度学习模型的海表面高度数值预报偏差订正方法用于数值预报模式下海平面高度产品的偏差订正。
本发明公开的基于深度学习模型的海表面高度数值预报偏差订正方法,包括以下步骤:
步骤一:数据预处理,建立数值预报数据与观测数据间的映射;
步骤二:构建SSH时序特征编码模型;
步骤三:构建SSH多层特征融合订正模型;
步骤四:训练模型并根据测试集结果进行调参;
步骤五:根据测试集评价模型订正效果。
进一步的,所述步骤一中,为保证订正后数据的真实性,使用反距离插值方式将数值预报数据插值到观测数据上;为保证模型训练集和测试集属于同一分布,模型在预处理时需针对每一变量进行标准化处理。
进一步的,所述SSH时序特征编码模型包括多源要素特征和SSH非常规分布特征两部分;
SSH非常规分布特征提取模块的计算针对单个时间步进行,将温度、盐度、海水流速等多源要素特征序列利用主成分分析降维后再重构新的SSH特征序列,以此过滤得到SSH特征序列在多要素空间维度下的常规分布信息,然后计算原始SSH特征序列与重构的SSH特征序列之差ResXt,从而最终得到SSH非常规分布特征序列;
多源要素特征序列在进行降维前需要进行去均值化:
其中,为每个特征的均值,Xt[i]为t时刻第i个格网点的特征向量;
X’t的协方差矩阵为
采用特征值分解法,covXt可分解为cov Xt=Q∑Q-1
其中,是covXt的特征向量组成的特征矩阵,∑为一个对角阵,对角线上的元素为特征值;
选择最大的K个特征值对应的特征矩阵重构数据,则原数据与重构数据之间的残差为:ResXt=X′t-X′tQ'Q'T,,
其中ResXt残差部分中对应海平面高度的分量ResXt(SSH)作为SSH非常规分布特征,用于提高模型对边缘部分的订正效果,与多源要素特征共同构成LSTM输入Xt:
Xt=[Xt,ResXt(SSH)]
采用LSTM模块对变量进行编码,提取变量间时序相关的特征信息,选择最后时间步的隐藏状态ht作为SSH时序特征编码模型的特征编码结果,使用遗忘门ft、输入门it、输出门ot分别控制单元接受、保存、输出的状态值,以实现信息的有选择性记忆和忘记;在t时刻,单个单元计算公式如下:
ft=σ(Wf[ht-1,xt]+bf)
it=σ(Wi[ht-1,xt]+bi)
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中,为t时间步的候选细胞状态,Ct为t时间步的保留细胞状态,ht为t时间步的隐藏状态,Wf,bf,Wi,bi,Wo,bo,WC,bC均为模型可训练参数,梯度下降时自动更新。
进一步的,所述步骤三多层特征融合订正模型中,除步骤二得到的时序特征编码ht外,还添加了时空坐标特征编码coorXt和订正前的海平面高度Xt(SSH);其中,时空坐标特征编码包括待订正点对应的时间信息以及待订正点的经纬度,使模型订正过程中考虑了季节性和空间分布特征;添加订正前的海平面高度作为订正模型变量之一构建不受时序特征编码模型影响的捷径链接,避免模型梯度传播困难,提高拟合能力;
模型使用两层全连接网络拟合与真实观测数据间的非线性关系,隐藏层后添加的激活函数为ReLU激活函数,即:
Yt=W2(ReLU(W1[ht,coorXt,Xt(SSH)]+b1))+b2
其中W1、b1为隐藏层参数,W2、b2为输出层参数,均为模型可训练参数。
进一步的,所述步骤四中,SSH非常规分布特征提取模块主成分维数、LSTM模块时间步长及节点数、多层特征融合订正模型隐藏层节点数应作为模型调参变量之一,需根据模型测试结果进行选择。
进一步的,所述步骤五中,采用均方根误差、平均绝对误差、R方三种评价指标对该模型的偏差订正效果进行度量。
进一步的,使用海洋上层部分深度的温度、盐度、海水流速预报数据作为海表面高度偏差订正的辅助数据构成多源要素特征。
本发明的有益效果如下:
克服了传统偏差订正模型只能捕捉简单线性关系之不足,通过SSH时序特征编码模型提取SSH非常规分布特征,结合多源要素特征进行时序性特征编码,利用多层特征融合订正模型将时序性特征编码与时空特征编码、订正前SSH相结合,拟合预报与真值之间复杂的非线性关系,拟合精度更高,而且与真实值的变化趋势更接近。其中SSH非常规分布特征提取模块增加了SSH时序特征编码模型对区域边界的关注度,提高了区域边界的订正效果。
附图说明
图1是本发明流程图;
图2是本发明的模型架构示意图;
图3(a)-图3(b)分别是添加残差模块的模型和未添加残差模块的模型订正后SSH结果分布(横轴为C3SL4观测数据,纵轴为订正后数据);
图4是不同时刻下C3SL4观测与各模型订正后的SSH误差绝对值统计。
具体实施方式
下面结合附图对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。
一种基于深度学习模型的海表面高度数值预报偏差订正方法,包括以下步骤:
步骤一:数据预处理,建立数值预报数据与观测数据间的映射;
步骤二:构建SSH时序特征编码模型;
步骤三:构建SSH多层特征融合订正模型;
步骤四:训练模型并根据测试集结果进行调参;
步骤五:根据测试集评价模型订正效果。
优选的,所述步骤一中,对数据的预处理中,保持观测数据不变,使用反距离插值方式将数值预报数据插值到观测数据对应的格网上。为保证模型训练集和测试集属于同一分布,模型在预处理时需针对每一变量进行标准化处理。反距离插值(Inverse DistanceWeighted)主要依赖于反距离的幂值,幂参数可基于距输出点的距离来控制已知点对内插值的影响。反距离插值为本领域的公知常识,不再赘述。
优选的,所述步骤二中,需要构建SSH时序特征编码模型对步骤一中生成的海洋环境数据集进行表示学习,以生成一种对SSH偏差订正有重要价值的SSH时序特征编码。它需要先通过特征提取层提取多源要素特征和SSH非常规分布特征,然后通过深度LSTM模型来融合这两类特征形成SSH时序特征编码以供后续偏差订正模型使用。其中,多源要素特征是按照传统预报思路筛选出的对SSH具有重要影响的要素特征,其包含了与SSH时空变化相关的信息;SSH非常规分布特征者则是从多要素数据中提取出的SSH所独有的、不与其他要素相关的时空分布特征,体现了SSH独有的时变信息。SSH时序特征编码模型通过深度LSTM模型对这两类特征进行表示学习,可以融合二者各自包含的重要信息,形成对SSH偏差订正更有价值的SSH时序特征编码。
在特征提取层中,对于多源要素特征而言,海表面高度的偏差与临近时刻的海水温度、盐度、流速等具有相关性,因此选择海洋上层部分深度的温度、盐度、海水流速预报数据作为海表面高度偏差订正的辅助数据构成多源要素特征。
在特征提取层中,对于SSH非常规特征而言,将SSH原始时空分布数据在相同时空下减去由其他要素数据重构的SSH时空分布数据则可以得到SSH非常规分布特征。为保证模型的实际可用性,SSH非常规分布特征提取模块的计算针对单个时间步进行,将温度、盐度、海水流速等多源要素特征序列利用主成分分析降维后再重构成新的SSH特征序列,以此过滤得到SSH特征序列在多要素空间维度下的常规分布信息(主成分信息),然后计算原始SSH特征序列与重构的SSH特征序列之差ResXt,从而最终得到SSH非常规分布特征序列。
在此过程中,第t个时间步的多源要素特征Xt在进行降维前需要进行去均值化:
这里,为每个特征的均值,Xt[i]为t时刻第i个格网点的特征向量。
X’t的协方差矩阵为
采用特征值分解法,covXt可分解为covXt=Q∑Q-1
其中,是covXt的特征向量组成的特征矩阵,∑为一个对角阵,对角线上的元素为特征值。
选择最大的K个特征值对应的特征矩阵重构数据,则原数据与重构数据之间的残差为:ResXt=X′t-X′tQ′Q′T
其中ResXt残差部分中对应海平面高度的分量ResXt(SSH)作为SSH非常规分布特征,用于提高模型对边缘部分的订正效果,与多源要素特征共同构成LSTM输入Xt。
Xt=[Xt,ResXt(SSH)]
SSH时序特征编码模型通过深度LSTM模型对这两类特征变量进行表示学习,形成对偏差订正更有价值的SSH时序特征编码:设模型考虑的时间长度为l,对于时刻t而言,LSTM模块输入为包括时刻t在内的l个时刻的特征变量[Xt-l+1,Xt-l+2,…,Xt],经过LSTM模块编码后,选择最后时间步的隐藏状态ht作为SSH时序特征编码模型的结果。
优选的,所述步骤三中,SSH多层特征融合订正模型除了使用步骤二得到的时序特征编码ht外,还添加了时空坐标特征编码coorXt和订正前的海平面高度Xt(SSH)。其中,时空坐标特征编码包括待订正点对应的时间信息(包括对应时间戳、年份、月份、日期)以及待订正点的经纬度,使模型订正过程中考虑了季节性和空间分布特征;添加订正前的海平面高度作为订正模型变量之一构建不受时序特征编码模型影响的捷径链接(shortcut),避免模型梯度传播困难,提高拟合能力。使用两层全连接网络拟合与真实观测数据间的非线性关系,隐藏层后添加的激活函数为ReLU激活函数。
Yt=W2(ReLU(W1[ht,coorXt,Xt(SSH)]+b1))+b2
其中W1、b1为隐藏层参数,W2、b2为输出层参数,均为模型可训练参数。
优选的,所述步骤四中,SSH非常规分布特征提取模块主成分维数、LSTM模块时间步长及节点数、多层特征融合订正模型隐藏层节点数应作为模型调参变量之一,需根据模型测试结果进行选择。本发明中选择主成分维数为15,时间步长为5,LSTM节点数为100,多层特征融合订正模型隐藏层节点数为50。模型损失函数采用均方误差损失函数,优化器选择Adam优化器,训练批次大小(batch size)为256,数据迭代次数(epoch)为30次。
优选的,所述步骤五中,采用均方根误差(Root Mean Squared Error,RMSE)、平均绝对误差(MeanAbsolute Error,MAE)、R方(R Squared,R2)三种评价指标对该模型的偏差订正效果进行度量。
实施例
本发明实施例基于观测和预报两种海洋数据实施:
HYCOM(Hybrid Coordinate Ocean Model)预报模式下获得的全球每三小时平均海平面高度数值预报产品(后文简称为HYCOM数据)。该数据时间分辨率为3小时,空间分辨率为0.08°×0.08°;
哥白尼气候变化服务(Copernicus Climate Change Service,C3S)提供的L4级产品(后文简称为C3SL4数据)。该产品是基于经交叉验证后双卫星测高计测量数据,由DUACS处理系统再加工生成的延时海平面高度全球格网数据。该数据时间分辨率为1天,空间分辨率为0.25°×0.25°;
为保证模型订正后的真值不变,需以C3SL4数据为参考,空间分辨率设置为0.25°×0.25°,时间分辨率设置为天平均,因此选择离真实格网点最近的预报格网点数据使用反距离权重法对HYCOM数据进行空间插值,时间维度上对HYCOM数据每个格网点的数据求得日平均值。研究区域为南海区域(经度105~122°,纬度0~24°),剔除陆地及海底深度低于125m的格网点后,共2850个有效格网点,时间段为时间段为2018年1月1日~2019年12月31日,其中剔除HYCOM数据缺失的2018年01月19日数据,共计729天。
研究区域内共有N=2850个有效空间格网点S={s1,s2,…,sN},时间长度为T=729,其中格点si的经纬坐标为(pi,qi),包含时间戳timet、年份yyt、月份mmt、日期ddt四个属性,t时刻格点si包含温度、盐度、流速、海面高度预报值等时序性变量共D维xt(si)=[ati1,ati2,…,atiD]该格点在该时刻的真实值为yt(si)。
为保证模型的实际可用性,SSH非常规分布特征提取模块计算针对单个时间步进行。设第t个时间步的模型输入数据为主成分分析保留的主成分维数为K(其中,0<K<D),即将D维向量降为K维。SSH非常规分布特征提取模块计算如图3所示。
在此过程中,输入数据在进行主成分分析前需要进行去均值化:
这里,为每个特征的均值,Xt[i]为t时刻第i个格网点的特征向量。
X’t的协方差矩阵为
采用特征值分解法,covXt可分解为cov Xt=Q∑Q-1
其中,是covXt的特征向量组成的特征矩阵,∑为一个对角阵,对角线上的元素为特征值。
选择最大的K个特征值对应的特征矩阵重构数据,则原数据与重构数据之间的残差为:ResXt=X′t-X′tQ′Q′T
其中ResXt残差部分中对应海平面高度的分量ResXt(SSH)作为SSH非常规分布特征,用于提高模型对边缘部分的订正效果,与多源要素特征共同构成LSTM输入Xt。
Xt=[Xt,ResXt(SSH)]
对于LSTM编码模块,使用遗忘门ft、输入门it、输出门ot分别控制LSTM单元接受、保存、输出的状态值,以实现信息的有选择性记忆和忘记。以t时间为例,单个单元计算公式如下:
ft=σ(Wf[ht-1,xt]+bf)
it=σ(Wi[ht-1,xt]+bi)
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中,为t时间步的候选细胞状态,Ct为t时间步的保留细胞状态,ht为t时间步的隐藏状态,Wf,bf,Wi,bi,Wo,bo,WC,bC均为模型可训练参数,梯度下降时自动更新。
选择最后时间步的隐藏状态ht作为SSH时序特征编码模型的特征编码结果。
t时刻格点Si SSH多层特征融合订正模型依赖于t时刻SSH时序性特征编码ht(si)、时空坐标特征编码coorxt(si)=[timet,yyt,mmt,ddt,pi,qi]及订正前海平面高度xt(si)(SSH)。订正模型的训练过程即为找到一个映射函数f,使得yt(si)=f(ht,coorXt,Xt(SSH))。本发明使用添加了ReLU激活函数的两层全连接网络拟合与真实观测数据间的非线性关系,即:
Yt=W2(ReLU(W1[ht,staticXt]+b1))+b2
其中W1、b1为隐藏层参数,W2、b2为输出层参数,均为模型可训练参数。
模型采用点对点的方式进行订正,不同时刻不同格点均为一条样本数据,剔除存在空值的样本数据后,样本数量为M,则对于该模型,设每条样本海平面高度真实值为y={y1,y2,...,yM},模型输出订正值为采用三种性能评价指标:RMSE、MAE和R2。RMSE是模型输出值与真实值之间误差平方的均值开方,MAE输出值与真实值之间误差的均值,RMSE与MAE的量纲相同,指标值越小,模型输出值与真实值越接近,模型订正效果越好。MAE反应的是真实误差,RMSE放大了较大误差之间的差距。R2反映模型输出值的变化趋势与真实趋势的接近程度,取值范围在0-1之间,取值接近于1则模型订正效果越好,可在不同模型上比较。
各性能指标定义为:
1.均方根误差
2.平均绝对误差
3.R2
其中,y为y的均值。
本发明选择使用常规机器学习偏差订正方式中的四种模型与本发明模型(MultiFeature Fusion Correction Model记为MFFC)进行对比实验。涉及模型及介绍如下:
1.本发明所提模型(MFFC):SSH非常规分布特征提取模块K=15,时间步长为5,LSTM节点数为100,全连接隐藏层节点数为50。
2.线性回归模型(Linear):最小二乘回归,计算截距。
3.BP神经网络(BPNN):两层全连接网络,其中隐藏层节点数为50,激活函数为ReLU,模型输入为非时序性变量。
4.长短期记忆网络(LSTM):时间步长为5,节点数为100,模型输入为时序性变量。
5.未添加SSH非常规分布特征提取模块(Unconventional FeatureExtraction)的模型(noUFE-MFFC):与本发明所提模型架构相同,时间步长为5,LSTM节点数为100,全连接隐藏层节点数为50,但不包含PCA残差部分。
模型损失函数均采用均方误差损失函数,优化器选择Adam优化器,训练批次大小(batch size)为256,数据迭代次数(epoch)为30次。
本发明实施例从2018年1月~2019年11月的数据中随机抽取99%数据作为训练数据,1%作为验证集用于模型调参及测试,剩余2019年12月的数据用于模型泛化实验,模拟实际应用场景,在测试时将前一天数据放入模型进行增量训练。两种测试集下订正评价结果如表1所示。
表1不同测试集下订正前后RMSE、MAE、R2评价结果
从实验结果可得到,HYCOM数据和C3SL4数据间由于参考平均海平面不同等原因,存在0.4~0.5m左右的偏差,订正实验中5种订正模型均可消除两者之间的绝大部分偏差,在随机选取样本的测试集上将RMSE和MAE降为0.04和0.03左右。线性回归模型与其余四种机器学习模型相比,不能拟合变量间非线性关系,因此只能消除部分偏差,订正效果最弱。同时,noUFE-MFFC模型与BPNN模型、LSTM模型对比可得,按照信息是否具有时序性划分变量采用不同模块分别处理有利于模型特征学习,提高了订正效果。MFFC模型对随机选取的测试集,无论是在RMSE、MAE及R2指标上均优于其余四种模型,订正效果最好。
对于未训练过的时间段组成的测试集,MFFC模型上订正效果虽稍微次于未添加SSH非常规分布特征提取模块的noUFE-MFFC模型,但MFFC模型在区域边界处预测更准确,说明SSH非常规分布特征提取模块可以增强模型对空间上变化强烈的区域订正效果。对2019年12月的订正数据按照真实值从小到大排序,分别得到MFFC和noUFE-MFFC两个模型的订正结果散点图如图3所示。对于海平面高度真实值在1.2-1.5m范围的数据会出现订正后结果稍微偏低的情况,其余范围两种模型的订正结果均分布在1:1对角线附近,说明MFFC模型对于不同海平面高度的订正效果大致相当,而MFFC模型相对而言更贴近1:1对角线,与真实值的变化趋势更接近,订正效果更好。如图4为2019年12月份每日所有格点在订正前和两种模型订正后的误差绝对值统计结果,可以看出MFFC模型与其余模型模型相比,误差绝对值之和较小,线性回归模型在不同日期的误差订正效果差别较大。
本发明的有益效果是:
克服了传统偏差订正模型只能捕捉简单线性关系之不足,通过SSH时序特征编码模型提取SSH非常规分布特征,结合多源要素特征进行时序性特征编码,利用多层特征融合订正模型将时序性特征编码与时空特征编码、订正前SSH相结合,拟合预报与真值之间复杂的非线性关系,拟合精度更高,而且与真实值的变化趋势更接近。其中SSH非常规分布特征提取模块增加了SSH时序特征编码模型对区域边界的关注度,提高了区域边界的订正效果。
本文所使用的词语“优选的”意指用作实例、示例或例证。本文描述为“优选的”任意方面或设计不必被解释为比其他方面或设计更有利。相反,词语“优选的”的使用旨在以具体方式提出概念。如本申请中所使用的术语“或”旨在意指包含的“或”而非排除的“或”。即,除非另外指定或从上下文中清楚,“X使用A或B”意指自然包括排列的任意一个。即,如果X使用A;X使用B;或X使用A和B二者,则“X使用A或B”在前述任一示例中得到满足。
而且,尽管已经相对于一个或实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以多个或多个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的存储方法。
综上所述,上述实施例为本发明的一种实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何背离本发明的精神实质与原理下所做的改变、修饰、代替、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,包括以下步骤:
步骤一:数据预处理,建立数值预报数据与观测数据间的映射;
步骤二:构建SSH时序特征编码模型;
步骤三:构建SSH多层特征融合订正模型;
步骤四:训练模型并根据测试集结果进行调参;
步骤五:根据测试集评价模型订正效果;
所述SSH时序特征编码模型提取多源要素特征和SSH非常规分布特征两部分;
SSH非常规分布特征的计算针对单个时间步进行,将多源要素特征序列利用主成分分析降维后再重构新的SSH特征序列,以此过滤得到SSH特征序列在多要素空间维度下的常规分布信息,然后计算原始SSH特征序列与重构的SSH特征序列之差ResXt,从而最终得到SSH非常规分布特征序列;
多源要素特征序列在进行降维前进行去均值化:
其中,为每个特征的均值,Xt[i]为t时刻第i个格网点的特征向量,n、N为经反距离插值后的数值预报数据对应的格网数量;
X’t的协方差矩阵为
其中,D为多源要素特征序列在进行降维前的维度;
采用特征值分解法,covXt分解为covXt=Q∑Q-1
其中,是covXt的特征向量组成的特征矩阵,∑为一个对角阵,对角线上的元素为特征值;
选择最大的K个特征值对应的特征矩阵重构数据,其中,K为多源要素特征序列降维后的维度,则原数据与重构数据之间的残差为:ResXt=X′t-X′tQ′Q'T,
其中ResXt残差部分中对应海平面高度的分量ResXt(SSH)作为SSH非常规分布特征,用于提高模型对边缘部分的订正效果,与多源要素特征共同构成LSTM输入Xt:
Xt=[Xt,ResXt(SSH)]
采用LSTM模块对变量进行编码,提取变量间时序相关的特征信息,选择最后时间步的隐藏状态ht作为SSH时序特征编码模型的特征编码结果,使用遗忘门ft、输入门it、输出门ot分别控制单元接受、保存、输出的状态值,以实现信息的有选择性记忆和忘记;在t时刻,单个单元计算公式如下:
ft=σ(Wf(ht-1,xt]+bf)
it=σ(Wi[ht-1,xt]+bi)
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中,为t时间步的候选细胞状态,Ct为t时间步的保留细胞状态,ht为t时间步的隐藏状态,Wf,bf,Wi,bi,Wo,bo,WC,bC均为模型可训练参数,梯度下降时自动更新。
2.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述步骤一中,为保证订正后数据的真实性,使用反距离插值方式将数值预报数据插值到观测数据上;为保证模型训练集和测试集属于同一分布,模型在预处理时针对每一变量进行标准化处理。
3.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述步骤三多层特征融合订正模型中,除步骤二得到的时序特征编码ht外,还添加了时空坐标特征编码coorXt和订正前的海平面高度Xt(SSH);其中,时空坐标特征编码包括待订正点对应的时间信息以及待订正点的经纬度,使模型订正过程中考虑了季节性和空间分布特征;添加订正前的海平面高度作为订正模型变量之一构建不受时序特征编码模型影响的捷径链接,避免模型梯度传播困难,提高拟合能力;
模型使用两层全连接网络拟合与真实观测数据间的非线性关系,隐藏层后添加的激活函数为ReLU激活函数,即:
Yt=W2(ReLU(W1(ht,coorXt,Xt(SSH)]+b1))+b2
其中W1、b1为隐藏层参数,W2、b2为输出层参数,均为模型可训练参数。
4.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述步骤四中,将SSH非常规分布特征提取模块的主成分维数、LSTM模块时间步长及节点数、多层特征融合订正模型隐藏层节点数作为模型调参变量之一,根据模型测试结果进行选择。
5.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述步骤五中,采用均方根误差、平均绝对误差、R方三种评价指标对该模型的偏差订正效果进行度量。
6.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,使用海洋上层部分深度的温度、盐度、海水流速预报数据作为海表面高度偏差订正的辅助数据构成多源要素特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210248883.2A CN114611608B (zh) | 2022-03-14 | 2022-03-14 | 基于深度学习模型的海表面高度数值预报偏差订正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210248883.2A CN114611608B (zh) | 2022-03-14 | 2022-03-14 | 基于深度学习模型的海表面高度数值预报偏差订正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114611608A CN114611608A (zh) | 2022-06-10 |
CN114611608B true CN114611608B (zh) | 2024-04-09 |
Family
ID=81862929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210248883.2A Active CN114611608B (zh) | 2022-03-14 | 2022-03-14 | 基于深度学习模型的海表面高度数值预报偏差订正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611608B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116432702B (zh) * | 2023-06-09 | 2023-08-29 | 南京信息工程大学 | 一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型 |
CN117404853B (zh) * | 2023-12-14 | 2024-03-08 | 山西省水利建筑工程局集团有限公司 | 隧道掘进机外用循环水冷却系统及方法 |
CN117633712B (zh) * | 2024-01-24 | 2024-04-19 | 国家卫星海洋应用中心 | 一种基于多源数据的海表高度数据融合方法、装置及设备 |
CN117909666A (zh) * | 2024-03-19 | 2024-04-19 | 青岛哈尔滨工程大学创新发展中心 | 一种融合数值模式及深度学习的海浪智能订正方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112884217A (zh) * | 2021-02-04 | 2021-06-01 | 国家海洋信息中心 | 一种基于多模型集成的海面高预报方法 |
CN113496104A (zh) * | 2021-07-16 | 2021-10-12 | 中科技术物理苏州研究院 | 基于深度学习的降水预报订正方法及系统 |
CN113807432A (zh) * | 2021-09-16 | 2021-12-17 | 成都卡普数据服务有限责任公司 | 一种基于深度学习的气温预报数据订正方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220003894A1 (en) * | 2018-09-26 | 2022-01-06 | Sofar Ocean Technologies, Inc. | Ocean weather forecasting system |
-
2022
- 2022-03-14 CN CN202210248883.2A patent/CN114611608B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112884217A (zh) * | 2021-02-04 | 2021-06-01 | 国家海洋信息中心 | 一种基于多模型集成的海面高预报方法 |
CN113496104A (zh) * | 2021-07-16 | 2021-10-12 | 中科技术物理苏州研究院 | 基于深度学习的降水预报订正方法及系统 |
CN113807432A (zh) * | 2021-09-16 | 2021-12-17 | 成都卡普数据服务有限责任公司 | 一种基于深度学习的气温预报数据订正方法 |
Non-Patent Citations (1)
Title |
---|
基于ECMWF产品的站点气温预报集成学习误差订正;陈昱文;黄小猛;李熠;陈悦;徐挚仁;黄兴;;应用气象学报;第31卷(第04期);第494-500页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114611608A (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114611608B (zh) | 基于深度学习模型的海表面高度数值预报偏差订正方法 | |
Zhou et al. | A review on global solar radiation prediction with machine learning models in a comprehensive perspective | |
US20230128989A1 (en) | Systems and methods of data preprocessing and augmentation for neural network climate forecasting models | |
US10909446B2 (en) | Systems and methods for selecting global climate simulation models for training neural network climate forecasting models | |
Brown et al. | A necessarily complex model to explain the biogeography of the amphibians and reptiles of Madagascar | |
Tran Anh et al. | Downscaling rainfall using deep learning long short‐term memory and feedforward neural network | |
Gamliel et al. | Incorporating physiology into species distribution models moderates the projected impact of warming on selected Mediterranean marine species | |
Raje et al. | A comparison of three methods for downscaling daily precipitation in the Punjab region | |
Mandle et al. | Assessing ecosystem service provision under climate change to support conservation and development planning in Myanmar | |
CN110648014A (zh) | 一种基于时空分位数回归的区域风电预测方法及系统 | |
CN115471016B (zh) | 一种基于cisso与daed的台风预测方法 | |
CN114936620B (zh) | 基于注意力机制的海表面温度数值预报偏差订正方法 | |
Zambrano et al. | The scale dependency of trait‐based tree neighborhood models | |
Zhang et al. | Estimating the grade of storm surge disaster loss in coastal areas of China via machine learning algorithms | |
CN114065996A (zh) | 基于变分自编码学习的交通流预测方法 | |
CN116844041A (zh) | 一种基于双向卷积时间自注意力机制的耕地提取方法 | |
Vosper et al. | Deep Learning for Downscaling Tropical Cyclone Rainfall to Hazard‐Relevant Spatial Scales | |
CN113536373B (zh) | 一种脱敏气象数据的生成方法 | |
van Vloten et al. | HyTCWaves: A Hybrid model for downscaling Tropical Cyclone induced extreme Waves climate | |
Pringle et al. | A new approach for the stochastic simulation of regional wave climates conditioned on synoptic-scale meteorology | |
CN114819253A (zh) | 城市人群聚集热点区域预测方法、系统、介质及终端 | |
Kesavavarthini et al. | Bias correction of CMIP6 simulations of precipitation over Indian monsoon core region using deep learning algorithms | |
Jiang et al. | A stacked ensemble learning and non‐homogeneous hidden Markov model for daily precipitation downscaling and projection | |
Amendola et al. | A neural network ensemble downscaling system (SIBILLA) for seasonal forecasts over Italy: winter case studies | |
Lee et al. | A new statistical correction strategy to improve long‐term dynamical prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |