CN115345207B

CN115345207B - 一种自适应的多气象要素预测方法

Info

Publication number: CN115345207B
Application number: CN202211252774.4A
Authority: CN
Inventors: 秦华旺; 雷为好
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2022-10-13
Filing date: 2022-10-13
Publication date: 2023-07-04
Anticipated expiration: 2042-10-13
Also published as: CN115345207A

Abstract

本发明公开了一种自适应的多气象要素预测方法，使用最邻近插值补全缺失值和替换异常值，用一维卷积神经网络对三种气象数据进行特征提取及降维，可以充分考虑数据的深层特征；改进的EM算法求解GMM最佳参数集可以跳出局部最优，改进的GMM模型能对三种气象要素进行分类，再分别预测，起到了对多种气象要素同时进行预测的有益效果；通过DFT‑CNN模型，判断降水和风速状态，根据不同状态，分别设置相对应的子序列分解数目，从而极大的提高预测精度；使用EWT算法将时序数据分解为数目不同的子序列，对三种气象要素各子序列构建BES‑RBF神经网络进行预测，通过序列重构得到更加精确的预测结果。

Description

一种自适应的多气象要素预测方法

技术领域

本发明涉及气象预测技术领域，特别是涉及一种自适应的多气象要素预测方法。

背景技术

气象预测（如降水、气温、风速等）对工农业、渔牧业、航空航海、公共事业、军事以及人们的日常生活有着重要的影响，因此对气象要素进行准确的预测就显得格外的重要，基于数值计算的预报方式，需要进行大量公式的数值求解，耗费的计算机资源较多，此外，无法保证气象预报的实时性，一些传统的预报方式如利用马尔可夫模型或者隐马尔可夫模型进行预报，具有预报精度不高且难以实现短时预报的缺点。

使用BP神经网络进行气象预测较为普遍，但BP神经网络容易陷于局部极小值，训练过程收敛速度较慢，训练时间较长，隐藏层和隐藏层节点数目难以确定，由于以上缺点，BP神经网络对气象数据预测精度较低；使用卷积神经网络、循环神经网络进行气象预测较为复杂，且需要大量历史气象数据，这对于一些缺乏历史观测数据的偏远地区比较困难，这种方式不适合小个体进行学习预测；此外，许多气象预测模型只针对单一气象要素进行预测，并没有实现对多气象要素的同时预测。

降水、气温和风速等气象序列数据具有非平稳、非线性的特征，直接使用处理平稳数据序列的方法对非平稳、非线性气象数据进行建模会产生较大的误差，为了提高预测精度，更好的解决非平稳非线性序列数据的预测问题，可以使用信号分解算法对原始气象数据进行分解，得到多个频率成分简单且较为平稳的子序列，对多个子序列分别建立预测模型，再将预测结果相加，可以有效提高原始气象数据的预测精度；而使用WT的信号分解算法存在最优小波基选取困难的问题；EMD是一种将信号分解成特征模态的方法，但分解信号得到的IMF分量存在着模态混叠现象，每个IMF中会包含不同时间尺度的特征成分，因此，选择合适的信号分解算法非常重要。

发明内容

为了解决以上技术问题，本发明提供一种自适应的多气象要素预测方法，其特征在于：包括以下步骤

S1、确定研究区域，对气象数据进行收集，气象数据包括该区域实测的降水、气温以及风速逐小时时间序列数据；

S2、对收集到的降水、气温以及风速数据分别进行数据预处理；

S3、对预处理后的降水、气温以及风速数据分别进行数据特征提取；

S4、使用飞蛾扑火算法对期望最大化算法进行改进，训练高斯混合模型，得到最优参数集，并对降水、气温以及风速数据进行分类；

S5、对分类后的降水数据进行二分类，并判断是否有雨，若有雨则执行下一步骤，若无雨则输出降水预测结果；对分类后的风速数据进行二分类，并判断是否有风，若有风则执行下一步骤，若无风则输出风速预测结果；

S6、使用经验小波变换方式对分类后的气温数据进行时序分解，得到多个分量后构建BES-RBF神经网络预测具体的气温值；

使用DFT-CNN分类模型分别对降水数据和风速数据进行分类，判断风速状态和降水状态，且根据不同的风速状态和降水状态设置相对应的子序列分解数目，同样使用经验小波变换方式分别对分类后的降水数据和风速数据进行时序分解，得到多个分量后构建相应的BES-RBF神经网络预测具体的降水值和风速值；

将各个子序列预测的气温值、降水值以及风速值相加得到最终预测值。

本发明进一步限定的技术方案是：

进一步的，步骤S2中数据预处理的方法具体为：对数据进行数据清洗，使用最邻近插值，将数据中的异常值和缺失值分别换成距离该异常值和缺失值所在样本点最近的原始数据的样本值，对三种气象数据进行归一化，基于下列公式：

其中，Si表示收集到的数据序列Smin和Smax分别表示收集数据中的最小值和最大值，

表示经过归一化处理后的数据序列。

前所述的一种自适应的多气象要素预测方法，步骤S4中，高斯混合模型由多个多维高斯分布叠加得到，概率密度函数如下，

其中,x表示多维气象数据样本的集合，N表示高斯混合模型包含的多维高斯分布的总簇数，P(x)表示多维高斯混合模型的概率密度；Pn(x)表示第n个多维高斯分布的概率密度，

、/>

、/>

表示待估计参数，分别为第n个高斯分布簇的系数、均值向量以及协方差矩阵；

高斯混合模型通过最大化对数似然函数实现最优参数估计，如下式所示，

其中，M表示总样本的组数，由降水、气温以及风速历史数据组成；xm表示第m组气象样本，

表示需要优化的参数集合。

前所述的一种自适应的多气象要素预测方法，步骤S4中，使用飞蛾扑火算法对期望最大化算法进行改进，训练高斯混合模型的方法包括以下步骤

S4.1、收集历史多年逐小时降水、气温以及风速时间序列数据，通过步骤S2中的数据预处理和步骤S3中的特征提取构建训练集和测试集，设置高斯混合模型阶数；

S4.2、初始化高斯混合模型参数；

S4.3、初始化飞蛾扑火算法参数；

S4.4、使用期望最大化算法随机选择一只飞蛾并生成其位置矩阵和对应的高斯混合模型参数；

S4.5、更新火焰数量；

S4.6、判断是否是首次迭代，若是则根据飞蛾初始位置计算出个体适应度并排序，若否则更新火焰位置；

S4.7、更新飞蛾位置矩阵并计算适应度值，与前一代最高的个体适应度值比较后，选择更高的适应度值；

S4.8、判断是否满足终止条件，若是则输出最优参数集，结束训练，若为否则返回步骤S4.4。

前所述的一种自适应的多气象要素预测方法，步骤S4.2中，初始化高斯混合模型参数的方法具体为，随机生成值大于零的三维向量

和3x3的随机数矩阵/>

，以及N个初始均值向量/>

和高斯混合模型系数/>

，通过下式将系数/>

标准化，使系数和为1，

其中，

表示高斯混合模型系数。

前所述的一种自适应的多气象要素预测方法，步骤S4.8中的最佳参数集如下所示，

其中，

表示最佳参数集，/>

表示第n个高斯分布簇的系数，/>

表示第n个均值向量，/>

和/>

分别表示第n个用于构造协方差矩阵的3维特征向量和3x3的随机矩阵；

通过计算最大后验概率，对降水、气温以及风速数据进行分类，公式如下：

其中，

表示第n个高斯分布簇的系数，/>

表示第m组气象样本多维高斯混合模型的概率密度，/>

表示第m组气象样本的第n个多维高斯分布的概率密度。

前所述的一种自适应的多气象要素预测方法，步骤S5中，将历史多年逐小时降水数据分为无降水数据和有降水数据，将历史多年逐小时风速数据分为有风数据和无风数据，采用最大间隔法策略分别训练两个对应的支持向量机，得到分离超平面及分类决策函数；

其中，

表示法向量的最优解，/>

表示截距的最优解，G(x)表示分类决策函数；

分别对实测降水数据和实测风速数据二分类，并判断是否有雨以及是否有风，若没有雨则输出降水预测结果，若有雨则执行步骤S6，若没有风则输出风速预测结果，若有风则执行步骤S6。

前所述的一种自适应的多气象要素预测方法，步骤S6中，使用DFT-CNN分类模型对风速数据以及降水数据进行分类的方法，包括以下步骤

S6.1.1、将风速一维时间序列数据转为二维图像，基于如下公式，

其中，T((j-1)×N+k)表示截取的一维时序数据中的第(j-1)×N+k个数据值，I(j,k)表示转换之后图像第j行、第k列的像素点，

和/>

分别表示求最大值函数和求最小值函数，/>

表示舍入函数，即使转换之后的像素值仅保持整数部分；

S6.1.2、使用二维离散傅里叶变换对得到的二维图像求得图像频谱，公式如下，

式中，f(x,y)表示一幅

的矩阵，其所在的坐标系被称为空间域；F(u,v)表示f(x,y)的傅里叶变换，其所在坐标系被称为频域；

S6.1.3、使用训练好的卷积神经网络对得到的频谱图进行三分类，即可判断当前实测的风速状态以及降水状态，对频谱图进行三分类前首先将频谱图的尺寸调整为[1,N,N]。

前所述的一种自适应的多气象要素预测方法，步骤S6中，使用经验小波变换方式对分类后的气温数据、降水数据以及风速数据进行时序分解，包括以下步骤

S6.2.1、确定气温、风速状态以及降水状态分别利用经验小波变换方式所分解的子序列数目的关系，风速状态分别为风速状态1、风速状态2以及风速状态3，降水状态分别为降水状态1、降水状态2以及降水状态3，关系如下，

其中，K7表示气温数据分解后子序列数目，K1、K2、K3分别表示降水状态1、降水状态2和降水状态3所对应的子序列分解数目，K4、K5、K6分别表示风速状态1、风速状态2和风速状态3所对应的子序列分解数目；

S6.2.2、对实测气温时间序列h(t)1，经过经验小波变换方式分解后得到，

其中，

表示信号分解得到的模态分量，K7表示气温序列分解的子序列数目；

S6.2.3、对实测风速时间序列h(t)2和实测降水时间序列h(t)3，分别经过经验小波变换方式分解后得到，

其中，

均表示信号分解得到的模态分量，子序列的数目N1和N2由当前风速和降水状态决定。

前所述的一种自适应的多气象要素预测方法，步骤S6中，构建BES-RBF的方法包括以下步骤

S6.3.1、选取历史多年降水、气温和风速数据进行步骤S2中的数据预处理和步骤S3中的特征提取，通过经验小波变换方式分解分别得到降水、气温和风速数据子序列数据集，将每一子序列数据集都划分为训练集和测试集；

S6.3.2、初始化秃鹰算法参数；

S6.3.3、初始化RBF神经网络参数；

S6.3.4、计算秃鹰个体适应度值，选择最佳适应度值，更新秃鹰位置；

S6.3.5、秃鹰通过螺旋搜索猎物和选择相应区域，更新秃鹰位置；

S6.3.6、在搜索空间中，更新位置后对猎物俯冲，更新秃鹰位置；

S6.3.7、判断是否满足结束条件，若满足则输出最优RBF初始化参数，否则重复步骤S6.3.4至步骤S6.3.7；

S6.3.8、使用训练集训练RBF网络，得到预测模型，利用下式预测：

其中，d表示隐藏层单元数；

表示欧式范数，x表示输入层的向量，/>

表示基函数的中心、/>

表示基宽度、/>

表示隐含层与输出层的连接权重值；

S6.3.9、对气温各子序列预测的结果重构，输出最终预测结果，使用皮尔逊相关系数防止合并子序列时操作重复，公式如下，

其中，HK,L表示两子序列K、L之间的皮尔逊相关系数，

和/>

分别表示子序列K、L的均值，n表示子序列K、L中的数据数目。

本发明的有益效果是：

（1）本发明中，使用最邻近插值补全缺失值和替换异常值，用一维卷积神经网络对三种气象数据进行特征提取及降维，可以充分考虑数据的深层特征；针对降水和风速时间序列数据的随机性和间歇性，分别利用历史数据训练支持向量机，再判断实测数据有无降水以及有无风速，若有降水或者有风，则进一步预测具体的降水和风速数值；

（2）本发明中，通过飞蛾扑火算法对EM算法进行优化，可以提高模型的鲁棒性，改进的EM算法求解GMM最佳参数集可以跳出局部最优，改进的高斯混合模型能对三种气象要素进行分类，再分别预测，起到了对多种气象要素同时进行预测的有益效果；

（3）本发明中，降水、气温和风速三种信号稳定程度不一，相较而言，风速在空间中随时间变化最剧烈，信号中包含的高频成分较多，气温信号则随时间变化的最缓慢，信号中包含的低频成分较多；本方法对气温时序信号直接使用EWT算法进行分解，但对降水、风速这类气象数据，直接使用EWT算法分解成固定数目或很多个子序列，再分别建立预测模型，并不合理，因为降水、风速在某些时间段内变化的可能也相对较为平缓，包含的低频成分较多，仍直接使用信号分解算法，分解成较多个或固定数目的子序列进行预测，不仅会浪费计算资源，还可能会影响预测精度，因此，本方法设计了DFT-CNN模型，去判断降水和风速的状态，根据不同状态，分别设置相对应的子序列分解数目，这样可以极大的提高预测精度；

（4）本发明中，降水、气温和风速等气象序列数据具有非平稳、非线性的特征，直接使用RBF神经网络预测，结果不够精确，所以本气象预测方法针对不同气象要素的特性，使用EWT将时序数据分解为数目不同的子序列，对三种气象要素各子序列构建BES-RBF神经网络进行预测，通过序列重构得到更加精确的预测结果。

附图说明

图1为本发明的总流程示意图；

图2为本发明中MFO-GMM模型训练的流程示意图；

图3为本发明中BES-RBF模型训练的流程示意图；

图4为本发明中DFT-CNN分类模型的流程示意图；

图5为本发明中一维时间序列信号转为二维图像的示意图；

图6为本发明中CNN分类模型的示意图。

具体实施方式

本实施例提供的一种自适应的多气象要素预测方法，结构如图1至图3所示，包括以下步骤

S1、确定研究区域，分别收集该区域实测的降水、气温和风速逐小时时间序列数据。

S2、对获取的气象数据分别进行数据预处理，具体为：对数据进行数据清洗，使用最邻近插值，将数据中的异常值和缺失值分别换成距离该异常值和缺失值所在样本点最近的原始数据的样本值；为了减少后续计算的复杂性以及防止数据间量纲的影响，对三种气象数据进行归一化，基于下列公式：

其中，S_i表示收集到的数据序列S_min和S_max分别表示收集数据中的最小值和最大值，

表示经过归一化处理后的数据序列。

步骤S3、对预处理后的降水、气温以及风速数据分别进行数据特征提取；通过对原始数据的特征进行转换，生成新的特征或者成分，会比直接使用原始的特征效果要好，使用主成分分析法（PCA）和非负矩阵分解的方法难以去挖掘数据深层特征，误差较大；

本步骤使用一维卷积神经网络分别提取降水、气温以及风速序列数据中隐含的深层特征，一维卷积神经网络包括用于提取一维序列数据特征的三个卷积层，每层卷积核大小维度设置为1*3，每个卷积层卷积核的个数与输入数据通道数保持一致；将输出结果通过一个池化层，池化操作可以剔除冗余信息，减少计算量；卷积核的参数可以通过历史数据训练学习得到。

步骤S4、高斯混合模型（GMM）是一种常用的分类方法，由于高斯混合模型（GMM）的初始参数随机给定，使用期望最大化算法（EM）求解最佳参数集会陷入局部最优，所以本步骤使用飞蛾扑火算法（MFO）对期望最大化算法（EM）进行改进，提高高斯混合模型（GMM）对降水、气温和风速三种气象数据的分类效果；

高斯混合模型（GMM）由多个多维高斯分布叠加得到，概率密度函数如下：

其中,x表示多维气象数据样本的集合，N表示高斯混合模型（GMM）包含的多维高斯分布的总簇数，P(x)表示多维高斯混合模型（GMM）的概率密度；P_n(x)表示第n个多维高斯分布的概率密度，

、/>

、/>

高斯混合模型（GMM）通过最大化对数似然函数实现最优参数估计，如下式所示，该式也用于在飞蛾扑火算法对期望最大化算法（EM）进行优化时，作为其适应度函数：

其中，M表示总样本的组数，由降水、气温以及风速历史数据组成；x_m表示第m组气象样本，

表示需要优化的参数集合。

本气象预测方法通过飞蛾扑火算法对期望最大化算法（EM）进行优化，将上式作为适应度函数，当满足终止条件或最大迭代次数时，输出最优参数集，具体流程如下：

S4.1、收集历史多年逐小时降水、气温以及风速时间序列数据，通过步骤S2中的数据预处理和步骤S3中的特征提取构建训练集和测试集，设置高斯混合模型（GMM）阶数N=3；

S4.2、初始化高斯混合模型（GMM）参数，具体为：随机生成值大于零的三维向量

和3x3的随机数矩阵/>

，以及N个初始均值向量/>

和高斯混合模型（GMM）系数/>

，通过下式将系数/>

标准化，使系数和为1，

其中，

表示高斯混合模型系数；

S4.3、初始化飞蛾扑火算法参数，飞蛾群体大小设置为f，变量维度设置为g，最大迭代次数设置为E；

S4.4、使用期望最大化算法（EM）随机选择一只飞蛾并生成其位置矩阵和对应的高斯混合模型（GMM）参数；

S4.5、更新火焰数量；

S4.6、判断是否是首次迭代，若是则根据飞蛾初始位置计算出个体适应度并排序；若否则更新火焰位置；

S4.8、判断是否满足终止条件，若是则输出最优参数集，结束训练；若为否则返回步骤S4.4，最佳参数集如下：

其中，

表示最佳参数集，/>

表示第n个高斯分布簇的系数，/>

表示第n个均值向量，/>

和/>

得到

后，遍历样本x_m，按照下式计算x_m由第n个高斯分布生成的后验概率

，并将x_m归于概率最大的那一类，通过计算最大后验概率，可以实现对降水、气温以及风速数据的分类，

其中，

表示第n个高斯分布簇的系数，/>

表示第m组气象样本多维高斯混合模型的概率密度，/>

表示第m组气象样本的第n个多维高斯分布的概率密度。

步骤S5、降水和风速具有稀疏性，而气温在空间上是连续变化的，当24小时降水不高于0.1mm时，视为无降水状态，当平地离地10米处风速不高于0.2m/s时，视为无风状态；

根据划分标准，将历史多年逐小时降水数据分为无降水数据和有降水数据，训练对应支持向量机（SVM）；同样，根据划分标准，将历史多年逐小时风速数据分为无风数据和有风数据，训练对应支持向量机（SVM）；

采用最大间隔法策略分别训练两个对应的训练支持向量机（SVM），由此得到分离超平面及分类决策函数，

其中，

表示法向量的最优解，/>

表示截距的最优解，G(x)表示分类决策函数；

训练好的两个支持向量机（SVM），分别对实测的逐小时降水数据和风速数据二分类，判断是否有雨以及是否有风，若无雨则输出降水预测结果，若有雨则执行下一步骤；若无风则输出风速预测结果，若有风则执行下一步骤。

一般来说需要对分类后的降水数据、气温数据以及风速数据分别进行时序信号分解，得到多个分量后分别构建多个模型预测具体的值，然后再将各个子序列预测的结果值相加得到最终的预测值；但是由于降水、气温和风速三种信号的稳定程度不一，相较而言，风速在空间中随时间变化最剧烈，信号中包含的高频成分较多，气温信号则随时间变化的最缓慢，信号中包含的低频成分较多。

像降水、风速这类气象数据具有非连续性和随时间变化较快的特点，直接使用信号分解算法分解成固定数目或很多个子序列，再分别建立预测模型，并不合理；因为降水、风速在某些时间段内变化的可能也相对较为平缓，如果直接使用信号分解算法，分解成较多个或固定数目的子序列进行预测，不仅会浪费计算资源，还可能会影响预测精度，因此，本方法针对不同气象要素的特性，制定不同的信号分解策略。

步骤S6中，使用两个DFT-CNN分类模型分别对风速和降水时序数据分类，DFT-CNN分类模型如图4所示，以风速为例，采用图像分类的思想对一维时序数据进行分类，包括以下步骤，

S6.1.1、如图5所示，首先需要将一维时间序列数据转为二维图像，从一维时序数据中截取N²段，要求截取的这段时序数据能尽可能的和原始时序数据保持一致长度大小，然后将截取的时序数据填充到

大小的矩阵中，矩阵的每一行都被长度为N的序列数据填充，接着对得到的矩阵归一化到0-255，即得到灰度图像像素值的范围，转换公式如下，

和/>

分别表示求最大值函数和求最小值函数，/>

表示舍入函数，即使转换之后的像素值仅保持整数部分；

S6.1.2、对处理得到的二维图像使用二维离散傅里叶变换（DFT）求图像频谱，图像的频谱图和原图像上各点并不存在一一对应的关系，图像频谱图上的高频部分表示原图像上灰度发生急剧变化的区域，意味着原始风速一维时间序列数据在这一段范围内，高频成分较多；频谱图上的低频部分表示原图像上灰度基本不变或者变化很小的区域，意味着原始风速一维时间序列数据在这一段范围内，低频成分较多；

因此可以使用卷积神经网络（CNN）模型对图像频谱图进行分类，根据图像的频谱图来判断实测的风速数据是哪一种风速状态，二维离散傅里叶变换（DFT）的公式如下：

式中，f(x,y)表示一幅

S6.1.3、对得到的频谱图用卷积神经网络（CNN）进行三分类；如图6所示，卷积神经网络（CNN）包含两个卷积层、两个池化层、一个全连接层以及一个Softmax层；将大量历史风速数据转为二维图像求得频谱图后，使用带有标签的频谱图训练卷积神经网络（CNN）得到最好的权重，损失函数采用L₁损失，从而完成模型的训练；使用训练好的卷积神经网络（CNN）对已有频谱图分类以及判断风速状态之前，需要将频谱图的尺寸调整（reshape）成[1,N,N]，然后再送入网络中进行分类，即可判断当前实测风速的状态。

步骤S6中，使用经验小波变换方式对分类后的气温数据、降水数据以及风速数据进行时序分解，包括以下步骤

S6.2.1、降水、气温和风速三种信号稳定程度不一，相较而言，风速在空间中变化最剧烈，信号包含的高频成分较多，气温信号则变化的最缓慢，针对不同气象要素的特性，进行时序分解时，将气温时间序列数据直接使用EWT算法分解为K₇个子序列；针对风速和降水，本方法分别设计了两个DFT-CNN分类模型进行三分类，来判别当前实测的风速和降水处于哪种状态，具体类别为风速状态1、风速状态2以及风速状态3，分别代表当前实测的风速为低频信号、中频信号以及高频信号，在进行时序信号分解时，分解的子序列个数分别为K_4、K_5、K₆；同理降水的具体类别为降水状态1、降水状态2以及降水状态3，分别代表当前实测的降水为低频信号、中频信号以及高频信号，在进行时序信号分解时，分解的子序列个数分别为K_1、K_2、K₃；相应地，各子序列数目应满足如下条件

；

S6.2.2、使用经验小波变换方式（EWT）对实测气温时间序列进行分解；

S6.2.3、使用经验小波变换方式（EWT）分别对实测风速时间序列和实测降水时间序列进行分解；

经验小波变换方式（EWT）是一种处理非线性、非平稳信号的方式，可以解决WT带来的模态混叠问题，同时避免了EMD缺乏数学理论支撑，对噪声和抽样较为敏感的缺点；三种气象要素中，气温数据随时间变化的最缓慢，其时序信号中包含的低频成分较多，所以本方法直接使用EWT算法，将气温时序信号分解成K₇个子序列，再使用BES-RBF算法对每个子序列进行预测；降水、风速在某些时间段内变化的可能也相对较为平缓，仍直接使用信号分解算法，分解成较多个或固定数目的子序列进行预测，不仅会浪费计算资源，还可能会影响预测精度，所以通过DFT-CNN分类模型判断实测的风速和降水状态，针对不同状态，分别设置相对应的子序列分解数目，在节约计算资源的同时，可以进一步提高预测的精度；

步骤S6.2.2至步骤S6.2.3中，使用经验小波变换方式（EWT）对三种气象要素时序数据进行分解，以气温数据为例，具体过程如下：

首先对信号h(t)₁进行快速傅里叶变换，并获取其频谱

，将频谱范围归一化到[0,π]；

接着对傅里叶频谱进行正确的分割，其边界确定为

,将傅里叶频谱[0,π]分解为K₇个相邻部分，且有/>

，/>

，对于每个/>

，各频带的边界带宽记为：

根据Littlewood-Paley和Meyer理论，经验小波的尺度函数和小波函数分别如下：

其中,

；

根据小波理论和上述尺度函数

以及小波函数/>

，信号h(t)₁可以分解成若干模态分量：

其中，小波变换细节系数W_x(k,t)是信号h(t)₁与小波函数

的内积，而逼近系数W_x(0,t)是信号h(t)₁与尺度函数/>

的内积，则：

对一个气温时间序列h(t)₁,经过经验小波变换方式（EWT）分解后得到：

其中，

表示信号分解得到的模态分量，K₇表示气温序列分解的子序列数目；

同理，将实测风速时间序列h(t)₂和实测降水时间序列h(t)₃，分别经过EWT分解后得到：

其中，

均表示信号分解得到的模态分量，子序列的数目N₁和N₂由当前风速和降水状态决定。

步骤S6中，依据降水、气温以及风速要素分解的子序列数目，分别构建相应数目的BES-RBF模型进行预测；

神经网络具有较强的学习与泛化能力，理论上可以逼近任何一个非线性函数，适合对气象数据进行预测；径向基神经网络（Radical Basis Function Neural Network,RBFNN）是一个三层结构的前向网络，由输入层、隐含层和输出层构成；RBF神经网络是一个能逼近任意精度的模型，克服了BP神经网络泛化能力弱、收敛速度慢、易陷入局部最优以及其函数值不紧密的问题；

RBF神经网络需要优化的参数为基函数的中心

、基宽度/>

、隐含层与输出层的连接权重值/>

，采用随机初始化网络参数的方法，可能会造成梯度消失或爆炸、初始值过大或过小的问题，从而降低网络收敛能力；本步骤使用秃鹰优化算法（Bald Eagle Search,BES）对RBF神经网络初始化参数进行寻优，解决随机初始化参数带来的问题，具体流程如下：

S6.3.1、选取历史多年降水、气温和风速数据进行步骤S2中的数据预处理和步骤S3中的特征提取，通过经验小波变换方式（EWT）分解分别得到降水、气温和风速数据子序列数据集，将每一子序列数据集都划分为训练集和测试集；

S6.3.2、初始化秃鹰算法参数，设置边界值

和/>

，设置种群数量为20，迭代次数为90；

S6.3.3、初始化RBF神经网络的基函数的中心

、基宽度/>

、隐含层与输出层的连接权重值/>

；

S6.3.4、计算秃鹰个体适应度值，选择最佳适应度值，并通过下式更新秃鹰位置：

其中，

取值为[1,2]，对位置变化进行控制；r是一个随机数，取值为[0,1]；Q_i表示第i只秃鹰当前的位置；Q_mean表示秃鹰平均位置分布；Q_best表示秃鹰种群位置中选取的最佳位置；

S6.3.5、秃鹰通过螺旋搜索猎物和选择相应区域，通过下式更新秃鹰位置：

其中，c(i)和z(i)分别表示极坐标中秃鹰的位置，取值范围均为[-1,1]；

S6.3.6、在搜索空间中，更新位置后对猎物俯冲，通过下式更新秃鹰位置：

其中，rand为一个随机数，s₁和s₂表示用于增加秃鹰向最佳和中心点运动强度的参数，取值均为[1.5,2]；

S6.3.8、得到最佳RBF网络初始化参数后，导入训练集进行训练，通过迭代利用梯度下降法最小化MAE损失，更新迭代次数和权重等参数，当满足终止条件后，将最佳基函数的中心

、基宽度/>

、隐含层与输出层的连接权重值/>

带入RBF网络中，得到如下预测模型，结束训练：

其中，d表示隐藏层单元数；

表示欧式范数，x表示输入层的向量，本气象预测方法径向基函数采用高斯函数作为激活函数，高斯函数如下：

其中，

；

S6.3.9、分别对降水、气温和风速要素各子序列预测的结果重构，输出最终预测结果，使用皮尔逊相关系数（Pearson Correlation Coefficient,PCCs）防止合并子序列时操作重复，将两子序列间的皮尔逊系数用H_K,L表示，公式如下：

其中，H_K,L表示两子序列K、L之间的皮尔逊相关系数，

和/>

分别表示子序列K、L的均值，n表示子序列K、L中的数据数目；

若子序列K和L之间的皮尔逊相关系数绝对值越接近1，则这两个序列的相关性越强；若相关系数绝对值越接近于0，则两序列相关性越弱；当系数为0时，两序列线性无关。

本气象预测方法，使用最邻近插值补全缺失值和替换异常值，用一维卷积神经网络对三种气象数据进行特征提取及降维，可以充分考虑数据的深层特征；通过飞蛾扑火算法对期望最大化算法（EM）进行优化，提高模型的鲁棒性，改进的期望最大化算法（EM）求解高斯混合模型（GMM）最佳参数集可以跳出局部最优，改进的高斯混合模型（GMM）能对三种气象要素进行分类，再分别预测，起到了对多种气象要素同时进行预测的有益效果；降水、气温和风速等气象序列数据具有非平稳、非线性的特征，直接使用RBF神经网络预测，结果不够精确，所以本气象预测方法针对不同气象要素的特性，使用经验小波变换方式（EWT）将时序数据分解为数目不同的子序列，对三种气象要素各子序列构建BES-RBF神经网络进行预测，通过序列重构得到更加精确的预测结果。

本方法对多种气象要素同时进行预测，不同气象要素的特点各不相同，降水、气温和风速三种信号稳定程度不一，相较而言，风速在空间中随时间变化最剧烈，信号中包含的高频成分较多，气温信号则随时间变化的最缓慢，信号中包含的低频成分较多。

本方法对气温时序信号直接使用EWT算法进行分解，但对降水、风速这类气象数据，直接使用EWT算法分解成固定数目或很多个子序列，再分别建立预测模型，并不合理，因为降水、风速在某些时间段内变化的可能也相对较为平缓，包含的低频成分较多，仍直接使用信号分解算法，分解成较多个或固定数目的子序列进行预测，不仅会浪费计算资源，还可能会影响预测精度，因此，本方法设计了DFT-CNN模型，去判断降水和风速的状态，根据不同状态，分别设置相对应的子序列分解数目，这样可以极大的提高预测精度。

除上述实施例外，本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案，均落在本发明要求的保护范围。