CN115345207B - 一种自适应的多气象要素预测方法 - Google Patents
一种自适应的多气象要素预测方法 Download PDFInfo
- Publication number
- CN115345207B CN115345207B CN202211252774.4A CN202211252774A CN115345207B CN 115345207 B CN115345207 B CN 115345207B CN 202211252774 A CN202211252774 A CN 202211252774A CN 115345207 B CN115345207 B CN 115345207B
- Authority
- CN
- China
- Prior art keywords
- data
- wind speed
- precipitation
- representing
- air temperature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000001556 precipitation Methods 0.000 claims abstract description 118
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 49
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 44
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 32
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims abstract description 6
- 239000000203 mixture Substances 0.000 claims description 42
- 238000012549 training Methods 0.000 claims description 32
- 238000009826 distribution Methods 0.000 claims description 23
- 239000011159 matrix material Substances 0.000 claims description 19
- 239000013598 vector Substances 0.000 claims description 17
- 241000511338 Haliaeetus leucocephalus Species 0.000 claims description 16
- 230000003044 adaptive effect Effects 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 12
- 230000001629 suppression Effects 0.000 claims description 12
- 238000013145 classification model Methods 0.000 claims description 11
- 238000012706 support-vector machine Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000036621 balding Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000009189 diving Effects 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000009467 reduction Effects 0.000 abstract description 3
- 230000000295 complement effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 30
- 230000008859 change Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 7
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 241000272184 Falconiformes Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种自适应的多气象要素预测方法,使用最邻近插值补全缺失值和替换异常值,用一维卷积神经网络对三种气象数据进行特征提取及降维,可以充分考虑数据的深层特征;改进的EM算法求解GMM最佳参数集可以跳出局部最优,改进的GMM模型能对三种气象要素进行分类,再分别预测,起到了对多种气象要素同时进行预测的有益效果;通过DFT‑CNN模型,判断降水和风速状态,根据不同状态,分别设置相对应的子序列分解数目,从而极大的提高预测精度;使用EWT算法将时序数据分解为数目不同的子序列,对三种气象要素各子序列构建BES‑RBF神经网络进行预测,通过序列重构得到更加精确的预测结果。
Description
技术领域
本发明涉及气象预测技术领域,特别是涉及一种自适应的多气象要素预测方法。
背景技术
气象预测(如降水、气温、风速等)对工农业、渔牧业、航空航海、公共事业、军事以及人们的日常生活有着重要的影响,因此对气象要素进行准确的预测就显得格外的重要,基于数值计算的预报方式,需要进行大量公式的数值求解,耗费的计算机资源较多,此外,无法保证气象预报的实时性,一些传统的预报方式如利用马尔可夫模型或者隐马尔可夫模型进行预报,具有预报精度不高且难以实现短时预报的缺点。
使用BP神经网络进行气象预测较为普遍,但BP神经网络容易陷于局部极小值,训练过程收敛速度较慢,训练时间较长,隐藏层和隐藏层节点数目难以确定,由于以上缺点,BP神经网络对气象数据预测精度较低;使用卷积神经网络、循环神经网络进行气象预测较为复杂,且需要大量历史气象数据,这对于一些缺乏历史观测数据的偏远地区比较困难,这种方式不适合小个体进行学习预测;此外,许多气象预测模型只针对单一气象要素进行预测,并没有实现对多气象要素的同时预测。
降水、气温和风速等气象序列数据具有非平稳、非线性的特征,直接使用处理平稳数据序列的方法对非平稳、非线性气象数据进行建模会产生较大的误差,为了提高预测精度,更好的解决非平稳非线性序列数据的预测问题,可以使用信号分解算法对原始气象数据进行分解,得到多个频率成分简单且较为平稳的子序列,对多个子序列分别建立预测模型,再将预测结果相加,可以有效提高原始气象数据的预测精度;而使用WT的信号分解算法存在最优小波基选取困难的问题;EMD是一种将信号分解成特征模态的方法,但分解信号得到的IMF分量存在着模态混叠现象,每个IMF中会包含不同时间尺度的特征成分,因此,选择合适的信号分解算法非常重要。
发明内容
为了解决以上技术问题,本发明提供一种自适应的多气象要素预测方法,其特征在于:包括以下步骤
S1、确定研究区域,对气象数据进行收集,气象数据包括该区域实测的降水、气温以及风速逐小时时间序列数据;
S2、对收集到的降水、气温以及风速数据分别进行数据预处理;
S3、对预处理后的降水、气温以及风速数据分别进行数据特征提取;
S4、使用飞蛾扑火算法对期望最大化算法进行改进,训练高斯混合模型,得到最优参数集,并对降水、气温以及风速数据进行分类;
S5、对分类后的降水数据进行二分类,并判断是否有雨,若有雨则执行下一步骤,若无雨则输出降水预测结果;对分类后的风速数据进行二分类,并判断是否有风,若有风则执行下一步骤,若无风则输出风速预测结果;
S6、使用经验小波变换方式对分类后的气温数据进行时序分解,得到多个分量后构建BES-RBF神经网络预测具体的气温值;
使用DFT-CNN分类模型分别对降水数据和风速数据进行分类,判断风速状态和降水状态,且根据不同的风速状态和降水状态设置相对应的子序列分解数目,同样使用经验小波变换方式分别对分类后的降水数据和风速数据进行时序分解,得到多个分量后构建相应的BES-RBF神经网络预测具体的降水值和风速值;
将各个子序列预测的气温值、降水值以及风速值相加得到最终预测值。
本发明进一步限定的技术方案是:
进一步的,步骤S2中数据预处理的方法具体为:对数据进行数据清洗,使用最邻近插值,将数据中的异常值和缺失值分别换成距离该异常值和缺失值所在样本点最近的原始数据的样本值,对三种气象数据进行归一化,基于下列公式:
前所述的一种自适应的多气象要素预测方法,步骤S4中,高斯混合模型由多个多维高斯分布叠加得到,概率密度函数如下,
其中,x表示多维气象数据样本的集合,N表示高斯混合模型包含的多维高斯分布的总簇数,P(x)表示多维高斯混合模型的概率密度;Pn(x)表示第n个多维高斯分布的概率密度,、/>、/>表示待估计参数,分别为第n个高斯分布簇的系数、均值向量以及协方差矩阵;
高斯混合模型通过最大化对数似然函数实现最优参数估计,如下式所示,
前所述的一种自适应的多气象要素预测方法,步骤S4中,使用飞蛾扑火算法对期望最大化算法进行改进,训练高斯混合模型的方法包括以下步骤
S4.1、收集历史多年逐小时降水、气温以及风速时间序列数据,通过步骤S2中的数据预处理和步骤S3中的特征提取构建训练集和测试集,设置高斯混合模型阶数;
S4.2、初始化高斯混合模型参数;
S4.3、初始化飞蛾扑火算法参数;
S4.4、使用期望最大化算法随机选择一只飞蛾并生成其位置矩阵和对应的高斯混合模型参数;
S4.5、更新火焰数量;
S4.6、判断是否是首次迭代,若是则根据飞蛾初始位置计算出个体适应度并排序,若否则更新火焰位置;
S4.7、更新飞蛾位置矩阵并计算适应度值,与前一代最高的个体适应度值比较后,选择更高的适应度值;
S4.8、判断是否满足终止条件,若是则输出最优参数集,结束训练,若为否则返回步骤S4.4。
前所述的一种自适应的多气象要素预测方法,步骤S4.2中,初始化高斯混合模型参数的方法具体为,随机生成值大于零的三维向量和3x3的随机数矩阵/>,以及N个初始均值向量/>和高斯混合模型系数/>,通过下式将系数/>标准化,使系数和为1,
前所述的一种自适应的多气象要素预测方法,步骤S4.8中的最佳参数集如下所示,
通过计算最大后验概率,对降水、气温以及风速数据进行分类,公式如下:
前所述的一种自适应的多气象要素预测方法,步骤S5中,将历史多年逐小时降水数据分为无降水数据和有降水数据,将历史多年逐小时风速数据分为有风数据和无风数据,采用最大间隔法策略分别训练两个对应的支持向量机,得到分离超平面及分类决策函数;
分别对实测降水数据和实测风速数据二分类,并判断是否有雨以及是否有风,若没有雨则输出降水预测结果,若有雨则执行步骤S6,若没有风则输出风速预测结果,若有风则执行步骤S6。
前所述的一种自适应的多气象要素预测方法,步骤S6中,使用DFT-CNN分类模型对风速数据以及降水数据进行分类的方法,包括以下步骤
S6.1.1、将风速一维时间序列数据转为二维图像,基于如下公式,
其中,T((j-1)×N+k)表示截取的一维时序数据中的第(j-1)×N+k个数据值,I(j,k)表示转换之后图像第j行、第k列的像素点,和/>分别表示求最大值函数和求最小值函数,/>表示舍入函数,即使转换之后的像素值仅保持整数部分;
S6.1.2、使用二维离散傅里叶变换对得到的二维图像求得图像频谱,公式如下,
S6.1.3、使用训练好的卷积神经网络对得到的频谱图进行三分类,即可判断当前实测的风速状态以及降水状态,对频谱图进行三分类前首先将频谱图的尺寸调整为[1,N,N]。
前所述的一种自适应的多气象要素预测方法,步骤S6中,使用经验小波变换方式对分类后的气温数据、降水数据以及风速数据进行时序分解,包括以下步骤
S6.2.1、确定气温、风速状态以及降水状态分别利用经验小波变换方式所分解的子序列数目的关系,风速状态分别为风速状态1、风速状态2以及风速状态3,降水状态分别为降水状态1、降水状态2以及降水状态3,关系如下,
其中,K7表示气温数据分解后子序列数目,K1、K2、K3分别表示降水状态1、降水状态2和降水状态3所对应的子序列分解数目,K4、K5、K6分别表示风速状态1、风速状态2和风速状态3所对应的子序列分解数目;
S6.2.2、对实测气温时间序列h(t)1,经过经验小波变换方式分解后得到,
S6.2.3、对实测风速时间序列h(t)2和实测降水时间序列h(t)3,分别经过经验小波变换方式分解后得到,
前所述的一种自适应的多气象要素预测方法,步骤S6中,构建BES-RBF的方法包括以下步骤
S6.3.1、选取历史多年降水、气温和风速数据进行步骤S2中的数据预处理和步骤S3中的特征提取,通过经验小波变换方式分解分别得到降水、气温和风速数据子序列数据集,将每一子序列数据集都划分为训练集和测试集;
S6.3.2、初始化秃鹰算法参数;
S6.3.3、初始化RBF神经网络参数;
S6.3.4、计算秃鹰个体适应度值,选择最佳适应度值,更新秃鹰位置;
S6.3.5、秃鹰通过螺旋搜索猎物和选择相应区域,更新秃鹰位置;
S6.3.6、在搜索空间中,更新位置后对猎物俯冲,更新秃鹰位置;
S6.3.7、判断是否满足结束条件,若满足则输出最优RBF初始化参数,否则重复步骤S6.3.4至步骤S6.3.7;
S6.3.8、使用训练集训练RBF网络,得到预测模型,利用下式预测:
S6.3.9、对气温各子序列预测的结果重构,输出最终预测结果,使用皮尔逊相关系数防止合并子序列时操作重复,公式如下,
本发明的有益效果是:
(1)本发明中,使用最邻近插值补全缺失值和替换异常值,用一维卷积神经网络对三种气象数据进行特征提取及降维,可以充分考虑数据的深层特征;针对降水和风速时间序列数据的随机性和间歇性,分别利用历史数据训练支持向量机,再判断实测数据有无降水以及有无风速,若有降水或者有风,则进一步预测具体的降水和风速数值;
(2)本发明中,通过飞蛾扑火算法对EM算法进行优化,可以提高模型的鲁棒性,改进的EM算法求解GMM最佳参数集可以跳出局部最优,改进的高斯混合模型能对三种气象要素进行分类,再分别预测,起到了对多种气象要素同时进行预测的有益效果;
(3)本发明中,降水、气温和风速三种信号稳定程度不一,相较而言,风速在空间中随时间变化最剧烈,信号中包含的高频成分较多,气温信号则随时间变化的最缓慢,信号中包含的低频成分较多;本方法对气温时序信号直接使用EWT算法进行分解,但对降水、风速这类气象数据,直接使用EWT算法分解成固定数目或很多个子序列,再分别建立预测模型,并不合理,因为降水、风速在某些时间段内变化的可能也相对较为平缓,包含的低频成分较多,仍直接使用信号分解算法,分解成较多个或固定数目的子序列进行预测,不仅会浪费计算资源,还可能会影响预测精度,因此,本方法设计了DFT-CNN模型,去判断降水和风速的状态,根据不同状态,分别设置相对应的子序列分解数目,这样可以极大的提高预测精度;
(4)本发明中,降水、气温和风速等气象序列数据具有非平稳、非线性的特征,直接使用RBF神经网络预测,结果不够精确,所以本气象预测方法针对不同气象要素的特性,使用EWT将时序数据分解为数目不同的子序列,对三种气象要素各子序列构建BES-RBF神经网络进行预测,通过序列重构得到更加精确的预测结果。
附图说明
图1为本发明的总流程示意图;
图2为本发明中MFO-GMM模型训练的流程示意图;
图3为本发明中BES-RBF模型训练的流程示意图;
图4为本发明中DFT-CNN分类模型的流程示意图;
图5为本发明中一维时间序列信号转为二维图像的示意图;
图6为本发明中CNN分类模型的示意图。
具体实施方式
本实施例提供的一种自适应的多气象要素预测方法,结构如图1至图3所示,包括以下步骤
S1、确定研究区域,分别收集该区域实测的降水、气温和风速逐小时时间序列数据。
S2、对获取的气象数据分别进行数据预处理,具体为:对数据进行数据清洗,使用最邻近插值,将数据中的异常值和缺失值分别换成距离该异常值和缺失值所在样本点最近的原始数据的样本值;为了减少后续计算的复杂性以及防止数据间量纲的影响,对三种气象数据进行归一化,基于下列公式:
步骤S3、对预处理后的降水、气温以及风速数据分别进行数据特征提取;通过对原始数据的特征进行转换,生成新的特征或者成分,会比直接使用原始的特征效果要好,使用主成分分析法(PCA)和非负矩阵分解的方法难以去挖掘数据深层特征,误差较大;
本步骤使用一维卷积神经网络分别提取降水、气温以及风速序列数据中隐含的深层特征,一维卷积神经网络包括用于提取一维序列数据特征的三个卷积层,每层卷积核大小维度设置为1*3,每个卷积层卷积核的个数与输入数据通道数保持一致;将输出结果通过一个池化层,池化操作可以剔除冗余信息,减少计算量;卷积核的参数可以通过历史数据训练学习得到。
步骤S4、高斯混合模型(GMM)是一种常用的分类方法,由于高斯混合模型(GMM)的初始参数随机给定,使用期望最大化算法(EM)求解最佳参数集会陷入局部最优,所以本步骤使用飞蛾扑火算法(MFO)对期望最大化算法(EM)进行改进,提高高斯混合模型(GMM)对降水、气温和风速三种气象数据的分类效果;
高斯混合模型(GMM)由多个多维高斯分布叠加得到,概率密度函数如下:
其中,x表示多维气象数据样本的集合,N表示高斯混合模型(GMM)包含的多维高斯分布的总簇数,P(x)表示多维高斯混合模型(GMM)的概率密度;Pn(x)表示第n个多维高斯分布的概率密度,、/>、/>表示待估计参数,分别为第n个高斯分布簇的系数、均值向量以及协方差矩阵;
高斯混合模型(GMM)通过最大化对数似然函数实现最优参数估计,如下式所示,该式也用于在飞蛾扑火算法对期望最大化算法(EM)进行优化时,作为其适应度函数:
本气象预测方法通过飞蛾扑火算法对期望最大化算法(EM)进行优化,将上式作为适应度函数,当满足终止条件或最大迭代次数时,输出最优参数集,具体流程如下:
S4.1、收集历史多年逐小时降水、气温以及风速时间序列数据,通过步骤S2中的数据预处理和步骤S3中的特征提取构建训练集和测试集,设置高斯混合模型(GMM)阶数N=3;
S4.2、初始化高斯混合模型(GMM)参数,具体为:随机生成值大于零的三维向量和3x3的随机数矩阵/>,以及N个初始均值向量/>和高斯混合模型(GMM)系数/>,通过下式将系数/>标准化,使系数和为1,
S4.3、初始化飞蛾扑火算法参数,飞蛾群体大小设置为f,变量维度设置为g,最大迭代次数设置为E;
S4.4、使用期望最大化算法(EM)随机选择一只飞蛾并生成其位置矩阵和对应的高斯混合模型(GMM)参数;
S4.5、更新火焰数量;
S4.6、判断是否是首次迭代,若是则根据飞蛾初始位置计算出个体适应度并排序;若否则更新火焰位置;
S4.7、更新飞蛾位置矩阵并计算适应度值,与前一代最高的个体适应度值比较后,选择更高的适应度值;
S4.8、判断是否满足终止条件,若是则输出最优参数集,结束训练;若为否则返回步骤S4.4,最佳参数集如下:
步骤S5、降水和风速具有稀疏性,而气温在空间上是连续变化的,当24小时降水不高于0.1mm时,视为无降水状态,当平地离地10米处风速不高于0.2m/s时,视为无风状态;
根据划分标准,将历史多年逐小时降水数据分为无降水数据和有降水数据,训练对应支持向量机(SVM);同样,根据划分标准,将历史多年逐小时风速数据分为无风数据和有风数据,训练对应支持向量机(SVM);
采用最大间隔法策略分别训练两个对应的训练支持向量机(SVM),由此得到分离超平面及分类决策函数,
训练好的两个支持向量机(SVM),分别对实测的逐小时降水数据和风速数据二分类,判断是否有雨以及是否有风,若无雨则输出降水预测结果,若有雨则执行下一步骤;若无风则输出风速预测结果,若有风则执行下一步骤。
一般来说需要对分类后的降水数据、气温数据以及风速数据分别进行时序信号分解,得到多个分量后分别构建多个模型预测具体的值,然后再将各个子序列预测的结果值相加得到最终的预测值;但是由于降水、气温和风速三种信号的稳定程度不一,相较而言,风速在空间中随时间变化最剧烈,信号中包含的高频成分较多,气温信号则随时间变化的最缓慢,信号中包含的低频成分较多。
像降水、风速这类气象数据具有非连续性和随时间变化较快的特点,直接使用信号分解算法分解成固定数目或很多个子序列,再分别建立预测模型,并不合理;因为降水、风速在某些时间段内变化的可能也相对较为平缓,如果直接使用信号分解算法,分解成较多个或固定数目的子序列进行预测,不仅会浪费计算资源,还可能会影响预测精度,因此,本方法针对不同气象要素的特性,制定不同的信号分解策略。
S6、使用经验小波变换方式对分类后的气温数据进行时序分解,得到多个分量后构建BES-RBF神经网络预测具体的气温值;
使用DFT-CNN分类模型分别对降水数据和风速数据进行分类,判断风速状态和降水状态,且根据不同的风速状态和降水状态设置相对应的子序列分解数目,同样使用经验小波变换方式分别对分类后的降水数据和风速数据进行时序分解,得到多个分量后构建相应的BES-RBF神经网络预测具体的降水值和风速值;
将各个子序列预测的气温值、降水值以及风速值相加得到最终预测值。
步骤S6中,使用两个DFT-CNN分类模型分别对风速和降水时序数据分类,DFT-CNN分类模型如图4所示,以风速为例,采用图像分类的思想对一维时序数据进行分类,包括以下步骤,
S6.1.1、如图5所示,首先需要将一维时间序列数据转为二维图像,从一维时序数据中截取N2段,要求截取的这段时序数据能尽可能的和原始时序数据保持一致长度大小,然后将截取的时序数据填充到大小的矩阵中,矩阵的每一行都被长度为N的序列数据填充,接着对得到的矩阵归一化到0-255,即得到灰度图像像素值的范围,转换公式如下,
其中,T((j-1)×N+k)表示截取的一维时序数据中的第(j-1)×N+k个数据值,I(j,k)表示转换之后图像第j行、第k列的像素点,和/>分别表示求最大值函数和求最小值函数,/>表示舍入函数,即使转换之后的像素值仅保持整数部分;
S6.1.2、对处理得到的二维图像使用二维离散傅里叶变换(DFT)求图像频谱,图像的频谱图和原图像上各点并不存在一一对应的关系,图像频谱图上的高频部分表示原图像上灰度发生急剧变化的区域,意味着原始风速一维时间序列数据在这一段范围内,高频成分较多;频谱图上的低频部分表示原图像上灰度基本不变或者变化很小的区域,意味着原始风速一维时间序列数据在这一段范围内,低频成分较多;
因此可以使用卷积神经网络(CNN)模型对图像频谱图进行分类,根据图像的频谱图来判断实测的风速数据是哪一种风速状态,二维离散傅里叶变换(DFT)的公式如下:
S6.1.3、对得到的频谱图用卷积神经网络(CNN)进行三分类;如图6所示,卷积神经网络(CNN)包含两个卷积层、两个池化层、一个全连接层以及一个Softmax层;将大量历史风速数据转为二维图像求得频谱图后,使用带有标签的频谱图训练卷积神经网络(CNN)得到最好的权重,损失函数采用L1损失,从而完成模型的训练;使用训练好的卷积神经网络(CNN)对已有频谱图分类以及判断风速状态之前,需要将频谱图的尺寸调整(reshape)成[1,N,N],然后再送入网络中进行分类,即可判断当前实测风速的状态。
步骤S6中,使用经验小波变换方式对分类后的气温数据、降水数据以及风速数据进行时序分解,包括以下步骤
S6.2.1、降水、气温和风速三种信号稳定程度不一,相较而言,风速在空间中变化最剧烈,信号包含的高频成分较多,气温信号则变化的最缓慢,针对不同气象要素的特性,进行时序分解时,将气温时间序列数据直接使用EWT算法分解为K7个子序列;针对风速和降水,本方法分别设计了两个DFT-CNN分类模型进行三分类,来判别当前实测的风速和降水处于哪种状态,具体类别为风速状态1、风速状态2以及风速状态3,分别代表当前实测的风速为低频信号、中频信号以及高频信号,在进行时序信号分解时,分解的子序列个数分别为K4、K5、K6;同理降水的具体类别为降水状态1、降水状态2以及降水状态3,分别代表当前实测的降水为低频信号、中频信号以及高频信号,在进行时序信号分解时,分解的子序列个数分别为K1、K2、K3;相应地,各子序列数目应满足如下条件;
S6.2.2、使用经验小波变换方式(EWT)对实测气温时间序列进行分解;
S6.2.3、使用经验小波变换方式(EWT)分别对实测风速时间序列和实测降水时间序列进行分解;
经验小波变换方式(EWT)是一种处理非线性、非平稳信号的方式,可以解决WT带来的模态混叠问题,同时避免了EMD缺乏数学理论支撑,对噪声和抽样较为敏感的缺点;三种气象要素中,气温数据随时间变化的最缓慢,其时序信号中包含的低频成分较多,所以本方法直接使用EWT算法,将气温时序信号分解成K7个子序列,再使用BES-RBF算法对每个子序列进行预测;降水、风速在某些时间段内变化的可能也相对较为平缓,仍直接使用信号分解算法,分解成较多个或固定数目的子序列进行预测,不仅会浪费计算资源,还可能会影响预测精度,所以通过DFT-CNN分类模型判断实测的风速和降水状态,针对不同状态,分别设置相对应的子序列分解数目,在节约计算资源的同时,可以进一步提高预测的精度;
步骤S6.2.2至步骤S6.2.3中,使用经验小波变换方式(EWT)对三种气象要素时序数据进行分解,以气温数据为例,具体过程如下:
根据Littlewood-Paley和Meyer理论,经验小波的尺度函数和小波函数分别如下:
对一个气温时间序列h(t)1,经过经验小波变换方式(EWT)分解后得到:
同理,将实测风速时间序列h(t)2和实测降水时间序列h(t)3,分别经过EWT分解后得到:
步骤S6中,依据降水、气温以及风速要素分解的子序列数目,分别构建相应数目的BES-RBF模型进行预测;
神经网络具有较强的学习与泛化能力,理论上可以逼近任何一个非线性函数,适合对气象数据进行预测;径向基神经网络(Radical Basis Function Neural Network,RBFNN)是一个三层结构的前向网络,由输入层、隐含层和输出层构成;RBF神经网络是一个能逼近任意精度的模型,克服了BP神经网络泛化能力弱、收敛速度慢、易陷入局部最优以及其函数值不紧密的问题;
RBF神经网络需要优化的参数为基函数的中心、基宽度/>、隐含层与输出层的连接权重值/>,采用随机初始化网络参数的方法,可能会造成梯度消失或爆炸、初始值过大或过小的问题,从而降低网络收敛能力;本步骤使用秃鹰优化算法(Bald Eagle Search,BES)对RBF神经网络初始化参数进行寻优,解决随机初始化参数带来的问题,具体流程如下:
S6.3.1、选取历史多年降水、气温和风速数据进行步骤S2中的数据预处理和步骤S3中的特征提取,通过经验小波变换方式(EWT)分解分别得到降水、气温和风速数据子序列数据集,将每一子序列数据集都划分为训练集和测试集;
S6.3.4、计算秃鹰个体适应度值,选择最佳适应度值,并通过下式更新秃鹰位置:
S6.3.5、秃鹰通过螺旋搜索猎物和选择相应区域,通过下式更新秃鹰位置:
其中,c(i)和z(i)分别表示极坐标中秃鹰的位置,取值范围均为[-1,1];
S6.3.6、在搜索空间中,更新位置后对猎物俯冲,通过下式更新秃鹰位置:
其中,rand为一个随机数,s1和s2表示用于增加秃鹰向最佳和中心点运动强度的参数,取值均为[1.5,2];
S6.3.7、判断是否满足结束条件,若满足则输出最优RBF初始化参数,否则重复步骤S6.3.4至步骤S6.3.7;
S6.3.8、得到最佳RBF网络初始化参数后,导入训练集进行训练,通过迭代利用梯度下降法最小化MAE损失,更新迭代次数和权重等参数,当满足终止条件后,将最佳基函数的中心、基宽度/>、隐含层与输出层的连接权重值/>带入RBF网络中,得到如下预测模型,结束训练:
S6.3.9、分别对降水、气温和风速要素各子序列预测的结果重构,输出最终预测结果,使用皮尔逊相关系数(Pearson Correlation Coefficient,PCCs)防止合并子序列时操作重复,将两子序列间的皮尔逊系数用HK,L表示,公式如下:
若子序列K和L之间的皮尔逊相关系数绝对值越接近1,则这两个序列的相关性越强;若相关系数绝对值越接近于0,则两序列相关性越弱;当系数为0时,两序列线性无关。
本气象预测方法,使用最邻近插值补全缺失值和替换异常值,用一维卷积神经网络对三种气象数据进行特征提取及降维,可以充分考虑数据的深层特征;通过飞蛾扑火算法对期望最大化算法(EM)进行优化,提高模型的鲁棒性,改进的期望最大化算法(EM)求解高斯混合模型(GMM)最佳参数集可以跳出局部最优,改进的高斯混合模型(GMM)能对三种气象要素进行分类,再分别预测,起到了对多种气象要素同时进行预测的有益效果;降水、气温和风速等气象序列数据具有非平稳、非线性的特征,直接使用RBF神经网络预测,结果不够精确,所以本气象预测方法针对不同气象要素的特性,使用经验小波变换方式(EWT)将时序数据分解为数目不同的子序列,对三种气象要素各子序列构建BES-RBF神经网络进行预测,通过序列重构得到更加精确的预测结果。
本方法对多种气象要素同时进行预测,不同气象要素的特点各不相同,降水、气温和风速三种信号稳定程度不一,相较而言,风速在空间中随时间变化最剧烈,信号中包含的高频成分较多,气温信号则随时间变化的最缓慢,信号中包含的低频成分较多。
本方法对气温时序信号直接使用EWT算法进行分解,但对降水、风速这类气象数据,直接使用EWT算法分解成固定数目或很多个子序列,再分别建立预测模型,并不合理,因为降水、风速在某些时间段内变化的可能也相对较为平缓,包含的低频成分较多,仍直接使用信号分解算法,分解成较多个或固定数目的子序列进行预测,不仅会浪费计算资源,还可能会影响预测精度,因此,本方法设计了DFT-CNN模型,去判断降水和风速的状态,根据不同状态,分别设置相对应的子序列分解数目,这样可以极大的提高预测精度。
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。
Claims (6)
1.一种自适应的多气象要素预测方法,其特征在于:包括以下步骤
S1、确定研究区域,对气象数据进行收集,气象数据包括该区域实测的降水、气温以及风速逐小时时间序列数据;
S2、对收集到的降水、气温以及风速数据分别进行数据预处理;
S3、对预处理后的降水、气温以及风速数据分别进行数据特征提取;
S4、使用飞蛾扑火算法对期望最大化算法进行改进,训练高斯混合模型,得到最优参数集,并对降水、气温以及风速数据进行分类;
S5、对分类后的降水数据进行二分类,并判断是否有雨,若有雨则执行下一步骤,若无雨则输出降水预测结果;对分类后的风速数据进行二分类,并判断是否有风,若有风则执行下一步骤,若无风则输出风速预测结果;
将历史多年逐小时降水数据分为无降水数据和有降水数据,将历史多年逐小时风速数据分为有风数据和无风数据,采用最大间隔法策略分别训练两个对应的支持向量机,得到分离超平面及分类决策函数;
分别对实测降水数据和实测风速数据二分类,并判断是否有雨以及是否有风,若没有雨则输出降水预测结果,若有雨则执行步骤S6,若没有风则输出风速预测结果,若有风则执行步骤S6;
S6、使用经验小波变换方式对分类后的气温数据进行时序分解,得到多个分量后构建BES-RBF神经网络预测具体的气温值;
使用DFT-CNN分类模型分别对降水数据和风速数据进行分类,判断风速状态和降水状态,且根据不同的风速状态和降水状态设置相对应的子序列分解数目,同样使用经验小波变换方式分别对分类后的降水数据和风速数据进行时序分解,得到多个分量后构建相应的BES-RBF神经网络预测具体的降水值和风速值;
将各个子序列预测的气温值、降水值以及风速值相加得到最终预测值;
使用DFT-CNN分类模型对风速数据以及降水数据进行分类的方法,包括以下步骤
S6.1.1、将风速一维时间序列数据转为二维图像,基于如下公式,
其中,T((j-1)×N+k)表示截取的一维时序数据中的第(j-1)×N+k个数据值,I(j,k)表示转换之后图像第j行、第k列的像素点,和/>分别表示求最大值函数和求最小值函数,/>表示舍入函数,即使转换之后的像素值仅保持整数部分;
S6.1.2、使用二维离散傅里叶变换对得到的二维图像求得图像频谱,公式如下,
S6.1.3、使用训练好的卷积神经网络对得到的频谱图进行三分类,即可判断当前实测的风速状态以及降水状态,对频谱图进行三分类前首先将频谱图的尺寸调整为[1,N,N];
使用经验小波变换方式对分类后的气温数据、降水数据以及风速数据进行时序分解,包括以下步骤
S6.2.1、确定气温、风速状态以及降水状态分别利用经验小波变换方式所分解的子序列数目的关系,风速状态分别为风速状态1、风速状态2以及风速状态3,降水状态分别为降水状态1、降水状态2以及降水状态3,关系如下,
其中,K7表示气温数据分解后子序列数目,K1、K2、K3分别表示降水状态1、降水状态2和降水状态3所对应的子序列分解数目,K4、K5、K6分别表示风速状态1、风速状态2和风速状态3所对应的子序列分解数目;
S6.2.2、对实测气温时间序列h(t)1,经过经验小波变换方式分解后得到,
S6.2.3、对实测风速时间序列h(t)2和实测降水时间序列h(t)3,分别经过经验小波变换方式分解后得到,
构建BES-RBF的方法包括以下步骤
S6.3.1、选取历史多年降水、气温和风速数据进行步骤S2中的数据预处理和步骤S3中的特征提取,通过经验小波变换方式分解分别得到降水、气温和风速数据子序列数据集,将每一子序列数据集都划分为训练集和测试集;
S6.3.2、初始化秃鹰算法参数;
S6.3.3、初始化RBF神经网络参数;
S6.3.4、计算秃鹰个体适应度值,选择最佳适应度值,更新秃鹰位置;
S6.3.5、秃鹰通过螺旋搜索猎物和选择相应区域,更新秃鹰位置;
S6.3.6、在搜索空间中,更新位置后对猎物俯冲,更新秃鹰位置;
S6.3.7、判断是否满足结束条件,若满足则输出最优RBF初始化参数,否则重复步骤S6.3.4至步骤S6.3.7;
S6.3.8、使用训练集训练RBF网络,得到预测模型,利用下式预测:
S6.3.9、对气温各子序列预测的结果重构,输出最终预测结果,使用皮尔逊相关系数防止合并子序列时操作重复,公式如下,
4.根据权利要求1所述的一种自适应的多气象要素预测方法,其特征在于:所述步骤S4中,使用飞蛾扑火算法对期望最大化算法进行改进,训练高斯混合模型的方法包括以下步骤
S4.1、收集历史多年逐小时降水、气温以及风速时间序列数据,通过步骤S2中的数据预处理和步骤S3中的特征提取构建训练集和测试集,设置高斯混合模型阶数;
S4.2、初始化高斯混合模型参数;
S4.3、初始化飞蛾扑火算法参数;
S4.4、使用期望最大化算法随机选择一只飞蛾并生成其位置矩阵和对应的高斯混合模型参数;
S4.5、更新火焰数量;
S4.6、判断是否是首次迭代,若是则根据飞蛾初始位置计算出个体适应度并排序,若否则更新火焰位置;
S4.7、更新飞蛾位置矩阵并计算适应度值,与前一代最高的个体适应度值比较后,选择更高的适应度值;
S4.8、判断是否满足终止条件,若是则输出最优参数集,结束训练,若为否则返回步骤S4.4。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211252774.4A CN115345207B (zh) | 2022-10-13 | 2022-10-13 | 一种自适应的多气象要素预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211252774.4A CN115345207B (zh) | 2022-10-13 | 2022-10-13 | 一种自适应的多气象要素预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115345207A CN115345207A (zh) | 2022-11-15 |
CN115345207B true CN115345207B (zh) | 2023-07-04 |
Family
ID=83957326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211252774.4A Active CN115345207B (zh) | 2022-10-13 | 2022-10-13 | 一种自适应的多气象要素预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115345207B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115794981B (zh) * | 2022-12-14 | 2023-09-26 | 广西电网有限责任公司 | 一种利用模型统计气象数据的方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426026B (zh) * | 2013-09-10 | 2016-02-24 | 信阳师范学院 | 一种混合神经网络预测及识别景区气象要素的方法 |
CN112348271B (zh) * | 2020-11-12 | 2024-01-30 | 华北电力大学 | 基于vmd-ipso-gru的短期光伏功率预测方法 |
CN114218870A (zh) * | 2021-12-22 | 2022-03-22 | 大连理工大学 | 一种基于变分模态分解与注意力机制的风速预测方法 |
CN114511065A (zh) * | 2022-01-21 | 2022-05-17 | 北京轩宇空间科技有限公司 | 神经网络模型构建方法、时间序列预测方法及装置 |
-
2022
- 2022-10-13 CN CN202211252774.4A patent/CN115345207B/zh active Active
Non-Patent Citations (1)
Title |
---|
基于PCA和改进PSO-GRU神经网络的气温预测;杨迎新;《现代电子技术》;20220101;第45卷(第1期);正文第89页第1列第1段-第93页第2列第1段 * |
Also Published As
Publication number | Publication date |
---|---|
CN115345207A (zh) | 2022-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | A review on global solar radiation prediction with machine learning models in a comprehensive perspective | |
Khazaei et al. | A high-accuracy hybrid method for short-term wind power forecasting | |
Hu et al. | Predicting Lake Erie wave heights and periods using XGBoost and LSTM | |
Han et al. | Convolutional neural network for convective storm nowcasting using 3-D Doppler weather radar data | |
US5796611A (en) | Weather forecast apparatus and method based on recognition of echo patterns of radar images | |
Yang et al. | Long short-term memory recurrent neural network for tidal level forecasting | |
Jalali et al. | An advanced short-term wind power forecasting framework based on the optimized deep neural network models | |
CN114488140B (zh) | 一种基于深度迁移学习的小样本雷达一维像目标识别方法 | |
Bai et al. | Development of a 2-D deep learning regional wave field forecast model based on convolutional neural network and the application in South China Sea | |
CN113239722B (zh) | 基于深度学习在多尺度下的强对流外推方法及系统 | |
CN113344045B (zh) | 一种结合hog特征提高sar船只分类精度的方法 | |
CN115345207B (zh) | 一种自适应的多气象要素预测方法 | |
Dong et al. | Ensemble wind speed forecasting system based on optimal model adaptive selection strategy: Case study in China | |
CN108983180A (zh) | 一种群智能高精度的雷达海杂波预报系统 | |
CN114611608A (zh) | 基于深度学习模型的海表面高度数值预报偏差订正方法 | |
Lyu et al. | Dynamic feature selection for solar irradiance forecasting based on deep reinforcement learning | |
CN115544890A (zh) | 一种短期电力负荷预测方法及系统 | |
Nguyen et al. | Chaotic time series prediction using a novel echo state network model with input reconstruction, Bayesian ridge regression and independent component analysis | |
CN114897204A (zh) | 一种海上风电场短期风速预测方法和装置 | |
Tang et al. | An EMD-PSO-LSSVM hybrid model for significant wave height prediction | |
CN113139513A (zh) | 基于超像素轮廓和改进pso-elm的空谱主动学习高光谱分类方法 | |
CN115952924B (zh) | 一种基于优化vmd与特征热力图的短期风电功率预测方法 | |
Fei et al. | Chinese Grain Production Forecasting Method Based on Particle Swarm Optimization-based Support Vector Machine | |
CN114065822B (zh) | 海洋潮流涨落的电磁识别方法及系统 | |
CN115600500A (zh) | 一种基于时空多尺度和k-sdw的超短期概率风电功率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |