CN115345207B - 一种自适应的多气象要素预测方法 - Google Patents

一种自适应的多气象要素预测方法 Download PDF

Info

Publication number
CN115345207B
CN115345207B CN202211252774.4A CN202211252774A CN115345207B CN 115345207 B CN115345207 B CN 115345207B CN 202211252774 A CN202211252774 A CN 202211252774A CN 115345207 B CN115345207 B CN 115345207B
Authority
CN
China
Prior art keywords
data
wind speed
precipitation
representing
air temperature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211252774.4A
Other languages
English (en)
Other versions
CN115345207A (zh
Inventor
秦华旺
雷为好
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202211252774.4A priority Critical patent/CN115345207B/zh
Publication of CN115345207A publication Critical patent/CN115345207A/zh
Application granted granted Critical
Publication of CN115345207B publication Critical patent/CN115345207B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种自适应的多气象要素预测方法,使用最邻近插值补全缺失值和替换异常值,用一维卷积神经网络对三种气象数据进行特征提取及降维,可以充分考虑数据的深层特征;改进的EM算法求解GMM最佳参数集可以跳出局部最优,改进的GMM模型能对三种气象要素进行分类,再分别预测,起到了对多种气象要素同时进行预测的有益效果;通过DFT‑CNN模型,判断降水和风速状态,根据不同状态,分别设置相对应的子序列分解数目,从而极大的提高预测精度;使用EWT算法将时序数据分解为数目不同的子序列,对三种气象要素各子序列构建BES‑RBF神经网络进行预测,通过序列重构得到更加精确的预测结果。

Description

一种自适应的多气象要素预测方法
技术领域
本发明涉及气象预测技术领域,特别是涉及一种自适应的多气象要素预测方法。
背景技术
气象预测(如降水、气温、风速等)对工农业、渔牧业、航空航海、公共事业、军事以及人们的日常生活有着重要的影响,因此对气象要素进行准确的预测就显得格外的重要,基于数值计算的预报方式,需要进行大量公式的数值求解,耗费的计算机资源较多,此外,无法保证气象预报的实时性,一些传统的预报方式如利用马尔可夫模型或者隐马尔可夫模型进行预报,具有预报精度不高且难以实现短时预报的缺点。
使用BP神经网络进行气象预测较为普遍,但BP神经网络容易陷于局部极小值,训练过程收敛速度较慢,训练时间较长,隐藏层和隐藏层节点数目难以确定,由于以上缺点,BP神经网络对气象数据预测精度较低;使用卷积神经网络、循环神经网络进行气象预测较为复杂,且需要大量历史气象数据,这对于一些缺乏历史观测数据的偏远地区比较困难,这种方式不适合小个体进行学习预测;此外,许多气象预测模型只针对单一气象要素进行预测,并没有实现对多气象要素的同时预测。
降水、气温和风速等气象序列数据具有非平稳、非线性的特征,直接使用处理平稳数据序列的方法对非平稳、非线性气象数据进行建模会产生较大的误差,为了提高预测精度,更好的解决非平稳非线性序列数据的预测问题,可以使用信号分解算法对原始气象数据进行分解,得到多个频率成分简单且较为平稳的子序列,对多个子序列分别建立预测模型,再将预测结果相加,可以有效提高原始气象数据的预测精度;而使用WT的信号分解算法存在最优小波基选取困难的问题;EMD是一种将信号分解成特征模态的方法,但分解信号得到的IMF分量存在着模态混叠现象,每个IMF中会包含不同时间尺度的特征成分,因此,选择合适的信号分解算法非常重要。
发明内容
为了解决以上技术问题,本发明提供一种自适应的多气象要素预测方法,其特征在于:包括以下步骤
S1、确定研究区域,对气象数据进行收集,气象数据包括该区域实测的降水、气温以及风速逐小时时间序列数据;
S2、对收集到的降水、气温以及风速数据分别进行数据预处理;
S3、对预处理后的降水、气温以及风速数据分别进行数据特征提取;
S4、使用飞蛾扑火算法对期望最大化算法进行改进,训练高斯混合模型,得到最优参数集,并对降水、气温以及风速数据进行分类;
S5、对分类后的降水数据进行二分类,并判断是否有雨,若有雨则执行下一步骤,若无雨则输出降水预测结果;对分类后的风速数据进行二分类,并判断是否有风,若有风则执行下一步骤,若无风则输出风速预测结果;
S6、使用经验小波变换方式对分类后的气温数据进行时序分解,得到多个分量后构建BES-RBF神经网络预测具体的气温值;
使用DFT-CNN分类模型分别对降水数据和风速数据进行分类,判断风速状态和降水状态,且根据不同的风速状态和降水状态设置相对应的子序列分解数目,同样使用经验小波变换方式分别对分类后的降水数据和风速数据进行时序分解,得到多个分量后构建相应的BES-RBF神经网络预测具体的降水值和风速值;
将各个子序列预测的气温值、降水值以及风速值相加得到最终预测值。
本发明进一步限定的技术方案是:
进一步的,步骤S2中数据预处理的方法具体为:对数据进行数据清洗,使用最邻近插值,将数据中的异常值和缺失值分别换成距离该异常值和缺失值所在样本点最近的原始数据的样本值,对三种气象数据进行归一化,基于下列公式:
Figure 566624DEST_PATH_IMAGE001
其中,Si表示收集到的数据序列Smin和Smax分别表示收集数据中的最小值和最大值,
Figure 503356DEST_PATH_IMAGE002
表示经过归一化处理后的数据序列。
前所述的一种自适应的多气象要素预测方法,步骤S4中,高斯混合模型由多个多维高斯分布叠加得到,概率密度函数如下,
Figure 942428DEST_PATH_IMAGE003
Figure 156371DEST_PATH_IMAGE004
其中,x表示多维气象数据样本的集合,N表示高斯混合模型包含的多维高斯分布的总簇数,P(x)表示多维高斯混合模型的概率密度;Pn(x)表示第n个多维高斯分布的概率密度,
Figure 124327DEST_PATH_IMAGE005
、/>
Figure 486039DEST_PATH_IMAGE006
、/>
Figure 10692DEST_PATH_IMAGE007
表示待估计参数,分别为第n个高斯分布簇的系数、均值向量以及协方差矩阵;
高斯混合模型通过最大化对数似然函数实现最优参数估计,如下式所示,
Figure DEST_PATH_IMAGE008
其中,M表示总样本的组数,由降水、气温以及风速历史数据组成;xm表示第m组气象样本,
Figure 610300DEST_PATH_IMAGE009
表示需要优化的参数集合。
前所述的一种自适应的多气象要素预测方法,步骤S4中,使用飞蛾扑火算法对期望最大化算法进行改进,训练高斯混合模型的方法包括以下步骤
S4.1、收集历史多年逐小时降水、气温以及风速时间序列数据,通过步骤S2中的数据预处理和步骤S3中的特征提取构建训练集和测试集,设置高斯混合模型阶数;
S4.2、初始化高斯混合模型参数;
S4.3、初始化飞蛾扑火算法参数;
S4.4、使用期望最大化算法随机选择一只飞蛾并生成其位置矩阵和对应的高斯混合模型参数;
S4.5、更新火焰数量;
S4.6、判断是否是首次迭代,若是则根据飞蛾初始位置计算出个体适应度并排序,若否则更新火焰位置;
S4.7、更新飞蛾位置矩阵并计算适应度值,与前一代最高的个体适应度值比较后,选择更高的适应度值;
S4.8、判断是否满足终止条件,若是则输出最优参数集,结束训练,若为否则返回步骤S4.4。
前所述的一种自适应的多气象要素预测方法,步骤S4.2中,初始化高斯混合模型参数的方法具体为,随机生成值大于零的三维向量
Figure 14737DEST_PATH_IMAGE010
和3x3的随机数矩阵/>
Figure 926061DEST_PATH_IMAGE011
,以及N个初始均值向量/>
Figure 175777DEST_PATH_IMAGE012
和高斯混合模型系数/>
Figure 426630DEST_PATH_IMAGE013
,通过下式将系数/>
Figure 939651DEST_PATH_IMAGE013
标准化,使系数和为1,
Figure 275954DEST_PATH_IMAGE014
其中,
Figure 329361DEST_PATH_IMAGE013
表示高斯混合模型系数。
前所述的一种自适应的多气象要素预测方法,步骤S4.8中的最佳参数集如下所示,
Figure 247769DEST_PATH_IMAGE015
其中,
Figure 994008DEST_PATH_IMAGE016
表示最佳参数集,/>
Figure 489712DEST_PATH_IMAGE013
表示第n个高斯分布簇的系数,/>
Figure 612389DEST_PATH_IMAGE012
表示第n个均值向量,/>
Figure 634571DEST_PATH_IMAGE010
和/>
Figure 551712DEST_PATH_IMAGE011
分别表示第n个用于构造协方差矩阵的3维特征向量和3x3的随机矩阵;
通过计算最大后验概率,对降水、气温以及风速数据进行分类,公式如下:
Figure 800290DEST_PATH_IMAGE017
其中,
Figure 195500DEST_PATH_IMAGE013
表示第n个高斯分布簇的系数,/>
Figure 9872DEST_PATH_IMAGE018
表示第m组气象样本多维高斯混合模型的概率密度,/>
Figure 176542DEST_PATH_IMAGE019
表示第m组气象样本的第n个多维高斯分布的概率密度。
前所述的一种自适应的多气象要素预测方法,步骤S5中,将历史多年逐小时降水数据分为无降水数据和有降水数据,将历史多年逐小时风速数据分为有风数据和无风数据,采用最大间隔法策略分别训练两个对应的支持向量机,得到分离超平面及分类决策函数;
Figure 709155DEST_PATH_IMAGE020
Figure 845738DEST_PATH_IMAGE021
其中,
Figure 780196DEST_PATH_IMAGE022
表示法向量的最优解,/>
Figure 367035DEST_PATH_IMAGE023
表示截距的最优解,G(x)表示分类决策函数;
分别对实测降水数据和实测风速数据二分类,并判断是否有雨以及是否有风,若没有雨则输出降水预测结果,若有雨则执行步骤S6,若没有风则输出风速预测结果,若有风则执行步骤S6。
前所述的一种自适应的多气象要素预测方法,步骤S6中,使用DFT-CNN分类模型对风速数据以及降水数据进行分类的方法,包括以下步骤
S6.1.1、将风速一维时间序列数据转为二维图像,基于如下公式,
Figure 855785DEST_PATH_IMAGE024
其中,T((j-1)×N+k)表示截取的一维时序数据中的第(j-1)×N+k个数据值,I(j,k)表示转换之后图像第j行、第k列的像素点,
Figure 123955DEST_PATH_IMAGE025
和/>
Figure 850603DEST_PATH_IMAGE026
分别表示求最大值函数和求最小值函数,/>
Figure 280447DEST_PATH_IMAGE027
表示舍入函数,即使转换之后的像素值仅保持整数部分;
S6.1.2、使用二维离散傅里叶变换对得到的二维图像求得图像频谱,公式如下,
Figure 597772DEST_PATH_IMAGE028
式中,f(x,y)表示一幅
Figure 404054DEST_PATH_IMAGE029
的矩阵,其所在的坐标系被称为空间域;F(u,v)表示f(x,y)的傅里叶变换,其所在坐标系被称为频域;
S6.1.3、使用训练好的卷积神经网络对得到的频谱图进行三分类,即可判断当前实测的风速状态以及降水状态,对频谱图进行三分类前首先将频谱图的尺寸调整为[1,N,N]。
前所述的一种自适应的多气象要素预测方法,步骤S6中,使用经验小波变换方式对分类后的气温数据、降水数据以及风速数据进行时序分解,包括以下步骤
S6.2.1、确定气温、风速状态以及降水状态分别利用经验小波变换方式所分解的子序列数目的关系,风速状态分别为风速状态1、风速状态2以及风速状态3,降水状态分别为降水状态1、降水状态2以及降水状态3,关系如下,
Figure 985208DEST_PATH_IMAGE030
其中,K7表示气温数据分解后子序列数目,K1、K2、K3分别表示降水状态1、降水状态2和降水状态3所对应的子序列分解数目,K4、K5、K6分别表示风速状态1、风速状态2和风速状态3所对应的子序列分解数目;
S6.2.2、对实测气温时间序列h(t)1,经过经验小波变换方式分解后得到,
Figure 851533DEST_PATH_IMAGE031
其中,
Figure 642771DEST_PATH_IMAGE032
表示信号分解得到的模态分量,K7表示气温序列分解的子序列数目;
S6.2.3、对实测风速时间序列h(t)2和实测降水时间序列h(t)3,分别经过经验小波变换方式分解后得到,
Figure 987165DEST_PATH_IMAGE033
Figure 750721DEST_PATH_IMAGE034
其中,
Figure 460051DEST_PATH_IMAGE032
均表示信号分解得到的模态分量,子序列的数目N1和N2由当前风速和降水状态决定。
前所述的一种自适应的多气象要素预测方法,步骤S6中,构建BES-RBF的方法包括以下步骤
S6.3.1、选取历史多年降水、气温和风速数据进行步骤S2中的数据预处理和步骤S3中的特征提取,通过经验小波变换方式分解分别得到降水、气温和风速数据子序列数据集,将每一子序列数据集都划分为训练集和测试集;
S6.3.2、初始化秃鹰算法参数;
S6.3.3、初始化RBF神经网络参数;
S6.3.4、计算秃鹰个体适应度值,选择最佳适应度值,更新秃鹰位置;
S6.3.5、秃鹰通过螺旋搜索猎物和选择相应区域,更新秃鹰位置;
S6.3.6、在搜索空间中,更新位置后对猎物俯冲,更新秃鹰位置;
S6.3.7、判断是否满足结束条件,若满足则输出最优RBF初始化参数,否则重复步骤S6.3.4至步骤S6.3.7;
S6.3.8、使用训练集训练RBF网络,得到预测模型,利用下式预测:
Figure 941848DEST_PATH_IMAGE035
其中,d表示隐藏层单元数;
Figure 902982DEST_PATH_IMAGE036
表示欧式范数,x表示输入层的向量,/>
Figure 255466DEST_PATH_IMAGE037
表示基函数的中心、/>
Figure 198014DEST_PATH_IMAGE038
表示基宽度、/>
Figure 839211DEST_PATH_IMAGE039
表示隐含层与输出层的连接权重值;
S6.3.9、对气温各子序列预测的结果重构,输出最终预测结果,使用皮尔逊相关系数防止合并子序列时操作重复,公式如下,
Figure 790987DEST_PATH_IMAGE040
其中,HK,L表示两子序列K、L之间的皮尔逊相关系数,
Figure 325873DEST_PATH_IMAGE041
和/>
Figure 704902DEST_PATH_IMAGE042
分别表示子序列K、L的均值,n表示子序列K、L中的数据数目。
本发明的有益效果是:
(1)本发明中,使用最邻近插值补全缺失值和替换异常值,用一维卷积神经网络对三种气象数据进行特征提取及降维,可以充分考虑数据的深层特征;针对降水和风速时间序列数据的随机性和间歇性,分别利用历史数据训练支持向量机,再判断实测数据有无降水以及有无风速,若有降水或者有风,则进一步预测具体的降水和风速数值;
(2)本发明中,通过飞蛾扑火算法对EM算法进行优化,可以提高模型的鲁棒性,改进的EM算法求解GMM最佳参数集可以跳出局部最优,改进的高斯混合模型能对三种气象要素进行分类,再分别预测,起到了对多种气象要素同时进行预测的有益效果;
(3)本发明中,降水、气温和风速三种信号稳定程度不一,相较而言,风速在空间中随时间变化最剧烈,信号中包含的高频成分较多,气温信号则随时间变化的最缓慢,信号中包含的低频成分较多;本方法对气温时序信号直接使用EWT算法进行分解,但对降水、风速这类气象数据,直接使用EWT算法分解成固定数目或很多个子序列,再分别建立预测模型,并不合理,因为降水、风速在某些时间段内变化的可能也相对较为平缓,包含的低频成分较多,仍直接使用信号分解算法,分解成较多个或固定数目的子序列进行预测,不仅会浪费计算资源,还可能会影响预测精度,因此,本方法设计了DFT-CNN模型,去判断降水和风速的状态,根据不同状态,分别设置相对应的子序列分解数目,这样可以极大的提高预测精度;
(4)本发明中,降水、气温和风速等气象序列数据具有非平稳、非线性的特征,直接使用RBF神经网络预测,结果不够精确,所以本气象预测方法针对不同气象要素的特性,使用EWT将时序数据分解为数目不同的子序列,对三种气象要素各子序列构建BES-RBF神经网络进行预测,通过序列重构得到更加精确的预测结果。
附图说明
图1为本发明的总流程示意图;
图2为本发明中MFO-GMM模型训练的流程示意图;
图3为本发明中BES-RBF模型训练的流程示意图;
图4为本发明中DFT-CNN分类模型的流程示意图;
图5为本发明中一维时间序列信号转为二维图像的示意图;
图6为本发明中CNN分类模型的示意图。
具体实施方式
本实施例提供的一种自适应的多气象要素预测方法,结构如图1至图3所示,包括以下步骤
S1、确定研究区域,分别收集该区域实测的降水、气温和风速逐小时时间序列数据。
S2、对获取的气象数据分别进行数据预处理,具体为:对数据进行数据清洗,使用最邻近插值,将数据中的异常值和缺失值分别换成距离该异常值和缺失值所在样本点最近的原始数据的样本值;为了减少后续计算的复杂性以及防止数据间量纲的影响,对三种气象数据进行归一化,基于下列公式:
Figure 833395DEST_PATH_IMAGE001
其中,Si表示收集到的数据序列Smin和Smax分别表示收集数据中的最小值和最大值,
Figure 323282DEST_PATH_IMAGE002
表示经过归一化处理后的数据序列。
步骤S3、对预处理后的降水、气温以及风速数据分别进行数据特征提取;通过对原始数据的特征进行转换,生成新的特征或者成分,会比直接使用原始的特征效果要好,使用主成分分析法(PCA)和非负矩阵分解的方法难以去挖掘数据深层特征,误差较大;
本步骤使用一维卷积神经网络分别提取降水、气温以及风速序列数据中隐含的深层特征,一维卷积神经网络包括用于提取一维序列数据特征的三个卷积层,每层卷积核大小维度设置为1*3,每个卷积层卷积核的个数与输入数据通道数保持一致;将输出结果通过一个池化层,池化操作可以剔除冗余信息,减少计算量;卷积核的参数可以通过历史数据训练学习得到。
步骤S4、高斯混合模型(GMM)是一种常用的分类方法,由于高斯混合模型(GMM)的初始参数随机给定,使用期望最大化算法(EM)求解最佳参数集会陷入局部最优,所以本步骤使用飞蛾扑火算法(MFO)对期望最大化算法(EM)进行改进,提高高斯混合模型(GMM)对降水、气温和风速三种气象数据的分类效果;
高斯混合模型(GMM)由多个多维高斯分布叠加得到,概率密度函数如下:
Figure 728987DEST_PATH_IMAGE003
Figure 13338DEST_PATH_IMAGE004
其中,x表示多维气象数据样本的集合,N表示高斯混合模型(GMM)包含的多维高斯分布的总簇数,P(x)表示多维高斯混合模型(GMM)的概率密度;Pn(x)表示第n个多维高斯分布的概率密度,
Figure 629127DEST_PATH_IMAGE005
、/>
Figure 657126DEST_PATH_IMAGE006
、/>
Figure 104288DEST_PATH_IMAGE007
表示待估计参数,分别为第n个高斯分布簇的系数、均值向量以及协方差矩阵;
高斯混合模型(GMM)通过最大化对数似然函数实现最优参数估计,如下式所示,该式也用于在飞蛾扑火算法对期望最大化算法(EM)进行优化时,作为其适应度函数:
Figure 887436DEST_PATH_IMAGE008
其中,M表示总样本的组数,由降水、气温以及风速历史数据组成;xm表示第m组气象样本,
Figure 52838DEST_PATH_IMAGE009
表示需要优化的参数集合。
本气象预测方法通过飞蛾扑火算法对期望最大化算法(EM)进行优化,将上式作为适应度函数,当满足终止条件或最大迭代次数时,输出最优参数集,具体流程如下:
S4.1、收集历史多年逐小时降水、气温以及风速时间序列数据,通过步骤S2中的数据预处理和步骤S3中的特征提取构建训练集和测试集,设置高斯混合模型(GMM)阶数N=3;
S4.2、初始化高斯混合模型(GMM)参数,具体为:随机生成值大于零的三维向量
Figure 822211DEST_PATH_IMAGE010
和3x3的随机数矩阵/>
Figure 123879DEST_PATH_IMAGE011
,以及N个初始均值向量/>
Figure 828661DEST_PATH_IMAGE012
和高斯混合模型(GMM)系数/>
Figure 950201DEST_PATH_IMAGE013
,通过下式将系数/>
Figure 585582DEST_PATH_IMAGE013
标准化,使系数和为1,
Figure 945019DEST_PATH_IMAGE014
其中,
Figure 7653DEST_PATH_IMAGE013
表示高斯混合模型系数;
S4.3、初始化飞蛾扑火算法参数,飞蛾群体大小设置为f,变量维度设置为g,最大迭代次数设置为E;
S4.4、使用期望最大化算法(EM)随机选择一只飞蛾并生成其位置矩阵和对应的高斯混合模型(GMM)参数;
S4.5、更新火焰数量;
S4.6、判断是否是首次迭代,若是则根据飞蛾初始位置计算出个体适应度并排序;若否则更新火焰位置;
S4.7、更新飞蛾位置矩阵并计算适应度值,与前一代最高的个体适应度值比较后,选择更高的适应度值;
S4.8、判断是否满足终止条件,若是则输出最优参数集,结束训练;若为否则返回步骤S4.4,最佳参数集如下:
Figure 944385DEST_PATH_IMAGE015
其中,
Figure 117877DEST_PATH_IMAGE016
表示最佳参数集,/>
Figure 128558DEST_PATH_IMAGE013
表示第n个高斯分布簇的系数,/>
Figure 299777DEST_PATH_IMAGE012
表示第n个均值向量,/>
Figure 661488DEST_PATH_IMAGE010
和/>
Figure 448791DEST_PATH_IMAGE011
分别表示第n个用于构造协方差矩阵的3维特征向量和3x3的随机矩阵;
得到
Figure 845137DEST_PATH_IMAGE016
后,遍历样本xm,按照下式计算xm由第n个高斯分布生成的后验概率
Figure 187257DEST_PATH_IMAGE043
,并将xm归于概率最大的那一类,通过计算最大后验概率,可以实现对降水、气温以及风速数据的分类,
Figure 770685DEST_PATH_IMAGE044
其中,
Figure 613876DEST_PATH_IMAGE013
表示第n个高斯分布簇的系数,/>
Figure 599149DEST_PATH_IMAGE018
表示第m组气象样本多维高斯混合模型的概率密度,/>
Figure 174487DEST_PATH_IMAGE019
表示第m组气象样本的第n个多维高斯分布的概率密度。
步骤S5、降水和风速具有稀疏性,而气温在空间上是连续变化的,当24小时降水不高于0.1mm时,视为无降水状态,当平地离地10米处风速不高于0.2m/s时,视为无风状态;
根据划分标准,将历史多年逐小时降水数据分为无降水数据和有降水数据,训练对应支持向量机(SVM);同样,根据划分标准,将历史多年逐小时风速数据分为无风数据和有风数据,训练对应支持向量机(SVM);
采用最大间隔法策略分别训练两个对应的训练支持向量机(SVM),由此得到分离超平面及分类决策函数,
Figure 182895DEST_PATH_IMAGE020
Figure 501880DEST_PATH_IMAGE021
其中,
Figure 341660DEST_PATH_IMAGE022
表示法向量的最优解,/>
Figure 900949DEST_PATH_IMAGE023
表示截距的最优解,G(x)表示分类决策函数;
训练好的两个支持向量机(SVM),分别对实测的逐小时降水数据和风速数据二分类,判断是否有雨以及是否有风,若无雨则输出降水预测结果,若有雨则执行下一步骤;若无风则输出风速预测结果,若有风则执行下一步骤。
一般来说需要对分类后的降水数据、气温数据以及风速数据分别进行时序信号分解,得到多个分量后分别构建多个模型预测具体的值,然后再将各个子序列预测的结果值相加得到最终的预测值;但是由于降水、气温和风速三种信号的稳定程度不一,相较而言,风速在空间中随时间变化最剧烈,信号中包含的高频成分较多,气温信号则随时间变化的最缓慢,信号中包含的低频成分较多。
像降水、风速这类气象数据具有非连续性和随时间变化较快的特点,直接使用信号分解算法分解成固定数目或很多个子序列,再分别建立预测模型,并不合理;因为降水、风速在某些时间段内变化的可能也相对较为平缓,如果直接使用信号分解算法,分解成较多个或固定数目的子序列进行预测,不仅会浪费计算资源,还可能会影响预测精度,因此,本方法针对不同气象要素的特性,制定不同的信号分解策略。
S6、使用经验小波变换方式对分类后的气温数据进行时序分解,得到多个分量后构建BES-RBF神经网络预测具体的气温值;
使用DFT-CNN分类模型分别对降水数据和风速数据进行分类,判断风速状态和降水状态,且根据不同的风速状态和降水状态设置相对应的子序列分解数目,同样使用经验小波变换方式分别对分类后的降水数据和风速数据进行时序分解,得到多个分量后构建相应的BES-RBF神经网络预测具体的降水值和风速值;
将各个子序列预测的气温值、降水值以及风速值相加得到最终预测值。
步骤S6中,使用两个DFT-CNN分类模型分别对风速和降水时序数据分类,DFT-CNN分类模型如图4所示,以风速为例,采用图像分类的思想对一维时序数据进行分类,包括以下步骤,
S6.1.1、如图5所示,首先需要将一维时间序列数据转为二维图像,从一维时序数据中截取N2段,要求截取的这段时序数据能尽可能的和原始时序数据保持一致长度大小,然后将截取的时序数据填充到
Figure 724548DEST_PATH_IMAGE029
大小的矩阵中,矩阵的每一行都被长度为N的序列数据填充,接着对得到的矩阵归一化到0-255,即得到灰度图像像素值的范围,转换公式如下,
Figure 519329DEST_PATH_IMAGE024
其中,T((j-1)×N+k)表示截取的一维时序数据中的第(j-1)×N+k个数据值,I(j,k)表示转换之后图像第j行、第k列的像素点,
Figure 744774DEST_PATH_IMAGE025
和/>
Figure 724231DEST_PATH_IMAGE026
分别表示求最大值函数和求最小值函数,/>
Figure 769548DEST_PATH_IMAGE027
表示舍入函数,即使转换之后的像素值仅保持整数部分;
S6.1.2、对处理得到的二维图像使用二维离散傅里叶变换(DFT)求图像频谱,图像的频谱图和原图像上各点并不存在一一对应的关系,图像频谱图上的高频部分表示原图像上灰度发生急剧变化的区域,意味着原始风速一维时间序列数据在这一段范围内,高频成分较多;频谱图上的低频部分表示原图像上灰度基本不变或者变化很小的区域,意味着原始风速一维时间序列数据在这一段范围内,低频成分较多;
因此可以使用卷积神经网络(CNN)模型对图像频谱图进行分类,根据图像的频谱图来判断实测的风速数据是哪一种风速状态,二维离散傅里叶变换(DFT)的公式如下:
Figure 164757DEST_PATH_IMAGE028
式中,f(x,y)表示一幅
Figure 182392DEST_PATH_IMAGE029
的矩阵,其所在的坐标系被称为空间域;F(u,v)表示f(x,y)的傅里叶变换,其所在坐标系被称为频域;
S6.1.3、对得到的频谱图用卷积神经网络(CNN)进行三分类;如图6所示,卷积神经网络(CNN)包含两个卷积层、两个池化层、一个全连接层以及一个Softmax层;将大量历史风速数据转为二维图像求得频谱图后,使用带有标签的频谱图训练卷积神经网络(CNN)得到最好的权重,损失函数采用L1损失,从而完成模型的训练;使用训练好的卷积神经网络(CNN)对已有频谱图分类以及判断风速状态之前,需要将频谱图的尺寸调整(reshape)成[1,N,N],然后再送入网络中进行分类,即可判断当前实测风速的状态。
步骤S6中,使用经验小波变换方式对分类后的气温数据、降水数据以及风速数据进行时序分解,包括以下步骤
S6.2.1、降水、气温和风速三种信号稳定程度不一,相较而言,风速在空间中变化最剧烈,信号包含的高频成分较多,气温信号则变化的最缓慢,针对不同气象要素的特性,进行时序分解时,将气温时间序列数据直接使用EWT算法分解为K7个子序列;针对风速和降水,本方法分别设计了两个DFT-CNN分类模型进行三分类,来判别当前实测的风速和降水处于哪种状态,具体类别为风速状态1、风速状态2以及风速状态3,分别代表当前实测的风速为低频信号、中频信号以及高频信号,在进行时序信号分解时,分解的子序列个数分别为K4、K5、K6;同理降水的具体类别为降水状态1、降水状态2以及降水状态3,分别代表当前实测的降水为低频信号、中频信号以及高频信号,在进行时序信号分解时,分解的子序列个数分别为K1、K2、K3;相应地,各子序列数目应满足如下条件
Figure 270433DEST_PATH_IMAGE045
S6.2.2、使用经验小波变换方式(EWT)对实测气温时间序列进行分解;
S6.2.3、使用经验小波变换方式(EWT)分别对实测风速时间序列和实测降水时间序列进行分解;
经验小波变换方式(EWT)是一种处理非线性、非平稳信号的方式,可以解决WT带来的模态混叠问题,同时避免了EMD缺乏数学理论支撑,对噪声和抽样较为敏感的缺点;三种气象要素中,气温数据随时间变化的最缓慢,其时序信号中包含的低频成分较多,所以本方法直接使用EWT算法,将气温时序信号分解成K7个子序列,再使用BES-RBF算法对每个子序列进行预测;降水、风速在某些时间段内变化的可能也相对较为平缓,仍直接使用信号分解算法,分解成较多个或固定数目的子序列进行预测,不仅会浪费计算资源,还可能会影响预测精度,所以通过DFT-CNN分类模型判断实测的风速和降水状态,针对不同状态,分别设置相对应的子序列分解数目,在节约计算资源的同时,可以进一步提高预测的精度;
步骤S6.2.2至步骤S6.2.3中,使用经验小波变换方式(EWT)对三种气象要素时序数据进行分解,以气温数据为例,具体过程如下:
首先对信号h(t)1进行快速傅里叶变换,并获取其频谱
Figure 616095DEST_PATH_IMAGE046
,将频谱范围归一化到[0,π];
接着对傅里叶频谱进行正确的分割,其边界确定为
Figure 80575DEST_PATH_IMAGE047
,将傅里叶频谱[0,π]分解为K7个相邻部分,且有/>
Figure 749453DEST_PATH_IMAGE048
,/>
Figure 946079DEST_PATH_IMAGE049
,对于每个/>
Figure 965988DEST_PATH_IMAGE050
,各频带的边界带宽记为:
Figure 296475DEST_PATH_IMAGE051
根据Littlewood-Paley和Meyer理论,经验小波的尺度函数和小波函数分别如下:
Figure 85440DEST_PATH_IMAGE052
Figure 452967DEST_PATH_IMAGE053
其中,
Figure 694593DEST_PATH_IMAGE054
根据小波理论和上述尺度函数
Figure 500875DEST_PATH_IMAGE055
以及小波函数/>
Figure 957395DEST_PATH_IMAGE056
,信号h(t)1可以分解成若干模态分量:
Figure 823720DEST_PATH_IMAGE057
其中,小波变换细节系数Wx(k,t)是信号h(t)1与小波函数
Figure 490324DEST_PATH_IMAGE058
的内积,而逼近系数Wx(0,t)是信号h(t)1与尺度函数/>
Figure 834718DEST_PATH_IMAGE059
的内积,则:
Figure 332695DEST_PATH_IMAGE060
对一个气温时间序列h(t)1,经过经验小波变换方式(EWT)分解后得到:
Figure 432238DEST_PATH_IMAGE061
其中,
Figure 648456DEST_PATH_IMAGE062
表示信号分解得到的模态分量,K7表示气温序列分解的子序列数目;
同理,将实测风速时间序列h(t)2和实测降水时间序列h(t)3,分别经过EWT分解后得到:
Figure 734224DEST_PATH_IMAGE063
Figure 86708DEST_PATH_IMAGE064
其中,
Figure 294835DEST_PATH_IMAGE062
均表示信号分解得到的模态分量,子序列的数目N1和N2由当前风速和降水状态决定。
步骤S6中,依据降水、气温以及风速要素分解的子序列数目,分别构建相应数目的BES-RBF模型进行预测;
神经网络具有较强的学习与泛化能力,理论上可以逼近任何一个非线性函数,适合对气象数据进行预测;径向基神经网络(Radical Basis Function Neural Network,RBFNN)是一个三层结构的前向网络,由输入层、隐含层和输出层构成;RBF神经网络是一个能逼近任意精度的模型,克服了BP神经网络泛化能力弱、收敛速度慢、易陷入局部最优以及其函数值不紧密的问题;
RBF神经网络需要优化的参数为基函数的中心
Figure 808469DEST_PATH_IMAGE065
、基宽度/>
Figure 760244DEST_PATH_IMAGE066
、隐含层与输出层的连接权重值/>
Figure 170497DEST_PATH_IMAGE067
,采用随机初始化网络参数的方法,可能会造成梯度消失或爆炸、初始值过大或过小的问题,从而降低网络收敛能力;本步骤使用秃鹰优化算法(Bald Eagle Search,BES)对RBF神经网络初始化参数进行寻优,解决随机初始化参数带来的问题,具体流程如下:
S6.3.1、选取历史多年降水、气温和风速数据进行步骤S2中的数据预处理和步骤S3中的特征提取,通过经验小波变换方式(EWT)分解分别得到降水、气温和风速数据子序列数据集,将每一子序列数据集都划分为训练集和测试集;
S6.3.2、初始化秃鹰算法参数,设置边界值
Figure 549526DEST_PATH_IMAGE068
和/>
Figure 802652DEST_PATH_IMAGE069
,设置种群数量为20,迭代次数为90;
S6.3.3、初始化RBF神经网络的基函数的中心
Figure 26960DEST_PATH_IMAGE065
、基宽度/>
Figure 619616DEST_PATH_IMAGE066
、隐含层与输出层的连接权重值/>
Figure 841650DEST_PATH_IMAGE067
S6.3.4、计算秃鹰个体适应度值,选择最佳适应度值,并通过下式更新秃鹰位置:
Figure 519756DEST_PATH_IMAGE070
其中,
Figure 626383DEST_PATH_IMAGE071
取值为[1,2],对位置变化进行控制;r是一个随机数,取值为[0,1];Qi表示第i只秃鹰当前的位置;Qmean表示秃鹰平均位置分布;Qbest表示秃鹰种群位置中选取的最佳位置;
S6.3.5、秃鹰通过螺旋搜索猎物和选择相应区域,通过下式更新秃鹰位置:
Figure 807966DEST_PATH_IMAGE072
其中,c(i)和z(i)分别表示极坐标中秃鹰的位置,取值范围均为[-1,1];
S6.3.6、在搜索空间中,更新位置后对猎物俯冲,通过下式更新秃鹰位置:
Figure 528797DEST_PATH_IMAGE073
其中,rand为一个随机数,s1和s2表示用于增加秃鹰向最佳和中心点运动强度的参数,取值均为[1.5,2];
S6.3.7、判断是否满足结束条件,若满足则输出最优RBF初始化参数,否则重复步骤S6.3.4至步骤S6.3.7;
S6.3.8、得到最佳RBF网络初始化参数后,导入训练集进行训练,通过迭代利用梯度下降法最小化MAE损失,更新迭代次数和权重等参数,当满足终止条件后,将最佳基函数的中心
Figure 366303DEST_PATH_IMAGE065
、基宽度/>
Figure 197993DEST_PATH_IMAGE066
、隐含层与输出层的连接权重值/>
Figure 827557DEST_PATH_IMAGE067
带入RBF网络中,得到如下预测模型,结束训练:
Figure DEST_PATH_IMAGE074
其中,d表示隐藏层单元数;
Figure 922552DEST_PATH_IMAGE075
表示欧式范数,x表示输入层的向量,本气象预测方法径向基函数采用高斯函数作为激活函数,高斯函数如下:
Figure 44092DEST_PATH_IMAGE076
其中,
Figure 679473DEST_PATH_IMAGE077
S6.3.9、分别对降水、气温和风速要素各子序列预测的结果重构,输出最终预测结果,使用皮尔逊相关系数(Pearson Correlation Coefficient,PCCs)防止合并子序列时操作重复,将两子序列间的皮尔逊系数用HK,L表示,公式如下:
Figure 914276DEST_PATH_IMAGE078
其中,HK,L表示两子序列K、L之间的皮尔逊相关系数,
Figure 976910DEST_PATH_IMAGE079
和/>
Figure 585746DEST_PATH_IMAGE080
分别表示子序列K、L的均值,n表示子序列K、L中的数据数目;
若子序列K和L之间的皮尔逊相关系数绝对值越接近1,则这两个序列的相关性越强;若相关系数绝对值越接近于0,则两序列相关性越弱;当系数为0时,两序列线性无关。
本气象预测方法,使用最邻近插值补全缺失值和替换异常值,用一维卷积神经网络对三种气象数据进行特征提取及降维,可以充分考虑数据的深层特征;通过飞蛾扑火算法对期望最大化算法(EM)进行优化,提高模型的鲁棒性,改进的期望最大化算法(EM)求解高斯混合模型(GMM)最佳参数集可以跳出局部最优,改进的高斯混合模型(GMM)能对三种气象要素进行分类,再分别预测,起到了对多种气象要素同时进行预测的有益效果;降水、气温和风速等气象序列数据具有非平稳、非线性的特征,直接使用RBF神经网络预测,结果不够精确,所以本气象预测方法针对不同气象要素的特性,使用经验小波变换方式(EWT)将时序数据分解为数目不同的子序列,对三种气象要素各子序列构建BES-RBF神经网络进行预测,通过序列重构得到更加精确的预测结果。
本方法对多种气象要素同时进行预测,不同气象要素的特点各不相同,降水、气温和风速三种信号稳定程度不一,相较而言,风速在空间中随时间变化最剧烈,信号中包含的高频成分较多,气温信号则随时间变化的最缓慢,信号中包含的低频成分较多。
本方法对气温时序信号直接使用EWT算法进行分解,但对降水、风速这类气象数据,直接使用EWT算法分解成固定数目或很多个子序列,再分别建立预测模型,并不合理,因为降水、风速在某些时间段内变化的可能也相对较为平缓,包含的低频成分较多,仍直接使用信号分解算法,分解成较多个或固定数目的子序列进行预测,不仅会浪费计算资源,还可能会影响预测精度,因此,本方法设计了DFT-CNN模型,去判断降水和风速的状态,根据不同状态,分别设置相对应的子序列分解数目,这样可以极大的提高预测精度。
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

Claims (6)

1.一种自适应的多气象要素预测方法,其特征在于:包括以下步骤
S1、确定研究区域,对气象数据进行收集,气象数据包括该区域实测的降水、气温以及风速逐小时时间序列数据;
S2、对收集到的降水、气温以及风速数据分别进行数据预处理;
S3、对预处理后的降水、气温以及风速数据分别进行数据特征提取;
S4、使用飞蛾扑火算法对期望最大化算法进行改进,训练高斯混合模型,得到最优参数集,并对降水、气温以及风速数据进行分类;
S5、对分类后的降水数据进行二分类,并判断是否有雨,若有雨则执行下一步骤,若无雨则输出降水预测结果;对分类后的风速数据进行二分类,并判断是否有风,若有风则执行下一步骤,若无风则输出风速预测结果;
将历史多年逐小时降水数据分为无降水数据和有降水数据,将历史多年逐小时风速数据分为有风数据和无风数据,采用最大间隔法策略分别训练两个对应的支持向量机,得到分离超平面及分类决策函数;
Figure 160300DEST_PATH_IMAGE001
Figure 215981DEST_PATH_IMAGE002
其中,
Figure 970310DEST_PATH_IMAGE003
表示法向量的最优解,/>
Figure 707322DEST_PATH_IMAGE004
表示截距的最优解,G(x)表示分类决策函数;
分别对实测降水数据和实测风速数据二分类,并判断是否有雨以及是否有风,若没有雨则输出降水预测结果,若有雨则执行步骤S6,若没有风则输出风速预测结果,若有风则执行步骤S6;
S6、使用经验小波变换方式对分类后的气温数据进行时序分解,得到多个分量后构建BES-RBF神经网络预测具体的气温值;
使用DFT-CNN分类模型分别对降水数据和风速数据进行分类,判断风速状态和降水状态,且根据不同的风速状态和降水状态设置相对应的子序列分解数目,同样使用经验小波变换方式分别对分类后的降水数据和风速数据进行时序分解,得到多个分量后构建相应的BES-RBF神经网络预测具体的降水值和风速值;
将各个子序列预测的气温值、降水值以及风速值相加得到最终预测值;
使用DFT-CNN分类模型对风速数据以及降水数据进行分类的方法,包括以下步骤
S6.1.1、将风速一维时间序列数据转为二维图像,基于如下公式,
Figure 230707DEST_PATH_IMAGE005
其中,T((j-1)×N+k)表示截取的一维时序数据中的第(j-1)×N+k个数据值,I(j,k)表示转换之后图像第j行、第k列的像素点,
Figure 660551DEST_PATH_IMAGE006
和/>
Figure 228410DEST_PATH_IMAGE007
分别表示求最大值函数和求最小值函数,/>
Figure 503533DEST_PATH_IMAGE008
表示舍入函数,即使转换之后的像素值仅保持整数部分;
S6.1.2、使用二维离散傅里叶变换对得到的二维图像求得图像频谱,公式如下,
Figure 147004DEST_PATH_IMAGE009
式中,f(x,y)表示一幅
Figure 482171DEST_PATH_IMAGE010
的矩阵,其所在的坐标系被称为空间域;F(u,v)表示 f(x,y)的傅里叶变换,其所在坐标系被称为频域;
S6.1.3、使用训练好的卷积神经网络对得到的频谱图进行三分类,即可判断当前实测的风速状态以及降水状态,对频谱图进行三分类前首先将频谱图的尺寸调整为[1,N,N];
使用经验小波变换方式对分类后的气温数据、降水数据以及风速数据进行时序分解,包括以下步骤
S6.2.1、确定气温、风速状态以及降水状态分别利用经验小波变换方式所分解的子序列数目的关系,风速状态分别为风速状态1、风速状态2以及风速状态3,降水状态分别为降水状态1、降水状态2以及降水状态3,关系如下,
Figure 211092DEST_PATH_IMAGE011
其中,K7表示气温数据分解后子序列数目,K1、K2、K3分别表示降水状态1、降水状态2和降水状态3所对应的子序列分解数目,K4、K5、K6分别表示风速状态1、风速状态2和风速状态3所对应的子序列分解数目;
S6.2.2、对实测气温时间序列h(t)1,经过经验小波变换方式分解后得到,
Figure 352224DEST_PATH_IMAGE012
其中,
Figure 850201DEST_PATH_IMAGE013
表示信号分解得到的模态分量,K7表示气温序列分解的子序列数目;
S6.2.3、对实测风速时间序列h(t)2和实测降水时间序列h(t)3,分别经过经验小波变换方式分解后得到,
Figure 621848DEST_PATH_IMAGE014
Figure 572486DEST_PATH_IMAGE015
其中,
Figure 454992DEST_PATH_IMAGE013
均表示信号分解得到的模态分量,子序列的数目N1和N2由当前风速和降水状态决定;
构建BES-RBF的方法包括以下步骤
S6.3.1、选取历史多年降水、气温和风速数据进行步骤S2中的数据预处理和步骤S3中的特征提取,通过经验小波变换方式分解分别得到降水、气温和风速数据子序列数据集,将每一子序列数据集都划分为训练集和测试集;
S6.3.2、初始化秃鹰算法参数;
S6.3.3、初始化RBF神经网络参数;
S6.3.4、计算秃鹰个体适应度值,选择最佳适应度值,更新秃鹰位置;
S6.3.5、秃鹰通过螺旋搜索猎物和选择相应区域,更新秃鹰位置;
S6.3.6、在搜索空间中,更新位置后对猎物俯冲,更新秃鹰位置;
S6.3.7、判断是否满足结束条件,若满足则输出最优RBF初始化参数,否则重复步骤S6.3.4至步骤S6.3.7;
S6.3.8、使用训练集训练RBF网络,得到预测模型,利用下式预测:
Figure 620525DEST_PATH_IMAGE016
其中,d表示隐藏层单元数;
Figure 563073DEST_PATH_IMAGE017
表示欧式范数,x表示输入层的向量,/>
Figure 1008DEST_PATH_IMAGE018
表示基函数的中心、/>
Figure 421625DEST_PATH_IMAGE019
表示基宽度、/>
Figure 894195DEST_PATH_IMAGE020
表示隐含层与输出层的连接权重值;
S6.3.9、对气温各子序列预测的结果重构,输出最终预测结果,使用皮尔逊相关系数防止合并子序列时操作重复,公式如下,
Figure 69961DEST_PATH_IMAGE021
其中,HK,L表示两子序列K、L之间的皮尔逊相关系数,
Figure 995192DEST_PATH_IMAGE022
和/>
Figure 219500DEST_PATH_IMAGE023
分别表示子序列K、L的均值,n表示子序列K、L中的数据数目。
2.根据权利要求1所述的一种自适应的多气象要素预测方法,其特征在于:所述步骤S2中数据预处理的方法具体为:对数据进行数据清洗,使用最邻近插值,将数据中的异常值和缺失值分别换成距离该异常值和缺失值所在样本点最近的原始数据的样本值,对三种气象数据进行归一化,基于下列公式:
Figure 280997DEST_PATH_IMAGE024
其中,Si表示收集到的数据序列Smin和Smax分别表示收集数据中的最小值和最大值,
Figure 565347DEST_PATH_IMAGE025
表示经过归一化处理后的数据序列。
3.根据权利要求1所述的一种自适应的多气象要素预测方法,其特征在于:所述步骤S4中,高斯混合模型由多个多维高斯分布叠加得到,概率密度函数如下,
Figure 289459DEST_PATH_IMAGE026
Figure 317457DEST_PATH_IMAGE027
其中,x表示多维气象数据样本的集合,N表示高斯混合模型包含的多维高斯分布的总簇数,P(x)表示多维高斯混合模型的概率密度;Pn(x)表示第n个多维高斯分布的概率密度,
Figure 499040DEST_PATH_IMAGE028
、/>
Figure 688713DEST_PATH_IMAGE029
、/>
Figure 588536DEST_PATH_IMAGE030
表示待估计参数,分别为第n个高斯分布簇的系数、均值向量以及协方差矩阵;
高斯混合模型通过最大化对数似然函数实现最优参数估计,如下式所示,
Figure DEST_PATH_IMAGE031
其中,M表示总样本的组数,由降水、气温以及风速历史数据组成;xm表示第m组气象样本,
Figure 216963DEST_PATH_IMAGE032
表示需要优化的参数集合。
4.根据权利要求1所述的一种自适应的多气象要素预测方法,其特征在于:所述步骤S4中,使用飞蛾扑火算法对期望最大化算法进行改进,训练高斯混合模型的方法包括以下步骤
S4.1、收集历史多年逐小时降水、气温以及风速时间序列数据,通过步骤S2中的数据预处理和步骤S3中的特征提取构建训练集和测试集,设置高斯混合模型阶数;
S4.2、初始化高斯混合模型参数;
S4.3、初始化飞蛾扑火算法参数;
S4.4、使用期望最大化算法随机选择一只飞蛾并生成其位置矩阵和对应的高斯混合模型参数;
S4.5、更新火焰数量;
S4.6、判断是否是首次迭代,若是则根据飞蛾初始位置计算出个体适应度并排序,若否则更新火焰位置;
S4.7、更新飞蛾位置矩阵并计算适应度值,与前一代最高的个体适应度值比较后,选择更高的适应度值;
S4.8、判断是否满足终止条件,若是则输出最优参数集,结束训练,若为否则返回步骤S4.4。
5.根据权利要求4所述的一种自适应的多气象要素预测方法,其特征在于:所述步骤S4.2中,初始化高斯混合模型参数的方法具体为,随机生成值大于零的三维向量
Figure 518632DEST_PATH_IMAGE033
和3x3的随机数矩阵/>
Figure 879206DEST_PATH_IMAGE034
,以及N个初始均值向量/>
Figure 266325DEST_PATH_IMAGE035
和高斯混合模型系数/>
Figure 449176DEST_PATH_IMAGE036
,通过下式将系数/>
Figure 339771DEST_PATH_IMAGE036
标准化,使系数和为1,
Figure 136826DEST_PATH_IMAGE037
其中,
Figure 745662DEST_PATH_IMAGE036
表示高斯混合模型系数。
6.根据权利要求4所述的一种自适应的多气象要素预测方法,其特征在于:所述步骤S4.8中的最佳参数集如下所示,
Figure 981471DEST_PATH_IMAGE038
其中,
Figure 992152DEST_PATH_IMAGE039
表示最佳参数集,/>
Figure 960108DEST_PATH_IMAGE036
表示第n个高斯分布簇的系数,/>
Figure 56240DEST_PATH_IMAGE035
表示第n个均值向量,/>
Figure 767844DEST_PATH_IMAGE033
和/>
Figure 633032DEST_PATH_IMAGE034
分别表示第n个用于构造协方差矩阵的3维特征向量和3x3的随机矩阵;
通过计算最大后验概率,对降水、气温以及风速数据进行分类,公式如下:
Figure 86404DEST_PATH_IMAGE040
其中,
Figure 669832DEST_PATH_IMAGE036
表示第n个高斯分布簇的系数,/>
Figure 919548DEST_PATH_IMAGE041
表示第m组气象样本多维高斯混合模型的概率密度,/>
Figure 904821DEST_PATH_IMAGE042
表示第m组气象样本的第n个多维高斯分布的概率密度。
CN202211252774.4A 2022-10-13 2022-10-13 一种自适应的多气象要素预测方法 Active CN115345207B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211252774.4A CN115345207B (zh) 2022-10-13 2022-10-13 一种自适应的多气象要素预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211252774.4A CN115345207B (zh) 2022-10-13 2022-10-13 一种自适应的多气象要素预测方法

Publications (2)

Publication Number Publication Date
CN115345207A CN115345207A (zh) 2022-11-15
CN115345207B true CN115345207B (zh) 2023-07-04

Family

ID=83957326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211252774.4A Active CN115345207B (zh) 2022-10-13 2022-10-13 一种自适应的多气象要素预测方法

Country Status (1)

Country Link
CN (1) CN115345207B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115794981B (zh) * 2022-12-14 2023-09-26 广西电网有限责任公司 一种利用模型统计气象数据的方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103426026B (zh) * 2013-09-10 2016-02-24 信阳师范学院 一种混合神经网络预测及识别景区气象要素的方法
CN112348271B (zh) * 2020-11-12 2024-01-30 华北电力大学 基于vmd-ipso-gru的短期光伏功率预测方法
CN114218870A (zh) * 2021-12-22 2022-03-22 大连理工大学 一种基于变分模态分解与注意力机制的风速预测方法
CN114511065A (zh) * 2022-01-21 2022-05-17 北京轩宇空间科技有限公司 神经网络模型构建方法、时间序列预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于PCA和改进PSO-GRU神经网络的气温预测;杨迎新;《现代电子技术》;20220101;第45卷(第1期);正文第89页第1列第1段-第93页第2列第1段 *

Also Published As

Publication number Publication date
CN115345207A (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
Zhou et al. A review on global solar radiation prediction with machine learning models in a comprehensive perspective
Khazaei et al. A high-accuracy hybrid method for short-term wind power forecasting
Hu et al. Predicting Lake Erie wave heights and periods using XGBoost and LSTM
Han et al. Convolutional neural network for convective storm nowcasting using 3-D Doppler weather radar data
US5796611A (en) Weather forecast apparatus and method based on recognition of echo patterns of radar images
Yang et al. Long short-term memory recurrent neural network for tidal level forecasting
Jalali et al. An advanced short-term wind power forecasting framework based on the optimized deep neural network models
CN114488140B (zh) 一种基于深度迁移学习的小样本雷达一维像目标识别方法
Bai et al. Development of a 2-D deep learning regional wave field forecast model based on convolutional neural network and the application in South China Sea
CN113239722B (zh) 基于深度学习在多尺度下的强对流外推方法及系统
CN113344045B (zh) 一种结合hog特征提高sar船只分类精度的方法
CN115345207B (zh) 一种自适应的多气象要素预测方法
Dong et al. Ensemble wind speed forecasting system based on optimal model adaptive selection strategy: Case study in China
CN108983180A (zh) 一种群智能高精度的雷达海杂波预报系统
CN114611608A (zh) 基于深度学习模型的海表面高度数值预报偏差订正方法
Lyu et al. Dynamic feature selection for solar irradiance forecasting based on deep reinforcement learning
CN115544890A (zh) 一种短期电力负荷预测方法及系统
Nguyen et al. Chaotic time series prediction using a novel echo state network model with input reconstruction, Bayesian ridge regression and independent component analysis
CN114897204A (zh) 一种海上风电场短期风速预测方法和装置
Tang et al. An EMD-PSO-LSSVM hybrid model for significant wave height prediction
CN113139513A (zh) 基于超像素轮廓和改进pso-elm的空谱主动学习高光谱分类方法
CN115952924B (zh) 一种基于优化vmd与特征热力图的短期风电功率预测方法
Fei et al. Chinese Grain Production Forecasting Method Based on Particle Swarm Optimization-based Support Vector Machine
CN114065822B (zh) 海洋潮流涨落的电磁识别方法及系统
CN115600500A (zh) 一种基于时空多尺度和k-sdw的超短期概率风电功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant