CN111695290B - 一种适用于变化环境下的短期径流智能预报混合模型方法 - Google Patents
一种适用于变化环境下的短期径流智能预报混合模型方法 Download PDFInfo
- Publication number
- CN111695290B CN111695290B CN202010408229.4A CN202010408229A CN111695290B CN 111695290 B CN111695290 B CN 111695290B CN 202010408229 A CN202010408229 A CN 202010408229A CN 111695290 B CN111695290 B CN 111695290B
- Authority
- CN
- China
- Prior art keywords
- model
- network
- lstm
- prediction
- particle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000005311 autocorrelation function Methods 0.000 claims abstract description 12
- 238000000354 decomposition reaction Methods 0.000 claims description 58
- 239000002245 particle Substances 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004088 simulation Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 abstract description 10
- 238000013439 planning Methods 0.000 abstract description 8
- 238000007726 management method Methods 0.000 abstract description 5
- 238000013468 resource allocation Methods 0.000 abstract description 4
- 238000005457 optimization Methods 0.000 description 11
- 230000002159 abnormal effect Effects 0.000 description 6
- 230000007547 defect Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000000489 vacuum metal deposition Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- KHOITXIGCFIULA-UHFFFAOYSA-N Alophen Chemical compound C1=CC(OC(=O)C)=CC=C1C(C=1N=CC=CC=1)C1=CC=C(OC(C)=O)C=C1 KHOITXIGCFIULA-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Molecular Biology (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
Abstract
本发明公开一种适用于变化环境下的短期径流智能预报混合模型方法,包括步骤:使用改进的VMD算法将原始的径流序列分解成k个IMFs,使得原序列变成多个更加稳定的子序列;用偏自相关函数PACF确定LSTM模型的输入步长,并使用PSO算法对LSTM网络的多个参数进行优化;使用优化得出的参数建立网络,并使用相应的子序列数据进行网络的训练;使用训练好的网络,对子序列进行预测;对各IMFs分量的预测结果求和,得到最终结果。本发明的模型预测结果可为防洪规划、水库调度和水资源配置等水资源规划管理活动提供可靠依据。
Description
技术领域
本发明涉及变化环境下水文时间序列预测模型方法,特别是涉及一种适用于变化环境下的短期径流智能预报混合模型方法。
背景技术
近年来,受到全球气候变化和人类活动的双重影响,流域产汇流条件发生巨大改变,水文系统更加复杂,许多水文气象因素的非平稳特征愈发显著,表现为一个复杂的非平稳、非线性过程,如何提高变化环境下水文预测精度对于防洪规划、水电站运行和水资源配置等水资源规划管理活动具有重要意义。
受气候、流域下垫面条件以及人类活动等综合因素的影响,日径流表现出更强的非平稳、非线性、变异性等特性,使得日径流的预测难度加大。因此,需寻求一种能够有效从非平稳序列中提取具有实际物理意义的特征信号的方法,才能准确地进行日径流预测。
目前针对日径流预测的方法主要分为基于物理机制的过程驱动模型和基于数据分析的数据驱动模型两大类。过程驱动模型基于大气环流、长期天气过程的演变规律和流域下垫面物理状况模拟径流形成的物理过程,如基于物理的分布式或半分布式水文模型以及基于概念的模型,包括Horton模型、Philip模型、新安江模型等,但这些模型方法存在着诸多问题:①回归形式单一,公式表达式单一,难以完全适应所有的水文过程模拟;②参数化问题,如参数的异质性导致预测精度较差等;③过程的复杂性,很多控制径流的过程不是简单的物理过程,而是化学或者生物过程以及人类活动等;而数据驱动模型则通过获取数据关系来快速预测径流的变化过程,忽略复杂的下垫面情况、水文过程,对复杂的非线性系统尤为有效。常见的预测模型有人工神经网络模型(ANN)、支持向量机(SVM)、自适应神经模糊推理系统(ANFIS)等。模型的机理是通过大量样本不断训练以实现误差最小化,普遍存在着易陷入局部最优或收敛不佳、过拟合现象突出、对参数依赖性强等弊端,这些在一定程度上制约了预测模型的实用性和可解释性。
尽管以上数据驱动方法较传统过程驱动方法有一定的优势,但受限于径流过程本身的复杂性和非平稳性,仅依靠预测模型很难对径流序列特征进行精确分辨和识别。越来越多的研究表明,对于复杂的非平稳时间序列,有效的序列分解方法有助于提高模型的预测精度。常见的序列分解方法有经验模态分解方法(EMD)、集成经验模态分解方法(EEMD)、互补集成经验模态分解方法(CEEMD)、小波分解方法(WT)、变分模态分解方法(VMD)等。相较于单一预测模型,EMD分解后的预测模型稳定性有所提高,然而,由于固有的信号间歇性,EMD方法存在模式混频缺陷,限制了其在实际中的广泛应用;EEMD方法通过加入随机白噪声来减弱随机误差对原序列的影响,但也增加了EEMD分解后的重构误差;相比EEMD分解,CEEMD在一定程度上抑制了模态混淆问题,但出现了较多的伪分量;而WT分解需要预先确定分解层数和选择合适的小波基,不合适的小波基和分解层数将会导致高频分量分解效果较差。相比WT分解和CEEMD分解两种方法,VMD分解具有有效减少伪分量、避免模态混叠现象等优势,具有更好的噪声鲁棒性。
因此,将VMD分解和参数优化纳入短期径流智能混合预测模型,能有效地提高非平稳、非线性的复杂时间序列数据的预测精度,径流预测结果可为水资源优化管理和水库优化调度提供技术支持,具有广泛的应用前景和实用意义。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种适用于变化环境下的短期径流智能预报混合模型方法,是一种基于变分模态分解-长短期记忆网络混合模型(VMD-LSTM)的日径流预测方法。
为实现本发明的目的所采用的技术方案是:
适用于变化环境下的短期径流智能预报混合模型方法,包括:
第一阶段,使用改进的VMD算法将原始的径流序列分解成k个IMFs,使得原序列变成多个更加稳定的子序列;
第二阶段,采用偏自相关函数PACF确定LSTM模型的输入步长,并使用PSO算法对LSTM网络的多个参数进行优化(包含LSTM隐层节点数、学习率);
第三阶段,使用优化得出的参数建立网络,并使用相应的子序列数据进行网络的训练;
第四阶段,使用训练好的网络,对子序列进行预测;
第五阶段,对各IMFs分量的预测结果求和,即可得到最终结果。
上述五个阶段的步骤具体实施如下:
步骤一:分解
VMD用于将原始日径流序列分解为离散的固有模态函数(IMFs),以产生具有相似特征的信号作为模型输入。
VMD是根据输入信号的频域特性自适应分解为k个离散的固有模态函数(IMFs),uk。IMFs是调幅调频(AM-FM)信号,表示如下:
uk(t)=Ak(t)cos(φk(t))
式中:Ak(t)和φk(t)分别为瞬时幅值和瞬时相位。相位φk(t)为非减函数,瞬时角频率ωk(t)=φ′k(t)。
为了获得每个模态函数uk的带宽,构建如下约束变分模型:
式中δ(t)为冲击函数,ωk为第k个IMF分量的中心频率, 为uk(t)的希尔伯特变换。
其中,约束变分模型的最优解通过交替方向乘子算法(alternate directionmethod of multipliers,ADMM)进行求解,最终得到IMFs分量。
VMD分解虽具有较好的分解效果,但存在确定分解层数k的不确定性问题,因此,本发明采用排列熵优化算法(permutation entroy optimization,PEO)实现分解层数k的自适应确定。该算法可以根据待分解信号的特点自适应的确定分解层数k;该算法的原理是对原始信号分解得到的每层固有模态函数进行排列熵的计算,由于异常分量具有随机性,所以其排列熵值远大于正常分量,因此设定排列熵的阈值Hp后,通过判断分解结果中每层IMF的排列熵是否大于阈值Hp,从而判断分解结果中是否有异常分量。其中,排列熵阈值Hp取0.6。
该算法的具体步骤如下:
(1)设定k的初始值为2,排列熵的阈值取经验值0.6;
(2)采用VMD算法对原始信号进行分解,得到k个固有模态函数IMFi(t)(i=1~k);
(3)计算分解结果中每个IMF的排列熵pei(i=1~k);
(4)判断pei是否大于阈值0.6,若是,说明分解结果出现了过分解,导致出现异常分量,停止循环,进入步骤(5);若不是,则说明未出现过分解,原始信号还需要加大分解层数,即令k=k+1,返回步骤(2),根据更新后的k值,继续对原始信号进行VMD分解。
(5)令k=k-1,输出最优k,采用VMD算法对序列进行最终的分解,得到k个IMFs。
步骤二:参数优化
众所周知,输入步长、隐层节点数和学习率等关键参数对LSTM模型的预测性能有很大影响。为了找出时间滞后对当前t时段径流的影响,采用偏自相关函数(PACF)确定LSTM模型的输入步长;而隐层节点数(HN)和权值系数的学习率(α)则直接影响着LSTM网络的输出,因此,利用PSO优化HN和α。
(1)输入步长的确定
偏自相关函数(PACF)确定LSTM模型的输入步长是通过分析偏自相关图确定输入变量,即对应于滞后长度的PACF图来确定。具体而言,假设输出变量为xi,在滞后k的PACF超出95%置信区间的情况下,前k个变量即为输入变量。
对于径流序列,滞后k处的协方差γk值为:
式中为径流序列的平均值,M=n/4为最大滞后系数,k为自相关函数的滞后长度,ρk可以表示为:
基于协方差公式,滞后k(k=1,2,…,M)处的PACFfkk可表示为:
根据各IMF序列的PACF值,分析各IMF中数据之间的相关性,并通过相关性选择各预测模型的最优输入步长。
(2)隐层节点数(HN)和学习率(α)的确定
利用PSO算法优化参数的过程如下:
1.初始化粒子群
由给定的种群规模、速度区间和搜索空间,初始化种群所有粒子的位置[X1,X2,X3,···,XN]和速度[V1,V2,V3,···,VN],其中N为种群规模。初始的位置和速度都是一定范围内的随机值。每个粒子的位置Xi是由隐层节点数和学习率组成的二维向量(HNi,αi),i为第i个粒子。
2.计算每个粒子当前位置的适应度(fitness),并找到全局和局部最优位置
分别用每个粒子位置Xi=(HNi,αi)中包含的参数,构建LSTM网络模型。将训练集输入LSTM网络进行计算,使用RSME作为适应度函数,计算公式如下:
其中N是训练集的数据个数,Yi(n)是LSTM网络第n个训练观测值的训练输出,Yo(n)是第n个观测值的实际观测值。这里适应度越小就意味着该粒子的位置越好。
计算每一个粒子对应的适应度,并记录粒子i历史上适应度最小时的位置即个体极值,记为pbesti。以及所有粒子历史上适应度最小时的位置即全局极值,记为gbest。
3.更新每个个体的位置和速度
使用以下公式进行粒子位置和速度的更新:
Vi=ω×Vi+c1×rand×(pbesti-Xi)+c2×rand×(gbest-Xi)
Xi=Xi+Vi
在上述公式中,rand:介于0到1的随机数;c1,c2是学习因子,一般取c1=c2=2;ω为惯性因子,一般取ω=0.6。特别的,Vi的最大值为Vmax(速度边界),若Vi大于Vmax,则Vi=Vmax。
4.重复2,3两步,直到精度达到要求或达到最大迭代次数。
5.此时的全局最优位置gbest=(HNbest,αbest),即为PSO输出的最优参数。
步骤三:网络训练
使用步骤二得到的最优参数(HNbest,αbest)和输入步长建立LSTM网络。将分解后的IMF分量数据按下式进行归一化处理(由于径流序列具有高度非线性和非平稳性,因此必须对输入数据进行归一化,以避免训练过程中数据出现大的波动),变为[0,1]区间的数。之后,根据构建网络的相关参数,对数据进行格式化。最后将格式化后的数据输入网络进行训练。
式中:xmaxandxmin分别为IMF数据中的最大值和最小值。
步骤四:预测
将步骤三训练的LSTM模型作为预测工具,每个分解的IMF对应一个LSTM预测模型。通过对模型IMFs的预测结果进行求和,得到最终的预测结果。
步骤五:模型精度评估
利用Nash Sutcliffe效率系数(NSE)、均方根误差(RMSE)和相关系数(R)对预测模型精度进行评价。NSE是一个归一化的统计量,计算剩余方差与实测值方差的相对大小。NSE取值为负无穷至1,NSE接近1,表示模型质量好,可信度高。
NSE、R和RMSE统计量的表达如下:
式中:Oi是实测值,Pi是模拟值,是实测平均值,/>为模拟值均值,n为实测值的个数。NSE>0.5,Re<±25%,则模型精度满足要求。NSE、R的值越接近于1时,其模拟结果越精确。
本发明本发明针对变异条件下的径流序列的非线性、非平稳特性,提出一种变化环境下的短期径流智能预报混合模型方法,即变分模态分解-长短期记忆网络混合模型(VMD-LSTM-PSO)。改进的VMD分解具有自适应性和强降噪性能,在利用VMD分解方法进行数据预处理时,可以生成更清晰的信号作为模型输入,能精确地分辨和识别径流过程的周期性、趋势性和随机性等特征;LSTM-PSO算法不仅继承了LSTM算法的优点,而且利用PSO算法优化了模型网络参数,能有效提高预测模型的参数迭代速度,避免陷入局部最优;总而言之,VMD-LSTM-PSO混合模型克服了传统RNN学习长期依赖关系的缺点,具有较强的非线性预测能力,能够捕获时间序列的长期相关性,收敛速度快,是一种精度较高且行之有效的日径流预测方法,且模型预测结果可为防洪规划、水库调度和水资源配置等水资源规划管理活动提供可靠依据。
附图说明
图1为变化环境下水文时间序列VLP预测模型方法流程图;
图2为PSO算法流程图;
图3为基于PACF法的利津站输入步长识别图;
图4为以利津站为例的VMD分解各分量预测结果图
图5为以利津站为例的VMD-LSTM-PSO最终预测结果图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1-3所示,本发明的适用于变化环境下的短期径流智能预报混合模型方法,其处理步骤,包括以下几个阶段:
第一阶段,使用改进的VMD算法将原始的径流序列分解成k个IMFs,使得原序列变成多个更加稳定的子序列;第二阶段,采用偏自相关函数(PACF)确定LSTM模型的输入步长,并使用PSO算法对LSTM网络的多个参数进行优化(主要有LSTM隐层节点数、学习率)。第三阶段,使用优化得出的参数建立网络,并使用相应的子序列数据进行网络的训练。第四阶段,使用训练好的网络,对子序列进行预测。最后,对各IMFs分量的预测结果求和,即可得到最终结果。
下面以头道拐站、龙门站、花园口站及利津站为例详述本发明。主要步骤如下:
步骤一:分解
VMD用于将原始日径流序列分解为离散的固有模态函数(IMFs),以产生具有相似特征的信号作为模型输入。
VMD方法根据输入信号的频域特性自适应分解为k个离散的固有模态函数(IMFs),uk。IMFs是调幅调频(AM-FM)信号,表示如下:
uk(t)=Ak(t)cos(φk(t))
式中:Ak(t)和φk(t)分别为瞬时幅值和瞬时相位。相位φk(t)为非减函数,瞬时角频率ωk(t)=φ′k(t)。
为了获得每个模态函数uk的带宽,构建如下约束变分模型:
式中δ(t)为冲击函数,ωk为第k个IMF分量的中心频率, 为uk(t)的希尔伯特变换。
其中,约束变分模型的最优解通过交替方向乘子算法(alternate directionmethod of multipliers,ADMM)进行求解,最终得到IMFs分量。
为了能够自适应地确定分解层数k,本发明使用排列熵优化算法(permutationentroy optimization,PEO),该算法可以根据待分解信号的特点自适应的确定分解层数k;该算法的原理是对原始信号分解得到的每层固有模态函数进行排列熵的计算,由于异常分量具有随机性,所以其排列熵值远大于正常分量,因此设定排列熵的阈值Hp后,通过判断分解结果中每层IMF的排列熵是否大于阈值Hp,从而判断分解结果中是否有异常分量。其中,排列熵阈值Hp取0.6。
该算法的具体步骤如下:
(1)设定k的初始值为2,排列熵的阈值取经验值0.6;
(2)采用VMD算法对原始信号进行分解,得到k个固有模态函数IMFi(t)(i=1~k);
(3)计算分解结果中每个IMF的排列熵pei(i=1~k);
(4)判断pei是否大于阈值0.6,若是,说明分解结果出现了过分解,导致出现异常分量,停止循环,进入步骤(5);若不是,则说明未出现过分解,原始信号还需要加大分解层数,即令k=k+1,返回步骤(2),根据更新后的k值,继续对原始信号进行VMD分解。
(5)令k=k-1,输出最优k,采用VMD算法对序列进行最终的分解,得到k个IMFs。
以头道拐1954-2006、龙门1956-2005、花园口1957-2012及利津站1950-2014年日径流序列为研究对象,采用所述改进的VMD方法和排列熵优化算法分别对头道拐年、龙门、花园口及利津站的日径流序列进行分解,可自适应得到k个分量。头道拐、龙门、花园口及利津站VMD分解所得IMFs数如表1所示(黄河干流四个测站日径流VMD分解结果统计),其中,以利津站为例其分解结果如图4所示。
表1
步骤二:参数优化
众所周知,输入步长、隐层节点数和学习率等关键参数对LSTM模型的预测性能有很大影响。为了找出时间滞后对当前t时段径流的影响,采用偏自相关函数(PACF)确定LSTM模型的输入步长;而隐层节点数(HN)和权值系数的学习率(α)则直接影响着LSTM网络的输出,因此,利用PSO优化HN和α。
(1)输入步长的确定
偏自相关函数(PACF)确定LSTM模型的输入步长是通过分析偏自相关图确定输入变量,即对应于滞后长度的PACF图来确定。具体而言,假设输出变量为xi,在滞后k的PACF超出95%置信区间的情况下,前k个变量即为输入变量。
对于径流序列,滞后k处的协方差γk值为:
式中为径流序列的平均值,M=n/4为最大滞后系数,k为自相关函数的滞后长度,ρk可以表示为:
基于协方差公式,滞后k(k=1,2,…,M)处的PACFfkk可表示为:
根据各IMF序列的PACF值,分析各IMF中数据之间的相关性,并通过相关性选择各预测模型的最优输入步长。
利津站的PACF图如图3所示,各测站输入、输出变量汇总于表2(各测站输入步长优化)。
表2
(2)隐层节点数(HN)和学习率(α)的确定
利用PSO算法优化参数的过程如下:
1.初始化粒子群
由给定的种群规模、速度区间和搜索空间,初始化种群所有粒子的位置[X1,X2,X3,···,XN]和速度[V1,V2,V3,···,VN],其中N为种群规模。初始的位置和速度都是一定范围内的随机值。每个粒子的位置Xi是由隐层节点数和学习率组成的二维向量(HNi,αi),i为第i个粒子。
2.计算每个粒子当前位置的适应度(fitness),并找到全局和局部最优位置
分别用每个粒子位置Xi=(HNi,αi)中包含的参数,构建LSTM网络模型。将训练集输入LSTM网络进行计算,使用RSME作为适应度函数,计算公式如下:
其中N是训练集的数据个数,Yi(n)是LSTM网络第n个训练观测值的训练输出,Yo(n)是第n个观测值的实际观测值。这里适应度越小就意味着该粒子的位置越好。
计算每一个粒子对应的适应度,并记录粒子i历史上适应度最小时的位置即个体极值,记为pbesti。以及所有粒子历史上适应度最小时的位置即全局极值,记为gbest。
3.更新每个个体的位置和速度
使用以下公式进行粒子位置和速度的更新:
Vi=ω×Vi+c1×rand×(pbesti-Xi)+c2×rand×(gbest-Xi)
Xi=Xi+Vi
在上述公式中,rand:介于0到1的随机数;c1,c2是学习因子,一般取c1=c2=2;ω为惯性因子,一般取ω=0.6。特别的,Vi的最大值为Vmax(速度边界),若Vi大于Vmax,则Vi=Vmax。
4.重复2,3两步,直到精度达到要求或达到最大迭代次数。
5.此时的全局最优位置gbest=(HNbest,αbest),即为PSO输出的最优参数。
基于步骤二分解结果,建立每个分量的LSTM-PSO预测模型。最终确定模型输入层节点数等于输入变量数,隐藏层数为2,输出层节点数为1。
步骤三:网络训练
使用步骤二得到的最优参数(HNbest,αbest)和输入步长建立LSTM网络。将分解后的IMF分量数据按下式进行归一化处理(由于径流序列具有高度非线性和非平稳性,因此必须对输入数据进行归一化,以避免训练过程中数据出现大的波动),变为[0,1]区间的数。之后,根据构建网络的相关参数,对数据进行格式化。最后将格式化后的数据输入网络进行训练。
式中:xmaxandxmin分别为IMF数据中的最大值和最小值。
步骤四:预测
将步骤三训练的LSTM模型作为预测工具,每个分解的IMF对应一个LSTM预测模型。通过对模型IMFs的预测结果进行求和,得到最终的预测结果。
基于上述VMD-LSTM-PSO模型对头道拐、龙门、花园口、利津站的日径流进行预见期为1天的预测。即基于VMD分解结果,将t时刻数据作为输出,t时刻之前数据(取决于输入步长)作为输入构建每个IMFs的LSTM-PSO预测模型。最后,对各IMFs分量的预测结果求和,即可得到最终结果。并选用NashSutcliffe效率系数(NSE)、均方根误差(RMSE)和相关系数(R)对预测模型精度进行评价。
预测模型中,将日径流数据分为训练集和验证集两部分,本发明选用后三年的数据进行验证,其余用于训练。利津站各分量预测结果及最终预测结果如图4和图5所示。各测站预测结果汇总于表3。
表3
步骤五:预测结果分析
分析图4、图5和表3可知,各测站预测精度均较高,且序列分解后的预测效果远优于未分解序列的预测效果,说明通过信号分解技术产生更清晰的信号输入有助于提高模型精度。
头道拐站未分解序列预测精度为:NSE=0.9383、RMSE=76.9076、R=0.9715;分解后预测精度为:NSE=0.9857、RMSE=37.022、R=0.9931。
龙门站未分解序列预测精度为:NSE=0.7445、RMSE=161.1504、R=0.8718;分解后预测精度为:NSE=0.8743、RMSE=113.0444、R=0.9449。
花园口站未分解序列预测精度为:NSE=0.9204、RMSE=210.4759、R=0.9598;分解后预测精度为:NSE=0.976、RMSE=115.5117、R=0.99。
利津站未分解序列预测精度为:NSE=0.9676、RMSE=132.9087、R=0.985;分解后预测精度为:NSE=0.9942、RMSE=56.3752、R=0.9972。
其中,龙门站的预测结果较差应归因于黄河中游复杂的下垫面条件。龙门站位于黄土高原,水土流失严重,日径流变化规律更为复杂。
本发明针对气候变化和人类活动双重影响下的水文系统(变异条件下的径流序列的非线性、非平稳特性),提出一种变化环境下水文时间序列VLP预测模型方法,即变分模态分解-长短期记忆网络混合模型(VMD-LSTM-PSO)。改进的VMD分解具有自适应性和强降噪性能,在利用VMD分解方法进行数据预处理时,可以生成更清晰的信号作为模型输入,较为精确地分辨和识别径流过程的周期性、趋势性和随机性等特征;LSTM-PSO算法不仅继承了LSTM算法的优点,而且利用PSO算法优化了模型网络参数,能有效提高预测模型的参数迭代速度,避免陷入局部最优。
总而言之,VMD-LSTM-PSO混合模型克服了传统RNN学习长期依赖关系的缺点,具有较强的非线性预测能力,能够捕获时间序列的长期相关性,收敛速度快,是一种精度较高且行之有效的日径流预测方法,且模型预测结果可为防洪规划、水库调度和水资源配置等水资源规划管理活动提供可靠依据。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (3)
1.适用于变化环境下的短期径流智能预报混合模型方法,其特征在于,包括步骤:
第一阶段.使用改进的VMD算法将原始的径流序列分解成k个固有模态函数IMFs,使得原序列变成多个更加稳定的子序列;
第二阶段.采用偏自相关函数PACF确定LSTM模型的输入步长,并使用PSO算法对LSTM网络的隐层节点数HN和学习率α进行优化;
第三阶段.使用优化得出的参数建立LSTM网络,并使用相应的子序列数据进行网络的训练;
第四阶段.使用训练好的网络作为预测工具,对子序列进行预测,每个分解的固有模态函数IMF对应一个LSTM预测模型;
第五阶段.对各IMFs分量的预测结果求和,即可得到最终结果;
所述第一阶段的步骤如下:
(1)设定k的初始值为2,排列熵的阈值取经验值0.6;
(2)采用VMD算法对原始信号进行分解,得到k个固有模态函数IMFi(t),i=1~k;
(3)计算分解结果中每个IMF的排列熵pei,i=1~k;
(4)判断pei是否大于阈值0.6,若是,停止循环,进入步骤(5);若不是,则令k=k+1,返回步骤(2),根据更新后的k值,继续对原始信号进行VMD分解;
(5)令k=k-1,输出最优k,采用VMD算法对序列进行最终的分解,得到k个IMFs;偏自相关函数PACF确定LSTM模型的输入步长是通过分析偏自相关图确定输入变量,即对应于滞后长度的PACF图来确定;假设输出变量为xi,在滞后k的PACF超出95%置信区间的情况下,前k个变量即为输入变量;
对于径流序列,滞后k处的协方差γk值为:
式中,为径流序列的平均值,M=n/4为最大滞后系数,k为自相关函数的滞后长度,ρk表示为:
基于协方差公式,滞后k(k=1,2,…,M)处的PACF fkk表示为:
根据各IMF序列的PACF值,分析各IMF中数据之间的相关性,并通过相关性选择各预测模型的最优输入步长;
隐层节点数HN和学习率α的确定步骤如下:
(1).初始化粒子群
由给定的种群规模、速度区间和搜索空间,初始化种群所有粒子的位置[X1,X2,X3,···,XN]和速度[V1,V2,V3,···,VN],其中N为种群规模,初始的位置和速度都是一定范围内的随机值,每个粒子的位置Xi是由隐层节点数和学习率组成的二维向量(HNi,αi),i为第i个粒子;
(2).计算每个粒子当前位置的适应度fitness,并找到全局和局部最优位置;
分别用每个粒子位置xi=(HNi,αi)中包含的参数,构建LSTM网络模型;将训练集输入LSTM网络进行计算,使用RSME作为适应度函数,计算公式如下:
其中N是训练集的数据个数,Yi(n)是LSTM网络第n个训练观测值的训练输出,Yo(n)是第n个观测值的实际观测值;
计算每一个粒子对应的适应度,并记录粒子i历史上适应度最小时的位置即个体极值,记为pbesti,以及所有粒子历史上适应度最小时的位置即全局极值,记为gbest;
(3).更新每个个体的位置和速度
使用以下公式进行粒子位置和速度的更新:
Vi=ω×Vi+c1×rand×(pbesti-Xi)+c2×rand×(gbest-Xi),
Xi=Xi+Vi,
上述公式中,rand:介于0到1的随机数;c1,c2是学习因子,c1=c2=2;ω为惯性因子,ω=0.6,Vi的最大值为Vmax,若Vi大于Vmax,则Vi=Vmax,
(4).重复(2),(3)两步,直到精度达到要求或达到最大迭代次数;
(5).此时的全局最优位置gbest=(HNbest,αbest),即为PSO输出的最优参数。
2.根据权利要求1所述适用于变化环境下的短期径流智能预报混合模型方法,其特征在于,LSTM网络训练的步骤如下:
使用得到的最优参数(HNbest,αbest)和输入步长建立LSTM网络,将分解后的IMF分量数据按下式进行归一化处理,变为[0,1]区间的数;之后根据构建网络的相关参数对数据进行格式化;最后将格式化后的数据输入网络进行训练;
式中:xmaxand xmin分别为IMF数据中的最大值和最小值。
3.根据权利要求2所述适用于变化环境下的短期径流智能预报混合模型方法,其特征在于,LSTM预测模型训练好后,进一步包括如下的模型评价步骤:
利用Nash Sutcliffe效率系数NSE、均方根误差RMSE和相关系数R对预测模型精度进行评价;NSE、R和RMSE统计量的表达如下:
式中,Oi是实测值,Pi是模拟值,是实测平均值,/>为模拟值均值,n为实测值的个数,NSE>0.5,Re<±25%,则模型精度满足要求,NSE、R的值越接近于1时,其模拟结果越精确。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010408229.4A CN111695290B (zh) | 2020-05-14 | 2020-05-14 | 一种适用于变化环境下的短期径流智能预报混合模型方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010408229.4A CN111695290B (zh) | 2020-05-14 | 2020-05-14 | 一种适用于变化环境下的短期径流智能预报混合模型方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111695290A CN111695290A (zh) | 2020-09-22 |
CN111695290B true CN111695290B (zh) | 2024-04-09 |
Family
ID=72477702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010408229.4A Active CN111695290B (zh) | 2020-05-14 | 2020-05-14 | 一种适用于变化环境下的短期径流智能预报混合模型方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111695290B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112668611B (zh) * | 2020-12-08 | 2024-02-02 | 湖南工业大学 | 一种基于Kmeans和CEEMD-PE-LSTM的短期光伏发电功率预测方法 |
CN113361777B (zh) * | 2021-06-08 | 2023-11-03 | 淮阴工学院 | 基于vmd分解和ihho优化lstm的径流预测方法及系统 |
CN113468810A (zh) * | 2021-07-01 | 2021-10-01 | 天行智控(成都)科技有限公司 | 一种智能地板感知室内摔倒预测模型及其建立方法 |
CN114169590B (zh) * | 2021-11-22 | 2024-05-28 | 华中科技大学 | 一种基于多情景划分的水库入库径流预报校正方法和系统 |
CN117113808B (zh) * | 2023-07-20 | 2024-05-10 | 武汉大学 | 一种全球气候模式耦合水文模型模拟的处理方法及系统 |
CN117332908B (zh) * | 2023-12-01 | 2024-02-13 | 长江水利委员会水文局 | 一种耦合集合预报的梯级水库多目标优化调度方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018072351A1 (zh) * | 2016-10-20 | 2018-04-26 | 北京工业大学 | 一种基于粒子群优化算法对支持向量机的优化方法 |
CN109615011A (zh) * | 2018-12-14 | 2019-04-12 | 河海大学 | 一种基于lstm的中小河流短期洪水预报方法 |
CN110288157A (zh) * | 2019-06-27 | 2019-09-27 | 电子科技大学 | 一种基于注意力机制和lstm的径流预测方法 |
CN110895772A (zh) * | 2019-11-11 | 2020-03-20 | 国网浙江省电力有限公司宁波供电公司 | 基于灰色关联分析与SA-PSO-Elman算法结合的售电量预测方法 |
CN110969312A (zh) * | 2019-12-23 | 2020-04-07 | 长江水利委员会水文局 | 基于变分模态分解和极端学习机的短期径流预测耦合方法 |
CN111027775A (zh) * | 2019-12-12 | 2020-04-17 | 中国长江三峡集团有限公司 | 基于长短期记忆网络的梯级水电站发电量预测方法 |
-
2020
- 2020-05-14 CN CN202010408229.4A patent/CN111695290B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018072351A1 (zh) * | 2016-10-20 | 2018-04-26 | 北京工业大学 | 一种基于粒子群优化算法对支持向量机的优化方法 |
CN109615011A (zh) * | 2018-12-14 | 2019-04-12 | 河海大学 | 一种基于lstm的中小河流短期洪水预报方法 |
CN110288157A (zh) * | 2019-06-27 | 2019-09-27 | 电子科技大学 | 一种基于注意力机制和lstm的径流预测方法 |
CN110895772A (zh) * | 2019-11-11 | 2020-03-20 | 国网浙江省电力有限公司宁波供电公司 | 基于灰色关联分析与SA-PSO-Elman算法结合的售电量预测方法 |
CN111027775A (zh) * | 2019-12-12 | 2020-04-17 | 中国长江三峡集团有限公司 | 基于长短期记忆网络的梯级水电站发电量预测方法 |
CN110969312A (zh) * | 2019-12-23 | 2020-04-07 | 长江水利委员会水文局 | 基于变分模态分解和极端学习机的短期径流预测耦合方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111695290A (zh) | 2020-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695290B (zh) | 一种适用于变化环境下的短期径流智能预报混合模型方法 | |
Nayak et al. | Fuzzy computing based rainfall–runoff model for real time flood forecasting | |
Jayawardena et al. | Noise reduction and prediction of hydrometeorological time series: dynamical systems approach vs. stochastic approach | |
Najafi et al. | Statistical downscaling of precipitation using machine learning with optimal predictor selection | |
Chawla et al. | Modeling spatial dependencies for mining geospatial data | |
Chiu | A cluster estimation method with extension to fuzzy model identification | |
CN108509935B (zh) | 一种基于随机森林算法的雷达工作模式识别方法 | |
CN115688579B (zh) | 一种基于生成对抗网络的流域多点水位预测预警方法 | |
Akbari et al. | Clustered K nearest neighbor algorithm for daily inflow forecasting | |
CN113392961A (zh) | 中尺度涡轨迹平稳序列提取与循环神经网络预测方法 | |
Sharma et al. | Rainfall prediction using neural network | |
CN104239489A (zh) | 利用相似性搜索和改进bp神经网络预测水位的方法 | |
CN112288193A (zh) | 基于注意力机制的gru深度学习的海洋站表层盐度预测方法 | |
Ismail et al. | A hybrid model of self organizing maps and least square support vector machine for river flow forecasting | |
Seo et al. | Multistep-ahead flood forecasting using wavelet and data-driven methods | |
US6317730B1 (en) | Method for optimizing a set of fuzzy rules using a computer | |
CN111507505A (zh) | 一种水库日入量预测模型的构建方法 | |
Chaturvedi | Rainfall Prediction using Back-Propagation Feed Forward Network | |
CN115618720A (zh) | 一种基于海拔高度的土壤盐渍化预测方法及系统 | |
CN117669008B (zh) | 一种基于深度学习的地基沉降预测方法及系统 | |
Costa et al. | Enhancing the accuracy of metocean hindcasts with machine learning models | |
CN117808214A (zh) | 水利工程数据分析系统 | |
Arroyo et al. | Exponential smoothing methods for interval time series | |
CN113191526A (zh) | 一种基于随机敏感度的短期风速区间多目标优化预测方法及系统 | |
CN117009758A (zh) | 一种基于pso-vmd-lstm的油井产量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |