CN116739168A - 一种基于灰色理论与编解码器的径流量预测方法 - Google Patents
一种基于灰色理论与编解码器的径流量预测方法 Download PDFInfo
- Publication number
- CN116739168A CN116739168A CN202310699340.7A CN202310699340A CN116739168A CN 116739168 A CN116739168 A CN 116739168A CN 202310699340 A CN202310699340 A CN 202310699340A CN 116739168 A CN116739168 A CN 116739168A
- Authority
- CN
- China
- Prior art keywords
- data
- runoff
- modal
- follows
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 22
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 11
- 238000011176 pooling Methods 0.000 claims abstract description 10
- 238000011160 research Methods 0.000 claims abstract description 9
- 238000010219 correlation analysis Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000002596 correlated effect Effects 0.000 claims abstract description 4
- 238000005259 measurement Methods 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 18
- 230000000875 corresponding effect Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000002441 reversible effect Effects 0.000 claims description 6
- 230000008901 benefit Effects 0.000 claims description 5
- 238000001704 evaporation Methods 0.000 claims description 3
- 230000008020 evaporation Effects 0.000 claims description 3
- 238000001556 precipitation Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000001932 seasonal effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于灰色理论与编解码器的径流量预测方法,包括如下步骤:从水文中心获取研究地区某一年的实测径流量数据和天气数据,并对数据进行预处理;用变分模态分解算法将预处理好的综合径流量序列数据分解成k个不同的模态分量;对模态分量进行灰色关联分析,得出各模态分量序列与径流量数据的关联度并排序,去除弱相关和不相关的模态分量,将其余分量重构得到去噪序列输入模型训练;采用Informer编码器提取全局特征;采用双向LSIM模块作为解码器提取数据间的局部特征,最后采用全局平均池化技术,得到最终的径流量预测结果。
Description
技术领域
本发明涉及基于深度学习的径流量预测领域,具体涉及一种基于灰色理论与编解码器的径流量预测方法。
背景技术
河川径流作为河流水文研究的重要内容,由于受到降雨、气候、人类生产活动等各种因素的影响,表现出随机性、不确定性、非线性的特点,这使得精准的预测径流量变得更加困难,为流域水库优化调度带来难题。精准的径流量预测对提高经济效益、流域水库优化调度、开展防洪抗旱工作以及保护人民的生命财产安全有重要意义。因此,寻找更加准确的径流量预测方法具有现实研究价值,应得到广泛重视。
由于径流时间序列具有复杂特性,使用单一的时间序列预测模型无法准确预测径流量,拟合效果较差。因此,综合使用多种模型进行径流量预测的方法被提出来。其中,基于数据分解的混合预测方法在径流量预测方面取得了较好的效果,通过采用分解技术对径流量数据进行分解处理,然后对分解后的子序列建立合适的模型进行径流量预测。分解技术的核心影响因素是如何确定分解后的模态分量个数,获取去噪序列,这对径流量预测结果有重要影响。目前,基于时频分析的分解技术被广泛应用于分解径流量序列数据,该技术在分解过程中由于噪声对分解的影响,使得在径流量序列特征提取过程中存在精度损失的问题。对分解后重构的序列采用长短期记忆网络建模具有较好的效果,然而,对于较长的输入序列,单独使用该网络设计模型预测效果有限。
发明内容
发明目的:为了克服现有技术中存在的不足,提供一种基于灰色理论与编解码器的径流量预测方法,主要利用灰色关联分析降低变分模态分解径流量序列时造成的精度损失问题,从而得到去噪序列,然后通过Informer编码器提取径流量序列的全局特征,采用双向LSTM模块提取局部特征,提高了径流量预测的准确性。
技术方案:为实现上述目的,本发明提供一种基于灰色理论与编解码器的径流量预测方法,包括如下步骤:
S1:从水文中心获取研究地区某一年的实测径流量数据和天气数据,并对数据进行预处理;
S2:用变分模态分解算法将预处理好的综合径流量序列数据分解成k个不同的模态分量;
S3:对模态分量进行灰色关联分析,得出各模态分量序列与径流量数据的关联度并排序,去除弱相关和不相关的模态分量,将其余分量重构得到去噪序列输入模型训练;
S4:采用Informer编码器提取全局特征;
S5:采用双向LSTM模块作为解码器提取数据间的局部特征,最后采用全局平均池化层得到最终的径流量预测结果。
进一步地,所述步骤S1中预处理的具体操作为:
S11:从水文中心获取研究地区某一年年初到年末的实测径流量数据和天气数据,天气数据包括降水量、蒸发量,采集频率为1小时;
S12:对采集到的原始数据采用具有季节性调整的线性插值法处理离散值与缺失值,并进行标准化处理,其公式为:
其中,x为原始数据,μ为原始数据均值,σ为原始数据标准差,N为标准差处理之后的数据;
S13:将经过预处理之后的天气数据(D)和径流量数据(S)通过时间相关性整合,得到一个新的综合径流量序列矩阵Z(t)=[S(t),D(t)]H。
进一步地,所述步骤S2的具体操作为:
S21:变分模态分解算法将预处理好的径流量序列数据分解成k个模态分量,可以通过求解变分问题来提取模态分量,其公式为:
其中,uk为分解得到的k个模态分量(IMF),wk为各个模态分量对应的中心频率,为偏微分符号,j为虚数单位,t为时间序列,*为卷积符号,δ(t)为平均冲激函数,||||2为二范式函数,s.t.为约束条件,Z(t)为预处理好的径流量数据;
S22:为了确定径流量序列数据的对应模态分量的带宽,利用二次惩罚项和拉格朗日乘子法的优势,将约束变分问题转变为非约束变分问题,其公式为:
其中,L为拉格朗日函数,λ为拉格朗日乘子,α为二次惩罚因子,其决定了模态分量的带宽;
再将两个参数使用交替方向乘子法迭代搜索,其公式为:
其中,ω为频率,为维纳滤波,/>分别为Z(t)、ui(t)、λ(t)对应的傅里叶变换,/>为模态函数功率谱重心;
最终径流量数据被分解成K个时间子序列,即Z(t)=IMF1+IMF2+…+IMFk。
进一步地,所述步骤S3的具体操作为:
S31:为了简化计算,将分解得到的k个模态分量分别进行归一化处理,将数据映射到[0,1]之间,以某个模态分量里的一段时间序列数据为例,将数据记为IMFi=[IMFi(1),IMFi(2),...IMFi(n)],其公式为:
其中,yIMFi(j)为归一化后的数据,IMFi(j)为模态分量里原始的时间序列数据,IMFi.min为数据的最小值,IMFi.max为数据的最大值,归一化处理后的模态分量序列数据记为YIMF=[yIMF1,yIMF2,...yIMFk]T;
S32:逐个计算每个模态分量里的数据与预处理好的径流量序列中对应数据的绝对值差,以第i个模态分量yIMFi为例,其公式为|yIMFi(j)-sj|;
S33:计算模态分量里的各个数据与预处理好的径流量序列数据的关联系数,其公式为:
其中,ρ为分辨系数,一般取值为0.5,miniminj|yIMFi(j)-sj|与maximaxj|yIMFi(j)-sj|分别为两级最小极差,两级最大极差;
S34:计算各模态分量的灰色关联度,其公式为:
其中,ri为第i个模态分量对预处理好的径流量序列的灰色关联度;
S35:根据各模态的灰色关联度进行排序,选择前百分之80的模态分量重构得到去噪序列P;
其中P=∑yIMFi i=1,2,...q,q为满足的模态分量数。
进一步地,所述步骤S4的具体操作为:
S41:通过一维卷积将序列P中的数据元素投影成维度为512的数据,并对数据进行位置编码,防止数据输入模型后位置关系丢失;
S42:向量输入到Informer Encoder中的ProbSparse Self-attention Block,计算输入的径流量序列的权重系数并构成稀疏矩阵,最终选择前25个查询向量,从而减少了注意力权重的数量和降低计算复杂度;
S43:将经过稀疏自注意力计算得到的输出向量进行多头拼接并通过线性层输出,接着通过最大池化操作进行下采样,网络维度减半,进一步减少模型参数的数量;
S44:堆叠模块最终输出值得重点关注的特征向量y。
进一步地,所述步骤S42中ProbSparse Self-attention具体过程为:
ProbSparse Self-attention是对Self-attention基于KL散度改进得到的,为每个Query随机采样部分Key并计算稀疏性得分,根据稀疏性得分选出其中前25个Queries,仅仅计算这u个Queries与Key的点积结果,从而得到注意力权重。对于剩下的Query将自注意层的输入取均值作为输出,这使得每个ProbSparse Self-attention层的输入输出长度保持一致,其公式为:
其中,Q、K、V为经过线性转换后Query、Key、Value这三个矩阵,为25个Queries,Softmax为激活函数。
进一步地,所述步骤S5的具体操作为:
S51:将S4输出的全局特征向量y输入到双向LSTM模型中,双向LSTM通过两个独立的隐藏层对序列数据进行正向和反向处理,分别得到状态变量和/>其公式为:
其中,为正向LSTM隐藏层的状态变量,/>为反向LSTM隐藏层的状态变量,/>为级联操作;
S52:在输出层中采用全局平均池化层捕获序列的重要特征,降低模型的维度,最终输出的径流量预测结果。
进一步地,所述步骤S51中LSTM的具体操作为:
S511:遗忘门ft决定了记忆单元该丢弃哪些信息,遗忘门读取上一隐藏层的值ht-1与输入值yt,随后输出一个在0到1之间的向量,其公式为:
ft=σ(Wf·[ht-1,yt]+bf)
其中,bf为偏置值,Wf为权重,σ为sigmoid激活函数;
S512:输入门it决定记忆单元添加哪些新信息,将输入值yt和前一隐藏层的信息ht-1传递到sigmoid激活函数中,输出一个与ft取值范围一样的向量it,然后利用输入值yt和前一隐藏层的信息ht-1通过tanh激活函数输出一个新的状态值其公式为:
it=σ(Wi·[ht-1,yt]+bi)
其中,Wi为权重,WC为tanh层的权重,bi为偏置值,bC为tanh层的偏置值;
S513:更新记忆单元状态,其公式为:
其中,Ct-1*ft为前一层的细胞状态与遗忘向量相乘,确定从Ct-1中遗忘的信息;为将sigmoid的输出值与tanh的输出值相乘,确定记忆单元添加的信息;
S514:输出门ot用来确定下一隐藏层输入的信息,首先将输入值yt和前一隐藏层的信息ht-1送入激活函数sigmoid,然后对更新的记忆单元信息ct使用激活函数tanh,最后将两个激活函数值相乘得出当前隐藏层的状态变量ht,其公式为:
ot=σ(WO·[ht-1,yt]+bO)
ht=ot*tanh(Ct)
其中,ot为当前时刻的记忆单元状态,WO为权重,bO为偏置值。
有益效果:本发明与现有技术相比,具备如下优点:
1、在特征提取之前利用灰色关联分析筛选经过变分模态分解得到的模态分量,避免了过度分解或分解不足,从而提高了预测的准确性。
2、采用Informer编码器可以从稀疏特征注意矩阵中自适应的识别和选择影响径流量的主要特征,降低了计算复杂度。
3、相比于Informer解码器一步生成预测结果,采用双向LSTM模型作为解码器能够学习数据内部的变化规律,增强特征图的局部依赖性,提取数据间的局部特征,从而输出更加准确的径流量预测结果。
附图说明
图1为本发明方法的流程示意图。
图2为本发明方法中Informer编码器的示意图。
图3为本发明方法中双向LSTM解码器的示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供一种基于灰色理论与编解码器的径流量预测方法,如图1所示,其包括如下步骤:
S1:从水文中心获取研究地区某一年的实测径流量数据和天气数据,并对数据进行预处理;
预处理的具体步骤为:
S11:从水文中心获取研究地区某一年年初到年末的实测径流量数据和天气数据,天气数据包括降水量、蒸发量,采集频率为1小时;
S12:对采集到的原始数据采用具有季节性调整的线性插值法处理离散值与缺失值,并进行标准化处理,其公式为:
其中,x为原始数据,μ为原始数据均值,σ为原始数据标准差,N为标准差处理之后的数据;
S13:将经过预处理之后的天气数据(D)和径流量数据(S)通过时间相关性整合,得到一个新的综合径流量序列矩阵Z(t)=[S(t),D(t)]H。
S2:用变分模态分解算法将预处理好的径流量序列数据分解成k个不同的模态分量;
变分模态分解的具体步骤为:
S21:变分模态分解算法将预处理好的径流量序列数据分解成k个模态分量,可以通过求解变分问题来提取模态分量,其公式为:
其中,uk为分解得到的k个模态分量(IMF),wk为各个模态分量对应的中心频率,为偏微分符号,j为虚数单位,t为时间序列,*为卷积符号,δ(t)为平均冲激函数,||||2为二范式函数,s.t.为约束条件,Z(t)为预处理好的径流量数据;
S22:为了确定径流量序列数据的对应模态分量的带宽,利用二次惩罚项和拉格朗日乘子法的优势,将约束变分问题转变为非约束变分问题,其公式为:
其中,L为拉格朗日函数,λ为拉格朗日乘子,α为二次惩罚因子,其决定了模态分量的带宽;
再将两个参数使用交替方向乘子法迭代搜索,其公式为:
其中,ω为频率,为维纳滤波,/>分别为Z(t)、ui(t)、λ(t)对应的傅里叶变换,/>为模态函数功率谱重心;
最终径流量数据被分解成K个时间子序列,即Z(t)=IMF1+IMF2+…+IMFk。
S3:对模态分量进行灰色关联分析,得出各模态分量序列与径流量数据的关联度并排序,去除弱相关和不相关的模态分量,将其余分量重构得到去噪序列输入模型训练;
操作步骤如下:
S31:为了简化计算,将分解得到的k个模态分量分别进行归一化处理,将数据映射到[0,1]之间,以某个模态分量里的一段时间序列数据为例,将数据记为IMFi=[IMFi(1),IMFi(2),...IMFi(n)],其公式为:
其中,yIMFi(j)为归一化后的数据,IMFi(j)为模态分量里原始的时间序列数据,IMFi.min为数据的最小值,IMFi.max为数据的最大值,归一化处理后的模态分量序列数据记为YIMF=[yIMF1,yIMF2,...yIMFk]T;
S32:逐个计算每个模态分量里的数据与预处理好的径流量序列中对应数据的绝对值差,以第i个模态分量yIMFi为例,其公式为|yIMFi(j)-sj|;
S33:计算模态分量里的各个数据与预处理好的径流量序列数据的关联系数,其公式为:
其中,ρ为分辨系数,一般取值为0.5,miniminj|yIMFi(j)-sj|与naximaxj|yIMFi(j)-sj|分别为两级最小极差,两级最大极差;
S34:计算各模态分量的灰色关联度,其公式为:
其中,ri为第i个模态分量对预处理好的径流量序列的灰色关联度;
S35:根据各模态的灰色关联度进行排序,选择前百分之80的模态分量重构得到去噪序列P;
其中P=∑yIMFi i=1,2,...q,q为满足的模态分量数。
S4:采用Informer编码器提取全局特征;
操作步骤如下:
S41:通过一维卷积将序列P中的数据元素投影成维度为512的数据,并对数据进行位置编码,防止数据输入模型后位置关系丢失;
S42:向量输入到Informer Encoder中的ProbSparse Self-attention Block,计算输入的径流量序列的权重系数并构成稀疏矩阵,最终选择前25个查询向量,从而减少了注意力权重的数量和降低计算复杂度;
ProbSparse Self-attention具体过程为:
ProbSparse Self-attention是对Self-attention基于KL散度改进得到的,为每个Query随机采样部分Key并计算稀疏性得分,根据稀疏性得分选出其中前25个Queries,仅仅计算这u个Queries与Key的点积结果,从而得到注意力权重。对于剩下的Query将自注意层的输入取均值作为输出,这使得每个ProbSparse Self-attention层的输入输出长度保持一致,其公式为:
其中,Q、K、V为经过线性转换后Query、Key、Value这三个矩阵,为25个Queries,Softmax为激活函数。
S43:将经过稀疏自注意力计算得到的输出向量进行多头拼接并通过线性层输出,接着通过最大池化操作进行下采样,网络维度减半,进一步减少模型参数的数量;
S44:堆叠模块最终输出值得重点关注的特征向量y。
S5:采用双向LSTM模块作为解码器提取数据间的局部特征,最后采用全局平均池化层得到最终的径流量预测结果;
操作步骤如下:
S51:将S4输出的全局特征向量y输入到双向LSTM模型中。双向LSTM通过两个独立的隐藏层对序列数据进行正向和反向处理,分别得到状态变量和/>其公式为:
其中,为正向LSTM隐藏层的状态变量,/>为反向LSTM隐藏层的状态变量,/>为级联操作。
S511:遗忘门ft决定了记忆单元该丢弃哪些信息,遗忘门读取上一隐藏层的值ht-1与输入值yt,随后输出一个在0到1之间的向量,其公式为:
ft=σ(Wf·[ht-1,yt]+bf)
其中,bf为偏置值,Wf为权重,σ为sigmoid激活函数;
S512:输入门it决定记忆单元添加哪些新信息,将输入值yt和前一隐藏层的信息ht-1传递到sigmoid激活函数中,输出一个与ft取值范围一样的向量it,然后利用输入值yt和前一隐藏层的信息ht-1通过tanh激活函数输出一个新的状态值其公式为:
it=σ(Wi·[ht-1,yt]+bi)
其中,Wi为权重,WC为tanh层的权重,bi为偏置值,bC为tanh层的偏置值;
S513:更新记忆单元状态,其公式为:
其中,Ct-1*ft为前一层的细胞状态与遗忘向量相乘,确定从Ct-1中遗忘的信息;为将sigmoid的输出值与tanh的输出值相乘,确定记忆单元添加的信息;
S514:输出门ot用来确定下一隐藏层输入的信息,首先将输入值yt和前一隐藏层的信息ht-1送入激活函数sigmoid,然后对更新的记忆单元信息ct使用激活函数tanh,最后将两个激活函数值相乘得出当前隐藏层的状态变量ht,其公式为:
ot=σ(WO·[ht-1,yt]+bO)
ht=ot*tanh(Ct)
其中,ot为当前时刻的记忆单元状态,WO为权重,bO为偏置值;
S52:在输出层中采用全局平均池化层捕获序列的重要特征,降低模型的维度,最终输出的径流量预测结果。
Claims (8)
1.一种基于灰色理论与编解码器的径流量预测方法,其特征在于,包括如下步骤:
S1:从水文中心获取研究地区某一年的实测径流量数据和天气数据,并对数据进行预处理;
S2:用变分模态分解算法将预处理好的综合径流量序列数据分解成k个不同的模态分量;
S3:对模态分量进行灰色关联分析,得出各模态分量序列与径流量数据的关联度并排序,去除弱相关和不相关的模态分量,将其余分量重构得到去噪序列输入模型训练;
S4:采用Informer编码器提取全局特征;
S5:采用双向LSTM模块作为解码器提取数据间的局部特征,最后采用全局平均池化层得到最终的径流量预测结果。
2.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S1中具体步骤为:
S11:从水文中心获取研究地区某一年年初到年末的实测径流量数据和天气数据,天气数据包括降水量、蒸发量,采集频率为1小时;
S12:对采集到的原始数据采用具有季节性调整的线性插值法处理离散值与缺失值,并进行标准化处理,其公式为:
其中,x为原始数据,μ为原始数据均值,σ为原始数据标准差,N为标准差处理之后的数据;
S13:将经过预处理之后的天气数据(D)和径流量数据(S)通过时间相关性整合,得到一个新的综合径流量序列矩阵Z(t)=[S(t),D(t)]H。
3.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S2中变分模态分解算法分解径流量序列数据的具体过程为:
S21:变分模态分解算法将预处理好的综合径流量序列数据分解成k个模态分量,可以通过求解变分问题来提取模态分量,其公式为:
其中,uk为分解得到的k个模态分量(IMF),wk为各个模态分量对应的中心频率,为偏微分符号,j为虚数单位,t为时间序列,*为卷积符号,δ(t)为平均冲激函数,|| ||2为二范式函数,s.t.为约束条件,Z(t)为预处理好的径流量数据;
S22:为了确定径流量序列数据的对应模态分量的带宽,利用二次惩罚项和拉格朗日乘子法的优势,将约束变分问题转变为非约束变分问题,其公式为:
其中,L为拉格朗日函数,λ为拉格朗日乘子,α为二次惩罚因子,其决定了模态分量的带宽。再将两个参数使用交替方向乘子法迭代搜索,最终径流量数据被分解成K个时间子序列,即Z(t)=IMF1+IMF2+…+IMFk。
4.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S3中灰色关联分析的具体步骤如下:
S31:为了简化计算,将分解得到的k个模态分量分别进行归一化处理,将数据映射到[0,1]之间,以某个模态分量里的一段时间序列数据为例,将数据记为IMFi=[IMFi(1),IMFi(2),…IMFi(n)],其公式为:
其中,yIMFi(j)为归一化后的数据,IMFi(j)为模态分量里原始的时间序列数据,IMFi.min为数据的最小值,IMFi.max为数据的最大值。归一化处理后的模态分量序列数据记为YIMF=[yIMF1,yIMF2,…yIMFk]T;
S32:逐个计算每个模态分量里的数据与预处理好的径流量序列中对应数据的绝对值差,以第i个模态分量yIMFi为例,其公式为|yIMFi(j)-sj|;
S33:计算模态分量里的各个数据与预处理好的径流量序列数据的关联系数,其公式为:
其中,ρ为分辨系数,一般取值为0.5,miniminj|yIMFi(j)-sj|与maximaxj|yIMFi(j)-sj|分别为两级最小极差,两级最大极差;
S34:计算各模态分量的灰色关联度,其公式为:
其中,ri为第i个模态分量对预处理好的径流量序列的灰色关联度;
S35:根据各模态的灰色关联度进行排序,选择前百分之80的模态分量重构得到去噪序列P;
其中P=∑yIMFi i=1,2,…q,q为满足的模态分量数。
5.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S4的具体步骤为:
S41:通过一维卷积将序列P中的数据元素投影成维度为512的数据,并对数据进行位置编码,防止数据输入模型后位置关系丢失;
S42:向量输入到InformerEncoder中的ProbSparse Self-attention Block,计算输入的径流量序列的权重系数并构成稀疏矩阵,最终选择前25个查询向量,从而减少了注意力权重的数量和降低计算复杂度;
S43:将经过稀疏自注意力计算得到的输出向量进行多头拼接并通过线性层输出,接着通过最大池化操作进行下采样,网络维度减半,进一步减少模型参数的数量;
S44:堆叠模块最终输出值得重点关注的特征向量y。
6.根据权利要求5所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S42中ProbSparse Self-attention具体过程为:
ProbSparse Self-attention是对Self-attention基于KL散度改进得到的,为每个Query随机采样部分Key并计算稀疏性得分,根据稀疏性得分选出其中前25个Queries,仅仅计算这u个Queries与Key的点积结果,从而得到注意力权重。对于剩下的Query将自注意层的输入取均值作为输出,这使得每个ProbSparse Self-attention层的输入输出长度保持一致,其公式为:
其中,Q、K、V为经过线性转换后Query、Key、Value这三个矩阵,为25个Queries,Softmax为激活函数。
7.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S5的具体过程为:
S51:将S4输出的全局特征向量y输入到双向LSTM模型中,双向LSTM通过两个独立的隐藏层对序列数据进行正向和反向处理,分别得到状态变量和/>其公式为:
其中,为正向LSTM隐藏层的状态变量,/>为反向LSTM隐藏层的状态变量,/>为级联操作;
S52:在输出层中采用全局平均池化层捕获序列的重要特征,降低模型的维度,最终输出的径流量预测结果。
8.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S51中LSTM的具体过程为:
S511:遗忘门ft决定了记忆单元该丢弃哪些信息,遗忘门读取上一隐藏层的值ht-1与输入值yt,随后输出一个在0到1之间的向量,其公式为:
ft=σ(Wf·[ht-1,yt]+bf)
其中,bf为偏置值,Wf为权重,σ为sigmoid激活函数;
S512:输入门it决定记忆单元添加哪些新信息,将输入值yt和前一隐藏层的信息ht-1传递到sigmoid激活函数中,输出一个与ft取值范围一样的向量it,然后利用输入值yt和前一隐藏层的信息ht-1通过tanh激活函数输出一个新的状态值其公式为:
it=σ(Wi·[ht-1,yt]+bi)
其中,Wi为权重,WC为tanh层的权重,bi为偏置值,bC为tanh层的偏置值;
S513:更新记忆单元状态,其公式为:
其中,Ct-1*ft为前一层的细胞状态与遗忘向量相乘,确定从Ct-1中遗忘的信息;为将sigmoid的输出值与tanh的输出值相乘,确定记忆单元添加的信息;
S514:输出门ot用来确定下一隐藏层输入的信息,首先将输入值yt和前一隐藏层的信息ht-1送入激活函数sigmoid,然后对更新的记忆单元信息ct使用激活函数tanh,最后将两个激活函数值相乘得出当前隐藏层的状态变量ht,其公式为:
ot=σ(WO·[ht-1,yt]+bO)
ht=ot*tanh(Ct)
其中,ot为当前时刻的记忆单元状态,WO为权重,bO为偏置值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310699340.7A CN116739168A (zh) | 2023-06-13 | 2023-06-13 | 一种基于灰色理论与编解码器的径流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310699340.7A CN116739168A (zh) | 2023-06-13 | 2023-06-13 | 一种基于灰色理论与编解码器的径流量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116739168A true CN116739168A (zh) | 2023-09-12 |
Family
ID=87900707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310699340.7A Pending CN116739168A (zh) | 2023-06-13 | 2023-06-13 | 一种基于灰色理论与编解码器的径流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116739168A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117744884A (zh) * | 2023-12-29 | 2024-03-22 | 南方电网调峰调频发电有限公司鲁布革水力发电厂 | 水库水流量预测模型的构建方法和水库水流量预测方法 |
-
2023
- 2023-06-13 CN CN202310699340.7A patent/CN116739168A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117744884A (zh) * | 2023-12-29 | 2024-03-22 | 南方电网调峰调频发电有限公司鲁布革水力发电厂 | 水库水流量预测模型的构建方法和水库水流量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263866B (zh) | 一种基于深度学习的电力用户负荷区间预测方法 | |
CN108256697B (zh) | 一种用于电力系统短期负荷的预测方法 | |
CN112633604B (zh) | 一种基于i-lstm的短期用电量预测方法 | |
CN111079998B (zh) | 基于长短时序相关性注意力机制模型的流量预测方法 | |
CN112434848B (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN111754042A (zh) | 基于高斯回归的大气污染物浓度的预测方法及装置 | |
CN111160651B (zh) | 一种基于stl-lstm的地铁客流预测方法 | |
CN112215422A (zh) | 基于季节性分解的长短时记忆网络水质动态预警方法 | |
CN111242377A (zh) | 一种集成深度学习和数据去噪的短期风速预测方法 | |
CN113705864A (zh) | 基于VMD-CNN-BiLSTM-ATT混合模型的气象干旱预测方法及装置 | |
CN110909928B (zh) | 能源负荷短期预测方法、装置、计算机设备及存储介质 | |
CN113486303A (zh) | 一种基于修饰模型集成的长时间序列预测方法 | |
CN114548592A (zh) | 一种基于cemd和lstm的非平稳时间序列数据预测方法 | |
CN114611792A (zh) | 一种基于混合CNN-Transformer模型的大气臭氧浓度预测方法 | |
CN116739168A (zh) | 一种基于灰色理论与编解码器的径流量预测方法 | |
CN114781744A (zh) | 基于编码解码器的深度学习多步长辐照度预测方法 | |
Mathew et al. | EMD-Att-LSTM: a data-driven strategy combined with deep learning for short-term load forecasting | |
CN115409258A (zh) | 一种混合深度学习短期辐照度预测方法 | |
CN113642767A (zh) | 一种基于mi-vmd-da-edlstm-vec的多维特征组合预测方法 | |
CN114912666A (zh) | 一种基于ceemdan算法和注意力机制的短时客流量预测方法 | |
CN115169430A (zh) | 基于多尺度解码的云网端资源多维时间序列异常检测方法 | |
CN112784479A (zh) | 一种洪水流量预测的方法 | |
CN116311921A (zh) | 一种基于多空间尺度时空Transformer的交通速度预测方法 | |
CN115343784A (zh) | 一种基于seq2seq-attention模型的局部气温预测方法 | |
CN113609766B (zh) | 一种基于深度概率潜隐模型的软测量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |