CN116739168A - 一种基于灰色理论与编解码器的径流量预测方法 - Google Patents

一种基于灰色理论与编解码器的径流量预测方法 Download PDF

Info

Publication number
CN116739168A
CN116739168A CN202310699340.7A CN202310699340A CN116739168A CN 116739168 A CN116739168 A CN 116739168A CN 202310699340 A CN202310699340 A CN 202310699340A CN 116739168 A CN116739168 A CN 116739168A
Authority
CN
China
Prior art keywords
data
runoff
modal
follows
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310699340.7A
Other languages
English (en)
Inventor
张雪洁
仓昊
王龙宝
徐淑芳
朱云
杨岳
陈一涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202310699340.7A priority Critical patent/CN116739168A/zh
Publication of CN116739168A publication Critical patent/CN116739168A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于灰色理论与编解码器的径流量预测方法,包括如下步骤:从水文中心获取研究地区某一年的实测径流量数据和天气数据,并对数据进行预处理;用变分模态分解算法将预处理好的综合径流量序列数据分解成k个不同的模态分量;对模态分量进行灰色关联分析,得出各模态分量序列与径流量数据的关联度并排序,去除弱相关和不相关的模态分量,将其余分量重构得到去噪序列输入模型训练;采用Informer编码器提取全局特征;采用双向LSIM模块作为解码器提取数据间的局部特征,最后采用全局平均池化技术,得到最终的径流量预测结果。

Description

一种基于灰色理论与编解码器的径流量预测方法
技术领域
本发明涉及基于深度学习的径流量预测领域,具体涉及一种基于灰色理论与编解码器的径流量预测方法。
背景技术
河川径流作为河流水文研究的重要内容,由于受到降雨、气候、人类生产活动等各种因素的影响,表现出随机性、不确定性、非线性的特点,这使得精准的预测径流量变得更加困难,为流域水库优化调度带来难题。精准的径流量预测对提高经济效益、流域水库优化调度、开展防洪抗旱工作以及保护人民的生命财产安全有重要意义。因此,寻找更加准确的径流量预测方法具有现实研究价值,应得到广泛重视。
由于径流时间序列具有复杂特性,使用单一的时间序列预测模型无法准确预测径流量,拟合效果较差。因此,综合使用多种模型进行径流量预测的方法被提出来。其中,基于数据分解的混合预测方法在径流量预测方面取得了较好的效果,通过采用分解技术对径流量数据进行分解处理,然后对分解后的子序列建立合适的模型进行径流量预测。分解技术的核心影响因素是如何确定分解后的模态分量个数,获取去噪序列,这对径流量预测结果有重要影响。目前,基于时频分析的分解技术被广泛应用于分解径流量序列数据,该技术在分解过程中由于噪声对分解的影响,使得在径流量序列特征提取过程中存在精度损失的问题。对分解后重构的序列采用长短期记忆网络建模具有较好的效果,然而,对于较长的输入序列,单独使用该网络设计模型预测效果有限。
发明内容
发明目的:为了克服现有技术中存在的不足,提供一种基于灰色理论与编解码器的径流量预测方法,主要利用灰色关联分析降低变分模态分解径流量序列时造成的精度损失问题,从而得到去噪序列,然后通过Informer编码器提取径流量序列的全局特征,采用双向LSTM模块提取局部特征,提高了径流量预测的准确性。
技术方案:为实现上述目的,本发明提供一种基于灰色理论与编解码器的径流量预测方法,包括如下步骤:
S1:从水文中心获取研究地区某一年的实测径流量数据和天气数据,并对数据进行预处理;
S2:用变分模态分解算法将预处理好的综合径流量序列数据分解成k个不同的模态分量;
S3:对模态分量进行灰色关联分析,得出各模态分量序列与径流量数据的关联度并排序,去除弱相关和不相关的模态分量,将其余分量重构得到去噪序列输入模型训练;
S4:采用Informer编码器提取全局特征;
S5:采用双向LSTM模块作为解码器提取数据间的局部特征,最后采用全局平均池化层得到最终的径流量预测结果。
进一步地,所述步骤S1中预处理的具体操作为:
S11:从水文中心获取研究地区某一年年初到年末的实测径流量数据和天气数据,天气数据包括降水量、蒸发量,采集频率为1小时;
S12:对采集到的原始数据采用具有季节性调整的线性插值法处理离散值与缺失值,并进行标准化处理,其公式为:
其中,x为原始数据,μ为原始数据均值,σ为原始数据标准差,N为标准差处理之后的数据;
S13:将经过预处理之后的天气数据(D)和径流量数据(S)通过时间相关性整合,得到一个新的综合径流量序列矩阵Z(t)=[S(t),D(t)]H
进一步地,所述步骤S2的具体操作为:
S21:变分模态分解算法将预处理好的径流量序列数据分解成k个模态分量,可以通过求解变分问题来提取模态分量,其公式为:
其中,uk为分解得到的k个模态分量(IMF),wk为各个模态分量对应的中心频率,为偏微分符号,j为虚数单位,t为时间序列,*为卷积符号,δ(t)为平均冲激函数,||||2为二范式函数,s.t.为约束条件,Z(t)为预处理好的径流量数据;
S22:为了确定径流量序列数据的对应模态分量的带宽,利用二次惩罚项和拉格朗日乘子法的优势,将约束变分问题转变为非约束变分问题,其公式为:
其中,L为拉格朗日函数,λ为拉格朗日乘子,α为二次惩罚因子,其决定了模态分量的带宽;
再将两个参数使用交替方向乘子法迭代搜索,其公式为:
其中,ω为频率,为维纳滤波,/>分别为Z(t)、ui(t)、λ(t)对应的傅里叶变换,/>为模态函数功率谱重心;
最终径流量数据被分解成K个时间子序列,即Z(t)=IMF1+IMF2+…+IMFk
进一步地,所述步骤S3的具体操作为:
S31:为了简化计算,将分解得到的k个模态分量分别进行归一化处理,将数据映射到[0,1]之间,以某个模态分量里的一段时间序列数据为例,将数据记为IMFi=[IMFi(1),IMFi(2),...IMFi(n)],其公式为:
其中,yIMFi(j)为归一化后的数据,IMFi(j)为模态分量里原始的时间序列数据,IMFi.min为数据的最小值,IMFi.max为数据的最大值,归一化处理后的模态分量序列数据记为YIMF=[yIMF1,yIMF2,...yIMFk]T
S32:逐个计算每个模态分量里的数据与预处理好的径流量序列中对应数据的绝对值差,以第i个模态分量yIMFi为例,其公式为|yIMFi(j)-sj|;
S33:计算模态分量里的各个数据与预处理好的径流量序列数据的关联系数,其公式为:
其中,ρ为分辨系数,一般取值为0.5,miniminj|yIMFi(j)-sj|与maximaxj|yIMFi(j)-sj|分别为两级最小极差,两级最大极差;
S34:计算各模态分量的灰色关联度,其公式为:
其中,ri为第i个模态分量对预处理好的径流量序列的灰色关联度;
S35:根据各模态的灰色关联度进行排序,选择前百分之80的模态分量重构得到去噪序列P;
其中P=∑yIMFi i=1,2,...q,q为满足的模态分量数。
进一步地,所述步骤S4的具体操作为:
S41:通过一维卷积将序列P中的数据元素投影成维度为512的数据,并对数据进行位置编码,防止数据输入模型后位置关系丢失;
S42:向量输入到Informer Encoder中的ProbSparse Self-attention Block,计算输入的径流量序列的权重系数并构成稀疏矩阵,最终选择前25个查询向量,从而减少了注意力权重的数量和降低计算复杂度;
S43:将经过稀疏自注意力计算得到的输出向量进行多头拼接并通过线性层输出,接着通过最大池化操作进行下采样,网络维度减半,进一步减少模型参数的数量;
S44:堆叠模块最终输出值得重点关注的特征向量y。
进一步地,所述步骤S42中ProbSparse Self-attention具体过程为:
ProbSparse Self-attention是对Self-attention基于KL散度改进得到的,为每个Query随机采样部分Key并计算稀疏性得分,根据稀疏性得分选出其中前25个Queries,仅仅计算这u个Queries与Key的点积结果,从而得到注意力权重。对于剩下的Query将自注意层的输入取均值作为输出,这使得每个ProbSparse Self-attention层的输入输出长度保持一致,其公式为:
其中,Q、K、V为经过线性转换后Query、Key、Value这三个矩阵,为25个Queries,Softmax为激活函数。
进一步地,所述步骤S5的具体操作为:
S51:将S4输出的全局特征向量y输入到双向LSTM模型中,双向LSTM通过两个独立的隐藏层对序列数据进行正向和反向处理,分别得到状态变量和/>其公式为:
其中,为正向LSTM隐藏层的状态变量,/>为反向LSTM隐藏层的状态变量,/>为级联操作;
S52:在输出层中采用全局平均池化层捕获序列的重要特征,降低模型的维度,最终输出的径流量预测结果。
进一步地,所述步骤S51中LSTM的具体操作为:
S511:遗忘门ft决定了记忆单元该丢弃哪些信息,遗忘门读取上一隐藏层的值ht-1与输入值yt,随后输出一个在0到1之间的向量,其公式为:
ft=σ(Wf·[ht-1,yt]+bf)
其中,bf为偏置值,Wf为权重,σ为sigmoid激活函数;
S512:输入门it决定记忆单元添加哪些新信息,将输入值yt和前一隐藏层的信息ht-1传递到sigmoid激活函数中,输出一个与ft取值范围一样的向量it,然后利用输入值yt和前一隐藏层的信息ht-1通过tanh激活函数输出一个新的状态值其公式为:
it=σ(Wi·[ht-1,yt]+bi)
其中,Wi为权重,WC为tanh层的权重,bi为偏置值,bC为tanh层的偏置值;
S513:更新记忆单元状态,其公式为:
其中,Ct-1*ft为前一层的细胞状态与遗忘向量相乘,确定从Ct-1中遗忘的信息;为将sigmoid的输出值与tanh的输出值相乘,确定记忆单元添加的信息;
S514:输出门ot用来确定下一隐藏层输入的信息,首先将输入值yt和前一隐藏层的信息ht-1送入激活函数sigmoid,然后对更新的记忆单元信息ct使用激活函数tanh,最后将两个激活函数值相乘得出当前隐藏层的状态变量ht,其公式为:
ot=σ(WO·[ht-1,yt]+bO)
ht=ot*tanh(Ct)
其中,ot为当前时刻的记忆单元状态,WO为权重,bO为偏置值。
有益效果:本发明与现有技术相比,具备如下优点:
1、在特征提取之前利用灰色关联分析筛选经过变分模态分解得到的模态分量,避免了过度分解或分解不足,从而提高了预测的准确性。
2、采用Informer编码器可以从稀疏特征注意矩阵中自适应的识别和选择影响径流量的主要特征,降低了计算复杂度。
3、相比于Informer解码器一步生成预测结果,采用双向LSTM模型作为解码器能够学习数据内部的变化规律,增强特征图的局部依赖性,提取数据间的局部特征,从而输出更加准确的径流量预测结果。
附图说明
图1为本发明方法的流程示意图。
图2为本发明方法中Informer编码器的示意图。
图3为本发明方法中双向LSTM解码器的示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供一种基于灰色理论与编解码器的径流量预测方法,如图1所示,其包括如下步骤:
S1:从水文中心获取研究地区某一年的实测径流量数据和天气数据,并对数据进行预处理;
预处理的具体步骤为:
S11:从水文中心获取研究地区某一年年初到年末的实测径流量数据和天气数据,天气数据包括降水量、蒸发量,采集频率为1小时;
S12:对采集到的原始数据采用具有季节性调整的线性插值法处理离散值与缺失值,并进行标准化处理,其公式为:
其中,x为原始数据,μ为原始数据均值,σ为原始数据标准差,N为标准差处理之后的数据;
S13:将经过预处理之后的天气数据(D)和径流量数据(S)通过时间相关性整合,得到一个新的综合径流量序列矩阵Z(t)=[S(t),D(t)]H
S2:用变分模态分解算法将预处理好的径流量序列数据分解成k个不同的模态分量;
变分模态分解的具体步骤为:
S21:变分模态分解算法将预处理好的径流量序列数据分解成k个模态分量,可以通过求解变分问题来提取模态分量,其公式为:
其中,uk为分解得到的k个模态分量(IMF),wk为各个模态分量对应的中心频率,为偏微分符号,j为虚数单位,t为时间序列,*为卷积符号,δ(t)为平均冲激函数,||||2为二范式函数,s.t.为约束条件,Z(t)为预处理好的径流量数据;
S22:为了确定径流量序列数据的对应模态分量的带宽,利用二次惩罚项和拉格朗日乘子法的优势,将约束变分问题转变为非约束变分问题,其公式为:
其中,L为拉格朗日函数,λ为拉格朗日乘子,α为二次惩罚因子,其决定了模态分量的带宽;
再将两个参数使用交替方向乘子法迭代搜索,其公式为:
其中,ω为频率,为维纳滤波,/>分别为Z(t)、ui(t)、λ(t)对应的傅里叶变换,/>为模态函数功率谱重心;
最终径流量数据被分解成K个时间子序列,即Z(t)=IMF1+IMF2+…+IMFk
S3:对模态分量进行灰色关联分析,得出各模态分量序列与径流量数据的关联度并排序,去除弱相关和不相关的模态分量,将其余分量重构得到去噪序列输入模型训练;
操作步骤如下:
S31:为了简化计算,将分解得到的k个模态分量分别进行归一化处理,将数据映射到[0,1]之间,以某个模态分量里的一段时间序列数据为例,将数据记为IMFi=[IMFi(1),IMFi(2),...IMFi(n)],其公式为:
其中,yIMFi(j)为归一化后的数据,IMFi(j)为模态分量里原始的时间序列数据,IMFi.min为数据的最小值,IMFi.max为数据的最大值,归一化处理后的模态分量序列数据记为YIMF=[yIMF1,yIMF2,...yIMFk]T
S32:逐个计算每个模态分量里的数据与预处理好的径流量序列中对应数据的绝对值差,以第i个模态分量yIMFi为例,其公式为|yIMFi(j)-sj|;
S33:计算模态分量里的各个数据与预处理好的径流量序列数据的关联系数,其公式为:
其中,ρ为分辨系数,一般取值为0.5,miniminj|yIMFi(j)-sj|与naximaxj|yIMFi(j)-sj|分别为两级最小极差,两级最大极差;
S34:计算各模态分量的灰色关联度,其公式为:
其中,ri为第i个模态分量对预处理好的径流量序列的灰色关联度;
S35:根据各模态的灰色关联度进行排序,选择前百分之80的模态分量重构得到去噪序列P;
其中P=∑yIMFi i=1,2,...q,q为满足的模态分量数。
S4:采用Informer编码器提取全局特征;
操作步骤如下:
S41:通过一维卷积将序列P中的数据元素投影成维度为512的数据,并对数据进行位置编码,防止数据输入模型后位置关系丢失;
S42:向量输入到Informer Encoder中的ProbSparse Self-attention Block,计算输入的径流量序列的权重系数并构成稀疏矩阵,最终选择前25个查询向量,从而减少了注意力权重的数量和降低计算复杂度;
ProbSparse Self-attention具体过程为:
ProbSparse Self-attention是对Self-attention基于KL散度改进得到的,为每个Query随机采样部分Key并计算稀疏性得分,根据稀疏性得分选出其中前25个Queries,仅仅计算这u个Queries与Key的点积结果,从而得到注意力权重。对于剩下的Query将自注意层的输入取均值作为输出,这使得每个ProbSparse Self-attention层的输入输出长度保持一致,其公式为:
其中,Q、K、V为经过线性转换后Query、Key、Value这三个矩阵,为25个Queries,Softmax为激活函数。
S43:将经过稀疏自注意力计算得到的输出向量进行多头拼接并通过线性层输出,接着通过最大池化操作进行下采样,网络维度减半,进一步减少模型参数的数量;
S44:堆叠模块最终输出值得重点关注的特征向量y。
S5:采用双向LSTM模块作为解码器提取数据间的局部特征,最后采用全局平均池化层得到最终的径流量预测结果;
操作步骤如下:
S51:将S4输出的全局特征向量y输入到双向LSTM模型中。双向LSTM通过两个独立的隐藏层对序列数据进行正向和反向处理,分别得到状态变量和/>其公式为:
其中,为正向LSTM隐藏层的状态变量,/>为反向LSTM隐藏层的状态变量,/>为级联操作。
S511:遗忘门ft决定了记忆单元该丢弃哪些信息,遗忘门读取上一隐藏层的值ht-1与输入值yt,随后输出一个在0到1之间的向量,其公式为:
ft=σ(Wf·[ht-1,yt]+bf)
其中,bf为偏置值,Wf为权重,σ为sigmoid激活函数;
S512:输入门it决定记忆单元添加哪些新信息,将输入值yt和前一隐藏层的信息ht-1传递到sigmoid激活函数中,输出一个与ft取值范围一样的向量it,然后利用输入值yt和前一隐藏层的信息ht-1通过tanh激活函数输出一个新的状态值其公式为:
it=σ(Wi·[ht-1,yt]+bi)
其中,Wi为权重,WC为tanh层的权重,bi为偏置值,bC为tanh层的偏置值;
S513:更新记忆单元状态,其公式为:
其中,Ct-1*ft为前一层的细胞状态与遗忘向量相乘,确定从Ct-1中遗忘的信息;为将sigmoid的输出值与tanh的输出值相乘,确定记忆单元添加的信息;
S514:输出门ot用来确定下一隐藏层输入的信息,首先将输入值yt和前一隐藏层的信息ht-1送入激活函数sigmoid,然后对更新的记忆单元信息ct使用激活函数tanh,最后将两个激活函数值相乘得出当前隐藏层的状态变量ht,其公式为:
ot=σ(WO·[ht-1,yt]+bO)
ht=ot*tanh(Ct)
其中,ot为当前时刻的记忆单元状态,WO为权重,bO为偏置值;
S52:在输出层中采用全局平均池化层捕获序列的重要特征,降低模型的维度,最终输出的径流量预测结果。

Claims (8)

1.一种基于灰色理论与编解码器的径流量预测方法,其特征在于,包括如下步骤:
S1:从水文中心获取研究地区某一年的实测径流量数据和天气数据,并对数据进行预处理;
S2:用变分模态分解算法将预处理好的综合径流量序列数据分解成k个不同的模态分量;
S3:对模态分量进行灰色关联分析,得出各模态分量序列与径流量数据的关联度并排序,去除弱相关和不相关的模态分量,将其余分量重构得到去噪序列输入模型训练;
S4:采用Informer编码器提取全局特征;
S5:采用双向LSTM模块作为解码器提取数据间的局部特征,最后采用全局平均池化层得到最终的径流量预测结果。
2.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S1中具体步骤为:
S11:从水文中心获取研究地区某一年年初到年末的实测径流量数据和天气数据,天气数据包括降水量、蒸发量,采集频率为1小时;
S12:对采集到的原始数据采用具有季节性调整的线性插值法处理离散值与缺失值,并进行标准化处理,其公式为:
其中,x为原始数据,μ为原始数据均值,σ为原始数据标准差,N为标准差处理之后的数据;
S13:将经过预处理之后的天气数据(D)和径流量数据(S)通过时间相关性整合,得到一个新的综合径流量序列矩阵Z(t)=[S(t),D(t)]H
3.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S2中变分模态分解算法分解径流量序列数据的具体过程为:
S21:变分模态分解算法将预处理好的综合径流量序列数据分解成k个模态分量,可以通过求解变分问题来提取模态分量,其公式为:
其中,uk为分解得到的k个模态分量(IMF),wk为各个模态分量对应的中心频率,为偏微分符号,j为虚数单位,t为时间序列,*为卷积符号,δ(t)为平均冲激函数,|| ||2为二范式函数,s.t.为约束条件,Z(t)为预处理好的径流量数据;
S22:为了确定径流量序列数据的对应模态分量的带宽,利用二次惩罚项和拉格朗日乘子法的优势,将约束变分问题转变为非约束变分问题,其公式为:
其中,L为拉格朗日函数,λ为拉格朗日乘子,α为二次惩罚因子,其决定了模态分量的带宽。再将两个参数使用交替方向乘子法迭代搜索,最终径流量数据被分解成K个时间子序列,即Z(t)=IMF1+IMF2+…+IMFk
4.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S3中灰色关联分析的具体步骤如下:
S31:为了简化计算,将分解得到的k个模态分量分别进行归一化处理,将数据映射到[0,1]之间,以某个模态分量里的一段时间序列数据为例,将数据记为IMFi=[IMFi(1),IMFi(2),…IMFi(n)],其公式为:
其中,yIMFi(j)为归一化后的数据,IMFi(j)为模态分量里原始的时间序列数据,IMFi.min为数据的最小值,IMFi.max为数据的最大值。归一化处理后的模态分量序列数据记为YIMF=[yIMF1,yIMF2,…yIMFk]T
S32:逐个计算每个模态分量里的数据与预处理好的径流量序列中对应数据的绝对值差,以第i个模态分量yIMFi为例,其公式为|yIMFi(j)-sj|;
S33:计算模态分量里的各个数据与预处理好的径流量序列数据的关联系数,其公式为:
其中,ρ为分辨系数,一般取值为0.5,miniminj|yIMFi(j)-sj|与maximaxj|yIMFi(j)-sj|分别为两级最小极差,两级最大极差;
S34:计算各模态分量的灰色关联度,其公式为:
其中,ri为第i个模态分量对预处理好的径流量序列的灰色关联度;
S35:根据各模态的灰色关联度进行排序,选择前百分之80的模态分量重构得到去噪序列P;
其中P=∑yIMFi i=1,2,…q,q为满足的模态分量数。
5.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S4的具体步骤为:
S41:通过一维卷积将序列P中的数据元素投影成维度为512的数据,并对数据进行位置编码,防止数据输入模型后位置关系丢失;
S42:向量输入到InformerEncoder中的ProbSparse Self-attention Block,计算输入的径流量序列的权重系数并构成稀疏矩阵,最终选择前25个查询向量,从而减少了注意力权重的数量和降低计算复杂度;
S43:将经过稀疏自注意力计算得到的输出向量进行多头拼接并通过线性层输出,接着通过最大池化操作进行下采样,网络维度减半,进一步减少模型参数的数量;
S44:堆叠模块最终输出值得重点关注的特征向量y。
6.根据权利要求5所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S42中ProbSparse Self-attention具体过程为:
ProbSparse Self-attention是对Self-attention基于KL散度改进得到的,为每个Query随机采样部分Key并计算稀疏性得分,根据稀疏性得分选出其中前25个Queries,仅仅计算这u个Queries与Key的点积结果,从而得到注意力权重。对于剩下的Query将自注意层的输入取均值作为输出,这使得每个ProbSparse Self-attention层的输入输出长度保持一致,其公式为:
其中,Q、K、V为经过线性转换后Query、Key、Value这三个矩阵,为25个Queries,Softmax为激活函数。
7.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S5的具体过程为:
S51:将S4输出的全局特征向量y输入到双向LSTM模型中,双向LSTM通过两个独立的隐藏层对序列数据进行正向和反向处理,分别得到状态变量和/>其公式为:
其中,为正向LSTM隐藏层的状态变量,/>为反向LSTM隐藏层的状态变量,/>为级联操作;
S52:在输出层中采用全局平均池化层捕获序列的重要特征,降低模型的维度,最终输出的径流量预测结果。
8.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法,其特征在于,所述步骤S51中LSTM的具体过程为:
S511:遗忘门ft决定了记忆单元该丢弃哪些信息,遗忘门读取上一隐藏层的值ht-1与输入值yt,随后输出一个在0到1之间的向量,其公式为:
ft=σ(Wf·[ht-1,yt]+bf)
其中,bf为偏置值,Wf为权重,σ为sigmoid激活函数;
S512:输入门it决定记忆单元添加哪些新信息,将输入值yt和前一隐藏层的信息ht-1传递到sigmoid激活函数中,输出一个与ft取值范围一样的向量it,然后利用输入值yt和前一隐藏层的信息ht-1通过tanh激活函数输出一个新的状态值其公式为:
it=σ(Wi·[ht-1,yt]+bi)
其中,Wi为权重,WC为tanh层的权重,bi为偏置值,bC为tanh层的偏置值;
S513:更新记忆单元状态,其公式为:
其中,Ct-1*ft为前一层的细胞状态与遗忘向量相乘,确定从Ct-1中遗忘的信息;为将sigmoid的输出值与tanh的输出值相乘,确定记忆单元添加的信息;
S514:输出门ot用来确定下一隐藏层输入的信息,首先将输入值yt和前一隐藏层的信息ht-1送入激活函数sigmoid,然后对更新的记忆单元信息ct使用激活函数tanh,最后将两个激活函数值相乘得出当前隐藏层的状态变量ht,其公式为:
ot=σ(WO·[ht-1,yt]+bO)
ht=ot*tanh(Ct)
其中,ot为当前时刻的记忆单元状态,WO为权重,bO为偏置值。
CN202310699340.7A 2023-06-13 2023-06-13 一种基于灰色理论与编解码器的径流量预测方法 Pending CN116739168A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310699340.7A CN116739168A (zh) 2023-06-13 2023-06-13 一种基于灰色理论与编解码器的径流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310699340.7A CN116739168A (zh) 2023-06-13 2023-06-13 一种基于灰色理论与编解码器的径流量预测方法

Publications (1)

Publication Number Publication Date
CN116739168A true CN116739168A (zh) 2023-09-12

Family

ID=87900707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310699340.7A Pending CN116739168A (zh) 2023-06-13 2023-06-13 一种基于灰色理论与编解码器的径流量预测方法

Country Status (1)

Country Link
CN (1) CN116739168A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117744884A (zh) * 2023-12-29 2024-03-22 南方电网调峰调频发电有限公司鲁布革水力发电厂 水库水流量预测模型的构建方法和水库水流量预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117744884A (zh) * 2023-12-29 2024-03-22 南方电网调峰调频发电有限公司鲁布革水力发电厂 水库水流量预测模型的构建方法和水库水流量预测方法

Similar Documents

Publication Publication Date Title
CN110263866B (zh) 一种基于深度学习的电力用户负荷区间预测方法
CN108256697B (zh) 一种用于电力系统短期负荷的预测方法
CN112633604B (zh) 一种基于i-lstm的短期用电量预测方法
CN111079998B (zh) 基于长短时序相关性注意力机制模型的流量预测方法
CN112434848B (zh) 基于深度信念网络的非线性加权组合风电功率预测方法
CN111754042A (zh) 基于高斯回归的大气污染物浓度的预测方法及装置
CN111160651B (zh) 一种基于stl-lstm的地铁客流预测方法
CN112215422A (zh) 基于季节性分解的长短时记忆网络水质动态预警方法
CN111242377A (zh) 一种集成深度学习和数据去噪的短期风速预测方法
CN113705864A (zh) 基于VMD-CNN-BiLSTM-ATT混合模型的气象干旱预测方法及装置
CN110909928B (zh) 能源负荷短期预测方法、装置、计算机设备及存储介质
CN113486303A (zh) 一种基于修饰模型集成的长时间序列预测方法
CN114548592A (zh) 一种基于cemd和lstm的非平稳时间序列数据预测方法
CN114611792A (zh) 一种基于混合CNN-Transformer模型的大气臭氧浓度预测方法
CN116739168A (zh) 一种基于灰色理论与编解码器的径流量预测方法
CN114781744A (zh) 基于编码解码器的深度学习多步长辐照度预测方法
Mathew et al. EMD-Att-LSTM: a data-driven strategy combined with deep learning for short-term load forecasting
CN115409258A (zh) 一种混合深度学习短期辐照度预测方法
CN113642767A (zh) 一种基于mi-vmd-da-edlstm-vec的多维特征组合预测方法
CN114912666A (zh) 一种基于ceemdan算法和注意力机制的短时客流量预测方法
CN115169430A (zh) 基于多尺度解码的云网端资源多维时间序列异常检测方法
CN112784479A (zh) 一种洪水流量预测的方法
CN116311921A (zh) 一种基于多空间尺度时空Transformer的交通速度预测方法
CN115343784A (zh) 一种基于seq2seq-attention模型的局部气温预测方法
CN113609766B (zh) 一种基于深度概率潜隐模型的软测量方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination