CN116739168A

CN116739168A - 一种基于灰色理论与编解码器的径流量预测方法

Info

Publication number: CN116739168A
Application number: CN202310699340.7A
Authority: CN
Inventors: 张雪洁; 仓昊; 王龙宝; 徐淑芳; 朱云; 杨岳; 陈一涵
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2023-06-13
Filing date: 2023-06-13
Publication date: 2023-09-12

Abstract

本发明公开了一种基于灰色理论与编解码器的径流量预测方法，包括如下步骤：从水文中心获取研究地区某一年的实测径流量数据和天气数据，并对数据进行预处理；用变分模态分解算法将预处理好的综合径流量序列数据分解成k个不同的模态分量；对模态分量进行灰色关联分析，得出各模态分量序列与径流量数据的关联度并排序，去除弱相关和不相关的模态分量，将其余分量重构得到去噪序列输入模型训练；采用Informer编码器提取全局特征；采用双向LSIM模块作为解码器提取数据间的局部特征，最后采用全局平均池化技术，得到最终的径流量预测结果。

Description

一种基于灰色理论与编解码器的径流量预测方法

技术领域

本发明涉及基于深度学习的径流量预测领域，具体涉及一种基于灰色理论与编解码器的径流量预测方法。

背景技术

河川径流作为河流水文研究的重要内容，由于受到降雨、气候、人类生产活动等各种因素的影响，表现出随机性、不确定性、非线性的特点，这使得精准的预测径流量变得更加困难，为流域水库优化调度带来难题。精准的径流量预测对提高经济效益、流域水库优化调度、开展防洪抗旱工作以及保护人民的生命财产安全有重要意义。因此，寻找更加准确的径流量预测方法具有现实研究价值，应得到广泛重视。

由于径流时间序列具有复杂特性，使用单一的时间序列预测模型无法准确预测径流量，拟合效果较差。因此，综合使用多种模型进行径流量预测的方法被提出来。其中，基于数据分解的混合预测方法在径流量预测方面取得了较好的效果，通过采用分解技术对径流量数据进行分解处理，然后对分解后的子序列建立合适的模型进行径流量预测。分解技术的核心影响因素是如何确定分解后的模态分量个数，获取去噪序列，这对径流量预测结果有重要影响。目前，基于时频分析的分解技术被广泛应用于分解径流量序列数据，该技术在分解过程中由于噪声对分解的影响，使得在径流量序列特征提取过程中存在精度损失的问题。对分解后重构的序列采用长短期记忆网络建模具有较好的效果，然而，对于较长的输入序列，单独使用该网络设计模型预测效果有限。

发明内容

发明目的：为了克服现有技术中存在的不足，提供一种基于灰色理论与编解码器的径流量预测方法，主要利用灰色关联分析降低变分模态分解径流量序列时造成的精度损失问题，从而得到去噪序列，然后通过Informer编码器提取径流量序列的全局特征，采用双向LSTM模块提取局部特征，提高了径流量预测的准确性。

技术方案：为实现上述目的，本发明提供一种基于灰色理论与编解码器的径流量预测方法，包括如下步骤：

S1：从水文中心获取研究地区某一年的实测径流量数据和天气数据，并对数据进行预处理；

S2：用变分模态分解算法将预处理好的综合径流量序列数据分解成k个不同的模态分量；

S3：对模态分量进行灰色关联分析，得出各模态分量序列与径流量数据的关联度并排序，去除弱相关和不相关的模态分量，将其余分量重构得到去噪序列输入模型训练；

S4：采用Informer编码器提取全局特征；

S5：采用双向LSTM模块作为解码器提取数据间的局部特征，最后采用全局平均池化层得到最终的径流量预测结果。

进一步地，所述步骤S1中预处理的具体操作为：

S11：从水文中心获取研究地区某一年年初到年末的实测径流量数据和天气数据，天气数据包括降水量、蒸发量，采集频率为1小时；

S12：对采集到的原始数据采用具有季节性调整的线性插值法处理离散值与缺失值，并进行标准化处理，其公式为：

其中，x为原始数据，μ为原始数据均值，σ为原始数据标准差，N为标准差处理之后的数据；

S13：将经过预处理之后的天气数据(D)和径流量数据(S)通过时间相关性整合，得到一个新的综合径流量序列矩阵Z(t)＝[S(t)，D(t)]^H。

进一步地，所述步骤S2的具体操作为：

S21：变分模态分解算法将预处理好的径流量序列数据分解成k个模态分量，可以通过求解变分问题来提取模态分量，其公式为：

其中，u_k为分解得到的k个模态分量(IMF)，w_k为各个模态分量对应的中心频率，为偏微分符号，j为虚数单位，t为时间序列，*为卷积符号，δ(t)为平均冲激函数，||||₂为二范式函数，s.t.为约束条件，Z(t)为预处理好的径流量数据；

S22：为了确定径流量序列数据的对应模态分量的带宽，利用二次惩罚项和拉格朗日乘子法的优势，将约束变分问题转变为非约束变分问题，其公式为：

其中，L为拉格朗日函数，λ为拉格朗日乘子，α为二次惩罚因子，其决定了模态分量的带宽；

再将两个参数使用交替方向乘子法迭代搜索，其公式为：

其中，ω为频率，为维纳滤波，/>分别为Z(t)、u_i(t)、λ(t)对应的傅里叶变换，/>为模态函数功率谱重心；

最终径流量数据被分解成K个时间子序列，即Z(t)＝IMF₁+IMF₂+…+IMF_k。

进一步地，所述步骤S3的具体操作为：

S31：为了简化计算，将分解得到的k个模态分量分别进行归一化处理，将数据映射到[0，1]之间，以某个模态分量里的一段时间序列数据为例，将数据记为IMF_i＝[IMF_i(1)，IMF_i(2)，...IMF_i(n)]，其公式为：

其中，y_IMFi(j)为归一化后的数据，IMF_i(j)为模态分量里原始的时间序列数据，IMF_i.min为数据的最小值，IMF_i.max为数据的最大值，归一化处理后的模态分量序列数据记为Y_IMF＝[y_IMF1，y_IMF2，...y_IMFk]^T；

S32：逐个计算每个模态分量里的数据与预处理好的径流量序列中对应数据的绝对值差，以第i个模态分量y_IMFi为例，其公式为|y_IMFi(j)-s_j|；

S33：计算模态分量里的各个数据与预处理好的径流量序列数据的关联系数，其公式为：

其中，ρ为分辨系数，一般取值为0.5，min_imin_j|y_IMFi(j)-s_j|与max_imax_j|y_IMFi(j)-s_j|分别为两级最小极差，两级最大极差；

S34：计算各模态分量的灰色关联度，其公式为：

其中，ri为第i个模态分量对预处理好的径流量序列的灰色关联度；

S35：根据各模态的灰色关联度进行排序，选择前百分之80的模态分量重构得到去噪序列P；

其中P＝∑y_IMFi i＝1，2，...q，q为满足的模态分量数。

进一步地，所述步骤S4的具体操作为：

S41：通过一维卷积将序列P中的数据元素投影成维度为512的数据，并对数据进行位置编码，防止数据输入模型后位置关系丢失；

S42：向量输入到Informer Encoder中的ProbSparse Self-attention Block，计算输入的径流量序列的权重系数并构成稀疏矩阵，最终选择前25个查询向量，从而减少了注意力权重的数量和降低计算复杂度；

S43：将经过稀疏自注意力计算得到的输出向量进行多头拼接并通过线性层输出，接着通过最大池化操作进行下采样，网络维度减半，进一步减少模型参数的数量；

S44：堆叠模块最终输出值得重点关注的特征向量y。

进一步地，所述步骤S42中ProbSparse Self-attention具体过程为：

ProbSparse Self-attention是对Self-attention基于KL散度改进得到的，为每个Query随机采样部分Key并计算稀疏性得分，根据稀疏性得分选出其中前25个Queries，仅仅计算这u个Queries与Key的点积结果，从而得到注意力权重。对于剩下的Query将自注意层的输入取均值作为输出，这使得每个ProbSparse Self-attention层的输入输出长度保持一致，其公式为：

其中，Q、K、V为经过线性转换后Query、Key、Value这三个矩阵，为25个Queries，Softmax为激活函数。

进一步地，所述步骤S5的具体操作为：

S51：将S4输出的全局特征向量y输入到双向LSTM模型中，双向LSTM通过两个独立的隐藏层对序列数据进行正向和反向处理，分别得到状态变量和/>其公式为：

其中，为正向LSTM隐藏层的状态变量，/>为反向LSTM隐藏层的状态变量，/>为级联操作；

S52：在输出层中采用全局平均池化层捕获序列的重要特征，降低模型的维度，最终输出的径流量预测结果。

进一步地，所述步骤S51中LSTM的具体操作为：

S511：遗忘门f_t决定了记忆单元该丢弃哪些信息，遗忘门读取上一隐藏层的值h_t-1与输入值y_t，随后输出一个在0到1之间的向量，其公式为：

f_t＝σ(W_f·[h_t-1，y_t]+b_f)

其中，b_f为偏置值，W_f为权重，σ为sigmoid激活函数；

S512：输入门i_t决定记忆单元添加哪些新信息，将输入值y_t和前一隐藏层的信息h_t-1传递到sigmoid激活函数中，输出一个与f_t取值范围一样的向量i_t，然后利用输入值y_t和前一隐藏层的信息h_t-1通过tanh激活函数输出一个新的状态值其公式为：

i_t＝σ(W_i·[h_t-1，y_t]+b_i)

其中，W_i为权重，W_C为tanh层的权重，b_i为偏置值，b_C为tanh层的偏置值；

S513：更新记忆单元状态，其公式为：

其中，C_t-1*f_t为前一层的细胞状态与遗忘向量相乘，确定从C_t-1中遗忘的信息；为将sigmoid的输出值与tanh的输出值相乘，确定记忆单元添加的信息；

S514：输出门o_t用来确定下一隐藏层输入的信息，首先将输入值y_t和前一隐藏层的信息h_t-1送入激活函数sigmoid，然后对更新的记忆单元信息c_t使用激活函数tanh，最后将两个激活函数值相乘得出当前隐藏层的状态变量h_t，其公式为：

o_t＝σ(W_O·[h_t-1，y_t]+b_O)

h_t＝o_t*tanh(C_t)

其中，o_t为当前时刻的记忆单元状态，W_O为权重，b_O为偏置值。

有益效果：本发明与现有技术相比，具备如下优点：

1、在特征提取之前利用灰色关联分析筛选经过变分模态分解得到的模态分量，避免了过度分解或分解不足，从而提高了预测的准确性。

2、采用Informer编码器可以从稀疏特征注意矩阵中自适应的识别和选择影响径流量的主要特征，降低了计算复杂度。

3、相比于Informer解码器一步生成预测结果，采用双向LSTM模型作为解码器能够学习数据内部的变化规律，增强特征图的局部依赖性，提取数据间的局部特征，从而输出更加准确的径流量预测结果。

附图说明

图1为本发明方法的流程示意图。

图2为本发明方法中Informer编码器的示意图。

图3为本发明方法中双向LSTM解码器的示意图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

本发明提供一种基于灰色理论与编解码器的径流量预测方法，如图1所示，其包括如下步骤：

预处理的具体步骤为：

S2：用变分模态分解算法将预处理好的径流量序列数据分解成k个不同的模态分量；

变分模态分解的具体步骤为：

再将两个参数使用交替方向乘子法迭代搜索，其公式为：

操作步骤如下：

其中，ρ为分辨系数，一般取值为0.5，min_imin_j|y_IMFi(j)-s_j|与nax_imax_j|y_IMFi(j)-s_j|分别为两级最小极差，两级最大极差；

S34：计算各模态分量的灰色关联度，其公式为：

其中，r_i为第i个模态分量对预处理好的径流量序列的灰色关联度；

其中P＝∑y_IMFi i＝1，2，...q，q为满足的模态分量数。

S4：采用Informer编码器提取全局特征；

操作步骤如下：

ProbSparse Self-attention具体过程为：

S44：堆叠模块最终输出值得重点关注的特征向量y。

S5：采用双向LSTM模块作为解码器提取数据间的局部特征，最后采用全局平均池化层得到最终的径流量预测结果；

操作步骤如下：

S51：将S4输出的全局特征向量y输入到双向LSTM模型中。双向LSTM通过两个独立的隐藏层对序列数据进行正向和反向处理，分别得到状态变量和/>其公式为：

其中，为正向LSTM隐藏层的状态变量，/>为反向LSTM隐藏层的状态变量，/>为级联操作。

f_t＝σ(W_f·[h_t-1，y_t]+b_f)

其中，b_f为偏置值，W_f为权重，σ为sigmoid激活函数；

i_t＝σ(W_i·[h_t-1，y_t]+b_i)

S513：更新记忆单元状态，其公式为：

o_t＝σ(W_O·[h_t-1，y_t]+b_O)

h_t＝o_t*tanh(C_t)

其中，o_t为当前时刻的记忆单元状态，W_O为权重，b_O为偏置值；

Claims

1.一种基于灰色理论与编解码器的径流量预测方法，其特征在于，包括如下步骤：

S4：采用Informer编码器提取全局特征；

2.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法，其特征在于，所述步骤S1中具体步骤为：

3.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法，其特征在于，所述步骤S2中变分模态分解算法分解径流量序列数据的具体过程为：

S21：变分模态分解算法将预处理好的综合径流量序列数据分解成k个模态分量，可以通过求解变分问题来提取模态分量，其公式为：

其中，u_k为分解得到的k个模态分量(IMF)，w_k为各个模态分量对应的中心频率，为偏微分符号，j为虚数单位，t为时间序列，*为卷积符号，δ(t)为平均冲激函数，|| ||₂为二范式函数，s.t.为约束条件，Z(t)为预处理好的径流量数据；

其中，L为拉格朗日函数，λ为拉格朗日乘子，α为二次惩罚因子，其决定了模态分量的带宽。再将两个参数使用交替方向乘子法迭代搜索，最终径流量数据被分解成K个时间子序列，即Z(t)＝IMF₁+IMF₂+…+IMF_k。

4.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法，其特征在于，所述步骤S3中灰色关联分析的具体步骤如下：

S31：为了简化计算，将分解得到的k个模态分量分别进行归一化处理，将数据映射到[0，1]之间，以某个模态分量里的一段时间序列数据为例，将数据记为IMF_i＝[IMF_i(1)，IMF_i(2)，…IMF_i(n)]，其公式为：

其中，y_IMFi(j)为归一化后的数据，IMF_i(j)为模态分量里原始的时间序列数据，IMF_i.min为数据的最小值，IMF_i.max为数据的最大值。归一化处理后的模态分量序列数据记为Y_IMF＝[y_IMF1，y_IMF2，…y_IMFk]^T；

S34：计算各模态分量的灰色关联度，其公式为：

其中P＝∑y_IMFi i＝1，2，…q，q为满足的模态分量数。

5.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法，其特征在于，所述步骤S4的具体步骤为：

S42：向量输入到InformerEncoder中的ProbSparse Self-attention Block，计算输入的径流量序列的权重系数并构成稀疏矩阵，最终选择前25个查询向量，从而减少了注意力权重的数量和降低计算复杂度；

S44：堆叠模块最终输出值得重点关注的特征向量y。

6.根据权利要求5所述的一种基于灰色理论与编解码器的径流量预测方法，其特征在于，所述步骤S42中ProbSparse Self-attention具体过程为：

7.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法，其特征在于，所述步骤S5的具体过程为：

8.根据权利要求1所述的一种基于灰色理论与编解码器的径流量预测方法，其特征在于，所述步骤S51中LSTM的具体过程为：

f_t＝σ(W_f·[h_t-1，y_t]+b_f)

其中，b_f为偏置值，W_f为权重，σ为sigmoid激活函数；

i_t＝σ(W_i·[h_t-1，y_t]+b_i)

S513：更新记忆单元状态，其公式为：

o_t＝σ(W_O·[h_t-1，y_t]+b_O)

h_t＝o_t*tanh(C_t)