CN117408172B

CN117408172B - 一种考虑半干旱区水文特征的数据驱动降水-径流模拟方法

Info

Publication number: CN117408172B
Application number: CN202311730494.4A
Authority: CN
Inventors: 汤梓杰; 王国庆; 张建云; 张江江; 金君良
Original assignee: Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources
Current assignee: Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources
Priority date: 2023-12-15
Filing date: 2023-12-15
Publication date: 2024-03-01
Anticipated expiration: 2043-12-15
Also published as: CN117408172A

Abstract

本发明公开了一种考虑半干旱区水文特征的数据驱动降水‑径流模拟方法，包括获取实测气象水文数据；对训练集划分湿润/干旱时期；在训练集中得到湿润、干旱模型；采用湿润/干旱时期数据训练极致梯度提升分类器，根据分类器对未来的湿润/干旱类别的预测结果，选取湿润/干旱模型进行降水‑径流模拟。本方法根据半干旱区水文特征时间异质性，先采用数据分割法，将常规序列分为干旱与湿润时期，再基于自注意力机制的时序卷积神经网络模型，通过预训练‑微调的策略，分别得到干旱和湿润模型，根据干旱与湿润时期序列分别训练分类器，根据分类器输出的类别选择用干旱/湿润模型模拟降水‑径流，显著提升了半干旱区降水‑径流模拟的精度。

Description

一种考虑半干旱区水文特征的数据驱动降水-径流模拟方法

技术领域

本发明属于水文和气象预测技术领域，具体涉及一种考虑半干旱区水文特征的数据驱动降水-径流模拟方法。

背景技术

气候变化导致极端降水事件频发，会在不同地区造成大规模洪灾，干旱或半干旱地区受到严重影响。在半干旱地区，当降水强度超过一般水平时，水量会超过土壤的渗透能力，裹挟贫瘠的表面土壤而迅速形成山洪，对下游造成极大的危害。水文学家利用降水-径流模型来预测严重的洪水事件，并根据情景分析提出有效的预防措施。半干旱区由于其径流过程多变性，在多水时期表现出陡涨、陡落的洪水过程，与少水时期的少量且缓变的径流过程存在较大差异性；同时半干旱区较少的水文事件，对于水文规律的归纳、发现与过程驱动模型的构建形成制约，在传统过程驱动的模拟上效果并不理想。因而，对于半干旱区的降水-径流模拟，需要从大数据中充分发掘有效信息，在解决降水-径流模拟难题的同时保持对水文过程规律足够的考量。

发明内容

为了实现更为精确的半干旱区降水-径流模拟，本发明考虑了半干旱区水文特征的时间异质性，提供一种新的数据驱动降水-径流模拟方法，结合了基于数据分割的样本特征识别方法与基于自注意力机制的时序卷积神经网络。

本发明具体采用以下技术方案：

一种考虑半干旱区水文特征的数据驱动降水-径流模拟方法，包括以下步骤：

S1.获取研究区逐日尺度实测气象水文数据，包括：径流、降水、气温、地表温度、相对湿度、蒸散发和气压，并对数据进行预处理；对整体时间序列采用时序交叉验证法划分多组训练集和验证集。

S2.对训练集每年径流序列采用Bai-Perron突变点检验进行年内的湿润、干旱时期划分，分别得到湿润、干旱序列；

S3.在训练集中，首先采用训练集内全序列预训练一个基于自注意力机制的时序卷积神经网络(Temporal Convolution Network with attention mechanism, TCN-attention，以下简称为TCN-attention)作为基础模型，其次将Bai-Perron突变点检验得到的湿润、干旱序列样本分别输入基础模型的后部决策层进行微调，分别得到湿润、干旱模型；

S4.用训练集中Bai-Perron突变点检验得到的湿润、干旱序列来训练XGBoost分类器(极致梯度提升分类器，eXtreme Gradient Boosting，以下都简称为XGBoost分类器)；

S5.将验证集中除径流外的气象数据输入步骤S4的XGBoost分类器中，根据XGBoost分类器预测的状态，选择步骤S3对应的湿润/干旱模型进行降水-径流模拟。

进一步地，所述步骤S1中对气象水文数据预处理包括：

步骤S1.1，对径流、降水、气温、地表温度、相对湿度、蒸散发和气压数据进行一致性、白噪声检验；

步骤S1.2，对不同来源的气象水文数据按照时间序列整理对齐，将气象序列进行0-1归一化，将径流序列进行Box-Cox变换：

式中，为经过Box-Cox变换后的径流序列；/>为原始径流序列，/>是径流序列的长度；/>为Box-Cox变换参数，通过极大似然估计确定，以使变换后的数据满足典型线性回归模型的所有假设，即/>变换后的序列服从期望为/>、标准差为/>的正态分布。

因为数据来源不同，需要整理，使数据在时间上对齐。

为了客观地反映总体方差并将随机误差的风险降至最低，本方法采用时序交叉验证方法划分多组验证集和训练集。

进一步地，步骤S2中对训练集的历史径流序列，采用Bai-Perron突变点检验进行年内径流湿润、干旱时期划分。Bai-Perron突变点检验的方法和原理是现有技术，在此不再赘述。

进一步地，所述步骤S3包括：

步骤S3.1，将训练集全序列输入到TCN-attention中，预训练基础模型。输入数据为前期气象水文时间序列窗口，窗口长度需要率定，输出数据为未来径流量。

前期指的是，如果预测Y8，即第8天的径流，输入的X8为第1到8天的气象+第1到7天的径流数据。

时序卷积神经网络(Temporal Convolution Network, TCN，以下简称为TCN)由残差连接块组成，其中包含一维因果扩张卷积层和残差连接通道，最终由ReLU激活函数传递，所述ReLU激活函数：一维卷积层在同一特征下进行时空卷积，计算特征的不同卷积进行回归；残差连接通道将残差连接到一维卷积层信息回归之外的下一层，并通过将残差从一个区块传递到另一个区块来对残差进行拟合回归。

本方法在TCN上加入自注意力机制，加强全局历史信息对于降水-径流拟合的指导，其主要计算机制如下：

其中，H _b是注意力层中第b个位置的隐藏状态，共有n1个位置，即隐藏状态被分成n1份映射；是大小为m的输入，即TCN的输出隐藏状态；O是注意层的输出；W是权重矩阵，包括W ^Q 、W ^K 、W ^V三个维度的投影矩阵，/>用于匹配值，/>是Q要匹配的向量（键），d _K是K的维度，/>是要提取的特征值，主要通过三个投影矩阵的梯度下降来拟合最佳的特征提取变换过程；T代表矩阵转置，Q和K矩阵相乘，需要把K转置一下；/>是归一化的激活函数。

步骤S3.2，根据数据表现出来的特征与训练得到的效果，对基础模型参数进行人工经验性调整，主要指标为NSE，使输出的未来径流量序列更接近真实值，包含值的接近和序列变化的接近，得到最佳参数配置与模型；基础模型参数包括堆叠层数、基础模型预训练学习率、时间序列样本长度、训练批量大小、扩张卷积核形状。

步骤S3.3，将Bai-Perron突变点检验得到的湿润、干旱序列分别输入步骤S3.2得到的基础模型后部决策层，根据训练得到的效果，对湿润、干旱模型的参数，包括堆叠层数、微调学习率、训练批量大小、扩张卷积核形状和微调层数，分别进行微调，分别得到湿润、干旱模型。

步骤S3.2、S3.3中模拟效果都可以根据指标RMSE、MAE、NSE、KGE进行衡量。

进一步地，所述步骤S4中XGBoost分类器拟合输入和输出，输入数据为前期气象水文数据与前期湿润/干旱类别，输出数据为未来湿润/干旱类别，为之后预测模型的选用提供依据。具体包括：

将训练集中Bai-Perron突变点检验得到的湿润序列窗口及湿润类别作为XGBoost分类器的输入数据，湿润序列窗口包括径流在内的气象水文数据；将训练集中Bai-Perron突变点检验得到的干旱序列窗口及干旱类别作为XGBoost分类器的输入数据，输出之后几天的类别，以预测未来的湿润/干旱状态。

XGBoost分类器通过不断分割特征并建立新的决策树模型，以梯度方式减少前一个模型的拟合残差，其拟合方程如下：

式中，是第t次迭代中第l个样本（即本发明中未来湿润/干旱类别）的预测值；X _l是第l个样本（即本发明中的前期气象数据）的值矩阵；/>是第k个树模型的拟合函数；/>是第t-1次迭代中第l个样本的预测值；/>是第t个树模型的拟合函数；F是树方程的空间集合。

本发明的有益成果：本方法根据半干旱区水文特征时间异质性，先采用数据分割方法，将常规序列分为干旱与湿润时期，再构建基于自注意力机制的时序卷积神经网络模型，通过预训练-微调的策略，分别得到干旱和湿润模型。根据干旱与湿润时期序列训练分类器，训练好的分类器在仅输入前期气象水文数据时，输出预测的未来类别，根据分类器输出的类别选择用干旱/湿润模型模拟降水-径流，兼顾了全序列样本的整体性与特定时期样本的专业性，显著提升了半干旱区降水-径流模拟的精度。

附图说明

图1为本发明方法流程示意图；

图2为本发明时序交叉验证数据划分示意图；

图3为本发明基于自注意力机制的时序卷积神经网络示意图；

图4为本发明BPX方法与现有Bai-Perron方法分别得到的干旱、湿润时期划分图；

图5为华县站全序列降水-径流模拟各模型MAE指标对比图；

图6为华县站全序列降水-径流模拟各模型RMSE指标对比图；

图7为华县站全序列降水-径流模拟各模型NSE指标对比图；

图8为华县站全序列降水-径流模拟各模型KGE指标对比图；

图9为华县站大型洪水场次中降水-径流模拟水文过程线图；

图10为华县站多步径流预测指标对比图；

图11为实施例1中华县站输入窗口率定对比图。

具体实施方式

下面结合附图和具体实例对本发明的技术方法作进一步的说明。

以下两个实施例以黄河中游支流渭河流域为例，在渭河上游林家村站、渭河下游华县站两个水文站的水文资料收集了日流量序列，华县站上游控制流域范围大，对半干旱区具有更好的代表性，因而将华县站控制流域作为主要试验实施流域，即实施例1；将林家村站控制流域作为验证流域，即实施例2。渭河上游林家村站、渭河下游华县站的气象资料可通过中国气象数据服务中心提供的相应控制流域、相应时间的气象序列提取，包括日平均的降水、气温、地表温度、相对湿度、蒸散发、气压数据。渭河上游林家村站、渭河下游华县站的径流数据由两个水文站的水文资料收集得到。

实施例1：如图1所示，本实施例的一种考虑半干旱区水文特征的数据驱动降水-径流模拟方法，包括以下步骤：

S1.获取逐日尺度实测气象水文数据，包括：径流、降水、气温、地表温度、相对湿度、蒸散发和气压，并进行数据预处理。径流数据包括华县站2001-2017年共6209日流量序列，华县站气象数据通过中国气象数据服务中心查询得到。

S2. 在图2所示的时序交叉验证的基础上划分4个训练-验证集，第一次训练-验证集划分以华县站2001、2002、2003年的日流量序列为训练集，2004-2017年的日流量序列为验证集，对训练集序列采用Bai-Perron突变点检验法对每年的日流量序列进行年内径流湿润、干旱时期划分；对验证集序列采用Bai-Perron突变点检验法对每年的日流量序列进行年内径流湿润、干旱时期划分，划分的湿润时期为如图4中位于下方的柱状条所示。

步骤S3.1，在训练集中，首先将训练集内气象数据序列窗口作为TCN-attention的输入数据，输出数据为径流量，预训练得到一个TCN-attention作为基础模型，时序卷积神经网络模型结构如图3。

窗口长度需要率定，本实施例中选择7天作为输入窗口长度。如图11所示，这些接受率定的时间窗口的结果指标中，5天和7天的效果是最好的，越长的时间窗口反而越不稳定，箱体越长表示越不稳定。而相对的，7天包含的信息量要大于5天，因此选择了7天作为最终时间窗口。

TCN由残差连接块组成，其中包含一维因果扩张卷积层和残差连接通道，最终由ReLU激活函数传递，即一维卷积层在同一特征下进行时空卷积，计算特征的不同卷积进行回归；残差连接通道将残差连接到一维卷积层信息回归之外的下一层，并通过将残差从一个区块传递到另一个区块来对残差进行拟合回归。

本申请在TCN上加入自注意力机制，加强全局历史信息对于降水-径流拟合的指导，其主要计算机制如下：

其中，K ^T指K 矩阵/向量的转置；的H _b是注意力层中第b个位置的隐藏状态，共有n1个位置，即隐藏状态被分成n1份映射；是大小为m的输入，即TCN的输出隐藏状态；O是注意层的输出；W是权重矩阵，包括W ^Q 、W ^K 、W ^V三个维度的投影矩阵，/>用于匹配值，/>是Q要匹配的向量（键），d _K是K的维度，/>是要提取的特征值，主要通过三个投影矩阵的梯度下降来拟合最佳的特征提取变换过程；T代表矩阵转置，Q和K矩阵相乘，需要把K转置一下；/>是归一化的激活函数。

步骤S3.2，根据不同方案（不同超参数配置方案）的模型预测效果，以NSE为主要考量指标，对基础模型参数进行人工经验性调整，调整代码中的参数设定，得到相对最佳参数配置与模型；基础模型参数包括堆叠层数、基础模型预训练学习率、时间序列样本长度、训练批量大小和扩张卷积核形状。

步骤S3.3，将步骤S2中对训练集序列采用Bai-Perron突变点检验得到的湿润时期的气象数据序列，输入到步骤32得到的基础模型后部决策层，本实施例选择后7层，输出数据为湿润时期的径流量，得到湿润模型；

将步骤S2中对训练集序列采用Bai-Perron突变点检验得到的干旱时期的气象数据序列，输入到步骤32得到的基础模型后部决策层，本实施例选择后7层，输出数据为干旱时期的径流量，得到干旱模型。

步骤S3.4，根据训练得到的效果，以NSE为主要考量指标，对湿润、干旱模型的参数分别进行人工经验性调整，得到相对最佳参数配置与模型，湿润、干旱模型的参数包括堆叠层数、微调学习率、训练批量大小、扩张卷积核形状和微调层数。

步骤S4，首先用训练集中Bai-Perron突变点检验得到的湿润、干旱序列训练极致梯度提升分类器XGBoost，具体做法是：将训练集中Bai-Perron突变点检验得到的湿润序列窗口及湿润类别作为XGBoost分类器的输入数据，窗口长度需要率定，与TCN的窗口长度一样，本实施例中选择7天作为输入窗口长度；将训练集中Bai-Perron突变点检验得到的干旱序列窗口及干旱类别作为XGBoost分类器的输入数据，以预测未来的湿润/干旱状态；此处干旱/湿润序列包括窗口期内的气象、径流和类别，输出数据是之后几天的类别；窗口长度需要率定，与TCN的窗口长度一样，本实施例中选择7天作为输入窗口长度；将输出结果与实测结果对比，调整超参数。

步骤S5，将华县站验证集除径流外的其他气象水文数据，输入到上述XGBoost分类器中，XGBoost分类器输出湿润/干旱，即XGBoost分类器预测了验证集的湿润/干旱状态，根据该预测状态，选择步骤S3.4中湿润/干旱模型，输入验证集的气象水文数据，进行降水-径流模拟，步骤S3.4中湿润/干旱模型输出模拟径流量，对验证集序列采用BPX方法对每年的日流量序列进行模拟后，得到的湿润时期为如图4中位于上方的柱状条所示；BPX能够考虑丰枯水年的径流与气象表现，BP更集中于径流值的高低，在枯水年如2004、2008，BP仅只包含部分主要洪峰，而BPX能够考虑全年相对多水时段；在10、17年这种也能纠正BP的明显错误。

实施例2：采用本方法对林家村站全序列进行降水-径流模拟。

下表1展示了在林家村站全序列降水-径流模拟对比结果。基本符合华县站表现出来的差异，进一步验证了BPX-TCN的优越性。

表1林家村站全序列降水-径流模拟对比结果

在当前数据挖掘背景下，强大的神经网络架构与充足的算力支持需要信息密度更高的样本数据。半干旱区洪水事件少，但容易造成水土流失、泥石流、山体滑坡等严重的社会、经济影响，如何在如此稀疏的洪水样本中充分挖掘有效的信息对于半干旱区水文预报、水资源规划是亟待解决的问题。

半干旱流域多数时间的土壤含水量在凋萎系数以下，在丰水时段的一场长降水过程中，流域产流模式将会出现从贫瘠土壤状态的超渗产流模式，向饱和土壤状态的蓄满产流模式转变。在少水时段，降水强度基本未达到土壤的下渗能力，包气带能够吸收净雨量，呈现单一形式的超渗产流关系。两种差异化明显的降水-径流关系，对现有的水文过程驱动模型或是单一的同质化神经网络形成了巨大的挑战。因此，本发明提出BPX方法以区分这两种差异化的时段，其中Bai-Perron根据历史各年的年内径流变化情况来识别年内最大的两个突变点作为“干转湿”与“湿转干”的转变时刻，XGBoost加入对气象因子的考量并实现对未来干旱/湿润时期的识别。在BPX根据数据表现的时段划分前提下，耦合TCN-attention神经网络，将TCN的局部感受野与attention的全局权重关联并建立气象-径流关系，以实现准确的径流模拟。

实施例3：本实施例将本方法与现有的过程驱动模型、数据驱动模型进行对比。

选用常用的新安江模型作为过程驱动模型对比代表，选用循环神经网络(RNN)、长短期记忆神经网络(LSTM)、门控制单元神经网络(GRU)作为数据驱动模型对比代表，从过程驱动模型和数据驱动模型两种角度对本申请提出的方法进行对比。

在模拟指标上，从一阶与二阶误差的角度选用四个模拟指标对模拟效果进行量化评定，包括MAE、RMSE、NSE、KGE，其中MAE与RMSE的值越小模拟效果越好，NSE与KGE的值越接近1模拟效果越好，具体计算方式如下：

式中，是第i个时刻的流量观测值；/>是第i个时刻的流量预测值；/>是观测值的平均值；n是样本数；/>是观测到的径流序列与预测的径流序列之间的皮尔逊相关系数；/>和/>是序列的平均值和标准偏差。

图5~图8展示了几种对比模型在华县站全序列降水-径流模拟结果，在所有评估模型中，新安江模型的 MAE = 80.12、RMSE = 213.36、NSE = 0.437 和 KGE = 0.415，在华县站上游流域的表现最差。对于未使用BPX方法（结合Bai-Perron突变点检验与XGBoost分类器）或自注意力机制的基本数据驱动模拟表现中，TCN>LSTM>GRU≈RNN。如果将自注意力机制添加到 LSTM 或 TCN 中，模型性能将得到进一步提高，尤其是 LSTM。如果分别使用干旱/湿润数据对数据驱动模型（RNN、GRU、LSTM 和 TCN）进行微调，可以观察到显著的改进。就 LSTM/TCN 模型而言，与采用BPX方法所取得的改进相比，采用注意力机制所取得的改进似乎较小，所有模型中BPX-TCN 的总体性能最佳。

图9中（a）、（b）、（c）分别展示了几种基于时序卷积神经网络模型，在华县站2007、2011、2017年大型洪水场次中降水-径流模拟结果，图9中（a）、（b）、（c）中的指标值依次显示了 TCN、BPX-TCN、TCN-Attention 和 BPX-TCN-Attention 的改进。具体来说，BPX-TCN-Attention 的表现与 TCN-Attention 相似，而 BPX-TCN 的表现则与 TCN 相当。这表明，在湿润时期或者大型洪水场次中，自注意力机制对 TCN 性能的改善可能比 BPX 方法更大。注意力机制的全局视角有助于洪水模拟中的模型拟合和偏差校正，BPX-TCN-Attention的表现会更稳定。

图10展示了几种基于时序卷积神经网络模型，在华县站径流多步预测的结果，在MAE、RMSE、NSE、KGE所有四个指标中，展现出BPX-TCN≈BPX-TCN-Attention>TCN>TCN-Attention 的趋势。TCN 和 TCN-Attention 之间的比较与之前的模拟结果一致，即添加自注意力机制后，TCN 的预测能力有了大幅提高。但是，BPX-TCN 和 BPX-TCN-Attention 都优于标准 TCN 模型。值得注意的是，BPX-TCN 在多步预测的第5天后不再保持明显优势，甚至低于BPX-TCN-Attention。这些发现与图9中的大型洪水场次中降水-径流模拟结果一致，表明在更具挑战性的任务中，加入自注意力机制可以改善结果，即BPX-TCN-Attention在多步径流预测中表现出更强的性能。

表1、图5~10中，不带BPX的模型都是不划分干、湿模型的结果，带BPX的模型就是基于“干旱与湿润时期存在差异化的水文循环机理”的前提下展开的，可以看出非常明显的差异。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种考虑半干旱区水文特征的数据驱动降水-径流模拟方法，其特征在于，包括以下步骤：

S1.获取研究区逐日尺度实测气象水文数据，并进行数据预处理；对整体时间序列采用时序交叉验证法划分多组训练集和验证集；

S2.对训练集每年径流采用Bai-Perron突变点检验进行年内湿润、干旱时期划分，分别得到湿润、干旱序列；

S3.在训练集中，用训练集内全序列预训练一个基于自注意力机制的时序卷积神经网络作为基础模型，再将Bai-Perron突变点检验得到的湿润、干旱序列分别输入基础模型后部决策层进行微调，分别得到湿润、干旱模型；步骤S3具体包括：

步骤S3.1，将训练集全序列输入到基于自注意力机制的时序卷积神经网络中，预训练基础模型，输入数据为前期气象水文时间序列窗口，包括气象数据和径流数据，输出数据为未来径流量；

步骤S3.2，根据数据表现出来的特征与训练得到的效果，对基础模型参数进行微调；

步骤S3.3，将步骤S2中Bai-Perron突变点检验得到的湿润、干旱序列分别输入步骤S3.2得到的基础模型后部决策层，根据训练得到的效果，对湿润、干旱模型的参数进行微调，分别得到湿润、干旱模型；

S4.用训练集中Bai-Perron突变点检验得到的湿润、干旱序列训练极致梯度提升分类器；训练极致梯度提升分类器的具体方法是：将训练集中Bai-Perron突变点检验得到的湿润序列窗口，包括径流在内的气象水文数据及湿润类别作为极致梯度提升分类器的输入数据，输出之后几天的类别；将训练集中Bai-Perron突变点检验得到的干旱序列窗口及干旱类别作为极致梯度提升分类器的输入数据，输出之后几天的类别；

S5.将验证集中除径流外的气象数据输入步骤S4的极致梯度提升分类器中，根据分类器预测的状态，选择步骤S3中对应的湿润/干旱模型进行降水-径流模拟。

2.根据权利要求1所述的一种考虑半干旱区水文特征的数据驱动降水-径流模拟方法，其特征在于，步骤S1中的气象水文数据包括：径流、降水、气温、地表温度、相对湿度、蒸散发和气压。

3.根据权利要求2所述的一种考虑半干旱区水文特征的数据驱动降水-径流模拟方法，其特征在于，步骤S1中对气象水文数据的预处理包括：

步骤S1.1，对径流、降水、气温、地表温度、相对湿度、蒸散发、气压数据进行一致性、白噪声检验；

；

式中，为经过Box-Cox变换后的径流序列；/>为原始径流序列，n₂是径流序列的长度；/>为Box-Cox变换参数，通过极大似然估计确定，以使变换后的数据满足典型线性回归模型的所有假设。