CN117332702A

CN117332702A - 基于ilstm的内涝水深预测与多因子时序分析方法

Info

Publication number: CN117332702A
Application number: CN202311627361.4A
Authority: CN
Inventors: 张书亮; 陈意文; 金恒旭; 杨祺琪; 赵宇; 鹿鹏程; 杨乐天; 郑上华; 严武杰
Original assignee: Nanjing Normal University
Current assignee: Nanjing Normal University
Priority date: 2023-11-30
Filing date: 2023-11-30
Publication date: 2024-01-02
Anticipated expiration: 2043-11-30
Also published as: CN117332702B

Abstract

本发明提出了一种基于ILSTM（Interpretable Long Short Term Memory）的内涝水深预测与多因子时序分析方法，具体如下：改进传统LSTM的隐藏层更新方式以及引入注意力机制得到本研究所采用的神经网络ILSTM；获得研究区影响水深的可能因子数据以及实时监测内涝水深数据，对数据进行数据预处理，包括卡尔曼滤波法进行异常数据处理、数据标准化，划分数据集为训练集、验证集以及测试集。采用训练集进行模型训练并采用验证集进行超参数自动搜索调优算法给出具有区域特点的一组超参数，设定超参数后得到模型。测试集输入模型得到水深结果以及多因子时序贡献，采用均方根误差、拟合优度评估最终预测结果的准确性。模型捕获多因子的时序状态并且在模拟精度以及物理解释性上均有说服力。

Description

基于ILSTM的内涝水深预测与多因子时序分析方法

技术领域

本发明属于水文水资源领域的城市内涝技术领域，具体涉及一种顾及多要素估计暴雨情景下城市内涝水深模拟方法。

背景技术

近年来，全球极端降雨天气频发，由降雨引发的内涝积水逐渐成为常态化风险，模拟内涝积水的方法众多，主要可以分为水动力模型模拟以及数值模型模拟，水动力模型由于涉及众多计算使得模型效率大大降低，难以满足暴雨内涝水深实时模拟以及预报的需求。数值模拟在提高模拟速度的同时，精度也能得到保证。可以精确模拟水深时序变化，并给出各时段水深预测结果和此过程中所涉及多变量时序贡献比例，在模拟精度得到保证的同时改善了深度学习可解释性差，机理性不强的缺点，模拟的内涝水深结果更有说服力。

目前，采用数据驱动的方式不需要使用者完全熟悉内涝水深的流动原理以及涉及参数的函数关系。通过建立水深和各种输入因子之间的函数关系，来预测区域水深演变。

机器学习的方法广泛用于城市内涝水深预测中，常见的数值模拟模型只能给出水深的预测结果，而其内部的计算过程以及变量之间的关系含糊，因此结果解释性较差。

针对以上问题，一种可解释性强的深度学习模型可以在模拟效率、模拟精度，原理性上解决问题。

发明内容

为解决现有数值模型解释力不足，本发明提出了一种预测准确度高可解释性强的ILSTM（Interpretable Long Short-Term Memory）模型，该模型由输入层、改进的隐藏层和输出层组成，可以捕捉降雨、气温、各种土地利用类型等多变量在时间序列中对地表水深积累的不同动态，并区分不同变量对时序预测的贡献。实现预测精度高可解释性强数值内涝水深模拟。

为达到上述的发明目的，本发明采用的技术方案为：

提供一种基于ILSTM的内涝水深预测与因子时序贡献分析方法，其包括以下步骤：

S1：获取目标地区的水文气象数据作为样本数据以及对数据预处理，所述样本数据应包括逐时降雨数据、DEM数据、路网密度、空气湿度、温度、土地利用类型以及目标变量逐时水深数据；

S2：设置由混合注意力机制融合的多层多因子内涝水深预测模型ILSTM；

S3：对步骤S1所得的样本数据进行标准化操作，并划分样本数据为训练集、验证集和测试集；

S4：将步骤S3所得的训练集和验证集输入S2构建的内涝水深预测模型中，设置模型参数，然后进行训练评估并使用超参数自动搜索和优化；

S5：确定最优模型，利用测试集实现内涝水深预测；

S6：在步骤S5的预测过程中捕获不同输入因子的时序变化动态，生成各因子时序贡献曲线。

进一步地，所述的S1包括以下步骤：

S11：将获取的数据进行预处理操作；

S12：将数据按照时间组合，形成自变量-目标变量数据集,/>，

。

进一步地，所述的S11包括以下步骤：

S111：数据预处理的数据主要包括降雨以及观测站所获得的水深数据，首先对获得的气象观测资料以及实测水深资料进行时间以及空间尺度比对；

S112：根据气象站的地理位置，采用泰森多边形算法进行区域划分，得到各个观测站的降雨时间序列；

S113：对不定长的降雨事件数据采用序列填充、序列截断方法，使每个降雨序列具有相同的长度，以适应模型输入的要求；

S114：各个观测点所获得的水深数据由于传感器的工作时间以及采样率不均匀，对数据进行重采样使得与降雨量时间尺度以及序列长度上保持一致。对新增加的重采样空白区间进行数据插值时，可以考虑使用不同的插值方法，包括线性插值、最近邻插值、双线性插值和双三次插值。这些方法可以根据具体情况选择，以获得合适的插值效果。

S115：设定异常数据矫正规则；

进一步地，步骤S2中ILSTM结构设计包括以下步骤：

S21：ILSTM的层设计；

S22：生成时序多因子贡献度；

S23：混合注意机制设置。

其中，步骤S21中ILSTM层设计包括以下步骤：

S211：ILSTM包括输入层、改进的隐藏层以及输出层，计算公式如下：

，

其中：表示输入门，/>表示遗忘门，/>表示输出门，/>表示记忆单元，/>表示输入项，/>运算符号表示按矩阵行求和，/>表示偏置项，/>表示时间步长为/>的隐藏状态矩阵,/>表示输入到隐藏层的转换权重矩阵，/>表示隐藏层之间的转换权重矩阵，/>表示隐藏层状态更新。

其中，步骤S22中ILSTM生成时序多因子贡献度，包括以下步骤：

S221构建多变量输入序列以及目标序列/>其中/>以及均为列向量；

S222：叠加输入序列和目标序列得到，/>和/>都是多维向量；

S223：通过学习非线性映射来预测目标序列的下一个值，/>给出变量以及时间重要性度量。

其中，步骤S23中ILSTM混合注意机制设计，包括以下步骤：

S231：特征输入和序列编码，将输入的多变量转换成固定维度的向量表示，然后输入到LSTM网络进行序列编码，

S232：注意力计算，上一步对输入的多变量时间序列进行循环遍历，每一时间步更新隐藏层状态，每个时间步，注意力机制计算每个变量特征对目标变量的影响权重，得到每个变量的时间状态贡献序列，

S233：权重融合，计算得到的注意力权重与相应的多变量特征向量相乘，将加权特征向量进行求和，得到最后的加权表示，用于输入后续的全连接层用于目标变量的预测。

进一步地，步骤S3对样本数据进行标准化包括以下步骤：

S31：建立水文数据集合W和降雨数据集合R，分别存储区域易涝点检测的内涝水文数据和区域所有雨量站采集的各个降雨事件数据，并根据时空信息将水文数据与降雨数据进行匹配；

S32：对数据进行归一化处理，将所有数据范围缩小在0-1之间，最值归一化通过下式计算：

，

上式中，是原始的序列数据，/>是归一化后的序列数据，/>表示内涝时序数据集中某个特征因子的序列最大值，/>表示内涝时序数据集中某个特征因子的序列最小值；

S33：将多要素内涝时序数据重构为有监督数据，假设当前时间为，输入前三个时间步即/>，/>，/>时刻的各要素历史观测值，预测未来两个时间步即/>，/>时刻的水深值；创建一个有输入-输出关系的数据集，用于训练和预测内涝水深变化。

S34：使用序列填充的方式，将每个序列填充到相同的长度，以满足模型输入的要求。在填充过程中，使用默认的填充值为0.0，将填充操作应用于序列的开头或结尾。这样可以转换数据为适合模型训练的有监督形式。

S35：设定异常数据判定规则，使用卡尔曼滤波法检查每一行数据记录，自动校正异常数据，并将校正后的数据作为模型输入数据；

S36：将标准化后的数据划分成训练集train，验证集valid和测试集test。

进一步地，步骤S4中模型训练以及超参数自动优化计算包括以下步骤：

S41：初始化模型超参数；

S42：使用自适应矩估计Adam优化算法优化学习率，更新学习率通过下式计算：

，

,

，

上式中，表示梯度，/>表示梯度/>的一阶矩，/>表示梯度/>的二阶矩，/>、/>表示/>、/>的偏置矫正，/>，/>的默认值为0.001，/>和/>为平滑参数，通常取0.9和0.99，/>表示/>时刻的/>取值，/>表示/>时刻的参数矩阵；

S43：使用丢弃法处理过拟合现象，即在训练多层网络模型时，梯度前向传播和反向传播的过程中随机隐藏神经元，暂不参与此次训练；

S44：训练模型并计算损失函数；

S45：使用超参数自动搜索优化方法更新模型所采用超参数，使用相关模型评价指标评估每次模型训练所采用超参数的优劣。

进一步地，所述的S45包括以下步骤：

S451：输入GIS数据与水文气象数据构成的城市暴雨内涝多因子-水深时序数据集；

S452：列举可调整的超参数范围，并且为合理衡量数据驱动的城市暴雨内涝水深预测模型的表现和性能引入相关评价指标；

S453：构建基于多变量数据的可解释性ILSTM，由输入层、改进的隐藏层以及输出层组成，ILSTM由输入层、改进的隐藏层以及输出层组成；

S454：超参数设置初始值，将训练集数据带入模型开展模型的学习训练；

S455：使用当前选择的超参数，构建预测模型结构，并根据验证集数据自动地优化模型参数。

S456：基于当前选定的超参数，通过测试集数据评估模型性能。；

S457：判定是否超参数遍历完毕，若完成，则打印参数结果。

进一步地，所述的S5包括以下步骤：

S51：根据超参数自动搜索算法返回的参数值设置最优模型；

S52：利用测试集实现内涝水深预测；

S53：对比模型给出的水深输出值与实测水深值，进行模型准确性评估；

进一步地，步骤S53模型得出的水深预测以及真实水深之间的精度评估包括以下步骤：

S531：设定模型中S457所选定的各个超参数，引入均方误差、均方根误差/>、平均绝对误差MAE和拟合优度/>，使用测试集数据对模型所采用超参数的优劣即预测结果的准确性进行评估，具体计算公式如下：

，

其中，代表样本中数据个数，/>代表模型预测水深值，/>表示真实观测值，/>表示真实观测平均值。

进一步地，步骤S6不同输入自变量因子的时序贡献计算以及曲线生成包括以下步骤：

S61：数据输入后，ILSTM在LSTM的基础上做出改进，变量的隐藏状态矩阵为：，输入到隐藏状态的转换/>，

隐藏层状态更新为：

，

其中：表示过渡权重，/>，/>表示向量沿轴计算，/>和/>用于捕获隐藏状态上一步的更新以及新的输入，使用/>替换标准LSTM的隐藏状态更新；表示偏置项，

S62：变量混合注意追踪；

S63：变量时序贡献曲线生成。

进一步地，所述的S62包括以下步骤：

S621：对每个变量对应的隐藏状态进行时间关注，得到每个变量的隐藏状态集；

S622：利用每个变量隐藏状态集推导出变量注意力。

进一步地，所述的S63包括以下步骤

S631：调用matplotlib库实现自变量因子时序贡献曲线。

本发明与现有技术相比，具有如下的优点和有益效果：

1、考虑到影响暴雨内涝水深的多种因素，将水深时空预测的多种因子作为模型输入，构建了数据驱动的暴雨内涝水深预测模型，实现基于ILSTM的内涝水深预测以及多因子时序贡献分析。通过建立科学合理的模型结构，在可解释性以及精度上都具有说服力，

2、克服了仅考虑单一因素数据驱动模型导致暴雨内涝水深模拟结果不准确，解释性低的弊端，将可能影响内涝水深的各个因子引入数值模型，综合利用多源地理信息数据及水文气候资料，更准确地刻画真实暴雨内涝水深的时空演化特征。通过改进基础LSTM的隐藏层状态更新提高暴雨内涝模拟结果的准确性与可解释性，为城市暴雨实时水深计算、抗洪抗险提供支撑与决策，

3、与物理模型相比，物理模型对于模拟城市内涝水深时需要耗费大量计算时间且涉及研究区域建模及众多参数，不具有可迁移性。使用ILSTM进行城市暴雨内涝水深计算可以显著提高模拟速度，在研究区数据充足情况下可以进行快速模拟。

附图说明

图1为本发明方法框架图；

图2是卡尔曼滤波法进行异常数据矫正流程；

图3为超参数自动搜索优化算法流程图；

图4为ILSTM的结构图；

图5为隐藏层状态更新过程。

具体实施方式

以下是本发明实施例的技术方案的详细描述，结合附图进行说明。这些描述将清晰而完整地阐述本发明实施例中的技术方案。

实施例：根据以往暴雨情景城市内涝情况选取内涝易发生社区作为研究实验区域，所需数据有该区域降雨数据，地形数据，路网密度，土地利用类型以及不同降雨情境下的内涝水深实测值。获取数据之后，本发明对数据进行处理，对原始获得的数据进行变换与组织，得到时间对应的各要素的数据集，对数据集进行划分，一般划分训练集70%，验证集20%和测试集10%。对改进的ILSTM进行训练，采用超参数自动搜索算法找到适合于研究区域的一组超参数

本发明设置混合注意力机制整合多源信息，利用每个变量的隐藏状态序列，增强模型对输入数据的建模能力。

如图1所示，本发明提供了一种基于LSTM的内涝水深预测以及因子时序贡献可视化的方法，该方法主要以下步骤：

S1：获取目标地区的水文气象数据作为样本数据以及对数据预处理，所述样本数据应包括降雨数据、DEM数据、路网密度、空气湿度、温度、土地利用类型以及目标变量水深等；

S5：确定最优模型，利用测试集实现内涝水深预测；

S6：在步骤S5的预测过程中捕获不同输入因子的时序变化动态，生成各因子时序贡献曲线；

进一步地，所述的S1包括以下步骤：

S11：本发明所需的数据格式以及数据描述如下，获得数据并对数据进行以下预处理操作；

表1：数据要求

S12：将数据按照时间组合，形成自变量-目标变量数据集,/>,

。

进一步地，所述的S11包括以下步骤：

S113：对非结构化的降雨事件数据，使用序列补齐和截断的方法，将每个降雨序列调整为相同的长度，以适应模型的输入要求。

S114：各个观测点所获得的水深数据由于传感器的工作时间以及采样率不均匀，对数据进行重采样使得与降雨量时间尺度以及序列长度上保持一致。对新增加的重采样空白区间进行数据插值，可采用线性插值法、最近邻插值法、双线性插值以及双三次插值；

S115：设定异常数据矫正规则。

表2：基于卡尔曼滤波的异常数据矫正规则

进一步地，步骤S2中ILSTM结构设计包括以下步骤：

S21：ILSTM的层设计；

S22：生成时序多因子贡献度；

S23：混合注意机制设置。

其中，步骤S21中ILSTM层设计包括以下步骤：

其中：表示输入门，/>表示遗忘门，/>表示输出门，/>表示记忆单元，/>表示输入项，/>运算符号表示按矩阵行求和，/>表示偏置项，/>表示时间步长为/>的隐藏状态矩阵,/>表示输入到隐藏层的转换权重矩阵，/>表示隐藏层之间的转换权重矩阵，/>表示隐藏层状态更新。ILSTM的结构图如4所示。

进一步地，步骤S22中ILSTM生成时序多因子贡献度，包括以下步骤：

S221构建多变量输入序列以及目标序列/>其中/>以及/>均为列向量；

S222：叠加输入序列和目标序列得到，/>和/>都是多维向量；

其中，步骤S23中ILSTM混合注意机制设计，包括以下步骤：

进一步地，步骤S3对样本数据进行标准化包括以下步骤：

，

S35：设定异常数据判定规则，使用卡尔曼滤波法检查每一行数据记录，自动校正异常数据，并将校正后的数据作为模型输入数据。如图2所示，显示了卡尔曼滤波矫正数据的过程；

S41：初始化模型超参数；

，

,

，

S44：训练模型并计算损失函数；

S45：使用超参数自动搜索优化方法更新模型所采用超参数，使用相关模型评价指标评估每次模型训练所采用超参数的优劣。超参数自动搜索方法流程如图3所示。

进一步地，所述的S45包括以下步骤：

S457：判定是否超参数遍历完毕，若完成，则打印参数结果。

进一步地，所述的S5包括以下步骤：

S51：根据超参数自动搜索算法返回的参数值设置最优模型；

S52：利用测试集实现内涝水深预测；

S53：对比模型给出的水深预测与真实水深值，进行模型精度评估；

进一步地，S53：对比模型给出的水深输出值与实测水深值，进行模型准确性评估；

，

隐藏层状态更新为：

，

其中：表示过渡权重，/>，/>表示向量沿轴计算，/>和/>用于捕获隐藏状态上一步的更新以及新的输入，使用/>替换标准LSTM的隐藏状态更新；/>表示偏置项，

S62：混合注意机制跟踪，隐藏状态更新如图5所示；

S63：变量时序贡献曲线生成；

进一步地，所述的S62包括以下步骤：

S622：利用每个变量隐藏状态集推导出变量注意力。

进一步地，所述的S63包括以下步骤：

S631：调用matplotlib库实现自变量因子时序贡献曲线。

以上的说明仅旨在帮助理解本发明的方法和核心概念。同时，根据本发明的思想，在具体的实施方式和应用范围中，一般技术人员可能会进行适当的修改。因此，本说明书的内容不应被视为对本发明的限制。

Claims

1.一种基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，包括以下步骤：

S1：获取目标地区的水文气象数据作为样本数据以及对数据进行预处理；

S2：构建由混合注意力机制融合的多层多参数内涝水深预测模型ILSTM；

S3：对步骤S1所得的样本数据进行标准化操作，划分样本数据为训练集、验证集和测试集；

S4：将步骤S3所得的训练集和验证集输入S2构建的内涝水深预测模型中，设置模型参数进行训练评估并使用超参数自动搜索和优化；

S5：确定最优模型，利用测试集实现内涝水深预测；

S6：在步骤S4的预测过程中捕获不同输入因子的时序变化动态，生成各因子时序贡献曲线；

其中，步骤S2中ILSTM结构设计包括以下步骤：

S21：ILSTM的层设计；

S22：生成时序多因子贡献度；

S23：混合注意机制设置。

2.根据权利要求1所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S21中ILSTM层设计包括以下步骤：

其中：表示输入门，/>表示遗忘门，/>表示输出门，/>表示记忆单元，/>表示输入项，运算符号表示按矩阵行求和，/>表示偏置项，/>表示时间步长为/>的隐藏状态矩阵, />表示输入到隐藏层的转换权重矩阵，/>表示隐藏层之间的转换权重矩阵，/>表示隐藏层状态更新。

3.根据权利要求2所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S22中ILSTM生成时序多因子贡献度，包括以下步骤：

S222：叠加输入序列和目标序列得到，/>和/>都是多维向量；

4.根据权利要求1所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S23中ILSTM混合注意机制设计，包括以下步骤：

5.根据权利要求1所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S1中样本数据包括降雨数据、DEM数据、路网密度、空气湿度、温度、土地利用类型以及目标变量水深，进行标准化包括以下步骤：

S11：将获取的数据进行预处理操作；

S12：将数据按照时间组合，形成自变量-目标变量数据集 , />,

。

6.根据权利要求5所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S11对数据进行预处理操作包括以下步骤：

S114：各个观测点所获得的水深数据由于传感器的工作时间以及采样率不均匀，对数据进行重采样使得与降雨量时间尺度以及序列长度上保持一致，对新增加的重采样空白区间进行数据插值，采用线性插值法、最近邻插值法、双线性插值以及双三次插值；

S115：设定异常数据矫正规则。

7.根据权利要求1所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S3对样本数据进行标准化包括以下步骤：

，

S33：将多要素内涝时序数据重构为有监督数据，假设当前时间为，输入前三个时间步即/>，/>，/>时刻的各要素历史观测值，预测未来两个时间步即/>，/>时刻的水深值；

S34：通过序列填充的方法使每个序列具有相同的长度以满足模型输入的要求，其中序列填充方法为，默认填充值为0.0，在序列开始或结束部分进行填充，并转化为有监督数据；

8.根据权利要求1所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S4中模型训练以及超参数自动优化计算包括以下步骤：

S41：初始化模型超参数；

，

,

，

上式中，表示梯度，/>表示梯度/>的一阶矩，/>表示梯度/>的二阶矩，/>、/>表示、 />的偏置矫正，/>，/>的默认值为0.001，/>和/>为平滑参数，分别选取0.9和0.99，/>表示/>时刻的/>取值，/>表示/>时刻的参数矩阵；

S44：训练模型并计算损失函数；

9.根据权利要求8所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S45超参数自动搜索优化以及评估包括以下步骤：

S451：输入融合多元水文气象数据的城市暴雨内涝时序数据集；

S452：以可枚举的列表形式设置超参数如：批大小、隐藏层数、各个隐藏层的节点数、学习率、丢弃比例和迭代次数的取值范围，并且未合理衡量数据驱动的城市暴雨内涝水深预测模型的表现和性能引入相关评价指标；

S453：构建基于多变量数据的可解释性ILSTM，由输入层、改进的隐藏层以及输出层组成；

S455：使用本轮选定的各个样例超参数来设置预测模型结构，并且利用验证集数据自适应地调整模型参数；

S456：在本轮选定的各个超参数下，使用测试机数据对模型表现的好坏进行衡量评估；

S457：判断所有的超参数是否遍历结束，如果结束，则打印出各个参数的具体结果。

10.根据权利要求1所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S5确定最优模型并利用测试集实现内涝水深预测包括以下步骤：

S51：根据超参数自动搜索算法返回的参数值设置最优模型；

S52：利用测试集实现内涝水深预测；

S53：对比模型给出的水深预测与真实水深值，进行模型精度评估。

11.根据权利要求10所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S53模型得出的水深预测以及真实水深之间的精度评估包括以下步骤：

，

12.根据权利要求1所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，步骤S6不同输入自变量因子的时序贡献计算以及曲线生成包括以下步骤：

隐藏层状态更新为：

，

其中：表示过渡权重，/>，/>表示向量沿轴计算，/>和/>用于捕获隐藏状态上一步的更新以及新的输入，使用/>替换标准LSTM的隐藏状态更新,/>表示偏置项，

S62：变量混合注意追踪；

S63：变量时序贡献曲线生成。

13.根据权利要求1所述的基于ILSTM的内涝水深预测与多因子时序分析方法，其特征在于，所述的S62混合注意机制追踪过程包括以下步骤：

S621：对每个变量对应的隐藏状态进行时间关注，得到每个变量的隐藏状态集,

S622：利用每个变量隐藏状态集推导出变量注意力。