CN112561132A

CN112561132A - 一种基于神经网络的水流量预测模型

Info

Publication number: CN112561132A
Application number: CN202011375737.3A
Authority: CN
Inventors: 王�琦
Original assignee: Xian Cresun Innovation Technology Co Ltd
Current assignee: Xian Cresun Innovation Technology Co Ltd
Priority date: 2020-11-30
Filing date: 2020-11-30
Publication date: 2021-03-26

Abstract

本发明公开了一种基于神经网络的水流量预测模型，包括分支网络组和全连接网络；分支网络组包括基于循环神经网络构建的第一分支网络和基于图卷积神经网络和循环神经网络构建的第二分支网络；第一分支网络用于对第一数据进行时序特征提取；第一数据基于N个水文站点中位于预定流域的出口断面处的目标水文站点的历史K年各小时流量数据构建；第二分支网络用于对第二数据中的降雨数据进行图数据特征提取和时序特征提取；第二数据基于N个水文站点的历史K年各小时降雨数据、N个水文站点的位置连接关系、未来P小时各水文站点的先验降雨数据构建；全连接网络用于对两个分支网络输出的特征进行合并分类预测得到目标水文站点未来P小时的流量预测值。

Description

一种基于神经网络的水流量预测模型

技术领域

本发明属于洪水预测领域，具体涉及一种基于神经网络的水流量预测模型。

背景技术

洪水是常见的自然灾害之一，每年有上亿人受洪水影响，流离失所，而洪水所造成的财力物力损失也非常巨大。有效地预测洪水流量并及时发出预警对于防洪减灾具有重大意义。

当前的基于神经网络的水流量预测模型主要分为传统物理模型和智能洪水预测模型。传统物理模型例如新安江模型，其是在充分挖掘当地的地形地貌、蒸发量、植被覆盖率等物理特征的前提下，进行物理过程的参数计算，最终制定出的一套具有区域针对性的预测模型。而智能洪水预测模型是以海量的历史数据作为先验知识，利用机器学习等智能方法得到的从输入特征到输出特征的函数映射或者联合分布。

但现有的基于神经网络的水流量预测模型多属于单点预测，即预测未来一个时间点的流量情况，而在实际情况中，预测得到的单个时间点的流量数据缺乏实际应用价值。并且，现有的基于神经网络的水流量预测模型在利用降雨量数据时仅仅将其作为时间序列进行分析，并未考虑降雨量的空间分布情况，因此无法完全挖掘实际降雨数据所描述的信息，预测的准确性不高。

发明内容

本发明实施例的目的在于提供一种基于神经网络的水流量预测模型，以实现未来一个时间段的洪水流量预测，并充分挖掘实际降雨数据所描述的信息，得到与实际降雨情况相符的准确性高的预测结果的目的。具体技术方案如下：

顺次连接的分支网络组和全连接网络；所述分支网络组包括并联的第一分支网络和第二分支网络；所述第一分支网络基于循环神经网络构建，所述第二分支网络基于图卷积神经网络和循环神经网络构建；所述全连接网络基于全连接层构建；

所述第一分支网络，用于对第一数据进行时序特征提取；所述第一数据基于预定流域的N个水文站点中位于所述预定流域的出口断面处的目标水文站点的历史K年各小时流量数据构建；

所述第二分支网络，用于对第二数据中的降雨数据进行图数据特征提取和时序特征提取；所述第二数据基于所述N个水文站点的历史K年各小时降雨数据、所述N个水文站点的位置连接关系、预先获取的未来P小时各水文站点的先验降雨数据构建；

所述全连接网络，用于对两个分支网络输出的特征进行合并分类预测，得到所述目标水文站点未来P小时的流量预测值；其中N、K和P为大于1的自然数。

可选的，所述第一分支网络包括GRU模块；所述第二分支网络包括顺次连接的GCN模块、维度变化模块、GRU模块和注意力层；所述全连接网络包括concat模块和多个全连接层。

可选的，所述第一数据和所述第二数据的构建过程包括：

获取所述预定流域的原始降雨数据、原始流量数据，以及表征所述预定流域的N个水文站点位置连接关系的邻接矩阵；其中，所述原始降雨数据包括所述预定流域的N个水文站点的历史K年各小时降雨数据，所述原始流量数据包括所述N个水文站点中位于所述预定流域的出口断面处的目标水文站点的历史K年各小时流量数据；

将所述原始降雨数据、所述原始流量数据和预先获取的未来P小时各水文站点的先验降雨数据进行预处理，分别得到处理后降雨数据、处理后流量数据和处理后先验降雨数据；

利用所述邻接矩阵得到归一化拉普拉斯矩阵；

基于所述处理后流量数据构建第一数据，并基于所述处理后降雨数据、所述处理后先验降雨数据和所述归一化拉普拉斯矩阵，构建第二数据。

可选的，所述将所述原始降雨数据、所述原始流量数据和预先获取的未来P小时各水文站点的先验降雨数据进行预处理，分别得到处理后降雨数据、处理后流量数据和处理后先验降雨数据，包括：

将所述原始降雨数据进行数据剔除处理、数据补全处理和归一化处理，得到处理后降雨数据；

将所述原始流量数据进行归一化处理，得到处理后流量数据；

将所述未来P小时各水文站点的先验降雨数据进行归一化处理，得到处理后先验降雨数据。

可选的，所述将所述原始降雨数据进行数据剔除处理、数据补全处理和归一化处理，得到处理后降雨数据，包括：

将所述原始降雨数据中，数据数目低于预设数量的水文站点所对应的数据剔除，得到剩余降雨数据；

对所述剩余降雨数据中缺失的降雨数据，利用反距离加权法进行数据补全，得到补全降雨数据；

将所述补全降雨数据进行归一化处理，得到处理后降雨数据。

可选的，所述利用所述邻接矩阵得到归一化拉普拉斯矩阵，包括：

利用所述邻接矩阵得到度矩阵；

利用所述邻接矩阵和所述度矩阵得到归一化拉普拉斯矩阵。

可选的，所述基于所述处理后流量数据构建第一数据，并基于所述处理后降雨数据、所述处理后先验降雨数据和所述归一化拉普拉斯矩阵，构建第二数据，包括：

从所述处理后流量数据中选取T小时对应的数据构建第一数据；

从所述处理后降雨数据中选取T小时对应的数据与所述处理后先验降雨数据构建输入向量，由所述输入向量与所述归一化拉普拉斯矩阵以及预设的参数矩阵，构建第二数据；

其中，T为大于1的自然数，且T小于等于所述K年对应的小时数。

可选的，所述第一分支网络对第一数据进行时序特征提取的过程，包括：

将所述第一数据输入所述第一分支网络，利用所述第一分支网络的所述GRU模块进行时序特征提取，得到第一输出特征。

可选的，所述第二分支网络对第二数据中的降雨数据进行图数据特征提取和时序特征提取的过程，包括：

将所述第二数据中的所述归一化拉普拉斯矩阵以及所述预设的参数矩阵作为所述第二分支网络的网络结构参数；

将所述输入向量作为所述第二分支网络的输入，利用所述第二分支网络的所述GCN模块对所述输入向量进行图数据特征提取；

将所述GCN模块提取出的特征利用所述维度变化模块进行维度重构；

将维度重构后的特征利用所述第二分支网络的所述GRU模块进行时序特征提取；

将所述GRU模块提取出的特征利用所述注意力层进行加权处理，得到第二输出特征。

可选的，所述全连接网络对两个分支网络输出的特征进行合并分类预测，得到所述目标水文站点未来P小时的流量预测值的过程，包括：

将所述第一输出特征和所述第二输出特征输入所述全连接网络，利用所述concat模块进行特征合并，得到合并特征；

将所述合并特征利用所述多个全连接层进行分类预测，得到所述目标水文站点未来P小时的流量预测值。

本发明实施例所提供的方案中，利用各水文站点的连接关系，引入降雨的空间分布信息，并与历史降雨数据和未来先验降雨数据构建图数据，利用预先训练的基于神经网络的水流量预测模型的分支网络之一进行图数据特征提取，以及时序特征提取。并将历史流量数据利用基于神经网络的水流量预测模型的分支网络之另一进行时序特征提取，通过对两分支网络的输出特征进行合并分类预测，可以得到未来一个时间段的洪水流量预测值。本发明实施例首次将图卷积神经网络应用于洪水流量预测领域，所提出的预测模型可以一次性得到未来一个时间段的洪水流量预测结果，该结果考虑到降雨至流量变化过程中通过河道连接的水文站点的降雨对流量变化的影响，因此能够充分挖掘实际降雨数据所描述的信息，得到与实际降雨情况相符的预测结果，预测的准确性较高。

附图说明

图1为本发明实施例所提供的一种基于神经网络的水流量预测模型的一种结构示意图；

图2为本发明实施例所提供的一种基于神经网络的水流量预测模型的另一种结构示意图；

图3为本发明实施例作为示例的息县地图；

图4为本发明实施例的第一输入数据和输入向量的示例图；

图5为本发明实施例的预测过程示意图；

图6为本发明实施例的洪水峰值预测效果对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了实现未来一个时间段的洪水流量预测，并充分挖掘实际降雨数据所描述的信息，得到与实际降雨情况相符的准确性高的预测结果的目的，本发明实施例提供了一种基于神经网络的水流量预测模型。

下面，首先对本发明实施例所提供的一种基于神经网络的水流量预测模型进行介绍。

如图1所示，图1为本发明实施例所提供的一种基于神经网络的水流量预测模型的一种结构示意图；本发明实施例所提供的一种基于神经网络的水流量预测模型，可以包括：

顺次连接的分支网络组和全连接网络；分支网络组包括并联的第一分支网络和第二分支网络；第一分支网络基于循环神经网络构建，第二分支网络基于图卷积神经网络和循环神经网络构建；全连接网络基于全连接层构建；

第一分支网络，用于对第一数据进行时序特征提取；第一数据基于预定流域的N个水文站点中位于预定流域的出口断面处的目标水文站点的历史K年各小时流量数据构建；

第二分支网络，用于对第二数据中的降雨数据进行图数据特征提取和时序特征提取；第二数据基于N个水文站点的历史K年各小时降雨数据、N个水文站点的位置连接关系、预先获取的未来P小时各水文站点的先验降雨数据构建；

全连接网络，用于对两个分支网络输出的特征进行合并分类预测，得到目标水文站点未来P小时的流量预测值；其中N、K和P为大于1的自然数。

预定流域是一个地理区域，在该地理区域内包含N个水文站点，用于监测降雨情况，每个水文站点可以记录并存储该水文站点每小时的降雨数据；N个水文站点中有一个目标水文站点位于预定流域的出口断面，用于监测该预定流域出口断面的水位及流量的变化情况。因此，目标水文站点还可以记录并存储其每小时的流量数据。

以下，首先对本发明实施例的基于神经网络习的水流量预测模型进行简单介绍，关于第一数据和第二数据的构建过程在后文中予以介绍。

循环神经网络(Recurrent Neural Network,RNN)是一种专门处理具有时序特征的神经网络，其内部特殊的隐含状态传递机制，可以使得当前的数据特征传递给下一时刻合并分析。从而让整个序列具有时间上的因果连续性。可选的，本发明实施例使用RNN的变体结构GRU网络(Gate Recurrent Unit)，相比于RNN，GRU添加了遗忘门，可以有效的防止时序过长导致的梯度爆炸问题。

并且，发明人考虑到由降雨过程到流量变化的过程是降雨量的汇聚过程，在降雨量汇聚的过程中，位于同一河道上的水文站点的流量将一起汇聚然后传递到下游。不具有河道连接关系的水文站点之间的降雨量则相对独立。发明人进行分析发现，本发明实施例这种涉及到元素之间连接关系的场景，比较适合采用图数据进行表征。图数据一般用G＝(V,E)表示，V中元素为顶点(vertex)，E中元素为边(edge)。而图卷积神经网络(GraphConvolutional Network，GCN)可以有效地对图数据进行特征提取从而实现分类或者预测任务。图卷积的核心思想是利用边的信息对节点信息进行聚合从而生成新的节点表示。GCN的本质目的就是用来提取拓扑图的空间特征。因此，发明人考虑可以将水文站点抽象为图数据G中的节点V，将水文站点之间按照实际河道的连接关系抽象为对应节点之间的边E。随后采用GCN网络进行图数据特征提取，再结合其余处理模块，实现对目标水文站点未来一段时间的流量预测。

本发明实施例为了实现未来一个时间段的洪水流量的准确预测，采用Seq2Seq模型的生成模式，结合降雨的空间分布特征，利用GCN网络和GRU网络构建基于神经网络的水流量预测模型。其中，Seq2Seq是一种循环神经网络的变种，常用于自然语言处理领域，是输出的长度不确定时采用的一种模型。

可选的一种实施方式中，本发明实施例基于python搭建基于神经网络的水流量预测模型，如图2所示，图2为本发明实施例所提供的一种基于神经网络的水流量预测模型的另一种结构示意图。该基于神经网络的水流量预测模型中：

第一分支网络包括GRU模块；第二分支网络包括顺次连接的GCN模块、维度变化模块、GRU模块和注意力层；全连接网络包括concat模块和多个全连接层。

其中，GRU模块是基于GRU网络构建的。GCN模块是基于GCN网络构建的。concat是神经网络中特征融合的一种方式，是通道数的合并。

可选的一种实施方式中，第一分支网络的GRU模块包括三个GRU层；第二分支网络的GCN模块包括三个GCN层，第二分支网络的GRU模块包含三个GRU层。第一分支网络和第二分支网络的三个GRU层的卷积核数量分别为50、30和20。全连接网络包括三个全连接层，神经元数量分别为50、40和24。

本发明实施例的基于神经网络的水流量预测模型是利用N个水文站点的历史数据中的T个小时的降雨数据、流量数据，在后的P小时的降雨数据和流量数据，以及N个水文站点的位置连接关系训练得到的。T为大于1的自然数，且T小于等于K年对应的小时数。可选的，本发明实施例中，T＝100，P＝24。

比如，可以利用历史数据中2013至2017年的100小时的降雨数据和流量数据、基于50个水文站点的位置连接关系得到的归一化拉普拉斯矩阵L、针对待预测时间段为24小时的已知的各水文站点降雨数据，以及参数矩阵W，构建若干个样本数据组，每一样本数据组包括第一样本数据和第二样本数据(参考后文第一数据和第二数据的构建过程)。

基于若干个样本数据组，依次利用基于神经网络的水流量预测模型进行训练，每次训练中，将第一样本数据输入第一分支网络，将第二样本数据中的输入向量X输入第二分支网络，并利用归一化拉普拉斯矩阵L和预设的参数矩阵作为第二分支网络的网络结构参数，以该样本数据组针对待预测时间段为24小时的目标水文站点已知的流量数据作为真值，进行迭代训练，比如迭代达到100次，直至获得训练好的模型参数，即得到训练完成的基于神经网络的水流量预测模型。关于模型训练过程概述为如下步骤。

1)将每一样本数据组和对应的真值，通过如图2结构所示的初始的网络模型进行训练，获得各样本数据组的训练结果。

2)将每一样本数据组的训练结果与该样本数据组对应的真值进行比较，得到该样本数据组对应的预测结果。

3)根据各个样本数据组对应的预测结果，计算网络模型的损失值。

4)根据损失值调整网络模型的参数，并重新进行1)-3)步骤，直至网络模型的损失值达到了一定的收敛条件，也就是损失值达到最小，这时，意味着每一样本数据组的训练结果与该样本数据组对应的真值一致，从而完成网络模型的训练，得到训练完成的基于神经网络的水流量预测模型。

具体的，训练过程采用Adam(Adaptive moment estimation)梯度下降的优化算法，以获得较好的损失下降过程。损失函数采用MSE(mean-square error，均方误差)。学习率为0.01。训练轮次为100，每轮每次输入的数据数目为32。

在基于神经网络的水流量预测模型训练完毕后，可以基于输入数据进行预测，得到目标水文站点未来P小时的流量预测值。

以下介绍第一数据和第二数据的构建过程和模型的预测过程。在模型预测领域中，输入数据的构建过程可以理解为模型的样本构建过程，是模型预测过程必不可少的环节。

首先，第一数据和第二数据的构建过程可以包括以下步骤：

S1，获取预定流域的原始降雨数据、原始流量数据，以及表征预定流域的N个水文站点位置连接关系的邻接矩阵；

其中，原始降雨数据包括预定流域的N个水文站点的历史K年各小时降雨数据，原始流量数据包括N个水文站点中位于预定流域的出口断面处的目标水文站点的历史K年各小时流量数据；

在本发明实施例中，可以从N个水文站点处获取历史K年各小时的降雨量数据生成原始降雨数据，从目标水文站点处获取历史K年各小时的水流量数据生成原始流量数据。作为优选的实施方案，历史K年可以为历史数据中，距离当前时间最近的连续K年。

作为本发明实施例的具体示例，选择中国河南省的息县流域作为预定流域，息县流域共有50个水文站点，时间范围可以选择为2013年～2018年，即N＝50，K＝6。获得的原始降雨数据和原始流量数据的示例如表1和表2所示，因作为形式示例，具体数值不进行示出。其中，TM为时间戳，以一小时为单位；S1～S50表示50个水文站点的降雨数据。Q表示目标水文站点的流量数据，S1～S50、Q均以毫米为单位。

表1原始降雨数据示例表

TM	S1	S2	…	S50
					2013年1月1日0时	/	/	/	/
2013年1月1日1时	/	/	/	/
					……	/	/	/	/
2013年12月31日23时	/	/	/	/
					……	/	/	/	/
2018年12月31日23时	/	/	/	/

表2原始流量数据示例表

TM	Q
		2013年1月1日0时	/
2013年1月1日1时	/
		……	/
2013年12月31日23时	/
		……	/
2018年12月31日23时	/

本领域技术人员可以理解的是，表1示例的整个表格维度为[(6×365×24+1)，51]＝[52561,51]。表2示例的整个表格维度为[52561,2]。

因此，为了实现发明人利用GCN的上述设想，在S1步骤中，除了获取预定流域的原始降雨数据、原始流量数据之外，还需要根据GCN网络的需要，获取表征预定流域的N个水文站点位置连接关系的邻接矩阵。邻接矩阵(Adjacency Matrix)是表示顶点之间相邻关系的矩阵，可以用来将一个图数据进行数值表示。获取该邻接矩阵的过程可以包括：

获取预定流域的N个水文站点和河道连接关系的资料，从中确定各水文站点之间的位置连接关系。依据确定的位置连接关系，生成各水文站点之间的邻接矩阵。可选的一种实施方式中，可以包括以下方式：

获取预定流域的N个水文站点的位置图，比如该位置图可以是包含预定流域的N个水文站点的地图，在具体示例中，该地图可以如图3所示，图3为本发明实施例作为示例的息县地图。从位置图中可以获知不同水文站点之间通过预定流域的河道的连接关系。通过上述连接关系可以建立一个邻接矩阵，用于表示N个水文站点中每两个水文站点之间是否具有连接关系。

得到的邻接矩阵A中，元素a_i,j代表水文站点i和水文站点j的连接关系，如果a_i,j＝1，代表水文站点i和水文站点j之间存在边，即具有连接关系；如果a_i,j＝0，代表水文站点i和水文站点j之间不存在边，即不具有连接关系。并且，各水文站点考虑自连接，即a_i,i＝1。本发明实施例共计N个水文站点，因此得到的邻接矩阵A为N×N的矩阵。

S2，将原始降雨数据、原始流量数据和预先获取的未来P小时各水文站点的先验降雨数据进行预处理，分别得到处理后降雨数据、处理后流量数据和处理后先验降雨数据。

可选的一种实施方式中，S2步骤可以包括S21～S23步骤：

S21，将原始降雨数据进行数据剔除处理、数据补全处理和归一化处理，得到处理后降雨数据。

可选的一种实施方式中，S21可以包括S211～S213：

S211，将原始降雨数据中，数据数目低于预设数量的水文站点所对应的数据剔除，得到剩余降雨数据。

在实际中，由于疏漏等原因，水文站点的降雨数据可能存在缺失，可以理解的是，如果使用缺失数据过多的原始降雨数据进行计算，会影响后续预测的准确性，因此，首先需要对缺失数据过多的水文站点的数据进行剔除。

比如针对表1的原始降雨数据，如果某一个水文站点的降雨数据的数目低于预设数量30000，则表明现存数据比例已经小于

意味着数据缺失近半数，对于如此多的确实数据，没有必要在后续进行缺失值补全。因为如果对其进行缺失值补全，将会引入过多人工因素，使得模型泛化能力下降。使得最终神经网络学习到的规律不符合真实的数据关系。因此，可以将缺失数据较多的水文站点所对应的数据剔除，保留优选水文站点的降雨数据，得到剩余降雨数据。

关于预设数量可以根据原始降雨数据的维度以及数据精度的需要进行合理选择。

S212，对剩余降雨数据中缺失的降雨数据，利用反距离加权法进行数据补全，得到补全降雨数据。

本领域技术人员可以理解的是，在剩余降雨数据中仍会有一些时间点的降雨数据存在缺失，可以使用缺失值补全算法对缺失的降雨数据进行补全。

其中，反距离加权算法(Inverse Distance Weighted，IDW)是缺失值补全的经典算法。反距离加权算法按照距离越远，相关性越小的原则，使用临近水文站点的降雨数据来对某一水文站点的缺失降雨数据进行补全。反距离加权算法的公式如下公式(1)所示。

针对本发明实施例，公式(1)中_x为出现数据缺失的水文站点的降雨数据估计值；M为参与计算的水文站点个数；x_r为相邻水文站点的降雨数据实际值；d_r为参与计算的相邻水文站点距离数据缺失的水文站点的实际距离；p为计算距离向量的范数类型，一般可以取值为2。

利用上述反距离加权算法可以对剩余降雨数据中缺失降雨数据的水文站点的降雨数据补全，从而得到补全降雨数据。即表1中的数据得以完整填充。

S213，将补全降雨数据进行归一化处理，得到处理后降雨数据。

归一化是一种无量纲处理手段，使物理系统数值的绝对值变成某种相对值关系。是简化计算，缩小量值的有效办法。通过合适的归一化处理，可以加快梯度下降求最优解的速度，降低模型参数数值大小，加快模型训练过程中的收敛速度，改善模型的性能，提高精度。

常用的归一化方法包括：min-max标准化、标准差标准化、非线性归一化等。由于降雨数据和流量数据并不满足正态分布，因此，本发明实施例优选的实施方案中，归一化处理包括[0,1]归一化处理。

[0,1]归一化处理属于min-max标准化，其通过对数据的每一个维度的值进行重新调节，使得最终的数据向量落在[0,1]之间。[0,1]归一化处理具体公式如下公式(2)所示。

其中，y_max和y_min分别是数据样本中的最大值和最小值；y是归一化前的原数据，y^*是归一化后的数据。

通过上述[0,1]归一化处理，可以得到补全降雨数据进行归一化处理后的处理后降雨数据。

S22，将原始流量数据进行归一化处理，得到处理后流量数据。

S22中的归一化处理与S213中的归一化处理相同。通过上述[0,1]归一化处理，可以得到原始流量数据进行归一化处理后的处理后流量数据。

S23，将未来P小时各水文站点的先验降雨数据进行归一化处理，得到处理后先验降雨数据。

未来P小时即为需要预测的未来时间段，P为大于1的自然数，比如P可以为24小时等等。本发明实施例可以通过天气预报等手段获知未来P小时每个水文站点的降雨数据，即未来P小时各水文站点的先验降雨数据，然后对获取到的先验降雨数据进行上述归一化处理，得到处理后先验降雨数据。

S3，利用邻接矩阵得到归一化拉普拉斯矩阵。

可选的一种实施方式中，S3可以包括S31和S32：

S31，利用邻接矩阵得到度矩阵。

度矩阵是图数据中常用的一种矩阵，其是对角阵，对角上的元素为各个顶点的度。度矩阵的计算公式如公式(3)所示。

其中，A表示邻接矩阵，D表示度矩阵，i和j为下标值。

S32，利用邻接矩阵和度矩阵得到归一化拉普拉斯矩阵。

拉普拉斯矩阵是图论中用到的一种重要矩阵，本发明实施例具体使用归一化拉普拉斯矩阵。归一化拉普拉斯矩阵L的计算公式如公式(4)所示。

L＝D^-1/2AD^-1/2 (4)

S4，基于处理后流量数据构建第一数据，并基于处理后降雨数据、处理后先验降雨数据和归一化拉普拉斯矩阵，构建第二数据。

可选的一种实施方式中，S4可以分为S41和S42：

S41，从处理后流量数据中选取T小时对应的数据构建第一数据。

从针对历史K年的处理后流量数据中，选取T小时对应的数据构建维度为[T,1]的第一输入数据。

其中，T为大于1的自然数，T小于等于K年对应的小时数，即T≤(K*365*24)。比如T可以为100等。且优选的实施方式中，T小时为距离当前时间最近的连续T小时。

S42，从处理后降雨数据中选取T小时对应的数据与处理后先验降雨数据构建输入向量，由输入向量与归一化拉普拉斯矩阵以及预设的参数矩阵，构建第二数据。

GCN网络的核心单元是GCN层，GCN层的计算思想可参见公式(5)：

X′＝f(LXW) (5)

其中，f表示GCN层对应的计算函数，L为归一化拉普拉斯矩阵，X为适合GCN网络的输入向量X，W为参数矩阵，参数矩阵W的目的是为了增加网络的拟合能力。

因此，本发明实施例S42所构建的第二输入数据包含L、W和X。

针对归一化拉普拉斯矩阵L，参见前文描述，在此不再赘述。

针对参数矩阵W，本发明实施例可以预设其中的值作为初始值，以便于模型训练。关于该部分内容请参见相关现有技术理解，在此不再赘述。

针对输入向量X，其为GCN网络的实际处理对象，在本发明实施例中，其构建过程包括：

从处理后降雨数据中选取T小时对应的数据，与处理后先验降雨数据，依据时间先后顺序排列，构建维度为[T+P,N,1]的输入向量。

关于第一输入数据和输入向量的形式可以参见图4，图4为本发明实施例的第一输入数据和输入向量的示例图。

本发明实施例中，S41和S42不分先后顺序。

以下，结合第一数据和第二数据，对本发明实施例的水流量预测模型得到目标水文站点未来P小时的流量预测值的过程进行介绍，该过程包括：

⑴，第一分支网络对第一数据进行时序特征提取；

可选的一种实施方式中，该过程包括：

将第一数据输入第一分支网络，利用第一分支网络的GRU模块进行时序特征提取，得到第一输出特征。

⑵，第二分支网络对第二数据中的降雨数据进行图数据特征提取和时序特征提取；

可选的一种实施方式中，该过程包括以下步骤：

步骤1，将第二数据中的归一化拉普拉斯矩阵以及预设的参数矩阵作为第二分支网络的网络结构参数；

步骤2，将输入向量作为第二分支网络的输入，利用第二分支网络的GCN模块对输入向量进行图数据特征提取；

步骤3，将GCN模块提取出的特征利用维度变化模块进行维度重构；

步骤4，将维度重构后的特征利用第二分支网络的GRU模块进行时序特征提取；

步骤5，将GRU模块提取出的特征利用注意力层进行加权处理，得到第二输出特征。

需要说明的是，上述两个分支网络的处理过程可以并行执行。

⑶，全连接网络对两个分支网络输出的特征进行合并分类预测，得到目标水文站点未来P小时的流量预测值。

可选的一种实施方式中，该过程包括以下步骤：

将第一输出特征和第二输出特征输入全连接网络，利用concat模块进行特征合并，得到合并特征；

将合并特征利用多个全连接层进行分类预测，得到目标水文站点未来P小时的流量预测值。

具体预测过程可以参见图5，图5为本发明实施例的预测过程示意图。以N＝50，T＝100，P＝24为例说明。

第一输入数据经由第一分支网络的三层GRU层进行时序特征提取，得到第一输出特征，维度从[100,1]变为[20]。

第二输入数据(包含归一化拉普拉斯矩阵L，输入向量X，参数矩阵W)经由第二分支网络处理，将输入向量X利用三层GCN层进行图数据特征提取，得到维度为[124,50,30]的向量；再将该向量的维度变化为[124,30]，将维度变化后的向量利用第二分支网络的三层GRU层进行时序特征提取，得到维度为[124,20]的向量，之后，针对[124,20]的向量利用注意力层为124小时数据中每个小时的数据附加一个权重，并进行加权求和，得到维度为[20]的第二输出特征。

将第一输出特征和第二输出特征利用全连接网络的concat模块进行向量合并，得到的合并特征维度为[40]，之后将合并特征利用三层全连接层进行分类预测，实现网络的数值拟合，最终得到维度为[24]的目标水文站点未来P小时的流量预测值。

其中，在图5中标记有各层处理的数据维度，以便于理解数据变化。关于GRU层、GCN层、注意力层和全连接层的具体处理过程请参见现有技术理解，在此不再赘述。

具体预测结果请参见图6，图6为本发明实施例的洪水峰值预测效果对比图。其中，上图为2018年实际流量图，下图为2018年预测流量图，flow为洪水峰值，单位为毫米。time为时间，单位h表示小时。可以看到，上下两图相似度极高，表明应用本发明实施例的基于神经网络的水流量预测模型可以达到较高的预测准确性。具体预测效果请一并参见表3，本发明实施例的基于神经网络的水流量预测模型在最优情况下的损失函数值为0.002065，即MSE(Mean Squared Error，均方误差)的取值。MSE是指参数估计值与参数真值之差平方的期望值，MSE可以评价数据的变化程度，本发明实施例中MSE表征的是预测出来的流量和实际流量误差的大小。MSE的值越小，说明预测模型描述实验数据具有更好的精确度，即表明预测结果越准确。本发明实施例的MSE值说明具有较好的预测效果。实验验证本发明实施例的基于神经网络的水流量预测模型对于洪峰峰值以及洪峰到达时间的预测准确度均可以达到100％。对洪峰持续时间的预测准确度也达到了90％。

表3模型验证数据

MSE	0.002065
		洪峰峰值预测准确度	100％
洪峰到达时间	100％
		洪峰持续时间	90％

因此，利用本发明实施例的基于神经网络的水流量预测模型可以实现未来一个时间段的洪水流量的准确预测。

可以理解的是，通过本发明实施例的基于神经网络的水流量预测模型得到的流量预测值也是归一化的数据，之后，可选的，可以利用相应的数据处理，得到与真实测量得到的流量值同一数据规格的数值。对此不再赘述。

可选的实施方式中，基于神经网络的水流量预测模型可以将得到的目标水文站点未来P小时的流量预测值进行输出，比如发送给另一设备或者进行显示，如显示在预定电子设备的显示屏上等等。

可选的实施方式中，基于神经网络的水流量预测模型还可以将得到的目标水文站点未来P小时的流量预测值与预定阈值进行比较，当目标水文站点未来P小时的流量预测值大于等于预定阈值时，发出警示信息。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于神经网络的水流量预测模型，其特征在于，包括：

2.根据权利要求1所述的模型，其特征在于，所述第一分支网络包括GRU模块；所述第二分支网络包括顺次连接的GCN模块、维度变化模块、GRU模块和注意力层；所述全连接网络包括concat模块和多个全连接层。

3.根据权利要求2所述的模型，其特征在于，所述第一数据和所述第二数据的构建过程包括：

利用所述邻接矩阵得到归一化拉普拉斯矩阵；

4.根据权利要求3所述的模型，其特征在于，所述将所述原始降雨数据、所述原始流量数据和预先获取的未来P小时各水文站点的先验降雨数据进行预处理，分别得到处理后降雨数据、处理后流量数据和处理后先验降雨数据，包括：

5.根据权利要求4所述的模型，其特征在于，所述将所述原始降雨数据进行数据剔除处理、数据补全处理和归一化处理，得到处理后降雨数据，包括：

6.根据权利要求3所述的模型，其特征在于，所述利用所述邻接矩阵得到归一化拉普拉斯矩阵，包括：

利用所述邻接矩阵得到度矩阵；

利用所述邻接矩阵和所述度矩阵得到归一化拉普拉斯矩阵。

7.根据权利要求4所述的模型，其特征在于，所述基于所述处理后流量数据构建第一数据，并基于所述处理后降雨数据、所述处理后先验降雨数据和所述归一化拉普拉斯矩阵，构建第二数据，包括：

8.根据权利要求7所述的模型，其特征在于，所述第一分支网络对第一数据进行时序特征提取的过程，包括：

9.根据权利要求8所述的模型，其特征在于，所述第二分支网络对第二数据中的降雨数据进行图数据特征提取和时序特征提取的过程，包括：

10.根据权利要求9所述的模型，其特征在于，所述全连接网络对两个分支网络输出的特征进行合并分类预测，得到所述目标水文站点未来P小时的流量预测值的过程，包括：