CN115169724A - 一种基于时空图卷积神经网络的径流预测方法 - Google Patents

一种基于时空图卷积神经网络的径流预测方法 Download PDF

Info

Publication number
CN115169724A
CN115169724A CN202210889361.0A CN202210889361A CN115169724A CN 115169724 A CN115169724 A CN 115169724A CN 202210889361 A CN202210889361 A CN 202210889361A CN 115169724 A CN115169724 A CN 115169724A
Authority
CN
China
Prior art keywords
data
neural network
model
time
runoff
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210889361.0A
Other languages
English (en)
Inventor
杨勤丽
孙文平
邵俊明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangtze River Delta Research Institute of UESTC Huzhou
Original Assignee
Yangtze River Delta Research Institute of UESTC Huzhou
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangtze River Delta Research Institute of UESTC Huzhou filed Critical Yangtze River Delta Research Institute of UESTC Huzhou
Priority to CN202210889361.0A priority Critical patent/CN115169724A/zh
Publication of CN115169724A publication Critical patent/CN115169724A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于时空图卷积神经网络的径流预测方法。首先收集并构建研究流域内径流及其影响要素的时间序列数据集,然后根据流域内水系拓扑结构设计图卷积神经网络模型结构,最后通过训练最终得到基于时空图卷积神经网络的径流预测模型。该模型不仅可以对现有水文站点的径流量进行预测,还能对流域内河流上任意断面(虚拟站点)进行径流预测。

Description

一种基于时空图卷积神经网络的径流预测方法
技术领域
本发明属于水文水资源领域,更为具体地讲,涉及一种基于时空图卷积神经网络的径流预测方法。
背景技术
目前国内外径流预测的研究主要集中在站点观测资料丰富的地区,此类地区一般拥有高密度的水文气象观测站,水文气象要素的观测数据较为详实。因此,可以根据历史数据构建水文模型或数据驱动模型,进而对各站点的径流进行预测。水文模型就是通过探索径流形成的物理机制,得到描述其变化趋势的数学模型,如降雨-径流模型、VIC模型等。数据驱动模型主要是挖掘影响因子与径流之间统计关系而构建的黑箱模型。近年来,深度学习在时间序列处理方法的快速发展为精准的径流预测提供了可能,特别是长短期记忆网络(LSTM)。LSTM主要由输入门、遗忘门和输出门组成,通过这些门控单元,LSTM可以控制信息的流动,即信息流的输入、输出以及细胞单元(Memory cell)的状态,选择性地输入、输出和记忆重要信息。上述方法的预测精度均依赖于大量的观测数据,且仅关注于对某单一水文站点的径流进行预测。
而在实际情况中,众多流域水文气象站点数量较少且分布不均,水文气象观测资料短缺;流域内上下游、干支流的水文站点之间相互影响,共同构成了全流域的水情。现有方法在缺资料地区应用时,由于数据受限,模型性能往往大大下降甚至失效。此外,现有方法多关注单一水文站点的径流预测,而缺乏挖掘流域内不同水文站之间的关联关系。在此背景下,如何充分利用有限观测资料进行全流域的精准径流预测显得尤为重要。
因此,提出了一种时空图卷积神经网络来进行径流预测的方法。图神经网络模型将径流数据看作图数据进行处理。图数据由节点与边组成,其中,节点可拥有不同属性,边表示节点之间的关系。对应于径流预测任务,水文站点(包括无资料的虚拟站点)即为图节点,影响径流的因子(降水、气温等)即为节点属性,水文站之间的连线即为边,径流流向即为边的方向。据此,可构建符号图神经网络。图神经网络在训练时不仅能挖掘节点自身的时间模式,还能通过其邻居节点挖掘节点间的空间模式,做出更精准的径流预测。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于时空图卷积神经网络的径流预测方法,弥补现有技术不能充分利用现有数据的缺点,并且可以显著提升径流预测的精度。
为实现上述发明目的,本发明基于时空图卷积神经网络的径流预测方法,其特征在于,包括以下步骤:
(1)、收集流域内各气象站、水文站的观测数据,包括水文站的径流数据及影响径流的气象数据,如降水、气温、水面蒸发等。
(2)、数据预处理,统计各个站点收集到的数据,并对缺失值进行补全,由于输入数据之间的数量级有时候差别较大,采用离差标准化方法对输入数据进行归一化,其转换公式为:
Figure BDA0003766965070000021
其中,X*为归一化后的数据,其范围在[0,1],X为原始数据,Xmax为原始数据的最大值,Xmin为原始数据的最小值。
(3)、建立时空图卷积神经网络模型。深度网络主要分为三个部分,首先是时间卷积,使用TCN(时域卷积)网络提取时间特征;其次是图卷积神经网络,通过GCN网络对径流进行时间序列的建模,并在每个时刻进行输出;最后是全连接网络,对图神经网络编码的多维状态向量转化为每个时刻的径流量;其他激活函数使用指数线性激活函数GLU,最后一层的激活函数使用线性激活函数linear。
(4)、模型训练。将有标签数据划分为训练集和测试集,使用训练集输入模型进行训练,损失函数使用平方根误差,优化器使用adam优化器,进行多次迭代使模型拟合并达到最优。
(5)、使用训练好的模型在测试集上进行测试,根据真实数据对预测结果进行评估。
本发明的目的是这样实现的。
本发明利用深度学习算法,采用一种基于时空图卷积神经网络的径流预测方法。首先收集流域内与径流相关的影响特征,然后构建特征与径流量互相对应的时间序列数据集,通过训练就能得到基于时空图卷积神经网络的径流预测模型,根据得到的径流预测模型就可以对以后的径流量进行预测。同时,考虑到GCN在关注空间特征时会忽略某些时间特征,所以加入时间卷积先提取时间特征,提高了模型捕获有效时间特征的能力,因而具有较高的预测精度。此外,本发明使用以数据驱动的深度学习方法,减少了对于流域内部水文物理机制的依赖性,有效扩大了模型的适用范围。
附图说明
图1是本发明的一种具体实施方式流程图;
图2是图卷积模块和时间卷积模块的结构示意图;
图3是本发明的深度神经网络模型结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
图1是本发明一种基于时空图卷积神经网络的径流预测方法的一种具体实施方式流程图。
在本实施例中,如图1所示,本发明一种基于时空图卷积神经网络的径流预测方法包括以下步骤:
S1:流域数据收集
收集流域内水文观测数据(流域出口断面逐日实测河川径流量)及与径流密切相关的影响因子的数据;与径流密切相关的因子包括:日降水量、气温、水面蒸发等。
S2:数据预处理
在实施过程中,收集到的原始数据可能会存在数据缺失等问题,可以使用一些插值方法,如线性插值,样条回归,最近邻替换等,以此对缺失数据进行补全,此外,由于输入的数据为不同类别的数据,其数量级有时候差别较大,故采用离差标准化方法对输入数据进行归一化,其转换公式为:
Figure BDA0003766965070000041
其中,X*为归一化后的数据,其范围在[0,1],X为原始数据,Xmax为原始数据的最大值,Xmin为原始数据的最小值。
S3:建立时空图卷积神经网络模型
该模型由三部分组成,首先是时间卷积,通过TCN强大的特性,跨时间步提取特征,并在每个时刻进行输出;对于单个节点的数据,TCN结构如图2所示,其中,每一层的输入,是上一层的kernel size(图中为2)个时刻的输出,整个TCN利用了1-D FCN(全卷积)网络的结构,每一个隐藏层的输入输出的时间长度都相同,维持相同的时间步。为了有效获取长时间依赖关系,利用了膨胀因果卷积,引入膨胀因子(dilation factor),对于dilation=[1,2,4]的TCN,其结构如图2,每层的卷积个数不变,但是下一层进行卷积膨胀,即下一层参与卷积的时刻会膨胀,膨胀系数一般是2的指数次方。
其次是图卷积神经网络,利用节点之间的连接关系构建邻接矩阵A,每个节点的时序数据经过TCN后,把输出作为图神经节点的输入,如图3所示;使用图卷积神经网络,在图结构数据的空间域上进行高阶特征提取,图卷积公式如下:
Θ*gx=UΘ(Λ)UTx
其中,x为信号,图核Θ为对角矩阵,
Figure BDA0003766965070000042
(In是单位矩阵,D是度矩阵,Λ由图拉普拉斯矩阵L的特征值组成的对角矩阵)。
运用切比雪夫多项式和一阶多项式近似,并将D归一化后,得到最终的图卷积:
Figure BDA0003766965070000043
θ为图核的共享参数。
最后是输出层,是一个普通的全连接前馈神经网络,用来对图神经网络编码的多维状态向量转化为每个时刻的径流量,在最后用于对输出结果的降维;
S4:模型训练
首先,将数据划分为训练集和测试集,训练集用来对模型进行训练,确定各层的权重参数,测试集用来评估最终模型的预测精度;
使用训练集输入模型进行训练时,先根据初始化方法,对模型每层的权重进行初始化,然后输入数据,先前向计算得到模型的输出,然后根据损失函数和真实标签计算损失,其中损失函数使用平方根误差,计算梯度反向传播更新每一层的权重,通过梯度下降多次迭代使模型拟合并达到最优,其中优化器使用adam优化器,最终获得训练完成的时空图卷积神经网络模型;
S5:径流预测
在模型中输入测试集的数据,进行径流量的预测,根据评估方法,对预测结果进行评估,以验证模型的合理性;评估函数如下,
纳什效率系数NSE(Nash-Sutcliffe):
Figure BDA0003766965070000051
相对误差RE:
Figure BDA0003766965070000052
其中,
Figure BDA0003766965070000053
表示径流实测值,
Figure BDA0003766965070000054
表示径流预测值,t表示第t时刻;
在实际应用中,根据流域,训练好模型以后就可以根据当前的输入来预测未来某个时刻的径流量;
本发明中,针对传统径流预测方法中的不足提出了一种基于时空图卷积神经网络的径流预测方法。本发明在利用空间特征和使用深度学习等关键技术上做出了创新。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (2)

1.一种基于时空图卷积神经网络的径流预测方法,其特征在于,包括以下步骤:
(1)、收集流域内各气象站、水文站的观测数据,包括水文站的径流数据及影响径流的气象数据,如降水、气温、水面蒸发等。
(2)、数据预处理,统计各个站点收集到的数据,并对缺失值进行补全,由于输入的数据之间数量级有时候差别较大,采用离差标准化方法对输入数据进行归一化,其转换公式为:
Figure FDA0003766965060000011
其中,X*为归一化后的数据,其范围在[0,1],X为原始数据,Xmax为原始数据的最大值,Xmin为原始数据的最小值。
(3)、建立时空图神经网络模型。深度网络主要分为三个部分,首先是时间卷积,使用TCN(时域卷积)网络提取时间特征;其次是图卷积神经网络,通过GCN网络对径流进行时间序列的建模,并在每个时刻进行输出;最后是全连接网络,把图神经网络编码的多维状态向量转化为每个时刻的径流量;其他激活函数使用指数线性激活函数GLU,最后一层的激活函数使用线性激活函数linear。
(4)、模型训练。将有标签数据划分为训练集和测试集,把训练集输入模型进行训练,损失函数使用平方根误差,优化器使用adam优化器,进行多次迭代使模型拟合并达到最优。
(5)、使用训练好的模型在测试集上进行测试,根据真实数据对预测结果进行评估。
2.根据权利要求1所述的径流预测方法,其特征在于,步骤(3)中,所述的时空图神经网络模型,和步骤(4)中,所述的神经网络模型训练:
2.1)、该模型主要由三部分组成,首先是时间卷积,通过TCN强大的特性,跨时间步提取特征,并在每个时刻进行输出;对于单个节点的数据,TCN结构如图2所示,其中,每一层的输入,是上一层的kernelsize(图中为2)个时刻的输出,整个TCN利用了1-D FCN(全卷积)网络的结构,每一个隐层的输入输出的时间长度都相同,维持相同的时间步。为了有效获取长时间依赖关系,利用了膨胀因果卷积,引入膨胀因子(dilation factor),对于dilation=[1,2,4]的TCN,其结构如图2,每层的卷积个数不变,但是下一层进行卷积膨胀,即下一层参与卷积的时刻会膨胀,膨胀系数一般是2的指数次方。
其次是图卷积神经网络,利用站点之间的连接关系构建邻接矩阵A,每个节点的时序数据经过TCN后,把输出作为图神经节点的输入,如图3所示;使用图卷积神经网络,在图结构数据的空间域上进行高阶特征提取,图卷积公式如下:
Θ*gx=UΘ(Λ)UTx
其中,x为信号,图核Θ为对角矩阵,
Figure FDA0003766965060000021
(In是单位矩阵,D是度矩阵,Λ由图拉普拉斯矩阵L的特征值组成的对角矩阵)。
运用切比雪夫多项式和一阶多项式近似,并将D归一化后,得到最终的图卷积:
Figure FDA0003766965060000022
θ为图核的共享参数。
最后是输出层,是一个普通的全连接前馈神经网络,用来对图神经网络编码的多维状态向量转化为每个时刻的径流量,在最后用于对输出结果的降维;
2.2)、首先,将数据划分为训练集和测试集,训练集用来对模型进行训练,确定各层的权重参数,测试集用来评估最终模型的预测精度;
所述模型训练流程为:先根据初始化方法,对模型每层的权重进行初始化,然后输入数据,每个节点的数据先进行时间卷积TCN,得到的时序隐向量特征输入图神经网络,最后将输出的多维隐向量特征输入全连接层进行降维,得到最终的径流量。将前向计算得到的输出,根据损失函数和真实标签计算损失,其中损失函数使用平方根误差,计算梯度反向传播更新每一层的权重,通过梯度下降多次迭代使模型拟合并达到最优,其中优化器使用adam优化器,最终获得训练完成的时空图神经神经网络模型。
CN202210889361.0A 2022-07-27 2022-07-27 一种基于时空图卷积神经网络的径流预测方法 Pending CN115169724A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210889361.0A CN115169724A (zh) 2022-07-27 2022-07-27 一种基于时空图卷积神经网络的径流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210889361.0A CN115169724A (zh) 2022-07-27 2022-07-27 一种基于时空图卷积神经网络的径流预测方法

Publications (1)

Publication Number Publication Date
CN115169724A true CN115169724A (zh) 2022-10-11

Family

ID=83497497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210889361.0A Pending CN115169724A (zh) 2022-07-27 2022-07-27 一种基于时空图卷积神经网络的径流预测方法

Country Status (1)

Country Link
CN (1) CN115169724A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115654381A (zh) * 2022-10-24 2023-01-31 电子科技大学 一种基于图神经网络的供水管道漏损检测方法
CN116187203A (zh) * 2023-04-20 2023-05-30 武汉大学 一种流域水质预测方法、系统、电子设备及存储介质
CN116484275A (zh) * 2023-04-17 2023-07-25 中南大学 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法
CN117151285A (zh) * 2023-08-29 2023-12-01 淮阴工学院 一种基于多要素注意力时空图卷积网络的径流预报方法
CN117273465A (zh) * 2023-11-15 2023-12-22 中国水利水电科学研究院 一种梯级水电枢纽群风险传递方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115654381A (zh) * 2022-10-24 2023-01-31 电子科技大学 一种基于图神经网络的供水管道漏损检测方法
CN116484275A (zh) * 2023-04-17 2023-07-25 中南大学 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法
CN116484275B (zh) * 2023-04-17 2023-12-22 中南大学 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法
CN116187203A (zh) * 2023-04-20 2023-05-30 武汉大学 一种流域水质预测方法、系统、电子设备及存储介质
CN117151285A (zh) * 2023-08-29 2023-12-01 淮阴工学院 一种基于多要素注意力时空图卷积网络的径流预报方法
CN117273465A (zh) * 2023-11-15 2023-12-22 中国水利水电科学研究院 一种梯级水电枢纽群风险传递方法
CN117273465B (zh) * 2023-11-15 2024-02-02 中国水利水电科学研究院 一种梯级水电枢纽群风险传递方法

Similar Documents

Publication Publication Date Title
CN115169724A (zh) 一种基于时空图卷积神经网络的径流预测方法
CN112101480B (zh) 一种多变量聚类与融合的时间序列组合预测方法
CN111222698B (zh) 面向物联网的基于长短时记忆网络的积水水位预测方法
CN112418547A (zh) 一种基于gcn-lstm组合模型的公交车站点客流量预测方法
CN109299812B (zh) 一种基于深度学习模型和knn实时校正的洪水预测方法
CN108009674A (zh) 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN110738355B (zh) 一种基于神经网络的城市内涝预测方法
CN113128113B (zh) 一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法
Moayyed et al. A Cyber-Secure generalized supermodel for wind power forecasting based on deep federated learning and image processing
CN108133225A (zh) 一种基于支持向量机的覆冰闪络故障预警方法
CN115859620A (zh) 一种基于多头注意力机制和图神经网络的径流重建方法
Nourani et al. A new hybrid algorithm for rainfall–runoff process modeling based on the wavelet transform and genetic fuzzy system
CN117236673B (zh) 城市水网多尺度防洪排涝联合优化调度方法和系统
CN115310536A (zh) 基于神经网络和gcn深度学习模型的水库水位预测预警方法
CN115115125A (zh) 基于深度学习融合模型的光伏功率区间概率预测方法
CN116822382A (zh) 基于时空多重特性图卷积的海表面温度预测方法及网络
CN113868938A (zh) 基于分位数回归的短期负荷概率密度预测方法、装置及系统
He et al. Short-term runoff prediction optimization method based on BGRU-BP and BLSTM-BP neural networks
CN116796168A (zh) 一种基于多头注意力机制的CNN-BiLSTM高海拔多因素输电线路可听噪声预测方法
Wang et al. Short-term wind power probabilistic forecasting using a new neural computing approach: GMC-DeepNN-PF
CN112446550B (zh) 一种短期建筑负荷概率密度预测方法
Tang et al. Traffic flow anomaly detection based on robust ridge regression with particle swarm optimization algorithm
CN115860165A (zh) 一种考虑初损的神经网络流域降雨径流预报方法及系统
CN108133280A (zh) 一种基于偏互信息法的覆冰闪络影响因素筛选方法
Yu et al. A Deep Learning-Based Multi-model Ensemble Method for Hydrological Forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination