CN113255206B - 一种基于深度强化学习的水文预报模型参数率定方法 - Google Patents

一种基于深度强化学习的水文预报模型参数率定方法 Download PDF

Info

Publication number
CN113255206B
CN113255206B CN202110361225.XA CN202110361225A CN113255206B CN 113255206 B CN113255206 B CN 113255206B CN 202110361225 A CN202110361225 A CN 202110361225A CN 113255206 B CN113255206 B CN 113255206B
Authority
CN
China
Prior art keywords
reinforcement learning
value
model
action
hydrologic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110361225.XA
Other languages
English (en)
Other versions
CN113255206A (zh
Inventor
胡鹤轩
吴雨霏
胡强
朱跃龙
张晔
胡震云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202110361225.XA priority Critical patent/CN113255206B/zh
Publication of CN113255206A publication Critical patent/CN113255206A/zh
Priority to US17/906,995 priority patent/US20230281459A1/en
Priority to PCT/CN2022/078763 priority patent/WO2022206265A1/zh
Application granted granted Critical
Publication of CN113255206B publication Critical patent/CN113255206B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/06Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/08Fluids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于深度强化学习的水文预报模型参数率定方法,包括:根据流域特性选取合适的水文预报模型,确定模型率定的参数及参数取值范围;建立水文预报模型参数率定的强化学习模型,确定强化学习三要素即状态空间、动作空间及奖励函数;应用深度强化学习方法DQN,优化水文预报模型的率定参数。本发明可通过设置深度强化学习模型动作值的步幅,自由控制率定参数最终优化的精确度,并采用DQN算法在率定参数的整个空间进行搜索,以确保率定参数优化的最优性,从而避免现代智能算法早熟、易陷入局部最优解的问题。

Description

一种基于深度强化学习的水文预报模型参数率定方法
技术领域
本发明属于水文预报模型参数率定技术领域,具体涉及一种基于深度强化学习的水文预报模型参数率定方法。
背景技术
水文预报模型广泛应用于降雨模拟预报、洪水预报预警、水文过程分析等领域,对提高水文领域研究效率有着重要的作用。由于水文预报模型结构一般比较复杂,在建立了模型之后,确定模型参数就成为了亟待解决的核心问题。参数率定,是在水文预报模型中找到一组最优参数解,使模拟预报后的结果与实测数据尽可能地接近。对于水文预报模型来说,参数率定直接影响着预报的准确性,因此,研究如何提高参数率定的速度和准确度,具有重要的科研意义和应用价值。
早期的水文预报模型的参数率定方法,多采用传统的人工试错法、梯度下降法等,这些方法虽然直观,但对工作人员经验要求较高,易受个人主观性影响,且参数率定的效率和精度都比较低。随着计算机技术的发展,遗传算法、粒子群算法等现代智能算法被广泛应用于水文预报模型参数自动率定领域,弥补了传统方法的不足,然而,虽然现代智能算法能够广泛搜索解的范围,但存在着早熟和易于陷入局部最优解的问题,从而影响全局最优解的选取。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种基于深度强化学习的水文预报模型参数率定方法。本发明可通过设置深度强化学习模型动作值的步幅,自由控制率定参数最终优化的精确度,采用DQN算法在率定参数的整个空间进行搜索,确保率定参数优化的最优性,避免现代智能算法早熟,容易陷入局部最优解的问题。
为解决上述技术问题,本发明采用以下技术方案。
本发明的一种基于深度强化学习的水文预报模型参数率定方法,包括以下步骤:
步骤1、选定水文预报模型及确定所需率定参数;所述的水文预报模型以降雨及蒸发时间序列作为输入,以预报流量的时间序列作为输出;
步骤2、建立水文预报模型参数率定的强化学习模型;所述的强化学习是指智能体Agent与环境交互学习的过程,其强化学习的关键三要素为状态空间、动作空间和奖励值函数;
步骤3、应用深度强化学习方法DQN,优化水文预报模型率定的参数。
进一步的,在所述步骤1中,选定水文预报模型及确定若干率定参数的过程包括:
根据流域特性选取不同的水文预报模型,确定该水文预报模型所需要率定的参数wi,i=1,2,...,N,N为水文预报模型所需率定参数的个数;
每个参数的取值范围:
Figure BDA0003005655700000021
其中,
Figure BDA0003005655700000022
分别为第i个率定参数的最小值和最大值。
进一步的,所述步骤2中建立水文预报模型参数率定的强化学习模型,其过程包括:
2-1)确定强化学习的状态空间:
定义t时刻强化学习状态值为水文预报模型的数个率定参数组成的一维向量st
Figure BDA0003005655700000023
其中
Figure BDA0003005655700000024
为当前t时刻水文预报模型率定参数值;
t时刻参数
Figure BDA0003005655700000025
值变化具有两种可能:增大或减小;设参数
Figure BDA0003005655700000026
增大或减小幅度均为Δi,则t+1时刻参数
Figure BDA0003005655700000027
值可能为
Figure BDA0003005655700000028
Figure BDA0003005655700000029
2-2)确定强化学习的动作空间:
定义强化学习动作空间A为各个率定参数变化的所有可能情况:
Figure BDA00030056557000000210
其中,2N为强化学习动作空间中动作的个数;矩阵A的每一行为选定的动作,即t时刻动作值at的可能值;
2-3)确定强化学习的奖励值函数:
Figure BDA00030056557000000211
为M个时段的实测的流量值,其中
Figure BDA00030056557000000212
为第i个时段的实测流量值;
根据t时刻状态
Figure BDA00030056557000000213
t+1时刻
Figure BDA00030056557000000214
通过水文预报模型获取预测流量序列分别为:
Figure BDA00030056557000000215
Figure BDA00030056557000000216
其中
Figure BDA00030056557000000217
分别为第i个时段的t时刻、t+1时刻预报流量值;
定义t时刻的均方根误差为RMSt,t+1时刻的均方根误差为RMSt+1
Figure BDA0003005655700000031
Figure BDA0003005655700000032
定义在t时刻状态st下执行动作at到达t+1时刻状态st+1获得的奖励值rt(st,at,st+1):
Figure BDA0003005655700000033
Figure BDA0003005655700000034
其中,C1为常数,大于0;C2为常数,小于0;C3为常数,大于0。
进一步的,所述步骤3中应用深度强化学习方法DQN,优化水文预报模型率定的参数,其过程包括:
根据所确定的强化学习的关键要素,执行下述强化学习DQN算法:
输入:初始化经验池D容量为N;
使用随机权重θ初始化动作值网络Q;
使用权重θ′=θ初始化目标动作值网络
Figure BDA0003005655700000036
过程:
For 1,M do
初始化状态s1
For t=1,T do
根据概率ε选择一个随机动作at,1-ε概率选择at=argmaxaQ(st,a;θ);
执行动作at,并获取奖励rt,得到下一状态st+1
将(st,at,rt,st+1)保存在经验池D中;
当经验池D达到一定数量时从中随机取出若干组(st,at,rt,st+1)为mini-batch;
设置:
Figure BDA0003005655700000035
执行一个梯度下降步骤(yj-Q(sj,aj;θ))2更新动作值网络参数θ;
每C步重置目标动作值网络
Figure BDA0003005655700000041
End For
End For
输出:最优状态:
Figure BDA0003005655700000042
进一步的,当DQN算法优化曲线达到收敛状态,则此时总奖励值处于轻微抖动状态,最优率定的参数值为
Figure BDA0003005655700000043
与现有技术相比,本发明具有以下优点和有益效果:
1.本发明可通过设置深度强化学习模型动作值的步幅,针对不同性质的率定参数自由控制率定参数所要优化的精确程度,保证率定参数优化的精确性和合理性,避免将过多计算资源投入到非重要参数上。
2.本发明采用DQN算法在率定参数的整个空间进行搜索,通过强化学习的自我决策与纠正能力,确保率定参数优化的最优性,避免了现代智能算法早熟,容易陷入局部最优解的问题。
附图说明
图1为本发明的一种实施例的方法流程图。
图2为本发明的一种实施例的水文预报模型示意图。
图3为本发明的一种实施例的强化学习示意图。
图4为本发明的一种实施例的动作价值网络及目标动作价值网络示意图。
图5为本发明的一种实施例的DQN优化算法流程图。
具体实施方式
本发明公开了一种基于深度强化学习的水文预报模型参数率定方法,包括:根据流域特性选取合适的水文预报模型,确定模型率定的参数及参数取值范围;构建强化学习三要素状态空间、动作空间及奖励函数;应用深度强化学习方法DQN优化水文预报模型的率定参数。本发明可通过设置深度强化学习模型动作值的步幅,自由控制率定参数最终优化的精确度,DQN算法在率定参数的整个空间进行搜索,确保率定参数优化的最优性,避免现代智能算法早熟,容易陷入局部最优解的问题。
下面结合附图对本发明做进一步详细说明。
图1为本发明的一种实施例的方法流程图。如图1所示,本实施例方法,包括以下步骤:
步骤1、选定水文预报模型及确定所需的率定参数;
根据流域特性选取不同的水文预报模型如图2所示,该水文预报模型以降雨及蒸发时间序列作为水文预报模型的输入,水文预报模型的输出为预报流量的时间序列。确定该水文预报模型的需要率定的参数wi,i=1,2,...,N,N为水文预报模型所需率定参数的个数。
每个参数具有取值范围:
Figure BDA0003005655700000051
其中,
Figure BDA0003005655700000052
分别为第i个率定参数的最小值和最大值。
步骤2、建立水文预报模型参数率定的强化学习模型;
如图3所示,强化学习是智能体Agent与环境交互学习的过程,该智能体能够根据环境当前的状态采取相应的动作,从而使得当前环境的状态发生改变。强化学习的关键三要素为状态空间、动作空间和奖励值函数。
(1)确定强化学习的状态空间:
定义t时刻强化学习状态值为水文预报模型的数个率定参数组成的一维向量st
Figure BDA0003005655700000053
其中
Figure BDA0003005655700000054
为当前t时刻水文预报模型率定参数值。
t时刻参数
Figure BDA0003005655700000055
值变化具有两种可能:增大或减小;设参数
Figure BDA0003005655700000056
增大或减小幅度均为Δi,则t+1时刻参数
Figure BDA0003005655700000057
值可能为
Figure BDA0003005655700000058
Figure BDA0003005655700000059
(2)确定强化学习的动作空间:
定义强化学习动作空间A为各个率定参数变化的所有可能情况:
Figure BDA00030056557000000510
其中,2N为强化学习动作空间中动作的个数;矩阵A的每一行为选定的动作,即t时刻动作值at的可能值。举例说明,当N=2,Δ1=Δ2=0.1时,
Figure BDA00030056557000000511
此时at的可能值为:[0.1,0.1]、[-0.1,0.1]、[0.1,-0.1]、[-0.1,-0.1]。
(3)确定强化学习的奖励值函数:
Figure BDA00030056557000000512
为M个时段的实测的流量值,其中
Figure BDA00030056557000000513
为第i个时段的实测流量值。
根据t时刻状态
Figure BDA00030056557000000514
t+1时刻
Figure BDA00030056557000000515
通过水文预报模型获取预测流量序列分别为:
Figure BDA0003005655700000061
Figure BDA0003005655700000062
其中
Figure BDA0003005655700000063
分别为第i个时段的t时刻、t+1时刻预报流量值。
定义t时刻的均方根误差为RMSt,t+1时刻的均方根误差为RMSt+1
Figure BDA0003005655700000064
Figure BDA0003005655700000065
定义在t时刻状态st下执行动作at到达t+1时刻状态st+1获得的奖励值rt(st,at,st+1):
Figure BDA0003005655700000066
Figure BDA0003005655700000067
其中,C1为常数,大于0;C2为常数,小于0;C3为常数,大于0。
步骤3、应用深度强化学习方法DQN,优化水文预报模型率定的参数;
如图4为动作价值网络及目标动作价值网络示意图,该网络以状态作为输入神经元,输入的个数为水文预报模型所需率定的参数个数;动作值作为输出,输出值的个数为动作空间中的动作的个数。动作价值网络是用来评估当前状态动作对的价值函数,采用神经网络设计的原因在于状态量较多。目标动作价值网络用于慢更新Q值,算法根据损失函数的更新公式来更新网络中的参数,每经过C轮迭代后,将动作价值网络中的参数复制给目标动作价值网络中的参数。在一段时间内目标动作价值网络的Q(sj,aj;θ)保持不变,使得训练时损失值震荡发散的可能性降低,从而提高了算法的稳定性。
如图5所示为DQN优化算法流程图,其中MainNet为动作价值网络,targetNet为目标动作价值网络。根据步骤2中所确定的强化学习关键三要素,执行强化学习DQN算法,其流程如下:
输入:初始化经验池D容量为N;
使用随机权重θ初始化动作值网络Q,该网络的输入输出由图4说明;
使用权重θ′=θ初始化目标动作值网络
Figure BDA0003005655700000068
该网络的输入输出由图4说明;
过程:
For 1,M do
随机初始化状态
Figure BDA0003005655700000071
For t=1,T do
根据概率ε(ε为较小值)选择随机动作at,1-ε概率选择at=argmaxaQ(st,a;θ),由动作价值网络计算得出;
执行动作at,得到下一状态
Figure BDA0003005655700000072
并获取奖励rt,rt由步骤2的计算公式得出;
将(st,at,rt,st+1)保存在经验池D中,此时需判断经验池的容量是否已满,当容量已满时可采用先进先出的策略更新经验池D;
当经验池D达到一定数量时从中随机取出数个组(st,at,rt,st+1)作为神经网络学习样本;
在目标动作值网络中求得
Figure BDA0003005655700000073
动作价值网络执行一个梯度下降步骤(yj-Q(sj,aj;θ))2更新该网络参数θ;
每C步重置目标动作值网络
Figure BDA0003005655700000074
意味将动作价值网络的参数θ设置为目标动作价值网络的参数θ';
End For
End For
输出:最优状态:
Figure BDA0003005655700000075
当DQN算法优化曲线达到收敛状态,此时总奖励值处于轻微抖动状态,最优率定的参数值为
Figure BDA0003005655700000076

Claims (1)

1.一种基于深度强化学习的水文预报模型参数率定方法,其特征在于,包括以下步骤:
步骤1、选定水文预报模型及确定所需率定参数;所述的水文预报模型以降雨及蒸发时间序列作为输入,以预报流量的时间序列作为输出;
步骤2、建立水文预报模型参数率定的强化学习模型;所述的强化学习是指智能体Agent与环境交互学习的过程,其强化学习的关键三要素为状态空间、动作空间和奖励值函数;
步骤3、应用深度强化学习方法DQN,优化水文预报模型率定的参数;
在所述步骤1中,选定水文预报模型及确定若干率定参数的过程包括:
根据流域特性选取不同的水文预报模型,确定该水文预报模型所需要率定的参数wi,i=1,2,...,N,N为水文预报模型所需率定参数的个数;
每个参数的取值范围:
Figure FDA0004011917220000011
其中,
Figure FDA0004011917220000012
分别为第i个率定参数的最小值和最大值;
所述步骤2中建立水文预报模型参数率定的强化学习模型,其过程包括:
2-1)确定强化学习的状态空间:
定义t时刻强化学习状态值为水文预报模型的数个率定参数组成的一维向量st
Figure FDA0004011917220000013
其中
Figure FDA0004011917220000014
为当前t时刻水文预报模型率定参数值;
t时刻参数
Figure FDA0004011917220000015
值变化具有两种可能:增大或减小;设参数
Figure FDA0004011917220000016
增大或减小幅度均为Δi,则t+1时刻参数
Figure FDA0004011917220000017
值可能为
Figure FDA0004011917220000018
Figure FDA0004011917220000019
2-2)确定强化学习的动作空间:
定义强化学习动作空间A为各个率定参数变化的所有可能情况:
Figure FDA00040119172200000110
其中,2N为强化学习动作空间中动作的个数;矩阵A的每一行为选定的动作,即t时刻动作值at的可能值;
2-3)确定强化学习的奖励值函数:
Figure FDA00040119172200000111
为M个时段的实测的流量值,其中
Figure FDA00040119172200000112
为第i个时段的实测流量值;
根据t时刻状态
Figure FDA0004011917220000021
t+1时刻
Figure FDA0004011917220000022
通过水文预报模型获取预测流量序列分别为:
Figure FDA0004011917220000023
Figure FDA0004011917220000024
其中
Figure FDA0004011917220000025
分别为第i个时段的t时刻、t+1时刻预报流量值;
定义t时刻的均方根误差为RMSt,t+1时刻的均方根误差为RMSt+1
Figure FDA0004011917220000026
Figure FDA0004011917220000027
定义在t时刻状态st下执行动作at到达t+1时刻状态st+1获得的奖励值rt(st,at,st+1):
Figure FDA0004011917220000028
Figure FDA0004011917220000029
其中,C1为常数,大于0;C2为常数,小于0;C3为常数,大于0;
所述步骤3中应用深度强化学习方法DQN,优化水文预报模型率定的参数,其过程包括:
根据所确定的强化学习的关键要素,执行下述深度强化学习方法DQN:
输入:初始化经验池D容量为N;
使用随机权重θ初始化动作值网络Q;
使用权重θ′=θ初始化目标动作值网络
Figure FDA00040119172200000210
过程:
For 1,M do
初始化状态s1
For t=1,T do
根据概率ε选择一个随机动作at,1-ε概率选择at=argmaxa Q(st,a;θ);
执行动作at,并获取奖励rt,得到下一状态st+1
将(st,at,rt,st+1)保存在经验池D中;
当经验池D达到一定数量时从中随机取出若干组(st,at,rt,st+1)为mini-batch;
设置:
Figure FDA0004011917220000031
执行一个梯度下降步骤(yj-Q(sj,aj;θ))2更新动作值网络参数θ;
每C步重置目标动作值网络
Figure FDA0004011917220000032
End For
End For
输出:最优状态:
Figure FDA0004011917220000033
当DQN算法优化曲线达到收敛状态,则此时总奖励值处于轻微抖动状态,最优率定的参数值为
Figure FDA0004011917220000034
CN202110361225.XA 2021-04-02 2021-04-02 一种基于深度强化学习的水文预报模型参数率定方法 Active CN113255206B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110361225.XA CN113255206B (zh) 2021-04-02 2021-04-02 一种基于深度强化学习的水文预报模型参数率定方法
US17/906,995 US20230281459A1 (en) 2021-04-02 2022-03-02 Method for calibrating parameters of hydrology forecasting model based on deep reinforcement learning
PCT/CN2022/078763 WO2022206265A1 (zh) 2021-04-02 2022-03-02 一种基于深度强化学习的水文预报模型参数率定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110361225.XA CN113255206B (zh) 2021-04-02 2021-04-02 一种基于深度强化学习的水文预报模型参数率定方法

Publications (2)

Publication Number Publication Date
CN113255206A CN113255206A (zh) 2021-08-13
CN113255206B true CN113255206B (zh) 2023-05-12

Family

ID=77220265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110361225.XA Active CN113255206B (zh) 2021-04-02 2021-04-02 一种基于深度强化学习的水文预报模型参数率定方法

Country Status (3)

Country Link
US (1) US20230281459A1 (zh)
CN (1) CN113255206B (zh)
WO (1) WO2022206265A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255206B (zh) * 2021-04-02 2023-05-12 河海大学 一种基于深度强化学习的水文预报模型参数率定方法
CN113783782B (zh) * 2021-09-09 2023-05-30 哈尔滨工程大学 一种深度强化学习的机会路由候选集节点排序方法
CN114739229A (zh) * 2022-03-07 2022-07-12 天津大学 一种基于强化学习的换热过程重要参数控制方法
CN116500994B (zh) * 2023-05-05 2024-05-03 成都理工大学 一种低碳分布式柔性作业车间的动态多目标调度方法
CN116933949B (zh) * 2023-09-18 2023-12-19 北京金水永利科技有限公司 一种融合水动力模型和数理模型的水质预测方法及系统
CN117150975B (zh) * 2023-10-31 2024-01-26 长江三峡集团实业发展(北京)有限公司 一种水动力模型参数优化、水动力过程模拟方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682355A (zh) * 2017-01-12 2017-05-17 中国水利水电科学研究院 一种基于pso‑ga混合算法的水文模型参数率定方法
CN111259522A (zh) * 2020-01-09 2020-06-09 河海大学 一种水文模型在地理空间上多流域并行率定的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366099A (zh) * 2013-08-02 2013-10-23 贵州东方世纪科技有限责任公司 一种水文模型参数调试方法
US11294096B2 (en) * 2017-11-03 2022-04-05 The Tomorrow Companies Inc. Real-time data pipeline techniques for improving a fast weather forecasting system
CN110619432B (zh) * 2019-09-17 2022-08-30 长江水利委员会水文局 一种基于深度学习的特征提取水文预报的方法
CN110930016A (zh) * 2019-11-19 2020-03-27 三峡大学 一种基于深度q学习的梯级水库随机优化调度方法
CN111768028B (zh) * 2020-06-05 2022-05-27 天津大学 一种基于深度强化学习的gwlf模型参数调节方法
CN111795681A (zh) * 2020-06-30 2020-10-20 杭州鲁尔物联科技有限公司 一种山洪灾害预警方法、装置、服务器及存储介质
CN113255206B (zh) * 2021-04-02 2023-05-12 河海大学 一种基于深度强化学习的水文预报模型参数率定方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682355A (zh) * 2017-01-12 2017-05-17 中国水利水电科学研究院 一种基于pso‑ga混合算法的水文模型参数率定方法
CN111259522A (zh) * 2020-01-09 2020-06-09 河海大学 一种水文模型在地理空间上多流域并行率定的方法

Also Published As

Publication number Publication date
CN113255206A (zh) 2021-08-13
US20230281459A1 (en) 2023-09-07
WO2022206265A1 (zh) 2022-10-06

Similar Documents

Publication Publication Date Title
CN113255206B (zh) 一种基于深度强化学习的水文预报模型参数率定方法
CN110984062B (zh) 一种流域干支流大规模水库群模拟调度方法
CN109902801B (zh) 一种基于变分推理贝叶斯神经网络的洪水集合预报方法
WO2021109644A1 (zh) 一种基于元学习的混合动力车辆工况预测方法
CN109325624A (zh) 一种基于深度学习的月度电力需求预测方法
CN110059867B (zh) 一种swlstm结合gpr的风速预测方法
CN106650920A (zh) 一种基于优化极限学习机的预测模型
CN105512832A (zh) 基于时变权最小方差的城市需水量组合预测方法
CN110097929A (zh) 一种高炉铁水硅含量在线预测方法
CN111553118A (zh) 基于强化学习的多维连续型优化变量全局优化方法
CN105574586A (zh) 基于mpso-bp网络的通用飞机航材需求预测方法
CN116992779A (zh) 基于数字孪生模型的光伏储能系统仿真方法及系统
CN109408896B (zh) 一种污水厌氧处理产气量多元智能实时监控方法
CN114648170A (zh) 基于混合深度学习模型的水库水位预测预警方法及系统
Shang et al. Research on intelligent pest prediction of based on improved artificial neural network
Lu et al. Double-track particle swarm optimizer for nonlinear constrained optimization problems
CN112257348B (zh) 一种锂电池长期退化趋势预测方法
CN105389614A (zh) 一种神经网络自更新过程的实现方法
CN113095477A (zh) 基于de-bp神经网络的风电功率预测方法
CN116880191A (zh) 一种基于时序预测的过程工业生产系统的智能控制方法
CN114648178B (zh) 一种基于ddpg算法的电能计量装置运维策略优化方法
CN113610665B (zh) 一种基于多延迟输出回声状态网的风力发电功率预测方法
CN116303786A (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN114995106A (zh) 基于改进小波神经网络的pid自整定方法、装置和设备
CN110321650B (zh) 基于新型试验设计与权重响应面的结构可靠性分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant