CN117993495B - 一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统 - Google Patents

一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统 Download PDF

Info

Publication number
CN117993495B
CN117993495B CN202410245453.4A CN202410245453A CN117993495B CN 117993495 B CN117993495 B CN 117993495B CN 202410245453 A CN202410245453 A CN 202410245453A CN 117993495 B CN117993495 B CN 117993495B
Authority
CN
China
Prior art keywords
model
data
water level
machine learning
flood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410245453.4A
Other languages
English (en)
Other versions
CN117993495A (zh
Inventor
陈黎明
周举
陆昊
胡腾飞
徐祎凡
丁磊
缴健
金秋
陈炼钢
栾震宇
施勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources
Original Assignee
Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources filed Critical Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources
Priority to CN202410245453.4A priority Critical patent/CN117993495B/zh
Publication of CN117993495A publication Critical patent/CN117993495A/zh
Application granted granted Critical
Publication of CN117993495B publication Critical patent/CN117993495B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Algebra (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统,涉及水文预报技术领域。本发明基于圣维南方程组构建一维水动力模型,模拟计算各种上下游组合工况下河道水文情势变化;结合机器学习算法构建高效的代理模型,建立行洪量阈值与下游水位/潮位、泄洪时间、控制水位等因素之间的响应关系,实现对河道关键控制断面的水位预报;根据流域防洪要求,计算不同下游水位/潮位条件和关键控制断面各防洪标准控制水位下的上游行洪量安全阈值,构建高精度行洪安全知识图谱。通过本发明,可以为流域防洪联合调度提供技术支撑,最大程度提升流域防灾减灾能力。

Description

一种机器学习结合传统机理模型构建行洪安全知识图谱的方 法及系统
技术领域
本发明涉及水文预报技术领域,尤其涉及一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统。
背景技术
长期以来,如何对洪水实现预报精准、预警期长、预案科学、预演快速的“四预”功能,构建以数字孪生流域为核心的智慧水利体系,一直是水文水资源领域研究的热点问题。目前的洪水预报主要以经验预报和水动力模型为主,经验预报方法存在精度不足的问题,在极端情景下更是难以适用;水动力模型方法计算耗时长,时效性较差,且模型构建需大量的边界条件约束,对专业知识要求较高,使用不够便捷。
发明内容
针对现有洪水预报方法中的问题,本发明提出一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统,结合机器学习模型,计算关键控制断面水位与其他水文因素的非线性响应关系,可形成精准及时的实时水位预报模型,计算各边界条件下水位变化情势,形成最大行洪安全知识图谱。
为了实现上述目的,本发明通过如下的技术方案来实现:
一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,所述方法包括:
通过机理模型模拟计算流域水文情势变化情况,具体包括:
实测河网断面,收集流域内河流断面数据、水位数据、流量数据和降雨数据并进行数据预处理;
根据收集到的河流断面数据、水位数据和流量数据,基于圣维南方程组构建一维水动力模型;进行模型率定与模型验证,判断所述一维水动力模型的精度是否满足要求;若否,则重新进行模型率定与验证;若是,则计算产汇流作为所述一维水动力模型的边界条件,模拟计算典型工况下的关键控制断面水位;
通过机器学习模型构建流域行洪安全知识图谱,具体包括:
将所述一维水动力模型的边界条件因子作为输入条件,模拟计算结果作为训练样本,进行关键影响因子识别和参数自动寻优后构建机器学习模型;其中,边界条件因子包括上游流量、下游水位或潮位数据,以及区间入流流量;
通过所述机器学习模型,分析关键控制断面水位与关键影响因子之间的非线性关系,计算不同影响因子条件下的关键控制断面水位;
以关键控制断面水位和下游边界逆推上游最大流量,以关键控制断面水位和下游水位或潮位数据为条件矩阵,绘制行洪安全知识图谱。
作为本发明的一种优选方案,所述基于圣维南方程组构建一维水动力模型,具体包括:
一维水动力模型基于一维明渠非恒定流方程,理论基础是圣维南方程组,包括连续方程和运动方程;
所述连续方程为:
式中,A表示过水断面面积,单位为m2;t表示时间,单位为s;Q表示河流断面净流量,单位为m3/s;x表示沿水流方向的距离,单位为m;q表示单位河段长度的旁侧入流量,包括均匀旁侧入量和集中旁侧入量,单位为m3/s;
所述运动方程为:
式中,g为重力加速度,单位为m2/s;α为动量校正系数;h为水深,单位为m;C为谢才系数;n为河床糙率,R为水力半径,单位为m;
对所述圣维南方程组采用6点Abbott-Ionescu隐式有限差分格式进行离散,按照水位-流量-水位的顺序交替布置形成计算网格,且水位点和流量点计算的时间步长Δt相同;
其中,连续方程离散为:
运动方程离散为:
式中,j表示计算网格中网格点的第j处;α、β、γ分别为过流宽度和外部输入δ的函数,随s时刻的流量和水深以及s+1/2时刻流量的大小而变化;δj表示在网格点j处的外部输入;
分别表示网格点j-1处、网格点j处、网格点j+1处在s+1时刻的流量;分别表示网格点j-1处、网格点j处、网格点j+1处在s+1时刻的水深。
作为本发明的一种优选方案,所述模型率定具体为对河床糙率n进行率定,按不同河段对河床糙率n进行设置,基于同步水文测验资料进行模型率定;
收集历史洪水资料进行模型验证,使用纳什效率系数NSE评价所述一维水动力模型的模拟结果,所述纳什效率系数NSE的计算公式如下:
式中,M为数据集中数据的个数,为第m个数据的实测值,为第m个数据的模型模拟值,为数据集中所有数据实测值的平均值。
作为本发明的一种优选方案,所述计算产汇流作为所述一维水动力模型的边界条件,方法包括:
收集流域多年降雨数据,使用泰森多边形划分单元计算面雨量,并通过流域的经验推理公式,计算支流集水区的降雨产流;
根据泰森多边形分割子流域的面积计算各雨量站在各个子流域的权重,得到泰森多边形面雨量权重矩阵,根据推理公式法,计算汇流;
将计算出的降雨产流和汇流作为一维水动力模型的边界条件。
作为本发明的一种优选方案,所述模拟计算典型工况下的关键控制断面水位,方法包括:
对长时期历史实测的下游水位或潮位数据频率分析,计算不同重现期最高潮位,根据流域防洪标准,选取关键控制断面及控制水位;
根据历史资料,选取不同重现期的下游水位或潮位数据作为典型工况,结合区间入流数据,计算不同上游流量数据对应的关键控制断面水位H1
作为本发明的一种优选方案,通过计算Gini系数和Pearson相关系数评估各影响因子的重要性,识别关键影响因子,具体包括:
给定影响因子的数据集D,数据集D的Gini系数的计算公式为:
式中,Gini(D)为数据集D的Gini系数;K表示影响因子的类别个数,pk表示数据集D中第k类影响因子所占比例;Gini(D,A)表示数据集D中影响因子A的Gini系数;
当计算影响因子A的Gini系数时,根据影响因子A的取值,将数据集D分割为D1和D2两个子集,计算每个取值对应的Gini系数,经加权后得到影响因子A的Gini系数;
所述Pearson相关系数的计算公式为:
式中,r表示Pearson相关系数;Xi、Yi分别表示变量X和变量Y的第i个观测值,分别表示变量X和变量Y的观测值的均值;I表示观测值的数量;
所述参数自动寻优具体为使用贝叶斯优化算法对模型参数进行自动寻优。
作为本发明的一种优选方案,所述机器学习模型使用的算法包括随机森林算法、长短时记忆算法、支持向量机算法和决策树算法;
当所述机器学习模型使用的算法具体为随机森林算法时,关键影响因子识别和参数自动寻优后构建的机器学习模型具体为随机森林代理模型;
所述分析关键控制断面水位与各影响因子之间的非线性关系,计算不同影响因子条件下的关键控制断面水位,具体包括:
根据给定的上游流量数据、下游水位或潮位数据和区间入流数据,通过随机森林代理模型计算不同组合下的关键控制断面水位H1
作为本发明的一种优选方案,所述以关键控制断面水位和下游边界逆推上游最大流量,以关键控制断面水位和下游水位或潮位数据为条件矩阵,绘制行洪安全知识图谱,方法包括:
构建随机森林回归模型,根据随机森林代理模型的计算结果,将下游水位或潮位数据和关键控制断面水位H1分别以0.01m形成条件网格矩阵,作为输入条件,逆向输出不同泄流时间情形下的上游最大下泄安全流量Qmax,形成阈值图谱作为行洪安全知识图谱。
一种机器学习结合传统机理模型构建行洪安全知识图谱的系统,所述系统包括:用于模拟计算流域水文情势变化情况的机理模型模块和用于构建流域行洪安全知识图谱的机器学习模型模块;
所述机理模型模块具体包括:
数据收集模块,用于收集流域内河流断面数据、水位数据、流量数据和降雨数据并进行数据预处理;
一维水动力模型模块,用于根据收集到的河流断面数据、水位数据和流量数据,基于圣维南方程组构建一维水动力模型,模拟计算典型工况下的关键控制断面水位,包括模型构建单元、模型率定单元、模型验证单元和边界条件计算单元;
所述模型构建单元用于对所述圣维南方程组采用6点Abbott-Ionescu隐式有限差分格式进行离散,按照水位-流量-水位的顺序交替布置形成计算网格,且水位点和流量点计算时间步长相同;
所述模型率定单元用于对河床糙率n进行率定,按不同河段对河床糙率n进行设置,基于同步水文测验资料进行模型率定;
所述模型验证单元用于收集历史洪水资料进行模型验证,使用纳什效率系数NSE评价所述一维水动力模型的模拟结果;
所述边界条件计算单元用于计算产汇流作为所述一维水动力模型的边界条件;
所述机器学习模块具体包括:
机器学习模型构建模块,用于将一维水动力模型的边界条件因子作为输入条件,模拟计算结果作为训练样本,进行关键影响因子识别和参数自动寻优后构建机器学习模型;
分析模块,用于通过所述机器学习模型,分析关键控制断面水位与关键影响因子之间的非线性关系,计算不同影响因子条件下的关键控制断面水位;
行洪安全知识图谱构建模块,用于构建随机森林回归模型,根据机器学习模型的计算结果,将下游水位或潮位数据和关键控制断面水位H1分别以0.01m形成条件网格矩阵,作为输入条件,逆向输出不同泄流时间情形下的上游最大下泄安全流量Qmax,形成阈值图谱作为行洪安全知识图谱。
与现有技术相比,本发明的有益效果是:通过水动力模型模拟典型工况,模拟计算水文情势变化,量化各情形下行洪量阈值、行洪时机;结合随机森林机器学习手段,建立行洪量阈值与下游水位/潮位、泄洪时间、控制水位等因素之间的响应关系,精细化的描述河道防洪控制断面洪水的变化规律,形成精准及时的实时水位预报模型,阐明安全行洪阈值,绘制阈值图谱,构建高精度的不同情形下的安全行洪图谱,可以为水利事件的精准决策提供科学依据,为流域的洪潮灾害防治、水利工程调度提供科学指导;支撑知识图谱构建,为数字孪生流域和数字孪生水利工程提供智能内核,实现精准及时的流域防洪、水资源管理与调配,最大程度减小流域洪灾损失。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为本发明的方法流程图;
图2为本发明实施例中6点Abbott-Ionescu隐式有限差分格式求解方程示意图;
图3为本发明实施例中构建随机森林代理模型的方法流程图;
图4为本发明实施例中行洪安全知识图谱示意图;
图5为本发明的系统模块化结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1-图4所示,为本发明的一个实施例,该实施例提供了一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,包括以下步骤:
S1:通过机理模型模拟计算流域水文情势变化情况,具体包括:
S11:实测河网断面,收集流域内河流断面数据、水位数据、流量数据和降雨数据并进行数据预处理,剔除不合理的数据;
S12:根据收集到的河流断面数据、水位数据和流量数据,基于圣维南方程组构建一维水动力模型;
在一个具体的实施例中,基于圣维南方程组构建一维水动力模型,具体包括:
一维水动力模型基于一维明渠非恒定流方程,理论基础是圣维南方程组,包括连续方程和运动方程;
连续方程为:
式中,A表示过水断面面积,单位为m2;t表示时间,单位为s;Q表示河流断面净流量,单位为m3/s;x表示沿水流方向的距离,单位为m;q表示单位河段长度的旁侧入流量,包括均匀旁侧入量和集中旁侧入量,单位为m3/s;
运动方程为:
式中,g为重力加速度,单位为m2/s;α为动量校正系数;h为水深,单位为m;C为谢才系数;n为河床糙率,R为水力半径,单位为m;
对圣维南方程组采用6点Abbott-Ionescu隐式有限差分格式进行离散,按照水位-流量-水位的顺序交替布置形成计算网格,且水位点和流量点计算的时间步长Δt相同;
其中,连续方程离散为:
运动方程离散为:
式中,j表示计算网格中网格点的第j处;α、β、γ分别为过流宽度和外部输入δ的函数,随s时刻流量和水深以及s+1/2时刻流量的大小而变化;δj表示在网格点j处的外部输入;
分别表示网格点j-1处、网格点j处、网格点j+1处在s+1时刻的流量;分别表示网格点j-1处、网格点j处、网格点j+1处在s+1时刻的水深;
S13:进行模型率定与模型验证,判断一维水动力模型的精度是否满足要求;若否,则重新进行模型率定与验证;若是,则计算产汇流作为一维水动力模型的边界条件,模拟计算典型工况下的关键控制断面水位;
在其中一个实施例中,模型率定具体为对河床糙率n进行率定,按不同河段对河床糙率n进行设置,基于同步水文测验资料进行模型率定;
收集历史洪水资料进行模型验证,使用纳什效率系数(Nash-Sutcliffeefficiency coefficient,简称NSE)评价一维水动力模型的模拟结果,纳什效率系数NSE的计算公式如下:
式中,M为数据集中数据的个数,为第m个数据的实测值,为第m个数据的模型模拟值,为数据集中所有数据实测值的平均值。
S14:计算产汇流作为一维水动力模型的边界条件,方法包括:
收集流域多年降雨数据,使用泰森多边形划分单元计算面雨量,并通过流域的经验推理公式,计算支流集水区的降雨产流;
根据泰森多边形分割子流域的面积计算各雨量站在各个子流域的权重,得到泰森多边形面雨量权重矩阵,根据推理公式法,计算汇流;
将计算出的降雨产流和汇流作为一维水动力模型的边界条件。
S15:模拟计算典型工况下的关键控制断面水位,方法包括:
对长时期历史实测的下游水位或潮位数据进行频率分析,计算不同重现期的最高潮位,根据流域防洪标准,选取关键控制断面及控制水位;
根据历史资料,选取不同重现期的下游水位或潮位数据作为典型工况,结合区间入流数据,计算不同上游流量数据对应的关键控制断面水位H1
S2:通过机器学习模型构建流域行洪安全知识图谱,具体包括:
S21:将一维水动力模型的边界条件因子作为输入条件,模拟计算结果作为训练样本,进行关键影响因子识别和参数自动寻优后构建机器学习模型;
其中边界条件因子包括上游流量、下游水位或潮位数据,以及区间入流流量;
在一个具体的实施例中,通过计算Gini系数和Pearson相关系数评估各影响因子的重要性,识别关键影响因子;
采用Gini系数表征各影响因子的特征重要性,避免了影响因子选取的盲目性和主观性;通过计算Pearson相关系数来描述两变量的线性相关性,借此解决各影响因子自相关问题,避免了参数选取时有关因素多度或重复考虑带来的信息冗余;
具体包括:给定影响因子的数据集D,数据集D的Gini系数的计算公式为:
式中,Gini(D)为数据集D的Gini系数;K表示影响因子的类别个数,pk表示数据集D中第k类影响因子所占比例;Gini(D,A)表示数据集D中影响因子A的Gini系数;
当计算影响因子A的Gini系数时,根据影响因子A的取值,将数据集D分割为D1和D2两个子集,计算每个取值对应的Gini系数,经加权后得到影响因子A的Gini系数;
Pearson相关系数的计算公式为:
式中,r表示Pearson相关系数;Xi、Yi分别表示变量X和变量Y的第i个观测值,分别表示变量X和变量Y的观测值的均值;I表示观测值的数量;
在其中一个实施例中,参数自动寻优具体为使用贝叶斯优化算法对模型参数进行自动寻优;
可选地,机器学习模型使用的算法包括但不限于随机森林算法、长短时记忆算法、支持向量机算法、决策树算法;
本实施例中的机器学习模型使用的算法具体为随机森林算法,通过关键影响因子识别和参数自动寻优构建随机森林代理模型,实现水位快速精准预报;
随机森林的优势在于它能够自动选择最佳的特征进行分裂,避免了过拟合和高方差的问题;同时,随机森林还可以处理大量的特征和样本,适用于各种类型的数据集。
S22:通过机器学习模型,分析关键控制断面水位与关键影响因子之间的非线性关系,计算不同影响因子条件下的关键控制断面水位;
在其中一个实施例中,步骤S22具体包括:根据给定的上游流量数据、下游水位或潮位数据和区间入流数据,通过随机森林代理模型计算不同组合下的关键控制断面水位H1
S23:以关键控制断面水位和下游边界逆推上游最大流量,以关键控制断面水位和下游水位或潮位数据为条件矩阵,绘制行洪安全知识图谱;
在其中一个实施例中,步骤S23具体包括:
构建随机森林回归模型,根据随机森林代理模型的计算结果,将下游水位或潮位数据和关键控制断面水位H1分别以0.01m形成条件网格矩阵,作为输入条件,逆向输出不同泄流时间情形下的上游最大下泄安全流量Qmax,形成阈值图谱作为行洪安全知识图谱。
以广东省潭江流域为例进行行洪安全知识图谱绘制,潭江流域为感潮河段,下游边界为潮位,此方法对于非感潮河段同样适用。
S1:通过机理模型模拟计算流域水文情势变化情况;
S11:实测河网断面,收集流域内河流断面数据、水位数据、流量数据和降雨数据并进行数据预处理,剔除不合理的数据;
S12:根据收集到的河流断面数据、水位数据和流量数据,基于圣维南方程组构建一维水动力模型;
S13:进行模型率定与模型验证,判断一维水动力模型的精度是否满足要求;若否,则重新进行模型率定与验证;若是,则计算产汇流作为一维水动力模型的边界条件,模拟计算典型工况下的关键控制断面水位;
一维水动力模型参数主要为河床糙率n,本次按不同河段对河床糙率n进行设置。收集到潭江流域2022年7月29日~7月31日同步水文测验资料。以官冲站为模型下边界,以长沙站、石咀站、三江口站为模型率定的参证资料。根据同步水文测验资料进行模型率定,水位的纳什系数均达0.96以上,流量的纳什系数均达到0.9以上,总体率定效果良好。糙率值区率定结果为干流上游断面0.032至下游末断面0.015依次减小,支流河流糙率统一设定为0.032。
使用一维水动力模型模拟潭江流域2018年9月15日~9月17日台风“山竹”期间水文过程,验证结果显示,水位的纳什系数均达0.97以上,模拟效果较好,可以基于此模型进行潭江流域的洪水演进研究。
S14:计算产汇流作为一维水动力模型的边界条件;
潭江流域的区间降雨产流均为未控区域,因此在发生洪潮灾害时仅能通过合山水闸调控上游来水,所以本次研究即重点研究合山水闸的泄流对水位的影响,分析满足关键控制断面防洪要求对应的合山闸安全泄量阈值。考虑到降雨产流对行洪的影响,收集流域多年降雨数据,使用泰森多边形划分75个单元计算面雨量,并通过经验模型,计算26个支流集水区的降雨产流,并将结果作为水动力模型的边界条件,其中台风暴潮期间使用“山竹”台风期间降雨资料,流域总降雨产流最高值为3800m3/s,平均降雨产流914m3/s,其余潮型使用2018年9月平均降雨产流,为100m3/s。根据《广东省暴雨径流查算图表》的推理公式法,计算汇流。
S15:模拟计算典型工况下的关键控制断面水位;
对长时期历史实测的下游水位或潮位数据进行频率分析,计算不同重现期的最高潮位,根据流域防洪标准,选取关键控制断面及控制水位;
根据《广东省江门市流域综合规划修编报告(2005-2030)》,潭江主流沿岸,防洪标准按30年一遇设防。但长沙站河段,由于历史原因没有建设堤防工程,目前采用的警戒水位为2.0m,防洪标准按5年一遇考虑。选取长沙站、石咀站两个控制断面,根据1976年到2021年长沙站和石咀站的实测水位进行频率分析。根据频率分析的结果,选取长沙站、石咀站两个控制断面,长沙站控制水位为5年一遇2.40米,石咀站控制水位为30年一遇2.43米。
根据历史资料,选取不同重现期的下游水位或潮位数据作为典型工况,结合区间入流数据,计算不同上游流量数据对应的关键控制断面水位H1
S2:通过机器学习模型构建流域行洪安全知识图谱;
将一维水动力模型的边界条件因子作为输入条件,模拟计算结果作为训练样本,进行关键影响因子识别和参数自动寻优后构建机器学习模型;
经计算,实施例中对河道水位影响最大的为下游水位/潮位H;其次为上游流量Q;以及其余主要的10个区间入流Qi,包括支流入流和水库入流等。
训练和测试机器学习算法的具体方法为:
本实施例中的机器学习模型使用的算法具体为随机森林算法,通过关键影响因子识别和参数自动寻优构建随机森林代理模型,实现水位快速精准预报;
本实施例共提取3860小时的机理模型计算逐时数据作为训练集,使用历史时期风暴潮和龙舟水期间200小时逐时数据作为测试集。训练集用于对机器学习算法进行训练,测试集用于验证机器学习算法的精度。本实施例使用下游水位或潮位数据H、时间t、10个主要区间来水Qi、上游泄流流量数据Q等12个因子作为随机森林代理模型的输入条件,通过随机森林计算关键控制断面水位与其他水文因素的非线性响应关系,输出关键控制断面水位H1,形成精准及时的关键断面实时水位预报模型。
构建随机森林回归模型,根据随机森林代理模型的计算结果,将下游水位或潮位数据和关键控制断面水位H1分别以0.01m形成条件网格矩阵,作为输入条件,逆向输出不同泄流时间情形下的上游最大下泄安全流量Qmax,形成阈值图谱作为行洪安全知识图谱。
本实施例中随机森林机器学习算法的具体技术流程如下:
一、运行环境
1、配备PyCharm
2、导入相关库
import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from scipy.stats import pearsonr
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import MinMaxScaler
from bayes_opt import BayesianOptimization
二、导入数据
1、样本集:4060组,每组均为时间t,下游水位/潮位H,上游流量Q,以及其余主要的10个区间入流Qi
2、特征变量:4060个,关键控制断面水位H1
三、方法
1、分训练集(3860组)、测试集(200组),分别存在txt文件中。
导入训练数据集
train_data=pd.read_csv('traindata.txt',index_col=0,sep='\t')
train_data=train_data.dropna(axis=0,how='any')
导入预测数据集
test_data=pd.read_csv('testdata.txt',index_col=0,sep='\t')
test_data=test_data.dropna(axis=0,how='any')
2、随机森林机器学习算法
3、随机森林绘制知识图谱算法
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
import numpy as np
import matplotlib.pyplot as plt
#读取数据
data=pd.read_csv('your_data.txt',sep='\t')
#提取特征和目标值
H_values=data['H'].values
H1_values=data['H1'].values
Q_values=data['Q'].values
#构建特征矩阵
features=np.column_stack((H_values,H1_values))
#构建随机森林回归模型
rf_model=RandomForestRegressor(n_estimators=50,random_state=42)
#训练模型
rf_model.fit(features,Q_values)
#生成网格点
grid_H,grid_H1=np.meshgrid(np.linspace(min(H_values),
max(H_values)),np.linspace(min(H1_values),max(H1_values)))
#将网格点数据转换成一维数组
grid_data=np.column_stack((grid_H.ravel(),grid_H1.ravel()))
#使用模型进行预测
predicted_Q_grid=rf_model.predict(grid_data)
#将预测结果转换为网格形状
predicted_Q_grid=predicted_Q_grid.reshape(grid_H.shape)
#绘制矩阵色块图
plt.figure(figsize=(10,8))
plt.pcolormesh(grid_H,grid_H1,predicted_Q_grid,cmap='viridis',shading='auto')
plt.scatter(H_values,H1_values,c=Q_values,cmap='viridis',edgecolors='k',linewidths=0.5,alpha=0.8)
plt.colorbar(label='Qmax值')
plt.xlabel('H')
plt.ylabel('H1')
plt.show()
上述流程中包含了随机森林机器学习算法进行水位预测和图谱绘制的主要参数设置和调用函数。
如图5所示,为本发明的另一实施例,该实施例提供了一种机器学习结合传统机理模型构建行洪安全知识图谱的系统,包括用于模拟计算流域水文情势变化情况的机理模型模块和用于构建流域行洪安全知识图谱的机器学习模型模块;
机理模型模块具体包括:
数据收集模块,用于收集流域内河流断面数据、水位数据、流量数据和降雨数据并进行数据预处理;
一维水动力模型模块,用于根据收集到的河流断面数据、水位数据和流量数据,基于圣维南方程组构建一维水动力模型,模拟计算典型工况下的关键控制断面水位,包括模型构建单元、模型率定单元、模型验证单元和边界条件计算单元;
模型构建单元用于对圣维南方程组采用6点Abbott-Ionescu隐式有限差分格式进行离散,按照水位-流量-水位的顺序交替布置形成计算网格,且水位点和流量点计算时间步长相同;
模型率定单元用于对河床糙率n进行率定,按不同河段对河床糙率n进行设置,基于同步水文测验资料进行模型率定;
模型验证单元用于收集历史洪水资料进行模型验证,使用纳什效率系数评价一维水动力模型的模拟结果;
边界条件计算单元用于计算产汇流作为一维水动力模型的边界条件;
机器学习模型模块具体包括:
机器学习模型构建模块,用于将一维水动力模型的边界条件因子作为输入条件,模拟计算结果作为训练样本,进行关键影响因子识别和参数自动寻优后构建机器学习模型;
分析模块,用于通过机器学习模型,分析关键控制断面水位与关键影响因子之间的非线性关系,计算不同影响因子条件下的关键控制断面水位;
行洪安全知识图谱构建模块,用于构建随机森林回归模型,根据机器学习模型的计算结果,将下游水位或潮位数据和关键控制断面水位H1分别以0.01m形成条件网格矩阵,作为输入条件,逆向输出不同泄流时间情形下的上游最大下泄安全流量Qmax,形成阈值图谱作为行洪安全知识图谱。
综上所述,本发明通过水动力模型模拟典型工况,模拟计算水文情势变化,量化各情形下行洪量阈值、行洪时机;结合随机森林机器学习手段,建立行洪量阈值与下游水位/潮位、泄洪时间、控制水位等因素之间的响应关系,精细化的描述河道防洪控制断面洪水的变化规律,形成精准及时的实时水位预报模型,阐明安全行洪阈值,绘制阈值图谱,构建高精度的不同情形下的安全行洪图谱,可以为水利事件的精准决策提供科学依据,为流域的洪潮灾害防治、水利工程调度提供科学指导;支撑知识图谱构建,为数字孪生流域和数字孪生水利工程提供智能内核,实现精准及时的流域防洪、水资源管理与调配,最大程度减小流域洪灾损失。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其他任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现,计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。该存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,其特征在于,所述方法包括:
通过机理模型模拟计算流域水文情势变化情况,具体包括:
实测河网断面,收集流域内河流断面数据、水位数据、流量数据和降雨数据并进行数据预处理;
根据收集到的河流断面数据、水位数据和流量数据,基于圣维南方程组构建一维水动力模型;
进行模型率定与模型验证,判断所述一维水动力模型的精度是否满足要求;若否,则重新进行模型率定与验证;若是,则计算产汇流作为所述一维水动力模型的边界条件,模拟计算典型工况下的关键控制断面水位;
通过机器学习模型构建流域行洪安全知识图谱,具体包括:
将所述一维水动力模型的边界条件因子作为输入条件,模拟计算结果作为训练样本,进行关键影响因子识别和参数自动寻优后构建机器学习模型;其中,边界条件因子包括上游流量、下游水位或潮位数据,以及区间入流流量;
通过所述机器学习模型,分析关键控制断面水位与关键影响因子之间的非线性关系,计算不同影响因子条件下的关键控制断面水位;
以关键控制断面水位和下游边界逆推上游最大流量,以关键控制断面水位和下游水位或潮位数据为条件矩阵,绘制行洪安全知识图谱。
2.根据权利要求1所述的一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,其特征在于,所述基于圣维南方程组构建一维水动力模型,具体包括:
一维水动力模型基于一维明渠非恒定流方程,理论基础是圣维南方程组,包括连续方程和运动方程;
所述连续方程为:
式中,A表示过水断面面积,单位为m2t表示时间,单位为s;Q表示河流断面净流量,单位为m3/s;x表示沿水流方向的距离,单位为m;q表示单位河段长度的旁侧入流量,包括均匀旁侧入量和集中旁侧入量,单位为m3/s;
所述运动方程为:
式中,g为重力加速度,单位为m2/s;α为动量校正系数;h为水深,单位为m;C为谢才系数;n为河床糙率,R为水力半径,单位为m;
对所述圣维南方程组采用6点Abbott-Ionescu隐式有限差分格式进行离散,按照水位-流量-水位的顺序交替布置形成计算网格,且水位点和流量点计算的时间步长∆𝑡相同;
其中,连续方程离散为:
运动方程离散为:
式中,j表示计算网格中网格点的第j处;αβγ分别为过流宽度和外部输入的函数,随s时刻的流量和水深以及s+1/2时刻流量的大小而变化;表示在网格点j处的外部输入;分别表示网格点j-1处、网格点j处、网格点j+1处在s+1时刻的流量;分别表示网格点j-1处、网格点j处、网格点j+1处在s+1时刻的水深。
3.根据权利要求1所述的一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,其特征在于,所述模型率定具体为对河床糙率n进行率定,按不同河段对河床糙率n进行设置,基于同步水文测验资料进行模型率定;
收集历史洪水资料进行模型验证,使用纳什效率系数NSE评价所述一维水动力模型的模拟结果,所述纳什效率系数NSE的计算公式如下:
式中,M为数据集中数据的个数,为第𝑚个数据的实测值,为第𝑚个数据的模型模拟值,为数据集中所有数据实测值的平均值。
4.根据权利要求1所述的一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,其特征在于,所述计算产汇流作为所述一维水动力模型的边界条件,方法包括:
收集流域多年降雨数据,使用泰森多边形划分单元计算面雨量,并通过流域的经验推理公式,计算支流集水区的降雨产流;
根据泰森多边形分割子流域的面积计算各雨量站在各个子流域的权重,得到泰森多边形面雨量权重矩阵,根据推理公式法,计算汇流;
将计算出的降雨产流和汇流作为一维水动力模型的边界条件。
5.根据权利要求1所述的一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,其特征在于,所述模拟计算典型工况下的关键控制断面水位,方法包括:
对长时期历史实测的下游水位或潮位数据频率分析,计算不同重现期最高潮位,根据流域防洪标准,选取关键控制断面及控制水位;
根据历史资料,选取不同重现期的下游水位或潮位数据作为典型工况,结合区间入流数据,计算不同上游流量数据对应的关键控制断面水位H1
6.根据权利要求1所述的一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,其特征在于,通过计算Gini系数和Pearson相关系数评估各影响因子的重要性,识别关键影响因子,具体包括:
给定影响因子的数据集D,数据集D的Gini系数的计算公式为:
式中,Gini(D)为数据集D的Gini系数;K表示影响因子的类别个数,表示数据集D中第k类影响因子所占比例;Gini(D,A)表示数据集D中影响因子A的Gini系数;
当计算影响因子A的Gini系数时,根据影响因子A的取值,将数据集D分割为D1和D2两个子集,计算每个取值对应的Gini系数,经加权后得到影响因子A的Gini系数;
所述Pearson相关系数的计算公式为:
式中,r表示Pearson相关系数;分别表示变量X和变量Y的第i个观测值,分别表示变量X和变量Y的观测值的均值;I表示观测值的数量;
所述参数自动寻优具体为使用贝叶斯优化算法对模型参数进行自动寻优。
7.根据权利要求1所述的一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,其特征在于,所述机器学习模型使用的算法包括随机森林算法、长短时记忆算法、支持向量机算法和决策树算法;
当所述机器学习模型使用的算法具体为随机森林算法时,关键影响因子识别和参数自动寻优后构建的机器学习模型具体为随机森林代理模型;
所述分析关键控制断面水位与各影响因子之间的非线性关系,计算不同影响因子条件下的关键控制断面水位,具体包括:
根据给定的上游流量数据、下游水位或潮位数据和区间入流数据,通过随机森林代理模型计算不同组合下的关键控制断面水位H1
8.根据权利要求7所述的一种机器学习结合传统机理模型构建行洪安全知识图谱的方法,其特征在于,所述以关键控制断面水位和下游边界逆推上游最大流量,以关键控制断面水位和下游水位或潮位数据为条件矩阵,绘制行洪安全知识图谱,方法包括:
构建随机森林回归模型,根据随机森林代理模型的计算结果,将下游水位或潮位数据和关键控制断面水位H1分别以0.01m形成条件网格矩阵,作为输入条件,逆向输出不同泄流时间情形下的上游最大下泄安全流量Qmax,形成阈值图谱作为行洪安全知识图谱。
9.基于权利要求1-8任一项所述的一种机器学习结合传统机理模型构建行洪安全知识图谱的方法的系统,其特征在于,所述系统包括:用于模拟计算流域水文情势变化情况的机理模型模块和用于构建流域行洪安全知识图谱的机器学习模型模块;
所述机理模型模块具体包括:
数据收集模块,用于收集流域内河流断面数据、水位数据、流量数据和降雨数据并进行数据预处理;
一维水动力模型模块,用于根据收集到的河流断面数据、水位数据和流量数据,基于圣维南方程组构建一维水动力模型,模拟计算典型工况下的关键控制断面水位,包括模型构建单元、模型率定单元、模型验证单元和边界条件计算单元;
所述模型构建单元用于对所述圣维南方程组采用6点Abbott-Ionescu隐式有限差分格式进行离散,按照水位-流量-水位的顺序交替布置形成计算网格,且水位点和流量点计算时间步长相同;
所述模型率定单元用于对河床糙率n进行率定,按不同河段对河床糙率n进行设置,基于同步水文测验资料进行模型率定;
所述模型验证单元用于收集历史洪水资料进行模型验证,使用纳什效率系数NSE评价所述一维水动力模型的模拟结果;
所述边界条件计算单元用于计算产汇流作为所述一维水动力模型的边界条件;
所述机器学习模型模块具体包括:
机器学习模型构建模块,用于将一维水动力模型的边界条件因子作为输入条件,模拟计算结果作为训练样本,进行关键影响因子识别和参数自动寻优后构建机器学习模型;
分析模块,用于通过所述机器学习模型,分析关键控制断面水位与关键影响因子之间的非线性关系,计算不同影响因子条件下的关键控制断面水位;
行洪安全知识图谱构建模块,用于构建随机森林回归模型,根据机器学习模型的计算结果,将下游水位或潮位数据和关键控制断面水位H1分别以0.01m形成条件网格矩阵,作为输入条件,逆向输出不同泄流时间情形下的上游最大下泄安全流量Qmax,形成阈值图谱作为行洪安全知识图谱。
CN202410245453.4A 2024-03-05 2024-03-05 一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统 Active CN117993495B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410245453.4A CN117993495B (zh) 2024-03-05 2024-03-05 一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410245453.4A CN117993495B (zh) 2024-03-05 2024-03-05 一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统

Publications (2)

Publication Number Publication Date
CN117993495A CN117993495A (zh) 2024-05-07
CN117993495B true CN117993495B (zh) 2024-09-03

Family

ID=90896025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410245453.4A Active CN117993495B (zh) 2024-03-05 2024-03-05 一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统

Country Status (1)

Country Link
CN (1) CN117993495B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507419A (zh) * 2020-11-19 2021-03-16 长江勘测规划设计研究有限责任公司 无资料、多碍洪构筑物的山区性河流洪水过程模拟方法
CN112966722A (zh) * 2021-02-07 2021-06-15 南昌大学 基于半监督随机森林模型的区域滑坡易发性预测方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR109623A1 (es) * 2018-02-16 2019-01-09 Pescarmona Enrique Menotti Proceso y sistema de análisis y gestión hidrológica para cuencas
CN113723024B (zh) * 2021-08-30 2024-04-05 浙江大学 一种适用于滨海地区的“溪流”-“河道”-“河口”分布式洪水过程模拟方法
CN115758712B (zh) * 2022-11-11 2024-05-14 长江勘测规划设计研究有限责任公司 城市雨洪全过程分布式水文水动力学耦合模型构建方法
CN115759459B (zh) * 2022-12-01 2023-07-28 长江水利委员会水文局 一种雨水工情耦合的流域洪水流量集合概率智能预报方法
CN116542021B (zh) * 2023-04-04 2024-08-13 中国长江电力股份有限公司 一种水文-水动力学耦合的河道型水库调洪演算方法
CN116822400B (zh) * 2023-05-30 2024-07-16 长江勘测规划设计研究有限责任公司 一种适合于大尺度平原河网一维非恒定流模拟方法
CN116776775A (zh) * 2023-06-27 2023-09-19 武汉大学 一种天然河道一维非恒定流数学模型糙率参数的自动率定方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507419A (zh) * 2020-11-19 2021-03-16 长江勘测规划设计研究有限责任公司 无资料、多碍洪构筑物的山区性河流洪水过程模拟方法
CN112966722A (zh) * 2021-02-07 2021-06-15 南昌大学 基于半监督随机森林模型的区域滑坡易发性预测方法

Also Published As

Publication number Publication date
CN117993495A (zh) 2024-05-07

Similar Documents

Publication Publication Date Title
JP4807565B2 (ja) 流量予測装置
CN113222296B (zh) 一种基于数字孪生的防洪调度方法
CN108764515A (zh) 一种耦合数值气象水文集合预报的水库调度风险决策方法
Wang et al. Surface water temperature prediction in large-deep reservoirs using a long short-term memory model
CN111553394B (zh) 基于循环神经网络和关注机制的水库水位预测方法
CN108109076A (zh) 一种考虑径流预报的梯级水电站群发电调度弃水风险分析方法
CN111898253B (zh) 水库调度及其下游河流生态环境保护的合作价值评估方法
CN114492233B (zh) 一种基于webGIS平台及考虑综合利用要求的流域水模拟方法
CN105930670A (zh) 基于模型参数不确定性的河流突发污染事故动态预测方法
CN116050628A (zh) 一种基于数字孪生的考虑预报不确定性的水库防洪优化调度方法
JP2024077563A (ja) 動的貯水容量の影響を考慮した貯水池の超短期水位予測方法、システムおよび記憶媒体
CN117436619B (zh) 一种基于等效防洪作用的梯级水库防洪库容联合预留方法
CN101899820A (zh) 面向河流生态系统保护的流域地表水可利用量确定方法
CN114819322B (zh) 湖泊入湖流量的预报方法
Randrianasolo et al. Impact of streamflow data assimilation and length of the verification period on the quality of short-term ensemble hydrologic forecasts
US20240256746A1 (en) Scheduling method and system for operation of reservoirs to recharge freshwater for repelling saltwater intrusion under changing conditions
CN117332908B (zh) 一种耦合集合预报的梯级水库多目标优化调度方法及系统
CN108960522A (zh) 一种光伏发电量预测分析方法
Wang et al. Evaluating the impact of power station regulation on the suitability of drifting spawning fish habitat based on the fuzzy evaluation method
CN117993495B (zh) 一种机器学习结合传统机理模型构建行洪安全知识图谱的方法及系统
CN115496128A (zh) 一种基于雨强-雨型特征参数联合分布的城市内涝风险预报方法
CN115146861B (zh) 一种基于水位延时因子的流域水位延时影响时间预测模型
CN115526378A (zh) 一种河道监测断面水质预测方法
CN115358587A (zh) 区域多部门协同的基础设施规划方法及系统
CN111047213B (zh) 基于多要素联合判别的中长期水资源量临界预警指标方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant