CN113378484B - 一种基于机器学习的平原河网地区洪水过程预报方法 - Google Patents

一种基于机器学习的平原河网地区洪水过程预报方法 Download PDF

Info

Publication number
CN113378484B
CN113378484B CN202110785030.8A CN202110785030A CN113378484B CN 113378484 B CN113378484 B CN 113378484B CN 202110785030 A CN202110785030 A CN 202110785030A CN 113378484 B CN113378484 B CN 113378484B
Authority
CN
China
Prior art keywords
rainfall
flood
time
water level
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110785030.8A
Other languages
English (en)
Other versions
CN113378484A (zh
Inventor
王杉
徐卫红
王静
俞茜
高建标
李娜
韩松
王艳艳
丁志雄
张念强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Institute of Water Resources and Hydropower Research
Original Assignee
China Institute of Water Resources and Hydropower Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Institute of Water Resources and Hydropower Research filed Critical China Institute of Water Resources and Hydropower Research
Priority to CN202110785030.8A priority Critical patent/CN113378484B/zh
Publication of CN113378484A publication Critical patent/CN113378484A/zh
Application granted granted Critical
Publication of CN113378484B publication Critical patent/CN113378484B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/08Fluids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种基于机器学习的平原河网地区洪水过程预报方法,该方法包括利用预报目标站点历史面降雨子过程数据和相应的历史洪水子过程数据,构建包括起涨点先验判定模型、洪峰水位回归模型和峰现历时回归模型的洪水过程预报模型;并基于预报目标站点实时和预报面降雨子过程数据和相应的实时水位子过程数据,利用起涨点先验判定模型,获得计算起涨点,利用洪峰水位回归模型和峰现历时回归模型,预报目标站点洪峰水位和峰现历时,实现目标站点洪水上涨过程的预报。本发明具有操作简单、建模速度快,计算效率高,预测精度高等优点,能够实现准确有效的洪水预测,有助于洪水防御决策。

Description

一种基于机器学习的平原河网地区洪水过程预报方法
技术领域
本发明涉及洪水过程预报技术领域,具体涉及一种基于机器学习的平原河网地区洪水过程预报方法。
背景技术
随着全球气候变暖,我国受洪涝灾害的威胁日益严峻。为了防御洪水,我国已形成了一套防洪工程体系,除此之外,非工程措施也日益完善。洪水过程预报是重要的非工程措施之一,基于洪水预报结果,可事先控制水利工程(水库、闸坝)的泄洪、拦洪、削减洪峰,与下游洪水错峰等,可为防洪决策提供重要依据。
洪水预报的预见期是以上游洪水向下游传播时间或由降雨形成洪水过程的滞后时间为依据的,大中河流域的预见期较长,一般在2天以上,小流域或区间的洪水预见期相对小一些,约3~6个小时。在防洪斗争中时间就是生命,能多争取1~2个小时,可大大降低或避免伤亡,是提高防汛减灾能力和效果的重要基础。
传统的洪水预报方法,主要是依据上游已经出现的水文情况或地区降雨,基于流域和河道内的流体力学和水量平衡原理,构建水文或水动力学模型,借助土壤、地貌、河网的特性进行产流和汇流演算,计算出下游断面的水位、流量过程(包括洪峰、总量)。这种基于模型的洪水预报方法,对于缺乏用于率定模型参数的资料地区,需移植临近相似区域的模型参数,但存在主观性强、不确定性高等问题。
发明内容
针对现有技术中的上述不足,本发明提供了一种基于机器学习的平原河网地区洪水过程预报方法。
为了达到上述发明目的,本发明采用的技术方案为:
一种基于机器学习的平原河网地区洪水过程预报方法,包括以下步骤:
获取预报目标站点及周边降雨监测站点的历史、实时、预报降雨过程数据,并采用反距离权重插值算法计算预报目标站点的历史、实时、预报面降雨过程数据;将实时面降雨过程数据和预报面降雨过程数据进行拼接,生成实时和预报面降雨过程数据;
采用连续无降雨划分方法,将历史面降雨过程数据、实时和预报面降雨过程数据,划分为历史面降雨子过程数据、实时和预报面降雨子过程数据;
利用预报目标站点的历史面降雨子过程数据和相应的历史洪水子过程数据,构建包括起涨点先验判定模型、洪峰水位回归模型和峰现历时回归模型的洪水过程预报模型;
利用起涨点先验判定模型,基于预报目标站点的实时和预报面降雨子过程数据和相应的实时水位子过程数据,识别起涨点并修正得到计算起涨点;
利用洪峰水位回归模型,预报目标站点的洪峰水位;
利用峰现历时回归模型,识别实时和预报面降雨子过程数据中的主降雨过程数据,预报目标站点的峰现历时;
以计算起涨点为起始时刻,基于预报目标站点的预报洪峰水位和峰现历时、计算起涨点后的实时水位数据,计算预报目标站点的预报洪水上涨过程。
进一步地,所述采用连续无降雨划分方法,将历史面降雨过程数据、实时和预报面降雨过程数据,划分为历史面降雨子过程数据、实时和预报面降雨子过程数据具体包括:
将历史面降雨过程数据、实时和预报面降雨过程数据中连续24小时无降雨作为划分条件;
根据划分条件,将历史面降雨过程数据、实时和预报面降雨过程数据划分至少一个历史面降雨子过程数据、实时和预报面降雨子过程数据。
进一步地,所述起涨点先验判定模型的构建方法具体包括:
设定预报目标站点各历史洪水子过程中水位由平或缓慢上涨转为明显上涨的点作为起涨点;
利用历史面降雨子过程数据和预报目标站点相应的历史洪水子过程数据,识别可接受起涨点子集和不可接受起涨点子集,构建训练集和验证集;
构建以历史水位过程一阶导数和时段累积雨量作为约束条件的起涨点判定模型,利用训练集对起涨点判定模型进行有监督分类训练,并利用验证集进行先验验证。
进一步地,所述利用训练集对起涨点判定模型进行有监督分类训练的方法为:
计算训练集中非连续平滑历史水位过程的一阶导数,设置一阶导数的系列阈值条件,计算训练集中可接受起涨点子集和不可接受起涨点子集中一阶导数满足设定阈值条件的水位点数量。
筛选各历史洪水子过程可接受起涨点子集中所述水位点数量大于或等于1的阈值条件;选取所述阈值条件在不可接受起涨点集中水位点数量最小的阈值条件作为一阶导数特征判别条件;
设置不同时段、不同累积雨量的组合作为系列阈值条件,基于满足所述一阶导数特征判别条件的水位点对应时刻之前的不同时段累积雨量,计算训练集中各历史洪水子过程可接受起涨点子集和不可接受起涨点子集中不同时段累积雨量满足所述阈值条件的水位点数量;
获取所述水位点数量在各历史洪水子过程可接受起涨点子集中大于等于1且在不可接受起涨点子集中为0所对应的阈值条件,筛选每个历史洪水子过程可接受起涨点子集中满足所述阈值条件的时刻最早的水位点;
计算所述水位点与所属可接受起涨点子集中时刻最早的水位点之间的时间差,计算所述每个阈值条件下全部历史洪水子过程的时间差平均值;
将所述时间差平均值最小所对应的阈值条件,作为时段累积雨量特征判别条件,并与一阶导数特征判别条件组合,作为起涨点判别条件。
进一步地,所述洪峰水位回归模型的构建方法为:
获取与预报目标站点各历史洪水子过程相对应的上游站点的洪峰流量、最大连续3小时平均流量、最大连续6小时平均流量数据,并分析与预报目标站点洪峰水位的相关性;
获取与预报目标站点各历史洪水子过程相对应的下游站点的初始时刻水位,并分析与预报目标站点洪峰水位的相关性;
获取各历史面降雨子过程在计算起涨点时刻之后的累积雨量和计算起涨点时刻预报目标站点的水位,并分析与预报目标站点洪峰水位的相关性;
选择所述相关性较大的特征,利用历史面降雨子过程数据和预报目标站点相应的历史洪水子过程数据建立训练集和验证集,采用机器学习方法进行训练,构建预报目标站点洪峰水位与目标站点计算起涨点时刻水位、本地区面降雨、上游站点洪水流量及下游站点初始时刻水位相关的回归模型。
进一步地,所述峰现历时回归模型的构建方法为:
计算各历史洪水子过程计算起涨点至洪峰的历时作为峰现历时;
设置系列百分比,计算各历史面降雨子过程总累积雨量,并与系列百分比相乘获得系列百分比累积雨量;
获取各历史面降雨子过程中累积雨量不小于且与系列百分比累积雨量最接近的系列连续降雨过程;
选择所述系列连续降雨过程中历时最短且最早出现的过程,分析该过程的累积雨量和历时与峰现历时的相关关系;
选取相关关系最大的连续降雨过程作为该历史洪水子过程的主降雨过程;
基于主降雨过程的累积雨量和总历时、历史洪水子过程的峰现历时,建立训练集和验证集,采用机器学习方法进行训练,构建峰现历时回归模型。
进一步地,所述历史洪水子过程数据的获取方法具体包括:
获取预报目标站点各面降雨子过程的初始时刻至下一场面降雨子过程初始时刻内的最高水位作为洪峰水位;
将各面降雨子过程的初始时刻至洪峰水位对应时刻内的洪水过程数据,作为预报目标站点的洪水子过程数据。
进一步地,所述起涨点修正得到计算起涨点具体包括:
获取各面降雨子过程中在起涨点对应时刻之前第一个满足连续T时长无降雨的时段;
计算所述时段结束时刻至所属面降雨子过程的结束时刻的累积雨量,分析该累积雨量、所述时段结束时刻水位与洪峰水位的相关性;
选取相关性最大的累积雨量所对应的时长T作为最优参数,将该T时长结束时刻作为计算起涨点。
进一步地,所述以计算起涨点为起始时刻,基于预报目标站点的预报洪峰水位和峰现历时、计算起涨点后的实时水位数据,计算预报目标站点的预报洪水上涨过程,具体包括:
以计算起涨点为起始时刻,利用峰现历时和洪峰水位确定洪峰点;
从洪峰点向前构造两个插值点;
利用三次样条曲线拟合计算起涨点后各实时水位实测点、洪峰点和新构造的插值点;
利用拟合后的三次样条曲线计算其余时间点的预测水位,得到预报目标站点的预报洪水上涨过程。
本发明具有以下有益效果:
本发明首先利用历史面降雨子过程数据和相应的历史洪水子过程数据,构建包括起涨点先验判定模型、洪峰水位回归模型和峰现历时回归模型的洪水过程预报模型;利用起涨点先验判定模型,识别起涨点并修正得到计算起涨点;利用构建的峰现历时回归模型,识别实时和预报面降雨子过程数据中的主降雨过程数据,预报目标站点的峰现历时;利用洪峰水位回归模型,预报目标站点的洪峰水位;最后根据预报目标站点的预报洪峰水位和峰现历时及计算起涨点后的实时水位数据,计算预报目标站点的预报洪水上涨过程数据,从而实现平原河网地区洪水过程预预报。该方法具有操作简单、建模速度快,计算效率高,预测精度高等优点,能够实现准确有效的洪水预测,有助于洪水防御决策。
附图说明
图1为本发明实施例提供的一种基于机器学习的平原河网地区洪水过程预报方法的流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,本发明实施例提供的一种基于机器学习的平原河网地区洪水过程预报方法,包括以下步骤S1至S7:
S1、获取预报目标站点及周边降雨监测站点的历史降雨过程数据、实时降雨过程数据、预报降雨过程数据,并采用反距离权重插值算法计算预报目标站点的历史面降雨过程数据、实时面降雨过程数据、预报面降雨过程数据;将实时面降雨过程数据和预报面降雨过程数据进行拼接,生成实时和预报面降雨过程数据;
在本步骤中,如果预报目标站点同时建有降雨监测站点,则直接使用该站点降雨过程数据;否则,需要通过周边降雨监测站点进行反距离权重插值。
本发明依据平原河网地区的特性,根据预报目标站点及周边降雨监测站点的历史降雨过程数据、实时降雨过程数据、预报降雨过程数据,利用IDW(Inverse DistanceWeight,反距离权重)插值算法计算预报目标站点的历史面降雨过程数据、实时面降雨过程数据、预报面降雨过程数据。
本发明将预报目标站点的实时面降雨过程数据和预报面降雨过程数据进行拼接,生成拼接后的实时和预报面降雨过程数据。
S2、采用连续无降雨划分方法,将历史面降雨过程数据、实时和预报面降雨过程数据,划分为历史面降雨子过程数据、实时和预报面降雨子过程数据;
在本步骤中,假设该目标站点上游站点为m个,下游站点为n个,则有:
预报目标站点的暴雨洪水事件集合S={S1,S2,S3,…},其中任意一场暴雨洪水事件Si=(Pi,Zi0,Qi1,Qi2,…,Qim,Zi1,Zi2,…,Zin),由本地面降雨过程Pi,目标站点水位过程Zi0,上游站点的洪水流量过程Qi和下游站点的水位过程Zi组成。
为了更精确的模拟一场连续暴雨形成的洪水多峰的情况,对各场次事件Si完整的降雨、水位和流量过程进行更为精细的划分,得到1个或数个子暴雨洪水事件,包括本地区面降雨子过程和与之相对应的目标站点水位子过程,同期上游站点流量子过程和下游站点水位子过程。
步骤S2具体包括以下分步骤:
S21、将历史面降雨过程数据、实时和预报面降雨过程数据中连续24小时无降雨作为划分条件;
S22、根据划分条件,将历史面降雨过程数据、实时和预报面降雨过程数据划分至少一个历史面降雨子过程数据、实时和预报面降雨子过程数据。
具体而言,本发明假设连续24小时无降雨则一场降雨过程停止,将暴雨洪水事件Si的完整面降雨过程Pi划分为1个或数个面降雨子过程{Pi1,Pi2,…},其中(Pij={pij1,pij2,…}|j=1,2,…)由逐时段(一般为1小时)降雨pijk组成。
S3、利用预报目标站点的历史面降雨子过程数据和相应的历史洪水子过程数据,构建包括起涨点先验判定模型、洪峰水位回归模型和峰现历时回归模型的洪水过程预报模型;
在本步骤中,起涨点先验判定模型的构建方法具体包括:
设定预报目标站点各历史洪水子过程中水位由平或缓慢上涨转为明显上涨的点作为起涨点;
利用历史面降雨子过程数据和预报目标站点相应的历史洪水子过程数据,识别可接受起涨点子集和不可接受起涨点子集,构建训练集和验证集;
构建以历史水位过程一阶导数和时段累积雨量作为约束条件的起涨点判定模型,利用训练集对起涨点判定模型进行有监督分类训练,并利用验证集进行先验验证。
利用训练集对起涨点判定模型进行有监督分类训练的方法为:
计算训练集中非连续平滑历史水位过程的一阶导数,设置一阶导数的系列阈值条件,计算训练集中可接受起涨点子集和不可接受起涨点子集中一阶导数满足设定阈值条件的水位点数量。
筛选各历史洪水子过程可接受起涨点子集中所述水位点数量大于或等于1的阈值条件;选取所述阈值条件在不可接受起涨点集中水位点数量最小的阈值条件作为一阶导数特征判别条件;
设置不同时段、不同累积雨量的组合作为系列阈值条件,基于满足所述一阶导数特征判别条件的水位点对应时刻之前的不同时段累积雨量,计算训练集中各历史洪水子过程可接受起涨点子集和不可接受起涨点子集中不同时段累积雨量满足所述阈值条件的水位点数量;
获取所述水位点数量在各历史洪水子过程可接受起涨点子集中大于等于1且在不可接受起涨点子集中为0所对应的阈值条件,筛选每个历史洪水子过程可接受起涨点子集中满足所述阈值条件的时刻最早的水位点;
计算所述水位点与所属可接受起涨点子集中时刻最早的水位点之间的时间差,计算所述每个阈值条件下全部历史洪水子过程的时间差平均值;
将所述时间差平均值最小所对应的阈值条件,作为时段累积雨量特征判别条件,并与一阶导数特征判别条件组合,作为起涨点判别条件。
具体而言,本发明定义目标站点在某暴雨洪水子过程中水位由平或缓慢上涨转为明显上涨的点(包括时间和水位两个值)作为“起涨点”。
从全部已划分好的暴雨洪水子过程数据中选取2个作为验证集,其余作为训练集,建立模型,用已有目标站点的水位和本地区面降雨过程数据实现对“起涨点”的“无二义性”和“尽可能早出现”的“先验识别”。
首先,对全部样本数据每场子过程的任意时间点及对应水位进行人工判读,将每场子过程的时间点(等间隔,一般为1小时)及对应水位分为一个不可接受起涨点集S1(水位平缓期,模型不应将该集合中的点识别为“起涨点”)和一个可接受起涨点集S2(水位明显上涨期,即模型应将该集合中的某点识别为“起涨点”),利用这两个集合做有监督分类训练。
建立一个类决策树的算法,算法以水位一阶导数和时段累积雨量作为两个特征,建立并筛选不同的特征判别条件,计算损失函数,以求达到识别“无二义性”且“尽可能早出现”的“先验识别”“起涨点”。
因本算法模型需要实现先验,在模型判别时无足够多的点以实现水位过程平滑时,需借用五点求导法计算非连续平滑水位过程的一阶导数dz/dt作为第一个特征。设定一阶导数阈值为R’,计算不同R’值下,S1和S2空间中不小于阈值R’的点的数量。求得一阶导数特征评判阈值R’,进而确定一阶导数特征判别条件。
首先,求任一实测水位点的一阶导数。
其次,根据S2空间中计算出的一阶导数,验证不同R’值(一般取3位小数),筛选满足如下条件的R’值:
a.S2空间中至少存在一个满足一阶导数dz0/dt0>=R’的点(z0,t0);
b.如果存在多个满足条件a的R’值:R’i|i=1,2,3,…,则计算S1空间中一阶导数不小于R’i的点的数量Mi,找到Mi|i=1,2,3…的最小值。
c.基于最小的Mi所对应的阈值R’,建立一阶导数特征判别条件dz/dt>=R’。
本算法为先验判定模型算法,由于水位数据往往是不平滑、不连续的,仅用一阶导数判断会存在严重的误差,即可能出现S1中的点被识别为“起涨点”的现象。所以,加入第二个特征即时段累积雨量,在完成一阶导数特征判别的基础上,进一步判断时段累积雨量特征。
基于平原河网地区洪水起涨通常是由本地降雨引起的这一基本判断(假设),将满足一阶导数特征判别条件的水位点对应时刻之前的不同时段累积雨量(如3小时5mm,3小时10mm,……6小时5mm,6小时10mm,……等)作为第二个特征。设定第二个特征阈值为T时段累积雨量R,计算不同T时段、不同R值下,S1和S2空间中满足一阶导数特征判别条件的水位点对应时刻之前T小时累积雨量不小于R的点的数量。求得第二个特征判别阈值T和R,进而确定时段累积雨量特征判别条件。
首先,根据历史降雨数据,建立一组(T,R)(T,R一般为整数)阈值条件;
其次,对各(Ti,Ri)阈值条件,计算S1和S2中满足同时满足一阶导数特征判别条件和(Ti,Ri)阈值条件的点的数量;获取S1中点的数量为0、S2中点的数不少于1对应的(Ti,Ri)阈值条件,定义为(Ti’,Ri’)阈值条件;
筛选每场次历史洪水子过程S2集合中同时满足一阶导数特征判别条件和(Ti’,Ri’)阈值条件的时刻最早的水位点;计算该点与所属S2集合中时刻最早的水位点之间的时间差d,计算各(Ti’,Ri’)阈值条件对应的全部历史洪水子过程的d的平均值。
要求找到一组(Ti,Ri)阈值条件使得d的平均值最小。
如果同时有多个(Ti,Ri)阈值条件满足d的平均值最小,则依次选取min(Ti)和min(Ri)。
综合两个特征的判别条件,可构建平原河网地区暴雨洪水起涨点(局部最优点)快速判断的模型,即“无二义”且“最早”的“起涨点”“先验识别”模型。
本发明中洪峰水位回归模型的构建方法为:
获取与预报目标站点各历史洪水子过程相对应的上游站点的洪峰流量、最大连续3小时平均流量、最大连续6小时平均流量等数据,并分析与预报目标站点洪峰水位的相关性;
获取与预报目标站点各历史洪水子过程相对应的下游站点的初始时刻水位,并分析与预报目标站点洪峰水位的相关性;
获取各历史面降雨子过程在计算起涨点时刻之后的累积雨量和计算起涨点时刻预报目标站点的水位,并分析与预报目标站点洪峰水位的相关性;
选择上述相关性较大的特征,利用历史面降雨子过程数据和预报目标站点相应的历史洪水子过程数据建立训练集和验证集,采用机器学习方法进行训练,构建预报目标站点洪峰水位与目标站点计算起涨点时刻水位、本地区面降雨、上游站点洪水流量及下游站点初始时刻水位相关的回归模型。
具体而言,考虑到本模型为先验性模型,即在只有暴雨洪水过程初期的实时洪水数据和降雨预报数据的条件下,预测目标站点的洪水过程,故对任一场暴雨洪水子过程,以修正后的“计算起涨点”为初始时刻t0’,抽取如下数据作为特征并分析相关性:
a.从目标站点洪水子过程相对应的上游站点洪峰流量、最大连续3小时平均流量、最大连续6小时平均流量等特征中,选取一个特征,分析其与目标站点洪峰水位的相关性,Qi~Zmax
b.分析目标站点洪水子过程相对应的下游站点的初始时刻水位与目标站点洪峰水位的相关性,Zi~Zmax
c.分析本地区面降雨子过程t0’时刻后的累积面雨量P和目标站点t0’时刻对应的水位Zt0’与目标站点洪峰水位的相关性,(P,Zt0’)~Zmax
d.选取相关性较大的特征,利用各场历史暴雨洪水子过程数据建立训练集和验证集(一般1-2组),采用多元线性回归、向量机、神经网络机器学习方法进行训练,建立目标站点洪峰水位~目标站点计算起涨点时刻水位~本地面降雨~上游站点洪水流量~下游站点初始时刻水位的回归模型。
模型及模型参数选取应满足:
a.不会出现模型过拟合现象;
b.基于各场洪水子过程(包括训练集和验证集)的模拟洪峰水位Zmax’={Zimax’|i=1,2,3,…}和实测洪峰水位Zmax={Zimax|i=1,2,3,…},计算预测残差绝对值|Zmax-Zmax’|的均值和方差,选取均值和方差最小的模型。
c.统计残差绝对值|Zmax-Zmax’|不大于10cm的洪水子过程场次数量m和总的洪水子过程场次数量M,要求m/M*100%最大,一般不小于75%。
本发明中峰现历时回归模型的构建方法为:
计算各历史洪水子过程计算起涨点至洪峰的历时作为峰现历时;
设置系列百分比,计算各历史面降雨子过程总累积雨量,并与系列百分比相乘获得系列百分比累积雨量;
获取各历史面降雨子过程中累积雨量不小于且与系列百分比累积雨量最接近的系列连续降雨过程;
选择所述系列连续降雨过程中历时最短且最早出现的过程,分析该过程的累积雨量和历时与峰现历时的相关关系;
选取相关关系最大的连续降雨过程作为该历史洪水子过程的主降雨过程;
基于主降雨过程的累积雨量和总历时、历史洪水子过程的峰现历时,建立训练集和验证集,采用机器学习方法进行训练,构建峰现历时回归模型。
具体而言,首先,以各场洪水子过程“计算起涨点”时刻t0’至洪峰水位时刻t的历时作为峰现历时Tmax
其次,构建“主降雨过程”判定方法:
将t0’时刻后对本场洪水子过程的洪峰水位“影响最大”的连续降雨过程定义为“主降雨过程”,其累积雨量应不小于面降雨子过程总累积雨量乘以某个比例X%的雨量,且其先后满足累积雨量最小、历时最小、最早出现的一段降雨过程。
即对于任一场次暴雨洪水子过程中,对于总累积雨量P、某个比例X%,会存在多个降雨过程的累积雨量Pi|i=1,2,3…,满足Pi>=P*X%;首先选择min(Pi)对应的降雨过程;如果存在多个,则再选择其中历时Ti最小即min(Ti)对应的降雨过程;如果仍存在多个,则选择该过程第一个时刻最早的降雨过程
选取上述选择的降雨过程的历时Tm和累积雨量Pm作为特征,检验不同比例X%对应的Tm、Pm与峰现历时Tmax的相关性,计算皮尔逊相关系数,将相关系数最大对应的X%定义为X’%。
由此,可以判定“主降雨过程”,即在任一场次暴雨洪水子过程中,在累积雨量不小于总累积雨量X’%的全部降雨过程中,先后满足累积雨量最小、历时最短、最早出现的一个降雨过程。
选取“主降雨过程”的累积雨量P’m和历时T’m、洪水子过程的峰现历时Tmax作为特征,基于各场次历史暴雨洪水子过程数据建立训练集和验证集,利用多元线性回归、向量机等机器学习模型,建立Tmax~T’m~P’m相关的回归模型。
模型及模型参数选取应满足:
a.不会出现模型过拟合现象;
b.基于各场次暴雨洪水子过程(包括训练集和验证集)模拟峰现历时Tmax’={Timax’|i=1,2,3,…}和实测峰现历时Tmax={Timax|i=1,2,3,…},计算预测残差绝对值|Tmax-Tmax’|的均值和方差,选取均值和方差最小的模型。
本发明中根据面降雨子过程选取相应的洪水子过程数据具体包括:
获取预报目标站点各面降雨子过程初始时刻至下一场面降雨子过程初始时刻内的最高水位作为洪峰水位;
将各面降雨子过程初始时刻至洪峰水位对应时刻内的洪水过程,作为预报目标站点的洪水子过程。
S4、利用起涨点先验判定模型,基于预报目标站点的实时和预报面降雨子过程数据和相应的实时水位子过程数据,识别起涨点并修正得到计算起涨点;
在本步骤中,受水位波动影响和五点求导法的局限,通过起涨点先验判定模型判定的“起涨点”偶尔会出现“滞后”的情况。即受本地降雨雨型的影响,目标站点的水位波动不明显,判定的“起涨点”明显晚于降雨开始时间;或者该场暴雨洪水子过程存在明显的前期降雨,对洪水上涨过程有一定的影响,那么需要重新找到一个“合适”的点用于判定累积雨量和洪水起涨的初始水位,修正为“计算起涨点”。即在考虑不连续降雨的情况下,将“起涨点”根据降雨过程修正为“计算起涨点”,该点对应的初始水位和之后的累积雨量对洪峰水位有非常明显的影响。
起涨点修正得到计算起涨点具体包括:
获取各面降雨子过程中在起涨点对应时刻之前第一个满足连续T时长无降雨的时段;
计算上述时段结束时刻至所属面降雨子过程的结束时刻的累积雨量,分析该累积雨量、上述时段结束时刻水位与洪峰水位的相关性;
选取相关性最大的累积雨量所对应的时长T作为最优参数,将该T时长结束时刻作为计算起涨点。
具体而言,首先,假设判断条件:对于任一场次暴雨洪水子过程,都存在一个时长T(T一般为整数,如3、5等,且小于24小时),从“起涨点先验判定”模型所求的“起涨点”时刻向前回溯,第一个满足该点有降雨且过去连续T时长无降雨的时刻t0’,t0’之前的降雨与本次洪水关系极小,且t0’之后的累积雨量与洪峰水位正相关极大,此时该为“计算起涨点”。
对T进行优化验证,对任一场次暴雨洪水子过程,获取不同T值即Ti所对应的时刻t0i’之后的累积雨量Pi和t0i’时刻对应的水位Zt0i’,计算Pi、Zt0i’和该场暴雨洪水子过程的洪峰水位Zmax的相关性,如皮尔逊相关系数,相关系数最大所对应的Ti为最优参数。最优参数Ti对应的t0i’为修正后的“计算起涨点”。
S5、利用洪峰水位回归模型,预报目标站点的洪峰水位;
在本实施例中,本发明对任一场实时和预报面降雨子过程数据,以修正后的“计算起涨点”为初始时刻,以实时和预报面降雨子过程数据对应的上游站点的洪峰流量、最大连续3小时平均流量、最大连续6小时平均流量等数据、下游站点的初始时刻水位、该场次实时和预报面降雨子过程的总累积面雨量和目标站点初始水位作为输入特征,利用洪峰水位回归模型预报得到目标站点的预报洪峰水位。S6、利用峰现历时回归模型,识别实时和预报面降雨子过程数据中的主降雨过程数据,预报目标站点的峰现历时;
在本实施例中,本发明以实时和预报面降雨子过程数据的累积雨量作为输入特征,识别实时和预报面降雨子过程数据中的主降雨过程数据;进而以主降雨过程的累积雨量和历时作为输入特征,预报目标站点的峰现历时。
S7、以计算起涨点为起始时刻,基于预报目标站点的预报洪峰水位和峰现历时、计算起涨点后的实时水位数据,计算预报目标站点的预报洪水上涨过程。
在本实施例中,步骤S7具体包括:
以计算起涨点为起始时刻,利用峰现历时和洪峰水位确定洪峰点;
从洪峰点向前构造两个插值点;
利用三次样条曲线拟合计算起涨点后各实时水位实测点、洪峰点和新构造的插值点;
利用拟合后的三次样条曲线计算其余时间点的预测水位,得到预报目标站点的预报洪水上涨过程。
具体而言,本发明以“计算起涨点”为0时刻,基于洪峰水位点(tmax,zmax)向前构造2个新的插值点(tmax-2,zmax-0.01),(tmax-1,zmax-0.005),利用三次样条曲线拟合计算起涨点之后的各实时水位点、洪峰水位点和新构造的插值点,利用该曲线求得其余时间点的预测水位,进而得到预报目标站点的预报洪水上涨过程。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (6)

1.一种基于机器学习的平原河网地区洪水过程预报方法,其特征在于,包括以下步骤:
获取预报目标站点及周边降雨监测站点的历史、实时、预报降雨过程数据,并采用反距离权重插值算法计算预报目标站点的历史、实时、预报面降雨过程数据;将实时面降雨过程数据和预报面降雨过程数据进行拼接,生成实时和预报面降雨过程数据;
采用连续无降雨划分方法,将历史面降雨过程数据、实时和预报面降雨过程数据,划分为历史面降雨子过程数据、实时和预报面降雨子过程数据;
利用预报目标站点的历史面降雨子过程数据和相应的历史洪水子过程数据,构建包括起涨点先验判定模型、洪峰水位回归模型和峰现历时回归模型的洪水过程预报模型;
其中起涨点先验判定模型的构建方法具体包括:
设定预报目标站点各历史洪水子过程中水位由平或缓慢上涨转为明显上涨的点作为起涨点;
利用历史面降雨子过程数据和预报目标站点相应的历史洪水子过程数据,识别可接受起涨点子集和不可接受起涨点子集,构建训练集和验证集;
构建以历史水位过程一阶导数和时段累积雨量作为约束条件的起涨点判定模型,利用训练集对起涨点判定模型进行有监督分类训练,并利用验证集进行先验验证;
洪峰水位回归模型的构建方法为:
获取与预报目标站点各历史洪水子过程相对应的上游站点的洪峰流量、最大连续3小时平均流量、最大连续6小时平均流量数据,并分析与预报目标站点洪峰水位的相关性;
获取与预报目标站点各历史洪水子过程相对应的下游站点的初始时刻水位,并分析与预报目标站点洪峰水位的相关性;
获取各历史面降雨子过程在计算起涨点时刻之后的累积雨量和计算起涨点时刻预报目标站点的水位,并分析与预报目标站点洪峰水位的相关性;
选择所述相关性较大的特征,利用历史面降雨子过程数据和预报目标站点相应的历史洪水子过程数据建立训练集和验证集,采用机器学习方法进行训练,构建预报目标站点洪峰水位与目标站点计算起涨点时刻水位、本地区面降雨、上游站点洪水流量及下游站点初始时刻水位相关的回归模型;
峰现历时回归模型的构建方法为:
计算各历史洪水子过程计算起涨点至洪峰的历时作为峰现历时;
设置系列百分比,计算各历史面降雨子过程总累积雨量,并与系列百分比相乘获得系列百分比累积雨量;
获取各历史面降雨子过程中累积雨量不小于且与系列百分比累积雨量最接近的系列连续降雨过程;
选择所述系列连续降雨过程中历时最短且最早出现的过程,分析该过程的累积雨量和历时与峰现历时的相关关系;
选取相关关系最大的连续降雨过程作为该历史洪水子过程的主降雨过程;
基于主降雨过程的累积雨量和总历时、历史洪水子过程的峰现历时,建立训练集和验证集,采用机器学习方法进行训练,构建峰现历时回归模型;
利用起涨点先验判定模型,基于预报目标站点的实时和预报面降雨子过程数据和相应的实时水位子过程数据,识别起涨点并修正得到计算起涨点;
利用洪峰水位回归模型,预报目标站点的洪峰水位;
利用峰现历时回归模型,识别实时和预报面降雨子过程数据中的主降雨过程数据,预报目标站点的峰现历时;
以计算起涨点为起始时刻,基于预报目标站点的预报洪峰水位和峰现历时、计算起涨点后的实时水位数据,计算预报目标站点的预报洪水上涨过程。
2.根据权利要求1所述的基于机器学习的平原河网地区洪水过程预报方法,其特征在于,所述采用连续无降雨划分方法,将历史面降雨过程数据、实时和预报面降雨过程数据,划分为历史面降雨子过程数据、实时和预报面降雨子过程数据具体包括:
将历史面降雨过程数据、实时和预报面降雨过程数据中连续24小时无降雨作为划分条件;
根据划分条件,将历史面降雨过程数据、实时和预报面降雨过程数据划分至少一个历史面降雨子过程数据、实时和预报面降雨子过程数据。
3.根据权利要求1所述的基于机器学习的平原河网地区洪水过程预报方法,其特征在于,所述利用训练集对起涨点判定模型进行有监督分类训练的方法为:
计算训练集中非连续平滑历史水位过程的一阶导数,设置一阶导数的系列阈值条件,计算训练集中可接受起涨点子集和不可接受起涨点子集中一阶导数满足设定阈值条件的水位点数量;
筛选各历史洪水子过程可接受起涨点子集中所述水位点数量大于或等于1的阈值条件;选取所述阈值条件在不可接受起涨点集中水位点数量最小的阈值条件作为一阶导数特征判别条件;
设置不同时段、不同累积雨量的组合作为系列阈值条件,基于满足所述一阶导数特征判别条件的水位点对应时刻之前的不同时段累积雨量,计算训练集中各历史洪水子过程可接受起涨点子集和不可接受起涨点子集中不同时段累积雨量满足所述阈值条件的水位点数量;
获取所述水位点数量在各历史洪水子过程可接受起涨点子集中大于等于1且在不可接受起涨点子集中为0所对应的阈值条件,筛选每个历史洪水子过程可接受起涨点子集中满足所述阈值条件的时刻最早的水位点;
计算所述水位点与所属可接受起涨点子集中时刻最早的水位点之间的时间差,计算所述每个阈值条件下全部历史洪水子过程的时间差平均值;
将所述时间差平均值最小所对应的阈值条件,作为时段累积雨量特征判别条件,并与一阶导数特征判别条件组合,作为起涨点判别条件。
4.根据权利要求1所述的基于机器学习的平原河网地区洪水过程预报方法,其特征在于,所述历史洪水子过程数据的获取方法具体包括:
获取预报目标站点各面降雨子过程的初始时刻至下一场面降雨子过程初始时刻内的最高水位作为洪峰水位;
将各面降雨子过程的初始时刻至洪峰水位对应时刻内的洪水过程数据,作为预报目标站点的洪水子过程数据。
5.根据权利要求1所述的基于机器学习的平原河网地区洪水过程预报方法,其特征在于,所述起涨点修正得到计算起涨点具体包括:
获取各面降雨子过程中在起涨点对应时刻之前第一个满足连续T时长无降雨的时段;
计算所述时段结束时刻至所属面降雨子过程的结束时刻的累积雨量,分析该累积雨量、所述时段结束时刻水位与洪峰水位的相关性;
选取相关性最大的累积雨量所对应的时长T作为最优参数,将该T时长结束时刻作为计算起涨点。
6.根据权利要求1所述的基于机器学习的平原河网地区洪水过程预报方法,其特征在于,所述以计算起涨点为起始时刻,基于预报目标站点的预报洪峰水位和峰现历时、计算起涨点后的实时水位数据,计算预报目标站点的预报洪水上涨过程,具体包括:
以计算起涨点为起始时刻,利用峰现历时和洪峰水位确定洪峰点;
从洪峰点向前构造两个插值点;
利用三次样条曲线拟合计算起涨点后各实时水位实测点、洪峰点和新构造的插值点;
利用拟合后的三次样条曲线计算其余时间点的预测水位,得到预报目标站点的预报洪水上涨过程。
CN202110785030.8A 2021-07-12 2021-07-12 一种基于机器学习的平原河网地区洪水过程预报方法 Active CN113378484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110785030.8A CN113378484B (zh) 2021-07-12 2021-07-12 一种基于机器学习的平原河网地区洪水过程预报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110785030.8A CN113378484B (zh) 2021-07-12 2021-07-12 一种基于机器学习的平原河网地区洪水过程预报方法

Publications (2)

Publication Number Publication Date
CN113378484A CN113378484A (zh) 2021-09-10
CN113378484B true CN113378484B (zh) 2021-12-21

Family

ID=77581784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110785030.8A Active CN113378484B (zh) 2021-07-12 2021-07-12 一种基于机器学习的平原河网地区洪水过程预报方法

Country Status (1)

Country Link
CN (1) CN113378484B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807709B (zh) * 2021-09-22 2024-02-27 河海大学 一种基于水情要素的多目标湖区水安全评价方法
CN114154417B (zh) * 2021-12-06 2022-06-07 中国水利水电科学研究院 基于深度学习框架的洪水预报模型及洪水预报方法
CN115271255B (zh) * 2022-09-19 2022-12-09 长江水利委员会水文局 基于知识图谱和机器学习的雨洪相似性分析方法和系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734340A (zh) * 2018-04-27 2018-11-02 河海大学 一种基于洪型概化的河道洪水预报方法
CN108921345A (zh) * 2018-06-28 2018-11-30 杭州市水文水资源监测总站 降水预报与支持向量机耦合的河道洪峰水位实时预报方法
CN110929956B (zh) * 2019-12-06 2020-07-03 中国水利水电科学研究院 一种基于机器学习的洪水预报方案实时优选方法
CN111428936B (zh) * 2020-04-08 2021-08-24 长江水利委员会水文局 一种基于分布式水节点的流域雨洪可利用性指标测算方法
CN111445087A (zh) * 2020-04-17 2020-07-24 华北水利水电大学 基于极限学习机的洪水预测方法
CN111625993B (zh) * 2020-05-25 2020-12-18 中国水利水电科学研究院 一种基于山区地形及降雨特征预测的小流域面雨量插值方法
CN111814407B (zh) * 2020-07-28 2023-10-13 安徽沃特水务科技有限公司 一种基于大数据和深度学习的洪水预报方法
CN112016179B (zh) * 2020-09-04 2021-04-20 中国水利水电科学研究院 海绵城市设施评价模型与城市雨洪模型的耦合方法
CN112199901B (zh) * 2020-09-14 2022-11-15 中国人民解放军96901部队23分队 一种无径流资料山区小流域山洪设计暴雨洪水计算方法

Also Published As

Publication number Publication date
CN113378484A (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
CN113378484B (zh) 一种基于机器学习的平原河网地区洪水过程预报方法
CN110984062B (zh) 一种流域干支流大规模水库群模拟调度方法
CN111222698B (zh) 面向物联网的基于长短时记忆网络的积水水位预测方法
CN112149984B (zh) 一种基于贝叶斯网络的水库调洪多维不确定性风险分析方法
CN110991046B (zh) 一种基于响应面函数的排水系统内涝风险快速预警方法
Al-Humoud et al. Approximate methods for the estimation of Muskingum flood routing parameters
CN108830419B (zh) 一种基于ecc后处理的梯级水库群入库流量联合预报方法
CN117035201B (zh) 平原河网水工程集群多目标调度规则制定方法及系统
CN111815043B (zh) 一种基于暴雨特征的洪水流量预测方法及系统
KR20220057740A (ko) 순환신경망을 이용한 하천 지역 침수 예측 방법
CN113807545A (zh) 一种基于深度学习和物理模型的河湖生态流量预报预警方法
Vafakhah et al. Application of intelligent technology in rainfall analysis
CN112036683A (zh) 一种适用于未来气候变化情景下的水库防洪风险预估方法
CN109299853B (zh) 一种基于联合概率分布的水库调度函数提取方法
JP4146053B2 (ja) ダムまたは河川における流量予測方法
CN113887119B (zh) 一种基于sarima-lstm的河流水质预测方法
CN112132324A (zh) 一种基于深度学习模型的超声波水表数据修复方法
KR101703809B1 (ko) 기지 유량 전이를 이용한 미계측 유역 장기유출량 산정방법
CN115828757A (zh) 一种流域水位预测的泄洪量滞后特征构造及选择方法
CN115688022A (zh) 一种基于最邻近算法的流域单位线实时优选方法
JPH11194803A (ja) ダム出水量予測モデル構築方法及びダム出水量予測方法
CN116777027A (zh) 一种非正常日的负荷预测方法及系统
CN115619045A (zh) 一种河口潮差预报方法和系统
CN107944627A (zh) 一种流域洪水预报方法
CN110807475B (zh) 一种基于确定性系数的洪水分类识别预报方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant