CN113705931B - 一种利用k最邻近法预测径流要素的方法 - Google Patents

一种利用k最邻近法预测径流要素的方法 Download PDF

Info

Publication number
CN113705931B
CN113705931B CN202111095225.6A CN202111095225A CN113705931B CN 113705931 B CN113705931 B CN 113705931B CN 202111095225 A CN202111095225 A CN 202111095225A CN 113705931 B CN113705931 B CN 113705931B
Authority
CN
China
Prior art keywords
rainfall
runoff
days
factors
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111095225.6A
Other languages
English (en)
Other versions
CN113705931A (zh
Inventor
吴碧琼
曹辉
汤正阳
姚华明
张海荣
张东杰
王骁鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Yangtze Power Co Ltd
Original Assignee
China Yangtze Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Yangtze Power Co Ltd filed Critical China Yangtze Power Co Ltd
Priority to CN202111095225.6A priority Critical patent/CN113705931B/zh
Publication of CN113705931A publication Critical patent/CN113705931A/zh
Application granted granted Critical
Publication of CN113705931B publication Critical patent/CN113705931B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Marketing (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种利用K最邻近法预测径流的方法,包括步骤:建立数据集,数据集预处理,根据数据集建立降雨径流预测模型,并利用该预测模型进行径流要素预测和查找历史相似;本发明利用非线性相关性提出一组用于预测径流要素的降雨因子,提出了一种利用K最邻近法预测径流要素的方法,包括洪峰、洪量、三天洪量、两日洪量、降雨径流系数,并得出历史相似过程;本发明所述方法不受流域产汇流时间限制,并在汛期复杂降雨情况下,可以通过较简单操作获取径流信息,具有预见期不受限制、工作量小、参数少、精度高、可靠性高等优点,大大提高了水文预报的效率。

Description

一种利用K最邻近法预测径流要素的方法
技术领域
本发明涉及水文预报领域,具体涉及一种利用K最邻近法预测径流要素的方法。
背景技术
径流中的洪峰、洪量、三天洪量、两日洪量、降雨径流系数要素预报是水文预报中的重要环节,可用于生产实际,在防汛抗旱、水资源开发利用、水库调度都有广泛的应用,尤其洪峰为防汛抢险提供了依据,洪量及降雨径流系数是指导水库调度的决策依据。
大量关于水文预报的研究已经开展,使得我们对径流要素与其影响因素的关系有了初步了解。尽管如此,目前水文预报大多依赖于传统预报模,并且注重“峰”值预报,弱化洪“量”预报,而水量预报在水资源开发利用、大型水库调度中更占主体的指导作用。另外,传统预报模型参数较多,需要耗费大量的时间进行参数率定,并且对历史降雨径流资料要求较高,不能充分利用每一场降雨径流过程资料。
为此,迫切需要从数据挖掘角度出发提出简洁高效的新方法,深入、系统地挖掘已有的降雨径流数据,用较少的参数构建模型,实现径流主要要素的预测;并考虑水文预报不确定性,找出历史相似过程,给出预测值在历史上出现的情况,以供决策参考。
发明内容
本发明目的在于克服上述不足,在利用非线性相关性提出一组用于预测径流要素的降雨因子基础上,提出了一种利用K最邻近法预测径流要素的方法,不仅能准确预测出径流主要要素,而且能快速查找相似降雨径流过程,准确度较高,能够广泛应用于生产实际,尤其是大型水库调度。
本发明为解决上述技术问题,所采用的技术方案是:一种利用K最邻近法预测径流要素的方法,它包括以下步骤:
S1、收集已知流域的场次降雨径流数据;
S2、基于非线性相关,提出一组用于预测径流要素的降雨因子,建立数据集;
S3、对所有数据进行归一化处理,然后将处理后的数据集划分为训练集和测试集两部分;
S4、确定K最邻近回归算法,在整个训练集上建立降雨径流的初始预测模型,并测试该预测模型在测试集上的可靠性,直至预测精度满足要求,得到对应的预测模型;
S5、利用预测模型对未知径流要素预测;
S6、利用降雨因子,快速查找数据集中空间距离最邻近的历史降雨径流过程,作为相似过程,并统计径流要素的最大值、最小值、中位数、均值。
优选地,所述步骤S1包括以下步骤:
S11、选取多场已知降雨径流场次过程,包含大、中、小场次过程;
S12、根据上述过程,提取每一场降雨径流过程的5个径流要素:洪峰、洪量、三天洪量、两日洪量、降雨径流系数。
优选地,所述步骤S2包括以下步骤:
S21、计算降雨因子:提出对径流造成较大影响的四大类降雨因素,降雨量、降雨历时、降雨强度、前期影响雨量;将每一类因素分为较细的因子,降雨量包括累积降雨量、一日降雨量、两日降雨量、多日降雨量;降雨历时包括降雨天数、降雨时数;降雨强度包括:最大日降雨、最大小时降雨、最大三小时降雨;前期影响雨量包括:前10天累积降雨量、前5天累积降雨量、前3天累计降雨量;对每一场次降雨径流过程计算上述12个降雨因子;
S22、筛选降雨因子:计算四类因素中各个因子与径流要素的相关系数,每类因素中取与洪峰、洪量、三天洪量、两日洪量、降雨径流系数平均相关系数排名第一的因子作为计算因子,最终确定为累积降雨量、降雨天数、最大日降雨和前10天累积降雨量4个降雨因子;相关系数采用Spearman秩相关系数,公式如下:
Figure BDA0003268857470000021
式中,ps为两组相同个数X,Y数据的Spearman秩相关系数,di为两组数据秩次之差,即xi,yi按大小排序的序号之差,n为数据的个数;
S23、将降雨因子作为模型输入,径流要素作为模型输出,整理成相应的数据集。
优选地,所述步骤S3中,数据集划分的方法为随机划分或Kennard-Stone划分。
优选地,所述步骤S3中,所述训练集与测试集的比例通过收敛性计算得到。
优选地,所述步骤S4包括步骤:
S41、选择K最邻近回归算法,具体为:寻找目标样本特征空间中距离最近的K个样本,并将K个样本的目标属性通过平均或者加权赋给该样本,以得到目标样本的目标值;
公式如下:
Y=w1X1+w2X2……+wKXK
式中,Y为目标值,Xi为距离第i个的样本与目标值对应的属性值,wi为第i个样本权重参数,i取值为1,2……K;
其中,空间距离度量公式为:
假设样本集有n个,X={X(1),X(2),……,X(n)},其中
Figure BDA0003268857470000031
即每个样本有m个特征维度,则任意两个样本之间的空间距离L定义为:
Figure BDA0003268857470000032
p为任意正整数,当p=1时称为曼哈顿距离,p=2时称为欧式距离;
wi权重参数可采用平均或加权,采用平均时w=1/K;采用加权时,提出一种反距离加权方法,公式如下:
wi=(Lmax/Li)/(Lmax/L1+Lmax/L2……+Lmax/LK)
式中,wi为第i个样本的权重,Lmax为K个样本中与目标样本的空间距离最大值,Li为第i个样本与目标样本的空间距离,i取值为1,2……K;
S42、利用训练集初步确定K最邻近法算法的超参数:距离度量参数p、距离最邻近的个数K值、w赋值方式;
S43、用初步确定超参数后的K最邻近算法在整个测试集上建立径流要素的初始预测模型,并在测试集上测试该预测模型的可靠性;若不满足,则继续调整利用训练集训练模型参数,直至测试集模型精度满足要求,即得到对应的预测模型;
S44、可靠性的评价指标包括可决系数R2或Nash-Sutcliffe效率系数(NSE),其中,可决系数R2计算公式如下:
Figure BDA0003268857470000041
Nash-Sutcliffe效率系数(NSE)计算公式如下:
Figure BDA0003268857470000042
式中,yi是观测值、
Figure BDA0003268857470000043
是观测值的均值、
Figure BDA0003268857470000044
为模型预测值、
Figure BDA0003268857470000045
为模型预测值。
优选地,所述步骤S5包括步骤:
S51、从未来场次降雨中获取累积降雨量、降雨天数、最大日降雨、前10天累积降雨量,作为预测模型输入;
S52、预测模型即为步骤S4中满足精度要求的预测模型;
S53、进行计算后,模型输出即为预测目标径流要素:洪峰、洪量、三天洪量、两日洪量、降雨径流系数。
优选地,所述步骤S6中查找的历史相似降雨径流过程个数,可以进行自由设定。
本发明的有益效果:本发明首先利用非线性相关性提出一组用于预测径流要素的降雨因子,并利用K最邻近法预测未知降雨径流要素,与传统水文预报模型相比,节省了大量的参数率定工作,并给出历史相似过程进行参考,具有工作量小、参数少、精度高、可靠性高、信息多等优点,可极大提高文预报的效率,而且普适性强,可应用于防汛、水资源利用和大型水库调度。
附图说明
图1为一种利用K最邻近法预测径流要素的方法的方法流程图;
图2为本发明具体实施方式的所选流域示意图;
图3为本发明实施例中K最邻近法模型在训练集和测试集上的洪峰预测情况;
图4为本发明实施例中K最邻近法模型在训练集和测试集上的洪量预测情况;
图5为本发明实施例中K最邻近法模型在训练集和测试集上的三天洪量预测情况;
图6为本发明实施例中K最邻近法模型在训练集和测试集上的两日洪量预测情况;
图7为本发明实施例中K最邻近法模型在训练集和测试集上的降雨径流系数预测情况。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细描述。
如图1所示,一种利用K最邻近法预测径流要素的方法,它包括以下步骤:
S1、收集已知流域的场次降雨径流数据;
S2、基于非线性相关,提出一组用于预测径流要素的降雨因子,建立数据集;
S3、对所有数据进行归一化处理,然后将处理后的数据集划分为训练集和测试集两部分;
S4、确定K最邻近回归算法,在整个训练集上建立降雨径流的初始预测模型,并测试该预测模型在测试集上的可靠性,直至预测精度满足要求,得到对应的预测模型;
S5、利用预测模型对未知径流要素预测;
S6、利用降雨因子,快速查找数据集中空间距离最邻近的历史降雨径流过程,作为相似过程,并统计径流要素的最大值、最小值、中位数、均值。
优选地,所述步骤S1包括以下步骤:
S11、选取多场已知降雨径流场次过程,包含大、中、小场次过程;
S12、根据上述过程,提取每一场降雨径流过程的5个径流要素:洪峰、洪量、三天洪量、两日洪量、降雨径流系数。
优选地,所述步骤S2包括以下步骤:
S21、计算降雨因子:提出对径流造成较大影响的四大类降雨因素,降雨量、降雨历时、降雨强度、前期影响雨量;将每一类因素分为较细的因子,降雨量包括累积降雨量、一日降雨量、两日降雨量、多日降雨量;降雨历时包括降雨天数、降雨时数;降雨强度包括:最大日降雨、最大小时降雨、最大三小时降雨;前期影响雨量包括:前10天累积降雨量、前5天累积降雨量、前3天累计降雨量;对每一场次降雨径流过程计算上述12个降雨因子;
S22、筛选降雨因子:计算四类因素中各个因子与径流要素的相关系数,每类因素中取与洪峰、洪量、三天洪量、两日洪量、降雨径流系数平均相关系数排名第一的因子作为计算因子,最终确定为累积降雨量、降雨天数、最大日降雨和前10天累积降雨量4个降雨因子;相关系数采用Spearman秩相关系数,公式如下:
Figure BDA0003268857470000051
式中,ps为两组相同个数X,Y数据的Spearman秩相关系数,di为两组数据秩次之差,即xi,yi按大小排序的序号之差,n为数据的个数;
S23、将降雨因子作为模型输入,径流要素作为模型输出,整理成相应的数据集。
优选地,所述步骤S3中,数据集划分的方法为随机划分或Kennard-Stone划分。
优选地,所述步骤S3中,所述训练集与测试集的比例通过收敛性计算得到。
优选地,所述步骤S4包括步骤:
S41、选择K最邻近回归算法,具体为:寻找目标样本特征空间中距离最近的K个样本,并将K个样本的目标属性通过平均或者加权赋给该样本,以得到目标样本的目标值;
公式如下:
Y=w1X1+w2X2……+wKXK
式中,Y为目标值,Xi为距离第i个的样本与目标值对应的属性值,wi为第i个样本权重参数,i取值为1,2……K;
其中,空间距离度量公式为:
假设样本集有n个,X={X(1),X(2),……,X(n)},其中
Figure BDA0003268857470000061
即每个样本有m个特征维度,则任意两个样本之间的空间距离L定义为:
Figure BDA0003268857470000062
p为任意正整数,当p=1时称为曼哈顿距离,p=2时称为欧式距离;
wi权重参数可采用平均或加权,采用平均时w=1/K;采用加权时,提出一种反距离加权方法,公式如下:
wi=(Lmax/Li)/(Lmax/L1+Lmax/L2……+Lmax/LK)
式中,wi为第i个样本的权重,Lmax为K个样本中与目标样本的空间距离最大值,Li为第i个样本与目标样本的空间距离,i取值为1,2……K;
S42、利用训练集初步确定K最邻近法算法的超参数:距离度量参数p、距离最邻近的个数K值、w赋值方式;
S43、用初步确定超参数后的K最邻近算法在整个测试集上建立径流要素的初始预测模型,并在测试集上测试该预测模型的可靠性;若不满足,则继续调整利用训练集训练模型参数,直至测试集模型精度满足要求,即得到对应的预测模型;
S44、可靠性的评价指标包括可决系数R2或Nash-Sutcliffe效率系数(NSE),其中,可决系数R2计算公式如下:
Figure BDA0003268857470000071
Nash-Sutcliffe效率系数(NSE)计算公式如下:
Figure BDA0003268857470000072
式中,yi是观测值、
Figure BDA0003268857470000073
是观测值的均值、
Figure BDA0003268857470000074
为模型预测值、
Figure BDA0003268857470000075
为模型预测值。
优选地,所述步骤S5包括步骤:
S51、从未来场次降雨中获取累积降雨量、降雨天数、最大日降雨、前10天累积降雨量,作为预测模型输入;
S52、预测模型即为步骤S4中满足精度要求的预测模型;
S53、进行计算后,模型输出即为预测目标径流要素:洪峰、洪量、三天洪量、两日洪量、降雨径流系数。
优选地,所述步骤S6中查找的历史相似降雨径流过程个数,可以进行自由设定。
本次实施以长江三峡区间为例,说明该方法的应用。如图2所示,三峡区间指长江干流寸滩水文站和支流武隆水文站到三峡大坝之间的流域,集水面积约6万km2。本实施例利用K最邻近法预测径流要素可以按以下步骤进行实施:
步骤一:建立数据集
收集研究范围三峡区间2014年至2020年,雨量站日降雨量,寸滩、武隆水文站小时流量,三峡水库小时入库流量数据。根据收集的日降雨量计算三峡区间面降雨量,三个站点流量计算三峡区间时段流量。分割每一场次降雨径流过程,计算每一场过程的累积降雨量、降雨天数、最大日降雨、前10天累积降雨量,以及对应的洪峰、洪量、三天洪量、两日洪量、降雨径流系数,形成本实施方式的数据集。在实际应用中,降雨量和流量的时间尺度可以根据具体收集资料进行改变,但至少是日尺度及更短的时间尺度。
步骤二:数据集预处理
将数据根据其最大值与最小值进行归一化处理,使得所有数据处于(0,1)范围中。本实例使用随机划分方法将整个数据集划分为训练集与测试集,二者比例通过收敛性测试确定。本实例中,训练集占总数据集的80%,测试集占总数据集的20%。
步骤三:建立径流要素预测模型
本实例利用K最邻近回归法作为径流要素的预测方法,采用可决系数R2作为判断预测精度的标准,其计算公式如下:
Figure BDA0003268857470000081
其中,yi是观测值、
Figure BDA0003268857470000082
是观测值的均值、
Figure BDA0003268857470000083
为模型预测值。
利用网格搜索确定K最邻近法回归模型的超参数,其中距离度量确定为欧式距离,K值确定为3,权重确定为反距离加权。使用整个训练集训练最优的K最邻近法回归模型,并检验该模型在该训练集上的表现,其结果如图3至图7所示。经计算,在训练集上使用该K最邻近法回归模型预测的洪峰、洪量、三天洪量、两日洪量、降雨径流系数与观测值之间的可决系数分别高达0.88、0.88、0.9、0.87、0.85,说明该模型在训练集上可行。在实际应用中,交叉验证的折数、超参数优化的方法以及判别标准可以根据数据集的改变进行调整。
步骤四:径流要素预测
使用训练后的K最邻近法回归模型对测试集中的洪峰、洪量、三天洪量、两日洪量、降雨径流系数预测进行预测。经计算,在测试集上使用该方法预测的洪峰、洪量、三天洪量、两日洪量、降雨径流系数预测与观测值之间的可决系数分别高达0.84、0.91、0.9、0.84、0.89,其预测结果如图3至图7所示。可见,预测值与观测值十分接近,说明本方法在测试集上也是可行的,可用于未知降雨径流预测。
步骤五:查找相似过程
以2021年7月6-7日的降雨径流过程为例,利用降雨影响因素:累积降雨量、降雨天数、最大日降雨、前10天累积降雨量(52mm、2天、30mm、84mm)快速查找3个空间距离最邻近的历史降雨径流过程,可作为相似过程,如下表1所示。
表1
Figure BDA0003268857470000091
从查找结果可以得出洪峰、洪量、三天洪量、两日洪量、降雨径流系数要素的最大值、最小值、中位数、均值,如下表2所示。
表2
Figure BDA0003268857470000092
本发明在收集已知降雨径流要素及其影响因素的基础上,建立数据集,然后对数据集中的所有数据进行归一化处理,处理后的数据集划分为训练集和测试集两部分,再采用K最邻近法算法在整个训练集上建立径流的初始预测模型,并测试该预测模型在测试集上的可靠性,直至预测精度满足要求,得到对应的目标预测模型,并对未知径流在数据集的基础上查找历史相似过程。该目标预测模型可以对未知降雨径流进行准确的主要要素预测,并提供历史相似过程,进行不确定性参考。与传统的水文预报模型相比,采用所述目标预测模型不仅能快速查找相似降雨径流过程,并且能对径流主要要素进行预测,工作量小、效率高、精度高、可靠性高,而且普适性强,可用于防汛、水资源利用和大型水库调度。
上述的实施例仅为本发明的优选技术方案,而不应视为对于本发明的限制,本申请中的实施例及实施例中的特征在不冲突的情况下,可以相互任意组合。本发明的保护范围应以权利要求记载的技术方案,包括权利要求记载的技术方案中技术特征的等同替换方案为保护范围。即在此范围内的等同替换改进,也在本发明的保护范围之内。

Claims (5)

1.一种利用K最邻近法预测径流要素的方法,其特征在于:它包括以下步骤:
S1、收集已知流域的场次降雨径流数据;
S2、基于非线性相关,提出一组用于预测径流要素的降雨因子,建立数据集;
S3、对所有数据进行归一化处理,然后将处理后的数据集划分为训练集和测试集两部分;
S4、确定K最邻近回归算法,在整个训练集上建立降雨径流的初始预测模型,并测试该预测模型在测试集上的可靠性,直至预测精度满足要求,得到对应的预测模型;
S5、利用预测模型对未知径流要素预测;
S6、利用降雨因子,快速查找数据集中空间距离最邻近的历史降雨径流过程,作为相似过程,并统计径流要素的最大值、最小值、中位数、均值;
所述步骤S1包括以下步骤:
S11、选取多场已知降雨径流场次过程,包含大、中、小场次过程;
S12、根据上述过程,提取每一场降雨径流过程的5个径流要素:洪峰、洪量、三天洪量、两日洪量、降雨径流系数;
所述步骤S2包括以下步骤:
S21、计算降雨因子:提出对径流造成较大影响的四大类降雨因素,降雨量、降雨历时、降雨强度、前期影响雨量;将每一类因素分为较细的因子,降雨量包括累积降雨量、一日降雨量、两日降雨量、多日降雨量;降雨历时包括降雨天数、降雨时数;降雨强度包括:最大日降雨、最大小时降雨、最大三小时降雨;前期影响雨量包括:前10天累积降雨量、前5天累积降雨量、前3天累计降雨量;对每一场次降雨径流过程计算上述12个降雨因子;
S22、筛选降雨因子:计算四类因素中各个因子与径流要素的相关系数,每类因素中取与洪峰、洪量、三天洪量、两日洪量、降雨径流系数平均相关系数排名第一的因子作为计算因子,最终确定为累积降雨量、降雨天数、最大日降雨和前10天累积降雨量4个降雨因子;相关系数采用Spearman秩相关系数,公式如下:
式中,ps为两组相同个数X,Y数据的Spearman秩相关系数,di为两组数据秩次之差,即xi,yi按大小排序的序号之差,n为数据的个数;
S23、将降雨因子作为模型输入,径流要素作为模型输出,整理成相应的数据集;
所述步骤S4包括步骤:
S41、选择K最邻近回归算法,具体为:寻找目标样本特征空间中距离最近的K个样本,并将K个样本的目标属性通过平均或者加权赋给该样本,以得到目标样本的目标值;
公式如下:
Y=w1X1+w2X2……+wKXK
式中,Y为目标值,Xi为距离第i个的样本与目标值对应的属性值,wi为第i个样本权重参数,i取值为1,2……K;
其中,空间距离度量公式为:
假设样本集有n个,X={X(1),X(2),……,X(n)},其中即每个样本有m个特征维度,则任意两个样本之间的空间距离L定义为:
p为任意正整数,当p=1时称为曼哈顿距离,p=2时称为欧式距离;
wi权重参数可采用平均或加权,采用平均时w=1/K;采用加权时,提出一种反距离加权方法,公式如下:
wi=(LmaxLi)(LmaxL1+LmaxL2……+LmaxLK)
式中,wi为第i个样本的权重,Lmax为K个样本中与目标样本的空间距离最大值,Li为第i个样本与目标样本的空间距离,i取值为1,2……K;
S42、利用训练集初步确定K最邻近法算法的超参数:距离度量参数p、距离最邻近的个数K值、w赋值方式;
S43、用初步确定超参数后的K最邻近算法在整个测试集上建立径流要素的初始预测模型,并在测试集上测试该预测模型的可靠性;若不满足,则继续调整利用训练集训练模型参数,直至测试集模型精度满足要求,即得到对应的预测模型;
S44、可靠性的评价指标包括可决系数R2或Nash-Sutcliffe效率系数(NSE),其中,可决系数R2计算公式如下:
Nash-Sutcliffe效率系数(NSE)计算公式如下:
式中,yi是观测值、是观测值的均值、为模型预测值、为模型预测值。
2.根据权利要求1所述的一种利用K最邻近法预测径流要素的方法,其特征在于:所述步骤S3中,数据集划分的方法为随机划分或Kennard-Stone划分。
3.根据权利要求1所述的一种利用K最邻近法预测径流要素的方法,其特征在于:所述步骤S3中,所述训练集与测试集的比例通过收敛性计算得到。
4.根据权利要求1所述的一种利用K最邻近法预测径流要素的方法,其特征在于:所述步骤S5包括步骤:
S51、从未来场次降雨中获取累积降雨量、降雨天数、最大日降雨、前10天累积降雨量,作为预测模型输入;
S52、预测模型即为步骤S4中满足精度要求的预测模型;
S53、进行计算后,模型输出即为预测目标径流要素:洪峰、洪量、三天洪量、两日洪量、降雨径流系数。
5.根据权利要求1所述的一种利用K最邻近法预测径流要素的方法,其特征在于:所述步骤S6中查找的历史相似降雨径流过程个数,进行自由设定。
CN202111095225.6A 2021-09-17 2021-09-17 一种利用k最邻近法预测径流要素的方法 Active CN113705931B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111095225.6A CN113705931B (zh) 2021-09-17 2021-09-17 一种利用k最邻近法预测径流要素的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111095225.6A CN113705931B (zh) 2021-09-17 2021-09-17 一种利用k最邻近法预测径流要素的方法

Publications (2)

Publication Number Publication Date
CN113705931A CN113705931A (zh) 2021-11-26
CN113705931B true CN113705931B (zh) 2023-04-18

Family

ID=78661095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111095225.6A Active CN113705931B (zh) 2021-09-17 2021-09-17 一种利用k最邻近法预测径流要素的方法

Country Status (1)

Country Link
CN (1) CN113705931B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114897242B (zh) * 2022-05-10 2023-10-27 中国长江电力股份有限公司 一种自适应分割时段场次降雨径流的方法
CN115271154B (zh) * 2022-06-07 2023-12-29 中国长江电力股份有限公司 一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法
CN116502567B (zh) * 2023-06-28 2023-09-12 中国空气动力研究与发展中心计算空气动力研究所 一种非结构网格流场的插值求解方法、装置、设备、介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272146A (zh) * 2018-08-23 2019-01-25 河海大学 一种基于深度学习模型和bp神经网络校正的洪水预测方法
CN109299812A (zh) * 2018-08-23 2019-02-01 河海大学 一种基于深度学习模型和knn实时校正的洪水预测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102867106A (zh) * 2012-08-14 2013-01-09 贵州乌江水电开发有限责任公司 短期径流预报方法及系统
CN108108838B (zh) * 2017-12-18 2021-08-27 华电福新能源股份有限公司福建分公司 一种高水量利用率的季调节水库优化调度方法
CN109886461A (zh) * 2019-01-18 2019-06-14 昆仑(重庆)河湖生态研究院(有限合伙) 一种径流预报方法及装置
CN112084461B (zh) * 2020-08-10 2024-05-14 河海大学 一种基于历史洪水学习的knn实时校正方法
CN112801342A (zh) * 2020-12-31 2021-05-14 国电大渡河流域水电开发有限公司 一种基于降雨径流相似性的自适应径流预报方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272146A (zh) * 2018-08-23 2019-01-25 河海大学 一种基于深度学习模型和bp神经网络校正的洪水预测方法
CN109299812A (zh) * 2018-08-23 2019-02-01 河海大学 一种基于深度学习模型和knn实时校正的洪水预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
夏润亮 ; 刘启兴 ; 李涛 ; 刘晓燕 ; 高云飞 ; 吴丹 ; .基于集成学习的黄河未控区径流预测研究.应用基础与工程科学学报.(第03期),全文. *

Also Published As

Publication number Publication date
CN113705931A (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN113705931B (zh) 一种利用k最邻近法预测径流要素的方法
WO2022135265A1 (zh) 气候变化影响下水库调度规则的失效预警分析方法
CN113379109B (zh) 一种基于预测模型自适应的径流预报方法
CN112506990B (zh) 一种基于时空信息的水文数据异常检测方法
CN103177301A (zh) 一种台风灾害风险预估方法
CN110047291A (zh) 一种考虑扩散过程的短时交通流预测方法
CN112580864B (zh) 结合多元数据应用价值提升的村镇生活垃圾产量预测系统
CN115099500B (zh) 基于权重修正和drsn-lstm模型的水位预测方法
CN108647425B (zh) 基于粒子群优化的K-means径流丰枯年份预报方法
CN110598352B (zh) 一种流域来水的预报方法
CN112907113B (zh) 一种考虑空间相关性的植被变化成因识别方法
CN113255986A (zh) 一种基于气象信息和深度学习算法的多步日径流预报方法
CN112215389A (zh) 一种确定河流环境流量过程区间的方法
CN110728409A (zh) 一种洪水过程类型相似性挖掘与快速预测方法
CN113033081A (zh) 一种基于som-bpnn模型的径流模拟方法及系统
CN108053646B (zh) 基于时间敏感特征的交通特征获取方法、预测方法及系统
CN110196456A (zh) 一种基于相似年灰色关联分析的中长期降雨径流预报方法
Zahraie et al. SST clustering for winter precipitation prediction in southeast of Iran: Comparison between modified K-means and genetic algorithm-based clustering methods
Hoan et al. Novel time series bagging based hybrid models for predicting historical water levels in the Mekong delta region, Vietnam
Lu et al. Uncertainty quantification of machine learning models to improve streamflow prediction under changing climate and environmental conditions
CN104778516A (zh) 一种基于区间可拓理论的线损率多重预测方法
CN115423146A (zh) 一种基于多因子最近邻抽样回归和支持向量机的自适应径流预报方法
Yusoff et al. Multiparameter probability distributions of at-site L-moment-based frequency analysis in Malaysia
KR20000056762A (ko) 상수도 시스템의 용수 수요 예측 방법
CN112862144B (zh) 基于双层目标优化的无资料城市确定最优损失曲线的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant