CN111325286A - 一种基于随机森林的防洪系统显效工程智能辨识方法 - Google Patents

一种基于随机森林的防洪系统显效工程智能辨识方法 Download PDF

Info

Publication number
CN111325286A
CN111325286A CN202010174210.8A CN202010174210A CN111325286A CN 111325286 A CN111325286 A CN 111325286A CN 202010174210 A CN202010174210 A CN 202010174210A CN 111325286 A CN111325286 A CN 111325286A
Authority
CN
China
Prior art keywords
flood control
flood
cost
random forest
control system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010174210.8A
Other languages
English (en)
Other versions
CN111325286B (zh
Inventor
李洁玉
钟平安
邴建平
杨敏芝
付吉斯
卢庆文
马昱斐
肖尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202010174210.8A priority Critical patent/CN111325286B/zh
Publication of CN111325286A publication Critical patent/CN111325286A/zh
Application granted granted Critical
Publication of CN111325286B publication Critical patent/CN111325286B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于随机森林的防洪系统显效工程智能辨识方法,包括:建立随机森林特征属性集;建立防洪系统“混合等效调度”模型,生成训练及验证样本集;基于“随机”思想构建随机森林基分类器;基于“集成”思想构建随机森林分类模型;建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度。本发明方法针对防洪系统历史洪水“小样本”的特点,为充分利用属性集及训练样本信息,基于随机森林“随机”和“集成”两种思想,提高了显效工程分类精度;通过引用机器学习原理,提高显效工程辨识效率;针对辨识结果不同种类错误代价不均等问题,利用期望总体代价评价随机森林分类精度。

Description

一种基于随机森林的防洪系统显效工程智能辨识方法
技术领域
本发明涉及防洪系统实时调度方法,尤其是一种基于随机森林的防洪系统显效工程智能辨识方法。
背景技术
防洪系统实时联合调度中,根据实时水雨工情信息智能辨识显效工程,并据以自组织建立“混合等效调度”模型,是降低防洪系统联合调度模型维数的有效途径,其关键是如何准确辨识显效工程集。
“显效工程”是防洪调度领域全新的概念,目前对此研究较少,已有技术是基于推理规则辨识显效工程。该方法是建立辨识指标体系,通过指标阈值确定推理规则,但指标阈值的确定受洪水样本、调度模型等主客观因素影响,随着洪水资料的积累,需定期检验和调整指标阈值,致使显效工程的辨识结果具有不确定性。实际上从防洪工程全集中辨识显效工程子集,是样本聚类问题,采用机器学习方法从样本中直接发掘规则,可以有效克服基于固定阈值的规则推理的缺陷。
决策树、神经网络、贝叶斯分类器等机器学习分类算法通常需要大量训练样本,但防洪显效工程辨识问题中通常样本量较少,随机森林分类算法是集成学习的代表性方法,能解决“小样本”分类问题、避免“过拟合”现象。因此,利用随机森林分类算法进行显效工程的准确高效辨识,是自组织建立“混合等效调度”模型、提高防洪效率的重要途径。
在显效工程辨识过程中,不同类型的错误会造成不同程度的后果。若将非显效工程误判为显效工程,仅会增加防洪调度的复杂度;若将显效工程误判为非显效工程,则会使防洪效果降低,增大防洪风险,甚至造成下游的洪涝灾害,故此类错误代价远大于前者。如何考虑两种错误的不均等代价,选择合理的分类精度评价指标,是评价随机森林分类模型在显效工程辨识中应用效果的关键内容。
发明内容
发明目的:提供一种基于随机森林的防洪系统显效工程智能辨识方法,以解决现有技术存在的上述问题。
技术方案:为实现上述发明目的,本发明采用以下技术方案:
一种基于随机森林的防洪系统显效工程智能辨识方法,包括以下步骤:
(1)建立随机森林特征属性集;
(2)建立防洪系统“混合等效调度”模型,生成训练及验证样本集;
(3)基于“随机”思想构建随机森林基分类器;
(4)基于“集成”思想构建随机森林分类模型;
(5)建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度。
进一步的,步骤(1)中充分考虑防洪系统实时水、雨、工情信息,选取防洪工程控制流域预测来水量、被补偿区间来水量、工程防洪压力、防洪点洪量贡献值、防洪点洪峰贡献值、防洪点洪水重叠度、工程间洪水重叠度为随机森林特征属性集。
进一步的,步骤(2)包括以下步骤:
(21)所述防洪系统“混合等效调度”模型分为以最大削峰准则为目标的非显效工程单独优化调度和以防洪点洪峰流量最小为目标的显效工程联合优化调度;
单独优化调度目标函数为:
min F1=max(q(t)) (1);
其中,q(t)为t时刻水库出库流量;
联合优化调度目标函数为:
Figure BDA0002410234420000021
其中,M1为显效水库数目;q′(i,t)为第i库出库流量在公共防洪点响应过程;q′(i,t)为各显效水库私有防洪点上游区间来水在公共防洪点的响应过程;q′区s(t)为公共防洪点上游区间来水在公共防洪点的响应过程;
约束条件包括:
1)水量平衡约束
V(i,t)=V(i,t-1)+(Q(i,t)-q(i,t))·Δt (3);
其中,V(i,t-1)、V(i,t)分别为第i水库t-1时刻和t时刻的蓄水量;Q(i,t)和q(i,t)分别为第i水库t时刻的入库、出库流量;
2)泄流能力约束
q(i,t)≤q(i,Z(i,t)) (4);
其中,q(i,Z(i,t))为第i水库第t时刻对应水位Z(i,t)的泄流能力;
3)最高水位约束
Z(i,t)≤Z(i,t)max (5);
其中,Z(i,t)max为第i水库第t时刻允许达到的最高水位;
4)期末水位约束
Z(i,end)=Z(i,con) (6);
其中,Z(i,end)为第i水库调度期末计算水位;Z(i,con)为第i水库期末控制水位;
5)泄流变幅约束
|q(i,t)-q(i,t-1)|≤Δq(i) (7);
其中,q(i,t-1)为第i水库t-1时刻的出库流量;Δq(i)为第i水库出库流量最大变幅;
(22)生成训练及验证样本集:
假设防洪系统中共有M座防洪工程,选取历史L场流域性洪水,其中L1场洪水用于模型训练,L2场洪水用于模型验证;计算每场洪水中各工程输入属性集各属性值;由上述建立的“混合等效调度”模型,采用逐步减库法确定每场洪水中显效工程,记为“1”,与非显效工程,记为“0”;由此得共有|S|个样本的训练集S(C,D),|S|=M×L1,其中,C={Cj}(j∈[1,N])为特征属性;D={Du}(u=0,1)为类别属性,即工程由逐步减库法辨识的类别。
进一步的,步骤(3)包括以下步骤:
(31)确定随机森林基分类器数目Z,采用bagging方法在训练样本集S中随机抽取产生Z个训练样本子集
Figure BDA0002410234420000031
作为各基分类器的训练集;
(32)采用Forest-RI方法进行属性随机选择,得到各基分类器的特征属性子集
Figure BDA0002410234420000032
k∈[1,Z];
(33)基于Gini不纯度最小准则,由CART算法进行节点分裂生成单棵决策树,作为随机森林基分类器,表示为:
h(x,Θe) (8);
其中,h(x,Θe)表示第e棵决策树;x为输入变量;Θe为独立同分布的随机变量,表示单棵决策树所采用的参数集。
进一步的,步骤(4)中建立包含Z棵决策树的随机森林,表示为{h1(x),h2(x),…,hZ(x)},由随机森林进行显效工程辨识,首先通过基分类器进行工程属性判别,最后通过投票法这一结合策略将基分类器结果结合得出最终分类结果,并得到第λ个样本属于Du类的概率Pλu
进一步的,步骤(5)包括以下步骤:
(51)令显效工程为正类,记为“1”,非显效工程为负类,记为“0”;逐步减库法辨识的工程属性为真实类别,随机森林分类模型辨识的工程属性为预测类别;costαβ为把α类样本误判为β类的代价;则正确分类的代价cost11=0,cost00=0,把负类预测为正类的代价为cost01,把正类预测为负类的代价为cost10
(52)统计L2场验证洪水辨识结果每类工程样本数,把正类预测为正类的样本数为真正例TP,把正类预测为负类的样本数为假负例FN,把负类预测为正类的样本数为假正例FP,把负类预测为负类的样本数为真负例TN;
(53)正例概率表示为p,负例概率表示为1-p;
归一化正例概率代价为:
Figure BDA0002410234420000041
归一化期望代价为:
Figure BDA0002410234420000042
其中,
Figure BDA0002410234420000043
(54)以归一化正例概率代价为横坐标、归一化期望代价为纵坐标绘制代价曲线:
将各样本属于“正类”的概率Pλ1由大到小排序,并依次将其作为阈值,记为θη,θη表示排序后第η个样本属于“正类”的概率;
按θη判断水库性质,若Pλ1>θη,则第λ个样本属于“正类”,否则,属于“负类”;所有样本判断完成后,计算FPR和FNR,得到一组(0,FPR)和(1,FNR)坐标,连接得到一条代价线段;
以此类推,按不同阈值θη判断水库性质,得到一系列代价线段,所有线段的下包线即代价曲线;
(55)代价曲线和横轴围成的面积为期望总体代价,该指标是考虑不均等代价的分类精度评价指标,计算公式如下:
Figure BDA0002410234420000051
其中,
Figure BDA0002410234420000052
Figure BDA0002410234420000053
分别为阈值θη对应的假反例率和假正例率。
有益效果:与现有技术相比,本发明的方法可以获得以下有益效果:
第一,采用机器学习中的随机森林分类算法进行显效工程辨识,避免了现有基于推理规则方法引起的辨识结果不确定性问题;第二,基于随机森林分类算法“随机”和“集成”两种思想,解决了显效工程辨识这一“小样本”分类问题;第三,选择期望总体代价为评价指标,充分考虑了显效工程辨识中不同错误类型的不均等代价。
附图说明
图1是本发明方法流程图;
图2是随机森林分类模型原理图;
图3是代价曲线及期望总体代价示例图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案进行详细说明。
如图1所示,基于随机森林的防洪系统显效工程智能辨识方法,主要包括以下步骤:
步骤1、建立随机森林特征属性集:
充分考虑防洪系统实时水、雨、工情信息,选取防洪工程控制流域预测来水量、被补偿区间来水量、工程防洪压力、防洪点洪量贡献值、防洪点洪峰贡献值、防洪点洪水重叠度、工程间洪水重叠度为随机森林特征属性集。
步骤2、建立防洪系统“混合等效调度”模型,生成训练及验证样本集:
步骤21、所述防洪系统“混合等效调度”模型分为以最大削峰准则为目标的非显效工程单独优化调度和以防洪点洪峰流量最小为目标的显效工程联合优化调度;
单独优化调度目标函数为:
min F1=max(q(t)) (1);
其中,q(t)为t时刻水库出库流量;
联合优化调度目标函数为:
Figure BDA0002410234420000061
其中,M1为显效水库数目;q′(i,t)为第i库出库流量在公共防洪点响应过程;q′(i,t)为各显效水库私有防洪点上游区间来水在公共防洪点的响应过程;q′区s(t)为公共防洪点上游区间来水在公共防洪点的响应过程;
约束条件包括:
1)水量平衡约束
V(i,t)=V(i,t-1)+(Q(i,t)-q(i,t))·Δt (3);
其中,V(i,t-1)、V(i,t)为第i水库t-1时刻和t时刻的蓄水量;Q(i,t)和q(i,t)分别为第i水库t时刻的入库、出库流量;
2)泄流能力约束
q(i,t)≤q(i,Z(i,t)) (4);
其中,q(i,Z(i,t))为第i水库第t时刻对应水位Z(i,t)的泄流能力;
3)最高水位约束
Z(i,t)≤Z(i,t)max (5);
其中,Z(i,t)max为第i水库第t时刻允许达到的最高水位;
4)期末水位约束
Z(i,end)=Z(i,con) (6);
其中,Z(i,end)为第i水库调度期末计算水位;Z(i,con)为第i水库期末控制水位;
5)泄流变幅约束
|q(i,t)-q(i,t-1)|≤Δq(i) (7);
其中,q(i,t-1)为第i水库t-1时刻的出库流量;Δq(i)为第i水库出库流量最大变幅。
步骤22、生成训练及验证样本集:
假设防洪系统中共有M座防洪工程,选取历史L场流域性洪水,其中L1场洪水用于模型训练,L2场洪水用于模型验证;计算每场洪水中各工程输入属性集各属性值;由上述建立的“混合等效调度”模型,采用逐步减库法确定每场洪水中显效工程(记为“1”)与非显效工程(记为“0”)。由此可得共有|S|个样本的训练集S(C,D),|S|=M×L1,其中,C={Cj}(j∈[1,N])为特征属性;D={Du}(u=0,1)为类别属性,即工程由逐步减库法辨识的类别。
本发明中,以淮河流域鲁台子断面以上14座水库组成的防洪系统为例,选取13场流域性洪水,其中,10场洪水用于模型训练,3场洪水用于模型验证。计算各场洪水中各水库属性值;由上述建立的“混合等效调度”模型,采用逐步减库法确定每场洪水中显效工程(记为“1”)与非显效工程(记为“0”)。由此可得训练集S中共有140个样本,验证集中共有42个样本。
步骤3、如图2所示,基于“随机”思想构建随机森林基分类器:
步骤31、确定随机森林基分类器数目Z,采用bagging方法在训练样本集S中随机抽取产生Z个训练样本子集
Figure BDA0002410234420000071
作为各基分类器的训练集;
本实施例中,确定随机森林基分类器数目Z=100,采用bagging方法在训练集S中随机抽取产生100个训练样本子集
Figure BDA0002410234420000072
作为各基分类器的训练集。
步骤32、采用Forest-RI方法进行属性随机选择,得到各基分类器的特征属性子集
Figure BDA0002410234420000073
(k∈[1,Z]);本实施例中,得到各基分类器的特征属性子集
Figure BDA0002410234420000081
(k∈[1,100]);
步骤33、基于Gini不纯度最小准则,由CART算法进行节点分裂生成单棵决策树,作为随机森林基分类器,表示为:
h(x,Θe) (8);
其中,h(x,Θe)表示第e棵决策树;x为输入变量;Θe为独立同分布的随机变量,表示单棵决策树所采用的参数集。
步骤4、如图2所示,基于“集成”思想构建随机森林分类模型:
建立包含Z棵决策树的随机森林,表示为{h1(x),h2(x),…,hZ(x)}。由随机森林进行显效工程辨识,首先通过基分类器进行工程属性判别,最后通过投票法这一结合策略将基分类器结果结合得出最终分类结果,并得到第λ个样本属于Du类的概率Pλu
本发明实施例中,建立包含100棵决策树的随机森林,表示为{h1(x),h2(x),…,h100(x)}。由随机森林进行显效工程辨识,首先通过基分类器进行工程属性判别,最后通过投票法这一结合策略将基分类器结果结合得出最终分类结果,并得到第λ个样本属于Du类的概率Pλu
步骤5、建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度:
步骤51、确定代价矩阵:令显效工程为正类(记为“1”),非显效工程为负类(记为“0”);逐步减库法辨识的工程属性为真实类别,随机森林分类模型辨识的工程属性为预测类别;costαβ为把α类样本误判为β类的代价,则正确分类的代价cost11=0,cost00=0,代价矩阵表示为:
Figure BDA0002410234420000082
步骤52、统计L2场验证洪水辨识结果每类工程样本数,得到混淆矩阵:
Figure BDA0002410234420000083
本实施例中,用步骤1至步骤4建立的随机森林分类模型进行3场验证洪水中显效工程辨识,统计辨识结果每类工程样本数,得到混淆矩阵:
Figure BDA0002410234420000091
步骤53、正例概率表示为p,负例概率表示为1-p。
归一化正例概率代价为:
Figure BDA0002410234420000092
归一化期望代价为:
Figure BDA0002410234420000093
其中,
Figure BDA0002410234420000094
步骤54、以归一化正例概率代价为横坐标、归一化期望代价为纵坐标绘制代价曲线:
将各样本属于“正类”的概率Pλ1由大到小排序,并依次将其作为阈值,记为θη(排序后第η个样本属于“正类”的概率)。
按θη判断水库性质,若Pλ1>θη,则第λ个样本属于“正类”,否则,属于“负类”;所有样本判断完成后,计算FPR和FNR,可得到一组(0,FPR)和(1,FNR)坐标,连接得到一条代价线段。
以此类推,按不同阈值θη判断水库性质,可得到一系列代价线段,所有线段的下包线即代价曲线,如图3所示。
步骤55、代价曲线和横轴围成的面积为期望总体代价,如图3阴影面积所示。期望总体代价是考虑不均等代价的分类精度评价指标,计算公式如下:
Figure BDA0002410234420000095
其中,
Figure BDA0002410234420000096
Figure BDA0002410234420000097
分别为阈值θη对应的假反例率和假正例率。
本实施例中,3场验证洪水所有工程由随机森林分类模型判断得到的属性和逐步减库法得到的真实属性完全一致,代价曲线为连接(0,0)和(1,0)点的一条线段,所以期望总体代价E(Tcost)=0。
本发明所提出的基于随机森林的防洪同显效工程智能辨识方法,可准确辨识防洪系统中的显效工程及非显效工程。该机器学习技术在防洪调度领域的应用,为显效工程高效准确辨识提供了新的途径。包括:建立随机森林特征属性集;建立防洪系统“混合等效调度”模型,生成训练样本集及验证样本集;基于“随机”思想构建随机森林基分类器;基于“集成”思想构建随机森林分类模型;建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度。为充分利用防洪系统不同工程的防洪能力,最大程度发挥防洪价值,本发明提出了基于随机森林的防洪系统显效工程智能辨识方法。针对防洪系统历史洪水“小样本”的特点,为充分利用属性集及训练样本信息,基于随机森林“随机”和“集成”两种思想,提高了显效工程分类精度;通过引用机器学习原理,提高显效工程辨识效率;针对辨识结果不同种类错误代价不均等问题,利用期望总体代价评价随机森林分类精度。

Claims (6)

1.一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,包括以下步骤:
(1)建立随机森林特征属性集;
(2)建立防洪系统“混合等效调度”模型,生成训练及验证样本集;
(3)基于“随机”思想构建随机森林基分类器;
(4)基于“集成”思想构建随机森林分类模型;
(5)建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度。
2.根据权利要求1所述的一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,步骤(1)中充分考虑防洪系统实时水、雨、工情信息,选取防洪工程控制流域预测来水量、被补偿区间来水量、工程防洪压力、防洪点洪量贡献值、防洪点洪峰贡献值、防洪点洪水重叠度、工程间洪水重叠度为随机森林特征属性集。
3.根据权利要求1所述的一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,步骤(2)包括以下步骤:
(21)所述防洪系统“混合等效调度”模型分为以最大削峰准则为目标的非显效工程单独优化调度和以防洪点洪峰流量最小为目标的显效工程联合优化调度;
单独优化调度目标函数为:
min F1=max(q(t)) (1);
其中,q(t)为t时刻水库出库流量;
联合优化调度目标函数为:
Figure FDA0002410234410000011
其中,M1为显效水库数目;q'(i,t)为第i库出库流量在公共防洪点响应过程;q'(i,t)为各显效水库私有防洪点上游区间来水在公共防洪点的响应过程;q'区s(t)为公共防洪点上游区间来水在公共防洪点的响应过程;
约束条件包括:
1)水量平衡约束
V(i,t)=V(i,t-1)+(Q(i,t)-q(i,t))·Δt (3);
其中,V(i,t-1)、V(i,t)分别为第i水库t-1时刻和t时刻的蓄水量;Q(i,t)和q(i,t)分别为第i水库t时刻的入库、出库流量;
2)泄流能力约束
q(i,t)≤q(i,Z(i,t)) (4);
其中,q(i,Z(i,t))为第i水库第t时刻对应水位Z(i,t)的泄流能力;
3)最高水位约束
Z(i,t)≤Z(i,t)max (5);
其中,Z(i,t)max为第i水库第t时刻允许达到的最高水位;
4)期末水位约束
Z(i,end)=Z(i,con) (6);
其中,Z(i,end)为第i水库调度期末计算水位;Z(i,con)为第i水库期末控制水位;
5)泄流变幅约束
|q(i,t)-q(i,t-1)|≤Δq(i) (7);
其中,q(i,t-1)为第i水库t-1时刻的出库流量;Δq(i)为第i水库出库流量最大变幅;
(22)生成训练及验证样本集:
假设防洪系统中共有M座防洪工程,选取历史L场流域性洪水,其中L1场洪水用于模型训练,L2场洪水用于模型验证;计算每场洪水中各工程输入属性集各属性值;由上述建立的“混合等效调度”模型,采用逐步减库法确定每场洪水中显效工程,记为“1”,与非显效工程,记为“0”;由此得共有|S|个样本的训练集S(C,D),|S|=M×L1,其中,C={Cj}(j∈[1,N])为特征属性;D={Du}(u=0,1)为类别属性,即工程由逐步减库法辨识的类别。
4.根据权利要求1所述的一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,步骤(3)包括以下步骤:
(31)确定随机森林基分类器数目Z,采用bagging方法在训练样本集S中随机抽取产生Z个训练样本子集
Figure FDA0002410234410000031
作为各基分类器的训练集;
(32)采用Forest-RI方法进行属性随机选择,得到各基分类器的特征属性子集
Figure FDA0002410234410000032
Figure FDA0002410234410000033
(33)基于Gini不纯度最小准则,由CART算法进行节点分裂生成单棵决策树,作为随机森林基分类器,表示为:
h(x,Θe) (8);
其中,h(x,Θe)表示第e棵决策树;x为输入变量;Θe为独立同分布的随机变量,表示单棵决策树所采用的参数集。
5.根据权利要求1所述的一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,步骤(4)中建立包含Z棵决策树的随机森林,表示为{h1(x),h2(x),…,hZ(x)},由随机森林进行显效工程辨识,首先通过基分类器进行工程属性判别,最后通过投票法这一结合策略将基分类器结果结合得出最终分类结果,并得到第λ个样本属于Du类的概率Pλu
6.根据权利要求1所述的一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,步骤(5)包括以下步骤:
(51)令显效工程为正类,记为“1”,非显效工程为负类,记为“0”;逐步减库法辨识的工程属性为真实类别,随机森林分类模型辨识的工程属性为预测类别;costαβ为把α类样本误判为β类的代价;则正确分类的代价cost11=0,cost00=0,把负类预测为正类的代价为cost01,把正类预测为负类的代价为cost10
(52)统计L2场验证洪水辨识结果每类工程样本数,把正类预测为正类的样本数为真正例TP,把正类预测为负类的样本数为假负例FN,把负类预测为正类的样本数为假正例FP,把负类预测为负类的样本数为真负例TN;
(53)正例概率表示为p,负例概率表示为1-p;
归一化正例概率代价为:
Figure FDA0002410234410000041
归一化期望代价为:
Figure FDA0002410234410000042
其中,
Figure FDA0002410234410000043
(54)以归一化正例概率代价为横坐标、归一化期望代价为纵坐标绘制代价曲线:
将各样本属于“正类”的概率Pλ1由大到小排序,并依次将其作为阈值,记为θη,θη表示排序后第η个样本属于“正类”的概率;
按θη判断水库性质,若Pλ1>θη,则第λ个样本属于“正类”,否则,属于“负类”;所有样本判断完成后,计算FPR和FNR,得到一组(0,FPR)和(1,FNR)坐标,连接得到一条代价线段;
以此类推,按不同阈值θη判断水库性质,得到一系列代价线段,所有线段的下包线即代价曲线;
(55)代价曲线和横轴围成的面积为期望总体代价,该指标是考虑不均等代价的分类精度评价指标,计算公式如下:
Figure FDA0002410234410000044
其中,
Figure FDA0002410234410000045
Figure FDA0002410234410000046
分别为阈值θη对应的假反例率和假正例率。
CN202010174210.8A 2020-03-13 2020-03-13 一种基于随机森林的防洪系统显效工程智能辨识方法 Active CN111325286B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010174210.8A CN111325286B (zh) 2020-03-13 2020-03-13 一种基于随机森林的防洪系统显效工程智能辨识方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010174210.8A CN111325286B (zh) 2020-03-13 2020-03-13 一种基于随机森林的防洪系统显效工程智能辨识方法

Publications (2)

Publication Number Publication Date
CN111325286A true CN111325286A (zh) 2020-06-23
CN111325286B CN111325286B (zh) 2022-07-29

Family

ID=71173263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010174210.8A Active CN111325286B (zh) 2020-03-13 2020-03-13 一种基于随机森林的防洪系统显效工程智能辨识方法

Country Status (1)

Country Link
CN (1) CN111325286B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784051A (zh) * 2020-07-03 2020-10-16 中国水利水电科学研究院 一种洪水调度方案优选方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101727434B1 (ko) * 2016-08-02 2017-04-26 성균관대학교산학협력단 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법
CN108062560A (zh) * 2017-12-04 2018-05-22 贵州电网有限责任公司电力科学研究院 一种基于随机森林的电力用户特征识别分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101727434B1 (ko) * 2016-08-02 2017-04-26 성균관대학교산학협력단 랜덤 포레스트 모델을 이용한 냉동기의 성능 판단 방법
CN108062560A (zh) * 2017-12-04 2018-05-22 贵州电网有限责任公司电力科学研究院 一种基于随机森林的电力用户特征识别分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784051A (zh) * 2020-07-03 2020-10-16 中国水利水电科学研究院 一种洪水调度方案优选方法
CN111784051B (zh) * 2020-07-03 2021-07-16 中国水利水电科学研究院 一种洪水调度方案优选方法

Also Published As

Publication number Publication date
CN111325286B (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
Chang et al. Intelligent control for modeling of real‐time reservoir operation, part II: artificial neural network with operating rule curves
CN101216998B (zh) 基于模糊粗糙集的证据理论城市交通流信息融合方法
CN110460605B (zh) 一种基于自动编码的异常网络流量检测方法
CN108985380B (zh) 一种基于聚类集成的转辙机故障识别方法
CN112101790A (zh) 一种水体监测视频及数据联动预警方法及系统
CN113378990B (zh) 基于深度学习的流量数据异常检测方法
CN103971133B (zh) 基于案例推理的钢板表面缺陷的自动识别方法
CN109873779A (zh) 一种基于lstm的分级式无线信号调制类型识别方法
CN103440525A (zh) 基于Vague值相似度量改进算法的城市湖库水华应急治理多目标多层次决策方法
CN116109458A (zh) 一种水库泄洪闸门调度方法、系统、存储介质及计算设备
CN112001788A (zh) 一种基于rf-dbscan算法的信用卡违约欺诈识别方法
CN111907523B (zh) 一种基于模糊推理的车辆跟驰寻优控制方法
CN111325286B (zh) 一种基于随机森林的防洪系统显效工程智能辨识方法
Li et al. Intelligent identification of effective reservoirs based on the random forest classification model
CN112906738A (zh) 一种水质检测及处理方法
CN108596224A (zh) 基于半监督学习的孪生超限学习机分类的数据处理方法
CN114549897A (zh) 一种分类模型的训练方法、装置及存储介质
CN109145951B (zh) 一种基于贝叶斯网络的隧道衬砌结构服役状况评价方法
CN113343123A (zh) 一种生成对抗多关系图网络的训练方法和检测方法
CN110807174B (zh) 一种基于统计分布的污水厂厂群出水分析及异常识别方法
CN109635008B (zh) 一种基于机器学习的设备故障检测方法
CN116541755A (zh) 一种基于时序图表征学习的金融行为模式分析预测方法
CN115688097A (zh) 一种基于改进遗传算法特征选择的工控系统入侵检测方法
Arsene et al. Consumer profile evaluation in a water distribution network using clustering and classification methods
CN115965466A (zh) 一种基于子图对比的以太坊账户身份推理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant