CN113570191A - 一种河流凌汛冰塞险情智能诊断方法 - Google Patents
一种河流凌汛冰塞险情智能诊断方法 Download PDFInfo
- Publication number
- CN113570191A CN113570191A CN202110685933.9A CN202110685933A CN113570191A CN 113570191 A CN113570191 A CN 113570191A CN 202110685933 A CN202110685933 A CN 202110685933A CN 113570191 A CN113570191 A CN 113570191A
- Authority
- CN
- China
- Prior art keywords
- ice
- diagnosis
- flood
- plug
- dangerous case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 226
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000009826 distribution Methods 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000011156 evaluation Methods 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000002360 preparation method Methods 0.000 claims abstract description 3
- 238000007637 random forest analysis Methods 0.000 claims description 34
- 238000003066 decision tree Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000012706 support-vector machine Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000003064 k means clustering Methods 0.000 claims description 6
- 238000005452 bending Methods 0.000 claims description 5
- 208000035126 Facies Diseases 0.000 claims description 3
- 230000008021 deposition Effects 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 230000000750 progressive effect Effects 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000005259 measurement Methods 0.000 abstract description 3
- 230000010354 integration Effects 0.000 abstract description 2
- 238000010276 construction Methods 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000013138 pruning Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 239000004575 stone Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种河流凌汛冰塞险情智能诊断方法,步骤依次包括凌汛冰塞险情诊断样本制作与凌汛冰塞险情诊断样本的智能诊断,即诊断样本划分、诊断指标体系构建及实测数据标准化处理;由主客观组合评价确定诊断指标权重;凌汛冰塞易发风险度计算;凌汛冰塞易发风险度等级划分;绘制凌汛冰塞险情分布图,构造凌汛冰塞险情诊断样本集;凌汛冰塞险情诊断样本训练与参数设定、凌汛冰塞险情诊断样本的智能诊断与凌汛冰塞险情诊断指标的重要性排序;本发明一种河流凌汛冰塞险情智能诊断方法采用主客观组合评价与人工智能算法相融合,具有诊断精度高、能够智能分析凌汛冰塞险情的空间分布特征及其变化规律、可进行凌汛冰塞险情诊断指标重要性排序的特点。
Description
技术领域
本发明涉及一种河流凌汛冰塞险情智能诊断方法。
背景技术
寒区河道凌汛灾害具有致灾因子多样、孕灾环境复杂、承灾体脆弱性大等特点,凌汛冰塞险情突发性强、诊断预测难度大。目前关于河流凌汛冰塞险情的研究,更多采用的是数值模拟方法,集中在冰塞形成及演变过程模拟、冰塞壅水过程模拟及风险分析等,数值模拟方法对于冰塞演变过程数据资料的详实程度要求较高,相关资料条件不理想的情况下难以取得很高的模拟或诊断精度。
发明内容
本发明所要解决的技术问题是提供一种河流凌汛冰塞险情智能诊断方法。
本发明一种河流凌汛冰塞险情智能诊断方法的技术方案是这样实现的:
一种河流凌汛冰塞险情智能诊断方法,依次包括下列步骤:
1、凌汛冰塞险情诊断样本制作
(1)、诊断样本划分、诊断指标体系构建及实测数据标准化处理
①、根据所研究河段地理位置和河势走向,将所研究河段平均划分为若干个小尺度诊断样本,上述诊断样本的划分原则为诊断样本内弯道需保持完整、河段长度为河宽的3~5倍;
②、建立目标层A、准则层B与指标层C三层递阶的凌汛冰塞险情诊断指标体系,上述目标层A即指凌汛冰塞易发风险度;准则层B包括热力环境B1、动力因素B2和边界条件B3;指标层C则由热力环境B1、动力因素B2和边界条件B3的各项诊断指标构成,热力环境B1诊断指标为凌汛期平均气温C1(℃)、累积负气温C2(℃)、凌汛周期C3(d)、最大冰厚C4(cm),主要反映凌汛期气温变化因素对河流凌汛冰塞险情的影响;动力因素B2诊断指标为凌峰流量C5(m3/s)、单位河长槽蓄水增量C6(105m2)、平滩流量C7(m3/s),主要反映凌汛洪水动力条件对河流凌汛冰塞险情的驱动作用;边界条件B3诊断指标为单位河长泥沙淤积量C8(万t/km)、河相系数C9(m1/2)、底坡比降C10(‰)、河槽弯曲系数C11、平滩河宽间距C12(m)、桥梁工程C13(座),主要反映河道形态、河势变化及工程设施等要素对河流凌汛冰塞险情的影响;
③、收集并整理研究河段历年凌汛期实测的水文、气象及河道工程数据,以不同类型数据的多年平均值对步骤1(1)②所述指标层C各项诊断指标赋值,构建诊断样本矩阵XN×M=(xij)N×M,式中N为诊断样本数量、M为各诊断样本对应诊断指标数量、xij为第i个诊断样本对应的第j项诊断指标值,利用极差变换标准化处理方法对上述诊断样本矩阵进行数据标准化处理;
(2)、由主客观组合评价确定诊断指标权重
①、根据层次分析法重要性比例标度规则,结合专家经验打分,构造步骤1(1)②所述不同诊断指标对应的递阶层次判断矩阵An×n=(aij)n×n,式中n为当前指标层对应诊断指标的数量,aij为第i项诊断指标与第j项诊断指标相对于上层诊断指标的重要性比例标度,且An×n满足一致性检验标准;
②、根据变异系数法、层次分析法、模糊层次分析法和熵权法,由下列公式1至公式4计算步骤1(1)②所述指标层C对应各项诊断指标的权重;
假设变异系数法、层次分析法、模糊层次分析法和熵权法求得河流凌汛冰塞险情诊断指标的综合权重向量分别为W1,W2,W3和W4,则表示各方法诊断指标权重向量的公式(公式1)如下:
针对各方法诊断指标权重向量,分别计算诊断指标权重间变异系数CVWn的公式(公式2)如下:
CVWn=σ(Wn)/μ((Wn)
表示不同方法主客观指标权重的均匀化系数ηn的公式(公式3)如下:
(3)、凌汛冰塞易发风险度计算
将步骤1(2)②所得诊断指标权重与步骤1(1)③所得数据标准值对应加权求和,得到步骤1(1)①各诊断样本的凌汛冰塞险情数据,即凌汛冰塞易发风险度;
(4)、凌汛冰塞易发风险度等级划分
采用K-means聚类算法和手肘法对步骤3所得的凌汛冰塞易发风险度进行等级划分;采用K-means聚类算法,通过迭代分析寻求最优聚类,凌汛冰塞易发风险度等级划分的步骤如下:
①、构建步骤1(1)①不同诊断样本凌汛冰塞易发风险度数据集S,S={S1,S2,......,SN},初始化k个聚类中心,不同聚类中心各对应一个簇P,P={P1,P2,......,Pk},1<k≤N;
②、将步骤1(3)所得不同诊断样本凌汛冰塞易发风险度数据集S中的每一数据划分至欧氏距离最近的聚类中心所在类簇中,数据分配完成,重新计算k个类簇数据平均值,对应得到新的聚类中心;
③、重复迭代步骤1(4)②操作,不同诊断样本凌汛冰塞易发风险度数据集S中的数据再分配,不断更新聚类中心,直至聚类中心不变为止,从而得到最优聚类结果;
K-means聚类算法中第i个诊断样本凌汛冰塞易发风险度数据Si与第j个聚类中心Uj间欧氏距离计算公式(公式5)为:
d(Si,Uj)=||Si-Uj||2,1≤i≤N,1≤j≤k
由公式5可知,对于每个聚类中心,类簇中所有样本凌汛冰塞易发风险度数据欧氏距离之和越小,说明聚类效果越好,样本与聚类中心相似度越高。
采用手肘法分析确定聚类中心个数k值,衡量指标是误差平方和SSE,SSE计算公式(公式6)如下:
手肘法判定k值的主要思路是:随着聚类中心数量的增加,各类簇中诊断样本聚合程度不断提高,诊断样本与聚类中心距离平方和减小;当k小于真实聚类数目时,各类簇中诊断样本聚合程度会随k的增大而迅速提高,而SSE表现为迅速大幅下降;当k大于真实聚类数目时,各类簇中诊断样本聚合程度便会迅速降低,SSE下降幅度会大幅减小至趋于平缓,SSE与k值关系曲线为手肘形状,肘部对应k值即为最佳聚类数目;
(5)、绘制凌汛冰塞险情分布图,构造凌汛冰塞险情诊断样本集
根据步骤1(4)凌汛冰塞易发风险度等级划分结果,基于GIS平台赋予步骤1(1)①各诊断样本对应的凌汛冰塞险情等级属性绘制凌汛冰塞险情分布图,直观地反映凌汛冰塞易发河段位置及其险情等级的空间分布特征,从而构造由诊断指标体系标准值及其对应凌汛冰塞险情等级组成的凌汛冰塞险情诊断样本集;
2、凌汛冰塞险情诊断样本的智能诊断
(1)、凌汛冰塞险情诊断样本训练与参数设定
根据步骤1(5)构造的凌汛冰塞险情诊断样本集,基于python构建随机森林(RF)凌汛冰塞险情诊断模型,随机森林中弱学习器最大迭代次数或分类树数目n=50,每个决策树随机选择的诊断指标数量为4,同时建立支持向量机(SVM)、决策树(DT)、先验为高斯分布的朴素贝叶斯(GNB)、先验为多项式分布的朴素贝叶斯(MNB)、K最邻近(KNN)、自适应增强(ADA)和梯度提升(GB)的凌汛冰塞险情诊断模型,用于对比论证随机森林(RF)凌汛冰塞险情诊断模型的合理性和可靠性,随机抽取70%的样本进行训练,30%的样本用于模型测试;
随机森林是由分类树和Bagging两部分组成的一种新型分类算法,随机森林由一系列树型分类器{h(x,Θk),k=1,2,…}组成,其中Θk为独立同分布随机向量,h(x,Θk)为构造的未经剪枝的分类树,每棵树对输入向量x进行分类决策投票,根据分类树所有投票结果,即可得到某一诊断样本对应的凌汛冰塞险情等级。随机森林生成步骤,如图8所示,首先,采用Bootstrap方法从训练样本集G中抽样选取k个子训练样本集{G1,G2,···Gk},并构建k棵分类树;然后,在分类树每个节点上,随机从n个指标中选取m个,选择最优分割指标进行分割,并重复选择指标、分割,直至遍历k棵分类树;最后,将k棵分类树聚集,构建完整的随机森林。运用随机森林算法进行凌汛冰塞险情诊断时,需要将待诊断样本输入到训练好的分类树中,叶子节点上分布的凌汛冰塞险情等级即为对应分类树的诊断结果,将各棵分类树叶子上的凌汛冰塞险情等级进行数据平均,如下列公式(公式7)所示,即得到整个随机森林的凌汛冰塞险情等级诊断结果:
公式7中:T为随机森林分类树数目;c为某一险情等级;P(c|v)为冰塞险情等级c在叶子节点v处发生的概率函数。
Bootstrap方法通过对训练样本进行重抽样,分割节点,随机选择指标,能够降低不同分类树之间的联系,而剪枝操作会增加分类树偏差,因此本发明一种河流凌汛冰塞险情智能诊断方法不对单颗树进行剪枝操作,使分类树处于低偏差状态,以保障凌汛冰塞险情等级诊断的准确性;
(2)、凌汛冰塞险情诊断样本的智能诊断
利用步骤2(1)诊断样本训练后的八种凌汛冰塞险情诊断模型,对测试样本进行凌汛冰塞险情等级诊断,采用精确率P、召回率R和综合指标F1,由公式8、公式9与公式11计算并评判诊断精度;
精确率P表示被分为正例的样本中实际为正例的比例,召回率R是实际正例被分为正例的比例,F-Measure指标F是精确率与召回率的加权调和平均,P、R和F越大,说明诊断精度越高。P、R和F的计算公式(公式8、公式9、公式10)如下:
当参数α=1时,即为最常见的F1,F1的计算公式(公式11)如下:
公式8至公式11中:P指精确率(%);TP指将正例诊断为正例的样本数量(个);FP指将非正例诊断为正例的样本数量(个);R指召回率(%);FN指将正例诊断为非正例的样本数量(个);
(3)、凌汛冰塞险情诊断指标的重要性排序
根据随机森林基尼指数,计算不同诊断指标对凌汛冰塞险情的贡献度,同时考虑模型样本训练产生的误差影响,通过样本集中不同凌汛冰塞险情等级对应各诊断指标均值之间的变异系数,以“诊断指标贡献度与变异系数乘积越大,指标越重要”为原则,结合凌汛冰塞灾害的主要成因分析,综合确定凌汛冰塞险情诊断指标的重要性排序;下列公式依次为公式12、公式13、公式14、公式15与公式16:
本发明一种河流凌汛冰塞险情智能诊断方法采用主客观组合评价与人工智能算法相融合,具有诊断精度高、能够智能分析凌汛冰塞险情的空间分布特征及其变化规律、可进行凌汛冰塞险情诊断指标的重要性排序的特点。
附图说明
下面结合附图和实施例对本发明做进一步的说明。
图1是本发明一种河流凌汛冰塞险情智能诊断方法流程图;
图2是所研究河段小尺度诊断样本分布图;
图3是所研究河段凌汛冰塞险情诊断指标赋值结果图;
图4是所研究河段凌汛冰塞险情诊断指标递阶层次判断矩阵图;
图5是所研究河段凌汛冰塞险情诊断指标权重图;
图6是所研究河段凌汛冰塞险情大小分布图;
图7是所研究河段凌汛冰塞险情聚类结果图;
图8是随机森林生成步骤图;
图9是所研究河段凌汛冰塞险情诊断精度对比图;
图10是所研究河段凌汛冰塞险情诊断指标贡献度统计图;
图11是所研究河段凌汛冰塞险情诊断指标变异系数统计图。
具体实施方式
实施例1
1、计算机软件与程序来源
软件:python,版本3.8,开源软件;
编译器:pycharm,社区版
2、本发明一种河流凌汛冰塞险情智能诊断方法
如图1所示,一种河流凌汛冰塞险情智能诊断方法,依次包括下列步骤:
Ⅰ、凌汛冰塞险情诊断样本制作
(1)、诊断样本划分、诊断指标体系构建及实测数据标准化处理
①、如图2所示,根据所研究河段地理位置和河势走向,将所研究河段黄河石嘴山至头道拐河段平均划分为64个小尺度诊断样本,上述诊断样本的划分原则为诊断样本内弯道需保持完整、河段长度为河宽的3倍;
②、建立目标层A、准则层B与指标层C三层递阶的凌汛冰塞险情诊断指标体系,上述目标层A即指凌汛冰塞易发风险度;准则层B包括热力环境B1、动力因素B2和边界条件B3;指标层C则由热力环境B1、动力因素B2和边界条件B3的各项诊断指标构成,热力环境B1诊断指标为凌汛期平均气温C1(℃)、累积负气温C2(℃)、凌汛周期C3(d)、最大冰厚C4(cm);动力因素B2诊断指标为凌峰流量C5(m3/s)、单位河长槽蓄水增量C6(105m2)、平滩流量C7(m3/s);边界条件B3诊断指标为单位河长泥沙淤积量C8(万t/km)、河相系数C9(m1/2)、底坡比降C10(‰)、河槽弯曲系数C11、平滩河宽间距C12(m)、桥梁工程C13(座);
③、选取研究河段1951~2018年凌汛期实测的水文、气象及河道工程数据,以不同类型数据的多年平均值对步骤Ⅰ(1)②所述指标层C各项诊断指标赋值,构建诊断样本矩阵XN×M=(xij)N×M,式中N为诊断样本数量64、M为各诊断样本对应诊断指标数量13、xij为第i个诊断样本对应的第j项诊断指标值,利用极差变换标准化处理方法对上述诊断样本矩阵进行数据标准化处理;凌汛冰塞险情诊断指标赋值结果见表1与图3;
表1凌汛冰塞险情诊断指标赋值结果
研究河段上游至下游编号 | 1 | 8 | 15 | 22 | 29 |
诊断指标值C1 | 3.12 | 3.83 | 4.47 | 4.73 | 4.99 |
诊断指标值C2 | 630.24 | 756.89 | 871.74 | 915.88 | 960.01 |
诊断指标值C3 | 90.00 | 99.15 | 107.70 | 112.60 | 117.50 |
诊断指标值C4 | 42.65 | 56.71 | 68.57 | 67.15 | 65.73 |
诊断指标值C5 | 804.00 | 830.38 | 873.55 | 1017.40 | 1161.25 |
诊断指标值C6 | 0.03 | 0.03 | 0.02 | 0.02 | 0.02 |
诊断指标值C7 | 1800.00 | 1800.00 | 1792.50 | 1740.00 | 1687.50 |
诊断指标值C8 | 3.41 | 3.41 | 4.20 | 4.20 | 4.20 |
诊断指标值C9 | 4.75 | 6.99 | 8.81 | 8.09 | 7.38 |
诊断指标值C10 | 0.27 | 0.27 | 0.15 | 0.15 | 0.15 |
诊断指标值C11 | 1.08 | 1.07 | 1.09 | 1.17 | 1.36 |
诊断指标值C12 | 325.00 | 385.31 | 434.40 | 416.20 | 398.00 |
诊断指标值C13 | 0 | 0 | 2 | 0 | 0 |
研究河段上游至下游编号 | 36 | 43 | 50 | 57 | 64 |
诊断指标值C1 | 5.21 | 5.35 | 5.50 | 5.64 | 5.78 |
诊断指标值C2 | 996.22 | 1012.65 | 1029.07 | 1045.50 | 1061.92 |
诊断指标值C3 | 121.07 | 121.30 | 121.53 | 121.77 | 122.00 |
诊断指标值C4 | 64.74 | 64.82 | 64.89 | 64.97 | 65.04 |
诊断指标值C5 | 1309.00 | 1466.50 | 1624.00 | 1781.50 | 1939.00 |
诊断指标值C6 | 0.02 | 0.02 | 0.02 | 0.02 | 0.02 |
诊断指标值C7 | 1678.20 | 1776.90 | 1875.60 | 1974.30 | 2073.00 |
诊断指标值C8 | 9.29 | 9.29 | 9.29 | 9.29 | 9.29 |
诊断指标值C9 | 6.95 | 7.23 | 7.50 | 7.78 | 8.06 |
诊断指标值C10 | 0.09 | 0.09 | 0.09 | 0.09 | 0.09 |
诊断指标值C11 | 1.41 | 1.35 | 1.36 | 1.71 | 1.96 |
诊断指标值C12 | 393.60 | 423.70 | 453.80 | 483.90 | 514.00 |
诊断指标值C13 | 1 | 0 | 0 | 0 | 0 |
(2)、由主客观组合评价确定诊断指标权重
①、根据层次分析法重要性比例标度规则,结合专家经验打分,构造如图4所示的步骤Ⅰ(1)②所述不同诊断指标对应的递阶层次判断矩阵An×n=(aij)n×n,式中aij为第i项诊断指标与第j项诊断指标相对于上层诊断指标的重要性比例标度,且An×n满足一致性检验标准;
②、根据变异系数法、层次分析法、模糊层次分析法和熵权法,由公式1至公式4计算步骤Ⅰ(1)②所述指标层C对应各项诊断指标的权重;表2和图5为步骤Ⅰ(1)②所述指标层C对应各项诊断指标的权重计算结果,由图5可见,河流凌汛冰塞险情影响权重较大的因素是桥梁工程C13、凌峰流量C5、底坡比降C10、泥沙淤积量C8、单位河长槽蓄水增量C6、河槽弯曲系数C11和凌汛期平均气温C1,与实际冰塞或冰坝灾害的主要影响因素基本相符;
表2凌汛冰塞诊断指标权重计算结果
(3)、凌汛冰塞易发风险度计算
将步骤Ⅰ(2)②所得诊断指标权重与步骤Ⅰ(1)③所得数据标准值对应加权求和,得到步骤Ⅰ(1)①各诊断样本的凌汛冰塞险情数据,即凌汛冰塞易发风险度;表3和图6为凌汛冰塞易发风险度计算结果;
表3凌汛冰塞易发风险度计算结果
河段编号 | 4 | 8 | 12 | 16 | 20 | 24 | 28 | 32 |
凌汛冰塞易发险度 | 0.4313 | 0.4412 | 0.4561 | 0.2779 | 0.2984 | 0.3215 | 0.3439 | 0.3742 |
河段编号 | 36 | 40 | 44 | 48 | 52 | 56 | 60 | 64 |
凌汛冰塞易发险度 | 0.4148 | 0.4351 | 0.4594 | 0.4674 | 0.5030 | 0.5382 | 0.5395 | 0.5750 |
(4)、凌汛冰塞易发风险度等级划分
采用K-means聚类算法和手肘法对步骤Ⅰ(3)所得的凌汛冰塞易发风险度进行等级划分;通过公式5和公式6计算不同聚类中心数目k(k=2,3……,8)对应的诊断样本与簇聚类中心距离误差平方和SSE,绘制SSE-k关系曲线,根据手肘法确定最佳聚类数目k=4,即凌汛冰塞险情划分为四个等级:低风险、中风险、高风险和极高风险;表4为凌汛冰塞险情等级划分标准;
表4凌汛冰塞险情等级划分标准
冰塞险情等级名称 | 低风险 | 中风险 | 高风险 | 极高风险 |
凌汛冰塞易发风险度聚类中心值 | 0.21 | 0.39 | 0.52 | 0.61 |
(5)、绘制凌汛冰塞险情分布图,构造凌汛冰塞险情诊断样本集
根据步骤Ⅰ(4)凌汛冰塞易发风险度等级划分结果,基于GIS平台赋予步骤Ⅰ(1)①各诊断样本对应的凌汛冰塞险情等级属性绘制凌汛冰塞险情分布图即图7,直观地反映凌汛冰塞易发河段位置及其险情等级的空间分布特征,从而构造由诊断指标体系标准值及其对应凌汛冰塞险情等级组成的凌汛冰塞险情诊断样本集;由图7分析可知:黄河石嘴山至头道拐河段凌汛冰塞险情高风险或极高风险区多分布在三湖河口至头道拐河段,下游河段冰塞险情总体大于上游河段;表5为凌汛冰塞险情分布图标注示例;
表5凌汛冰塞险情分布图标注示例
地名 | 石嘴山 | 乌海市 | 磴口 | 八彦高勒 | 三湖河口 | 昭君坟 | 头道拐 |
颜色表示 | 浅灰色 | 浅灰色 | 浅灰色 | 灰色 | 深灰色 | 深灰色 | 黑色 |
冰塞险情等级 | 低风险 | 低风险 | 低风险 | 中风险 | 高风险 | 高风险 | 极高风险 |
II、凌汛冰塞险情诊断样本的智能诊断
(1)、凌汛冰塞险情诊断样本训练与参数设定
根据步骤Ⅰ(5)构造的凌汛冰塞险情诊断样本集,基于python构建随机森林(RF)凌汛冰塞险情诊断模型,随机森林中弱学习器最大迭代次数或分类树数目n=50,每个决策树随机选择的诊断指标数量为4,同时建立支持向量机(SVM)、决策树(DT)、先验为高斯分布的朴素贝叶斯(GNB)、先验为多项式分布的朴素贝叶斯(MNB)、K最邻近(KNN)、自适应增强(ADA)和梯度提升(GB)的凌汛冰塞险情诊断模型,用于对比论证随机森林(RF)凌汛冰塞险情诊断模型的合理性和可靠性,随机抽取70%的样本进行训练,30%的样本用于模型测试;
(2)、凌汛冰塞险情诊断样本的智能诊断
利用步骤II(1)诊断样本训练后的随机森林(RF)凌汛冰塞险情诊断模型,对测试样本进行凌汛冰塞险情等级诊断,采用精确率P、召回率R和综合指标F1,由公式8、公式9、公式11计算并评判诊断精度,精确率P=97.72%,召回率R=95.83%,综合指标F1=96.54%,明显高于支持向量机(SVM)、决策树(DT)、先验为高斯分布的朴素贝叶斯(GNB)、先验为多项式分布的朴素贝叶斯(MNB)、K最邻近(KNN)、自适应增强(ADA)和梯度提升(GB)七种智能方法的诊断精度,凌汛冰塞险情八种智能方法诊断精度比较见表6和图9,由图9可见,经过比较,随机森林更适用于黄河宁蒙段(石嘴山至头道拐河段)凌汛冰塞险情诊断,数据挖掘能力更强,与GIS结合,能够快速分析凌汛冰塞险情的空间分布特征及其变化规律。
表6凌汛冰塞险情八种智能方法诊断精度比较
方法名称 | RF | KNN | MNB | DT | GB | SVM | GNB | ADA |
精确率P | 0.98 | 0.95 | 0.90 | 0.93 | 0.88 | 0.75 | 0.75 | 0.50 |
召回率R | 0.96 | 0.98 | 0.90 | 0.85 | 0.81 | 0.56 | 0.56 | 0.22 |
综合指标F1 | 0.97 | 0.96 | 0.88 | 0.87 | 0.83 | 0.61 | 0.61 | 0.28 |
(3)、凌汛冰塞险情诊断指标的重要性排序
根据随机森林基尼指数,计算不同诊断指标对凌汛冰塞险情的贡献度,同时考虑模型样本训练产生的误差影响,通过诊断样本集中不同凌汛冰塞险情等级对应各诊断指标均值之间的变异系数,以“诊断指标贡献度与变异系数乘积越大,指标越重要”为原则,结合凌汛冰塞灾害的主要成因分析,综合确定凌汛冰塞险情诊断指标的重要性排序,表7和图10为凌汛冰塞险情诊断指标贡献度,表8和图11为凌汛冰塞险情诊断指标变异系数,根据指标重要性判断原则,得出诊断指标重要性由大至小排序的前7项为C13>C8>C10>C1>C5>C6>C2,考虑底坡比降C10受单位河长泥沙淤积量C8影响且多年变化较小,而河槽弯曲系数C11已被其他学者论证为其与冰塞冰坝具有较好的关联关系,因此从冰塞灾害成因角度分析,前7个重要指标中舍掉C10而增加C11指标,可得冰塞险情的主要驱动因子为:凌汛期平均气温C1、累积负气温C2、凌峰流量C5、单位河长槽蓄水增量C6、单位河长泥沙淤积量C8、河槽弯曲系数C11和跨河桥梁工程C13,与本发明步骤Ⅰ(2)②得出的凌汛冰塞险情影响权重较大的因素相比,两种方法分析的主要因素基本一致,只是个别因素的重要性排序略有差别,考虑主要是由诊断样本矩阵中不同指标标准值的差异性而引起,同时也验证了凌汛冰塞险情指标重要性分析结果是合理的。
表7凌汛冰塞险情诊断指标贡献度
表8凌汛冰塞险情诊断指标变异系数
实施例说明,本发明一种河流凌汛冰塞险情智能诊断方法步骤依次包括凌汛冰塞险情诊断样本制作与凌汛冰塞险情诊断样本的智能诊断,根据河段地理位置和河势走向,将所研究河段黄河石嘴山至头道拐河段平均划分为64个小尺度诊断样本,上述诊断样本的划分原则为诊断样本内弯道需保持完整、河段长度为河宽的3倍,采用目标层A、准则层B与指标层C三层递阶的凌汛冰塞险情诊断指标体系,通过选取1951~2018年凌汛期水文、气象及河道工程实测数据的均值对第三层指标层C中13项诊断指标赋值、构建诊断样本矩阵并进行数据标准化处理,采用主客观组合评价确定第三层指标层13项诊断指标权重,得到凌汛冰塞易发风险度,采用K-means聚类算法和手肘法将凌汛冰塞易发风险度划分为低风险、中风险、高风险与极高风险的四个等级,基于GIS平台赋予不同诊断样本对应的凌汛冰塞险情等级属性,绘制凌汛冰塞险情分布图,直观地反映凌汛冰塞易发河段位置及其险情等级的空间分布特征,从而构造了由诊断指标体系标准值及其对应险情等级组成的凌汛冰塞险情诊断样本集,根据凌汛冰塞险情诊断样本集,基于python构建随机森林(RF)凌汛冰塞险情诊断模型,利用诊断样本训练后的随机森林(RF)凌汛冰塞险情诊断模型,对测试样本进行凌汛冰塞险情等级诊断,采用精确率P、召回率R和综合指标F1计算并评判诊断精度,精确率P=97.72%,召回率R=95.83%,综合指标F1=96.54%,明显高于支持向量机(SVM)、决策树(DT)、先验为高斯分布的朴素贝叶斯(GNB)、先验为多项式分布的朴素贝叶斯(MNB)、K最邻近(KNN)、自适应增强(ADA)和梯度提升(GB)七种智能方法的诊断精度,说明随机森林更适用于黄河石嘴山至头道拐河段凌汛冰塞险情诊断,数据挖掘能力更强,与GIS结合,能够快速分析凌汛冰塞险情的空间分布特征及其变化规律。根据随机森林基尼指数,计算不同诊断指标对凌汛冰塞险情的贡献度,同时考虑模型样本训练产生的误差影响,通过诊断样本集中不同凌汛冰塞险情等级对应各诊断指标均值之间的变异系数,以“诊断指标贡献度与变异系数乘积越大,指标越重要”为原则,结合凌汛冰塞灾害的主要成因分析,综合确定凌汛冰塞险情诊断指标的重要性排序,与本发明一种河流凌汛冰塞险情智能诊断方法主客观组合评价确定第三层指标层13项诊断指标权重得出的凌汛冰塞险情影响权重较大的因素相比,两种方法分析的主要因素基本一致,只是个别因素的重要性排序略有差别,考虑主要是由诊断样本矩阵中不同指标标准值的差异性而引起,同时也验证了凌汛冰塞险情指标重要性分析结果是合理的。总之,本发明一种河流凌汛冰塞险情智能诊断方法采用主客观组合评价与人工智能算法相融合,具有诊断精度高、能够智能分析凌汛冰塞险情的空间分布特征及其变化规律、可进行凌汛冰塞险情诊断指标的重要性排序的特点。
Claims (1)
1.一种河流凌汛冰塞险情智能诊断方法,依次包括下列步骤:
Ⅰ、凌汛冰塞险情诊断样本制作
(1)、诊断样本划分、诊断指标体系构建及实测数据标准化处理
①、根据所研究河段地理位置和河势走向,将所研究河段平均划分为若干个小尺度诊断样本,上述诊断样本的划分原则为诊断样本内弯道需保持完整、河段长度为河宽的3~5倍;
②、建立目标层A、准则层B与指标层C三层递阶的凌汛冰塞险情诊断指标体系,上述目标层A即指凌汛冰塞易发风险度;准则层B包括热力环境B1、动力因素B2和边界条件B3;指标层C则由热力环境B1、动力因素B2和边界条件B3的各项诊断指标构成,热力环境B1诊断指标为凌汛期平均气温C1、累积负气温C2、凌汛周期C3、最大冰厚C4;动力因素B2诊断指标为凌峰流量C5、单位河长槽蓄水增量C6、平滩流量C7;边界条件B3诊断指标为单位河长泥沙淤积量C8、河相系数C9、底坡比降C10、河槽弯曲系数C11、平滩河宽间距C12、桥梁工程C13;
③、收集并整理研究河段历年凌汛期实测的水文、气象及河道工程数据,以不同类型数据的多年平均值对步骤Ⅰ(1)②所述指标层C各项诊断指标赋值,构建诊断样本矩阵XN×M=(xij)N×M,式中N为诊断样本数量、M为各诊断样本对应诊断指标数量、xij为第i个诊断样本对应的第j项诊断指标值,利用极差变换标准化处理方法对上述诊断样本矩阵进行数据标准化处理;
(2)、由主客观组合评价确定诊断指标权重
①、根据层次分析法重要性比例标度规则,结合专家经验打分,构造步骤Ⅰ(1)②所述不同诊断指标对应的递阶层次判断矩阵An×n=(aij)n×n,式中n为当前指标层对应诊断指标的数量,aij为第i项诊断指标与第j项诊断指标相对于上层诊断指标的重要性比例标度,且An×n满足一致性检验标准;
②、根据变异系数法、层次分析法、模糊层次分析法和熵权法,计算步骤Ⅰ(1)②所述指标层C对应各项诊断指标的权重;
(3)、凌汛冰塞易发风险度计算
将步骤Ⅰ(2)②所得诊断指标权重与步骤Ⅰ(1)③所得数据标准值对应加权求和,得到步骤Ⅰ(1)①各诊断样本的凌汛冰塞险情数据,即凌汛冰塞易发风险度;
(4)、凌汛冰塞易发风险度等级划分
采用K-means聚类算法和手肘法对步骤Ⅰ(3)所得的凌汛冰塞易发风险度进行等级划分;
(5)、绘制凌汛冰塞险情分布图,构造凌汛冰塞险情诊断样本集
根据步骤Ⅰ(4)凌汛冰塞易发风险度等级划分结果,基于GIS平台赋予步骤Ⅰ(1)①各诊断样本对应的凌汛冰塞险情等级属性绘制凌汛冰塞险情分布图,直观地反映凌汛冰塞易发河段位置及其险情等级的空间分布特征,从而构造由诊断指标体系标准值及其对应凌汛冰塞险情等级组成的凌汛冰塞险情诊断样本集;
II、凌汛冰塞险情诊断样本的智能诊断
(1)、凌汛冰塞险情诊断样本训练与参数设定
根据步骤Ⅰ(5)构造的凌汛冰塞险情诊断样本集,基于python构建随机森林(RF)凌汛冰塞险情诊断模型,随机森林中弱学习器最大迭代次数或分类树数目n=50,每个决策树随机选择的诊断指标数量为4,同时建立支持向量机(SVM)、决策树(DT)、先验为高斯分布的朴素贝叶斯(GNB)、先验为多项式分布的朴素贝叶斯(MNB)、K最邻近(KNN)、自适应增强(ADA)和梯度提升(GB)的凌汛冰塞险情诊断模型,用于对比论证随机森林(RF)凌汛冰塞险情诊断模型的合理性和可靠性,随机抽取70%的样本进行训练,30%的样本用于模型测试;
(2)、凌汛冰塞险情诊断样本的智能诊断
利用步骤II(1)诊断样本训练后的八种凌汛冰塞险情诊断模型,对测试样本进行凌汛冰塞险情等级诊断,采用精确率P、召回率R和综合指标F1,计算并评判诊断精度;
(3)、凌汛冰塞险情诊断指标的重要性排序
根据随机森林基尼指数,计算不同诊断指标对凌汛冰塞险情的贡献度,同时考虑模型样本训练产生的误差影响,通过样本集中不同凌汛冰塞险情等级对应各诊断指标均值之间的变异系数,以“诊断指标贡献度与变异系数乘积越大,指标越重要”为原则,结合凌汛冰塞灾害的主要成因分析,综合确定凌汛冰塞险情诊断指标的重要性排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110685933.9A CN113570191B (zh) | 2021-06-21 | 2021-06-21 | 一种河流凌汛冰塞险情智能诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110685933.9A CN113570191B (zh) | 2021-06-21 | 2021-06-21 | 一种河流凌汛冰塞险情智能诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113570191A true CN113570191A (zh) | 2021-10-29 |
CN113570191B CN113570191B (zh) | 2023-10-27 |
Family
ID=78162381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110685933.9A Active CN113570191B (zh) | 2021-06-21 | 2021-06-21 | 一种河流凌汛冰塞险情智能诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113570191B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150019262A1 (en) * | 2013-07-11 | 2015-01-15 | Corelogic Solutions, Llc | Method and system for generating a flash flood risk score |
CN110956101A (zh) * | 2019-11-19 | 2020-04-03 | 广东省城乡规划设计研究院 | 一种基于随机森林算法的遥感影像黄河冰凌检测方法 |
AU2020100709A4 (en) * | 2020-05-05 | 2020-06-11 | Bao, Yuhang Mr | A method of prediction model based on random forest algorithm |
CN111582386A (zh) * | 2020-05-11 | 2020-08-25 | 四川师范大学 | 一种基于随机森林的地质灾害多灾种综合风险评价方法 |
CN112132371A (zh) * | 2019-06-25 | 2020-12-25 | 天津大学 | 一种耦合熵权-模糊聚类算法的城市洪涝风险评估方法 |
CN112785151A (zh) * | 2021-01-22 | 2021-05-11 | 黄河勘测规划设计研究院有限公司 | 串联水库联合防凌补偿调度方法及其专用系统 |
-
2021
- 2021-06-21 CN CN202110685933.9A patent/CN113570191B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150019262A1 (en) * | 2013-07-11 | 2015-01-15 | Corelogic Solutions, Llc | Method and system for generating a flash flood risk score |
CN112132371A (zh) * | 2019-06-25 | 2020-12-25 | 天津大学 | 一种耦合熵权-模糊聚类算法的城市洪涝风险评估方法 |
CN110956101A (zh) * | 2019-11-19 | 2020-04-03 | 广东省城乡规划设计研究院 | 一种基于随机森林算法的遥感影像黄河冰凌检测方法 |
AU2020100709A4 (en) * | 2020-05-05 | 2020-06-11 | Bao, Yuhang Mr | A method of prediction model based on random forest algorithm |
CN111582386A (zh) * | 2020-05-11 | 2020-08-25 | 四川师范大学 | 一种基于随机森林的地质灾害多灾种综合风险评价方法 |
CN112785151A (zh) * | 2021-01-22 | 2021-05-11 | 黄河勘测规划设计研究院有限公司 | 串联水库联合防凌补偿调度方法及其专用系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113570191B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304668B (zh) | 一种结合水文过程数据和历史先验数据的洪水预测方法 | |
CN110728411B (zh) | 一种基于卷积神经网络的高低空区域联合降雨预测方法 | |
CN113537600B (zh) | 一种全过程耦合机器学习的中长期降水预报建模方法 | |
CN113705877B (zh) | 基于深度学习模型的实时月径流预报方法 | |
CN112288164B (zh) | 一种计及空间相关性和修正数值天气预报的风功率组合预测方法 | |
Jalalkamali | Using of hybrid fuzzy models to predict spatiotemporal groundwater quality parameters | |
KR102314013B1 (ko) | 딥러닝 기반 도시침수 한계강우량 추정 방법 | |
CN111260111A (zh) | 基于气象大数据的径流预报改进方法 | |
CN110442143B (zh) | 一种基于组合多目标鸽群优化的无人机态势数据聚类方法 | |
CN112949189A (zh) | 一种基于深度学习的多因素诱发滑坡预测的建模方法 | |
CN110765418B (zh) | 一种流域水沙研究模型的智能集合评估方法和系统 | |
Calp | A hybrid ANFIS-GA approach for estimation of regional rainfall amount | |
CN113313139A (zh) | 基于机组动态特性的风电功率预测不确定性量化方法 | |
CN113836808A (zh) | 一种基于重污染特征约束的pm2.5深度学习预测方法 | |
CN116245227A (zh) | 逐日气象干旱预测方法、装置、存储介质和设备 | |
CN115877483A (zh) | 一种基于随机森林和gru的台风路径预报方法 | |
CN114882373A (zh) | 基于深度神经网络的多特征融合沙尘暴预测方法 | |
Gumilar et al. | Performance analysis of hybrid machine learning methods on imbalanced data (rainfall classification) | |
CN113033910A (zh) | 一种光伏发电功率的预测方法、存储介质及终端设备 | |
Noor et al. | Prediction map of rainfall classification using random forest and inverse distance weighted (IDW) | |
CN113570191A (zh) | 一种河流凌汛冰塞险情智能诊断方法 | |
Gunawan et al. | Long Short-Term Memory Approach for Predicting Air Temperature In Indonesia | |
CN113222288B (zh) | 村镇社区空间发展图谱的分类演化及预测方法 | |
Velasco et al. | Performance analysis of multilayer perceptron neural network models in week-ahead rainfall forecasting | |
CN115345245A (zh) | 一种基于随机森林和迁移学习的热带气旋快速加强预报方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |