CN114154686A - 一种基于集成学习的大坝变形预测方法 - Google Patents

一种基于集成学习的大坝变形预测方法 Download PDF

Info

Publication number
CN114154686A
CN114154686A CN202111356366.9A CN202111356366A CN114154686A CN 114154686 A CN114154686 A CN 114154686A CN 202111356366 A CN202111356366 A CN 202111356366A CN 114154686 A CN114154686 A CN 114154686A
Authority
CN
China
Prior art keywords
model
dam
neural network
deformation prediction
ensemble learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111356366.9A
Other languages
English (en)
Inventor
高成发
董彦锋
龙凤阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202111356366.9A priority Critical patent/CN114154686A/zh
Publication of CN114154686A publication Critical patent/CN114154686A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Medical Informatics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于集成学习的大坝变形预测方法,对大坝上观测点连续监测得到的垂直位移观测数据进行预处理,得到重力拱坝上点的沉降变形量与水压、温度和时效因素的关系;对预处理后的数据集进行划分,利用神经网络构建单个大坝变形预测模型,并对单个大坝变形预测模型进行训练;采用十折交叉检验方法对单个大坝变形预测模型的输出结果进行验证,确定最优模型参数,得到简单神经网络模型;将若干简单神经网络模型的输出结果进行加权平均,得到集成结果;对集成学习模型进行精度评估并验证其泛化性能。使用本发明方法,大坝变形预测精度较统计模型提高了27%,较单神经网络模型平均提高了16%,且集成模型更加稳定。

Description

一种基于集成学习的大坝变形预测方法
技术领域
本发明属于大坝安全监测领域,特别涉及了一种大坝变形预测方法。
背景技术
大坝对合理配置及利用水资源非常重要,在供水、旅游、发电、航运等方面发挥着不可替代的作用,也是防洪工程体系的关键组成部分。大坝不仅为人们带来了巨大的综合经济效益,也为江河流经区域的人们的生产生活提供了安全保障。但是,一旦大坝出现险情,就会造成严重的经济损失或人员伤亡。由于时间的推移,大坝运行的结构、基础、环境等各种条件逐渐发生变化,加之监控不到位,导致大坝出现了一些安全隐患。大坝的损坏一般都是由量变到质变的,这个过程是不可能靠人的直觉来发现的,因而为确保大坝的安全运营,必须进行完善可靠的变形监测工作。在大坝变形监测数据处理与分析的过程中,建立良好的大坝变形分析模型是至关重要的。目前应用最多的大坝安全监控模型主要是统计模型、确定性模型和混合模型。庞大的大坝观测资料会导致数据分析和处理的工作量巨大,且大坝安全监控系统是一个复杂的时变系统,其所表现出的复杂性己经不是传统的数学监控模型所能解决的了。
发明内容
为了解决上述背景技术提到的技术问题,本发明提出了一种基于集成学习的大坝变形预测方法,通过将多个简单神经网络模型进行集成,可以有效提高大坝变形预测的稳定性和精度。
为了实现上述技术目的,本发明的技术方案为:
一种基于集成学习的大坝变形预测方法,包括以下步骤:
(1)对大坝上观测点连续监测得到的垂直位移观测数据进行预处理,得到重力拱坝上点的沉降变形量YS与水压YH、温度YT和时效Yθ因素的关系;
(2)对预处理后的数据集进行划分,利用神经网络构建单个大坝变形预测模型,确定模型结构,并对单个大坝变形预测模型进行训练;
(3)采用十折交叉检验方法对单个大坝变形预测模型的输出结果进行验证,确定最优模型参数,得到简单神经网络模型;
(4)将若干简单神经网络模型的输出结果进行加权平均,得到集成结果;
(5)对集成学习模型进行精度评估并验证其泛化性能。
进一步地,在步骤(1)中,所述重力拱坝上点的沉降变形量YS与水压YH、温度YT和时效Yθ因素的关系如下式:
Figure BDA0003357368510000021
上式中,H是坝前水深;a0是常数项,ai是水压因子回归系数,i=1~3,表示水压3分量;t是累计观测的天数;b1j、b2j是温度因子回归系数,j=1~2,用于模拟温度变化的年周期和半年周期;θ是累计进行观测的天数除以100;c1、c2是时效因子回归系数。
进一步地,在步骤(2)中,将水压分量H1,H2,H3,温度分量
Figure BDA0003357368510000022
Figure BDA0003357368510000023
时效分量θ,lnθ作为单个神经网络模型的输入,大坝变形量作为输出,构建单个大坝变形预测模型。
进一步地,在步骤(2)中,所述神经网络为BP神经网络。
进一步地,所述单个大坝变形预测模型的输入层节点数为9,隐含层节点数为19,输出层节点数为1。
进一步地,步骤(3)的具体过程如下:
训练样本随机打乱,然后等分为10份,编号Sm,m=1,2,3...10,依次将某个样本Sm作为测试样本,将其余9个样本作为训练样本对模型进行训练和验证,并选取精度最优模型,保留其验证误差,网络结构和模型参数。
进一步地,在步骤(4)中,将N个简单神经网络模型进行集成,每个模型的输出记为yn,n=1,2,3,...,N,误差记为Mn,n=1,2,3...,N,则集成学习模型中权重为
Figure BDA0003357368510000031
集成模型输出为
Figure BDA0003357368510000032
进一步地,在步骤(5)中,采用平均绝对偏差、均方根误差、相关系数和标准差作为评估指标。
采用上述技术方案带来的有益效果:
本发明利用人工神经网络模型可以更好地描述大坝变形值与库水压、温度和时效三个影响因子间的近似关系,将三个因素的分量作为单个神经网络模型的输入,大坝沉降量作为输出,对单个神经网络模型进行训练,然而由于单个神经网络模型存在稳定性差,预测精度不高的问题,采用集成学习的思想对单个神经网络模型进行集成,即训练多个神经网络模型,在此基础上,采用十折交叉验证方法,来确定单个简单神经网络模型的最优超参数,并将多个简单神经网络模型的结果加权平均作为集成模型的结果。使用本发明提出的方法,大坝变形预测精度较统计模型提高了27%,较单神经网络模型平均提高了16%,且集成模型更加稳定。
附图说明
图1为本发明的方法流程图;
图2为单个神经网络模型结构示意图;
图3为确定网络结构隐含层节点数图;
图4为简单神经网络模型与集成模型性能对比图;
图5为统计模型、BP神经网络模型、集成模型残差对比图。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
本发明设计了一种基于集成学习的大坝变形预测方法,如图1所示,步骤如下:
步骤1:利用某大坝上1个观测点自1999年1月到2006年12月的连续观测数据,剔除其中的粗差,对大坝上观测点连续监测得到的垂直位移观测数据进行预处理,得到重力拱坝上点的垂直位移YS与水压YH、温度YT和时效数据Yθ,基于1999年1月至2005年12月的数据,通过拟合得到点垂直位移YS与水压YH、温度YT和时效数据Yθ之间的统计模型,如式(1)所示,并利用该统计模型计算得到2006年1月至2006年12月的大坝观测点位移值。
Figure BDA0003357368510000041
上式中,H是坝前水深;a0是常数项,ai是水压因子回归系数,i=1~3,表示水压3分量;t是累计观测的天数;b1j、b2j是温度因子回归系数,j=1~2,用于模拟温度变化的年周期和半年周期;θ是累计进行观测的天数除以100;c1、c2是时效因子回归系数。
步骤2:利用神经网络构建单个大坝变形预测模型将数据集进行划分,利用BP神经网络构建单个大坝变形预测模型,确定模型结构,并对单个模型进行训练,使用平均绝对偏差(MAE)、均方根误差(RMSE)、相关系数(R)、标准差(STD)作为模型性能评价指标,这里神经网络模型结构为9-19-1,如图2所示。1999年1月至2005年12月的数据作为训练集,2006年1月至2006年12月的数据作为测试集。模型隐含层节点数确定方法为,将隐含层节点数分别设置为1至30,比较不同模型的四个指标:平均绝对偏差(MAE)、均方根误差(RMSE)、相关系数(R)、标准差(STD)。根据经验,隐含层节点数设置为2n+1最优,n为模型输入层节点数,在本方法中,模型节点数为19,且根据图3显示,模型在节点数达到19以后,四项指标并未随着节点数的增加而继续稳定优化,因此,考虑到模型训练效率,本实施例将模型节点数确定为19。
Figure BDA0003357368510000051
Figure BDA0003357368510000052
Figure BDA0003357368510000053
Figure BDA0003357368510000054
上式中,
Figure BDA0003357368510000055
为第i次观测的模型输出值和真实值,
Figure BDA0003357368510000056
为所有观测的模型输出值和真实值的平均值。
步骤3:采用十折交叉检验方法对每一个神经网络模型的输出结果进行验证,确定最优模型参数,即将训练样本随机打乱,然后等分为10份,编号Si(i=1,2,3...10),分别将S1作为测试样本,S2~S10作为训练样本,S2作为测试样本,S1,S3~S10作为训练样本,S3作为测试样本,S1,S2,S4~S10作为训练样本,依次类推,对模型进行训练、验证,并选取精度最优模型,保留其验证误差,网络结构和模型参数。
步骤4:根据需要,将N个简单神经网络模型进行集成,即将模型输出结果加权平均作为集成模型输出结果:在上一步的基础上,将优化后的模型作为简单神经网络模型,每个模型的输出记为yn(n=1,2,3,...,N),误差记为Mn(n=1,2,3...,N),在集成模型中权重为
Figure BDA0003357368510000061
则集成模型输出记为
Figure BDA0003357368510000062
在本实施例中,简单神经网络模型个数为50(N=50),各个简单神经模型与集成模型性能对比如图4所示,横轴为模型编号,前50个为简单神经网络模型,第51个集成学习模型,由图4可知,简单神经网络模型极不稳定,输出结果跳跃性大。而集成模型输出结果在MAE、RMSE、R、STD四项指标均是最优值或非常接近最优简单神经网络模型输出值,证明集成学习模型精度高,稳定性好,拟合程度高,且输出结果与真实值偏离小。
步骤5:对集成学习模型进行精度评估并验证其泛化性能;将集成模型与统计模型,单个BP神经网络模型进行比较,2006年1月至2006年12月的预测数据残差对比结果如图5所示。最后使用MAE、RMSE、R、STD四项指标评价集成模型的精度和性能,比较结果如表1所示,集成学习模型对比统计模型,单个BP神经网络模型,更加稳定,且精度更高。针对RMSE指标,集成学习模型较统计模型提升27%,较简单神经网络模型提升16%。本方法可有效预测大坝形变。
表1.模型精度对比
MAE RMSE R STD
统计模型 0.1933 0.2591 0.9464 0.2497
BP-NN 0.1725 0.2252 0.9613 0.2208
EN-NN 0.1611 0.1892 0.9775 0.1831
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (8)

1.一种基于集成学习的大坝变形预测方法,其特征在于,包括以下步骤:
(1)对大坝上观测点连续监测得到的垂直位移观测数据进行预处理,得到重力拱坝上点的沉降变形量YS与水压YH、温度YT和时效Yθ因素的关系;
(2)对预处理后的数据集进行划分,利用神经网络构建单个大坝变形预测模型,确定模型结构,并对单个大坝变形预测模型进行训练;
(3)采用十折交叉检验方法对单个大坝变形预测模型的输出结果进行验证,确定最优模型参数,得到简单神经网络模型;
(4)将若干简单神经网络模型的输出结果进行加权平均,得到集成结果;
(5)对集成学习模型进行精度评估并验证其泛化性能。
2.根据权利要求1所述基于集成学习的大坝变形预测方法,其特征在于,在步骤(1)中,所述重力拱坝上点的沉降变形量YS与水压YH、温度YT和时效Yθ因素的关系如下式:
Figure FDA0003357368500000011
上式中,H是坝前水深;a0是常数项,ai是水压因子回归系数,i=1~3,表示水压3分量;t是累计观测的天数;b1j、b2j是温度因子回归系数,j=1~2,用于模拟温度变化的年周期和半年周期;θ是累计进行观测的天数除以100;c1、c2是时效因子回归系数。
3.根据权利要求2所述基于集成学习的大坝变形预测方法,其特征在于,在步骤(2)中,将水压分量H1,H2,H3,温度分量
Figure FDA0003357368500000012
Figure FDA0003357368500000013
时效分量θ,lnθ作为单个神经网络模型的输入,大坝变形量作为输出,构建单个大坝变形预测模型。
4.根据权利要求1所述基于集成学习的大坝变形预测方法,其特征在于,在步骤(2)中,所述神经网络为BP神经网络。
5.根据权利要求1所述基于集成学习的大坝变形预测方法,其特征在于,所述单个大坝变形预测模型的输入层节点数为9,隐含层节点数为19,输出层节点数为1。
6.根据权利要求1所述基于集成学习的大坝变形预测方法,其特征在于,步骤(3)的具体过程如下:
训练样本随机打乱,然后等分为10份,编号Sm,m=1,2,3...10,依次将某个样本Sm作为测试样本,将其余9个样本作为训练样本对模型进行训练和验证,并选取精度最优模型,保留其验证误差,网络结构和模型参数。
7.根据权利要求1所述基于集成学习的大坝变形预测方法,其特征在于,在步骤(4)中,将N个简单神经网络模型进行集成,每个模型的输出记为yn,n=1,2,3,...,N,误差记为Mn,n=1,2,3...,N,则集成学习模型中权重为
Figure FDA0003357368500000021
集成模型输出为
Figure FDA0003357368500000022
8.根据权利要求1所述基于集成学习的大坝变形预测方法,其特征在于,在步骤(5)中,采用平均绝对偏差、均方根误差、相关系数和标准差作为评估指标。
CN202111356366.9A 2021-11-16 2021-11-16 一种基于集成学习的大坝变形预测方法 Pending CN114154686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111356366.9A CN114154686A (zh) 2021-11-16 2021-11-16 一种基于集成学习的大坝变形预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111356366.9A CN114154686A (zh) 2021-11-16 2021-11-16 一种基于集成学习的大坝变形预测方法

Publications (1)

Publication Number Publication Date
CN114154686A true CN114154686A (zh) 2022-03-08

Family

ID=80456549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111356366.9A Pending CN114154686A (zh) 2021-11-16 2021-11-16 一种基于集成学习的大坝变形预测方法

Country Status (1)

Country Link
CN (1) CN114154686A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117634652A (zh) * 2024-01-26 2024-03-01 西安理工大学 基于机器学习的大坝变形可解释预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699477A (zh) * 2009-10-21 2010-04-28 东南大学 精确预测大坝变形的神经网络方法
CN109033509A (zh) * 2018-06-14 2018-12-18 东南大学 一种基于大坝变形分析的融合模型构建方法
CN111461453A (zh) * 2020-04-13 2020-07-28 中国水利水电科学研究院 一种基于多模型组合的中长期径流集合预报方法
CN112396230A (zh) * 2020-11-16 2021-02-23 中国石油大学(华东) 基于近邻神经网络的油藏地质建模静态参数分布预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699477A (zh) * 2009-10-21 2010-04-28 东南大学 精确预测大坝变形的神经网络方法
CN109033509A (zh) * 2018-06-14 2018-12-18 东南大学 一种基于大坝变形分析的融合模型构建方法
CN111461453A (zh) * 2020-04-13 2020-07-28 中国水利水电科学研究院 一种基于多模型组合的中长期径流集合预报方法
CN112396230A (zh) * 2020-11-16 2021-02-23 中国石油大学(华东) 基于近邻神经网络的油藏地质建模静态参数分布预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117634652A (zh) * 2024-01-26 2024-03-01 西安理工大学 基于机器学习的大坝变形可解释预测方法
CN117634652B (zh) * 2024-01-26 2024-04-09 西安理工大学 基于机器学习的大坝变形可解释预测方法

Similar Documents

Publication Publication Date Title
CN110807554B (zh) 基于风电/光伏经典场景集的生成方法及系统
CN105784556B (zh) 一种基于自组织模糊神经网络的空气细颗粒物pm2.5软测量方法
CN111191191B (zh) 一种精准预测混凝土坝变形效应的组合模型的构建方法
CN108399470B (zh) 一种基于多示例遗传神经网络的室内pm2.5预测方法
CN106355540A (zh) 一种基于gra‑bp神经网络的中小型水库大坝安全评价方法
CN112330065A (zh) 一种基于基流分割和人工神经网络模型的径流预报方法
CN112861436A (zh) 一种发动机排放实时预测方法
CN103353295B (zh) 一种精确预测大坝坝体垂直变形量的方法
CN111428419A (zh) 悬浮泥沙浓度预测方法、装置、计算机设备和存储介质
Su Analysis of optimisation method for online education data mining based on big data assessment technology
CN116432123A (zh) 一种基于cart决策树算法的电能表故障预警方法
CN114154686A (zh) 一种基于集成学习的大坝变形预测方法
CN111311026A (zh) 一种顾及数据特征、模型和校正的径流非线性预测方法
CN110751312A (zh) 一种基于多因子的系统动力学生活需水预测方法和系统
CN110555566B (zh) 一种基于b样条分位数回归的光电概率密度预测方法
CN112862063A (zh) 一种基于深度信念网络的复杂管网泄漏定位方法
CN112085353A (zh) 一种基于劣化度分析的锅炉低负荷稳燃能力评价方法
CN110648023A (zh) 基于二次指数平滑改进gm(1,1)的数据预测模型的建立方法
CN116611702A (zh) 一种面向楼宇综合能源管理的集成学习光伏发电预测方法
Zhang et al. Multivariate discrete grey model base on dummy drivers
CN109101759A (zh) 一种基于正逆响应面法的参数识别方法
CN113077110A (zh) 一种基于gru的调和残差分段式潮位预测方法
CN112581311A (zh) 一种多风电场聚合后出力长期波动特性预测方法及系统
CN112670997A (zh) 考虑光伏不确定性的电热能源系统时序概率潮流计算方法
CN112765141A (zh) 基于迁移学习的连续大规模水质缺失数据填补方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination