CN117708762A - 一种多监测点联合监测的大坝安全监测模型构建方法 - Google Patents
一种多监测点联合监测的大坝安全监测模型构建方法 Download PDFInfo
- Publication number
- CN117708762A CN117708762A CN202410167080.3A CN202410167080A CN117708762A CN 117708762 A CN117708762 A CN 117708762A CN 202410167080 A CN202410167080 A CN 202410167080A CN 117708762 A CN117708762 A CN 117708762A
- Authority
- CN
- China
- Prior art keywords
- monitoring
- data
- data set
- sequence
- dam
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 250
- 238000010276 construction Methods 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000009467 reduction Effects 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims description 46
- 238000012795 verification Methods 0.000 claims description 29
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000000513 principal component analysis Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 238000011946 reduction process Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 description 29
- 238000012706 support-vector machine Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000009466 transformation Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000008030 elimination Effects 0.000 description 7
- 238000003379 elimination reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000032683 aging Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004035 construction material Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- RGCLLPNLLBQHPF-HJWRWDBZSA-N phosphamidon Chemical compound CCN(CC)C(=O)C(\Cl)=C(/C)OP(=O)(OC)OC RGCLLPNLLBQHPF-HJWRWDBZSA-N 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Human Resources & Organizations (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种多监测点联合监测的大坝安全监测模型构建方法,属于大坝监测技术领域,能够解决现有监测方法监测范围小,无法对大坝整体安全进行综合性的监测和评估,同时监测效率和准确性较低的问题。所述方法包括:S1、获取大坝上位于同一监测断面或同一监测线上的多个监测点的监测数据序列和影响因子序列;S2、对监测数据序列进行降维处理,得到信息量覆盖率满足预设条件的目标数据集;S3、根据目标数据集和影响因子序列,构建大坝安全监测模型。本发明用于监测大坝安全。
Description
技术领域
本发明涉及一种多监测点联合监测的大坝安全监测模型构建方法,属于大坝监测技术领域。
背景技术
大坝在防洪、发电、航运、供水、灌溉、养殖、旅游等方面带来了巨大的社会效益。然而,随着大坝运行时长的增加,很多建设较早的大坝因筑坝材料老化、维护管理不善等原因,长期处于带病运行状态。大坝的病变隐患若不能被及时发现和处理,可能会引发大坝灾变甚至溃坝,严重危害人民群众生命财产安全和经济社会发展。因此,有必要对大坝进行安全监测。
现有的大坝安全监测方法通常仅针对单个监测点进行监测,监测范围较小,监测维度有限,无法对大坝整体安全进行综合性的监测和评估;同时,监测数据中包含了较多干扰信息,导致对监测数据的计算速率较低。因此,现有监测方法存在监测范围小,监测效率和准确性较低的缺陷。
发明内容
本发明提供了一种多监测点联合监测的大坝安全监测模型构建方法,能够解决现有监测方法监测范围小,无法对大坝整体安全进行综合性的监测和评估,同时监测效率和准确性较低的问题。
本发明提供了一种多监测点联合监测的大坝安全监测模型构建方法,所述方法包括:
S1、获取大坝上位于同一监测断面或同一监测线上的多个监测点的监测数据序列和影响因子序列;
S2、对所述监测数据序列进行降维处理,得到信息量覆盖率满足预设条件的目标数据集;
S3、根据所述目标数据集和所述影响因子序列,构建大坝安全监测模型。
可选地,所述S2具体为:
S21、对所述监测数据序列进行降维处理,得到包含不同数据信息的多个降维数据序列;
S22、从多个降维数据序列中提取至少一个降维数据序列,形成信息量覆盖率满足预设条件的目标数据集。
可选地,所述S22具体为:
从多个降维数据序列中依次提取信息量最多的降维数据序列,直至已提取的降维数据序列的信息量覆盖率满足所述预设条件;并将已提取的降维数据序列组合形成目标数据集。
可选地,所述S2中的降维处理为主成分分析。
可选地,所述S3具体为:
S31、从所述目标数据集中提取多个数据形成训练样本数据集,并从所述影响因子序列中提取与所述训练样本数据集中的数据相对应的影响因子数据形成训练变量数据集;
S32、利用所述训练变量数据集和所述训练样本数据集对监督学习算法进行训练,得到大坝安全监测模型。
可选地,所述S32具体为:
利用所述训练变量数据集和所述训练样本数据集对监督学习算法进行训练,得到所述监督学习算法的多组参数组合;
从多组参数组合中确定所述监督学习算法的最优参数组合,并根据所述最优参数组合构建大坝安全监测模型。
可选地,在所述S3之后,所述方法还包括:
S4、根据所述目标数据集和所述影响因子序列,确定所述大坝安全监测模型的预测精度。
可选地,所述S4具体为:
S41、从所述目标数据集剩余的数据中提取多个数据形成验证样本数据集,并从所述影响因子序列中提取与所述验证样本数据集中的数据相对应的影响因子数据形成验证变量数据集;
S42、将所述验证变量数据集输入所述大坝安全监测模型中,得到验证结果;并根据所述验证结果与所述验证样本数据集,确定所述大坝安全监测模型的预测精度。
可选地,在所述S3之前,所述方法还包括:
分别对所述目标数据集和所述影响因子序列进行归一化处理,得到归一化的目标数据集和归一化的影响因子序列;
相应地,所述S3具体为:
根据所述归一化的目标数据集和所述归一化的影响因子序列,构建大坝安全监测模型。
可选地,在所述S2之前,所述方法还包括:
对所述监测数据序列进行粗差剔除和降噪预处理,得到预处理数据序列;
相应地,所述S2中的对所述监测数据序列进行降维处理,具体为:
对所述预处理数据序列进行降维处理。
本发明能产生的有益效果包括:
本发明通过对监测数据序列进行降维处理,得到包含主要监测信息的目标数据集,再根据目标数据集构建大坝安全监测模型,能够尽可能地排除监测数据序列中的无效信息对模型构建的干扰,减少模型构建的误差,有效提高模型的构建效率和预测精度。
本发明通过设置多个监测点,能够扩大大坝的监测范围和维度,同时便于实现基于多个监测点的联合监测,有利于对大坝整体安全进行综合评估和预测。
附图说明
图1为本发明实施例提供的大坝安全监测模型构建方法的流程图;
图2为本发明实施例提供的对两个监测点的监测数据序列进行主成分分析的示意图;
图3为本发明实施例提供的经粗差剔除、降噪后的监测点LA-2~LA-6的监测数据序列示意图;
图4为本发明实施例提供的经粗差剔除、降噪后的监测点LA-7~LA-11的监测数据序列示意图;
图5为本发明实施例提供的主成分分量PC1~PC5的时间序列示意图;
图6为本发明实施例提供的主成分分量PC6~PC10的时间序列示意图;
图7为本发明实施例提供的大坝安全监测模型与其他模型的预测结果对比示意图。
具体实施方式
下面结合实施例详述本发明,但本发明并不局限于这些实施例。
本发明实施例提供了一种多监测点联合监测的大坝安全监测模型构建方法,如图1所示,该方法包括:
S1、获取大坝上位于同一监测断面或同一监测线上的多个监测点的监测数据序列和影响因子序列;
S2、对监测数据序列进行降维处理,得到信息量覆盖率满足预设条件的目标数据集;
S3、根据目标数据集和影响因子序列,构建大坝安全监测模型。
其中,监测数据包括监测点的位移、渗流等信息;影响因子包括温度因子、水位因子、降雨因子等信息。由于监测数据序列和影响因子序列是同步采集的,因此每个监测数据均有与之实时对应的影响因子数据。
由于上述多个监测点位于同一监测断面或同一监测线上,彼此之间存在一定的关联性,因此,上述多个监测点采集的监测数据时间序列,可以用于构建多监测点联合监测的大坝安全监测模型。
在本实施例中,S2具体可以为:
S21、对监测数据序列进行降维处理,得到包含不同数据信息的多个降维数据序列;
S22、从多个降维数据序列中提取至少一个降维数据序列,形成信息量覆盖率满足预设条件的目标数据集。
具体地,降维处理可以将原始高维数据转化为低维数据,同时尽可能地保留原始高维数据中的关键信息,提高模型的构建效率和预测精度。降维处理后一般会得到多个降维数据序列,由于各个降维数据序列中的数据信息不同,使得各个降维数据序列所包含的信息量也可能不同。一般来说,序列包含的信息量越大,其保留的关键信息也越多,因此应提取包含信息量较多的一个或多个降维数据序列组成目标数据集,目标数据集的信息量覆盖率为提取的降维数据序列的信息量之和,进而根据目标数据集构建模型。
实际中,可根据情况设置预设条件,对目标数据集进行限定,进而限定降维数据序列的提取方式。在本实施例中,该预设条件为目标数据集的信息量覆盖率大于或等于特定值,且所需的降维数据序列的数量最少。
示例地,若降维后得到五个降维数据序列,五个降维数据序列的信息量总和为100,且五个降维数据序列所包含的信息量分别为1、2、5、10和82,则五个降维数据序列的信息量覆盖率分别为1%、2%、5%、10%和82%。同时,将预设条件设为目标数据集的信息量覆盖率大于或等于90%,且所需的降维数据序列的数量最少。
若只考虑预设条件中的“目标数据集的信息量覆盖率大于或等于90%”,则至少有如下两种提取降维数据序列的方式:一种是提取信息量覆盖率为10%和82%的两个降维数据序列组成目标数据集,此时目标数据集的信息量覆盖率为92%;另一种是提取信息量覆盖率为1%、2%、5%和82%的四个降维数据序列组成目标数据集,此时目标数据集的信息量覆盖率为90%。但若同时考虑预设条件中的“且所需的降维数据序列的数量最少”,则应采取前一种提取方式,此时提取的降维数据序列的数量最少,有利于提高模型构建效率。
为保证目标数据集中的降维数据序列的数量,在本实施例中,S22具体可以为:
从多个降维数据序列中依次提取信息量最多的降维数据序列,直至已提取的降维数据序列的信息量覆盖率满足预设条件;并将已提取的降维数据序列组合形成目标数据集。
按照信息量的多少依次提取降维数据序列,能够使目标数据集所需的降维数据序列的数量最少,且使目标数据集包含的关键信息更多,能够高效得到满足预设条件的目标数据集。
在本实施例中,S2中的降维处理为主成分分析。
主成分分析的原理是在监测数据序列所在的坐标系中,寻找相互正交的投影轴,使得多个监测数据在少数几个投影轴上的方差最大,则可以将多个监测点的监测数据集中到少数几个投影轴上,形成多个包含较多信息量的主成分分量。
下面以两个监测点的监测数据序列为例,说明主成分分析的具体方法。设大坝上某两个相关联的监测点采集的两组监测数据序列分别为 和,且和的长度均为,则可以根据和建立平面直角坐标系。如图2所示,坐标横轴为,坐标纵轴为,将和上相同监测时刻的监测数据按照坐标 ,且,在坐标系中标记为点,从而绘制成散点图。其中,为中第个监测时刻的监测数据,为中第个监测时刻的监测数据。由此可知,散点图中共有个点。
由于和之间具有一定的关联性,因此在平面直角坐标中,大部分的点都落在一条直线附近,所有点的分布大致呈一个椭圆形区域。将椭圆的长轴方向设为坐标轴,并将椭圆的短轴方向设为坐标轴,进行坐标系的变换,变换后所有点的坐标为:
(1)
式(1)中:为变换后的坐标系横轴与原坐标系横轴之间的夹角,为监测数据序列中第个监测时刻的监测数据,为监测数据序列中第个监测时刻的监测数据,、分别为坐标系变换后与第个监测时刻对应的点的横纵坐标值,。
将式(1)转换为矩阵形式,即:
(2)
式(2)中:为和中的所有监测数据构成的矩阵;为坐标变换矩阵,且其为正交矩阵;为经坐标系变换后的矩阵。
进一步有:
(3)
(4)
式(3)和(4)中:为坐标变换矩阵,且其为正交矩阵;为坐标变化矩阵的逆矩阵,为坐标变化矩阵的转置矩阵,为单位矩阵。
由图2可知,在二维空间上,两组监测序列经过坐标变换后,轴上的数据较为分散,变化幅度较大,方差较大,表明轴包含的数据信息较多;而轴上的数据较为集中,变化幅度较小,方差较小,表明轴包含的数据信息较少。
可以将两组监测序列在轴上的分量设为第一主成分分量,将轴上的分量设为第二主成分分量,由此,通过坐标系变换得到了两组降维数据序列,即两个主成分分量,完成了对监测数据序列和的降维处理。
由于这个点的方差主要表现在轴上,使轴包含的数据信息较多,因此,若选择一个主成分分量来表示这两组监测序列,为保留更多的关键信息,应选择第一主成分分量。
进一步地,当个监测点相互关联时,则可以进行多维空间的正交变换,以分别处理个方向上的监测数据序列。
示例地,设大坝上有个相互关联的监测点,各监测点的监测数据序列分别为,且长度均为。
由,可构成监测数据矩阵:
(5)
式(5)中:为监测数据矩阵,为监测数据序列中第个监测时刻的监测数据,;。
矩阵中虽然都是相关联的监测点,但是考虑到监测数据序列的变化范围会对分析结果产生较大的影响。所以在分析之前,可以对监测数据矩阵进行归一化处理。令每个监测数据减去其对应的监测数据序列的均值,得到监测数据序列的归一化向量,即:
(6)
式(5)中:为归一化向量,为监测数据序列中第个监测时刻的监测数据,为监测数据序列中所有监测数据的均值,;。
即:
(7)
式(7)中:为监测数据序列中所有监测数据的均值,为监测数据序列中第个监测时刻的监测数据,,。
则将监测数据序列的相关矩阵表示为:
(8)
式(8)中:为归一化向量,为归一化向量的转置向量,为相关矩阵,,。
由此得,相关矩阵的特征向量和特征值满足:
(9)
式(9)中:为相关向量,为的单位矩阵,为相关矩阵的特征向量,为相关矩阵的特征值,,。
监测数据矩阵一般为正定矩阵,所以其一定有个实特征向量和个正特征值,将特征向量降序排列:
(10)
式(10)中:为相关矩阵的特征向量,。
则可以将监测数据矩阵改写为:
(11)
式(11)中:为改写后的矩阵,为监测数据矩阵,为相关矩阵的特征值矩阵的转置矩阵,为相关矩阵的特征值,。
将监测数据矩阵用个向量的外积之和表示:
(12)
式(12)中:为原始空间坐标变换后的方向向量,可以看作是的分量;为各个监测序列在坐标变换后的坐标轴上的分量,为相关矩阵的特征值矩阵。
在二维空间中,第一主成分分量包含的数据信息量远大于第二主成分分量所包含的数据信息量;在多维空间中,监测数据矩阵包含的关键信息主要体现在数据信息量最多的前个主成分分量上,剩余的主成分分量所包含的信息主要为噪声等随机因素产生的信息,因此,将数据信息量最多的前个主成分分量定义为监测数据矩阵的有效分量。目标数据集由个有效分量组成。
实际中,可以设定一个参数来确定有效分量的个数,要求该参数能够表征包含数据信息量最多的前个分量的总信息量在原始数据信息量中的占比。
在本实施例中,该参数设定为:
(13)
式(13)中:表示前个主成分分量的累计模长占所有主成分分量模长之和的百分比,为第个主成分分量向量的模,。
同时,本实施例设定阈值,当大于或等于时,所需的的最小值即为有效分量的个数。在此基础上,可以将监测数据矩阵拆分为有效信息部分和剩余残差部分:
(14)
式(14)中:为有效信息部分,为剩余残差部分,为第个主成分分量数据序列组成的向量,为第个主成分分量时间序列组成的向量,。
其中,有效信息部分为有效分量的集合,包含着监测数据矩阵中的主要信息,这部分的相关性较强,相当于图2中的分量;剩余残差部分主要包含了噪声、随机误差等,这部分离散程度较高,相当于图2中的分量。因此,应将拟定为用于构建模型的目标数据集。
在本实施例中,S3具体可以为:
S31、从目标数据集中提取多个数据形成训练样本数据集,并从影响因子序列中提取与训练样本数据集中的数据相对应的影响因子数据形成训练变量数据集;
S32、利用训练变量数据集和训练样本数据集对监督学习算法进行训练,得到大坝安全监测模型。
具体地,本实施例从目标数据集中提取多个数据形成训练样本数据集,用于对监督学习算法进行训练,以构建大坝安全监测模型;同时将目标数据集中剩余的数据作为验证样本数据集,用于验证已构建完成的大坝安全监测模型的预测精度。
本实施例运用的监督学习算法为支持向量机(Support Vector Machine,简称SVM)。
具体地,本实施例将训练变量数据集作为支持向量机的输入量,并将训练样本数据集作为支持向量机的输出量,对支持向量机进行训练。支持向量机的通过多次运算,得到训练变量数据集和训练样本数据集之间的映射关系,基于该映射关系,即可得到大坝监测安全模型。
一般地,训练样本数据集中的数据量越多,对支持向量机的训练效果越好,大坝安全监测模型的预测精度也越高,实际中可根据具体情况设定训练样本数据集在目标数据集中数据量的占比。
进一步地,S32具体可以为:
利用所述训练变量数据集和所述训练样本数据集对监督学习算法进行训练,得到监督学习算法的多组参数组合;
从多组参数组合中确定监督学习算法的最优参数组合,并根据最优参数组合构建大坝安全监测模型。
在本实施例中,支持向量机首先需要选定一个核函数,再在选定的核函数的基础上寻找最优惩罚参数和核函数宽度。
高斯径向基函数核(Radial basis function kernel,简称RBF核),是目前应用最广泛的核函数。对于RBF核参数的选择方法有很多种,其中最常用的是网格搜索法。网格搜索法的原理是将一定范围内的参数划分为的网格,遍历网格中的所有组合,采用交叉验证的方式选取最优参数。为了提高支持向量机的分类回归精度,需要将网格划分得非常细,这使得计算量较大。
本实施例采用双线性搜索法寻找RBF核函数的最优参数,可在保证支持向量机分类回归精度的同时,大大降低计算量。双线性搜索法的原理是,基于大量实验证明,在以为坐标的坐标空间中,最优参数组合往往出现在某条曲线附近,曲线的解析式为:
(15)
式(15)中:为核函数宽,为最优惩罚参数,为多项式核函数下的最优惩罚参数。
基于双线性搜索的支持向量机参数寻优方法可归结为:选用多项式核函数SVM,采用交叉验证的方式,求解最优惩罚参数,记作;选用RBF核函数SVM,对满足式(15)的参数组合进行训练寻优,确定最优参数组合。
本实施例基于上述最优参数,构建大坝安全监测模型。
在本实施例中,在S3之后,该方法还可以包括:
S4、根据目标数据集和影响因子序列,确定大坝安全监测模型的预测精度。
进一步地,S4具体可以为:
S41、从目标数据集剩余的数据中提取多个数据形成验证样本数据集,并从影响因子序列中提取与验证样本数据集中的数据相对应的影响因子数据形成验证变量数据集;
S42、将验证变量数据集输入大坝安全监测模型中,得到验证结果;并根据验证结果与验证样本数据集,确定大坝安全监测模型的预测精度。
本实施例通过计算验证结果与验证样本数据集中数据之间的偏差度,来确定大坝安全监测模型的预测精度。
在本实施例中,在S3之前,该方法还可以包括:
分别对目标数据集和影响因子序列进行归一化处理,得到归一化的目标数据集和归一化的影响因子序列;
相应地,S3具体为:
根据归一化的目标数据集和归一化的影响因子序列,构建大坝安全监测模型。
具体地,为了减小监测数据、影响因子等数据在数量级上差异对训练速度的影响,可以将所有数据进行归一化处理:
(16)
式(16)中:、分别为归一化前后的数据;、分别为数据的最大值和最小值。
相应地,训练结束后,可以对数据进行反归一化处理,恢复数据的初始数量级。即:
(17)
式(17)中:、分别为归一化前后的数据;、分别为数据的最大值和最小值。
在本实施例中,在S2之前,该方法还可以包括:
对监测数据序列进行粗差剔除和降噪预处理,得到预处理数据序列;
相应地,S2中的对监测数据序列进行降维处理,具体为:
对预处理数据序列进行降维处理。
大坝的监测数据序列是一种随时间或空间变化的具有非平稳、非线性特征的数据信号,是水压、温度、降雨、时效等因素的综合反映。在其获取过程中,受到环境因素、仪器因素、采集因素、人为因素等的影响,不可避免地含有噪声,甚至出现含有粗差的数据,导致数据质量欠佳,甚至无法真实反映大坝实际工作性态。因此,有必要对监测数据序列进行粗差剔除、降噪等预处理。
粗差剔除是指采用统计学方法删除监测数据序列中严重偏离群体的野值,常用的方法有拉依达准则、检验方法和狄克逊准则等。本实施例采用拉依达准则对大坝安全监测数据序列中的粗差予以剔除。
根据监测数据与影响因子,建立相应的数学模型来拟合监测数据:
(18)
式(18)中:为第个监测数据的数学模型拟合值,为第个影响因子的第个实测值,为第个模型拟合值与实测值的残差,为测值的序号,。
拉依达准则是指先假设一组监测数据序列只含有随机误差,且误差服从正态分布,即,根据统计学理论可知,误差落在区间内的概率高达99.7%,其中为监测中误差。对于大坝安全监测数据序列,一般用下式的估值代替监测中误差。
(19)
式(19)中:为监测中误差,为第个模型拟合值与实测值的残差,为监测序列的长度,为影响因子的个数,。
当出现有大于的误差,即
(20)
可判断为粗差,应予以剔除。
在本实施例中,采用小波阈值法对监测数据序列进行降噪。
大坝安全监测数据序列可看作真实信号与噪声信号的叠加,即:
(21)
式(21)中:为原始监测信号,为真实信号,为噪声信号。
小波变换是一种多尺度分析方法,在时域和频域内具有较强的局部识别能力。大坝安全监测数据序列中的有效信号在小波域内的小波系数较大,而噪声信号由于具有随机性及其在时域上的不连续性,故噪声信号的小波系数较小。根据以上特征,可确定一个合适的阈值,在保留有效信号的同时,将噪声系数置零,以实现降噪的目的。
小波阈值降噪法的原理是根据大坝安全监测数据序列中有效信号和噪声信号在小波域中对应小波系数不同的特征,选定阈值重新调整小波系数后,利用小波逆变换重构监测数据信号。传统的阈值确定方法有硬阈值法和软阈值法,函数表达式分别如下式所示。
(22)
(23)
式(23)和(24)中:为降噪阈值,、分别为监测数据序列的小波变换系数在阈值下降噪前后的取值。
从式(23)和式(24)中可以看出,硬阈值法是将小于阈值的小波系数全部舍去,仅保留大于等于阈值的小波系数,这种处理方式会使得处理后的大坝安全监测数据序列在处不连续。软阈值法对小波系数的处理方式是将小波系数的绝对值减去一个给定的阈值,并保留正值,处理后的监测数据序列较为光滑,但小波系数的改变使得真实数据也产生偏差,会影响后续监测数据序列的重构。
目前常用的阈值估计方法有固定阈值法(Sqtwolog)、无偏似然估计法(Rigrsure)、启发式阈值法(Heursure)和极大极小阈值法(Minimaxi)。
1、固定阈值法(Sqtwolog)
根据监测序列长度确定降噪阈值,Sqtwolog阈值计算公式为:
(24)
式(24)中:为大坝安全监测数据序列长度,为噪声标准差,为固定阈值法的估计阈值。
2、无偏似然估计法(Rigrsure)
设是监测数据序列绝对值的升序序列,令,则Rigrsure阈值计算公式为:
(25)
(26)
(27)
式(25)~式(27)中:为监测数据序列绝对值的升序序列中第个数据的平方,为大坝安全监测数据序列长度,为噪声标准差,为无偏似然估计法的估计阈值。
3、启发式阈值法(Heursure)
Heursure阈值计算公式为:
(28)
式(28)中:、为中间量,计算方法为、,为小波变换中缩放因子组成的向量的模长的平方,为大坝安全监测数据序列长度,为噪声标准差,为固定阈值法的估计阈值,为无偏似然估计法的估计阈值。为启发式阈值法的估计阈值,
4、极大极小阈值法(Minimaxi)
该方法产生的极值监测数据序列的方差最小,Minimaxi阈值计算公式为:
(29)
式(29)中:为大坝安全监测数据序列长度,为噪声标准差,为极大极小阈值法的估计阈值。
计算过程中,噪声标准差是未知的,一般采用下式进行估计:
(30)
式(30)中:为分解尺度,表示在分解尺度下,小波分解后对应分解层数中小波系数的绝对值的中值。
下面,本实施例结合实例,具体说明大坝安全监测模型的构建方法。
本实例以某混凝土溢流坝为监测对象,在该坝的坝顶设置了若干水平位移监测点(LA),然后从中选取监测数据质量较好的10个监测点,分别为LA-2、LA-3、LA-4、LA-5、LA-6、LA-7、LA-8、LA-9、LA-10、LA-11,并提取10个监测点的监测数据时间序列。
本实例采用拉依达准则对监测数据时间序列进行粗差剔除,并采用小波阈值降噪法对粗差剔除后的监测数据时间序列进行降噪,完成对监测数据时间序列的预处理。预处理后的10个监测点的监测数据序列如图3至图4所示,可以看出,10个监测点的监测数据序列变化趋势具有高度相似性。
本实例对预处理后的10个监测数据序列进行主成分分析,得到多个主成分分量(PC),从多个主成分分量(PC)中选取包含的信息量(特征值量)最多的10个主成分分量,分别为PC1、PC2、PC3、PC4、PC5、PC6、PC7、PC8、PC9、PC10,各主成分分量如图5和图6所示,各主成分分量的特征值量和特征值贡献率,以及多个主成分分量的累计贡献率如表1所示。
表1 主成分分量特征值、贡献率及累计贡献率
本示例设定阈值(R2)为95%,从表1中可以看出,主成分分量PC1可以代表监测数据序列97.9%的变化特征,则可以将主成分分量PC1提取出来作为有效分量,形成信息量覆盖率大于或等于95%且所需的主成分分量的个数最少的目标数据集,即,,降维效果较为明显。
示例地,若设定阈值为99%,因主成分分量PC1、主成分分量PC2和主成分分量PC3的累计贡献率超过99%,则需要依次将主成分分量PC1、主成分分量PC2和主成分分量PC3提取出来作为有效分量,形成信息量覆盖率大于或等于99%且所需的主成分分量的个数最少的目标数据集,即,。
本实例降维后得到的目标数据集中共有482组监测数据中,按照时间的先后顺序,提取前450组监测数据作为训练样本数据集,将后32组监测数据作为验证样本数据集。同时,从影响因子数据集中分别提取与训练样本数据集和验证样本数据集相对应的影响因子数据,形成训练变量数据集和验证变量数据集。
然后,将训练变量数据集作为支持向量机的输入量,将训练样本数据集作为训练样本的输出量,对支持向量机进行训练。
本实例首先采用多项式核函数SVM网格搜索最优惩罚参数,采用交叉验证的方式,得最优惩罚参数。
然后采用RBF核函数SVM,给定惩罚参数的范围为[0.01, 100],步长0.01,根据式(15),计算,同样采用交叉验证的方式,得到最优参数组合 ,并基于该最优参数组合,形成大坝安全监测模型。
为了验证模型的预测精度,本实例将验证变量数据集输入大坝安全监测模型中,得到预测结果;并根据预测结果与验证样本数据集,确定大坝安全监测模型的预测精度。
为了评价本实例建立的基于PCV-SVM的大坝安全监测模型的预测能力,本实例将该模型的预测结果与如下模型的预测结果进行对比分析:
1、SVM-PCA模型:基于支持向量机分别对各监测点测值进行预测,然后提取主分量的模型。
2、时空分布模型:基于空间位移场时空分布模型对各监测点测值进行预测,然后提取主分量的模型。
为了定量比较各模型的预测精度,本实例引入均方根误差(Root Mean SquaredError,简称RMSE),平均绝对百分比误差(Mean Absolute Percentage Error,简称MAPE)和拟合优度()三个评价指标。
1、均方根误差(RMSE):
(31)
式(31)中:RMSE为均方根误差,为第个监测数据的原始测值,为对第个监测数据的预测值,为监测数据的个数,。
2、平均绝对百分比误差(MAPE):
(32)
式(32)中:MAPE为平均绝对百分比误差,为第个监测数据的原始测值,为对第个监测数据的预测值,为监测数据的个数,。
3、拟合优度():
(33)
式(33)中:为拟合优度,为第个监测数据的原始测值,为对第个监测数据的预测值,为原始测值序列的平均值,为预测值序列的平均值,为监测数据的个数,。
采用上述三个评价指标对PCA-SVM模型、SVM-PCA模型和时空分布模型预测结果对比如图7所示,三种模型预测效果的评价指标对比如表2所示。
表2 三种模型预测效果的评价指标
通过本实例,可以得出如下结论:
(1)按照本发明所述方法构建的PCA-SVM模型的拟合精度要优于SVM-PCA模型和时空分布模型,同时PCA-SVM模型的MSE和MAPE均比另外两种模型小,由此可知,PCA-SVM模型比SVM-PCA模型和时空分布模型的预测效果好,说明先对监测数据序列进行主成分分析后再进行预测,不仅能大幅减小工作量,亦能有效提高预测精度。
(2)大坝监测数据中包含很多噪声、粗差和冗余信息,本发明在对监测数据进行粗差剔除、降噪的基础上,提取多个监测点的有效分量作为目标数据集,实现了对大坝监测数据的充分、有效利用。
(3)预测精度是实现大坝预警的基础,常规的大坝监控模型以设置单个监测点居多,容易忽略关联监测点间的有效信息,导致模型的预测精度大大降低,造成险情误报、漏报等情况。本发明以具有关联性的多个监测点的有效分量为基础建立大坝安全监测模型,相较于基于单个监测点构建的模型,鲁棒性大大提高。
以上所述,仅是本申请的几个实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。
Claims (10)
1.一种多监测点联合监测的大坝安全监测模型构建方法,其特征在于,所述方法包括:
S1、获取大坝上位于同一监测断面或同一监测线上的多个监测点的监测数据序列和影响因子序列;
S2、对所述监测数据序列进行降维处理,得到信息量覆盖率满足预设条件的目标数据集;
S3、根据所述目标数据集和所述影响因子序列,构建大坝安全监测模型。
2.根据权利要求1所述的方法,其特征在于,所述S2具体为:
S21、对所述监测数据序列进行降维处理,得到包含不同数据信息的多个降维数据序列;
S22、从多个降维数据序列中提取至少一个降维数据序列,形成信息量覆盖率满足预设条件的目标数据集。
3.根据权利要求2所述的方法,其特征在于,所述S22具体为:
从多个降维数据序列中依次提取信息量最多的降维数据序列,直至已提取的降维数据序列的信息量覆盖率满足所述预设条件;并将已提取的降维数据序列组合形成目标数据集。
4.根据权利要求1所述的方法,其特征在于,所述S2中的降维处理为主成分分析。
5.根据权利要求1所述的方法,其特征在于,所述S3具体为:
S31、从所述目标数据集中提取多个数据形成训练样本数据集,并从所述影响因子序列中提取与所述训练样本数据集中的数据相对应的影响因子数据形成训练变量数据集;
S32、利用所述训练变量数据集和所述训练样本数据集对监督学习算法进行训练,得到大坝安全监测模型。
6.根据权利要求5所述的方法,其特征在于,所述S32具体为:
利用所述训练变量数据集和所述训练样本数据集对监督学习算法进行训练,得到所述监督学习算法的多组参数组合;
从多组参数组合中确定所述监督学习算法的最优参数组合,并根据所述最优参数组合构建大坝安全监测模型。
7.根据权利要求5所述的方法,其特征在于,在所述S3之后,所述方法还包括:
S4、根据所述目标数据集和所述影响因子序列,确定所述大坝安全监测模型的预测精度。
8.根据权利要求7所述的方法,其特征在于,所述S4具体为:
S41、从所述目标数据集剩余的数据中提取多个数据形成验证样本数据集,并从所述影响因子序列中提取与所述验证样本数据集中的数据相对应的影响因子数据形成验证变量数据集;
S42、将所述验证变量数据集输入所述大坝安全监测模型中,得到验证结果;并根据所述验证结果与所述验证样本数据集,确定所述大坝安全监测模型的预测精度。
9.根据权利要求1所述的方法,其特征在于,在所述S3之前,所述方法还包括:
分别对所述目标数据集和所述影响因子序列进行归一化处理,得到归一化的目标数据集和归一化的影响因子序列;
相应地,所述S3具体为:
根据所述归一化的目标数据集和所述归一化的影响因子序列,构建大坝安全监测模型。
10.根据权利要求1所述的方法,其特征在于,在所述S2之前,所述方法还包括:
对所述监测数据序列进行粗差剔除和降噪预处理,得到预处理数据序列;
相应地,所述S2中的对所述监测数据序列进行降维处理,具体为:
对所述预处理数据序列进行降维处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410167080.3A CN117708762A (zh) | 2024-02-06 | 2024-02-06 | 一种多监测点联合监测的大坝安全监测模型构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410167080.3A CN117708762A (zh) | 2024-02-06 | 2024-02-06 | 一种多监测点联合监测的大坝安全监测模型构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117708762A true CN117708762A (zh) | 2024-03-15 |
Family
ID=90148294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410167080.3A Pending CN117708762A (zh) | 2024-02-06 | 2024-02-06 | 一种多监测点联合监测的大坝安全监测模型构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117708762A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197824A (zh) * | 2018-01-29 | 2018-06-22 | 河海大学 | 一种高坝服役安全空间警戒域诊断方法 |
CN111080982A (zh) * | 2019-12-31 | 2020-04-28 | 三峡大学 | 一种基于多传感器的大坝安全智能监测与预警系统及方法 |
CN113108764A (zh) * | 2021-04-15 | 2021-07-13 | 中国水利水电科学研究院 | 一种溃坝过程安全监测、预警与影响评估方法 |
CN114424167A (zh) * | 2019-05-06 | 2022-04-29 | 强力物联网投资组合2016有限公司 | 用于促进工业物联网系统智能开发的平台 |
CN115585767A (zh) * | 2022-09-05 | 2023-01-10 | 中国地质环境监测院(自然资源部地质灾害技术指导中心) | 基于多源监测数据异常形变挖掘的滑坡预警规则生成方法 |
CN116128312A (zh) * | 2023-04-17 | 2023-05-16 | 南昌工程学院 | 基于监测数据分析的大坝安全预警方法及系统 |
CN117078627A (zh) * | 2023-08-18 | 2023-11-17 | 中国水利水电科学研究院 | 一种淤地坝坝体缺陷监测及安全评价方法及系统 |
CN117422938A (zh) * | 2023-12-18 | 2024-01-19 | 水利部珠江水利委员会珠江水利综合技术中心 | 基于三维分析平台的坝坡混凝土结构异常分析方法 |
-
2024
- 2024-02-06 CN CN202410167080.3A patent/CN117708762A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197824A (zh) * | 2018-01-29 | 2018-06-22 | 河海大学 | 一种高坝服役安全空间警戒域诊断方法 |
CN114424167A (zh) * | 2019-05-06 | 2022-04-29 | 强力物联网投资组合2016有限公司 | 用于促进工业物联网系统智能开发的平台 |
CN111080982A (zh) * | 2019-12-31 | 2020-04-28 | 三峡大学 | 一种基于多传感器的大坝安全智能监测与预警系统及方法 |
CN113108764A (zh) * | 2021-04-15 | 2021-07-13 | 中国水利水电科学研究院 | 一种溃坝过程安全监测、预警与影响评估方法 |
CN115585767A (zh) * | 2022-09-05 | 2023-01-10 | 中国地质环境监测院(自然资源部地质灾害技术指导中心) | 基于多源监测数据异常形变挖掘的滑坡预警规则生成方法 |
CN116128312A (zh) * | 2023-04-17 | 2023-05-16 | 南昌工程学院 | 基于监测数据分析的大坝安全预警方法及系统 |
CN117078627A (zh) * | 2023-08-18 | 2023-11-17 | 中国水利水电科学研究院 | 一种淤地坝坝体缺陷监测及安全评价方法及系统 |
CN117422938A (zh) * | 2023-12-18 | 2024-01-19 | 水利部珠江水利委员会珠江水利综合技术中心 | 基于三维分析平台的坝坡混凝土结构异常分析方法 |
Non-Patent Citations (4)
Title |
---|
RADU POPA ET AL.: "基于一种优化算法的大坝变形性态模型(英文)", 《岩土工程学报》, no. 11, 15 November 2008 (2008-11-15), pages 1637 - 1642 * |
李俊等: "基于关联规则的大坝变形性态预判模型", 《西北水电》, no. 01, 28 February 2022 (2022-02-28), pages 73 * |
王丽蓉等: "多监测项目联合的大坝安全监控模型", 《西北水电》, no. 06, 31 December 2021 (2021-12-31), pages 11 * |
钱程等: "基于GM-ANN组合模型的大坝变形监测数据分析方法", 《中国农村水利水电》, no. 10, 15 October 2015 (2015-10-15), pages 157 - 159 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Deng et al. | Modified kernel principal component analysis using double-weighted local outlier factor and its application to nonlinear process monitoring | |
CN110987436B (zh) | 基于激励机制的轴承故障诊断方法 | |
CN109710661A (zh) | 基于遗传模拟退火算法对高压加热器状态分析的方法 | |
CN112529053A (zh) | 一种服务器中时序数据短期预测方法及系统 | |
CN116108371A (zh) | 基于级联异常生成网络的云服务异常诊断方法与系统 | |
CN116008404A (zh) | 基于激光超声的供热管道损伤识别与风险评估方法及系统 | |
CN117493953A (zh) | 一种基于缺陷数据挖掘的避雷器状态评估方法 | |
Rong et al. | Dam safety monitoring data anomaly recognition using multiple-point model with local outlier factor | |
Wan et al. | Mining subsequent trend patterns from financial time series | |
Ali et al. | Flood prediction using deep learning models | |
CN114003900A (zh) | 变电站二次系统网络入侵检测方法、装置及系统 | |
CN117909881A (zh) | 多源数据融合的抽油机的故障诊断方法及装置 | |
CN113011086B (zh) | 一种基于ga-svr算法森林生物量的估测方法 | |
CN113159088B (zh) | 一种基于多特征融合和宽度学习的故障监测与诊断方法 | |
Wan et al. | Abnormal patterns recognition in bivariate autocorrelated process using optimized random forest and multi-feature extraction | |
CN117494573A (zh) | 一种风速预测方法、系统及电子设备 | |
CN110210154B (zh) | 利用大坝测点数据判断测点表征大坝性态相似度的方法 | |
CN117708762A (zh) | 一种多监测点联合监测的大坝安全监测模型构建方法 | |
Liang et al. | Abnormal data cleaning for wind turbines by image segmentation based on active shape model and class uncertainty | |
CN113705920B (zh) | 火电厂用水数据样本集的生成方法和终端设备 | |
CN115828129A (zh) | 基于卷积特征聚类的智能用电系统故障检测方法及系统 | |
Zhu et al. | Efficient estimation of chlorophyll a concentration in artificial upwelling | |
Yang et al. | Adaptive density peak clustering for determinging cluster center | |
Dan et al. | Prediction of metal futures price volatility and empirical analysis based on symbolic time series of high-frequency | |
Jiang et al. | Discharge estimation based on machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |