CN115164820B - 一种坝体监测数据中粗差的检测方法 - Google Patents
一种坝体监测数据中粗差的检测方法 Download PDFInfo
- Publication number
- CN115164820B CN115164820B CN202210911903.XA CN202210911903A CN115164820B CN 115164820 B CN115164820 B CN 115164820B CN 202210911903 A CN202210911903 A CN 202210911903A CN 115164820 B CN115164820 B CN 115164820B
- Authority
- CN
- China
- Prior art keywords
- data
- detected
- outlier
- value
- dam
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000001514 detection method Methods 0.000 claims abstract description 46
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000005484 gravity Effects 0.000 abstract description 19
- 238000006073 displacement reaction Methods 0.000 description 7
- 238000013450 outlier detection Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 3
- 239000004567 concrete Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011897 real-time detection Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000011382 roller-compacted concrete Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01B—MEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
- G01B21/00—Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant
- G01B21/32—Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant for measuring the deformation in a solid
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
本发明公开了一种坝体监测数据中粗差的检测方法,属于重力坝监测技术领域,能够解决现有的粗差检测方法检测结果不稳定,且效率低下,难以适应工程需求的问题。所述方法包括:S1、获取坝体中不同坝段的历史监测数据和待检测数据,并根据历史监测数据确定窗口长度和检测阈值;S2、根据窗口长度和待检测数据从历史监测数据中提取出窗口序列;S3、根据窗口序列和检测阈值确定待检测数据是否为离群值;S4、当待检测数据为离群值时,获取待检测数据对应的同一时刻的相邻坝段的监测值;S5、根据同一时刻的相邻坝段的监测值确定待检测数据是否为粗差;S6、利用待检测数据更新窗口序列,并重复执行S3至S6。本发明用于粗差检测。
Description
技术领域
本发明涉及一种坝体监测数据中粗差的检测方法,属于重力坝监测技术领域。
背景技术
重力坝变形监测数据包含了坝体变形的重要信息,对精确、可靠的监测数据进行相关分析,是了解、掌握坝体变形安全性态的重要工程措施。然而,在监测数据采集过程中,常会由于各种原因产生离群值,如:(1)大坝受到地震、风浪、滑坡等偶然荷载影响,导致坝体变形量产生突然变化;(2)坝体结构受损,导致坝体抗变形能力减弱,从而产生不符合一般规律的离群值;(3)数据采集、传输过程中,受仪器设备性能与工作状态,以及外界环境因素影响时,产生类似粗差的离群值。(1)和(2)原因产生的离群值,对于分析监控坝体安全至关重要;而(3)原因产生的粗差离群值是错值,若不剔除,则会对后续数据分析计算产生非常不良的影响。所以,粗差检测对于坝体安全监控及数据分析建模等计算具有重要意义。
目前,针对重力坝原位变形监测数据的粗差检测方法并不多,主要依靠专家经验进行识别,即依靠专家的知识和经验来识别数据中是否有粗差,从而剔除。这种方法过于依赖专家水平,检测结果不稳定,且效率低下,难以适应工程需求。而现有针对离群值的检测方法,如统计概率法、多尺度分解和数据挖掘等方法,仅能找出离群值,并不能确定离群值是否是粗差。因而现有的方法难以实现准确、快速的粗差剔除。
发明内容
本发明提供了一种坝体监测数据中粗差的检测方法,能够解决现有的粗差检测方法检测结果不稳定,且效率低下,难以适应工程需求的问题。
本发明提供了一种坝体监测数据中粗差的检测方法,所述方法包括:
S1、获取坝体中不同坝段的历史监测数据和待检测数据,并根据所述历史监测数据确定窗口长度和检测阈值;
S2、根据所述窗口长度和所述待检测数据从所述历史监测数据中提取出窗口序列;
S3、根据所述窗口序列和所述检测阈值确定所述待检测数据是否为离群值;
S4、当所述待检测数据为离群值时,获取所述待检测数据对应的同一时刻的相邻坝段的监测值;
S5、根据所述同一时刻的相邻坝段的监测值确定所述待检测数据是否为粗差;
S6、利用所述待检测数据更新所述窗口序列,并重复执行S3至S6。
可选的,所述S5具体为:
若所述待检测数据对应的同一时刻的相邻坝段的监测值全部为正常值,则确定所述待检测数据为粗差。
可选的,所述S1具体包括:
S11、获取坝体中不同坝段的历史监测数据和待检测数据,并计算所述历史监测数据的显著相关性结果;
S12、根据所述显著相关性结果确定窗口长度;
S13、根据所述窗口长度和所述历史监测数据确定检测阈值。
可选的,所述检测阈值包括最大阈值和最小阈值;
所述S13具体包括:
S131、对所述历史监测数据进行滞后i阶的差分计算,得到k组滞后序列,其中,i=1,2,…,k;k为窗口长度;
S132、确定每组滞后序列的最大阈值和最小阈值。
可选的,所述S2具体包括:
S21、从所述历史监测数据中提取出所述待检测数据的前k个数据作为窗口序列;其中,所述k为窗口长度;
S22、初始化所述窗口序列中各数据的离群系数为预设值。
可选的,所述S3具体包括:
S31、根据所述窗口序列中各数据的离群系数确定所述窗口序列中的正常值;
S32、根据所述窗口序列中的正常值和所述检测阈值,计算所述待检测数据的多个局部离群系数,并从多个所述局部离群系数中确定所述待检测数据的最终离群系数;
S33、若所述待检测数据的最终离群系数为非预设值,则确定所述待检测数据为离群值。
可选的,所述S31具体为:
当所述窗口序列中离群系数为预设值的数据个数大于离群系数为非预设值的数据个数时,将所有离群系数为预设值的数据标记为正常值;
当所述窗口序列中离群系数为预设值的数据个数小于离群系数为非预设值的数据个数时,将所有离群系数为非预设值的数据标记为正常值。
可选的,所述S32具体包括:
S321、获取所述待检测数据与所述窗口序列中各正常值的差值;
S322、当所述差值大于或等于0时,计算所述差值与对应的最大阈值的比值;当所述差值小于0时,计算所述差值与对应的最小阈值的比值;并将所述比值记为所述待检测数据的局部离群系数;
S323、当所述待检测数据的局部离群系数中存在多个局部离群系数的绝对值大于1,则将距离所述待检测数据最近的局部离群系数作为所述待检测数据的最终离群系数;当所述待检测数据的多个局部离群系数的绝对值均小于或等于1,则将所述待检测数据的最终离群系数赋值为所述预设值。
可选的,所述S6具体为:
S61、将所述待检测数据作为最新时刻数据加入所述窗口序列的末尾,并剔除所述窗口序列首端的最初时刻数据,以更新所述窗口序列;
S62、获取监测到的下一时刻数据作为新的待检测数据,并重复执行S3至S6。
可选的,所述S12具体为:
根据第一公式计算窗口长度;
所述第一公式为:k=2K+1;
其中,k为窗口长度,K为所述历史监测数据的显著相关性结果。
可选的,所述S132具体为:
将每组滞后序列中的最大值作为所述滞后序列的最大阈值,将每组滞后序列中的最小值作为所述滞后序列的最小阈值。
可选的,所述S132具体包括:
获取每组滞后序列的均值和标准差;
计算每组滞后序列中均值与3倍标准差的差值,将所述差值作为所述滞后序列的最小阈值;并计算所述均值与3倍标准差的和值,将所述和值作为所述滞后序列的最大阈值。
本发明能产生的有益效果包括:
(1)本发明提供的坝体监测数据中粗差的检测方法,通过根据不同坝段具有相同变化规律特点,且认为粗差是偶然发生的个别现象,不同时发生于相邻坝段这一前提,来识别粗差。即当某个坝段某时刻值被检测出是离群值后,再判断相邻坝段数据是否为离群值,以此来判断该坝段某时刻值是否为粗差。该方法不依赖于专家水平,检测结果稳定,且效率较高,能够准确快速的检测出粗差,可以很好地适应工程需求。
(2)本发明提供的坝体监测数据中粗差的检测方法,针对重力坝变形监测数据的规律与特点,依据自相关与偏自相关分析,挖掘出数据序列中前后值相关性较大的数据,以显著相关的数据对待检测值进行判断,提高了离群值检测的可靠度;该方法不仅可对单个离群值进行检验,而且还可以对阶跃离群情况进行检验,因而具有更高的适应性;同时,以窗口数据对下一时刻的待检测值进行计算,数据量小,大大提高了计算效率,还可实现对流数据的实时检测,提高了检测方法的智能化水平。此外,本发明结合常规的统计概率法、极值法和专家经验法,拟定变形监测数据的检测阈值,且可根据不同方法对检测阈值进行调整,使得检测阈值设定具有更高的灵活性;以不同时刻数据之间差分值与相应阈值的比值大小定义离群系数,其离群系数物理意义明确,便于理解离群值的离群程度。该方法能准确快速的检测出单个测点监测数据中的离群值,在此基础上,考虑重力坝分为不同坝段这一结构特征,根据相邻坝段变化一致性原则,可对离群值再次进行判断是否为粗差。
附图说明
图1为本发明实施例提供的坝体监测数据中粗差的检测方法流程图;
图2为本发明实施例提供的某重力坝坝顶水平位移待检测数据过程线;
图3为本发明实施例计算的待检测数据的离群系数;
图4为本发明实施例提供的待检测数据序列中检测出的离群值;
图5为本发明实施例提供的突变离群值示意图;
图6为本发明实施例提供的阶跃离群值示意图;
图7为本发明实施例提供的坝体结构示意图。
具体实施方式
下面结合实施例详述本发明,但本发明并不局限于这些实施例。
本发明实施例提供了一种坝体监测数据中粗差的检测方法,如图1所示,所述方法包括:
S1、获取坝体中不同坝段的历史监测数据和待检测数据,并根据历史监测数据确定窗口长度和检测阈值。
具体包括:
S11、获取坝体中不同坝段的历史监测数据和待检测数据,并计算历史监测数据的显著相关性结果;
S12、根据显著相关性结果确定窗口长度;
具体可以根据第一公式计算窗口长度;
第一公式为:k=2K+1;
其中,k为窗口长度,K为历史监测数据的显著相关性结果。
在实际应用中,假设重力坝某一坝段变形监测数据序列表示为{x1,x2,…,xt-1,xt,xt+1…,xt+i},历史监测数据是指已获取的不包括待检测数据的监测数据,如{x1,x2,…,xt-1},在获取历史监测数据后,需对该数据进行初步筛选,保证其中无离群值的存在,这样才能挖掘出正常值组成的序列的窗口长度k和检测阈值B。
历史监测数据为一维时间序列,对其进行自相关系数和偏自相关系数的计算,根据计算结果即可知道历史监测数据有滞后几阶的显著相关性,即某时刻值与前几时刻的值有显著相关性。假设计算的显著相关性结果为K,则选择k=2K+1作为窗口序列的长度,即窗口长度。
S13、根据窗口长度和历史监测数据确定检测阈值。
检测阈值包括最大阈值和最小阈值。
S13具体包括:
S131、对历史监测数据进行滞后i阶的差分计算,得到k组滞后序列,其中,i=1,2,…,k;k为窗口长度;
S132、确定每组滞后序列的最大阈值和最小阈值。进一步的,可以将每组滞后序列的最大阈值组成的集合记为最大阈值集合,将每组滞后序列的最小阈值组成的集合记为最小阈值集合。
根据已确定的窗口长度k,可对历史监测数据进行差分计算得到k组滞后序列,具体的:
前例中,重力坝某一坝段变形监测的历史监测数据序列表示为X={x1,x2,…,xt-1},X的滞后i阶的差分序列表示为ΔiX={xi,1,xi,2,…,xi,j},其中,
Δxi,j=xi,j-xi,j-i;
式中:i=1,2,…,k,表示滞后阶数;j=1+i,2+i,…,t-1,表示第j时刻的值。Δxi,j表示X序列中的xj与其前i时刻数据之间的差值。
得到了k个滞后序列ΔXi(i=1,2,…,k),每个滞后序列有最大和最小两个阈值,共2k个阈值。每个滞后序列的最大阈值即可组成最大阈值集合B1,每个滞后序列的最小阈值即可组成最小阈值集合B2。
检测阈值(即最大阈值和最小阈值)的计算可采用小概率法、最值法、专家经验法,或可结合其他方法,综合确定检测阈值,本发明实施例对此不做限定。
其中,最值法就是将每组滞后序列中的最大值作为滞后序列的最大阈值,将每组滞后序列中的最小值作为滞后序列的最小阈值。
专家经验法就是根据专家经验,来确定最大阈值和最小阈值。
基于小概率法的阈值计算方法为:首先获取每组滞后序列的均值和标准差;设数据序列为{x1,x2,…,xt},该组数据的均值为:
该组数据的标准差为:
根据均值和标准差即可确定一个合理的检测阈值区间,通常选取3倍σ值作为阈值。
具体的,计算每组滞后序列中均值与3倍标准差的差值,将差值作为滞后序列的最小阈值;并计算均值与3倍标准差的和值,将和值作为滞后序列的最大阈值。
S2、根据窗口长度和待检测数据从历史监测数据中提取出窗口序列。
具体包括:
S21、从历史监测数据中提取出待检测数据的前k个数据作为窗口序列;其中,k为窗口长度;
S22、初始化窗口序列中各数据的离群系数为预设值。
其中,预设值为预先设置的值,本领域技术人员可以根据实际情况进行设定,本发明实施例对此不做限定。在实际应用中,预设值可以设置为0,即初始化窗口序列中各数据的离群系数为0。
根据前例,从历史监测数据中提取窗口序列W={xt-k,…,xt-2,xt-1},则待检测数据序列为{xt,xt+1…,xt+i}。人工识别并确保初始的窗口序列中各数据为正常值,并且将各值的离群系数O均定义为0。
S3、根据窗口序列和检测阈值确定待检测数据是否为离群值。
具体包括:
S31、根据窗口序列中各数据的离群系数确定窗口序列中的正常值。进一步的,可以将所有正常值组成的集合记为判断集合。
具体为:当窗口序列中离群系数为0的数据个数大于离群系数非0的数据个数时,将所有离群系数为0的数据标记为正常值,并将所有正常值组成的集合记为判断集合;
当窗口序列中离群系数为0的数据个数小于离群系数非0的数据个数时,将所有离群系数非0的数据标记为正常值,并将所有正常值组成的集合记为判断集合。
在本发明中,根据离群系数将窗口序列W中较多一类数据标记为正常值,组成判断集合Z,
若窗口序列W中,离群系数为0的数据占多数,即正常值为多数,则标记它们;若离群系数为非0的数据占多数,则标记离群系数非0的数据为正常值。该算法仅适用于以下两种情况:(1)窗口序列数据中仅出现突变离群值时,如图5所示,突变离群值占少数,此时离群系数为0的正常值占多数;(2)窗口序列数据中仅出现阶跃离群值时,离群系数为非0的值占多数,此时标记的正常值为占多数的阶跃离群值。如图6所示的阶跃离群值,当xi+1被判定为离群值时,其后的xi+2~xi+4虽然相对于xi+1是正常值,但相对于xi+1之前的数据趋势仍然属于脱离整体趋势的少数离群值,所以即使xi+2~xi+4的离群系数非零,仍将它们标记为正常值,依据它们对xi+5进行离群值判断。
S32、根据窗口序列中的正常值和检测阈值,计算待检测数据的多个局部离群系数,并从多个局部离群系数中确定待检测数据的最终离群系数。
具体包括:
S321、获取待检测数据与窗口序列中各正常值的差值。
S322、当差值大于或等于0时,计算差值与对应的最大阈值的比值;当差值小于0时,计算差值与对应的最小阈值的比值;并将比值记为待检测数据的局部离群系数。
在本发明中,计算待检测数据xt与判断集合Z中各值的差di,di=xt-xi(xi∈Z),di的集合记为D。计算xt的多个局部离群系数ui,组成集合U,(ui∈U),局部离群系数计算公式如下:
ui=di/b1i(di∈D、b1i∈B1且di≥0);
ui=di/b2i(di∈D、b2i∈B2且di<0)。
S323、当待检测数据的局部离群系数中存在多个局部离群系数的绝对值大于1,则将距离待检测数据最近的局部离群系数作为待检测数据的最终离群系数,该离群系数的正负号,表示坝体位移的方向。示例的,正号表示坝体向下游的位移量为离群值,负号表示坝体向上游的位移量为离群值;当待检测数据的多个局部离群系数的绝对值均小于或等于1,则将待检测数据的最终离群系数赋值为预设值。该预设值可以为0。
具体的,(1)若U中存在多个|ui|>1,则将最靠近待检测数据xt局部离群系数ui作为xt的最终离群系数,即Ot=ui;
(2)若U中各值|ui|≤1,则待检测数据判定为正常数据,并定义其最终离群系数Ot=0。
S33、若待检测数据的最终离群系数为非预设值,则确定待检测数据为离群值。示例的,若待检测数据的最终离群系数非0,则确定待检测数据为离群值。
S4、当待检测数据为离群值时,获取待检测数据对应的同一时刻的相邻坝段的监测值。
重力坝建设过程中通常会将其分为多个坝段,每个坝段中间设置横缝,然后会在每个坝段同一高程设置一个变形测点,以此监测坝体变形情况。示例的,如图7所示,某坝被分为9个坝段,除了9#坝段外,在其余8个坝段顶部分别设置一个变形测点。重力坝虽然被分为多个坝段,但由于其体积大、自重大、刚性大,且所处环境、所受荷载影响均相似,所以不同坝段具有相似的变化规律,通常只是在变化幅度上稍有差异。本发明根据不同坝段具有相同变化规律特点,且认为粗差是偶然发生的个别现象,不同时发生于相邻坝段这一前提,来识别粗差。即当某个坝段某时刻的待检测数据被检测出是离群值后,再获取相邻坝段同一时刻的监测值。根据相邻坝段同一时刻的监测值,来检测待检测数据是否是粗差。
需要说明的是,若待检测数据为正常值时,则不执行步骤S4和S5,而直接执行步骤S6。
S5、根据同一时刻的相邻坝段的监测值确定待检测数据是否为粗差。
具体的,若待检测数据对应的同一时刻的相邻坝段的监测值全部为正常值,则确定待检测数据为粗差;若待检测数据对应的同一时刻的相邻坝段的监测值存在离群值,则确定待检测数据不是粗差。
在实际应用中,若待检测数据为离群值,其相邻坝段的监测值亦存在离群值,则说明该离群值不是偶然发生的粗差,而是由于其他原因引起的各坝段普遍存在的变形;若相邻坝段均为正常值,则说明该离群值只发生于这一个坝段,为偶然发生的粗差。
需要说明的是,若判断的是坝体两端的坝段,则只存在一个相邻的坝段,因而也只使用一个相邻坝段的监测值进行粗差判断即可。
S6、利用待检测数据更新窗口序列,并重复执行S3至S6。
具体包括:
S61、将待检测数据作为最新时刻数据加入窗口序列的末尾,并剔除窗口序列首端的最初时刻数据,以更新窗口序列;
S62、获取监测到的下一时刻数据作为新的待检测数据,并重复执行S3至S6。
将待检测值xt加入窗口序列W中,同时剔除窗口序列W中最初时刻的值xt-k,更新窗口序列W={xt-k+1,…,xt-1,xt},再将下一时刻数据xt+1作为新的待检测数据,重复步骤S3至S6,以实现对实时数据的持续检测。
需要说明的是,本发明实施例提供的粗差检测方法中,关于窗口序列k和检测阈值B的选择,均可采用其他方法确定,本发明实施例对此不做限定。
在本发明实施例中,重力坝变形监测数据有其自身的规律与特征,本发明适用于自身具有一定自相关性和偏自相关性的数据。以待检测数据的前k时刻的局部数据为依据,判断待检测数据是否偏离整体趋势太远,是否为离群值和粗差。该方法可根据已有的数据对最新的数据进行离群检测和粗差检测,即可满足对实时流数据的离群值检测和粗差检测,其实时性和智能性均有所提升。
本发明另一实施例提供一种混凝土坝的粗差检测方法,具体包括:
步骤100:确定窗口长度和检测阈值参数。
某电站枢纽工程由拦河坝、泄水建筑物、输水系统、地下厂房及地面开关站等建筑物组成。拦河坝为碾压混凝土重力坝,最大坝高72.4m,坝顶长206m,坝顶宽7.5m。水库总库容为4700万m3。拦河坝分为9个坝段,坝顶位移监测布置有引张线,测点编号分别为EX1~EX8,引张线左、右两个端点外侧各设一条垂线,以校测引张线端点位移。本实施例选取5#坝段的EX4测点数据进行分析。该测点位于河床中部坝顶处,其变化幅度和规律均具有一定代表性,可以体现混凝土重力坝坝顶水平位移的一般规律。EX4测点的监测数据为每日一次测值,共有2016年6月2日~2018年10月22日的869个数据,如图2所示,设这869个数据表示为{x1,x2,…,xi,…,x720,x721,…,x869},其中720个数据作为训练数据,即历史监测数据,表示为{x1,x2,…,xi,…,x720},其后的149个数据作为测试数据,即待检测数据,表示为{x721,x722,…,xi,…,x869}。
对720个历史监测数据采用自相关和偏自相关分析,求得该数据序列的显著相性K为3阶,即窗口长度k=2*3+1=7。然后,对720个历史数据进行差分计算,得到7组差分序列Δ1EX4~Δ7EX4,再对每组差分序列采用小概率法进行计算,求得各组差分序列的检测阈值(即最大阈值μ+3σ和最小阈值μ-3σ),结果见下表1。
表1Δ1EX4~Δ7EX4序列的3σ计算结果
本实施例还可采用最值法计算每组差分序列的最大值和最小值作为阈值进行离群值检验。基于最值法的阈值结果见表2。
表2Δ1EX4~Δ7EX4序列的最值结果
步骤200:提取窗口序列并初始化离群系数。
由于窗口序列已求得为7,则初始的窗口序列W为{x714,x715,x716,x717,x718,x719,x720}。人工识别并确保窗口序列中各数据为正常值,窗口序列W={x714,x715,x716,x717,x718,x719,x720}中各值的离群系数O均为0。
步骤300:标记正常数据。
根据离群系数将窗口序列W中较多一类数据标记为正常数据,组成判断集合Z。窗口序列中的各值均为正常值,即标记{x714,x715,x716,x717,x718,x719,x720}中的所有值为正常值。
步骤400:计算局部离群系数。
(1)计算待检测值x721与Z中各值的差di,di=xt-xi(xi∈Z),di的集合记为D。
(2)计算x721的多个局部离群系数ui,组成集合U,(ui∈U),局部离群系数计算公式如下:
ui=di/b1i(di∈D、b1i∈B1且di≥0);
ui=di/b2i(di∈D、b2i∈B2且di<0)。
步骤500:确定最终离群系数和离群值。
(1)若U中存在多个|ui|>1,则选取距离待检测数据xt最近的局部离群系数ui作为xt的最终离群系数,即Ot=ui;并确定待检测数据xt为离群值。
(2)若U中各值|ui|≤1,则待检测数据xt判定为正常数据,并定义其最终离群系数Ot=0。
步骤600:确定粗差。
当待检测数据xt为离群值时,获取xt对应的同一时刻(即t时刻)的相邻坝段的监测值;若相邻坝段的监测值存在离群值,则说明该离群值不是偶然发生的粗差,而是由于其他原因引起的各坝段普遍存在的变形;若相邻坝段的监测值均为正常值,则说明该离群值只发生于这一个坝段,为偶然发生的粗差,即确定待检测数据xt为粗差。
步骤700:更新窗口序列。
将下一时刻的待检测值x721加入窗口序列W中,同时剔除窗口序列W中最初时刻的值x714,更新窗口序列W={x715,x716,x717,x718,x719,x720,x721},再将下一时刻数据x722作为待检测数据,重复步骤300~步骤700,实现数据的持续检测。
对149个待检测数据的离群值检测结果见图3、图4及表3。
表3检测出的离群值情况
由表3可知,突变离群值为2018年6月7日的2.0、2018年6月20日的1.5和2018年8月29日的6.0,阶跃离群值从2018年9月12日的2.2536开始发生阶跃突变,其他离群值则是被检测出的原始数据中的离群值。离群系数表示待检测值与其前k个数据之间的差值,再与相应阈值的比,如34号数据,该数据滞后2阶差分序列的历史最小值(前730个数据中的最小值)为-0.9674,而在测试数据中滞后2阶的差分值为-1.0940,它的绝对值大于-0.9674的绝对值,即变化量超过了历史最值,它们的比值为1.1307,即异常系数为-1.1307,其中负号表示大坝向上游方向位移。从2018年9月12日开始产生阶跃离群值,在其后的3个数据也被判定为离群值,这是该算法的一项原则,即当发生阶跃离群值时,其后边的3个数据虽然是看似满足正常规律,但相对于之前数据的总体规律,仍然为少数的离群值,而该算法设定的判别范围是大于窗口序列数据一半的长度,即大于7/2。所以,阶跃值及其后边共4个值,将会被判定为离群值,再往后则会判定为正常值。
本发明通过根据不同坝段具有相同变化规律特点,且认为粗差是偶然发生的个别现象,不同时发生于相邻坝段这一前提,来识别粗差。即当某个坝段某时刻值被检测出是离群值后,再判断相邻坝段数据是否为离群值,以此来判断该坝段某时刻值是否为粗差。该方法不依赖于专家水平,检测结果稳定,且效率较高,能够准确快速的检测出粗差,可以很好地适应工程需求。
本发明针对重力坝变形监测数据的规律与特点,依据自相关与偏自相关分析,挖掘出数据序列中前后值相关性较大的数据,以显著相关的数据对待检测值进行判断,提高了离群值检测的可靠度;该方法不仅可对单个离群值进行检验,而且还可以对阶跃离群情况进行检验,因而具有更高的适应性;同时,以窗口数据对下一时刻的待检测值进行计算,数据量小,大大提高了计算效率,还可实现对流数据的实时检测,提高了检测方法的智能化水平。此外,本发明结合常规的统计概率法、极值法和专家经验法,拟定变形监测数据的检测阈值,且可根据不同方法对检测阈值进行调整,使得检测阈值设定具有更高的灵活性;以不同时刻数据之间差分值与相应阈值的比值大小定义离群系数,其离群系数物理意义明确,便于理解离群值的离群程度。该方法能准确快速的检测出单个测点监测数据中的离群值,在此基础上,考虑重力坝分为不同坝段这一结构特征,根据相邻坝段变化一致性原则,可对离群值再次进行判断是否为粗差。
以上所述,仅是本申请的几个实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。
Claims (7)
1.一种坝体监测数据中粗差的检测方法,其特征在于,所述方法包括:
S1、获取坝体中不同坝段的历史监测数据和待检测数据,并根据所述历史监测数据确定窗口长度和检测阈值;其中,所述检测阈值包括最大阈值和最小阈值;所述S1具体包括:S11、获取坝体中不同坝段的历史监测数据和待检测数据,并计算所述历史监测数据的显著相关性结果;S12、根据所述显著相关性结果确定窗口长度;S13、对所述历史监测数据进行滞后i阶的差分计算,得到k组滞后序列,并确定每组滞后序列的最大阈值和最小阈值;其中,i=1,2,…,k;k为窗口长度;
S2、根据所述窗口长度和所述待检测数据从所述历史监测数据中提取出窗口序列;
S3、根据所述窗口序列和所述检测阈值确定所述待检测数据是否为离群值;所述S3具体包括:S31、根据所述窗口序列中各数据的离群系数确定所述窗口序列中的正常值;S32、根据所述窗口序列中的正常值和所述检测阈值,计算所述待检测数据的多个局部离群系数,并从多个所述局部离群系数中确定所述待检测数据的最终离群系数;S33、若所述待检测数据的最终离群系数为非预设值,则确定所述待检测数据为离群值;
S4、当所述待检测数据为离群值时,获取所述待检测数据对应的同一时刻的相邻坝段的监测值;
S5、根据所述同一时刻的相邻坝段的监测值确定所述待检测数据是否为粗差;
S6、利用所述待检测数据更新所述窗口序列,并重复执行S3至S6。
2.根据权利要求1所述的方法,其特征在于,所述S5具体为:
若所述待检测数据对应的同一时刻的相邻坝段的监测值全部为正常值,则确定所述待检测数据为粗差。
3.根据权利要求1所述的方法,其特征在于,所述S2具体包括:
S21、从所述历史监测数据中提取出所述待检测数据的前k个数据作为窗口序列;其中,所述k为窗口长度;
S22、初始化所述窗口序列中各数据的离群系数为预设值。
4.根据权利要求3所述的方法,其特征在于,所述S31具体为:
当所述窗口序列中离群系数为预设值的数据个数大于离群系数为非预设值的数据个数时,将所有离群系数为预设值的数据标记为正常值;
当所述窗口序列中离群系数为预设值的数据个数小于离群系数为非预设值的数据个数时,将所有离群系数为非预设值的数据标记为正常值。
5.根据权利要求4所述的方法,其特征在于,所述S32具体包括:
S321、获取所述待检测数据与所述窗口序列中各正常值的差值;
S322、当所述差值大于或等于0时,计算所述差值与对应的最大阈值的比值;当所述差值小于0时,计算所述差值与对应的最小阈值的比值;并将所述比值记为所述待检测数据的局部离群系数;
S323、当所述待检测数据的局部离群系数中存在多个局部离群系数的绝对值大于1,则将距离所述待检测数据最近的局部离群系数作为所述待检测数据的最终离群系数;当所述待检测数据的多个局部离群系数的绝对值均小于或等于1,则将所述待检测数据的最终离群系数赋值为所述预设值。
6.根据权利要求5所述的方法,其特征在于,所述S6具体为:
S61、将所述待检测数据作为最新时刻数据加入所述窗口序列的末尾,并剔除所述窗口序列首端的最初时刻数据,以更新所述窗口序列;
S62、获取监测到的下一时刻数据作为新的待检测数据,并重复执行S3至S6。
7.根据权利要求1所述的方法,其特征在于,所述S12具体为:
根据第一公式计算窗口长度;
所述第一公式为:k=2K+1;
其中,k为窗口长度,K为所述历史监测数据的显著相关性结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210911903.XA CN115164820B (zh) | 2022-07-29 | 2022-07-29 | 一种坝体监测数据中粗差的检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210911903.XA CN115164820B (zh) | 2022-07-29 | 2022-07-29 | 一种坝体监测数据中粗差的检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115164820A CN115164820A (zh) | 2022-10-11 |
CN115164820B true CN115164820B (zh) | 2024-08-09 |
Family
ID=83477901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210911903.XA Active CN115164820B (zh) | 2022-07-29 | 2022-07-29 | 一种坝体监测数据中粗差的检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115164820B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570259A (zh) * | 2016-11-03 | 2017-04-19 | 国网电力科学研究院 | 一种大坝位移数据的粗差剔除方法 |
CN108319664A (zh) * | 2018-01-17 | 2018-07-24 | 国电南瑞科技股份有限公司 | 一种大坝及工程安全监测数据粗差识别方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101208595B1 (ko) * | 2011-02-28 | 2012-12-06 | 경희대학교 산학협력단 | 라그랑주 승수법을 이용한 그로스 에러 감지 방법 및 시스템, 및 그로스 에러 감지 시스템을 이용한 데이터 보정 방법 |
CN106022966A (zh) * | 2016-05-31 | 2016-10-12 | 中国电建集团昆明勘测设计研究院有限公司 | 一种基于增量判别的水电工程安全监测数据粗差处理方法 |
CN111222095B (zh) * | 2019-12-19 | 2023-06-16 | 国网电力科学研究院有限公司 | 一种大坝变形监测中的粗差判别方法、装置及系统 |
CN111709465B (zh) * | 2020-06-04 | 2022-12-20 | 中国电建集团华东勘测设计研究院有限公司 | 大坝安全监测数据粗差智能识别方法 |
CN114492168B (zh) * | 2021-12-28 | 2024-05-10 | 大唐水电科学技术研究院有限公司 | 一种动系统下大坝安全监测数据粗差识别方法 |
-
2022
- 2022-07-29 CN CN202210911903.XA patent/CN115164820B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570259A (zh) * | 2016-11-03 | 2017-04-19 | 国网电力科学研究院 | 一种大坝位移数据的粗差剔除方法 |
CN108319664A (zh) * | 2018-01-17 | 2018-07-24 | 国电南瑞科技股份有限公司 | 一种大坝及工程安全监测数据粗差识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115164820A (zh) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241627B (zh) | 概率分级的动态支护方法及自动设计支护方案的装置 | |
CN112348237B (zh) | 一种动态钻井数据异常趋势检测方法 | |
CN115689393A (zh) | 一种基于物联网的电力系统实时动态监测系统及方法 | |
CN112085921A (zh) | 一种基于位移与动力多参数的滑坡综合监测预警方法 | |
CN112966856A (zh) | 一种山洪风险预测方法及预测系统 | |
CN109829561B (zh) | 基于平滑处理与网络模型机器学习的事故预测方法 | |
CN113670616B (zh) | 一种轴承性能退化状态检测方法及系统 | |
CN112330187A (zh) | 一种地下设施水灾风险评估方法、系统、终端及存储介质 | |
CN114116689A (zh) | 一种基于建筑结构安全监测的大数据清洗方法 | |
CN115638833A (zh) | 一种监控数据处理方法及系统 | |
CN116579615A (zh) | 一种基于无人机遥感的植被覆盖监测系统 | |
CN118114071B (zh) | 一种切除地下锚索的钻头钻进状态监测系统 | |
CN112504357A (zh) | 一种河道过流能力动态分析方法和系统 | |
CN114236332A (zh) | 一种电力电缆绝缘状态判断方法及系统 | |
CN117171702A (zh) | 一种基于深度学习的多模态电网故障检测方法和系统 | |
CN115164820B (zh) | 一种坝体监测数据中粗差的检测方法 | |
CN113505997B (zh) | 一种基于机器学习的建筑墙面渗漏水风险等级评估方法 | |
CN112329868A (zh) | 基于clara聚类的制造加工设备群能效状态评价方法 | |
CN117060379A (zh) | 一种基于爬坡特征的深远海风电功率短期预测方法及系统 | |
CN115019476B (zh) | 一种基于多源信息融合的滑坡时空信息监测预警方法 | |
CN117172983A (zh) | 一种基于遥感技术的植被生态水储量监测系统 | |
CN110780342A (zh) | 一种岩石边坡变形预警方法 | |
CN110455399A (zh) | 用分布式光纤对建筑结构振动进行全局预警的方法 | |
CN112836990B (zh) | 隧道监测设备故障判断方法、装置及电子设备 | |
CN112445856A (zh) | 一种海面高度影响关联分析方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |