CN101968758B - 多数据点阈值检测方法 - Google Patents

多数据点阈值检测方法 Download PDF

Info

Publication number
CN101968758B
CN101968758B CN201010527612A CN201010527612A CN101968758B CN 101968758 B CN101968758 B CN 101968758B CN 201010527612 A CN201010527612 A CN 201010527612A CN 201010527612 A CN201010527612 A CN 201010527612A CN 101968758 B CN101968758 B CN 101968758B
Authority
CN
China
Prior art keywords
period
value
interval
data
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010527612A
Other languages
English (en)
Other versions
CN101968758A (zh
Inventor
刘文洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong Xiaoxing Transformer Co ltd
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201010527612A priority Critical patent/CN101968758B/zh
Publication of CN101968758A publication Critical patent/CN101968758A/zh
Application granted granted Critical
Publication of CN101968758B publication Critical patent/CN101968758B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种多数据点阈值检测方法,用于解决现有的自律计算系统性能分析方法决策效率低的技术问题。技术方案是通过划分性能数据的统计区间,对设备的性能指标在一个统计区间内,进行连续的阈值检测,当整个时间段内的多次检测值均超过边界值时,才认为性能故障发生,从而避免了无效决策所导致的系统开销,提高了自律系统的决策效率。与背景技术的单点判断相比,系统无效操作减少了75%。

Description

多数据点阈值检测方法
技术领域
本发明涉及一种阈值检测方法,特别是一种多数据点阈值检测方法。
背景技术
文献“LitoiuMarin.A Performance Analysis Methodfor Autonomic ComputingSystems[J].ACM Transactions on Autonomous and Adaptive Systems,v 2,n 1,March 1,2007”公开了一种自律计算系统的性能分析方法。该方法利用性能评估以及线性和非线性的编程模型,通过观察工作负载的负载度来计算分布式系统性能矩阵的边界值。系统采用队列网络模型建模(QNM),模型数据能够实时的采集和过滤。自律管理器通过性能边界值,可以调节会话的数量,计算可用节点数。该方法解决了性能故障边界值的计算问题,但是,该方法采用单点检测,即性能故障发生一次就调节会话数量,在故障偶然发生立刻恢复的情况下,自律系统进行了无效决策和操作,导致自律系统的决策效率较低。
发明内容
为了克服现有的自律计算系统性能分析方法决策效率低的不足,本发明提供一种多数据点阈值检测方法。该方法通过划分性能数据的统计区间,对设备的性能指标在一个统计区间内,进行连续的阈值检测,当整个时间段内的多次检测值均超过边界值时,才认为性能故障发生,从而可以避免无效决策所导致的系统开销,提高自律系统的决策效率。
本发明解决其技术问题所采用的技术方案:一种多数据点阈值检测方法,其特点是包括以下步骤:
(a)定义阈值上限边界值Tuppererror和下限边界值Tlowererror,且:Tuppererror>Tlowererror;性能计数器所记录的值value满足如下关系:{value>Tuppererror}∨{value<Tlowererror}则认为性能计数器发生性能异常,value处于阈值区间;
(b)设性能指标的初始统计时刻为T1,结束统计时刻为T2,插值间隔为Tn,则在区间[T1,T2]内,需要统计的区间个数定义为:
N period = T 2 - T 1 T n
对于任意的性能计数器,假设每t时刻(t∈[T1,T2])统计一个原始数据,共统计了N个时刻,这N个时刻的数据被划分在NPeriod个区间内;
(c)设计统计量,采用统计量最大值,最小值,平均值或标准偏差来统计性能数据,其中将单个统计区间内的值按照统计量计算后即可得到一个采样数据点,①采用最大值统计性能数据:
MAXi=Max(Xt…Xt+period)
式中,i属于[1,NPeriod],t是i区间的起始时刻,t+period表示一个统计区间,MAX是求最大值的函数;则在整个[T1,T2]区间内,按照最大值统计量,性能数据构成由最大值组成的集合:
集合 MAX
= { MAX 1 , MAX 2 , . . . MAX N Period }
= { MAX ( X T 1 , . . . T 1 + Period ) , MAX ( X T 1 + Period , . . . T 1 + 2 Period ) , . . . , MAX ( X T 1 + ( N - 1 ) * Period , . . . T 1 + N * Period ) }
②采用最小值统计性能数据:
按照相同的时刻和插值条件,同等的定义基于最小值的统计量集合:
集合 MIN
= { MIN 1 , MIN 2 , . . . MIN N Period }
= { MIN ( X T 1 , . . . T 1 + Period ) , MIN ( X T 1 + Period , . . . T 1 + 2 Period ) , . . . , MIN ( X T 1 + ( N - 1 ) * Period , . . . T 1 + N * Period ) }
③采用平均值统计性能数据:
时刻和插值条件不变,在单个统计区间内采用平均值函数,得到统计集合:
集合 AVERAGE
= { AVG 1 , AVG 2 , . . . AVG N Period }
= { AVG ( X T 1 , . . . T 1 + Period ) , AVG ( X T 1 + Period , . . . T 1 + 2 Period ) , . . . , AVG ( X T 1 + ( N - 1 ) * Period , . . . T 1 + N * Period ) }
其中,假设单个统计区间内有k个性能数据,则该区间的平均值函数定义为:
AVG = Σ i = 1 k X i k
④采用标准偏差统计性能数据:
假设SD为统计函数,得到统计集合SD:
统计集合 SD
= { SD 1 , SD 2 , . . . SD N Period }
= { SD ( X T 1 , . . . T 1 + Period ) , SD ( X T 1 + Period , . . . T 1 + 2 Period ) , . . . , SD ( X T 1 + ( N - 1 ) * Period , . . . T 1 + N * Period ) }
假设单个统计区间内有k个性能数据,则该区间的标准偏差函数定义为:
SD = K Σ i = 1 K X i 2 - ( Σ i = 1 K X i ) 2 K ( K - 1 )
(d)采用多点检测方法判断阈值是否越界;用计数器记录在整个[T1,T2]区间内阈值越界的次数,初始值为0;假设采样数据点为N个,当发现第一个数据点超过阈值后,计数器加1,继续判断随后的N-1个数据点是否越界,如果越界数据点超过P个(P>1并且P<=N),则认为性能故障发生,从而通知自律系统,自律系统采用策略来修复性能故障;当越界数据个数不足P时,不作任何通知,继续判断后续数据点;当判断个数等于N时,如果无性能故障发生,则计数器清零,重新开始下一组数据点计数。
本发明的有益效果是:由于通过划分性能数据的统计区间,对设备的性能指标在一个统计区间内,进行连续的阈值检测,当整个时间段内的多次检测值均超过边界值时,才认为性能故障发生,从而避免了无效决策所导致的系统开销,提高了自律系统的决策效率。与背景技术的单点判断相比,系统无效操作减少了75%。
下面结合具体实施方式对本发明作详细说明。
具体实施方式
A、定义阈值区间。阈值具有上限边界值Tupererror和下限边界值Tlowererror,且:Tuppererror>Tlowererror。假设性能计数器为P,其值value满足如下关系:{Value>Tuppererror}∨{Value<Tlowererror}则认为性能计数器P发生性能异常,value处于阈值区间。
定义CPU使用率的上限为90%,下限为5%,及CPU负荷超过90%,则认为该设备负荷过大,需要其他设备来分担工作,当CPU使用率低于5%时,则认为该设备空闲,需要承担一些其他设备的工作,这两种情况发生时都需要向自律系统通知。因此,阈值区间为[5,90]。
B、划分时间周期。设性能指标的初始统计时刻为T1,结束统计时刻为T2,插值间隔为Tn,则在区间[T1,T2]内,需要统计的区间个数定义为:
N period = T 2 - T 1 T n
对于任意的性能计数器Pi,假设每t时刻(t∈[T1,T2])统计一个原始数据,共统计了N个时刻,这N个时刻的数据被划分在NPeriod个区间内。
如统计开始时间为9:00,结束时间为10:00,插值间隔为10分钟,则统计区间=60/10=6。时间区间为[9:00,9:10],[9:10,9:20],[9:20,9:30],[9:30,9:40],[9:40,9:50],[9:50,10:00]。
C、设计统计量。在一个固定的时间区间内,除了采用原始采样点判断阈值是否越界外,还采用最大值,最小值,平均值,标准偏差等统计量来统计性能数据,优点是将一个统计区间内的值按照统计量计算后得到一个数据点,之后再利用多数据点检测方法进行检测,进一步减少通报次数,避免无效操作。其中:
●基于最大值的统计。
MAXi=Max(Xt…Xt+period)
式中,i属于[1,NPeriod],t是i区间的起始时刻,t+period表示一个统计区间,MAX是求最大值的函数。则在整个[T1,T2]区间内,按照最大值统计量,性能数据构成由最大值组成的集合:
集合 MAX
= { MAX 1 , MAX 2 , . . . MAX N Period }
= { MAX ( X T 1 , . . . T 1 + Period ) , MAX ( X T 1 + Period , . . . T 1 + 2 Period ) , . . . , MAX ( X T 1 + ( N - 1 ) * Period , . . . T 1 + N * Period ) }
●基于最小值的统计。
按照相同的时刻和插值条件,同等的定义基于最小值的统计量集合:
集合 MIN
= { MIN 1 , MIN 2 , . . . MIN N Period }
= { MIN ( X T 1 , . . . T 1 + Period ) , MIN ( X T 1 + Period , . . . T 1 + 2 Period ) , . . . , MIN ( X T 1 + ( N - 1 ) * Period , . . . T 1 + N * Period ) }
●基于平均值的统计。
时刻和插值条件不变,在单个统计区间内采用平均值函数,得到统计集合:
集合 AVERAGE
= { AVG 1 , AVG 2 , . . . AVG N Period }
= { AVG ( X T 1 , . . . T 1 + Period ) , AVG ( X T 1 + Period , . . . T 1 + 2 Period ) , . . . , AVG ( X T 1 + ( N - 1 ) * Period , . . . T 1 + N * Period ) }
其中,假设一个区间内有k个性能数据,则该区间的平均值函数定义为:
AVG = Σ i = 1 k X i k
●基于标准偏差的统计。
最大值,最小值和平均值反映了性能数据的真实走势,但在在实际应用中,还需要了解某个时间段内的性能数据偏离平均值的程度,这就需要用标准偏差来统计,现有的统计工具中缺少对该部分的定义。依据前面的条件,假设SD为统计函数,得到统计集合SD:
统计集合 SD
= { SD 1 , SD 2 , . . . SD N Period }
= { SD ( X T 1 , . . . T 1 + Period ) , SD ( X T 1 + Period , . . . T 1 + 2 Period ) , . . . , SD ( X T 1 + ( N - 1 ) * Period , . . . T 1 + N * Period ) }
假设一个区间内有k个性能数据,则该区间的标准偏差函数定义为:
SD = K Σ i = 1 K X i 2 - ( Σ i = 1 K X i ) 2 K ( K - 1 )
假设使用最大值作为统计量,在上述6个时间区间内,分别根据公式计算出区间内的最大值为{85,90,80,95,98,95}。
D、采用多点检测方法判断阈值是否越界。用计数器记录在一个采样区间内阈值越界的次数,初始值为0。假设采样数据点为N个,当发现第一个数据点超过阈值后,计数器加1,继续判断随后的N-1个数据点是否越界,如果越界数据点超过P个(P>1并且P<=N),则认为性能故障发生,从而通知自律系统,自律系统采用策略来修复性能故障。当越界数据个数不足P时,不作任何通知,继续判断后续数据点。当判断个数等于N时,如果无性能故障发生,则计数器清零,重新开始下一组数据点计数。
假设6个数据点中只要有3个超过阈值就通知自律系统。首先阈值计数器P=0。
Step1:85<90,P=0;
Step2:90=90,P=1;
Step3:80<90,P=1;
Step4:95>90,P=2;
Step5:98>90,P=3;
Step6:95>90,P=4;
由于(P=4)>3,所以认为该设备发生性能故障,需要向自律系统通知一次。
以上实施例可以看出,减少了管理设备在发生性能故障时的无效通知次数,提高了自律计算系统的决策效率,避免了执行无效策略所产生的系统开销。
下面通过表1说明本发明的效果:
表1是针对ESX2.5服务器,对CPU利用率按照每分钟1次,采集了10个数据点作为一个采样区间,并利用多数据点阈值检测方法进行了判断,得到了实际通报给自律计算系统的阈值个数。
假设阈值上限是26,按照背景技术单点检测方法,则采样点2,5,6,7均超过阈值,通报次数为4,自律管理器AM在10分钟内将收到4次来自同一台服务器的性能故障通报,并采取策略来修复故障,导致同样的策略执行四次,而第一个策略执行完毕后,可能服务器性能值已经恢复正常,因此其他策略执行属于无效操作,从而加大了系统开销。
按照多数据点阈值检测方法,假设阈值上限相同,连续3个采样点越界才通报,则2属于偶然越界值,不通报,只有在5,6,7这3个数据点判断完毕后才认为性能故障发生,向自律系统通报一次,策略执行一次。与背景技术的单点判断相比,系统无效操作减少了75%。
表1ESX2.5服务器的CPU利用率%
  个数   采样值
  1   23.92613
  2   41.15160
  3   25.37086
  4   22.78824
  5   26.58733
  6   27.66686
  7   26.18363
  8   23.53114
  9   23.80006
  10   23.17188

Claims (1)

1.一种多数据点阈值检测方法,其特征在于包括以下步骤:
(a)定义阈值上限边界值Tuppererror和下限边界值Tlowererror,且:Tuppererror>Tlowererror;性能计数器所记录的值value满足如下关系:{value>Tuppererror}∨{value<Tlowererror}则认为性能计数器发生性能异常,value处于阈值区间;
(b)设性能指标的初始统计时刻为T1,结束统计时刻为T2,插值间隔为Tn,则在区间[T1,T2]内,需要统计的区间个数定义为:
N period = T 2 - T 1 T n
对于任意的性能计数器,假设每t时刻,t∈[T1,T2],统计一个原始数据,共统计了N个时刻,这N个时刻的数据被划分在NPeriod个区间内;
(c)设计统计量,采用统计量最大值,最小值,平均值或标准偏差来统计性能数据,其中将单个统计区间内的值按照统计量计算后即可得到一个采样数据点,①采用最大值统计性能数据:
MAXi=Max(Xt…Xt+period)
式中,i属于[1,NPeriod],t是i区间的起始时刻,t+period表示一个统计区间,MAX是求最大值的函数;则在整个[T1,T2]区间内,按照最大值统计量,性能数据构成由最大值组成的集合:
集合 MAX
= { MAX 1 , MAX 2 , . . . MAX N period }
= { MAX ( X T 1 . . . X T 1 + period ) , MAX ( X T 1 + period . . . X T 1 + 2 period ) , . . . , MAX ( X T 1 + ( N - 1 ) * period . . . X T 1 + N * period ) }
②采用最小值统计性能数据:
按照相同的时刻和插值条件,同等的定义基于最小值的统计量集合:
集合 MIN
= { MIN 1 , MIN 2 , . . . MIN N period }
= { MIN ( X T 1 . . . X T 1 + period ) , MIN ( X T 1 + period . . . X T 1 + 2 period ) , . . . , MIN ( X T 1 + ( N - 1 ) * period . . . X T 1 + N * period ) }
③采用平均值统计性能数据:
时刻和插值条件不变,在单个统计区间内采用平均值函数,得到统计集合:
集合 AVERAGE
= { AVG 1 , AVG 2 , . . . AVG N period }
= { AVG ( X T 1 . . . X T 1 + period ) , AVG ( X T 1 + period . . . X T 1 + 2 period ) , . . . , AVG ( X T 1 + ( N - 1 ) * period . . . X T 1 + N * period ) } 其中,假设单个统计区间内有k个性能数据,则该区间的平均值函数定义为:
AVG = Σ i = 1 k X i k
④采用标准偏差统计性能数据:
假设SD为统计函数,得到统计集合SD:
统计集合
Figure FSB00000856851800023
= { SD 1 , SD 2 , . . . SD N period }
= { SD ( X T 1 . . . X T 1 + period ) , SD ( X T 1 + period . . . X T 1 + 2 period ) , . . . , SD ( X T 1 + ( N - 1 ) * period . . . X T 1 + N * period ) }
假设单个统计区间内有k个性能数据,则该区间的标准偏差函数定义为:
SD = K Σ i = 1 K X i 2 - ( Σ i = 1 K X i ) 2 K ( K - 1 )
(d)采用多点检测方法判断阈值是否越界;用计数器记录在整个[T1,T2]区间内阈值越界的次数,初始值为0;假设从自律系统中获取的采样数据点为N个,当发现第一个数据点超过阈值后,计数器加1,继续判断随后的N-1个数据点是否越界,如果越界数据点超过P个,P>1并且P<=N,则认为性能故障发生,从而通知自律系统,自律系统采用策略来修复性能故障;当越界数据个数不足P时,不作任何通知,继续判断后续数据点;当判断个数等于N时,如果无性能故障发生,则计数器清零,重新开始下一组数据点计数。
CN201010527612A 2010-10-28 2010-10-28 多数据点阈值检测方法 Expired - Fee Related CN101968758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010527612A CN101968758B (zh) 2010-10-28 2010-10-28 多数据点阈值检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010527612A CN101968758B (zh) 2010-10-28 2010-10-28 多数据点阈值检测方法

Publications (2)

Publication Number Publication Date
CN101968758A CN101968758A (zh) 2011-02-09
CN101968758B true CN101968758B (zh) 2012-10-10

Family

ID=43547917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010527612A Expired - Fee Related CN101968758B (zh) 2010-10-28 2010-10-28 多数据点阈值检测方法

Country Status (1)

Country Link
CN (1) CN101968758B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103029585B (zh) * 2012-12-24 2015-12-02 安科智慧城市技术(中国)有限公司 一种车载酒精检测系统、方法及汽车
CN104376232B (zh) * 2014-12-11 2017-06-30 中煤科工集团重庆研究院有限公司 非接触式顶底板及巷帮移近量测量数据粗大误差判别方法
US10634379B2 (en) * 2017-09-28 2020-04-28 Honeywell International Inc. Actuators with condition tracking
CN109879128B (zh) * 2017-12-06 2021-08-03 上海三菱电梯有限公司 电梯故障诊断方法
CN110008245B (zh) * 2019-04-08 2024-01-23 西安热工研究院有限公司 一个适用于设备故障预警模型时间段查找的方法
CN111546793B (zh) * 2020-05-25 2022-05-13 珠海趣印科技有限公司 一种打印机检纸阈值的处理方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003278862A1 (en) * 2002-06-25 2004-01-06 International Business Machines Corporation Method and system for monitoring performance of application in a distributed environment

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Marin L.A et al.A Performance Analysis Method for Autonomic Computing Systems.《ACM Transactions on Autonomous and Adaptive Systems》.2007,1-27. *
刘文洁等.基于自律计算的多数据点阈值检测方法.《计算机科学》.2011,第38卷(第5期),132-134,168. *
曹敏等.基于自适应阈值的网络流量异常检测算法.《计算机工程》.2009,第35卷(第19期),164-166,177. *

Also Published As

Publication number Publication date
CN101968758A (zh) 2011-02-09

Similar Documents

Publication Publication Date Title
CN101968758B (zh) 多数据点阈值检测方法
Stock et al. Indicators for dating business cycles: Cross-history selection and comparisons
CN103400209B (zh) 配电网检修实施方案优化方法
CN103278771B (zh) 工业现场三相异步电机异常状态的辨识方法
CN106291252A (zh) 一种10kV线损及低压台区线损管理分析方法
CN103177186B (zh) 一种电气回路故障概率预测方法
CN104779608B (zh) 基于离线策略的电力系统安全稳定在线附加紧急控制方法
CN103729804A (zh) 一种应对电能质量预警的在线决策支持方法
CN105137177A (zh) 一种用于配电网单点监测的谐波电压责任计算告警方法
CN105096060A (zh) 一种基于电能服务管理平台的企业开工率获取方法
CN103310307B (zh) 基于概率风险评估的电力系统规划方案灵活性评估方法
CN106780125B (zh) 一种基于月均用电量的采集异常紧急程度计算方法
CN111598380B (zh) 一种配电线路负损原因判别方法
WO2021098350A1 (zh) 一种电力需求侧管理方法及其存储介质
CN117557003A (zh) 一种基于电能碳模型的行业碳排放监测方法
CN106682817B (zh) 一种采集异常紧急程度的判定方法
CN106067095B (zh) 一种线损率的异常数据的识别方法
CN109443395B (zh) 一种用能强度多点计量差值超过限值判断方法及系统
CN104143160A (zh) 一种基于计算机实现的评测电网调度能力的方法
CN103700034A (zh) 一种基于边际成本理论的配电网网架规划方法
CN113297194B (zh) 一种电动汽车聚合商备用容量虚假数据识别与清洗的方法
CN109066664A (zh) 一种基于110kV变电站全停风险闭环管控的量化评估方法
CN102347635A (zh) 一种供电可靠性精细化监控系统
CN117391357B (zh) 一种基于大数据的电网调度运行管理的调度自查系统
CN103093116B (zh) 一种电网供需风险评估方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NORTHWESTERN POLYTECHNICAL UNIVERSITY

Effective date: 20140814

Owner name: NANTONG HYOSUNG TRANSFORMER CO., LTD.

Free format text: FORMER OWNER: NORTHWESTERN POLYTECHNICAL UNIVERSITY

Effective date: 20140814

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 710072 XI'AN, SHAANXI PROVINCE TO: 226600 NANTONG, JIANGSU PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20140814

Address after: No. 88 Haian Avenue Hyosung Haian County Development Zone 226600 Jiangsu city of Nantong Province

Patentee after: NANTONG XIAOXING TRANSFORMER Co.,Ltd.

Patentee after: Northwestern Polytechnical University

Address before: 710072 Xi'an friendship West Road, Shaanxi, No. 127

Patentee before: Northwestern Polytechnical University

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121010