CN104536868A - 一种it系统运行指标动态阈值分析方法 - Google Patents

一种it系统运行指标动态阈值分析方法 Download PDF

Info

Publication number
CN104536868A
CN104536868A CN201410697138.1A CN201410697138A CN104536868A CN 104536868 A CN104536868 A CN 104536868A CN 201410697138 A CN201410697138 A CN 201410697138A CN 104536868 A CN104536868 A CN 104536868A
Authority
CN
China
Prior art keywords
index
value
dynamic threshold
normal
baseline
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410697138.1A
Other languages
English (en)
Inventor
蒋君伟
刘东海
张宜凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BROADA TECHNOLOGY Co Ltd
Original Assignee
BEIJING BROADA TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BROADA TECHNOLOGY Co Ltd filed Critical BEIJING BROADA TECHNOLOGY Co Ltd
Priority to CN201410697138.1A priority Critical patent/CN104536868A/zh
Publication of CN104536868A publication Critical patent/CN104536868A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种IT系统运行指标动态阈值分析方法,步骤如下:1、查询运行指标历史变化情况;2、基于正态分布的原理计算当前时间粒度下的指标正常值区间R,其上限标记为RU,下限标记为RD;3、将各时间粒度的RU连接作为动态阈值上基线,RD连接作为动态阈值下基线;4、判断当前时间粒度下新采集到的运行指标,如>RU则为值过高异常,如<RD则为值过低异常。本发明的有益效果为:解决静态阈值存在的不足,通过智能学习运行指标的历史运行规律,计算不同时间点运行指标正常取值范围,生成动态阈值基线,以用于运行指标的监测分析。本发明有益的效果:本发明无需大量人为操作,计算量小,且分析准确,因此可大量减少运维人力成本,提高监测覆盖面与准确率。

Description

一种IT系统运行指标动态阈值分析方法
技术领域
本发明涉及IT运维领域,主要是一种IT系统运行指标动态阈值分析方法。
背景技术
IT系统运行状态监测是现代信息化建设发展中不可或缺的组成部份,它为运维人员提供7x24小时的IT系统运行状态信息,实时监测存在故障的点提供及时准确的预警,对于降低IT系统运维成本,实现其长期稳定运行有极大的帮助。
IT系统运行状态往往反映于其各类软硬件运行指标上,包含底层的网络流量到高层的业务交易量。对这些运行指标进行收集后,需要进行进一步的分析,以判断IT系统的运行健康状态。
传统运行指标分析技术往往使用人为建立若干静态阈值来进行监测分析,其存在人为经验误差。并且一个大规模的IT系统包含的各类软硬件指标可多达数万个,因此使用静态规则人为为这些指标配置合理的静态规则更不可能。
发明内容
本发明的目的在于克服现有技术存在的不足,而提供一种IT系统运行指标动态阈值分析方法,通过人工智能算法,实现大规模IT系统运行状态的自动化监测。
本发明的目的是通过如下技术方案来完成的。这种IT系统运行指标动态阈值分析方法,利用性能指标运行规律特征计算当前时间点正常值区间,生成动态阈值基线,以判断当前运行状态是否正常,步骤如下:
1)、查询运行指标历史变化情况;
2)、基于正态分布的原理计算当前时间粒度下的指标正常值区间R,其上限标记为RU,下限标记为RD;
3)、将各时间粒度的RU连接作为动态阈值上基线,RD连接作为动态阈值下基线;
4)、判断当前时间粒度下新采集到的运行指标,如>RU则为值过高异常,如<RD则为值过低异常。
本发明的有益效果为:解决静态阈值存在的不足,通过智能学习运行指标的历史运行规律,计算不同时间点运行指标正常取值范围,来生成动态阈值基线,以用于运行指标的监测分析。由于本发明无需大量人为操作,计算量小,且分析准确,因此可大量减少运维人力成本,提高监测覆盖面与准确率。
附图说明
图1为本发明的动态阈值分析流程示意图;
图2为本发明所涉及的指标正态分布规律示意图;
图3为本发明的阈值计算流程示意图;
图4为本发明生成的动态阈值基线示意图。
具体实施方式
下面将结合附图和实施例对本发明做详细的介绍:
实施例:本发明所述的这种IT系统运行指标动态阈值分析方法,利用性能指标运行规律特征计算当前时间点正常值区间,生成动态阈值基线,以判断当前运行状态是否正常。本发明可有效判断IT环境中一些性能指标的运行状态,并实现自动学习能力,减少实施大规模IT监测时的人为配置与分析工作。
图1为下述各模块的运行流程图,描述了数据流向;本发明共涉及4个模块:指标接收模块、动态阈值分析模块、监测展现模块、告警通知模块。1.指标接收模块提供标准的数据接口,完成对各IT系统最新上报运行指标的接收预处理,并保存为历史数据;2.动态阈值分析模块,即本发明算法实现模块,根据指标历史情况与当前情况,计算动态阈值基线与发送指标运行异常事件;3.监测展现模块通过趋势图实现运行指标变化轨迹以及动态基线的显示,提供对比分析;4.告警通知模块根据指标运行状态变更,给用户发送告警。
图2为IT运行指标的正态分布示意图,由于IT运行指标往往与具体信息系统业务吞吐量有关,而用户的业务吞吐量则具备峰谷特征,因此从某个同周期的历史时间段来看,其指标实际值总是处于某个特定的区间范围,体现出正态分布的特征。
图3为本发明计算动态阈值的过程;具体步骤如下:
1)、接收到IT资源产生的新指标P;
2)、查询指标P过去历史数据,如下:
(1)、前小时平均值与标准差
(2)、前一天同小时平均值PMd与标准差PSDd
(3)、过去8周同一天同小时平均值PMW1~PMWS与标准差PSDW1~PSDWS
3)、计算正常值平均值:
4)、计算正常值标准差:
5)、计算当前小时正常值区间上阈值RU=RM+RSD×S
6)、计算当前小时正常值区间下阈值RD=RM-RSD×5
7)、计算当天动态基线,将当天生成的所有小时RU作为上基线,所有小时RD作为下基线
8)、如果指标P>RU则为超上阈值异常,如果指标P<RD则为超下阈值异常,其它则为正常情况。
图4为本发明最后生成的动态基线示意图,从中可以看出用户的运行指标在工作日上班时间段体现出峰值,非工作时间段体现为谷值,而计算出的动态基线则更为平缓的呈现在指标变化趋势上下。
本发明不局限于上述实施方式,不论在其形状或材料构成上作任何变化,凡是采用本发明所提供的结构设计,都是本发明的一种变形,均应认为在本发明保护范围之内。

Claims (2)

1.一种IT系统运行指标动态阈值分析方法,其特征是:利用性能指标运行规律特征计算当前时间点正常值区间,生成动态阈值基线,以判断当前运行状态是否正常,步骤如下:
1)、查询运行指标历史变化情况;
2)、基于正态分布的原理计算当前时间粒度下的指标正常值区间R,其上限标记为RU,下限标记为RD;
3)、将各时间粒度的RU连接作为动态阈值上基线,RD连接作为动态阈值下基线;
4)、判断当前时间粒度下新采集到的运行指标,如>RU则为值过高异常,如<RD则为值过低异常。
2.根据权利要求1所述的IT系统运行指标动态阈值分析方法,其特征在于:该方法的具体步骤如下:
1)、接收到IT资源产生的新指标P;
2)、查询指标P过去历史数据,如下:
(1)、前小时平均值PMk与标准差PSDh
(2)、前一天同小时平均值PMd与标准差PSDd
(3)、过去8周同一天同小时平均值PMW1~PM与标准差PSDW1~PSDW8
3)、计算正常值平均值:
4)、计算正常值标准差:
5)、计算当前小时正常值区间上阈值RU=RM+RSD×3;
6)、计算当前小时正常值区间下阈值RD=RM-RSD×3;
7)、计算当天动态基线,将当天生成的所有小时RU作为上基线,所有小时RD作为下基线;
8)、如果指标P>RU则为超上阈值异常,如果指标P<RD则为超下阈值异常,其它则为正常情况。
CN201410697138.1A 2014-11-26 2014-11-26 一种it系统运行指标动态阈值分析方法 Pending CN104536868A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410697138.1A CN104536868A (zh) 2014-11-26 2014-11-26 一种it系统运行指标动态阈值分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410697138.1A CN104536868A (zh) 2014-11-26 2014-11-26 一种it系统运行指标动态阈值分析方法

Publications (1)

Publication Number Publication Date
CN104536868A true CN104536868A (zh) 2015-04-22

Family

ID=52852398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410697138.1A Pending CN104536868A (zh) 2014-11-26 2014-11-26 一种it系统运行指标动态阈值分析方法

Country Status (1)

Country Link
CN (1) CN104536868A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992280A (zh) * 2015-06-29 2015-10-21 中国民用航空厦门空中交通管理站 基于智能耳麦的空中交通管制员安全能力自动监控系统
CN105279386A (zh) * 2015-11-16 2016-01-27 拉扎斯网络科技(上海)有限公司 一种指标异常数据确定的方法及装置
CN105406991A (zh) * 2015-10-26 2016-03-16 上海华讯网络系统有限公司 基于网络监控指标由历史数据生成业务阈值的方法及系统
CN106168970A (zh) * 2016-07-08 2016-11-30 北京光年无限科技有限公司 面向问答机器人的功能模块检测方法及系统
CN106209432A (zh) * 2016-06-30 2016-12-07 中国人民解放军国防科学技术大学 基于动态阈值的网络设备亚健康预警方法及装置
TWI563844B (en) * 2015-07-24 2016-12-21 Vivotek Inc Setting method for a surveillance system, setting device thereof and computer readable medium
CN106502857A (zh) * 2015-09-07 2017-03-15 上海隆通网络系统有限公司 一种在it运维管理系统中的智能分析干预方法及系统
CN106557401A (zh) * 2016-10-13 2017-04-05 中国铁道科学研究院电子计算技术研究所 一种it设备监控指标的动态阈值设定方法及系统
CN106682159A (zh) * 2016-12-26 2017-05-17 山东鲁能软件技术有限公司 一种阈值配置方法
CN106940701A (zh) * 2016-01-05 2017-07-11 阿里巴巴集团控股有限公司 一种指标预期期望动态更新方法、装置和系统
CN107179975A (zh) * 2016-03-09 2017-09-19 北京京东尚科信息技术有限公司 监控方法和装置
CN108880841A (zh) * 2017-05-11 2018-11-23 上海宏时数据系统有限公司 一种业务监控系统的阀值设置、异常检测系统及方法
CN109213651A (zh) * 2017-06-29 2019-01-15 北京三快在线科技有限公司 一种对象监控方法及装置、电子设备
CN109327334A (zh) * 2018-09-30 2019-02-12 山东中创软件商用中间件股份有限公司 一种针对于设备性能的告警方法、装置及设备
CN109377059A (zh) * 2018-10-27 2019-02-22 平安医疗健康管理股份有限公司 一种基于风险管控的数据处理方法及设备
CN109558295A (zh) * 2018-11-15 2019-04-02 新华三信息安全技术有限公司 一种性能指标异常检测方法及装置
CN110928929A (zh) * 2019-12-10 2020-03-27 国家电网有限公司信息通信分公司 一种指标数据的正常数据区间确定方法和装置
CN111123777A (zh) * 2019-12-23 2020-05-08 东华大学 一种平移自动门远程监测预警系统
CN111207306A (zh) * 2020-03-09 2020-05-29 合肥泽众城市智能科技有限公司 基于数字压力信号处理的热力管网泄漏监测方法
CN112398706A (zh) * 2019-08-19 2021-02-23 中国移动通信集团广西有限公司 数据评估标准确定方法、装置及存储介质、电子设备
CN112433919A (zh) * 2020-11-25 2021-03-02 深圳前海微众银行股份有限公司 一种信息告警方法、设备及存储介质
CN112926749A (zh) * 2020-12-30 2021-06-08 国网宁夏电力有限公司信息通信公司 一种智能电网信息设备监控系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101657765A (zh) * 2007-03-12 2010-02-24 艾默生过程管理电力和水力解决方案有限公司 利用从统计和实时数据得到的可达到性能对设备进行通用性能评估的方法和装置
CN103744771A (zh) * 2014-01-28 2014-04-23 中国工商银行股份有限公司 一种监控主机性能基准偏差的方法、设备及系统
CN103744786A (zh) * 2014-01-16 2014-04-23 北京工业大学 基于软件功能层对软件异常行为溯源的方法
CN104050071A (zh) * 2014-06-30 2014-09-17 苏州科达科技股份有限公司 存储设备失效预警方法及系统
GB2514136A (en) * 2013-05-14 2014-11-19 Aims Innovation As Integration platform monitoring

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101657765A (zh) * 2007-03-12 2010-02-24 艾默生过程管理电力和水力解决方案有限公司 利用从统计和实时数据得到的可达到性能对设备进行通用性能评估的方法和装置
GB2514136A (en) * 2013-05-14 2014-11-19 Aims Innovation As Integration platform monitoring
CN103744786A (zh) * 2014-01-16 2014-04-23 北京工业大学 基于软件功能层对软件异常行为溯源的方法
CN103744771A (zh) * 2014-01-28 2014-04-23 中国工商银行股份有限公司 一种监控主机性能基准偏差的方法、设备及系统
CN104050071A (zh) * 2014-06-30 2014-09-17 苏州科达科技股份有限公司 存储设备失效预警方法及系统

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992280A (zh) * 2015-06-29 2015-10-21 中国民用航空厦门空中交通管理站 基于智能耳麦的空中交通管制员安全能力自动监控系统
TWI563844B (en) * 2015-07-24 2016-12-21 Vivotek Inc Setting method for a surveillance system, setting device thereof and computer readable medium
CN106502857A (zh) * 2015-09-07 2017-03-15 上海隆通网络系统有限公司 一种在it运维管理系统中的智能分析干预方法及系统
CN105406991A (zh) * 2015-10-26 2016-03-16 上海华讯网络系统有限公司 基于网络监控指标由历史数据生成业务阈值的方法及系统
CN105279386A (zh) * 2015-11-16 2016-01-27 拉扎斯网络科技(上海)有限公司 一种指标异常数据确定的方法及装置
CN105279386B (zh) * 2015-11-16 2019-08-16 拉扎斯网络科技(上海)有限公司 一种指标异常数据确定的方法及装置
CN106940701A (zh) * 2016-01-05 2017-07-11 阿里巴巴集团控股有限公司 一种指标预期期望动态更新方法、装置和系统
CN107179975A (zh) * 2016-03-09 2017-09-19 北京京东尚科信息技术有限公司 监控方法和装置
CN106209432B (zh) * 2016-06-30 2019-04-19 中国人民解放军国防科学技术大学 基于动态阈值的网络设备亚健康预警方法及装置
CN106209432A (zh) * 2016-06-30 2016-12-07 中国人民解放军国防科学技术大学 基于动态阈值的网络设备亚健康预警方法及装置
CN106168970A (zh) * 2016-07-08 2016-11-30 北京光年无限科技有限公司 面向问答机器人的功能模块检测方法及系统
CN106557401A (zh) * 2016-10-13 2017-04-05 中国铁道科学研究院电子计算技术研究所 一种it设备监控指标的动态阈值设定方法及系统
CN106682159A (zh) * 2016-12-26 2017-05-17 山东鲁能软件技术有限公司 一种阈值配置方法
CN108880841A (zh) * 2017-05-11 2018-11-23 上海宏时数据系统有限公司 一种业务监控系统的阀值设置、异常检测系统及方法
CN109213651A (zh) * 2017-06-29 2019-01-15 北京三快在线科技有限公司 一种对象监控方法及装置、电子设备
CN109327334A (zh) * 2018-09-30 2019-02-12 山东中创软件商用中间件股份有限公司 一种针对于设备性能的告警方法、装置及设备
CN109377059A (zh) * 2018-10-27 2019-02-22 平安医疗健康管理股份有限公司 一种基于风险管控的数据处理方法及设备
CN109558295A (zh) * 2018-11-15 2019-04-02 新华三信息安全技术有限公司 一种性能指标异常检测方法及装置
CN109558295B (zh) * 2018-11-15 2022-05-24 新华三信息安全技术有限公司 一种性能指标异常检测方法及装置
CN112398706A (zh) * 2019-08-19 2021-02-23 中国移动通信集团广西有限公司 数据评估标准确定方法、装置及存储介质、电子设备
CN110928929A (zh) * 2019-12-10 2020-03-27 国家电网有限公司信息通信分公司 一种指标数据的正常数据区间确定方法和装置
CN111123777A (zh) * 2019-12-23 2020-05-08 东华大学 一种平移自动门远程监测预警系统
CN111207306A (zh) * 2020-03-09 2020-05-29 合肥泽众城市智能科技有限公司 基于数字压力信号处理的热力管网泄漏监测方法
CN111207306B (zh) * 2020-03-09 2021-11-26 合肥泽众城市智能科技有限公司 基于数字压力信号处理的热力管网泄漏监测方法
CN112433919A (zh) * 2020-11-25 2021-03-02 深圳前海微众银行股份有限公司 一种信息告警方法、设备及存储介质
CN112926749A (zh) * 2020-12-30 2021-06-08 国网宁夏电力有限公司信息通信公司 一种智能电网信息设备监控系统及方法

Similar Documents

Publication Publication Date Title
CN104536868A (zh) 一种it系统运行指标动态阈值分析方法
CN111371185A (zh) 一种基于配变终端的线损监测系统和方法
CN105406991A (zh) 基于网络监控指标由历史数据生成业务阈值的方法及系统
CN110658415B (zh) 一种低压配电线路故障检测方法及系统
CN103065228B (zh) 停电监控评估预警方法及设备
CN108880841A (zh) 一种业务监控系统的阀值设置、异常检测系统及方法
CN103023028B (zh) 一种基于实体间依赖关系图的电网故障快速定位方法
CN103901845A (zh) 一种油田生产现场物联设备远程智能管理方法及系统
WO2013169903A1 (en) Methods and systems for managing distributed energy resources
CN105003828A (zh) 一种基于移动平台的排水在线监测预警方法及系统
CN103310294A (zh) 一种合同能源管理系统
CN103822098A (zh) 供水管网泄露监控方法
CN106680442A (zh) 一种用于水环境风险预警的阈值计算方法
CN103488169B (zh) 连续型化工装置及其控制回路性能实时评价方法、装置
CN114417981B (zh) 一种智能河长巡测系统
CN109272254A (zh) 一种污水零直排综合监测系统
CN204089886U (zh) 基于气象信息的电网动态监控预警系统
CN104156888A (zh) 基于风险综合评价模型的电力系统运营风险监测方法
CN205580497U (zh) 一种大型设备故障定点报警系统
CN109814462B (zh) 一种基于大数据的城市排水网络监控控制系统
CN117092953A (zh) 一种基于工业物联网的生产数据采集管控系统
CN104281140A (zh) 制造企业能源监控系统
CN103346906A (zh) 一种基于云计算的智能运维方法及系统
CN112508315A (zh) 一种防汛会商系统
CN111077865B (zh) 一种污染源企业环保生产负荷监控系统及方法

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Chinese weapon No. 69 building, 100089 Beijing city Haidian District Zizhuyuan Road Room 901

Applicant after: Beijing Guangtong software Limited by Share Ltd XinDa

Address before: Chinese weapon No. 69 building, 100089 Beijing city Haidian District Zizhuyuan Road Room 901

Applicant before: BEIJING BROADA TECHNOLOGY CO., LTD.

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150422