CN110782045A - 一种运维告警系统动态阈值的生成方法及装置 - Google Patents

一种运维告警系统动态阈值的生成方法及装置 Download PDF

Info

Publication number
CN110782045A
CN110782045A CN201910987538.9A CN201910987538A CN110782045A CN 110782045 A CN110782045 A CN 110782045A CN 201910987538 A CN201910987538 A CN 201910987538A CN 110782045 A CN110782045 A CN 110782045A
Authority
CN
China
Prior art keywords
index data
data
hyper
sarima model
sarima
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910987538.9A
Other languages
English (en)
Inventor
赵神州
李正洪
覃进学
王纯斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Sefon Software Co Ltd
Original Assignee
Chengdu Sefon Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Sefon Software Co Ltd filed Critical Chengdu Sefon Software Co Ltd
Priority to CN201910987538.9A priority Critical patent/CN110782045A/zh
Publication of CN110782045A publication Critical patent/CN110782045A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本发明公开了一种运维告警系统动态阈值的生成方法及装置,本方案基于SARIMA模型,通过对某一运维监控指标在不同时间点上的值进行建模,形成预测模型,通过置信度预设的置信区间生成阈值空间,从而形成动态阈值。此建模过程随着指标值数据的增加而不断调整优化,动态阈值亦随实际应用环境的变化而变化。解决了现有的运维系统方案依靠人力和经验值,一方面配置易出错;另一方面不够灵活,不能根据系统实际负载情况进行动态阈值调整,易出现误报和漏报的问题。

Description

一种运维告警系统动态阈值的生成方法及装置
技术领域
本发明涉及机器学习领域,特别涉及一种运维告警系统动态阈值的生成方法及装置。
背景技术
SARIMA模型:全称叫做周期性自回归差分移动平均模型,全称是Seasonal AutoRegressive Integrated Moving Average。也记作SARIMA(p,d,q)(P,D,Q)m,是统计模型(statistic model)中最常见的一种用来进行时间序列建模的模型。
系统运维类似于系统维护,前者更加侧重于保障系统正常运行,运维有运行和维护两层含义。对于一个系统,有时出错我们无法预知,系统越复杂,其维护难度越大,为了减少损失,我们尽可能地去预防各种错误,对于突发情况,尽可能地去修复。
为了在系统出现问题是及时处理,人们设计处理运维系统,现有的运维系统方案依靠人力和经验值,一方面配置易出错;另一方面不够灵活,不能根据系统实际负载情况进行动态阈值调整,易出现误报和漏报。
发明内容
本发明的目的在于:提供了一种运维告警系统动态阈值的生成方法及装置,解决了现有的运维系统方案依靠人力和经验值,一方面配置易出错;另一方面不够灵活,不能根据系统实际负载情况进行动态阈值调整,易出现误报和漏报的问题。
本发明采用的技术方案如下:
一种运维告警系统动态阈值的生成方法,包括被监控系统的指标数据,还包括以下步骤:
S1、利用指标数据历史时间序列建立SARIMA模型;
S2、在时刻t,对指标数据使用SARIMA模型进行预测,根据用户输入的置信度区间确定时刻t的阈值区间;
S3、判断采集到的时刻t的指标数据是否位于步骤S2确定的阈值区间内,若指标数据位于阈值区间内,则直接转入步骤S4;若指标数据没有位于阈值区间内,则转入步骤S4的同时进行告警;
S4、将时刻t的数据加入指标数据历史时间序列后更新SARIMA模型。
本方案基于SARIMA模型,通过对某一运维监控指标在不同时间点上的值进行建模,形成预测模型,通过置信度预设的置信区间生成阈值空间,从而形成动态阈值。此建模过程随着指标值数据的增加而不断调整优化,动态阈值亦随实际应用环境的变化而变化。
进一步的,所述步骤S1中利用指标数据历史时间序列建立阈值SARIMA模型的具体方法包括以下步骤:
S101、初始化SARIMA模型的参数、超参数;
S102、获取指标数据历史时间序列,将指标数据历史时间序列分为训练集和测试集;
S103、通过网格搜索遍历SARIMA模型的超参数组合;
S104、对步骤S103中遍历的每一组超参数组合,使用训练集的数据拟合SARIMA模型,根据拟合后的SARIMA模型使用测试集进行测试,计算SARIMA模型的准确性,选取准确性最高的SARIMA模型进行使用。
在上述方案中,系统会持续对运维监控目标对象进行各项监控指标数据采集,每个指标都会有系列时间序列数据;然后选择SARIMA模型的超参数,用部分指标数据拟合SARIMA模型数学公式,然后用部分数据对SARIMA模型进行评估,选取最优的模型进行持久化,供后续预测之用。
进一步的,所述步骤S101中初始化的参数、超参数包括自回归阶数p、差分次数d、移动平均阶数q、周期回归阶数P、周期差分次数D、周期移动平均阶数Q和周期观察数量 m。
进一步的,所述步骤S102获取指标数据历史时间序列后,对指标数据历史时间序列的数据进行Dicky Fuller测试,若通过测试,则直接将指标数据历史时间序列分为训练集和测试集,若没有通过测试,则对指标数据历史时间序列的数据进行周期性差分处理,直到通过Dicky Fuller测试。
SARIMA模型一般要求时序数据是稳定的,或者通过一阶差分或二阶差分加周期性差分之后是稳定的。通过Dicky Fuller测试可以判断指标数据历史时间序列的数据的稳定性。
进一步的,所述步骤S104中选取准确性最高的SARIMA模型的方法包括以下步骤:
S10401、选取一组超参数组合,计算使用该组合的SARIMA模型的准确性;
S10402、判断缓存数据是否为空,若缓存数据为空,则进入步骤S10403,若缓存数据不为空,则判断步骤S10401中得到的SARIMA模型的准确性是否大于缓存数据中SARIMA模型的准确性,若步骤S10401中得到的SARIMA模型的准确性大于缓存数据中SARIMA 模型的准确性则进入步骤S10403,否则进入步骤S10404;
S10403、将步骤S10401中得到的SARIMA模型存储到缓存数据中,并覆盖缓存数据中的其它SARIMA模型;
S10404、判断是否完成超参数组合遍历,若完成超参数组合遍历,则读取缓存数据中的SARIMA模型进行使用,若未完成超参数组合遍历,则从超参数组合中选取一组新的超参数组合送入步骤S10401。
理论上,有1296种组合可用于遍历,实际中只有少部分可用,大部分会导致模型错误或溢出,在在遍历过程中对错误或溢出的模型直接忽略。
进一步的,所述用户输入的置信度区间的置信度为85%-99%。
进一步的,所述指标数据包括CPU使用率、CPU空闲率、内存使用率、内存空闲率、磁盘使用率、磁盘IOPS、网卡上行速率、网卡下行速率、CPU load、JVM minor GC耗时毫秒数、JVM full GC耗时毫秒数、数据库TPS、数据库QPS、数据库IOPS、cache hits、cache misses、TLB hits、TLB misses中的至少一个。
一种运维告警系统动态阈值的生成装置,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令,实现上述的一种运维告警系统动态阈值的生成方法。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明一种运维告警系统动态阈值的生成方法及装置,解决了现有的运维系统方案依靠人力和经验值,一方面配置易出错;另一方面不够灵活,不能根据系统实际负载情况进行动态阈值调整,易出现误报和漏报的问题;
2.本发明一种运维告警系统动态阈值的生成方法及装置,消除人力干预、自动生成相关阈值、其灵活性和系统负载适配性相对更优。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明的SARIMA模型生成流程图;
图2是本发明的运维系统架构图;
图3是现有方案的运维系统架构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合图1至图3对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
实施例1
一种运维告警系统动态阈值的生成方法,包括被监控系统的指标数据,还包括以下步骤:
S1、利用指标数据历史时间序列建立SARIMA模型;
S2、在时刻t,对指标数据使用SARIMA模型进行预测,根据用户输入的置信度区间确定时刻t的阈值区间;
S3、判断采集到的时刻t的指标数据是否位于步骤S2确定的阈值区间内,若指标数据位于阈值区间内,则直接转入步骤S4;若指标数据没有位于阈值区间内,则转入步骤S4的同时进行告警;
S4、将时刻t的数据加入指标数据历史时间序列后更新SARIMA模型。
本方案基于SARIMA模型,通过对某一运维监控指标在不同时间点上的值进行建模,形成预测模型,通过置信度预设的置信区间生成阈值空间,从而形成动态阈值。此建模过程随着指标值数据的增加而不断调整优化,动态阈值亦随实际应用环境的变化而变化。
实施例2
本实施例在实施例1的基础上进一步的,所述步骤S1中利用指标数据历史时间序列建立阈值SARIMA模型的具体方法包括以下步骤:
S101、初始化SARIMA模型的参数、超参数;
S102、获取指标数据历史时间序列,将指标数据历史时间序列分为训练集和测试集;
S103、通过网格搜索遍历SARIMA模型的超参数组合;
S104、对步骤S103中遍历的每一组超参数组合,使用训练集的数据拟合SARIMA模型,根据拟合后的SARIMA模型使用测试集进行测试,计算SARIMA模型的准确性,选取准确性最高的SARIMA模型进行使用。
在上述方案中,系统会持续对运维监控目标对象进行各项监控指标数据采集,每个指标都会有系列时间序列数据;然后选择SARIMA模型的超参数,用部分指标数据拟合SARIMA模型数学公式,然后用部分数据对SARIMA模型进行评估,选取最优的模型进行持久化,供后续预测之用。
实施例3
本实施例在实施例2的基础上进一步的,所述步骤S101中初始化的参数、超参数包括自回归阶数p、差分次数d、移动平均阶数q、周期回归阶数P、周期差分次数D、周期移动平均阶数Q和周期观察数量m。
进一步的,所述步骤S102获取指标数据历史时间序列后,对指标数据历史时间序列的数据进行Dicky Fuller测试,若通过测试,则直接将指标数据历史时间序列分为训练集和测试集,若没有通过测试,则对指标数据历史时间序列的数据进行周期性差分处理,直到通过Dicky Fuller测试。
SARIMA模型一般要求时序数据是稳定的,或者通过一阶差分或二阶差分加周期性差分之后是稳定的。通过Dicky Fuller测试可以判断指标数据历史时间序列的数据的稳定性。
实施例4
本实施例在实施例2的基础上进一步的,所述步骤S104中选取准确性最高的SARIMA 模型的方法包括以下步骤:
S10401、选取一组超参数组合,计算使用该组合的SARIMA模型的准确性;
S10402、判断缓存数据是否为空,若缓存数据为空,则进入步骤S10403,若缓存数据不为空,则判断步骤S10401中得到的SARIMA模型的准确性是否大于缓存数据中SARIMA模型的准确性,若步骤S10401中得到的SARIMA模型的准确性大于缓存数据中SARIMA 模型的准确性则进入步骤S10403,否则进入步骤S10404;
S10403、将步骤S10401中得到的SARIMA模型存储到缓存数据中,并覆盖缓存数据中的其它SARIMA模型;
S10404、判断是否完成超参数组合遍历,若完成超参数组合遍历,则读取缓存数据中的SARIMA模型进行使用,若未完成超参数组合遍历,则从超参数组合中选取一组新的超参数组合送入步骤S10401。
理论上,有1296种组合可用于遍历,实际中只有少部分可用,大部分会导致模型错误或溢出,在在遍历过程中对错误或溢出的模型直接忽略。
实施例5
本实施例在实施例2的基础上进一步的,所述用户输入的置信度区间的置信度为85%。所述指标数据包括CPU使用率、CPU空闲率、内存使用率、内存空闲率、磁盘使用率、磁盘IOPS、网卡上行速率、网卡下行速率、CPU load、JVM minor GC耗时毫秒数、JVM full GC耗时毫秒数、数据库TPS、数据库QPS、数据库IOPS、cache hits、cache misses、TLB hits、TLB misses中的至少一个。
实施例6
本实施例与实施例5的区别在于,所述用户输入的置信度区间的置信度为99%。
实施例7
本实施例与实施例5的区别在于,所述用户输入的置信度区间的置信度为95%。
实施例8
一种运维告警系统动态阈值的生成装置,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令,实现如实施例1所述的一种运维告警系统动态阈值的生成方法。
实施例9
如图3所示,本实施例为现有的运维系统架构,包括采集模块、告警模块、规则阈值模块、管理系统、存储模块和通知模块。采集模块从被监控系统采集指标数据,将指标数据送入告警模块,告警模块接收到指标数据后,读取规则阈值模块记录的规则与阈值配置对指标数据进行判断,若指标数据在阈值范围内,则不做处理,若指标数据在阈值范围外,则将告警数据发送到存储模块进程存储,同时存储模块发送信息到通知模块,通知模块发送告警通知到管理系统,运维人员通过管理系统配置规则阈值模块和技术告警通知。
实施例10
如图2所示,本实施例为采用本方案的运维系统架构,在实施例9的基础上,本方案增设了阈值建模模块,运维人员只需要配置系统时将指标配置输入阈值建模模块中,阈值建模模块即可采用本方法根据采集模块采集指标数据实时调整规则阈值模块中的动态阈值,同时运维人员还可手动配置规则阈值模块中的静态阈值,实现双保险。
实施例11
在实施例10的基础上,本实施例为阈值建模模块的具体工作流程,
SA、准备参数(p,d,q,P,D,Q,m)搜索列表以进行网格搜索grid search;理论上,有1296 种组合可用于遍历,实际中只有少部分可用,大部分会导致模型错误或溢出,在在遍历过程中忽略;
SB、获取某监控指标时间序列数据,处理缺失值;
SC、数据平稳性处理:对数据进行Dicky Fuller测试,如果通过测试,转入步骤SD;否则,对数据进行一阶差分或二阶差分处理,并进行周期性差分处理,直至数据平稳;
SD、经过步骤SC处理,得到平稳数据序列;
SE、通过网格搜索遍历超参数组合,用部分时间序列数据拟合SARIMA数学表达式expr,根据表达式对另一部分数据数据进行预测,判断准确性。其判断流程如下:
输入:dataList=[y1,y2,y3,….yn];
正确预测计数:correctPredictions=0;
for index from 0to dataList.length;
do;
if index==0or index==dataList.length–1then;
skip;
else if dataList[index]在expr(dataList[index-1])的上下界之内then;
correctPredictions+=1;
end if;
end for;
选取准确性(correctPredictions)SARIMA为最优模型;
SF、模型持久化,用于后续告警判定之用。
实施例11
本实施例在实施例10的基础上结合实施例4进行选取准确性最高的SARIMA模型的方法的说明:
S10401、从超参数列表parameters中选取一组(p,d,q,P,D,Q,m)组合,通过dataList 部分数据拟合SARIMA模型的数学表达式expr,通过dataList剩下的数据计算使用该组合的SARIMA模型的准确性Precision;
S10402、判断缓存数据optimization是否为空,若缓存数据optimization为空,则进入步骤S10403,若缓存数据optimization不为空,则判断步骤S10401中得到的SARIMA模型的准确性Precision是否大于缓存数据optimization中SARIMA模型的准确性Precision,若步骤S10401中得到的SARIMA模型的准确性Precision大于缓存数据optimization中SARIMA模型的准确性Precision则进入步骤S10403,否则进入步骤S10404;
S10403、将步骤S10401中得到的SARIMA模型存储到缓存数据optimization中,并覆盖缓存数据optimization中的其它SARIMA模型;
S10404、判断是否完成超参数列表parameters中的超参数组合遍历,若完成超参数组合遍历,则读取缓存数据optimization中的SARIMA模型进行使用,若未完成超参数组合遍历,则从超参数组合中选取一组新的超参数组合送入步骤S10401。
在上述方案中,系统会持续对运维监控目标对象进行各项监控指标数据采集,采集时间间隔为10秒,故系统启动几分钟之后,每个指标都会有系列时间序列数据;然后对此序列进行差分,得到平稳序列;然后通过网格搜索选择超参数,用部分指标数据拟合SARIMA数学公式,然后用部分数据对公式进行评估,选取最优的模型进行持久化,供后续预测之用。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种运维告警系统动态阈值的生成方法,包括被监控系统的指标数据,其特征在于:还包括以下步骤:
S1、利用指标数据历史时间序列建立SARIMA模型;
S2、在时刻t,对指标数据使用SARIMA模型进行预测,根据用户输入的置信度区间确定时刻t的阈值区间;
S3、判断采集到的时刻t的指标数据是否位于步骤S2确定的阈值区间内,若指标数据位于阈值区间内,则直接转入步骤S4;若指标数据没有位于阈值区间内,则转入步骤S4的同时进行告警;
S4、将时刻t的数据加入指标数据历史时间序列后更新SARIMA模型。
2.根据权利要求1所述的一种运维告警系统动态阈值的生成方法,其特征在于:所述步骤S1中利用指标数据历史时间序列建立阈值SARIMA模型的具体方法包括以下步骤:
S101、初始化SARIMA模型的参数、超参数;
S102、获取指标数据历史时间序列,将指标数据历史时间序列分为训练集和测试集;
S103、通过网格搜索遍历SARIMA模型的超参数组合;
S104、对步骤S103中遍历的每一组超参数组合,使用训练集的数据拟合SARIMA模型,根据拟合后的SARIMA模型使用测试集进行测试,计算SARIMA模型的准确性,选取准确性最高的SARIMA模型进行使用。
3.根据权利要求2所述的一种运维告警系统动态阈值的生成方法,其特征在于:所述步骤S101中初始化的参数、超参数包括自回归阶数p、差分次数d、移动平均阶数q、周期回归阶数P、周期差分次数D、周期移动平均阶数Q和周期观察数量m。
4.根据权利要求2所述的一种运维告警系统动态阈值的生成方法,其特征在于:所述步骤S102获取指标数据历史时间序列后,对指标数据历史时间序列的数据进行Dicky Fuller测试,若通过测试,则直接将指标数据历史时间序列分为训练集和测试集,若没有通过测试,则对指标数据历史时间序列的数据进行周期性差分处理,直到通过Dicky Fuller测试。
5.根据权利要求2所述的一种运维告警系统动态阈值的生成方法,其特征在于:所述步骤S104中选取准确性最高的SARIMA模型的方法包括以下步骤:
S10401、选取一组超参数组合,计算使用该组合的SARIMA模型的准确性;
S10402、判断缓存数据是否为空,若缓存数据为空,则进入步骤S10403,若缓存数据不为空,则判断步骤S10401中得到的SARIMA模型的准确性是否大于缓存数据中SARIMA模型的准确性,若步骤S10401中得到的SARIMA模型的准确性大于缓存数据中SARIMA模型的准确性则进入步骤S10403,否则进入步骤S10404;
S10403、将步骤S10401中得到的SARIMA模型存储到缓存数据中,并覆盖缓存数据中的其它SARIMA模型;
S10404、判断是否完成超参数组合遍历,若完成超参数组合遍历,则读取缓存数据中的SARIMA模型进行使用,若未完成超参数组合遍历,则从超参数组合中选取一组新的超参数组合送入步骤S10401。
6.根据权利要求1所述的一种运维告警系统动态阈值的生成方法,其特征在于:所述用户输入的置信度区间的置信度为85%-99%。
7.根据权利要求1所述的一种运维告警系统动态阈值的生成方法,其特征在于:所述指标数据包括CPU使用率、CPU空闲率、内存使用率、内存空闲率、磁盘使用率、磁盘IOPS、网卡上行速率、网卡下行速率、CPU load、JVM minor GC耗时毫秒数、JVM full GC耗时毫秒数、数据库TPS、数据库QPS、数据库IOPS、cache hits、cache misses、TLB hits、TLB misses中的至少一个。
8.一种运维告警系统动态阈值的生成装置,其特征在于:包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令,实现如权利要求1所述的一种运维告警系统动态阈值的生成方法。
CN201910987538.9A 2019-10-17 2019-10-17 一种运维告警系统动态阈值的生成方法及装置 Pending CN110782045A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910987538.9A CN110782045A (zh) 2019-10-17 2019-10-17 一种运维告警系统动态阈值的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910987538.9A CN110782045A (zh) 2019-10-17 2019-10-17 一种运维告警系统动态阈值的生成方法及装置

Publications (1)

Publication Number Publication Date
CN110782045A true CN110782045A (zh) 2020-02-11

Family

ID=69385907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910987538.9A Pending CN110782045A (zh) 2019-10-17 2019-10-17 一种运维告警系统动态阈值的生成方法及装置

Country Status (1)

Country Link
CN (1) CN110782045A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052145A (zh) * 2020-09-09 2020-12-08 中国工商银行股份有限公司 性能告警阈值的确定方法、装置、电子设备和介质
CN112489402A (zh) * 2020-11-27 2021-03-12 罗普特科技集团股份有限公司 一种管廊的预警方法、装置、系统及存储介质
CN112926749A (zh) * 2020-12-30 2021-06-08 国网宁夏电力有限公司信息通信公司 一种智能电网信息设备监控系统及方法
CN113064834A (zh) * 2021-04-22 2021-07-02 中国工商银行股份有限公司 异常检测方法、装置、电子设备、介质和程序产品
WO2022017080A1 (zh) * 2020-07-23 2022-01-27 长鑫存储技术有限公司 光罩缺陷检测方法及系统
CN114168444A (zh) * 2021-12-14 2022-03-11 天津科技大学 一种基于监控大数据的动态运维报修模型
CN114564370A (zh) * 2022-04-29 2022-05-31 天云软件技术有限公司 告警阈值的确定方法、装置、设备及计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101267362A (zh) * 2008-05-16 2008-09-17 亿阳信通股份有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
CN101771758A (zh) * 2008-12-31 2010-07-07 北京亿阳信通软件研究院有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
CN108038040A (zh) * 2017-12-08 2018-05-15 上海市信息网络有限公司 计算机集群性能指标检测方法、电子设备及存储介质
CN108898222A (zh) * 2018-06-26 2018-11-27 郑州云海信息技术有限公司 一种自动调节网络模型超参数的方法和装置
CN108921355A (zh) * 2018-07-03 2018-11-30 国家计算机网络与信息安全管理中心 一种基于时间序列预测模型的告警阈值设定方法及装置
CN109816116A (zh) * 2019-01-17 2019-05-28 腾讯科技(深圳)有限公司 机器学习模型中超参数的优化方法及装置
CN109978230A (zh) * 2019-02-15 2019-07-05 杭州博钊科技有限公司 一种基于深度卷积神经网络的电力销售金额智能预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101267362A (zh) * 2008-05-16 2008-09-17 亿阳信通股份有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
CN101771758A (zh) * 2008-12-31 2010-07-07 北京亿阳信通软件研究院有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
CN108038040A (zh) * 2017-12-08 2018-05-15 上海市信息网络有限公司 计算机集群性能指标检测方法、电子设备及存储介质
CN108898222A (zh) * 2018-06-26 2018-11-27 郑州云海信息技术有限公司 一种自动调节网络模型超参数的方法和装置
CN108921355A (zh) * 2018-07-03 2018-11-30 国家计算机网络与信息安全管理中心 一种基于时间序列预测模型的告警阈值设定方法及装置
CN109816116A (zh) * 2019-01-17 2019-05-28 腾讯科技(深圳)有限公司 机器学习模型中超参数的优化方法及装置
CN109978230A (zh) * 2019-02-15 2019-07-05 杭州博钊科技有限公司 一种基于深度卷积神经网络的电力销售金额智能预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
梁文娟等: "SARIMA模型在航空公司运营安全状态预测中的应用", 《安全与环境学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022017080A1 (zh) * 2020-07-23 2022-01-27 长鑫存储技术有限公司 光罩缺陷检测方法及系统
CN112052145A (zh) * 2020-09-09 2020-12-08 中国工商银行股份有限公司 性能告警阈值的确定方法、装置、电子设备和介质
CN112489402A (zh) * 2020-11-27 2021-03-12 罗普特科技集团股份有限公司 一种管廊的预警方法、装置、系统及存储介质
CN112926749A (zh) * 2020-12-30 2021-06-08 国网宁夏电力有限公司信息通信公司 一种智能电网信息设备监控系统及方法
CN113064834A (zh) * 2021-04-22 2021-07-02 中国工商银行股份有限公司 异常检测方法、装置、电子设备、介质和程序产品
CN113064834B (zh) * 2021-04-22 2022-08-05 中国工商银行股份有限公司 异常检测方法、装置、电子设备、介质
CN114168444A (zh) * 2021-12-14 2022-03-11 天津科技大学 一种基于监控大数据的动态运维报修模型
CN114564370A (zh) * 2022-04-29 2022-05-31 天云软件技术有限公司 告警阈值的确定方法、装置、设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN110782045A (zh) 一种运维告警系统动态阈值的生成方法及装置
CN109947088B (zh) 基于模型全生命周期管理的设备故障预警系统
US10732618B2 (en) Machine health monitoring, failure detection and prediction using non-parametric data
CN107408225B (zh) 操作数据的自适应处置
JP5605476B2 (ja) システム運用管理装置、システム運用管理方法、及びプログラム記憶媒体
US11403164B2 (en) Method and device for determining a performance indicator value for predicting anomalies in a computing infrastructure from values of performance indicators
US11093314B2 (en) Time-sequential data diagnosis device, additional learning method, and recording medium
US20140052489A1 (en) Time derivative-based program management systems and methods
JP2018180759A (ja) システム分析装置、及びシステム分析方法
NO20200858A1 (en) Methods And Systems To Determine And Optimize Reservoir Simulator Performance In A Cloud Computing Environment
JP6427357B2 (ja) 診断支援システム及び診断支援方法
US20200349049A1 (en) Methods and systems for estimating process capacity
US20180232964A1 (en) Vehicle component failure prevention
US20150039555A1 (en) Heuristically modifying dbms environments using performance analytics
JP7145821B2 (ja) 故障確率評価システムおよびその方法
WO2021130771A1 (en) System and method of machine learning based deviation prediction and interconnected-metrics derivation for action recommendations
CN112882795A (zh) 虚拟机异常诊断方法、装置、设备及存储介质
CN112286088A (zh) 一种动力设备故障预测模型在线应用的方法及应用系统
Jeet et al. A model for estimating the impact of low productivity on the schedule of a software development project
JP5200678B2 (ja) サービシステム、サービスシステム管理方法、及びプログラム
Jang et al. A proactive alarm reduction method and its human factors validation test for a main control room for SMART
Cao Estimating efforts for various activities in agile software development: An empirical study
CA3020799A1 (en) Requirements determination
JP6275542B2 (ja) 分析装置およびコンピュータプログラム
JP2018156653A (ja) 組織ポテンシャルの予測装置、予測方法、プログラム、および記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200211

RJ01 Rejection of invention patent application after publication