CN111367747A - 基于时间标注的指标异动检测预警的装置 - Google Patents

基于时间标注的指标异动检测预警的装置 Download PDF

Info

Publication number
CN111367747A
CN111367747A CN201811587478.3A CN201811587478A CN111367747A CN 111367747 A CN111367747 A CN 111367747A CN 201811587478 A CN201811587478 A CN 201811587478A CN 111367747 A CN111367747 A CN 111367747A
Authority
CN
China
Prior art keywords
time sequence
time
abnormal
index data
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811587478.3A
Other languages
English (en)
Other versions
CN111367747B (zh
Inventor
叶晓龙
任赣
竺士杰
孟震
乔柏林
蒋通通
胡林熙
杜悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811587478.3A priority Critical patent/CN111367747B/zh
Publication of CN111367747A publication Critical patent/CN111367747A/zh
Application granted granted Critical
Publication of CN111367747B publication Critical patent/CN111367747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明实施例提供一种基于时间标注的指标异动检测预警的装置,所述装置基于时间标注学习实现故障预警的方式,采用系统异常时间窗口标注,反向提取强相关的指标集合,形成核心指标集合,作为实时预警的数据基础;并通过时间窗口标注,以及Cramer分解,实现对应指标阈值的自动更新,从而极大降低人工维护成本,相比基于统一加权等模式在准确定上更加精确,而且具有更好的适用性。

Description

基于时间标注的指标异动检测预警的装置
技术领域
本发明实施例涉及计算机软件技术领域,尤其涉及一种基于时间标注的指标异动检测预警的装置。
背景技术
IT系统的监控是IT运维保障系统稳定运行及时响应的基础。然而随着IT技术和业务的发展,IT系统规模日益庞大,涉及的各类主机、平台、进程、服务、业务的各类类监控指标数量日益增多,每个组件指标都需要设定对应的告警策略。有的是静态的阈值指标,有的是随着业务行为特征具有一定的周期趋势特征,如用户为每天在线用户,随着时间推移形成一定的周期特征。然后通过定时轮训的进程实现对指标异动的判断,生成响应的预警信息。其中,指标的阈值设定又经常随着业务规模,系统架构等因素发生变化,导致原有的阈值设定无法适用,因此需要进行人工重新维护更新,难以实现对IT系统的高效、精确的风险预警。目前主要的解决方式有:
基于人工配置的时序指标异动检测方法:以人工维护的方式,实现对所有指标告警阈值的配置更新,也是目前大多数IT企业的主要的解决方式,统一处理所有的运维监控指标,人工维护成本较高,尤其是大型IT系统中的海量监控指标的更新维护,难以实现及时更新和调整。
基于CMDB的配置数据实现IT系统预警:通过对IT系统资源的运行状态进行多层次、全方位的实时监控,如CPU、内存、交易量等设定基准值,并且通过层次化依赖关系模型构建的以业务为核心的故障根源分析模型和故障影响性分析模型,可准确地定位造成交易失败的故障节点,以及预测该故障节点可能会影响的其他交易和影响的程度,及时通知运维管理人员采取措施,避免风险进一步地扩散。
基于历史数据加权生成业务基线预警:通过对监控指标的历史数据当天的日期属性对应的历史上当前时刻所在时段的监控项指标历史数据,计算其上下限基线,并且根据对应模块的权重设定告警的风险点等级和影响范围。数据采集模块用于从数据库中获取及存储阈值配置信息、活动周期预估数据和业务趋势预估数据;权重系数运算模块用于对各指标进行权重系数运算;上下限约束模块用于根据各指标的上下限约束完成指标数据的裁减;阈值输出模块用于输出阈值信息。
但上述现有监控技术都存在监控不及时、精度不高等问题。
发明内容
本发明实施例提供一种基于时间标注的指标异动检测预警的装置,用以解决现有监控技术中监控不及时、精度不高等问题。
根据本发明实施例的第一个方面,提供一种基于时间标注的指标异动检测预警的装置,包括:
离线学习单元OLU,用于基于异常事件的异常时间窗口,自动关联时序数据库TSDB中的时序指标数据,并且通过Cramer分解,计算不确定因子和异常时间窗口的相关性,从而获取高敏时序指标数据集合;
异常模型AM,用于基于高敏时序指标数据集合、目标系统可用率和正态分位函数算法,生成时序指标数据告警阈值区间;
RC规则检测器,基于时序指标数据告警阈值区间,对目标时序指标数据进行异动检测。
进一步,还包括标注工具LT,用于对异动事件进行对应系统和异常时间窗口标注。
进一步,还包括预警单元AU,用于获取RC的异动检测结果,将异动检测结果进行信息推送;并且将相关异动模型发送给LT标注工具,进行标注分析。
进一步,还包括:
消息队列MQ,用于获取各个分布式监控客户端上报的时序指标数据,并进行队列化处理。
进一步,还包括:
时序数据库TSDB,用于从MQ模块的主题中归档时序指标并存储。
进一步,还包括:
事件库ED,用于存储事件的相关信息。
进一步,离线学习单元OLU,进一步用于:
根据ED中新增异常时间窗口标注事件的触发,获取对应新增的事件属性,事件属性包括对应的系统模块和影响的范围,时间窗口为TF;更新计算所述对应的系统模块的可用率
Figure BDA0001919454710000031
Figure BDA0001919454710000032
选择离线分析的时序窗口Tw,TF∈Tw
根据Tw时间窗口,生成异动标注值;正常状态时序点的异动标注值为0,异常时序点的异动标注值为1,得到N维度的异动标注值序列数据W=[w1,w2...wn],且wi为0或1,N为总时序点数为;
根据Tw时间窗口,从TSDB中遍历对应的时序指标数据,得到时序指标数据在Tw时间窗口内的异动标注值序列Y=[y1,y2...yn];
若Y内异动标注值为周期性趋势时,则通过对Q个周期的时序数据集合生成U=[μ1,μ2...μn],其中μi为Q序列中的对应时序点的中位数或者平均;若Y内异动标注值为平稳性指标时,则Ui中的μi值相同为固定常数;
结合Ui对Y内异动标注值进行Cramer分解,得到yi=μii,其中μi为确定性影响,εi随机不确定性干扰,得到εi=yii序列E;
计算向量W和E的相关性γ:
Figure BDA0001919454710000033
将γ满足预设条件的时序指标数据纳入高敏时序指标数据集合。
进一步,异常模型AM,进一步用于:
时序指标数据yi告警阈值区间的正常阈值区间为
Figure BDA0001919454710000034
Figure BDA0001919454710000035
本发明实施例提供一种基于时间标注的指标异动检测预警的装置,所述装置基于时间标注学习实现故障预警的方式,采用系统异常时间窗口标注,反向提取强相关的指标集合,形成核心指标集合,作为实时预警的数据基础;并通过时间窗口标注,以及Cramer分解,实现对应指标阈值的自动更新,从而极大降低人工维护成本,相比基于统一加权等模式在准确定上更加精确,而且具有更好的适用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于时间标注的指标异动检测预警的装置的一结构示意图;
图2为本发明基于时间标注的指标异动检测预警的装置的又一结构示意图;
图3为本发明基于时间标注的指标异动检测预警的装置的正态分布概率密度曲线示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术方案主要存在以下几个问题:
方案一针对人为经验维护的方式存在的问题:
随着目前各类系统集群规模的不断扩大,单纯的人工维护已经成为一项艰巨的任务,再加上业务规模上发生的快速变化,运维非常容易淹没在海量告警信息之中,难以精准快速的发现系统的严重风险。
方案二针对CMDB配置数据实现预警的装置存在的问题:
基于CMDB配置数据实现层次化的依赖拓扑模型,本质上是要建立对海量监控指标在整个依赖模型中的层次定位和关系,模型的维护工作量较高,而且对于IT人员的技能要求上也有较高的门槛,难以快速上手,而且容易受到系统变化而发生适用性的变化。
方案三针对基于历史数据加权计算的装置存在的问题:
基于历史数据加权计算的方案,主要是通过根据历史时间及其时刻分别计算生成业务阈值,并排除异常数据设定不同的基线,以提高告警的准确度。模型的自适应上存在一定的局限,而且异常数据排除的方式相对机械。
综上,现有的技术方案上都存在一定的不足,体现在维护成本上、方法适用性上、准确程度上都有一定的缺陷和不足。而本提案首次提出了基于时间标注学习实现故障预警的方式,采用系统异常时间窗口标注,反向提取强相关的指标集合,形成核心指标集合,作为实时预警的数据基础;并通过时间窗口标注,以及Cramer分解,实现对应指标阈值的自动更新,从而极大降低人工维护成本,相比基于统一加权等模式在准确定上更加精确,而且具有更好的适用性。
如图1所示,本发明具体实施例示出一种基于时间标注的指标异动检测预警的装置的结构示意图,包括:
离线学习单元OLUA01,用于基于异常事件的异常时间窗口,自动关联时序数据库TSDB中的时序指标数据,并且通过Cramer分解,计算不确定因子和异常时间窗口的相关性,从而获取高敏时序指标数据集合;
异常模型AMA02,用于基于高敏时序指标数据集合、目标系统可用率和正态分位函数算法,生成时序指标数据告警阈值区间;
RC规则检测器A03,基于时序指标数据告警阈值区间,对目标时序指标数据进行异动检测。
在本发明上述任一具体实施例的基础上,提供一种基于时间标注的指标异动检测预警的装置,还包括标注工具LT,用于对异动事件进行对应系统和异常时间窗口标注。
在本发明上述任一具体实施例的基础上,提供一种基于时间标注的指标异动检测预警的装置,还包括预警单元AU,用于获取RC的异动检测结果,将异动检测结果进行信息推送;并且将相关异动模型发送给LT标注工具,进行标注分析。
在本发明上述任一具体实施例的基础上,提供一种基于时间标注的指标异动检测预警的装置,还包括:
消息队列MQ,用于获取各个分布式监控客户端上报的时序指标数据,并进行队列化处理。
在本发明上述任一具体实施例的基础上,提供一种基于时间标注的指标异动检测预警的装置,还包括:
时序数据库TSDB,用于从MQ模块的主题中归档时序指标并存储。
在本发明上述任一具体实施例的基础上,提供一种基于时间标注的指标异动检测预警的装置,还包括:
事件库ED,用于存储事件的相关信息。
在本发明上述任一具体实施例的基础上,提供一种基于时间标注的指标异动检测预警的装置的具体实施例,离线学习单元OLU,进一步用于:
根据ED中新增异常时间窗口标注事件的触发,获取对应新增的事件属性,事件属性包括对应的系统模块和影响的范围,时间窗口为TF;更新计算所述对应的系统模块的可用率
Figure BDA0001919454710000061
Figure BDA0001919454710000062
选择离线分析的时序窗口Tw,TF∈Tw
根据Tw时间窗口,生成异动标注值;正常状态时序点的异动标注值为0,异常时序点的异动标注值为1,得到N维度的异动标注值序列数据W=[w1,w2...wn],且wi为0或1,N为总时序点数为;
根据Tw时间窗口,从TSDB中遍历对应的时序指标数据,得到时序指标数据在Tw时间窗口内的异动标注值序列Y=[y1,y2...yn];
若Y内异动标注值为周期性趋势时,则通过对Q个周期的时序数据集合生成U=[μ1,μ2...μn],其中μi为Q序列中的对应时序点的中位数或者平均;若Y内异动标注值为平稳性指标时,则Ui中的μi值相同为固定常数;
结合Ui对Y内异动标注值进行Cramer分解,得到yi=μii,其中μi为确定性影响,εi随机不确定性干扰,得到εi=yii序列E;
计算向量W和E的相关性γ:
Figure BDA0001919454710000071
将γ满足预设条件的时序指标数据纳入高敏时序指标数据集合。
在本发明上述任一具体实施例的基础上,提供一种基于时间标注的指标异动检测预警的装置,异常模型AM,进一步用于:
时序指标数据yi告警阈值区间的正常阈值区间为
Figure BDA0001919454710000072
Figure BDA0001919454710000073
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
如图2,在本发明上述任一具体实施例的基础上,示出提供一种基于时间标注的指标异动检测预警的装置结构示意图。为了实现对分布式系统中海量告警数据的分析,建立核心的高敏指标集,从而实现高效的准确的预警能力。本方主要由以下消息队列(MQ,Message Queue),规则校验器(RC,Rule Checker),异动模型(AM,Anomaly Model),离线学习单元(OLU,Offline Learning Unit),预警单元(AU,Alert Unit),标注工具(LT,LabelTool),以及时序数据库(TSDB,Time Series DataBase)和事件库(ED,Event DataBase)构成。
MQ消息队列:主要负责收集来自各个分布式监控客户端上报的时序指标数据,并为后项的实时处理按主题进行队列化处理。
TSDB时序数据库:主要负责从MQ模块的主题中归档时序指标,利用其对时间序列指标数据特有的高效压缩和读写以及聚合性能,为上层的离线学习单元提供数据支持。
ED事件库:主要负责存储事件的相关信息,包括发生日期,事件类型,影响的模块,开始/结束的时间等信息。
LT标注工具:主要负责对告警及异动事件进行对应系统和时间窗口的标注,为OLU模块提供训练和学习的数据。
OLU离线学习单元:根据LT模块标注的异动时间窗口,遍历TSDB中的指标数据进行相关性分析,从而得强相关的高敏指标合集。
AM异常模型:主要负责接收来自OLU的高敏指标合集,以及异常检测的阈值策略信息,RC模块提供模型判断依据。
RC规则检测器:主要负责从MQ主题中抽取时序指标,并且根据AM的模型策略接口实现实时的异动规则判断。
AU预警单元:接收来自RC规则检测器的判断,通过邮件、电话、短信、工单等多种方式进行信息推送,并且将相关的异动模型传输给LT标注工具,进行标注分析。
结合上图对本装置的功能结构说明,其中OLU离线学习单元和AM异常模型模块是最为核心的模块,下面针对这两个模块的处理过程进行详细阐述。
OLU离线学习单元。
根据EventDB事件库中新增异常标注事件的触发,OLU模块从读取对应新增的事件属性,主要包括对应的系统模块,影响的范围,时间窗口表示为TF。并且更新计算该系统模块对应的可用率:
Figure BDA0001919454710000081
选择离线分析的时序窗口Tw,要求满足TF∈Tw。一般选择策略上可以以TF时序窗口为中心,向前和向后各自扩展一个同样长度的时间窗口,而且时序数据点数不小于分析的最小点数N,如60个时序点。
根据Tw的时间窗口,生成异动标注值,正常状态时序点的值为0,异常时序点的值为1,则可以得到N维度的时序列数据W=[w1,w2...wn],且wi为0或1(假设总时序点数为N)。
OLU根据Tw时间窗口,从TSDB中逐个遍历对应的时序序列值,如指标在Tw时间窗口内的指标时序值Y=[y1,y2...yn]。
若Yi时序指标为周期性趋势指标时,则通过对Q个周期的时序数据集合生成,U=[μ1,μ2...μn],其中μi为Q序列中的对应时序点的中位数或者平均。若为Yi时序指标为平稳性指标时,则Ui中的μi值相同为固定常数,一般通过均值计算。
结合Ui对Yi时序指标进行Cramer分解,得到yi=μii,其中μi为确定性影响,εi随机不确定性干扰,则可以得到εi=yii序列E。
计算向量W和E的相关性
Figure BDA0001919454710000091
当相关系统γ接近0时表示时序Yi对异常没有相关性,当接近1时表示,该指标对异常有强相关性,应该纳入核心高敏的预警指标集。通常的设定为0.5以下为弱相关,0.8以上为强相关(可以根据实际场景进行调整)。
Anomaly Model Process(异常模型处理)。
根据OLU模块针对T期间内的事件信息,计算出每个系统的可用率指标
Figure BDA0001919454710000095
关联对应系统下的所有指标集合,其中T期间较长。
由于时序指标经过了Cramer分解,变成yi=μii,其中μi为确定性影响指标,由历史数据的均值或者中位数方式进行计算生成,εi为不确定影响,是确定指标合理阈值区间的关键。
标准差是样本与其均值偏离查平方的算术平均数的平方根,则其计算公式为
Figure BDA0001919454710000092
指标值数据服从正态分布yi~N(μ,δ2),转化为标准正态分布N(0,1),则其累计分布函数:
Figure BDA0001919454710000093
整理可得:
Figure BDA0001919454710000094
则其正态分位函数为
Figure BDA0001919454710000101
则可以得到对应的概率的值的阈值区间。正态分布概率密度曲线示意图如图3所示。
对于指标yi的εi可以得到
Figure BDA0001919454710000102
以及
Figure BDA0001919454710000103
则对应指标yi的正常阈值区间为
Figure BDA0001919454710000104
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的装置。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的装置。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种基于时间标注的指标异动检测预警的装置,其特征在于,包括:
离线学习单元OLU,用于基于异常事件的异常时间窗口,自动关联时序数据库TSDB中的时序指标数据,并且通过Cramer分解,计算不确定因子和异常时间窗口的相关性,从而获取高敏时序指标数据集合;
异常模型AM,用于基于高敏时序指标数据集合、目标系统可用率和正态分位函数算法,生成时序指标数据告警阈值区间;
规则检测器RC,基于时序指标数据告警阈值区间,对目标时序指标数据进行异动检测。
2.根据权利要求1所述的装置,其特征在于,还包括标注工具LT,用于对异动事件进行对应系统和异常时间窗口标注。
3.根据权利要求2所述的装置,其特征在于,还包括预警单元AU,用于获取RC的异动检测结果,将异动检测结果进行信息推送;并且将相关异动模型发送给LT标注工具,进行标注分析。
4.根据权利要求3所述的装置,其特征在于,还包括:
消息队列MQ,用于获取各个分布式监控客户端上报的时序指标数据,并进行队列化处理。
5.根据权利要求4所述的装置,其特征在于,还包括:
时序数据库TSDB,用于从MQ模块的主题中归档时序指标并存储。
6.根据权利要求5所述的装置,其特征在于,还包括:
事件库ED,用于存储事件的相关信息。
7.根据权利要求6所述的装置,其特征在于,离线学习单元OLU,进一步用于:
根据ED中新增异常时间窗口标注事件的触发,获取对应新增的事件属性,事件属性包括对应的系统模块和影响的范围,时间窗口为TF;更新计算所述对应的系统模块的可用率
Figure FDA0001919454700000024
Figure FDA0001919454700000025
选择离线分析的时序窗口Tw,TF∈Tw
根据Tw时间窗口,生成异动标注值;正常状态时序点的异动标注值为0,异常时序点的异动标注值为1,得到N维度的异动标注值序列数据W=[w1,w2…wn],且wi为0或1,N为总时序点数为;
根据Tw时间窗口,从TSDB中遍历对应的时序指标数据,得到时序指标数据在Tw时间窗口内的异动标注值序列Y=[y1,y2…yn];
若Y内异动标注值为周期性趋势时,则通过对Q个周期的时序数据集合生成U=[μ12…μn],其中μi为Q序列中的对应时序点的中位数或者平均;若Y内异动标注值为平稳性指标时,则Ui中的μi值相同为固定常数;
结合Ui对Y内异动标注值进行Cramer分解,得到yi=μii,其中μi为确定性影响,εi随机不确定性干扰,得到εi=yii序列E;
计算向量W和E的相关性γ:
Figure FDA0001919454700000021
将γ满足预设条件的时序指标数据纳入高敏时序指标数据集合。
8.根据权利要求7所述的装置,其特征在于,异常模型AM,进一步用于:
时序指标数据yi告警阈值区间的正常阈值区间为
Figure FDA0001919454700000022
Figure FDA0001919454700000023
CN201811587478.3A 2018-12-25 2018-12-25 基于时间标注的指标异动检测预警的装置 Active CN111367747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811587478.3A CN111367747B (zh) 2018-12-25 2018-12-25 基于时间标注的指标异动检测预警的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811587478.3A CN111367747B (zh) 2018-12-25 2018-12-25 基于时间标注的指标异动检测预警的装置

Publications (2)

Publication Number Publication Date
CN111367747A true CN111367747A (zh) 2020-07-03
CN111367747B CN111367747B (zh) 2023-07-04

Family

ID=71209734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811587478.3A Active CN111367747B (zh) 2018-12-25 2018-12-25 基于时间标注的指标异动检测预警的装置

Country Status (1)

Country Link
CN (1) CN111367747B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967719A (zh) * 2020-07-21 2020-11-20 珠海格力电器股份有限公司 一种检测指标的更新方法和装置
CN112256526A (zh) * 2020-10-14 2021-01-22 中国银联股份有限公司 基于机器学习的数据实时监控方法以及装置
CN115134246A (zh) * 2021-03-22 2022-09-30 中国移动通信集团河南有限公司 网络性能指标监控方法、装置、设备和存储介质
CN115190023A (zh) * 2021-03-23 2022-10-14 中移(上海)信息通信科技有限公司 组态管理策略处理方法、装置及通信设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317681A (zh) * 2014-09-02 2015-01-28 上海交通大学 针对计算机系统的行为异常自动检测方法及检测系统
CN106557401A (zh) * 2016-10-13 2017-04-05 中国铁道科学研究院电子计算技术研究所 一种it设备监控指标的动态阈值设定方法及系统
CN107301118A (zh) * 2017-06-15 2017-10-27 中国科学院计算技术研究所 一种基于日志的故障指标自动标注方法与系统
CN108038040A (zh) * 2017-12-08 2018-05-15 上海市信息网络有限公司 计算机集群性能指标检测方法、电子设备及存储介质
CN108229760A (zh) * 2018-02-08 2018-06-29 北京航空航天大学 面向灾害预测的不等间距时间序列异常趋势分析方法
CN108320810A (zh) * 2018-04-11 2018-07-24 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质
JP2018147442A (ja) * 2017-03-09 2018-09-20 沖電気工業株式会社 変化点検出装置および変化点検出方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317681A (zh) * 2014-09-02 2015-01-28 上海交通大学 针对计算机系统的行为异常自动检测方法及检测系统
CN106557401A (zh) * 2016-10-13 2017-04-05 中国铁道科学研究院电子计算技术研究所 一种it设备监控指标的动态阈值设定方法及系统
JP2018147442A (ja) * 2017-03-09 2018-09-20 沖電気工業株式会社 変化点検出装置および変化点検出方法
CN107301118A (zh) * 2017-06-15 2017-10-27 中国科学院计算技术研究所 一种基于日志的故障指标自动标注方法与系统
CN108038040A (zh) * 2017-12-08 2018-05-15 上海市信息网络有限公司 计算机集群性能指标检测方法、电子设备及存储介质
CN108229760A (zh) * 2018-02-08 2018-06-29 北京航空航天大学 面向灾害预测的不等间距时间序列异常趋势分析方法
CN108320810A (zh) * 2018-04-11 2018-07-24 平安科技(深圳)有限公司 疾病异常数据检测方法及装置、计算机装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KYLE HUNDMAN,VALENTINO CONSTANTINOU,CHRISTOPHER LAPORTE,IAN COLWELL,TOM SODERSTROM: "Detecting spacecraft anomalies using lstms and nonparametric dynamic thresholding" *
王伟: "基于时间序列的噪声监测点异常发现" *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967719A (zh) * 2020-07-21 2020-11-20 珠海格力电器股份有限公司 一种检测指标的更新方法和装置
CN112256526A (zh) * 2020-10-14 2021-01-22 中国银联股份有限公司 基于机器学习的数据实时监控方法以及装置
CN112256526B (zh) * 2020-10-14 2024-02-23 中国银联股份有限公司 基于机器学习的数据实时监控方法以及装置
CN115134246A (zh) * 2021-03-22 2022-09-30 中国移动通信集团河南有限公司 网络性能指标监控方法、装置、设备和存储介质
CN115134246B (zh) * 2021-03-22 2023-07-21 中国移动通信集团河南有限公司 网络性能指标监控方法、装置、设备和存储介质
CN115190023A (zh) * 2021-03-23 2022-10-14 中移(上海)信息通信科技有限公司 组态管理策略处理方法、装置及通信设备
CN115190023B (zh) * 2021-03-23 2023-09-19 中移(上海)信息通信科技有限公司 组态管理策略处理方法、装置及通信设备

Also Published As

Publication number Publication date
CN111367747B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
CN111367747A (zh) 基于时间标注的指标异动检测预警的装置
US7437281B1 (en) System and method for monitoring and modeling system performance
CN107086944B (zh) 一种异常检测方法和装置
CN108052528B (zh) 一种存储设备时序分类预警方法
CN111045894B (zh) 数据库异常检测方法、装置、计算机设备和存储介质
US7197428B1 (en) Method for performance monitoring and modeling
US11012289B2 (en) Reinforced machine learning tool for anomaly detection
CN110134566A (zh) 一种基于标签技术的云环境下信息系统性能监测方法
CN108959004B (zh) 磁盘故障预测方法、装置、设备及计算机可读存储介质
CN114297036B (zh) 数据处理方法、装置、电子设备及可读存储介质
US7369967B1 (en) System and method for monitoring and modeling system performance
CN116049146B (zh) 一种数据库故障处理方法、装置、设备及存储介质
WO2021002780A1 (ru) Система мониторинга качества и процессов на базе машинного обучения
US7617313B1 (en) Metric transport and database load
CN114978956A (zh) 智慧城市网络设备性能异常突变点检测方法及装置
CN113868953A (zh) 工业系统中多机组运行优化方法、装置、系统及存储介质
WO2023115856A1 (zh) 一种任务异常告警方法及装置
Zhu et al. Solar power ramp event forewarning with limited historical observations
US20210099894A1 (en) Forcasting time series data
CN110363381B (zh) 一种信息处理方法和装置
WO2019019429A1 (zh) 一种虚拟机异常检测方法、装置、设备及存储介质
CN114978877A (zh) 一种异常处理方法、装置、电子设备及计算机可读介质
CN114564345A (zh) 一种服务器异常检测方法、装置、设备及存储介质
Lingrand et al. Optimization of jobs submission on the EGEE production grid: modeling faults using workload
RU2632124C1 (ru) Способ прогнозной оценки эффективности многоэтапных процессов

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant