CN111327443B - 一种故障根源指标确定方法及装置 - Google Patents

一种故障根源指标确定方法及装置 Download PDF

Info

Publication number
CN111327443B
CN111327443B CN201811541597.5A CN201811541597A CN111327443B CN 111327443 B CN111327443 B CN 111327443B CN 201811541597 A CN201811541597 A CN 201811541597A CN 111327443 B CN111327443 B CN 111327443B
Authority
CN
China
Prior art keywords
index
correlation coefficient
value
period
preset threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811541597.5A
Other languages
English (en)
Other versions
CN111327443A (zh
Inventor
朱世翔
杨英苹
王霖
陈霞
王伟坚
杜礼
张兆雄
欧洋洋
李鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Beijing Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Beijing Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811541597.5A priority Critical patent/CN111327443B/zh
Publication of CN111327443A publication Critical patent/CN111327443A/zh
Application granted granted Critical
Publication of CN111327443B publication Critical patent/CN111327443B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis

Abstract

本发明公开了一种故障根源指标确定方法及装置。该方法包括:获取预设周期内告警的第一指标以及所述第一指标的指标值;获取所述预设周期内与所述第一指标关联的第二指标以及所述第二指标的指标值;所述第二指标与所述第一指标的第一相关性系数大于第一预设阈值;若第一差值大于第二预设阈值,则确定所述第二指标属于故障根源指标;所述第一差值为所述第一相关性系数的绝对值减去所述第二指标在所述预设周期的前一个未发生告警的周期内与所述第一指标的第二相关性系数的绝对值的差值。

Description

一种故障根源指标确定方法及装置
技术领域
本发明涉及业务支撑领域,尤其涉及一种故障根源指标确定方法及装置。
背景技术
随着业务的高速发展和系统技术的进步,特别是云计算、容器、分布式组件等开源技术的快速普及,运维管理系统中基础设施即服务(IaaS,Infrastructure as a Service)层、平台即服务(PaaS,Platform-as-a-Service)层、软件即服务(SaaS,Software-as-a-Service)层等各层级中设备、模块、组件、应用、业务等运维对象的规模不断扩大,从而导致监控指标和告警的种类和数量都在急剧增长。同时由于各运维对象之间的相互关联影响,当一个层级的一个或多个指标的运行状态发生异常并触发告警时,会导致不同层级的多个相关联对象的指标也随之产生告警。因此,确定出导致一个指标告警的异常根源指标,至关重要。
现有技术中,当一个指标告警时,没有确定与该指标关联的某个指标是否为导致该指标告警的指标的方法。
发明内容
本申请实施例提供了一种故障根源指标确定方法,解决了现有技术中没有确定与该指标关联的某个指标是否为导致该指标告警的指标的方法的问题。
本发明实施例提供一种故障根源指标确定方法,包括:
获取预设周期内告警的第一指标以及所述第一指标的指标值;
获取所述预设周期内与所述第一指标关联的第二指标以及所述第二指标的指标值;所述第二指标与所述第一指标的第一相关性系数大于第一预设阈值;
若第一差值的绝对值大于第二预设阈值,则确定所述第二指标属于故障根源指标;所述第一差值为所述第一相关性系数减去所述第二指标在所述预设周期的前一个未发生告警的周期内与所述第一指标的第二相关性系数的差值。
可选的,在所述第一指标告警时刻的预设时间段内,若收到所述第二指标的告警通知,则确定所述第二指标属于故障根源指标。
可选的,若所述第一相关性系数小于或等于第一预设阈值,或者所述第一差值的绝对值小于或等于第二预设阈值,则确定所述第一指标属于故障根源指标。
可选的,所述第一预设阈值为0.5;所述第二预设阈值为0.3。
可选的,所述第一相关性系数和所述第二相关性系数是根据皮尔逊Pearson相关性算法确定的。
本发明实施例中,根据在预设周期内告警的第一指标,先获取预设周期内与第一指标的第一相关性系数大于第一预设阈值的第二指标,再确定出预设周期的前一周期内第二指标与第一指标的第二相关性系数,再根据第一差值与第二预设阈值的关系,确定第二指标是否为故障根源指标,由于相关性系数是根据数学统计规律确定的量,因此确定出的故障根源指标的可靠性较高。
本发明实施例提供一种故障根源指标确定装置,包括:
获取模块,用于获取预设周期内告警的第一指标以及所述第一指标的指标值;以及用于获取所述预设周期内与所述第一指标关联的第二指标以及所述第二指标的指标值;所述第二指标与所述第一指标的第一相关性系数大于第一预设阈值;
处理模块,用于若第一差值大于第二预设阈值,则确定所述第二指标属于故障根源指标;所述第一差值为所述第一相关性系数的绝对值减去所述第二指标在所述预设周期的前一个未发生告警的周期内与所述第一指标的第二相关性系数的绝对值的差值。
可选的,所述处理模块还用于:
在所述第一指标告警时刻的预设时间段内,若收到所述第二指标的告警通知,则确定所述第二指标属于故障根源指标。
可选的,所述处理模块还用于:
若所述第一相关性系数小于或等于第一预设阈值,或者所述第一差值的绝对值小于或等于第二预设阈值,则确定所述第一指标属于故障根源指标。
可选的,所述第一预设阈值为0.5;所述第二预设阈值为0.3。
可选的,所述第一相关性系数和所述第二相关性系数是根据皮尔逊Pearson相关性算法确定的。
附图说明
图1为本发明实施例提出的一种故障根源指标确定方法对应的步骤流程图;
图2为本发明实施例提出的一种故障根源指标确定方法对应的分析示意图;
图3为本发明实施例提出的一种故障根源指标确定方法对应的具体步骤流程图;
图4为本发明实施例提出的一种故障根源指标确定装置对应的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互结合。
随着业务的高速发展和系统技术的进步,特别是云计算、容器、分布式组件等开源技术的快速普及,运维管理系统中基础设施即服务(IaaS,Infrastructure as a Service)层、平台即服务(PaaS,Platform-as-a-Service)层、软件即服务(SaaS,Software-as-a-Service)层等各层级中设备、模块、组件、应用、业务等运维对象的规模不断扩大,从而导致监控指标和告警的种类和数量都在急剧增长。同时由于各运维对象之间的相互关联影响,当一个层级的一个或多个指标的运行状态发生异常并触发告警时,会导致不同层级的多个相关联对象的指标也随之产生告警。因此,确定出导致一个指标告警的异常根源指标,至关重要。
当一个指标告警时,没有确定与该指标关联的某个指标是否为导致该指标告警的指标的方法是一个亟待解决的问题。
如图1所示,为本发明实施例提出的一种故障根源指标确定方法对应的步骤流程图。
步骤101:获取预设周期内告警的第一指标以及所述第一指标的指标值。
步骤102:获取所述预设周期内与所述第一指标关联的第二指标以及所述第二指标的指标值。
所述第二指标与所述第一指标的第一相关性系数大于第一预设阈值。
步骤103:若第一差值的绝对值大于第二预设阈值,则确定所述第二指标属于故障根源指标。
所述第一差值为所述第一相关性系数的绝对值减去所述第二指标在所述预设周期的前一个未发生告警的周期内与所述第一指标的第二相关性系数的绝对值的差值。
需要说明的是,步骤101~103仅以第二指标为例,还可以对多个指标都做对第二指标一样的处理。
步骤101中,运维管理系统会检验系统各项指标是否正常,如果某一项指标出现异常,则运维管理系统会收到该项指标的告警。第一指标即是运维管理系统收到告警的指标。具体地,生成该指标的为一个资源实例,资源实例包括很多数据,举例来说,用于该项指标对应业务的资源数据,资源实例包括的数据称为资源实例数据。第一指标对应的资源实例数据设为第一资源实例数据。第一资源实例数据包括第一指标以及所述第一指标的指标值,还可能包括其他指标以及相应指标值。
运维管理系统会预设一个周期作为检验指标数据是否正常的周期,当一个指标出现异常时,运维管理系统会获取该指标值。需要说明的是,第一资源实例数据每个指标的指标值在每个周期内都可能发生变化,如果一个周期内一个指标的指标值发生变化,一种可选的取值方式为,将该周期内该指标的平均值,作为该周期内的指标值。
步骤102中,由于各个资源实例之间都可能存在资源数据、业务逻辑上的交互或关联。在第一资源实例数据成为告警数据后,运维管理系统获取与第一资源实例数据关联的至少一个资源实例数据。所述至少一个资源实例数据包括至少一个指标以及所述至少一个指标中每个指标的指标值,将所述至少一个指标,作为第一指标集合。需要说明的是,至少一个指标可以为至少一个资源实例数据中所有指标或部分指标。第二指标为第一指标集合中第一相关性系数大于第一预设阈值的一个指标。第一预设阈值为在运维管理系统经过多次实验结果设置的值,举例来说,第一预设阈值设为0.5。
可选的,将所述预设周期内所述第一指标集合中与第一指标的相关性系数的绝对值大于第一预设阈值的指标,作为第二指标集合。也就是说,第二指标可以为第二指标集合中的任一集合。
确定相关性系数一种可行的实施方式为,借助皮尔逊Pearson相关性算法,计算所述第一指标集合中每个指标与第一指标的相关性系数,Pearson相关性算法公式如下:
Figure BDA0001908291220000051
其中ρ为相关系数,xi、yi是两个随机变量。
ρ可以达到+1或-1,ρ的绝对值越大,相关性越强,当ρ的绝对值在第一预设阈值以上时,属于强相关性。两个随机变量分别为X、Y(也可以看做两个集合),它们的元素个数均为K,两个随即变量取的第i(1<=i<=K)个值分别用Xi、Yi表示。对X、Y进行排序(同时为升序或降序),得到两个元素排行集合x、y,其中元素xi、yi分别为Xi在X中的排行以及Yi在Y中的排行。
步骤103中,如果预设周期的前一周期内,第一指标仍然发生告警,则查看更前一周期的第一指标的状态,直到第一指标没有发生告警的周期,再计算第一指标与第二指标的第二相关性系数。
若第一差值大于第二预设阈值,说明第二指标的波动较大,指标值出现了异常,因此确定所述第二指标属于故障根源指标。可选的,第二预设阈值为0.3。
可选的,在所述第一指标告警时刻的预设时间段内,若收到所述第二指标的告警通知,则确定所述第二指标属于故障根源指标。
可选的,若所述第一相关性系数小于或等于第一预设阈值,或者所述第一差值小于或等于第二预设阈值,则确定所述第一指标属于故障根源指标。
具体地,从所述第二指标集合中确定故障根源指标的一种可选的实施方式如下:
根据所述第一资源实例数据和所述至少一个资源实例数据确定出的所述预设周期内以及所述预设周期之前N个周期的每个周期内所述第一指标与所述第一指标集合中每个指标的相关性系数,从所述第一指标中确定故障根源指标。所述故障根源指标为导致所述第一指标告警的指标,N为正整数。
具体地,根据所述第二指标集合中每个指标在所述N个周期中每个周期内与所述第一指标的相关性系数,与该指标与所述第一指标在所述预设周期内的相关性系数的差值,确定该指标是否属于所述故障根源指标。
需要说明的是,第一指标集合中与第一指标的相关性系数的绝对值大于第一预设阈值的指标,为与第一指标相关性较大的指标,因此导致第一指标异常的故障根源指标在第二集合中。
在确定了强相关的第二指标集合的基础上,比较第二指标集合中每个指标与第一指标在本周期的相关性系数,以及在本周期之前的N个周期内的相关性系数,根据二者差值,确定每个指标是否属于故障根源指标。
在该实施方式下,可选的,若第二指标与所述第一指标的相关性系数在所述N个周期内有M个或M个以上的周期满足,与所述第二指标与所述第一指标在所述预设周期内的相关性系数的差值的绝对值大于第二预设阈值,则确定所述第二指标属于所述故障根源指标;否则,确定所述第二指标不属于所述故障根源指标;所述第二指标为所述第二指标集合中任一指标;M为正整数。
需要说明的是,当N个周期内有M个周期内满足上述条件,举例来说,第二预设阈值为0.2,运维管理系统认为该指标波动较大,属于故障根源指标。N与M的取值可根据具体的业务情景来设定。举例来说,对于第二指标集合中任一指标,当N为100时,设置当100个周期内满足上述条件的周期达到30%以上,则确定该指标属于故障根源指标,即M为30。也可以设置为,当N大于100时,无论N为多少,M只要大于30,也确定该指标属于故障根源指标。
或者,可选的,确定所述第二指标集合中每个指标在所述预设周期的前一周期内与所述第一指标的相关性系数,若该相关性系数与该指标与所述第一指标在所述预设周期内的相关性系数的差值的绝对值大于第三预设阈值,则确定该指标属于所述故障根源指标;否则,确定该指标不属于所述故障根源指标。
需要说明的是,该方式下,只考虑第二指标集合中每个指标在所述预设周期内与第一指标的相关性系数,与在预设周期的前一周期内与第一指标的相关性系数的差值,当该差值的绝对值大于第三预设阈值时,运维管理系统认为指标骤变,出现异常,无需判断其他周期内的相关性系数,即可确定该指标是不是属于故障根源指标。
如图2所示,为本发明实施例提出的一种故障根源指标确定方法对应的分析示意图。
设目标告警数据为A,A发生时间为T,相关性系数计算取值时长为T0,相关性系数为r,A对应的监控指标为K1,相关指标为K2,K2对应的资源实例数据为B,告警相关时长为t。T0取值为30分钟,t取值为正负10分钟,具体T0、t根据数据采集粒度调整。
规则i:计算[T-T0,T]时段内K1和K2的相关性系数记为r1,通过r1的取值大小来判断K1和K2两个指标间的相关性大小,如果|r1|>0.5,判定K1和K2强相关。对所有相关指标计算r1值,判断与K1强相关的指标范围;
规则ii:计算预设周期的前一个未发生告警的周期[T-T0,T]内K1和K2的相关性系数记为r2。如果预设周期的前一个周期内K1发生告警,需要再向前一天查询K1的状态,直至一个周期内[T-T0,T]时段内K1无告警才可采用。比较r1和r2,如果r1和r2均为正或者均为负,且|r1-r2|>0.3,则判定K2指标波动为告警A的根源所在,即K2为故障根源指标。类似地,对所有强相关的指标计算相应的r2值,判断其他的故障根源指标。
规则iii:查询[T-t,T+t]时段内与K2指标的告警情况,如果该时段内存在K2指标的告警,则判定K2指标波动为告警A的根源所在,即K2为故障根源指标。类似地,对所有强相关的指标计算相应的r2值,判断其他的故障根源指标。
如图3所示,为本发明实施例提出的一种故障根源指标确定方法对应的具体步骤流程图。
步骤301:接收到外部系统发送过来的目标告警数据。
目标告警数据指示出了发生告警的指标即第一指标以及第一指标的指标值。
步骤302:根据目标告警数据,提取目标告警数据所在的资源实例数据。
目标告警数据属于一个资源实例数据的一部分,当一个资源实例数据的指标发生告警时,这个资源实例数据都要被提取。
步骤303:提取与资源实例数据关联的至少一个资源实例数据。
资源实例数据被提取后,与该资源实例数据相关联的资源实例数据也被提取,需要说明的是,资源实例数据之间的关联关系是由资源管理系统记录的。
步骤304:提取至少一个资源实例数据的所有指标,作为第一指标集合。
也就是说,第一指标集合为与第一指标对应的资源实例数据关联的资源实例数据中所有指标的集合。
步骤305:根据第一指标集合中各指标以及指标值,分别计算第一指标与第一指标集合中每个指标的相关性系数ri,确定第一指标集合中是否存在ri值的绝对值大于0.5的指标,若存在,则将该指标作为第二指标集合。
需要说明的是,第一指标和第一指标集合中的每个指标都对应一个相关性系数ri,i代表各个指标的编号。
如不存在,执行步骤307。
步骤306:分别计算前一正常周期的第一指标与第二指标集合中每个指标之间的相关性系数ri’,用ri’的绝对值减去ri的绝对值,确定第一差值是否大于0.3,若大于,则判定该指标为故障根源指标。
如第二指标集合中不存在故障根源指标,执行步骤307。
需要说明的是,前一正常周期是指,在该周期之前距离该周期最近未发生告警的那个周期。
步骤307:查询第一指标告警发生时刻的预设时段内,第一指标集合中是否存在发生告警的指标,若存在,则判定该指标为故障根源指标。
若不存在,执行步骤309。
预设时段是在告警发生时刻的一个时间范围,举例来说,在告警发生时刻的前十分钟至后十分钟。
步骤308:将判定为故障根源指标的指标输出。
步骤309:结束流程。
本发明实施例中,根据在预设周期内告警的第一资源实例数据,确定与所述第一资源实例数据关联的至少一个资源实例数据,再根据在预设周期以及之前N个周期内,至少一个资源实例数据中每个指标与第一指标的相关性系数,确定出导致第一指标告警的故障根源指标,相关性系数是根据数学统计规律确定的量,因此确定出的故障根源指标的可靠性较高。
如图4所示,为本发明实施例提出的一种故障根源指标确定装置对应的结构示意图。
本发明实施例提供一种故障根源指标确定装置,包括:
获取模块401,用于获取预设周期内告警的第一指标以及所述第一指标的指标值;以及用于获取所述预设周期内与所述第一指标关联的第二指标以及所述第二指标的指标值;所述第二指标与所述第一指标的第一相关性系数大于第一预设阈值;
处理模块402,用于若第一差值大于第二预设阈值,则确定所述第二指标属于故障根源指标;所述第一差值为所述第一相关性系数的绝对值减去所述第二指标在所述预设周期的前一个未发生告警的周期内与所述第一指标的第二相关性系数的绝对值的差值。
可选的,所述处理模块402还用于:
在所述第一指标告警时刻的预设时间段内,若收到所述第二指标的告警通知,则确定所述第二指标属于故障根源指标。
可选的,所述处理模块402还用于:
若所述第一相关性系数小于或等于第一预设阈值,或者所述第一差值的绝对值小于或等于第二预设阈值,则确定所述第一指标属于故障根源指标。
可选的,所述第一预设阈值为0.5;所述第二预设阈值为0.3。
可选的,所述第一相关性系数和所述第二相关性系数是根据皮尔逊Pearson相关性算法确定的。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种故障根源指标确定方法,其特征在于,包括:
获取预设周期内告警的第一指标以及所述第一指标的指标值;
获取所述预设周期内与所述第一指标关联的第二指标以及所述第二指标的指标值;所述第二指标与所述第一指标的第一相关性系数大于第一预设阈值;
若第一差值大于第二预设阈值,则确定所述第二指标属于故障根源指标;所述第一差值为所述第一相关性系数的绝对值减去所述第二指标在所述预设周期的前一个未发生告警的周期内与所述第一指标的第二相关性系数的绝对值的差值;
在所述第一指标告警时刻的预设时间段内,若收到所述第二指标的告警通知,则确定所述第二指标属于故障根源指标。
2.如权利要求1所述的方法,其特征在于,还包括:
若所述第一相关性系数小于或等于第一预设阈值,或者所述第一差值的绝对值小于或等于第二预设阈值,则确定所述第一指标属于故障根源指标。
3.如权利要求1-2任一所述的方法,其特征在于,包括:
所述第一预设阈值为0.5;所述第二预设阈值为0.3。
4.如权利要求1-2任一所述的方法,其特征在于,包括:
所述第一相关性系数和所述第二相关性系数是根据皮尔逊Pearson相关性算法确定的。
5.一种故障根源指标确定装置,其特征在于,包括:
获取模块,用于获取预设周期内告警的第一指标以及所述第一指标的指标值;以及用于获取所述预设周期内与所述第一指标关联的第二指标以及所述第二指标的指标值;所述第二指标与所述第一指标的第一相关性系数大于第一预设阈值;
处理模块,用于若第一差值大于第二预设阈值,则确定所述第二指标属于故障根源指标;所述第一差值为所述第一相关性系数的绝对值减去所述第二指标在所述预设周期的前一个未发生告警的周期内与所述第一指标的第二相关性系数的绝对值的差值;在所述第一指标告警时刻的预设时间段内,若收到所述第二指标的告警通知,则确定所述第二指标属于故障根源指标。
6.如权利要求5所述的装置,其特征在于,所述处理模块还用于:
若所述第一相关性系数小于或等于第一预设阈值,或者所述第一差值的绝对值小于或等于第二预设阈值,则确定所述第一指标属于故障根源指标。
7.如权利要求5-6任一所述的装置,其特征在于,所述第一预设阈值为0.5;所述第二预设阈值为0.3。
8.如权利要求5-6任一所述的装置,其特征在于,所述第一相关性系数和所述第二相关性系数是根据皮尔逊Pearson相关性算法确定的。
CN201811541597.5A 2018-12-17 2018-12-17 一种故障根源指标确定方法及装置 Active CN111327443B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811541597.5A CN111327443B (zh) 2018-12-17 2018-12-17 一种故障根源指标确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811541597.5A CN111327443B (zh) 2018-12-17 2018-12-17 一种故障根源指标确定方法及装置

Publications (2)

Publication Number Publication Date
CN111327443A CN111327443A (zh) 2020-06-23
CN111327443B true CN111327443B (zh) 2022-11-22

Family

ID=71172588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811541597.5A Active CN111327443B (zh) 2018-12-17 2018-12-17 一种故障根源指标确定方法及装置

Country Status (1)

Country Link
CN (1) CN111327443B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015090098A1 (zh) * 2013-12-20 2015-06-25 中兴通讯股份有限公司 一种实现故障定位的方法及装置
CN107463486A (zh) * 2017-07-05 2017-12-12 东软集团股份有限公司 系统性能分析方法、装置及服务器
CN108009040A (zh) * 2017-12-12 2018-05-08 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10198339B2 (en) * 2016-05-16 2019-02-05 Oracle International Corporation Correlation-based analytic for time-series data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015090098A1 (zh) * 2013-12-20 2015-06-25 中兴通讯股份有限公司 一种实现故障定位的方法及装置
CN107463486A (zh) * 2017-07-05 2017-12-12 东软集团股份有限公司 系统性能分析方法、装置及服务器
CN108009040A (zh) * 2017-12-12 2018-05-08 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质

Also Published As

Publication number Publication date
CN111327443A (zh) 2020-06-23

Similar Documents

Publication Publication Date Title
CN107871190B (zh) 一种业务指标监控方法及装置
CN107528722B (zh) 一种时间序列中异常点检测方法及装置
CN109815084B (zh) 异常识别方法、装置和电子设备及存储介质
CN107066365B (zh) 一种系统异常的监测方法及装置
US10354197B2 (en) Pattern analytics for real-time detection of known significant pattern signatures
RU2017118317A (ru) Система и способ автоматического расчета кибер-риска в бизнес-критических приложениях
US9524223B2 (en) Performance metrics of a computer system
CN104778111A (zh) 一种进行报警的方法和装置
CN111045894B (zh) 数据库异常检测方法、装置、计算机设备和存储介质
US20170139759A1 (en) Pattern analytics for real-time detection of known significant pattern signatures
CN109088775B (zh) 异常监控方法、装置以及服务器
US20170185464A1 (en) Detecting flapping in resource measurements
CN108984376B (zh) 一种系统异常检测方法、装置及设备
US11620539B2 (en) Method and device for monitoring a process of generating metric data for predicting anomalies
US9600391B2 (en) Operations management apparatus, operations management method and program
US20130041710A1 (en) Advanced Statistical Detection of Emerging Trends
CN109597746B (zh) 故障分析方法及装置
WO2015171860A1 (en) Automatic alert generation
CN110222936B (zh) 一种业务场景的根因定位方法、系统及电子设备
CN110275992B (zh) 应急处理方法、装置、服务器及计算机可读存储介质
CN110971435A (zh) 一种报警方法及装置
CN111327443B (zh) 一种故障根源指标确定方法及装置
CN110457185B (zh) 一种异常报警方法、装置及电子设备
CN110738327B (zh) 一种快充桩设备风险评估方法及系统
CN115774646A (zh) 一种进程预警方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant