CN114966304A - 故障定位方法、装置及电子设备 - Google Patents
故障定位方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114966304A CN114966304A CN202210383983.6A CN202210383983A CN114966304A CN 114966304 A CN114966304 A CN 114966304A CN 202210383983 A CN202210383983 A CN 202210383983A CN 114966304 A CN114966304 A CN 114966304A
- Authority
- CN
- China
- Prior art keywords
- index
- abnormal
- fault
- target
- target service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/081—Locating faults in cables, transmission lines, or networks according to type of conductors
- G01R31/086—Locating faults in cables, transmission lines, or networks according to type of conductors in power transmission or distribution networks, i.e. with interconnected conductors
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00002—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by monitoring
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Abstract
本申请实施例提供了一种故障定位方法、装置及电子设备,该方法包括:获取目标对象提供的目标服务的指标,所述目标对象与所述目标服务相对应,所述指标与所述目标服务相对应;对所述指标的指标值进行监测,确定异常指标;确定与所述异常指标对应的异常目标服务;定位所述异常目标服务对应的目标对象为故障对象。
Description
技术领域
本申请涉及强电网技术领域,尤其涉及一种故障定位方法、装置及电子设备。
背景技术
IT系统是一种接地系统,其中,字母I表示电源端所有带电部分不接地或有一点通过阻抗接地,字母T表示电源端有一点直接接地。
在一些场景下,大型的IT系统中,如果某个节点或节点中的某个网元发生故障,这个故障会波及到相邻的网元或者相邻节点中的其他网元,从而引发IT系统产生大量、重复、有用或无用的告警信息。为了保证IT系统能快速的恢复正常工作状态,如何快速且准确的找到发生故障的节点或网元是本领域技术人员需要解决的技术问题。
发明内容
本申请实施例的目的是提供一种故障定位方法、装置及电子设备,能够快速的从大量的告警信息中准确的找到发生故障的节点或网元,保证IT系统能快速的恢复正常工作状态。
为了解决上述技术问题,本申请实施例是这样实现的:
第一方面,本申请实施例提供了一种故障定位方法,包括:获取目标对象提供的目标服务的指标,所述目标对象与所述目标服务相对应,所述指标与所述目标服务相对应;对所述指标的指标值进行监测,确定异常指标;确定与所述异常指标对应的异常目标服务;定位所述异常目标服务对应的目标对象为故障对象。
第二方面,本申请实施例提供了一种故障定位装置,包括:获取模块,用于获取目标对象提供的目标服务的指标,所述目标对象与所述目标服务相对应,所述指标与所述目标服务相对应;监测模块,用于对所述指标的指标值进行监测,确定异常指标;确定模块,用于确定与所述异常指标对应的异常目标服务定位模块,用于定位所述异常目标服务对应的目标对象为故障对象。
第三方面,本申请实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线;其中,所述处理器、所述通信接口以及所述存储器通过通信总线完成相互间的通信;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序,实现如第一方面所提到的故障定位方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如第一方面所提到的故障定位方法步骤。
以上本申请实施例提供的技术方案,通过获取目标对象提供的目标服务的指标,所述目标对象与所述目标服务相对应,所述指标与所述目标服务相对应;对所述指标的指标值进行监测,确定异常指标;确定与所述异常指标对应的异常目标服务;定位所述异常目标服务对应的目标对象为故障对象,能够对各个目标服务对应的指标进行监测,从而确定出异常指标,再确定出异常指标对应的异常目标服务,即可定位异常目标服务对应的目标对象为故障对象,能够快速且准确的找到发生故障的节点或网元,而无需从大量的告警信息中定位发生故障的节点或网元,提高了故障定位的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的故障定位方法的第一种流程示意图;
图2为本申请实施例提供的故障定位方法的第二种流程示意图;
图3为本申请实施例提供的故障定位装置的模块组成示意图;
图4为本申请实施例提供的电子设备的结构示意图。
具体实施方式
本申请实施例提供了一种故障定位方法、装置及电子设备,能快速的从大量的告警信息中准确的找到发生故障的节点或网元,保证IT系统能快速的恢复正常工作状态。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
示例性的,如图1所示,本申请实施例提供一种故障定位方法,该方法的执行主体可以为服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,而且,该服务器可以是能够进行故障定位的服务器,该故障定位方法具体可以包括以下步骤:
在步骤S101中,获取与目标服务对应的指标。
其中,目标对象与目标服务相对应,指标与目标服务相对应。
具体来讲,对于IT系统而言,从IT系统能够提供的业务层面,按照用户的需求,设置涉及影响IT系统稳定运行的关键指标集合。从IT系统能够提供的业务层面来讲,包括业务请求量、业务类型等,针对不同的业务按照一个业务逻辑所经过的网元或节点的数量设定指标的数量,每一个指标对应该网元或该节点所能提供的服务,该指标的指标值可以为该服务运行时所产生的服务数据的数据量,也可以为该服务运行的运行时长。以业务请求量为例,假设IT系统提供的一个业务逻辑经过4个网元或节点,则设定4个业务指标,根据业务逻辑的先后顺序对上述的4个指标进行编号。其中,4个网元或节点依次提供服务A、服务B、服务C和服务D,对应的指标分别为指标A、指标B、指标C和指标D,对各个指标依次进行编号分别为001、002、003和004。其中,目标对象可以为网元和/或节点。
对于不同的指标,设定对应的采集规则,如对于业务请求量而言,按照1分钟一个采样点的频率统计各个指标每1分钟内的业务请求总量。在采集到各个指标数据之后进行存储,并生成各个指标的指标数据随时间实时变化的动态趋势线。
提取每个指标在与当前时间段类型相同的历史数据,其中,时间段类型可以分为工作时间或节假日时间,得到每个指标的历史数据之后,采用自学习算法,根据每个指标的历史数据的时间序列的季节性、周期性等因素,基于自相关系数、偏相关系数的关联分析方法,对上述的各个指标的指标数据随时间变化的动态趋势线动态生成各指标随时间运行的合理的上限范围和下限范围。如此,由于季节、节假日、以及其它因素的影响,仅采用单一的上限阈值和下限阈值的方法,可能会造成误警,导致告警的结果不准确,而采用本方案,上限和下限采用浮动区间的方式,降低了误警率,提高了告警的准确度。
在步骤S103中,对指标的指标值进行监测,确定异常指标。
具体来讲,可以预先设定对IT系统的异常监测规则(预定义规则),根据该异常监测规则,对各个指标值进行监测,从而确定出异常指标。
其中,对指标的指标值进行监测,确定异常指标包括以下之一:
对指标的指标值异常时的连续异常时间进行监测,在连续异常时间超出预设时长的情况下,确定指标为异常指标。也就是说,根据指标的连续异常时间进行判断,当监测指标的指标值连续异常的时间超过预设时长时,则确定该指标异常,并生成告警数据;并记录该指标异常时所处的时间区间。其中,指标的指标值异常指的是指标值不处于上述实施例中合理的上限范围、下限范围。
其中,可以基于各个指标在与当前时间段类型相同的历史数据作为样本数据,绘制参考对比基线,其中,可以将在历史N天内同一采集点的指标值的平均值作为基准值,结合浮动区间评估模型得到上浮动范围(上限范围)和下浮动范围(下限范围),结合基准值、上限范围和下限范围得到各个指标的正常变化区间,即该正常变化区间为上限范围中的上限值至下限范围中的下限值之间的区间,以正常变化区间为参考,判断指标是否异常,从而进一步确定IT系统是否处于异常状态。如此,各个指标的合理的上限范围和下限范围是基于与当前时间类型相同的样本数据进行计算得到的,因此,更能够符合各个业务场景,提高了定位异常指标的准确度,也进一步提高了故障定位的精确度。
例如,某个指标的指标值超越上浮动范围连续9分钟(或连续3个采样点)或低于下浮动范围连续9分钟(或连续3个采样点),则认为该指标异常,该指标对应的服务异常,提供该服务的网元或节点异常。当该指标异常时,所处的时间区间即为异常时间区间。
进一步,如果该指标的实时变化的指标值超出正常变化区间之外的持续时间未超过预设时长或者采样点数非常少量,则认为产生瞬间的异常突变,在确定该指标并非异常指标。
对指标的指标值异常时的变化趋势进行监测,在变化趋势指示指标的指标值与指标值的正常变化区间之间的误差,在误差逐渐增大时,确定指标为异常指标。也就是说根据指标的异常趋势进行判断,即当指标值超出上限范围或下限范围时,持续判断该指标的变化趋势,指标的变化趋势可以通过以下方式确定:获取指标的当前指标值与指标上限值/指标下限值的差的绝对值,本申请实施例中将该绝对值记录为t,以及上一个周期采集的指标值与指标上限值/指标下限值的差的绝对值,本申请实施例中将该绝对值记录为t-1。其中,“/”表示相除,若t<t-1,则认为误差在逐渐减小,此时确定该指标不是异常指标,不产生告警数据;若t>=t-1,则确定当前指标为异常指标,产生该指标告警信息。
其中,指标的指标值超出正常变化区间的指标为异常指标,正常变化区间是基于指标在与当前时间段一致的历史时间段的历史数据得到的。
在步骤S105中,确定与异常指标对应的异常目标服务。
具体来讲,在确定异常指标后,根据指标和服务的映射关系,确定出该异常指标对应的异常目标服务。
在步骤S107中,定位异常目标服务对应的目标对象为故障对象。
具体来讲,在确定异常目标服务之后,根据异常目标服务和目标对象的映射关系,确定出与该异常目标服务对应的目标对象为故障对象。
通过本申请实施例公开的技术方案,能够对各个目标服务对应的指标进行监测,从而确定出异常指标,再确定出异常指标对应的异常目标服务,即可定位异常目标服务对应的目标对象为故障对象,能够快速且准确的找到发生故障的节点或网元,而无需从大量的告警信息中定位发生故障的节点或网元,提高了故障定位的效率。
在一种可能的实现方式中,在定位异常目标服务对应的目标对象为故障对象之后,方法还包括:生成与故障对象对应的告警信息。即在确定故障对象之后,生成与该故障对象对应的告警信息,能够提高告警信息生成的准确性,减少生成其他一些不必要的告警信息,便于相关人员从告警信息中快速的查找到故障网元或节点,提高了对网元或节点的定位效率,进一步提高了故障处理效率。
示例性的,如图2所示,本申请实施例提供一种故障定位方法,该方法的执行主体可以为服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,而且,该服务器可以是能够进行故障定位的服务器,该故障定位方法具体可以包括以下步骤:
在步骤S201中,获取目标对象提供的目标服务的指标。
其中,目标对象与目标服务相对应,指标与目标服务相对应。
在步骤S203中,对指标的指标值进行监测,确定异常指标。
在步骤S204中,将各异常指标输入至故障关联模型,通过故障关联模型识别各异常指标之间的关联关系;根据关联关系从各异常指标中确定目标异常指标。
其中,目标异常指标为引起其余异常指标异常的根源指标。
具体来讲,根据IT系统中故障的因果关系或关联关系,根据故障关联模型识别各个异常指标之间是否有关联关系,故障关联模型可以采用FP-growth算法训练得到。更为具体的,查找第一指标异常事件数据集,第一指标异常事件数据集中的每个异常指标发生的次数进行统计,对第一指标异常事件数据集中的异常指标按照发生的次数降序排列,得到第二指标异常事件数据集,对第二指标异常事件数据集构建FP树,对于FP树中的每一个异常指标,获取该异常指标对应的条件模式基,之后递归调用FP-growth算法,得到所有异常指标的频繁模式,如果各个异常指标之间的信息交互的次数超出阈值,则说明各个异常指标之间的交互频繁,便可以确定各异常指标之间的关联关系。
例如,假定该目标服务有4个指标,分别为指标A、指标B、指标C和指标D,在这4个指标中有指标B、指标C和指标D这三个指标异常,根据异常指标的故障关联模型,将这三个指标进行汇聚和显性处理,确定这三个指标之间是否有关联性。
在得到上述各个异常指标之间的关联关系之后,可以对IT系统出现的故障进行定位,达到汇聚告警的效果。例如,根据上述计算得到的指标B、指标C和指标D之间的关联关系,确定指标C和指标D指标出现异常的原因是因为指标B出现异常,而指标B是针对目标服务B进行的监控,通过汇聚和显性处理,可以快速定位到是服务B出现异常,不用耗费时间在服务C和服务D上面,从而达到汇聚告警,并快速定位影响IT系统稳定运行的关键问题。
在步骤S205中,确定与目标异常指标对应的异常目标服务。
在步骤S207中,定位异常目标服务对应的目标对象为故障对象。
值得注意的是,步骤S201、步骤S203、步骤S205和步骤S207具有相同或类似的实现方式,相同之处可以互相参照,本申请实施例在此不再赘述。
通过本申请实施例公开的技术方案,能够对各个目标服务对应的指标进行监测,从而确定出异常指标,再确定出异常指标对应的异常目标服务,即可定位异常目标服务对应的目标对象为故障对象,能够快速且准确的找到发生故障的节点或网元,而无需从大量的告警信息中定位发生故障的节点或网元,提高了故障定位的效率,保证IT系统稳定运行。此外,基于各个异常指标的关联关系查找到目标异常指标,可以进一步快速定位到故障源,提高了故障处理效率。
对应上述实施例提供的故障定位方法,基于相同的技术构思,本申请实施例还提供了一种故障定位装置,图3本申请实施例提供的故障定位装置的模块组成示意图,该故障定位装置用于执行上述实施例描述的故障定位方法,如图3所示,该故障定位装置300包括:获取模块301,用于获取目标对象提供的目标服务的指标,目标对象与目标服务相对应,指标与目标服务相对应;监测模块302,用于对指标的指标值进行监测,确定异常指标;确定模块303,用于确定与异常指标对应的异常目标服务;定位模块304,用于定位异常目标服务对应的目标对象为故障对象。
通过本申请实施例公开的技术方案,能够对各个目标服务对应的指标进行监测,从而确定出异常指标,再确定出异常指标对应的异常目标服务,即可定位异常目标服务对应的目标对象为故障对象,能够快速且准确的找到发生故障的节点或网元,而无需从大量的告警信息中定位发生故障的节点或网元,提高了故障定位的效率。
在一种可能的实现方式中,故障定位装置300还包括:生成模块,用于生成与故障对象对应的告警信息。
在一种可能的实现方式中,故障定位装置300还包括:识别模块,用于将各异常指标输入至故障关联模型,通过故障关联模型识别各异常指标之间的关联关系。确定模块303,还用于根据关联关系从各异常指标中确定目标异常指标,目标异常指标为引起其余异常指标异常的根源指标。确定模块303,还用于确定与目标异常指标对应的异常目标服务。
在一种可能的实现方式中,确定模块303,还用于对指标的指标值异常时的连续异常时间进行监测,在连续异常时间超出预设时长的情况下,确定指标为异常指标。
在一种可能的实现方式中,确定模块303,还用于对指标的指标值异常时的变化趋势进行监测,在变化趋势指示指标的指标值与指标值的正常变化区间之间的误差,在误差逐渐增大时,确定指标为异常指标。
在一种可能的实现方式中,指标的指标值超出正常变化区间的指标为异常指标,正常变化区间是基于指标在与当前时间段一致的历史时间段的历史数据得到的。
本申请实施例提供的故障定位装置能够实现上述故障定位方法对应的实施例中的各个过程,且具有相同或类似的有益效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例提供的故障定位装置与本申请实施例提供的故障定位方法基于同一申请构思,故障定位装置和故障定位方法基于同一申请构思,因此该实施例的具体实施可以参见前述故障定位方法的实施,且具有相同或类似的有益效果,重复之处不再赘述。
对应上述实施例提供的故障定位方法,基于相同的技术构思,本申请实施例还提供了一种电子设备,该电子设备用于执行上述的故障定位方法,图4为实现本申请各个实施例的一种电子设备的结构示意图,如图4所示。电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器401和存储器402,存储器402中可以存储有一个或一个以上存储应用程序或数据。其中,存储器402可以是短暂存储或持久存储。存储在存储器402的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对电子设备中的一系列计算机可执行指令。
更进一步地,处理器401可以设置为与存储器402通信,在电子设备上执行存储器402中的一系列计算机可执行指令。电子设备还可以包括一个或一个以上电源403,一个或一个以上有线或无线网络接口404,一个或一个以上输入输出接口405,一个或一个以上键盘406。
具体在本实施例中,电子设备包括有处理器、通信接口、存储器和通信总线;其中,处理器、通信接口以及存储器通过总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现以上方法实施例中的各个步骤,且具有以上方法实施例所具有的有益效果,为避免重复,本申请实施例在此不再赘述。
本实施例中还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现以上方法实施例中的各个步骤,且具有以上方法实施例所具有的有益效果,为避免重复,本申请实施例在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,电子设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、装置或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种故障定位方法,其特征在于,所述故障定位方法包括:
获取目标对象提供的目标服务的指标,所述目标对象与所述目标服务相对应,所述指标与所述目标服务相对应;
对所述指标的指标值进行监测,确定异常指标;
确定与所述异常指标对应的异常目标服务;
定位所述异常目标服务对应的目标对象为故障对象。
2.根据权利要求1所述的故障定位方法,其特征在于,在所述定位所述异常目标服务对应的目标对象为故障对象之后,所述方法还包括:
生成与所述故障对象对应的告警信息。
3.根据权利要求1所述的故障定位方法,其特征在于,所述异常指标为多个,在所述对所述指标的指标值进行监测,确定异常指标之后,所述方法还包括:
将各所述异常指标输入至故障关联模型,通过所述故障关联模型识别各所述异常指标之间的关联关系;
根据所述关联关系从各所述异常指标中确定目标异常指标,所述目标异常指标为引起其余异常指标异常的根源指标;
所述确定与所述异常指标对应的异常目标服务包括:
确定与所述目标异常指标对应的异常目标服务。
4.根据权利要求1所述的故障定位方法,其特征在于,对所述指标的指标值进行监测,确定异常指标包括:
对所述指标的指标值异常时的连续异常时间进行监测,在所述连续异常时间超出预设时长的情况下,确定所述指标为异常指标。
5.根据权利要求1所述的故障定位方法,其特征在于,对所述指标的指标值进行监测,确定异常指标包括:
对所述指标的指标值异常时的变化趋势进行监测,在所述变化趋势指示所述指标的指标值与指标值的正常变化区间之间的误差,在所述误差逐渐增大时,确定所述指标为异常指标。
6.根据权利要求5所述的故障定位方法,其特征在于,所述指标的指标值超出所述正常变化区间的指标为异常指标,所述正常变化区间是基于所述指标在与当前时间段一致的历史时间段的历史数据得到的。
7.一种故障定位装置,其特征在于,所述故障定位装置包括:
获取模块,用于获取目标对象提供的目标服务的指标,所述目标对象与所述目标服务相对应,所述指标与所述目标服务相对应;
监测模块,用于对所述指标的指标值进行监测,确定异常指标;
确定模块,用于确定与所述异常指标对应的异常目标服务;
定位模块,用于定位所述异常目标服务对应的目标对象为故障对象。
8.根据权利要求7所述的故障定位装置,其特征在于,所述故障定位装置还包括:
生成模块,用于生成与所述故障对象对应的告警信息。
9.一种电子设备,包括处理器、通信接口、存储器和通信总线,其特征在于,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信,所述存储器,用于存放计算机程序,所述处理器,用于执行所述存储器上所存放的程序,实现如权利要求1-6任意一项所述的故障定位方法步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-6任意一项所述的故障定位方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210383983.6A CN114966304A (zh) | 2022-04-13 | 2022-04-13 | 故障定位方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210383983.6A CN114966304A (zh) | 2022-04-13 | 2022-04-13 | 故障定位方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114966304A true CN114966304A (zh) | 2022-08-30 |
Family
ID=82978422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210383983.6A Pending CN114966304A (zh) | 2022-04-13 | 2022-04-13 | 故障定位方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114966304A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110166264A (zh) * | 2018-02-11 | 2019-08-23 | 北京三快在线科技有限公司 | 一种故障定位方法、装置及电子设备 |
CN110955575A (zh) * | 2019-11-14 | 2020-04-03 | 国网浙江省电力有限公司信息通信分公司 | 一种基于关联分析模型的业务系统故障定位方法 |
CN112559300A (zh) * | 2020-12-14 | 2021-03-26 | 中国工商银行股份有限公司 | 一种故障原因确定系统、方法及装置 |
CN112947364A (zh) * | 2021-01-29 | 2021-06-11 | 上海工程技术大学 | 一种基于大数据预警配电站设备故障的系统及方法 |
CN113271224A (zh) * | 2021-05-17 | 2021-08-17 | 中国邮政储蓄银行股份有限公司 | 节点的定位方法、装置、存储介质及电子装置 |
CN113590429A (zh) * | 2021-08-18 | 2021-11-02 | 北京爱奇艺科技有限公司 | 一种服务器故障诊断方法、装置及电子设备 |
-
2022
- 2022-04-13 CN CN202210383983.6A patent/CN114966304A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110166264A (zh) * | 2018-02-11 | 2019-08-23 | 北京三快在线科技有限公司 | 一种故障定位方法、装置及电子设备 |
CN110955575A (zh) * | 2019-11-14 | 2020-04-03 | 国网浙江省电力有限公司信息通信分公司 | 一种基于关联分析模型的业务系统故障定位方法 |
CN112559300A (zh) * | 2020-12-14 | 2021-03-26 | 中国工商银行股份有限公司 | 一种故障原因确定系统、方法及装置 |
CN112947364A (zh) * | 2021-01-29 | 2021-06-11 | 上海工程技术大学 | 一种基于大数据预警配电站设备故障的系统及方法 |
CN113271224A (zh) * | 2021-05-17 | 2021-08-17 | 中国邮政储蓄银行股份有限公司 | 节点的定位方法、装置、存储介质及电子装置 |
CN113590429A (zh) * | 2021-08-18 | 2021-11-02 | 北京爱奇艺科技有限公司 | 一种服务器故障诊断方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110661659B (zh) | 一种告警方法、装置、系统及电子设备 | |
CN108833184B (zh) | 服务故障定位方法、装置、计算机设备及存储介质 | |
CN111092757B (zh) | 一种异常数据的检测方法、系统及设备 | |
CN111600746B (zh) | 网络故障定位方法、装置及设备 | |
CN109034423B (zh) | 一种故障预警判定的方法、装置、设备及存储介质 | |
CN114465870B (zh) | 告警信息的处理方法及装置、存储介质和电子设备 | |
CN114595210A (zh) | 一种多维数据的异常检测方法、装置及电子设备 | |
CN110858072B (zh) | 设备运行状态的确定方法及装置 | |
CN105183619A (zh) | 一种系统故障预警方法和系统 | |
CN113641526A (zh) | 告警根因定位方法、装置、电子设备及计算机存储介质 | |
CN112583944B (zh) | 一种更新域名证书的处理方法和装置 | |
CN116149926A (zh) | 业务指标的异常监测方法、装置、设备及存储介质 | |
CN115658441B (zh) | 一种基于日志的家政业务系统异常监控方法、设备及介质 | |
CN115495274B (zh) | 基于时序数据的异常处理方法、网络设备和可读存储介质 | |
CN114966304A (zh) | 故障定位方法、装置及电子设备 | |
CN115690681A (zh) | 异常判断依据的处理方法、异常判断方法及装置 | |
CN112527610A (zh) | 设备运作状态的监测方法及装置 | |
CN114500249B (zh) | 一种根因定位方法和装置 | |
CN113162801B (zh) | 一种告警分析方法、装置及存储介质 | |
CN112732517B (zh) | 一种磁盘故障告警方法、装置、设备及可读存储介质 | |
CN115567366A (zh) | 网络故障影响的分析方法、装置、存储介质及电子设备 | |
CN114356722A (zh) | 用于服务器集群的监控告警方法、系统、设备及存储介质 | |
CN112737120B (zh) | 区域电网控制报告的生成方法、装置和计算机设备 | |
CN111581044A (zh) | 集群优化方法、装置、服务器及介质 | |
CN113468384A (zh) | 网络情报源信息的处理方法、装置、存储介质及处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |