CN106941423A - 故障原因定位方法及装置 - Google Patents
故障原因定位方法及装置 Download PDFInfo
- Publication number
- CN106941423A CN106941423A CN201710239607.9A CN201710239607A CN106941423A CN 106941423 A CN106941423 A CN 106941423A CN 201710239607 A CN201710239607 A CN 201710239607A CN 106941423 A CN106941423 A CN 106941423A
- Authority
- CN
- China
- Prior art keywords
- fault type
- type
- fault
- failure
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0604—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种故障原因定位方法及装置,属于网络技术领域。方法包括:根据当前发生的业务故障的多项告警信息,获取业务故障的多种故障类型;根据每种故障类型被其他故障类型所引起的关联概率,对每种故障类型单独作用时引起业务故障的第一概率进行调整,得到每种故障类型的第二概率;基于第二概率符合预设输出规则的目标故障类型所对应的告警信息,输出故障原因定位信息。通过根据该多种故障类型之间的关联关系,对该多种故障类型的第一概率进行调整,可从该多种故障类型中排除掉被其他故障类型所引起的故障类型,输出最有可能导致业务故障的故障原因定位信息,提高了故障原因定位的准确性和智能性。
Description
技术领域
本发明涉及网络技术领域,特别涉及一种故障原因定位方法及装置。
背景技术
在网络系统运行的过程中,网络系统的各种业务很可能会出现各种各样的故障,运维人员需要对引起业务故障的原因进行定位,以便解决故障,从而保证网络系统的正常运行。
现有技术中,配合网络系统设置有不同种类的告警系统,比如,用于监测网络故障的网络告警系统、用于监测主机故障的主机告警系统等。当告警系统监测到相应的故障时,会生成包含故障原因信息的告警信息。运维人员通过查看各个告警系统的告警信息,获知可能导致业务故障的原因,然后,根据经验对可能导致业务故障的原因进行分析,并通过测试逐一排查以定位引起业务故障的真正原因。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
在对故障原因进行定位的过程中,运维人员需要熟悉各个告警系统,才能能够准确理解告警系统的告警信息,并且,当网络系统产生多种故障时,多种故障之间可能是具有关联的,比如由于故障A引起的故障B,而运维人员在分析故障原因的过程中,无法直接获知这种关联,而只能根据自身经验逐一测试排查来定位故障原因,这个过程需要消耗很长的时间,因此,定位效率低、智能性差。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种故障原因定位方法及装置。所述技术方案如下:
第一方面,提供了一种故障原因定位方法,所述方法包括:
根据当前发生的业务故障的多项告警信息,获取所述业务故障的多种故障类型;
根据每种故障类型的关联概率,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率;
基于目标故障类型所对应的告警信息,输出故障原因定位信息,所述目标故障类型为所述每种故障类型中第二概率符合预设输出规则的故障类型;
其中,所述关联概率用于指示所述每种故障类型被所述多种故障类型中其他故障类型所引起的概率,所述第一概率用于指示所述每种故障类型单独作用时引起所述业务故障的概率;所述第二概率用于指示所述每种故障类型在所述多种故障类型共同作用时引起所述业务故障的概率。
第二方面,提供了一种故障原因定位方法,所述方法包括:
获取当前发生的业务故障的多项告警信息;
基于故障分析模型,对所述多项告警信息进行分析,得到所述业务故障的故障类型,所述故障分析模型由历史故障数据训练得到,所述历史故障数据包括历史业务故障发生时接收到的告警信息以及所确定的故障类型;
基于所述故障类型所对应的告警信息,输出故障原因定位信息。
第三方面,提供了一种故障原因定位装置,所述装置包括:
获取模块,用于根据当前发生的业务故障的多项告警信息,获取所述业务故障的多种故障类型;
调整模块,用于根据每种故障类型的关联概率,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率;
输出模块,用于基于目标故障类型所对应的告警信息,输出故障原因定位信息,所述目标故障类型为所述每种故障类型中第二概率符合预设输出规则的故障类型;
其中,所述关联概率用于指示所述每种故障类型被所述多种故障类型中其他故障类型所引起的概率,所述第一概率用于指示所述每种故障类型单独作用时引起所述业务故障的概率;所述第二概率用于指示所述每种故障类型在所述多种故障类型共同作用时引起所述业务故障的概率。
第四方面,提供了一种故障原因定位装置,所述装置包括:
第一获取模块,用于获取当前发生的业务故障的多项告警信息;
分析模块,用于基于故障分析模型,对所述多项告警信息进行分析,得到所述业务故障的故障类型,所述故障分析模型由历史故障数据训练得到,所述历史故障数据包括历史业务故障发生时接收到的告警信息以及所确定的故障类型;
输出模块,用于基于所述故障类型所对应的告警信息,输出故障原因定位信息。
本发明实施例提供的技术方案带来的有益效果是:
通过当前发生业务故障的多项告警信息,能够得到可能导致业务故障的多种故障类型,并根据该多种故障类型之间的关联关系,对该多种故障类型单独导致该业务故障的概率进行调整,从而可以从该多种故障类型中排除掉一些被其他故障类型所引起的故障类型,最终输出最有可能导致该业务故障的故障类型所对应的故障原因定位信息,提高了故障原因定位的准确性和智能性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的实施环境架构图;
图2是本发明实施例提供的一种故障原因定位方法的流程图;
图3是本发明实施例提供的一种故障类型之间的关联概率的表示方式;
图4本发明实施例提供的一种各个故障类型之间优先级的有向图表示示意图;
图5是本发明实施例提供的一种故障原因定位信息的输出示意图;
图6是本发明实施例提供的一种故障原因定位方法的逻辑分层示意图;
图7是本发明实施例提供的一种故障原因定位方法的流程图;
图8是本发明实施例提供的一种故障原因定位装置的框图;
图9是本发明实施例提供的一种故障原因定位装置的框图;
图10是本发明实施例提供的一种故障原因定位装置的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1为本发明的实施环境架构图,其中,网络系统100用于提供多种业务的服务,该多种业务可以为游戏业务、网络直播业务、电商类业务等,其中,对于每一种业务还可以进行细分,比如,可以将游戏业务分为网页游戏业务和手机游戏业务等,本实施例对业务种类的划分方式不作限定。
在网络系统中,每一种业务对应一个或多个网络节点101,每个网络节点配置有一个或多个用于为该业务提供服务的业务服务器1011。配合网络系统设置有不同种类的告警系统,比如,用于监测网络故障的网络告警系统、用于监测各种服务器的主机故障的主机告警系统,用于监测各种业务关联的进程故障的进程告警系统等。该不同种类的告警系统部署在网络系统中的各个节点,用于对网络系统中各个网络节点进行故障监测。
网络系统中还包括管理服务器102,该管理服务器102上配置有智能故障定位系统,该管理服务器可以与各种告警系统以及各个网络节点的业务服务器进行通信,以获取业务故障时的告警信息,并通过图2所提供的故障原因定位方法,对业务故障的原因进行定位。
图2是本发明实施例提供的一种故障原因定位方法的流程图,参见图2,本发明实施例提供的方法流程包括:
201、根据当前发生的业务故障的多项告警信息,获取该业务故障的多种故障类型。
在本发明实施例中,对于当前发生的业务故障,管理服务器可以从各种告警系统拉取该业务对应的告警信息,或者由各个告警系统在监测到故障时,生成各自的告警信息,并将该告警信息上报至管理服务器。该告警信息中包括可能引起业务故障的故障原因信息,故障原因信息可以包括发生故障的时间、发生故障的网络节点信息以及故障描述信息,比如,一条故障原因信息的举例可以为:
“发生时间:2016年11月29日上午11时;
网络节点信息:河北省到上海徐汇节点15中国电信;
故障描述信息:网络平均延迟33.63毫秒,丢包率4.54%”。
在本发明实施例中,管理服务器可以配置有故障原因信息与故障类型的对应关系,当获取到该业务故障的多项告警信息时,对于每项告警信息,管理服务器可以提取每项告警信息所包含的故障原因信息,对于每个故障原因信息,获取与该故障原因信息对应的故障类型,得到该业务故障的多种故障类型。需要说明的是,该多种故障类型是指可能引起该业务故障的故障类型。
202、根据每种故障类型的关联概率,确定每种故障类型引起业务故障的衰减因子。
在本发明实施例中,故障类型可以包括交换机异常、主机系统异常、用户到机房网络异常、主机ping不可达、主机IO告警、机房内网网络异常以及业务进程异常等。当然,还可以对故障类型进行更细粒度的划分,比如上述交换机异常还可以包括交换机负载异常和交换机接口异常等,本实施例对故障类型的划分不作限定。
其中,不同的故障类型之间可能具有一定的关联关系,本实施例中采用关联概率来表示一种故障类型与该多种故障类型中其他故障类型的关联关系,该关联概率表示一种故障类型被该业务故障的多种故障类型中其他故障类型所引起的概率。需要说明的是,如果某种故障类型不能够被另一种故障类型引起,则说明该种故障类型与该另一种故障类型之间没有关联关系,该两种故障类型之间也不存在关联概率。
例如,故障类型A必然会引起故障类型B,也即是发生A类型的故障必然会发生B类型的故障,比如,交换机异常必然导致主机ping不可达等,则故障类型B相对于故障类型A的关联概率可以记为P(B|A)等于1。假如,故障类型C为机房内网网络异常,则由于机房内网网络异常可能导致主机ping不可达,假设该概率为50%,则故障类型B相对于故障类型C的关联概率可以记为P(B|C)等于0.5。该P(B|A)和P(B|C)均为故障类型B的关联概率,也即是,当一种故障类型能够被该多种故障类型中两种或两种以上的故障类型引起时,该种故障类型的关联概率为包括两个或两个以上概率的一组概率。
本发明实施例中,可以预先对各种故障类型的关联概率进行统计,比如,可以根据经验进行统计,或者通过对历史关联数据进行统计得到,例如,对于任一种故障类型,该种故障类型的历史关联数据可以为:该种故障类型发生时,其他故障类型也发生的记录。通过对该种故障类型的一定数目的记录的统计,可以得到该种故障类型与其他故障类型之间的关联概率。本实施例中,可以采用关联矩阵的方式来表示每种故障类型的关联概率,如图3所示为一种故障类型之间的关联概率的表示方式,图中以故障类型A至故障类型F为例示出,矩阵的行标识被引起的故障类型,矩阵的列表示引起的故障类型,行和列交叉元素的数值表示行所指示的故障类型被列所指示的故障类型引起的概率。其中,如果两个故障类型之间没有关联关系,那么该两个故障类型交叉元素的数值可以为默认值或者为空值等。本实施例中,管理服务器可以采用多种形式来存储该矩阵所表示的故障类型的关联关系,比如以链表的方式存储等,本实施例对此不作限定。
在本发明实施例中,当引起业务故障的故障类型为多种时,为了能够准确定位真正导致业务故障的故障类型,可以根据该多种故障类型之间的关联关系,确定每种故障类型的衰减因子,该过程可以为:根据每种故障类型的关联概率,确定每种故障类型的优先级;按照优先级从高到低的顺序,依次确定每种故障类型的衰减因子。其中,在按照优先级从高到低的顺序,确定第一故障类型的衰减因子的过程中,根据第二故障类型的衰减因子和第一故障类型被第二故障类型引起的关联概率,确定第一故障类型的衰减因子。
其中,其中,第一故障类型为该多种故障类型中的任一种故障类型,第二故障类型为该多种故障类型中优先级高于第一故障类型的故障类型。
例如,可以按照优先级从高到低的顺序,采用如下公式(1)来确定每种故障类型的衰减因子:
其中,f(C)表示故障类型C的衰减因子,P(C|Fr)表示故障类型C被故障类型Fr引起的关联概率,f(Fr)表示故障类型Fr的衰减因子,m表示多种故障类型中引起故障类型C的故障类型的数目,∏为连乘符号。
其中,根据每种故障类型的关联概率,确定每种故障类型的优先级的过程可以为:如果多种故障类型中的第一故障类型能够引起多种故障类型中的第二故障类型,则将第一故障类型的优先级提高一个等级;如果多种故障类型中存在引起第一故障类型的第三故障类型,则将第三故障类型的优先级提高一个等级。
例如,该多种故障类型为故障类型A、故障类型B、故障类型C和故障类型D。假设各个故障类型的初始优先级都为0,由图2所示的矩阵可知,故障类型A能够引起故障类型B,且P(B|A)等于1,因此,故障类型A的优先级加1,等于1;故障类型C能够引起故障类型B,且P(B|C)等于0.5,因此,故障类型C的优先级加1,等于1,而故障类型C又能被故障类型A引起,且P(C|A)等于0.5,因此,故障类型A的优先级再加1,等于2,依次类推,得到故障类型A的优先级为3,故障类型B的优先级为0,故障类型C的优先级为2,故障类型D的优先级为0。根据优先级从高到低排序得到故障类型A、故障类型C、故障类型B和故障类型D。其中,优先级相等的故障类型的可以随机进行排序,图4为各个故障类型之间优先级的有向图表示示意图,其中,A指向B的箭头表示故障类型A引起故障类型B,箭头上的权值表示故障类型A相对于故障类型B的关联概率,图中,父节点的层级高于子节点的层级,层级越高的节点对应故障类型的优先级越高。
在得到故障类型的优先级排序后,管理服务器可以优先级从高到低的顺序依次获取每种故障类型的衰减因子。需要说明的是,对于多种故障类型中的每种故障类型,如果该种故障类型与其他故障类型中任一种故障类型之间均没有关联关系,即该种故障类型不能被其他故障类型所引起,则该种故障类型的衰减因子为1,否则故障类型的衰减因子小于1。
对于上述举例中,由于故障类型A不能被故障类型B、故障类型C和故障类型D引起,所以故障类型A与故障类型B、C、D之间均没有关联关系,因此,故障类型A的衰减因子为1,即f(A)=1。根据上述公式(1)可计算出故障类型C的衰减因子f(C)=(1-0.5)*f(A),得到f(C)=0.5;故障类型B的衰减因子f(B)=(1-1)*f(A)*(1-0.5)*f(C),得到f(B)=0;故障类型D的衰减因子f(D)=(1-0.2)*f(C),得到f(D)=0.4。
本发明实施例中,通过根据多种故障类型之间的关联关系,对故障类型进行优先级排序,并根据该优先级排序依次计算各种故障类型的衰减因子,保证了各种故障类型的衰减因子的准确性。比如,在实际应用过程中,会为每种故障类型的衰减因子设置一个初始值,比如该初始值可以为1,如果在计算故障类型B的衰减因子时,故障类型C还没有根据自身的关联概率得到实际的衰减因子,而此时,在计算故障类型B的衰减因子时,直接将故障类型C衰减因子的初始值代入,将导致计算结果不准确。
203、根据每种故障类型的衰减因子,对该故障类型的第一概率进行调整,得到该故障类型的第二概率。
其中,每种故障类型的第一概率用于指示每种故障类型单独作用时引起业务故障的概率;第二概率用于指示每种故障类型在该多种故障类型共同作用时引起业务故障的概率。
本发明实施例中,可以通过预设算法,对每种故障类型的第一概率和衰减因子进行处理,得到每种故障类型的第二概率。该预设算法可以为乘积算法,或者为其他衰减处理算法等,本实施例对此不作限定。其中,当故障类型的衰减因子小于1时,该故障类型的衰减因子用于对第一概率向数值更小的方向调整,从而得到第二概率,此时,第二概率小于第一概率。
其中,每种故障类型的第一概率可以根据经验统计得到,或者,通过收集历史反馈的故障数据,并对该故障数据进行统计分析得到,例如,对于同一业务,当该业务发生故障时,记录该业务的故障记录,该故障记录包括实际导致该业务故障的故障类型,由于可能每次导致该业务故障的故障类型会有所不同,因此,可以对该业务的故障记录进行分析,得到不同故障类型导致该业务故障的第一概率。管理服务器可以存储每种故障类型与第一概率之间的对应关系,根据该对应关系,管理服务器可以获取每种故障类型的第一概率。例如,每种故障类型与第一概率的对应关系可以如表1所示:
表1
故障类型 | 故障类型描述 | 第一概率 |
A | 交换机异常 | 0.8 |
B | 主机ping不可达 | 1 |
C | 机房内网网络异常 | 0.5 |
D | 业务进程异常 | 0.6 |
以表1所示的故障类型和第一概率的对应关系为例,假设以每种故障类型的第一概率和衰减因子的乘积作为每种故障类型的第二概率。结合步骤102中得到的故障类型A、故障类型B、故障类型C和故障类型D的衰减因子,可以得到故障类型A的第二概率P(A)=0.8*f(A)=0.8;故障类型B的第二概率P(B)=1*f(B)=0;故障类型C的第二概率P(C)=0.5*f(C)=0.25;故障类型D的第二概率P(D)=1*f(D)=0.24。
通过根据每种故障类型的衰减因子,对每种故障类型的第一概率进行调整,可以降低一些不太可能导致业务故障的故障类型的概率,该不太可能导致业务故障的故障类型是指能够被其他故障类型引起的故障类型。比如上述故障类型B、故障类型C和故障类型D,而且,不会降低最有可能导致业务故障的故障类型的概率,比如故障类型A,从而使得真正导致业务故障的故障类型凸显出来,以提高对业务故障的故障原因进行定位的准确性。
上述步骤202和203是根据每种故障类型的关联概率,对每种故障类型的第一概率进行调整,得到每种故障类型的第二概率的过程。
204、基于目标故障类型所对应的告警信息,输出故障原因定位信息,该目标故障类型为每种故障类型中第二概率符合预设输出规则的故障类型。
其中,预设输出规则可以为第二概率高于第一预设阈值,或者按照概率从高到低排序,排序靠前的预设数目个等。该第一预设阈值和该预设数目均可以由管理服务器进行预先设置或修改,本实施例对此不作限定。
比如,在一种实施方式中,在得到该多种故障类型中每种故障类型的第二概率之后,管理服务器可以将第二概率高于第一预设阈值的故障类型确定为目标故障类型。如果第二概率最高的指定故障类型的概率值高于第二预设阈值时,则直接将该指定故障类型确定为目标故障类型。该第二预设阈值可以大于该第一预设阈值。需要说明的是,在该种实施方式下,如果该多种故障类型中没有第二概率高于该预设阈值的故障类型,则可以对本次故障的相关信息进行记录,作为反向样本由运维人员进行参考和研究,以便对智能故障定位系统进行调整,比如,调整相关故障类型的第一概率,或者调整相关故障类型与其他故障类型之间的关联概率等。
在另一种实施方式中,在得到该多种故障类型中每种故障类型的第二概率之后,管理服务器可以按照第二概率从高到低的顺序,对该多种故障类型进行排序,将排序靠前的预设数目的故障类型确定为目标故障类型。其中,该预设数目可以为一个或多个。当然,该预设数目还可以根据故障类型的第二概率的高低来确定,比如,当第二概率最高的指定故障类型的概率值高于第二预设阈值时,确定该预设数目为1,也即该指定故障类型为目标故障类型。
本发明实施例中,管理服务器在确定目标故障类型之后,可以输出该业务故障的故障原因定位信息,该故障原因定位信息可以包括目标故障类型对应的故障原因信息。
例如,由于步骤201中管理服务器是通过告警信息得到的多种故障类型,告警信息中包含有相应的故障原因信息,因此,管理服务器可以将目标故障类型对应的告警信息所包含的故障原因信息作为故障原因定位信息输出,从而完成对业务故障的定位。
此外,为了使故障定位信息更加详细,除了故障原因定位信息除了包括输出故障原因信息之外,还可以包括业务名称,比如“**游戏业务”等,以及该业务所对应的业务服务器所在服务区域,比如“电信一区”等,还可以包括该业务故障的表象信息,比如“掉线500人”等。其中,管理服务器可以通过业务的配置信息,获取该业务所对应的业务服务器所在区域,比如,业务的配置信息可以包括该业务所对应业务服务器的地址信息,通过业务服务器的地址信息确定该服务器所属的服务区域,比如对应每个业务服务器的地址信息配置有该业务服务器所属的服务区域。图5即为一种业务故障的故障原因定位信息的输出示意图。
需要说明的是,管理服务器可以与在与本地连接的显示器上输出该故障原因定位信息,还可以根据故障原因定位信息,确定发生故障的网络节点,将该故障原因信息发送到管理该网络节点的工作站,由该工作站通过显示器输出该故障原因定位信息。当然,对应一个网络节点,还可以将该网络节点标识和管理该网络节点的工作人员的联系方式对应配置到管理服务器,该联系方式可以为电话号码、邮箱、即时通讯账号等,管理服务器可以通过短信、电话、邮件或者即时通讯消息等方式输出该故障原因定位信息,以使得工作人员能够及时获知当前发生了业务故障以及导致故障的原因。
本发明实施例中,工作人员可以根据故障原因定位信息,对业务故障进行修复,工作人员可以反馈修复结果,如果根据定位的故障原因对业务故障修复成功,可以通过本地工作站,针对该业务故障向管理服务器返回修复成功消息,否则返回修复失败消息。在另一实施例中,还提供了业务故障的自动修复服务,在对业务故障的原因进行定位之后,管理服务器还可以根据目标故障类型,确定该目标故障类型是否属于可自动修复故障类型,如果该目标故障类型属于可自动修复故障类型,管理服务器可以调用相应自动修复程序,对业务故障进行自动修复,并记录本次自动修复记录。
基于上述步骤201至步骤204,本发明实施例提供的故障原因定位方法从逻辑层的角度可以分为输入层,分析层和输出层,参见图6所示的一种故障原因定位方法的逻辑分层示意图,其中输入层用于执行步骤201,分析层用于执行步骤202和步骤203,输出层用于执行步骤204。
本发明实施例提供的方法,通过业务故障的多项告警信息得到可能导致业务故障的多种故障类型后,能够根据该多种故障类型之间的关联关系,比如一种故障类型可能是由于另一种故障类型引起等,对该每种故障类型单独导致该业务故障的概率进行调整,从而可以从该多种故障类型中排除掉一些被其他故障类型所引起的故障类型,最终输出最有可能导致该业务故障的原因,提高了故障原因定位的准确性和智能性。
需要说明的是,基于上述图2所示的故障原因定位方法,管理服务器可以对每一次故障的相关信息进行记录,得到历史故障数据。该历史故障数据包括每次故障对应的业务、涉及的多项告警信息、确定的导致业务故障的故障类型、故障原因定位信息、以及根据故障原因定位信息对业务故障进行修复的修复结果等。为了进一步地提高对业务故障进行定位的智能性,本实施例中可以将管理服务器记录的故障的相关信息作为样本,以对预设的神经网络进行训练,通过得到的故障分析模型对业务故障进行定位,详细过程参见图7所提供的实施例。
图7是本发明实施例提供的一种故障原因定位方法的流程图,参见图7,本发明实施例提供的方法流程包括:
701、获取当前发生的业务故障的多项告警信息。
在本发明实施例中,对于当前发生的业务故障,管理服务器可以从各种告警系统拉取该业务对应的告警信息,或者由各个告警系统在监测到故障时,生成告警信息,并将该告警信息上报至管理服务器。该告警信息中包括可能引起业务故障的故障原因信息,该故障原因信息与步骤201中故障原因信息包含的内容同理,在此不做赘述。
702、基于故障分析模型,对该多项告警信息进行分析,得到业务故障的故障类型。
其中,故障分析模型由历史故障数据训练得到,该过程可以为:管理服务器获取历史故障数据;根据历史故障数据,对预设神经网络模型进行训练,以调整预设神经网络模型中各个节点的参数值;将调整后的预设神经网络模型作为该故障分析模型。其中,管理服务器中配置有预设神经网络,该预设神经网络包括多个输入节点和多个输出节点,为了提高定位的准确性,该预设神经玩了个可以为3层或3层以上的神经网络,本实施例对此不作限定。其中,预设神经网络的各个节点均设置有一个初始的参数值,在训练的过程中可以对每个节点的参数值进行调整。其中,需要说明的是,在训练过程中各个节点的参数值处于可调整状态;当训练结束后,将各个节点的参数进行锁定,从而得到该故障分析模型,在利用故障分析模型进行故障原因定位时,不会再调整各个节点的参数值。
其中,需要说明的是,在训练过程中,管理服务器可以根据故障修复结果将历史故障数据划分为正样本数据和负样本数据,比如,将故障修复结果为修复城东的历史故障数据划分为正样本数据,将故障修复结果为修复失败的历史故障数据划分为负样本数据,当然,为了更好的扩展样本数据的范围,还可以对正样本数据对应的故障类型进行修改,得到负样本数据。
在得到故障分析模型之后,管理服务器可以将业务故障的告警信息作为该故障分析模型的输入,经过该故障分析模型的分析之后,输出最有可能导致该业务故障的一种或多种故障类型。
703、基于该业务故障的故障类型所对应的告警信息,输出故障原因定位信息。
该步骤与步骤204同理,在此不做赘述。
需要说明的是,历史故障数据可以存储在历史故障数据库中,在使用故障分析模型对业务故障的原因进行定位之后,还可以根据定位的故障相关信息对历史故障数据库进行扩充。管理服务器也可以根据扩充的历史故障数据库,对故障分析模型进行优化,例如,根据历史故障数据库中新增的历史故障数据,对故障分析模型进行训练,以对该故障分析模型各个节点的参数值进行调整,从而完成对故障分析模型的优化,提高故障分析模型的对故障原因定位的准确性。
本发明实施例提供的方法,通过历史故障数据对预设神经网络的训练,得到故障分析模型,当获取到业务故障的多项告警信息时,通过将该多项告警信息输入该故障分析模型,便可以直接得到该业务故障的故障类型,并输出相应的故障原因定位信息,从而进一步地提高了对业务故障进行定位的准确性和智能性。
图8是本发明实施例提供的一种故障原因定位装置的框图。参照图8,该装置包括获取模块801,调整模块802和输出模块803。
其中,获取模块801与调整模块802连接,用于根据当前发生的业务故障的多项告警信息,获取所述业务故障的多种故障类型;调整模块802与输出模块803连接,用于根据每种故障类型的关联概率,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率,所述关联概率用于指示所述每种故障类型被所述多种故障类型中其他故障类型所引起的概率,所述第一概率用于指示所述每种故障类型单独作用时引起所述业务故障的概率;所述第二概率用于指示所述每种故障类型在所述多种故障类型共同作用时引起所述业务故障的概率;输出模块803,用于基于目标故障类型所对应的告警信息,输出故障原因定位信息,所述目标故障类型为所述每种故障类型中第二概率符合预设输出规则的故障类型。
在一种可能的实现方式中,所述调整模块802包括:
确定子模块,用于根据所述每种故障类型的关联概率,确定所述每种故障类型引起所述业务故障的衰减因子;
调整子模块,用于根据所述每种故障类型衰减因子,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率。
在一种可能的实现方式中,对于所述多种故障类型中的每种故障类型,如果所述故障类型不能被所述多种故障类型中其他故障类型所引起,则所述故障类型的衰减因子为1,否则所述故障类型的衰减因子小于1。
在一种可能的实现方式中,所述确定子模块用于根据所述每种故障类型的关联概率,确定所述每种故障类型的优先级;按照优先级从高到低的顺序,依次确定所述每种故障类型的衰减因子;在按照所述顺序确定第一故障类型的衰减因子的过程中,根据第二故障类型的衰减因子和所述第一故障类型被所述第二故障类型引起的关联概率,确定所述第一故障类型的衰减因子;其中,所述第一故障类型为所述多种故障类型中的任一种故障类型,所述第二故障类型为所述多种故障类型中优先级高于所述第一故障类型的故障类型。
在一种可能的实现方式中,所述确定子模块用于如果所述多种故障类型中的第一故障类型能够引起所述多种故障类型中的第二故障类型,则将所述第一故障类型的优先级提高一个等级;如果所述多种故障类型中存在引起所述第一故障类型的第三故障类型,则将所述第三故障类型的优先级提高一个等级。
本发明实施例提供的装置,通过当前发生业务故障的多项告警信息,能够得到可能导致业务故障的多种故障类型,并根据该多种故障类型之间的关联关系,对该多种故障类型单独导致该业务故障的概率进行调整,从而可以从该多种故障类型中排除掉一些被其他故障类型所引起的故障类型,最终输出最有可能导致该业务故障的故障类型所对应的故障原因定位信息,提高了故障原因定位的准确性和智能性。
图9是本发明实施例提供的一种故障原因定位装置的框图。参照图9,该装置包括第一获取模块901,分析模块902和输出模块903。
其中,第一获取模块901与分析模块902连接,用于获取当前发生的业务故障的多项告警信息;分析模块902与输出模块903,用于基于故障分析模型,对所述多项告警信息进行分析,得到所述业务故障的故障类型,所述故障分析模型由历史故障数据训练得到,所述历史故障数据包括历史业务故障发生时接收到的告警信息以及所确定的故障类型;输出模块903,用于基于所述故障类型所对应的告警信息,输出故障原因定位信息。
在一种可能的实现方式中,所述装置还包括:
第二获取模块,用于获取所述历史故障数据;
训练模块,用于根据所述历史故障数据,对预设神经网络模型进行训练,以调整所述预设神经网络模型中各个节点的参数值;将调整后的所述预设神经网络模型作为所述故障分析模型。
本发明实施例提供的装置,通过历史故障数据对预设神经网络的训练,得到故障分析模型,当获取到业务故障的多项告警信息时,通过将该多项告警信息输入该故障分析模型,便可以直接得到该业务故障的故障类型,并输出相应的故障原因定位信息,从而进一步地提高了对业务故障进行定位的准确性和智能性。
需要说明的是:上述实施例提供的故障原因定位装置在定位故障原因时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的故障原因定位装置与故障原因定位方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图10是本发明实施例提供的一种故障原因定位装置的框图。例如,装置1000可以被提供为一服务器。参照图10,装置1000包括处理组件1022,其进一步包括一个或多个处理器,以及由存储器1032所代表的存储器资源,用于存储可由处理部件1022的执行的指令,例如应用程序。存储器1032中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件822被配置为执行指令,以执行上述故障原因定位方法实施例中管理服务器所执行的方法。
装置800还可以包括一个电源组件1026被配置为执行装置1000的电源管理,一个有线或无线网络接口1050被配置为将装置1000连接到网络,和一个输入输出(I/O)接口1058。装置800可以操作基于存储在存储器1032的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由管理服务器中的处理器执行以完成上述实施例中的故障原因定位方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (14)
1.一种故障原因定位方法,其特征在于,所述方法包括:
根据当前发生的业务故障的多项告警信息,获取所述业务故障的多种故障类型;
根据每种故障类型的关联概率,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率;
基于目标故障类型所对应的告警信息,输出故障原因定位信息,所述目标故障类型为所述每种故障类型中第二概率符合预设输出规则的故障类型;
其中,所述关联概率用于指示所述每种故障类型被所述多种故障类型中其他故障类型所引起的概率,所述第一概率用于指示所述每种故障类型单独作用时引起所述业务故障的概率;所述第二概率用于指示所述每种故障类型在所述多种故障类型共同作用时引起所述业务故障的概率。
2.根据权利要求1所述的方法,其特征在于,根据每种故障类型的关联概率,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率,包括:
根据所述每种故障类型的关联概率,确定所述每种故障类型引起所述业务故障的衰减因子;
根据所述每种故障类型的衰减因子,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率。
3.根据权利要求2所述的方法,其特征在于,对于所述多种故障类型中的每种故障类型,如果所述故障类型不能被所述多种故障类型中其他故障类型所引起,则所述故障类型的衰减因子为1,否则所述故障类型的衰减因子小于1。
4.根据权利要求2或3所述的方法,其特征在于,根据所述每种故障类型的关联概率,确定所述每种故障类型引起所述业务故障的衰减因子,包括:
根据所述每种故障类型的关联概率,确定所述每种故障类型的优先级;
按照优先级从高到低的顺序,依次确定所述每种故障类型的衰减因子;
在按照所述顺序确定第一故障类型的衰减因子的过程中,根据第二故障类型的衰减因子和所述第一故障类型被所述第二故障类型引起的关联概率,确定所述第一故障类型的衰减因子;
其中,所述第一故障类型为所述多种故障类型中的任一种故障类型,所述第二故障类型为所述多种故障类型中优先级高于所述第一故障类型的故障类型。
5.根据权利要求4所述的方法,其特征在于,根据所述每种故障类型的关联概率,确定所述每种故障类型的优先级,包括:
如果所述多种故障类型中的第一故障类型能够引起所述多种故障类型中的第二故障类型,则将所述第一故障类型的优先级提高一个等级;
如果所述多种故障类型中存在引起所述第一故障类型的第三故障类型,则将所述第三故障类型的优先级提高一个等级。
6.一种故障原因定位方法,其特征在于,所述方法包括:
获取当前发生的业务故障的多项告警信息;
基于故障分析模型,对所述多项告警信息进行分析,得到所述业务故障的故障类型,所述故障分析模型由历史故障数据训练得到,所述历史故障数据包括历史业务故障发生时接收到的告警信息以及所确定的故障类型;
基于所述故障类型所对应的告警信息,输出故障原因定位信息。
7.根据权利要求6所述的方法,其特征在于,获取当前发生的业务故障的多项告警信息之前,所述方法还包括:
获取所述历史故障数据;
根据所述历史故障数据,对预设神经网络模型进行训练,以调整所述预设神经网络模型中各个节点的参数值;
将调整后的所述预设神经网络模型作为所述故障分析模型。
8.一种故障原因定位装置,其特征在于,所述装置包括:
获取模块,用于根据当前发生的业务故障的多项告警信息,获取所述业务故障的多种故障类型;
调整模块,用于根据每种故障类型的关联概率,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率;
输出模块,用于基于目标故障类型所对应的告警信息,输出故障原因定位信息,所述目标故障类型为所述每种故障类型中第二概率符合预设输出规则的故障类型;
其中,所述关联概率用于指示所述每种故障类型被所述多种故障类型中其他故障类型所引起的概率,所述第一概率用于指示所述每种故障类型单独作用时引起所述业务故障的概率;所述第二概率用于指示所述每种故障类型在所述多种故障类型共同作用时引起所述业务故障的概率。
9.根据权利要求8所述的装置,其特征在于,所述调整模块包括:
确定子模块,用于根据所述每种故障类型的关联概率,确定所述每种故障类型引起所述业务故障的衰减因子;
调整子模块,用于根据所述每种故障类型的衰减因子,对所述每种故障类型的第一概率进行调整,得到所述每种故障类型的第二概率。
10.根据权利要求9所述的装置,其特征在于,对于所述多种故障类型中的每种故障类型,如果所述故障类型不能被所述多种故障类型中其他故障类型所引起,则所述故障类型的衰减因子为1,否则所述故障类型的衰减因子小于1。
11.根据权利要求9或10所述的装置,其特征在于,所述确定子模块用于根据所述每种故障类型的关联概率,确定所述每种故障类型的优先级;按照优先级从高到低的顺序,依次确定所述每种故障类型的衰减因子;在按照所述顺序确定第一故障类型的衰减因子的过程中,根据第二故障类型的衰减因子和所述第一故障类型被所述第二故障类型引起的关联概率,确定所述第一故障类型的衰减因子;其中,所述第一故障类型为所述多种故障类型中的任一种故障类型,所述第二故障类型为所述多种故障类型中优先级高于所述第一故障类型的故障类型。
12.根据权利要求11所述的装置,其特征在于,所述确定子模块用于如果所述多种故障类型中的第一故障类型能够引起所述多种故障类型中的第二故障类型,则将所述第一故障类型的优先级提高一个等级;如果所述多种故障类型中存在引起所述第一故障类型的第三故障类型,则将所述第三故障类型的优先级提高一个等级。
13.一种故障原因定位装置,其特征在于,所述装置包括:
第一获取模块,用于获取当前发生的业务故障的多项告警信息;
分析模块,用于基于故障分析模型,对所述多项告警信息进行分析,得到所述业务故障的故障类型,所述故障分析模型由历史故障数据训练得到,所述历史故障数据包括历史业务故障发生时接收到的告警信息以及所确定的故障类型;
输出模块,用于基于所述故障类型所对应的告警信息,输出故障原因定位信息。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取所述历史故障数据;
训练模块,用于根据所述历史故障数据,对预设神经网络模型进行训练,以调整所述预设神经网络模型中各个节点的参数值;将调整后的所述预设神经网络模型作为所述故障分析模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710239607.9A CN106941423B (zh) | 2017-04-13 | 2017-04-13 | 故障原因定位方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710239607.9A CN106941423B (zh) | 2017-04-13 | 2017-04-13 | 故障原因定位方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106941423A true CN106941423A (zh) | 2017-07-11 |
CN106941423B CN106941423B (zh) | 2018-06-05 |
Family
ID=59463980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710239607.9A Active CN106941423B (zh) | 2017-04-13 | 2017-04-13 | 故障原因定位方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106941423B (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107464060A (zh) * | 2017-08-08 | 2017-12-12 | 国网江苏省电力公司宿迁供电公司 | 一种基于主动概率统计算法的智能监控专家系统 |
CN107608837A (zh) * | 2017-09-21 | 2018-01-19 | 浪潮软件集团有限公司 | 定位故障环境设备的方法、装置、可读介质及存储控制器 |
CN108600009A (zh) * | 2018-04-25 | 2018-09-28 | 北京思特奇信息技术股份有限公司 | 一种基于告警数据分析的网络告警根源定位方法 |
CN108733563A (zh) * | 2018-05-18 | 2018-11-02 | 平安普惠企业管理有限公司 | 应用软件的业务故障处理方法、服务端及存储介质 |
CN109086207A (zh) * | 2018-08-02 | 2018-12-25 | 平安科技(深圳)有限公司 | 页面响应故障分析方法、计算机可读存储介质及终端设备 |
CN109245943A (zh) * | 2018-10-19 | 2019-01-18 | 北京奇艺世纪科技有限公司 | 一种故障定位方法及装置 |
CN109614284A (zh) * | 2018-10-25 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 一种数据处理方法及装置 |
CN109871963A (zh) * | 2019-01-08 | 2019-06-11 | 西藏纳旺网络技术有限公司 | 运行故障还原方法、装置、电子设备及存储介质 |
CN109902283A (zh) * | 2018-05-03 | 2019-06-18 | 华为技术有限公司 | 一种信息输出方法及装置 |
CN110351120A (zh) * | 2019-06-06 | 2019-10-18 | 武汉烽火技术服务有限公司 | 一种通信设备故障判断方法及系统 |
CN110609759A (zh) * | 2018-06-15 | 2019-12-24 | 华为技术有限公司 | 一种故障根因分析的方法及装置 |
CN111258788A (zh) * | 2020-01-17 | 2020-06-09 | 上海商汤智能科技有限公司 | 磁盘故障预测方法、装置及计算机可读存储介质 |
CN111274118A (zh) * | 2018-12-05 | 2020-06-12 | 阿里巴巴集团控股有限公司 | 一种应用优化处理方法、装置和系统 |
WO2020119369A1 (zh) * | 2018-12-13 | 2020-06-18 | 平安普惠企业管理有限公司 | 智能it运维故障定位方法、装置、设备及可读存储介质 |
CN112711516A (zh) * | 2021-03-26 | 2021-04-27 | 腾讯科技(深圳)有限公司 | 一种数据处理方法和相关装置 |
CN112730654A (zh) * | 2020-12-18 | 2021-04-30 | 国网河北省电力有限公司电力科学研究院 | 六氟化硫电气设备故障检测方法、装置及终端设备 |
CN113064836A (zh) * | 2021-05-07 | 2021-07-02 | 中国工商银行股份有限公司 | 一种基于银行系统自动化测试的业务异常修复方法及装置 |
CN113392893A (zh) * | 2021-06-08 | 2021-09-14 | 北京达佳互联信息技术有限公司 | 业务故障的定位方法、装置、存储介质及计算机程序产品 |
CN113793128A (zh) * | 2021-09-18 | 2021-12-14 | 北京京东振世信息技术有限公司 | 业务故障原因信息生成方法、装置、设备和计算机可读介质 |
CN113849486A (zh) * | 2021-11-30 | 2021-12-28 | 云和恩墨(北京)信息技术有限公司 | 故障处理方法、其装置、电子设备及计算机可读存储介质 |
CN114996119A (zh) * | 2022-04-20 | 2022-09-02 | 中国工商银行股份有限公司 | 故障诊断方法、装置、电子设备及存储介质 |
CN117192269A (zh) * | 2023-09-20 | 2023-12-08 | 珠海高新区铭越科技有限公司 | 一种用于电房环境控制箱的大数据监测预警系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1333615A2 (en) * | 2002-01-24 | 2003-08-06 | Alcatel Canada Inc. | System and method of identifying a faulty component in a network element |
CN101360013A (zh) * | 2008-09-25 | 2009-02-04 | 烽火通信科技股份有限公司 | 一种基于相关性分析的传输网通用快速故障定位方法 |
CN102546274A (zh) * | 2010-12-20 | 2012-07-04 | 中国移动通信集团广西有限公司 | 一种通信业务中的告警监控方法及设备 |
CN104518905A (zh) * | 2013-10-08 | 2015-04-15 | 华为技术有限公司 | 一种故障定位方法及装置 |
CN105721184A (zh) * | 2014-12-03 | 2016-06-29 | 中国移动通信集团山东有限公司 | 一种网络链路质量的监控方法及装置 |
CN106470122A (zh) * | 2016-09-20 | 2017-03-01 | 北京汇通金财信息科技有限公司 | 一种网络故障定位方法及装置 |
-
2017
- 2017-04-13 CN CN201710239607.9A patent/CN106941423B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1333615A2 (en) * | 2002-01-24 | 2003-08-06 | Alcatel Canada Inc. | System and method of identifying a faulty component in a network element |
CN101360013A (zh) * | 2008-09-25 | 2009-02-04 | 烽火通信科技股份有限公司 | 一种基于相关性分析的传输网通用快速故障定位方法 |
CN102546274A (zh) * | 2010-12-20 | 2012-07-04 | 中国移动通信集团广西有限公司 | 一种通信业务中的告警监控方法及设备 |
CN104518905A (zh) * | 2013-10-08 | 2015-04-15 | 华为技术有限公司 | 一种故障定位方法及装置 |
CN105721184A (zh) * | 2014-12-03 | 2016-06-29 | 中国移动通信集团山东有限公司 | 一种网络链路质量的监控方法及装置 |
CN106470122A (zh) * | 2016-09-20 | 2017-03-01 | 北京汇通金财信息科技有限公司 | 一种网络故障定位方法及装置 |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107464060B (zh) * | 2017-08-08 | 2024-03-22 | 国网江苏省电力公司宿迁供电公司 | 一种基于主动概率统计算法的智能监控专家系统 |
CN107464060A (zh) * | 2017-08-08 | 2017-12-12 | 国网江苏省电力公司宿迁供电公司 | 一种基于主动概率统计算法的智能监控专家系统 |
CN107608837A (zh) * | 2017-09-21 | 2018-01-19 | 浪潮软件集团有限公司 | 定位故障环境设备的方法、装置、可读介质及存储控制器 |
CN108600009A (zh) * | 2018-04-25 | 2018-09-28 | 北京思特奇信息技术股份有限公司 | 一种基于告警数据分析的网络告警根源定位方法 |
CN108600009B (zh) * | 2018-04-25 | 2021-03-30 | 北京思特奇信息技术股份有限公司 | 一种基于告警数据分析的网络告警根源定位方法 |
CN109902283A (zh) * | 2018-05-03 | 2019-06-18 | 华为技术有限公司 | 一种信息输出方法及装置 |
CN108733563A (zh) * | 2018-05-18 | 2018-11-02 | 平安普惠企业管理有限公司 | 应用软件的业务故障处理方法、服务端及存储介质 |
CN108733563B (zh) * | 2018-05-18 | 2023-04-11 | 平安普惠企业管理有限公司 | 应用软件的业务故障处理方法、服务端及存储介质 |
CN110609759A (zh) * | 2018-06-15 | 2019-12-24 | 华为技术有限公司 | 一种故障根因分析的方法及装置 |
CN110609759B (zh) * | 2018-06-15 | 2021-09-14 | 华为技术有限公司 | 一种故障根因分析的方法及装置 |
US11438212B2 (en) | 2018-06-15 | 2022-09-06 | Huawei Technologies Co., Ltd. | Fault root cause analysis method and apparatus |
CN109086207B (zh) * | 2018-08-02 | 2023-04-14 | 平安科技(深圳)有限公司 | 页面响应故障分析方法、计算机可读存储介质及终端设备 |
CN109086207A (zh) * | 2018-08-02 | 2018-12-25 | 平安科技(深圳)有限公司 | 页面响应故障分析方法、计算机可读存储介质及终端设备 |
CN109245943B (zh) * | 2018-10-19 | 2022-02-01 | 北京奇艺世纪科技有限公司 | 一种故障定位方法及装置 |
CN109245943A (zh) * | 2018-10-19 | 2019-01-18 | 北京奇艺世纪科技有限公司 | 一种故障定位方法及装置 |
CN109614284A (zh) * | 2018-10-25 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 一种数据处理方法及装置 |
CN109614284B (zh) * | 2018-10-25 | 2022-06-14 | 北京奇艺世纪科技有限公司 | 一种数据处理方法及装置 |
CN111274118B (zh) * | 2018-12-05 | 2024-05-14 | 阿里巴巴集团控股有限公司 | 一种应用优化处理方法、装置和系统 |
CN111274118A (zh) * | 2018-12-05 | 2020-06-12 | 阿里巴巴集团控股有限公司 | 一种应用优化处理方法、装置和系统 |
WO2020119369A1 (zh) * | 2018-12-13 | 2020-06-18 | 平安普惠企业管理有限公司 | 智能it运维故障定位方法、装置、设备及可读存储介质 |
CN109871963A (zh) * | 2019-01-08 | 2019-06-11 | 西藏纳旺网络技术有限公司 | 运行故障还原方法、装置、电子设备及存储介质 |
CN110351120A (zh) * | 2019-06-06 | 2019-10-18 | 武汉烽火技术服务有限公司 | 一种通信设备故障判断方法及系统 |
CN110351120B (zh) * | 2019-06-06 | 2022-07-29 | 武汉烽火技术服务有限公司 | 一种通信设备故障判断方法及系统 |
CN111258788A (zh) * | 2020-01-17 | 2020-06-09 | 上海商汤智能科技有限公司 | 磁盘故障预测方法、装置及计算机可读存储介质 |
CN111258788B (zh) * | 2020-01-17 | 2024-04-12 | 上海商汤智能科技有限公司 | 磁盘故障预测方法、装置及计算机可读存储介质 |
CN112730654A (zh) * | 2020-12-18 | 2021-04-30 | 国网河北省电力有限公司电力科学研究院 | 六氟化硫电气设备故障检测方法、装置及终端设备 |
CN112711516A (zh) * | 2021-03-26 | 2021-04-27 | 腾讯科技(深圳)有限公司 | 一种数据处理方法和相关装置 |
CN113064836A (zh) * | 2021-05-07 | 2021-07-02 | 中国工商银行股份有限公司 | 一种基于银行系统自动化测试的业务异常修复方法及装置 |
CN113392893A (zh) * | 2021-06-08 | 2021-09-14 | 北京达佳互联信息技术有限公司 | 业务故障的定位方法、装置、存储介质及计算机程序产品 |
CN113392893B (zh) * | 2021-06-08 | 2024-08-13 | 北京达佳互联信息技术有限公司 | 业务故障的定位方法、装置、存储介质及计算机程序产品 |
CN113793128A (zh) * | 2021-09-18 | 2021-12-14 | 北京京东振世信息技术有限公司 | 业务故障原因信息生成方法、装置、设备和计算机可读介质 |
CN113849486A (zh) * | 2021-11-30 | 2021-12-28 | 云和恩墨(北京)信息技术有限公司 | 故障处理方法、其装置、电子设备及计算机可读存储介质 |
CN114996119B (zh) * | 2022-04-20 | 2023-03-03 | 中国工商银行股份有限公司 | 故障诊断方法、装置、电子设备及存储介质 |
CN114996119A (zh) * | 2022-04-20 | 2022-09-02 | 中国工商银行股份有限公司 | 故障诊断方法、装置、电子设备及存储介质 |
CN117192269A (zh) * | 2023-09-20 | 2023-12-08 | 珠海高新区铭越科技有限公司 | 一种用于电房环境控制箱的大数据监测预警系统及方法 |
CN117192269B (zh) * | 2023-09-20 | 2024-04-05 | 珠海高新区铭越科技有限公司 | 一种用于电房环境控制箱的大数据监测预警系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106941423B (zh) | 2018-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106941423B (zh) | 故障原因定位方法及装置 | |
CN106199276B (zh) | 一种用电信息采集系统中异常信息的智能诊断系统及方法 | |
AU671194B2 (en) | Event correlation | |
CN102149103B (zh) | 网络优化系统及方法 | |
US5557547A (en) | Monitoring system status | |
CN103370904B (zh) | 用于确定网络意外事件的严重性的方法、网络实体 | |
CN105991332A (zh) | 告警处理方法及装置 | |
CN113542039A (zh) | 一种通过ai算法定位5g网络虚拟化跨层问题的方法 | |
CA2272609A1 (en) | Software fault management system | |
CN1276118A (zh) | 电信网的网络监控方法 | |
JPH08307524A (ja) | 通信ネットワークの構成要素の異常状態のリスクを識別する方法と装置 | |
CN109347688A (zh) | 一种在无线局域网中定位故障的方法和装置 | |
US6636486B1 (en) | System, method and apparatus for monitoring and analyzing traffic data from manual reporting switches | |
CN102447577A (zh) | 一种客户导向的通信网络告警处理方法 | |
CN106817708A (zh) | 一种巡检簇构建方法及装置 | |
EP0598484A2 (en) | Monitoring system status | |
CN112070243A (zh) | 一种电网故障信息多渠道自动推送方法 | |
CN107548087A (zh) | 一种告警关联分析的方法及装置 | |
CN110752959A (zh) | 一种智能变电站过程层物理链路故障定位系统 | |
CN110135603A (zh) | 一种基于改进熵权法的电力网络告警空间特征分析方法 | |
CN115865611A (zh) | 一种网络设备的故障处理方法、装置及电子设备 | |
CN112256922B (zh) | 一种故障停电快速识别方法及系统 | |
CN109067602A (zh) | 基于通信监测的电力配用电业务故障诊断方法及相关产品 | |
EP3560145B1 (en) | Apparatus and method for identifying network object groups | |
CN110609761B (zh) | 确定故障源的方法、装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |