CN111193605B - 一种故障定位方法、装置及存储介质 - Google Patents

一种故障定位方法、装置及存储介质 Download PDF

Info

Publication number
CN111193605B
CN111193605B CN201910803082.6A CN201910803082A CN111193605B CN 111193605 B CN111193605 B CN 111193605B CN 201910803082 A CN201910803082 A CN 201910803082A CN 111193605 B CN111193605 B CN 111193605B
Authority
CN
China
Prior art keywords
node
fault
parent node
preset
parent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910803082.6A
Other languages
English (en)
Other versions
CN111193605A (zh
Inventor
陈乃华
洪楷
刘伟
雷航
王月瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910803082.6A priority Critical patent/CN111193605B/zh
Publication of CN111193605A publication Critical patent/CN111193605A/zh
Application granted granted Critical
Publication of CN111193605B publication Critical patent/CN111193605B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例公开了一种故障定位方法、装置及存储介质;本申请实施例在获取系统中设备发送的故障告警信息后,可以根据故障告警信息在预设对应关系中确定设备对应的当前故障节点,然后基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,以输出目标关联节点的节点信息;由于预设对应关系中包括节点之间的故障关联关系,即当前故障节点可以根据预设对应关系中的故障关联关系找出最终的故障根因,从而可以提高故障定位的准确性。

Description

一种故障定位方法、装置及存储介质
技术领域
本申请涉及网络信息技术领域,具体涉及一种故障定位方法、装置及存储介质。
背景技术
在网络系统运行的过程中,网络系统的各种业务很可能会出现各种各样的故障,运维人员需要对引起业务故障的原因进行定位,以便解决故障,从而保证网络系统的正常运行。
现有技术中,配合网络系统设置有不同种类的设备,比如,用于监测网络故障的网络故障设备、用于监测主机故障的主机故障设备等。当设备监测到相应故障时,会生成故障告警信息。运维人员通过查看各个设备的故障告警信息,获知可能导致业务故障的原因,然后,根据故障传播链定位引起业务故障的真正原因。
在对现有技术的研究和实践过程中,本申请的申请人发现,在对故障原因进行定位的过程中,设备通常具有上下层的关系,由于最终的故障一般都处于关系的顶层,由该顶层引起下层故障,如果不涉及关系层次会导致找不到最终的故障根因,影响故障定位的准确性。
发明内容
本申请实施例提供一种故障定位方法、装置及存储介质,可以提高故障定位的准确性。
本申请实施例提供一种故障定位方法,包括:
获取系统中设备发送的故障告警信息;
根据所述故障告警信息在预设对应关系中确定所述设备对应的当前故障节点,其中,所述预设对应关系包括节点之间的故障关联关系,所述节点对应于所述系统中的设备;
基于所述预设对应关系查询与所述当前故障节点具有故障关联关系、且发生故障的目标关联节点;
输出目标关联节点的节点信息。
相应的,本申请实施例还提供一种故障定位装置,包括:
获取模块,用于获取系统中设备发送的故障告警信息;
确定模块,用于根据所述故障告警信息在预设对应关系中确定所述设备对应的当前故障节点,其中,所述预设对应关系包括节点之间的故障关联关系,所述节点对应于所述业务系统中的设备;
查询模块,用于基于所述预设对应关系查询与所述当前故障节点具有故障关联关系、且发生故障的目标关联节点;
输出模块,用于输出目标关联节点的节点信息。
此外,本申请实施例还提供一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本申请实施例提供的任一种故障定位方法中的步骤。
本申请实施例在获取到系统中设备发送的故障告警信息后,根据故障告警信息在预设对应关系中确定设备对应的当前故障节点,其中,预设对应关系包括节点之间的故障关联关系,节点对应于业务系统中的设备,然后,基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,最后,输出目标关联节点的节点信息;由于预设对应关系中包括节点之间的故障关联关系,即当前故障节点可以根据预设对应关系中的故障关联关系找出最终的故障根因,从而可以提高故障定位的准确性。
附图说明
图1a是本申请实施例提供的故障定位系统的场景示意图;
图1b是本申请实施例提供的故障定位方法的流程示意图;
图2a是本申请实施例提供的故障定位方法的另一流程示意图;
图2b是本申请实施例提供的故障定位方法中的预设对应关系示意图;
图3a是本申请实施例提供的故障定位装置的结构示意图;
图3b是本申请实施例提供的故障定位装置的另一结构示意图;
图3c是本申请实施例提供的故障定位装置的另一结构示意图;
图3d是本申请实施例提供的故障定位装置的另一结构示意图;
图3e是本申请实施例提供的故障定位装置的另一结构示意图;
图3f是本申请实施例提供的故障定位装置的另一结构示意图;
图4是本申请实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种故障定位方法、装置及存储介质。
请参阅图1a,图1a是本申请实施例所提供的故障定位系统的场景示意图,包括:多个设备,其中,设备可以为服务器等网络设备(该故障定位系统中设备的具体个数在此处不作限定),设备之间可以通过通信网络连接,通信网络可以包括无线网络以及有线网络,其中无线网络包括无线广域网、无线局域网、无线城域网、以及无线个人网中的一种或多种的组合。网络中包括路由器、网关等等网络实体,图中并未示意出。该多个设备之间可以通过通信网络进行信息交互,比如设备在监测到故障发生时,会发送故障告警信息。
该故障定位系统可以包括故障定位装置,该故障定位装置具体可以集成在其中一设备中,在图1a中,该设备主要用于获取系统中其他设备发送的故障告警信息,根据故障告警信息在预设对应关系中确定设备对应的当前故障节点,该预设对应关系包括节点之间的故障关联关系,节点对应于系统中的设备,基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,输出目标关联节点的节点信息。
需要说明的是,图1a所示的故障定位系统的场景示意图仅仅是一个示例,本申请实施例描述的故障定位系统以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着故障定位系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
以下分别进行详细说明。需要说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
在本申请实施例中,将从故障定位装置的角度进行描述,该故障定位装置具体可以集成设备如服务器中。
一种故障定位方法,包括:获取系统中设备发送的故障告警信息,根据故障告警信息在预设对应关系中确定设备对应的当前故障节点,其中,预设对应关系包括节点之间的故障关联关系,节点对应于系统中的设备,基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,输出目标关联节点的节点信息。
请参阅图1b,图1b是本申请实施例提供的故障定位方法的流程示意图。该故障定位方法的具体流程可以如下:
101、获取系统中设备发送的故障告警信息。
其中,该系统可用于提供多种业务的服务,该多种业务可以为游戏业务、网络直播业务、电商业务等,对于每一种业务还可以进行细分,比如,可以将游戏业务分为网页游戏和手机游戏业务等,本申请实施例对业务种类的划分方式不作限定。在该系统中,每一种业务对应一个或多个网络节点,每个网络节点配置有一个或多个用于为该业务提供服务的业务服务器。配合该系统设置有不同种类的设备,比如,用于检测网络故障的网络告警设备、用于监测各种服务器的主机故障的主机告警设备等。该不同种类的设备部署在系统中的各个网络节点,用于对系统中各个网络节点进行故障监测,当设备监测到故障发生时,会发送故障告警信息。
例如,当某一网络节点上的业务服务器发生故障时,设置在该网络节点上的用于检测该业务服务器的设备便会检测出故障发生,并发送故障告警信息。
该故障告警信息可以由各个设备在监测到故障时,生成各自的告警信息并发送。该故障告警信息中包括可能引起业务故障的故障原因信息,故障原因信息可以包括发生故障的时间,发生故障的网络节点信息以及故障描述信息等。
102、根据故障告警信息在预设对应关系中确定设备对应的当前故障节点。
其中,该预设对应关系可以为知识图谱,知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
本申请实施例中,预设对应关系包括多个节点,节点之间通过关联关系连接,如故障关联关系,其中,每个节点对应于系统中设备。该预设对应关系是将所有跟业务有关的信息,涉及的方方面面的知识汇总起来形成的一个大网。
另外,该预设对应关系包括节点之间的故障关联关系。该故障关联关系指的是,当一个节点对应的设备发生故障时,会对另一个节点对应的设备造成影响,那么,这两个节点具有故障关联关系。
可选的,该预设对应关系可以由运维人员预先进行建立,并进行更新,或者,也可以由系统自行进行建立和实时更新。
例如,以游戏业务为例进行说明,该游戏业务对应多个网络节点,每个网络节点上均设置有用于为该游戏业务提供服务的业务服务器,相应的,在每个网络节点上均设置有用于监测业务服务器的设备,当某一设备监测到故障发生时,会发送告警信息,通过该故障告警信息可以在预设对应关系中映射出该设备对应的节点,该节点即为当前故障节点,比如,可以根据该故障告警信息上的网络节点信息在预设对应关系中映射出该设备对应的节点。
103、基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点。
其中,该目标关联节点指的是,基于当前故障节点得出的最终的故障根因,具体可参照以下描述。
在一些实施例中,基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,具体可以包括:
(1)在预设对应关系中查询与当前故障节点具有故障关联关系的母节点;例如,具体可以如下:
A1、在预设对应关系中查询与当前故障节点具有故障关联关系的候选节点。
B1、从候选节点中确定当前故障节点的母节点。
需要说明的是,在预设对应关系中,当a节点对应的设备发生故障时,会对b节点对应的设备造成影响,此时,a节点就是与b节点具有故障关联关系的母节点,b节点就是与a节点具有故障关联关系的子节点。
例如,在预设对应关系中分别有c1、c2、c3三个节点,其中,当c3节点发生故障时,会对c2节点造成影响;当c2节点发生故障时,会对c1节点造成影响。若当前故障节点为c2,则c1节点、c3节点就是与c2节点具有故障关联关系的节点,即,c1节点、c3节点就是与c2节点具有故障关联关系的候选节点,其中,c3节点为与c2节点具有故障关联关系的母节点,c1节点为与c2节点具有故障关联关系的子节点。
(2)当母节点发生故障,且母节点不满足预设查询终止条件时,将母节点更新为当前故障节点,并返回执行在预设对应关系中查询与当前故障节点具有故障关联关系的母节点的步骤;例如,具体可以如下:
A2、当母节点发生故障时,获取母节点的节点类型。
B2、当节点类型不为预设对应关系的根节点时,确定母节点不满足预设查询终止条件,将母节点更新为当前故障节点。
需要说明的是,根节点指的是,在预设对应关系中,当一节点没有与其具有故障关联关系的母节点时,该节点即为根节点。
可以理解的,当检测到母节点发生故障、且母节点不为预设对应关系中的根节点时,该母节点有可能不是最终的故障根因,则需将该母节点更新为当前故障节点,并返回执行在预设对应关系中查询与当前故障节点具有故障关联关系的母节点的步骤。
例如,在预设对应关系中分别有d1节点、d2节点、d3节点这三个节点,其中,当d3节点发生故障时,会对d2节点造成影响;当d2节点发生故障时,会对d1节点造成影响。若当前故障节点为d1节点,则d2节点就是与d1节点具有故障关联关系的母节点,d3节点就是与d2节点具有故障关联关系的母节点,即d2节点不是根节点,当检测到d2节点发生故障时,则将d2节点更新为当前故障节点,并返回执行在预设对应关系中查询与当前故障节点具有故障关联关系的母节点的步骤。
(3)当母节点发生故障,且母节点满足预设查询终止条件时,确定母节点为目标关联节点;例如,具体可以如下:
A3、当母节点发生故障时,获取母节点的节点类型。
B3、当节点类型为预设对应关系的根节点时,确定母节点满足预设查询终止条件,确定母节点为目标关联节点。
可以理解的,当母节点发生故障,且母节点的节点类型为根节点时,该母节点即为最终的故障根因,则需将该母节点确定为目标关联节点。
例如,在预设对应关系中分别有e1节点、e2节点这两个节点,其中,当e2节点发生故障时,会对e1节点造成影响。若当前故障节点为e1节点,则e2节点就是与e1节点具有故障关联关系的母节点,且e2节点没有与e2节点具有故障关联关系的母节点,即e2节点是根节点,当检测到e2节点发生故障时,则将e2节点确定为目标关联节点骤。
(4)当母节点未发生故障时,确定当前故障节点为目标关联节点。
可以理解的,当母节点未发生故障,即说明该母节点对应的当前故障节点即为最终的故障根因,则需将当前故障节点确定目标关联节点。
例如,在预设对应关系中分别有f1节点、f2节点这两个节点,其中,当f2节点发生故障时,会对f1节点造成影响。若当前故障节点为f1节点,则f2节点就是与f1节点具有故障关联关系的母节点,当检测到f2节点没有发生故障时,则将f2节点确定为目标关联节点。
在一些实施例中,可以根据以下方式确定母节点是否发生故障;例如,具体可以如下:获取第一数量和第二数量;将第一数量与第二数量进行对比,得到对比结果;根据对比结果确定母节点是否发生故障。
其中,第一数量为与母节点具有故障关联关系的子节点的数量,第二数量为发生故障的子节点的数量。
例如,在预设对应关系中分别有g4节点、g3节点、g2节点、g1节点这四个节点,其中,当g4节点发生故障时,会对g3节点、g2节点、g1节点造成影响。若当前故障节点为g3节点,则g4节点就是与g3节点具有故障关联关系的母节点,g1节点、g2节点、g3节点就是与g4节点具有故障关联关系的子节点,g3节点就是g1节点、g2节点、g3节点这三个子节点中发生故障的子节点。也即,此时,第一数量为3,第二数量为1。
其中,根据对比结果确定母节点是否发生故障,具体可以如下:当对比结果包括第一数量等于第二数量时,确定母节点发生故障;当对比结果包括第一数量不等于第二数量时,基于母节点发生故障的概率确定所述母节点是否发生故障。
可以理解的,当第一数量等于第二数量时,也即,与母节点具有故障关联关系的子节点均发生故障,此时,可以确定母节点发生故障,仅仅只是因为由于母节点对应的设备故障导致未发出故障告警信息。
在一些实施例中,当对比结果包括第一数量不等于第二数量时,基于母节点发生故障的概率确定所述母节点是否发生故障,具体可以如下:
当第一数量不等于第二数量、且第二数量等于1时,也即,与母节点具有故障关联关系的子节点中只有一个子节点均发生故障,此时,可以确定母节点没有发生故障;
当第一数量不等于第二数量,且第二数量不等于1时,计算母节点发生故障的概率,并基于概率确定母节点是否发生故障;例如,具体可以如下:获取每一发生故障的子节点的预设概率;基于预设概率计算母节点发生故障的概率,并基于概率确定母节点是否发生故障。
其中,可以根据以下公式计算母节点发生故障的概率P,
Figure BDA0002182873230000081
其中,m表示第一数量,n表示第二数量,Pi、Pj分别为对应的发生故障的子节点的预设概率,该预设概率可以由运维人员进行设定,也可以通过历史数据统计得到并实时更新。
例如,在预设对应关系中,h5节点总共有h4节点、h3节点、h2节点、h1节点这四个子节点,当h5节点为母节点,h4节点、h3节点、h2节点为发生故障的子节点,且h4节点的预设概率为0.2,h3节点的预设概率为0.3,h2节点的预设概率为0.1,则此时h5节点发生故障的概率P=(0.2*0.3+0.2*0.1+0.3*0.1)/4。
进一步的,当母节点发生故障的概率满足预设概率条件时,确定母节点发生故障;当母节点发生故障的概率不满足预设概率条件时,确定母节点没有发生故障。该预设概率条件可以根据实际情况设定,在此不做限制。
在一些实施例中,还可以根据以下方式确定母节点是否发生故障;例如,具体可以如下:获取第一数量和第二数量;基于第一数量生成预设数量阈值,其中,第一数量越大,该预设数量阈值的设定也相应越大,其具体映射关系为多次试验得出的经验值;当第二数量大于预设数量阈值时,确定母节点发生故障;当第二数量小于、等于预设数量阈值时,确定母节点没有发生故障。
104、输出目标关联节点的节点信息。
其中,该节点信息可以为目标关联节点的名称等。
由上可知,本申请实施例在获取系统中设备发送的故障告警信息后,可以根据故障告警信息在预设对应关系中确定设备对应的当前故障节点,然后基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,以输出目标关联节点;由于预设对应关系中包括节点之间的故障关联关系,即当前故障节点可以根据预设对应关系中的故障关联关系找出最终的故障根因,从而可以提高故障定位的准确性。
根据上面实施例所描述的方法,以下将举例进一步详细说明。
在本实施例中,将以该故障定位装置具体集成在服务器中为例进行说明。
(一)定义节点、自定义节点以及故障关联关系,具体可以如下:
1、定义节点
其中,预设对应关系由多个节点组成,每一节点对应系统中的一个网络节点,相应的,每一节点对应系统中的一个设备。也即,在该预设对应关系中,每一节点均定义有相应的节点信息。
例如,在配置管理数据库中有很多信息:如业务这一层包含业务ID、业务名称、业务类型等等,业务设备这一层包含机器IP、相关交换机、存储机房、机架、外网相关信息等等,当然也包含其他很多信息,原本分散在各表中,也可能多张表中的不同字段名称指的是同一个实体(如业务id、机器IP等),所以要对每种实体节点进行一个定义。主要定义信息:标签名称、所属表名及字段名、是否是故障节点、预设概率等。
2、定义自定义节点
实际情况中还存在一些通用信息,比如这个业务接了周边哪个其他平台(实现鉴权、支付等功能)、一些映射关系等,这些信息运维都能知道,但是在配置管理数据库中不方便维护或者维护的不好,对于这类信息就要做一些自定义,形成自定义节点。
3、定义故障关联关系
其中,该预设对应关系包括节点之间的故障关联关系。该故障关联关系指的是,在预设对应关系中,当一个节点对应的设备发生故障时,会对另一个节点对应的设备造成影响,也即,这两个节点就是具有故障关联关系的节点。
(二)图谱构建
根据以上构建准备构建预设对应关系,其中,该预设对应关系是将所有跟业务有关的信息,涉及的方方面面的知识汇总起来形成的一个大网。
例如,关系图谱构建时,使用一种开源软件neo4j,考虑到这种软件的使用效率和接口功能,所以通过将数据库中的所有信息查询后,直接根据节点定义、自定义节点定义以及故障关联关系定义,生成neo4j可导入的csv文件,再通过neo4j的csv文件导入功能导入到图数据库中进行构建节点相关数据。
(三)图谱使用
请参阅图2a,图2a是本申请实施例提供的故障定位方法的另一流程示意图。该故障定位方法的具体流程可以如下:
201、服务器获取系统中设备发送的故障告警信息。
比如,以游戏业务为例,其中,该游戏业务在机房侧设置有多个设备,在用户侧设置有多个设备;当机房侧发生故障时,相应的设备便会检测出故障发生,并发送故障告警信息到服务器;同样,当用户侧发生故障时,相应的设备便会检测出故障发生,并发送故障告警信息到服务器。
202、服务器根据故障告警信息在预设对应关系中确定设备对应的当前故障节点。
比如,还是以游戏业务为例进行说明,请参照图2b,图2b是机房侧对应的预设对应关系。其中,当机房侧有3个设备发送故障告警信息到服务器,服务器可以根据告警信息在预设对应关系中确定设备对应的当前故障节点,这3个当前故障节点分别为:上海-周浦-1、上海-周浦-2、上海-周浦-3。
203、服务器在预设对应关系中查询与当前故障节点具有故障关联关系的候选节点。
比如,还是以游戏业务为例进行说明,请继续参阅图2b。其中,在机房侧,当上海这个节点发生故障时,会对上海-周浦这个节点造成影响;当上海-周浦这个节点发生故障时,会对上海-周浦-1、上海-周浦-2、上海-周浦-3、上海-周浦-4、上海-周浦-5这5个节点造成影响。也即,此时,与上海-周浦-1这个当前故障节点具有故障关联关系的候选节点就是上海-周浦,与上海-周浦-2这个当前故障节点具有故障关联关系的候选节点就是上海-周浦,与上海-周浦-3这个当前故障节点具有故障关联关系的候选节点就是上海-周浦。
204、服务器从候选节点中确定当前故障节点的母节点。
比如,还是游戏业务为例进行说明,请继续参阅图2b。其中,从预设对应关系中可知,与上海-周浦-1这个当前故障节点具有故障关联关系的母节点就是上海-周浦,与上海-周浦-2这个当前故障节点具有故障关联关系的母节点就是上海-周浦,与上海-周浦-3这个当前故障节点具有故障关联关系的母节点就是上海-周浦。
205、当服务器检测到母节点发生故障,且母节点不满足预设查询终止条件时,将母节点更新为当前故障节点,并返回执行步骤203;例如,具体可以如下:当服务器检测到母节点发生故障时,服务器获取母节点的节点类型;当节点类型不为预设对应关系的根节点时,服务器确定母节点不满足预设查询终止条件,服务器将母节点更新为当前故障节点。
比如,还是游戏业务为例进行说明,请继续参阅图2b。其中,从预设对应关系中可知,当服务器检测到上海-周浦这个母节点发生故障,且上海-周浦这个母节点不是根节点,服务器将上海-周浦这个母节点更新为当前故障节点,并返回执行步骤203。
206、当服务器检测到母节点发生故障,且母节点满足预设查询终止条件时,服务器将母节点更新为目标关联节点,并执行步骤208;例如,具体可以如下:当服务器检测到母节点发生故障时,获取母节点的节点类型;当节点类型为预设对应关系的根节点时,确定母节点满足预设查询终止条件,将母节点更新为目标关联节点,并执行步骤208。
比如,还是游戏业务为例进行说明,请继续参阅图2b。其中,从预设对应关系中可知,当服务器检测到上海这个母节点没有发生故障,且上海这个母节点是根节点,服务器将上海-周浦这个母节点更新为目标关联节点,并返回执行步骤203。
207、当服务器检测到母节点未发生故障时,将当前故障节点更新为目标关联节点,并执行步骤208。
208、服务器输出目标关联节点。
在一些实施例中,服务器可以根据以下方式确定母节点是否发生故障;例如,具体可以如下:服务器获取第一数量和第二数量;服务器将第一数量与第二数量进行对比,得到对比结果;服务器根据对比结果确定母节点是否发生故障。
在一些实施例中,服务器根据对比结果确定母节点是否发生故障,具体可以包括:当服务器检测到对比结果包括第一数量等于第二数量时,服务器确定母节点发生故障;当服务器检测到对比结果包括第一数量不等于第二数量时,服务器基于母节点发生故障的概率确定所述母节点是否发生故障。
在一些实施例中,当对比结果包括第一数量不等于第二数量时,基于母节点发生故障的概率确定所述母节点是否发生故障;例如,具体可以如下:
当第一数量不等于第二数量、且第二数量等于1时,也即,与母节点具有故障关联关系的子节点中只有一个子节点均发生故障,此时,可以确定母节点没有发生故障,并输出提示信息,例如,该提示信息可以为:该母节点初步确定没有发生故障。
当第一数量不等于第二数量,且第二数量不等于1时,计算母节点发生故障的概率,并基于概率确定母节点是否发生故障;例如,具体可以如下:获取每一发生故障的子节点的预设概率;基于预设概率计算母节点发生故障的概率,并基于概率确定母节点是否发生故障。
其中,可以根据以下公式计算母节点发生故障的概率P,
Figure BDA0002182873230000121
,其中,m表示第一数量,n表示第二数量,Pi、Pj分别为对应的发生故障的子节点的预设概率,该预设概率可以由运维人员进行设定,也可以通过历史数据统计得到并实时更新。
进一步的,当母节点发生故障的概率满足预设概率条件时,确定母节点发生故障;当母节点发生故障的概率不满足预设概率条件时,确定母节点没有发生故障。该预设概率条件可以根据实际情况设定,在此不做限制。
在一些实施例中,服务器还可以根据以下方式确定母节点是否发生故障;例如,具体可以如下:服务器获取第一数量和第二数量,其中,第一数量为与母节点具有故障关联关系的子节点的数量,第二数量为发生故障的子节点的数量;服务器基于第一数量生成预设数量阈值,其中,第一数量越大,该预设数量阈值的设定也相应越大,其具体映射关系为多次试验得出的经验值;当服务器检测到第二数量大于预设数量阈值时,服务器确定母节点发生故障;当服务器检测到第二数量小于、等于预设数量阈值时,服务器确定母节点没有发生故障。
由上可知,本申请实施例在获取系统中设备发送的故障告警信息后,可以根据故障告警信息在预设对应关系中确定设备对应的当前故障节点,然后基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,以输出目标关联节点;由于预设对应关系中包括节点之间的故障关联关系,即当前故障节点可以根据预设对应关系中的故障关联关系找出最终的故障根因,从而可以提高故障定位的准确性。
为了更好地实施以上方法,本发明实施例还提供一种故障定位装置,请参阅图3a,图3a是本申请实施例提供的故障定位装置的结构示意图。如图3a所示,该故障定位装置可以包括获取模块301、确定模块302、查询模块303、和输出模块304,如下:
(1)获取模块301;
获取模块301,用于获取系统中设备发送的故障告警信息。
(2)确定模块302;
确定模块302,用于根据故障告警信息在预设对应关系中确定设备对应的当前故障节点。
(3)查询模块303;
查询模块303,用于基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点。
其中,请参阅图3b,图3b是本申请实施例提供的故障定位装置的另一结构示意图。如图3b所示,查询模块303可以包括查询单元3031、第一更新单元3032和第二更新单元3033,如下:
该查询单元3031,用于在预设对应关系中查询与当前故障节点具有故障关联关系的母节点。
该第一更新单元3032,用于当母节点发生故障,且母节点不满足预设查询终止条件时,将母节点更新为当前故障节点并触发查询单元3031执行在预设对应关系中查询与当前故障节点具有故障关联关系的母节点。
该第二更新单元3033,用于当母节点未发生故障时,将当前故障节点更新为目标关联节点,并触发输出模块304执行输出目标关联节点。
在一些实施例中,请参阅图3c,图3c是本申请实施例提供的故障定位装置的另一结构示意图。如图3c所示,该第一更新单元3032包括第一获取子单元30321和第一更新子单元30322,如下:
该第一获取子单元30321,用于当母节点发生故障时,获取母节点的节点类型;
该第一更新子单元30322,用于当节点类型不为预设对应关系的根节点时,确定母节点不满足预设查询终止条件,将母节点更新为当前故障节点,并触发查询单元3031执行在预设对应关系中查询与所述当前故障节点具有故障关联关系的母节点。
在一些实施例中,请参阅图3d,图3d是本申请实施例提供的故障定位装置的另一结构示意图。如图3d所示,该查询模块303还包括第三更新单元3034,如下:
该第三更新单元3034,用于当母节点发生故障,且母节点满足预设查询终止条件时,将母节点更新为目标关联节点,并触发输出模块304执行输出目标关联节点。
在一些实施例中,请参阅图3e,图3e是本申请实施例提供的故障定位装置的另一结构示意图。如图3e所示,该第一更新单元3032还包括第二获取子单元30323、比对子单元30321和执行子单元30325,如下:
该第二获取子单元30323,用于获取第一数量和第二数量,第一数量为与母节点具有故障关联关系的子节点的数量,第二数量为发生故障的子节点的数量;
该比对子单元30324,用于将第一数量与第二数量进行对比,得到对比结果;
该执行子单元30325,用于根据对比结果确定母节点是否发生故障,若是,触发第一获取子单元执行当母节点发生故障时,获取母节点的节点类型。
在一些实施例中,该执行子单元30325还具体用于:获取每一发生故障的子节点的预设概率;基于预设概率计算母节点发生故障的概率;当概率满足预设概率条件时,确定母节点发生故障。
在一实施例中,请参阅图3f,图3f是本申请实施例提供的故障定位装置的另一结构示意图。如图3f所示,该第一更新单元3032还包括第三获取子单元30326、生成子单元30327和确定子单元30328,如下:
该第三获取子单元30326,用于获取第一数量和第二数量,第一数量为与母节点具有故障关联关系的子节点的数量,第二数量为发生故障的子节点的数量;
该生成子单元30327,用于基于第一数量生成预设数量阈值;
该确定子单元30328,用于当第二数量大于所述预设数量阈值时,确定母节点发生故障。
(4)输出模块304;
输出模块304,用于输出目标关联节点的节点信息。
具体实施时,以上各个模块、单元、可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块、单元的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本申请实施例在获取系统中设备发送的故障告警信息后,可以根据故障告警信息在预设对应关系中确定设备对应的当前故障节点,然后基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,以输出目标关联节点;由于预设对应关系中包括节点之间的故障关联关系,即当前故障节点可以根据预设对应关系中的故障关联关系找出最终的故障根因,从而可以提高故障定位的准确性。
本发明实施例还提供一种服务器,如图4所示,其示出了本发明实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
服务器还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取系统中设备发送的故障告警信息;根据所述故障告警信息在预设对应关系中确定所述设备对应的当前故障节点,其中,所述预设对应关系包括节点之间的故障关联关系,所述节点对应于所述系统中的设备;基于所述预设对应关系查询与所述当前故障节点具有故障关联关系、且发生故障的目标关联节点;输出目标关联节点的节点信息。
其中,所述基于所述预设对应关系查询与所述当前故障节点具有故障关联关系、且发生故障的目标关联节点的步骤,包括:
在所述预设对应关系中查询与所述当前故障节点具有故障关联关系的母节点;
当所述母节点发生故障,且所述母节点满足预设查询终止条件时,确定所述母节点为目标关联节点;
当所述母节点未发生故障时,确定所述当前故障节点为目标关联节点。
其中,所述基于所述预设对应关系查询与所述当前故障节点具有故障关联关系、且发生故障的目标关联节点的步骤,还包括:
当所述母节点发生故障,且所述母节点不满足预设查询终止条件时,将所述母节点更新为当前故障节点,并返回执行所述在所述预设对应关系中查询与所述当前故障节点具有故障关联关系的母节点的步骤。
其中,当所述母节点发生故障,且所述母节点不满足预设查询终止条件时,将所述母节点更新为当前故障节点的步骤,包括:
当所述母节点发生故障时,获取所述母节点的节点类型;
当所述节点类型不为预设对应关系的根节点时,确定所述母节点不满足预设查询终止条件,将所述母节点更新为当前故障节点。
其中,当所述母节点发生故障,且所述母节点不满足预设查询终止条件时,将所述母节点更新为当前故障节点的步骤,还包括:
获取第一数量和第二数量,所述第一数量为与所述母节点具有故障关联关系的子节点的数量,所述第二数量为发生故障的子节点的数量;
将所述第一数量与所述第二数量进行对比,得到对比结果;
根据所述对比结果确定所述母节点是否发生故障,若是,执行所述当所述母节点发生故障时,获取所述母节点的节点类型的步骤。
其中,所述根据所述对比结果确定所述母节点是否发生故障的步骤,包括:
当所述对比结果包括所述第一数量等于所述第二数量时,确定所述母节点发生故障;
当所述对比结果包括所述第一数量不等于所述第二数量时,基于所述母节点发生故障的概率确定所述母节点是否发生故障。
其中,所述基于所述母节点发生故障的概率确定所述母节点是否发生故障的步骤,包括:
获取每一发生故障的子节点的预设概率;
基于所述预设概率计算所述母节点发生故障的概率;
当所述概率满足预设概率条件时,确定所述母节点发生故障。
其中,当所述母节点发生故障,且所述母节点不满足预设查询终止条件时,将所述母节点更新为当前故障节点的步骤,还包括:
获取第一数量和第二数量,所述第一数量为与所述母节点具有故障关联关系的子节点的数量,所述第二数量为发生故障的子节点的数量;
基于所述第一数量生成预设数量阈值;
当所述第二数量大于所述预设数量阈值时,确定所述母节点发生故障。
以上各个操作的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本实施例的服务器在获取系统中设备发送的故障告警信息后,可以根据故障告警信息在预设对应关系中确定设备对应的当前故障节点,然后基于预设对应关系查询与当前故障节点具有故障关联关系、且发生故障的目标关联节点,以输出目标关联节点;由于预设对应关系中包括节点之间的故障关联关系,即当前故障节点可以根据预设对应关系中的故障关联关系找出最终的故障根因,从而可以提高故障定位的准确性。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、磁盘或光盘等。
以上对本发明实施例所提供的一种故障定位方法、装置和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种故障定位方法,其特征在于,包括:
获取系统中设备发送的故障告警信息;
根据所述故障告警信息在预设对应关系中确定所述设备对应的当前故障节点,其中,所述预设对应关系包括节点之间的故障关联关系,所述节点对应于所述系统中的设备,所述故障关联关系指当一个节点对应的设备发生故障时会对另一个节点对应的设备造成影响;
在所述预设对应关系中查询与所述当前故障节点具有故障关联关系的母节点;
获取第一数量和第二数量,所述第一数量为与所述母节点具有故障关联关系的子节点的数量,所述第二数量为发生故障的子节点的数量;
将所述第一数量与所述第二数量进行对比,得到对比结果;
根据所述对比结果确定所述母节点是否发生故障,包括:当所述对比结果包括所述第一数量不等于所述第二数量时,获取每一发生故障的子节点的预设概率,基于所述预设概率计算所述母节点发生故障的概率,当所述概率满足预设概率条件时,确定所述母节点发生故障;其中,基于所述预设概率计算所述母节点发生故障的概率包括:基于公式
Figure FDA0003345985730000011
计算所述母节点发生故障的概率P,其中,m表示第一数量,n表示第二数量,Pi、Pj分别为对应的发生故障的子节点的预设概率;
当所述母节点发生故障,且所述母节点满足预设查询终止条件时,确定所述母节点为目标关联节点;
输出目标关联节点的节点信息。
2.根据权利要求1所述的故障定位方法,其特征在于,所述方法还包括;
当所述母节点未发生故障时,确定所述当前故障节点为目标关联节点。
3.根据权利要求2所述的故障定位方法,其特征在于,还包括:
当所述母节点发生故障,且所述母节点不满足预设查询终止条件时,将所述母节点更新为当前故障节点,并返回执行所述在所述预设对应关系中查询与所述当前故障节点具有故障关联关系的母节点的步骤。
4.根据权利要求3所述的故障定位方法,其特征在于,当所述母节点发生故障,且所述母节点不满足预设查询终止条件时,将所述母节点更新为当前故障节点的步骤,包括:
当所述母节点发生故障时,获取所述母节点的节点类型;
当所述节点类型不为预设对应关系中的根节点时,确定所述母节点不满足预设查询终止条件,将所述母节点更新为当前故障节点。
5.根据权利要求4所述的故障定位方法,其特征在于,所述根据所述对比结果确定所述母节点是否发生故障的步骤,还包括:
当所述对比结果包括所述第一数量等于所述第二数量时,确定所述母节点发生故障。
6.根据权利要求3所述的故障定位方法,其特征在于,还包括:
基于所述第一数量生成预设数量阈值;
当所述第二数量大于所述预设数量阈值时,确定所述母节点发生故障。
7.一种故障定位装置,其特征在于,包括:
获取模块,用于获取系统中设备发送的故障告警信息;
确定模块,用于根据所述故障告警信息在预设对应关系中确定所述设备对应的当前故障节点,其中,所述预设对应关系包括节点之间的故障关联关系,所述节点对应于所述业务系统中的设备,所述故障关联关系指当一个节点对应的设备发生故障时会对另一个节点对应的设备造成影响;
查询模块,用于:在所述预设对应关系中查询与所述当前故障节点具有故障关联关系的母节点;获取第一数量和第二数量,所述第一数量为与所述母节点具有故障关联关系的子节点的数量,所述第二数量为发生故障的子节点的数量;将所述第一数量与所述第二数量进行对比,得到对比结果;根据所述对比结果确定所述母节点是否发生故障,包括:当所述对比结果包括所述第一数量不等于所述第二数量时,获取每一发生故障的子节点的预设概率,基于所述预设概率计算所述母节点发生故障的概率,当所述概率满足预设概率条件时,确定所述母节点发生故障;当所述母节点发生故障,且所述母节点满足预设查询终止条件时,确定所述母节点为目标关联节点;其中,基于所述预设概率计算所述母节点发生故障的概率包括:基于公式
Figure FDA0003345985730000031
计算所述母节点发生故障的概率P,其中,m表示第一数量,n表示第二数量,Pi、Pj分别为对应的发生故障的子节点的预设概率;
输出模块,用于输出所述目标关联节点的节点信息。
8.根据权利要求7所述的故障定位装置,其特征在于,所述查询模块包括:
第二更新单元,用于当所述母节点未发生故障时,确定所述当前故障节点为目标关联节点。
9.根据权利要求8所述的故障定位装置,其特征在于,所述查询模块还包括:
第一更新单元,用于当所述母节点发生故障,且所述母节点不满足预设查询终止条件时,将所述母节点更新为当前故障节点,并触发所述查询单元执行在所述预设对应关系中查询与所述当前故障节点具有故障关联关系的母节点。
10.根据权利要求9所述的故障定位装置,其特征在于,所述第一更新单元包括:
第一获取子单元,用于当所述母节点发生故障时,获取所述母节点的节点类型;
第一更新子单元,用于当所述节点类型不为预设对应关系的根节点时,确定所述母节点不满足预设查询终止条件,将所述母节点更新为当前故障节点,并触发所述查询单元执行在所述预设对应关系中查询与所述当前故障节点具有故障关联关系的母节点。
11.根据权利要求10所述的故障定位装置,其特征在于,所述装置还包括执行子单元具体用于:
当所述对比结果包括所述第一数量等于所述第二数量时,确定所述母节点发生故障。
12.一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-6任一项所述故障定位方法的步骤。
CN201910803082.6A 2019-08-28 2019-08-28 一种故障定位方法、装置及存储介质 Active CN111193605B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910803082.6A CN111193605B (zh) 2019-08-28 2019-08-28 一种故障定位方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910803082.6A CN111193605B (zh) 2019-08-28 2019-08-28 一种故障定位方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111193605A CN111193605A (zh) 2020-05-22
CN111193605B true CN111193605B (zh) 2022-02-01

Family

ID=70709055

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910803082.6A Active CN111193605B (zh) 2019-08-28 2019-08-28 一种故障定位方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111193605B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111679953B (zh) * 2020-06-09 2022-04-12 平安科技(深圳)有限公司 基于人工智能的故障节点识别方法、装置、设备和介质
CN111722058A (zh) * 2020-06-17 2020-09-29 国网甘肃省电力公司信息通信公司 基于知识图谱的电力信息系统故障检测方法、装置及介质
CN111930547B (zh) * 2020-07-31 2024-06-25 中国工商银行股份有限公司 一种故障定位方法、装置及存储介质
CN112035288B (zh) * 2020-09-01 2023-08-15 中国银行股份有限公司 一种作业故障影响确定方法及相关设备
CN112269818B (zh) * 2020-11-25 2023-11-21 成都数之联科技股份有限公司 一种设备参数根因定位方法及系统、装置、介质
CN112764957A (zh) * 2021-01-15 2021-05-07 中国工商银行股份有限公司 应用故障定界方法及装置
CN112749285A (zh) * 2021-01-21 2021-05-04 北京明略昭辉科技有限公司 一种基于知识图谱的资源预警方法、系统、设备及介质
CN113032238B (zh) * 2021-05-25 2021-08-17 南昌惠联网络技术有限公司 基于应用知识图谱的实时根因分析方法
CN113434320A (zh) * 2021-06-24 2021-09-24 中国工商银行股份有限公司 信息系统故障定位方法、装置、设备及存储介质
CN113672776B (zh) * 2021-08-25 2024-04-12 中国农业银行股份有限公司 一种故障分析方法及装置
CN115243286B (zh) * 2022-06-20 2024-05-03 中国联合网络通信集团有限公司 一种数据处理方法、装置及存储介质
CN115529229A (zh) * 2022-11-09 2022-12-27 中国农业银行股份有限公司 故障定位方法、装置及设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102404141B (zh) * 2011-11-04 2014-03-12 华为技术有限公司 一种告警抑制的方法及装置
CN104796273B (zh) * 2014-01-20 2018-11-16 中国移动通信集团山西有限公司 一种网络故障根源诊断的方法和装置
CN106330501A (zh) * 2015-06-26 2017-01-11 中兴通讯股份有限公司 一种故障关联方法和装置
US10142185B2 (en) * 2016-06-08 2018-11-27 At&T Intellectual Property I, L.P. Content quality assessment and prediction via flows
CN108259195B (zh) * 2016-12-28 2021-07-09 阿里巴巴集团控股有限公司 异常事件的影响范围的确定方法及系统
CN109308252B (zh) * 2017-07-27 2022-04-01 中国移动通信集团浙江有限公司 一种故障定位处理方法及装置
CN108833184B (zh) * 2018-06-29 2020-10-27 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
CN110149223B (zh) * 2019-05-10 2022-04-15 中国联合网络通信集团有限公司 故障定位方法和设备

Also Published As

Publication number Publication date
CN111193605A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
CN111193605B (zh) 一种故障定位方法、装置及存储介质
CN111600746B (zh) 网络故障定位方法、装置及设备
US9960964B2 (en) System, method and apparatus to manage services in a network
CN107104824B (zh) 一种网络拓扑确定方法和装置
US20130212257A1 (en) Computer program and monitoring apparatus
CN106294073B (zh) 服务调用方法及装置
CN108833202A (zh) 故障链路检测方法、装置和计算机可读存储介质
CN110784515A (zh) 基于分布式集群的数据存储方法、及其相关设备
US10185614B2 (en) Generic alarm correlation by means of normalized alarm codes
CN112685175B (zh) 一种服务拓扑图的构建方法、装置和计算机可读存储介质
US8572220B2 (en) System and method for managing configurations of NCPI devices
CN113259148B (zh) 基于联邦学习的告警关联检测方法、系统及介质
WO2006117833A1 (ja) 監視シミュレーション装置,方法およびそのプログラム
CN113114491B (zh) 一种网络拓扑的构建方法、装置和设备
CN104283966A (zh) 云存储系统的数据分布算法及其装置
CN107203437A (zh) 防止内存数据丢失的方法、装置和系统
CN110083512A (zh) 集群监控的方法及装置
CN113656369A (zh) 一种大数据场景下的日志分布式流式采集及计算方法
CN110752972A (zh) 一种网卡状态监控方法、装置、设备及介质
CN115643158A (zh) 设备集群修复方法、装置、设备和存储介质
CN114598680A (zh) 域名的管理方法、装置及存储介质
CN113946465A (zh) 一种大数据的故障处理方法及其相关设备
CN112187543A (zh) 一种云平台事件监控系统、方法及电子设备
CN107968809B (zh) 一种副本放置方法及装置
CN115150253B (zh) 一种故障根因确定方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant