CN113037562A - 一种网关故障评估方法、装置及服务器 - Google Patents
一种网关故障评估方法、装置及服务器 Download PDFInfo
- Publication number
- CN113037562A CN113037562A CN202110314847.7A CN202110314847A CN113037562A CN 113037562 A CN113037562 A CN 113037562A CN 202110314847 A CN202110314847 A CN 202110314847A CN 113037562 A CN113037562 A CN 113037562A
- Authority
- CN
- China
- Prior art keywords
- fault
- gateway
- preset
- target
- target gateway
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000011156 evaluation Methods 0.000 claims abstract description 52
- 230000008859 change Effects 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000012423 maintenance Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/66—Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供的网关故障评估方法、装置及服务器,应用于计算机技术领域,该方法在获取目标网关的运行信息之后,首先根据运行信息和预设故障判定规则,判断目标网关是否发生故障,如果目标网关发生故障,则基于预设业务清单,确定故障影响的目标业务,即确定故障的影响范围,同时,根据目标业务以及预设故障等级评价原则,确定故障的故障等级。本方法可以根据目标网关的运行信息判断目标网关是否发生故障,并在目标网关发生故障的情况下,确定故障的影响范围和故障等级,与现有技术中通过人工复盘对故障进行评估的方法相比,可以节省大量的人力消耗,同时,具有更高的时效性,能够迅速的得出故障评估结果,从而满足实际应用需求。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种网关故障评估方法、装置及服务器。
背景技术
网关是互联网中重要的中间连接、控制设备,主要用于实现网络间的连通和信息交互控制,正因为网关在互联网的正常运行过程中发挥着举足轻重的作用,网关故障对于互联网的影响往往是较为严重的。为了准确了解网关故障发生的原因、故障造成的影响,并基于此指定相应的维护方案,以及防止类似故障的再次发生,对网关故障进行评估,确定网关故障的等级和影响范围,是网关维护管理的重要工作。
现有技术对网关故障的评估大多是在相应的故障排除之后,对故障进行复盘时,通过运维人员整理各方面信息确定故障的影响范围和故障的等级,难以迅速的给出评估结论,现有技术中的网关故障评估方法,不仅耗费大量人力,而且在时效性方面严重不足,难以满足实际应用需求。
发明内容
有鉴于此,本发明的目的在于提供一种网关故障评估方法、装置及服务器,根据目标网关的运行信息实时判断目标网关的故障等级和影响范围,节省人力,同时具有较高的时效性,具体方案如下:
第一方面,本发明提供一种网关故障评估方法,包括:
获取目标网关的运行信息;
根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障;
若所述目标网关发生故障,基于预设业务清单,确定所述故障影响的目标业务,其中,所述预设业务清单中记录所述目标网关对应的所有业务;
根据所述目标业务以及预设故障等级评价原则,确定所述故障的故障等级。
可选的,所述运行信息包括硬件资源占用信息、运行状态信息和运行记录。
可选的,所述根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障,包括:
根据所述硬件资源占用信息确定所述目标网关的资源占用率和所述资源占用率的变化率;
若所述资源占用率超过预设占用率阈值,或者,所述资源占用率的变化率超过预设变化率阈值,判定所述目标网关发生故障;
若所述资源占用率未超过所述预设占用率阈值,且所述资源占用率的变化率未超过所述预设变化率阈值,判定所述目标网关正常。
可选的,所述运行状态信息包括配置下发状态;
所述根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障,包括:
获取运行日志;
根据所述运行日志中记录的配置下发状态,判断所述目标网关是否发生故障。
可选的,所述运行记录包括运行日志和配置信息;
所述根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障,包括:
获取预设关键字集合,其中,所述预设关键字集合中记录有与网关故障相对应的关键字;
判断所述运行日志或所述配置信息中是否包括所述预设关键字集合中记录的关键字;
若所述运行日志或所述配置信息中包括所述预设关键字集合中记录的至少一个关键字,判定所述目标网关发生故障;
若所述运行日志和所述配置信息中未包括所述预设关键字集合中记录的关键字,判定所述目标网关正常。
可选的,所述根据所述目标业务以及预设故障等级评价原则,确定所述故障的故障等级,包括:
确定所述目标业务的总数量和各所述目标业务对应的业务等级;
根据所述目标业务的总数量、各所述目标业务对应的业务等级以及所述预设故障等级评价原则,确定所述故障的故障等级;
其中,所述预设故障等级评价原则中记录有受故障影响的业务的数量与故障等级之间的对应关系,以及,受故障影响的业务的业务等级与故障等级之间的对应关系。
可选的,本发明第一方面提供的网关故障评估方法,还包括:统计所述故障的持续时长;
根据所述持续时长与预设时长阈值的大小关系,更新所述故障的故障等级。
可选的,本发明第一方面提供的网关故障评估方法,还包括:
对所述目标网关进行外部拨号测试;
根据外部拨号测试结果判断所述目标网关是否出现故障。
第二方面,本发明提供一种网关故障评估装置,包括:
获取单元,用于获取目标网关的运行信息;
判断单元,用于根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障;
第一确定单元,用于若所述目标网关发生故障,基于预设业务清单,确定所述故障影响的目标业务,其中,所述预设业务清单中记录所述目标网关对应的所有业务;
第二确定单元,用于根据所述目标业务以及预设故障等级评价原则,确定所述故障的故障等级。
第三方面,本发明提供一种服务器,包括:存储器和处理器;所述存储器存储有适于所述处理器执行的程序,以实现本发明第一方面任一项所述的网关故障评估方法。
基于上述技术方案,本发明提供的网关故障评估方法,在获取目标网关的运行信息之后,首先根据运行信息和预设故障判定规则,判断目标网关是否发生故障,如果目标网关发生故障,则基于预设业务清单,确定故障影响的目标业务,即确定故障的影响范围,同时,根据目标业务以及预设故障等级评价原则,确定故障的故障等级。本发明提供的网关故障评估方法可以根据目标网关的运行信息判断目标网关是否发生故障,并在目标网关发生故障的情况下,确定故障的影响范围和故障等级,与现有技术中通过人工复盘对故障进行评估的方法相比,可以节省大量的人力消耗,同时,具有更高的时效性,能够迅速的得出故障评估结果,从而满足实际应用需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种网关故障评估方法流程图;
图2是本发明实施例提供的一种网关故障评估装置的结构框图;
图3是本发明实施例提供的另一种网关故障评估装置的结构框图;
图4是本发明实施例提供的再一种网关故障评估装置的结构框图;
图5是本发明实施例提供的一种服务器的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明实施例提供的网关故障评估方法流程图,该方法可应用于电子设备,比如笔记本电脑、PC机(个人计算机)等能够获取网关的运行信息,运行预设控制程序以对运行信息进行分析的电子设备;当然,在某些情况下,也可以应用于网络侧的服务器。参照图1,本发明实施例提供的网关故障评估方法的流程,可以包括:
S100、获取目标网关的运行信息。
在本发明实施例以及后续各个实施例中,目标网关指的是需要应用本发明提供的网关故障评估方法进行运行监控以及故障评估的网关,在实际应用中,可以是互联网络中任意一个网关。
进一步的,目标网关的运行信息主要指目标网关在运行过程中能够表征目标网关运行状态的参数。可选的,在本发明实施例中,目标网关的运行信息主要包括硬件资源占用信息、运行状态信息、运行记录以及在对目标网关进行拨号测试时对应的拨测信息。
其中,目标网关的硬件资源占用信息可以是影响目标网关运行性能的关键硬件设备的占用信息,比如CPU、内存、IO口等,当然,还可以包括其他可以其他基础监控信息,比如网卡的流量变化信息等;运行状态信息主要包括配置下发状态、进程运行状态等;运行记录主要指目标网关中存储的运行日志和配置信息。
需要说明的是,为了保证故障评估的时效性,上述运行信息的获取是实时进行的,比如,可以按照预设的信息采集周期对上述运行信息进行采集,随着目标网关的运行,实时获取目标网关的运行信息。
S110、根据运行信息和预设故障判定规则,判断目标网关是否发生故障,若是,执行S120。
在获得前述运行信息之后,即可结合预设故障判定规则对目标网关是否发生故障进行判断。
如前所述,目标网关的运行信息可以包括多种,相应的,预设故障判定规则的具体内容也会有所不同,下面结合具体选用的运行信息,对预设故障判定规则的可选构成,以及判断目标网关是否发生故障的过程进行介绍。
可选的,在运行信息选用硬件资源占用信息的情况下,首先需要根据硬件资源占用信息确定目标网关的资源占用率和相应的资源占用率的变化率。比如,硬件资源指CPU,相应的,资源占用率则可以是CPU占用率,而资源占用率的变化率则对应的是CPU占用率的变化率;再比如,硬件资源指内存,相应的,资源占用率则可以是内存使用率,而资源占用率则对应的是内存使用率的变化率。
为了完成对上述资源占用率以及资源占用率的变化率的评估,本发明实施例分别设置有预设占用率阈值以及预设变化率阈值,基于此,如果资源占用率超过预设占用率阈值,或者,资源占用率的变化率超过预设变化率阈值,则判定目标网关发生故障;相反的,如果资源占用率未超过预设占用率阈值,且资源占用率的变化率未超过预设变化率阈值,则可以判定目标网关是正常的。
可选的,在运行状态信息包括配置下发状态的情况下,在对目标网关是否发生故障的判断过程中,首先需要获取目标网关的运行日志,并进一步根据运行日志中记录的配置下发状态,判断目标网关是否发生故障。需要说明的是,对于根据配置下发状态判断目标网关是否故障的具体过程,可以参照现有技术实现,本发明对此不做限定。
可选的,在运行记录包括运行日志和配置信息的情况下,本发明实施例提供的方法中提供预设关键字集合,该预设关键字集合中记录有与网关故障相对应的关键字,基于此,首先要获取预设关键字集合,然后判断运行日志或配置信息中是否包括预设关键字集合中记录的关键字,如果运行日志或配置信息中包括预设关键字集合中记录的至少一个关键字,则判定目标网关发生故障;相反的,如果运行日志和配置信息中未包括预设关键字集合中记录的关键字,则判定目标网关正常。
进一步的,预设关键字集合中还可包括与各预设关键字对应的故障含义以及该故障对系统中各个业务的影响,为后续步骤确定故障的影响范围和故障等级提供参考依据。
可选的,还可控制客户端模拟设备对目标网关进行外部拨号测试,获取目标网关在响应拨号测试过程中的拨测信息,根据外部拨号测试结果判断目标网关是否出现故障。需要说明的是,对于通过客户端模拟设备进行外部拨号测试的具体测试过程,可以基于现有技术实现,本发明对此不做限定。
可选的,本发明实施例提供的网关故障评估方法,还可提供可视化展示功能,以及报警功能。具体的,在获取到上述运行信息后,首先即可将所得运行信息通过可视化设备进行展示,进一步的,在以任何一种方式判断目标网关发生故障的情况下,还可以对相应的故障信息进行可视化展示。可选的,结合历史维护经验,可以得到与各种故障对应的应急预案,当然,这些应急预案是作为参考信息使用的,在确定目标网关发生故障后,还以根据判定故障的依据,即前述运行信息,确定是否存在与当前故障对应的应急预案,如果存在的话,还可以一并展示相应的应急预案。
进一步的,为了尽可能的缩短目标网关处于故障状态的时间,在判定目标网关发生故障之后,即可向运维人员发送故障通知消息。
当然,如果经过判断目标网关没有发生故障,则退出当前控制过程即可。
S120、基于预设业务清单确定故障影响的目标业务,并根据目标业务以及预设故障等级评价原则,确定故障的故障等级;
在实际应用中,一个网关对应一个设备集群,而为了便于统计管理该设备集群对应的数量众多的业务,往往需要针对确定的网关设置对应的业务清单,该清单中记录网关所有的业务,并且,清单中记录有各个业务的业务名称、服务对象、客户信息以及业务等级。在本实施例提供的方法中,同样提供预设业务清单,用于记录目标网关对应的所有业务。
基于此,首先需要根据预设业务清单,确定清单中受故障影响的目标业务具体有哪些。需要说明的是,对于任一故障,基于预设业务清单判定该故障具体影响哪些目标业务的具体过程,可以参照现有技术实现,本发明对此不做限定。
可以想到的是,确定了受故障影响的目标业务之后,即可相应的得到目标业务的总数量和各个目标业务对应的业务等级,确定了目标业务的数量以及具体的目标业务包括哪些业务,即等同于确定故障的影响范围。
而用于确定故障等级的预设故障等级评价原则,则可基于目标业务的数量以及目标业务的业务等级指定,即该预设故障等级评价原则中记录有受故障影响的业务的数量与故障等级之间的对应关系,以及,受故障影响的业务的业务等级与故障等级之间的对应关系。
比如,目标业务的数量大于5个时,确定故障等级为A等级;目标业务的数量大于3个且小于等于5个时,确定故障等级为B等级,以此类推,此处不再一一列举。
再比如,如果目标业务中包括业务等级为重点业务的业务时,确定故障等级为A等级,相反的,则可将故障等级确定为B等级。
当然,在实际应用中,还可以将上述两种判定条件结合到一起使用,沿用前例,目标业务的数量大于3个且小于等于5个,但目标业务中包括一个重点业务,则直接将故障等级确定为A等级。大多数情况下,可以将故障等级划分为A~F六个等级,此处不再赘述。
可选的,本发明实施例提供的评估方法,还支持对故障等级的动态更新,具体的,在判定发生故障后,统计故障的持续时长,并进一步根据所得持续时长与预设时长阈值的大小关系,更新故障的故障等级。
比如,故障持续时长大于3小时,或者,目标业务中包括重点业务,或者目标业务的数量超过一定值时,确定故障等级为A等级。
如过目标业务的数量较少,且包括重点业务,则基于故障的持续时长更新故障等级,具体的:
如果故障的持续时长为2-3小时时,故障等级为B等级;如果故障的持续时长为1-2小时,故障等级为C等级;如果故障的持续时长为30分钟-1小时,故障等级为D等级;如果故障的持续时长为10分钟-30分钟,故障等级为E等级;如果故障的持续时长为0-10分钟,则故障等级为F等级。
当然,上述给出的各种确定故障等级的方法还可以采用其他组合方式,采用其中的一种或多种实现故障等级的确定,此处不再赘述。
下面对本发明实施例提供的网关故障评估装置进行介绍,下文描述的网关故障评估装置可以认为是为实现本发明实施例提供的网关故障评估方法,在中央设备中需设置的功能模块架构;下文描述内容可与上文相互参照。
图2为本发明实施例提供的一种网关故障评估装置的结构框图,参照图2,该装置可以包括:
获取单元10,用于获取目标网关的运行信息;
判断单元20,用于根据运行信息和预设故障判定规则,判断目标网关是否发生故障;
第一确定单元30,用于若目标网关发生故障,基于预设业务清单,确定故障影响的目标业务,其中,预设业务清单中记录目标网关对应的所有业务;
第二确定单元40,用于根据目标业务以及预设故障等级评价原则,确定故障的故障等级。
可选的,运行信息包括硬件资源占用信息、运行状态信息和运行记录。
可选的,判断单元20,用于根据运行信息和预设故障判定规则,判断目标网关是否发生故障,包括:
根据硬件资源占用信息确定目标网关的资源占用率和资源占用率的变化率;
若资源占用率超过预设占用率阈值,或者,资源占用率的变化率超过预设变化率阈值,判定目标网关发生故障;
若资源占用率未超过预设占用率阈值,且资源占用率的变化率未超过预设变化率阈值,判定目标网关正常。
可选的,运行状态信息包括配置下发状态;
判断单元20,用于根据运行信息和预设故障判定规则,判断目标网关是否发生故障,包括:
获取运行日志;
根据运行日志中记录的配置下发状态,判断目标网关是否发生故障。
可选的,运行记录包括运行日志和配置信息;
判断单元20,用于根据运行信息和预设故障判定规则,判断目标网关是否发生故障,包括:
获取预设关键字集合,其中,预设关键字集合中记录有与网关故障相对应的关键字;
判断运行日志或配置信息中是否包括预设关键字集合中记录的关键字;
若运行日志或配置信息中包括预设关键字集合中记录的至少一个关键字,判定目标网关发生故障;
若运行日志和配置信息中未包括预设关键字集合中记录的关键字,判定目标网关正常。
可选的,第二确定单元40,用于根据目标业务以及预设故障等级评价原则,确定故障的故障等级,包括:
确定目标业务的总数量和各目标业务对应的业务等级;
根据目标业务的总数量、各目标业务对应的业务等级以及预设故障等级评价原则,确定故障的故障等级;
其中,预设故障等级评价原则中记录有受故障影响的业务的数量与故障等级之间的对应关系,以及,受故障影响的业务的业务等级与故障等级之间的对应关系。
可选的,参见图3,图3是本发明实施例提供的另一种网关故障评估装置的结构框图,在图2所示实施例的基础上,本装置还包括:
统计单元50,用于统计故障的持续时长;
更新单元60,用于根据持续时长与预设时长阈值的大小关系,更新故障的故障等级。
可选的,参见图4,图4是本发明实施例提供的再一种网关故障评估装置的结构框图,在图3所示实施例的基础上,本装置还包括:
拨测单元70,用于对目标网关进行外部拨号测试;根据外部拨号测试结果判断目标网关是否出现故障。
可选的,本发明申请实施例还提供一种服务器,图5为本发明实施例提供的服务器的硬件结构图,参见图5所示,包括:可以包括:至少一个处理器100,至少一个通信接口200,至少一个存储器300和至少一个通信总线400;
在本发明实施例中,处理器100、通信接口200、存储器300、通信总线400的数量为至少一个,且处理器100、通信接口200、存储器300通过通信总线400完成相互间的通信;显然,图5所示的处理器100、通信接口200、存储器300和通信总线400所示的通信连接示意仅是可选的;
可选的,通信接口200可以为通信模块的接口,如GSM模块的接口;
处理器100可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器300可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
其中,处理器100具体用于实现上述所述的网关故障评估方法的任一实施例。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种网关故障评估方法,其特征在于,包括:
获取目标网关的运行信息;
根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障;
若所述目标网关发生故障,基于预设业务清单,确定所述故障影响的目标业务,其中,所述预设业务清单中记录所述目标网关对应的所有业务;
根据所述目标业务以及预设故障等级评价原则,确定所述故障的故障等级。
2.根据权利要求1所述的网关故障评估方法,其特征在于,所述运行信息包括硬件资源占用信息、运行状态信息和运行记录。
3.根据权利要求2所述的网关故障评估方法,其特征在于,所述根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障,包括:
根据所述硬件资源占用信息确定所述目标网关的资源占用率和所述资源占用率的变化率;
若所述资源占用率超过预设占用率阈值,或者,所述资源占用率的变化率超过预设变化率阈值,判定所述目标网关发生故障;
若所述资源占用率未超过所述预设占用率阈值,且所述资源占用率的变化率未超过所述预设变化率阈值,判定所述目标网关正常。
4.根据权利要求2所述的网关故障评估方法,其特征在于,所述运行状态信息包括配置下发状态;
所述根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障,包括:
获取运行日志;
根据所述运行日志中记录的配置下发状态,判断所述目标网关是否发生故障。
5.根据权利要求2所述的网关故障评估方法,其特征在于,所述运行记录包括运行日志和配置信息;
所述根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障,包括:
获取预设关键字集合,其中,所述预设关键字集合中记录有与网关故障相对应的关键字;
判断所述运行日志或所述配置信息中是否包括所述预设关键字集合中记录的关键字;
若所述运行日志或所述配置信息中包括所述预设关键字集合中记录的至少一个关键字,判定所述目标网关发生故障;
若所述运行日志和所述配置信息中未包括所述预设关键字集合中记录的关键字,判定所述目标网关正常。
6.根据权利要求1所述的网关故障评估方法,其特征在于,所述根据所述目标业务以及预设故障等级评价原则,确定所述故障的故障等级,包括:
确定所述目标业务的总数量和各所述目标业务对应的业务等级;
根据所述目标业务的总数量、各所述目标业务对应的业务等级以及所述预设故障等级评价原则,确定所述故障的故障等级;
其中,所述预设故障等级评价原则中记录有受故障影响的业务的数量与故障等级之间的对应关系,以及,受故障影响的业务的业务等级与故障等级之间的对应关系。
7.根据权利要求1所述的网关故障评估方法,其特征在于,还包括:统计所述故障的持续时长;
根据所述持续时长与预设时长阈值的大小关系,更新所述故障的故障等级。
8.根据权利要求1-7任一项所述的网关故障评估方法,其特征在于,还包括:
对所述目标网关进行外部拨号测试;
根据外部拨号测试结果判断所述目标网关是否出现故障。
9.一种网关故障评估装置,其特征在于,包括:
获取单元,用于获取目标网关的运行信息;
判断单元,用于根据所述运行信息和预设故障判定规则,判断所述目标网关是否发生故障;
第一确定单元,用于若所述目标网关发生故障,基于预设业务清单,确定所述故障影响的目标业务,其中,所述预设业务清单中记录所述目标网关对应的所有业务;
第二确定单元,用于根据所述目标业务以及预设故障等级评价原则,确定所述故障的故障等级。
10.一种服务器,其特征在于,包括:存储器和处理器;所述存储器存储有适于所述处理器执行的程序,以实现权利要求1至8任一项所述的网关故障评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110314847.7A CN113037562A (zh) | 2021-03-24 | 2021-03-24 | 一种网关故障评估方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110314847.7A CN113037562A (zh) | 2021-03-24 | 2021-03-24 | 一种网关故障评估方法、装置及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113037562A true CN113037562A (zh) | 2021-06-25 |
Family
ID=76474067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110314847.7A Pending CN113037562A (zh) | 2021-03-24 | 2021-03-24 | 一种网关故障评估方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113037562A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114095964A (zh) * | 2021-11-19 | 2022-02-25 | 中国联合网络通信集团有限公司 | 一种故障恢复方法、装置及计算机可读存储介质 |
CN114172784A (zh) * | 2021-11-16 | 2022-03-11 | 武汉烽火技术服务有限公司 | 一种网络故障风险分析方法及装置 |
CN115086143A (zh) * | 2022-04-28 | 2022-09-20 | 阿里巴巴(中国)有限公司 | 故障预警方法及装置 |
CN115378798A (zh) * | 2022-08-22 | 2022-11-22 | 中国联合网络通信集团有限公司 | 基于动态感知的多集群网关协同方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106789141A (zh) * | 2015-11-24 | 2017-05-31 | 阿里巴巴集团控股有限公司 | 一种网关设备故障处理方法及装置 |
CN109002384A (zh) * | 2018-06-29 | 2018-12-14 | 郑州云海信息技术有限公司 | 一种服务器故障的报警方法、装置、设备及存储介质 |
CN111953548A (zh) * | 2020-08-21 | 2020-11-17 | 中国建设银行股份有限公司 | 一种业务影响判定方法及装置 |
CN112003748A (zh) * | 2020-08-21 | 2020-11-27 | 中国建设银行股份有限公司 | 适用于虚拟网关的故障处理方法、系统、装置和存储介质 |
CN112003765A (zh) * | 2020-08-13 | 2020-11-27 | 中移(杭州)信息技术有限公司 | 网关故障诊断方法、系统、服务器及存储介质 |
-
2021
- 2021-03-24 CN CN202110314847.7A patent/CN113037562A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106789141A (zh) * | 2015-11-24 | 2017-05-31 | 阿里巴巴集团控股有限公司 | 一种网关设备故障处理方法及装置 |
CN109002384A (zh) * | 2018-06-29 | 2018-12-14 | 郑州云海信息技术有限公司 | 一种服务器故障的报警方法、装置、设备及存储介质 |
CN112003765A (zh) * | 2020-08-13 | 2020-11-27 | 中移(杭州)信息技术有限公司 | 网关故障诊断方法、系统、服务器及存储介质 |
CN111953548A (zh) * | 2020-08-21 | 2020-11-17 | 中国建设银行股份有限公司 | 一种业务影响判定方法及装置 |
CN112003748A (zh) * | 2020-08-21 | 2020-11-27 | 中国建设银行股份有限公司 | 适用于虚拟网关的故障处理方法、系统、装置和存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114172784A (zh) * | 2021-11-16 | 2022-03-11 | 武汉烽火技术服务有限公司 | 一种网络故障风险分析方法及装置 |
CN114172784B (zh) * | 2021-11-16 | 2023-11-03 | 武汉烽火技术服务有限公司 | 一种网络故障风险分析方法及装置 |
CN114095964A (zh) * | 2021-11-19 | 2022-02-25 | 中国联合网络通信集团有限公司 | 一种故障恢复方法、装置及计算机可读存储介质 |
CN114095964B (zh) * | 2021-11-19 | 2023-05-26 | 中国联合网络通信集团有限公司 | 一种故障恢复方法、装置及计算机可读存储介质 |
CN115086143A (zh) * | 2022-04-28 | 2022-09-20 | 阿里巴巴(中国)有限公司 | 故障预警方法及装置 |
CN115378798A (zh) * | 2022-08-22 | 2022-11-22 | 中国联合网络通信集团有限公司 | 基于动态感知的多集群网关协同方法及系统 |
CN115378798B (zh) * | 2022-08-22 | 2024-02-13 | 中国联合网络通信集团有限公司 | 基于动态感知的多集群网关协同方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113037562A (zh) | 一种网关故障评估方法、装置及服务器 | |
CN108848515B (zh) | 一种基于大数据的物联网业务质量监测平台及方法 | |
US6973415B1 (en) | System and method for monitoring and modeling system performance | |
US7082381B1 (en) | Method for performance monitoring and modeling | |
CN108092836A (zh) | 一种服务器的监控方法及装置 | |
US7369967B1 (en) | System and method for monitoring and modeling system performance | |
CN110650060A (zh) | 流量告警的处理方法、设备及存储介质 | |
CN114095965A (zh) | 指标检测模型获取及故障定位方法、装置、设备及存储介质 | |
CN116405412B (zh) | 基于混沌工程故障模拟服务端集群有效性验证方法和系统 | |
CN114202238A (zh) | 供电设备健康度评估方法、运维方法、装置及服务器 | |
CN114338372A (zh) | 网络信息安全监控方法及系统 | |
CN117061335A (zh) | 云平台设备健康管控方法、装置、存储介质和电子设备 | |
CN111157245A (zh) | 一种轨道交通走行部轴承的监管方法及系统 | |
CN111176950A (zh) | 一种监控服务器集群的网卡的方法和设备 | |
CN113835961B (zh) | 告警信息监控方法、装置、服务器及存储介质 | |
CN111654405A (zh) | 通信链路的故障节点方法、装置、设备及存储介质 | |
Proença et al. | Anomaly detection for network servers using digital signature of network segment | |
CN114666390B (zh) | 应用程序的页面监测方法、装置、电子设备及存储介质 | |
CN114500178B (zh) | 一种自运维的智慧物联网关 | |
CN113259322B (zh) | 一种预防Web服务异常的方法、系统及介质 | |
CN110069382A (zh) | 软件监控方法、服务器、终端设备、计算机设备及介质 | |
EP3772834A1 (en) | A method of predicting the time course of a plurality of data relative to a telephony infrastructure for network function virtualization | |
CN110232521B (zh) | 一种业务系统稳定性评估方法及评估装置 | |
CN109120439B (zh) | 分布式集群告警输出方法、装置、设备及可读存储介质 | |
CN111488284A (zh) | 一种用于OpenStack云平台的模拟操作主动检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210625 |