CN112350840A - 一种故障监测和修复的方法及相关设备 - Google Patents

一种故障监测和修复的方法及相关设备 Download PDF

Info

Publication number
CN112350840A
CN112350840A CN201910729057.8A CN201910729057A CN112350840A CN 112350840 A CN112350840 A CN 112350840A CN 201910729057 A CN201910729057 A CN 201910729057A CN 112350840 A CN112350840 A CN 112350840A
Authority
CN
China
Prior art keywords
monitoring object
target monitoring
target
gateway device
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910729057.8A
Other languages
English (en)
Inventor
周兆熊
武玉磊
谭武功
曾强
周江村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile IoT Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile IoT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile IoT Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910729057.8A priority Critical patent/CN112350840A/zh
Publication of CN112350840A publication Critical patent/CN112350840A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供一种故障监测和修复的方法及相关设备,涉及通信技术领域,其中,所述方法包括:确定待监测的目标监测对象;对所述目标监测对象执行监测任务,得到任务数据;在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;基于所述预设处理策略对所述目标监测对象进行故障修复。本发明实施例中,通过对目标监测对象执行监测任务,并对存在故障的目标监测对象按照预设处理策略进行修复,能够提高处理网关设备故障的智能化程度。

Description

一种故障监测和修复的方法及相关设备
技术领域
本发明涉及通信技术领域,尤其涉及一种故障监测和修复的方法及相关设备。
背景技术
随着物联网技术的发展,网关设备作为物联网的核心设备也越来越受到重视。网关设备能够实现系统信息的采集、信息输入、信息输出、集中控制、远程控制及联动控制等功能。网关设备是实现家居智能化的关键设备。
现有技术中,网关设备上设置有运行状态指示灯,当网关设备出现故障时,可以通过运行状态指示灯告知用户,以便用户对网关设备的故障进行处理。现有技术中对网关设备故障的处理方法智能化程度较低。
发明内容
本发明实施例提供一种故障监测和修复的方法及相关设备,以解决现有技术中对网关设备故障的处理方法智能化程度较低的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种故障监测和修复的方法,所述方法应用于网关设备,所述方法包括:
确定待监测的目标监测对象;
对所述目标监测对象执行监测任务,得到任务数据;
在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;
基于所述预设处理策略对所述目标监测对象进行故障修复。
可选的,所述确定待监测的目标监测对象之前,所述方法还包括:
预配置至少一个监测对象;
所述确定待监测的目标监测对象,包括:
按照第一预设时长对每个监测对象周期性地监测,获取待监测的目标监测对象。
可选的,所述对所述目标监测对象执行监测任务,得到任务数据之后,所述方法还包括:
基于所述任务数据对所述目标监测对象的状态信息进行更新;
根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象;
在确定继续监测所述目标监测对象的情况下,在第二预设时长后对所述目标监测对象执行所述监测任务,其中,所述第二预设时长小于所述第一预设时长。
可选的,所述获取与所述目标监测对象对应的预设处理策略之前,所述方法还包括:
获取与所述目标监测对象关联的进程的运行数据;
基于所述运行数据获取目标进程;
所述基于所述预设处理策略对所述目标监测对象进行故障修复,包括:
基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作。
可选的,所述对所述目标监测对象执行监测任务,得到任务数据,包括:
对所述目标监测对象执行下述至少一项操作得到任务数据:
向所述网关设备的进程发送消息、调用所述网关设备的接口、调用所述网关设备的调试命令、调用所述网关设备的操作系统命令、调用所述网关设备的操作系统接口以及读取文件系统信息。
第二方面,本发明实施例提供了一种网关设备,包括:
第一确定模块,用于确定待监测的目标监测对象;
第一执行模块,用于对所述目标监测对象执行监测任务,得到任务数据;
第一获取模块,用于在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;
修复模块,用于基于所述预设处理策略对所述目标监测对象进行故障修复。
可选的,所述网关设备还包括:
配置模块,用于预配置至少一个监测对象;
所述第一确定模块具体用于:
按照第一预设时长对每个监测对象周期性地监测,获取待监测的目标监测对象。
可选的,所述网关设备还包括:
更新模块,用于基于所述任务数据对所述目标监测对象的状态信息进行更新;
第二确定模块,用于根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象;
第二执行模块,用于在确定继续监测所述目标监测对象的情况下,在第二预设时长后对所述目标监测对象执行所述监测任务,其中,所述第二预设时长小于所述第一预设时长。
可选的,所述网关设备还包括:
第二获取模块,用于获取与所述目标监测对象关联的进程的运行数据;
第三获取模块,用于基于所述运行数据获取目标进程;
所述修复模块具体用于:
基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作。
可选的,所述第一执行模块具体用于:
对所述目标监测对象执行下述至少一项操作得到任务数据:
向所述网关设备的进程发送消息、调用所述网关设备的接口、调用所述网关设备的调试命令、调用所述网关设备的操作系统命令、调用所述网关设备的操作系统接口以及读取文件系统信息。
第三方面,本发明实施例提供了一种网关设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的故障监测和修复的方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的故障监测和修复的方法的步骤。
本发明实施例中,确定待监测的目标监测对象;对所述目标监测对象执行监测任务,得到任务数据;在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;基于所述预设处理策略对所述目标监测对象进行故障修复,这样,通过对目标监测对象执行监测任务,并对存在故障的目标监测对象按照预设处理策略进行修复,能够提高处理网关设备故障的智能化程度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种故障监测和修复的方法的流程图;
图2是本发明实施例提供的网关设备的结构示意图之一;
图3是本发明实施例提供的网关设备的结构示意图之二;
图4是本发明实施例提供的网关设备的结构示意图之三;
图5是本发明实施例提供的网关设备的结构示意图之四;
图6是本发明实施例提供的网关设备的结构示意图之五;
图7是本发明实施例提供的网关设备的结构示意图之六;
图8是本发明实施例提供的网关设备的结构示意图之七。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种故障监测和修复的方法的流程图,所述方法应用于网关设备,如图1所示,包括以下步骤:
步骤101、确定待监测的目标监测对象。
其中,所述目标监测对象可以是所述网关设备上的进程,例如,管理用户登录的进程;或者可以是所述网关设备上的芯片,例如,CPU(Central Processing Unit,处理器)及内存;或者可以是所述网关设备的接口,例如,发送接口。本发明实施例对所述目标监测对象不进行限定,可以影响网关设备的工作状态的对象均可以作为目标监测对象。
另外,可以从多个监测对象中确定目标监测对象,可以预配置至少一个监测对象;按照第一预设时长对每个监测对象周期性地监测,获取当前待监测的目标监测对象;或者,可以根据上一次对目标监测对象执行监测任务的任务数据,确定所述目标监测对象是否作为当前待监测的目标监测对象。
步骤102、对所述目标监测对象执行监测任务,得到任务数据。
其中,可以是通过向所述网关设备的进程发送消息得到任务数据;或者可以是调用所述网关设备的接口得到任务数据;或者可以是调用所述网关设备的调试命令得到任务数据;或者可以是调用所述网关设备的操作系统命令得到任务数据;或者可以是调用所述网关设备的操作系统接口得到任务数据;或者可以是读取文件系统信息得到任务数据,等等,本发明实施例对此不进行限定。可以通过上述多种方式获取目标监测对象的运行参数,并从目标监测对象的运行参数中提取到任务数据。
以调用所述网关设备的调试命令得到任务数据为例,可以通过调用所述网关设备的调试命令获取目标监测对象的运行参数,并从目标监测对象的运行参数中提取到任务数据。若所述目标监测对象为管理用户登录的进程,则可以调用网关设备的调试命令获取该进程的状态参数,所述任务数据可以为该进程的状态参数;若所述目标监测对象为CPU,则可以调用所述网关设备的调试命令获取CPU的使用率,所述任务数据可以为CPU的使用率;若所述目标监测对象为内存,则可以调用所述网关设备的调试命令获取内存使用率,所述任务数据可以为内存使用率。
步骤103、在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略。
其中,可以将所述任务数据与预设故障条件进行匹配,确定所述任务数据是否满足预设故障条件。可以将所述任务数据与第一预设范围进行匹配,确定所述任务数据是否在第一预设范围内。第一预设范围可以为预先配置的数值范围,还可以是预先配置的多个状态参数等等。预设故障条件可以与目标监测对象对应。所述预设处理策略可以是预先配置在网关设备上的处理策略,还可以是用户手动配置在网关设备上的处理策略。
以所述目标监测对象为CPU为例,所述预设故障条件可以为CPU的使用率超过第一预设值,例如第一预设值可以为80%,若CPU的使用率高于80%,则获取针对CPU的预设处理策略。所述针对CPU的预设处理策略可以是将对CPU的使用率超过第二预设值的进程停止、关闭或者重启,或者可以是将对CPU的使用率最大的进程停止、关闭或者重启。
以所述目标监测对象为内存为例,所述预设故障条件可以为内存的使用率在第三预设时长内持续增加,所述第三预设时长可以为1小时,或者可以为5小时,或者可以为1天,若内存的使用率在第三预设时长内持续增加,则获取针对内存的预设处理策略。内存的使用率在第三预设时长内持续增加可以表示存在内存泄露的情况。所述针对内存的预设处理策略可以是将网关设备重启;或者可以是将对内存的使用率持续增加的进程重启。
步骤104、基于所述预设处理策略对所述目标监测对象进行故障修复。
其中,对所述目标监测对象进行故障修复,以所述目标监测对象为CPU为例,可以是将对CPU的使用率超过第二预设值的进程停止、关闭或者重启,或者可以是将对CPU的使用率最大的进程停止、关闭或者重启;以所述目标监测对象为内存为例,可以是将网关设备重启;或者可以是将对内存的使用率持续增加的进程重启。
本发明实施例中,确定待监测的目标监测对象;对所述目标监测对象执行监测任务,得到任务数据;在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;基于所述预设处理策略对所述目标监测对象进行故障修复,这样,通过对目标监测对象执行监测任务,并对存在故障的目标监测对象按照预设处理策略进行修复,能够提高处理网关设备故障的智能化程度。
可选的,所述确定待监测的目标监测对象之前,所述方法还包括:
预配置至少一个监测对象;
所述确定待监测的目标监测对象,包括:
按照第一预设时长对每个监测对象周期性地监测,获取待监测的目标监测对象。
其中,可以启动定时器计时,按照第一预设时长对每个监测对象周期性地监测,获取当前待监测的目标监测对象。第一预设时长可以为1min,或者可以为5min,或者可以为10min等等,本发明实施例对此不进行限定。例如,可以预配置有10个监测对象,分别为第1监测对象至第10监测对象,按照5min为周期对每个监测对象进行监测,将第1监测对象至第10监测对象作为目标监测对象,5min后再将第1监测对象至第10监测对象作为目标监测对象。
该实施方式中,预配置至少一个监测对象;按照第一预设时长对每个监测对象周期性地监测,获取待监测的目标监测对象。这样,能够实现对监测对象的周期性监测,通过实时的监测进一步提高处理网关设备故障的智能化程度。
可选的,所述对所述目标监测对象执行监测任务,得到任务数据之后,所述方法还包括:
基于所述任务数据对所述目标监测对象的状态信息进行更新;
根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象;
在确定继续监测所述目标监测对象的情况下,在第二预设时长后对所述目标监测对象执行所述监测任务,其中,所述第二预设时长小于所述第一预设时长。
其中,所述目标监测对象的状态信息可以包括所述目标监测对象的使用参数。以所述目标监测对象为CPU为例,所述目标监测对象的状态信息可以包括CPU的使用率,对当前的CPU的使用率进行更新;以所述目标监测对象为内存为例,所述目标监测对象的状态信息可以包括内存的使用率,对当前的内存的使用率进行更新。根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象,可以是,若目标监测对象的状态信息满足预设状态条件,则确定继续监测所述目标监测对象。在目标监测对象的状态信息满足预设状态条件时,表示目标监测对象可能会出现故障。以所述目标监测对象为CPU为例,所述预设状态件可以是CPU的使用率达到第三预设值,所述第三预设值可以为70%,或者可以为80%,或者可以为85%等等。
进一步的,所述目标监测对象的状态信息还可以包括所述目标监测对象的历史使用参数,以所述目标监测对象为CPU为例,可以包括5次执行监测任务获取到的CPU的使用率,根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象,可以是,若目标监测对象的状态信息满足预设状态条件,则确定继续监测所述目标监测对象。在目标监测对象的状态信息满足预设状态条件时,表示目标监测对象可能会出现故障。以所述目标监测对象为CPU为例,所述预设状态条件可以是所述多次执行监测任务获取到的CPU的使用率的增长速率达到预设速率值。
该实施方式中,基于所述任务数据对所述目标监测对象的状态信息进行更新;根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象;在确定继续监测所述目标监测对象的情况下,在第二预设时长后对所述目标监测对象执行所述监测任务,其中,所述第二预设时长小于所述第一预设时长。这样,在目标监测对象的状态信息表示目标监测对象可能会出现故障的情况下,缩短目标监测对象的监测周期,加强对目标监测对象的监测,能够预测故障,进一步提高处理网关设备故障的智能化程度。
可选的,所述获取与所述目标监测对象对应的预设处理策略之前,所述方法还包括:
获取与所述目标监测对象关联的进程的运行数据;
基于所述运行数据获取目标进程;
所述基于所述预设处理策略对所述目标监测对象进行故障修复,包括:
基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作。
其中,可以通过向所述网关设备的进程发送消息、调用所述网关设备的接口、调用所述网关设备的调试命令、调用所述网关设备的操作系统命令、调用所述网关设备的操作系统接口或者读取文件系统信息来获取与所述目标监测对象关联的进程的运行数据。
另外,基于所述运行数据获取目标进程,可以是将所述运行数据中满足预设条件的运行数据对应的进程作为目标进程。以所述目标监测对象为CPU为例,可以是将对CPU的使用率超过第二预设值的进程作为目标进程,或者可以是将对CPU的使用率最大的进程作为目标进程。基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作,可以是将对CPU的使用率超过第二预设值的进程停止、关闭或者重启,或者可以是将对CPU的使用率最大的进程停止、关闭或者重启。
该实施方式中,获取与所述目标监测对象关联的进程的运行数据;基于所述运行数据获取目标进程;基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作。这样,通过对与所述目标监测对象关联的进程的自动诊断,并对出现问题的进程进行自动处理,进一步提高处理网关设备故障的智能化程度。
可选的,所述对所述目标监测对象执行监测任务,得到任务数据,包括:
对所述目标监测对象执行下述至少一项操作得到任务数据:
向所述网关设备的进程发送消息、调用所述网关设备的接口、调用所述网关设备的调试命令、调用所述网关设备的操作系统命令、调用所述网关设备的操作系统接口以及读取文件系统信息。
该实施方式中,通过上述多种方式得到任务数据,不需要人工参与,能够自动收集网关设备的信息,进一步提高处理网关设备故障的智能化程度。
作为一种具体的实施方式,所述故障监测和修复的方法应用于网关设备200,如图2及图3所示,所述网关设备200可以包括管理模块201及代理模块202,所述管理模块201可以包括第一监测单元2011、第一通信单元2012及第一策略单元2013,所述代理模块202可以包括第二监测单元2021、第二通信单元2022及第二策略单元2023,所述故障监测和修复的方法具体可以包括如下两个过程:
网关设备200的健康状态监测过程:
如图2所示,第一监测单元2011启动定时器,按照定时的时长周期性遍历所有监测对象,为每个监测对象发送监测请求至第二通信单元2022;
第二通信单元2022接收监测请求,并通过消息队列将监测请求发送至第二监测单元2021;
第二监测单元2021从消息队列中读取监测请求;
第二监测单元2021根据监测请求获取监测对象的状态,可以通过向所述网关设备200的进程发送消息、调用所述网关设备200的接口、调用所述网关设备200的调试命令、调用所述网关设备200的操作系统命令、调用所述网关设备200的操作系统接口或者读取文件系统信息来获取监测对象的状态;
第二监测单元2021将监测结果发送至第一通信单元2012,所述监测结果可以包括监测对象的状态;
第一通信单元2012接收监测结果,并将监测结果发送至第一策略单元2013。
网关设备200的故障处理策略执行过程:
如图3所示,第一策略单元2013从消息队列中读取监测结果;
第一策略单元2013根据监测结果更新监测对象的状态信息;
第一策略单元2013根据监测对象的状态信息确定监测对象是否异常,若确定监测对象异常,则根据配置的策略,将策略执行请求发送至第二通信单元2022,所述策略可以是在监测对象出现异常后,为修复故障而执行的一个或一组动作的集合;
第二通信单元2022接收所述策略执行请求,并通过消息队列将所述策略执行请求发送至第二策略单元2023;
第二策略单元2023接收所述策略执行请求;
第二策略单元2023执行所述策略执行请求对应的策略,其中,可以是通过向所述网关设备200的进程发送消息、调用所述网关设备200的接口、调用所述网关设备200的调试命令、调用所述网关设备200的操作系统命令、调用所述网关设备200的操作系统接口或者读取文件系统信息来执行对应的策略。所述策略可以包括对出现异常的进程进行停止、关闭或者重启的操作,或者还可以包括重启所述网关设备200。
其中,所述网关设备200可以为智能网关。
该实施方式中,可以实现自动对网关设备的状态信息的收集,并根据配置的策略对异常问题进行修复,不需要人工参与,智能化程度较高。
参见图4,本发明实施例提供了一种网关设备的结构示意图,如图4所示,所述网关设备300包括:
第一确定模块301,用于确定待监测的目标监测对象;
第一执行模块302,用于对所述目标监测对象执行监测任务,得到任务数据;
第一获取模块303,用于在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;
修复模块304,用于基于所述预设处理策略对所述目标监测对象进行故障修复。
可选的,如图5所示,所述网关设备300还包括:
配置模块305,用于预配置至少一个监测对象;
所述第一确定模块301具体用于:
按照第一预设时长对每个监测对象周期性地监测,获取待监测的目标监测对象。
可选的,如图6所示,所述网关设备300还包括:
更新模块306,用于基于所述任务数据对所述目标监测对象的状态信息进行更新;
第二确定模块307,用于根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象;
第二执行模块308,用于在确定继续监测所述目标监测对象的情况下,在第二预设时长后对所述目标监测对象执行所述监测任务,其中,所述第二预设时长小于所述第一预设时长。
可选的,如图7所示,所述网关设备300还包括:
第二获取模块309,用于获取与所述目标监测对象关联的进程的运行数据;
第三获取模块310,用于基于所述运行数据获取目标进程;
所述修复模块304具体用于:
基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作。
可选的,所述第一执行模块302具体用于:
对所述目标监测对象执行下述至少一项操作得到任务数据:
向所述网关设备的进程发送消息、调用所述网关设备的接口、调用所述网关设备的调试命令、调用所述网关设备的操作系统命令、调用所述网关设备的操作系统接口以及读取文件系统信息。
网关设备能够实现图1的方法实施例中的各个过程,为避免重复,这里不再赘述。
请参见图8,图8是本发明实施例提供的另一种网关设备的结构示意图,如图8所示,网关设备400包括:存储器402、处理器401及存储在所述存储器402上并可在所述处理器401上运行的程序,其中:
所述处理器401读取存储器402中的程序,用于执行:
确定待监测的目标监测对象;
对所述目标监测对象执行监测任务,得到任务数据;
在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;
基于所述预设处理策略对所述目标监测对象进行故障修复。
可选的,所述处理器401还用于执行:
预配置至少一个监测对象;
所述确定待监测的目标监测对象,包括:
按照第一预设时长对每个监测对象周期性地监测,获取待监测的目标监测对象。
可选的,所述处理器401还用于执行:
基于所述任务数据对所述目标监测对象的状态信息进行更新;
根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象;
在确定继续监测所述目标监测对象的情况下,在第二预设时长后对所述目标监测对象执行所述监测任务,其中,所述第二预设时长小于所述第一预设时长。
可选的,所述处理器401还用于执行:
获取与所述目标监测对象关联的进程的运行数据;
基于所述运行数据获取目标进程;
所述处理器401执行的所述基于所述预设处理策略对所述目标监测对象进行故障修复,包括:
基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作。
可选的,所述处理器401执行的所述对所述目标监测对象执行监测任务,得到任务数据,包括:
对所述目标监测对象执行下述至少一项操作得到任务数据:
向所述网关设备的进程发送消息、调用所述网关设备的接口、调用所述网关设备的调试命令、调用所述网关设备的操作系统命令、调用所述网关设备的操作系统接口以及读取文件系统信息。
在图8中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器401代表的一个或多个处理器和存储器402代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。
处理器401负责管理总线架构和通常的处理,存储器402可以存储处理器401在执行操作时所使用的数据。
需要说明的是,本发明实施例方法实施例中的任意实施方式都可以被本实施例中的上述网关设备所实现,以及达到相同的有益效果,此处不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述故障监测和修复的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (12)

1.一种故障监测和修复的方法,所述方法应用于网关设备,其特征在于,所述方法包括:
确定待监测的目标监测对象;
对所述目标监测对象执行监测任务,得到任务数据;
在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;
基于所述预设处理策略对所述目标监测对象进行故障修复。
2.根据权利要求1所述的方法,其特征在于,所述确定待监测的目标监测对象之前,所述方法还包括:
预配置至少一个监测对象;
所述确定待监测的目标监测对象,包括:
按照第一预设时长对每个监测对象周期性地监测,获取待监测的目标监测对象。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标监测对象执行监测任务,得到任务数据之后,所述方法还包括:
基于所述任务数据对所述目标监测对象的状态信息进行更新;
根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象;
在确定继续监测所述目标监测对象的情况下,在第二预设时长后对所述目标监测对象执行所述监测任务,其中,所述第二预设时长小于所述第一预设时长。
4.根据权利要求1所述的方法,其特征在于,所述获取与所述目标监测对象对应的预设处理策略之前,所述方法还包括:
获取与所述目标监测对象关联的进程的运行数据;
基于所述运行数据获取目标进程;
所述基于所述预设处理策略对所述目标监测对象进行故障修复,包括:
基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作。
5.根据权利要求1所述的方法,其特征在于,所述对所述目标监测对象执行监测任务,得到任务数据,包括:
对所述目标监测对象执行下述至少一项操作得到任务数据:
向所述网关设备的进程发送消息、调用所述网关设备的接口、调用所述网关设备的调试命令、调用所述网关设备的操作系统命令、调用所述网关设备的操作系统接口以及读取文件系统信息。
6.一种网关设备,其特征在于,包括:
第一确定模块,用于确定待监测的目标监测对象;
第一执行模块,用于对所述目标监测对象执行监测任务,得到任务数据;
第一获取模块,用于在所述任务数据满足预设故障条件的情况下,获取与所述目标监测对象对应的预设处理策略;
修复模块,用于基于所述预设处理策略对所述目标监测对象进行故障修复。
7.根据权利要求6所述的网关设备,其特征在于,所述网关设备还包括:
配置模块,用于预配置至少一个监测对象;
所述第一确定模块具体用于:
按照第一预设时长对每个监测对象周期性地监测,获取待监测的目标监测对象。
8.根据权利要求7所述的网关设备,其特征在于,所述网关设备还包括:
更新模块,用于基于所述任务数据对所述目标监测对象的状态信息进行更新;
第二确定模块,用于根据所述目标监测对象的状态信息确定是否继续监测所述目标监测对象;
第二执行模块,用于在确定继续监测所述目标监测对象的情况下,在第二预设时长后对所述目标监测对象执行所述监测任务,其中,所述第二预设时长小于所述第一预设时长。
9.根据权利要求6所述的网关设备,其特征在于,所述网关设备还包括:
第二获取模块,用于获取与所述目标监测对象关联的进程的运行数据;
第三获取模块,用于基于所述运行数据获取目标进程;
所述修复模块具体用于:
基于所述预设处理策略对所述目标进程进行停止、关闭或者重启的操作。
10.根据权利要求6所述的网关设备,其特征在于,所述第一执行模块具体用于:
对所述目标监测对象执行下述至少一项操作得到任务数据:
向所述网关设备的进程发送消息、调用所述网关设备的接口、调用所述网关设备的调试命令、调用所述网关设备的操作系统命令、调用所述网关设备的操作系统接口以及读取文件系统信息。
11.一种网关设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至5中任一项所述的故障监测和修复的方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的故障监测和修复的方法的步骤。
CN201910729057.8A 2019-08-08 2019-08-08 一种故障监测和修复的方法及相关设备 Pending CN112350840A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910729057.8A CN112350840A (zh) 2019-08-08 2019-08-08 一种故障监测和修复的方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910729057.8A CN112350840A (zh) 2019-08-08 2019-08-08 一种故障监测和修复的方法及相关设备

Publications (1)

Publication Number Publication Date
CN112350840A true CN112350840A (zh) 2021-02-09

Family

ID=74367543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910729057.8A Pending CN112350840A (zh) 2019-08-08 2019-08-08 一种故障监测和修复的方法及相关设备

Country Status (1)

Country Link
CN (1) CN112350840A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861366A (zh) * 2021-02-23 2021-05-28 中国电子科技集团公司第五十四研究所 一种用于低轨卫星监测的调度系统及调度方法
CN114490765A (zh) * 2022-01-25 2022-05-13 中国人民解放军32039部队 故障监测方法、装置和电子设备
CN117835099A (zh) * 2024-03-05 2024-04-05 四川天邑康和通信股份有限公司 基于fttr的故障自诊断与自修复方法、装置、设备及介质
CN117835099B (zh) * 2024-03-05 2024-05-24 四川天邑康和通信股份有限公司 基于fttr的故障自诊断与自修复方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101639908A (zh) * 2009-06-09 2010-02-03 北京千禧维讯科技有限公司 用于通讯网络维护的测试和预警的电子系统
CN101739327A (zh) * 2008-11-07 2010-06-16 北大方正集团有限公司 一种对服务进程进行监控修复的方法和系统
US20160085772A1 (en) * 2014-09-19 2016-03-24 Amazon Technologies, Inc. Automated configuration of log-coordinated storage groups
CN106708016A (zh) * 2016-12-22 2017-05-24 中国石油天然气股份有限公司 故障监控方法和装置
CN107515796A (zh) * 2017-07-31 2017-12-26 北京奇安信科技有限公司 一种设备异常监控处理方法及装置
CN107707431A (zh) * 2017-10-31 2018-02-16 河南科技大学 一种面向云平台的数据安全监测方法及系统
CN109039729A (zh) * 2018-07-25 2018-12-18 浪潮电子信息产业股份有限公司 一种云平台的故障检测方法及装置
CN109101375A (zh) * 2018-07-04 2018-12-28 维沃移动通信有限公司 一种修复故障的方法、服务器和测试装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739327A (zh) * 2008-11-07 2010-06-16 北大方正集团有限公司 一种对服务进程进行监控修复的方法和系统
CN101639908A (zh) * 2009-06-09 2010-02-03 北京千禧维讯科技有限公司 用于通讯网络维护的测试和预警的电子系统
US20160085772A1 (en) * 2014-09-19 2016-03-24 Amazon Technologies, Inc. Automated configuration of log-coordinated storage groups
CN106708016A (zh) * 2016-12-22 2017-05-24 中国石油天然气股份有限公司 故障监控方法和装置
CN107515796A (zh) * 2017-07-31 2017-12-26 北京奇安信科技有限公司 一种设备异常监控处理方法及装置
CN107707431A (zh) * 2017-10-31 2018-02-16 河南科技大学 一种面向云平台的数据安全监测方法及系统
CN109101375A (zh) * 2018-07-04 2018-12-28 维沃移动通信有限公司 一种修复故障的方法、服务器和测试装置
CN109039729A (zh) * 2018-07-25 2018-12-18 浪潮电子信息产业股份有限公司 一种云平台的故障检测方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861366A (zh) * 2021-02-23 2021-05-28 中国电子科技集团公司第五十四研究所 一种用于低轨卫星监测的调度系统及调度方法
CN114490765A (zh) * 2022-01-25 2022-05-13 中国人民解放军32039部队 故障监测方法、装置和电子设备
CN114490765B (zh) * 2022-01-25 2022-11-29 中国人民解放军32039部队 故障监测方法、装置和电子设备
CN117835099A (zh) * 2024-03-05 2024-04-05 四川天邑康和通信股份有限公司 基于fttr的故障自诊断与自修复方法、装置、设备及介质
CN117835099B (zh) * 2024-03-05 2024-05-24 四川天邑康和通信股份有限公司 基于fttr的故障自诊断与自修复方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN107451040B (zh) 故障原因的定位方法、装置及计算机可读存储介质
CA2883358C (en) Automated demand response gateway
CN103281373A (zh) 家庭网关智能升级装置及升级方法
CN112350840A (zh) 一种故障监测和修复的方法及相关设备
CN110750343B (zh) 集群系统定时任务调度控制方法及集群系统
CN111277458A (zh) 网络设备的故障监测方法、装置、计算机设备和存储介质
CN109218407A (zh) 基于日志监控技术的代码管控方法及终端设备
CN111626498B (zh) 设备运行状态预测方法、装置、设备及存储介质
CN109358873A (zh) 一种应用程序更新方法、存储介质和终端设备
CN111104237A (zh) 可配置的故障自动化处理方法和系统及计算机存储介质
CN113765743A (zh) 智能网关工作状态监控方法
CN115296979B (zh) 一种故障处理方法、装置、设备及存储介质
CN114600089A (zh) 确定采集频率的方法、装置、计算设备和存储介质
CN115314358B (zh) 一种家宽网络的哑网元故障监控方法和装置
CN112423032B (zh) 基于智能电视的数据监控方法、装置、电子设备及介质
CN111381932B (zh) 触发应用程序更改的方法、装置、电子设备及存储介质
CN111176959B (zh) 跨域的应用服务器的预警方法、系统及存储介质
RU2520942C2 (ru) Способ функционирования энергетической автоматизированной системы и энергетическая автоматизированная система
CN106294059A (zh) 网管系统中进程的恢复方法及装置
CN112433740B (zh) 一种集群离线升级的方法、系统、设备及介质
CN111711537B (zh) 备用主节点列表更新方法、装置及设备
US9535414B2 (en) System and method for distributing and exchanging elements for planning and/or for operating automation operating equipment
CN112182363B (zh) 基于微服务框架的智能稽查方法、装置、设备及存储介质
CN114422332B (zh) 网络切片控制方法、装置、处理设备及存储介质
JP2016012186A (ja) プログラム管理端末装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210209