CN109388544B - 一种故障监测方法、装置及电子设备 - Google Patents

一种故障监测方法、装置及电子设备 Download PDF

Info

Publication number
CN109388544B
CN109388544B CN201811272066.0A CN201811272066A CN109388544B CN 109388544 B CN109388544 B CN 109388544B CN 201811272066 A CN201811272066 A CN 201811272066A CN 109388544 B CN109388544 B CN 109388544B
Authority
CN
China
Prior art keywords
network
service module
node service
module
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811272066.0A
Other languages
English (en)
Other versions
CN109388544A (zh
Inventor
尚付飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811272066.0A priority Critical patent/CN109388544B/zh
Publication of CN109388544A publication Critical patent/CN109388544A/zh
Application granted granted Critical
Publication of CN109388544B publication Critical patent/CN109388544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems

Abstract

本发明实施例提供一种故障监测方法、装置及电子设备,第一节点业务模块获取网络异常信息,所述网络异常信息用于描述网络异常信息;根据所述网络异常信息,确定通讯规则;依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障。发生故障的节点业务模块能够通过对网络异常信息的解析,选择最优的通讯路径将故障信息上报,实现了自发按需上报,无需对各个节点不停监控,节省了系统资源。

Description

一种故障监测方法、装置及电子设备
技术领域
本发明涉及计算机技术领域,特别是涉及一种故障监测方法、装置及电子设备。
背景技术
在一个存储集群中,通常包括多个节点业务模块、集群监控模块。其中,每个节点业务模块上配置有网卡等网络设备,通过该网络设备,各个节点业务模块之间能够进行数据复制、动态重分布数据等通讯操作;集群监控模块用于对各个业务模块进行监控,当任意一个节点业务模块发生网络故障时,做到将相应节点业务模块的网络故障信息发送给上层管理模块,控制节点业务模块的工作。目前,为了检测节点业务模块是否发生网络故障,通常使用的方法是各个节点业务模块之间进行相互监听,当某个节点业务模块发生网络故障时,再通过选举处理机制,由其他正常工作的节点业务模块将该某个节点业务模块的故障信息上报给集群监控模块。
然而,发明人通过研究发现,由于存储集群中存在大量的节点业务模块,各个节点业务模块之间的监听会占用大量系统资源,而且,即使在检测到网络故障后,还需要经过选举处理机制才能完成上报,需要进行较为复杂的计算,进一步耗费计算资源。
因此,如何能够节省系统资源,更有效地实现故障上报是本领域技术人员亟需解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种故障监测方法、装置及电子设备,用于解决现有技术中故障上报浪费系统资源的问题。
为实现上述目的及其他相关目的,根据本发明的第一方面,本发明实施例提供一种故障监测方法,该方法包括以下步骤:
第一节点业务模块获取网络异常信息,所述网络异常信息用于描述网络异常信息;
根据所述网络异常信息,确定通讯规则;
依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障。
可选地,当所述网络异常信息包括网络延迟时,所述根据所述网络异常信息,确定通讯规则,包括:
第一节点业务模块计算参考网段的网络速度;
当所述网络速度高于网速阈值时,确定通讯规则为使用参考网段作为通讯路径;
所述依据所述通讯规则,向集群监控模块发送故障消息,包括:
第一节点业务模块使用所述参考网段向集群监控模块发送故障消息。
可选地,当所述网络异常信息包括网络延迟时,所述根据所述网络异常信息,确定通讯规则,包括:
第一节点业务模块计算第一节点业务模块与第二节点业务模块的网络响应,其中,所述第二节点业务模块为与第一节点单业务模块同网段的节点业务模块;
当所述网络响应低于阈值时,确定通讯规则为选择第二节点业务模块作为通讯路径;
所述依据所述通讯规则,向集群监控模块发送故障消息,包括:
第一节点业务模块将故障消息向第二节点业务模块发送,以使第二节点业务模块将所述故障消息向集群监控模块发送。
可选地,当所述网络异常信息包括网线拔出和/或网络设备损坏时,所述根据所述网络异常信息,确定通讯规则,包括:
确定所述通讯规则为选择热备网络设备作为通讯路径;
所述依据所述通讯规则,向集群监控模块发送故障消息,包括:
第一节点模块使用所述热备网络设备向集群监控模块发送故障消息;
其中,所述热备网络设备包括无线通讯设备。
根据本发明的第二方面,本发明实施例还提供一种故障监测装置,包括:
异常获取模块,用于获取网络异常信息,所述网络异常信息用于描述网络异常信息;
确定模块,用于根据所述网络异常信息,确定通讯规则;
发送模块,用于依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障。
可选地,所述确定模块还用于,
当所述网络异常信息包括网络延迟时,计算参考网段的网络速度;
当所述网络速度高于网速阈值时,确定通讯规则为使用参考网段作为通讯路径。
所述发送模块还用于,
使用所述参考网段向集群监控模块发送故障消息。
可选地,所述确定模块还用于,
当所述网络异常信息包括网络延迟时,计算第一节点业务模块与第二节点业务模块的网络响应,其中,所述第二节点业务模块为与第一节点单业务模块同网段的节点业务模块;
当所述网络响应低于阈值时,确定通讯规则为选择第二节点业务模块作为通讯路径;
所述发送模块还用于,
将故障消息向第二节点业务模块发送,以使第二节点业务模块将所述故障消息向集群监控模块发送。
可选地,所述确定模块还用于,当所述网络异常信息包括网线拔出和/或网络设备损坏时,确定所述通讯规则为选择热备网络设备作为通讯路径;
所述发送模块还用于,使用所述热备网络设备向集群监控模块发送故障消息;其中,所述热备网络设备包括无线通讯设备。
根据本发明的第三方面,本发明实施例还提供一种电子设备,所述电子设备包括处理器;以及,
与所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令被所述处理器执行,以使所述处理器能够:
获取网络异常信息,所述网络异常信息携带有网络异常信息;
根据所述网络异常信息,确定通讯规则;
依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障。
根据本发明的第四方面,本发明实施例还提供一种电子设备,所述电子设备包括上述实施例所述的故障监测装置。
如上所述,本发明实施例提供的一种故障监测方法、装置及电子设备,具有以下有益效果:第一节点业务模块获取网络异常信息,所述网络异常信息用于描述网络异常信息;根据所述网络异常信息,确定通讯规则;依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障。发生故障的节点业务模块能够通过对网络异常信息的解析,选择最优的通讯路径将故障信息上报,实现了自发按需上报,无需对各个节点不停监控,节省了系统资源。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种存储集群的结构示意图;
图2是本发明实施例提供的一种故障监测方法的流程示意图;
图3是本发明实施例提供的一种通讯规则的确定方法的流程示意图;
图4是本发明实施例提供的另一种通讯规则的确定方法的流程示意图;
图5是本发明实施例提供的再一种通讯规则确定方法的流程示意图;
图6是本发明实施例提供的一种故障监测装置的结构示意图;
图7是本发明实施例提供的执行故障监测方法的电子设备的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
请参阅图1至图7。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
参见图1是本发明实施例提供的一种存储集群的结构示意图,如图1所示,该存储集群可以包括第一节点业务模块11、第二节点业务模块12、集群监控模块2和上层管理模块3。第一节点业务模11和第二节点业务模块12之间可以相互通信;同时,第一节点业务模块11和第二节点业务模块12均能够与集群监控模块2通信,这样,集群监控模块2能够对第一节点业务模块11和第二节点业务模块12进行监控,当集群监控模块2监测到第一节点业务模块11和/或第二节点业务模块12发生故障时,集群监控模块2能够将故障信息上报到上层管理模块3进行后续的处理。
当然需要说明的是,上述存储集群仅是一示例性实施例,本发明实施例的故障监测方法能够应用于包括任意多个节点业务模块的存储集群中,在发明实施例中不再赘述。
参见图2,是本发明实施例提供的一种故障监测方法的流程示意图,如图2所示,本发明实施例示出了第一节点业务模块执行故障监测的过程,当然需要说明的是,执行本发明的故障监测方法的执行主体可以是存储集群中的任意一个节点业务模块,本发明实施例以第一节点业务模块为例对该故障监测方法进行描述:
步骤S101:第一节点业务模块获取网络异常信息,所述网络异常信息用于描述网络异常原因。
第一节点业务模块11能够对自身的网络状态进行检测,在第一节点业务模块自身中的网络功能出现异常时,获取网络异常信息,该网络异常信息可以包括网络延迟、网络拔出和网络设备损坏等,用于描述网络异常的原因。
步骤S102:根据所述网络异常信息,确定通讯规则。
第一节点业务模块11能够对网络异常信息进行读取或解析,进行确定通讯规则,保证故障信息及时上报。
在第一种实施情况下,参见图3,是本发明实施例提供的一种通讯规则的确定方法的流程示意图,根据步骤S101获取的网络异常信息,当所述网络异常信息包括网络延迟时,本发明实施例示出了第一节点业务模块确定通讯规则的过程:
步骤S1021:第一节点业务模块计算参考网段的网络速度。
当发生网络延迟时,可能对应的原因是DHCP服务发生故障或者存在网络拥堵。在一示例性实施例中,第一节点业务模块可以通过常用的ping或者其他工具,对一个或多个参考网段的网络速度进行检测,例如可以ping“192.168.1.0”对应的第一参考网段,也可以ping“192.168.2.0”对应的第二参考网段,进而获取第一参考网段和第二参考网段的网络速度。
步骤S1022:当所述网络速度高于网速阈值时,确定通讯规则为使用参考网段作为通讯路径。
当第一参考网段的网络速度高于网速阈值时,可以确定使用第一参考网段作为通讯路径。
在第二种实施情况下,参见图4,是本发明实施例提供的另一种通讯规则的确定方法的流程示意图,在网络异常信息包括网络延时时,本发明实施例示出了另一种第一节点业务模块确定通讯规则的过程:
步骤S1023:计算多个参考网段的网络速度。
在本发明实施例中,第一节点业务模块11可以同时测试多个参考网段的网络速度,例如同时测试第一参考网段和第二参考网段的网络速度。
步骤S1024:选择网络速度最高的参考网段作为通讯路径。
从第一参考网段和第二参考网段中选择网络速度最高的参考网段作为通讯路径。
本发明实施例与上述实施例相同之处,可参见上述实施例的描述在此不再赘述。
在第三种实施情况下,参见图5,是本发明实施例提供的再一种通讯规则确定方法的流程示意图,如图5所示,本发明实施例示出了第一节点业务模块在网络异常信息包括网络延迟时,选择其他节点业务模块的过程:
步骤S1025:第一节点业务模块计算第一节点业务模块与第二节点业务模块的网络响应,其中,所述第二节点业务模块为与第一节点单业务模块同网段的节点业务模块。
第一节点业务模块11可以向处于同网段的其他节点业务模块发送检测消息,例如ping的方式,检测与第二节点业务模块12的网络通信情况,获得相应的网络响应。
步骤S1026:当所述网络响应低于阈值时,确定通讯规则为选择第二节点业务模块作为通讯路径。
当第一节点业务模块11与第二节点业务模块12之间的网络响应低于阈值时,表示第一节点业务模块11与第二节点业务模块12之间的网络通信状况较好,则确定选择第二节点业务模块12作为通讯路径。
在第四种实施情况下,第一节点业务模块在网络异常信息包括网线拔出和/或网络设备损坏时,确定所述通讯规则为选择热备网络设备作为通讯路径。其中,所述热备网络设备可以包括蓝牙、WIFI等无线通讯设备。
步骤S103:依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块网络故障。
根据步骤S102确定的通讯规则,第一节点业务模块11依据确定的通讯规则,向集群监控模块2发送故障消息。
相应地,在第一种实施情况下,第一节点业务模块11可以通过配置网络速度高的参考网段,将第一节点业务模块11的故障消息发送到集群监控模块2。在第二种实施情况下,第一节点业务模块11可以将故障消息发送到同网段的、网络响应速度低于阈值的第二节点业务模块12,进一步第二节点业务模块将该故障信息转发到集群监控模块2。在第三种实施情况下,第一节点业务模块11可以通过热备网络设备将故障信息发送到集群监控模块2。
由上述实施例的描述可见,本发明实施例提供的一种故障监测方法,第一节点业务模块获取网络异常信息,所述网络异常信息用于描述网络异常信息;根据所述网络异常信息,确定通讯规则;依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障。发生故障的节点业务模块能够通过对网络异常信息的解析,选择最优的通讯路径将故障信息上报,实现了自发按需上报,无需对各个节点不停监控,节省了系统资源。
通过以上的方法实施例的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
与本发明提供的故障监测方法实施例相对应,本发明还提供了一种故障监测装置。
参见图6,是本发明实施例提供的一种故障监测装置的结构示意图,如图6所示,该装置包括:
异常获取模块11,用于获取网络异常信息,所述网络异常信息用于描述网络异常信息;
确定模块12,用于根据所述网络异常信息,确定通讯规则;
发送模块13,用于依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障。
在第一种实施情况下,确定模块12还用于,当所述网络异常信息包括网络延迟时,计算参考网段的网络速度;当所述网络速度高于网速阈值时,确定通讯规则为使用参考网段作为通讯路径;发送模块13还用于使用所述参考网段向集群监控模块发送故障消息。
在第二种实施情况下,确定模块12还用于,计算多个参考网段的网络速度;选择网络速度最高的参考网段作为通讯路径;发送模块13还用于使用网络速度最高的参考网段向集群监控模块发送故障消息。
在第三种实施情况下,确定模块12还用于,当所述网络异常信息包括网络延迟时,计算第一节点业务模块与第二节点业务模块的网络响应,其中,所述第二节点业务模块为与第一节点单业务模块同网段的节点业务模块;当所述网络响应低于阈值时,确定通讯规则为选择第二节点业务模块作为通讯路径;发送模块13还用于将故障消息向第二节点业务模块发送,以使第二节点业务模块将所述故障消息向集群监控模块发送。
在第四种实施情况下,确定模块12还用于,当所述网络异常信息包括网线拔出和/或网络设备损坏时,确定所述通讯规则为选择热备网络设备作为通讯路径;实施发送模块13还用于,使用所述热备网络设备向集群监控模块发送故障消息;其中,所述热备网络设备包括无线通讯设备。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的故障监测方法。
图7是本发明实施例提供的执行故障监测方法的电子设备的硬件结构示意图,如图7所示,该设备包括:
一个或多个处理器610以及存储器620,图6中以一个处理器610为例。
执行故障监测方法的设备还可以包括:输入装置630和输出装置640。
处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。
存储器620作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的故障监测方法对应的程序指令/模块(例如,附图6所示的异常获取模块11、确定模块12和发送模块13)。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例故障监测方法。
存储器620可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据故障监测装置的使用所创建的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器620可选包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至故障监测装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置630可接收输入的数字或字符信息,以及产生与故障监测装置的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器620中,当被所述一个或者多个处理器610执行时,执行上述任意方法实施例中的故障监测方法。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
本发明实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种故障监测方法,其特征在于,包括以下步骤:
第一节点业务模块获取网络异常信息,所述网络异常信息用于描述网络异常原因;
根据所述网络异常信息,确定通讯规则,依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障;
当所述网络异常信息包括网络延迟时,所述根据所述网络异常信息,确定通讯规则,包括:第一节点业务模块计算参考网段的网络速度;
当所述网络速度高于网速阈值时,确定通讯规则为使用参考网段作为通讯路径;
所述依据所述通讯规则,向集群监控模块发送故障消息,包括:
第一节点业务模块使用所述参考网段向集群监控模块发送故障消息;或者
当所述网络异常信息包括网络延迟时,所述根据所述网络异常信息,确定通讯规则,包括:第一节点业务模块计算第一节点业务模块与第二节点业务模块的网络响应,其中,所述第二节点业务模块为与第一节点单业务模块同网段的节点业务模块;
当所述网络响应低于阈值时,确定通讯规则为选择第二节点业务模块作为通讯路径;
第一节点业务模块将故障消息向第二节点业务模块发送,以使第二节点业务模块将所述故障消息向集群监控模块发送。
2.根据权利要求1所述的故障监测方法,其特征在于,当所述网络异常信息包括网线拔出和/或网络设备损坏时,所述根据所述网络异常信息,确定通讯规则,包括:
确定所述通讯规则为选择热备网络设备作为通讯路径;
第一节点模块使用所述热备网络设备向集群监控模块发送故障消息;
其中,所述热备网络设备包括无线通讯设备。
3.一种故障监测装置,其特征在于,包括:
异常获取模块,用于获取网络异常信息,所述网络异常信息用于描述网络异常原因;
确定模块,用于根据所述网络异常信息,确定通讯规则;
发送模块,用于依据所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障;
所述确定模块还用于,当所述网络异常信息包括网络延迟时,计算参考网段的网络速度,当所述网络速度高于网速阈值时,确定通讯规则为使用参考网段作为通讯路径;所述发送模块还用于,使用所述参考网段向集群监控模块发送故障消息;或者
所述确定模块还用于,当所述网络异常信息包括网络延迟时,计算第一节点业务模块与第二节点业务模块的网络响应,其中,所述第二节点业务模块为与第一节点单业务模块同网段的节点业务模块;将故障消息向第二节点业务模块发送,以使第二节点业务模块将所述故障消息向集群监控模块发送。
4.根据权利要求3所述的故障监测装置,其特征在于,
所述确定模块还用于,当所述网络异常信息包括网线拔出和/或网络设备损坏时,确定所述通讯规则为选择热备网络设备作为通讯路径;
所述发送模块还用于,使用所述热备网络设备向集群监控模块发送故障消息;其中,所述热备网络设备包括无线通讯设备。
5.一种电子设备,其特征在于,所述电子设备包括处理器;以及,
与所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令被所述处理器执行,以使所述处理器能够:
获取网络异常信息,所述网络异常信息用于描述网络异常原因;
根据所述网络异常信息,确定通讯规则依据,所述通讯规则,向集群监控模块发送故障消息,以指示第一节点业务模块发生网络故障;
当所述网络异常信息包括网络延迟时,所述根据所述网络异常信息,确定通讯规则,包括:第一节点业务模块计算参考网段的网络速度;
当所述网络速度高于网速阈值时,确定通讯规则为使用参考网段作为通讯路径;
所述依据所述通讯规则,向集群监控模块发送故障消息,包括:
第一节点业务模块使用所述参考网段向集群监控模块发送故障消息;或者
当所述网络异常信息包括网络延迟时,所述根据所述网络异常信息,确定通讯规则,包括:第一节点业务模块计算第一节点业务模块与第二节点业务模块的网络响应,其中,所述第二节点业务模块为与第一节点单业务模块同网段的节点业务模块;
当所述网络响应低于阈值时,确定通讯规则为选择第二节点业务模块作为通讯路径;
第一节点业务模块将故障消息向第二节点业务模块发送,以使第二节点业务模块将所述故障消息向集群监控模块发送。
6.一种电子设备,其特征在于,所述电子设备包括如权利要求3或4所述的故障监测装置。
CN201811272066.0A 2018-10-30 2018-10-30 一种故障监测方法、装置及电子设备 Active CN109388544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811272066.0A CN109388544B (zh) 2018-10-30 2018-10-30 一种故障监测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811272066.0A CN109388544B (zh) 2018-10-30 2018-10-30 一种故障监测方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN109388544A CN109388544A (zh) 2019-02-26
CN109388544B true CN109388544B (zh) 2022-03-04

Family

ID=65428297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811272066.0A Active CN109388544B (zh) 2018-10-30 2018-10-30 一种故障监测方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN109388544B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114157585A (zh) * 2021-12-09 2022-03-08 京东科技信息技术有限公司 一种业务资源监测的方法和装置
CN117424664A (zh) * 2023-12-19 2024-01-19 南京华鹄科技发展有限公司 一种基于复合通信网络的应急广播系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1089182A2 (en) * 1999-10-01 2001-04-04 STMicroelectronics, Inc. System and method for communicating with an integrated circuit
CN106776183A (zh) * 2016-12-22 2017-05-31 歌尔科技有限公司 一种调试电路、调试装置、调制系统和一种电子设备
CN108495348A (zh) * 2018-01-31 2018-09-04 上海连尚网络科技有限公司 一种用于用户设备的网络切换方法、设备以及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6791352B2 (en) * 2002-02-08 2004-09-14 International Business Machines Corporation Method and apparatus for debugging a chip

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1089182A2 (en) * 1999-10-01 2001-04-04 STMicroelectronics, Inc. System and method for communicating with an integrated circuit
CN106776183A (zh) * 2016-12-22 2017-05-31 歌尔科技有限公司 一种调试电路、调试装置、调制系统和一种电子设备
CN108495348A (zh) * 2018-01-31 2018-09-04 上海连尚网络科技有限公司 一种用于用户设备的网络切换方法、设备以及介质

Also Published As

Publication number Publication date
CN109388544A (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
CN111181801B (zh) 节点集群测试方法、装置、电子设备及存储介质
CN109495306B (zh) 一种业务网络的扩容方法及设备
CN104426885A (zh) 异常账号提供方法及装置
CN103838648A (zh) 一种终端及数据备份方法
CN109388544B (zh) 一种故障监测方法、装置及电子设备
CN109218141A (zh) 一种故障节点检测方法及相关装置
CN104243590A (zh) 资源对象推荐方法和装置
US20170185454A1 (en) Method and Electronic Device for Determining Resource Consumption of Task
CN108683528B (zh) 一种数据传输方法、中心服务器、服务器及数据传输系统
JP2022033685A (ja) 堅牢性を確定するための方法、装置、電子機器、コンピュータ可読記憶媒体、及びコンピュータプログラム
CN107423176B (zh) 一种内存的测试方法、控制终端、服务器及系统
US9641595B2 (en) System management apparatus, system management method, and storage medium
US20220337809A1 (en) Video playing
CN110708369B (zh) 设备节点的文件部署方法、装置、调度服务器及存储介质
CN111130828B (zh) 一种智能配网方法、装置及终端设备
US20170141949A1 (en) Method and apparatus for processing alarm information in cloud computing
US10210127B2 (en) Storage system cabling analysis
CN110995856B (zh) 一种服务器扩展的方法、装置、设备及存储介质
JP7354127B2 (ja) デジタルコンテンツに関する活動通知の提供
CN111147600B (zh) 集群环境下的服务执行方法及终端
CN105392083B (zh) 一种mpp音箱切换方法及接入控制器
CN108512698B (zh) 一种网络容灾方法、装置及电子设备
CN107977418A (zh) 一种截屏图片管理方法、截屏图片管理装置及移动终端
CN107797764B (zh) 确定路径的方法及其装置
CN112260857A (zh) 一种交换机光模块初始化的方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant