CN109218141A - 一种故障节点检测方法及相关装置 - Google Patents

一种故障节点检测方法及相关装置 Download PDF

Info

Publication number
CN109218141A
CN109218141A CN201811383301.1A CN201811383301A CN109218141A CN 109218141 A CN109218141 A CN 109218141A CN 201811383301 A CN201811383301 A CN 201811383301A CN 109218141 A CN109218141 A CN 109218141A
Authority
CN
China
Prior art keywords
network interface
interface card
node
data packet
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811383301.1A
Other languages
English (en)
Inventor
吴昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811383301.1A priority Critical patent/CN109218141A/zh
Publication of CN109218141A publication Critical patent/CN109218141A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种故障节点检测方法,每个节点均设置有至少两个用于心跳检测网卡,当第一节点利用自己的每个第一网卡向第二节点中对应的每个第二网卡发送心跳检测数据包后,只有第二节点的所有第二网卡均为返回第一响应数据包时,才确定第二节点为故障节点,因此,可以有效避免网卡故障导致检测结果误判为节点故障,从而可以有效提高故障节点检测的准确率。本发明还提供了一种故障节点检测系统、装置及计算机可读存储介质,同样可以实现上述技术效果。

Description

一种故障节点检测方法及相关装置
技术领域
本发明涉及计算机技术,更具体地说,涉及一种故障节点检测方法、系统、装置及计算机可读存储介质。
背景技术
在高可用集群系统中,有多个节点同时对外提供服务,当某一节点发生故障时,其他节点就可以接管该故障节点的服务,从而从集群的角度来说,用户还能够正常访问集群。
为了实现上述功能,在集群中所有节点通过心跳网络连接在一起,每个节点会通过网络来检查其他节点的状态,进而判断节点是否在集群中是否为故障节点。
但是目前确定故障节点的方法通常不够准确,将非故障节点也确定为故障节点,从而浪费了集群的资源。
因此,如何提高故障节点检测的准确率,是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种故障节点检测方法、系统、装置及计算机可读存储介质,以解决如何提高故障节点检测的准确率的问题。
为实现上述目的,本发明实施例提供了如下技术方案:
一种故障节点检测方法,包括:
利用第一节点的每个第一网卡向第二节点中对应每个第一网卡的每个第二网卡发送心跳检测数据包;其中,所述第一网卡与所述第二网卡一一对应,且个数至少为2个;
判断所述第二节点的每个第二网卡是否均未返回第一响应数据包;
若是,则确定所述第二节点为故障节点。
其中,所述方法还包括:
接收所述第二节点发送的心跳检测数据包;
确定每个心跳检测数据包对应的目标第二网卡;
确定与所述目标第二网卡对应的目标第一网卡;
利用所述目标第一网卡向对应的目标第二网卡返回第二响应数据包;
确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障。
其中,所述确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障之后,还包括:
重新建立所述非目标第一网卡与所述第二节点中对应的第二网卡的连接关系。
其中,所述第二响应数据包为与每个所述第一网卡对应的接收队列中的第二相应数据包;其中所述接收队列与所述第一网卡一一对应。
其中,所述确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障之后,还包括:
将所述非目标第一网卡的接收队列转移至目标第一网卡。
本申请还提供了一种故障节点检测系统,包括:
发送模块,用于利用第一节点的每个第一网卡向第二节点中对应每个第一网卡的每个第二网卡发送心跳检测数据包;其中,所述第一网卡与所述第二网卡一一对应,且个数至少为2个;
判断模块,用于判断所述第二节点的每个第二网卡是否均未返回第一响应数据包;
第一确定模块,用于当所述第二节点的每个第二网卡均未发送所述第一响应数据包时确定所述第二节点为故障节点。
其中,还包括:
接收模块,用于接收所述第二节点发送的心跳检测数据包;
第二确定模块,用于确定每个心跳检测数据包对应的目标第二网卡;
第三确定模块,用于确定与所述目标第二网卡对应的目标第一网卡;
返回模块,用于利用所述目标第一网卡向对应的目标第二网卡返回第二响应数据包;
第四确定模块,用于确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障。
其中,还包括:
重连模块,用于重新建立所述非目标第一网卡与所述第二节点中对应的第二网卡的连接关系。
本申请还提供了一种故障节点检测装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如所述故障节点检测方法的步骤。
本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如所述故障节点检测方法的步骤。
通过以上方案可知,本发明提供的一种故障节点检测方法,每个节点均设置有至少两个用于心跳检测网卡,当第一节点利用自己的每个第一网卡向第二节点中对应的每个第二网卡发送心跳检测数据包后,只有第二节点的所有第二网卡均为返回第一响应数据包时,才确定第二节点为故障节点,因此,可以有效避免网卡故障导致检测结果误判为节点故障,从而可以有效提高故障节点检测的准确率。本发明还提供了一种故障节点检测系统、装置及计算机可读存储介质,同样可以实现上述技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例公开的一种故障节点检测方法流程图;
图2为本发明实施例公开的一种具体的故障节点检测方法流程图;
图3为本发明实施例公开的一种具体的故障节点检测方法流程图;
图4为本发明实施例公开的一种故障节点检测系统结构示意图;
图5为本发明实施例公开的一种故障节点检测装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种故障节点检测方法、系统、装置及计算机可读存储介质,以解决如何提高故障节点检测的准确率的问题。
参见图1,本发明实施例提供的一种故障节点检测方法,具体包括:
S101,利用第一节点的每个第一网卡向第二节点中对应每个第一网卡的每个第二网卡发送心跳检测数据包;其中,所述第一网卡与所述第二网卡一一对应,且个数至少为2个。
在本方案中,为集群中每一个节点均配置至少两个用于建立心跳网络的网卡,需要说明的是,每个节点中,用于建立心跳网络的网卡数量一致,且一一对应,即每两个节点中对应的两个网卡建立一条连接,每个网卡只与对应的网卡传输心跳检测相关的数据。
例如,集群中有3个节点,分别是A、B、C,其中每个节点对应两个网卡,网卡的IP地址分别是A1、A2、B1、B2、C1、C2,其中,A1、B1、C1相互对应,A2、B2、C2相互对应,相互对应的网卡之间传输用于心跳检测的数据包。
具体地,利用第一节点的每个第一网卡向第二节点中对应每个第一网卡的第二网卡发送心跳检测数据包。
例如,第一节点为A,第二节点为B、C,在本步骤中,利用A1分别向对应的B1、C1发送心跳检测数据包,利用A2分别向对应的B2、C2发送心跳检测数据包,并等待第二节点每个网卡的响应。
S102,判断所述第二节点的每个第二网卡是否均未返回第一响应数据包。
具体地,判断第二节点的每个第二网卡是否均未返回第一响应数据包。
在本方案中,为每个节点设置至少两个网卡,当所有网卡都没有返回响应数据时,才确定节点故障,否则只认为网卡的网络连接故障。
S103,若是,则确定所述第二节点为故障节点。
由此可见,本申请实施例提供的一种故障节点检测方法,每个节点均设置有至少两个用于心跳检测网卡,当第一节点利用自己的每个第一网卡向第二节点中对应的每个第二网卡发送心跳检测数据包后,只有第二节点的所有第二网卡均为返回第一响应数据包时,才确定第二节点为故障节点,因此,可以有效避免网卡故障导致检测结果误判为节点故障,从而可以有效提高故障节点检测的准确率。
下面对本申请实施例提供的一种具体的故障节点检测方法进行介绍,下文描述的一种具体的故障节点检测方法与上述实施例可以相互参照。
参见图2,本申请实施例提供的一种具体的故障节点检测方法,在上述实施例的基础上还包括:
S201,接收所述第二节点发送的心跳检测数据包。
在本方案中,第一节点接收第二节点发送的心跳检测数据包,使第二节点来检测第一节点的故障情况。
S202,确定每个心跳检测数据包对应的目标第二网卡。
确定每个心跳检测数据包是由哪个第二网卡发送的,即确定每个心跳检测数据包对应的目标第二网卡。
S203,确定与所述目标第二网卡对应的目标第一网卡。
具体地,由于第二网卡与第一网卡是一一对应的,因此,利用目标第二网卡确定出发送对应的心跳检测数据包的目标第一网卡。
S204,利用所述目标第一网卡向对应的目标第二网卡返回第二响应数据包。
利用每个目标第一网卡向与每个目标第一网卡对应的目标第二网卡返回第二响应数据包。
S205,确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障。
具体地,作为心跳检测数据包的接收方,存在一种情况,即发送方的一个网卡故障,因此与该网卡建立连接的所有其他节点上的网卡之间的连接关系均是故障的,为了检测出这种情况,在本方案中,作为接收方的第一节点需要确定出自己的所有网卡中哪些网卡没有接收到心跳检测数据包,从而这些网卡与对应的第二节点的网卡之间的连接关系就是故障的。
具体地,在本方案中,只需确定出非目标第一网卡,即没有接收到心跳检测数据包的网卡,将该非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障。
S206,重新建立所述非目标第一网卡与所述第二节点中对应的第二网卡的连接关系。
进一步地,在确定了故障连接关系后,即可重新建立非目标第一网卡与对应的第二网卡的连接关系,使连接关系恢复正常状态。
需要说明的是,如果连接关系建立失败,则说明网卡硬件出现问题,需要即是更换。
下面对本申请实施例提供的一种具体的故障节点检测方法进行介绍,下文描述的一种具体的故障节点检测方法与上述任一实施例可以相互参照。
参见图3,本申请实施例提供的一种具体的故障节点检测方法,具体包括:
S301,接收所述第二节点发送的心跳检测数据包。
需要说明的是,集群系统中,每一个几点都可以作为心跳检测数据包的发送方,也可以作为心跳检测数据包的接收方,也即响应方,在集群系统中,每个节点相互监听,形成心跳网络。
在本方案中,每个节点中预置有配置文件,配置文件中配置了所有节点的所有IP地址。通过该配置文件确定需要监听其他所有节点的IP地址,启动TCP网络监听,向其他所有IP地址发送心跳检测数据包,并等待对方的回应,如果同一个接收方节点的所有网卡均为返回响应数据包,确定该接收方节点故障,当然,当前所述发送方,也作为其他集群节点的接收方,被其他集群节点监听。
需要说明的是每一个节点中,对应每一个网卡均有两个队列,一个是发送队列,一个是接收队列。
作为发送方时,间隔预设时间将发送队列中的心跳检测数据包发送至对应的接收方网卡,接收方对应的网卡在接收到该心跳检测数据包时,从对应的接收队列中确定响应数据包,返回给发送方。
具体地,本方案以第一节点作为接收方、第二节点作为发送方进行具体描述。
S302,确定每个心跳检测数据包对应的目标第二网卡。
S303,确定与所述目标第二网卡对应的目标第一网卡。
S304,利用所述目标第一网卡向对应的目标第二网卡返回第二响应数据包。
S305,确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡确定为故障网卡。
需要说明的是,由于每个目标第一网卡再接收到对应的心跳检测数据包后,都需要从自己对应的接收队列中确定响应数据包,因此,可以确定当前待返回的第二响应数据包所在的是哪些待返回接收队列,并确定出这些待返回接收队列中不涉及到哪个队列,如果一个队列不是待返回接收队列,则说明该队列对应的网卡无需返回响应数据包,进一步说明其没有接收到心跳检测数据包。因此证明发送方与该网卡对应的网卡是故障的,因此这两个网卡之间的连接关系是故障连接,无需存在,即可删除这两个网卡之间的连接关系。
S306,将所述非目标第一网卡的接收队列转移至目标第一网卡。
具体地,由于非目标第一网卡的连接关系已故障,因此无需再存在,因此即可将非目标第网卡的接收队列转移至目标第一网卡,使其他目标第一网卡利用其接收队列进行响应。
下面对本申请实施例提供的一种故障节点检测系统进行介绍,下文描述的一种故障节点检测系统,与上述任一实施例可以相互参照。
参见图4,本申请实施例提供的一种故障节点检测系统,具体包括:
发送模块401,用于利用第一节点的每个第一网卡向第二节点中对应每个第一网卡的每个第二网卡发送心跳检测数据包;其中,所述第一网卡与所述第二网卡一一对应,且个数至少为2个。
判断模块402,用于判断所述第二节点的每个第二网卡是否均未返回第一响应数据包。
第一确定模块403,用于当所述第二节点的每个第二网卡均未发送所述第一响应数据包时确定所述第二节点为故障节点。
作为优选实施例,上述系统还包括:
接收模块,用于接收所述第二节点发送的心跳检测数据包;
第二确定模块,用于确定每个心跳检测数据包对应的目标第二网卡;
第三确定模块,用于确定与所述目标第二网卡对应的目标第一网卡;
返回模块,用于利用所述目标第一网卡向对应的目标第二网卡返回第二响应数据包;
第四确定模块,用于确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障。
作为优选实施例,上述系统还包括:
重连模块,用于重新建立所述非目标第一网卡与所述第二节点中对应的第二网卡的连接关系。
本实施例的故障节点检测系统用于实现前述的故障节点检测方法,因此故障节点检测系统中的具体实施方式可见前文中的故障节点检测方法的实施例部分,例如,发送模块401,判断模块402,第一确定模块403,分别用于实现上述故障节点检测方法中步骤S101,S102,S103,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
下面对本申请实施例提供的一种故障节点检测装置进行介绍,下文描述的一种故障节点检测装置与上述任一实施例提供的实施例可以相互参照。
参见图5,本申请实施例提供的一种故障节点检测装置,具体包括:
存储器100,用于存储计算机程序;
处理器200,用于执行所述计算机程序时实现如上述任一实施例所述故障节点检测方法的步骤。
具体的,存储器100包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机可读指令,该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。处理器200为故障节点检测装置提供计算和控制能力,可以实现上述任一故障节点检测方法实施例所提供的步骤。
在上述实施例的基础上,作为优选实施方式,所述故障节点检测装置还包括:
输入接口300,用于获取外部导入的计算机程序、参数和指令,经处理器控制保存至存储器中。该输入接口300可以与输入装置相连,接收用户手动输入的参数或指令。该输入装置可以是显示屏上覆盖的触摸层,也可以是终端外壳上设置的按键、轨迹球或触控板,也可以是键盘、触控板或鼠标等。具体的,在本实施例中,用户可以通过输入接口300手动配置第一节点、第二节点的网卡个数和IP地址等信息。
显示单元400,用于显示处理器发送的数据。该显示单元40可以为PC机上的显示屏、液晶显示屏或者电子墨水显示屏等。具体的,在本实施例中,显示单元400可以显示故障节点检测的结果、心跳检测信息等。
网络端口500,用于与外部各终端设备进行通信连接。该通信连接所采用的通信技术可以为有线通信技术或无线通信技术,如移动高清链接技术(MHL)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术等。具体的,在本方案中,第一节点与第二节点之间可以通过网络端口500相互通信。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种故障节点检测方法,其特征在于,包括:
利用第一节点的每个第一网卡向第二节点中对应每个第一网卡的每个第二网卡发送心跳检测数据包;其中,所述第一网卡与所述第二网卡一一对应,且个数至少为2个;
判断所述第二节点的每个第二网卡是否均未返回第一响应数据包;
若是,则确定所述第二节点为故障节点。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述第二节点发送的心跳检测数据包;
确定每个心跳检测数据包对应的目标第二网卡;
确定与所述目标第二网卡对应的目标第一网卡;
利用所述目标第一网卡向对应的目标第二网卡返回第二响应数据包;
确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障。
3.根据权利要求2所述的方法,其特征在于,所述确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障之后,还包括:
重新建立所述非目标第一网卡与所述第二节点中对应的第二网卡的连接关系。
4.根据权利要求2所述的方法,其特征在于,所述第二响应数据包为与每个所述第一网卡对应的接收队列中的第二相应数据包;其中所述接收队列与所述第一网卡一一对应。
5.根据权利要求4所述的方法,其特征在于,所述确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障之后,还包括:
将所述非目标第一网卡的接收队列转移至目标第一网卡。
6.一种故障节点检测系统,其特征在于,包括:
发送模块,用于利用第一节点的每个第一网卡向第二节点中对应每个第一网卡的每个第二网卡发送心跳检测数据包;其中,所述第一网卡与所述第二网卡一一对应,且个数至少为2个;
判断模块,用于判断所述第二节点的每个第二网卡是否均未返回第一响应数据包;
第一确定模块,用于当所述第二节点的每个第二网卡均未发送所述第一响应数据包时确定所述第二节点为故障节点。
7.根据权利要求6所述的方法,其特征在于,还包括:
接收模块,用于接收所述第二节点发送的心跳检测数据包;
第二确定模块,用于确定每个心跳检测数据包对应的目标第二网卡;
第三确定模块,用于确定与所述目标第二网卡对应的目标第一网卡;
返回模块,用于利用所述目标第一网卡向对应的目标第二网卡返回第二响应数据包;
第四确定模块,用于确定所有第一网卡中的非目标第一网卡,将所述非目标第一网卡与对应的第二网卡之间的连接关系确定为连接故障。
8.根据权利要求7所述的系统,其特征在于,还包括:
重连模块,用于重新建立所述非目标第一网卡与所述第二节点中对应的第二网卡的连接关系。
9.一种故障节点检测装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述故障节点检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述故障节点检测方法的步骤。
CN201811383301.1A 2018-11-20 2018-11-20 一种故障节点检测方法及相关装置 Pending CN109218141A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811383301.1A CN109218141A (zh) 2018-11-20 2018-11-20 一种故障节点检测方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811383301.1A CN109218141A (zh) 2018-11-20 2018-11-20 一种故障节点检测方法及相关装置

Publications (1)

Publication Number Publication Date
CN109218141A true CN109218141A (zh) 2019-01-15

Family

ID=64993930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811383301.1A Pending CN109218141A (zh) 2018-11-20 2018-11-20 一种故障节点检测方法及相关装置

Country Status (1)

Country Link
CN (1) CN109218141A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110808874A (zh) * 2019-10-25 2020-02-18 北京大米科技有限公司 一种跨机房服务监控方法、装置、存储介质及服务器
CN110933142A (zh) * 2019-11-07 2020-03-27 浪潮电子信息产业股份有限公司 一种icfs集群网卡监控方法、装置和设备及介质
CN111212127A (zh) * 2019-12-29 2020-05-29 浪潮电子信息产业股份有限公司 一种存储集群及业务数据的维护方法、装置和存储介质
WO2020220231A1 (zh) * 2019-04-29 2020-11-05 华为海洋网络有限公司 海缆故障判断方法和装置
WO2020244067A1 (zh) * 2019-06-04 2020-12-10 平安科技(深圳)有限公司 故障检测方法及相关设备
CN113542052A (zh) * 2021-06-07 2021-10-22 新华三信息技术有限公司 一种节点故障确定方法、装置和服务器
CN113824796A (zh) * 2021-10-22 2021-12-21 杭州宏杉科技股份有限公司 令牌传递方法及装置
CN114363150A (zh) * 2021-12-28 2022-04-15 浪潮通信技术有限公司 服务器集群的网卡连通性监控方法及装置
CN114548769A (zh) * 2022-02-23 2022-05-27 广东妍曦信息科技有限公司 一种智能电网it资产大数据监测系统及方法
CN116684256A (zh) * 2023-08-01 2023-09-01 苏州浪潮智能科技有限公司 节点故障监测方法、装置、系统、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104486128A (zh) * 2014-12-23 2015-04-01 浪潮(北京)电子信息产业有限公司 一种实现双控制器节点间冗余心跳的系统及方法
CN104579727A (zh) * 2013-10-17 2015-04-29 国际商业机器公司 一种管理网络节点的网络连接的方法和装置
CN104702693A (zh) * 2015-03-19 2015-06-10 华为技术有限公司 两节点系统分区的处理方法和节点
CN106301853A (zh) * 2015-06-05 2017-01-04 华为技术有限公司 集群系统中节点的故障检测方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104579727A (zh) * 2013-10-17 2015-04-29 国际商业机器公司 一种管理网络节点的网络连接的方法和装置
CN104486128A (zh) * 2014-12-23 2015-04-01 浪潮(北京)电子信息产业有限公司 一种实现双控制器节点间冗余心跳的系统及方法
CN104702693A (zh) * 2015-03-19 2015-06-10 华为技术有限公司 两节点系统分区的处理方法和节点
CN106301853A (zh) * 2015-06-05 2017-01-04 华为技术有限公司 集群系统中节点的故障检测方法和装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11265080B2 (en) 2019-04-29 2022-03-01 Hmn Technologies Co., Limited Submarine cable fault determining method and apparatus
WO2020220231A1 (zh) * 2019-04-29 2020-11-05 华为海洋网络有限公司 海缆故障判断方法和装置
WO2020244067A1 (zh) * 2019-06-04 2020-12-10 平安科技(深圳)有限公司 故障检测方法及相关设备
CN110808874A (zh) * 2019-10-25 2020-02-18 北京大米科技有限公司 一种跨机房服务监控方法、装置、存储介质及服务器
CN110933142A (zh) * 2019-11-07 2020-03-27 浪潮电子信息产业股份有限公司 一种icfs集群网卡监控方法、装置和设备及介质
CN111212127A (zh) * 2019-12-29 2020-05-29 浪潮电子信息产业股份有限公司 一种存储集群及业务数据的维护方法、装置和存储介质
CN113542052A (zh) * 2021-06-07 2021-10-22 新华三信息技术有限公司 一种节点故障确定方法、装置和服务器
CN113824796A (zh) * 2021-10-22 2021-12-21 杭州宏杉科技股份有限公司 令牌传递方法及装置
CN113824796B (zh) * 2021-10-22 2023-06-30 杭州宏杉科技股份有限公司 令牌传递方法及装置
CN114363150A (zh) * 2021-12-28 2022-04-15 浪潮通信技术有限公司 服务器集群的网卡连通性监控方法及装置
CN114363150B (zh) * 2021-12-28 2024-05-14 浪潮通信技术有限公司 服务器集群的网卡连通性监控方法及装置
CN114548769A (zh) * 2022-02-23 2022-05-27 广东妍曦信息科技有限公司 一种智能电网it资产大数据监测系统及方法
CN116684256A (zh) * 2023-08-01 2023-09-01 苏州浪潮智能科技有限公司 节点故障监测方法、装置、系统、电子设备及存储介质
CN116684256B (zh) * 2023-08-01 2023-11-03 苏州浪潮智能科技有限公司 节点故障监测方法、装置、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109218141A (zh) 一种故障节点检测方法及相关装置
CN111181801B (zh) 节点集群测试方法、装置、电子设备及存储介质
US8935576B2 (en) Automated cabling process for a complex environment
EP2696534B1 (en) Method and device for monitoring quick path interconnect link
TW201719436A (zh) 使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器
CN106502814B (zh) 一种记录pcie设备错误信息的方法及装置
US20140201356A1 (en) Monitoring system of managing cloud-based hosts and monitoring method using for the same
JP2015524122A (ja) ピーシーアイエクスプレスのエンドポイントデバイスにアクセスするための方法、コンピューターシステム、および、装置
EP3865998A1 (en) Cluster management method, apparatus and system
CN109101371B (zh) 一种容灾切换方法及装置
CN109041267B (zh) 一种网络连接故障处理方法、装置及电子设备
US20170163505A1 (en) Application centric network experience monitoring
CN109271273A (zh) 一种通讯异常恢复的方法、异常恢复设备及存储介质
CN104079717A (zh) 一种显示设备界面的方法及服务器
CN106502944A (zh) 计算机、pcie设备以及pcie设备的心跳检测方法
CN108768807B (zh) 一种云平台虚实互连的方法及装置
CN104079634A (zh) 一种显示设备界面的方法、设备及系统
CN109739581A (zh) 一种fpga部分重配置方法、系统、设备及计算机介质
CN115599617A (zh) 总线检测方法、装置、服务器及电子设备
CN104954187B (zh) 一种确定用户侧设备状态的方法和装置
CN110688267B (zh) 一种硬盘端口的修复方法及装置
CN115276844A (zh) 通信模组的测试方法、装置及电子设备
CN116260747A (zh) 终端测试设备的监测方法、装置及电子设备
CN110752939B (zh) 一种业务进程故障处理方法、通知方法和装置
CN108833914B (zh) Cob拼接墙的故障检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190115

RJ01 Rejection of invention patent application after publication