CN112311621B - 通信检测方法及装置 - Google Patents

通信检测方法及装置 Download PDF

Info

Publication number
CN112311621B
CN112311621B CN202011100474.5A CN202011100474A CN112311621B CN 112311621 B CN112311621 B CN 112311621B CN 202011100474 A CN202011100474 A CN 202011100474A CN 112311621 B CN112311621 B CN 112311621B
Authority
CN
China
Prior art keywords
control board
frame
standby
slave control
heartbeat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011100474.5A
Other languages
English (en)
Other versions
CN112311621A (zh
Inventor
祖淑芝
方立文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd Hefei Branch
Original Assignee
New H3C Technologies Co Ltd Hefei Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd Hefei Branch filed Critical New H3C Technologies Co Ltd Hefei Branch
Priority to CN202011100474.5A priority Critical patent/CN112311621B/zh
Publication of CN112311621A publication Critical patent/CN112311621A/zh
Application granted granted Critical
Publication of CN112311621B publication Critical patent/CN112311621B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Abstract

本申请提供一种通信检测方法及装置,所述方法应用于备框主控板,所述备框主控板处于备用框,所述备用框还包括多个备框从控板,所述方法包括:当未接收到目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数递增;如果所述备框从控板的个数不小于预设的数量值,则判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值;如果超过,则判断是否接收到除所述目标备框从控板之外的其他备框从控板发送的心跳报文;如果接收到,则重启所述目标备框从控板;如果未接收到,则重启所述备框主控板。

Description

通信检测方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及一种通信检测方法及装置。
背景技术
在框式堆叠设备组网中,框式堆叠设备内板卡间的通信是否健康,是决定组网稳定性的重要参数之一。框式堆叠设备内的某个板卡故障,会对业务功能造成影响。因此,需定时对框式堆叠设备内板卡间的通信进行检测,判断是否存在板卡故障。比如,各板卡之间采用心跳检测方式,进而发现故障板卡,并重启故障板卡。
框式堆叠设备组网内包括主用框、备用框。主用框包括一个主框主控板以及多个主框从控板;备用框包括一个备用备框主控板以及多个备框从控板。多个主框从控板以及多个备框从控板构成堆叠系统。如图1所示,图1为框式堆叠设备组网示意图。
在图1中,1框为主用框,2框为备用框。1框插槽(slot)0为主框主控板,1框slot1-1框slot3均为主框从控板。2框slot0为备框主控板,2框slot1-2框slot3均为备框从控板。1框slot2、1框slot3、2框slot2、2框slot3均为堆叠板,1框和2框组成堆叠系统。
此时,若2框slot 3出现单通故障,板间报文无法从2框slot3到达2框slot0。则2框slot3与2框slot0之间的通信,因2框slot 3的故障而导致单通。但是2框slot 3与1框slot0之间的通信正常,因此,该板卡的故障无法及时发现。2框slot 3继续运行,进而影响业务功能。
发明内容
有鉴于此,本申请提供了一种通信检测方法及装置,用以解决现有技术中备框从控板与备框主控板间通信故障,但与主框主控板间通信正常,导致故障板卡无法及时发现,影响业务功能的问题。
第一方面,本申请提供了一种通信检测方法,所述方法应用于备框主控板,所述备框主控板处于备用框,所述备用框还包括多个备框从控板,所述方法包括:
当未接收到目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数递增;
如果所述备用框内板卡的个数不小于预设的数量值,则判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值;
如果超过,则判断是否接收到除所述目标备框从控板之外的其他备框从控板发送的心跳报文;
如果接收到,则重启所述目标备框从控板;
如果未接收到,则重启所述备框主控板。
第二方面,本申请提供了一种通信检测装置,所述装置应用于备框主控板,所述备框主控板处于备用框,所述备用框还包括多个备框从控板,所述装置包括:
计算单元,用于当未接收到目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数递增;
判断单元,用于如果所述备用框内板卡的个数不小于预设的数量值,则判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值;
所述判断单元还用于,如果超过,则判断是否接收到除所述目标备框从控板之外的其他备框从控板发送的心跳报文;
重启单元,用于如果接收到,则重启所述目标备框从控板;
所述重启单元还用于,如果未接收到,则重启所述备框主控板。
第三方面,本申请提供了一种网络设备,包括处理器和机器可读存储介质,机器可读存储介质存储有能够被处理器执行的机器可执行指令,处理器被机器可执行指令促使执行本申请第一方面所提供的方法。
因此,通过应用本申请提供的通信检测方法及装置,当备框主控板未接收到目标备框从控板发送的心跳报文时,备框主控板将与目标备框从控板对应的心跳超时次数递增。如果备用框内板卡的个数不小于预设的数量值,则备框主控板判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值。如果超过,则备框主控板判断是否接收到除目标备框从控板之外的其他备框从控板发送的心跳报文。如果接收到,则备框主控板重启目标备框从控板;如果未接收到,则备框主控板重启备框主控板。
备框主控板根据与目标备框从控板对应的心跳超时次数、是否接收到其他备框从控板发送的心跳报文,综合确定与目标备框从控板之间通信是否故障。针对已故障的目标备框从控板,备框主控板对其进行重启操作。解决现有技术中备框内备框从控板与备框主控板间通信故障,但与主用主控板间通信正常,导致故障板卡无法及时发现,影响业务功能的问题。
附图说明
图1为框式堆叠设备组网示意图;
图2为本申请实施例提供的通信检测方法的流程图;
图3为本申请实施例提供的通信检测装置结构图;
图4为本申请实施例提供的网络设备硬件结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施例并不代表与本申请相一致的所有实施例。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相对应的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在现有技术方案中,若管理人员手动将1框slot 3拔出,由于2框slot3的故障无法通知2框slot 0,使得2框slot0确认堆叠板的接口全部为正常状态。而1框slot确认堆叠板只有1框slot2的堆叠口为正常状态。如此,造成框间堆叠异构,而且,框间交互的堆叠报文在通过2框slot3转发时,导致框间通信异常,进而影响业务功能。
需要说明的是,1框内各slot间的通信检测可按照现有技术方案进行检测,在此不再复述。在本申请实施例中,针对现有技术方案中2框内各slot间无法进行通信检测的问题提出一种通信检测方法。
下面对本申请实施例提供的通信检测方法进行详细地说明。参见图2,图2为本申请实施例提供的通信检测方法的流程图。该方法应用于备框主控板,该备框主控板处于备用框,该备用框还包括多个备框从控板,本申请实施例提供的通信检测方法可包括如下所示步骤。
步骤210、当未接收到目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数递增。
具体地,请参考图1。1框为主用框,2框为备用框。1框插槽(slot)0为主用主控板,1框slot1-1框slot3均为主用从控板。2框slot0为备框主控板,2框slot1-2框slot3均为备框从控板。1框slot2、1框slot3、2框slot2、2框slot3均为堆叠板。1框和2框构成堆叠系统。
1框与2框之间具有数据通道,各框内的slot可通过数据通道向对框发送业务报文。各框内包括管理通道以及数据通道。管理通道可用于传输协议类报文,数据通道可用于传输数据类报文。
进一步地,在执行本步骤之前还包括,备框内各个备框从控板向备框主控板发送注册消息的步骤。
例如,2框内各个slot启动后,均生成一注册消息。该注册消息包括各个slot的slot号。各个slot向2框slot0发送注册消息。2框slot0接收到各个slot发送的注册消息后,从注册消息中获取各个slot的slot号。2框slot0记录各个slot的slot号,并将与各个slot对应的心跳超时次数进行初始化处理。也即是,设置与各个slot对应的心跳超时次数的初始值以及最大值。
其中,心跳超时次数的初始值为0,最大值可根据当前组网情况进行设置。例如,最大值设置为40。与各个slot对应的心跳超时次数的最大值可设置为同一值,或者,根据各个slot设置不同的值,在此不进行限定。
更进一步地,在执行本步骤之前,备框内各个备框从控板周期性向备框主控板发送心跳报文的步骤。
例如,2框内各个slot向备框主控板发送注册消息后,各个slot周期性向2框slot0发送心跳报文。各个slot可通过框内的控制通道向2框slot0发送心跳报文。各个slot可设置发送周期,具体可设置为1秒。
在本申请实施例中,备框主控板将备用框内的每个备框从控板作为目标备框从控板。备框主控板识别是否接收到该目标备框从控板发送的心跳报文。如果未接收到目标备框从控板发送的心跳报文,则备框主控板将与目标备框从控板对应的心跳超时次数递增,即,将心跳超时次数加1。如果接收到目标备框从控板发送的心跳报文,则备框主控板将与目标备框从控板对应的心跳超时次数清零。
例如,2框slot0首先将2框slot1作为目标备框从控板。2框slot0识别是否接收到2框slot1发送的心跳报文。如果未接收到2框slot1发送的心跳报文,则2框slot0将与2框slot1对应的心跳超时次数递增,即,将心跳超时次数加1。如果接收到2框slot1发送的心跳报文,则2框slot0将与2框slot1对应的心跳超时次数清零。
然后,2框slot0将2框slot2作为目标备框从控板。2框slot0识别是否接收到2框slot2发送的心跳报文。如果未接收到2框slot2发送的心跳报文,则2框slot0将与2框slot2对应的心跳超时次数递增,即,将心跳超时次数加1。如果接收到2框slot2发送的心跳报文,则2框slot0将与2框slot2对应的心跳超时次数清零。
最后,2框slot0将2框slot3作为目标备框从控板。2框slot3识别是否接收到2框slot3发送的心跳报文。如果未接收到2框slot3发送的心跳报文,则2框slot0将与2框slot3对应的心跳超时次数递增,即,将心跳超时次数加1。如果接收到2框slot3发送的心跳报文,则2框slot0将与2框slot3对应的心跳超时次数清零。
步骤220、如果所述备用框内板卡的个数不小于预设的数量值,则判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值。
具体地,备框主控板将与目标备框从控板对应的心跳超时次数递增后,备框主控板判断当前备用框内的板卡的个数是否小于预设的数量值。如果备用框内板卡的个数不小于预设的数量值,则备框主控板判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值。
在本申请实施例中,预设的数量值最小为3。
例如,目标备框从控板为2框slot1。2框slot0判断当前备用框内的板卡的个数是否小于预设的数量值。当前备用框内的板卡的个数为3,则2框slot0判断与2框slot1对应的心跳超时次数是否超过预设的次数值。
步骤230、如果超过,则判断是否接收到除所述目标备框从控板之外的其他备框从控板发送的心跳报文。
具体地,根据步骤220的判断,如果与目标备框从控板对应的心跳超时次数是否超过预设的次数值,则备框主控板判断是否接收到除目标备框从控板之外的其他备框从控板发送的心跳报文。
在本申请实施例中,预设的次数值可具体为40。
例如,目标备框从控板为2框slot1。与2框slot1对应的心跳超时次数为41,此时,2框slot0确定与2框slot1对应的心跳超时次数超过预设的次数值。2框slot0判断是否接收到2框slot2、2框slot3发送的心跳报文。
步骤240、如果接收到,则重启所述目标备框从控板。
具体地,根据步骤230的判断,如果备框主控板接收到除目标备框从控板之外的其他备框从控板发送的心跳报文,则备框主控板确定目标备框从控板故障,备框主控板重启该目标备框从控板。
例如,目标备框从控板为2框slot1。此时,2框slot0确定接收到2框slot2、2框slot3发送的心跳报文,则2框slot0确定2框slot1故障,2框slot0重启2框slot1。
步骤250、如果未接收到,则重启所述备框主控板。
具体地,根据步骤230的判断,如果备框主控板未接收到除目标备框从控板之外的其他备框从控板发送的心跳报文,则备框主控板确定是自身出现故障,备框主控板重启自身。
例如,目标备框从控板为2框slot1。此时,2框slot0确定未接收到2框slot2、2框slot3发送的心跳报文,则2框slot0确定自身故障,2框slot0重启自身。
因此,通过应用本申请提供的通信检测方法,当备框主控板未接收到目标备框从控板发送的心跳报文时,备框主控板将与目标备框从控板对应的心跳超时次数递增。如果备用框内板卡的个数不小于预设的数量值,则备框主控板判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值。如果超过,则备框主控板判断是否接收到除目标备框从控板之外的其他备框从控板发送的心跳报文。如果接收到,则备框主控板重启目标备框从控板;如果未接收到,则备框主控板重启备框主控板。
备框主控板根据与目标备框从控板对应的心跳超时次数、是否接收到其他备框从控板发送的心跳报文,综合确定与目标备框从控板之间通信是否故障。针对已故障的目标备框从控板,备框主控板对其进行重启操作。解决现有技术中备框内备框从控板与备框主控板间通信故障,但与主用主控板间通信正常,导致故障板卡无法及时发现,影响业务功能的问题。
可选地,在本申请实施例中,还包括备框主控板接收硬件驱动模块发送的通知消息的过程。
具体地,当硬件驱动模块感知到备框从控板脱离备框主控板时,硬件驱动模块生成通知消息。该通知消息包括备框从控板的slot号以及备框从控板脱离备用框的脱离信息。
硬件驱动模块向备框主控板发送通知消息。备框主控板接收到硬件驱动模块发送的通知消息后,从通知消息中获取备框从控板的slot号以及备框从控板脱离备用框的脱离信息。根据脱离信息,备框主控板识别备框从控板是否正常脱离备用框。如果是,则备框主控板删除已记录的备框从控板的slot号。
在本申请实施例中,备框从控板脱离备用框具体是指备框从控板从备用框中拔出、重启等操作。也就是,备框从控板正常从备用框中脱离。脱离信息中记载备框从控板从备用框中的脱离原因。
可选地,在本申请实施例中,备框主控板还周期性地向已记录的备框从控板的slot号对应的备框从控板发送组播心跳检测报文。
备框从控板如果接收到备框主控板发送的组播心跳检测报文后,则将本地记录的与备框主控板对应的心跳超时次数清零。
备框从控板如果未接收到备框主控板发送的组播心跳检测报文,则备框从控板将与备框主控板对应的心跳超时次数递增,即,将心跳超时次数加1。备框从控板判断与备框主控板对应的心跳超时次数是否超过预设的次数值。
如果与备框主控板对应的心跳超时次数超过预设的次数值,则该备框从控板确定自身与备框主控板间的通信故障,备框从控板重启自身。
可选地,在本申请实施例中,备框从控板包括备框备板以及备框接口板。
若备框主控板重启,此时,备用框内无备框主控板。备用框内的备框备板可自行升级为备框主控板。
当备框备板升级为备框主控板后,该备框备板称之为新备框主控板。新备框主控板将备用框包括的全部备框从控板对应的心跳超时次数清零。
新备框主控板还向备用框内包括的全部备框从控板发送通知消息。备框从控板根据通知消息,确定备框主控板已变更,备框从控板将本地记录的与备框主控板对应的心跳超时次数清零。
基于同一发明构思,本申请实施例还提供了与上述通信检测方法对应的通信检测装置。参见图3,图3为本申请实施例提供的通信检测装置结构图,所述装置应用于备框主控板,所述备框主控板处于备用框,所述备用框还包括多个备框从控板,所述装置包括:
计算单元310,用于当未接收到目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数递增;
判断单元320,用于如果所述备用框内板卡的个数不小于预设的数量值,则判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值;
所述判断单元320还用于,如果超过,则判断是否接收到除所述目标备框从控板之外的其他备框从控板发送的心跳报文;
重启单元330,用于如果接收到,则重启所述目标备框从控板;
所述重启单元330还用于,如果未接收到,则重启所述备框主控板。
可选地,所述装置还包括:接收单元(图中未示出),用于接收所述备框从控板发送的注册消息,所述注册消息包括所述备框从控板的slot号;
记录单元(图中未示出),用于记录所述备框从控板的slot号,并将与所述备框从控板对应的心跳超时次数进行初始化处理。
可选地,所述装置还包括:清零单元(图中未示出),用于当接收到所述目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数清零。
可选地,所述接收单元(图中未示出)还用于,接收硬件驱动模块发送的通知消息,所述通知消息包括所述备框从控板的slot号以及所述备框从控板脱离所述备用框的脱离信息;
所述装置还包括:识别单元(图中未示出),用于根据所述脱离信息,识别所述备框从控板是否正常脱离所述备用框;
删除单元(图中未示出),用于如果是,则删除已记录的所述备框从控板的slot号。
可选地,所述清零单元(图中未示出)还用于,当所述备框备板升级为所述备框主控板后,将所述备用框包括的全部备框从控板对应的心跳超时次数清零。
可选地,所述装置还包括:发送单元(图中未示出),用于周期性向已记录的所述备框从控板的slot号对应的备框从控板发送组播心跳检测报文,以使得所述备框从控板更新本地记录的与所述备框主控板对应的心跳超时次数,并在所述心跳超时次数超过预设的次数值时,重启所述备框从控板。
因此,通过应用本申请提供的通信检测装置,当未接收到目标备框从控板发送的心跳报文时,该装置将与目标备框从控板对应的心跳超时次数递增。如果备用框内板卡的个数不小于预设的数量值,则该装置判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值。如果超过,则该装置判断是否接收到除目标备框从控板之外的其他备框从控板发送的心跳报文。如果接收到,则该装置重启目标备框从控板;如果未接收到,则该装置重启备框主控板。
该装置根据与目标备框从控板对应的心跳超时次数、是否接收到其他备框从控板发送的心跳报文,综合确定与目标备框从控板之间通信是否故障。针对已故障的目标备框从控板,该装置对其进行重启操作。解决现有技术中备框内备框从控板与备框主控板间通信故障,但与主用主控板间通信正常,导致故障板卡无法及时发现,影响业务功能的问题。
基于同一发明构思,本申请实施例还提供了一种网络设备,如图4所示,包括处理器410、收发器420和机器可读存储介质430,机器可读存储介质430存储有能够被处理器410执行的机器可执行指令,处理器410被机器可执行指令促使执行本申请实施例所提供的通信检测方法。前述图3所示的通信检测装置,可采用如图4所示的网络设备硬件结构实现。
上述计算机可读存储介质430可以包括随机存取存储器(英文:Random AccessMemory,简称:RAM),也可以包括非易失性存储器(英文:Non-volatile Memory,简称:NVM),例如至少一个磁盘存储器。可选的,计算机可读存储介质430还可以是至少一个位于远离前述处理器410的存储装置。
上述处理器410可以是通用处理器,包括中央处理器(英文:Central ProcessingUnit,简称:CPU)、网络处理器(英文:Network Processor,简称:NP)等;还可以是数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:ApplicationSpecific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field-Programmable Gate Array,简称:FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本申请实施例中,处理器410通过读取机器可读存储介质430中存储的机器可执行指令,被机器可执行指令促使能够实现处理器410自身以及调用收发器420执行前述本申请实施例描述的通信检测方法。
另外,本申请实施例提供了一种机器可读存储介质430,机器可读存储介质430存储有机器可执行指令,在被处理器410调用和执行时,机器可执行指令促使处理器410自身以及调用收发器420执行前述本申请实施例描述的通信检测方法。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
对于通信检测装置以及机器可读存储介质实施例而言,由于其涉及的方法内容基本相似于前述的方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (12)

1.一种通信检测方法,其特征在于,所述方法应用于备框主控板,所述备框主控板处于备用框,所述备用框还包括多个备框从控板,所述方法包括:
当未接收到目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数递增;
如果所述备用框内板卡的个数不小于预设的数量值,则判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值;
如果超过,则判断是否接收到除所述目标备框从控板之外的其他备框从控板发送的心跳报文;
如果接收到,则重启所述目标备框从控板;
如果未接收到,则重启所述备框主控板。
2.根据权利要求1所述的方法,其特征在于,所述当未接收到目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数递增之前,所述方法还包括:
接收所述备框从控板发送的注册消息,所述注册消息包括所述备框从控板的slot号;
记录所述备框从控板的slot号,并将与所述备框从控板对应的心跳超时次数进行初始化处理。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当接收到所述目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数清零。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收硬件驱动模块发送的通知消息,所述通知消息包括所述备框从控板的slot号以及所述备框从控板脱离所述备用框的脱离信息;
根据所述脱离信息,识别所述备框从控板是否正常脱离所述备用框;
如果是,则删除已记录的所述备框从控板的slot号。
5.根据权利要求1所述的方法,其特征在于,所述备框从控板包括备框备板;
所述方法还包括:
当所述备框备板升级为所述备框主控板后,将所述备用框包括的全部备框从控板对应的心跳超时次数清零。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
周期性向已记录的所述备框从控板的slot号对应的备框从控板发送组播心跳检测报文,以使得所述备框从控板更新本地记录的与所述备框主控板对应的心跳超时次数,并在所述心跳超时次数超过预设的次数值时,重启所述备框从控板。
7.一种通信检测装置,其特征在于,所述装置应用于备框主控板,所述备框主控板处于备用框,所述备用框还包括多个备框从控板,所述装置包括:
计算单元,用于当未接收到目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数递增;
判断单元,用于如果所述备用框内板卡的个数不小于预设的数量值,则判断与目标备框从控板对应的心跳超时次数是否超过预设的次数值;
所述判断单元还用于,如果超过,则判断是否接收到除所述目标备框从控板之外的其他备框从控板发送的心跳报文;
重启单元,用于如果接收到,则重启所述目标备框从控板;
所述重启单元还用于,如果未接收到,则重启所述备框主控板。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
接收单元,用于接收所述备框从控板发送的注册消息,所述注册消息包括所述备框从控板的slot号;
记录单元,用于记录所述备框从控板的slot号,并将与所述备框从控板对应的心跳超时次数进行初始化处理。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
清零单元,用于当接收到所述目标备框从控板发送的心跳报文时,将与所述目标备框从控板对应的心跳超时次数清零。
10.根据权利要求8所述的装置,其特征在于,所述接收单元还用于,接收硬件驱动模块发送的通知消息,所述通知消息包括所述备框从控板的slot号以及所述备框从控板脱离所述备用框的脱离信息;
所述装置还包括:识别单元,用于根据所述脱离信息,识别所述备框从控板是否正常脱离所述备用框;
删除单元,用于如果是,则删除已记录的所述备框从控板的slot号。
11.根据权利要求9所述的装置,其特征在于,所述备框从控板包括备框备板;
所述清零单元还用于,当所述备框备板升级为所述备框主控板后,将所述备用框包括的全部备框从控板对应的心跳超时次数清零。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
发送单元,用于周期性向已记录的所述备框从控板的slot号对应的备用从控板发送组播心跳检测报文,以使得所述备框从控板更新本地记录的与所述备框主控板对应的心跳超时次数,并在所述心跳超时次数超过预设的次数值时,重启所述备框从控板。
CN202011100474.5A 2020-10-15 2020-10-15 通信检测方法及装置 Active CN112311621B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011100474.5A CN112311621B (zh) 2020-10-15 2020-10-15 通信检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011100474.5A CN112311621B (zh) 2020-10-15 2020-10-15 通信检测方法及装置

Publications (2)

Publication Number Publication Date
CN112311621A CN112311621A (zh) 2021-02-02
CN112311621B true CN112311621B (zh) 2022-05-24

Family

ID=74327101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011100474.5A Active CN112311621B (zh) 2020-10-15 2020-10-15 通信检测方法及装置

Country Status (1)

Country Link
CN (1) CN112311621B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113645103B (zh) * 2021-10-15 2021-12-24 杭州海康威视数字技术股份有限公司 视频监控平台与前端设备间通信链路异常检测方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101707536A (zh) * 2009-11-25 2010-05-12 成都市华为赛门铁克科技有限公司 故障检测方法、线卡及主控卡
CN101986626A (zh) * 2010-11-18 2011-03-16 中兴通讯股份有限公司 一种设备的保护方法及装置
CN102571492A (zh) * 2012-01-06 2012-07-11 华为技术有限公司 检测路由设备故障的方法和装置
KR101330066B1 (ko) * 2012-05-31 2013-11-18 한국해양과학기술원 통신 시스템의 백플랜 버스 구조 및 이를 이용한 보드 인식 방법
CN103916272A (zh) * 2014-03-31 2014-07-09 大唐移动通信设备有限公司 一种主控单板及一种主控单板故障检测方法
CN105959128A (zh) * 2015-08-11 2016-09-21 杭州迪普科技有限公司 故障处理方法、装置以及网络设备
WO2016188026A1 (zh) * 2015-05-22 2016-12-01 中兴通讯股份有限公司 主用主控板与备用主控板之间时间同步的方法及装置
CN111314432A (zh) * 2020-01-20 2020-06-19 新华三大数据技术有限公司 一种报文处理方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101707536A (zh) * 2009-11-25 2010-05-12 成都市华为赛门铁克科技有限公司 故障检测方法、线卡及主控卡
CN101986626A (zh) * 2010-11-18 2011-03-16 中兴通讯股份有限公司 一种设备的保护方法及装置
CN102571492A (zh) * 2012-01-06 2012-07-11 华为技术有限公司 检测路由设备故障的方法和装置
KR101330066B1 (ko) * 2012-05-31 2013-11-18 한국해양과학기술원 통신 시스템의 백플랜 버스 구조 및 이를 이용한 보드 인식 방법
CN103916272A (zh) * 2014-03-31 2014-07-09 大唐移动通信设备有限公司 一种主控单板及一种主控单板故障检测方法
WO2016188026A1 (zh) * 2015-05-22 2016-12-01 中兴通讯股份有限公司 主用主控板与备用主控板之间时间同步的方法及装置
CN105959128A (zh) * 2015-08-11 2016-09-21 杭州迪普科技有限公司 故障处理方法、装置以及网络设备
CN111314432A (zh) * 2020-01-20 2020-06-19 新华三大数据技术有限公司 一种报文处理方法及装置

Also Published As

Publication number Publication date
CN112311621A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN109240765B (zh) 服务资源的熔断方法、装置、设备及计算机可读存储介质
CN102708018B (zh) 一种异常处理方法及系统、代理设备与控制装置
CN102244669B (zh) 一种堆叠设备中软件升级的方法和堆叠设备
EP1697843B1 (en) System and method for managing protocol network failures in a cluster system
CN105933407B (zh) 一种实现Redis集群高可用的方法及系统
CN109714202B (zh) 一种客户端离线原因判别方法和集群式安全管理系统
CN107729185B (zh) 一种故障处理方法及装置
CN104980524A (zh) 一种weblogic连接池失效监测方法
JP2001101033A (ja) オペレーティングシステム及びアプリケーションプログラムの障害監視方法
US10318392B2 (en) Management system for virtual machine failure detection and recovery
CN111385107B (zh) 一种服务器的主备切换处理方法及装置
CN112311621B (zh) 通信检测方法及装置
CN104503861A (zh) 一种异常处理方法及系统、代理设备与控制装置
CN110933142A (zh) 一种icfs集群网卡监控方法、装置和设备及介质
CN102609327A (zh) 提高多核处理器的可靠性的方法及装置
CN111142801B (zh) 分布式存储系统网络亚健康检测方法及装置
CN114168071B (zh) 一种分布式集群扩容方法、分布式集群扩容装置及介质
CN110990328B (zh) 一种TBox的双处理器间可靠通信的方法及系统
CN111800810A (zh) 智能设备及其wcn模块异常恢复的系统和方法
CN107528705B (zh) 故障处理方法及装置
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
CN111880947B (zh) 一种数据传输方法及装置
CN101557307B (zh) 调度自动化系统应用状态管理方法
CN113190385A (zh) 车站应用服务器主备机的数据同步方法
CN109324834A (zh) 一种分布式存储服务器自动重启的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant