CN101150458A - 检测单板的方法和设备 - Google Patents

检测单板的方法和设备 Download PDF

Info

Publication number
CN101150458A
CN101150458A CNA2007101694378A CN200710169437A CN101150458A CN 101150458 A CN101150458 A CN 101150458A CN A2007101694378 A CNA2007101694378 A CN A2007101694378A CN 200710169437 A CN200710169437 A CN 200710169437A CN 101150458 A CN101150458 A CN 101150458A
Authority
CN
China
Prior art keywords
veneer
master control
control borad
detection messages
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101694378A
Other languages
English (en)
Inventor
郑明华
尹向东
曹真
毛晓磊
孙玉芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNA2007101694378A priority Critical patent/CN101150458A/zh
Publication of CN101150458A publication Critical patent/CN101150458A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Small-Scale Networks (AREA)

Abstract

本发明公开了一种检测单板的方法和设备,属于通信领域。所述方法包括:主控板沿着环形结构发送检测报文,环形结构由主控板和待检测的单板顺序排列形成;收到检测报文的单板,沿着环形结构转发检测报文;主控板判断是否在预设的故障时间内收到检测报文,如果收到,则单板正常。所述设备包括主控板和单板。本发明可以检测出单板是否发生故障。采用环形结构,可以分散主控板对检测报文的压力,将检测报文分布到各个单板,充分利用单板的CPU处理能力,与现有技术中主控板需要处理每个单板发来的心跳报文并返回响应的方式相比,减轻了主控板的压力,提高了检测单板的效率。

Description

检测单板的方法和设备
技术领域
本发明涉及通信领域,特别涉及一种检测单板的方法和设备。
背景技术
在数据通信设备或者类似设备中,一般都有多个单板,也称为线路板,或LPU(LineProcessing Unit,线路处理模块)板,在设备运行过程中,需要通过外部检测确定每个单板的健康状态,确保能及时发现单板故障并进行故障恢复。
现有技术中通过心跳检测的方式进行单板的健康检测,称为心型心跳检测模型,单板向主控板发送心跳报文,主控板收到后返回响应报文给单板,主控板在规定的时间内,如果收到某单板发来的心跳报文,则认为该单板为正常的单板,如果收不到某单板发来的心跳报文,则认为该单板故障。
在实现本发明的过程中,发明人发现上述现有技术中至少存在以下缺点:
每个单板都需要给主控板发送心跳报文,主控板给每个单板返回响应,即采用一对一的方式来进行检测,对主控板的处理能力要求较高,主控板的压力较大。当单板的数量增加时,心跳报文也会随之增多,主控板的处理压力也会随之增大,如果此时主控板的CPU不能够做到心跳报文的负载均衡,处理不了单板的心跳报文,则可能发生误判,认为单板故障,从而复位单板,造成单板业务中断。
发明内容
为了提高单板检测的效率,本发明实施例提供了一种检测单板的方法和设备。所述技术方案如下:
一种检测单板的方法,所述方法包括:
主控板沿着环形结构发送检测报文,所述环形结构由所述主控板和待检测的单板顺序排列形成;
收到所述检测报文的单板,沿着所述环形结构转发所述检测报文;
所述主控板判断是否在预设的故障时间内收到所述检测报文,如果收到,则所述单板正常。
一种检测单板的设备,所述设备包括主控板和单板,
所述主控板用于沿着环形结构发送检测报文,所述环形结构由所述主控板和待检测的单板顺序排列形成;还用于判断是否在预设的故障时间内收到所述检测报文,如果收到,则判定所述单板正常。
所述单板用于收到所述检测报文后,沿着所述主控板预设的环形结构转发所述检测报文。
本发明实施例提供的技术方案的有益效果是:
通过主控板发送检测报文并沿着环形结构经单板传输,如果在预设的故障时间内收到检测报文,则认为单板正常,从而可以检测出单板是否发生故障。采用环形结构,可以分散主控板对检测报文的压力,将检测报文分布到各个单板,充分利用单板的CPU处理能力,与现有技术中主控板需要处理每个单板发来的心跳报文并返回响应的方式相比,减轻了主控板的压力,提高了检测单板的效率。
附图说明
图1是本发明实施例1提供的检测单板的方法流程图;
图2是本发明实施例1提供的环形结构图;
图3是本发明实施例2提供的检测单板的方法流程图;
图4是本发明实施例2提供的环形结构内单板发送告警信息示意图;
图5是本发明实施例2提供的主控板双环发送心跳报文示意图;
图6是本发明实施例3提供的检测单板的方法流程图;
图7是本发明实施例3提供的包含备用主控板的环形结构图;
图8是本发明实施例3提供的包含备用主控板的环形结构内单板发送告警信息示意图;
图9是本发明实施例3提供的主用主控板发生故障单板发送告警信息示意图;
图10是本发明实施例4提供的检测单板的设备结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
参见图1,本实施例以主控板和单板组成环形结构后,主控板发送检测报文为例进行说明,本发明实施例提供了一种检测单板的方法,具体包括以下步骤:
步骤101:通信设备启动后,该通信设备内的主控板构建环形结构,并将该环形结构信息下发给环内的所有单板,环形结构由主控板和待检测的单板顺序排列形成,单板可以为一个或多个。
例如,参见图2,按照所有单板的插槽号从小到大的顺序排列,LPU1、LPU2、LPU3、...、LPUn,LPU1与LPUn分别与AMB(Active Main Board,主用主控板)相连,构成环形的结构。单板的顺序也可以为插槽号从大到小的顺序等等。
主控板向所有单板下发结构信息的过程即握手的过程,主控板可以记录结构信息从主控板出发经环形结构传输后又回到主控板所用的时间,即握手时间。在设置故障时间时可以根据握手时间来设置。
步骤102:主控板沿着上述环形结构发送检测报文,检测报文可以为现有技术中的心跳报文,如HELLO报文等协议报文,主控板可以周期性地发出检测报文,进行单板健康检测。
步骤103:环形结构内的单板收到检测报文后,沿着环形结构转发检测报文给相邻的硬件,如给相邻的单板或给相邻的主控板。
环形结构内的每个单板都沿着环形结构转发检测报文,则检测报文会最终回到主控板。例如,参见图2,AMB发送检测报文,经过LPU1、LPU2、...、LPUn的转发后,最后回到AMB。
步骤104:主控板判断是否在预设的故障时间内收到自己发出的检测报文,如果是,则执行步骤105;否则,执行步骤106。
其中,预设的故障时间可以设置为大于或等于上述握手时间,考虑到设备实际运行过程中报文传输会有延时,因此通常设置故障时间大于握手时间,例如握手时间为1秒,则预设故障时间为2秒。另外,预设的故障时间大于或等于预设的告警时间,如预设告警时间为1秒,则故障时间为2秒或3秒。
步骤105:主控板判定环形结构内的所有单板均正常,然后结束。
步骤106:主控板判定环形结构内至少有一个单板发生故障,然后结束。
本实施例中主控板沿着预设的环形结构发送检测报文,单板沿着环形结构转发检测报文;主控板如果在预设的故障时间内收到检测报文,则认为单板正常,从而可以检测出单板是否发生故障。采用环形结构,可以分散主控板对检测报文的压力,将检测报文分布到各个单板,充分利用单板的CPU处理能力,与现有技术中主控板需要处理每个单板发来的检测报文并返回响应的方式相比,减轻了主控板的压力,提高了检测单板的效率。
实施例2
参见图3,本实施例以主控板和单板组成环形结构后,主控板发送检测报文且单板根据判断发出告警信息为例进行说明,本发明实施例提供了一种检测单板的方法,具体包括以下步骤:
步骤201:通信设备启动后,该通信设备内的主控板构建环形结构,并将该环形结构信息下发给环内的所有单板,环形结构由主控板和待检测的单板顺序排列形成,单板可以为一个或多个。
主控板向所有单板下发拓扑结构信息的过程即握手的过程,主控板可以记录拓扑结构信息从主控板出发经环形结构传输后又回到主控板所用的时间,即握手时间。在设置故障时间时可以根据握手时间来设置。
步骤202:主控板沿着上述环形结构发送检测报文,检测报文可以为心跳报文,如HELLO报文等协议报文,主控板可以周期性地发出检测报文,进行单板健康检测。
步骤203:环形结构内的单板判断是否在预设的告警时间内收到检测报文,如果是,则执行步骤204;否则,执行步骤205。
步骤204:该单板沿着环形结构转发检测报文给相邻的硬件,如给相邻的单板或给相邻的主控板,然后执行步骤206。
步骤205:该单板向主控板发送告警信息,然后执行步骤206。
例如,参见图4,AMB给LPU1发送检测报文后,由于LPU1和LPU2都发生故障,则LPU3无法收到检测报文,因此LPU3给AMB发送告警信息,同理,LPU4直到LPUn都收不到检测报文,则这些单板都给AMB发送告警信息。
步骤206:主控板判断是否在预设的故障时间内收到自己发出的检测报文,如果是,则执行步骤207;否则,执行步骤208。
其中,预设的故障时间可以设置为大于或等于上述握手时间,考虑到设备实际运行过程中报文传输会有延时,因此通常设置故障时间大于握手时间。
步骤207:主控板判定环形结构内的所有单板均正常,然后结束。
步骤208:主控板判定环形结构内有至少有一个单板发生故障,然后结束。
主控板判断出有单板发生故障后,还可以进一步采用心型心跳检测模型排查具体是哪个单板发生故障,则步骤208之后还可以包括下面的步骤:
主控板在预设的故障时间内收到告警信息后,分别向环形结构内未发出告警信息的每个单板发送包含单板标识信息的检测报文;收到包含单板标识信息的检测报文的单板,向主控板返回响应报文;主控板判定在预设的单板故障时间内,返回响应报文的单板正常,未返回响应报文的单板故障。其中,单板标识信息通常为单板号,例如,参见图4,AMB收到除LPU1和LPU2之外的所有单板发来的告警信息,则AMB给未发出告警信息的单板LPU1发送包含单板号为1的检测报文,给未发出告警信息的单板LPU2发送包含单板号为2的检测报文,进行心型心跳检测,根据LPU1和LPU2是否返回响应报文来定位故障,如果LPU2返回响应报文给AMB,而LPU1没有返回响应报文给AMB,则AMB判断出LPU1故障,LPU2正常。
进一步地,还可以设置告警次数,当同一单板发出告警信息的次数超过预设的告警次数后,再发起心型心跳检测。例如,参见图4,预设告警次数为3,则LPU3向AMB发出告警信息的次数超过3次时,AMB才发起心型心跳检测,具体定位LPU1和LPU2中哪个单板发生故障。
进一步地,主控板在收到告警信息后,可以隔离未发出告警信息的单板,重新构建环形结构,新环形结构中包括所有发出告警信息的单板和主控板,不包括未发出告警信息的单板,然后主控板根据新的拓扑结构重新进行单板健康检测。例如,参见图4,LPU3至LPUn发出告警信息给AMB后,AMB重新构建环形结构,包括AMB、LPU3、...、LPUn。另外,当设备内部出现单板插拔的情况时,主控板可以获取到设备内部的变化,并重新构建环形结构,将已经拔出的单板排除在环形结构外,生成新的环形结构,并根据新的环形结构重新进行单板健康检测。
为了提高单板的检测效率,进一步地,还可以采用双环检测报文机制,即步骤102中,主控板在环形结构上发送检测报文时,分别按照顺时针方向和逆时针方向发送检测报文,即顺时针方向发送一个检测报文,逆时针方向发送一个检测报文,两个检测报文在环形结构上按相反的方向传输。例如,参见图5,AMB在环形结构上沿顺时针方向发送检测报文给LPUn,沿逆时针方向发送检测报文给LPU1,每个单板在顺时针方向上收到检测报文后,按照顺时针方向转发该检测报文,在逆时针方向上收到检测报文后,在逆时针方向上转发该检测报文,最后AMB会收到两个检测报文。主控板可以判断在预设的故障时间内是否收到自己发出的任一个检测报文,如果收到,则判定所有单板正常,如果两个检测报文都没有收到,则判定有单板发生故障。另外,如果在故障时间内主控板收到一个单板由于在顺时针方向上未收到检测报文而发来的告警信息和另一个单板由于在逆时针方向上未收到检测报文而发来的告警信息,且这两个单板之间仅有一个第三单板,则可以判定该第三单板故障。例如,参见图5,在故障时间2秒内,AMB收到LPU1因顺时针方向未收到检测报文发来的告警信息和LPU3因逆时针方向未收到检测报文发来的告警信息,由环形结构可知LPU1与LPU3之间仅有一个单板LPU2,则AMB判定LPU2发生故障。
本实施例中主控板沿着预设的环形结构发送检测报文,单板沿着环形结构转发检测报文;主控板如果在预设的故障时间内收到检测报文,则认为单板正常,从而可以检测出单板是否发生故障。采用环形结构,可以分散主控板对检测报文的压力,将检测报文分布到各个单板,充分利用单板的CPU处理能力,与现有技术中主控板需要处理每个单板发来的心跳报文并返回响应的方式相比,减轻了主控板的压力,提高了检测单板的效率。主控板在收到单板告警信息后发起心型心跳检测,可以准确定位出故障单板,减少了误判。采用双环检测报文检测机制,极大地提高了单板检测的效率,降低了误判。
实施例3
参见图6,本实施例以主用主控板、单板和备用主控板组成环形结构后,主控板发送检测报文为例进行说明,本发明实施例提供了一种检测单板的方法,具体包括以下步骤:
步骤301:通信设备启动后,该通信设备内的主用主控板构建环形结构,并将该环形结构信息下发给环内的所有单板,环形结构包括主用主控板、单板和SMB(Standby Main Board,备用主控板),备用主控板与主用主控板相连,单板可以为一个或多个。
其中,环形结构内的所有单板可以按照预设的顺序排列。例如,参见图7,AMB与单板LPU1相连,单板按照插槽号从小到大的顺序排列,LPU1、LPU2、LPU3、...、LPUn,LPUn与SMB相连,SMB与AMB相连,构成环形的结构。
主用主控板向所有单板下发结构信息的过程即握手的过程,主用主控板可以记录结构信息从主用主控板出发经环形结构传输后又回到主用主控板所用的时间,即握手时间。在设置故障时间时可以根据握手时间来设置。
步骤302:主用主控板沿着上述环形结构发送检测报文给单板,检测报文可以为心跳报文,如HELLO报文等协议报文,主用主控板可以周期性地发出检测报文,进行单板健康检测。
步骤303:环形结构内的单板判断是否在预设的告警时间内收到检测报文,如果是,则执行步骤304;否则,执行步骤305。
步骤304:该单板沿着环形结构转发检测报文给相邻的硬件,如给相邻的单板或给相邻的备用主控板,然后执行步骤306。
步骤305:该单板分别向主用主控板和备用主控板发送告警信息,然后执行步骤306。
例如,参见图8,AMB给LPU1发送检测报文后,由于LPU1和LPU2都发生故障,则LPU3无法收到检测报文,因此LPU3分别给AMB和SMB发送告警信息,同理,LPU4直到LPUn都收不到检测报文,则这些单板均分别给AMB和SMB发送告警信息。
步骤306:备用主控板判断是否收到单板发来的告警信息,如果是,则执行步骤307;否则,执行步骤309。
步骤307:备用主控板判断发出告警信息的单板数目是否大于或等于未发出告警信息的单板数目,如果是,则执行步骤308;否则,执行步骤310。
步骤308:备用主控板认为单板发出告警信息是因为主用主控板发生故障,则发起主备倒换,即将自己变成主用主控板,然后结束。
例如,参见图9,AMB发生故障,无法发出检测报文,所有单板及SMB均收不到检测报文,则每个单板都分别给AMB和SMB发送告警信息,SMB统计收到的告警信息的数目,如果SMB收到的告警信息的数目(即发出告警信息的单板数目)大于或等于未发出告警信息的单板数目,则备用主控板发起主备倒换,备用主控板变为主用主控板。如n=10,共有10个单板,某一时刻SMB收到6个单板发来的告警信息,则有4个单板还未发出告警信息,此时SMB可以判定AMB发生故障,则发起主备倒换。
步骤309:备用主控板收到单板发来的检测报文,则转发该检测报文给主用主控板,然后执行步骤310。
步骤310:主用主控板判断是否在预设的故障时间内收到自己发出的检测报文,如果是,则执行步骤311;否则,执行步骤312。其中,预设的故障时间可以设置为大于或等于上述握手时间。另外,预设的故障时间大于或等于预设的告警时间。
步骤311:主用主控板判定环形结构内的所有单板均正常,然后结束。
步骤312:主用主控板判定环形结构内至少有一个单板发生故障,然后结束。
在本实施例中主控板判断出有单板发生故障后,还可以进一步采用心型心跳检测模型排查具体是哪个单板发生故障,进一步地,还可以设置告警次数,当同一单板发出告警信息的次数超过预设的告警次数后,再发起心型心跳检测。具体过程同实施例2中所述,此处不再赘述。
进一步地,主控板在收到告警信息后,可以隔离未发出告警信息的单板,重新构建环形结构,然后根据新的拓扑结构重新进行单板健康检测。为了提高单板的检测效率,进一步地,还可以采用双环检测报文机制,即主控板在环形结构上发送检测报文时,分别按照顺时针和逆时针方向发送检测报文。具体过程同实施例1中所述,此处不再赘述。
本实施例中主用主控板沿着预设的环形结构发送检测报文,经单板和备用主控板传输;主用主控板如果在预设的故障时间内收到检测报文,则认为单板正常,从而可以检测出单板是否发生故障。采用环形结构,可以分散主用主控板对检测报文的压力,将检测报文分布到各个单板,充分利用单板的CPU处理能力,与现有技术中主控板需要处理每个单板发来的心跳报文并返回响应的方式相比,减轻了主控板的压力,提高了检测单板的效率。主用主控板在收到单板告警信息后发起心型心跳检测,可以准确定位出故障单板,减少了误判。采用双环检测报文检测机制,极大地提高了单板检测的效率,降低了误判。采用备用主控板比较发出告警信息的单板数目与未发出告警信息的单板数目,来判断是否主用主控板故障,从而能即使进行主备倒换,可以防止主用主控板异常时出现误判,保证设备的正常运行。
实施例4
参见图10,本发明实施例提供了一种检测单板的设备,包括主控板和单板;
主控板用于沿着环形结构发送检测报文,环形结构由主控板和待检测的单板顺序排列形成;还用于判断是否在预设的故障时间内收到检测报文,如果收到,则判定待检测的单板正常。
单板用于收到检测报文后,沿着主控板预设的环形结构转发检测报文。
进一步地,主控板还包括:
故障判定模块,用于当在故障时间内未收到检测报文时,判定待检测的单板中至少有一个单板发生故障。
进一步地,单板还包括:
告警模块,用于当在预设的告警时间内未收到检测报文时,向主控板发送告警信息;故障时间大于或等于告警时间。
进一步地,主控板还包括:
定位模块,用于当主控板在故障时间内收到告警信息时,分别向环形结构内未发出告警信息的每个单板发送包含单板标识信息的检测报文;还用于判定在预设的单板故障时间内,返回响应报文的单板正常,未返回响应报文的单板故障;相应地,单板还包括:
响应模块,用于在收到定位模块发来的包含单板标识信息的检测报文后,向主控板返回响应报文。其中,主控板可以同时包括故障判定模块和定位模块,另外,还可以当单板包括告警模块时,主控板包括定位模块。
进一步地,主控板还可以采用双环发送检测报文的机制,主控板具体包括:
发送模块,用于在环形结构上分别按照顺时针方向和逆时针方向发送检测报文,环形结构由主控板和待检测的单板顺序排列形成;
检测模块,用于判断是否在预设的故障时间内收到检测报文,如果收到,则判定单板正常;相应地,如果单板为多个单板,则主控板还包括:
定位模块,用于判断在故障时间内是否收到多个单板中的一个单板由于在顺时针方向未收到检测报文而发来的告警信息和另一个单板由于在逆时针方向未收到检测报文而发来的告警信息,且该一个单板和另一个单板之间仅有一个第三单板,如果是,则第三单板故障。
进一步地,上述设备还包括与主控板相连的备用主控板,且检测报文按照主控板、单板和备用主控板的顺序传输;
相应地,当单板在预设的告警时间内未收到检测报文向主控板发送告警信息时,单板还包括:
告警模块,用于当在预设的告警时间内未收到主控板发来的检测报文时,向备用主控板发送告警信息;
备用主控板还包括:
倒换模块,用于根据收到的告警信息的数目,判断出发出告警信息的单板数目大于或等于未发出告警信息的单板数目时,发起主备倒换。
本实施例中主控板沿着预设的环形结构发送检测报文,单板沿着环形结构转发检测报文;主控板如果在预设的故障时间内收到检测报文,则认为单板正常,从而可以检测出单板是否发生故障。采用环形结构,可以分散主用主控板对检测报文的压力,将检测报文分布到各个单板,充分利用单板的CPU处理能力,与现有技术中主控板需要处理每个单板发来的心跳报文并返回响应的方式相比,减轻了主控板的压力,提高了检测单板的效率。主控板在收到单板告警信息后发起心型心跳检测,可以准确定位出故障单板,减少了误判。采用双环检测报文检测机制,极大地提高了单板检测的效率,降低了误判。采用备用主控板比较发出告警信息的单板数目与未发出告警信息的单板数目,来判断是否主用主控板故障,从而能即使进行主备倒换,可以防止主用主控板异常时出现误判,保证设备的正常运行。
本发明实施例中主控板向未发出告警信息的所有单板发起的心型心跳检测与现有技术中的心型心跳检测是有区别的,本发明实施例中是主控板向单板发送检测报文(包括心跳报文),而现有技术中是单板向主控板发送心跳报文。
本发明实施例可以通过软件实现,相应的软件可以存储到可读取的存储介质中,例如路由器的硬盘和缓存中。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种检测单板的方法,其特征在于,所述方法包括:
主控板沿着环形结构发送检测报文,所述环形结构由所述主控板和待检测的单板顺序排列形成;
收到所述检测报文的单板,沿着所述环形结构转发所述检测报文;
所述主控板判断是否在预设的故障时间内收到所述检测报文,如果收到,则所述单板正常。
2.根据权利要求1所述的检测单板的方法,其特征在于,所述方法还包括:
如果所述主控板在所述故障时间内未收到所述检测报文,则所述单板中至少有一个单板发生故障。
3.根据权利要求2所述的检测单板的方法,其特征在于,所述主控板发出所述检测报文后,还包括:
当所述单板在预设的告警时间内未收到所述检测报文时,所述单板向所述主控板发送告警信息;所述故障时间大于或等于所述告警时间。
4.根据权利要求1至3中任意一项所述的检测单板的方法,其特征在于,所述方法还包括:
如果所述主控板在所述故障时间内收到告警信息,则分别向所述环形结构内未发出告警信息的每个单板发送包含单板标识信息的检测报文;
收到所述包含单板标识信息的检测报文的单板,向所述主控板返回响应报文;
所述主控板判定在预设的单板故障时间内,返回响应报文的单板正常,未返回响应报文的单板故障。
5.根据权利要求1所述的检测单板的方法,其特征在于,所述主控板沿着环形结构发送检测报文,具体为:
主控板在环形结构上分别按照顺时针方向和逆时针方向发送检测报文。
6.根据权利要求5所述的检测单板的方法,其特征在于,当所述单板为多个时,所述方法还包括:
所述主控板判断在所述故障时间内是否收到所述多个单板中的一个单板由于在所述顺时针方向未收到所述检测报文而发来的告警信息和另一个单板由于在所述逆时针方向未收到所述检测报文而发来的告警信息,且所述一个单板和另一个单板之间仅有一个第三单板,如果是,则所述第三单板故障。
7.根据权利要求3所述的检测单板的方法,其特征在于,所述环形结构还包括与所述主控板相连的备用主控板,所述检测报文按照所述主控板、单板和备用主控板的顺序传输;
相应地,所述方法还包括:
当所述单板在所述的告警时间内未收到所述检测报文时,所述单板向备用主控板发送告警信息,当发出告警信息的单板数目大于或等于未发出告警信息的单板数目时,所述备用主控板发起主备倒换。
8.一种检测单板的设备,其特征在于,所述设备包括主控板和单板,
所述主控板用于沿着环形结构发送检测报文,所述环形结构由所述主控板和待检测的单板顺序排列形成;还用于判断是否在预设的故障时间内收到所述检测报文,如果收到,则判定所述单板正常。
所述单板用于收到所述检测报文后,沿着所述主控板预设的环形结构转发所述检测报文。
9.根据权利要求8所述的检测单板的设备,其特征在于,所述主控板还包括:
故障判定模块,用于当在所述故障时间内未收到所述检测报文时,判定所述单板中至少有一个单板发生故障。
10.根据权利要求9所述的检测单板的设备,其特征在于,所述单板还包括:
告警模块,用于当在预设的告警时间内未收到所述主控板发来的检测报文时,向所述主控板发送告警信息;所述故障时间大于或等于所述告警时间。
11.根据权利要求8至10中任意一项所述的检测单板的设备,其特征在于,所述主控板还包括:
定位模块,用于当所述主控板在所述故障时间内收到告警信息时,分别向所述环形结构内未发出告警信息的每个单板发送包含单板标识信息的检测报文;还用于判定在预设的单板故障时间内,返回响应报文的单板正常,未返回响应报文的单板故障;
所述单板还包括:
响应模块,用于在收到所述定位模块发来的包含单板标识信息的检测报文后,向所述主控板返回响应报文。
12.根据权利要求8所述的检测单板的设备,其特征在于,所述主控板具体包括:
发送模块,用于在环形结构上分别按照顺时针方向和逆时针方向发送检测报文,所述环形结构由所述主控板和待检测的单板顺序排列形成;
检测模块,用于判断是否在预设的故障时间内收到所述检测报文,如果收到,则判定所述单板正常。
13.根据权利要求12所述的检测单板的设备,其特征在于,当所述单板为多个时,所述主控板还包括:
定位模块,用于判断在所述故障时间内是否收到所述多个单板中的一个单板由于在所述顺时针方向未收到所述检测报文而发来的告警信息和另一个单板由于在所述逆时针方向未收到所述检测报文而发来的告警信息,且所述一个单板和另一个单板之间仅有一个第三单板,如果是,则所述第三单板故障。
14.根据权利要求10所述的检测单板的设备,其特征在于,所述设备还包括与所述主控板相连的备用主控板,且所述检测报文按照所述主控板、单板和备用主控板的顺序传输;
相应地,所述单板还包括:
告警模块,用于当在所述告警时间内未收到所述主控板发来的检测报文时,向所述备用主控板发送告警信息;
所述备用主控板还包括:
倒换模块,用于根据收到的告警信息的数目,判断出发出告警信息的单板数目大于或等于未发出告警信息的单板数目时,发起主备倒换。
CNA2007101694378A 2007-11-10 2007-11-10 检测单板的方法和设备 Pending CN101150458A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007101694378A CN101150458A (zh) 2007-11-10 2007-11-10 检测单板的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007101694378A CN101150458A (zh) 2007-11-10 2007-11-10 检测单板的方法和设备

Publications (1)

Publication Number Publication Date
CN101150458A true CN101150458A (zh) 2008-03-26

Family

ID=39250810

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101694378A Pending CN101150458A (zh) 2007-11-10 2007-11-10 检测单板的方法和设备

Country Status (1)

Country Link
CN (1) CN101150458A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101800672A (zh) * 2010-02-10 2010-08-11 杭州华三通信技术有限公司 设备检测方法和设备
WO2011015068A1 (zh) * 2009-08-03 2011-02-10 中兴通讯股份有限公司 一种故障检测的方法和系统
CN102026042A (zh) * 2009-09-18 2011-04-20 中兴通讯股份有限公司 一种高级电信计算架构控制面的保活、自愈方法和装置
CN102694692A (zh) * 2012-06-18 2012-09-26 杭州华三通信技术有限公司 一种分布式设备的故障检测方法和装置
CN105306256A (zh) * 2015-09-23 2016-02-03 中国电子科技集团公司第五十四研究所 一种基于VxWorks设备的双机热备实现方法
CN105353272A (zh) * 2015-11-10 2016-02-24 四川东方电气自动控制工程有限公司 一种风力发电场单环网多点故障快速定位方法
CN106789306A (zh) * 2016-12-30 2017-05-31 深圳市风云实业有限公司 通信设备软件故障检测收集恢复方法和系统
CN107682188A (zh) * 2017-09-29 2018-02-09 新华三技术有限公司 一种故障感知方法和装置
CN108845971A (zh) * 2018-06-14 2018-11-20 国蓉科技有限公司 多处理器板重构系统及方法
CN109756399A (zh) * 2019-02-18 2019-05-14 新华三技术有限公司 一种bfd会话维护方法及分布式设备
CN110794436A (zh) * 2019-10-28 2020-02-14 捷信(浙江)通信技术有限公司 船舶定位管理系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011015068A1 (zh) * 2009-08-03 2011-02-10 中兴通讯股份有限公司 一种故障检测的方法和系统
CN102026042A (zh) * 2009-09-18 2011-04-20 中兴通讯股份有限公司 一种高级电信计算架构控制面的保活、自愈方法和装置
CN101800672B (zh) * 2010-02-10 2013-03-20 杭州华三通信技术有限公司 设备检测方法和设备
CN101800672A (zh) * 2010-02-10 2010-08-11 杭州华三通信技术有限公司 设备检测方法和设备
CN102694692A (zh) * 2012-06-18 2012-09-26 杭州华三通信技术有限公司 一种分布式设备的故障检测方法和装置
CN105306256B (zh) * 2015-09-23 2018-09-14 中国电子科技集团公司第五十四研究所 一种基于VxWorks设备的双机热备实现方法
CN105306256A (zh) * 2015-09-23 2016-02-03 中国电子科技集团公司第五十四研究所 一种基于VxWorks设备的双机热备实现方法
CN105353272A (zh) * 2015-11-10 2016-02-24 四川东方电气自动控制工程有限公司 一种风力发电场单环网多点故障快速定位方法
CN105353272B (zh) * 2015-11-10 2018-08-10 四川东方电气自动控制工程有限公司 一种风力发电场单环网多点故障快速定位方法
CN106789306A (zh) * 2016-12-30 2017-05-31 深圳市风云实业有限公司 通信设备软件故障检测收集恢复方法和系统
CN107682188A (zh) * 2017-09-29 2018-02-09 新华三技术有限公司 一种故障感知方法和装置
CN108845971A (zh) * 2018-06-14 2018-11-20 国蓉科技有限公司 多处理器板重构系统及方法
CN109756399A (zh) * 2019-02-18 2019-05-14 新华三技术有限公司 一种bfd会话维护方法及分布式设备
CN110794436A (zh) * 2019-10-28 2020-02-14 捷信(浙江)通信技术有限公司 船舶定位管理系统

Similar Documents

Publication Publication Date Title
CN101150458A (zh) 检测单板的方法和设备
CN101094157B (zh) 利用链路聚合实现网络互连的方法
US6658595B1 (en) Method and system for asymmetrically maintaining system operability
JP3649580B2 (ja) 分散コンピュータ・システムのエラーを報告するシステム
CN101291243B (zh) 高可用集群系统的裂脑预防方法
CN102315975B (zh) 一种基于irf系统的故障处理方法及其设备
US20090249115A1 (en) Method and system for dynamic link failover management
US20050058063A1 (en) Method and system supporting real-time fail-over of network switches
US7496797B2 (en) Advanced switching lost packet and event detection and handling
CN101355466B (zh) 连续性检查消息报文的传输方法和装置
CN103858106A (zh) 远程电缆接入点复位
CN101951345B (zh) 一种报文的发送方法和设备
CN101707536A (zh) 故障检测方法、线卡及主控卡
JPH0756644B2 (ja) 状態変化通知装置及び方法
CN101984573A (zh) 分布式实现lacp标准状态机的方法及系统
CN103442035A (zh) 一种空管自动化系统的双网热备冗余实现方法
JP4616020B2 (ja) ネットワーク監視プログラム及びネットワークシステム
CN106502944A (zh) 计算机、pcie设备以及pcie设备的心跳检测方法
CN101599906B (zh) 端口状态设置的方法及装置
CN109327383A (zh) 一种故障处理方法及设备
JP5665723B2 (ja) パケット中継装置およびシステム、障害検出方法
CN110391928A (zh) 一种使用电子开关执行主备切换的通信方法和设备
CN101848165A (zh) 控制通信链路中断后恢复的方法和接口板
JP3371953B2 (ja) Usbネットワーク構成システム
JP2014532236A (ja) 接続方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20080326