CN102257759A - 主备倒换方法、系统控制单元和通信系统 - Google Patents

主备倒换方法、系统控制单元和通信系统 Download PDF

Info

Publication number
CN102257759A
CN102257759A CN2011800003235A CN201180000323A CN102257759A CN 102257759 A CN102257759 A CN 102257759A CN 2011800003235 A CN2011800003235 A CN 2011800003235A CN 201180000323 A CN201180000323 A CN 201180000323A CN 102257759 A CN102257759 A CN 102257759A
Authority
CN
China
Prior art keywords
transmission link
system control
control unit
link
scu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800003235A
Other languages
English (en)
Other versions
CN102257759B (zh
Inventor
赵虎
刘永合
孙渊
王伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN102257759A publication Critical patent/CN102257759A/zh
Application granted granted Critical
Publication of CN102257759B publication Critical patent/CN102257759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/74Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for increasing reliability, e.g. using redundant or spare channels or apparatus

Abstract

本发明公开了一种主备倒换方法、系统控制单元和通信系统。该方法包括:第一系统控制单元按照设定的检测周期向对端网元发送检测报文;当第一系统控制单元接收到主备倒换指令时,停止发送检测报文,使得传输链路切换因在设定的超时时间内第一系统控制单元停止发送检测报文而触发,并且第一系统控制单元同时启动倒换计时器;当监测到倒换计时器的值达到倒换计时值时进行复位以完成主备倒换,其中,倒换计时值大于超时时间。本发明的系统控制单元在进行主备倒换的复位操作之前,首先主动停止发送检测报文,延迟一段时间后,直至传输链路切换后再停止工作。因此能够在进行主备倒换的情况下减少业务数据报文的丢包,保证业务的连续性和可靠性。

Description

主备倒换方法、系统控制单元和通信系统
技术领域
本发明实施例涉及通信技术,尤其涉及一种主备倒换方法、系统控制单元和通信系统。
背景技术
微型电信计算架构(Micro  Telecommunications  ComputingArchitecture,简称mTCA)是通信领域硬件实现的常用架构。一般在背板上设置系统控制单元(System Control Unit,简称SCU),由SCU连接各种业务板,例如,通用处理单元(General Processing Unit,简称GPU)、电路接入单元(Circuit Interface Unit,简称CIU)、操作维护单元(Operation&Maintenance Unit,简称OMU)和数据处理单元(Data Process Unit,简称DPU)等业务板。SCU和各种业务板构成实现某种业务处理功能的系统。由SCU实现各业务板之间数据的转发,且控制整个系统的基本运转,如控制背板上的风扇运行。通常,SCU及其所连接的业务板称为一个mTCA框,SCU与业务板之间的传输链路为框内传输链路。随着业务数量的增加,同一业务可能需要多框协作来完成,则出现了级联SCU的情况。两个框的SCU可以各自直接相连,称为自级联。由于SCU的网口数量有限,所以当需要两个以上框的SCU级联时,可以将各框的SCU分别连接至交换机(Lanswtich,简称LSW)实现级联。不同框的SCU之间的传输链路为框间传输链路。
为了保证系统工作的可靠性,通常在每个框内会设置两个SCU,两个SCU分别与业务板相连,且分别连接框间传输链路。在为业务板提供数据报文交互方面,两个SCU可以独立的运行,分别为业务板提供数据报文转发;在执行系统的控制方面,一个SCU为主用,另一个SCU为备用,由主用SCU进行控制,备用SCU作为备份硬件,两个SCU的主备角色可以互相转换,即可进行主备倒换。
在上述系统架构中会存在传输链路切换的需求,例如,当由于策略而触发主备倒换时,主用SCU可能需要先执行复位操作,在复位期间将不能为业务板提供报文传输,此时也需要切换至由框内的备用SCU提供传输链路。现有技术中,由于某一个SCU故障也可能导致该SCU不能为业务板提供报文传输,而需要切换至由框内的另一个SCU提供传输链路。
现有框内和框间的以太网(Ethernet)数据传输链路通常采用端口汇聚(TRUNK)技术,将两个SCU所提供的物理传输链路绑定为一个逻辑链路,即一个TRUNK组。两个物理传输链路作为TRUNK组的成员链路。在TRUNK技术中的故障检测通常采用Ethernet操作管理维护(Operations,Administration and Maintenance,简称OAM)或链路汇聚控制协议(LinkAggregation Control Protocol,简称LACP)等协议来检测。检测原理类似,以OAM协议为例,各SCU和业务板均以设定检测周期间隔地在各传输链路中发送检测报文,当在设定时间内未收到对端返回的检测报文时,即视为该传输链路故障。对于采用了端口汇聚技术的传输链路,则可以是关闭故障的成员链路,而将传输的业务数据报文切换至TRUNK组中的其他成员链路进行传输。
然而,在实现本发明的研究过程中,发明人发现现有技术存在如下缺陷:业务板基于OAM/LACP等协议,需要在设定时间接收不到检测报文才能发现发生了链路切换,业务板在此之前通过该传输链路发送的业务数据报文将无法被处理,造成了丢包的缺陷,使业务的连续性和可靠性下降。
发明内容
本发明实施例提供一种主备倒换方法、系统控制单元和通信系统,用于解决现有技术主备倒换过程中存在着的因丢包而导致业务连续性,可靠性下降的缺陷,以实现系统内的传输链路在主备倒换情况下实现零丢包链路切换,以改善业务的连续性和可靠性。
本发明实施例提供了一种主备倒换方法,包括:
第一系统控制单元在所连的传输链路中按照设定的检测周期向对端网元发送用于表示传输链路状态的检测报文;
当所述第一系统控制单元接收到主备倒换指令时,停止在自身所连的传输链路中发送检测报文,使得传输链路切换因在设定的超时时间内第一系统控制单元停止发送检测报文而触发,以切换至对端网元与框内第二系统控制单元之间的传输链路进行数据传输,并且所述第一系统控制单元同时启动倒换计时器;
当所述第一系统控制单元监测到所述倒换计时器的值达到倒换计时值时,所述第一系统控制单元进行复位以完成主备倒换,其中,所述倒换计时值大于所述超时时间。
本发明实施例提供了一种系统控制单元,包括:
检测报文发送模块,用于在所在系统控制单元所连的传输链路中按照设定的检测周期向对端网元发送用于表示传输链路状态的检测报文;
链路主备倒换模块,用于当接收到主备倒换指令时,停止在所述系统控制单元所连的传输链路中发送检测报文,使得传输链路切换因在设定的超时时间内所述系统控制单元停止发送检测报文而触发,以切换至对端网元与框内另一系统控制单元之间的传输链路进行数据传输,并且同时为所在系统控制单元启动倒换计时器;
复位模块,用于当监测到所述倒换计时器的值达到倒换计时值时,进行所在系统控制单元的复位以完成主备倒换,其中,所述倒换计时值大于所述超时时间。
本发明实施例还提供了一种通信系统,包括一个或多个框,每个框内包括两个系统控制单元和一个以上业务板,其中:采用本发明实施例所提供的系统控制单元作为所述系统控制单元。
本发明实施例提供的主备倒换方法、系统控制单元和通信系统,SCU在进行主备倒换的复位操作之前,首先主动停止发送检测报文,但并不立即复位以停止数据报文传输,而是延时一定的时长再停止数据报文传输。SCU停止发送检测报文相当于通知对端网元该传输链路不可用,如果在设定的超时时间内均没有发送检测报文,则该传输链路将被判断出链路路障,从而触发传输链路切换。由于SCU倒换计时值的时长大于设定的超时时间,因此,在SCU停止发送检测报文到触发传输链路切换的这段时间内,SCU并未进行复位操作,仍然能够接收并处理对端网元发送的数据,从而保证业务的连续性以及可靠性。
附图说明
图1为本发明实施例一提供的主备倒换方法的流程图;
图2为本发明实施例二提供的主备倒换方法的流程图;
图3为本发明实施例二中单框系统的硬件架构示意图;
图4为本发明实施例三提供的主备倒换方法的流程图;
图5为本发明实施例三中自级联多框系统的架构示意图;
图6为本发明实施例四提供的主备倒换方法的流程图;
图7为本发明实施例四中LSW级联多框系统的架构示意图;
图8为本发明实施例六提供的系统控制单元的结构示意图;
图9为本发明实施例七提供的通信系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明实施例一提供的主备倒换方法的流程图,本实施例具体适用于由SCU和业务板所构成的单框或多框通信系统中所执行的主备倒换情况,具体涉及各SCU所执行的操作。所谓主备倒换,其属于链路切换的情况之一,实际应用中由于一些关键模块故障或者策略性需要,会主动控制框内SCU进行主备倒换,这不包含直接插拔主用SCU的情况。主备倒换时会首先停止主用SCU工作进行复位。本实施例的主备倒换方法具体包括如下步骤:
步骤110、第一SCU在所连的传输链路中按照设定的检测周期向对端网元发送用于表示链路状态的检测报文;
上述步骤110中的执行主体第一SCU可以是框内的需要执行主备倒换的主用SCU,备用SCU记为第二SCU,也类似地执行发送检测报文的操作。
步骤120、当第一SCU接收到主备倒换指令时,停止在自身所连的传输链路中发送检测报文,使得传输链路切换因在设定的超时时间内第一SCU停止发送检测报文而触发,以切换至对端网元与框内第二SCU之间的传输链路进行数据传输,并且该第一SCU同时启动倒换计时器;
上述主备倒换指令可以由操作人员输入,也可以由其他设备传输而来,指示该第一SCU需要进行主备倒换,即主用SCU需要首先停止工作进行复位。此时第一SCU主动停止发送检测报文,但暂时不停止数据传输工作,虽然SCU具备收发数据报文的功能,但由于已准备进入主备倒换,所以此时SCU实际上不进行数据报文的发送,仅接收对端网元发送的数据报文。
步骤130、当第一SCU监测到倒换计时器的值达到倒换计时值时,第一SCU进行复位以完成主备倒换,其中,倒换计时值大于上述超时时间。
本实施例的技术方案,主用SCU在进行主备倒换的复位操作之前,首先主动停止发送检测报文,但并不立即停止数据报文传输,而是延时一定的时长再停止数据报文传输,此延时的时长由倒换计时器来控制。SCU在倒换计时值内停止发送检测报文,即至少在超时时间内未正常发送检测报文,相当于通知对端网元该传输链路不可用,使得对端网元不能按照设定的超时时间接收到检测报文,从而对端网元能够基于已有的链路故障检测协议,例如OAM或LACP协议视为检测到链路故障,从而自行触发链路切换。由于倒换计时值的时长大于超时时长,所以在延迟的这段时间内,主用SCU仍然能为对端网元提供数据传输服务,直至对端网元检测到链路不可用,自行切换链路之后再停止工作。因此,本实施例的技术方案能够在进行主备倒换的情况下减少丢包,或实现业务数据报文的零丢包,保证业务的连续性和可靠性。
上述技术方案以主用SCU将要进行主备倒换为例进行说明,实际应用中,若备用SCU有主动停止传输工作的需求,也可以执行上述操作,先主动停止发送检测报文以告知对端,延迟一段时间后再停止工作。
上述实施例中,传输链路切换因在超时时间内第一SCU未发送检测报文而触发,以切换至对端网元与框内第二SCU之间的传输链路进行数据传输可以具体以如下方式实现:
当对端网元在超时时间内未收到第一SCU发送的检测报文时,判断该传输链路故障;
对端网元基于已有的链路故障检测协议切换至与框内第二SCU之间的传输链路进行数据传输。
上述技术方案为对端网元触发传输链路切换的情况,对端网元可以为业务板或其他框的SCU,下面通过实施例进行详细说明。
实施例二
图2为本发明实施例二提供的主备倒换方法的流程图,本实施例可以以上述实施例为基础,且具体为单框系统中执行主备倒换的情况。图3为本发明实施例二中单框系统的硬件架构示意图,如图3所示,该系统为单个mTCA框的架构,框内包括两个SCU,分别为主用SCU和备用SCU,按照SCU在背板上的插接位置,一般记为SCU7和SCU8。两个SCU分别与各业务板相连,图3中举例示出的业务板为GPU、CIU、OMU和DPU。业务板分别与两个SCU通过框内传输链路进行报文的传输,两个SCU之间通过高速链路连接,优选可采用10GE端口(HiGig,简称HIG)链路连接,实现高速传输。本实施例的主备倒换方法包括上述实施例中SCU所执行的各步骤,还包括对端网元所执行的如下步骤:
步骤210、对端网元为自身与SCU相连的传输链路启动第一切换定时器,本实施例中对端网元为通过框内传输链路与SCU相连的任意一个业务板;
步骤220、当业务板在框内传输链路中接收到检测报文时,根据检测报文更新传输链路的状态信息,并重启对应的第一切换定时器,即可以将第一切换定时器的计时值清零,重新开始计时;
步骤230、当业务板监测到第一切换定时器的值达到超时时间时,将对应传输链路的状态信息更新为不可用,并根据传输链路的状态信息将数据报文切换至其他传输链路进行传输,其中,超时时间大于检测周期且小于倒换计时值。
上述步骤230中,当业务板监测到达到超时时间时,也即定时器超时,意味着在超时时间的时间内都未收到检测报文,可视为与SCU相连的框内传输链路故障,由此更新传输链路的状态信息,并根据传输链路的状态信息触发将数据报文切换至其他工作正常的传输链路进行传输。在业务板切换至新传输链路进行数据报文传输时,相应可以将视为故障的原传输链路的对应以太端口关闭,但优选是将该以太端口设置为接收侧可用,发送侧不可用,从而接收仍然在途的数据报文,避免丢包。
业务板未按时收到检测报文的原因可能是由于SCU确实发生了故障而停止工作,本发明实施例所适用的情况是由于SCU需要进行主备倒换而主动停止发送检测报文。若是发生了主备倒换,则各业务板与该SCU之间的框内传输链路都接收不到检测报文,从而各业务板可以将数据报文的传输切换至框内另一个SCU的传输链路进行传输。现有框内和框间的以太网传输链路通常采用TRUNK技术,将多个物理链路绑定为一个逻辑的链路,形成一个TRUNK组,对于主用SCU和备用SCU而言,即将一个业务板与主用SCU的物理链路和备用SCU的物理链路绑定为一个逻辑链路,两条物理链路均作为该TRUNK组的成员链路,这样不但提升了传输带宽,而且数据还可以同时经由被绑定的多个物理链路传输,当网络出现故障或其他原因断开其中一条或多条物理链路时,剩下的物理链路还可以工作。基于OAM协议的检测结果与TRUNK技术联动,发现成员链路故障时,可以将数据传输切换至TRUNK组内的另一成员链路,即切换至备用SCU的传输链路。
在本实施例的基础上,SCU还可以相应地从所连的各传输链路中接收对端网元,即业务板发送的检测报文,根据是否接收到检测报文,以及接收到检测报文的内容来更新传输链路的状态信息;SCU还将所连的传输链路的状态信息同步给框内的另一SCU。两个SCU均执行同步操作,以便两SCU之间能够获知各自传输链路的状态。SCU从框内传输链路向业务板发送的检测报文,以及相应接收的业务板发送的检测报文可以基于已有协议实现,例如基于遵循IEEE802.3ah标准/IEEE802.1ag标准OAM协议或基于LACP协议,检测聚合组内所有点到点的链路状态,则SCU通过框内传输链路与业务板之间交互的检测报文可以为OAM报文或LACP报文。
在实际应用中,主用SCU和备用SCU正常启动开始工作后,可以建立点到点的实时链路检测,按照设定的检测周期发送检测报文,也同时接收业务板返回的检测报文;主用SCU和备用SCU均根据检测报文获知传输链路的状态,并通过HIG链路同步链路状态信息。当主用SCU接收到主备倒换指令需要复位时,则主用SCU首先停止发送检测报文,使得业务板能够在一定时间后将与主用SCU连接的传输链路视为故障而切换至备用SCU的传输链路。主用SCU在停止发送检测报文后延迟一段时间再停止工作,进行复位。
可以根据实际需要设置倒换计时值、检测周期和超时时间之间的关系,满足倒换计时值大于超时时间即可。优选是可以设置检测周期为200毫秒,倒换计时值为2秒,超时时间为600毫秒,能够留有一定延时余量,保证数据报文的传输。上述检测周期和超时时间的时长的设置可以通过改变已有协议中的时长设置来实现。
实施例三
图4为本发明实施例三提供的主备倒换方法的流程图,本实施例可以上述实施例为基础,具体适用于自级联的多框系统,图5为本发明实施例三中自级联多框系统的架构示意图,各框内两个SCU与业务板的连接关系可参照图3所示,不同框的SCU之间的相连如图5所示,通过框间传输链路相连,框间传输链路与框内传输链路的链路状态检测方式一致。本实施例的主备倒换方法包括上述实施例中SCU所执行的各步骤,还包括对端网元所执行的如下步骤:
步骤410、对端网元为自身与SCU相连的框间传输链路启动第一切换定时器,本实施例中对端网元为通过框间传输链路与SCU相连的其他框SCU,业务板所执行的流程可参见实施例二的方案;
步骤420、当其他框SCU在框间传输链路中接收到检测报文时,根据检测报文更新传输链路的状态信息,并重启对应的第一切换定时器,即可以将第一切换定时器的计时值清零,重新开始计时;
步骤430、当其他框SCU监测到第一切换定时器的值达到超时时间时,将对应传输链路的状态信息更新为不可用,并根据传输链路的状态信息将数据报文切换至其他框间传输链路进行传输,其中,超时时间大于检测周期且小于倒换计时值。
其他框SCU作为对端网元时所执行的操作与业务板相似,例如图5中,当mTCA第二框内的主用SCU和备用SCU无法接收到mTCA第一框内的主用SCU发送的检测报文时,即将数据报文切换至与mTCA第一框内的备用SCU连接的框间传输链路进行传输。
框间传输链路中所交互的检测报文也可以基于OAM协议或LACP协议实现,则SCU通过框间传输链路与其他框SCU之间交互的检测报文可以为OAM报文或LACP报文。
本实施例的技术方案实现了当系统内发生主备倒换的情况下,保证框间传输链路数据报文不丢包。实际应用中,各框内SCU所执行的操作是相同的,每个SCU既发送检测报文,在需要停止工作之前停止发送检测报文,又作为对端网元在接收不到检测报文时根据传输链路的状态信息执行链路切换的操作。对于OAM协议或LACP协议的链路故障检测而言,传输链路两侧端口设置的检测功能一致,因此业务板和SCU对传输链路是否接收到检测报文均可以设置第一切换定时器来进行超时控制。
在前述实施例一技术方案的基础上,传输链路切换因在超时时间内第一SCU未发送检测报文而触发,以切换至对端网元与框内第二SCU之间的传输链路进行数据传输还可以通过如下方式实现:
对端网元在接收到第一SCU发送的检测报文时返回检测响应;
第一SCU从所连的传输链路中接收对端网元返回的检测响应,根据检测响应更新传输链路的状态信息;
第一SCU将所连的传输链路的状态信息同步给框内的第二SCU;
当第二SCU根据同步接收到的传输链路的状态信息,判断第一SCU的传输链路为不可用时,则第二SCU切换至对端网元与自身所连的传输链路进行数据传输。下面以交换机作为对端网元为例对此实现方式进行说明。
实施例四
图6为本发明实施例四提供的主备倒换方法的流程图,本实施例可以上述实施例为基础,具体适用于通过LSW级联的多框系统。由于SCU面板网口数量的限制,在一些大业务流量的的场景下,需要超过三框的mTCA级联来协作完成,这样就需要引入外置LSW来实现级联,所有框连接LSW的方式均相同。图7为本发明实施例四中LSW级联多框系统的架构示意图,框内两个SCU与业务板的连接关系可参照图3所示,不同框的SCU之间的相连如图7所示,各个框内的SCU均与LSW相连,两个LSW再通过框间传输链路相连。本实施例的主备倒换方法包括上述实施例中SCU所执行的各步骤,且SCU从所连的各传输链路中接收对端网元发送的检测报文,根据检测报文更新传输链路的状态信息的操作可以具体包括如下步骤:
步骤610、SCU为自身与对端网元相连的各传输链路分别启动第二切换定时器,SCU的操作可适用于对端网元为业务板、自级联时其他框的SCU或LSW;
步骤620、当SCU在传输链路中接收到检测报文时,根据检测报文更新传输链路的状态信息,并重启对应的第二切换定时器,即可以将第二切换定时器的计时值清零,重新开始计时;
步骤630、当SCU监测到第二切换定时器的值达到超时时间时,即第二切换定时器超时,此时SCU将对应传输链路的状态信息更新为不可用,其中,超时时间大于检测周期且小于倒换计时值。
而后SCU可以继续执行状态信息的同步操作。
受限于业务链路检测实时性的要求,LSW与SCU之间不能采用标准OAM来检测链路状态。因此开启LSW端口通用的访问控制列表(AccessControl List,简称ACL)功能来进行链路检测,使LSW的端口接收到某一种指定类型的报文,直接回送回去,而SCU则发送指定类型的报文。LSW将指定类型的报文回送给SCU相当于向SCU返回检测响应。SCU侧对指定类型的报文的处理流程和基于OAM协议的处理方式类似,可从中获取链路状态信息,从而间接完成SCU和LSW间的链路检测,同时SCU将检测到的链路状态信息通过HIG链路通知框内另一SCU。
由于各框的SCU不是直接相连来收发检测报文,而是通过LSW级联,所以与自级联的链路切换方式不同,LSW级联方式中,由发生主备倒换的框内SCU主动完成链路切换。即当本实施例中对端网元为通过框间传输链路与第一SCU相连的LSW时,在第一SCU将所连的传输链路的状态信息同步给框内的第二SCU之后,该方法还包括:框内的第二SCU根据同步接收到的各传输链路的状态信息,判断对板的第一SCU的传输链路是否为不可用,若是,则第二SCU将对板的第一SCU与LSW交互的数据报文切换至LSW与自身所连的传输链路进行数据传输。
以图7所示结构为例。mTCA第一框内的主用SCU和备用SCU开始工作后,均按照设定检测周期发送检测报文;同时各SCU也监测是否能在超时时间内接收到检测响应,当超时后仍不能接收到检测响应时,即判断链路故障,更新链路状态信息,通知框内的另一个SCU。另一SCU可根据主用SCU的链路状态进行链路切换。当mTCA第一框内主用SCU接收到主备倒换指令时,会停止发送检测报文给LSW,这将导致LSW不回复检测响应,从而致使第一框内主用SCU能够检测到超时而判断链路故障。
在本实施例中,将要进行主备倒换的SCU主动进行链路切换,但其触发链路切换的条件与实施例三中不进行主备倒换的其他框SCU相同,都是在一定时间未接收到检测报文,即触发链路切换。所以业务板和SCU的超时时间可以设置为不同时长,也可以设置为相同的时长。
实施例五
本发明实施例五提供的主备倒换方法可以以上述任意实施例为基础,且优选是交互的检测报文中传输链路的状态信息包括物理层状态信息和链路层状态信息,则业务板或第二SCU根据传输链路的状态信息触发传输链路切换,切换至对端网元与框内第二SCU之间的传输链路进行数据传输的步骤可具体执行如下操作:根据传输链路的物理层状态信息、链路层状态信息和设定选路策略确定各传输链路的状态是否为可用,对于SCU而言,每个SCU不仅根据自身所连传输链路的信息进行选择,还可以根据同步得到的对板SCU的链路状态信息进行选路;在状态为可用的传输链路中选择切换至的传输链路,将数据报文切换至选择的传输链路中进行传输。
实际应用中,主用SCU所对应的框内传输链路两侧的端口可记为GE1端口,与框间传输链路两侧的端口可记为GE3端口;备用SCU所对应的框内传输链路两侧的端口可记为GE2端口,与框间传输链路两侧的端口可记为GE4端口。SCU与业务板之间,级联的SCU之间,以及SCU与LSW之间通过交互检测报文来获知传输链路的状态,且将链路状态信息对应记录在本板中。传输链路的状态信息优选是包括物理层状态信息和链路层状态信息,物理层状态信息可表示为连通(Link up)和不连通(Link down),链路层状态信息可表示为正常和故障两种。根据物理层状态信息、链路层状态信息和设定选路策略确定传输链路的状态是否为可用,从可用状态的传输链路中选择切换至的传输链路。
设定选路策略可以根据需要设置,优选是根据传输链路的物理层状态信息、链路层状态信息和设定选路策略确定待选传输链路是否为可用具体包括:
将链路层状态信息为正常的传输链路的状态确定为可用,因为链路层状态为正常时则物理层状态必然是连通的;当判断出各传输链路的链路层状态信息均为故障时,将物理层状态信息为连通的传输链路的状态确定为可用。
物理层状态信息、链路层状态信息与传输链路可用性之间的关系即是选路策略,对于业务板的框间传输链路而言,其中一种具体方式体现在表1中:
表1
Figure BDA0000063729520000131
Figure BDA0000063729520000141
基于上述选路策略,首先根据链路层状态确定传输链路是否可用;当链路层状态均为故障时,则根据物理层状态确定传输链路是否可用,物理层状态为连通的传输链路可用。
对于SCU而言,其框内传输链路和框间传输链路的选路策略与业务板类似,首先根据链路层状态确定传输链路是否可用;当链路层状态均为故障时,则根据物理层状态确定传输链路是否可用,物理层状态为连通的传输链路可用,选路策略形成的传输链路状态对应关系如表2所示:
表2
Figure BDA0000063729520000142
Figure BDA0000063729520000151
实施例六
图8为本发明实施例六提供的系统控制单元的结构示意图,该SCU可以是主用SCU或备用SCU,也可以是单框或多框内的任意一个SCU。该SCU包括检测报文发送模块810、链路主备倒换模块820和复位模块830。其中,检测报文发送模块810用于在所在SCU所连的传输链路中按照设定的检测周期向对端网元发送用于表示传输链路状态的检测报文;链路主备倒换模块820用于当接收到主备倒换指令时,停止在SCU所连的传输链路中发送检测报文,使得传输链路切换因在设定的超时时间内该SCU停止发送检测报文而触发,以切换至对端网元与框内另一SCU之间的传输链路进行数据传输,并且同时为链路主备倒换模块820所在SCU启动倒换计时器;复位模块830用于当监测到倒换计时器的值达到倒换计时值时,进行所在SCU的复位以完成主备倒换,其中,该倒换计时值大于超时时间。
本实施例的技术方案,第一SCU,即主用SCU在进行主备倒换的复位操作之前,首先主动停止发送检测报文,但并不立即停止数据报文传输,而是延时一定的时长再停止数据报文传输,SCU停止发送检测报文相当于通知对端网元该传输链路不可用,使得对端网元不能在超时时间内接收到检测报文,从而视为检测到链路故障,触发链路切换。由于倒换计时值的时长大于超时时间,所以在延迟的这段时间内,主用SCU仍然能为对端网元提供数据传输服务,直至对端网元切换链路之后再停止工作。因此,本实施例的技术方案能够在进行主备倒换的情况下实现业务数据报文的零丢包,保证业务的连续性和可靠性。
在上述技术方案的基础上,本实施例优选是设置SCU还包括:链路状态获取模块840和状态信息同步模块850。其中,链路状态获取模块840用于从所在SCU所连的传输链路中接收对端网元根据检测报文返回的检测响应,并根据检测响应更新传输链路的状态信息;状态信息同步模块850用于与框内的另一SCU相互同步所连的传输链路的状态信息。
其中,链路状态获取模块具体可包括:切换计时单元、第一状态更新单元和第二状态更新单元。其中,切换计时单元用于为SCU与对端网元相连的传输链路启动第二切换定时器;第一状态更新单元用于当在传输链路中接收到检测报文或检测响应时,根据检测报文或检测响应更新传输链路的状态信息,并重启对应的第二切换定时器;第二状态更新单元用于当监测到第二切换定时器的值达到超时时间时,将对应传输链路的状态信息更新为不可用,其中,超时时间大于所述检测周期且小于所述倒换计时值。
状态信息在每个框内两个SCU之间进行同步,有助于SCU控制链路的切换。在该SCU中还可以包括链路切换模块,用于当根据同步接收到的传输链路的状态信息,判断另一SCU的传输链路为不可用时,则将另一SCU与对端网元之间的数据传输切换至链路切换模块所在SCU所连的传输链路。该方案适用于另一SCU即将发生主备倒换的情况,SCU可以主动发起传输链路切换,如前述实施例所述,尤为适用于通过交换机进行级联的情况。
优选是检测报文中传输链路的状态信息包括物理层状态信息和链路层状态信息,则SCU还可以包括:链路状态确定模块860、物理状态确定模块870和链路选择模块880。其中,链路状态确定模块860和物理状态确定模块870与状态信息同步模块850相配合,用于根据传输链路的物理层状态信息、链路层状态信息和设定选路策略确定各传输链路的状态是否为可用,不仅根据自身所连传输链路的信息进行选择,还可以同步得到的对板SCU的链路状态信息进行选路。具体地,链路状态确定模块860用于当根据链路层状态信息判断出存在链路层状态为正常的传输链路时,将链路层状态信息为正常的传输链路的状态确定为可用;物理状态确定模块870用于当根据链路层状态信息判断出各传输链路的链路层状态信息均为故障时,根据物理层状态信息判断传输链路的物理层状态,将物理层状态为连通的传输链路的状态确定为可用。链路选择模块880用于在状态为可用的传输链路中选择切换至的传输链路,并切换至选择的传输链路中进行数据传输。
本发明各实施例提供的SCU可执行本发明实施例所提供的主备倒换方法,实现主备倒换时零丢包链路切换,保证业务传输的连续性和可靠性。
实施例七
图9为本发明实施例七提供的通信系统的结构示意图,该系统包括一个或多个框,每个框内包括两个SCU910和一个以上业务板920,图9所示为一个框的架构。其中,该系统采用本发明任意实施例所提供的SCU作为SCU910。
对于业务板920,其优选是包括:切换计时模块921、计时重启模块922和链路切换模块923。其中,切换计时模块921用于为业务板920与SCU910相连的传输链路分别启动第一切换定时器;计时重启模块922用于当业务板920在传输链路中接收到检测报文时,根据检测报文更新传输链路的状态信息,并重启对应的第一切换定时器;链路切换模块923用于当监测到第一切换定时器的值达到超时时间时,将对应传输链路的状态信息更新为不可用,并根据传输链路的状态信息将数据报文切换至其他传输链路进行传输,其中,超时时间大于检测周期且小于倒换计时值。
本发明各实施例的技术方案,可以通过建立SCU与对端业务板、对端其他SCU或对端LSW之间的实时链路检测,来确保当前链路传输的可靠性。当主用SCU因关键模块故障或者策略性需要进行主备倒换时,主用SCU板通过停止和所有相关框内/框间传输链路的检测报文,启动定时期延期复位,在此期间对接的业务板/SCU板检测到相关链路超时故障,将所有业务切换到其他链路状态正常的传输链路上,从而保证数据传输零丢包,即整个倒换过程上层不感知。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (11)

1.一种主备倒换方法,其特征在于,包括:
第一系统控制单元在所连的传输链路中按照设定的检测周期向对端网元发送用于表示传输链路状态的检测报文;
当所述第一系统控制单元接收到主备倒换指令时,停止在自身所连的传输链路中发送检测报文,使得传输链路切换因在设定的超时时间内第一系统控制单元停止发送检测报文而触发,以切换至对端网元与框内第二系统控制单元之间的传输链路进行数据传输,并且所述第一系统控制单元同时启动倒换计时器;
当所述第一系统控制单元监测到所述倒换计时器的值达到倒换计时值时,所述第一系统控制单元进行复位以完成主备倒换,其中,所述倒换计时值大于所述超时时间。
2.根据权利要求1所述的主备倒换方法,其特征在于,传输链路切换因在所述超时时间内第一系统控制单元未发送检测报文而触发,以切换至对端网元与框内第二系统控制单元之间的传输链路进行数据传输包括:
当所述对端网元在所述超时时间内未收到第一系统控制单元发送的检测报文时,判断所述传输链路故障;
所述对端网元基于已有的链路故障检测协议切换至与框内第二系统控制单元之间的传输链路进行数据传输。
3.根据权利要求2所述的主备倒换方法,其特征在于:
所述第一系统控制单元通过框内传输链路与业务板之间交互的检测报文和通过框间传输链路与其他框系统控制单元之间交互的检测报文为OAM报文或LACP报文。
4.根据权利要求1所述的主备倒换方法,其特征在于,传输链路切换因在所述超时时间内第一系统控制单元未发送检测报文而触发,以切换至对端网元与框内第二系统控制单元之间的传输链路进行数据传输包括:
所述对端网元在接收到第一系统控制单元发送的检测报文时返回检测响应;
所述第一系统控制单元从所连的传输链路中接收对端网元返回的检测响应,根据所述检测响应更新传输链路的状态信息;
所述第一系统控制单元将所连的传输链路的状态信息同步给框内的第二系统控制单元;
当所述第二系统控制单元根据同步接收到的传输链路的状态信息,判断第一系统控制单元的传输链路为不可用时,则所述第二系统控制单元切换至对端网元与自身所连的传输链路进行数据传输。
5.根据权利要求1所述的主备倒换方法,其特征在于:所述检测周期为200毫秒,所述倒换计时值为2秒,所述超时时间为600毫秒。
6.根据权利要求1所述的主备倒换方法,其特征在于,所述传输链路的状态信息包括物理层状态信息和链路层状态信息,则触发传输链路切换,切换至对端网元与框内第二系统控制单元之间的传输链路进行数据传输包括:
当根据所述链路层状态信息判断出存在链路层状态为正常的传输链路时,将链路层状态信息为正常的传输链路的状态确定为可用;
当根据所述链路层状态信息判断出各传输链路的链路层状态信息均为故障时,根据所述物理层状态信息判断传输链路的物理层状态,将物理层状态为连通的传输链路的状态确定为可用;
在状态为可用的各传输链路中选择切换至的传输链路,将数据传输切换至选择的传输链路。
7.一种系统控制单元,其特征在于,包括:
检测报文发送模块,用于在所在系统控制单元所连的传输链路中按照设定的检测周期向对端网元发送用于表示传输链路状态的检测报文;
链路主备倒换模块,用于当接收到主备倒换指令时,停止在所述系统控制单元所连的传输链路中发送检测报文,使得传输链路切换因在设定的超时时间内所述系统控制单元停止发送检测报文而触发,以切换至对端网元与框内另一系统控制单元之间的传输链路进行数据传输,并且同时为所在系统控制单元启动倒换计时器;
复位模块,用于当监测到所述倒换计时器的值达到倒换计时值时,进行所在系统控制单元的复位以完成主备倒换,其中,所述倒换计时值大于所述超时时间。
8.根据权利要求7所述的系统控制单元,其特征在于,还包括:
链路状态获取模块,用于从所在系统控制单元所连的传输链路中接收对端网元根据所述检测报文返回的检测响应,根据所述检测响应更新传输链路的状态信息;
状态信息同步模块,用于与框内的另一系统控制单元相互同步所连的传输链路的状态信息。
9.根据权利要求8所述的系统控制单元,其特征在于,还包括:
链路切换模块,用于当根据同步接收到的传输链路的状态信息,判断另一系统控制单元的传输链路为不可用时,则将另一系统控制单元与对端网元之间的数据传输切换至所在系统控制单元所连的传输链路。
10.根据权利要求8所述的系统控制单元,其特征在于,所述传输链路的状态信息包括物理层状态信息和链路层状态信息,则所述系统控制单元还包括:
链路状态确定模块,用于当根据所述链路层状态信息判断出存在链路层状态为正常的传输链路时,将链路层状态信息为正常的传输链路的状态确定为可用;
物理状态确定模块,用于当根据所述链路层状态信息判断出各传输链路的链路层状态信息均为故障时,根据所述物理层状态信息判断传输链路的物理层状态,将物理层状态为连通的传输链路的状态确定为可用;
链路选择模块,用于在状态为可用的传输链路中选择切换至的传输链路,并切换至选择的传输链路中进行数据传输。
11.一种通信系统,包括一个或多个框,每个框内包括两个系统控制单元和一个以上业务板,其特征在于:
采用权利要求7~10任一所述系统控制单元作为所述系统控制单元。
CN201180000323.5A 2011-04-25 2011-04-25 主备倒换方法、系统控制单元和通信系统 Active CN102257759B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/073277 WO2011110135A2 (zh) 2011-04-25 2011-04-25 主备倒换方法、系统控制单元和通信系统

Publications (2)

Publication Number Publication Date
CN102257759A true CN102257759A (zh) 2011-11-23
CN102257759B CN102257759B (zh) 2014-02-19

Family

ID=44563913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180000323.5A Active CN102257759B (zh) 2011-04-25 2011-04-25 主备倒换方法、系统控制单元和通信系统

Country Status (3)

Country Link
US (1) US20120269057A1 (zh)
CN (1) CN102257759B (zh)
WO (1) WO2011110135A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103138996A (zh) * 2011-11-25 2013-06-05 中兴通讯股份有限公司 一种分布式系统状态检测方法及分布式系统
CN103812675A (zh) * 2012-11-08 2014-05-21 中兴通讯股份有限公司 一种实现业务交付平台异地容灾切换的方法和系统
CN105763442A (zh) * 2016-04-14 2016-07-13 烽火通信科技股份有限公司 主备倒换lacp聚合链路不中断的pon系统及方法
CN105790902A (zh) * 2014-12-22 2016-07-20 研祥智能科技股份有限公司 冗余网卡切换的实现方法和系统
CN105871743A (zh) * 2015-01-21 2016-08-17 杭州迪普科技有限公司 聚合端口状态协商方法以及装置
CN107204888A (zh) * 2016-03-16 2017-09-26 华为技术有限公司 一种切换超时时间的方法、装置和通信设备
CN107547301A (zh) * 2017-06-21 2018-01-05 新华三信息安全技术有限公司 一种主备设备倒换方法及装置
CN111400009A (zh) * 2020-03-17 2020-07-10 广州视源电子科技股份有限公司 一种通信控制方法、装置、智能交互平板及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2938372B1 (en) 2012-12-26 2019-09-04 Becton, Dickinson and Company Pen needle assembly
CN111324492B (zh) * 2020-01-23 2023-06-02 北京和利时系统集成有限公司 一种冗余主机链路冲突模式下的诊断及切换方法和装置
CN116684048B (zh) * 2023-08-02 2023-10-31 成都电科星拓科技有限公司 Serdes中继芯片主备链路切换方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030035368A1 (en) * 2001-08-17 2003-02-20 Toru Tanada Redundant ethernet transmission line system
EP1418713A1 (en) * 2001-08-08 2004-05-12 Fujitsu Limited SERVER, MOBILE COMMUNICATION TERMINAL, RADIO DEVICE, COMMUNICATION METHOD FOR COMMUNICATION SYSTEM, AND COMMUNICATION SYSTEM
CN101183982A (zh) * 2007-11-21 2008-05-21 烽火通信科技股份有限公司 一种基于多业务传输环网拓扑结构自动发现的方法
US20090119539A1 (en) * 2001-11-29 2009-05-07 International Business Machines Corporation System and program for error handling in a dual adaptor system where one adaptor is a master
CN101841408A (zh) * 2010-05-07 2010-09-22 北京星网锐捷网络技术有限公司 主备路由设备切换方法及路由设备
CN101895791A (zh) * 2009-05-21 2010-11-24 中兴通讯股份有限公司 以太网无源光网络中保护切换方法与装置
CN101902403A (zh) * 2010-07-30 2010-12-01 中国联合网络通信集团有限公司 一种增强组播源可靠性的方法及其装置
CN102025562A (zh) * 2010-11-25 2011-04-20 中兴通讯股份有限公司 一种路径检测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488844B (zh) * 2009-02-23 2012-01-11 中兴通讯股份有限公司 一种板间通信链路切换控制的方法和系统以及一种接口板

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1418713A1 (en) * 2001-08-08 2004-05-12 Fujitsu Limited SERVER, MOBILE COMMUNICATION TERMINAL, RADIO DEVICE, COMMUNICATION METHOD FOR COMMUNICATION SYSTEM, AND COMMUNICATION SYSTEM
US20030035368A1 (en) * 2001-08-17 2003-02-20 Toru Tanada Redundant ethernet transmission line system
US20090119539A1 (en) * 2001-11-29 2009-05-07 International Business Machines Corporation System and program for error handling in a dual adaptor system where one adaptor is a master
CN101183982A (zh) * 2007-11-21 2008-05-21 烽火通信科技股份有限公司 一种基于多业务传输环网拓扑结构自动发现的方法
CN101895791A (zh) * 2009-05-21 2010-11-24 中兴通讯股份有限公司 以太网无源光网络中保护切换方法与装置
CN101841408A (zh) * 2010-05-07 2010-09-22 北京星网锐捷网络技术有限公司 主备路由设备切换方法及路由设备
CN101902403A (zh) * 2010-07-30 2010-12-01 中国联合网络通信集团有限公司 一种增强组播源可靠性的方法及其装置
CN102025562A (zh) * 2010-11-25 2011-04-20 中兴通讯股份有限公司 一种路径检测方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103138996A (zh) * 2011-11-25 2013-06-05 中兴通讯股份有限公司 一种分布式系统状态检测方法及分布式系统
CN103812675A (zh) * 2012-11-08 2014-05-21 中兴通讯股份有限公司 一种实现业务交付平台异地容灾切换的方法和系统
CN105790902A (zh) * 2014-12-22 2016-07-20 研祥智能科技股份有限公司 冗余网卡切换的实现方法和系统
CN105790902B (zh) * 2014-12-22 2020-06-09 研祥智能科技股份有限公司 冗余网卡切换的实现方法和系统
CN105871743A (zh) * 2015-01-21 2016-08-17 杭州迪普科技有限公司 聚合端口状态协商方法以及装置
CN107204888A (zh) * 2016-03-16 2017-09-26 华为技术有限公司 一种切换超时时间的方法、装置和通信设备
CN107204888B (zh) * 2016-03-16 2020-02-14 华为技术有限公司 一种切换超时时间的方法、装置和通信设备
CN105763442A (zh) * 2016-04-14 2016-07-13 烽火通信科技股份有限公司 主备倒换lacp聚合链路不中断的pon系统及方法
CN107547301A (zh) * 2017-06-21 2018-01-05 新华三信息安全技术有限公司 一种主备设备倒换方法及装置
CN107547301B (zh) * 2017-06-21 2021-07-30 新华三信息安全技术有限公司 一种主备设备倒换方法及装置
CN111400009A (zh) * 2020-03-17 2020-07-10 广州视源电子科技股份有限公司 一种通信控制方法、装置、智能交互平板及存储介质

Also Published As

Publication number Publication date
CN102257759B (zh) 2014-02-19
WO2011110135A2 (zh) 2011-09-15
WO2011110135A3 (zh) 2012-03-22
US20120269057A1 (en) 2012-10-25

Similar Documents

Publication Publication Date Title
CN102257759B (zh) 主备倒换方法、系统控制单元和通信系统
CN103744809B (zh) 基于vrrp的车辆信息管理系统双机热备方法
WO2009023996A1 (fr) Procédé de mise en œuvre d'une interconnexion de réseau par l'intermédiaire d'une agrégation de liaisons
CN101594383B (zh) 一种双控制器存储系统的服务和控制器状态监控方法
EP1982447A2 (en) System and method for detecting and recovering from virtual switch link failures
US10868754B2 (en) High availability input/output management nodes
CN102724030A (zh) 一种高可靠性的堆叠系统
CN109218232B (zh) 一种实现Mux机的方法、设备及系统
CN101841735B (zh) 框式交换机及堆叠系统以及堆叠后故障处理方法
CN103188172A (zh) 链路聚合的异常恢复方法和交换设备
CN103107906A (zh) 一种板卡间通信方法、板卡及通信机框设备
WO2013114238A1 (en) Distributed fabric management protocol
WO2016095344A1 (zh) 链路切换方法、装置及线卡
CN110912815B (zh) 一种网元防成环方法、装置、设备及可读存储介质
CN101877631A (zh) 服务器及其业务切换方法
CN103607293A (zh) 一种流量保护方法及设备
US8929361B2 (en) Switch discovery protocol for a distributed fabric system
US20160173216A1 (en) Apparatus and Method for Two-Way Timestamp Exchange
US9705823B2 (en) Port status synchronization method, related device, and system
CN111510336B (zh) 一种网络设备状态管理方法及装置
CN111224803B (zh) 一种堆叠系统中多主检测方法及堆叠系统
CN102255741B (zh) 用户业务信息备份方法和装置
CN104270270A (zh) 一种中高端机架式大容量设备通信管理方法
CN112398731B (zh) 一种处理报文的方法和第一网络设备
CN101686153A (zh) 一种通信设备发送vrrp通告消息的方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant