CN110391928B - 一种使用电子开关执行主备切换的通信方法和设备 - Google Patents

一种使用电子开关执行主备切换的通信方法和设备 Download PDF

Info

Publication number
CN110391928B
CN110391928B CN201810362435.9A CN201810362435A CN110391928B CN 110391928 B CN110391928 B CN 110391928B CN 201810362435 A CN201810362435 A CN 201810362435A CN 110391928 B CN110391928 B CN 110391928B
Authority
CN
China
Prior art keywords
electronic switch
link
control board
period
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810362435.9A
Other languages
English (en)
Other versions
CN110391928A (zh
Inventor
张锋
陈井凤
李春荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201810362435.9A priority Critical patent/CN110391928B/zh
Priority to PCT/CN2019/082003 priority patent/WO2019201124A1/zh
Publication of CN110391928A publication Critical patent/CN110391928A/zh
Application granted granted Critical
Publication of CN110391928B publication Critical patent/CN110391928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4604LAN interconnection over a backbone network, e.g. Internet, Frame Relay
    • H04L12/462LAN interconnection over a bridge based backbone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Small-Scale Networks (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请提供了一种使用电子开关执行主备切换的通信方法和设备。在一种通信方法中,第一设备中的主用控制板经由电子开关和电子开关到第二设备的第一链路向第二设备发送通知消息,通知消息用于指示第二设备在一段时间内避免向第一设备发送告警消息;第一设备断开主用控制板到电子开关的第一连接,接通备用控制板到电子开关的第二连接;备用控制板经由第二连接、电子开关和第一链路向第二设备发送业务报文。本申请提供的方案,有助于降低使用电子开关执行主备切换的耗时。

Description

一种使用电子开关执行主备切换的通信方法和设备
技术领域
本申请涉及通信领域,尤其涉及一种使用电子开关执行主备切换的通信方法和设备。
背景技术
网络设备可以通过内部的接口板(interface board)与其他网络设备通信。为降低设备成本和功耗,接口板内部可以使用电子开关实现信号的传递,电子开关是指利用电子电路以及电力电子器件实现电路通断的运行单元。采用电子开关的接口板,去除了物理编码子层(physical coding sublayer,PCS)模块和介质访问控制(media accesscontrol,MAC)模块,从而达到降低成本和功耗的目的。采用了电子开关的网络设备,在执行内部主备切换期间,由于缺少了PCS模块的物理层处理,会向外发送不稳定物理层信号,进而触发设备间端口切换,这使得网络设备完成主备切换的耗时较长。
发明内容
有鉴于此,本申请实施例提供了一种通信方法和设备,有助于降低采用了电子开关的网络设备完成主备切换的耗时。
第一方面,本申请实施例提供了一种通信方法。该方法包括:首先,第一设备中的主用控制板经由第一设备中的电子开关和电子开关到第二设备的第一链路向第二设备发送通知消息,该通知消息用于指示第二设备在一段时间内避免向第一设备发送告警消息,该告警消息用于通知第一设备该第一链路发生故障,该一段时间从第二设备检测到第一链路发生故障时开始;其次,第一设备执行切换,该切换是指断开主用控制板到电子开关的第一连接,接通备用控制板到电子开关的第二连接;然后,备用控制板经由第二连接、电子开关和第一链路向第二设备发送业务报文。
第一方面提供的方案中,第一设备将通知消息发送到第二设备,以便指示第二设备在检测到链路故障后的一段时间内避免向第一设备发送告警消息。由此,虽然第一设备执行主备切换期间,向第二设备发送的物理层信号出现不稳定,但这不会引发端口切换,由此降低了完成主备切换的耗时。
在一个可能的设计中,第一设备断开主用控制板到电子开关的第一连接,接通备用控制板到电子开关的第二连接之前,检测到主用控制板异常后,向电子开关发送切换信号,该切换信号用于触发电子开关执行切换,该切换指断开该第一连接,接通该第二连接。采用自动检测故障和主备切换机制可以提高通信安全性。
在一个可能的设计中,第一设备断开第一连接和接通第二连接的期间也即电子开关执行切换的期间,电子开关经由第二设备到第一设备的第二链路接收来自第二设备的业务报文,将接收自第二设备的业务报文经由电子开关到主用控制板的第三连接发送至主用控制板,将接收自第二设备的业务报文经由电子开关到备用控制板的第四连接发送至备用控制板。电子开关可以同时向主用控制板和备用控制板发送接收自第二设备的业务报文。第二链路和第一链路连接第一设备的同一物理端口。由此,第一设备的电子开关执行切换的期间,不影响接收第二设备发送的业务报文,即第二设备到第一设备的流量不会中断,提高了通信效率。
在一个可能的设计中,第二设备检测到链路故障的一段时间后,电子开关经由第二设备到第一设备的第二链路接收到来自第二设备的告警消息,该告警消息用于通知第一设备第一链路发生故障。第二链路和第一链路连接第一设备的同一物理端口。在该一段时间后,第一设备仍然收到告警消息,表示第一链路发生了非主备切换导致的故障,进而第一设备和第二设备可以切换端口以便恢复通信,由此提高了通信的安全性。
在一个可能的设计中,通知消息包括标志位,标志位标识第一设备使用电子开关。第二设备根据通知消息可以知晓第一设备使用了电子开关,也就会说第一设备在随后执行切换时会发送过来不稳定的物理层信号,在一段时间内并不需要针对该不稳定的物理层信号返回告警消息,进而可以避免引发端口切换。
第二方面,本申请实施例提供了一种通信方法。该方法包括:首先,第二设备经由从第一设备到第二设备的第一链路接收第一设备发送的通知消息,通知消息用于指示第二设备在一段时间内避免向第一设备发送告警消息,告警消息用于通知第一设备第一链路发生故障,该一段时间从第二设备检测到第一链路发生故障时开始;其次,在第二设备检测到第一链路发生故障后,在该一段时间内第二设备避免向第一设备发送告警消息。
在一个可能的设计中,在该一段时间内,第二设备经由第二设备到第一设备的第二链路向第一设备发送业务报文。第二链路和第一链路连接第二设备的同一物理端口。由此,第二设备检测到第一链路发生故障后的一段时间内,第二设备到第一设备的流量不会中断,提高了通信效率。
在一个可能的设计中,第二设备确定故障在一段时间结束后仍存在,基于在一段时间结束后仍存在的该故障,第二设备向第一设备发送用于通知第一设备第一链路发生该故障的告警消息。在该一段时间后,第二设备检测到第一链路的故障仍然存在,表示第一链路发生了非主备切换导致的故障,则第二设备经第二链路向第一设备发送告警消息,以便通知第一设备切换端口以便恢复通信,由此提高了通信的安全性。
在一个可能的设计中,通知消息包括标志位,标志位标识第一设备使用电子开关。
第三方面,本申请实施例提供了一种通信设备,用作第一设备。第一设备包括主用控制板、备用控制板和电子开关。主用控制板用于经由电子开关和电子开关到第二设备的第一链路向第二设备发送通知消息,通知消息用于指示第二设备在一段时间内避免向第一设备发送告警消息,告警消息用于通知第一设备第一链路发生故障,该一段时间从第二设备检测到第一链路发生故障时开始。备用控制板用于触发电子开关执行切换,该切换是指断开主用控制板到电子开关的第一连接,接通备用控制板到电子开关的第二连接。备用控制板还用于经由第二连接、电子开关和第一链路向第二设备发送业务报文。
在一个可能的设计中,备用控制板在触发电子开关执行切换之前,还用于:检测到主用控制板异常后,向电子开关发送切换信号,切换信号用于触发电子开关执行切换。
在一个可能的设计中,电子开关在执行切换的期间,还用于:经由第二设备到第一设备的第二链路接收来自第二设备的业务报文,第二链路和第一链路连接第一设备的同一物理端口;将接收自第二设备的业务报文经由电子开关到主用控制板的第三连接发送至主用控制板;将接收自第二设备的业务报文经由电子开关到备用控制板的第四连接发送至备用控制板。
在一个可能的设计中,通知消息包括标志位,标志位标识第一设备使用电子开关。
第四方面,本申请实施例提供了一种通信设备,用作第二设备。第二设备包括存储器和与存储器耦合的处理器。处理器用于执行存储器包括的指令,从而执行第二方面及第二方面任一可能的设计中第二设备执行的操作。
第五方面,本申请实施例提供了一种通信系统,包括第三方面或第三方面任一可能的设计中的第一设备,以及包括第四方面或第四方面任一可能的设计中的第二设备。
第六方面,本申请提实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行第一方面或第一方面任一可能的设计中的方法中第一设备执行的操作。
第七方面,本申请提实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行第二方面或第二方面任一可能的设计中的方法中第二设备执行的操作。
第八方面,本申请实施例提供了一种通信设备。该通信设备包括用于执行第一方面或第一方面任一可能的设计中的方法中第一设备功能的模块。
第九方面,本申请实施例提供了一种通信设备。该通信设备包括用于执行第二方面或第二方面任一可能的设计中的方法中第二设备功能的模块。
附图说明
图1为本申请实施例提供的一种网络结构的示意图;
图2为本申请实施例提供的一种接入层设备的结构示意图;
图3示出了一种采用FPGA或ASIC实现的接口板的结构;
图4示出了一种采用电子开关实现的接口板的结构;
图5为本申请实施例提供的一种通信方法的流程图;
图6示出了一种通信设备的结构。
具体实施方式
本申请实施例描述的本端设备与对端设备的通信中,对端设备根据通知消息可以提前获知本端设备正常执行主备切换的一段时间内将发出不稳定的物理层信号,也就是说对端设备在检测到链路故障的一段时间内并不需要针对不稳定的物理层信号返回告警消息,因此对端设备在检测到链路故障的一段时间内避免返回告警消息从而避免触发端口切换,有助于降低主备切换的耗时。而当链路故障的持续时间超过一定长度时,表明链路故障不是主备切换导致的故障,对端设备向本端设备返回告警消息以触发端口切换,由此可以在发生非主备切换导致的链路故障时恢复通信。
图1为本申请实施例提供的一种网络结构的示意图。该网络100结构由上至下可以分为核心层、汇聚层和接入层三层。用户设备通过接入层设备接入到网络中,接入层设备进一步经由汇聚层设备连接到核心层设备上,核心层设备负责网络的高速交换。例如图1中用户设备105和用户设备106可以经接入层设备101接入网络100,用户设备107可以经接入层设备103接入网络100,接入层可以包括接入环,接入环中设备102、设备101、设备103和设备104顺次连接,汇聚层可以包括汇聚环,汇聚环中的设备117、设备115、设备116和设备118顺次连接。接入环中的设备102和设备104分别连接汇聚环中的设备115和设备116,由此接入环与汇聚环连接。汇聚环中的设备117和设备118分别连接核心层设备120和设备121,由此汇聚环连接到核心层设备。图1中用户设备105、用户设备106和用户设备107中的任一个例如是基站收发台(base transceiver station,BTS)、演进节点B(E-UTRAN Node B,eNodeB)、无线接入点(access point,AP)、服务器和主机等,该网络例如是分组传送网(packet transport network,PTN),设备101、设备102、设备103、设备104、设备115至设备124可以是PTN设备,例如设备101、设备102、设备103和设备104中的任一个是华为PTN950或华为PTN910,设备115至设备118中的任一个是华为PTN1900和PTN3900,设备119至设备124中的任一个是华为PTN3900。以上网络结构、设备类型和设备数量仅为一种示例,本申请并不限于以上网络结构、设备类型和设备数量。例如设备101或设备102可以连接1、2、3至任意多个接入层设备,也可以连接1、2、3至任意多个用户设备。
图2为本申请实施例提供的一种接入层设备的结构示意图。该接入层设备可以是图1中设备101。接入层设备通常具有1U或2U的高度,也可称为盒式设备。电子工业联盟(electronic industries alliance,EIA)规定1U是4.445厘米,2U是8.89厘米。盒式设备中包括两个控制板和用于与其他设备相连的多个接口板。两个控制板中的一个做为主用控制板201,另一个做为备用控制板202,主用控制板201通过接口板与其他设备通信,该其他设备例如是接入环中的其他盒式设备、汇聚层设备或是用户设备进行通信。当网络中不存在汇聚层时,该其他设备还可以是核心层设备信。例如主用控制板201通过接口板203、接口板204、接口板205和接口板206可以分别与设备102、设备103、用户设备105和用户设备106通信。主用控制板201也可以通过一个接口板与多个其他设备通信。在主用控制板201出现异常时,备用控制板202可以代替主用控制板与其他设备进行通信。接口板与其他设备的通信速率可以是25吉比特每秒(Gbps)、50Gbps或100Gbps。盒式设备的控制板可以包括处理器和与处理器耦合的用于存储指令的存储器,以便由处理器读取该指令执行控制板的控制管理和数据交换的功能。该用于存储指令的存储器也可以集成到处理器内部。该处理器可以是用于实现局域网交换机(local area network switch,LSW)功能的LSW芯片和网络处理器(network processor,NP)两者中的任一个或是两者的组合。该处理器可以是指一个处理器,也可以包括多个处理器。以上用于存储指令的存储器可以包括易失性存储器(volatilememory),例如随机存取存储器(random-access Memory,RAM);也可以包括非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM),快闪存储器(flashmemory),硬盘驱动器(hard disk drive,HDD)或固态硬盘(solid-state disk,SSD)。该存储器还可以包括上述种类的存储器的组合。该存储器可以是指一个存储器,也可以包括多个存储器。
接口板可以有两种结构,一种是采用现场可编程逻辑门阵列(field-programmable gate array,FPGA)或专用集成电路(application-specific integratedcircuit,ASIC)实现,另一种是采用电子开关实现。
图3以图2中接口板203为例,示出了一种采用FPGA或ASIC实现的接口板的结构。图3所示接口板203的结构可以应用于图2中任一接口板。为便于展示,图3中设备101中除接口板203以外的接口板未示出。接口板203包括PCS模块301、MAC模块302、PCS模块303、MAC模块304、PCS模块305和MAC模块306,PCS模块负责物理编码子层PCS的数据处理,MAC模块负责MAC层的数据处理。主用控制板201可以经PCS模块301、MAC模块302、MAC模块306、PCS模块305向其他设备例如设备102发送报文,该报文例如是告警消息或业务报文。当主用控制板201出现异常时,负责发送报文的控制板由主用控制板201切换到备用控制板202。切换期间,PCS模块305从主用控制板201收到的物理层信号中断,此时PCS模块305执行物理层功能,该物理层功能包括向其他设备例如设备102发送空闲(idle)信号,以避免其他设备例如设备102认定设备101到设备102的物理层链路发生故障。
图4示出了一种采用电子开关实现的接口板的结构。图4所示接口板203的结构可以应用于图2中任一接口板,为便于展示,图4中设备101中除接口板203以外的接口板未示出。图4所示接口板203去除了PCS模块和MAC模块,主用控制板201和备用控制板202可以经由接口板203上的电子开关401与其他设备例如设备102通信。电子开关401经由链路404接收设备102发送的数据后,将接收的数据经由电路407和电路408同时发往主用控制板201和备用控制板202。主用控制板201和备用控制板202中的一个向电子开关401发送数据,其中主用控制板201经电路405向电子开关401发送数据,备用控制板202经电路406向电子开关401发送数据。电子开关401可以包括主备选择管脚402,主用控制板201可以经由电路409向主备选择管脚402发送切换信号,备用控制板202可以经由电路410向主备选择管脚402发送切换信号,该切换信号用于触发电子开关401执行切换。电子开关401执行切换可以是断开电路405并接通电路406,由此电子开关由接收主用控制板发送的数据切换到接收备用控制板发送的数据,实现从主用控制板到备用控制板的切换。电子开关401执行切换也可以是断开电路406并接通电路405,由此电子开关由接收备用控制板发送的数据切换到接收主用控制板发送的数据,实现从备用控制板到主用控制板的切换。由此通过向主备选择管脚402发送不同的切换信号可以触发电子开关401在接收主用控制板201发送的数据和接收备用控制板202发送的数据两种操作方式之间的切换,即实现主备切换。主用控制板201和备用控制板202可以通过电路411互相检测状态,以便触发主备切换,例如当电路405接通,电路406断开时,备用控制板202可以检测主用控制板201的状态,检测到主用控制板201异常后,例如不在位(即控制板不在盒式设备中用于插入该控制板的插槽中)或者硬件异常,向主备选择管脚402发送切换信号,触发电子开关401执行切换,该切换是断开电路405,接通电路406。类似地,当电路406接通,电路405断开时,主用控制板201可以检测备用控制板202的状态,检测到备用控制板202异常后,例如不在位或者硬件异常,向主备选择管脚402发送切换信号,触发电子开关401执行切换,该切换是断开电路406,接通电路405。
采用电子开关实现的接口板由于去除了PCS模块和MAC模块,降低了成本和功耗。电子开关在执行切换的期间,即从断开电路405和电路406中的一个到接通电路405和电路406中的另一个的期间,电子开关401发往其他设备例如设备102的物理层信号是不稳定的,由于缺少PCS模块发送idle信号,设备102将检测到设备101到设备102的物理层链路403发生故障,该故障可以是电气电子工程师学会(institute of electrical and electronicsengineers,IEEE)802.3规范2008年版本中规定的链路故障linkdown。举例来说,物理层链路故障的检测方式可以是设备102从设备101连续收到4个无效的编码组后就确定设备101到设备102的物理层链路403发生了链路故障linkdown。设备102检测到linkdown后,将产生本地告警(local fault),停止经由设备102到设备101的链路404向设备101发送业务报文,并经链路404向设备101发送远端告警(remote fault),以便通知设备101链路403发生故障,随后设备101和设备102将同时进行端口切换以便恢复通信,这将导致设备101上的主备切换需要较长的时间。链路403和链路404可以连接设备101的同一物理端口,设备101经该同一物理端口可以同时从链路404接收数据和向链路403发送数据,该同一物理端口可以位于接口板203上,链路403和链路404可以是单根光纤上两个相反方向的链路,也可以是两根光纤上两个相反方向的链路。链路403和链路404还可以连接设备102的同一物理端口,设备102经设备102的该同一物理端口可以同时从链路403接收数据和向链路404发送数据,该设备102的同一物理端口可以位于设备102的接口板上,也可以位于设备102的收发器上。以上设备101和设备102进行端口切换是指设备101和设备102均将用于与对方双向通信的物理端口切换到另一个物理端口上。
图5为本申请实施例提供的一种通信方法的流程图。图5所示方法以图4所示设备101与设备102进行通信为例,包括如下内容。
S501、主用控制板201经由电子开关401和链路403向设备102发送通知消息。
设备101可以在初始化时、初次与设备102建立连接时或是其他执行主备切换前的任一时刻向设备102发送通知消息。该通知消息用于指示设备102在一段时间内避免向设备101发送告警消息。该告警消息用于通知设备101链路403发生故障。
通知消息可以包括用于标识设备101使用电子开关的标志位。在一个示例中,标志位为1个比特,标志位为0时表示设备101未使用电子开关,标志位为1时表示设备101使用了电子开关,标志位为1时指示设备102在一段时间内避免向设备101发送告警消息。设备102检测到通知消息中的标志位为1时,可以获知设备101使用了电子开关,也就是提前获知如果设备101执行主备切换,一段时间内从设备101接收的物理层信号将会出现不稳定,进而在检测到链路403发生故障后,在一段时间内避免向设备101发送告警消息。该一段时间的长度可以是预设的,例如由管理员或制造商根据电子开关401切换所需时间长度预先设定。在另一个示例中,标志位为多个比特,标志位的值指示该一段时间的长度,该标志位的值还可以指示设备101是否使用电子开关,例如该多个比特值为0时指示设备101未使用电子开关,为非0值时指示设备101使用了电子开关。设备102检测到通知消息中的标志位的值为非0值时,可以获知设备101使用了电子开关并且可以获知该一段时间的长度,设备102在检测到链路403发生故障后,在该一段时间的长度内避免向设备101发送告警消息。在另一个示例中,标志位为多个比特,标志位的值为一个索引值,设备102检测到通知消息中的该索引值时,可以获知设备101使用了电子开关并查找索引值对应的时间长度,该索引值对应的时间长度即为该一段时间的长度,例如索引值对应的时间长度为20纳秒(ns),则设备102在检测到链路403发生故障后,在20ns内避免向设备101发送告警消息。
设备102避免向设备101发送告警消息的方式可以是在检测到链路故障的一段时间内对于linkdown不做任何处理,或是对于接收到的local fault不做任何处理或者将接收到的local fault丢弃,也可以是在检测到链路故障的一段时间内抑制用于向设备101发送告警消息的告警发送模块,使告警发送模块失效一段时间,在这一段时间内不向设备101发送告警消息。
以上所述一段时间可以从设备102检测到链路403发生故障时开始,故障检测方式例如前述链路故障linkdown的检测方式。设备102在检测到链路403发生故障的一段时间内避免向设备101发送告警消息,由此设备101执行主备切换期间,即使设备101向设备102发送的物理层信号不稳定,也不会收到设备102发送的告警消息,这避免了设备101和设备102切换用于互相通信的端口。该告警消息是一种携带告警信息的报文,该告警信息用于指示链路发生故障。业务报文是不携带该告警信息的报文,业务报文可以用于在通信中交换数据。业务报文中可以携带通知消息。
S502、设备102经由链路403接收设备101发送的通知消息。
S503、设备101执行切换。
设备101执行切换,该切换可以是断开主用控制板201到电子开关401的连接,例如电路405,接通备用控制板202到电子开关401的连接,例如电路406。设备101执行切换例如是备用控制板202经电路410向电子开关401发送切换信号,切换信号用于触发电子开关401执行所述切换。
备用控制板202在检测到主用控制板201异常后,例如主用控制板201不在位或硬件异常,可以向电子开关401的主备选择管脚402发送切换信号,触发电子开关401执行上述切换。
设备101执行切换(例如电子开关401执行切换)的期间,设备102到设备101的流量(即业务报文)可以不中断,即设备102仍然可以向设备101发送业务报文。设备102可以经链路404向设备101发送业务报文,电子开关401接收到设备101发送的业务报文后,可以将接收的业务报文经电子开关401到主用控制板201的连接例如电路407向备用控制板201发送,以及将接收的业务报文经电子开关401到备用控制板202的连接例如电路408向备用控制板202发送。链路403和链路404可以连接设备101的同一物理端口。链路403和链路404还可以连接设备102的同一物理端口。
S504、当设备102检测到链路403发生故障后,在一段时间内避免向设备101发送告警消息。
如前所述,设备101执行主用控制板和备用控制板之间的切换期间,向设备102发送的物理层信号会出现不稳定,设备102会检测到链路403发生故障,例如该故障是linkdown并引发设备102产生local fault。设备102根据通知消息已经提前获知设备101执行主备切换期间会产生不稳定的物理层信号,为避免设备101和设备102进行端口切换,设备102在检测到链路403发生故障时,在一段时间内避免向设备101发送用于通知设备101链路403发生该故障的告警消息,该一段时间可以从设备102检测到链路403发生故障时开始。举例来说,设备102可以在检测到链路403发生linkdown时,启动定时器,定时器的时长是S501中所述一段时间的长度。参见前述对故障检测方式的描述,设备102可以持续根据从设备101接收的报文的编码信号判断linkdown是否仍然存在,例如当连续收到4个无效的编码组后就确定linkdown仍然存在。在定时器到时前,设备102避免向设备101发送告警消息。S504中避免发送告警消息的方式可参照S501中所述内容,在此不再赘述。设备101执行主备切换,断开主用控制板201到电子开关401的连接后,设备102将检测到链路403发生故障,启动定时器,在定时器到时前,避免向设备101发送告警消息,由此,虽然设备101执行主备切换期间产生了不稳定物理信号,但设备102并不会返回告警消息,进而不会引发设备101和设备102进行端口切换。
S505、备用控制板202经由电子开关401和链路403向设备102发送业务报文。
电子开关401完成切换后,备用控制板202经由备用控制板202到电子开关401的连接例如电路406,向电子开关401发送业务报文。电子开关401将接收自备用控制板202的业务报文经由链路403向设备102发送。
设备101完成主备切换后,备用控制板202经由电子开关401和链路403向设备102发送业务报文后,设备101和设备102之间的通信恢复正常。
链路403的故障可以由设备101执行主备切换导致,也可以由非主备切换的其他原因导致,例如设备101向设备102发送数据时使用的光模块损坏或是用做链路403的光纤断开。非主备切换的其他原因导致的链路故障的持续时间大于电子开关执行主备切换所需的时间。在非主备切换的其他原因导致链路发生故障的情况下,可以执行S506、S507和S508以便处理其他原因导致的链路故障。
S506、设备102确定在以上一段时间结束后,链路403的故障仍然存在,则经由链路404向设备101发送告警消息。
以上一段时间结束后,例如该定时器到时时,设备102可以检测链路403的故障是否仍然存在,在确定故障仍然存在的情况下,则表明故障不是由主备切换导致的,即设备101并未执行S503而是由非主备切换的原因导致链路403发生故障,则基于在该一段时间结束后仍然存在该故障,设备102经由链路404向设备101发送告警消息,以便通知设备101链路403发生故障,由此响应于非主备切换导致的链路故障,设备101和设备102进行端口切换以便恢复通信。在非主备切换的原因导致链路403发生故障的情况下,设备101未执行S503和S505,设备102执行S504检测到该其他原因导致的故障,在一段时间内避免发送告警消息,在该一段时间后如果故障仍然存在,即故障的持续时间超过了电子开关执行主备切换所需的时间,则向设备101发送告警消息,在该一段时间后如果故障已不存在,则不向设备101发送告警消息。S506中设备102检测链路403故障的方式,可以参见S504中对故障检测方式的描述。S506中设备102判断S504所述的一段时间是否结束,可以通过判断S504所述的定时器是否到时来实现。
S507、设备102执行端口切换;
设备102向设备101发送告警消息后,停止向设备101发送流量即停止向设备101发送报文,执行端口切换,将与设备101通信的端口切换到设备102的另一端口。
S508、设备101执行端口切换;
设备101接收到设备102发送的告警消息后,执行端口切换,将与设备102通信的端口切换到设备101的另一端口。由此响应于非主备切换的其他原因导致的链路故障,设备101和设备102进行端口切换,设备101使用设备101的另一端口与设备102的另一端口恢复通信。由此,图5所示方法不仅能够处理主备切换导致的链路故障,也能够处理非主备切换的其他原因导致的链路故障。
图5以设备101与设备102进行通信的方法进行举例,该方法也可以用于图1中设备102与设备5通信、设备102与设备101通信、设备101与设备103通信、设备103与设备104通信或者设备104与设备6通信。也就是说该方法可以用于接入层的盒式设备与其他盒式设备、汇聚层设备或核心层设备之间的通信,从而降低盒式设备上执行主备切换的耗时。
图4还示出了一种通信设备的结构,该通信设备包括主用控制板201、备用控制板202和电子开关401,其中主用控制板201、备用控制板202和电子开关401执行的功能可以参见图5所示方法所述。图4所示结构可以应用于接入层的任意盒式设备,例如图1中设备101、设备102、设备103和设备104中的一个或多个。图4以该结构应用于设备101为例,该通信设备内各部件的功能可以包括以下内容。
主用控制板201,用于经由电子开关401和链路403向设备102发送通知消息,通知消息用于指示设备102在一段时间内避免向设备101发送告警消息,告警消息用于通知设备101链路403发生故障,该一段时间从设备102检测到链路403发生故障时开始。
备用控制板202,用于触发电子开关401执行切换,该切换是指断开主用控制板201到电子开关401的第一连接例如电路405,接通备用控制板202到电子开关401的第二连接例如电路406。
备用控制板202,还用于经由该第二连接、电子开关401和链路403向设备102发送业务报文。
备用控制板202在触发电子开关401执行切换之前,还可以用于:检测到主用控制板201异常,向电子开关401发送切换信号,该切换信号用于触发电子开关401执行所述切换。
电子开关401在执行所述切换的期间,还可以用于:
经由设备102到设备101的链路404接收来自设备102的业务报文,链路403和链路404连接设备101的同一物理端口;
将接收自设备102的业务报文经由电子开关401到主用控制板201的第三连接,例如电路407,发送至主用控制板201;
将接收自设备102的业务报文经由电子开关401到备用控制板202的第四连接,例如电路408发送至备用控制板202。
电子开关401在所述一段时间后,还可以用于:经由设备102到设备101的链路404接收来自设备102的告警消息,告警消息用于通知设备101链路403发生故障。
通知消息可以包括标志位,该标志位标识设备101使用电子开关。
图6示出了一种通信设备的结构。图6所示结构可以应用于任意接入层盒式设备、汇聚层设备和核心层设备,例如图1中设备101、设备102、设备103和设备104中的一个或多个,当图1中不存在汇聚层使得接入层设备直接连接到核心层设备时,该结构还可以应用于设备12,设备13和设备14中的一个或多个,使得该通信设备与接入层盒式设备通信。图6以该结构应用于设备102为例,设备102与设备101通信时,设备101可以用作第一设备。图6所示通信设备包括用于存储指令的存储器602,以及与存储器耦合的处理器601。处理器601读取存储器602中存储的指令,执行图5所示方法中设备102执行的部分或全部操作。可选地,存储器602还可以集成到处理器601内部。该通信设备还可以包括收发器603,在该通信设备内部收发器603、处理器601和存储器602可以通过总线互相连接,或者当存储器602集成在处理器601内部时,收发器603直接与处理器601耦合。处理器601可以经收发器603接收其他设备发送的数据或是向其他设备发送数据,例如经收发器603从链路403接收通知消息和接收报文,例如经收发器603向链路404发送告警消息和发送报文。
处理器601可以是中央处理器(central processing unit,CPU),NP和LSW三者中任一个,或者三者中任意两个或三个的组合。处理器601可以是指一个处理器,也可以包括多个处理器。存储器602可以包括易失性存储器,例如RAM;存储器602也可以包括非易失性存储器,例如ROM,快闪存储器,HDD或SSD;存储器602还可以包括上述种类的存储器的组合。存储器602可以是指一个存储器,也可以包括多个存储器。收发器603可以是有线收发器,无线收发器或其组合。有线收发器例如可以为以太网接口。以太网接口可以是光接口,电接口或其组合。无线收发器例如可以为无线局域网收发器,蜂窝网络收发器或其组合。收发器例如可以为接口板。
图6所示通信设备的结构应用到盒式设备时,处理器和存储器可以位于主用控制板或备用控制板上,收发器可以位于接口板上,其中存储器也可以集成在处理器中。
本申请实施例中所描述的方法步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息,存储媒介还可以集成到处理器中。
应理解,在本申请的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如SSD)等。
本说明书的各个部分均采用递进的方式进行描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点介绍的都是与其他实施方式不同之处。尤其,对于装置和系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例部分的说明即可。

Claims (16)

1.一种通信方法,其特征在于,该方法包括:
第一设备中的主用控制板经由所述第一设备中的电子开关和所述电子开关到第二设备的第一链路向所述第二设备发送通知消息,所述通知消息用于指示所述第二设备在一段时间内避免向所述第一设备发送告警消息,所述告警消息用于通知所述第一设备所述第一链路发生故障,所述一段时间从所述第二设备检测到所述第一链路发生所述故障时开始;
所述第一设备断开所述主用控制板到所述电子开关的第一连接,接通备用控制板到所述电子开关的第二连接;
所述备用控制板经由所述第二连接、所述电子开关和所述第一链路向所述第二设备发送业务报文。
2.如权利要求1所述的方法,其特征在于,所述第一设备断开所述第一连接,接通所述第二连接之前,所述方法还包括:
所述备用控制板检测到所述主用控制板异常后,向所述电子开关发送切换信号,所述切换信号用于触发所述电子开关断开所述第一连接,接通所述第二连接。
3.如权利要求1或2所述的方法,其特征在于,所述第一设备断开所述第一连接和接通所述第二连接的期间,所述方法还包括:
所述电子开关经由所述第二设备到所述第一设备的第二链路接收来自所述第二设备的业务报文,所述第二链路和所述第一链路连接所述第一设备的同一物理端口;
所述电子开关将接收自所述第二设备的业务报文经由所述电子开关到所述主用控制板的第三连接发送至所述主用控制板;
所述电子开关将接收自所述第二设备的业务报文经由所述电子开关到所述备用控制板的第四连接发送至所述备用控制板。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述通知消息包括标志位,所述标志位标识所述第一设备使用电子开关。
5.一种通信方法,所述方法包括:
第二设备经由从第一设备到所述第二设备的第一链路接收所述第一设备发送的通知消息,所述通知消息用于指示所述第二设备在一段时间内避免向所述第一设备发送告警消息,所述告警消息用于通知所述第一设备所述第一链路发生故障,所述一段时间从所述第二设备检测到所述第一链路发生所述故障时开始;
在所述第二设备检测到所述第一链路发生所述故障后,在所述一段时间内所述第二设备避免向所述第一设备发送所述告警消息。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
在所述一段时间内,所述第二设备经由所述第二设备到所述第一设备的第二链路向所述第一设备发送业务报文,所述第二链路和所述第一链路连接所述第二设备的同一物理端口。
7.如权利要求5或6所述的方法,其特征在于,所述方法还包括:
所述第二设备确定所述故障在所述一段时间结束后仍存在;
基于在所述一段时间结束后仍存在的所述故障,所述第二设备经由所述第二设备到所述第一设备的第二链路向所述第一设备发送所述告警消息。
8.如权利要求5至7中任一项所述的方法,其特征在于,所述通知消息包括标志位,所述标志位标识所述第一设备使用电子开关。
9.一种通信设备,用作第一设备,其特征在于,所述第一设备包括主用控制板、备用控制板和电子开关;
所述主用控制板,用于经由所述电子开关和所述电子开关到第二设备的第一链路向所述第二设备发送通知消息,所述通知消息用于指示所述第二设备在一段时间内避免向所述第一设备发送告警消息,所述告警消息用于通知所述第一设备所述第一链路发生故障,所述一段时间从所述第二设备检测到所述第一链路发生所述故障时开始;
所述备用控制板,用于触发所述电子开关执行切换,所述切换是指断开所述主用控制板到所述电子开关的第一连接,接通所述备用控制板到所述电子开关的第二连接;
所述备用控制板,还用于经由所述第二连接、所述电子开关和所述第一链路向所述第二设备发送业务报文。
10.如权利要求9所述的通信设备,其特征在于,所述备用控制板在触发所述电子开关执行切换之前,还用于:
检测到所述主用控制板异常后,向所述电子开关发送切换信号,所述切换信号用于触发所述电子开关执行所述切换。
11.如权利要求9或10所述的通信设备,其特征在于,所述电子开关在执行所述切换的期间,还用于:
经由所述第二设备到所述第一设备的第二链路接收来自所述第二设备的业务报文,所述第二链路和所述第一链路连接所述第一设备的同一物理端口;
将接收自所述第二设备的业务报文经由所述电子开关到所述主用控制板的第三连接发送至所述主用控制板;
将接收自所述第二设备的业务报文经由所述电子开关到所述备用控制板的第四连接发送至所述备用控制板。
12.如权利要求9至11中任一项所述的通信设备,其特征在于,所述通知消息包括标志位,所述标志位标识所述第一设备使用电子开关。
13.一种通信设备,用作第二设备,其特征在于,所述第二设备包括:
存储器,该存储器包括指令;
与所述存储器耦合的处理器,所述处理器用于执行所述指令,从而:
经由从第一设备到所述第二设备的第一链路接收所述第一设备发送的通知消息,所述通知消息用于指示所述第二设备在一段时间内避免向所述第一设备发送告警消息,所述告警消息用于通知所述第一设备所述第一链路发生故障,所述一段时间从所述第二设备检测到所述第一链路发生所述故障时开始;
在检测到所述第一链路发生所述故障后,在所述一段时间内避免向所述第一设备发送所述告警消息。
14.如权利要求13所述的通信设备,其特征在于,所述处理器还用于执行所述指令,从而:
在所述一段时间内,经由所述第二设备到所述第一设备的第二链路向所述第一设备发送业务报文,所述第二链路和所述第一链路连接所述第二设备的同一物理端口。
15.如权利要求13或14所述的通信设备,其特征在于,所述处理器还用于执行所述指令,从而:
确定所述故障在所述一段时间结束后仍存在;
基于在所述一段时间结束后仍存在的所述故障,经由所述第二设备到所述第一设备的第二链路向所述第一设备发送所述告警消息。
16.如权利要求13至15中任一项所述的通信设备,其特征在于,所述通知消息包括标志位,所述标志位标识所述第一设备使用电子开关。
CN201810362435.9A 2018-04-20 2018-04-20 一种使用电子开关执行主备切换的通信方法和设备 Active CN110391928B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810362435.9A CN110391928B (zh) 2018-04-20 2018-04-20 一种使用电子开关执行主备切换的通信方法和设备
PCT/CN2019/082003 WO2019201124A1 (zh) 2018-04-20 2019-04-10 一种使用电子开关执行主备切换的通信方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810362435.9A CN110391928B (zh) 2018-04-20 2018-04-20 一种使用电子开关执行主备切换的通信方法和设备

Publications (2)

Publication Number Publication Date
CN110391928A CN110391928A (zh) 2019-10-29
CN110391928B true CN110391928B (zh) 2022-01-18

Family

ID=68239284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810362435.9A Active CN110391928B (zh) 2018-04-20 2018-04-20 一种使用电子开关执行主备切换的通信方法和设备

Country Status (2)

Country Link
CN (1) CN110391928B (zh)
WO (1) WO2019201124A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114363144B (zh) * 2020-09-28 2023-06-27 华为技术有限公司 一种面向分布式系统的故障信息关联上报方法及相关设备
CN113300885B (zh) * 2021-05-21 2022-04-26 湖南兴天电子科技有限公司 一种网络切换设备及方法
CN116170068B (zh) * 2021-11-25 2024-08-27 中国联合网络通信集团有限公司 无线通信系统及采用其进行故障处理的方法和设备
CN115914897B (zh) * 2023-03-09 2023-05-12 天津瑞利通科技有限公司 一种用于ptn设备的传输切换测试系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1881885A (zh) * 2005-06-17 2006-12-20 华为技术有限公司 一种网络交换设备及网络业务保护方法
CN1988566A (zh) * 2005-12-21 2007-06-27 华为技术有限公司 一种接入层设备中单板主备切换的方法
CN102739453A (zh) * 2012-07-03 2012-10-17 华为软件技术有限公司 主备切换方法、设备及系统
CN104683153A (zh) * 2015-03-09 2015-06-03 陈健强 一种集群路由器主备mpu控制方法及其系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100530996C (zh) * 2004-08-06 2009-08-19 华为技术有限公司 通信设备中实现单板主备倒换的系统及方法
CN101188822B (zh) * 2007-12-13 2010-09-08 上海华为技术有限公司 接口板主备倒换的方法、系统和能实现主备倒换的接口板
CN102006222B (zh) * 2010-11-16 2015-06-24 中兴通讯股份有限公司 一种业务链路切换方法及装置
CN102223304B (zh) * 2011-06-16 2014-08-27 杭州华三通信技术有限公司 用于主备倒换后持续转发的方法和装置
JP5481658B2 (ja) * 2011-06-17 2014-04-23 株式会社日立製作所 光通信システム、インタフェース盤、及び、制御方法
CN105871614A (zh) * 2016-03-31 2016-08-17 国网山西省电力公司信息通信分公司 一种通信设备中板卡的保护方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1881885A (zh) * 2005-06-17 2006-12-20 华为技术有限公司 一种网络交换设备及网络业务保护方法
CN1988566A (zh) * 2005-12-21 2007-06-27 华为技术有限公司 一种接入层设备中单板主备切换的方法
CN102739453A (zh) * 2012-07-03 2012-10-17 华为软件技术有限公司 主备切换方法、设备及系统
CN104683153A (zh) * 2015-03-09 2015-06-03 陈健强 一种集群路由器主备mpu控制方法及其系统

Also Published As

Publication number Publication date
CN110391928A (zh) 2019-10-29
WO2019201124A1 (zh) 2019-10-24

Similar Documents

Publication Publication Date Title
CN110391928B (zh) 一种使用电子开关执行主备切换的通信方法和设备
CN111372272B (zh) 无线桥接网络的异常恢复方法和装置
CN102104531B (zh) 一种报文处理装置、方法及系统
WO2020088351A1 (zh) 设备信息发送的方法、计算机设备和分布式计算机设备系统
US9100336B2 (en) Method for managing a switch chip port, main control board, switch board, and system
CN110661599B (zh) 一种主、备节点间的ha实现方法、装置及存储介质
CN105049238A (zh) 一种lte网关设备交换子系统的冗余备份方法和设备
CN102271049B (zh) 通信设备状态设置方法、装置和系统
US20230106077A1 (en) Distributed Storage System, Exception Handling Method Thereof, and Related Apparatus
CN115733729B (zh) 通信故障处理方法、系统及设备
CN108462588B (zh) 一种数据处理方法和设备
CN113438105B (zh) 一种辅助mad检测多irf分裂方法、装置及设备
JP5711420B2 (ja) イーサネットノードの検出フレームタイムアウト時間の設定方法及びシステム
CN111224803B (zh) 一种堆叠系统中多主检测方法及堆叠系统
US11563622B2 (en) Event-triggered adaptiveness to toggle timers/modes in fast-detection OAM protocols
CN101188503B (zh) 刀片服务器和刀片系统中的链路状态检测
CN110138657B (zh) 交换机间的聚合链路切换方法、装置、设备及存储介质
CN112788786A (zh) 网络连接的控制方法、终端及存储介质
JP2010136038A (ja) 伝送装置及び冗長構成部の系切替え方法
CN113573329A (zh) 节点控制的方法、系统以及装置
US10122588B2 (en) Ring network uplink designation
CN117434877B (zh) 周期性通信系统的冗余控制方法、执行器设备和存储介质
CN109983422B (zh) 用于管理电器的电力消耗的系统
WO2014079383A1 (zh) 故障检测方法及相关设备和堆叠系统
CN116260743A (zh) 链路检测方法、装置、智能网卡及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant