CN102098218B - 基于以太网组播的系统保活方法 - Google Patents
基于以太网组播的系统保活方法 Download PDFInfo
- Publication number
- CN102098218B CN102098218B CN2011100250520A CN201110025052A CN102098218B CN 102098218 B CN102098218 B CN 102098218B CN 2011100250520 A CN2011100250520 A CN 2011100250520A CN 201110025052 A CN201110025052 A CN 201110025052A CN 102098218 B CN102098218 B CN 102098218B
- Authority
- CN
- China
- Prior art keywords
- control module
- fault
- son
- backup
- main control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Small-Scale Networks (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于以太网组播的系统保活方法,主要涉及网络保活领域。其包括以下步骤:主控模块周期性地轮询子控模块,并根据子控模块的响应情况更新系统保活信息;备份子控模块替代所述故障子控模块;所述备份子控模块向所述主控模块报告状态,所述主控模块根据所述备份子控模块报告的状态更新系统保活信息。本发明提供了一种系统开销小的基于以太网组播的系统保活方法。其通信过程属于数据链路层通信,处理过程计算量小,占用网络带宽少,系统开销小。
Description
技术领域
本发明涉及网络系统保活领域,特别涉及一种基于以太网组播的系统保活方法。
背景技术
通信系统,如机框局域网系统,通常由多个系统板卡模块组成,同时也具备多个通信端口和通信链路,为了确保系统以较小的故障间隔时间长期不间断运行,这些板卡模块以冗余方式同时存在于系统中,进行相互备份或者负载分担,以提高设备可靠性。系统需要即时刷新各个模块的在位及运行情况的信息,如果模块正常运行,我们称其处于“活着”状态;如果模块出现故障,系统隔离故障模块,启用备份模块,以保证系统整体一直处于“活着”状态。目前,以太网是系统内部模块间互联的最常用技术之一。
获得系统内部模块是否处于“活着”状态的手段主要有以下两种:
1、故障模块主动告警:适用于单板卡设备,而且具备硬件告警通道,不适用于多板卡多模块互联设备,多板卡多模块设备一般不具备复杂的硬件告警通道,而且硬件告警通道能携带信息量有限。
2、消息通信:模块定时向系统管理方发送消息,告知系统我还活着;或者系统管理方定时轮询各个模块,认为有反馈消息的模块活着,数次未反馈的模块出现了故障。为了不中断语音、视频等流媒体的通信,这种消息通信需要在毫秒级交互,至少需要50毫秒级别甚至更短时间间隔的消息通信。
目前的消息通信方法主要有:
基于IP(Internet Protocol,互联网协议)广播,简单起见,可认为是IP广播,报文携带必要的模块信息在系统内广播;基于UDP(UserDatagram Protocol,用户数据协议)单播,创建专用的UDP端口,使用UDP报文携带模块信息通信。
IP广播属于网络安全模型中的第3层通信,即网络层通信;UDP单播属于网络安全模型中的第4层通信,即传输层通信。以UDP单播为例,其通信信息首先在应用层封装为消息,然后交给传输层增加UDP协议头,然后交给网络层增加IP头,然后交给数据链路层增加帧头,最后通过物理层发送。接收方收到上述信息后,按照相反顺序逐层解封装,最后得到原始的通信信息。封装和解封装过程,会产生大量的计算;封装过程导致的数据长度增长,会占用较多的网络带宽。因此,采用传统的消息通信方法进行系统保活,会产生较多的系统开销
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是如何提供一种系统开销小的基于以太网组播的系统保活方法。从而避免通信过程中,信息多次封装导致的计算量增加和对网络带宽的过多占用。
(二)技术方案
本发明的基于以太网组播的系统保活方法,包括以下步骤:
S1:主控模块周期性地轮询子控模块,并根据子控模块的响应情况更新系统保活信息;
S2:备份子控模块替代所述故障子控模块;
S3:所述备份子控模块向所述主控模块报告状态,所述主控模块根据所述备份子控模块报告的状态更新系统保活信息。
优选地,所述主控模块和子控模块间通信帧符合以太网标准格式,所述通信帧包含帧头、帧类型、数据字段和校验信息。
优选地,所述帧头包含6字节的目的MAC地址,6字节的源MAC地址,4字节的PRI TAG字段和2字节的帧长度字段。
优选地,所述目的MAC地址为数据链路层地址0x01:80:c2:00:00:02~0x01:80:c2:00:00:2d中之一或者为0x01:80:c2:00:00:2f。
优选地,所述S2具体包括以下步骤:所述备份子控模块与所述故障子控模块在故障前周期性地执行握手通信,当握手通信中断时,所述备份子控模块认为所述故障子控模块出现故障,从而替代所述故障子控模块。
优选地,所述S2具体包括以下步骤:所述主控模块将故障信息发送给所述备份子控模块,所述备份子控模块替代所述故障子控模块。
优选地,所述S2具体包括以下步骤:所述主控模块周期性地将所述保活信息发送给所有备份子控模块,备份子控模块接收到自身对应子控模块的故障信息后,替代所述故障子控模块。
优选地,所述主控模块和子控模块均以主备竞争模式或者双活模式存在于所述系统中。
优选地,在所述S1之前还包括以下步骤:系统上电,激活所述主控模块和子控模块。
优选地,所述S1中,主控模块周期性地轮询子控模块具体包括:所述主控模块通过发送请求request组播通信帧周期性地轮询所述子控模块;
所述子控模块的响应情况包括:正常子控模块通过发送响应response单播通信帧响应所述轮询,故障子控模块不响应所述轮询。
(三)有益效果
本发明的基于以太网组播的系统保活方法,其通信过程属于数据链路层通信,其处理过程计算量小,占用网络带宽少,系统开销小。另外,以太网组播地址为标准MAC地址,具有明显特征,便于交换芯片和网卡硬件识别。
附图说明
图1是本发明实施例所述基于以太网组播的系统保活方法的流程图;
图2是本发明实施例所述方法中通信帧的数据结构图;
图3是本发明实施例所述方法中帧头的数据结构图;
图4是本发明实施例所述方法中数据字段的数据结构图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
机框局域网系统,通常由多个系统板卡模块组成。这些板卡模块大致可以划分为主控模块和子控模块,主控模块在实现本发明的基于以太网组播的系统保活方法过程中,主要负责系统中保活信息(如各板块模块是否在线、是否运行正常)的汇总,指令下发(如命令备用模块替代故障模块)和决策控制(如判断决策子控模块是否出现故障、是否需要发出告警)。在系统中一般会部署一个或者两个逻辑功能相同的主控模块。子控模块是用来实现具体逻辑功能(如语音信息的接收和转发、视频信息的接收和转发)的板卡模块,其负责提供保活信息,指令中继及执行,决策控制中继及执行。
图1是本发明所述基于以太网组播的系统保活方法的流程图,参见图1,其主要包括以下步骤:
S1:主控模块周期性地轮询子控模块,并根据子控模块的响应情况更新系统保活信息;
在本步骤中,所述子控模块的响应情况为正常子控模块响应所述轮询,故障子控模块不响应所述轮询;
S2:备份子控模块替代所述故障子控模块;
S3:所述备份子控模块向所述主控模块报告状态,所述主控模块根据所述备份子控模块报告的状态更新系统保活信息。
所述S2和S3中,所述备份子控模块是指与所述故障子控模块对应的以主备竞争模式或者双活模式存在于所述系统中的子控模块。所述S2之前,主控模块还可以发出告警,并记录在系统日志中。
本发明的基于以太网组播的系统保活方法,在主控模块和子控模块的通信过程中,通信信息在应用层被封装为消息后直接交给数据链路层,经过数据链路层封装为帧,然后交给物理层发送给接收方;接收方按照相反的顺序逐层解封装得到上述信息。与传统的通信过程相比,发送过程减少了传输层和网络层的封装过程,接收过程相应减少传输层和网络层的解封装过程。并且,由于封装过程的减少,帧格式中少了IP头、TCP/UPD协议头。因此,本发明的基于以太网组播的系统保活方法,其通信过程计算量小,占用网络带宽少,系统开销小。
图2是本发明实施例所述通信帧的数据结构图,参见图2,优选地,所述主控模块和子控模块间通信帧符合以太网标准格式,所述通信帧包含帧头1、帧类型2、数据字段3和校验信息4。帧类型2写入固定值0xAA55,表示通信帧的内容与系统保活相关(以下将这种通信帧简称保活帧)。通信帧采用以太网标准格式,直接使用现有的以太网通信协议,便于本发明方案的推广。
图3是本发明实施例所述帧头的数据结构图,参见图3,优选地,所述帧头1包含6字节的目的MAC地址1.1,6字节的源MAC地址1.2,4字节的PRI TAG字段1.3和2字节的帧长度字段1.4。PRI TAG字段1.3中前两个字节为固定值0x8100;后两个字节中包括4比特的优先级字段和12比特的VLAN ID(虚拟局域网识别)字段。优先级字段的取值范围为0~7,可以根据系统定义取0或者7表示最高优先级,以确保保活帧在系统中优先传输;VLAN ID字段根据系统定义取值,当其取值为0时,表示无VLAN。帧长度字段1.4用于标识该通信帧的长度,其值为数据字段3的长度加上20个字节。
优选地,所述目的MAC地址1.1为数据链路层地址0x01:80:c2:00:00:02~0x01:80:c2:00:00:2d 中之一或者为0x01:80:c2:00:00:2f。MAC地址0x01:80:c2:00:00:02~0x01:80:c2:00:00:2f中,除0x01:80:c2:00:00:2e保留给链路汇聚协议使用外,其余地址可供本发明所述保活方法任意使用,方便了本发明方法的实施。
优选地,所述S2具体包括以下步骤:所述备份子控模块与所述故障子控模块在故障前周期性地执行握手通信,当握手通信中断时,所述备份子控模块认为所述故障子控模块出现故障,从而替代所述故障子控模块。
优选地,所述S2具体包括以下步骤:所述主控模块将故障信息发送给所述备份子控模块,所述备份子控模块替代所述故障子控模块。主控模块通过轮询获得保活信息后进行处理,视未响应的子控模块出现故障,并将对应的故障信息发送给相应的备份子控模块。
优选地,所述S2具体包括以下步骤:所述主控模块周期性地将所述保活信息发送给所有备份子控模块,备份子控模块接收到自身对应子控模块的故障信息后,替代所述故障子控模块。保活信息包括所有子控模块是否运行正常的状态信息,当备份子控模块接收到的信息显示,与自己以主备竞争或者双活模式存在的子控模块运行不正常时,备份子控模块视为收到自身对应子控模块的故障信息。
图4是本发明实施例所述数据字段3的数据结构图,参见图4,优选地,所述数据字段3包括一个或者多个消息3.1,所述消息3.1包括消息类型3.1.1、消息长度3.1.2和消息值3.1.3。本发明方法的通信帧中数据字段只包含消息3.1,无附加的IP头、TCP/UPD协议头等数据。因此,其通信帧中有效信息比率高,且没有多次的封装过程,减少了计算量和对网络带宽的占用。
优选地,所述消息类型3.1.1包括:request(请求),response(响应),report(报告)和command(命令)。本发明方法的消息类型包括但不限于request,response,report和command。总体来讲,消息类型较少,便于实施,系统开销小。
优选地,所述校验信息4为CRC32校验信息。采用CRC32校验方法对通信帧的数据进行校验,保证了帧中数据的准确度。
优选地,所述主控模块和子控模块均以主备竞争模式或者双活模式存在于所述系统中。主控模块以主备竞争模式存在于系统中,是指在系统中同时设置两个主控模块A和B,其中A处于启用状态,B处于备用状态,当A出现故障时,系统将A隔离,同时由B代替A完成系统任务。主控模块以双活模式存在于系统中,是指在系统中同时设置两个均处于启用状态的主控模块A和B,A和B分担系统任务,当A出现故障时,系统将A隔离,由B独立完成系统任务。子控模块按照与主控模块相似的主备竞争模式或者双活模式存在于系统中。其区别在于,在一个系统中会同时存在多个具有不同逻辑功能的子控模块。
优选地,在所述S1之前还包括以下步骤:系统上电,激活所述主控模块和子控模块。
优选地,所述S1中,主控模块周期性地轮询子控模块具体包括:所述主控模块通过发送请求request组播通信帧周期性地轮询所述子控模块;所述子控模块的响应情况包括:正常子控模块通过发送响应response单播通信帧响应所述轮询,故障子控模块不响应所述轮询。request组播通信帧是指以组播方式发送出的消息类型为request的通信帧;response单播通信帧是指以单播方式发送出的消息类型为response的通信帧。为了减少链路带宽的占用,正常子控模块在响应主控模块的轮询时,从接收到的request通信帧中提取源MAC地址,该源MAC地址为主控模块的MAC地址,以此MAC地址封装response通信帧。这是一个单播帧,点到点发送给主控模块。主控模块如果指定某个子控模块执行指令时,也可以向其发送单播帧,方式相同。单播帧与组播帧的区别在于目的MAC地址不同,前者为某个具体模块的MAC地址,后者为组播MAC地址。适当的使用单播帧进行通信可以有效减少对链路带宽的占用。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (9)
1.一种基于以太网组播的系统保活方法,其特征在于,所述系统保活方法包括以下步骤:
S1:主控模块周期性地轮询子控模块,并根据子控模块的响应情况更新系统保活信息;
S2:备份子控模块替代所述故障子控模块;
S3:所述备份子控模块向所述主控模块报告状态,所述主控模块根据所述备份子控模块报告的状态更新系统保活信息;
所述S1中,主控模块周期性地轮询子控模块具体包括:所述主控模块通过发送请求request组播通信帧周期性地轮询所述子控模块;
所述子控模块的响应情况包括:正常子控模块通过发送响应response单播通信帧响应所述轮询,故障子控模块不响应所述轮询。
2.如权利要求1所述的系统保活方法,其特征在于,所述主控模块和子控模块间通信帧符合以太网标准格式,所述通信帧包含帧头、帧类型、数据字段和校验信息。
3.如权利要求2所述的系统保活方法,其特征在于,所述帧头包含6字节的目的MAC地址,6字节的源MAC地址,4字节的PRITAG字段和2字节的帧长度字段。
4.如权利要求3所述的系统保活方法,其特征在于,所述目的MAC地址为数据链路层地址0x01:80:c2:00:00:02~0x01:80:c2:00:00:2d中之一或者为0x01:80:c2:00:00:2f。
5.如权利要求1所述的系统保活方法,其特征在于,所述S2具体包括以下步骤:所述备份子控模块与所述故障子控模块在故障前周期性地执行握手通信,当握手通信中断时,所述备份子控模块认为所述故障子控模块出现故障,从而替代所述故障子控模块。
6.如权利要求1所述的系统保活方法,其特征在于,所述S2具体包括以下步骤:所述主控模块将故障信息发送给所述备份子控模块,所述备份子控模块替代所述故障子控模块。
7.如权利要求1所述的系统保活方法,其特征在于,所述S2具体包括以下步骤:所述主控模块周期性地将所述保活信息发送给所有备份子控模块,备份子控模块接收到自身对应子控模块的故障信息后,替代所述故障子控模块。
8.如权利要求1所述的系统保活方法,其特征在于,所述主控模块和子控模块均以主备竞争模式或者双活模式存在于所述系统中。
9.如权利要求1所述的系统保活方法,其特征在于,在所述S1之前还包括以下步骤:系统上电,激活所述主控模块和子控模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100250520A CN102098218B (zh) | 2011-01-21 | 2011-01-21 | 基于以太网组播的系统保活方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100250520A CN102098218B (zh) | 2011-01-21 | 2011-01-21 | 基于以太网组播的系统保活方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102098218A CN102098218A (zh) | 2011-06-15 |
CN102098218B true CN102098218B (zh) | 2013-07-17 |
Family
ID=44131090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011100250520A Expired - Fee Related CN102098218B (zh) | 2011-01-21 | 2011-01-21 | 基于以太网组播的系统保活方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102098218B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102223258B (zh) * | 2011-08-02 | 2013-10-23 | 杭州华三通信技术有限公司 | 一种防止bfd会话中断的方法和设备 |
CN103973595B (zh) * | 2014-05-19 | 2017-11-14 | 新华三技术有限公司 | 一种链路存活确定方法、交换机及控制器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1321004A (zh) * | 2000-04-25 | 2001-11-07 | 华为技术有限公司 | 交换机的主备倒换方法及其实现装置 |
CN1567737A (zh) * | 2003-07-01 | 2005-01-19 | 深圳市中兴通讯股份有限公司 | 一种宽带接入服务器热备份的方法 |
CN1983841A (zh) * | 2006-05-11 | 2007-06-20 | 华为技术有限公司 | 一种级连系统及实现备份的方法 |
CN101447900A (zh) * | 2008-12-15 | 2009-06-03 | 华为技术有限公司 | 一种建立双向转发检测的方法、系统及设备 |
CN101938417A (zh) * | 2010-09-01 | 2011-01-05 | 中兴通讯股份有限公司 | 板卡主备配置的实现方法和板卡 |
-
2011
- 2011-01-21 CN CN2011100250520A patent/CN102098218B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1321004A (zh) * | 2000-04-25 | 2001-11-07 | 华为技术有限公司 | 交换机的主备倒换方法及其实现装置 |
CN1567737A (zh) * | 2003-07-01 | 2005-01-19 | 深圳市中兴通讯股份有限公司 | 一种宽带接入服务器热备份的方法 |
CN1983841A (zh) * | 2006-05-11 | 2007-06-20 | 华为技术有限公司 | 一种级连系统及实现备份的方法 |
CN101447900A (zh) * | 2008-12-15 | 2009-06-03 | 华为技术有限公司 | 一种建立双向转发检测的方法、系统及设备 |
CN101938417A (zh) * | 2010-09-01 | 2011-01-05 | 中兴通讯股份有限公司 | 板卡主备配置的实现方法和板卡 |
Also Published As
Publication number | Publication date |
---|---|
CN102098218A (zh) | 2011-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105450489B (zh) | 输出优先实现最短报文的HEBus高效现场总线系统及通信方法 | |
EP2086178A1 (en) | Link aggregation method, device, mac frame receiving/sending method and system | |
CN111818138B (zh) | 面向智能车的车云实时数据通信方法 | |
US9774932B2 (en) | Method and apparatus for data packet switching, access switch and switching system | |
CN101341450B (zh) | 数据周期性传输的方法、通信网络及控制单元 | |
CN102917286A (zh) | 一种epon接入系统中的手拉手保护倒换方法和系统 | |
CN105052081A (zh) | 通信流量处理架构和方法 | |
CN105656645A (zh) | 堆叠系统的故障处理的决策方法和装置 | |
CN105978762A (zh) | 冗余以太网数据传输设备、系统及方法 | |
CN106453541A (zh) | 一种数据同步的方法、服务器以及数据同步系统 | |
CN102916874B (zh) | 一种报文发送方法及设备 | |
CN107864099A (zh) | 一种异构fc网络的流量控制方法及系统 | |
CN105827485A (zh) | 基于prp和hsr网络的节点通信状态监视方法 | |
CN203883860U (zh) | 一种校园网的网络通信架构 | |
CN102035688A (zh) | 一种快速控制网络链路访问设计方法 | |
CN102098218B (zh) | 基于以太网组播的系统保活方法 | |
CN102438017A (zh) | 基于路由功能的Modbus和BACnet Ethernet协议转化装置及转化方法 | |
CN103685065A (zh) | 一种基于时间的通信调度方法 | |
CN115226100A (zh) | 一种基于5g的工业异构网络边缘网关 | |
CN107612714A (zh) | 一种自动拓扑结构实现方法及系统 | |
CN111163003A (zh) | 一种无线多控制域sdn网络的拓扑发现方法 | |
CN111585791B (zh) | 一种数据同步配置方法、系统及存储介质 | |
CN110933385B (zh) | 基于可见光单向网络隔离的视频流传输系统 | |
CN110324205B (zh) | 一种监听方法、监听装置、电子设备及存储介质 | |
CN101090353A (zh) | 基于嵌入式以太网技术的led显示屏数据通信设备和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
PP01 | Preservation of patent right | ||
PP01 | Preservation of patent right |
Effective date of registration: 20180823 Granted publication date: 20130717 |
|
PD01 | Discharge of preservation of patent | ||
PD01 | Discharge of preservation of patent |
Date of cancellation: 20210823 Granted publication date: 20130717 |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130717 Termination date: 20200121 |