CN106982160A - 链路非对称网闸双机热备系统及主备切换方法 - Google Patents

链路非对称网闸双机热备系统及主备切换方法 Download PDF

Info

Publication number
CN106982160A
CN106982160A CN201710140410.XA CN201710140410A CN106982160A CN 106982160 A CN106982160 A CN 106982160A CN 201710140410 A CN201710140410 A CN 201710140410A CN 106982160 A CN106982160 A CN 106982160A
Authority
CN
China
Prior art keywords
gateway
terminal
standby
primary
vrrp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710140410.XA
Other languages
English (en)
Other versions
CN106982160B (zh
Inventor
杨旭东
左明阳
陆彦辉
陈云锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN TIPTOP INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN TIPTOP INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN TIPTOP INFORMATION TECHNOLOGY Co Ltd filed Critical SHENZHEN TIPTOP INFORMATION TECHNOLOGY Co Ltd
Priority to CN201710140410.XA priority Critical patent/CN106982160B/zh
Publication of CN106982160A publication Critical patent/CN106982160A/zh
Application granted granted Critical
Publication of CN106982160B publication Critical patent/CN106982160B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • H04L69/163In-band adaptation of TCP data exchange; In-band control procedures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Abstract

本公开提供了一种链路非对称网闸双机热备系统及主备切换系方法。所述系统包括:主用网闸和备用网闸其中一个作为备用;当所述主用网闸内端机切换为备用网闸内端机时,通过TCP协议通知所述主用网闸外端机切换为备用网闸外端机,当所述主用网闸外端机切换为备用网闸外端机时,通过TCP协议通知所述主用网闸内端机切换为备用网闸内端机;当所述备用网闸内端机通过所述VRRP协议检测不到主用网闸内端机的心跳,且当所述备用网闸外端机通过所述VRRP协议检测不到主用网闸外端机的心跳时,所述备用网闸内端机与所述备用网闸外端机之间通过TCP协议协商后,分别切换成主用网闸内端机和主用网闸外端机。

Description

链路非对称网闸双机热备系统及主备切换方法
技术领域
本公开涉及计算机网络技术领域,尤其涉及一种链路非对称网闸双机热备系统及主备切换方法。
背景技术
随着互联网经济的快速发展,信息化是当今世界发展的一大趋势,也是我国产业结构优化升级,实现工业和现代化、增强国际竞争力与综合国力的关键环节。信息的保密性、完整性和可用性对保持竞争优势,资金流动、企业效益、商业形象、客户权益和个人隐私都是至关重要的。网闸(Netgap)全名为安全隔离网闸,是一种在不同等级网络间借助物理隔离进行数据安全交换的网络设备。同时,网闸也是连接不同安全等级网络之间的唯一桥梁,一旦网闸设备出现单点故障(Single Points of Failures,简称SPOFs),整个被保护网络对外的传输和交换业务将会受到巨大影响,甚至可能会引起整个网络的瘫痪。因此,衡量一个网闸的负载能力和可靠性是网闸应用中的一个关键指标。双机热备技术为解决网闸单点故障
(Single Points of Failures,简称SPOFs)提供了可靠保障,研究网闸的双机热备技术对提高网闸的负载能力和可靠性具有非常重要的意义。
发明内容
本公开在基于VRRP1.0协议和原网闸双机热备系统链路完全对称结构的基础上,提出了一种链路非对称结构网闸双机热备系统以及主备切换方法,使得网闸的切换性能能够得到显著的提升。相比现有技术中完全对称结构的网闸解决方案,解决了链路切换容易“锁死”的问题,并且还具有链路收敛速度快,多线程并行处理程序结构简单等优点,同时还可以自主设置网闸组ID(HAID),提高网闸热备组的安全性。
为了达到上述目的,根据本公开的一方面,提出一种链路非对称结构网闸双机热备系统,所述系统包括:
主用网闸和至少一个备用网闸;所述主用网闸包括主用网闸内端机和主用网闸外端机;所述备用网闸包括备用网闸内端机和备用网闸外端机;
其中,所述主用网闸内端机和主用网闸外端机之间、以及所述备用网闸内端机和备用网闸外端机之间通过TCP协议进行相互通信协商;而所述主用网闸内端机和备用网闸内端机之间、以及主用网闸外端机和备用网闸外端机之间通过VRRP协议进行心跳监测;
当所述主用网闸内端机切换为备用网闸内端机时,通过TCP协议通知所述主用网闸外端机切换为备用网闸外端机,当所述主用网闸外端机切换为备用网闸外端机时,通过TCP协议通知所述主用网闸内端机切换为备用网闸内端机;
当所述备用网闸内端机通过所述VRRP协议检测不到主用网闸内端机的心跳,且当所述备用网闸外端机通过所述VRRP协议检测不到主用网闸外端机的心跳时,所述备用网闸内端机与所述备用网闸外端机之间通过TCP协议协商后,分别切换成主用网闸内端机和主用网闸外端机。
可选地,所述主用网闸内端机向所述备用网闸内端机定时发送并随时接收VRRP心跳包,所述主用网闸外端机向所述备用网闸外端机定时发送并随时接收VRRP心跳包。
可选地,所述备用网闸内端机向所述备用网闸内端机定时发送VRRP心跳包,所述备用网闸外端机向所述备用网闸外端机定时发送VRRP心跳包。
可选地,所述主要网闸内端机检测到所述主用网闸外端机切换至备用网闸外端机后,切换为备用网闸内端机。
可选地,在无主用网闸、主用网闸丢线或者主用网闸不参考VRRP协议时,选择优先级最高的备用网闸切作为主用网闸。
可选地,所述链路非对称网闸双机热备系统采用抢占模式和非抢占模式作为备机竞选机制,在抢占模式下,优先级最高的备用网闸切换成主用网闸,当前主用网闸切换成备用网闸;在非抢占模式下,只有主用网闸发生故障时,主用网闸切换至备用网闸。
根据本公开另一方面,提供了一种链路非对称网闸双机热备系统的主备切换方法,所述链路非对称网闸双机热备系统包括主用网闸和至少一个备用网闸;所述主用网闸包括主用网闸内端机和主用网闸外端机;所述备用网闸包括备用网闸内端机和备用网闸外端机;所述方法包括:
在所述主用网闸内端机切换为备用网闸内端机时,通过TCP协议通知所述主用网闸外端机切换为备用网闸外端机;
在所述主用网闸外端机切换为备用网闸外端机时,通过TCP协议通知所述主用网闸内端机切换为备用网闸内端机;
在所述备用网闸内端机通过所述VRRP协议检测不到主用网闸内端机的心跳,且在所述备用网闸外端机通过所述VRRP协议检测不到主用网闸外端机的心跳时,所述备用网闸内端机与所述备用网闸外端机之间通过TCP协议进行协商;
在写上通过后,所述备用网闸内端机与所述备用网闸外端机分别切换成主用网闸内端机和主用网闸外端机。
可选地,所述主用网闸内端机向所述备用网闸内端机定时发送并随时接收VRRP心跳包,所述主用网闸外端机向所述备用网闸外端机定时发送并随时接收VRRP心跳包。
可选地,所述备用网闸内端机向所述备用网闸内端机定时发送VRRP心跳包,所述备用网闸外端机向所述备用网闸外端机定时发送VRRP心跳包。
可选地,所述主要网闸内端机检测到所述主用网闸外端机切换至备用网闸外端机后,切换为备用网闸内端机。
本公开链路非对称结构网闸双机热备系统及数据处理方法主要通过同网端网闸间VRRP协议心跳包监测和网闸内外处理器间TCP协议双重协商机制来确保网闸的主备机切换。而不是当前如现有技术中所采用的完全对称结构,通过心跳线简单监测网闸内外端机的状态和主备网闸间处理机状态。解决了网闸“单设备双系统”特性下,目前“单设备单系统”高可用(High availability)方案无法适用这一难题,并且,本公开告别了完全对称结构交叉切换“锁死”的情况,使网闸的切换性能得到了显著的提升。
附图说明
图1为根据本公开一实施例的链路非对称结构网闸双机热备系统的拓扑图;
图2为根据本公开一实施例的链路非对称结构网闸双机热备系统的结构演进图;
图3为根据本公开一实施例的链路非对称结构网闸双机热备系统的模块图;
图4(a)-(b)为根据本公开一实施例的链路非对称结构网闸双机热备系统的主备切换数据处理方法流程图;
图5为根据本公开一实施例的链路非对称结构网闸双机热备主备切换的流程图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
已有技术中,利用热备份路由器协议(Hot standby Router Protocol,HSRP)和虚拟路由器冗余协议(Virtual Router Redundancy Protocol,VRRP)设计了基于网闸的热备协议(GAP-VRRP),实现对网闸的热备功能,但其方案中其实只是在网闸内网一端实现了热备,主网闸和备网闸之间只有内端机间心跳线相连,网闸内外端处理器间通过心跳相互监测(如:图2中结构1所示),这样就存在一个明显的不足,当主备网闸内网端间心跳线出现故障时,将会导致“双主”现象,有可能会导致系统崩溃。
为了解决上述提到的会导致“双主”现象的问题,额可以增加主备网闸间外端机间的心跳监测,网闸内外端机和主被网闸内外端机间都通过心跳协议进行检测,形成网闸热备方案,如图2中结构2所示。但是由于这种方案协议结构完全对称,在两网闸内外端机同时处理数据交叉切换时,容易出现“锁死”现象。
因此,本公开公开实施例在此基础上又对以上方案进行改进,提出了链路非对称结构网闸双机热备系统,如图2中结构3所示,本公开提出的链路非对称结构网闸双机热备系统避免了程序的“锁死”现象,并且使网闸的切换性能上得到显著提升。
如图1所示,本公开实施例提出了一种链路非对称结构网闸双机热备系统,该系统主要应用于如图2所示的链路非对称结构网闸高可用拓扑结构中。
根据本公开一实施例的链路非对称结构网闸双机热备系统,如图1所示,所述链路非对称结构网闸双机热备系统包括:主用网闸和备用网闸,其中,主用网闸和备用网闸都由两套独立的高性能处理系统分别作为内端机和外端机,即所述主用网闸包括主用网闸内端机和主用网闸外端机;所述备用网闸包括备用网闸内端机和备用网闸外端机。
由于网闸属于“单设备双系统”设备,考虑到网闸的双机热备和设计,根据本公开一实施例的链路非对称结构网闸双机热备系统模块图,如图2所示,整个双机热备系统包括主用网闸和备用网闸,主备网闸都由内外端机构成,主、备网闸间互为热备。
其中,所述主用网闸内端机和主用网闸外端机之间、以及所述备用网闸内端机和备用网闸外端机之间通过TCP协议进行相互通信协商;而所述主用网闸内端机和备用网闸内端机之间、以及主用网闸外端机和备用网闸外端机之间通过VRRP协议进行心跳监测;
当所述主用网闸内端机切换为备用网闸内端机时,通过TCP协议通知所述主用网闸外端机切换为备用网闸外端机,当所述主用网闸外端机切换为备用网闸外端机时,通过TCP协议通知所述主用网闸内端机切换为备用网闸内端机;
当所述备用网闸内端机通过所述VRRP协议检测不到主用网闸内端机的心跳,且当所述备用网闸外端机通过所述VRRP协议检测不到主用网闸外端机的心跳时,所述备用网闸内端机与所述备用网闸外端机之间通过TCP协议协商后,分别切换成主用网闸内端机和主用网闸外端机。
如图2中网闸热备系统中结构3所示,可以把主用(master)网闸内端机用A1表示、外端机用B1来表示,备用(backup)网闸内端机按备用网闸内端机A2表示、外端机按备用网闸外端机B2来表示,其热备系统特征在于,所述方法包括:
主用网闸内端机A1和主用网闸外端机B1之间通过开启TCP协议来进行相互通信协商,备用网闸内端机A2和备用网闸外端机B2之间通过开启TCP协议来进行相互通信协商;主用网闸内端机A1和备用网闸内端机A2之间通过VRRP协议包进行通信,主用网闸外端机B1和备用网闸外端机B2之间通过VRRP协议包进行通信,协议规则如下:
当自身为master时,如果处理机A(主用网闸内端机A1/备用网闸内端机A2)成为了backup/fault,那么通知将处理机B(主用网闸外端机B1/备用网闸外端机B2)也成为backup,反之亦然;
当自身为backup时,以处理机主用网闸内端机A1举例,只有在同时满足主用网闸内端机A1、备用网闸内端机A2间协商条件和主用网闸内端机A1、主用网闸外端机B1间协商条件时才会变为master(即:双重协商条件),其他处理机亦然。
处理机处于backup状态时只接收VRRP包,处于master状态时定时发送,并且随时接收VRRP包。
由此可以看出,四台处理机热备协议处于非对称结构,也可以说是一种协商式的结构,解决了完全对称结构下交叉切换时容易“锁死”的问题,提高了网闸的切换性能。
当主用网闸内端机或外端机出现故障或宕机时,主用网闸变为备用状态(backup),备用网闸能够迅速转变为主用状态(master)并完全接管主网闸的现有全部业务,保证数据安全可靠的传输和交换。
由于网闸的双向传输特性,网闸的内外端机都要进行类似的数据处理和数据同步来保障网闸正常的数据交换。
基于网闸的“单设备双系统”的特性,网闸的双机热备其特征下,在出现故障时通过网闸内、外端机间协调使网闸内、外端机保持统一的主备状态;
在网闸的双机热备协议下,网闸内、外端机保持统一的主备状态是通过利用网闸内外端机进行TCP通信协商机制进行的。内端机为主控端作TCP通信服务器端,外端机为TCP通信的客户端,当自身当前要状态改变时,协议相互发送自己要变为的状态,当服务器端(客户端)接收到客户端(服务器端)状态跟自己想要状态(主/备状态)相同时,则一块变为该状态,不同时,则同时变为备机状态。也就是说,只要内外端机其一为想做备机,则内外端机一块作备机。
基于网闸的“单设备双系统”的特性,网闸的双机热备其特征下,在出现故障时,最短的时间内保证主机宕机后备用网闸进行向主机状态和业务的切换;
热备系统通过VRRP(Virtual Router Redundancy Protocol)心跳包进行主备网闸间的协议通信,主网闸内端机与备网闸内端机通过与内网交换机相连或通过HA(心跳口)直接相连来进行心跳监测。心跳包包括主备机优先级(Priority)、组ID(HAID)、虚拟IP、虚拟MAC、认证方式、广播间隔(adver_interval),校验和等内容。通过匹配HAID和优先级信息的比较来确定网闸状态为主机或备机。
在网闸处于备机状态时引入了一个与优先级相关的漂移时间T当经过时间T=(3×adver_interval+(256-Priority)/256)秒,仍未收到主网闸发来的心跳包时,则认为主机宕机,再经过备用网闸内外端处理机间的协商符合条件后一块变为主机状态。
基于网闸的“单设备双系统”的特性,网闸的双机热备其特征下,在出现故障时双机热备下四个系统间的状态监测及切换机制;
热备系统的状态监测主要硬件状态监测和主备机状态监测。硬件状态监测主要指热备端口的状态监测、数据端口的状态监测和网卡的状态监测,硬件状态出错则用fault表示。主备机状态(master/backup)监测主要指使网闸主备机间的状态变化,并通过VRRP包(网闸与网闸间的通信)和网闸内外端机间通信协商机制进行判定主备状态的切换。
可配置的网闸热备组ID(HAID)可以使网闸自动识别是否是热备组网闸发来心跳包,若匹配是则接收,不匹配则丢弃,避免了局域网内其它非热备组的VRRP包对热备组造成干扰,提高了网闸热备的可靠性和安全性。
基于网闸的“单设备双系统”的特性,网闸的双机热备其特征下,在出现故障时主备网闸间切换和数据同步;
网闸业务同步包括数据同步和配置同步,当网闸处于主机状态时,网闸的数据传输和交换需要把自己的配置和业务数据同步到备用网闸,用来防止主网闸出现故障,在主备网闸切换时网闸业务丢失的情况。网闸配置同步:在主网闸业务配置更改时会及时同步到备用网闸以更新备用网闸的配置情况;数据业务的同步:主网闸正在进行业务的传输和交换时,备用网闸会及时缓存所传业务数据,当主用网闸出现故障或宕机时,备用网闸则会切换为主机状态并进行数据的续传或重传。
由于两台网闸互为热备时,备用网闸突然出现故障或异常,必将导致热备功能的作用失败。此发明方案中热备系统还配置了异常故障的警告和日志记录功能。当网闸处于热备状态时,网闸出现异常故障则会发出警告,并自动录于网闸故障日志。
下面通过具体的实施例来阐述上述链路非对称结构网闸双机热备系统的实现方式。
在具体实现双机备份时,通过在主用网闸内外端机、备用网闸内外端机上分别加载下述模块来完实现双机热备:VRRP发送模块、VRRP接收模块、Peer_to_peer接收模块、设备状态监控模块和主程序模块。
其中,VRRP发送模块和VRRP接收模块用于主、备网闸间用心跳线相连来监测主备网闸所处优先级、VHID等信息;Peer_to_peer接收模块属于网闸内外端机间通信模块,主要负责网闸内外网状态的监测和接收;设备状态监控模块主要用于宕机监测,网口、网卡通断监测;主程序模块主要负责根据其它模块的状态变换信息来控制本端机所处状态及状态转换工作。
根据本公开的另一方面,还提出一种链路非对称结构网闸双机热备主备切换方法,该方法包括以下步骤:
在所述主用网闸内端机切换为备用网闸内端机时,通过TCP协议通知所述主用网闸外端机切换为备用网闸外端机;
在所述主用网闸外端机切换为备用网闸外端机时,通过TCP协议通知所述主用网闸内端机切换为备用网闸内端机;
在所述备用网闸内端机通过所述VRRP协议检测不到主用网闸内端机的心跳,且在所述备用网闸外端机通过所述VRRP协议检测不到主用网闸外端机的心跳时,所述备用网闸内端机与所述备用网闸外端机之间通过TCP协议进行协商;
在协商通过后,所述备用网闸内端机与所述备用网闸外端机分别切换成主用网闸内端机和主用网闸外端机。
下面通过具体的实施方式说明实现链路非对称结构网闸双机热备主备切换的流程,如图5所示。
步骤1:进行网闸双机热备系统VRRP发送模块、VRRP接收模块、Peer_to_peer接收模块、设备状态监控模块的初始化工作(如图3所示,除主程序外的其它线程的初始化)。即,以上初始化的四个模块我们用线程来表示,并且各线程的主要工作内容为:
线程1:VRRP发送线程(VRRP发送/接收指主备网闸间的通信),主要负责组建VRRP包(以太网头+VRRP报文);定时发送VRRP包(间隔1秒);输出发送状态信息。
线程2:VRRP接收线程,主要负责接收VRRP包,设置超时,判断超时与否;接收并解析VRRP数据包,校验HAID,并与自己优先级进行比较;输出接收状态信息(优先级、接收超时,校验HAID(网闸互备组ID)是否匹配,不匹配则丢弃,视为干扰包)。
线程3:Peer_to_Peer接收线程(peer_to_peer接收/发送指网闸内部内外端机间通信),主要负责心跳监测(监测网闸内外端机SOCKET通信是否正常。并设置定时检测和超时);监听并接收peer端机(Peer端机指网闸内/外端机的统称,内外端机相互通信)发来的状态,给主线程状态转换作参考。
线程4:设备状态监测线程,主要负责测试应用口(即:虚拟IP口)状态是否正常;测试HA口(即:热备口)状态是否正常;测试获取网卡信息是否正常。
步骤2:根据VRRP发送模块、VRRP接收模块、Peer_to_peer接收模块、设备状态监控模块初始化反馈的信息完成双机热备系统主程序模块的初始化工作。
主程序模块初始化流程如图4(a)所示,其主要负责读取配置文件,监测配置是否正确,初始化变量;向peer主机发送本机状态信息(网闸内外端机间的通信);根据各线程动态进行状态监控,确定当前网闸自身端机的主/备状态。最后,如果确认自身将切换为主机状态时,则利用虚拟IP技术发送免费ARP广播包来实现由备用网闸向主用网闸状态的切换。
其中,当网闸处于热备状态时,如果主用网闸任意处理机(内端机/外端机)出现故障(网线断掉、宕机重启、内外端机通信故障),网闸对端处理机都会通过TCP协议进行通信了解对方情况,并切网闸两处理机同时转为备用状态。备用网闸根据主备网闸间的心跳线监测主用网闸出现故障(一般是一定时间收不到心跳包则认定主用网闸同端处理器出现故障),然后自己再跟本网闸对端机进行TCP通信,告诉对端机自己想要变为主机状态,由于网闸另一侧也用心跳线相连,对端机也会收到主用网闸故障的消息,并且也会通知对端机自己也要变为主机,因此,备用网闸的两处理机都会收到对端机要变主机的消息,如果对端恰好和自己意愿相同,则处理机变为主机,这样两处理器就做到了同时变为主机状态。
步骤3:根据VRRP发送模块、VRRP接收模块、Peer_to_peer接收模块、设备状态监控模块的实时监控信息和主程序模块的初始化信息完成工双机热备系统主程序模块中主、备机状态流程的数据处理,最终确定主备机状态。
主程序模块主备机状态转换流程如图4(b)所示,当网闸在主程序初始化流程(如图4(a)中)初始化判定为主机状态时,主机状态将会继续监测各子线程的变化,用来随时准备主/备机的切换。主机状态程序流程如图4(a)所示。其主要任务是:开启数据同步;定期发送VRRP心跳包通告备用网闸自己处于Master状态;响应对虚拟IP地址的ARP请求(响应的是热备接口的真实MAC地址);接收到比自己的优先级大的VRRP报文或自身设备不正常时,才会转为Backup状态。
当网闸在主程序初始化流程(如图4(a)中)初始化判定为备机状态时,备机状态也将会继续监测各子线程的变化,用来随时准备主/备机的切换。其主要任务是:接收Master发送的VRRP广播报文,从中了解Master;接收到VRRP报文,如果收到报文的优先级为0或接收超时,将状态设置为Master,开始发送报文;如果收到报文优先级小于本地优先级而且本地设置了抢占方式,一段时间后转为Master状态否则正常接收;网闸处于Backup状态,当间隔(3×adver_interval+(256-Priority)/256)秒没有收到Master发来的VRRP报文,则认为当前的Master已经Down掉,将自己转为Master状态,发送VRRP报文。
运行VRRP协议的VRRP网闸对外组成一个虚拟网闸,其中之一处于Master状,称为主控网闸或主用网闸,而其它的处于backup状态,称为备用网闸。起初没有主控网闸,或者主控网闸丢线,再或者主控网闸不参考VRRP协议,那么将选择一个优选级最高的备份网闸成为主控网闸。
运行VRRP协议的VRRP网闸对外组成一个虚拟网闸,其中之一处于Master状,称为主控网闸或主用网闸,而其它的处于backup状态,称为备用网闸。起初没有主控网闸,或者主控网闸丢线,再或者主控网闸不参考VRRP协议,那么将选择一个优选级最高的备份网闸成为主控网闸,这需VRRP的竞选机制来维护各个VRRP网闸的状态。
为强化热备系统的可靠性和稳定性,本公开实施例中还提供了可供选择的双机热备系统的备机竞选机制。该竞选机制可分为抢占模式和非抢占模式。抢占模式即:严格按优先级级别,优先级高的抢占为主机(主机状态时发送VRRP包优先级为自己的优先级,优先级高的做主机)。非抢占模式即:设备做为主机时不再受优先级别影响,只有在发生故障时才会转为备机状态。(网闸为主机状态时发送VRRP包优先级为最大值255)。
此发明方案中热备系统还配置了异常故障的警告和日志记录功能。当网闸处于热备状态时,网闸出现异常故障则会发出警告,并自动录于网闸故障日志。
为了测试本公开实施例提出的链路非对称网闸双机热备系统的有效性,专门搭建了如图1拓扑所示的测试系统,并在网闸、服务器、客户端上搭建了相应的业务环境,需要用到硬件设备如下:网闸2台;交换机2台;PC机两台(一台作内网服务器,一台作外网服务器);网线六根。另外,测试可以分为两类,第一类是:热备程序的关闭、网线插拔等宕机测试,用来测试双机热备程序软件诊测和主备切换的正确性。第二类是:软件辅助测试,用网闸文件共享同步功能来测试双机在发生主/备切换时数据业务是否丢失。最后,保证业务配置和测试数据准确无误的情况下,做了如表1所示的以下测试,并给出了相应测试结果。并且各种模拟交叉切换的故障场景实验,测试结果均十分理想,程序未出现“锁死”现象。由测试结果可知,该双机热备系统能够对我们所发生的各种故障进行检测,并能够相应地完成各种故障切换,系统的切换时间都在和文献中的故障切换时间(2-4秒)范围之内。由此表明该发明方案的合理性和可靠性。
表1
通过上述技术方案可知,本公开实施例中链路非对称结构网闸双机热备系统及数据处理方法主要通过同网端网闸间VRRP协议心跳包监测和网闸内外处理器间TCP协议双重协商机制来确保网闸的主备机切换。而不是当前如现有技术中所采用的完全对称结构,通过心跳线简单监测网闸内外端机的状态和主备网闸间处理机状态。解决了网闸“单设备双系统”特性下,目前“单设备单系统”高可用(High availability)方案无法适用这一难题,并且,本公开告别了完全对称结构交叉切换“锁死”的情况,使网闸的切换性能得到了显著的提升。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种链路非对称网闸双机热备系统,其特征在于,包括:主用网闸和至少一个备用网闸;所述主用网闸包括主用网闸内端机和主用网闸外端机;所述备用网闸包括备用网闸内端机和备用网闸外端机;
其中,所述主用网闸内端机和主用网闸外端机之间、以及所述备用网闸内端机和备用网闸外端机之间通过TCP协议进行相互通信协商;而所述主用网闸内端机和备用网闸内端机之间、以及主用网闸外端机和备用网闸外端机之间通过VRRP协议进行心跳监测;
当所述主用网闸内端机切换为备用网闸内端机时,通过TCP协议通知所述主用网闸外端机切换为备用网闸外端机,当所述主用网闸外端机切换为备用网闸外端机时,通过TCP协议通知所述主用网闸内端机切换为备用网闸内端机;
当所述备用网闸内端机通过所述VRRP协议检测不到主用网闸内端机的心跳,且当所述备用网闸外端机通过所述VRRP协议检测不到主用网闸外端机的心跳时,所述备用网闸内端机与所述备用网闸外端机之间通过TCP协议协商后,分别切换成主用网闸内端机和主用网闸外端机。
2.如权利要求1所述的系统,其特征在于,所述主用网闸内端机向所述备用网闸内端机定时发送并随时接收VRRP心跳包,所述主用网闸外端机向所述备用网闸外端机定时发送并随时接收VRRP心跳包。
3.如权利要求1或2所述的系统,其特征在于,所述备用网闸内端机向所述备用网闸内端机定时发送VRRP心跳包,所述备用网闸外端机向所述备用网闸外端机定时发送VRRP心跳包。
4.如权利要求1或2所述的系统,其特征在于,所述主要网闸内端机检测到所述主用网闸外端机切换至备用网闸外端机后,切换为备用网闸内端机。
5.如权利要求1或2所述的系统,其特征在于,在无主用网闸、主用网闸丢线或者主用网闸不参考VRRP协议时,选择优先级最高的备用网闸切作为主用网闸。
6.如权利要求1或2所述的系统,其特征在于,所述链路非对称网闸双机热备系统采用抢占模式和非抢占模式作为备机竞选机制,在抢占模式下,优先级最高的备用网闸切换成主用网闸,当前主用网闸切换成备用网闸;在非抢占模式下,只有主用网闸发生故障时,主用网闸切换至备用网闸。
7.一种链路非对称网闸双机热备系统的主备切换方法,所述链路非对称网闸双机热备系统包括主用网闸和至少一个备用网闸;所述主用网闸包括主用网闸内端机和主用网闸外端机;所述备用网闸包括备用网闸内端机和备用网闸外端机;其特征在于,所述方法包括:
在所述主用网闸内端机切换为备用网闸内端机时,通过TCP协议通知所述主用网闸外端机切换为备用网闸外端机;
在所述主用网闸外端机切换为备用网闸外端机时,通过TCP协议通知所述主用网闸内端机切换为备用网闸内端机;
在所述备用网闸内端机通过所述VRRP协议检测不到主用网闸内端机的心跳,且在所述备用网闸外端机通过所述VRRP协议检测不到主用网闸外端机的心跳时,所述备用网闸内端机与所述备用网闸外端机之间通过TCP协议进行协商;
在协商通过后,所述备用网闸内端机与所述备用网闸外端机分别切换成主用网闸内端机和主用网闸外端机。
8.如权利要求7所述的方法,其特征在于,所述主用网闸内端机向所述备用网闸内端机定时发送并随时接收VRRP心跳包,所述主用网闸外端机向所述备用网闸外端机定时发送并随时接收VRRP心跳包。
9.如权利要求7或8所述的方法,其特征在于,所述备用网闸内端机向所述备用网闸内端机定时发送VRRP心跳包,所述备用网闸外端机向所述备用网闸外端机定时发送VRRP心跳包。
10.如权利要求7或8所述的方法,其特征在于,所述主要网闸内端机检测到所述主用网闸外端机切换至备用网闸外端机后,切换为备用网闸内端机。
CN201710140410.XA 2017-03-10 2017-03-10 链路非对称网闸双机热备系统及主备切换方法 Active CN106982160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710140410.XA CN106982160B (zh) 2017-03-10 2017-03-10 链路非对称网闸双机热备系统及主备切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710140410.XA CN106982160B (zh) 2017-03-10 2017-03-10 链路非对称网闸双机热备系统及主备切换方法

Publications (2)

Publication Number Publication Date
CN106982160A true CN106982160A (zh) 2017-07-25
CN106982160B CN106982160B (zh) 2019-07-19

Family

ID=59337980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710140410.XA Active CN106982160B (zh) 2017-03-10 2017-03-10 链路非对称网闸双机热备系统及主备切换方法

Country Status (1)

Country Link
CN (1) CN106982160B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109474478A (zh) * 2018-12-14 2019-03-15 厦门市美亚柏科信息股份有限公司 用于监测传输数据异常的方法、装置和系统
CN109547873A (zh) * 2018-11-26 2019-03-29 北京奇安信科技有限公司 一种基于单向光闸的实现双机热备的处理方法及装置
CN110266795A (zh) * 2019-06-20 2019-09-20 上海思询信息科技有限公司 一种基于Openstack平台控制方法
CN111934912A (zh) * 2020-07-15 2020-11-13 浙江中控技术股份有限公司 双主机隔离网关的热备冗余系统及控制方法
CN112702439A (zh) * 2020-12-31 2021-04-23 北京天融信网络安全技术有限公司 网闸状态同步方法及隔离网闸
CN112822039A (zh) * 2020-12-31 2021-05-18 英赛克科技(北京)有限公司 双机热备系统主备模式切换的方法
CN113938319A (zh) * 2021-12-03 2022-01-14 北京天融信网络安全技术有限公司 一种数据传输方法及单向网闸
CN114979036A (zh) * 2022-05-31 2022-08-30 山东中网云安智能科技有限公司 一种基于心跳和隔离交换矩阵的网闸的双机热备系统
CN115022084A (zh) * 2022-07-18 2022-09-06 深圳市城市交通规划设计研究中心股份有限公司 一种网络隔离网闸数据交换方法及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103368902A (zh) * 2012-03-27 2013-10-23 湖南亲安网络科技有限公司 数据交互方法
CN103491072A (zh) * 2013-09-06 2014-01-01 北京信息控制研究所 一种基于双单向隔离网闸的边界访问控制方法
CN105007272A (zh) * 2015-07-21 2015-10-28 陈巨根 一种具有安全隔离的信息交换系统
CN105656902A (zh) * 2016-01-15 2016-06-08 深圳市利谱信息技术有限公司 一种基于光传输的单向可靠传输及控制系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103368902A (zh) * 2012-03-27 2013-10-23 湖南亲安网络科技有限公司 数据交互方法
CN103491072A (zh) * 2013-09-06 2014-01-01 北京信息控制研究所 一种基于双单向隔离网闸的边界访问控制方法
CN105007272A (zh) * 2015-07-21 2015-10-28 陈巨根 一种具有安全隔离的信息交换系统
CN105656902A (zh) * 2016-01-15 2016-06-08 深圳市利谱信息技术有限公司 一种基于光传输的单向可靠传输及控制系统

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109547873A (zh) * 2018-11-26 2019-03-29 北京奇安信科技有限公司 一种基于单向光闸的实现双机热备的处理方法及装置
CN109474478B (zh) * 2018-12-14 2022-04-29 厦门市美亚柏科信息股份有限公司 用于监测传输数据异常的方法、装置和系统
CN109474478A (zh) * 2018-12-14 2019-03-15 厦门市美亚柏科信息股份有限公司 用于监测传输数据异常的方法、装置和系统
CN110266795A (zh) * 2019-06-20 2019-09-20 上海思询信息科技有限公司 一种基于Openstack平台控制方法
CN111934912A (zh) * 2020-07-15 2020-11-13 浙江中控技术股份有限公司 双主机隔离网关的热备冗余系统及控制方法
CN111934912B (zh) * 2020-07-15 2022-08-19 浙江中控技术股份有限公司 双主机隔离网关的热备冗余系统及控制方法
CN112702439A (zh) * 2020-12-31 2021-04-23 北京天融信网络安全技术有限公司 网闸状态同步方法及隔离网闸
CN112822039A (zh) * 2020-12-31 2021-05-18 英赛克科技(北京)有限公司 双机热备系统主备模式切换的方法
CN112702439B (zh) * 2020-12-31 2022-11-15 北京天融信网络安全技术有限公司 网闸状态同步方法及隔离网闸
CN112822039B (zh) * 2020-12-31 2023-05-23 英赛克科技(北京)有限公司 双机热备系统主备模式切换的方法
CN113938319A (zh) * 2021-12-03 2022-01-14 北京天融信网络安全技术有限公司 一种数据传输方法及单向网闸
CN113938319B (zh) * 2021-12-03 2024-02-20 北京天融信网络安全技术有限公司 一种数据传输方法及单向网闸
CN114979036A (zh) * 2022-05-31 2022-08-30 山东中网云安智能科技有限公司 一种基于心跳和隔离交换矩阵的网闸的双机热备系统
CN114979036B (zh) * 2022-05-31 2024-05-10 山东中网云安智能科技有限公司 一种基于心跳和隔离交换矩阵的网闸的双机热备系统
CN115022084A (zh) * 2022-07-18 2022-09-06 深圳市城市交通规划设计研究中心股份有限公司 一种网络隔离网闸数据交换方法及其应用
CN115022084B (zh) * 2022-07-18 2022-11-25 深圳市城市交通规划设计研究中心股份有限公司 一种网络隔离网闸数据交换方法及其应用

Also Published As

Publication number Publication date
CN106982160B (zh) 2019-07-19

Similar Documents

Publication Publication Date Title
CN106982160B (zh) 链路非对称网闸双机热备系统及主备切换方法
US10567340B2 (en) Data center system
CN110912780B (zh) 一种高可用集群检测方法、系统及受控终端
US10523539B2 (en) Method and system of resiliency in cloud-delivered SD-WAN
US10257019B2 (en) Link aggregation split-brain detection and recovery
US10200278B2 (en) Network management system control service for VXLAN on an MLAG domain
US6728780B1 (en) High availability networking with warm standby interface failover
CN1980230B (zh) 对vrrp组进行管理的方法
US6763479B1 (en) High availability networking with alternate pathing failover
US7639605B2 (en) System and method for detecting and recovering from virtual switch link failures
US6732186B1 (en) High availability networking with quad trunking failover
Sidki et al. Fault tolerant mechanisms for SDN controllers
US9385944B2 (en) Communication system, path switching method and communication device
CN102984057B (zh) 一种多业务一体化双冗余网络系统
CN105656645B (zh) 堆叠系统的故障处理的决策方法和装置
US20070067462A1 (en) Information processing apparatus, communication load decentralizing method, and communication system
US11307945B2 (en) Methods and apparatus for detecting, eliminating and/or mitigating split brain occurrences in high availability systems
WO2012019464A1 (zh) 路由器集群中板间互联的装置及方法
CN108306777A (zh) 基于sdn控制器的虚拟网关主备切换方法及装置
US20160205033A1 (en) Pool element status information synchronization method, pool register, and pool element
CN112787960A (zh) 一种堆叠分裂的处理方法、装置、设备及存储介质
CN113839862A (zh) Mclag邻居之间同步arp信息的方法、系统、终端及存储介质
CN105049238A (zh) 一种lte网关设备交换子系统的冗余备份方法和设备
US20200028731A1 (en) Method of cooperative active-standby failover between logical routers based on health of attached services
CN103607306B (zh) 多机热备用系统的切换方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant