发明内容
为此,发明人提供一种快速处理冗余备份事件的一种LTE网关设备交换子系统的冗余备份方法和对应的设备。
所述一种LTE网关设备交换子系统的冗余备份方法,包括以下步骤:
将业务板上的两个端口分别与两个交换板的第一以太网接口连接,所述的两个交换板中与业务板连接使能的交换板为第一交换板,另一交换板为第二交换板,第二交换板备份第一交换板中的配置信息;
将两个交换板的第二以太网接口与外部主机连接;
监测交换板与外部主机之间第二以太网接口的中断状态,所述中断为第二以太网接口连接断开时触发的中断;
当发生所述中断时,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由第一交换板切换到第二交换板。
进一步,还包括以下步骤:
监测第一交换板与业务板之间第一以太网接口的中断状态,所述中断为第一交换板和业务板连接的第一以太网接口连接断开时触发的中断;
当发生所述中断时,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由第一交换板切换到第二交换板。
进一步,包括以下步骤:
判断当第一交换板的缓存中的外部主机对应的MAC地址在设定的时间内是否刷新;
若有刷新,则第一交换板与外部主机之间的链路通信正常;
若没有,则第一交换板发起ARP探测,若ARP探测成功,则第一交换板与外部主机之间的链路通信正常;
若失败,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由当前交换板切换到备用交换板。
进一步,还包括以下步骤:
判断第一交换板的硬件温度,若第一交换板的硬件温度达到设定值,将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,则将网关设备的负责数据链路的交换板由当前交换板切换到备用交换板。
发明人还提供了一种LTE网关设备交换子系统,包括第一交换板,第二交换板,至少一对互为主业务板和备用业务板的业务板;
所述交换板具有第二以太网接口和至少2个第一以太网接口,所述交换板分别通过各自的第二以太网接口与外部主机连接,所述业务板通过交换板第一以太网接口与交换板连接;
所述的两个交换板中与业务板连接使能的交换板为第一交换板,另一交换板为第二交换板,第二交换板用于备份第一交换板中的配置信息;
所述第一交换板还用于监测第一交换板上的第二以太网接口中断,当其第二以太网接口发生中断时,将第二交换板与外部主机的连接使能,将第二交换板与外部主机的连接使能,并使第二交换板负责数据链路交换功能。
进一步,所述第一交换板还用于监测第一交换板与业务板之间第一以太网接口的中断状态,所述中断为第一交换板和业务板连接的第一以太网接口连接断开时触发的中断;
当发生所述中断时,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由第一交换板切换到第二交换板。
进一步,所述第一交换板还用于缓存外部主机的MAC地址,当所述MAC地址在设定的时间内有刷新,则第一交换板与外部主机之间的链路通信正常;若在设定的时间内没有刷新,则第一交换板发起ARP探测,若ARP探测成功,则第一交换板与外部主机之间的链路题哦那些正常;若ARP探测失败,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由当前交换板切换到备用交换板。
进一步,所述第一交换板还用于判断其自身的硬件温度,若第一交换板的硬件温度达到设定值时,将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,则将网关设备的负责数据链路的交换板由当前交换板切换到备用交换板。
区别于现有技术,上述技术方案中由于物理端口状态的变化情况是以中断的方式报告给软件的功能完整性监控模块,所以感知到事件的延迟非常低,在10毫秒以内。因此本发明能快速的启动备用交换板。因而故障恢复时间短响应及时,保证了网关设备的健壮性。
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
请参阅图2,图2示为本发明的一种ATCA机箱的硬件安装方式,LTE网关由ATCA机箱、交换板和业务板三个主要部分组成,其中ATCA机箱的用于给各个业务板卡供电并提供背板通道,其中交换板的用于提供最终的业务物理接口并汇聚进出的业务数据流,交换板的功能中最基础的就是二层转发;其中业务板用于流量转发以及隧道业务和各种接入业务的处理。在多数的实施例中,交换板为1对,业务板至少有1对;例如ATCA机箱为6槽或14槽时,业务板分别为2对和6对。一对交换板互为主备交换板,每对业务板互为主备业务板。LTE网关设备提供的业务包括IP包三层转发、IPsec隧道封装解封装以及加解密、NAT网络地址转换、访问策略控制、GTP-U的IP隧道封装解封装业务。在各个具体的业务模块软件实现的时候,将对业务板的物理端口透明,只能看到逻辑层面的聚合端口。在6槽ACTA机箱里面,除了有2个槽位给交换板使用外,最多可以有4块业务板。在14槽ATCA机箱里面,除了有2个槽位给交换板使用外,最多可以有12块业务板。通常,每张交换板都和所有业务板组成星型结构,两张交换板在机箱内部和所有业务板就组成了双星型结构。两个星型结构的内部网络互为备份,当一张交换板出现故障的时候,另一张交换板接替继续工作不影响业务。
请参考图3,图3中示例了本发明的部分硬件的连接方式和第一交换板使能时的信息交换的情况,第二交换板的连接和信息交换情况未在图中出现,但第二交换板的连接方式参考第一交换板。如图所示交换板通过各自的第二以太网接口与外部主机连接,所述多个业务板通过交换板第一以太网接口与交换板连接。图中业务板A和业务板B互为一对主备业务板。在其他实施例中主备业务板可能有多对,其连接方式参考业务板A和业务板B。当业务板A作为用于实现LTE业务处理,而业务板B主要用于备份业务板A上的数据,则此时业务板A为主业务板,业务板B为备用业务板。所述的第一交换板与主主业务板连接使能,所述第二交换板用于备份第一交换板的配置信息。
参考图5,发明人提供了一种用于LTE网关设备交换子系统的冗余备份方法包括以下步骤:
将业务板上的两个端口分别与两个交换板的第一以太网接口连接,所述的两个交换板中与业务板连接使能的交换板为第一交换板,另一交换板为第二交换板,第二交换板备份第一交换板中的配置信息;
将两个交换板的第二以太网接口与外部主机连接;
监测交换板与外部主机之间第二以太网接口的中断状态,所述中断为第一交换板和外部主机连接的第二以太网接口连接断开时触发的中断;
当发生所述中断时,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由第一交换板切换到第二交换板。所述外部主机在某些情况下也被称为外部网络设备。第一交换板和第二交换板互为主备。通过上述方法切换后,上述第二交换板变为主交换板,或也称为第一交换板,上述第一交换板变为备用交换板,或也称为第二交换板。
第一交换板实时监控其和业务板之间连接即第二以太网接口的连接情况,如果原来是连接(Link-up)状态的第二以太网接口突然变成断开(Link-down)状态,那么就表示交换板的功能是不完整的,就可能会引起第一第二交换板之间的切换。以太网接口正常工作就处于link-up状态,在主要的实施例中,以太网接口的速率协商失败或者网线松掉就处于link-down状态,状态变化触发硬件以中断事件的形式报告给系统。再通过系统调用的方法接收板卡物理端口状态变化的中断报告的事件。
由于物理端口状态的变化情况是以中断的方式报告给软件的功能完整性监控模块,所以感知到事件的延迟非常低,在10毫秒以内。因此本发明能快速的启动备用交换板。因而故障恢复时间短响应及时,保证了网关设备的健壮性。
发明人在另一些实施例里还监测交换板与业务板之间第一以太网接口的中断状态,所述中断为第一交换板和业务板连接的第一以太网接口连接断开时触发的中断;当发生所述中断时,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由第一交换板切换到第二交换板。
在某些实施例中,为了描述方便,第一以太网口和第二以太网口也被称为端口;
处于备用状态下的第二交换板的被监控端口都被设置为shutdown(关闭)状态。当发生主备交换板切换的时候,由备用交换板切换为主交换的被监控端口被设置为noshutdown(开启)状态也称作使能状态,由主交换板切换为备用交换板的被监控端口被设置为shutdown状态,也称作去能。另外一旦发生主备交换板切换事件,LTE网关设备将向网管系统发出严重告警,通知网络管理人员进行交换板的功能完整性检查,消除网络不能使用的隐患。
该方法通过中断的方法判断交换板和业务板之间的网络连接,中断通知缩短了发现接口断开的时间,进而缩短了故障恢复时间,保证了网关设备的健壮性。并且该方法在检测过程中不需要依赖于发送的心跳包或者特定的报文,进而降低了对网络带宽的占用。
发明人还提供一种用于LTE网关设备交换子系统的冗余备份方法,该方法可以单独作为冗余备份的方法,也可以配合前述的方法使用。参考图6,所述方法包括以下步骤:
判断当第一交换板的缓存中的外部主机对应的MAC地址在设定的时间内是否刷新;
若有刷新,则第一交换板与外部主机之间的链路通信正常;
若没有,则第一交换板发起ARP探测,若ARP探测成功,则第一交换板与外部主机之间的链路通信正常;
若失败,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由当前交换板切换到备用交换板。
当使用本方法时,通常由网络管理员指定对端的外部网络设备(外部主机)的IP地址并指定当对应的MAC地址缓存项不存在时定时发送ARP探测的时间间隔。
上述步骤方法中,通过MAC地址在缓存中的更新时刻判断与外部主机的连接是否是正常的,若超过设定时间未刷新外部主机对应的MAC地址,则认为外部主机与交换板之间的连接断开,进而进一步通过ARP探测进一步确定。当确定ARP连接断开时,此时需要启动备用交换板即第二交换板。
上述方法通过外部主机MAC地址的刷新时刻得知与外部主机的连接状况,当超过设定时间还未刷新,才启动ARP探测,整个过程中添加的通信数据包较少,相比其他方法能降低了对网络带宽的占用。
发明人提供一种用于LTE网关设备交换子系统的冗余备份方法在某些实施例中还包括以下步骤:
判断第一交换板的硬件温度,若第一交换板的硬件温度达到设定值,将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,则将网关设备的负责数据链路的交换板由当前交换板切换到备用交换板。
在一些网关设备交换板的芯片硬件有比较严格的工作温度要求,可以把交换板的工作温度列入交换板健康状况的考察范围。由网关设备开发人员根据交换板硬件的工作温度要求设定作为主备交换板切换条件的门限值。
发明人提供了一种LTE网关设备的交换子系统用于实施网关冗余备份方法,请参考图1~4,该子交换系统包括第一交换板,第二交换板,至少一对互为主业务板和备用业务板的业务板;
所述交换板具有第二以太网接口和至少2个第一以太网接口,所述交换板分别通过各自的第二以太网接口与外部主机连接,所述业务板通过交换板第一以太网接口与交换板连接;
所述的两个交换板中与业务板连接使能的交换板为第一交换板,另一交换板为第二交换板,第二交换板用于备份第一交换板中的配置信息;
所述第一交换板还用于监测第一交换板上的第二以太网接口中断,当其第二以太网接口发生中断时,将第二交换板与外部主机的连接使能,将第二交换板与外部主机的连接使能,并使第二交换板负责数据链路交换功能。
该子系统通过中断的方法判断交换板和业务板之间的网络连接,中断通知缩短了发现接口断开的时间,进而缩短了故障恢复时间,保证了网关设备的健壮性。并且该方法在检测过程中不需要依赖于发送的心跳包或者特定的报文,进而降低了对网络带宽的占用。
在另一些实施例中,发明人提供的一种LTE网关设备的交换子系统中,所述第一交换板还用于监测第一交换板与业务板之间第一以太网接口的中断状态,所述中断为第一交换板和业务板连接的第一以太网接口连接断开时触发的中断;
当发生所述中断时,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由第一交换板切换到第二交换板。
在另一些实施例中,发明人提供的一种LTE网关设备的交换子系统中,所述第一交换板还用于缓存外部主机的MAC地址,当所述MAC地址在设定的时间内有刷新,则第一交换板与外部主机之间的链路通信正常;若在设定的时间内没有刷新,则第一交换板发起ARP探测,若ARP探测成功,则第一交换板与外部主机之间的链路题哦那些正常;若ARP探测失败,则将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,将网关设备的负责数据链路的交换板由当前交换板切换到备用交换板。
上述系统通过外部主机MAC地址的刷新时刻得知与外部主机的连接状况,当超过设定时间还未刷新,才启动ARP探测,整个过程中添加的通信数据包较少,相比其他网关设备的冗余备份中的网关功能完整性检查能降低了对网络带宽的占用。
在另一些实施例中,发明人提供的一种LTE网关设备的交换子系统中,第一交换板还用于判断其自身的硬件温度,若第一交换板的硬件温度达到设定值时,将所述第二交换板与外部主机的连接使能,将所述业务板与第二交换板的连接使能,则将网关设备的负责数据链路的交换板由当前交换板切换到备用交换板。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括……”或“包含……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外,在本文中,“大于”、“小于”、“超过”等理解为不包括本数;“以上”、“以下”、“以内”等理解为包括本数。
本领域内的技术人员应明白,上述各实施例可提供为方法、装置、或计算机程序产品。这些实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。上述各实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机设备可读取的存储介质中,用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备,包括但不限于:个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等;所述的存储介质,包括但不限于:RAM、ROM、磁碟、磁带、光盘、闪存、U盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。
上述各实施例是参照根据实施例所述的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到计算机设备的处理器以产生一个机器,使得通过计算机设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机设备以特定方式工作的计算机设备可读存储器中,使得存储在该计算机设备可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机设备上,使得在计算机设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已经对上述各实施例进行了描述,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改,所以以上所述仅为本发明的实施例,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围之内。