CN115102897B - 一种基于链路聚合的堆叠分裂保护方法 - Google Patents

一种基于链路聚合的堆叠分裂保护方法 Download PDF

Info

Publication number
CN115102897B
CN115102897B CN202210630156.2A CN202210630156A CN115102897B CN 115102897 B CN115102897 B CN 115102897B CN 202210630156 A CN202210630156 A CN 202210630156A CN 115102897 B CN115102897 B CN 115102897B
Authority
CN
China
Prior art keywords
stack
protection
link aggregation
split
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210630156.2A
Other languages
English (en)
Other versions
CN115102897A (zh
Inventor
武焱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Huaxin Chang'an Network Technology Co ltd
Original Assignee
Shanghai Huaxin Chang'an Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Huaxin Chang'an Network Technology Co ltd filed Critical Shanghai Huaxin Chang'an Network Technology Co ltd
Priority to CN202210630156.2A priority Critical patent/CN115102897B/zh
Publication of CN115102897A publication Critical patent/CN115102897A/zh
Application granted granted Critical
Publication of CN115102897B publication Critical patent/CN115102897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种基于链路聚合的堆叠分裂保护方法,该方法包括:堆叠系统中的每个交换机设备与代理设备共享一个链路聚合组;在链路聚合组的成员端口上运行有堆叠分裂保护协议,该堆叠分裂保护协议报文携带有堆叠分裂保护所需的信息,经代理设备中转,在堆叠系统中的各交换机设备之间传输,实现让处于分裂状态的交换机设备进入保护状态,保证处于活跃状态的交换机设备的正常功能。该方法及装置采用链路聚合端口,相比现有的解决方案,配置更简洁,且收敛速度快,能快速检测到堆叠分裂,以减轻因堆叠分裂带来的网络故障影响。

Description

一种基于链路聚合的堆叠分裂保护方法
技术领域
本发明属于网络通信技术领域,涉及堆叠交换机发生分裂后的网络保护方法,尤其是一种基于链路聚合的堆叠分裂保护方法。
背景技术
随着网络的高速发展,各行业对网络设备也有了更高的需求,希望提供一种更高可靠性、大数据量转发和高端口密集度的网络设备,于是堆叠技术应运而生。
通过将多台支持堆叠特性的交换机设备组合到一起,从逻辑上形成一台交换机设备,从而实现网络高可靠性和网络大数据量转发,增加端口数量,同时简化网络管理。但这样同时引入一个问题,当堆叠线缆或某些交换机设备发生故障,将导致堆叠系统的分裂,分裂后会出现一个或多个子堆叠系统,由于各分裂后的子堆叠系统的配置一致(包括路由Mac和IP地址等),这就会导致路由混乱,从而影响正常网络转发功能,因此需要采用一种方法来保护分裂后的堆叠系统,使网络通信不受影响。
现阶段,堆叠分裂检测与保护方法中,主要通过代理设备来实现。在原始堆叠系统中配置路由子接口,堆叠系统中的各交换机设备通过此接口经由代理设备实现彼此通信,各交换机设备在此接口上发送多个主检测报文,当堆叠系统发现多个主设备时,则判断出现堆叠分裂现象。
在上述现有技术中,由于需要配置路由子接口,故依赖三层路由协议,这使得配置更复杂,面对的故障风险更大。
发明内容
为了解决现有技术存在的上述问题,本发明提供一种基于链路聚合的堆叠分裂保护方法,采用链路聚合端口,相比现有的解决方案,配置更简洁,且收敛速度快,能快速检测到堆叠分裂,以减轻因堆叠分裂带来的网络故障影响。
为实现上述目的,本发明采用下述技术方案:
在本发明一实施例中,提出了一种基于链路聚合的堆叠分裂保护方法,该方法包括:
堆叠系统中的每个交换机设备与代理设备共享一个链路聚合组;
在链路聚合组的成员端口上运行有堆叠分裂保护协议,该堆叠分裂保护协议报文携带有堆叠分裂保护所需的信息,经代理设备中转,在堆叠系统中的各交换机设备之间传输,实现让处于分裂状态的交换机设备进入保护状态,保证处于活跃状态的交换机设备的正常功能。
进一步地,按照设备已经是主设备、最高设备优先级、最长设备运行时间、最小设备ID和最小设备Mac地址的优先顺序选举出堆叠系统中的主交换机设备,然后将堆叠系统中的各交换机设备与代理设备之间的链路加入同一个链路聚合组,将上述链路聚合组分配给堆叠分裂保护功能,并在堆叠系统和代理设备上分别使能堆叠分裂保护功能,堆叠分裂保护协议报文将在此链路聚合组的成员端口上传输。
进一步地,堆叠分裂保护功能选择链路聚合组的指定成员端口作为向代理设备发送堆叠分裂保护协议报文的传输端口;堆叠系统中的主交换机设备在链路聚合组的上述指定成员端口上以低频周期性的发送携带有堆叠分裂保护所需信息的堆叠分裂保护协议报文;当该堆叠分裂保护协议报文到达代理设备时,代理设备识别到接收该堆叠分裂保护协议报文的链路聚合组,并将该堆叠分裂保护协议报文从该链路聚合组的其它成员端口转发出去,使报文到达堆叠系统中的其它交换机设备;堆叠系统中的其它交换机设备在接收到该堆叠分裂保护协议报文后,解析该堆叠分裂保护协议报文中的堆叠分裂保护所需的信息,得到主交换机设备的Mac地址,将该Mac地址与其它交换机设备存储的主交换机设备的Mac地址进行逐一比较;若一致,则当前交换机设备保持正常运行,否则判断出现堆叠分裂现象。
进一步地,当堆叠系统出现堆叠分裂现象时,分裂后交换机设备组成子堆叠系统,并重新选出主交换机设备;子堆叠系统的主交换机设备通过链路聚合组的指定成员端口发送带有保护状态标志的堆叠分裂保护协议报文给代理设备,该堆叠分裂保护协议报文携带有子堆叠系统的其它交换机设备信息,代理设备在接收到带有保护状态标志的堆叠分裂保护协议报文后,发送确认报文给子堆叠系统的主交换机设备,并将其转发给链路聚合组的其它成员端口;子堆叠系统的主交换机设备将进入保护状态,并通知子堆叠系统的其它交换机设备进入保护状态,同时关闭新的主交换机设备和其它交换机设备上除链路聚合组的成员端口之外的面板上的其它端口,并设置链路聚合组的成员端口阻塞除堆叠分裂保护协议报文之外的其它报文。
进一步地,当堆叠系统出现堆叠分裂现象时,原始堆叠系统的主交换机设备将以高频周期性的发送堆叠分裂保护协议报文;子堆叠系统的主交换机设备将启动一个保护计时器,在保护计时器超时之前,子堆叠系统的主交换机设备不主动发送堆叠分裂保护协议报文;在保护计时器超时之前,若收到来自原始堆叠系统的主交换机设备发送的堆叠分裂保护协议报文,子堆叠系统的主交换机设备将关闭此保护计时器,并开始发送堆叠分裂保护协议报文;若子堆叠系统的交换机设备连续接收到2-4个具有不同主交换机设备的Mac地址的堆叠分裂保护协议报文时,若这些堆叠分裂保护协议报文来自原始堆叠系统的主交换机设备,则子堆叠系统将进入保护状态;若这些堆叠分裂保护协议报文不是来自原始堆叠系统的主交换机设备,则Mac地址较大的子堆叠系统进入保护状态;当子堆叠系统的交换机设备在保护计时器超时时未接收到堆叠分裂保护协议报文,则子堆叠系统的主交换机设备将在指定的链路聚合组的成员端口上以低频周期性的发送堆叠分裂保护协议报文,并激活所有面板端口。
进一步地,堆叠系统在启动时,若禁用了堆叠分裂保护功能,则堆叠系统中的交换机设备将继续以正常状态运行;若使能了堆叠分裂保护功能,则堆叠系统中的主交换机设备激活与堆叠分裂保护相关联的链路聚合组。
进一步地,当堆叠系统的堆叠分裂现象消失,将启动自动恢复过程,子堆叠系统中的所有交换机设备将直接重新启动并加入原始堆叠系统;在加入原始堆叠系统时,子堆叠系统中处于保护状态的交换机设备将其保护状态发送给原始堆叠系统的主交换机设备;原始堆叠系统的主交换机设备将等待一段时间,然后将向子堆叠系统中处于保护状态的交换机设备发送消息,使其切换到活跃状态;子堆叠系统中处于保护状态的交换机设备在接收到从原堆叠系统的主交换机设备发出的消息时,将启用所有端口,然后切换到活跃状态。
进一步地,堆叠系统为管理员提供一个手动恢复选项,可在处于保护状态的交换机设备上禁用堆叠分裂保护功能,并在重新启动后进入活跃状态并正常工作。
在本发明一实施例中,还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现前述基于链路聚合的堆叠分裂保护方法。
在本发明一实施例中,还提出了一种计算机可读存储介质,计算机可读存储介质存储有执行基于链路聚合的堆叠分裂保护方法的计算机程序。
有益效果:
本发明使用链路聚合来传输堆叠分裂保护协议报文,降低复杂度和故障率;在堆叠系统拓扑改变后,快速收敛,以减轻网络故障带来的影响。
附图说明
图1是本发明基于链路聚合的堆叠分裂保护拓扑结构图;
图2是本发明堆叠系统中的堆叠线缆断开拓扑结构图;
图3是本发明堆叠分裂保护流程示意图;
图4是本发明一实施例的在未开启堆叠分裂保护功能前的拓扑结构图;
图5是本发明一实施例的堆叠系统中的堆叠线缆断开拓扑结构图;
图6是本发明一实施例的在开启堆叠分裂保护功能后的拓扑结构图;
图7是本发明一实施例的堆叠系统的恢复后的拓扑结构图。
图8是本发明计算机设备结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神,应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种简单高效的方法来检测堆叠分裂现象以及分裂后对堆叠系统的保护处理,其基本思想是设计一个新的专有协议,它可以运行在链路聚合组的成员端口上,以携带堆叠分裂保护所需的信息,堆叠系统中的每个交换机设备与代理设备共享一个链路聚合组,从而实现堆叠分裂保护功能。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
图1是本发明基于链路聚合的堆叠分裂保护拓扑结构图。如图1所示,交换机设备1-4通过堆叠线缆连接到一起,组成堆叠系统,按照如下优先顺序选举出Master(主交换机设备):设备已经是Master、最高设备优先级、最长设备运行时间、最小设备ID和最小设备Mac地址。假如交换机设备1-4同时启动并配置相同的优先级,由于是刚启动,4台交换机设备都处于初始状态还未选出Master,并且由于同时启动,运行时间一致(运行时间相差20分钟以内算一致),又拥有相同的优先级,因此根据最小设备ID原则,选举出交换机设备1作为Master(主交换机设备),其它交换机设备为Slave(从交换机设备),堆叠系统的各交换机设备与代理设备之间通过网线连接,分别在堆叠系统和代理设备上使用相应配置命令,将这些链路(堆叠系统中的交换机设备1-4与代理设备通过网线连接的线路)加入同一个链路聚合组(Link Aggregation Group简称LinkAgg),使用相应的配置命令,将上述链路聚合组分配给堆叠分裂保护功能,并在堆叠系统和代理设备上分别使能堆叠分裂保护功能(Stacking Split Protection简称SSP),之后,堆叠分裂保护协议报文(Stacking SplitProtection Protocol Data Unit简称SSP PDU)将在此链路聚合组的成员端口上传输。
其中,堆叠分裂保护协议是为实现堆叠分裂保护功能而设计的私有协议,此协议报文经代理设备中转,在堆叠系统中的交换机设备之间进行传输,协议报文包括以下信息:源和目的Mac地址、帧类型、协议版本号、消息类型、设备ID、设备状态、Master的启动时间、Master的Mac地址、时间戳、堆叠系统成员个数及各成员Mac地址。
SSP应选择LinkAgg的指定成员端口作为向代理设备发送SSP PDU的传输端口。LinkAgg指定成员端口的选择标准为Master或离Master最近的设备上的端口号(该端口号是自定义的,设备启动之后会给交换机设备面板上所有的端口分配一个端口号)最小的LinkAgg的成员端口。如图1所示,将选择交换机设备1上与代理设备相连的端口作为指定成员端口。
Master(交换机设备1)在LinkAgg的上述指定成员端口上周期性的(每4秒发送一个)发送携带堆叠分裂保护所需的信息(包括源和目的Mac地址、帧类型、协议版本号、消息类型、设备ID、设备状态、Master的启动时间、Master的Mac地址、时间戳、堆叠系统成员个数及各成员Mac地址)的堆叠分裂保护协议报文,即SSP PDU。
当堆叠分裂保护协议报文到达代理设备时,代理设备根据接收的端口号识别到接收此SSP PDU的LinkAgg,并将此SSP PDU从LinkAgg的其它成员端口转发出去,使SSP PDU到达其它交换机设备(交换机设备2-4)。
其它交换机设备在收到此SSP PDU后,解析SSP PDU中的堆叠分裂保护所需的信息,得到Master的Mac地址,将此Mac地址与当前接收此SSP PDU的交换机设备存储的Master的Mac地址进行比较,由于此时交换机设备2-4上存储的Master的Mac地址就是交换机设备1的Mac地址,与接收到的SSP PDU中Master的Mac地址一致,因此判断出堆叠系统没有处于分裂状态,交换机设备1-4将继续保持正常运行。
若由于堆叠线缆发生故障导致其中一个堆叠线缆断开,如图2所示,当交换机设备2与交换机设备3之间的堆叠线缆断开并导致堆叠系统拓扑发生改变时,将出现堆叠分裂现象,分裂后交换机设备3和交换机设备4组成子堆叠系统,并且重新选出Master,如图2选出交换机设备3作为子堆叠系统的Master。由于堆叠系统中的路由Mac和IP地址一致,因此分裂后的子堆叠系统跟原始堆叠系统存在相同路由Mac和IP地址,这会导致网络业务流量转发出现故障。
原始堆叠系统的Master(交换机设备1)在发现拓扑发生变化后,为了达到快速收敛,将从以4秒间隔改为60毫秒为间隔周期性的发送SSP PDU。
交换机设备3变成Master后,将启动一个保护计时器,在计时器超时之前,交换机设备3不会发送SSP PDU,只是等待接收SSP PDU。
此时交换机设备2-4均收到来自原始堆叠系统的Master(交换机设备1)的SSPPDU,由于交换机设备2和原始堆叠系统的Master(交换机设备1)属于同一个子堆叠系统,交换机设备2上存储的Master的Mac地址和接收到来自原始堆叠系统的Master(交换机设备1)的SSP PDU中Master的Mac地址一致,因此交换机设备2保持正常运行。
交换机设备3-4收到来自原始堆叠系统的Master(交换机设备1)的SSP PDU后,将会拿SSP PDU中Master的Mac地址(交换机设备1的Mac地址)与当前交换机设备存储的Master的Mac地址相比较,由于此时交换机设备3和交换机设备4上存储的Master地址不再是交换机设备1的Mac地址了,因此判断出现堆叠分裂现象。
子堆叠系统的Master(交换机设备3)使用上述前文提到的方法选出LinkAgg指定成员端口来发送带有保护状态标志的SSP PDU(判断出现堆叠分裂现象后,发送的SSP PDU要携带“保护状态标志”,说明自己将要进入保护模式)给代理设备,此报文携带当前子堆叠系统的其它交换机设备信息(如交换机设备4),代理设备在收到带有保护状态标志的SSPPDU后,需发送确认报文给子堆叠系统的Master(交换机设备3)以确认收到此SSP PDU并将其转发给LinkAgg的其它成员端口。
子堆叠系统的Master(交换机设备3)将进入保护状态,并且通过堆叠线缆通知交换机设备4进入保护状态,同时关闭交换机设备3和交换机设备4上除LinkAgg的成员端口之外的面板上的其它端口,并设置LinkAgg的成员端口阻塞除SSP PDU之外的其它报文。
原始堆叠系统的Master(交换机设备1)在连续快速发送一定的时间之后(约5-10秒),将恢复以4秒时间间隔周期性的发送SSP PDU。
当原始堆叠系统的Master(交换机设备1)检测到任何导致其拓扑大小发生变化的事件时,堆叠分裂保护协议就会以极短的间隔(每60毫秒1次)发送SSP PDU。在足够长的持续时间(5-10秒)内,原始堆叠系统的Master(交换机设备1)应以高频(每60毫秒1次)发送SSP PDU,以确保在出现堆叠分裂现象时立即采取行动。
在接收到来自一个处于活跃状态的子堆叠系统且拥有更小Mac地址的SSP PDU,那么当前接收此SSP PDU的交换机设备(拥有较大Mac地址的交换机设备)的Master的Mac地址与SSP PDU发送者的Mac地址不匹配,说明了网络中存在一个处于活跃状态的子堆叠系统。在这种情况下,当前接收此SSP PDU的交换机设备应该监视2-4个这样的连续帧,之后,若上述存在的一个处于活跃状态的子堆叠系统有原始的Master或更小的Mac地址,那么当前接收此SSP PDU的交换机设备应该切换到保护状态,而发送报文的交换机设备(一个处于活跃状态的子堆叠系统)保持正常运行状态。
在本发明中,具体分为以下几点进行说明:
(1)堆叠分裂保护功能开启与关闭
如果堆叠系统在启动时禁用了堆叠分裂保护功能,交换机设备将继续以正常状态运行。
如果堆叠系统在启动时使能了堆叠分裂保护功能,Master(主设备)激活与堆叠分裂保护相关联的链路聚合组(使用配置命令将链路聚合分配给堆叠分裂保护功能使用的链路聚合组)。除了SSP PDU之外,端口应该阻塞其它报文。除链路聚合组的成员端口外,其它面板端口应该关闭,直到检测到在同一链路聚合组上没有连接其它处于活跃状态的Master。
如果Master从另一个活跃的Master接收SSP PDU,那么该Master就进入保护状态。除链路聚合组的成员端口外,所有面板端口均被禁用。
如果Master在保护计时器到期时没有接收到SSP PDU,它将开始在指定的链路聚合组的成员端口上以每4秒1个的速度发送SSP PDU,并完成初始化(激活所有面板端口),如图3所示。
(2)堆叠分裂保护与处理
在堆叠系统拓扑发生改变导致堆叠分裂时,原始堆叠系统的Master(处于活跃状态的Master)开始通过指定的链路聚合组的成员端口以每60毫秒发送1个SSP PDU。
如果在当前的堆叠系统中不存在可用的链路聚合组的成员端口(通过查看链路聚合成员端口是否存在)时,Master将继续正常运行。
如果当前堆叠系统中存在链路聚合组的成员端口,当前的堆叠系统的其它交换机设备(处于活跃状态的其它交换机设备)将会收到SSP PDU,并且由于Master Mac地址能够正确匹配,它们将继续以活跃状态运行。
当接收到来自子堆叠系统的交换机设备的带有保护状态标志位的SSP PDU时,原始堆叠系统的Master将为子堆叠系统的所有交换机设备产生一个告警信息。
子堆叠系统中的Master开始通过指定的链路聚合组成员端口以每60毫秒速率发送SSP PDU。
如果在当前的子堆叠系统中不存在可用的链路聚合组成员端口时,Master将继续正常运行。
子堆叠系统的其它交换机成员在连续收到3个具有不同Master Mac地址的SSPPDU时,将检测到堆叠分裂条件(当发现多个处于活动状态的Master时,则判断出现堆叠分裂现象)。如果SSP PDU来自原始堆叠系统的Master,则子堆叠系统将进入保护状态。如果SSP PDU不是来自原始堆叠系统的Master,则Mac地址较大的子堆叠系统进入保护状态。
在堆叠分裂保护上,将会发生以下保护状态相关操作:
A.通过堆叠线缆通知其它交换机设备此子堆叠系统需要进入保护状态。
B.除链路聚合组成员端口外,所有面板端口都将被设置为admin down状态。
C.通过链路聚合组成员端口以每60毫秒1个的速度发送带有保护状态标志位的SSP PDU,指示所有子堆叠详细信息(堆叠分裂保护协议报文中的堆叠系统成员个数及各成员Mac地址)给代理设备,并等待来自代理设备的确认。
D.将保护状态消息发送到子堆叠系统的其它交换机设备,用于子堆叠系统的其它交换机设备(没有链路聚合组成员端口的交换机设备)的保护状态配置。子堆叠系统的其它交换机设备在接收来自子堆叠系统的Master的保护状态消息时,将面板端口设置为admindown状态。
E.代理设备发送报文来确认收到特定SSP PDU。
具有链路聚合组成员端口且未收到SSP PDU的子堆叠系统的交换机设备将假定没有其他活跃的Master,并应周期性发送SSP PDU。
(3)堆叠系统自动恢复
一旦堆叠线缆状态恢复(堆叠线缆状态变成UP,比如重新连接堆叠线缆),并触发堆叠合并,后续的自动恢复过程将会启动。
子堆叠系统的交换机设备将直接重新启动并加入原始堆叠系统。
在加入原始堆叠系统时,处于保护状态的交换机设备将通过堆叠线缆将其保护状态发送给原始堆叠系统的Master。
原始堆叠系统的Master将等待60秒,以确定堆叠系统是否稳定,然后将通过堆叠线缆向处于保护状态的交换机设备发送消息,使其切换到活跃状态。
处于保护状态的交换机设备,在接收到从原始堆叠系统的Master发出的消息时,将启用所有面板的端口,然后切换到活跃状态。
只要堆叠线缆断开并接收到SSP PDU,在保护状态下的子堆叠系统的交换机设备将保持在该状态。如果在一段时间内(保护计时器时长)没有接收到SSP PDU,子堆叠系统将通过重新启动来恢复并再次处于活跃状态。
(4)堆叠系统手动恢复
手动恢复将是为管理员提供的一个选项,使保护状态下子堆叠系统的交换机设备独立工作,而不加入原始堆叠系统。
用户可以在处于保护状态的子堆叠系统的Master上禁用堆叠分裂保护功能,并重新启动设备。
在重新启动后,因为堆叠分裂保护功能被禁用,设备将进入活跃状态并正常工作。
(5)代理设备
基本功能是将接收到的SSP PDU转发到链路聚合组的其它成员端口。
当启用代理设备功能时,与代理设备相关的所有链路聚合组成员端口将被设置以接收SSP PDU。当接收到SSP PDU时,代理设备将此SSP PDU转发到链路聚合组的其它成员端口。
当代理设备接收到带有保护状态标志位的SSP PDU时,它会立即发送确认报文,并将此PDU转发到链路聚合组的其它成员端口。
需要说明的是,尽管在上述实施例及附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
为了对上述基于链路聚合的堆叠分裂保护方法进行更为清楚的解释,下面结合一个具体的实施例来进行说明,然而值得注意的是该实施例仅是为了更好地说明本发明,并不构成对本发明不当的限定。
使用场景:
在未开启堆叠分裂保护之前,如图4所示,PC1和PC2通过堆叠系统与外部网络通信,此时网络通信是正常的。当交换机设备2和3之间的堆叠线缆断开后,将会出现两个活跃的子堆叠系统,如图5所示,分裂后出现两个子堆叠系统,由于交换机设备1-4原属于同一个堆叠系统(属于同一个堆叠系统中的成员设备上的路由Mac地址和IP地址需一致),这将导致分裂后的两个子堆叠系统的路由Mac地址和IP地址一致,由此引发路由混乱。比如,此时PC1向Internet请求网络流量,Internet回复的网络流量有可能发送给交换机设备3和4所在的子堆叠系统,导致PC1收不到Internet回复的网络流量而出现断网,同理PC2也有可能会出现断网。
在开启堆叠分裂保护功能后,如图6所示,在堆叠线缆断开之前,堆叠系统中的Master(交换机设备1)以每4秒发送一个报文的速率向1/1/1端口发送SSP PDU,当堆叠线缆断开之后,堆叠系统将捕获到交换机设备2和3之间的堆叠线缆断开事件,此时交换机设备1(原始堆叠系统的Master)立即改为以每60毫秒发送一个报文的速率向1/1/1端口发送SSPPDU,此SSP PDU中携带的信息包括:源和目的Mac地址、帧类型、协议版本号、消息类型、设备ID、设备状态、Master的启动时间、Master的Mac地址、时间戳、堆叠系统成员个数及各成员Mac地址,其中消息类型为堆叠系统健康状态类型消息,代理设备收到此报文后,将发送到链路聚合组的其它成员端口。
交换机设备2收到上述SSP PDU后,解析SSP PDU中的内容,得到Master的Mac地址,由于此时交换机设备1和2从属同一个子堆叠系统,因此交换机设备2上存储的Master的Mac地址与交换机设备1发送的SSP PDU中的Master的Mac地址一致,即交换机设备1的Mac地址,因此交换机设备2保持正常运行。
交换机设备3收到上述SSP PDU报文后,解析SSP PDU中的内容,得到Master的Mac地址,由于此时交换机设备3属于另外一个堆叠子系统,因此交换机设备3上存储的Master的Mac地址与交换机设备1发送的SSP PDU中的Master的Mac地址不一致,并且交换机设备3通过检查发现SSP PDU中的Master的Mac地址与原始堆叠系统的Master一致(交换机设备3上有存储分裂之前的Master的Mac地址),因此交换机设备3将进入保护状态,又因为交换机设备3是子堆叠系统中的Master,所以交换机设备3会通知其所在子堆叠系统中的所有交换机设备,让其进入保护状态,即交换机设备4,此后交换机设备3立即以每60毫秒发送一个报文的速率持续向3/1/1端口发送带有保护状态标志位的SSP PDU,SSP PDU中携带的信息包括:源和目的Mac地址、帧类型、协议版本号、消息类型、设备ID、设备状态、Master的启动时间、Master的Mac地址、时间戳、堆叠系统成员个数及各成员Mac地址,其中消息类型为堆叠系统保护状态类型消息。
交换机设备4也会收到由交换机设备1发出的SSP PDU,由于SSP PDU中的Master的Mac地址与交换机设备4上存储的Master地址不一致(交换机设备4上存储的当前Master的Mac地址为交换机设备3的Mac地址),并且交换机设备4通过检查发现SSP PDU中的Master的Mac地址与原始堆叠系统的Master一致(交换机设备4上有存储分裂之前的Master的Mac地址),因此交换机设备4将进入保护状态,又因为交换机设备4是子堆叠系统中的Slave设备,所以交换机设备4会通知其所在的子堆叠系统中的Master,即交换机设备3,然后交换机设备4立即以每秒60毫秒发送一个报文的速率持续向4/1/1端口发送带有保护状态标志位的SSP PDU,SSP PDU中携带的信息包括:源和目的Mac地址、帧类型、协议版本号、消息类型、设备ID、设备状态、Master的启动时间、Master的Mac地址、时间戳、堆叠系统成员个数及各成员Mac地址,其中消息类型为堆叠系统保护状态类型消息。交换机设备3收到交换机设备4发来的进入保护状态消息后,将通知所在堆叠子系统的所有交换机设备,让交换机设备进入保护状态。
代理设备在收到来自交换机设备3和交换机设备4发来的带有保护状态标志位的SSP PDU消息后,会回复一个消息类型为报文接收确认类型的SSP PDU,同时将收到的带有保护状态标志位的SSP PDU发送给链路聚合组其它成员端口,交换机设备1和2收到此带有保护状态标志位的SSP PDU后,将记录下进入保护状态的交换机设备,即交换机设备3和4。交换机设备3和4收到来自代理设备发回的确认报文后,将关闭除堆叠口(堆叠线缆所在的端口)以外的所有其他端口。
此后PC1将通过交换机设备1和2所在的子堆叠系统进行上网,而PC2将无法进行上网,这样可以保证PC1一侧的设备网络通信正常。
堆叠系统的恢复,如图7所示,将堆叠线缆重新连接好,连接好以后交换机设备3和4会重新加入交换机设备1所在的子堆叠系统,交换机设备3由Master变回Slave,由于交换机设备3和交换机设备4处于保护状态,所以交换机设备3和交换机设备4将重新启动以恢复其正常功能,启动完成之后将变成正常状态。
基于前述发明构思,如图8所示,本发明还提出一种计算机设备200,包括存储器210、处理器220及存储在存储器210上并可在处理器220上运行的计算机程序230,处理器220执行计算机程序230时实现前述基于链路聚合的堆叠分裂保护方法。
基于前述发明构思,本发明还提出一种计算机可读存储介质,计算机可读存储介质存储有执行前述基于链路聚合的堆叠分裂保护方法的计算机程序。
由于堆叠系统的各交换机设备使用同一个Mac和IP地址,因此当堆叠线缆或交换机设备故障导致堆叠系统发生分裂时,将出现L2环路或L3流量中断,而本发明提出的基于链路聚合的堆叠分裂保护方法可以通过链路聚合端口和代理设备来实现让处于分裂状态的交换机设备进入保护状态,处于保护状态的交换机设备除了转发堆叠分裂保护协议报文SSP PDU之外,将阻断其它报文以保证处于活跃状态的设备的正常功能,当堆叠线缆或交换机设备重新恢复正常后,处于保护状态的交换机设备重新加入堆叠系统并恢复正常功能。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包含的各种修改和等同布置。
对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于链路聚合的堆叠分裂保护方法,其特征在于,该方法包括:
堆叠系统中的每个交换机设备与代理设备共享一个链路聚合组;
在链路聚合组的成员端口上运行有堆叠分裂保护协议,堆叠分裂保护协议报文携带有堆叠分裂保护所需的信息,经代理设备中转,在堆叠系统中的各交换机设备之间传输,实现让处于分裂状态的交换机设备进入保护状态,保证处于活跃状态的交换机设备的正常功能;堆叠分裂保护协议是为实现堆叠分裂保护功能而设计的私有协议,此协议报文经代理设备中转,在堆叠系统中的交换机设备之间进行传输,协议报文包括以下信息:源和目的Mac地址、帧类型、协议版本号、消息类型、设备ID、设备状态、Master的启动时间、Master的Mac地址、时间戳、堆叠系统成员个数及各成员Mac地址。
2.根据权利要求1所述的基于链路聚合的堆叠分裂保护方法,其特征在于,按照设备已经是主设备、最高设备优先级、最长设备运行时间、最小设备ID和最小设备Mac地址的优先顺序选举出堆叠系统中的主交换机设备,然后将堆叠系统中的各交换机设备与代理设备之间的链路加入同一个链路聚合组,将上述链路聚合组分配给堆叠分裂保护功能,并在堆叠系统和代理设备上分别使能堆叠分裂保护功能,堆叠分裂保护协议报文将在此链路聚合组的成员端口上传输。
3.根据权利要求2所述的基于链路聚合的堆叠分裂保护方法,其特征在于,所述堆叠分裂保护功能选择链路聚合组的指定成员端口作为向代理设备发送堆叠分裂保护协议报文的传输端口;堆叠系统中的主交换机设备在链路聚合组的上述指定成员端口上以低频周期性的发送携带有堆叠分裂保护所需信息的堆叠分裂保护协议报文;当该堆叠分裂保护协议报文到达代理设备时,代理设备识别到接收该堆叠分裂保护协议报文的链路聚合组,并将该堆叠分裂保护协议报文从该链路聚合组的其它成员端口转发出去,使报文到达堆叠系统中的其它交换机设备;堆叠系统中的其它交换机设备在接收到该堆叠分裂保护协议报文后,解析该堆叠分裂保护协议报文中的堆叠分裂保护所需的信息,得到主交换机设备的Mac地址,将该Mac地址与其它交换机设备存储的主交换机设备的Mac地址进行逐一比较;若一致,则当前交换机设备保持正常运行,否则判断出现堆叠分裂现象。
4.根据权利要求3所述的基于链路聚合的堆叠分裂保护方法,其特征在于,当堆叠系统出现堆叠分裂现象时,分裂后交换机设备组成子堆叠系统,并重新选出主交换机设备;子堆叠系统的主交换机设备通过链路聚合组的指定成员端口发送带有保护状态标志的堆叠分裂保护协议报文给代理设备,该堆叠分裂保护协议报文携带有子堆叠系统的其它交换机设备信息,代理设备在接收到带有保护状态标志的堆叠分裂保护协议报文后,发送确认报文给子堆叠系统的主交换机设备,并将其转发给链路聚合组的其它成员端口;子堆叠系统的主交换机设备将进入保护状态,并通知子堆叠系统的其它交换机设备进入保护状态,同时关闭新的主交换机设备和其它交换机设备上除链路聚合组的成员端口之外的面板上的其它端口,并设置链路聚合组的成员端口阻塞除堆叠分裂保护协议报文之外的其它报文。
5.根据权利要求4所述的基于链路聚合的堆叠分裂保护方法,其特征在于,当堆叠系统出现堆叠分裂现象时,原始堆叠系统的主交换机设备将以高频周期性的发送堆叠分裂保护协议报文;子堆叠系统的主交换机设备将启动一个保护计时器,在保护计时器超时之前,子堆叠系统的主交换机设备不主动发送堆叠分裂保护协议报文;在保护计时器超时之前,若收到来自原始堆叠系统的主交换机设备发送的堆叠分裂保护协议报文,子堆叠系统的主交换机设备将关闭此保护计时器,并开始发送堆叠分裂保护协议报文;若子堆叠系统的交换机设备连续接收到2-4个具有不同主交换机设备的Mac地址的堆叠分裂保护协议报文时,若这些堆叠分裂保护协议报文来自原始堆叠系统的主交换机设备,则子堆叠系统将进入保护状态;若这些堆叠分裂保护协议报文不是来自原始堆叠系统的主交换机设备,则Mac地址较大的子堆叠系统进入保护状态;当子堆叠系统的交换机设备在保护计时器超时时未接收到堆叠分裂保护协议报文,则子堆叠系统的主交换机设备将在指定的链路聚合组的成员端口上以低频周期性的发送堆叠分裂保护协议报文,并激活所有面板端口。
6.根据权利要求1所述的基于链路聚合的堆叠分裂保护方法,其特征在于,所述堆叠系统在启动时,若禁用了堆叠分裂保护功能,则堆叠系统中的交换机设备将继续以正常状态运行;若使能了堆叠分裂保护功能,则堆叠系统中的主交换机设备激活与堆叠分裂保护相关联的链路聚合组。
7.根据权利要求3所述的基于链路聚合的堆叠分裂保护方法,其特征在于,当堆叠系统的堆叠分裂现象消失,将启动自动恢复过程,子堆叠系统中的所有交换机设备将直接重新启动并加入原始堆叠系统;在加入原始堆叠系统时,子堆叠系统中处于保护状态的交换机设备将其保护状态发送给原始堆叠系统的主交换机设备;原始堆叠系统的主交换机设备将等待一段时间,然后将向子堆叠系统中处于保护状态的交换机设备发送消息,使其切换到活跃状态;子堆叠系统中处于保护状态的交换机设备在接收到从原堆叠系统的主交换机设备发出的消息时,将启用所有端口,然后切换到活跃状态。
8.根据权利要求7所述的基于链路聚合的堆叠分裂保护方法,其特征在于,所述堆叠系统为管理员提供一个手动恢复选项,可在处于保护状态的交换机设备上禁用堆叠分裂保护功能,并在重新启动后进入活跃状态并正常工作。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8任一项所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1-8任一项所述的计算机程序。
CN202210630156.2A 2022-06-06 2022-06-06 一种基于链路聚合的堆叠分裂保护方法 Active CN115102897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210630156.2A CN115102897B (zh) 2022-06-06 2022-06-06 一种基于链路聚合的堆叠分裂保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210630156.2A CN115102897B (zh) 2022-06-06 2022-06-06 一种基于链路聚合的堆叠分裂保护方法

Publications (2)

Publication Number Publication Date
CN115102897A CN115102897A (zh) 2022-09-23
CN115102897B true CN115102897B (zh) 2024-01-05

Family

ID=83288066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210630156.2A Active CN115102897B (zh) 2022-06-06 2022-06-06 一种基于链路聚合的堆叠分裂保护方法

Country Status (1)

Country Link
CN (1) CN115102897B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231682A (zh) * 2011-07-25 2011-11-02 杭州华三通信技术有限公司 一种堆叠冲突的处理方法和设备
CN102355366A (zh) * 2011-08-24 2012-02-15 杭州华三通信技术有限公司 堆叠分裂时管理堆叠成员设备的方法和堆叠成员设备
CN104660449A (zh) * 2015-02-13 2015-05-27 杭州华三通信技术有限公司 防止堆叠分裂多主设备Master的方法和设备
CN111343040A (zh) * 2020-01-17 2020-06-26 新华三信息安全技术有限公司 扩展网桥的端口扩展器堆叠分裂检测方法和装置
CN112217658A (zh) * 2019-07-11 2021-01-12 华为技术有限公司 一种堆叠分裂处理方法及装置
CN112787960A (zh) * 2020-11-30 2021-05-11 北京东土军悦科技有限公司 一种堆叠分裂的处理方法、装置、设备及存储介质
CN112910734A (zh) * 2021-01-29 2021-06-04 新华三技术有限公司 一种切换链路聚合组的方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11019500B2 (en) * 2015-09-11 2021-05-25 Apple Inc. Apparatus for determining an estimated number of bytes to send over a link
US10498644B2 (en) * 2017-09-27 2019-12-03 Hewlett Packard Enterprise Development Lp Grace link state advertisement (LSA) from a virtual stack device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231682A (zh) * 2011-07-25 2011-11-02 杭州华三通信技术有限公司 一种堆叠冲突的处理方法和设备
CN102355366A (zh) * 2011-08-24 2012-02-15 杭州华三通信技术有限公司 堆叠分裂时管理堆叠成员设备的方法和堆叠成员设备
CN104660449A (zh) * 2015-02-13 2015-05-27 杭州华三通信技术有限公司 防止堆叠分裂多主设备Master的方法和设备
CN112217658A (zh) * 2019-07-11 2021-01-12 华为技术有限公司 一种堆叠分裂处理方法及装置
CN111343040A (zh) * 2020-01-17 2020-06-26 新华三信息安全技术有限公司 扩展网桥的端口扩展器堆叠分裂检测方法和装置
CN112787960A (zh) * 2020-11-30 2021-05-11 北京东土军悦科技有限公司 一种堆叠分裂的处理方法、装置、设备及存储介质
CN112910734A (zh) * 2021-01-29 2021-06-04 新华三技术有限公司 一种切换链路聚合组的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《A real-time performance evaluation of tightly coupled LTE Wi-Fi radio access networks》;S Thoma Valerrian 等;《IEEE》;全文 *
《基于堆叠系统业务不中断升级的设计与实现》;陈光礼;《中国优秀硕士学位论文全文数据库》;全文 *

Also Published As

Publication number Publication date
CN115102897A (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
US9237092B2 (en) Method, apparatus, and system for updating ring network topology information
US8886831B2 (en) System and methodology for fast link failover based on remote upstream failures
US8117337B2 (en) Method and device for implementing link pass through in point-to-multipoint network
US9385944B2 (en) Communication system, path switching method and communication device
JP6287518B2 (ja) オープンフロースイッチおよびオープンフローネットワークの障害復旧方法
WO2009023996A1 (fr) Procédé de mise en œuvre d'une interconnexion de réseau par l'intermédiaire d'une agrégation de liaisons
CN102904818A (zh) 一种arp信息表项更新方法及装置
CN109218232B (zh) 一种实现Mux机的方法、设备及系统
CN110278094B (zh) 链路恢复方法及装置、系统、存储介质、电子装置
CN113645312B (zh) 一种基于erps协议的子环网链路保护方法与装置
WO2011150780A1 (zh) 触发路由切换的方法和服务运营商侧运营商边缘设备
CN109150709B (zh) 一种实现Mux机的方法、设备及系统
WO2010133065A1 (zh) 基于无源光网络的保护系统和方法
CN115102897B (zh) 一种基于链路聚合的堆叠分裂保护方法
JP5518771B2 (ja) 冗長ネットワークシステム、終端装置及び中継点隣接装置
CN111224803B (zh) 一种堆叠系统中多主检测方法及堆叠系统
CN111835544B (zh) 一种基于用户态协议栈的虚拟路由器的监控方法及系统
CN112231154A (zh) 双机热备切换方法及装置
KR100669030B1 (ko) 빠른 통신 복구가 가능한 이더넷링크보호기
JP2000244526A (ja) 多重化したネットワーク接続装置システム
CN113630427B (zh) 保护倒换方法及装置
KR100318966B1 (ko) 비동기전송모드 교환망에서 헬스체크를 이용한 네트웍 자동 복구시스템 및 방법
CN113805788B (zh) 一种分布式存储系统及其异常处理方法和相关装置
CN110995585A (zh) 一种链路非负载分担保护方法
JP4035820B2 (ja) 回線切替装置及びデータ伝送システム及び回線切替方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant