WO2022048281A1

WO2022048281A1 - 一种改善链路聚合协议超时的方法和设备

Info

Publication number: WO2022048281A1
Application number: PCT/CN2021/103319
Authority: WO
Inventors: 卢彦呈
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2020-09-04
Filing date: 2021-06-29
Publication date: 2022-03-10
Also published as: CN112134797B; US20230198881A1; US11683257B1; CN112134797A

Abstract

本发明提供了一种改善链路聚合协议超时的方法和设备，该方法包括以下步骤：设定交换机接收LACPDU封包的超时时间和超时阈值次数；响应于第一交换机接收来自第二交换机的LACPDU封包超时，统计超时次数；响应于超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断第二交换机端口是否异常；响应于第二交换机端口异常，将第二交换机异常端口移除聚合链路。通过使用本发明的方案，能够避免带内管理可能被带内数据流影响稳定性的问题，能够使聚合链路的稳定性能获得更进一步的提升，并且保留了向前兼容的弹性。

Description

一种改善链路聚合协议超时的方法和设备

本申请要求于2020年9月4日提交中国国家知识产权局，申请号为202010921798.9，发明名称为“一种改善链路聚合协议超时的方法和设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本领域涉及计算机领域，并且更具体地涉及一种改善链路聚合协议超时的方法和设备。

背景技术

带外管理(Out-of-band management)是指使用独立管理信道进行装置维护。它允许系统管理员远程监控和管理服务器、路由器、网络交换机和其他网络装置。相对的，带内管理是指使用常规数据信道来管理装置。带内管理(In-Band Management)的明显限制是这种管理容易受到被管理装置受攻击或损害的影响。带外管理通过部署与数据信道物理隔离的管理信道来解决这个限制。

聚合链路(Link aggregation)是将多个物理埠汇聚在一起，形成一个逻辑端口，以实现出和入流量吞吐量在各成员端口的负荷分担，交换机根据用户配置的端口负荷分担策略决定网络封包从哪个成员埠发送到对端的交换机。当交换机检测到其中一个成员埠的链路发生故障时，就停止在此埠上发送封包，并根据负荷分担策略在剩下的链路中重新计算报文的发送埠，故障埠恢复后再次担任收发埠。

聚合链路控制协议(Link Aggregation Control Protocol，LACP)是一种让交换机之间可以动态形成聚合链路的协议，透过两台机器定时交换LACPDU(Link Aggregation Control Protocol Data Unit，聚合链路控制协议数据单元)，交换机可以知道对端的聚合链路设定并且协调出适合的配置，也能知道对端是否正常运作中。目前聚合链路的建立一般是使用LACP协议来进行，链路建成后会持续在链路上发送LACPDU的封包。在实际应用的场合，经常会碰到的问题是，在端口上会限制每秒能够送往CPU(Central Processing Unit，中央处理器)的封包数以避免CPU超载，而LACPDU封包是需要送交CPU做处理的，如果网络状态不稳定，比如发生广播风暴，或是有回路产生，这时端口上会有太多需要送往CPU处理的封包，比如ARP(Address Resolution Protocol，地址解析协议)封包，那就很可能会把LACPDU封包挤掉，使得端口产生误判将端口移出聚合链路，让聚合链路上的端口呈现不稳定的状态。

发明内容

有鉴于此，本发明实施例的目的在于提出一种改善链路聚合协议超时的方法和设备，通过使用本发明的方法，能够避免带内管理可能被带内数据流影响稳定性的问题，能够使聚合链路的稳定性能获得更进一步的提升，并且保留了向前兼容的弹性。

基于上述目的，本发明的实施例的一个方面提供了一种改善链路聚合协议超时的方法，包括以下步骤：

设定交换机接收LACPDU封包的超时时间和超时阈值次数；

响应于第一交换机接收来自第二交换机的LACPDU封包超时，统计超时次数；

响应于超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断第二交换机端口是否异常；

响应于第二交换机端口异常，将第二交换机异常端口移除聚合链路。

根据本发明的一个实施例，响应于超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断第二交换机端口是否异常包括：

响应于超时次数大于阈值次数，第一交换机提交查询第二交换机端口状态的请求；

响应于网络控制中心接收到请求，网络控制中心获取第二交换机端口状态并判断第二交换机端口的状态是否异常；

网络控制中心将是否异常的判断结果发送到第一交换机。

根据本发明的一个实施例，设定交换机接收LACPDU封包的超时时间和超时阈值次数包括：

设定接收LACPDU封包的阈值时间；

响应于接收LACPDU封包的时间大于阈值时间判断为超时一次并重新开始计时。

根据本发明的一个实施例，阈值次数为三次。

根据本发明的一个实施例，方法还包括：修改LACPDU封包的reserved(保留)区块的字段以切换交换机聚合链路是否支持带外管理模式。

本发明的实施例的另一个方面，还提供了一种改善链路聚合协议超时的设备，设备包括：

设定模块，设定模块配置为设定交换机接收LACPDU封包的超时时间和超时阈值次数；

统计模块，统计模块配置为响应于第一交换机接收来自第二交换机的 LACPDU封包超时，统计超时次数；

判断模块，判断模块配置为响应于超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断第二交换机端口是否异常；

移除模块，移除模块配置为响应于第二交换机端口异常，将第二交换机异常端口移除聚合链路。

根据本发明的一个实施例，判断模块还配置为：

网络控制中心将是否异常的判断结果发送到第一交换机。

根据本发明的一个实施例，设定模块还配置为：

设定接收LACPDU封包的阈值时间；

根据本发明的一个实施例，阈值次数为三次。

根据本发明的一个实施例，设备还包括修改模块，修改模块配置为修改LACPDU封包的reserved区块的字段以切换交换机聚合链路是否支持带外管理模式。

本发明具有以下有益技术效果：本发明实施例提供的改善链路聚合协议超时的方法，通过设定交换机接收LACPDU封包的超时时间和超时阈值次数；响应于第一交换机接收来自第二交换机的LACPDU封包超时，统计超时次数；响应于超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断第二交换机端口是否异常；响应于第二交换机端口异常，将第二交换机异常端口移除聚合链路的技术方案，能够避免带内管理可能被带内数据流影响稳定性的问题，能够使聚合链路的稳定性能获得更进一步的提升，并且保留了向前兼容的弹性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的实施例。

图1为根据本发明一个实施例的改善链路聚合协议超时的方法的示意性流程图；以及

图2为根据本发明一个实施例的改善链路聚合协议超时的设备的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明实施例进一步详细说明。

基于上述目的，本发明的实施例的第一个方面，提出了一种改善链路聚合协议超时的方法的一个实施例。图1示出的是该方法的示意性流程图。

如图1中所示，该方法可以包括以下步骤：

S1设定交换机接收LACPDU封包的超时时间和超时阈值次数，根据IEEE802.3ad的标准，用户可以设定使用长间隔(30秒)或短间隔(1秒) 来发送LACPDU封包；

S2响应于第一交换机接收来自第二交换机的LACPDU封包超时，统计超时次数；

S3响应于超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断第二交换机端口是否异常，由于一般数据中心都会有一个网络控制中心(Controller)用来监控数据中心的所有网络设备，可以在控制中心里追加聚合链路状态监控和控制模块，让交换机得以透过控制中心来查询对端交换机的聚合链路状态，使聚合链路的状态不受带内数据流的影响；

S4响应于第二交换机端口异常，将第二交换机异常端口移除聚合链路，网络控制中心在判断第二交换机端口异常后，可以定时监控该异常端口，当该异常端口的状态正常时，重新将该端口加入到聚合链路中。

通过本发明的技术方案，能够避免带内管理可能被带内数据流影响稳定性的问题，能够使聚合链路的稳定性能获得更进一步的提升，并且保留了向前兼容的弹性。

在本发明的一个优选实施例中，响应于超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断第二交换机端口是否异常包括：

网络控制中心将是否异常的判断结果发送到第一交换机。当第一交换机接收LACPDU封包超时计数达到三次时，提交第二交换机的聚合链路查询的请求到控制中心的聚合链路状态监控和控制模块，此时聚合链路状态监控和控制模块确认数据库中的链路状态表，如果表中信息过期则让聚合链路状态监控和控制模块对第二交换机发送状态请求，第二交换机回传链路状态后再把查询结果回传到第一交换机，此时第一交换机再根据对端链路状态决定是否需要关闭端口。

在本发明的一个优选实施例中，设定交换机接收LACPDU封包的超时时间和超时阈值次数包括：

设定接收LACPDU封包的阈值时间；

在本发明的一个优选实施例中，阈值次数为三次。

在本发明的一个优选实施例中，方法还包括：修改LACPDU封包的reserved区块的字段以切换交换机聚合链路是否支持带外管理模式。修改LACP字段的位置是reserved区段，在标准中该区段共计保留五十个字节作为扩展功能之用，故修改该字段不会影响既有功能，使用其中第一个字节的第一个位作为是否支持带外管理模式的判断，1为带外管理，0为带内管理。这样的好处是可以向前兼容没有支持本技术的旧设备，如果收到的LACPDU封包里reserved区块没有修改，那就继续使用带内管理的方式维护聚合链路状态。

需要说明的是，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关硬件来完成，上述的程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(Read-Only Memory，ROM)或随机存取存储器(Random Access Memory，RAM)等。上述计算机程序的实施例，可以达到与之对应的前述任意方法实施例相同或者相类似的效果。

此外，根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序，该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时，执行本发明实施例公开的方法中限定的上述功能。

基于上述目的，本发明的实施例的第二个方面，提出了一种改善链路聚合协议超时的设备，如图2所示，设备200包括：

设定模块201，设定模块配置为设定交换机接收LACPDU封包的超时时间和超时阈值次数；

统计模块202，统计模块配置为响应于第一交换机接收来自第二交换机的LACPDU封包超时，统计超时次数；

判断模块203，判断模块配置为响应于超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断第二交换机端口是否异常；

移除模块204，移除模块配置为响应于第二交换机端口异常，将第二交换机异常端口移除聚合链路。

在本发明的一个优选实施例中，判断模块还配置为：

网络控制中心将是否异常的判断结果发送到第一交换机。

在本发明的一个优选实施例中，设定模块还配置为：

设定接收LACPDU封包的阈值时间；

在本发明的一个优选实施例中，阈值次数为三次。

在本发明的一个优选实施例中，设备还包括修改模块，修改模块配置为修改LACPDU封包的reserved区块的字段以切换交换机聚合链路是否支持带外管理模式。

上述实施例，特别是任何“优选”实施例是实现的可能示例，并且仅为了清楚地理解本发明的原理而提出。可以在不脱离本文所描述的技术的精神和原理的情况下对上述实施例进行许多变化和修改。所有修改旨在被包括在本公开的范围内并且由所附权利要求保护。

Claims

一种改善链路聚合协议超时的方法，其特征在于，包括以下步骤：

设定交换机接收LACPDU封包的超时时间和超时阈值次数；

响应于第一交换机接收来自第二交换机的LACPDU封包超时，统计所述超时次数；

响应于所述超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断所述第二交换机端口是否异常；

响应于所述第二交换机端口异常，将所述第二交换机异常端口移除所述聚合链路。
根据权利要求1所述的方法，其特征在于，响应于所述超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断所述第二交换机端口是否异常包括：

响应于所述超时次数大于所述阈值次数，所述第一交换机提交查询所述第二交换机端口状态的请求；

响应于所述网络控制中心接收到所述请求，所述网络控制中心获取所述第二交换机端口状态并判断所述第二交换机端口的状态是否异常；

所述网络控制中心将是否异常的判断结果发送到所述第一交换机。
根据权利要求1所述的方法，其特征在于，设定交换机接收LACPDU封包的超时时间和超时阈值次数包括：

设定接收LACPDU封包的阈值时间；

响应于接收LACPDU封包的时间大于所述阈值时间判断为超时一次并重新开始计时。
根据权利要求1所述的方法，其特征在于，所述阈值次数为三次。
根据权利要求1所述的方法，其特征在于，还包括：修改LACPDU封包的reserved区块的字段以切换所述交换机聚合链路是否支持带外管理模式。
一种改善链路聚合协议超时的设备，其特征在于，所述设备包括：

设定模块，所述设定模块配置为设定交换机接收LACPDU封包的超时时间和超时阈值次数；

统计模块，所述统计模块配置为响应于第一交换机接收来自第二交换机的LACPDU封包超时，统计所述超时次数；

判断模块，所述判断模块配置为响应于所述超时次数大于阈值次数并且交换机聚合链路处于带外管理模式，通过网络控制中心判断所述第二交换机端口是否异常；

移除模块，所述移除模块配置为响应于所述第二交换机端口异常，将所述第二交换机异常端口移除所述聚合链路。
根据权利要求6所述的设备，其特征在于，所述判断模块还配置为：

响应于所述超时次数大于所述阈值次数，所述第一交换机提交查询所述第二交换机端口状态的请求；

响应于所述网络控制中心接收到所述请求，所述网络控制中心获取所述第二交换机端口状态并判断所述第二交换机端口的状态是否异常；

所述网络控制中心将是否异常的判断结果发送到所述第一交换机。
根据权利要求6所述的设备，其特征在于，所述设定模块还配置为：

设定接收LACPDU封包的阈值时间；

响应于接收LACPDU封包的时间大于所述阈值时间判断为超时一次并重新开始计时。
根据权利要求6所述的设备，其特征在于，所述阈值次数为三次。
根据权利要求6所述的设备，其特征在于，还包括修改模块，所述修改模块配置为修改LACPDU封包的reserved区块的字段以切换所述交换机聚合链路是否支持带外管理模式。