CN104917624A - 一种链路聚合路径的健康检查系统及方法 - Google Patents

一种链路聚合路径的健康检查系统及方法 Download PDF

Info

Publication number
CN104917624A
CN104917624A CN201410085959.XA CN201410085959A CN104917624A CN 104917624 A CN104917624 A CN 104917624A CN 201410085959 A CN201410085959 A CN 201410085959A CN 104917624 A CN104917624 A CN 104917624A
Authority
CN
China
Prior art keywords
message
physical port
time
health
check
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410085959.XA
Other languages
English (en)
Inventor
任钊
陈永亮
贝少峰
欧夕晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ARRAY NETWORKS (BEIJING) Inc
Array Networks Inc
Original Assignee
ARRAY NETWORKS (BEIJING) Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ARRAY NETWORKS (BEIJING) Inc filed Critical ARRAY NETWORKS (BEIJING) Inc
Priority to CN201410085959.XA priority Critical patent/CN104917624A/zh
Publication of CN104917624A publication Critical patent/CN104917624A/zh
Pending legal-status Critical Current

Links

Abstract

本发明一种链路聚合路径的健康检查系统是由聚合物理端口、N(N>1)条交换机支路以及聚合交换机网络连接构成,其中所述的聚合物理端口是由M(M>1)个物理端口以及用户输入输出模块、报文发送模块、报文接收模块和超时检查模块组成。本发明在对静态链路聚合路径进行健康检查时,可检出故障的物理端口,使得系统工作时可忽略标记为故障的物理端口,实现故障自动转移,弥补了静态链路聚合的不足;本发明可以指定任意检查地址,并能指定发送网关,且配置简单,便于实施。

Description

一种链路聚合路径的健康检查系统及方法
技术领域
本发明涉及网络应用交付控制领域,特别涉及一种链路聚合路径的健康检查系统及方法。
背景技术
链路聚合(Link Aggregation)是指将多条以太网物理链路捆绑在一起成为一条逻辑链路,从而实现增加链路带宽,提高链路冗余。链路聚合有两种模式,动态模式和静态模式。基于IEEE802.3ad标准的LACP(链路聚合控制协议)协议是一种实现链路动态聚合的协议,运行该协议的设备之间通过互发LACPDU(链路聚合控制协议数据单元)来交互链路聚合的相关信息。如果在超过规定的时间,本端成员端口仍未收到来自对端的LACPDU,则认为对端成员端口已失效,系统将不使用该端口发送数据报,实现了故障转移。在静态聚合模式下,聚合组内的成员端口上不启用LACP协议,其端口状态通过手工进行维护。在数据中心中,为了增加链路冗余,常常需要跨交换机做链路聚合,即本端聚合物理端口和对端聚合物理端口之间的链路经过了不同的交换机和不同的网络路径。而LACP协议不支持跨交换机连路聚合,所以只能采用静态聚合模式。在静态聚合模式下,若其中一条路径发生故障,系统不能自动故障转移,仍然会通过该路径发送数据报,从而造成数据报丢失。
发明内容
为克服已有技术中存在的问题,本发明的目的是提供一种可以实现故障自动转移的链路聚合路径健康检查系统及方法。
一种链路聚合路径的健康检查系统是由聚合物理端口、N(N>1)条交换机支路以及聚合交换机网络连接构成,其中所述的聚合物理端口是由M(M>1)个物理端口以及用户输入输出模块、报文发送模块、报文接收模块和超时检查模块组成。
所述的用户输入输出模块:用于接收并保存用户的输入,包括预设IP地址、报文发送时间间隔、超时时间、健康计数和故障计数,并用于查看健康检查结果和统计信息;
所述的报文发送模块:用于以预先配置的时间间隔向目的地址发送包含健康检查信息的报文,记录该报文所通过的物理端口标记,并用于成功发送报文后启动相应的定时器;
所述的报文接收模块:用于检查所有收到的报文,从其中的健康检查报文中提取对应物理端口标识,检查被标识的物理端口,若相应的定时器未超时、且健康计数已达到用户初始设定的门限,则标记该物理端口为健康,若相应的定时器已超时,则丢弃上述被标识物理端口传输的报文;
所述的超时检查模块:用于定期检查所有物理端口相应的定时器,若超时且故障的计数到达用户初始设定的门限,则标记对应的物理端口的检查结果为故障。
一种链路聚合路径的健康检查方法,包括以下步骤:
步骤一,预设聚合物理端口IP地址、健康检查报文发送间隔、健康检查报文接收超时时间、检查结果未健康时应收到报文的次数,检查结果未故障时报文超时的次数和网关;
步骤二,通过每个物理端口发送健康检查报文,所述的健康检查报文中有其所通过的物理端口的标记;
进一步地,健康检查报文中还可以指定发送该报文所经过的网关,成功发送后启动超时定时器;
步骤三,检查所有收到的报文:如果是健康检查报文则从报文中提取出所对应的物理端口,检查该报文是否超时;如果没有超时,则停止相应定时器并且增加该物理端口健康的计数,清零故障计数,如果健康计数达到用户设定的门限,则该物理端口的最终检查结果为健康;如果已经超时,则丢弃该数据报文;
步骤四,定期检查所有定时器,如果已经超时,则找到对应的物理端口并且清零健康的计数,增加故障的计数,如果故障的计数到达用户设定的门限则标记该接口的检查结果为故障,物理端口在发送报文时将忽略标记为故障的物理端口,实现自动故障转移。
本发明在对静态链路聚合路径进行健康检查时,可检出故障的物理端口,使得系统工作时可忽略标记为故障的物理端口,实现故障自动转移,弥补了静态链路聚合的不足;本发明可以指定任意检查地址,并能指定发送网关,且配置简单,便于实施。
附图说明
图1是本发明设备的系统结构示意图;
图2是本发明聚合物理端口组成结构示意图;
图3是本发明报文接收模块工作流程图;
图4是本发明超时检查模块工作流程图;
图5是本发明一种实施例网络系统结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也是本申请各权利要求所要求保护的技术方案。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。
一种链路聚合路径健康检查系统是通过从指定的物理端口(构成逻辑聚合端口的物理端口,以下称聚合物理端口)向预设的目的地址发送报文,例如:聚合物理端口发送ICMP Echo Request(Internet Control Message Protocol,Internet控制报文协议类型8)报文,如果能在规定的时间内收到对端发回的ICMP Echo Reply(控制报文协议类型0)报文,则说明该聚合物理端口所属的网络路径工作正常,否则说明该路径不通。
如图1所示:一种链路聚合路径的健康检查系统是由聚合物理端口100,交换机支路200和交换机支路300,聚合交换机400网络连接构成,如图2所示,其中所述的聚合物理端口100是由M(M>1)个物理端口以及用户输入输出模块101,报文发送模块102,报文接收模块103和超时检查模块104组成。
所述的用户输入输出模块:用于用户输入输出模块接收并保存用户的输入,包括预设健康检查目的地的IP地址、报文发送间隔、超时时间、检查结果未健康时需要收到的次数、检查结果未故障时需要超时的次数和网关等,且用于查看健康检查的结果和统计信息;
所述的报文发送模块:系统以用户配置的时间间隔向目的地址发送包含健康检查信息的报文,例如,发送ICMPEchoRequest报文。通过每个物理端口发送一个报文,即系统有多少个物理端口组成就需要发送多少个报文,也即每个报文通过不同的物理端口发送。由于报文返回时并不一定和发送时的路径相同,因此需要报文中标记出该报文是通过哪个物理端口发送的,用户还可以指定发送该报文所经过的网关,成功发送报文后启动超时定时器。
所述的报文接收模块:用于报文接收模块检查所有收到的报文,例如:接收ICMP Echo Reply报文。如果是健康检查报文则从报文中提取出其对应的物理端口标识(即找到该报文是从哪个物理端口发送出去的),并检查该报文是否超时。如果没有超时,则停止超时定时器并且增加该接口健康的计数,清零故障计数,如果健康计数达到用户设定的门限,则该接口的最终检查结果为健康;如果已经超时,则丢弃该数据报文,所述的报文接收工作流程如图3所示。
所述的超时检查模块:超时检查模块定期检查所有定时器,如果已经超时,则找到对应的物理端口并且清零健康的计数,增加故障的计数,如果故障的计数到达用户设定的门限则标记该接口的检查结果为故障。聚合物理端口在发送数据报时会忽略标记为故障的物理端口。所述的超时检查模块工作流程如图4所示。
一种链路聚合路径的健康检查方法,包括以下步骤:
步骤一,预设聚合物理端口IP地址、健康检查报文发送间隔、健康检查报文接收超时时间、检查结果未健康时应收到报文的次数,检查结果未故障时报文超时的次数和网关,所述的网关就是系统默认的路由,即发送健康检查报文下一跳的地址,仅在健康检查目的地址和本机不在同一个网段时使用);
步骤二,通过每个物理端口发送健康检查报文,所述的健康检查报文中设有其通过的物理端口的标记,进一步地,健康检查报文中还可以指定发送该报文所经过的网关;成功发送后启动超时定时器;
步骤三,检查所有收到的报文:如果是健康检查报文则从报文中提取出其对应的物理端口,并检查该报文是否超时。如果没有超时,则停止超时定时器并且增加该物理端口健康的计数,清零故障计数,如果健康计数达到用户设定的门限,则该物理端口的最终检查结果为健康;如果已经超时,则丢弃该数据报文;
步骤四,定期检查所有定时器,如果已经超时,则找到对应的物理端口并且清零健康的计数,增加故障的计数,如果故障的计数到达用户设定的门限则标记该接口的检查结果为故障。物理端口在发送报文时将忽略标记为故障的物理端口,实现自动故障转移。
现举一个实例,如图5所示,某网络欲检查聚合交换机C处的健康状态,现采用ArrayNetworks APV系列产品之一作为聚合物理端口100,所述的聚合物理端口可以按照需求配置M个(M>1)物理端口,本实例为陈述方便,选择配置两个物理端口,且配置两条交换机支路。首先对每个物理端口进行如下配置:
bond interface bond1 port2
bond interface bond1 port3
ip address bond1 192.168.1.2 255.255.255.0
然后配置健康检查,
bond heal bond1 192.168.1.1 2 3 4 5
假设配置健康检查的目的是聚合交换机C处,设其地址为192.168.1.1,发送ICMP Echo Request报文时间间隔为2秒,超时时间为3秒,连续收到4次ICMP Echo Reply报文则标记物理端口为健康,连续超时5此则标记物理端口为故障。
断开Switch B和Switch C之间的链路,健康检查的结果如下:
show bond bond1
bond1(bond1):flags=8003<UP,BROADCAST,MULTICAST>mtu1500
inet6 fe80::230:48ff:fe9a:6efc prefixlen 64 scopeid 0x5
inet 192.168.1.2 netmask 0xffffff00 broadcast 192.168.1.255
ether 00:30:48:9a:6e:ff
status:active
Bond Interface:port2(ACT)primary,port3(ACT)primary
health check:ON
Health check Address:192.168.1.1;Gateway:
Interval:2;Timeout:3;UP limit:4;DOWN limit:5
port2:UP port3:DOWN
health check statistics:
health check packets send 8
health check packets receive 4
health check route not found 0
health check invalid interface 0
health check source ip not found 0
health check not enough memory 0
需要说明的是,本发明各设备实施方式中提到的各单元都是逻辑单元,在物理上,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现,这些逻辑单元本身的物理实现方式并不是最重要的,这些逻辑单元所实现的功能的组合才是解决本发明所提出的技术问题的关键。此外,为了突出本发明的创新部分,本发明没有引入上述各设备实施方式以及与解决本发明所提出的技术问题关系不太密切的单元,但这并不表明不存在上述设备实施方式以及其它有关实施单元。
虽然通过参照本发明的某些优选实施方式,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (2)

1.一种链路聚合路径的健康检查系统是由聚合物理端口、N(N>1)条交换机支路以及聚合交换机网络连接构成,其特征是所述的聚合物理端口是由M(M>1)个物理端口以及用户输入输出模块、报文发送模块、报文接收模块和超时检查模块组成:
所述的用户输入输出模块:用于接收并保存用户的输入,包括预设IP地址、报文发送时间间隔、超时时间、健康计数和故障计数,并用于查看健康检查结果和统计信息;
所述的报文发送模块:用于以预先配置的时间间隔向目的地址发送包含健康检查信息的报文,记录该报文所通过的物理端口标记,并用于成功发送报文后启动相应的定时器;
所述的报文接收模块:用于检查所有收到的报文,从其中的健康检查报文中提取对应物理端口标识,检查被标识的物理端口,若相应的定时器未超时、且健康计数已达到用户初始设定的门限,则标记该物理端口为健康,若相应的定时器已超时,则丢弃上述被标识物理端口传输的报文;
所述的超时检查模块:用于定期检查所有物理端口相应的定时器,若超时且故障的计数到达用户初始设定的门限,则标记对应的物理端口的检查结果为故障。
2.一种链路聚合路径的健康检查方法,其特征是包括以下步骤:
步骤一,预设聚合物理端口IP地址、健康检查报文发送间隔、健康检查报文接收超时时间、检查结果未健康时应收到报文的次数,检查结果未故障时报文超时的次数和网关;
步骤二,通过每个物理端口发送健康检查报文,所述的健康检查报文中有其所通过的物理端口的标记;
进一步地,健康检查报文中还可以指定发送该报文所经过的网关,成功发送后启动超时定时器;
步骤三,检查所有收到的报文:如果是健康检查报文则从报文中提取出所对应的物理端口,检查该报文是否超时;如果没有超时,则停止相应定时器并且增加该物理端口健康的计数,清零故障计数,如果健康计数达到用户设定的门限,则该物理端口的最终检查结果为健康;如果已经超时,则丢弃该数据报文;
步骤四,定期检查所有定时器,如果已经超时,则找到对应的物理端口并且清零健康的计数,增加故障的计数,如果故障的计数到达用户设定的门限,则标记该接口的检查结果为故障,聚合物理端口在发送报文时将忽略标记为故障的物理端口,实现自动故障转移。
CN201410085959.XA 2014-03-10 2014-03-10 一种链路聚合路径的健康检查系统及方法 Pending CN104917624A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410085959.XA CN104917624A (zh) 2014-03-10 2014-03-10 一种链路聚合路径的健康检查系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410085959.XA CN104917624A (zh) 2014-03-10 2014-03-10 一种链路聚合路径的健康检查系统及方法

Publications (1)

Publication Number Publication Date
CN104917624A true CN104917624A (zh) 2015-09-16

Family

ID=54086353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410085959.XA Pending CN104917624A (zh) 2014-03-10 2014-03-10 一种链路聚合路径的健康检查系统及方法

Country Status (1)

Country Link
CN (1) CN104917624A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789886A (zh) * 2016-11-16 2017-05-31 深圳市异度信息产业有限公司 数据的传输方法及装置
CN106911533A (zh) * 2017-02-13 2017-06-30 杭州迪普科技股份有限公司 一种链路状态的探测方法及装置
CN107404393A (zh) * 2016-05-20 2017-11-28 北京信威通信技术股份有限公司 一种判断链路故障的方法及系统
CN109933478A (zh) * 2017-12-19 2019-06-25 杭州华为数字技术有限公司 一种存储系统的故障处理方法和存储系统
CN110784339A (zh) * 2019-10-09 2020-02-11 杭州迪普科技股份有限公司 Lacp报文超时的故障检测方法、装置、电子设备
CN113055286A (zh) * 2021-04-27 2021-06-29 融智通科技(北京)股份有限公司 交换机端口静态汇聚检测及保护方法、交换机及存储介质
CN113300953A (zh) * 2021-07-27 2021-08-24 苏州浪潮智能科技有限公司 一种多路径故障转移组的管理方法、系统及相关装置
WO2021238508A1 (zh) * 2020-05-29 2021-12-02 华为技术有限公司 一种数据处理的方法、装置和设备
CN114020606A (zh) * 2021-10-22 2022-02-08 苏州浪潮智能科技有限公司 一种多路径主机插件自动化测试方法及装置
WO2022048281A1 (zh) * 2020-09-04 2022-03-10 苏州浪潮智能科技有限公司 一种改善链路聚合协议超时的方法和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110663A (zh) * 2007-08-31 2008-01-23 华为技术有限公司 实现链路故障处理的方法、系统及装置
CN101800676A (zh) * 2010-02-20 2010-08-11 中兴通讯股份有限公司 链路检测方法、装置和系统
CN102164056A (zh) * 2011-03-17 2011-08-24 杭州华三通信技术有限公司 堆叠链路聚合故障检测方法和堆叠设备
US20130016617A1 (en) * 2011-07-12 2013-01-17 Alaxala Networks Corporation Network relay device and control method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110663A (zh) * 2007-08-31 2008-01-23 华为技术有限公司 实现链路故障处理的方法、系统及装置
CN101800676A (zh) * 2010-02-20 2010-08-11 中兴通讯股份有限公司 链路检测方法、装置和系统
CN102164056A (zh) * 2011-03-17 2011-08-24 杭州华三通信技术有限公司 堆叠链路聚合故障检测方法和堆叠设备
US20130016617A1 (en) * 2011-07-12 2013-01-17 Alaxala Networks Corporation Network relay device and control method thereof

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107404393A (zh) * 2016-05-20 2017-11-28 北京信威通信技术股份有限公司 一种判断链路故障的方法及系统
CN106789886A (zh) * 2016-11-16 2017-05-31 深圳市异度信息产业有限公司 数据的传输方法及装置
CN106911533A (zh) * 2017-02-13 2017-06-30 杭州迪普科技股份有限公司 一种链路状态的探测方法及装置
CN106911533B (zh) * 2017-02-13 2020-01-03 杭州迪普科技股份有限公司 一种链路状态的探测方法及装置
CN109933478A (zh) * 2017-12-19 2019-06-25 杭州华为数字技术有限公司 一种存储系统的故障处理方法和存储系统
CN109933478B (zh) * 2017-12-19 2021-02-26 华为技术有限公司 一种存储系统的故障处理方法和存储系统
CN110784339A (zh) * 2019-10-09 2020-02-11 杭州迪普科技股份有限公司 Lacp报文超时的故障检测方法、装置、电子设备
US11310139B2 (en) 2019-10-09 2022-04-19 Hangzhou Dptech Technologies Co., Ltd. Fault detection for LACP packet timeout
WO2021238508A1 (zh) * 2020-05-29 2021-12-02 华为技术有限公司 一种数据处理的方法、装置和设备
WO2022048281A1 (zh) * 2020-09-04 2022-03-10 苏州浪潮智能科技有限公司 一种改善链路聚合协议超时的方法和设备
US11683257B1 (en) 2020-09-04 2023-06-20 Inspur Suzhou Intelligent Technology Co., Ltd. Method and device for improving link aggregation protocol timeout
CN113055286A (zh) * 2021-04-27 2021-06-29 融智通科技(北京)股份有限公司 交换机端口静态汇聚检测及保护方法、交换机及存储介质
CN113300953B (zh) * 2021-07-27 2021-10-15 苏州浪潮智能科技有限公司 一种多路径故障转移组的管理方法、系统及相关装置
CN113300953A (zh) * 2021-07-27 2021-08-24 苏州浪潮智能科技有限公司 一种多路径故障转移组的管理方法、系统及相关装置
CN114020606A (zh) * 2021-10-22 2022-02-08 苏州浪潮智能科技有限公司 一种多路径主机插件自动化测试方法及装置
CN114020606B (zh) * 2021-10-22 2024-01-12 苏州浪潮智能科技有限公司 一种多路径主机插件自动化测试方法及装置

Similar Documents

Publication Publication Date Title
CN104917624A (zh) 一种链路聚合路径的健康检查系统及方法
US8634308B2 (en) Path detection in trill networks
CN107925629B (zh) 一种IPv6网络中数据报文的发送方法及装置
CN101355466B (zh) 连续性检查消息报文的传输方法和装置
US20120233492A1 (en) Transmitting network information using link or port aggregation protocols
CN101094121B (zh) 非直连设备间以太网链路的检测方法、系统和设备
CN101714991B (zh) 心跳机制的实现方法
CN103581021A (zh) 软件定义网络下业务检测的方法及设备
CN105337853A (zh) 一种软件定义网络中的实例建立方法和装置
US9264298B2 (en) Technique for bundling in link aggregation
US11139995B2 (en) Methods and router devices for verifying a multicast datapath
CN105610743A (zh) Mlag环境下实现stp协议族的方法及装置
CN101841424B (zh) 基于socks代理连接的ems网管系统和方法
CN101834759A (zh) 捆绑链路的检测方法及分布式设备
CN104602285B (zh) 一种容灾方法及设备
EP2165475A1 (en) System and method for an adaptive access point mode
CN109150711A (zh) 点到多点二层组播业务的保护倒换方法、装置及存储介质
CN103179036A (zh) 基于FPGA实现MPLS-TP OAM的Linktrace的方法
CN105049239A (zh) 接口连接关系的识别方法和系统
CN103825794A (zh) 多链路透明互联数据帧发送方法及装置
CN111510331B (zh) 网络故障分析方法、装置、服务器及存储介质
CN102711163A (zh) 一种ip-ran设备快速检测告警链路故障的方法
CN104079485A (zh) 一种传递指定转发者信息的方法及装置
CN114690680A (zh) 数据处理的方法、控制器以及第一网络设备
US8787217B2 (en) Method, apparatus and computer program product for fast retransmission of proposal messages

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150916

WD01 Invention patent application deemed withdrawn after publication