CN117938743A - 一种基于胖树拓扑的数据中心网络链路恢复方法和装置 - Google Patents
一种基于胖树拓扑的数据中心网络链路恢复方法和装置 Download PDFInfo
- Publication number
- CN117938743A CN117938743A CN202410098452.1A CN202410098452A CN117938743A CN 117938743 A CN117938743 A CN 117938743A CN 202410098452 A CN202410098452 A CN 202410098452A CN 117938743 A CN117938743 A CN 117938743A
- Authority
- CN
- China
- Prior art keywords
- frn
- packet
- dlid
- mad
- tree topology
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000005540 biological transmission Effects 0.000 claims abstract description 10
- 230000002159 abnormal effect Effects 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 4
- 230000000977 initiatory effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 8
- 238000007449 liver function test Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000009530 blood pressure measurement Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- COCAUCFPFHUGAA-MGNBDDOMSA-N n-[3-[(1s,7s)-5-amino-4-thia-6-azabicyclo[5.1.0]oct-5-en-7-yl]-4-fluorophenyl]-5-chloropyridine-2-carboxamide Chemical compound C=1C=C(F)C([C@@]23N=C(SCC[C@@H]2C3)N)=CC=1NC(=O)C1=CC=C(Cl)C=N1 COCAUCFPFHUGAA-MGNBDDOMSA-N 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/28—Routing or path finding of packets in data switching networks using route fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/22—Alternate routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/24—Multipath
- H04L45/247—Multipath using M:N active or standby paths
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供了一种基于胖树拓扑的数据中心网络链路恢复方法和装置,该方法包括:根据交换机入端口的路由请求,基于路由袁确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的DLID和SLID缓存到快速路由切换FRN发送队列中;从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;当所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。本发明的技术方案缩短了链路恢复时间。
Description
技术领域
本发明属于高性能网络计算领域,特别涉及一种基于胖树拓扑的数据中心网络链路恢复方法和装置。
背景技术
高性能计算(HPC)一直被用于解决复杂计算问题。随着当前数据指数级增长的趋势,需要更大规模的集群计算规模来应对当前和未来的计算挑战。在HPC中,集群高效的进程间通信取决于能够提供高带宽和低延迟同时支持大量端点(计算和存储服务器)的互连结构,依赖于高速可靠的互连网络。MPI、共享存储、机器学习框架,甚至新的异构计算架构都具有相同的特性和要求,因此需要稳健而具有弹性的网络。
随着InfiniBand网络继续扩展以适应更大规模的计算和存储容量,未来可能需要40K网络节点,甚至100K节点来满足需求,但是随着HCA卡和交换机的增加,特别是伴随这种情况不断增长的光纤线缆将会遭受物理或电气损坏,造成链路不通的情况。解决这个问题的传统软件机制包括作业检查,它将创建作业的时间点快照。如果作业在未来某个时间点失败,作业将从上次成功的状态和时间点继续。当然,IB协议也有数据完整性检查和重传机制,但这些方法对性能带来很大的负面影响,并且在非常大的规模下是不切实际的。
在实验中,我们在280个节点组成两层胖树的小规模NDR环境中进行15天压测。NDR线缆(线缆1)每小时的发生异常概率为0.0232%。1根线缆,使用5.6个月,大概会出现1次。10000根线缆,1个小时会有2.32根线缆出现异常。在乌镇中心的HDR环境下,1402条光纤线缆,7天时间发生了3次类似事件,每小时的发生异常概率为0.00129%。通过简单的计算,按照测试得到的异常概率来计算,10K、40K、100K节点规模下2小时发生线缆故障的次数如表1所示。
表1
可以看出,在大规模环境中出现链路错误的问题是比较常见的,无论是线缆1还是线缆2在更大规模的环境中出现故障的次数和概率都比较大,所以需要更加稳定的光纤链路,更加快速有效的链路容错算法。
但是在当今的高速网络中,如果出现链路故障的情况,节点会向子网管理器OpenSM发送trap128的管理包(MAD),OpenSM收到MAD包后将识别故障链路,触发重新扫描并重新计算路由以避免问题,但是对于1000个节点,这可能需要长达5秒的时间;对于具有10000个或更多节点的群集,这可能需要30秒甚至更长的时间,这将无法确保运行计算的完整性。低效的处理机制会导致较长的链路恢复时间,这将无法保证网络的可靠稳定,很可能会导致作业失败,这是无法容忍的情况。因此急需一种高效快速的路由容错方法。
发明内容
本发明的目的在于提供一种基于胖树拓扑的数据中心网络链路恢复方法和装置,旨在缩短链路恢复时间。
根据本发明的第一方面,提供了一种基于胖树拓扑的数据中心网络链路恢复方法,包括:
根据交换机入端口的路由请求,基于路由表确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的DLID和SLID缓存到FRN发送队列中;
从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;
当所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。
优选地,所述从所述FRN发送队列中读取DLID中的备用端口字段,进一步包括:
当所述FRN发送队列中存储的DLID和SLID超过预设阈值时,向CPU发起中断;CPU收到中断后,获取所述FRN发送队列,解析出DLID中的备用端口字段。
优选地,在所述读取交换机在胖树拓扑中的层级值之后,还包括:
当所述层级值为零时,不执行任何处理。
优选地,所述根据DLID和SLID组建FRN_MAD包,进一步包括:
将FRN_MAD包的SLID设置为所述交换机的LID,将FRN_MAD包的DLID设置为所述数据包的SLID,将FRN_MAD包的Payload填充以对应数据包的DLID。
优选地,所述组建FRN_MAD包并传送到VHCA,进一步包括:
当FRN_MAD包到达胖树拓扑的每一级交换机后,如果层级值不为零,则直接转发所述FRN_MAD包,如果层级值为零,则将该包传送到VHCA。
根据本发明的第二方面,提供了一种基于胖树拓扑的数据中心网络链路恢复装置,包括:
中断单元,用于根据交换机入端口的路由请求,基于路由表确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的DLID和SLID缓存到FRN发送队列中;
判断单元,用于从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;
组包单元,用于在所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。
相比于相关技术,本发明的技术方案具备以下优点:
本发明的链路切换直接在交换机中进行,缩短了链路恢复时间,保证运行计算的完整性,能够实现链路故障的快速识别和快速恢复。
本发明的其它特征和优点将在随后的说明书中阐述,并且部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可以通过在说明书、权利要求书以及附图中所指出的结构和流程来实现和获取。
附图说明
为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单介绍,显而易见的是,下面描述中的附图是本发明的某些实施例,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1是根据本发明的上行链路故障恢复示意图。
图2是根据本发明的下行链路故障恢复示意图。
图3是根据本发明的基于胖树拓扑的数据中心网络链路恢复方法的总体流程图。
图4是根据本发明的SwitchInfo属性的reserved域示意图。
图5是根据本发明的FRN_MAD包格式示意图。
图6是根据本发明的FRNUpdateTable格式示意图。
图7是根据本发明的FRN线性路由表包格式示意图。
图8是根据本发明的更新状态MAD包格式示意图。
图9是根据本发明的LFT表格式示意图。
图10是根据本发明的FRN Log格式示意图。
图11是根据本发明的故障点Switch处理流程图。
图12是根据本发明的FRN FIFO格式示意图。
图13是根据本发明的Update Table格式示意图。
图14是根据本发明的流量源点交换机处理流程图。
图15是根据本发明的链路快速恢复流程图。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
基于以上分析,为了确保在大规模网络应用场景,快速解决链路故障,提高链路故障响应速度,本发明提出一种基于胖树拓扑的数据中心网络链路恢复方法和装置,提高在链路故障时纠正通信的速度,缩短路由恢复时间,可以无感地切换到其他路径,减少对作业的影响。
本发明的链路恢复机制中,交换机有多条路由路径到达目的地,其中上行链路故障的通信恢复机制为,当交换机的其中一条路径发生链路故障时,故障点交换机快速识别链路故障并将路由切换到备选路由,从而规避故障链路,如图1所示。在下行链路故障的通信恢复机制中,在某些情况下交换机由于链路故障而没有可供选择的其他端口到达目的地,例如在胖树网络下游交换机,如图2所示。此时交换机将信息传递给网络的另一交换机,从新的交换机选择最佳路由到达目的地。本发明基于这种备选路由和故障信息回传的思想,达到链路的快速恢复。链路快速恢复机制基于IB协议,在交换机的软硬件相互配合的流程下进行。
参见图3的流程图,本发明提供的所述基于胖树拓扑的数据中心网络链路恢复方法包括:
步骤101:根据交换机入端口的路由请求,基于路由表确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的DLID和SLID缓存到快速路由切换FRN发送队列中。
步骤102:从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值。
步骤103:当所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。
具体地,在执行该方法之前,预先在交换机固件中定义如下相关域和属性:
(1)增加快速恢复标志位FRN_FLAG和交换机层级SwitchLevel域,这两个域属于交换机的属性,可以利用现有的SwitchInfo属性的reserved域,如图4所示。其中FRN_FLAG用于标识当前交换机发生过快速路由切换FRN,OpenSM通过该域判定当前交换机是否已经发生链路快速恢复的路由切换,SwitchLevel用于标记当前交换机处于拓扑中哪一个层级,交换机的固件通过当前交换机所处的胖树拓扑的层级,决定是否启动链路快速恢复、FRN_MAD的拦截和识别等功能。定义如表2所示。
表2
(2)增加属性FRNDLID,属性的ID为0xFFE0,用于构造FRN_MAD包,FRN_MAD包的源节点身份标识SLID为当前交换机SW的LID,目的节点身份标识DLID为数据包的SLID,payload为64字节,用到17bit填充数据包的DLID。当下行链路出现故障后,需要回传FRN_MAD包,告知流量源点交换机进行路由切换。FRN_MAD包格式和内容定义如图5、表3和表4所示:
表3
表4
Offset | Bits | Name | Description | Access |
64+i*17 | 16:0 | DLID | DLID=快速路由恢复数据包的SLID | RW |
(3)增加属性FRNUpdateTable,ID=0xFFE1,用于OpenSM获取UpdateTable信息时,以LID-port的形式填充MAD数据包,payload为64字节,(17bit LID+8bit port id)*20。其中OpenSM使用AttributeModifier顺序读取表项。格式和内容定义如图6、表5和表6所示:
表5
表6
(4)增加路由表MAD属性和包格式字段,属性ID为0xFFE2,将IB协议中传统的LFT和backupport以及flag设置在一个属性中,这样能保证其一致性。OpenSM使用AttributeModifier顺序读取表项。格式和内容定义如图7、表7和表8所示:表7
表8
(5)增加路由表配置开始和结束状态通知的MAD属性和包格式,属性ID为0xFFE3,OpenSM在配置路由表开始和配置路由表结束都需要通知固件,固件在开始和结束之间的时间禁用快速路由机制。格式和内容定义如图8、表9所示:
表9
交换机芯片内部由多个端口组成,每个端口自底向上分别由串行解串器Serdes模块、物理链路控制Pcs模块、链路Link模块、入端口/出端口Ingress/Egress模块组成,每个端口之间的互联是由片内的交叉开关Crossbar网络实现的。为了支持链路快速恢复,交换机芯片中的核心模块需要进行如下功能支持。
对于路由转发表FTB(Fowrard Table)模块,每个表项增加BackupPort和Flag域,如图9所示。其中BackupPort是链路快速恢复路由的备选端口,由OpenSM配置,Flag域表示当前DLID进行过路由切换,由交换机的固件修改,默认值为0。
Egress作为交换机端口的出站数据管理模块,设置FRN_EN寄存器,FRN_EN使能时(软件在配置Linkinitialize到link arm切换时打开),数据出站缓存管理模块EGR根据link状态对数据包进行数据丢包,并产生FRN log;frn_mask[2:0]针对Linkarm/Linkinitialize/Linkdown三种状态下的FRN log进行屏蔽。数据丢包场景定义如表10所示:
表10
参见图10,每个port的FRN log由32条entry组成,每个entry中存放不同的event(vldf、DLID、SLID均不同)。
将每个要丢弃的数据包(不包括广播/多播报文)的DLID/iport_id和FRN log中所有vldf为1的entry进行比对,若全部不相等则写入第一个vldf为0的entry中。
如果Log entry的vldf不全为0或超过预设阈值,则产生frn_log_ms_irq中断,将所有vldf置为0后,自动撤销中断;其中该阈值是可配置参数。
软件收到中断后,顺序读取32条FRN log entry,如果当前entry被读取,则对应的vldf清零。FRN log entry地址编码如表11所示:
表11
offerset | description |
0 | FRN entry0 |
1 | FRN entry 0 |
2 | FRN entry 1 |
3 | FRN entry 1 |
4 | FRN entry 2 |
5 | FRN entry 3 |
6 | FRN entry 3 |
... | ... |
63 | FRN entry 31 |
对于Link模块,Ingress区分当前交换机所处层级,当该交换机位于level0时,对Attribute ID为0xFFE0的MAD包则转发给port0,不修改包内容。其中:
Ingress 1bit Flag寄存器接口由软件配置,当值为1时,将MAD包转发到内部管理节点VHCA;当值为0时,将LID路由到输出端口。Ingress中数据位宽为1024bits,其中Attribute ID位于1flit[735:720]字段。
交换机的任务管理模块VHCA实现FRN包的识别和上报,功能包括对收到的SMP包进行检测,通过检查opcode和QPN识别为SMP包,检查DLID和Attribute ID,若等于0xFFE0则判定为FRN包;将FRN包映射到QP 2,并与传输层(translayer)QP 2握手获得payload存储的信息;payload搬运完成后通知translayer产生CQE并上报中断。
FRN包的Header中的信息通过CQE上报,MAD报文则需要软件解析payload获取。
参见图11、14和15的流程图,链路快速恢复步骤如下:
交换机中某个入端口Ingress向FTB(Forward Table)发起路由表查询请求。FTB向Ingress返回路由结果(Output Number);
Ingress根据路由结果,将数据包发送到Crossbar的对应入口缓存中。Crossbar将数据包交换到对应出口缓存。出口缓存将数据包发送给交换机出站Port的Egress。
Egress检测状态如果为linkdown,数据包无法发送,提取数据包中DLID和SLID,并存储在本地FRN FIFO中(如图12所示),丢弃数据包,FIFO深度为32,位宽为34bits,设置Amost_full阈值寄存器,当FIFO中存储的DLID和SLID超过阈值时,向CPU发起中断。
CPU收到中断后,读取Link_tx中的FRN FIFO中的内容。根据DLID对应的Backupport的值,来判断是直接修改路由表还是组建FRN_MAD包。
如果Backupport的值非0,则CPU根据FRN FIFO中的内容,直接修改线性转发表LFT中的内容。LFT可以认为是FTB的一个子集。具体操作为:
(1)读取LFT对应的DLID中的内容。
(2)将output port改为backupport,backupport写0,同时flag置1。
(3)软件在片上存储单元OCM中维护一个Update Table,其格式如图13,能够存储的条目为4k。在OpenSM下一个sweep周期中,通过新增属性FRN INFO获取update_table中的信息,同步SW中更新后的路由表信息,完成OpenSM和交换机中路由表的一致性,最后由OpenSM完成FRN_FLAG写回0的操作。
如果Backupport的值为0,并且如果Switchlevel不为0,则软件组建FRN_MAD包,MAD的SLID设置为交换机的LID,DLID为数据包的SLID。Payload填充以对应数据包的DLID。而如果Switchlevel为0,则软件不做任何处理(属于交换机与HCA之间的故障)。
CPU下发回传FRN MAD命令给VHCA,VHCA将MAD包注入到网络中。当FRN_MAD包到达每一级交换机后,如果判断Switchlevel非0,则直接转发FRN_MAD包。
FRN_MAD包到达流量源点交换机,Ingress根据FRN_MAD包中的AttributeIDfield,判断其为FRN_MAD包,同时在Switchlevel=0的情况下,将该包转发到VHCA。
VHCA收到FRN_MAD包,上报中断,软件读取FRN_MAD包。软件根据FRN_MAD包的payload中的DLID,修改路由表。
可见,本发明提出的基于胖树拓扑的数据中心网络链路恢复方法,相比于相关技术,链路切换直接在交换机中进行,缩短了链路恢复时间,路由恢复时间可提高到毫秒级,保证运行计算的完整性,能够实现链路故障的快速识别和快速恢复。
相应地,本发明在第二方面提供了一种基于胖树拓扑的数据中心网络链路恢复装置,包括:
中断单元,用于根据交换机入端口的路由请求,基于路由表确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的DLID和SLID缓存到FRN发送队列中;
判断单元,用于从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;
组包单元,用于在所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。
上述装置可通过上述第一方面的实施例提供的基于胖树拓扑的数据中心网络链路恢复方法实现,具体的实现方式可以参见第一方面的实施例中的描述,在此不再赘述。
可以理解,上述实施例中描述的电路结构、名称和参数仅为举例。本领域技术人员还可以根据使用需要,对以上多个实施例的结构特征进行容易想到的组合和调整,而不应将本发明的构思限制于上述示例的具体细节。
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,包括:
根据交换机入端口的路由请求,基于路由表确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的目的节点身份标识DLID和源节点身份标识SLID缓存到快速路由切换FRN发送队列中;
从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;
当所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到内部管理节点VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。
2.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述从所述FRN发送队列中读取DLID中的备用端口字段,进一步包括:
当所述FRN发送队列中存储的DLID和SLID超过预设阈值时,向CPU发起中断;CPU收到中断后,获取所述FRN发送队列,解析出DLID中的备用端口字段。
3.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,在所述读取交换机在胖树拓扑中的层级值之后,还包括:
当所述层级值为零时,不执行任何处理。
4.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述根据DLID和SLID组建FRN_MAD包,进一步包括:
将FRN_MAD包的SLID设置为所述交换机的LID,将FRN_MAD包的DLID设置为所述数据包的SLID,将FRN_MAD包的Payload填充以对应数据包的DLID。
5.根据权利要求1所述的基于胖树拓扑的数据中心网络链路恢复方法,其特征在于,所述组建FRN_MAD包并传送到内部管理节点VHCA,进一步包括:
当FRN_MAD包到达胖树拓扑的每一级交换机后,如果层级值不为零,则直接转发所述FRN_MAD包,如果层级值为零,则将该包传送到VHCA。
6.一种基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,包括:
中断单元,用于根据交换机入端口的路由请求,基于路由表确定出端口,当所述出端口链路状态异常时,丢弃数据包,并将数据包中的目的节点身份标识DLID和源节点身份标识SLID缓存到快速路由切换FRN发送队列中;
判断单元,用于从所述FRN发送队列中读取DLID中的备用端口字段,如果所述备用端口字段存在,则根据所述备用端口字段值修改路由表;如果所述备用端口字段不存在,则读取交换机在胖树拓扑中的层级值;
组包单元,用于在所述层级值不为零时,根据DLID和SLID组建FRN_MAD包,并传送到内部管理节点VHCA,以利用软件根据FRN_MAD包的DLID修改路由表。
7.根据权利要求6所述的基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,所述判断单元,进一步用于:
当所述FRN发送队列中存储的DLID和SLID超过预设阈值时,向CPU发起中断;CPU收到中断后,获取所述FRN发送队列,解析出DLID中的备用端口字段。
8.根据权利要求6所述的基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,所述判断单元,进一步用于:
当所述层级值为零时,不执行任何处理。
9.根据权利要求6所述的基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,所述组包单元,进一步用于:
将FRN_MAD包的SLID设置为所述交换机的LID,将FRN_MAD包的DLID设置为所述数据包的SLID,将FRN_MAD包的Payload填充以对应数据包的DLID。
10.根据权利要求6所述的基于胖树拓扑的数据中心网络链路恢复装置,其特征在于,所述组包单元,进一步用于:
当FRN_MAD包到达胖树拓扑的每一级交换机后,如果层级值不为零,则直接转发所述FRN_MAD包,如果层级值为零,则将该包传送到内部管理节点VHCA。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410098452.1A CN117938743B (zh) | 2024-01-23 | 2024-01-23 | 一种基于胖树拓扑的数据中心网络链路恢复方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410098452.1A CN117938743B (zh) | 2024-01-23 | 2024-01-23 | 一种基于胖树拓扑的数据中心网络链路恢复方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117938743A true CN117938743A (zh) | 2024-04-26 |
CN117938743B CN117938743B (zh) | 2024-09-10 |
Family
ID=90753453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410098452.1A Active CN117938743B (zh) | 2024-01-23 | 2024-01-23 | 一种基于胖树拓扑的数据中心网络链路恢复方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117938743B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008014254A1 (de) * | 2008-03-13 | 2009-09-17 | Audi Ag | Sternkoppler für ein Bussystem, Bussystem mit einem solchen Sternkoppler sowie Verfahren zum Austauschen von Signalen in einem Bussystem |
CN102821050A (zh) * | 2012-08-15 | 2012-12-12 | 南京南瑞继保电气有限公司 | 一种快速生成树协议应用于单环网拓扑的处理方法 |
US20140280551A1 (en) * | 2013-03-15 | 2014-09-18 | Citrix Systems, Inc. | Pairing users with social media communities |
US20220311702A1 (en) * | 2021-03-25 | 2022-09-29 | Mellanox Technologies Tlv Ltd. | Efficient propagation of fault routing notifications |
CN117354263A (zh) * | 2023-10-12 | 2024-01-05 | 曙光信息产业股份有限公司 | 网络管理方法、装置、计算机设备和存储介质 |
CN117411840A (zh) * | 2023-10-12 | 2024-01-16 | 曙光信息产业股份有限公司 | 链路故障处理方法、装置、设备、存储介质和程序产品 |
-
2024
- 2024-01-23 CN CN202410098452.1A patent/CN117938743B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008014254A1 (de) * | 2008-03-13 | 2009-09-17 | Audi Ag | Sternkoppler für ein Bussystem, Bussystem mit einem solchen Sternkoppler sowie Verfahren zum Austauschen von Signalen in einem Bussystem |
CN102821050A (zh) * | 2012-08-15 | 2012-12-12 | 南京南瑞继保电气有限公司 | 一种快速生成树协议应用于单环网拓扑的处理方法 |
US20140280551A1 (en) * | 2013-03-15 | 2014-09-18 | Citrix Systems, Inc. | Pairing users with social media communities |
US20220311702A1 (en) * | 2021-03-25 | 2022-09-29 | Mellanox Technologies Tlv Ltd. | Efficient propagation of fault routing notifications |
CN115208746A (zh) * | 2021-03-25 | 2022-10-18 | 迈络思科技有限公司 | 故障路由通知的有效传播 |
CN117354263A (zh) * | 2023-10-12 | 2024-01-05 | 曙光信息产业股份有限公司 | 网络管理方法、装置、计算机设备和存储介质 |
CN117411840A (zh) * | 2023-10-12 | 2024-01-16 | 曙光信息产业股份有限公司 | 链路故障处理方法、装置、设备、存储介质和程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN117938743B (zh) | 2024-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7706255B1 (en) | Communications apparatus with redundant switching or backpressure mechanism | |
US9755947B2 (en) | Hierarchical self-organizing classification processing in a network switch | |
US8203935B2 (en) | Signal transmitting device for switching forwarding destination | |
CN105791126B (zh) | 一种三态内容可寻址存储器tcam查表方法及装置 | |
WO2018108149A1 (zh) | 数据链路切换方法和装置以及数据链路切换设备 | |
US9203728B2 (en) | Metadata capture for testing TCP connections | |
US9465701B2 (en) | Relay device and recovery method | |
US11552882B2 (en) | Efficient propagation of fault routing notifications | |
WO2020073907A1 (zh) | 转发表项的更新方法及装置 | |
WO2003069440A2 (en) | Network processor with high-speed transceiver | |
JP4724763B2 (ja) | パケット処理装置およびインタフェースユニット | |
CN111682966B (zh) | 带故障主动报告功能的网络通信装置,系统及其方法 | |
CN117938743B (zh) | 一种基于胖树拓扑的数据中心网络链路恢复方法和装置 | |
US9426058B2 (en) | Transmission equipment and transmission method | |
Tong et al. | A novel and efficient link discovery mechanism in SDN | |
US20230239244A1 (en) | Heavy hitter flow detection | |
CN117354253A (zh) | 一种网络拥塞通知方法、装置及存储介质 | |
US20130346837A1 (en) | Communication device | |
JP2010141845A (ja) | 複数のサーバを有する通信装置及び通信方法 | |
CN108282383B (zh) | 一种实现故障处理的方法及设备 | |
CN116962161A (zh) | 路径检测方法、装置、系统及计算机可读存储介质 | |
CN110213118B (zh) | 一种fc网络系统及其流量控制方法 | |
CN115001627B (zh) | 一种InfiniBand网络子网管理报文处理方法及系统 | |
US20230080535A1 (en) | Network Path Testing via Independent Test Traffic | |
WO2024113830A1 (zh) | 数据传输方法、装置、设备、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |