CN115499271B - 一种混合网络拓扑结构及其路由方法 - Google Patents
一种混合网络拓扑结构及其路由方法 Download PDFInfo
- Publication number
- CN115499271B CN115499271B CN202211054395.4A CN202211054395A CN115499271B CN 115499271 B CN115499271 B CN 115499271B CN 202211054395 A CN202211054395 A CN 202211054395A CN 115499271 B CN115499271 B CN 115499271B
- Authority
- CN
- China
- Prior art keywords
- edge
- node
- network
- direct
- switches
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000005540 biological transmission Effects 0.000 claims abstract description 11
- 235000008694 Humulus lupulus Nutrition 0.000 claims description 12
- 238000004891 communication Methods 0.000 abstract description 29
- 238000012217 deletion Methods 0.000 abstract description 2
- 230000037430 deletion Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/44—Star or tree networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/14—Routing performance; Theoretical aspects
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Multi Processors (AREA)
Abstract
本发明公开了一种混合网络拓扑结构及其路由方法,混合网络拓扑结构,包括直接子网络3D‑Torus结构和间接子网络多层交换机组成的树状网络结构,其中多个直接子网络之间通过间接子网络连接;直接子网络为规模是N×N×N且删除部分连接的3D‑Torus结构,间接子网络为两层交换机构成的树状网络结构;在混合网络拓扑结构中对报文采用路由方法进行传输。本发明具有结构规整、网络直径小、带宽高、传输时延低的优点,既适合局部通信,也适合全局通信,并且可支持大规模高效通信。
Description
技术领域
本发明属于网络技术领域,具体涉及一种混合网络拓扑结构及其路由方法。
背景技术
当前高性能计算集群正在向E级计算规模发展,网络拓扑结构代表了集群中的各类节点的连接规则,也面临更加严峻的性能挑战,需要设计一个扩展性和通信性能更好的网络拓扑结构,来保证高性能计算集群拥有更大的计算节点规模以及更好的通信性能。
网络拓扑结构与应用的通信特征相匹配,则可以显著提升网络的通信性能和网络资源利用率,降低资源成本和能耗开销。高性能计算应用普遍都包括点对点通信和全局通信两种通信模式,应用向大规模扩展时,其核心算法部分的点对点通信的时间占比高,有显著的通信局部性特征;同时全局通信对程序运行时间的影响也越来越大,这就要求网络拓扑结构节点度高、网络直径低。
直接网络3D-Torus和间接网络Fat-tree是高性能互连领域常用的两种网络拓扑,例如美国的Blue Gene/L的网络拓扑是3D-Torus,中国的神威·太湖之光的网络拓扑是Fat-tree。但是3D-Torus的网络直径会随着节点规模的增大而线性增大,极大地影响通信的性能。而Fat-tree每个终端节点只连接一个边缘交换机,当该交换机无法使用时,会有一组终端节点无法使用,容错性不高;且终端节点之间不互联,不适合局部通信占比高或Alltoall集合通信类型的高性能应用。
发明内容
为了克服现有技术的不足,本发明提供了一种混合网络拓扑结构及其路由方法,混合网络拓扑结构,包括直接子网络3D-Torus结构和间接子网络多层交换机组成的树状网络结构,其中多个直接子网络之间通过间接子网络连接;直接子网络为规模是N×N×N且删除部分连接的3D-Torus结构,间接子网络为两层交换机构成的树状网络结构;在混合网络拓扑结构中对报文采用路由方法进行传输。本发明具有结构规整、网络直径小、带宽高、传输时延低的优点,既适合局部通信,也适合全局通信,并且可支持大规模高效通信。
本发明解决其技术问题所采用的技术方案包括如下步骤:
一种混合网络拓扑结构,包括间接子网络和K个直接子网络;所述K个直接子网络通过间接子网络连接;
单个直接子网络为规模是N×N×N且删除部分连接的3D-Torus结构,用X、Y、Z表示直接子网络的节点在3D-Torus结构中的坐标,X、Y、Z的取值均为0,1,…,N-1;删除部分连接的规则如下:将3D-Torus结构中由边界节点之间的互连产生了横跨整个3D-Torus结构的链路定义为长连接;删除所有Y方向的长连接,X方向上删除Y=1~N-2时的长连接,Z方向删除X=1~N-2且Y=1~N-2时的长连接;
所述间接子网络为两层交换机构成的树状网络结构;第一层交换机称为边缘交换机,边缘交换机与直接子网络直接连接;第二层交换机称为核心交换机,核心交换机与边缘交换机直接连接;
定义直接子网络中X、Y、Z任意一个坐标值为0或者N-1的节点为边缘节点,直接子网络中只有边缘节点连接边缘交换机,处于直接子网络内部的(N-2)3个节点不连接边缘交换机,直接子网络与(N3-(N-2)3-2*(N-2)2)/2N+1=2N-1个边缘交换机连接,边缘交换机的编号为A,A=1,2,…,2N-1,直接子网络与2N-1个边缘交换机共同组成一个pod;K个直接子网络构成K个pod;
每个pod中,直接子网络中的边缘节点均会与边缘交换机连接,2N-2个边缘交换机每个连接2N个边缘节点,另1个边缘交换机会连接2(N-2)2个边缘节点,具体连接方式如下:
首先对于X、Z任意一个方向的值等于0或者N-1的节点,通过X+(-1)[((X-Z)*2)/N+1]*Z+[(N+1)/2]计算其连接的边缘交换机序号,而剩下节点的坐标为:Y=0时X=1~N-2、Z=1~N-2,总共(N-2)2个节点以及坐标为:Y=N-1时X=1~N-2、Z=1~N-2,总共(N-2)2个节点,连接至编号为2N-1的边缘交换机,设定节点属于与其连接的边缘交换机;对于直接子网络内部没有连接边缘交换机的节点,在与它距离最短的边缘节点中选择负载最小的边缘交换机作为目的节点所属的边缘交换机;
边缘交换机与核心交换机组成树状网络,连接方式如下:pod个数为K,边缘交换机总数为(2N-1)×K,核心交换机的总数也为(2N-1)×K;将核心交换机分为(2N-1)组,每组包括K个核心交换机,核心交换机的组编号为C,C=1,2,…,2N-1;第C组的每个核心交换机均会分别连接每个pod中的编号为A=C的边缘交换机。
优选地,所述N=4。
一种应用于上述混合网络拓扑结构的路由方法,包括如下步骤:
步骤1:定义自适应维序路由算法;
报文按照X、Y、Z维的顺序进行路由,先测试X方向上的通道状态,若X方向通道空闲,则沿X方向通道传输报文;若发现X方向通道拥塞时,再测试Y、Z方向通道的状态,Y、Z方向通道哪个空闲就沿该方向进行报文的传输;
步骤2:在进行报文传输时,当源节点和目的节点位于同一pod内时,路由包括以下步骤:
步骤2-1:判断源节点与目的节点之间的直接子网络路径是否大于2跳,若不大于2跳,则通过直接子网络路由到目的节点;若大于2跳,比较源节点与目的节点所属的边缘交换机的编号是否相同;
步骤2-2:若相同,则报文路由到目的节点所属的边缘交换机,如果目的节点与边缘交换机直接连接,则报文由边缘交换机路由至目的节点;否则边缘交换机将报文发送至其直接连接的节点中距离目的节点最近的节点,再经过直接子网络路由到目的节点;
步骤2-3:若不同,源节点与目的节点不属于同一个边缘交换机,则源节点先通过直接子网络的自适应维序路由到与目的节点属于同一个边缘交换机的节点,后续的步骤同步骤2-2;
步骤3:当源节点和目的节点位于不同pod内时,此时报文需跨pod进行路由,包括以下步骤:
步骤3-1:判断源节点与目的节点所连接的边缘交换机编号是否相同,若相同,报文直接在间接子网络内进行传输,直接转到步骤3-3,若不同,则先在直接子网络内进行传输,转到步骤3-2;
步骤3-2:报文在直接子网络内进行传输,源节点通过直接子网络的自适应维序路由传输到最近的与目的节点所属边缘交换机编号相同的节点,然后报文在间接子网络内进行传输;
步骤3-3:报文在间接子网络内进行传输,报文先传输到当前节点所属的边缘交换机上,边缘交换机再根据上行链路的拥塞程度,采用自适应路由选择空闲的核心交换机作为下一跳路由的地址;报文到达核心交换机后,核心交换机将报文传送至与目的节点所在pod对应的边缘交换机;最后通过边缘交换机判断能否直接发送至目的节点,若能则直接传输;若不能则发送至距离目的节点最近的节点,再经过直接子网络路由到目的节点。
本发明的有益效果如下:
本发明采用3D-Torus拓扑和树状多层交换机相结合的方法构建混合网络拓扑结构。可发挥直接子网络拓扑Torus的结构规整、网络直径低、节点度高、容错性高以及间接子网络扩展性好、带宽高的优势。所提出的混合网络拓扑具有结构规整、网络直径小、带宽高、传输时延低的优点,既适合局部通信,也适合全局通信,并且可支持大规模高效通信。同时,针对混合网络拓扑结构特点提出使用直接子网络链路时采用自适应维序路由,使用间接子网络链路时采用自适应路由的路由策略,能有效防止死锁,降低拥塞。
附图说明
图1是本发明提出的混合网络拓扑的直接子网络当N=4时的结构示意图。
图2是本发明提出的混合网络拓扑的pod结构示意图。
图3是本发明提出的混合网络拓扑的直接子网络XZ平面示意图。
图4是本发明提出的混合网络拓扑的pod数量为8时的整体拓扑结构示意图。
图5是本发明提出的路由策略的pod内路由流程示意图。
图6是本发明提出的路由策略的pod间路由流程示意图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明的目的是:面对高性能计算集群日益增长的需求,设计出匹配高性能计算应用通信特征的、扩展性好和网络直径低的网络拓扑结构并设计相应的路由策略。由于混合网络拓扑可以结合直接网络和间接网络的优势,其逐渐成为一种网络拓扑设计的新趋势。所以本发明采用了混合网络拓扑结构,由直接子网络和间接子网络构成。
一种混合网络拓扑结构,包括间接子网络和K个直接子网络;所述K个直接子网络通过间接子网络连接;
单个直接子网络为规模是N×N×N且删除部分连接的3D-Torus结构,用X、Y、Z表示直接子网络的节点在3D-Torus结构中的坐标,X、Y、Z的取值均为0,1,…,N-1;删除部分连接的规则如下:将3D-Torus结构中由边界节点之间的互连产生了横跨整个3D-Torus结构的链路定义为长连接;删除所有Y方向的长连接,X方向上删除Y=1~N-2时的长连接,Z方向删除X=1~N-2且Y=1~N-2时的长连接;
所述间接子网络为两层交换机构成的树状网络结构;第一层交换机称为边缘交换机,边缘交换机与直接子网络直接连接;第二层交换机称为核心交换机,核心交换机与边缘交换机直接连接;
定义直接子网络中X、Y、Z任意一个坐标值为0或者N-1的节点为边缘节点,直接子网络中只有边缘节点连接边缘交换机,处于直接子网络内部的(N-2)3个节点不连接边缘交换机,直接子网络与(N3-(N-2)3-2*(N-2)2)/2N+1=2N-1个边缘交换机连接,边缘交换机的编号为A,A=1,2,…,2N-1,直接子网络与2N-1个边缘交换机共同组成一个pod;K个直接子网络构成K个pod;
每个pod中,直接子网络中的边缘节点均会与边缘交换机连接,2N-2个边缘交换机每个连接2N个边缘节点,另1个边缘交换机会连接2(N-2)2个边缘节点,具体连接方式如下:
首先对于X、Z任意一个方向的值等于0或者N-1的节点,通过X+(-1)[((X-Z)*2)/N+1]*Z+[(N+1)/2]计算其连接的边缘节点序号,而剩下节点的坐标为:Y=0时X=1~N-2、Z=1~N-2,总共(N-2)2个节点以及坐标为:Y=N-1时X=1~N-2、Z=1~N-2,总共(N-2)2个节点,连接至编号为2N-1的边缘交换机,设定节点属于与其连接的边缘交换机;对于直接子网络内部没有连接边缘交换机的节点,在与它距离最短的边缘节点中选择负载最小的边缘交换机作为目的节点所属的边缘交换机。
边缘交换机与核心交换机组成树状网络,连接方式如下:pod个数为K,边缘交换机总数为(2N-1)×K,核心交换机的总数也为(2N-1)×K;将核心交换机分为(2N-1)组,每组包括K个核心交换机,核心交换机的组编号为C,C=1,2,…,2N-1;第C组的每个核心交换机均会分别连接每个pod中的编号为A=C的边缘交换机;这样保证每个边缘交换机均连接K个核心交换机,同时每个核心交换机均连接K个边缘交换机,组成树状网络。
一种应用于上述混合网络拓扑结构的路由方法,包括如下步骤:
步骤1:定义自适应维序路由算法;
报文按照X、Y、Z维的顺序进行路由,先测试X方向上的通道状态,若X方向通道空闲,则沿X方向通道传输报文;若发现X方向通道拥塞时,再测试Y、Z方向通道的状态,Y、Z方向通道哪个空闲就沿该方向进行报文的传输;
步骤2:在进行报文传输时,当源节点和目的节点位于同一pod内时,路由包括以下步骤:
步骤2-1:判断源节点与目的节点之间的直接子网络路径是否大于2跳,若不大于2跳,则通过直接子网络路由到目的节点;若大于2跳,比较源节点与目的节点所属的边缘交换机的编号是否相同;
步骤2-2:若相同,则报文路由到目的节点所属的边缘交换机,如果目的节点与边缘交换机直接连接,则报文由边缘交换机路由至目的节点;否则边缘交换机将报文发送至其直接连接的节点中距离目的节点最近的节点,再经过直接子网络路由到目的节点;
步骤2-3:若不同,源节点与目的节点不属于同一个边缘交换机,则源节点先通过直接子网络的自适应维序路由到与目的节点属于同一个边缘交换机的节点,后续的步骤同步骤2-2;
步骤3:当源节点和目的节点位于不同pod内时,此时报文需跨pod进行路由,包括以下步骤:
步骤3-1:判断源节点与目的节点所连接的边缘交换机编号是否相同,若相同,报文直接在间接子网络内进行传输,直接转到步骤3-3,若不同,则先在直接子网络内进行传输,转到步骤3-2;
步骤3-2:报文在直接子网络内进行传输,源节点通过直接子网络的自适应维序路由传输到最近的与目的节点所属边缘交换机编号相同的节点,然后报文在间接子网络内进行传输;
步骤3-3:报文在间接子网络内进行传输,报文先传输到当前节点所属的边缘交换机上,边缘交换机再根据上行链路的拥塞程度,采用自适应路由选择空闲的核心交换机作为下一跳路由的地址;报文到达核心交换机后,核心交换机将报文传送至与目的节点所在pod对应的边缘交换机;最后通过边缘交换机判断能否直接发送至目的节点,若能则直接传输;若不能则发送至距离目的节点最近的节点,再经过直接子网络路由到目的节点。
具体实施例:
本实施例提供了一种混合网络拓扑结构,包括:直接子网络3D-Torus结构和间接子网络多层交换机组成的树状网络结构。其中多个直接子网络之间通过间接子网络连接。
本实施例采用直接网络和间接网络结合的方法,采用3D-Torus拓扑和树状多层交换机相结合的方法构建混合网络拓扑结构。可发挥直接子网络拓扑Torus的结构规整、网络直径低、节点度高、容错性高以及间接子网络扩展性好、带宽高的优势,如图1所示。所提出的混合网络拓扑具有结构规整、网络直径小、带宽高、传输时延低的优点,既适合局部通信,也适合全局通信,并且可支持大规模高效通信。同时,针对混合网络拓扑结构特点提出使用直接子网络链路时采用自适应维序路由,使用间接子网络链路时采用自适应路由的路由策略,能有效防止死锁,降低拥塞。
具体来说Torus拓扑结构适合局部通信特征强烈的高性能计算应用,并且小规模的Torus具有网络直径低,结构对称等优势,其中以规模大小为4×4×4的结构最优;多层交换机组成的树状结构可以保证拓扑具有良好的可扩展性,同时网络规模增大时,网络直径只与间接子网络的层数有关,因此采用多层交换机组成的树状网络结构作为间接子网络,Torus直接子网络之间以树状多层交换机的间接子网络连接起来,构成混合网络拓扑KNS-3DTF。并且在Torus网络的基础之上,删除部分长连接用于与间接子网络连接,保证不需要额外增加Torus中节点的端口,可有效降低系统部署成本。据此,本发明提出了混合网络结构KNS-3DTF。通过三个参数表示其结构,分别为K、N、S。K为pod数量;N为直接子网络3D-Torus的每一维的节点个数;S表示间接子网络的层数。
直接子网络由4*4*4,且删除了部分连接的3D-Torus构成。将3D-Torus结构中边界节点之间的互连产生了横跨整个结构的链路称为长连接,其删除连接的规则为,删除所有Y方向的长连接,X方向上删除Y=1~2时的长连接,Z方向删除X=1~2且Y=1~2时的长连接。保证直接子网络中的节点在连接边缘交换机后,其节点度均为6。
所述的间接子网络为多层交换机构成的树状网络结构。一般由两层交换机组成,第一层交换机与直接子网络直接相连,称为边缘交换机。直接子网络3D-Torus中只有处于边缘的节点连接边缘交换机,处于中心的8个节点不连接边缘交换机,每个直接子网络都有7个边缘交换机与之连接,共同组成一个pod,如图2所示。每个pod之间的边缘交换机之间通过上一层的交换机连接,称为核心交换机。
每个pod中,边缘交换机与直接子网络连接方式如下:将X,Z固定不变时,Y方向的4个节点称为一组。同时定义X,Y,Z任意一个方向的值等于0或者3(即处在3D-Torus边缘)的节点为边缘节点。直接子网络中的边缘节点均会与边缘交换机连接,6个边缘交换机每个会分别连接8个节点,1个边缘交换机会连接8个节点。为了方便描述,从3D-Torus的XZ方向来描述连接情况,用坐标(X,Z)来表示Y方向的一组N个节点。
首先对于X,Z任意一个方向的值等于0或者3的节点,通过X+(-1)[((X-Z)*2)/4+1]*Z+[(4+1)/2]计算其连接的边缘节点序号。而剩下的节点的坐标为Y=0时X=1~2、Z=1~2,总共4个节点以及坐标为Y=3时X=1~2、Z=1~2,总共4个节点,连接至序号为7的边缘交换机。当内部节点没有连接边缘交换机时,由于每个节点相邻的节点分别连接三个不同的边缘交换机,在三个边缘交换机中选择负载最小的交换机,作为目的节点所属的边缘交换机。如图3所示,为一个4×4的矩阵,图中数字标号相同的节点代表连接同一个边缘交换机的编号,并且除了数字标号为7的节点,其余节点均代表一组Y方向上的4个节点。而数字标号为7的4个节点为Y=0、3的8个边缘节点所连接的边缘交换机编号。从图看出,我们以Z=(N-1)/2=1.5或者X=(N-1)/2=1.5为分界线,在同一分界线内的2组边缘节点,分别连接不同的交换机,并且包含所有的边缘交换机编号,这样保证消息可以在3跳之内,到达任意编号的边缘交换机,这有效减小了跳数。
边缘交换机与核心交换机组成树状网络,连接方式如下:当拓扑中的pod个数为8时,边缘交换机总数为56,边缘交换机上有一层核心交换机,每个边缘交换机会连接8个不同的核心交换机。核心交换机的节点度均为8,每个核心交换机均会连接8个pod中的相同编号的边缘交换机,故核心交换机的总数也为56。这样可保证每个边缘交换机均连接8个核心交换机,同时每个核心交换机均连接8个边缘交换机,组成树状网络。详细连接情况如图4所示,为本发明提出的混合网络拓扑的pod数量为8时的整体拓扑结构示意图。此时网络中的终端规模为512,每个pod内边缘交换机数量为7,总数为56,核心交换机总数为56。
KNS-3DTF中,每个终端节点可以用坐标(P,X,Y,Z,A)标识,P代表pod编号,X、Y、Z代表在3D-Torus中的坐标,A代表边缘交换机的编号,从1开始编号。相应的边缘交换机编号,用坐标(P,A)表示,其中P表示pod编号;A表示边缘交换机在该pod内的编号,从1开始编号。图4中被选中的节点标号为(0,3,0,0,5),表示该节点位于第0号pod内,在3D-Torus中的坐标为(3,0,0),连接边缘交换机编号为5,坐标为(0,5)。
根据本发明的技术方案,提供了一种匹配该网络拓扑结构的路由策略,包括:判断源节点和目的节点是否位于同一pod内,当源节点和目的节点位于同一pod内时,则根据跳数判断报文通过直接子网络链路采用自适应维序路由算法还是经过边缘交换机路由。当源节点和目的节点位于不同pod内时,经过边缘交换机路由,该过程可分为直接子网络路由和间接子网络路由两部分。直接子网络路由采用自适应维序路由,报文在此过程到达中间节点。随后进行间接子网络路由,报文从中间节点发送到其所属的边缘交换机,再通过自适应路由到达目的节点所在pod内的边缘交换机,最后由边缘交换机判断目的节点是否是其直接连接的节点,若是则直接发送到目的节点,否则发送至直接连接的节点中距离目的节点最近的节点,再经过直接子网络路由到目的节点。
自适应维序路由算法中维序的意思是:报文按照X、Y、Z维的顺序进行路由。先测试X方向上的通道状态,若X维通道空闲,则沿X维通道传输报文,若发现X维通道拥塞时,再测试Y、Z通道的状态,遇到某一维度的通道空闲就进行报文的传输,灵活改变传输维度。采用维序的方式能在传输过程中避免网络的死锁现象。而配合自适应路由,可以提升网络中数据传输路径的多样性,有效减少维序路由带来的传输路径重合问题,一定程度上避免网络拥塞,具有平衡网络负载的能力。同时为了避免给边缘交换机带来更大压力,导致pod间通信受到影响,一般pod内的通信,报文会优先考虑直接子网络的链路,除非通过边缘交换机路由能获得更短的路径。
为了便于路由策略的说明,设报文的源节点编号为(Psrc,Xsrc,Ysrc,Zsrc,Asrc),所连接的边缘交换机编号为(Psrc,Asrc);目的节点编号为(Pdst,Xdst,Ydst,Zdst,Adst),所连接的边缘交换机编号为(Pdst,Adst)。
当源节点和目的节点位于同一pod内时,即Psrc=Pdst时,路由包括以下步骤,其详细流程图如图5所示:
1)先判断当前节点与目的节点之间的直接子网络路径是否大于2跳,若不大于2跳,则通过直接子网络链路到指定的节点。若大于2跳,比较当前节点与目的节点的所属的边缘交换机的编号Asrc、Adst是否相同。
2)若相同,则报文路由到目的节点所属的边缘交换机,如果目的节点与边缘交换机直接连接,则报文由边缘交换机路由至目的节点;否则边缘交换机将报文发送至其直接连接的节点中距离目的节点最近的节点,再经过直接子网络路由到目的节点。
3)若不同,两个节点不属于同一个边缘交换机,则源节点先通过直接子网络的自适应维序路由到与目的节点属于同一个边缘交换机的节点。由于一个边缘交换机一般有2组8个Y方向的节点连接至一个交换机,由图3可知,以Z=1.5或者X=1.5为分界线,在同一分界线内的2组边缘节点,分别连接不同的交换机,并且包含所有的边缘交换机编号,有效减少了跳数,所以此过程的跳数最大不超过3跳。后续的步骤同1)。
当源节点和目的节点位于不同pod时,即Psrc≠Pdst时,此时报文需跨pod进行路由,路由包括以下步骤,其详细流程图如图6所示:
1)首先需要判断源节点与目的节点所连接的边缘交换机编号Asrc、Adst是否相同,若相同,报文直接在多级间接子网络中进行传输,见步骤3),若不同先在直接子网络内进行传输,见步骤2)。
2)报文在直接子网络内进行传输,该过程与源节点和目的节点位于同一pod内的类似,源节点通过直接子网络链路经过自适应维序路由传输到最近的与目的节点所属边缘交换机编号相同的节点。
3)报文在间接子网络内进行传输,报文先路由到当前节点所属的边缘交换机上,边缘交换机再根据上行链路的拥塞程度,采用自适应算法选择空闲的核心交换机作为下一跳路由的地址。报文到达核心交换机后,核心交换机将报文传送至与目的节点所在pod对应的边缘交换机。最后边缘交换机判断目的节点是否是其直接连接的节点,若是则直接发送到目的节点,若不是则发送至直接连接的节点中距离目的节点最近的节点,再经过直接子网络路由到目的节点。
Claims (3)
1.一种混合网络拓扑结构,其特征在于,包括间接子网络和K个直接子网络;所述K个直接子网络通过间接子网络连接;
单个直接子网络为规模是N×N×N且删除部分连接的3D-Torus结构,用X、Y、Z表示直接子网络的节点在3D-Torus结构中的坐标,X、Y、Z的取值均为0,1,…,N-1;删除部分连接的规则如下:将3D-Torus结构中由边界节点之间的互连产生了横跨整个3D-Torus结构的链路定义为长连接;删除所有Y方向的长连接,X方向上删除Y=1~N-2时的长连接,Z方向删除X=1~N-2且Y=1~N-2时的长连接;
所述间接子网络为两层交换机构成的树状网络结构;第一层交换机称为边缘交换机,边缘交换机与直接子网络直接连接;第二层交换机称为核心交换机,核心交换机与边缘交换机直接连接;
定义直接子网络中X、Y、Z任意一个坐标值为0或者N-1的节点为边缘节点,直接子网络中只有边缘节点连接边缘交换机,处于直接子网络内部的(N-2)3个节点不连接边缘交换机,直接子网络与(N3-(N-2)3-2*(N-2)2)/2N+1=2N-1个边缘交换机连接,边缘交换机的编号为A,A=1,2,…,2N-1,直接子网络与2N-1个边缘交换机共同组成一个pod;K个直接子网络构成K个pod;
每个pod中,直接子网络中的边缘节点均会与边缘交换机连接,2N-2个边缘交换机每个连接2N个边缘节点,另1个边缘交换机会连接2(N-2)2个边缘节点,具体连接方式如下:
首先对于X、Z任意一个方向的值等于0或者N-1的节点,通过X+(-1)[((X-Z)*2)/N+1]*Z+[(N+1)/2]计算其连接的边缘交换机序号,而剩下节点的坐标为:Y=0时X=1~N-2、Z=1~N-2,总共(N-2)2个节点以及坐标为:Y=N-1时X=1~N-2、Z=1~N-2,总共(N-2)2个节点,连接至编号为2N-1的边缘交换机,设定节点属于与其连接的边缘交换机;对于直接子网络内部没有连接边缘交换机的节点,在与它距离最短的边缘节点中选择负载最小的边缘交换机作为目的节点所属的边缘交换机;
边缘交换机与核心交换机组成树状网络,连接方式如下:pod个数为K,边缘交换机总数为(2N-1)×K,核心交换机的总数也为(2N-1)×K;将核心交换机分为(2N-1)组,每组包括K个核心交换机,核心交换机的组编号为C,C=1,2,…,2N-1;第C组的每个核心交换机均会分别连接每个pod中的编号为A=C的边缘交换机。
2.根据权利要求1所述的一种混合网络拓扑结构,其特征在于,所述N=4。
3.一种应用于权利要求1所述的混合网络拓扑结构的路由方法,包括如下步骤:
步骤1:定义自适应维序路由算法;
报文按照X、Y、Z维的顺序进行路由,先测试X方向上的通道状态,若X方向通道空闲,则沿X方向通道传输报文;若发现X方向通道拥塞时,再测试Y、Z方向通道的状态,Y、Z方向通道哪个空闲就沿该方向进行报文的传输;
步骤2:在进行报文传输时,当源节点和目的节点位于同一pod内时,路由包括以下步骤:
步骤2-1:判断源节点与目的节点之间的直接子网络路径是否大于2跳,若不大于2跳,则通过直接子网络路由到目的节点;若大于2跳,比较源节点与目的节点所属的边缘交换机的编号是否相同;
步骤2-2:若相同,则报文路由到目的节点所属的边缘交换机,如果目的节点与边缘交换机直接连接,则报文由边缘交换机路由至目的节点;否则边缘交换机将报文发送至其直接连接的节点中距离目的节点最近的节点,再经过直接子网络路由到目的节点;
步骤2-3:若不同,源节点与目的节点不属于同一个边缘交换机,则源节点先通过直接子网络的自适应维序路由到与目的节点属于同一个边缘交换机的节点,后续的步骤同步骤2-2;
步骤3:当源节点和目的节点位于不同pod内时,此时报文需跨pod进行路由,包括以下步骤:
步骤3-1:判断源节点与目的节点所连接的边缘交换机编号是否相同,若相同,报文直接在间接子网络内进行传输,直接转到步骤3-3,若不同,则先在直接子网络内进行传输,转到步骤3-2;
步骤3-2:报文在直接子网络内进行传输,源节点通过直接子网络的自适应维序路由传输到最近的与目的节点所属边缘交换机编号相同的节点,然后报文在间接子网络内进行传输;
步骤3-3:报文在间接子网络内进行传输,报文先传输到当前节点所属的边缘交换机上,边缘交换机再根据上行链路的拥塞程度,采用自适应路由选择空闲的核心交换机作为下一跳路由的地址;报文到达核心交换机后,核心交换机将报文传送至与目的节点所在pod对应的边缘交换机;最后通过边缘交换机判断能否直接发送至目的节点,若能则直接传输;若不能则发送至距离目的节点最近的节点,再经过直接子网络路由到目的节点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211054395.4A CN115499271B (zh) | 2022-08-30 | 2022-08-30 | 一种混合网络拓扑结构及其路由方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211054395.4A CN115499271B (zh) | 2022-08-30 | 2022-08-30 | 一种混合网络拓扑结构及其路由方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115499271A CN115499271A (zh) | 2022-12-20 |
CN115499271B true CN115499271B (zh) | 2023-10-13 |
Family
ID=84466558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211054395.4A Active CN115499271B (zh) | 2022-08-30 | 2022-08-30 | 一种混合网络拓扑结构及其路由方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115499271B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515893A (zh) * | 2009-03-26 | 2009-08-26 | 浙江大学 | 确定rdt片上网络最短路由的方法 |
CN105634953A (zh) * | 2015-12-30 | 2016-06-01 | 中国人民解放军国防科学技术大学 | 一种基于可见光通信的混合数据中心组网与路由方法 |
CN106165356A (zh) * | 2014-02-13 | 2016-11-23 | 洛克波特网络股份有限公司 | 在分布式直接互连网络中路由分组的方法 |
CN107509126A (zh) * | 2016-11-10 | 2017-12-22 | 华为技术有限公司 | 光网络的逻辑拓扑重构方法、重构控制器及光网络系统 |
CN108696329A (zh) * | 2018-08-27 | 2018-10-23 | 电子科技大学 | 基于二维Torus架构的大规模光网络拓扑设计方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4676463B2 (ja) * | 2007-07-13 | 2011-04-27 | 株式会社日立製作所 | 並列計算機システム |
-
2022
- 2022-08-30 CN CN202211054395.4A patent/CN115499271B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515893A (zh) * | 2009-03-26 | 2009-08-26 | 浙江大学 | 确定rdt片上网络最短路由的方法 |
CN106165356A (zh) * | 2014-02-13 | 2016-11-23 | 洛克波特网络股份有限公司 | 在分布式直接互连网络中路由分组的方法 |
CN105634953A (zh) * | 2015-12-30 | 2016-06-01 | 中国人民解放军国防科学技术大学 | 一种基于可见光通信的混合数据中心组网与路由方法 |
CN107509126A (zh) * | 2016-11-10 | 2017-12-22 | 华为技术有限公司 | 光网络的逻辑拓扑重构方法、重构控制器及光网络系统 |
CN108696329A (zh) * | 2018-08-27 | 2018-10-23 | 电子科技大学 | 基于二维Torus架构的大规模光网络拓扑设计方法 |
Non-Patent Citations (1)
Title |
---|
数据中心中路由编码的可行性研究;丁炳辰;电子学报;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115499271A (zh) | 2022-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9825844B2 (en) | Network topology of hierarchical ring with recursive shortcuts | |
CN112350949B (zh) | 软件定义网络中基于流调度的重路由拥塞控制方法及系统 | |
CN108259387B (zh) | 一种通过交换机构建的交换系统及其路由方法 | |
CN108540204A (zh) | 用于卫星网络拓扑生成的快速收敛蚁群算法 | |
CN108449269A (zh) | 基于sdn的数据中心网络负载均衡方法 | |
CN103346967A (zh) | 一种数据中心网络拓扑结构及其路由方法 | |
JP2003533106A (ja) | 通信ネットワーク | |
CN108234310A (zh) | 多层次互连网络、自适应路由方法及路由设备 | |
US20180227215A1 (en) | Systems and Methods for NoC Construction | |
US20050254473A1 (en) | Routing within a mobile communication network | |
CN110830394A (zh) | 一种基于RapidIO网络的路由表生成方法 | |
CN102769569B (zh) | 交换式矩阵数据中心网络系统及数据包转发方法 | |
CN107484220A (zh) | 一种无线传感器和执行器网络的可靠高效路由方法 | |
CN117135059B (zh) | 一种网络拓扑结构、构造方法、路由算法、设备及介质 | |
CN116886591A (zh) | 片上网络的拓扑结构及路由方法 | |
CN115499271B (zh) | 一种混合网络拓扑结构及其路由方法 | |
CN116016384B (zh) | 基于环形布局的可扩展片上网络拓扑结构及其路由方法 | |
Ashraf | Placing controllers in software-defined wireless mesh networks | |
CN111371572B (zh) | 一种网络节点的选举方法及节点设备 | |
CN103297481A (zh) | 互联交换方法和装置 | |
CN113203940B (zh) | 3D NoC测试规划中的并行测试方法 | |
Hu et al. | Restricted epidemic routing method in large-scale delay-tolerant networks | |
CN110972206B (zh) | 一种实现5g物联网网络路由路径的多跳路由方法 | |
Huang et al. | Socially-aware concurrent entanglement routing with path decomposition in quantum networks | |
CN115297065B (zh) | 处理设备通信互连方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |