CN101394343B - 并行计算机系统通信中网络存在故障域时的路由方法 - Google Patents

并行计算机系统通信中网络存在故障域时的路由方法 Download PDF

Info

Publication number
CN101394343B
CN101394343B CN2008100463879A CN200810046387A CN101394343B CN 101394343 B CN101394343 B CN 101394343B CN 2008100463879 A CN2008100463879 A CN 2008100463879A CN 200810046387 A CN200810046387 A CN 200810046387A CN 101394343 B CN101394343 B CN 101394343B
Authority
CN
China
Prior art keywords
node
network
fault
ring
fault ring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008100463879A
Other languages
English (en)
Other versions
CN101394343A (zh
Inventor
许都
谢铃富
王晟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN2008100463879A priority Critical patent/CN101394343B/zh
Publication of CN101394343A publication Critical patent/CN101394343A/zh
Application granted granted Critical
Publication of CN101394343B publication Critical patent/CN101394343B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

该发明属于并行计算机通信中网络出现故障域时的容错路由方法。包括围绕网络故障域设置的故障环,及围绕该故障环由正常节点组成的与其形状相同的外环,以及设定的拟进入外环分流传递的报文类别;而网络在无故障节点区域内仍按正常路由传递报文,当报文进入外环时首先根据报文类别决定是进入故障环绕道路由、还是在外环上按绕道路由的方式分流传递。该发明由于将绕道报文的通道由一条增设至两条,从而大幅度减少了必须进入故障环绕道报文的数量,减轻了故障环上的负载,消除了网络运行中因故障环上流量过大而行成的制约网络高效运行的瓶颈效应等弊病;从而具有可确保网络顺畅、高效运行等特点。

Description

并行计算机系统通信中网络存在故障域时的路由方法
技术领域
本发明属于通信系统中的并行计算机网络通信技术领域,特别是一种当二维Mesh/Tori网络通信中出现故障域时的容错路由方法。
背景技术
Mesh/Tori网络结构被广泛用于大规模并行计算机通信系统中,为实现并行计算机系统高性能计算提供了良好的解决方法,并在一定程度上满足了对计算能力日益增长的要求。但随着网络的规模不断增大,整个网络发生故障的几率也会随之增大;而一个运行很久的网络,随着运行时间的增长,网络运行的故障率亦会增加。因此,在无法保证网络不发生故障、以及原本针对无故障网络开发的路由方法在网络出现故障时失效、甚至导致网络瘫痪的前提下,人们设计了容错路由方法。目前,在网络运行过程中,当网络出现故障(域)时的常规容错路由方法是:设置一条由与故障域(节点)相邻的正常节点组成的故障环,所有只剩最后一条最短路由的报文在被故障域阻塞时,都必须进入故障环进行绕道路由,而在无故障区域内的报文仍按原为无故障网络设计的正常路由进行。如文献《Torus网络中针对重迭块状故障域的容错虫孔路由方法》(J.-D.Shih,“Fault-tolerantwormhole routing in torus networks with overlapped block faults,”IEE Proc.Comput.Digit.Tech.,vol.150,no.1,Jan.2003.),以及《Mesh网络中针对非凸形故障域的一种容错路由方法》(Chen and Chiu,“A fault-tolerant routing scheme formeshes with nonconvex faults,”IEEE Transactions on Parallel and DistributedSystems,vol.12,no.5,May2001.)中所公开的路由方法即属于此类通过故障环上的绕道路由来实现报文顺利传递的技术。该类路由方法虽然克服了众多为无故障网络设计的路由方法在网络发生(存在)故障(域)时失效等弊病,但随着网络流量的大幅度增加,进入故障环上而需绕道报文的流量无疑亦将随之增加,从而又加重了故障环上的负载,使其成为制约网络有效运行的瓶颈,影响到网络顺畅、高效运行。
发明内容
本发明的目的是针对背景技术存在的缺陷,研究设计一种并行计算机系统通信中网络存在故障域时的路由方法。其路由方法是在原故障环外增设一外环来分流故障环上的报文数量,有效地减少必须进入故障环绕道报文的数量,减轻故障环上的负载,消除网络运行中因故障环上流量过大行成的瓶颈效应等弊病,以达到降低故障环制约网络运行性能的瓶颈效应,以达到确保网络顺畅、高效运行等目的。
本发明的解决方案是在传统容错路由的基础上,通过在故障环外围增设一条由与该故障环相邻的正常节点组成且与其形状相同的分流环作为外环,以有效减少进入故障环绕道报文的数量,该外环为故障环分流时其报文传递方式与在相应的故障环上的传递方式相同,而在无故障节点区域内仍按传统的正常路由方式传递报文,从而实现其目的。因此,本发明路由方法包括网络中存在的故障域及围绕该故障域设置的故障环,关键在于在故障环外围还设有一条由与该故障环相邻的正常节点组成且与其形状相同的分流环作为外环,同时设定拟进入外环分流传递的报文类别;而网络系统进行报文传递的方法为:
1.0.网络(源)节点收到报文并读取目的节点地址;
1.1.判断源节点是否位于故障环上:如果是,则转到1.2按传统故障环上的路由方式传递报文直至到达目的节点2.1通过本地发射通道移出网络;如果不是,则转1.3进一步判断;
1.2.按传统故障环上的路由方式传递报文直至到达目的节点2.1;
1.3.判断源节点是否位于外环上:如果不是,则转到1.7按正常路由传递到下一节点2.0;如果是,则转到1.4进一步判断;
1.4.判断是否为故障环分流:如果不是,则转到1.5报文进入故障环,之后按1.2所述的路由方式传递报文至目的节点2.1通过本地发射通道移出网络;如果是,则转到1.6按故障环上的路由方式传递报文至下一节点3.0;
2.0.判断该节点是否为目的节点:如果不是目的节点,则返回1.3继续处理;如果是,则进入目的节点2.1通过本地发射信道移出网络;
3.0.判断该节点是否为目的节点:如果是则进入目的节点2.1通过本地发射通道移出网络;如果不是目的节点,则进入3.1继续判断;
3.1.判断是否继续分流:如果不是,则按正常路由3.2传递至目的节点2.1通过本地发射通道移出网络;如果是,则返回1.6继续处理至到达目的节点2.1并通过本地发射通道移出网络。
在二维Mesh网络中,上述由与故障环相邻的正常节点组成且与其形状相同的外环,当故障环上部分节点位于该网络边界节点上时,这部分节点在分流时作为外环上的节点处理。而所述设定拟进入外环分流传递的报文类别,其报文类别的设定根据地址址偏移量:选取来自东-西(EW)、南-北(SN)、西-东(WE)及北-南(NS)中的任意两类报文作为分流的报文,其余两类报文则仍进入故障环进行绕道路由。
本发明由于在故障环外围增设了一条与其形状相同的外环,该外环从必须进入故障环进行路由的报文中按设定类别分流到外环上,从而有效地减少了必须进入故障环绕道报文的数量,减轻了故障环上的负载,消除了网络运行中因故障环上流量过大而行成的制约网络高效运行的瓶颈效应等弊病;从而可确保网络顺畅、高效运行等特点。
附图说明
图1.为本发明路由方法流程图;
图2.为实施例附图;
图3.为具体实施方式与背景技术仿真运行“平均延时”效果曲线对比示意图;
图4.为具体实施方式与背景技术仿真运行“网络吞吐量”效果曲线对比示意图;
图2中:○为正常节点,⊙为故障节点,①为故障环上节点,②为外环上节点,S1、S2:源节点,D1、D2:目的节点,d1为分流报文传递终止点,d2为绕道报文终止点;→为报文传递方向。
具体实施方式
附图2为本实施方式报文传具体递过程示意图。
本实施例设定南-北及北-南类别报文为分流传递的报文类别。现以在OPNET平台上搭建12X12的Tori网络运行为例:
A.当源节点S1收到报文并读取目的节点地址为D1,经1.1及1.3判断得知该节点既不是故障环上节点也不是外环上节点,因此按1.7正常路由传至下一节点2.0;首先经2.0判断当前节点不是目的节点,因此返回1.3判断该节点也不是外环上节点,则按1.7正常路由传递至下一节点;再经2.0判断得知当前节点仍不是目的节点、返回1.3,经判断得知当前节点是外环上节点,再经1.4判断得知该报文属于北-南类需分流的报文而进入1.7按故障环上的路由方式开始并依次传递报文至根据目的节点D1地址在外环上d节点处结束分流路由,继而按正常路由传递报文直至目的节点D1
B.当源节点S2收到报文并读取目的节点地址为D2,经1.1判断得知该节点是故障环上节点,因此按1.2原故障环上路由方式传至故障环上的节点d2、再经正常路由传递至目的节点。
附图3及附图4:分别为本实施方式与与背景技术(仅设故障环)在相同网络条件下进行仿真运行过程中,网络的“平均延时”及“吞吐量”效果曲线对比示意图。

Claims (2)

1.一种并行计算机系统通信中网络存在故障域时的路由方法,包括网络中的故障域及围绕该故障域设置的故障环,其特征在于在故障环外围还设有一条由与该故障环相邻的正常节点组成且与其形状相同的外环作为分流,同时设定拟进入外环分流传递的报文类别;而网络系统进行报文传递的方法为:
1.0.网络源节点收到报文并读取目的节点地址;
1.1.判断源节点是否位于故障环上:如果是,则转到1.2按传统故障环上的路由方式传递报文直至到达目的节点,执行2.1通过本地发射通道移出网络;如果不是,则转1.3进一步判断;
1.2.按传统故障环上的路由方式传递报文直至到达目的节点并执行2.1步骤;
1.3.判断源节点是否位于外环上:如果不是,则转到1.7按正常路由传递到下一节点,执行步骤2.0;如果是,则转到1.4进一步判断;
1.4.判断是否为故障环分流:如果不是,则转到1.5;如果是,则转到1.6按故障环上的路由方式传递报文至下一节点并执行3.0步骤;
1.5.由步骤1.4进入的报文送入故障环,按步骤1.2的路由方式传递报文至目的节点,执行2.1通过本地发射通道移出网络;
1.6.按故障环上的路由方式传递报文至下一节点并执行3.0步骤;
1.7.按正常路由传递到下一节点,执行步骤2.0;
2.0.判断该节点是否为目的节点:如果不是目的节点,则返回1.3继续处理;如果是,则进入目的节点,执行2.1通过本地发射通道移出网络;
2.1.通过本地发射通道移出网络;
3.0.判断该节点是否为目的节点:如果是则进入目的节点,执行2.1通过本地发射通道移出网络;如果不是目的节点,则进入3.1继续判断;
3.1.判断是否继续分流:如果不是,则执行步骤3.2;如果是,则返回1.6继续处理至到达目的节点,执行2.1并通过本地发射通道移出网络;
3.2.按正常路由传递至目的节点,执行2.1通过本地发射通道移出网络。
2.按权利要求1所述并行计算机系统通信中网络存在故障域时的路由方法,其特征在于在二维Mesh网络运行中,当故障环上部分节点位于该网络边界节点上时,这部分节点在分流时作为外环上的节点处理。
CN2008100463879A 2008-10-27 2008-10-27 并行计算机系统通信中网络存在故障域时的路由方法 Expired - Fee Related CN101394343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100463879A CN101394343B (zh) 2008-10-27 2008-10-27 并行计算机系统通信中网络存在故障域时的路由方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100463879A CN101394343B (zh) 2008-10-27 2008-10-27 并行计算机系统通信中网络存在故障域时的路由方法

Publications (2)

Publication Number Publication Date
CN101394343A CN101394343A (zh) 2009-03-25
CN101394343B true CN101394343B (zh) 2011-07-20

Family

ID=40494426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100463879A Expired - Fee Related CN101394343B (zh) 2008-10-27 2008-10-27 并行计算机系统通信中网络存在故障域时的路由方法

Country Status (1)

Country Link
CN (1) CN101394343B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101841442B (zh) * 2010-02-08 2011-11-16 电子科技大学 一种在名址分离网络中对网络异常进行检测的方法
CN107171954B (zh) * 2016-03-08 2020-06-26 华为技术有限公司 容错路由方法、装置及片上网络

Also Published As

Publication number Publication date
CN101394343A (zh) 2009-03-25

Similar Documents

Publication Publication Date Title
US7502314B2 (en) Label-switched path network with alternate routing control
CN100527702C (zh) 在环型网络中重新路由mpls业务的方法和网络节点
US20170085463A1 (en) Network Topology of Hierarchical Ring with Recursive Shortcuts
CN104247344A (zh) 用于拆分式体系结构中快速故障转移的控制器安排
CN101888333A (zh) 用于在网络元件的转发平面内保持端口状态表的方法和装置
CN101227399B (zh) 报文传输方法、系统及转发节点
CN101262298B (zh) 一种wdm网中的多种服务等级的多故障保护方法
CN101888307B (zh) 用于本地实现端口选择的方法和装置
CN102629912B (zh) 面向无缓冲片上网络的容错偏转路由方法及装置
CN101834789B (zh) 面向包-电路交换片上路由器的回退转向路由算法及所用路由器
CN103973564B (zh) 互连网络系统的自适应路由方法
CN100576825C (zh) 一种基于虚拟斯特纳树的组播随机化路由方法
CN101394343B (zh) 并行计算机系统通信中网络存在故障域时的路由方法
CN104639437A (zh) 堆叠系统中广播报文的转发方法及装置
CN103546397B (zh) 支持乱序的自路由Omega网络
Aggarwal et al. Modification of cutsets for reliability evaluation of communication systems
CN100536405C (zh) 有效使用网络资源的保护路径获取方法
CN106453091A (zh) 路由器转发平面的等价路由管理方法和装置
CN109347687A (zh) 一种基于网络节点故障定位的通信系统及方法
Fan et al. Disjoint paths construction and fault-tolerant routing in BCube of data center networks
CN116016384B (zh) 基于环形布局的可扩展片上网络拓扑结构及其路由方法
CN101316212A (zh) 环网故障处理方法、环网及运营商骨干设备
CN107276908A (zh) 一种路由信息处理方法及分组交换设备
CN110166286A (zh) 一种ip ran网络系统
CN103490810B (zh) 一种波长转换范围受限的光组播动态p圈2跳段保护方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110720

Termination date: 20131027