CN105634823B - 一种基于多路由配置的数据中心网络故障恢复方法 - Google Patents

一种基于多路由配置的数据中心网络故障恢复方法 Download PDF

Info

Publication number
CN105634823B
CN105634823B CN201610030241.XA CN201610030241A CN105634823B CN 105634823 B CN105634823 B CN 105634823B CN 201610030241 A CN201610030241 A CN 201610030241A CN 105634823 B CN105634823 B CN 105634823B
Authority
CN
China
Prior art keywords
link
node
backup
isolated
topology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610030241.XA
Other languages
English (en)
Other versions
CN105634823A (zh
Inventor
王辉
李哲青
李沛谕
范志辉
周毅
张莉敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Science and Technology
Original Assignee
Henan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Science and Technology filed Critical Henan University of Science and Technology
Priority to CN201610030241.XA priority Critical patent/CN105634823B/zh
Publication of CN105634823A publication Critical patent/CN105634823A/zh
Application granted granted Critical
Publication of CN105634823B publication Critical patent/CN105634823B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Abstract

本发明公开了一种基于多路由配置的数据中心网络故障恢复方法,属于数据中心网络领域。该方法结合数据中心网络与快速恢复机制,在数据中心网络中使用多路由配置的方法,建立备份拓扑,并根据网络中数据流的大小,自适应的调整链路权重,实现优化链路负载分布的路由转发策略。包括数据中心网络拓扑构建模型,备份拓扑模块,权重优化模块,负载均衡模块。本发明可以实现数据流在数据中心间的负载均衡分布,即根据链路上数据流的大小,自适应的调整链路权重,进而调整路由转发路径,从而减小高利用率链路的负载,减小网络发生拥塞的几率。

Description

一种基于多路由配置的数据中心网络故障恢复方法
技术领域
本发明属于数据中心网络领域,涉及一种面向数据中心网络架构的故障快速恢复方法,具体涉及一种应用在数据中心网络间数据流的路由的转发策略。
背景技术
数据中心网络(Datacenter Network)是应用于数据中心内的网络,因为数据中心内的流量呈现出典型的交换数据集中、东西流量增多等特征,对数据中心网络提出了进一步的要求:高扩展性、高健壮性、灵活的拓扑和链路容量控制、绿色节能等。数据集中就意味着风险集中、响应集中、复杂度集中,数据中心出现故障的情况几乎不可避免。因此,数据中心解决方案应着重关注如何尽量减小数据中心出现故障后对网络中关键业务造成的影响。
数据中心的故障类型众多,但故障所导致的结果却大同小异,即数据中心中的设备、链路或服务器发生故障,无法对外提供正常服务。缓解这些问题最简单的方式就是冗余设计,可以通过对设备、链路、服务器提供备份,从而将故障对用户业务的影响降低到最小。但是,冗余性在带来好处的同时也会带来如下一些缺点:网络复杂度增加,配置和管理难度增加。为了适度降低冗余,提高数据中心设备的使用效率,应当及时对网络进行故障检测、诊断和恢复。
如果某个数据中心网络发生故障,它将具有两个明显特征:第一,大量的节点可能同时不可用;第二,数据中心区域内,故障节点造成比较差的连通性。由于数据中心网络的分布特点,使用OSPF算法达到最小的收敛时间是非常困难的。存在路径替代方法—IP快速恢复机制,即当路由器检测到故障时,不立即通知其他路由器,而是计算备份路径进行故障恢复,可以大大减小收敛时间。作为从单一的网络组件(链路或节点)故障快速恢复的多路由配置方法(multiple routing configuration,MRC)也已经被提出。
MRC算法的主要思想是:基于网络的原始拓扑生成一组备份拓扑,每个备份拓扑中均包含原始拓扑的所有节点和链路。通过配置不同备份拓扑中的链路权重,使得每个备份拓扑中的某些节点邻接链路因权重值过大而不被选作恢复路径上的链路,从而使得恢复路径不经过故障设备。
然而,在传统MRC方法中,备份拓扑中的所有链路权重都被提前赋为固定值,这使得在发生单一组件故障时,替换路径的某条链路负载过高,导致网络拥塞。对此,本专利采用启发式算法来自动分配备份拓扑中的链路权重,尽可能使用链路利用率小的链路进行重路由,并且结合链路费用目标函数来实现较好的负载分布。
发明内容
本发明为解决上述技术问题,提供一种基于多路由配置的数据中心网络故障恢复的方法,主要解决故障后数据中心网络中负载不均衡问题。
为了实现上述目的,本发明采取的技术方案如下:一种基于多路由配置的数据中心网络故障恢复方法,
步骤一、根据多路由配置的方法和网络拓扑结构,构建备份拓扑,针对备份拓扑的构建满足以下几个特征:
a、每个备份拓扑不改变原始的网络拓扑结构,并且都必须包含一个主干网,即从备份配置中移除所有孤立节点、孤立链路和受限链路后,剩余的节点相互连通,备份拓扑中每一个孤立节点可以通过至少一个受限链路连接到主干网;
b、孤立节点只与孤立链路和受限链路相连,并且至少连接一个受限链路,在同一个备份拓扑中,受限链路的两端不能同为孤立节点;
c、每一条链路和每一个节点都必须至少在一个备份配置中被孤立;
步骤二、根据网络拓扑结构和流量矩阵,用最短路径算法计算各个节点对之间的最短路径,当最短路径中某条链路u-v或节点u发生故障,则查找相应的备份拓扑进行重路由;
步骤三、在查找过程中,为减少故障后重路由路径负载过高,造成网络拥塞,采用链路花费函数构造负载均衡机制,根据链路最优权值,使故障后所有链路费用和最小;初始时,每条链路的权重设置为,根据链路花费函数计算此时所有链路代价之和,设置迭代次数,每次迭代采用启发式算法在内随机选取链路权重,计算目标函数值,在设定的迭代次数内,若更改一部分链路权值,目标函数值没有明显的改善,则终止迭代,将此时的链路权值作为最优权值。
本发明所述的备份拓扑的查找转发规则是:
假设节点u收到目的节点为d的数据包,下一跳节点和链路分别为v和u-v,具体的转发过程如下。
a、如果链路u-v未发生故障,则转发数据包到v,否则执行b;
b、如果路由表标记大于0,且数据包之前已被重路由,则丢弃该数据包,否则执行c;
c、分别执行以下两步:
c-1)如果节点v和目的节点d不同,则选择备份配置中节点v被孤立的备份路由表;
c-2)如果节点v和目的节点d相同,并且链路u-v和节点v在同一个备份配置中被孤立,则选择与此相应的备份路由表;如果链路u-v和节点v不在同一个备份配置中被孤立,则选择备份配置中链路u-v被孤立的备份路由表;
d、在数据包头部写入所选择的备份路由表标记,根据备份路由表转发数据包。
本发明所述的链路花费目标函数为
(1)
其中,表示链路利用率函数,为通信负载,c(a)表示链路a可承受量的最大流量带宽,链路的利用率为
本发明具有以下有效效果:
通过使用本发明的方法,能在故障后立即进行重路由过程,而不必通知网络中其他路由器,大大减小了故障恢复时间;使用备份配置的方法,实现了物理链路与备份链路的逻辑分离,使得每个备份拓扑中的链路权重可以不同,使链路得到充分利用,减小了数据中心网络重路由后的链路拥塞情况,符合实际要求。
附图说明
图1为本发明的整体流程示意图。
图2为本发明的网络拓扑结构示意图。
图3为本发明的数据包转发流程图。
图4为本发明单链路故障时各条链路的平均利用率。
图5为本发明单节点故障时各条链路的平均利用率。
具体实施方式
以下结合附图和技术方案进一步说明本发明的具体实施方式。
用有向图G( V,E)表示网络拓扑,其中V表示网络中路由器的集合,E表示链路集合。数据包从源点s到目的节点d的路径P由链路组成。c(a)表示链路a可承受量的最大流量带宽,流量矩阵D给出每个OD(Origin-Destination)对(s,d)间要求传输的流量请求。通信负载为,表示经过链路的总的数据流量,链路的利用率为。为计算方便,假设所有链路的容量为1。流量目标函数即对于任意的成立。
采用公式(1)中定义的描述链路费用的函数,建立负载均衡机制,优化的目标是最小化所有链路的花费函数
(1)
表示链路利用率函数,由公式可知,该函数呈线性递增趋势。随着链路利用率的增加,函数值也不断增加,而且增加的速度不断加快。若链路利用率较高,则对该链路赋予较大的花费函数值,为实现优化目标则应该降低该链路的通信负载。
由于任意节点对之间的网络流量是根据最短路径算法计算得到的,而最短路径算法又与链路权值相关,所以需计算出一组经过优化的权值w,将其合理的分配给每条链路以满足特定的目标函数,并使所有链路的费用之和最小。
对于MRC,所有的流量是在无故障时根据备份配置C0进行路由。当出现单链路或单节点故障时,所有的重路由流量根据相应的备份配置进行重路由。这个逻辑上的分离对重分布数据流量到可用链路有很大的灵活性。
为优化备份配置权重,采取启发式(Heuristic Algorithms)方法。首先,每条链路给出一个花费函数,总的网络的花费函数是所有链路花费的总和。通过改变值,计算值,新的链路权重从选择(),通过多次试探来寻求最小化目标函数值的权值设置。为简化分析,假设每条链路的容量相同,而链路权值设置为
(2)
kd为常数,。当在范围内,若经过多次迭代循环(每个备份配置进行至少10次迭代),目标函数值没有明显的改善,将转到范围内进行试探。为避免陷入查找最小值的无限循环,在设定的迭代次数内,若更改一部分链路权值,目标函数值没有明显的改善,则终止迭代,将此时的链路权值作为最优权值。
为了解决数据中心网络重路由后链路拥塞问题,本发明提供了一种基于多路由配置的数据中心网络故障恢复的方法,如图1所示,首先根据网络拓扑结构和流量矩阵,用最短路径算法计算各个节点对之间的最短路径,当最短路径中某条链路u-v发生故障,查找相应的备份拓扑C(u)或C(v)进行重路由,直到转发到目的节点。根据链路花费函数计算当前所有链路的总花费,如果当前函数值最小或稳定在某一范围之内,则把当前的链路权重分配到各个链路;如果函数值较大,则采用启发式算法优化链路权重,并且将其分配到各个链路,再次计算函数值,直到得到最小的目标函数值。
本发明采用如图2所示的网络拓扑结构,假设每个节点代表一个数据中心网络,MRC恢复方案将保证每一个节点和链路至少在一个备份配置中孤立一次。因此,MRC保护任何区域中的一个数据中心故障不会造成整个网络服务中断。
图2显示的是一个原始网络拓扑结构和由MRC算法产生的2个备份拓扑结构。每一个备份拓扑包含两类节点(正常节点和孤立节点)和三种链路(正常链路、受限链路和孤立链路)。为了能从单个的链路故障或节点故障中恢复,备份拓扑集应满足以下特征:
(1) 每个备份拓扑不改变原始的网络拓扑结构,并且都必须包含一个主干网,即从备份配置中移除所有孤立节点、孤立链路和受限链路后,剩余的节点相互连通。备份拓扑中每一个孤立节点可以通过至少一个受限链路连接到主干网。
(2) 孤立节点只与孤立链路和受限链路相连,并且至少连接一个受限链路。在同一个备份拓扑中,受限链路的两端不能同为孤立节点。
(3)每一条链路和每一个节点都必须至少在一个备份配置中被孤立。
在MRC算法中,数据包转发最多使用两个路由表,即正常路由表和备份路由表。备份路由表是通过计算备份配置中任意节点对之间的最短路径得到,其中孤立链路被设置无穷大权重值,所以不被用来转发数据包;受限链路被设置足够大的权重值,在最短路径中仅作为第一跳和最后一跳使用。在数据包转发的过程中,需要在数据包头部写入当前所使用的路由表标记号,确保节点在转发数据包时所使用的路由表与数据包头部标记的路由表相同。正常路由表标记为0,备份路由表标记为i(i>0)。
数据包转发过程如图3所示,假设节点u收到目的节点为d的数据包,下一跳节点和链路分别为v和u-v,具体的转发过程如下。
(1) 如果链路u-v未发生故障,则转发数据包到v,否则执行(2)。
(2) 如果路由表标记大于0(数据包之前已被重路由),则丢弃该数据包,否则执行(3)。
(3) 分别执行以下两步:
(3-2) 如果节点v和目的节点d不同,则选择备份配置中节点v被孤立的备份路由表。
(3-1) 如果节点v和目的节点d相同,并且链路u-v和节点v在同一个备份配置中被孤立,则选择与此相应的备份路由表;如果链路u-v和节点v不在同一个备份配置中被孤立,则选择备份配置中链路u-v被孤立的备份路由表。
(4) 在数据包头部写入所选择的备份路由表标记,根据备份路由表转发数据包。
拓扑模型如图2所示,假设数据包同时从源节点发送,源节点及目的节点不可能发生故障。为计算方便,假设所有链路的容量为1。图4为相同单链路故障后,自动权重分布对网络中链路负载分布的影响。由图4可知,MRC方法中54%的链路的利用率在40%-70%,但是Modified MRC方法中70%的链路的利用率在30%-60%,并且25%的高利用率链路从70%-92%降低到70%-78%。
如果中间节点1发生故障,与其相连的链路也不可用来转发数据包。图5表示的是节点1故障后,Modified MRC算法对链路负载分布的影响。由图可知,其中,80%的链路的利用率低于70%,而MRC方法仅有70%的链路的利用率低于70%,并且30%的高利用率链路从90%-96%降低到70%-81%。

Claims (1)

1.一种基于多路由配置的数据中心网络故障恢复方法,其特征在于:
步骤一、根据多路由配置的方法和网络拓扑结构,构建备份拓扑,针对备份拓扑的构建满足以下几个特征:
每个备份拓扑不改变原始的网络拓扑结构,并且都必须包含一个主干网,即从备份配置中移除所有孤立节点、孤立链路和受限链路后,剩余的节点相互连通,备份拓扑中每一个孤立节点可以通过至少一个受限链路连接到主干网;
孤立节点只与孤立链路和受限链路相连,并且至少连接一个受限链路,在同一个备份拓扑中,受限链路的两端不能同为孤立节点;
每一条链路和每一个节点都必须至少在一个备份配置中被孤立;
步骤二、根据网络拓扑结构和流量矩阵,用最短路径算法计算各个节点对之间的最短路径,当最短路径中某条链路u-v或节点u发生故障,则查找相应的备份拓扑进行重路由;
备份拓扑的查找转发规则是:
假设节点u收到目的节点为d的数据包,下一跳节点和链路分别为v和u-v,具体的转发过程如下:
a、如果链路u-v未发生故障,则转发数据包到v,否则执行b;
b、如果路由表标记大于0,且数据包之前已被重路由,则丢弃该数据包,否则执行c;
c、分别执行以下两步:
c-1)如果节点v和目的节点d不同,则选择备份配置中节点v被孤立的备份路由表;
c-2)如果节点v和目的节点d相同,并且链路u-v和节点v在同一个备份配置中被孤立,则选择与此相应的备份路由表;如果链路u-v和节点v不在同一个备份配置中被孤立,则选择备份配置中链路u-v被孤立的备份路由表;
d、在数据包头部写入所选择的备份路由表标记,根据备份路由表转发数据包;
步骤三、在查找过程中,采用链路花费目标函数构造负载均衡机制,根据链路最优权值,使故障后所有链路费用和最小;初始时,每条链路的权重设置为,根据链路花费目标函数计算此时所有链路代价之和,设置迭代次数,每次迭代采用启发式算法在内随机选取链路权重,计算链路花费目标函数值,在设定的迭代次数内,若更改一部分链路权值,链路花费目标函数值没有明显的改善,则终止迭代,将此时的链路权值作为最优权值;
所述的链路花费目标函数为
(1)
其中,E表示链路集合,表示链路利用率函数,为通信负载,c(a)表示链路a可承受量的最大流量带宽,链路的利用率为
CN201610030241.XA 2016-01-18 2016-01-18 一种基于多路由配置的数据中心网络故障恢复方法 Expired - Fee Related CN105634823B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610030241.XA CN105634823B (zh) 2016-01-18 2016-01-18 一种基于多路由配置的数据中心网络故障恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610030241.XA CN105634823B (zh) 2016-01-18 2016-01-18 一种基于多路由配置的数据中心网络故障恢复方法

Publications (2)

Publication Number Publication Date
CN105634823A CN105634823A (zh) 2016-06-01
CN105634823B true CN105634823B (zh) 2018-09-25

Family

ID=56049361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610030241.XA Expired - Fee Related CN105634823B (zh) 2016-01-18 2016-01-18 一种基于多路由配置的数据中心网络故障恢复方法

Country Status (1)

Country Link
CN (1) CN105634823B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106209621A (zh) * 2016-06-17 2016-12-07 中国人民解放军空军工程大学 服务质量约束的链路故障恢复方法
CN106209420B (zh) * 2016-06-27 2019-03-26 瑞斯康达科技发展股份有限公司 一种定位数据转发业务故障的方法及电子设备
CN106888170B (zh) * 2017-02-21 2019-11-01 中国联合网络通信集团有限公司 报文转发方法和系统
CN110365507B (zh) * 2018-04-10 2022-03-01 中国电信股份有限公司 用于实现链路权重自动赋值的方法和装置
CN108768847A (zh) * 2018-06-04 2018-11-06 河南科技大学 IP网络中基于K-Shell算法的主动式故障快速重路由方法
CN108683602B (zh) * 2018-07-13 2022-05-13 深圳致星科技有限公司 一种数据中心网络负载均衡方法
CN114124942B (zh) * 2020-08-10 2023-08-15 中国移动通信集团湖南有限公司 核心网资源调度方法、装置及电子设备
CN112888027B (zh) * 2021-01-22 2022-06-14 华南理工大学 一种无线传感器网络的连通恢复方法、系统、装置及介质
CN115242806B (zh) * 2022-06-14 2023-09-29 山东省计算中心(国家超级计算济南中心) 一种在超算互联网中超算中心数据备份的方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102395172A (zh) * 2011-11-16 2012-03-28 武汉大学 一种工业无线网状网络的数据传输方法
CN104301214A (zh) * 2014-10-10 2015-01-21 北京邮电大学 一种覆盖网路由方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102395172A (zh) * 2011-11-16 2012-03-28 武汉大学 一种工业无线网状网络的数据传输方法
CN104301214A (zh) * 2014-10-10 2015-01-21 北京邮电大学 一种覆盖网路由方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《云环境下SDN的流量异常检测性能分析》;马超 等;《计算机与现代化》;20151231(第242期);第93-97页 *
《基于数据流技术的电信网络异常检测模型研究》;李建国;《电子信息与计算机科学》;20141231(第11期);第20-21页 *

Also Published As

Publication number Publication date
CN105634823A (zh) 2016-06-01

Similar Documents

Publication Publication Date Title
CN105634823B (zh) 一种基于多路由配置的数据中心网络故障恢复方法
CN105379196B (zh) 用于容错和负载平衡路由的方法、系统和计算机存储介质
EP2606612B1 (en) Automated traffic engineering for fat tree networks
JP6062939B2 (ja) スプリットアーキテクチャシステムにおけるコントローラ−スイッチ接続性の自己修復性認識型ハイブリッド設計
Kanagevlu et al. SDN controlled local re-routing to reduce congestion in cloud data center
CN107302496B (zh) 一种基于带内控制的软件定义网络链路故障恢复方法
JP5668759B2 (ja) 通信システム、制御装置、パケット転送経路の制御方法およびプログラム
JP5943431B2 (ja) ネットワーク、データ転送ノード、通信方法およびプログラム
CN112532518B (zh) 一种段路由策略的路径选择方法及装置
CN107306224B (zh) 一种路由路径更新方法、网络管理装置及路由设备
Muthumanikandan et al. Link failure recovery using shortest path fast rerouting technique in SDN
WO2013017017A1 (en) Load balancing in link aggregation
CN113347102B (zh) 基于q-学习的sdn链路抗毁方法、存储介质及系统
CN105406988A (zh) 一种软件定义抗毁网络构建方法
Lei et al. Multipath routing in SDN-based data center networks
US10608957B2 (en) Method and apparatus to optimize multi-destination traffic over etherchannel in stackwise virtual topology
Huynh et al. Cross-over spanning trees enhancing metro ethernet resilience and load balancing
Liu et al. D 2 ENDIST: Dynamic and disjoint ENDIST-based layer-2 routing algorithm for cloud datacenters
Fan et al. An optimization algorithm for spatial information network self-healing based on software defined network
Mejia et al. Boosting ethernet performance by segment-based routing
Lee et al. Modeling and algorithm for multiple spanning tree provisioning in resilient and load balanced ethernet networks
Ruelas et al. Implementation of neural switch using OpenFlow as load balancing method in data center
CN108243104A (zh) 一种多层lsp控制方法和装置
Tembo et al. A new backup topology design method for congestion avoidance in IP fast reroute
CN115378875A (zh) 适应不同网络环境的可靠流量调度方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180925

Termination date: 20210118

CF01 Termination of patent right due to non-payment of annual fee