CN103327095B - 一种可扩展的数据中心网络架构的实现方法 - Google Patents

一种可扩展的数据中心网络架构的实现方法 Download PDF

Info

Publication number
CN103327095B
CN103327095B CN201310246936.8A CN201310246936A CN103327095B CN 103327095 B CN103327095 B CN 103327095B CN 201310246936 A CN201310246936 A CN 201310246936A CN 103327095 B CN103327095 B CN 103327095B
Authority
CN
China
Prior art keywords
frame
node
group
sigma
core switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310246936.8A
Other languages
English (en)
Other versions
CN103327095A (zh
Inventor
吴斌
肖杰
文红
付澍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201310246936.8A priority Critical patent/CN103327095B/zh
Publication of CN103327095A publication Critical patent/CN103327095A/zh
Application granted granted Critical
Publication of CN103327095B publication Critical patent/CN103327095B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种可扩展的数据中心网络架构,采用光交换器替代传统的电交换器,把数据中心内部的机架(6)、ToR交换器(5)、聚合交换器(4)、核心交换器(3)和内容交换器(2)分组成不同的组件,然后再把各组件拉远、分布式地放置在骨干网络中的一组邻近节点上,组件之间的数据通过骨干网络中的光纤进行交换及传输,从而有效地利用了骨干网络基础设施来简化数据中心内部连接、增强数据中心网络架构的可扩展性,本发明还公布了数据中心网络架构的实现方法,通过将机架的分组、交换器数量的确定、组件的放置及业务的路由的求解问题全部归结到一个整数线性规划中再利用数学工具进行求解或根据启发式算法进行架构的设计,设计灵活,适应性强。

Description

一种可扩展的数据中心网络架构的实现方法
技术领域
本发明涉及一种数据中心网络架构,特别是涉及一种可扩展的数据中心网络架构的实现方法。
背景技术
数据中心(Datacenter)是云服务的业务支撑平台,由大量的服务器(Server)组成。这些服务器以机架(Rack)的形式被组织起来,每个机架上通常放置几十到上千个服务器,提供并行计算与资源存储。同一机架和不同机架上的服务器之间,都存在数据交换需求。为了满足这种需求,数据中心内部包含一个多级交换网络。
通常,在数据中心每个机架顶端放置了一个ToR(Top-of-Rack)交换器,负责本机架服务器之间的数据交换及与其他机架的数据交换接口。ToR交换器通常需要具有包头解析和路由功能。各个ToR交换器再连接到核心交换器(CoreSwitch),实现不同机架上服务器之间的数据交换与共享。由于Core交换器负责不同机架之间数据流的电路交换(Circuitswitching),可以采用crossbar交叉连接交换器来实现。ToR和Core交换器组成一个多级交换网络,通常采用经典的胖树(Fat-Tree)结构。
随着云服务的快速发展,用户数目和服务内容不断增长,数据中心的规模也越来越大,所包含的服务器数量呈现出指数增长趋势,内部数据交换量也以超线性的方式增长。这种快速发展的趋势,对数据中心的可扩展性提出了非常高的要求。然而,现有数据中心的扩展性存在以下不足:
(1)当前的数据中心采用仓储式的集中放置方式,通常需要一个大型工厂或几个足球场的面积来放置机架、服务器与交换网络,随着数据中心规模的扩大,系统能耗不断上升,很难对一个数据中心进行集中供电,系统散热也十分困难。
(2)由于单个电交换器或路由器的容量有限(即存在电子瓶颈的问题),为了实现足够大的系统交换容量,所需的交换器数量及单个交换器的端口数都非常大,导致系统内部交换网络规模庞大、连接复杂、成本高。电交换网络的功耗也是一个重要的制约因素。
(3)当前数据中心内部交换网络通常采用Fat-Tree多级交换架构。在电路交换(CircuitSwitching)的情况下,为了保证交换网络无阻塞,所需的Core交换器数量跟ToR交换器的输入端口数之间须保持固定的比例关系,比如,为了实现可重排无阻塞,需要满足中间级交换器的数目不得少于输入级交换器的端口数目。这种固定架构增大了数据中心内部结构的复杂程度,也缺乏设计的灵活性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种可扩展的数据中心网络架构的实现方法,该数据网络中心采用分布式的架构,解决了传统架构中集中放置带来的供电困难、散热代价高和空间不足等问题,可扩展性更强,能耗更低;使用两种实现方法对数据中心网络架构进行设计和调整,设计灵活,适应性强。
本发明的目的是通过以下技术方案来实现的:一种可扩展的数据中心网络架构,它包括核心层组件和边缘层组件,核心层组件和边缘层组件分布式的放置在骨干网络的各个节点上并通过光纤进行连接,所述核心层组件包括核心交换器和内容交换器,所述边缘层组件包括一个或多个机架、一个或多个ToR交换器和聚合交换器;机架上放置有多个服务器,机架顶端设有一个ToR交换器,ToR交换器用于完成同一个机架的服务器之间的数据交换;聚合交换器连接同一节点不同机架上的ToR交换器,用于完成同一个节点不同机架之间的数据交换;核心交换器通过光纤分别连接各个节点的聚合交换器,用于完成不同节点机架之间的数据交换;内容交换器一端连接同一节点的核心交换器,另一端通过网络连接外部用户,负责外部用户业务的接入和数据交换。
进一步的,所述的核心交换器为光核心交换器,所述的聚合交换器为光聚合交换器。
进一步的,所述的核心层组件和边缘层组件的分布式程度是根据设计的目标在单节点集中放置和全网分散放置两种模式之间进行灵活控制。
一种可扩展的数据中心网络架构的实现方法,它包括如下步骤:
S11:建立以下整数线性规划;
目标函数为:
min i m i z e { Σ u ∈ V P s S u + Σ m ∈ V Σ k ≤ K Δ k J m k + Σ u ∈ V Σ v ∈ V P u v F u v + Σ m ∈ V Σ n ∈ V , n > m Σ u ∈ V θ ( P m u + P n u ) T m n u - Σ u ∈ V P 0 Y u } ;
约束条件为:
Σ m ∈ V R m i = 1 , ∀ i ∈ R ;
X m n i j &GreaterEqual; R m i + R n j - 1 , &ForAll; m , n &Element; V : m < n , &ForAll; i , j &Element; R : i &NotEqual; j ;
S u &GreaterEqual; 1 &alpha; &Sigma; m &Element; V &Sigma; n &Element; V , n > m T m n u , &ForAll; u &Element; V ;
S u &GreaterEqual; 1 &beta; &Sigma; v &Element; V F u v , &ForAll; u &Element; V ;
J m k &GreaterEqual; 1 &gamma; ( &Sigma; i &Element; R R m i - N k ) , &ForAll; m &Element; V , &ForAll; k ;
&Sigma; u &Element; V T m n u = &Sigma; i &Element; R &Sigma; j &Element; R , j &NotEqual; i r i j X m n i j , &ForAll; m , n &Element; V : m < n ;
&Sigma; v &Element; V F u v + &Sigma; m &Element; V &Sigma; n &Element; V , n > m T m n u &le; Q , &ForAll; u &Element; V ;
&Sigma; u &Element; V F u v = d v , &ForAll; v &Element; V ;
Y u &le; S u , &ForAll; u &Element; V ;
Y u &le; &Sigma; i &Element; R R u i , &ForAll; u &Element; V ;
其中:
1)定义K为代价函数中阴影区域数目;
2)定义Δk与Nk分别为代价函数纵轴与横轴标度值;
3)定义V为骨干网络G(V,E)中所有节点的集合;
4)定义E为骨干网络G(V,E)中所有链接的集合;
5)定义R为所有机架集合;
6)定义Q为核心交换器交换容量;
7)定义Ps为一对核心交换器和内容交换器的总代价;
8)定义Po为当一对核心交换器与内容交换器跟一组机架放置在同一个节点时所节省的基础建设费;
9)定义Puv为节点u和节点v之间单位流量的传输代价;
10)定义θ为传输时延代价系数,θPuv表示节点u和节点v之间单位流量的传输和时延总代价,其中(θ-1)Puv为时延代价部分;
11)定义dv为网络中节点v处的业务请求量,v∈V;
12)定义rij为数据中心内部编号为i的机架与编号为j的机架间的交换量;
13)定义α为一任意一个满足α≥∑i∈Rj∈Rγij的常数;
14)定义β为一任意一个满足β≥∑v∈Vdv的常数;
15)定义γ为一任意一个满足γ≥|R|的常数;
定义待定变量:
1)定义Su为二进制变量,当有一个核心交换器与内容交换器对放置在节点u处时,其取值为1,否则为0,其中u∈V;
2)定义为二进制变量,如果编号为i的机架放置在节点m处则取值为1,否则为0,其中i∈R,m∈V;
3)定义Yu为二进制变量,如果一个核心交换器与内容交换器对跟一个机架组同时放置在节点u处,则取值为1,否则取值为0,其中u∈V;
4)定义为二进制变量,如果节点m处的机架数目超过Nk,则取值为1,否则取值为0,其中m∈V,k≤K;
5)定义为二进制变量,如果编号为i的机架放置在节点m,同时编号为j的机架放置在节点n,则取值为1,否则取值为0,其中m,n∈V,m<n,i,j∈R,i≠j;
6)定义为非负整数变量,表示节点v处的外部业务从u处的内容交换器接入的量,其中u∈V,v∈V;
7)定义为非负整数变量,表示节点m处的机架和节点n处的机架之间的交换总量中由节点u处的核心交换器完成交换的那部分量,其中m,n∈V,m<n,u∈V;
S12:利用数学优化工具求解S11的整数线性规划,根据求解出的结果完成数据中心网络架构的设计。所述S11的整数线性规划的求解方法为:
S121:编写C程序,根据S11的整数线性规划式子生成优化工具CPLEX的执行文件;
S122:运行CPLEX,将S121生成的执行文件导入到CPLEX,CPLEX根据一定的搜索算法自动求取出优化问题的最优解;
S123:从CPLEX中导出优化结果,并将结果对照回各个变量,根据变量的取值设计当前数据中心网络架构。
一种可扩展的数据中心网络架构的实现方法,它包括如下步骤:
S21:机架分组,采用贪婪算法的思想每次在降低平均代价的前提下尽量把总交换量较大的机架放到同一个机架组,具体实施步骤为:
S211:新建一个机架分组,从所有待分组的机架中找到交换量最大的一对机架,将其中一个放到当前分组,计算平均代价,平均代价计算公式为:
其中PC为当前分组中机架的基础建设费用,根据代价函数得到,Qc为当前分组中机架之间的交换总量;
S212:从剩下的待分组机架中找到一个跟当前分组中的所有机架交换总量最大的一个机架;
S213:考察该机架添加进当前分组后的平均代价,如果平均代价变小,则该机架加入当前分组,跳转到S212,否则当前分组结束,跳转到S214;
S214:如果只剩下一个机架待分组,则把该机架单独作为一组,S21结束,如果所有机架已经分组完毕,S21结束;否则跳转到S211;
S22:计算不同机架组之间的数据交换总量,其组内部交换量不考虑,再根据外部业务和每个核心交换器的容量计算出所需的核心交换器数目,把核心交换器分配到各个机架组,优先分配给先出现的机架组,不足则不分配;
S23:进行分组放置,仍然采用贪婪算法的思想,针对已经分配了核心交换器的机架组进行放置,放置过程中两个组件的交换量分摊到它们各自的核心交换器上,具体放置方法为:
S231:从所有待放置的机架组中选出跟当前已经放置的组间交换总量最大的那组;如果当前还没有放置任何组,则从所有待放置组中找出交换量最大的一对组,从两者中任意选择一组;
S232:对S231选出的组,在网络中选择节点进行放置,具体做法为:
针对网络中所有可行节点(没被放置机架组)进行考查,如果当前组放置后,外部业务按照与相邻核心交换器之间距离由近及远逐个接入,直到当前网络中的核心交换器已经饱和或者当前平均代价不再减小;
当前组每放置在一个待选节点都可以得到一个最小平均代价,从在所有可行节点分别求取的最小平均代价中找到最小的一个,在该节点上放置当前组,同时按照分摊的思想确定所有已放置的组在各个核心交换器上的交换量;
S233:如果所有组已经放置完毕,则S22结束;否则跳转S231;
S24:如果S22完成后不存在没有分配到核心交换器的机架组,则整个算法结束;否则每次从所有待放置组中选取跟所有已放置组之间交换总量最大的那个组,在网络中各个节点进行尝试,根据平均代价计算方法的公式找到使得平均代价最小的节点进行放置,循环使用此方法,完成所有待定组的放置。
进一步的,所述的平均代价计算方法为:
其中,PC为当前网络中已经放置的核心交换器代价之和,PI为组间交换的传输和延时代价和,PD为已经接入的外部业务传输代价和,TI为所有放置组间交换量之和,TD为已经接入的外部业务总量。
本发明的有益效果是:
(1)数据网络中心架构采用分布式的架构,解决了传统架构中集中放置带来的供电困难、散热代价高和空间不足等问题;
(2)采用光交换器替代传统的电交换器,并且把数据中心内部的多级交换网络嵌入到骨干网络中去的,从而有效地利用了骨干网络基础设施来简化数据中心内部连接,降低了成本及功耗,同时也增强了数据中心网络架构的可扩展性;
(3)把机架和交换器嵌入到骨干网络中,可以根据网络架构和业务分布进行设计和调整数据中心网络架构,设计灵活且适应性更强。
附图说明
图1为本发明数据中心网络架构的结构图;
图2为代价函数曲线;
图3为实施例所采用的骨干网络;
图4为实施例中所给出的机架间业务交换量;
图5为实施例给出的骨干网络上各个链接上传输单位流量的传输单价;
图6为实施例给出的骨干网络中各个节点的业务量,也就是数据网络外部的交换量;
图7为实施例给出的代价函数曲线上的标度值,以及采用方法一设计时的一些常系数的取值;
图8为实施例采用方法一设计出的数据中心内部组件的放置结果;
图9为实施例采用方法一设计出的骨干网络中各个节点的业务接入路由;
图10为实施例采用方法一设计出的放置在不同节点的机架组之间的数据交换方法;
图11为实施例采用方法二设计出的数据中心内部组件的放置结果;
图12为实施例采用方法二设计出的骨干网络中各个节点的业务接入路由;
图13为实施例采用方法二设计出的放置在不同节点的机架组之间的数据交换方法;
图14为本发明方法一的流程图;
图15为本发明方法二的流程图;
图中,1-数据中心网络架构,2-内容交换器,3-光核心交换器,4-光聚合交换器,5-ToR交换器,6-机架,7-节点。
具体实施方式
下面结合附图及实施例进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种可扩展的数据中心网络架构,它包括核心层组件和边缘层组件,核心层组件和边缘层组件分布式的放置在骨干网络的各个节点7上并通过光纤进行连接,所述核心层组件包括核心交换器3和内容交换器2,所述边缘层组件包括一个或多个机架6、一个或多个ToR交换器5和聚合交换器4;机架6上放置有多个服务器,机架6顶端设有一个ToR交换器5,ToR交换器5用于完成同一个机架的服务器之间的数据交换;聚合交换器4连接同一节点不同机架上的ToR交换器5,用于完成同一个节点不同机架之间的数据交换;核心交换器3通过光纤分别连接各个节点的聚合交换器4,用于完成不同节点机架之间的数据交换;内容交换器2一端连接同一节点的核心交换器3,另一端通过网络连接外部用户,负责外部用户业务的接入和数据交换。
进一步的,所述的核心交换器3为光核心交换器,所述的聚合交换器4为光聚合交换器。
进一步的,所述的核心层组件和边缘层组件的分布式程度是根据设计的目标在单节点集中放置和全网分散放置两种模式之间进行灵活控制。
一种可扩展的数据中心网络架构的实现方法,它包括如下两种:
方法一:将机架的分组、交换器数量的确定、组件的放置以及业务的路由的求解问题全部归结到一个整数线性规划中去,然后利用数学工具进行求解;
方法二:根据启发式算法进行设计求解;
如图14所示,所述方法一包括以下步骤:
根据系统给出参数条件,建立如图2所示代价函数曲线,完成如下符号定义与数值对照,图2为代价函数曲线,显示了单个节点机架放置代价跟机架数目之间的关系,当机架数目上升时,放置代价是非线性上升的:
1)定义K为代价函数中阴影区域数目,然后确定其取值;
2)定义Δk与Nk分别为代价函数纵轴与横轴标度值,然后确定其取值;
3)定义V为骨干网络G(V,E)中所有节点的集合,然后确定其取值;
4)定义E为骨干网络G(V,E)中所有链接的集合,然后确定其取值;
5)定义R为所有机架集合,然后确定其取值;
6)定义Q为核心交换器交换容量,然后确定其取值;
7)定义Ps为一对核心交换器和内容交换器的总代价,然后确定其取值;
8)定义Po为当一对核心交换器与内容交换器跟一组机架放置在同一个节点时所节省的基础建设费,然后确定其取值;
9)定义Puv为节点u和节点v之间单位流量的传输代价,然后确定其取值;
10)定义θ为传输时延代价系数,θPuv表示节点u和节点v之间单位流量的传输和时延总代价,其中(θ-1)Puv为时延代价部分,然后确定其取值;
11)定义dv为网络中节点v处的业务请求量,v∈V,然后确定其取值;
12)定义rij为数据中心内部编号为i的机架与编号为j的机架间的交换量,然后确定其取值;
13)定义α为一任意一个满足α≥∑i∈Rj∈Rγij的常数,然后确定其取值;
14)定义β为一任意一个满足β≥∑v∈Vdv的常数,然后确定其取值;
15)定义γ为一任意一个满足γ≥|R|的常数,然后确定其取值;
定义如下待定变量:
1)定义Su为二进制变量,当有一个核心交换器与内容交换器对放置在节点u处时,其取值为1,否则为0,其中u∈V;
2)定义为二进制变量,如果编号为i的机架放置在节点m处则取值为1,否则为0,其中i∈R,m∈V;
3)定义Yu为二进制变量,如果一个核心交换器与内容交换器对跟一个机架组同时放置在节点u处,则取值为1,否则取值为0,其中u∈V;
4)定义为二进制变量,如果节点m处的机架数目超过Nk,则取值为1,否则取值为0,其中m∈V,k≤K;
5)定义为二进制变量,如果编号为i的机架放置在节点m,同时编号为j的机架放置在节点n,则取值为1,否则取值为0,其中m,n∈V,m<n,i,j∈R,i≠j;
6)定义为非负整数变量,表示节点v处的外部业务从u处的内容交换器接入的量,其中u∈V,v∈V;
7)定义为非负整数变量,表示节点m处的机架和节点n处的机架之间的交换总量中由节点u处的核心交换器完成交换的那部分量,其中m,n∈V,m<n,u∈V;
S11:根据上述完成的条件,建立以下整数线性规划;
目标函数为:
min i m i z e { &Sigma; u &Element; V P s S u + &Sigma; m &Element; V &Sigma; k &le; K &Delta; k J m k + &Sigma; u &Element; V &Sigma; v &Element; V P u v F u v + &Sigma; m &Element; V &Sigma; n &Element; V , n > m &Sigma; u &Element; V &theta; ( P m u + P n u ) T m n u - &Sigma; u &Element; V P 0 Y u } ;
约束条件为:
&Sigma; m &Element; V R m i = 1 , &ForAll; i &Element; R ;
X m n i j &GreaterEqual; R m i + R n j - 1 , &ForAll; m , n &Element; V : m < n , &ForAll; i , j &Element; R : i &NotEqual; j ;
S u &GreaterEqual; 1 &alpha; &Sigma; m &Element; V &Sigma; n &Element; V , n > m T m n u , &ForAll; u &Element; V ;
S u &GreaterEqual; 1 &beta; &Sigma; v &Element; V F u v , &ForAll; u &Element; V ;
J m k &GreaterEqual; 1 &gamma; ( &Sigma; i &Element; R R m i - N k ) , &ForAll; m &Element; V , &ForAll; k ;
&Sigma; u &Element; V T m n u = &Sigma; i &Element; R &Sigma; j &Element; R , j &NotEqual; i r i j X m n i j , &ForAll; m , n &Element; V : m < n ;
&Sigma; v &Element; V F u v + &Sigma; m &Element; V &Sigma; n &Element; V , n > m T m n u &le; Q , &ForAll; u &Element; V ;
&Sigma; u &Element; V F u v = d v , &ForAll; v &Element; V ;
Y u &le; S u , &ForAll; u &Element; V ;
Y u &le; &Sigma; i &Element; R R u i , &ForAll; u &Element; V ;
S12:利用数学优化工具求解S11的整数线性规划,根据求解出的结果完成数据中心网络架构的设计。所述S11的整数线性规划的求解方法为:
S121:编写C程序,根据S11的整数线性规划式子生成优化工具CPLEX的执行文件;
S122:运行CPLEX,将S121生成的执行文件导入到CPLEX,CPLEX根据一定的搜索算法自动求取出优化问题的最优解;
S123:从CPLEX中导出优化结果,并将结果对照回各个变量,根据变量的取值设计当前数据中心网络架构。
如图15所示,所述方法二包括以下步骤:
S21:机架分组,采用贪婪算法的思想每次在降低平均代价的前提下尽量把总交换量较大的机架放到同一个机架组,具体实施步骤为:
S211:新建一个机架分组,从所有待分组的机架中找到交换量最大的一对机架,将其中一个放到当前分组,计算平均代价,平均代价计算公式为:
其中PC为当前分组中机架的基础建设费用,根据图2所示代价函数得到,Qc为当前分组中机架之间的交换总量;
S212:从剩下的待分组机架中找到一个跟当前分组中的所有机架交换总量最大的一个机架;
S213:考察该机架添加进当前分组后的平均代价,如果平均代价变小,则该机架加入当前分组,跳转到S212,否则当前分组结束,跳转到S214;
S214:如果只剩下一个机架待分组,则把该机架单独作为一组,S21结束,如果所有机架已经分组完毕,S21结束;否则跳转到S211;
S22:计算不同机架组之间的数据交换总量,其组内部交换量不考虑,再根据外部业务和每个核心交换器的容量计算出所需的核心交换器数目,把核心交换器分配到各个机架组,优先分配给先出现的机架组,不足则不分配;
S23:进行分组放置,仍然采用贪婪算法的思想,针对已经分配了核心交换器的机架组进行放置,放置过程中两个组件的交换量分摊到它们各自的核心交换器上,具体放置方法为:
S231:从所有待放置的机架组中选出跟当前已经放置的组间交换总量最大的那组;如果当前还没有放置任何组,则从所有待放置组中找出交换量最大的一对组,从两者中任意选择一组;
S232:对S231选出的组,在网络中选择节点进行放置,具体做法为:
针对网络中所有可行节点(没被放置机架组)进行考查,如果当前组放置后,外部业务按照与相邻核心交换器之间距离由近及远逐个接入,直到当前网络中的核心交换器已经饱和或者当前平均代价不再减小;平均代价计算方法为:
其中,PC为当前网络中已经放置的核心交换器代价之和,PI为组间交换的传输和延时代价和,PD为已经接入的外部业务传输代价和,TI为所有放置组间交换量之和,TD为已经接入的外部业务总量。
当前组每放置在一个待选节点都可以得到一个最小平均代价,从在所有可行节点分别求取的最小平均代价中找到最小的一个,在该节点上放置当前组,同时按照分摊的思想确定所有已放置的组在各个核心交换器上的交换量。
S233:如果所有组已经放置完毕,则S22结束;否则跳转S231;
S24:如果S22完成后不存在没有分配到核心交换器的机架组,则整个算法结束;否则每次从所有待放置组中选取跟所有已放置组之间交换总量最大的那个组,在网络中各个节点进行尝试,根据平均代价计算方法的公式找到使得平均代价最小的节点进行放置,循环使用此方法,完成所有待定组的放置。
结合实施例,本发明的工作过程如下:假设给出如图3所示的骨干网络,pan-EuropeanCOST239网络,该网络共有11个节点,26条链接,并分别按照图4、图5、图6和图7给出机架间数据交换量、骨干网络各个链接上的单位数据量传输单价、骨干网各节点业务量以及图2所示的代价函数曲线。
按照方法一的设计思路,直接把给出的已知条件代入相应的参数,并假设出必有的变量,然后完成整数线性规划的实例化,送入数学工具即可求出变量的取值。将求得的变量取值对照到系统,则可以得到图8、图9、图10的结果。图8中所有机架被分成4组,分别放置在网络中的4个不同节点上,其中三个节点分别放置了1个核心交换器。从图9中可以看到外部业务一般都是就近接入到相应的核心交换器的,其中节点5处的业务交换是由节点4和节点8处的内容交换器共同接入的。
按照方法二的设计思路,进行机架分组,依次可以得到如图11所示分组(0、1、2)、(3、8、9)、(4、6、7)、(5),计算组件交换总量,进一步可以计算出系统总共需要4个核心交换器,因此恰好把每个核心交换器分别分配到各个机架组。然后依次考查4个组的放置,根据最小化当前平均单价的原则可以得到它们依次放置的位置为节点2、节点4、节点5和节点7,在放置的同时也确定了组件的交换方式和外部节点的路由。如图12所示为设计出的骨干网络中各个节点的业务接入路由,除了节点9处的业务是由两处内容交换器分别承担一部分接入以外,绝大部分节点的业务都是由其临近节点处的内容交换器接入的。图13所示设计出的放置在不同节点的机架组之间的数据交换方法。

Claims (4)

1.一种可扩展的数据中心网络架构的实现方法,可扩展的数据中心网络架构包括核心层组件和边缘层组件,核心层组件和边缘层组件分布式的放置在骨干网络的各个节点(7)上并通过光纤进行连接,所述核心层组件包括核心交换器(3)和内容交换器(2),所述边缘层组件包括一个或多个机架(6)、一个或多个ToR交换器(5)和聚合交换器(4);机架(6)上放置有多个服务器,机架(6)顶端设有一个ToR交换器(5),ToR交换器(5)用于完成同一个机架(6)的服务器之间的数据交换;聚合交换器(4)连接同一节点不同机架(6)上的ToR交换器(5),用于完成同一个节点不同机架(6)之间的数据交换;核心交换器(3)通过光纤分别连接各个节点的聚合交换器(4),用于完成不同节点机架(6)之间的数据交换;内容交换器(2)一端连接同一节点的核心交换器(3),另一端通过网络连接外部用户,负责外部用户业务的接入和数据交换,其特征在于:它包括以下步骤:
S11:建立以下整数线性规划;
目标函数为:
min i m i z e { &Sigma; u &Element; V P s S u + &Sigma; m &Element; V &Sigma; k &le; K &Delta; k J m k + &Sigma; u &Element; V &Sigma; v &Element; V P u v F u v + &Sigma; m &Element; V &Sigma; n &Element; V , n > m &Sigma; u &Element; V &theta; ( P m u + P n u ) T m n u - &Sigma; u &Element; V P 0 Y u } ;
约束条件为:
&Sigma; m &Element; V R m i = 1 , &ForAll; i &Element; R ;
X m n i j &GreaterEqual; R m i + R n j - 1 , &ForAll; m , n &Element; V : m < n , &ForAll; i , j &Element; R : i &NotEqual; j ;
S u &GreaterEqual; 1 &alpha; &Sigma; m &Element; V &Sigma; n &Element; V , n > m T m n u , &ForAll; u &Element; V ;
S u &GreaterEqual; 1 &beta; &Sigma; v &Element; V F u v , &ForAll; u &Element; V ;
I m k &GreaterEqual; 1 &gamma; ( &Sigma; i &Element; R R m i - N k ) , &ForAll; m &Element; V , &ForAll; k ;
&Sigma; u &Element; V T m n u = &Sigma; i &Element; R &Sigma; j &Element; R , j &NotEqual; i r i j X m n i j , &ForAll; m , n &Element; V : m < n ;
&Sigma; v &Element; V F u v + &Sigma; m &Element; V &Sigma; n &Element; V , n > m T m n u &le; Q , &ForAll; u &Element; V ;
&Sigma; u &Element; V F u v = d v , &ForAll; v &Element; V ;
Yu≤Su &ForAll; u &Element; V ;
Y u &le; &Sigma; i &Element; R R u i , &ForAll; u &Element; V ;
其中:
1)定义K为代价函数中阴影区域数目;
2)定义Δk与Nk分别为代价函数纵轴与横轴标度值;
3)定义V为骨干网络G(V,E)中所有节点的集合;
4)定义E为骨干网络G(V,E)中所有链接的集合;
5)定义R为所有机架集合;
6)定义Q为核心交换器交换容量;
7)定义Ps为一对核心交换器和内容交换器的总代价;
8)定义Po为当一对核心交换器与内容交换器跟一组机架放置在同一个节点时所节省的基础建设费;
9)定义Puv为节点u和节点v之间单位流量的传输代价;
10)定义θ为传输时延代价系数,θPuv表示节点u和节点v之间单位流量的传输和时延总代价,其中(θ-1)Puv为时延代价部分;
11)定义dv为网络中节点v处的业务请求量,v∈V;
12)定义rij为数据中心内部编号为i的机架与编号为j的机架间的交换量;
13)定义α为一任意一个满足α≥Σi∈RΣj∈Rrij的常数;
14)定义β为一任意一个满足β≥Σv∈Vdv的常数;
15)定义γ为一任意一个满足γ≥|R|的常数;
定义待定变量:
1)定义Su为二进制变量,当有一个核心交换器与内容交换器对放置在节点u处时,其取值为1,否则为0,其中u∈V;
2)定义为二进制变量,如果编号为i的机架放置在节点m处则取值为1,否则为0,其中i∈R,m∈V;
3)定义Yu为二进制变量,如果一个核心交换器与内容交换器对跟一个机架组同时放置在节点u处,则取值为1,否则取值为0,其中u∈V;
4)定义为二进制变量,如果节点m处的机架数目超过Nk,则取值为1,否则取值为0,其中m∈V,k≤K;
5)定义为二进制变量,如果编号为i的机架放置在节点m,同时编号为j的机架放置在节点n,则取值为1,否则取值为0,其中m,n∈V,m<n,i,j∈R,i≠j;
6)定义为非负整数变量,表示节点v处的外部业务从u处的内容交换器接入的量,其中u∈V,v∈V;
7)定义为非负整数变量,表示节点m处的机架和节点n处的机架之间的交换总量中由节点u处的核心交换器完成交换的那部分量,其中m,n∈V,m<n,u∈V;
S12:利用数学优化工具求解S11的整数线性规划,根据求解出的结果完成数据中心网络架构的设计。
2.根据权利要求1所述的一种可扩展的数据中心网络架构的实现方法,其特征在于:所述S11的整数线性规划的求解方法为:
S121:编写C程序,根据S11的整数线性规划式子生成优化工具CPLEX的执行文件;
S122:运行CPLEX,将S121生成的执行文件导入到CPLEX,CPLEX根据一定的搜索算法自动求取出优化问题的最优解;
S123:从CPLEX中导出优化结果,并将结果对照回各个变量,根据变量的取值设计当前数据中心网络架构。
3.一种可扩展的数据中心网络架构的实现方法,可扩展的数据中心网络架构包括核心层组件和边缘层组件,核心层组件和边缘层组件分布式的放置在骨干网络的各个节点(7)上并通过光纤进行连接,所述核心层组件包括核心交换器(3)和内容交换器(2),所述边缘层组件包括一个或多个机架(6)、一个或多个ToR交换器(5)和聚合交换器(4);机架(6)上放置有多个服务器,机架(6)顶端设有一个ToR交换器(5),ToR交换器(5)用于完成同一个机架(6)的服务器之间的数据交换;聚合交换器(4)连接同一节点不同机架(6)上的ToR交换器(5),用于完成同一个节点不同机架(6)之间的数据交换;核心交换器(3)通过光纤分别连接各个节点的聚合交换器(4),用于完成不同节点机架(6)之间的数据交换;内容交换器(2)一端连接同一节点的核心交换器(3),另一端通过网络连接外部用户,负责外部用户业务的接入和数据交换,其特征在于:它包括以下步骤:
S21:机架分组,采用贪婪算法的思想每次在降低平均代价的前提下尽量把总交换量较大的机架放到同一个机架组,具体实施步骤为:
S211:新建一个机架分组,从所有待分组的机架中找到交换量最大的一对机架,将其中一个放到当前分组,计算平均代价,平均代价计算公式为:
其中PC为当前分组中机架的基础建设费用,根据代价函数得到,Qc为当前分组中机架之间的交换总量,定义Ps为一对核心交换器和内容交换器的总代价;定义Po为当一对核心交换器与内容交换器跟一组机架放置在同一个节点时所节省的基础建设费;
S212:从剩下的待分组机架中找到一个跟当前分组中的所有机架交换总量最大的一个机架;
S213:考察该机架添加进当前分组后的平均代价,如果平均代价变小,则该机架加入当前分组,跳转到S212,否则当前分组结束,跳转到S214;
S214:如果只剩下一个机架待分组,则把该机架单独作为一组,S21结束,如果所有机架已经分组完毕,S21结束;否则跳转到S211;
S22:计算不同机架组之间的数据交换总量,其组内部交换量不考虑,再根据外部业务和每个核心交换器的容量计算出所需的核心交换器数目,把核心交换器分配到各个机架组,优先分配给先出现的机架组,不足则不分配;
S23:进行分组放置,仍然采用贪婪算法的思想,针对已经分配了核心交换器的机架组进行放置,放置过程中两个组件的交换量分摊到它们各自的核心交换器上,具体放置方法为:
S231:从所有待放置的机架组中选出跟当前已经放置的组间交换总量最大的那组;如果当前还没有放置任何组,则从所有待放置组中找出交换量最大的一对组,从两者中任意选择一组;
S232:对S231选出的组,在网络中选择节点进行放置,具体做法为:
针对网络中所有没被放置机架组的可行节点进行考查,如果当前组放置后,外部业务按照与相邻核心交换器之间距离由近及远逐个接入,直到当前网络中的核心交换器已经饱和或者当前平均代价不再减小;
当前组每放置在一个待选节点都可以得到一个最小平均代价,从在所有可行节点分别求取的最小平均代价中找到最小的一个,在该节点上放置当前组,同时按照分摊的思想确定所有已放置的组在各个核心交换器上的交换量;
S233:如果所有组已经放置完毕,则S22结束;否则跳转S231;
S24:如果S22完成后不存在没有分配到核心交换器的机架组,则整个算法结束;否则每次从所有待放置组中选取跟所有已放置组之间交换总量最大的那个组,在网络中各个节点进行尝试,根据平均代价计算方法的公式找到使得平均代价最小的节点进行放置,循环使用此方法,完成所有待定组的放置。
4.根据权利要求3所述的一种可扩展的数据中心网络架构的实现方法,其特征在于:所述的平均代价计算方法为:
其中,PC为当前网络中已经放置的核心交换器代价之和,PI为组间交换的传输和延时代价和,PD为已经接入的外部业务传输代价和,TI为所有放置组间交换量之和,TD为已经接入的外部业务总量。
CN201310246936.8A 2013-06-20 2013-06-20 一种可扩展的数据中心网络架构的实现方法 Expired - Fee Related CN103327095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310246936.8A CN103327095B (zh) 2013-06-20 2013-06-20 一种可扩展的数据中心网络架构的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310246936.8A CN103327095B (zh) 2013-06-20 2013-06-20 一种可扩展的数据中心网络架构的实现方法

Publications (2)

Publication Number Publication Date
CN103327095A CN103327095A (zh) 2013-09-25
CN103327095B true CN103327095B (zh) 2016-03-02

Family

ID=49195616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310246936.8A Expired - Fee Related CN103327095B (zh) 2013-06-20 2013-06-20 一种可扩展的数据中心网络架构的实现方法

Country Status (1)

Country Link
CN (1) CN103327095B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104661234A (zh) * 2015-02-09 2015-05-27 清华大学 基于60GHz无线通信技术的服务器机架布置方法
CN105208567B (zh) * 2015-10-13 2018-10-19 清华大学 一种基于多次反射的无线数据中心机架布置方法
CN105808822B (zh) * 2016-02-25 2019-04-19 上海交通大学 基于负载因子及最优化模型的混合数据中心架设方法
US10355939B2 (en) 2017-04-13 2019-07-16 International Business Machines Corporation Scalable data center network topology on distributed switch
CN108616590B (zh) * 2018-04-26 2020-07-31 清华大学 十亿规模网络嵌入的迭代随机投影算法及装置
CN108900334B (zh) * 2018-06-27 2020-07-10 华中科技大学 一种基于ilp模型的副本选择节点在网络设备上的布局方法
CN110287025A (zh) * 2019-06-19 2019-09-27 深圳前海微众银行股份有限公司 一种资源分配方法、装置及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1408151A (zh) * 2000-03-01 2003-04-02 艾利森电话股份有限公司 光纤网络

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1408151A (zh) * 2000-03-01 2003-04-02 艾利森电话股份有限公司 光纤网络

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A Scalable,Commodity Data Center Network Architecture;Mohammad Al-Fares,Alexander Loukissas,Amin Vahdat;《ACM SIGCOMM》;20081031;第38卷(第4期);第63-74页 *
c-Through:part-time optics in data centers;Guohui Wang,David G.Andersen,et al.;《ACM SIGCOMM》;20101031;第40卷(第4期);第327-338页 *
Exploring online virtual networks mapping with stochastic bandwidth demand in multi-datacenter;Gang Sun,Hongfang Yu,Lemin Li,Vishal Anand,Yanyang Cai,Hao Di.;《Photonic Network Communications》;20111126;第109-122页 *
Helios: A Hybrid Electrical/Optical Switch Architecture for Modular Data Centers;Nathan Farrington,George Porter,et al.;《ACM SIGCOMM》;20101031;第40卷(第4期);第339-350页 *
虚拟网络的映射技术研究;孙罡;《中国博士学位论文电子期刊》;20130515(第5期);全文 *

Also Published As

Publication number Publication date
CN103327095A (zh) 2013-09-25

Similar Documents

Publication Publication Date Title
CN103327095B (zh) 一种可扩展的数据中心网络架构的实现方法
CN108845970B (zh) 一种自由切换gpu服务器拓扑的装置及方法
US10303640B2 (en) Method and apparatus to manage the direct interconnect switch wiring and growth in computer networks
Wang et al. Neural network meets DCN: Traffic-driven topology adaptation with deep learning
US8307122B2 (en) Close-coupling shared storage architecture of double-wing expandable multiprocessor
Wu et al. An inter/intra-chip optical network for manycore processors
Morris et al. Exploring the design of 64-and 256-core power efficient nanophotonic interconnect
CN105227496A (zh) 捆绑式交换机、网络及在该网络上传输数据的方法
CN114896940B (zh) 一种软件定义的晶圆级交换系统设计方法及装置
CN104035525A (zh) 一种计算节点
US8953497B2 (en) Modified tree-based multicast routing schema
CN105426163A (zh) 一种基于mic协处理器的单数据流分位数处理方法
CN105099776A (zh) 云服务器的管理系统
Zhang et al. Design and analysis of wireless data center network topology HCDCN based on VLC
CN116560005B (zh) 一种基于光学互联的芯粒实现方法和系统
CN208141331U (zh) 一种可调输出电压的冗余扩展服务器架构
Sinha et al. Data-flow aware CNN accelerator with hybrid wireless interconnection
Maniotis et al. Co-packaged optics for HPC and data center networks
CN103914429B (zh) 用于粗粒度动态可重构阵列的多模式数据传输互连器
CN104750659A (zh) 一种基于自动布线互连网络的粗粒度可重构阵列电路
CN103414962A (zh) 一种面向大规模用户接入的远距离无源光网(lr-pon)布局规划方法
Falahati et al. Application-based dynamic reconfiguration in optical network-on-chip
CN102298418A (zh) 基于MicroTCA标准的AMC板卡及其连接方法
US20090028140A1 (en) Switching device, switching method, and switch control program
Yan et al. On the Performance Investigation of a Recursive Fast Optical Switch-Based High Performance Computing Network Architecture

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160302