CN106851442B - 一种超级计算机中的光互连网络系统及通信方法 - Google Patents
一种超级计算机中的光互连网络系统及通信方法 Download PDFInfo
- Publication number
- CN106851442B CN106851442B CN201710038494.6A CN201710038494A CN106851442B CN 106851442 B CN106851442 B CN 106851442B CN 201710038494 A CN201710038494 A CN 201710038494A CN 106851442 B CN106851442 B CN 106851442B
- Authority
- CN
- China
- Prior art keywords
- array
- interchanger
- supercomputing
- optical switch
- grouping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
- H04Q11/0071—Provisions for the electrical-optical layer interface
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
- H04Q2011/0073—Provisions for forwarding or routing, e.g. lookup tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
- H04Q2011/0075—Wavelength grouping or hierarchical aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
- H04Q2011/0086—Network resource allocation, dimensioning or optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种超级计算机中的光互连网络系统及通信方法,本发明的系统包括全局光交换机、阵列电交换机和电路由器。每8台电路由器互连为一个立方体状的计算簇,c个计算簇组成一个超级计算节点;k个超级计算节点,8台阵列电交换机和1台全局光交换机组成一个超级计算阵列;M个超级计算阵列全互连组成网络系统。本发明的方法利用电分组交换和光电路交换两种交换机制,实现了全局光交换机、阵列电交换机和电路由器之间的通信。本发明具有较高的网络可扩展性,提高了链路利用率,支持不同交换机制,降低了网络的拥塞。
Description
技术领域
本发明属于通信技术领域,更进一步涉及互连网络通信技术领域中的一种超级计算机中的光互连网络系统及通信方法。本发明采用了光电路交换机OCS(Optical CircusSwitch)与电分组交换机混合互连的网络拓扑结构,同时通过连接规则和优化的波分复用通信方法,组成了一个光互连的超级计算机互连网络系统,同时实现了光电路交换和电分组交换的混合交换方式,满足不同高性能计算应用的流量业务需求。
背景技术
随着社会经济发展对高性能计算资源的需求越来越高,超级计算机的计算性能正在向E(1018flops)级发展,为满足性能的提升,超级计算机将拥有数十万节点的规模。因此互连系统对超级计算机的性能提升有着关键作用。传统的电互连技术受限于高频率下的信号干扰和高能耗等问题,难以为超级计算机提供高带宽低能耗的互连系统。
由于光互连本身具有高带宽和低能耗的特性,因此光互连网络成为研究人员所关注的焦点。但现存的光互连网络存在以下两点问题:第一,光互连网络性能的发挥需要良好的拓扑结构支持,光互连网络采用集中式架构,整个网络的规模严重受限于核心光交换机的端口数目,网络的可扩展性不高;第二,光互连网络一般采用光电路交换机制,但缺少有效的方案解决光电路交换带宽资源利用率不高的问题,甚至高性能计算中的一些应用流量操作是光电路交换无法支持的,因此网络性能无法得到有效的提高。
西安电子科技大学拥有的专利技术“基于超立方簇的数据中心光互连网络系统及通信方法”(申请号201210133164.2,授权公告号CN 1026384114B,公开日为2012.08.15)中公开了一种基于超立方簇的数据中心光互连网络系统及通信方法。该专利技术的系统包括P台架顶光交换机,P台架顶电交换机和P×h台服务器。每台架顶电交换机连接u台服务器和一台架顶光交换机构成网络基本单元,m个基本单元通过架顶光交换机互连成基于超立方拓扑的簇形结构,r个簇进一步通过架顶光交换机互连成环形拓扑结构。该专利技术系统的不足之处是:网络的拓扑结构提供的互连端口较少,系统的可扩展性受限;顶层环形结构的对分带宽较低,系统的通信时延较高,会出现网络阻塞严重的问题。
Chen Kai等人在其发表的论文“OSA:An Optical Switching Architecture forData Center Networks With Unprecedented Flexibility”(IEEE/ACM TRANSACTIONS ONNETWORKING,2014)中提出了一种数据中心全光互连网络系统及通信方法。该论文提出的系统使用微机电系统MEMS(Micro-Electro-Mechanical System)光交换机与所有架顶交换机直接连接构成一个星形拓扑,每个架顶交换机配备j个光收发模块,j个光收发模块连接到一个1×j波长选择交换机WSS(Wavelength Selective Switch),WSS通过j个光环行器与MEMS光交换机连接。该论文系统的不足之处是:采用星形拓扑结构这种集中式的光交换架构,使得光交换机的基数较高,造成设备设计复杂度上升,使得网络的开销和成本较高,同时也会导致中心光交换机的负荷较大,出现网络阻塞严重的问题。该论文所提供的通信方法是:根据MEMS交换机的交叉开关矩阵直接连接的架顶交换机之间使用光电路交换直接传输数据,非直接连接的架顶交换机之间采用hop-by-hop的通信方法:首先,源架顶交换机选择当前j个直接连接的架顶交换机中的一个作为中间节点,然后该中间架顶交换机接收到信号后进行光电转换,提取数据分组头部并重新想目的交换机转发。该论文的通信方法存在的不足之处是:对于波长资源利用率低,网络拥塞严重,存在数据交换粒度较粗,链路利用率较低,路径建立开销较大的问题。
发明内容
本发明的目的在于克服上述现有技术的不足,解决目前超级计算机光互连网络系统扩展性差,设备成本和复杂度高,链路利用率低,网络阻塞严重的问题,提出一种超级计算机中的光互连拓扑结构及通信方法,该结构具有良好的可扩展性,设备成本和复杂度较低的特点;该通信方法具有数据交换粒度较细,链路利用率较高,网络阻塞较低的特点。
实现本发明目的的思路是,设计了一种层级分布式的光互连网络系统,最底层为立方体状计算簇,计算簇是负责计算业务处理的基本单元;若干计算簇组成一个超级计算节点,超级计算节点是扩展计算业务处理能力的基本单元;超级计算节点按照一定的连接规则与8台阵列电交换机互连;最高层为全局光交换机,全局光交换机通过下行光交换端口与8台阵列电交换机互连,若干超级计算节点、8台阵列电交换机和1台全局光交换机组成一个超级计算阵列,超级计算阵列是网络系统的基本扩展单元,超级计算阵列之间通过全局光交换机的上行光交换端口进行互连和扩展。
本发明的系统包括全局光交换机、阵列电交换机、电路由器。
所述的全局光交换机有N台,每台全局光交换机有8个并行的下行光交换端口,每台全局光交换机通过N-1个全局光交换端口与其他全局光交换机互连。
所述的阵列电交换机有D台,其中D=8N,每台阵列电交换机有R个电互连端口,每台阵列电交换机通过1个光互连端口与1个全局光交换机互连。
所述的电路由器有F台,每个路由器通过7个电互连端口连接h个计算节点,1个电互连端口连接1台阵列电交换机,其中F=8N×R;每8个电路由器互连为一个立方体状的计算簇,c个计算簇组成一个超级计算节点,c≥1;k个超级计算节点,8台阵列电交换机和1台全局光交换机组成一个超级计算阵列;全系统共有M个超级计算阵列,其中M=N。所述的计算簇、超级计算节点、超级计算阵列组成了层级分布式光互连结构。
所述的计算节点包括执行高性能计算的芯片,内存,网卡和一些相应接口,用于向电路由器发送并从电路由器接收各种业务请求,并对业务请求进行处理。
所述的层级分布式光互连结构是由三层光互连网络结构组成,第一层由计算簇组成;第二层由超级计算节点组成;第三层有超级计算阵列组成;超级计算阵列之间通过全局光交换机全互连。
本发明的方法是基于超级计算机中的光互连网络系统的通信方法,包括如下步骤:
(1)产生数据分组:
计算节点中的源计算节点产生数据分组,并将数据分组发送至与源计算节点互连的源路由器RS;
(2)源路由器RS解析数据分组,提取数据分组中的目的地址;
(3)判断目的地址与源路由器RS的地址是否同处一个超级计算阵列中,若是,则执行步骤(4);否则,执行步骤(6);
(4)判断目的地址与源路由器RS的地址是否同处一个超级计算节点中,若是,则执行步骤(5);否则,执行步骤(6);
(5)源路由器RS将数据分组发送至目的路由器Rd后执行续步骤(31);
(6)源路由器RS将数据分组转发给相连的源阵列电交换机ESs;
(7)源阵列电交换机ESs解析数据分组,提取数据分组中的目的地址;
(8)判断目的地址与源阵列电交换机ESs的地址是否同处于一个超级计算阵列中,若是,则执行步骤(9);否则,执行步骤(12);
(9)源阵列电交换机ESs将数据分组存入本地缓存中相应的电交换子队列中;
(10)源阵列电交换机ESs周期性查询本地缓存的所有电交换子队列;
(11)判断电交换子队列中是否存在待发送的数据分组,若是,则执行步骤(13);否则,执行步骤(10);
(12)电交换子队列申请相应的发送端口,待发送端口确认可以发送,将数据分组转发至目的路由器Rd,执行步骤(5);
(13)源阵列电交换机ESs根据数据分组中的信息将数据分组存入本地缓存中光交换子队列中;
(14)源阵列电交换机ESs周期性查询本地缓存的所有光交换子队列;
(15)判断光交换子队列中是否存在待发送的数据分组,若是,则执行步骤(16),否则,执行步骤(14);
(16)判断源阵列电交换机ESs在上一查询周期中是否为光交换子队列产生过建链分组,若是,则执行步骤(15);否则,执行步骤(17);
(17)源阵列电交换机ESs产生建链分组,将建链分组携带的信息发送至与源阵列电交换机ESs相连的全局光交换机OSs,
(18)全局光交换机OSs接收建链分组后,查询该建链分组的输出端口,并提取该建链分组携带的信息;
(19)全局光交换机OSs查询该输出端口的通信波长λ是否存在被占用的标记;若是,则执行步骤(20);否则,则执行步骤(21);
(20)全局光交换机OSs将建链分组存储在输入端口的缓存队列中并等待波长被释放,执行步骤(19);
(21)全局光交换机OSs转发建链分组至目的电路由器Rd所在的超级计算阵列的全局光交换机OSd,并标记输出端口的通信波长λ被占用;
(22)判断全局光交换机OSd是否收到建链分组,若是,则执行步骤(23);否则,执行步骤(18);
(23)全局光交换机OSd查询输出端口的通信波长λ是否存在被占用,若是,则执行步骤(22);否则,执行步骤(24);
(24)全局光交换机OSd将接收到的建链分组转发至目的阵列电交换机ESd;
(25)目的阵列电交换机ESd接收到建链分组后,产生响应分组,并将产生的响应分组携带的信息发往源阵列电交换机ESs;
(26)判断源阵列电交换机ESs是否收到响应分组,若是,则执行步骤(28);否则,执行步骤(27);
(27)全局光交换机OSd根据响应分组配置输入输出端口,并向源阵列电交换机ESs转发该响应分组,执行步骤(26);
(28)全局光交换机OSs将响应分组转发至源阵列电交换机ESs,源阵列电交换机ESs提取响应分组所携带的通信波长λ,选择本地缓存的光交换子队列,并使用通信波长λ将该队列中的所有数据分组发送至全局光交换机OSs;
(29)源阵列电交换机ESs向目的阵列电交换机ESd发送拆链分组;
(30)判断拆链分组是否到达目的阵列电交换机ESd,若是,则目的阵列电交换机ESd销毁该拆链分组,执行步骤(32);否则,执行步骤(29);
(31)数据分组通过已经建立的光传输路径到达目的阵列电交换机ESd,目的阵列电交换机ESd转发数据分组到目的路由器Rd;
(32)目的路由器Rd将所接收的数据分组转发给计算节点中目的计算节点,通信过程完成。
本发明与现有技术相比,具有以下优点:
第一,由于本发明的系统中采用全局光交换机、阵列电交换机、电路由器通过一定的互连规则构成网络系统,克服了现有技术网络系统提供的互连端口较少,系统的可扩展性受限,顶层环形结构的对分带宽较低的问题,使得本发明的网络系统可扩展性好,对分带宽高。
第二,由于本发明的系统中的光交换机采用层级分布式光互连结构,克服了在集中式的星形拓扑结构光交换互连结构中,中心光交换机的基数过大,负荷较高,容易出现拥塞的问题,使得本发明的网络系统中每个光交换机负荷较为均衡,缓解了网络拥塞。
第三,由于本发明的通信方法采用超级计算阵列内通信波长分配方法和超级计算阵列间通信波长分配方法进行通信波长分配,克服了现有波分复用技术的通信波长资源利用率低,网络拥塞严重的问题,使得本发明的通信方法通信波长资源利用率较高,缓解了网络拥塞。
附图说明
图1是本发明的系统示意图;
图2本发明系统中阵列电交换机和全局光交换机连接关系示意图;
图3本发明通信方法的流程图。
具体实施方式:
下面结合附图对本发明做进一步的描述。
参照附图1,对本发明系统的拓扑结构做进一步的描述。
本发明的的光互连网络系统,包括全局光交换机、阵列电交换机、电路由器。
全局光交换机有N台,每台全局光交换机有8个并行的下行光交换端口,每台全局光交换机通过N-1个全局光交换端口与其他全局光交换机互连。
阵列电交换机有D台,其中D=8N,每台阵列电交换机有R个电互连端口,每台阵列电交换机通过1个光互连端口与1个全局光交换机互连。
电路由器有F台,每个路由器通过7个电互连端口连接h个计算节点,1个电互连端口连接1台阵列电交换机,其中F=8N×R;每8个电路由器互连为一个立方体状的计算簇,c个计算簇组成一个超级计算节点,c≥1;k个超级计算节点,8台阵列电交换机和1台全局光交换机组成一个超级计算阵列;全系统共有M个超级计算阵列,其中M=N;所述的计算簇、超级计算节点、超级计算阵列组成了层级分布式光互连结构。
计算节点包括执行高性能计算的芯片,内存,网卡和一些相应接口,用于向电路由器发送并从电路由器接收各种业务请求,并对业务请求进行处理。
层级分布式光互连结构是由三层光互连网络结构组成,第一层由计算簇组成;第二层由超级计算节点组成;第三层有超级计算阵列组成;超级计算阵列之间通过全局光交换机全互连,构成层级分布式光交换结构。
参照附图2,对本发明系统中的全局光交换机、阵列电交换机和电路由器的连接关系做进一步的描述。
每台全局光交换机通过8个下行光交换端口与处于同一个超级计算阵列的8台阵列电交换机互连,通过N-1个全局光交换端口与处于不同超级计算阵列的N-1台全局光交换机互连;每台阵列电交换机通过1个上行光交换端口与处于同一个超级计算阵列的全局光交换机互连,通过k个下行电交换端口与电路由器互连。
参照附图3,对本发明的方法做进一步描述。
步骤1,产生数据分组。
计算节点中的源计算节点产生数据分组,并将数据分组发送至与源计算节点互连的源路由器RS。
步骤2,源路由器RS解析数据分组,提取数据分组中的目的地址。
步骤3,判断目的地址与源路由器RS的地址是否同处一个超级计算阵列中,若是,则执行步骤4;否则,执行步骤6。
步骤4,判断目的地址与源路由器RS的地址是否同处一个超级计算节点中,若是,则执行步骤5;否则,执行步骤6。
步骤5,源路由器RS将数据分组发送至目的路由器Rd后执行步骤31。
步骤6,源路由器RS将数据分组转发给直连的源阵列电交换机ESs。
步骤7,源阵列电交换机ESs解析数据分组,提取数据分组中的目的地址。
步骤8,判断目的地址与源阵列电交换机ESs的地址是否同处于一个超级计算阵列中,若是,则执行步骤9;否则,执行步骤12。
步骤9,源阵列电交换机ESs将数据分组存入本地缓存中相应的电交换子队列中。
步骤10,源阵列电交换机ESs周期性查询本地缓存的所有电交换子队列。
步骤11,判断电交换子队列中是否存在待发送的数据分组,若是,则执行步骤13;否则,执行步骤10。
步骤12,电交换子队列申请相应的发送端口,待发送端口确认可以发送,将数据分组转发至目的路由器Rd,执行步骤5。
步骤13,源阵列电交换机ESs根据数据分组中的信息将数据分组存入本地缓存中光交换子队列中。
步骤14,源阵列电交换机ESs周期性查询本地缓存的所有光交换子队列。
步骤15,判断光交换子队列中是否存在待发送的数据分组,若是,则执行步骤16,否则,执行步骤14。
步骤16,判断源阵列电交换机ESs在上一查询周期中是否为光交换子队列产生过建链分组,若是,则执行步骤15;否则,执行步骤17。
步骤17,源阵列电交换机ESs产生建链分组,将建链分组携带的信息发送至与源阵列电交换机ESs相连的全局光交换机OSs。
所述的建链分组携带的信息包括源阵列电交换机ESs地址、目的地址、通信波长λ。
所述的通信波长λ是由如下两种波长分配方法中的一种所确定的:
第一种,将超级计算阵列内通信波长集合设置为Φp,将超级计算阵列内通信波长集合Φp均分为8个波长,阵列电交换机的通信波长λ与超级计算阵列波长集合Φp中的第Is个波长对应,其中,Is为阵列电交换机的序号,满足0≤Is≤7。
第二种,将超级计算阵列间通信波长集合设置为Φc,将超级计算阵列间通信波长集合Φc划分为个波长组,每个波长组内有n个波长,n≥2,全局光交换机子队列的通信波长λ与超级计算阵列间通信波长集合Φc中第i个波长组的第Ij个波长对应;其中,i由下式计算得到:
i=min(N-|Ij-Is|,|Ij-Is||)
其中,Ij表示目的阵列电交换机ESd的超级计算阵列的序号,Is表示源阵列电交换机ESs的超级计算阵列的序号,0≤Ij,Is≤N-1;min表示取最小值操作;|·|表示取绝对值操作。
步骤18,全局光交换机OSs接收建链分组后,查询该建链分组的输出端口,并提取该建链分组携带的信息。
步骤19,全局光交换机OSs查询该输出端口的通信波长λ是否存在被占用的标记;若是,则执行步骤20;否则,则执行步骤21。
步骤20,全局光交换机OSs将建链分组存储在输入端口的缓存队列中并等待波长被释放,执行步骤19。
步骤21,全局光交换机OSs转发建链分组至目的电路由器Rd所在的超级计算阵列的全局光交换机OSd,并标记输出端口的通信波长λ被占用。
步骤22,判断全局光交换机OSd是否收到建链分组,若是,则执行步骤23;否则,执行步骤18。
步骤23,全局光交换机OSd查询输出端口的通信波长λ是否存在被占用,若是,则执行步骤22;否则,执行步骤24。
步骤24,全局光交换机OSd将接收到的建链分组转发至目的阵列电交换机ESd。
步骤25,目的阵列电交换机ESd接收到建链分组后,产生响应分组,并将产生的响应分组携带的信息发往源阵列电交换机ESs。
所述的响应分组携带的信息包括源阵列电交换机ESs地址、目的地址、通信波长λ。
步骤26,判断源阵列电交换机ESs是否收到响应分组,若是,则执行步骤28;否则,执行步骤27。
步骤27,全局光交换机OSd根据响应分组配置输入输出端口,并向源阵列电交换机ESs转发该响应分组,执行步骤26。
步骤28,全局光交换机OSs将响应分组转发至源阵列电交换机ESs,源阵列电交换机ESs提取响应分组所携带的通信波长λ,选择本地缓存的光交换子队列,并使用通信波长λ将该队列中的所有数据分组发送至全局光交换机OSs。
步骤29,源阵列电交换机ESs向目的阵列电交换机ESd发送拆链分组;
步骤30,判断拆链分组是否到达目的阵列电交换机ESd,若是,则目的阵列电交换机ESd销毁该拆链分组,执行步骤32;否则,执行步骤29。
步骤31,数据分组通过已经建立的光传输路径到达目的阵列电交换机ESd,目的阵列电交换机ESd转发数据分组到目的路由器Rd。
步骤32,目的路由器Rd将所接收的数据分组转发给计算节点中目的计算节点,通信过程完成。
Claims (5)
1.一种超级计算机中的光互连网络系统,包括全局光交换机、阵列电交换机、电路由器;其特征在于:
所述的全局光交换机有N台,每台全局光交换机有8个并行的下行光交换端口,每台全局光交换机通过N-1个全局光交换端口与其他全局光交换机互连;
所述的阵列电交换机有D台,其中D=8N,每台阵列电交换机有R个电互连端口,每台阵列电交换机通过1个光互连端口与1个全局光交换机互连;
所述的电路由器有F台,每个路由器通过7个电互连端口连接h个计算节点,1个电互连端口连接1台阵列电交换机,其中F=8N×R;每8个电路由器互连为一个立方体状的计算簇,c个计算簇组成一个超级计算节点,c≥1;k个超级计算节点,8台阵列电交换机和1台全局光交换机组成一个超级计算阵列;全系统共有M个超级计算阵列,其中M=N;所述的计算簇、超级计算节点、超级计算阵列组成了层级分布式光互连结构;
所述的计算节点包括执行高性能计算的芯片,内存,网卡和一些相应接口,用于向电路由器发送并从电路由器接收各种业务请求,并对业务请求进行处理。
2.根据权利要求1所述的一种超级计算机中的光互连网络系统,其特征在于,所述的层级分布式光互连结构是由三层光互连网络结构组成,第一层由计算簇组成;第二层由超级计算节点组成;第三层由超级计算阵列组成;超级计算阵列之间通过全局光交换机全互连。
3.一种超级计算机中的光互连网络通信方法,该方法是基于超级计算机中的光互连网络系统实现的通信方法,包括如下步骤:
(1)产生数据分组:
计算节点中的源计算节点产生数据分组,并将数据分组发送至与源计算节点互连的源路由器RS;
(2)源路由器RS解析数据分组,提取数据分组中的目的地址;
(3)判断目的地址与源路由器RS的地址是否同处一个超级计算阵列中,若是,则执行步骤(4);否则,执行步骤(6);
(4)判断目的地址与源路由器RS的地址是否同处一个超级计算节点中,若是,则执行步骤(5);否则,执行步骤(6);
(5)源路由器RS将数据分组发送至目的路由器Rd后执行步骤(31);
(6)源路由器RS将数据分组转发给相连的源阵列电交换机ESs;
(7)源阵列电交换机ESs解析数据分组,提取数据分组中的目的地址;
(8)判断目的地址与源阵列电交换机ESs的地址是否同处于一个超级计算阵列中,若是,则执行步骤(9);否则,执行步骤(12);
(9)源阵列电交换机ESs将数据分组存入本地缓存中相应的电交换子队列中;
(10)源阵列电交换机ESs周期性查询本地缓存的所有电交换子队列;
(11)判断电交换子队列中是否存在待发送的数据分组,若是,则执行步骤(13);否则,执行步骤(10);
(12)电交换子队列申请相应的发送端口,待发送端口确认可以发送,将数据分组转发至目的路由器Rd,执行步骤(5);
(13)源阵列电交换机ESs根据数据分组中的信息将数据分组存入本地缓存中光交换子队列中;
(14)源阵列电交换机ESs周期性查询本地缓存的所有光交换子队列;
(15)判断光交换子队列中是否存在待发送的数据分组,若是,则执行步骤(16),否则,执行步骤(14);
(16)判断源阵列电交换机ESs在上一查询周期中是否为光交换子队列产生过建链分组,若是,则执行步骤(15);否则,执行步骤(17);
(17)源阵列电交换机ESs产生建链分组,将建链分组携带的信息发送至与源阵列电交换机ESs相连的全局光交换机OSs;
(18)全局光交换机OSs接收建链分组后,查询该建链分组的输出端口,并提取该建链分组携带的信息;
(19)全局光交换机OSs查询该输出端口的通信波长λ是否存在被占用的标记;若是,则执行步骤(20);否则,则执行步骤(21);
(20)全局光交换机OSs将建链分组存储在输入端口的缓存队列中并等待波长被释放,执行步骤(19);
(21)全局光交换机OSs转发建链分组至目的电路由器Rd所在的超级计算阵列的全局光交换机OSd,并标记输出端口的通信波长λ被占用;
(22)判断全局光交换机OSd是否收到建链分组,若是,则执行步骤(23);否则,执行步骤(18);
(23)全局光交换机OSd查询输出端口的通信波长λ是否存在被占用,若是,则执行步骤(22);否则,执行步骤(24);
(24)全局光交换机OSd将接收到的建链分组转发至目的阵列电交换机ESd;
(25)目的阵列电交换机ESd接收到建链分组后,产生响应分组,并将产生的响应分组携带的信息发往源阵列电交换机ESs;
(26)判断源阵列电交换机ESs是否收到响应分组,若是,则执行步骤(28);否则,执行步骤(27);
(27)全局光交换机OSd根据响应分组配置输入输出端口,并向源阵列电交换机ESs转发该响应分组,执行步骤(26);
(28)全局光交换机OSs将响应分组转发至源阵列电交换机ESs,源阵列电交换机ESs提取响应分组所携带的通信波长λ,选择本地缓存的光交换子队列,并使用通信波长λ将该队列中的所有数据分组发送至全局光交换机OSs;
(29)源阵列电交换机ESs向目的阵列电交换机ESd发送拆链分组;
(30)判断拆链分组是否到达目的阵列电交换机ESd,若是,则目的阵列电交换机ESd销毁该拆链分组,执行步骤(32);否则,执行步骤(29);
(31)数据分组通过已经建立的光传输路径到达目的阵列电交换机ESd,目的阵列电交换机ESd转发数据分组到目的路由器Rd;
(32)目的路由器Rd将所接收的数据分组转发给计算节点中目的计算节点,通信过程完成。
4.根据权利要求3所述的一种超级计算机中的光互连网络通信方法,其特征在于,步骤(17)中所述的建链分组携带的信息包括源阵列电交换机ESs地址、目的地址、通信波长λ。
5.根据权利要求3所述的一种超级计算机中的光互连网络通信方法,其特征在于,步骤(25)所述的响应分组携带的信息包括源阵列电交换机ESs地址、目的地址、通信波长λ;
所述的通信波长λ是由如下两种波长分配方法中的一种所确定的:
第一种,将超级计算阵列内通信波长集合设置为Φp,将超级计算阵列内通信波长集合Φp均分为8个波长,阵列电交换机的通信波长λ与超级计算阵列波长集合Φp中的第Is个波长对应,其中,Is表示阵列电交换机的序号,满足0≤Is≤7;
第二种,将超级计算阵列间通信波长集合设置为Φc,将超级计算阵列间通信波长集合Φc划分为个波长组,表示向下取整操作,每个波长组内有n个波长,n≥2,全局光交换机子队列的通信波长λ与超级计算阵列间通信波长集合Φc中第i个波长组的第Ij个波长对应;其中i由下式计算得到:
i=min(N-|Ij-Is|,|Ij-Is||)
其中,Ij表示目的阵列电交换机ESd的超级计算阵列的序号,Is表示源阵列电交换机ESs的超级计算阵列的序号,0≤Ij,Is≤N-1;min表示取最小值操作;|·|表示取绝对值操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710038494.6A CN106851442B (zh) | 2017-01-19 | 2017-01-19 | 一种超级计算机中的光互连网络系统及通信方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710038494.6A CN106851442B (zh) | 2017-01-19 | 2017-01-19 | 一种超级计算机中的光互连网络系统及通信方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106851442A CN106851442A (zh) | 2017-06-13 |
CN106851442B true CN106851442B (zh) | 2019-05-21 |
Family
ID=59124958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710038494.6A Active CN106851442B (zh) | 2017-01-19 | 2017-01-19 | 一种超级计算机中的光互连网络系统及通信方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106851442B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106209294B (zh) * | 2016-07-01 | 2018-08-03 | 西安电子科技大学 | 一种高扩展的数据中心全光互连网络系统及通信方法 |
WO2019200568A1 (zh) * | 2018-04-18 | 2019-10-24 | 华为技术有限公司 | 一种数据通信方法及装置 |
CN108768864B (zh) * | 2018-07-16 | 2021-05-28 | 南京邮电大学 | 一种易拓展高容错的数据中心网络拓扑系统 |
US11042416B2 (en) | 2019-03-06 | 2021-06-22 | Google Llc | Reconfigurable computing pods using optical networks |
CN112118194B (zh) * | 2019-06-04 | 2021-12-10 | 华为技术有限公司 | 数据交换设备、服务器和通信系统 |
US11122347B2 (en) | 2019-07-01 | 2021-09-14 | Google Llc | Reconfigurable computing pods using optical networks with one-to-many optical switches |
CN110809202B (zh) * | 2019-10-09 | 2021-07-27 | 东南大学 | 无源光分配节点及电光混合双层接入网络 |
CN111193971B (zh) * | 2019-11-15 | 2020-12-08 | 西安电子科技大学 | 一种面向机器学习的分布式计算互连网络系统及通信方法 |
JP7315271B2 (ja) * | 2020-02-17 | 2023-07-26 | 国立研究開発法人産業技術総合研究所 | 通信制御方法及び通信制御装置 |
CN112965752B (zh) * | 2021-05-18 | 2021-09-07 | 北京壁仞科技开发有限公司 | 利用计算阵列来处理数据的方法和计算系统 |
CN118612579A (zh) * | 2023-03-06 | 2024-09-06 | 华为技术有限公司 | 一种人工智能计算系统及方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102638411A (zh) * | 2012-05-02 | 2012-08-15 | 西安电子科技大学 | 基于超立方簇的数据中心光互连网络系统及通信方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8503879B2 (en) * | 2010-10-25 | 2013-08-06 | Nec Laboratories America, Inc. | Hybrid optical/electrical switching system for data center networks |
-
2017
- 2017-01-19 CN CN201710038494.6A patent/CN106851442B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102638411A (zh) * | 2012-05-02 | 2012-08-15 | 西安电子科技大学 | 基于超立方簇的数据中心光互连网络系统及通信方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106851442A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106851442B (zh) | 一种超级计算机中的光互连网络系统及通信方法 | |
Chen et al. | The features, hardware, and architectures of data center networks: A survey | |
Jin et al. | Latency-aware VNF chain deployment with efficient resource reuse at network edge | |
Xia et al. | A tale of two topologies: Exploring convertible data center network architectures with flat-tree | |
Chen et al. | WaveCube: A scalable, fault-tolerant, high-performance optical data center architecture | |
Wu et al. | Rethinking the architecture design of data center networks | |
CN110300072A (zh) | 网络互连交换 | |
CN106685530A (zh) | 用于采用波长不可知的端点的扁平化数据中心网络的方法和装置 | |
CN105072513B (zh) | 支持多种传输交换模式的光网络控制方法 | |
Cheng et al. | POTORI: a passive optical top-of-rack interconnect architecture for data centers | |
CN106941633A (zh) | 基于sdn的全光交换数据中心网络控制系统及其实现方法 | |
CN103716721B (zh) | 向分组光网络的目的地节点提供外部光数据分组的方法和系统 | |
Hirono et al. | HOLST: Architecture design of energy-efficient data center network based on ultra high-speed optical switch | |
CN104427412B (zh) | 一种带宽地图更新的方法及装置 | |
CN106209294B (zh) | 一种高扩展的数据中心全光互连网络系统及通信方法 | |
Nooruzzaman et al. | Hyperscale data center networks with Transparent HyperX architecture | |
Tang et al. | Effectively reconfigure the optical circuit switching layer topology in data center network by OCBridge | |
CN106789750B (zh) | 一种高性能计算互连网络系统及通信方法 | |
Barry et al. | Optical switching in datacenters: architectures based on optical circuit switching | |
Liu et al. | WRH-ONoC: A wavelength-reused hierarchical architecture for optical network on chips | |
Wang et al. | Large-scale hybrid electronic/optical switching networks for datacenters and HPC systems | |
Shu et al. | Programmable OPS/OCS hybrid data centre network | |
Tao et al. | Reconfigurable optical crosshaul architecture for 6G radio access networks | |
Zhao et al. | Dragonfly-of-torus: A reconfigurable network topology for high-performance computing | |
Wang et al. | Computing-aware proactive IP-optical integrated network restructuring for edge computing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |