CN104579786B - 一种基于2D Torus网络拓扑架构的服务器设计方法 - Google Patents

一种基于2D Torus网络拓扑架构的服务器设计方法 Download PDF

Info

Publication number
CN104579786B
CN104579786B CN201510027196.8A CN201510027196A CN104579786B CN 104579786 B CN104579786 B CN 104579786B CN 201510027196 A CN201510027196 A CN 201510027196A CN 104579786 B CN104579786 B CN 104579786B
Authority
CN
China
Prior art keywords
node
calculate node
rio
unit
calculate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510027196.8A
Other languages
English (en)
Other versions
CN104579786A (zh
Inventor
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Langchao Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Langchao Electronic Information Industry Co Ltd filed Critical Langchao Electronic Information Industry Co Ltd
Priority to CN201510027196.8A priority Critical patent/CN104579786B/zh
Publication of CN104579786A publication Critical patent/CN104579786A/zh
Application granted granted Critical
Publication of CN104579786B publication Critical patent/CN104579786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种基于融合和2D Torus网络拓扑架构的服务器设计方法,在基于2D Torus网络拓扑的新型服务器系统架构中,计算节点间通过基于2D Torus网络拓扑进行互联,互联后每个计算节点分别由5条链路与系统中的其他相邻节点进行互联,这样不但降低了节点间访问的传输时延,而且增强了节点间互联的冗余度,有效避免当出现单个节点故障后,造成其他节点将无法访问到与故障节点单元相连接的其他节点单元,不会影响整个计算机系统的连通性和稳定性。

Description

一种基于2D Torus网络拓扑架构的服务器设计方法
技术领域
本发明涉及新型服务器设计技术领域,具体地说是一种基于2D Torus网络拓扑架构的服务器设计方法。
背景技术
随着网络数据量的爆炸式增长,对大规模并行计算和分布式网络计算有这巨大的需求。2D Torus作为一种网络拓扑,不但降低了网络中节点间访问的传输时延,而且增强了节点间互联的冗余度,有效避免当出现单个节点故障后,造成其他节点将无法访问到与故障节点单元相连接的其他节点单元,不会影响整个网络传输连通性和稳定性。
传统的服务器体系在互连架构方面存在着下面的限制:目前的计算机体系架构中,节点单元间互联时往往采用1~2条单一的互联通路,这种设计增强了系统中的孤岛效应,如果单个节点单元遇到故障,其他节点将无法访问到与故障节点单元相连接的其他节点单元,会影响整个计算机系统的连通性和稳定性。同时目前计算机体系的扩展性存在局限,在现有架构下多采用松耦合式的互连方式,这种松耦合式的互连方式存在两方面的弊端,一方面增加多节点单元间通讯的延时、节点间冗余度低,另一方面无法做到灵活和大规模话的扩展。
发明内容
本发明的目的是提供一种基于2D Torus网络拓扑架构的服务器设计方法。
本发明的目的是按以下方式实现的,由计算节点、交换模块和管理模块三部分组成,其中,计算节点作为系统中的处理单元,计算节点间通过基于2D Torus网络拓扑进行互联,互联后每个计算节点分别由5条链路与系统中的其他相邻的计算节点进行互联;
交换模块用来实现系统内计算节点与系统外部设备间的通信,系统中的每个计算节点通过2条1Gb的链路分别连接系统中的两个交换模块;
管理模块作为整个系统中的管理中心,系统中的每个计算节点通过2条1Gb的链路分别连接系统中的两个管理模块,管理模块作为整个系统中的管理中心,提供对所有计算节点、交换模块工作及运行状态的监控。
两个计算节点在两个不同的平面内,每个计算节点会对外引出5条扩展链路,每条链路的带宽为10Gb/s,其中四条链路分别用来连接与计算节点自身在同一平面内相邻的计算节点;第五条链路用于与不同平面间两个计算节点间的互联。
计算节点由信息处理单元、信息存储单元、网络控制单元、磁盘储存单元、PCIe至S-RIO转换单元和PS-RIO交换单元6部分组成,其中,
信息处理单元可以选用X86、ARM或FPGA等通用的处理器来构建面向不同应用的计算节点;
信息存储单元与信息处理单元间通过SMI链路进行连接,信息存储单元为信息处理单元提供运算所需的数据和存放计算处理后的数据与指令;
网络控制单元主要实现计算节点与系统中管理模块间实现信息的交互,网络控制单元与信息处理单元间通过PCIe x4的链路进行连接,网络控制单元选用业界通用的Intel、Brodcom或其他公司标准的网络适配器;
磁盘存储单元通过SATA链路与信息处理单元连接,磁盘存储单元中支持1个2.5寸的磁盘,用来存放大容量的数据以及存放操作系统;
PCIe至S-RIO转换单元,采用IDT公司的芯片实现将由信息处理单元传送来的x4的PCIe信号转换为S-RIO;
PS-RIO交换单元,采用IDT公司的CPS-1848交换芯片,用于接收到由PCIe至S-RIO转换单元发来的1组S-RIO信号后,转换成24组S-RIO信号,其中有8组S-RIO信号连接系统中的网络交换模块,用于系统内计算节点与系统外部设备间的通信,剩余的16组S-RIO信号用于连接系统中相邻的计算节点,组成基于2D Torus拓扑的互联网络。
本发明的有益效果是:
1、在业界中首次将2D Torus的网络拓扑用在计算机体系互联架构中;
2、新的架构克服了目前计算机体系松耦合互联架构,在节点间互联时存在的传输延时高和冗余度低的弊端;
3、在2D Torus架构下可以实现节点的灵活和大规模化的扩展,教目前计算机体系架构项目进一步增强了计算机体系的扩展性能
在基于2D Torus网络拓扑的新型服务器系统架构中,计算节点间通过基于2DTorus网络拓扑进行互联,互联后每个计算节点分别由5条链路与系统中的其他相邻节点进行互联,这样不但降低了节点间访问的传输时延,而且增强了节点间互联的冗余度,有效避免当出现单个节点故障后,造成其他节点将无法访问到与故障节点单元相连接的其他节点单元,不会影响整个计算机系统的连通性和稳定性。
附图说明
图1是基于2D Torus网络拓扑的新型服务器架构图;
图2是新架构中双节点互联图;
图3是基于2D Torus拓扑的节点间互联框图;
图4是新结构中数据交换网络互联拓扑图;
图5是新结构中管理网络互联拓扑图;
图6是新结构中节点原理框图。
具体实施方式
参照说明书附图对本发明的方法作以下详细地说明。
本发明的一种基于2D Torus网络拓扑架构的服务器设计方法,入图1所示,基于2DTorus网络拓扑的新型服务器架构,主要由节点、交换模块和管理模块三部分组成,其中节点主要作为系统中的处理单元,可以选用X86、ARM或FPGA等通用的处理器来构建面向不同应用的计算节点,计算节点间通过基于2D Torus网络拓扑进行互联,互联后每个计算节点分别由5条链路与系统中的其他相邻节点进行互联,这样不但降低了节点间访问的传输时延,而且增强了节点间互联的冗余度,有效避免当出现单个节点故障后,造成其他节点将无法访问到与故障节点单元相连接的其他节点单元,不会影响整个计算机系统的连通性和稳定性。交换模块主要用来实现系统内节点与系统外部设备间的通信,系统中的每个节点通过2条1Gb的链路分别连接系统中的两个交换模块。管理模块作为整个系统中的管理中心,提供对所有节点、交换模块工作及运行状态的监控。
图2所示,新架构中双节点互联图中有两个计算节点,此两个计算节点在两个不同的平面内,图中每个计算节点会对外引出5条扩展链路,每条链路的带宽为10Gb/s,其中四条链路分别用来连接与计算节点自身在同一平面内相邻的节点;一条链路用于实现不同平面间两个节点间的互联。
图3是根据图2两节点互联的方式扩展到多节点互联时的拓扑图,其中一个节点在一个平面内,相邻的计算节点在另一个平面内,两个平面间的计算节点均通过链路进行连接。
通过这种基于2D Torus网络拓扑将系统中的所有计算节点进行互联后,不但降低了节点间访问的传输时延,而且增强了节点间互联的冗余度,有效避免当出现单个节点故障后,造成其他节点将无法访问到与故障节点单元相连接的其他节点单元,不会影响整个计算机系统的连通性和稳定性,同时这种架构具有灵活的扩展性,理论上只要不受系统物理尺寸限制,架构中的计算节点可以无限的进行扩展,新的架构特别适合目前大规模并行计算和分布式应用的需求。
图4为新结构中数据交换网络互联拓扑图,交换模块主要用来实现系统内计算节点与系统外部设备间的通信,系统中的每个计算节点通过2条1Gb的链路分别连接系统中的两个交换模块,提高交换网络的冗余度。
图5为新结构中管理网络互联拓扑图,系统中的每个计算节点通过2条1Gb的链路分别连接系统中的两个管理模块,管理模块作为整个系统中的管理中心,提供对所有计算节点、交换模块工作及运行状态的监控。
图6.为新结构中节点原理框图,节点主要由信息处理单元、信息存储单元、网络控制单元、磁盘储存单元、PCIe至S-RIO转换单元和PS-RIO交换单元6部分组成。其中信息处理单元可以选用X86、ARM或FPGA等通用的处理器来构建面向不同应用的计算节点;信息存储单元与信息处理单元间通过SMI链路进行连接,信息存储单元主要为信息处理单元提供运算所需的数据和存放计算处理后的数据与指令。网络控制单元主要实现计算节点与系统中管理模块间实现信息的交互,网络控制单元与信息处理单元间通过PCIe x4的链路进行连接,网络控制单元可以选用业界通用的Intel、Brodcom或其他公司标准的网络适配器;磁盘存储单元通过SATA链路与信息处理单元连接,磁盘存储单元中可以支持1个2.5寸的磁盘,主要用来存放大容量的数据以及存放操作系统;PCIe至S-RIO转换单元,采用IDT公司的芯片实现将由信息处理单元传送来的x4的PCIe信号转换为S-RIO;PS-RIO交换,采用IDT公司的CPS-1848交换芯片,主要实现接收到由PCIe至S-RIO转换单元发来的1组S-RIO信号后,转换成24组S-RIO信号,其中有8组S-RIO信号连接系统中的网络交换模块,实现实现系统内计算节点与系统外部设备间的通信,剩余的16组S-RIO信号用于连接系统中相邻的计算节点,组成基于2D Torus拓扑的互联网络。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1.一种基于2D Torus网络拓扑架构的服务器设计方法, 其特征在于该架构由计算节点、交换模块和管理模块三部分组成,其中计算节点间通过基于2D Torus网络拓扑进行互联,每个计算节点分别由5条链路与系统中的其他相邻的计算节点进行互联;
交换模块用来实现系统内计算节点与系统外部设备间的通信,系统中的每个计算节点通过2条1Gb的链路分别连接系统中的两个交换模块;
管理模块作为整个系统中的管理中心,系统中的每个计算节点通过2条1Gb的链路分别连接系统中的两个管理模块,管理模块提供对所有计算节点、交换模块工作及运行状态的监控;
每个计算节点会对外引出5条扩展链路,每条链路的带宽为10Gb/s,其中4条链路分别用来连接与计算节点自身在同一平面内相邻的计算节点;第5条链路用于与不同平面间计算节点的互联;
计算节点由信息处理单元、信息存储单元、网络控制单元、磁盘存储单元、PCIe至S-RIO转换单元和PS-RIO交换单元6部分组成,其中:
信息处理单元选用通用的处理器来构建面向不同应用的计算节点;
信息存储单元与信息处理单元间通过SMI链路进行连接,信息存储单元为信息处理单元提供运算所需的数据和存放计算处理后的数据与指令;
网络控制单元实现计算节点与系统中管理模块间信息的交互,网络控制单元与信息处理单元间通过PCIe x4的链路进行连接,网络控制单元选用通用的网络适配器;
磁盘存储单元通过SATA链路与信息处理单元连接,磁盘存储单元中支持1个2.5寸的磁盘,用来存放大容量的数据以及存放操作系统;
PCIe至S-RIO转换单元,采用IDT公司的芯片实现将由信息处理单元传送来的x4的PCIe信号转换为S-RIO;
PS-RIO交换单元,采用IDT公司的CPS-1848交换芯片,用于接收到由PCIe至S-RIO转换单元发来的1组S-RIO信号后,转换成24组S-RIO信号,其中有8组S-RIO信号连接系统中的交换模块,用于系统内计算节点与系统外部设备间的通信,剩余的16组S-RIO信号用于连接系统中相邻的计算节点,组成基于2D Torus网络拓扑的互联网络。
CN201510027196.8A 2015-01-20 2015-01-20 一种基于2D Torus网络拓扑架构的服务器设计方法 Active CN104579786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510027196.8A CN104579786B (zh) 2015-01-20 2015-01-20 一种基于2D Torus网络拓扑架构的服务器设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510027196.8A CN104579786B (zh) 2015-01-20 2015-01-20 一种基于2D Torus网络拓扑架构的服务器设计方法

Publications (2)

Publication Number Publication Date
CN104579786A CN104579786A (zh) 2015-04-29
CN104579786B true CN104579786B (zh) 2017-11-03

Family

ID=53095051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510027196.8A Active CN104579786B (zh) 2015-01-20 2015-01-20 一种基于2D Torus网络拓扑架构的服务器设计方法

Country Status (1)

Country Link
CN (1) CN104579786B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9690734B2 (en) 2014-09-10 2017-06-27 Arjun Kapoor Quasi-optimized interconnection network for, and method of, interconnecting nodes in large-scale, parallel systems
CN107102961A (zh) * 2017-04-26 2017-08-29 济南浪潮高新科技投资发展有限公司 加速arm处理器并行工作的方法及系统
CN107391428B (zh) * 2017-07-31 2024-02-13 郑州云海信息技术有限公司 一种新型架构四路服务器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103124420A (zh) * 2013-01-21 2013-05-29 电子科技大学 一种无线片上网络架构方法
CN104065664A (zh) * 2014-07-01 2014-09-24 曙光信息产业(北京)有限公司 一种云服务器验证系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9153539B2 (en) * 2013-03-15 2015-10-06 Nvidia Corporation Ground-referenced single-ended signaling connected graphics processing unit multi-chip module

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103124420A (zh) * 2013-01-21 2013-05-29 电子科技大学 一种无线片上网络架构方法
CN104065664A (zh) * 2014-07-01 2014-09-24 曙光信息产业(北京)有限公司 一种云服务器验证系统

Also Published As

Publication number Publication date
CN104579786A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
US9880972B2 (en) Computer subsystem and computer system with composite nodes in an interconnection structure
CN102387084B (zh) 基于RapidIO协议包交换的系统结构
CN110033078B (zh) 一种基于树状拓扑的计算系统及方法
EP2688243B1 (en) 50 Gb/s ethernet using serializer/deserializer lanes
US20160335209A1 (en) High-speed data transmission using pcie protocol
CN106713184A (zh) 一种双冗余数据交换装置
CN102929363B (zh) 一种高密度刀片服务器的设计方法
CN104579786B (zh) 一种基于2D Torus网络拓扑架构的服务器设计方法
US20160292115A1 (en) Methods and Apparatus for IO, Processing and Memory Bandwidth Optimization for Analytics Systems
CN105867072A (zh) 一种基于vme-s总线的工件台运动控制系统
CN103336756B (zh) 一种数据计算节点的生成装置
CN104408014A (zh) 一种计算系统之间处理单元互连的系统及方法
CN105099776A (zh) 云服务器的管理系统
CN104461396B (zh) 一种基于融合架构的分布式存储扩展架构
CN111193971B (zh) 一种面向机器学习的分布式计算互连网络系统及通信方法
CN104750581A (zh) 一种冗余互连的内存共享的服务器系统
CN104580527B (zh) 一种面向云服务器应用的多i/o高密度多节点服务器系统设计方法
CN105763488A (zh) 数据中心汇聚核心交换机及其背板
CN104898775A (zh) 计算装置、存储装置、网络交换设备及计算机体系架构
Ueno et al. Virtual circuit-switching network with flexible topology for high-performance fpga cluster
CN105589830B (zh) 一种刀片式服务器架构
CN207070081U (zh) 一种双冗余数据交换装置
CN105426120A (zh) 一种基于nvme的混合加速系统
CN102724095A (zh) 一种基于交换芯片的12路srio数据总线拓扑结构设计方法
CN106095720A (zh) 一种多路计算机系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant