CN102929363A - 一种高密度刀片服务器的设计方法 - Google Patents

一种高密度刀片服务器的设计方法 Download PDF

Info

Publication number
CN102929363A
CN102929363A CN2012104116629A CN201210411662A CN102929363A CN 102929363 A CN102929363 A CN 102929363A CN 2012104116629 A CN2012104116629 A CN 2012104116629A CN 201210411662 A CN201210411662 A CN 201210411662A CN 102929363 A CN102929363 A CN 102929363A
Authority
CN
China
Prior art keywords
unit
speed
high speed
data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104116629A
Other languages
English (en)
Other versions
CN102929363B (zh
Inventor
王磊
王守昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201210411662.9A priority Critical patent/CN102929363B/zh
Publication of CN102929363A publication Critical patent/CN102929363A/zh
Application granted granted Critical
Publication of CN102929363B publication Critical patent/CN102929363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种高密度刀片服务器的设计方法,该方法区别于传统的以处理器为中心的刀片服务器体系结构,是一种即能支持高速协处理器,又同时具备支持本地数据存储及丰富I/O扩展功能的高密度刀片服务器体系架构设计,在新的体系结构中,打破了原有刀片服务器体系架构只以通用处理器单元为中心并且I/O扩展性差的限制,通过创新设计基于通用处理器的高速转换模块作为通用处理单元与高速协处理器及I/O扩展单元之间的转换桥梁,可以在统一的体系架构中不但实现支持高速协处理器,以大幅度提升单个刀片服务器自身的信息及运算处理能力,避免原有服务器架构中通用处理器浮点运算能力低的问题。

Description

一种高密度刀片服务器的设计方法
技术领域
本发明涉及计算机通信领域,具体涉及一种支持高速协处理器、本地存储及IO扩展的高密度刀片服务器系统的设计方法。
背景技术
高性能计算技术的发展是伴随着计算机技术的发展而发展的,也就是说,从计算机技术诞生之日起,人们就在为追求更高计算能力的计算机系统而努力。在过去几十年间,可以说是高性能计算机体系结构和通信技术不断创新的年代,出现了包括MPP、SMP、集群等各种各样的体系结构及网络互联技术。尤其是最近几年,集群技术发展迅速,已经成为构建超级计算机系统的主流架构之一。
GPU 计算是指把图形处理器 (GPU) 用作协处理器来为 CPU 加速,从而为通用科学和工程计算服务。一颗 CPU 包含四到八个 CPU 核心,而一颗 GPU却包含数百个尺寸更小的核心。它们在应用程序中共同处理数据。 正是这种大规模并行架构让 GPU 能够拥有极高的计算性能。GPU 计算是指把图形处理器 (GPU) 用作协处理器来为 CPU 加速,从而为通用科学和工程计算服务。GPU 通过承担部分运算量繁重且耗时的代码,从而为那些在 CPU 上运行的应用程序加速。应用程序的剩余部分仍然交由 CPU 处理。 从用户的角度来看,应用程序之所以能更快速地运行是因为使用了 GPU 的大规模并行处理能力来提升性能。 这种方式就叫做「 异构」或「 混合型」计算。
目前刀片服务器产品由于计算节点密度大、集成管理、交换等应用的特点成为搭建高性能集群的首先硬件平台。然而,在日益增长的高性能商业计算应用领域中,对系统的计算能力和扩展性提出了更高的要求,但现有刀片服务器体系结构受制于空间限制只以通用处理器单元为中心并且I/O扩展性差,在现有刀片服务器系统体系结构的基础上,提出一种支持高速协处理器、本地存储及IO扩展的高密度刀片服务器架构设计。
发明内容
本发明的目的是提供一种高密度刀片服务器的设计方法。
本发明的目的是按以下方式实现的,该系统包括:计算处理单元、信息存储单元、高速转换单元、磁盘通信单元、信息控制/传输单元、网络通信单元、高速数据传输单元、平台监控管理单元、电源控制单元和对外互联单元其中:
计算处理单元,主要采用业界通用的处理器设备,负责平台基本数据的运算、控制信息的分析及处理、控制命令的接收及发布,计算处理器单元间通过传输速率高达8.0GT/s高速的QPI传输链路实现两个计算处里单元间信息的共享、通讯及处理;
信息存储单元,直接与计算处理器单元通信,每个计算处理单元都具备独立的4个信息存书单元,每个信息存储单元最大能可设计支持3个信息扩展模块,每个信息扩展模块能支持业界通用的容量为8GB、16GB以及32GB的内存储模组,信息存储单元作为计算处理单元的信息及数据存储仓库;
高速转换单元,在整个体系架构中起着重要的作用,高速转换单元作为通用处理单元与高速协处理器及I/O扩展单元之间的转换桥梁,直接与每个通用计算处里单元连接,为计算处里单元提供双向32GB/s的通讯带宽,通过高速转换单元平台支持高速协处理器,计算单元将计算数据和任务通过高速转换单元传送到高速协处理器,利用高速协处理器计算核心多、计算频率高的特点处理复杂及大数据量得数据,最终运算完成得数据高速协处理器又通过高速转换单元传往通用处理器,同时通过高速转换模块,系统还支持通用的基于PCIe传输信道的I/O扩展设备,不但支持像无限宽带Infiniband、万兆以太网这样偏重高速运算的应用需求,还满足SATA、SAS及FC这种偏重数据存储应用的需求;
磁盘通信单元,提供本地数据的存储,主要存放通常计算处里单元访问频率不高的数据,磁盘通信单元为本地数据的储存提供6Gb/s的传输链路,磁盘通信单元采用基于灵活配置的设计方案,根据系统的需求进行独立的安装与拆卸,当使用高速协处理器时,系统面向高性能的数据传输应用,数据直接通过高速数据传输单元与外界系统交互,因此系统将不提供对磁盘通信单元的支持;当使用I/O扩展单元时,系统将提供对磁盘通讯单元的支持,用于低速数据的存储;
信息控制/传输单元,作为整个平台的传输控制中枢,负责计算处理单元与磁盘通信单元、网络通信单元、高速数据传输单元、平台监控管理单元间的通信;
网络通信单元与高速数据传输单元,作为整个平台与外部系统的通信桥梁,负责将平台的数据传送的外界平台以及接收外界平台发送的数据及运算任务;其中网络通信单元采用基于以太网作为通讯通路,提供两条1Gb/s的传输链路;高速数据传输单元采用基于无限宽带Infiniband作为高速通讯通路,具备高带宽和低传输延时的特点,提供56Gb/s的高速传输链路,当系统面向高性能的数据传输应用时,为高速协处理单元和通用计算单元提供一条与外界高速数据传输的通路;
平台监控管理单元,负责对信息处理单元、高速信息交换单元、IO扩展模块等系统中各模块状态的监控和配置管理;
高运算性的实现步骤如下: 在支持通用处理单元的基础上,设计高速转换模块通过PCIe3.0总线直接与每个通用计算处里单元连接,为计算处里单元提供双向32GB/s的通讯带宽,使平台支持高速的协处理器,通过扩展支持协处理器平台可以提供每秒1.2万亿次的浮点运算能力;
高可扩展的实现步骤如下:高速转换模块将原有的高速协处理单元换成基于PCI-E总线的IO扩展单元,为信息处理单元方便的进行IO方面的扩展,包括HCA卡、SAS RAID卡、万兆光纤网卡、图形处理卡,从而提高系统整体的可扩展性。
本发明的有益效果是:本发明区别于传统的以处理器为中心的刀片服务器体系结构,提出一种即能支持高速协处理器,又同时具备支持本地数据存储及丰富I/O扩展功能的高密度刀片服务器体系架构设计,在新的体系结构中,打破了原有刀片服务器体系架构只以通用处理器单元为中心并且I/O扩展性差的限制,通过创新设计基于通用处理器的高速转换模块作为通用处理单元与高速协处理器及I/O扩展单元之间的转换桥梁,可以在统一的体系架构中不但实现支持高速协处理器,以大幅度提升单个刀片服务器自身的信息及运算处理能力,避免原有服务器架构中通用处理器浮点运算能力低的问题。
在整个体系架构中还单独设计了高速数据传输单元为配合高速协处理器的使用。同时系统还可以支持通用的基于PCIe传输信道的I/O扩展设备,使新的刀片服务器体系架构具备很强的扩展性,不但可以支持像无限宽带Infiniband、万兆以太网这样偏重高速运算的应用需求,还可以满足SATA、SAS及FC这种偏重数据存储应用的需求,完全突破了原有刀片服务器架构受空间限制的难题,提出全新支持高速新处理器、本次存储及I/O扩展的告密度刀片服务器架构体系,通过创新设计基于通用处理器的高速转换模块作为通用处理单元与高速协处理器及I/O扩展单元之间的转换桥梁,可以在统一的体系结构中实现对高速协处理器与I/O扩展功能的支持,使整个刀片服务器平台的运算性能、扩展性和适应性同时得到了大幅度的提升,使其更适用于复杂的高性能运算及商业应用领域,因而具有非常广阔的发展前景。
附图说明
  图1是支持高速协处理器、磁盘存储及I/O扩展的高密度刀片服务器结构原理图;
图2是高速转换模块与计算单元通讯原理图。
具体实施方式
下面参照附图,对本发明的内容以具体实例来描述实现这一体系结构的过程。
正如发明内容中所描述的,本发明体系结构主要包括:计算处理单元、信息存储单元、高速转换单元、磁盘通信单元、信息控制/传输单元、网络通信单元、高速数据传输单元、平台监控管理单元、电源控制单元和对外互联单元。
计算处理单元基于通用的计算机体系架构,主要采用基于Intel Xeon处理器及相应芯片组构建处理单元计算平台;
高速转换单元,采用可热插拔的模块板卡设计,高速转换单元作为通用处理单元与高速协处理器及I/O扩展单元之间的转换桥梁,通过PCIe3.0总线直接与每个通用计算处里单元连接,为计算处里单元提供双向32GB/s的通讯带宽。
协处理器模块,基于Nvidia Tesla和Intel MIC协助里模块,单个高速协处理模块可以提供每秒6000亿次的浮点运算能力,同时通过I/O扩展模块可以为信息处理单元方便的进行IO放面的扩展,例如HCA卡、SAS RAID卡、万兆光纤网卡、图形处理卡。
网络通信单元基于目前通用的以太网传输技术设计,采用业界通用的以太网交换解决方案,提供两条千兆1Gb/s的传输通路通过对外互联单元与外界通讯,在处理单元与通讯单元进行数据通信时,负责数据包的转换,把以太网包格式转换成处理单元本地协议可识别的包格式。
高速数据传输单元采用可热插拔的模块板卡设计,基于Mellanox公司的ConnectX3芯片作为主传输交换芯片设计方案,为高速协处理单元和通用计算单元提供一条56Gb/s的高速传输链路与外界通讯。
平台监控管理单元采用基于标准的计算机管理总线设计,可以对信息处理单元、高速信息交换单元、通讯转换单元的状况进行监督,并可对上述单元进行配置和基于预定策略的管理。
本发明的即能支持高速协处理器,又同时具备支持本地数据存储及丰富I/O扩展功能的高密度刀片服务器体系架构设计方法,可以在统一的体系结构中实现对高速协处理器与I/O扩展功能的支持,使整个刀片服务器平台的运算性能、扩展性和适应性同时得到了大幅度的提升。本系统可以在一个统一的系统体系架构内实现基于运算密集型应用与商用I/O扩展应用的互换。
与传统的刀片服务器体系结构相比,这种新型的体系结构打破了原有体系架构只以通用处理器单元为中心并且I/O扩展性差的限制,具有高运算性能、高可扩展,以及基于模块化部件灵活配置等特性。
其中,高运算性的实现方式描述如下: 在支持通用处理单元的基础上,设计高速转换模块通过PCIe3.0总线直接与每个通用计算处里单元连接,为计算处里单元提供双向32GB/s的通讯带宽,使平台可以支持高速的协处理器,通过扩展支持协处理器平台可以提供每秒1.2万亿次的浮点运算能力。
高可扩展的实现方式描述如下:在这种新型体系结构中,可以高速转换模块将原有的高速协处理单元换成基于PCI-E总线的IO扩展单元,可以为信息处理单元方便的进行IO放面的扩展,例如HCA卡、SAS RAID卡、万兆光纤网卡、图形处理卡,从而提高系统整体的可扩展性。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。                                                                                          

Claims (1)

1. 一种高密度刀片服务器的设计方法, 其特征在于该系统包括:计算处理单元、信息存储单元、高速转换单元、磁盘通信单元、信息控制/传输单元、网络通信单元、高速数据传输单元、平台监控管理单元、电源控制单元和对外互联单元其中:
计算处理单元,主要采用业界通用的处理器设备,负责平台基本数据的运算、控制信息的分析及处理、控制命令的接收及发布,计算处理器单元间通过传输速率高达8.0GT/s高速的QPI传输链路实现两个计算处里单元间信息的共享、通讯及处理;
信息存储单元,直接与计算处理器单元通信,每个计算处理单元都具备独立的4个信息存书单元,每个信息存储单元最大能可设计支持3个信息扩展模块,每个信息扩展模块能支持业界通用的容量为8GB、16GB以及32GB的内存储模组,信息存储单元作为计算处理单元的信息及数据存储仓库;
高速转换单元,在整个体系架构中起着重要的作用,高速转换单元作为通用处理单元与高速协处理器及I/O扩展单元之间的转换桥梁,直接与每个通用计算处里单元连接,为计算处里单元提供双向32GB/s的通讯带宽,通过高速转换单元平台支持高速协处理器,计算单元将计算数据和任务通过高速转换单元传送到高速协处理器,利用高速协处理器计算核心多、计算频率高的特点处理复杂及大数据量得数据,最终运算完成得数据高速协处理器又通过高速转换单元传往通用处理器,同时通过高速转换模块,系统还支持通用的基于PCIe传输信道的I/O扩展设备,不但支持像Infiniband、万兆以太网这样偏重高速运算的应用需求,还满足SATA、SAS及FC这种偏重数据存储应用的需求;
磁盘通信单元,提供本地数据的存储,主要存放通常计算处里单元访问频率不高的数据,磁盘通信单元为本地数据的储存提供6Gb/s的传输链路,磁盘通信单元采用基于灵活配置的设计方案,根据系统的需求进行独立的安装与拆卸,当使用高速协处理器时,系统面向高性能的数据传输应用,数据直接通过高速数据传输单元与外界系统交互,因此系统将不提供对磁盘通信单元的支持;当使用I/O扩展单元时,系统将提供对磁盘通讯单元的支持,用于低速数据的存储;
信息控制/传输单元,作为整个平台的传输控制中枢,负责计算处理单元与磁盘通信单元、网络通信单元、高速数据传输单元、平台监控管理单元间的通信;
网络通信单元与高速数据传输单元,作为整个平台与外部系统的通信桥梁,负责将平台的数据传送的外界平台以及接收外界平台发送的数据及运算任务;其中网络通信单元采用基于以太网作为通讯通路,提供两条1Gb/s的传输链路;高速数据传输单元采用基于Infiniband作为高速通讯通路,具备高带宽和低传输延时的特点,提供56Gb/s的高速传输链路,当系统面向高性能的数据传输应用时,为高速协处理单元和通用计算单元提供一条与外界高速数据传输的通路;
平台监控管理单元,负责对信息处理单元、高速信息交换单元、IO扩展模块等系统中各模块状态的监控和配置管理;
高运算性的实现步骤如下: 在支持通用处理单元的基础上,设计高速转换模块通过PCIe3.0总线直接与每个通用计算处里单元连接,为计算处里单元提供双向32GB/s的通讯带宽,使平台支持高速的协处理器,通过扩展支持协处理器平台可以提供每秒1.2万亿次的浮点运算能力;
高可扩展的实现步骤如下:高速转换模块将原有的高速协处理单元换成基于PCI-E总线的IO扩展单元,为信息处理单元方便的进行IO方面的扩展,包括HCA卡、SAS RAID卡、万兆光纤网卡、图形处理卡,从而提高系统整体的可扩展性。
CN201210411662.9A 2012-10-25 2012-10-25 一种高密度刀片服务器的设计方法 Active CN102929363B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210411662.9A CN102929363B (zh) 2012-10-25 2012-10-25 一种高密度刀片服务器的设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210411662.9A CN102929363B (zh) 2012-10-25 2012-10-25 一种高密度刀片服务器的设计方法

Publications (2)

Publication Number Publication Date
CN102929363A true CN102929363A (zh) 2013-02-13
CN102929363B CN102929363B (zh) 2016-08-31

Family

ID=47644189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210411662.9A Active CN102929363B (zh) 2012-10-25 2012-10-25 一种高密度刀片服务器的设计方法

Country Status (1)

Country Link
CN (1) CN102929363B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103595541A (zh) * 2013-11-01 2014-02-19 浪潮电子信息产业股份有限公司 一种外插网卡实现带外管理的设计方法
CN103984394A (zh) * 2014-05-08 2014-08-13 浪潮电子信息产业股份有限公司 一种高密度、节能刀片服务器系统
CN104035524A (zh) * 2014-06-23 2014-09-10 浪潮(北京)电子信息产业有限公司 一种冷存储服务器
CN104991614A (zh) * 2015-06-16 2015-10-21 山东超越数控电子有限公司 一种加固模块化服务器
CN105005361A (zh) * 2015-07-01 2015-10-28 浪潮电子信息产业股份有限公司 一种面向高性能计算的新型处理单元及计算机体系架构
CN105589830A (zh) * 2015-12-28 2016-05-18 浪潮(北京)电子信息产业有限公司 一种刀片式服务器架构
CN106201983A (zh) * 2016-07-15 2016-12-07 浪潮(北京)电子信息产业有限公司 一种计算机系统架构
CN104035731B (zh) * 2014-06-16 2017-02-15 浪潮(北京)电子信息产业有限公司 一种刀片式服务器的存储头结点

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060265449A1 (en) * 2005-04-28 2006-11-23 Satoru Uemura Blade server system
CN1869869A (zh) * 2005-05-24 2006-11-29 英业达股份有限公司 刀片服务器系统
CN101059792A (zh) * 2006-12-30 2007-10-24 曙光信息产业(北京)有限公司 一种对称多处理器刀片服务器
US7483974B2 (en) * 2003-09-24 2009-01-27 Intel Corporation Virtual management controller to coordinate processing blade management in a blade server environment
CN102073356A (zh) * 2010-12-10 2011-05-25 曙光信息产业(北京)有限公司 刀片服务器的io扩展模块、设有该模块的刀片及服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7483974B2 (en) * 2003-09-24 2009-01-27 Intel Corporation Virtual management controller to coordinate processing blade management in a blade server environment
US20060265449A1 (en) * 2005-04-28 2006-11-23 Satoru Uemura Blade server system
CN1869869A (zh) * 2005-05-24 2006-11-29 英业达股份有限公司 刀片服务器系统
CN101059792A (zh) * 2006-12-30 2007-10-24 曙光信息产业(北京)有限公司 一种对称多处理器刀片服务器
CN102073356A (zh) * 2010-12-10 2011-05-25 曙光信息产业(北京)有限公司 刀片服务器的io扩展模块、设有该模块的刀片及服务器

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103595541A (zh) * 2013-11-01 2014-02-19 浪潮电子信息产业股份有限公司 一种外插网卡实现带外管理的设计方法
CN103984394A (zh) * 2014-05-08 2014-08-13 浪潮电子信息产业股份有限公司 一种高密度、节能刀片服务器系统
CN104035731B (zh) * 2014-06-16 2017-02-15 浪潮(北京)电子信息产业有限公司 一种刀片式服务器的存储头结点
CN104035524A (zh) * 2014-06-23 2014-09-10 浪潮(北京)电子信息产业有限公司 一种冷存储服务器
CN104035524B (zh) * 2014-06-23 2017-11-10 浪潮(北京)电子信息产业有限公司 一种冷存储服务器
CN104991614A (zh) * 2015-06-16 2015-10-21 山东超越数控电子有限公司 一种加固模块化服务器
CN105005361A (zh) * 2015-07-01 2015-10-28 浪潮电子信息产业股份有限公司 一种面向高性能计算的新型处理单元及计算机体系架构
CN105589830A (zh) * 2015-12-28 2016-05-18 浪潮(北京)电子信息产业有限公司 一种刀片式服务器架构
CN105589830B (zh) * 2015-12-28 2018-12-25 浪潮(北京)电子信息产业有限公司 一种刀片式服务器架构
CN106201983A (zh) * 2016-07-15 2016-12-07 浪潮(北京)电子信息产业有限公司 一种计算机系统架构
CN106201983B (zh) * 2016-07-15 2019-04-23 浪潮(北京)电子信息产业有限公司 一种计算机系统

Also Published As

Publication number Publication date
CN102929363B (zh) 2016-08-31

Similar Documents

Publication Publication Date Title
CN102929363A (zh) 一种高密度刀片服务器的设计方法
TWI507867B (zh) 多計算節點之以單一微控制器爲基礎的管理技術
CN102710477B (zh) 一种基于vpx总线结构的数据处理系统
CN109242754B (zh) 一种基于OpenVPX平台的多GPU高性能处理系统
CN101594235B (zh) 一种基于smbus总线对刀片服务器进行管理的方法
CN103777716A (zh) 一种基于vpx总线的fmc结构3u通用载板
CN202309754U (zh) 高速信号数据处理系统
CN103116559B (zh) 一种高速互联服务器系统的设计方法
CN101969378B (zh) 基于交换机的可扩展dspeed-dsp_q6474信号处理板
EP3008608B1 (en) Collaboration server
CN204557308U (zh) 一种基于融合架构的高密度新型刀片型服务器
CN104461396A (zh) 一种基于融合架构的分布式存储扩展架构
CN204217080U (zh) 一种基于ppc处理器的音视频采集板
CN108334550A (zh) 一种基于人力资源管理系统的数据处理系统
CN104579786B (zh) 一种基于2D Torus网络拓扑架构的服务器设计方法
CN203561933U (zh) 一种基于vpx总线的fmc结构3u通用载板
CN101026575A (zh) 高可用、高可扩展的模块化网络服务器体系结构
US20090177832A1 (en) Parallel computer system and method for parallel processing of data
CN105589830B (zh) 一种刀片式服务器架构
CN103217681B (zh) 一种树形拓扑机构多处理器声纳信号处理的方法
RU167666U1 (ru) Процессорный модуль (MBE2S-PC)
CN214098424U (zh) 一种基于腾云s2500的双路服务器主板
CN203465722U (zh) 一种面向多尺度计算的计算机系统
CN113688093A (zh) 一种基于以太网控制器的智能网卡
CN102622328A (zh) 一种基于正交连接器的高速冗余服务器通信系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant