CN217587961U - 一种基于双路国产cpu的人工智能服务器硬件架构 - Google Patents

一种基于双路国产cpu的人工智能服务器硬件架构 Download PDF

Info

Publication number
CN217587961U
CN217587961U CN202221221460.3U CN202221221460U CN217587961U CN 217587961 U CN217587961 U CN 217587961U CN 202221221460 U CN202221221460 U CN 202221221460U CN 217587961 U CN217587961 U CN 217587961U
Authority
CN
China
Prior art keywords
controller
module
gpu
power supply
artificial intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202221221460.3U
Other languages
English (en)
Inventor
于天琦
陈艳飞
王谦
龚骁敏
孙涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 52 Research Institute
Original Assignee
CETC 52 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 52 Research Institute filed Critical CETC 52 Research Institute
Priority to CN202221221460.3U priority Critical patent/CN217587961U/zh
Application granted granted Critical
Publication of CN217587961U publication Critical patent/CN217587961U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)

Abstract

本实用新型公开了一种基于双路国产CPU的人工智能服务器硬件架构,包括安装在服务器机箱内的控制器、存储模块、散热模块、GPU模块和冗余电源;服务器机箱分为上下两层,服务器机箱的下层安装控制器和冗余电源,服务器机箱的上层依次安装存储模块、散热模块和GPU模块;控制器内含两颗国产CPU,控制器通过高速连接器与所述存储模块连接,控制器通过高速连接器与GPU模块连接通信,控制器和GPU模块均由冗余电源供电。本实用新型集成度高,计算性能优越。

Description

一种基于双路国产CPU的人工智能服务器硬件架构
技术领域
本实用新型属于人工智能服务器技术领域,具体涉及一种基于双路国产 CPU的人工智能服务器硬件架构。
背景技术
近年来,人工智能发展迅速,并与多种应用场景深度融合。人工智能是当前的热点,它的发展对计算能力提出了新的挑战。作为计算能力的主要提供者,面向人工智能的服务器技术成为关注的焦点。
但是,在基于国产CPU平台的人工智能服务器(AI服务器)的研发设计和应用上还处于起步阶段,特别是基于国产双路CPU的AI服务器硬件平台还处于相对不成熟阶段。相较于普通服务器,AI服务器不但要求能提供先进的算法和深度学习能力,同时对于整机的硬件处理计算能力、数据存储和处理能力、整机散热能力和稳定运转都有较高要求,否则不足以发挥AI服务器在深度学习算法和视觉识别上的优势。
实用新型内容
本实用新型的目的在于提供一种基于双路国产CPU的人工智能服务器硬件架构,集成度高,计算性能优越。
为实现上述目的,本实用新型所采取的技术方案为:
一种基于双路国产CPU的人工智能服务器硬件架构,所述基于双路国产 CPU的人工智能服务器硬件架构包括安装在服务器机箱内的控制器、存储模块、散热模块、GPU模块和冗余电源;
所述服务器机箱分为上下两层,所述服务器机箱的下层安装控制器和冗余电源,所述服务器机箱的上层依次安装存储模块、散热模块和GPU模块;
所述控制器内含两颗国产CPU,所述控制器通过高速连接器与所述存储模块连接,所述控制器通过高速连接器与所述GPU模块连接通信,所述控制器和 GPU模块均由所述冗余电源供电。
以下还提供了若干可选方式,但并不作为对上述总体方案的额外限定,仅仅是进一步的增补或优选,在没有技术或逻辑矛盾的前提下,各可选方式可单独针对上述总体方案进行组合,还可以是多个可选方式之间进行组合。
作为优选,所述冗余电源包括四个电源模块,其中每两个电源模块为一组,一组电源模块与所述控制器连接用于为控制器供电,另一组电源模块与所述 GPU模块连接用于为GPU模块供电。
作为优选,所述控制器上集成USB控制器、网络控制器、BMC控制器和 SATA控制器,用于提供控制器的对外接口。
作为优选,所述控制器的两颗国产CPU通过多层PCB层叠结构布线连接,所述控制器的对外接口基于多层PCB层叠结构分布。
作为优选,所述控制器的对外接口采用ESD防护措施,所述高速连接器采用EMC及EMI防护措施。
作为优选,所述控制器上集成磁盘控制器,所述存储模块提供硬盘盘位,所述控制器上的磁盘控制器将SAS信号通过高速线缆连接到存储模块的高速连接器,存储模块的高速连接器将SAS信号接到所述硬盘盘位上。
作为优选,所述硬盘盘位用于插入2.5寸SSD、2.5寸HDD或3.5寸HDD。
作为优选,所述GPU模块包括GPU卡载板和GPU卡,所述GPU卡载板上安装有与控制器连接的高速连接器,所述GPU卡载板上安装有与冗余电源连接的电源连接器,所述GPU卡载板上通过PCIE SWITCH提供多个用于插GPU 卡的PCIE插槽。
作为优选,所述GPU模块内具有两个高速连接器,每个高速连接器连接一个PCIESWITCH,并由PCIE SWITCH扩展输出五路PCIE信号分别连接至五个 PCIE插槽。
作为优选,所述散热模块包括一个或多个强制风冷风扇。
本实用新型提供的基于双路国产CPU的人工智能服务器硬件架构具有以下有益效果:(1)本实用新型的架构具备集成度高的特点;(2)本实用新型设计的控制器具有计算性能优越的特点,且操作简单,便于实施生产。
附图说明
图1为本实用新型的基于双路国产CPU的人工智能服务器硬件架构立体结构示意图;
图2为本实用新型的基于双路国产CPU的人工智能服务器硬件架构的结构连接示意图;
图3为本实用新型控制器结构示意图;
图4为本实用新型GPU模块结构示意图;
图5为本实用新型基于双路国产CPU的人工智能服务器硬件架构散热时气流方向示意图。
图示中:1、控制器;2、存储模块;3、散热模块;4、GPU模块;5、冗余电源。
具体实施方式
下面将结合本实用新型实施例中的附图,对本实用新型实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本实用新型一部分实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本实用新型保护的范围。
需要说明的是,当组件被称为与另一个组件“连接”时,它可以直接与另一个组件连接或者也可以存在居中的组件。除非另有定义,本文所使用的所有的技术和科学术语与属于本实用新型的技术领域的技术人员通常理解的含义相同。本文中在本实用新型的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本实用新型。
如图1所示,一种基于国产双路CPU的人工智能服务器硬件架构的机箱中包含控制器1、存储模块2、GPU模块4、散热模块3和冗余电源5五部分组成,将机箱空间分成上、下两部分,下层设置控制器1和冗余电源5;上层设置GPU 模块4、存储模块2及散热模块3,合理有效的利用了机箱空间。
需要说明的是,本实施例中上下以图1所示的机箱方位为准,以图示中的方位时机箱面积最大的一面设置在安装面或水平面上,以此将机箱的空间分为上下两层进行利用。在其他实施例中,当机箱方位变化时,本实施例中划分的机箱的上下两层也会跟随机箱变化为前后两层或左右两层。
如图2所示,为人工智能服务器的整体硬件架构,控制器1作为整个服务器的核心单元,内含两颗国产CPU以提供人工智能所需的强大的计算性能,并通过高速连接器将控制器上的高速信号接到GPU模块4和存储模块2,并且控制器1和GPU模块4均由冗余电源5供电。
以上基于国产双路CPU的人工智能服务器的整体架构设计如下:
1)高集成度设计:控制器采用双路国产多核CPU,两颗CPU(CPU0和 CPU1)通过多层PCB层叠结构布线连接,实现两颗CPU之间的数据通信,控制器上提供人工智能服务器所应该具有的对外IO接口;同时控制器上放置多个高速连接器,通过高速线缆分别与存储模块、散热模块、电源模块、GPU模块连接,并将所有模块集成在一个4U的机箱空间内,实现人工智能服务器所具备的相应功能,具有高计算密度的特点,可适用于深度学习模型开发、大规模并行计算和AI训练服务场景。
2)控制器和GPU模块互联设计:控制器和GPU模块分别放置在机箱的上下两层,通过高速连接器实现互联和信号传输,并通过相应的结构件辅助固定。
3)电源设备冗余设计:在一个实施例中,整机共设置四个电源,例如图2 中所示四个电源分布在机箱左右两侧,其中每两个电源模块为一组,一组电源 (例如图2中的电源3和电源4为一组)给控制器供电,一组电源(例如图2 中的电源1和电源2为一组)给GPU模块供电。每组电源中设置一个主电源和一个备用电源,实现电源设备冗余,每组中的两个电源通过时序控制为控制器和GPU模块供电。
在对两个电源进行时序控制时,可以采用在正常工作时两个电源交替供电,当其中一个电源出现故障或拔出时,另外一个电源会继续保持正常供电,防止发生意外断电情况导致控制器、存储模块、GPU卡正在处理的信息丢失的问题。
如图3所示,为控制器的高集成度硬件架构示意图,控制器上以两颗国产 CPU为核心,下设网络控制器、BMC控制器、USB控制器和SATA控制器,上行接口分别与两个CPU连接,各控制器的下行接口引到机箱IO面板对外输出相应的接口。
本实施例中由CPU0连接至网络控制器和BMC控制器,由CPU1连接至 USB控制器和SATA控制器。在其他实施例中控制器个下行接口与CPU的连接关系和根据实际情况进行调整。控制器上集成了人工智能服务器具备的功能模块(例如系统盘、内存模组、BMC管理模块)与对外接口,比如USB3.0接口、千兆网络接口、VGA(Video Graphics Array)显示接口。
控制器上的磁盘控制器将SAS(Statistical Analysis System)信号通过高速线缆连接到存储模块的高速连接器,存储模块的高速连接器将SAS信号接到对外提供的硬盘盘位上,进而实现磁盘读写控制;存储模块可以提供多个硬盘盘位,每个硬盘盘位可插入2.5寸SSD、2.5寸HDD或3.5寸HDD;存储模块通过高速线缆与控制器进行连接实现数据通信,进而实现控制器对于存储模块上每个硬盘的读写控制。且存储模块电源为从控制器引出通过线缆接到存储模块。
在一个实施例中控制器线路硬件架构设计如下:
1)采用2颗国产高性能CPU用于提升控制器的处理性能,连接多个DDR (DoubleData Rate)插槽,具有强大的数据处理性能和计算能力,控制器上内存模组由多根DDR插槽组成,CPU引出对应的内存信号,接到物理的DDR插槽。
2)控制器上同时集成USB(Universal Serial Bus)控制器、网络控制器、 BMC(Baseboard Management Controller,基板管理控制器)控制器和SATA(Serial ATA)控制器,用以提供整机对外接口,对外提供丰富的IO接口,用于连接键鼠、网络等外部设备,操作便利。
3)控制器的两颗国产CPU通过多层PCB层叠结构布线连接,控制器的对外接口采用基于多层PCB层叠结构实现层叠结构设计;控制器和四个电源的接口连接基于多层PCB层叠结构实现采用层叠结构设计,提升空间利用率。
如图4所示为GPU模块结构示意图,GPU模块包括GPU卡载板和GPU卡, GPU卡载板上安装有与控制器连接的高速连接器,GPU卡载板上安装有与冗余电源连接的电源连接器,GPU卡载板上通过PCIE SWITCH提供多个用于插 GPU卡的PCIE插槽。
在一个实施例中,控制器上的PCIE信号通过高速连接器接到GPU卡载板上,再通过GPU卡上的PCB信号走线接到GPU卡载板上的两颗PCIE SWITCH 上;PCIE SWITCH将接收到的PCIE信号进行扩展,扩展后的PCIE信号分别连接到对应的PCIE扩展插槽上;PCIE扩展插槽用于插GPU卡,使得基于双路国产CPU的人工智能服务器具备高性能计算和大规模并行计算的能力,可以广泛应用于人脸识别、大数据分析、视频分析等应用场景。
为了提高本实施例人工智能服务器的并行计算能力,在一个实施例中,GPU 卡载板包括两颗PCIE SWITCH、两个高速连接器和10个PCIE扩展插槽,2个电源接口;控制器上的PCIE信号通过两个高速连接器接到GPU卡载板上,作为两颗PCIE SWITCH的上行接口信号;每颗PCIE SWITCH可以扩展出5组 PCIE信号分别连接到对应的5个PCIE扩展插槽上;每个PCIE扩展插槽可以插一张GPU卡,进而可以实现GPU卡与控制器的数据通信。电源1和电源2作为一组冗余电源单独为GPU模块上的PCIE SWITCH和GPU卡供电,保障其上电后正常工作。
以上GPU卡载板结构的设计如下:
1)控制器与GPU卡载板之间采用高速连接器连接进行信号传递,GPU卡载板独立于控制器,与控制器是上下错层连接,通过相应的结构件辅助固定。
2)GPU卡载板上提供PCIE(Peripheral Component Interconnect Express)扩展插槽用于插GPU卡。
3)GPU卡载板的供电采取冗余电源方式,保障其稳定工作。
如图5所示,本实施例中的散热模块包括一个或多个强制风冷风扇,风流的方向(图中黑粗箭头所指方向)为存储模块端到GPU模块端,机箱中采用多个散热片对主要芯片进行散热,并通过对风扇转速的控制降低整个机箱的环境温度。最终可以实现,在芯片温度高时提高风扇转速,及时将芯片温度降低到合理的工作温度范围内。风扇转速根据各测温点的实时温度实现转速动态调节,保障整机温度在合理区间,使得人工智能服务器可以可靠、稳定运行。
为了保证本实施例人工智能服务器硬件架构工作的稳定性,本实施例对控制器稳定性与抗干扰性设计如下:
1)散热设计:散热部分采用CPU散热器主动散热方式与机箱内强制风冷风扇进行综合控制机箱内部的环境温度,BMC会对各个位置的温度进行监控,根据检测的温度结果实时调整风扇转速,同时控制器上CPU采用主动散热方式,在CPU散热器上安装风扇,可以根据CPU内部温度灵活调节CPU散热器上的风扇转速,保障CPU芯片温度在合理的工作区间内,使得人工智能服务器能够可靠稳定运行。
2)控制器上的对外接口均采用ESD防护措施。
3)不管是对外高速线缆、高速连接器设计还是控制器的各个功能模块设计都充分考虑了EMC以及EMI防护措施。
本实用新型采用控制器高集成度设计理念,采用2颗国产高性能CPU,控制器、GPU模块与电源模块采用冗余设计方式,集成到一个机箱中,再加上合理散热与抗干扰的防护措施,最终设计实现一款先进的基于双路国产CPU的人工智能服务器硬件平台。本实用新型设计方法具有高集成度的特点,所设计的人工智能服务器具备整机集成度高、计算处理能力强的优点,可广泛应用于人脸识别、大数据分析、视频分析等应用场景。
本实施例的基于双路国产CPU的人工智能服务器硬件架构,采用双路国产 CPU主板作为整机控制器,通过高速连接器将控制器与GPU卡载板连接实现控制器和GPU卡的数据传输,通过背板结构对外提供磁盘盘位用于数据存储,控制器和GPU卡载板的供电电源均采用冗余设计方式,将一个包含双路CPU的控制器、存储模块、散热风扇、GPU模块(包含GPU卡载板及GPU卡)设计在一个机箱里;再通过合理散热设计与抗干扰的防护措施,最终设计实现基于双路国产CPU的人工智能服务器硬件架构;该双路国产CPU人工智能服务器具有高计算密度的特点,可适用于深度学习模型开发和AI训练服务场景;本设计方法操作简单,便于实施生产。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本实用新型的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对实用新型范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本实用新型构思的前提下,还可以做出若干变形和改进,这些都属于本实用新型的保护范围。因此,本实用新型的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述基于双路国产CPU的人工智能服务器硬件架构包括安装在服务器机箱内的控制器、存储模块、散热模块、GPU模块和冗余电源;
所述服务器机箱分为上下两层,所述服务器机箱的下层安装控制器和冗余电源,所述服务器机箱的上层依次安装存储模块、散热模块和GPU模块;
所述控制器内含两颗国产CPU,所述控制器通过高速连接器与所述存储模块连接,所述控制器通过高速连接器与所述GPU模块连接通信,所述控制器和GPU模块均由所述冗余电源供电。
2.如权利要求1所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述冗余电源包括四个电源模块,其中每两个电源模块为一组,一组电源模块与所述控制器连接用于为控制器供电,另一组电源模块与所述GPU模块连接用于为GPU模块供电。
3.如权利要求1所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述控制器上集成USB控制器、网络控制器、BMC控制器和SATA控制器,用于提供控制器的对外接口。
4.如权利要求3所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述控制器的两颗国产CPU通过多层PCB层叠结构布线连接,所述控制器的对外接口基于多层PCB层叠结构分布。
5.如权利要求3所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述控制器的对外接口采用ESD防护措施,所述高速连接器采用EMC及EMI防护措施。
6.如权利要求1所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述控制器上集成磁盘控制器,所述存储模块提供硬盘盘位,所述控制器上的磁盘控制器将SAS信号通过高速线缆连接到存储模块的高速连接器,存储模块的高速连接器将SAS信号接到所述硬盘盘位上。
7.如权利要求6所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述硬盘盘位用于插入2.5寸SSD、2.5寸HDD或3.5寸HDD。
8.如权利要求1所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述GPU模块包括GPU卡载板和GPU卡,所述GPU卡载板上安装有与控制器连接的高速连接器,所述GPU卡载板上安装有与冗余电源连接的电源连接器,所述GPU卡载板上通过PCIESWITCH提供多个用于插GPU卡的PCIE插槽。
9.如权利要求8所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述GPU模块内具有两个高速连接器,每个高速连接器连接一个PCIE SWITCH,并由PCIESWITCH扩展输出五路PCIE信号分别连接至五个PCIE插槽。
10.如权利要求1所述的基于双路国产CPU的人工智能服务器硬件架构,其特征在于,所述散热模块包括一个或多个强制风冷风扇。
CN202221221460.3U 2022-05-20 2022-05-20 一种基于双路国产cpu的人工智能服务器硬件架构 Active CN217587961U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202221221460.3U CN217587961U (zh) 2022-05-20 2022-05-20 一种基于双路国产cpu的人工智能服务器硬件架构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202221221460.3U CN217587961U (zh) 2022-05-20 2022-05-20 一种基于双路国产cpu的人工智能服务器硬件架构

Publications (1)

Publication Number Publication Date
CN217587961U true CN217587961U (zh) 2022-10-14

Family

ID=83552924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202221221460.3U Active CN217587961U (zh) 2022-05-20 2022-05-20 一种基于双路国产cpu的人工智能服务器硬件架构

Country Status (1)

Country Link
CN (1) CN217587961U (zh)

Similar Documents

Publication Publication Date Title
JP3157935U (ja) サーバー
US8671153B1 (en) Low cost, high performance and high data throughput server blade
CN207051798U (zh) 一种高功率服务器电源板
CN108874711B (zh) 一种优化散热的硬盘背板系统
CN210428286U (zh) 一种模块化边缘服务器结构
CN104102301A (zh) 一种2u超高密度存储服务器
CN214896436U (zh) 一种模块化多计算节点gpu服务器结构
CN202443354U (zh) 多节点无线缆模块化计算机
CN117041184B (zh) Io拓展装置及io交换机
CN211427335U (zh) 一种新型高端八路服务器
CN106919533B (zh) 4u高密度存储型服务器
CN111258948B (zh) 一种新型gpu服务器系统
CN217587961U (zh) 一种基于双路国产cpu的人工智能服务器硬件架构
CN113220080B (zh) 一种模块化多计算节点gpu服务器结构
CN218768130U (zh) 一种支持CXL信号和PCIe信号的硬盘背板及存储装置
CN215932518U (zh) 一种云计算超融合一体机设备
CN216352292U (zh) 服务器主板及服务器
CN113485960B (zh) 一种基于ft-2000-4的通用平台及计算机
CN206649427U (zh) 一种包括双控存储系统的服务器结构
CN214011980U (zh) 一种具有ras特性的服务器
CN212906134U (zh) 处理器组件和服务器
CN206696775U (zh) 基于现有机箱外连多级jbod双控存储服务器
CN113157062B (zh) 一种模块化显卡扩展箱结构
CN115268581A (zh) 一种高性能计算力的ai边缘服务器系统架构
CN214896435U (zh) 一种模块化显卡扩展箱结构

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant