CN109933552A - 一种通用gpu节点装置及通用16gpu box装置 - Google Patents

一种通用gpu节点装置及通用16gpu box装置 Download PDF

Info

Publication number
CN109933552A
CN109933552A CN201910147057.7A CN201910147057A CN109933552A CN 109933552 A CN109933552 A CN 109933552A CN 201910147057 A CN201910147057 A CN 201910147057A CN 109933552 A CN109933552 A CN 109933552A
Authority
CN
China
Prior art keywords
gpu
chip
connect
switch
pex9797
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910147057.7A
Other languages
English (en)
Inventor
邓文博
薛广营
季冬冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910147057.7A priority Critical patent/CN109933552A/zh
Publication of CN109933552A publication Critical patent/CN109933552A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

本发明公开了一种通用GPU节点装置,包括,GPU板卡、Switch板卡、电源板;GPU板卡包括8只GPU、GPU通信模块和通信管理模块,通信管理模块的输入端与Switch板卡的输出端连接,通信管理模块的输出端与GPU通信模块连接;GPU通信模块与GPU连接;GPU与Switch板卡连接;switch板卡包括PCIE扩展模块,PCIE扩展模块的输入端与CPU连接,输出端与GPU板卡连接。还公开了一种通用16GPU BOX装置,能够搭配多种通用型号的服务器,具有GPU数量多,通用性强的优点。

Description

一种通用GPU节点装置及通用16GPU BOX装置
技术领域
本发明涉及板卡设计技术领域,尤其是一种通用GPU节点装置及通用16GPU BOX装置。
背景技术
随着人工智能(AI)领域的飞速发展,市场对于GPU服务器的需求也越来越高。目前市场上主要的GPU服务器架构都为CPU板和GPU板都集成在同一个箱体内,且GPU数量较少,一般为4GPU或8GPU。在这样的架构中,GPU板为专门设计,只能在对应的服务器中使用,不具有通用性,且GPU数量较少,因此无法满足日益增长的计算要求。
发明内容
本发明的目的是提供一种通用GPU节点装置及通用16GPU BOX装置,能够搭配多种通用型号的服务器,具有GPU数量多,通用性强的优点。
为实现上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种通用GPU节点装置,包括,GPU板卡、完成GPU板卡互连和管理的Switch板卡、为GPU板卡和Switch板卡进行供电的电源板;所述GPU板卡包括8只GPU、GPU通信模块和通信管理模块,所述通信管理模块的输入端与Switch板卡的输出端连接,通信管理模块的输出端与GPU通信模块连接;所述GPU通信模块与GPU连接;所述GPU与Switch板卡连接;所述switch板卡包括PCIE扩展模块,所述PCIE扩展模块的输入端与CPU连接,输出端与GPU板卡连接。
结合第一方面,在第一方面第一种可能的实现方式中,所述GPU通信模块包括6只NVLINK Switch芯片;所述通信管理模块包括PEX8725芯片;每只GPU分别与6只NVLINKSwitch芯片的NVLINK接口连接;所述PEX8725芯片的上行PCIE接口与Switch板卡连接,下行PCIE接口分别与6只NVLINK Switch芯片连接。
结合第一方面,在第一方面第二种可能的实现方式中,所述PCIE扩展模块包括3个PEX9797芯片:PEX9797_1芯片、PEX9797_2芯片、PEX9797_3芯片,和1个PEX8749芯片;PEX9797_1芯片的port1和port2与CPU通信连接,port4和5分别连接PEX9797_2的port1口和PEX9797_3的port1口;port3和6外接两个标准的X16 PCIE slot;PEX9797_2芯片的port1与PEX9797_1芯片通信,port2下接PEX8749芯片的port1口,port3至port6口分别挂接GPU板的4个GPU芯片;PEX9797_3芯片的port1与PEX9797_1芯片通信,port2至port5分别挂接GPU板的4个GPU芯片,port6外接标准的X16 PCIE slot;PEX8749的port1与PEX9797_2互联,port2外接标准X16 PCIE slot,port3连接GPU板的PEX8725芯片。
结合第一方面,在第一方面第三种可能的实现方式中,所述电源板包括54V转12V电源模块,电源板外接54V电源,一路经54V转12V电源模块输出12V电压,为Switch板供电;电源板另一路通过radsok连接器为GPU板进行54V供电。
本发明第二方面提供了一种通用16GPU BOX装置,包括两组GPU节点装置:上GPU节点和下GPU节点;所述上GPU节点的GPU通信模块与下GPU节点的GPU通信模块连接。
结合第二方面,在第二方面第一种可能的实现方式中,所述上GPU节点的6只NVLINK Switch芯片与下GPU节点的6只NVLINK Switch芯片一一对应连接。
结合第二方面,在第二方面第二种可能的实现方式中,所述上GPU节点包括6个高速连接器,,外接高速线缆传输NVLINK信号,所述上GPU节点的6只NVLINK Switch芯片通过高速连接器与下GPU节点的6只NVLINK Switch芯片连接。
结合第二方面,在第二方面第三种可能的实现方式中,所述上GPU节点的6只NVLINK Switch芯片与下GPU节点的6只NVLINK Switch芯片通过PCB板卡一一对应连接。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明系统对外提供4组X16的PCIE信号,可以和多种通用服务器进行搭配使用,内部共包括16个全互联的GPU,能够提供足够强大的计算能力。只有GPU部分,和CPU部分独立开来,且最多可支持16GPU,能够搭配多种通用型号的服务器,具有GPU数量多,通用性强的优点。
附图说明
图1是本发明通用GPU节点装置结构示意图;
图2是本发明通用16GPU BOX装置实施例一结构示意图;
图3是本发明通用16GPU BOX装置实施例二结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,一种通用GPU节点装置,包括,GPU板卡、完成GPU板卡互连和管理的Switch板卡、为GPU板卡和Switch板卡进行供电的电源板。
Switch板的主要作用为扩展从计算节点传输来的PCIE信号,以实现对GPU板的互联和管理,同时扩展出4个标准的PCIE slot用于挂接网卡等PCIE设备。Switch板主要包括3个PEX9797芯片和1个PEX8749芯片,PEX9797和PEX8749皆为PCIE扩展芯片,用于扩展出更多的PCIE接口。每个PEX9797芯片包括P1-P6共6个X16 port;PEX8749芯片包括3个X16 port。其中PEX9797_1芯片的port1和2配置为上行口用于和CPU通信,其他4个port配置为下行口,port4和5分别连接PEX9797_2和PEX9797_3的port1口;port3和6外接两个标准的X16 PCIEslot。PEX9797_2芯片的port1配置为上行口用于和PEX9797_1芯片通信,其他port配置为下行口,其中port2下接PEX8749芯片的port1口,port3-6口分别挂接GPU板的4个GPU芯片。PEX9797_3芯片配置方式和PEX9797_2类似,port1配置为上行口用于和PEX9797_1芯片通信,其他port配置为下行口,port2-5分别挂接GPU板的4个GPU芯片,port6外接标准的X16PCIE slot。PEX8749的port1配置为上行口和PEX9797_2互联,port2和3配置为下行口,其中port2外接标准X16 PCIE slot,port3连接GPU板的PEX8725芯片。
GPU板主要包括8个GPU、6个NVLINK Switch以及1个用于管理NVLINK Switch芯片的PEX8725芯片。每个GPU分别通过1个X16的PCIE信号同Switch板PEX9797芯片互联,并且每个GPU集成6组NVLINK信号分别连接至6个NVLINK Switch芯片。NVLINK Switch芯片主要用于实现GPU间的互连通信,每个NVLINK Switch芯片共包括16个NVLINK接口,其中8个用于分别连接板内的8个GPU,另外8个用于连接另一层节点对应的NVLINK Switch芯片。PEX8725芯片共包括7个PCIE port,其中port1为X4 PCIE接口,配置为上行口用于连接Switch板的PEX8749,port2-7为X2 PCIE接口,配置为下行口分别连接6个NVLINK Switch芯片,以实现对NVLINK Switch芯片的管理功能。GPU板还包括6个高速连接器,外接高速线缆传输NVLINK信号,以实现和另一层GPU板进行互联,这就构成了一个16路全连接的GPU构架。
电源板主要作用是为Switch板和GPU板进行供电,从外部接入54V电源,54V电源一部分通过板内电源模块转换为12V电源为Switch板供电,另一部分直接通过radsok连接器为GPU板进行54V供电。
如图2所示,一种通用16GPU BOX装置,包括两组GPU节点装置:上GPU节点和下GPU节点;所述上GPU节点的GPU通信模块与下GPU节点的GPU通信模块连接。
如图3所示,一种通用16GPU BOX装置,包括两组GPU节点装置:上GPU节点和下GPU节点;上GPU节点的6只NVLINK Switch芯片与下GPU节点的6只NVLINK Switch芯片一一对应连接。
优选地,上GPU节点包括6个高速连接器,外接高速线缆传输NVLINK信号,所述上GPU节点的6只NVLINK Switch芯片通过高速连接器与下GPU节点的6只NVLINK Switch芯片连接。
优选地,上GPU节点的6只NVLINK Switch芯片与下GPU节点的6只NVLINK Switch芯片通过PCB板卡一一对应连接。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (8)

1.一种通用GPU节点装置,其特征是,包括,GPU板卡、完成GPU板卡互连和管理的Switch板卡、为GPU板卡和Switch板卡进行供电的电源板;所述GPU板卡包括8只GPU、GPU通信模块和通信管理模块,所述通信管理模块的输入端与Switch板卡的输出端连接,通信管理模块的输出端与GPU通信模块连接;所述GPU通信模块与GPU连接;所述GPU与Switch板卡连接;所述switch板卡包括PCIE扩展模块,所述PCIE扩展模块的输入端与CPU连接,输出端与GPU板卡连接。
2.如权利要求1所述的通用GPU节点装置,其特征是,所述GPU通信模块包括6只NVLINKSwitch芯片;所述通信管理模块包括PEX8725芯片;每只GPU分别与6只NVLINK Switch芯片的NVLINK接口连接;所述PEX8725芯片的上行PCIE接口与Switch板卡连接,下行PCIE接口分别与6只NVLINK Switch芯片连接。
3.如权利要求1所述的通用GPU节点装置,其特征是,所述PCIE扩展模块包括3个PEX9797芯片:PEX9797_1芯片、PEX9797_2芯片、PEX9797_3芯片,和1个PEX8749芯片;PEX9797_1芯片的port1和port2与CPU通信连接,port4和5分别连接PEX9797_2的port1口和PEX9797_3的port1口;port3和6外接两个标准的X16PCIE slot;PEX9797_2芯片的port1与PEX9797_1芯片通信,port2下接PEX8749芯片的port1口,port3至port6口分别挂接GPU板的4个GPU芯片;PEX9797_3芯片的port1与PEX9797_1芯片通信,port2至port5分别挂接GPU板的4个GPU芯片,port6外接标准的X16PCIE slot;PEX8749的port1与PEX9797_2互联,port2外接标准X16PCIE slot,port3连接GPU板的PEX8725芯片。
4.如权利要求1所述的通用GPU节点装置,其特征是,所述电源板包括54V转12V电源模块,电源板外接54V电源,一路经54V转12V电源模块输出12V电压,为Switch板供电;电源板另一路通过radsok连接器为GPU板进行54V供电。
5.一种通用16GPU BOX装置,采用权利要求1至4任一项权利要求所述的通用GPU节点装置,其特征是,包括两组GPU节点装置:上GPU节点和下GPU节点;所述上GPU节点的GPU通信模块与下GPU节点的GPU通信模块连接。
6.如权利要求5所述的通用16GPU BOX装置,其特征是,所述上GPU节点的6只NVLINKSwitch芯片与下GPU节点的6只NVLINK Switch芯片一一对应连接。
7.如权利要求6所述的通用16GPU BOX装置,其特征是,所述上GPU节点包括6个高速连接器,外接高速线缆传输NVLINK信号,所述上GPU节点的6只NVLINK Switch芯片通过高速连接器与下GPU节点的6只NVLINK Switch芯片连接。
8.如权利要求6所述的通用16GPU BOX装置,其特征是,所述上GPU节点的6只NVLINKSwitch芯片与下GPU节点的6只NVLINK Switch芯片通过PCB板卡一一对应连接。
CN201910147057.7A 2019-02-27 2019-02-27 一种通用gpu节点装置及通用16gpu box装置 Pending CN109933552A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910147057.7A CN109933552A (zh) 2019-02-27 2019-02-27 一种通用gpu节点装置及通用16gpu box装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910147057.7A CN109933552A (zh) 2019-02-27 2019-02-27 一种通用gpu节点装置及通用16gpu box装置

Publications (1)

Publication Number Publication Date
CN109933552A true CN109933552A (zh) 2019-06-25

Family

ID=66986027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910147057.7A Pending CN109933552A (zh) 2019-02-27 2019-02-27 一种通用gpu节点装置及通用16gpu box装置

Country Status (1)

Country Link
CN (1) CN109933552A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166341A (zh) * 2019-07-01 2019-08-23 联想(北京)有限公司 一种服务器、服务器集群及通信方法
CN110461111A (zh) * 2019-07-12 2019-11-15 苏州浪潮智能科技有限公司 一种支持Intel GPU的AI服务器架构系统
CN111352494A (zh) * 2020-02-22 2020-06-30 苏州浪潮智能科技有限公司 一种54v输入pcie交换板供电架构及电源布线方法
CN111741232A (zh) * 2020-08-11 2020-10-02 成都索贝数码科技股份有限公司 基于双显卡nvlink提高超高清非编编辑性能的方法
CN112667556A (zh) * 2020-12-23 2021-04-16 曙光信息产业(北京)有限公司 Gpu服务器和图像处理系统
WO2022021298A1 (en) * 2020-07-31 2022-02-03 Nvidia Corporation Multi-format graphics processing unit docking board

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140129753A1 (en) * 2012-11-06 2014-05-08 Ocz Technology Group Inc. Integrated storage/processing devices, systems and methods for performing big data analytics
CN105094242A (zh) * 2015-07-21 2015-11-25 浪潮电子信息产业股份有限公司 一种支持8个gpu卡的gpu节点以及服务器系统
CN107590101A (zh) * 2017-09-06 2018-01-16 郑州云海信息技术有限公司 一种与gpu整机箱互联的服务器装置
CN107632953A (zh) * 2017-09-14 2018-01-26 郑州云海信息技术有限公司 一种gpu箱pcie扩展互连拓扑装置
CN107748726A (zh) * 2017-11-02 2018-03-02 郑州云海信息技术有限公司 一种gpu箱
CN108776511A (zh) * 2018-05-30 2018-11-09 郑州云海信息技术有限公司 一种基于hgx-2的4u8gpu可扩展8u16gpu的服务器架构
CN109271337A (zh) * 2018-08-31 2019-01-25 郑州云海信息技术有限公司 一种基于hgx-2的gpu-box系统架构

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140129753A1 (en) * 2012-11-06 2014-05-08 Ocz Technology Group Inc. Integrated storage/processing devices, systems and methods for performing big data analytics
CN105094242A (zh) * 2015-07-21 2015-11-25 浪潮电子信息产业股份有限公司 一种支持8个gpu卡的gpu节点以及服务器系统
CN107590101A (zh) * 2017-09-06 2018-01-16 郑州云海信息技术有限公司 一种与gpu整机箱互联的服务器装置
CN107632953A (zh) * 2017-09-14 2018-01-26 郑州云海信息技术有限公司 一种gpu箱pcie扩展互连拓扑装置
CN107748726A (zh) * 2017-11-02 2018-03-02 郑州云海信息技术有限公司 一种gpu箱
CN108776511A (zh) * 2018-05-30 2018-11-09 郑州云海信息技术有限公司 一种基于hgx-2的4u8gpu可扩展8u16gpu的服务器架构
CN109271337A (zh) * 2018-08-31 2019-01-25 郑州云海信息技术有限公司 一种基于hgx-2的gpu-box系统架构

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166341A (zh) * 2019-07-01 2019-08-23 联想(北京)有限公司 一种服务器、服务器集群及通信方法
CN110166341B (zh) * 2019-07-01 2021-08-17 联想(北京)有限公司 一种服务器、服务器集群及通信方法
CN110461111A (zh) * 2019-07-12 2019-11-15 苏州浪潮智能科技有限公司 一种支持Intel GPU的AI服务器架构系统
CN111352494A (zh) * 2020-02-22 2020-06-30 苏州浪潮智能科技有限公司 一种54v输入pcie交换板供电架构及电源布线方法
WO2022021298A1 (en) * 2020-07-31 2022-02-03 Nvidia Corporation Multi-format graphics processing unit docking board
CN111741232A (zh) * 2020-08-11 2020-10-02 成都索贝数码科技股份有限公司 基于双显卡nvlink提高超高清非编编辑性能的方法
CN112667556A (zh) * 2020-12-23 2021-04-16 曙光信息产业(北京)有限公司 Gpu服务器和图像处理系统

Similar Documents

Publication Publication Date Title
CN109933552A (zh) 一种通用gpu节点装置及通用16gpu box装置
CN203930612U (zh) 一种多功能pcie io转接板
CN105510811A (zh) 基于总线传输的开关矩阵测试系统
CN107748726A (zh) 一种gpu箱
CN203133691U (zh) 一种基于cpci架构的服务器计算节点
CN205427066U (zh) 一种电子对抗通用环境测试模拟系统
CN107255975B (zh) 一种利用高速总线实现fpga程序快速加载的装置及方法
CN206075270U (zh) Spi总线接口的1553b总线模块
CN103472733A (zh) 一种基于光纤通信的电力系统数字实时仿真物理接口装置
CN103607192A (zh) 机载串行接口转换装置及应用
CN103023823B (zh) 一种用于pxi便携平台的5槽异形背板
CN104915313B (zh) 一种采用fpga实现电平转换的fmc板卡
CN206805410U (zh) 一种应用在服务器上的pcie扩展板卡
CN201260229Y (zh) 一种远程手机测试系统及装置
CN203414742U (zh) 一种基于光纤通信的电力系统数字实时仿真物理接口装置
CN203151532U (zh) 一种轨道车辆能源管理系统mvb通讯装置及储能式轻轨车
CN202453873U (zh) 一种系统管理设备的测试板卡
CN204256733U (zh) 基于vpx 3u板卡的中频信号板
CN206323392U (zh) 一种车载网络物理层测试板卡
CN207884653U (zh) 一种隔离型can通讯模块
CN218473163U (zh) 一种基于MINI PCIE的Lora无线通信模块测试工装
CN104461995A (zh) 具有记忆功能的中频信号板
CN207099077U (zh) 一种基于fpga的可扩展多通道串口光端机
CN220673779U (zh) 一种车载以太网仿真装置
CN209946883U (zh) 一种改进型硬件模块化电路装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190625