CN111258948B - 一种新型gpu服务器系统 - Google Patents

一种新型gpu服务器系统 Download PDF

Info

Publication number
CN111258948B
CN111258948B CN202010064017.9A CN202010064017A CN111258948B CN 111258948 B CN111258948 B CN 111258948B CN 202010064017 A CN202010064017 A CN 202010064017A CN 111258948 B CN111258948 B CN 111258948B
Authority
CN
China
Prior art keywords
board
pcie
gpu
connector
nvme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010064017.9A
Other languages
English (en)
Other versions
CN111258948A (zh
Inventor
王树明
孔祥涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010064017.9A priority Critical patent/CN111258948B/zh
Publication of CN111258948A publication Critical patent/CN111258948A/zh
Application granted granted Critical
Publication of CN111258948B publication Critical patent/CN111258948B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17306Intercommunication techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/266Arrangements to supply power to external peripherals either directly from the computer or under computer control, e.g. supply of power through the communication port, computer controlled power-strips
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Multi Processors (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明公开了一种新型GPU服务器系统,包括计算板、四个电源模块、两个GPU板、NVME直通板、PCIe直通板、风扇板、中背板、电源板、硬盘背板,其中,中背板的一侧与电源板、两个GPU板、NVME直通板、PCIe直通板互联、另一侧与风扇板互联。本发明采用中背板互联、模块化设计,缩短了机箱尺寸,实现整机无线缆互联设计,利于系统集成,系统主体部分采用分层设计理念,将前窗划分为不同的功能区域,可方便实现板卡免工具拆卸、便于系统维护,采用PCIe switch拓扑,首先可以扇出更多PCIe资源,允许系统接入更多的PCIe Device;其次,PCIe switch一定程度程度上增加了PCIe信号链路长度,使得主板、中背板、GPU板的设计成为现实,利于系统功能模块的划分。

Description

一种新型GPU服务器系统
技术领域
本发明属于数据处理技术领域,特别涉及一种新型GPU服务器系统。
背景技术
随着信息化水平的不断提高,各个领域呈现出数据爆炸性的增长,对数据有效采集、整合传输、处理分析模式也提出新的需求,对数据存储、计算的速度要求越来越高,为了满足日渐增加的数据处理需要,高密度、边缘加速计算型服务器越来越受到重视;传统云计算通过网络云将巨大的数据计算处理程序分解成无数个微程序,通过多部服务器组成的系统进行处理和分析这些微程序的到结果并返回给用户,而用户通过网络获得应用所需的资源。
边缘计算相对于传统云计算的优势主要体现在低延时、更安全、减少数据的传输和提高可用性。
传统的机架式GPU服务器一般只能支持1个GPU卡,能够使用的GPU卡数量非常有限,则大大限制了GPU服务器的处理能力。
发明内容
本发明的目的是克服现有技术中的不足,提供一种新型GPU服务器系统,采用中背板互联、模块化设计,缩短了机箱尺寸,实现整机无线缆互联设计,利于系统集成,系统主体部分采用分层设计理念,将前窗划分为不同的功能区域,可方便实现板卡免工具拆卸、便于系统维护,采用PCIe switch拓扑,首先可以扇出更多PCIe资源,允许系统接入更多的PCIeDevice;其次,PCIe switch一定程度程度上增加了PCIe信号链路长度,使得主板、中背板、GPU 板的设计成为现实,利于系统功能模块的划分。
为了实现上述目的,本发明采用的技术方案是:
一种新型GPU服务器系统,包括计算板、四个电源模块、两个GPU板、NVME 直通板、PCIe直通板、风扇板、中背板、电源板、硬盘背板,其中,中背板的一侧与电源板、两个GPU板、NVME直通板、PCIe直通板互联、另一侧与风扇板互联,
所述计算板上设有两个CPU节点,每一个CPU节点连接一个CPU,
所述四个电源模块安装在计算板的两侧,每侧设有两个,
所述两个GPU板设在PCIe直通板和NVME直通板的下方,每个GPU板上集成4片GPU加速单元,同一GPU板上的任意两个GPU加速单元之间均通过两组 NVLink高速通信总线互联,
所述NVME直通板设在计算板一侧的下方,并通过金手指与硬盘背板互联,
所述PCIe直通板设在计算板的中部下方,
所述风扇板设在中背板的一侧,风扇板上安装有两组风扇模组,每组风扇模组包括5个8056风扇转子模块。
优选的,在GPU板的内侧边居中位置设有1组高速连接器,并通过中背板与计算板互联。
优选的,每个GPU板上集成有一片能够时序逻辑控制、电源芯片管理、温感芯片管理的FPGA芯片,其对外有1组PCIe信号连接至所述CPU板上的PCIe swtich。
优选的,所述计算板上的两个CPU之间通过两组UPI高速互联总线互联,且每个CPU至少对外扩展6个集成1DPC的DIMM slot。
优选的,所述计算板上还设有PCH。
优选的,所述中背板上设有用于传递PCIe信号的连接器一、连接器二、连接器三、连接器四、连接器五、连接器六、连接器七、连接器八,且每个连接器对应设置一个散热机构,在散热机构上设有散热孔。
优选的,所述NVME直通板、PCIe直通板均设有两个,每个NVME直通板、 PCIe直通板上安装有两个NVME硬盘和两个PCIe卡槽,四个NVME硬盘和四个 PCIe卡槽分为上下两层设置。
优选的,所述电源模块为2000W CRPS PSU电源模块。
本发明的有益效果是:
1)本发明采用中背板互联、模块化设计,缩短了机箱尺寸,实现整机无线缆互联设计,利于系统集成,系统主体部分采用分层设计理念,将前窗划分为不同的功能区域,可方便实现板卡免工具拆卸、便于系统维护,采用PCIe switch拓扑,首先可以扇出更多PCIe资源,允许系统接入更多的PCIe Device;其次,PCIe switch一定程度程度上增加了PCIe信号链路长度,使得主板、中背板、GPU板的设计成为现实,利于系统功能模块的划分。
2)本发明每个GPU板上集成4片SXM2 V100 GPU加速单元,每个GPU与任一其他GPU之间通过两组NVLink高速通信总线互联,用于GPU之间高速数据交互。
3)本发明电源模块为2000W CRPS PSU电源模块,用于为计算板、NVME 硬盘、PCIe插卡以及GPU板散热。
附图说明
附图1是本发明一种新型GPU服务器系统结构示意图。
附图2是本发明一种新型GPU服务器系统中背板的侧视图。
附图3是本发明一种新型GPU服务器系统中背板的另一侧视图。
附图4是本发明一种新型GPU服务器系统GPU板PCIe信号互联关系示意图。
附图5是本发明一种新型GPU服务器系统中背板PCIe信号互联关系示意图。
附图6是本发明一种新型GPU服务器系统整体PCIe信号互联关系示意图。
具体实施方式
下面结合附图1-6,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
一种新型GPU服务器系统,如图1、2、3所示,包括计算板、四个电源模块、两个GPU板、NVME直通板、PCIe直通板、风扇板、中背板401、电源板、硬盘背板,其中,中背板401的一侧与电源板、两个GPU板、NVME直通板、PCIe 直通板互联、另一侧与风扇板互联,中置背板为各个模块信号、电源提供桥接作用,
所述计算板上设有两个CPU节点,每一个CPU节点连接一个CPU,位于整体结构的上层空间并占有1U高度,尺寸为330mm*300mm,
所述四个电源模块安装在计算板的两侧,每侧设有两个,
所述两个GPU板设在PCIe直通板和NVME直通板的下方,每个GPU板上集成4片GPU加速单元,同一GPU板上的任意两个GPU加速单元之间均通过两组 NVLink高速通信总线互联,两个GPU板位于整体结构的下方2U空间,分为2 分层,每1U高度一个GPU板,尺寸为330mm*300mm,系统设计2U空间用于安装 2组GPU板,第一GPU板301与第二GPU板302之间设计互相独立,根据应用场景可同时装配使用,也可仅使用一组以降成本,即实现4GPU或8GPU配置,所述NVME直通板设在计算板一侧的下方,并通过金手指与硬盘背板互联,
所述PCIe直通板设在计算板的中部下方,
所述风扇板设在中背板401的一侧,风扇板上安装有两组风扇模组,每组风扇模组包括5个8056风扇转子模块,两个模组可分别根据机箱上下2U空间分别调控转速,风扇模组1用于机箱上层2U空间,包括计算板、NVME硬盘及 PCIe插卡的散热;风扇模组2则用于机箱下层2U空间GPU板的散热。
所述电源模块为2000W CRPS PSU电源模块。
如图4所示,在GPU板的内侧边居中位置设有1组高速连接器201,并通过中背板401与计算板互联。
每个GPU板上集成有一片能够时序逻辑控制、电源芯片管理、温感芯片管理的FPGA芯片,其对外有1组PCIe信号连接至所述CPU板上的PCIe swtich。
所述计算板上的两个CPU之间通过两组UPI高速互联总线互联,且每个CPU 至少对外扩展6个集成1DPC的DIMM slot。
如图5所示,所述中背板401上至少设有连接器一、连接器二、连接器三、连接器四、连接器五、连接器六、连接器七、连接器八,且每个连接器至少对应设置一个通风孔。
第一CPU101上的PCIe信号通过连接器一、连接器二最后拓展至NVME硬盘,
第一CPU101上的PCIe信号通过连接器一601、连接器三603最后拓展至 PCIe卡槽中,
第一CPU101上的PCIe信号通过连接器一601、连接器四604最后拓展至一个第一GPU板301中,
第一GPU板301上的PCIe信号通过连接器四604、连接器三603最后拓展至PCIe卡槽中,
第二CPU102上的PCIe信号通过连接器六606、连接器八608最后最后拓展至NVME硬盘中,
第二CPU102上的PCIe信号通过连接器六606、连接器七607最后拓展至 PCIe卡槽中,
第二CPU102上的PCIe信号通过连接器六606、连接器五605最后拓展至另一个第二GPU板302中,
第二GPU板302上的PCIe信号通过连接器五605、连接器七607最后拓展至PCIe卡槽中。
所述NVME直通板、PCIe直通板均设有两个,每个NVME直通板、PCIe直通板上安装有两个NVME硬盘和两个PCIe卡槽,四个NVME硬盘和四个PCIe卡槽分为上下两层设置。
如图6所示,为新型GPU服务器系统整体PCIe信号互联关系示意图,采用中背板401的设置,实现了2个GPU板和8个GPU加速单元的扩展支持,采用NVLink高速互联的GPU模块,实现更加强劲的加速计算性能,第一GPU板 301与第二GPU板302之间设计互相独立,根据应用场景可同时装配使用,也可仅使用一组以降成本,即实现4GPU或8GPU配置,一方面考虑到低功耗低成本,另一方面又兼顾高性能加速。
以上内容仅仅是对本发明的结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (8)

1.一种新型GPU服务器系统,其特征在于,包括计算板、四个电源模块、两个GPU板、NVME直通板、PCIe直通板、风扇板、中背板、电源板、硬盘背板,其中,中背板的一侧与电源板、两个GPU板、NVME直通板、PCIe直通板互联、另一侧与风扇板互联,
所述计算板上设有两个CPU节点,每一个CPU节点连接一个CPU,
所述四个电源模块安装在计算板的两侧,每侧设有两个,
所述两个GPU板设在PCIe直通板和NVME直通板的下方,每个GPU板上集成4片GPU加速单元,同一GPU板上的任意两个GPU加速单元之间均通过两组NVLink高速通信总线互联,
所述NVME直通板设在计算板一侧的下方,并通过金手指与硬盘背板互联,
所述PCIe直通板设在计算板的中部下方,
所述风扇板设在中背板的一侧,风扇板上安装有两组风扇模组,每组风扇模组包括5个8056风扇转子模块。
2.根据权利要求1所述的一种新型GPU服务器系统,其特征在于,在GPU板的内侧边居中位置设有1组高速连接器,并通过中背板与计算板互联。
3.根据权利要求2所述的一种新型GPU服务器系统,其特征在于,每个GPU板上集成有一片能够时序逻辑控制、电源芯片管理、温感芯片管理的FPGA芯片,其对外有1组PCIe信号连接至所述CPU板上的PCIe swtich。
4.根据权利要求1所述的一种新型GPU服务器系统,其特征在于,所述计算板上的两个CPU之间通过两组UPI高速互联总线互联,且每个CPU至少对外扩展6个集成1DPC的DIMMslot。
5.根据权利要求4所述的一种新型GPU服务器系统,其特征在于,计算板上还设有PCH,计算板集成一片PCIe switch,对外扩展1组与CPU互联的x4 Lane PCIe,对外扩展5组与计算板PCH、GPU板PCIe switch及FPGA芯片互联的x1 Lane PCIe。
6.根据权利要求1所述的一种新型GPU服务器系统,其特征在于,所述中背板上设有用于传递PCIe信号的连接器一、连接器二、连接器三、连接器四、连接器五、连接器六、连接器七、连接器八,且每个连接器对应设置一个散热机构,在散热机构上设有散热孔。
7.根据权利要求1所述的一种新型GPU服务器系统,其特征在于,所述NVME直通板、PCIe直通板均设有两个,每个NVME直通板、PCIe直通板上安装有两个NVME硬盘和两个PCIe卡槽,四个NVME硬盘和四个PCIe卡槽分为上下两层设置。
8.根据权利要求1所述的一种新型GPU服务器系统,其特征在于,所述电源模块为2000WCRPS PSU电源模块。
CN202010064017.9A 2020-01-20 2020-01-20 一种新型gpu服务器系统 Active CN111258948B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010064017.9A CN111258948B (zh) 2020-01-20 2020-01-20 一种新型gpu服务器系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010064017.9A CN111258948B (zh) 2020-01-20 2020-01-20 一种新型gpu服务器系统

Publications (2)

Publication Number Publication Date
CN111258948A CN111258948A (zh) 2020-06-09
CN111258948B true CN111258948B (zh) 2022-07-08

Family

ID=70952503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010064017.9A Active CN111258948B (zh) 2020-01-20 2020-01-20 一种新型gpu服务器系统

Country Status (1)

Country Link
CN (1) CN111258948B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113359969B (zh) * 2021-04-30 2022-11-04 山东英信计算机技术有限公司 一种供电装置和服务器
CN117055707B (zh) * 2023-10-07 2024-01-02 安擎计算机信息股份有限公司 一种基于ocsp主板实现的gpu服务器系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107450686A (zh) * 2017-08-15 2017-12-08 郑州云海信息技术有限公司 一种4u超高密度8路服务器系统架构
CN209543240U (zh) * 2019-04-23 2019-10-25 深圳市阿普奥云科技有限公司 4u高度的gpu服务器机箱及gpu服务器
CN110461111B (zh) * 2019-07-12 2021-03-30 苏州浪潮智能科技有限公司 一种支持Intel GPU的AI服务器架构系统

Also Published As

Publication number Publication date
CN111258948A (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
US11102902B2 (en) Data storage system connectors with parallel array of dense memory cards and high airflow
CN109242754B (zh) 一种基于OpenVPX平台的多GPU高性能处理系统
US7929310B2 (en) Cell board interconnection architecture
US20080043405A1 (en) Chassis partition architecture for multi-processor system
CN111258948B (zh) 一种新型gpu服务器系统
KR20160032274A (ko) 큰 확장성 프로세서 설치에 있어서 유연한 저장 및 네트워크 프로비저닝을 위한 시스템 및 방법
CN104657317A (zh) 服务器
CN213338710U (zh) 一种基于多fpga板卡全连接的异构计算服务器
CN100541390C (zh) 多处理器系统之多向可安装架构
CN102625608A (zh) 一种大规模多节点服务器机柜的设计方法
US6829666B1 (en) Modular computing architecture having common communication interface
US11004476B2 (en) Multi-column interleaved DIMM placement and routing topology
CN202443354U (zh) 多节点无线缆模块化计算机
CN212569645U (zh) 一种灵活可配的边缘服务器系统架构
CN115481068B (zh) 服务器及数据中心
CN116700445A (zh) 一种基于分布式存储硬件架构的全闪存arm存储服务器
CN206649427U (zh) 一种包括双控存储系统的服务器结构
CN113741642B (zh) 一种高密度gpu服务器
CN214011980U (zh) 一种具有ras特性的服务器
CN210428236U (zh) 一种高密度八路服务器
CN210983137U (zh) 一种服务器硬件系统架构
CN217587961U (zh) 一种基于双路国产cpu的人工智能服务器硬件架构
CN112260969B (zh) 一种基于cpci架构的刀片式边缘计算设备
CN219958163U (zh) 一种刀片服务器及服务器集群
CN220795800U (zh) 一种四路cpu服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant