CN113220080A - 一种模块化多计算节点gpu服务器结构 - Google Patents

一种模块化多计算节点gpu服务器结构 Download PDF

Info

Publication number
CN113220080A
CN113220080A CN202110453659.2A CN202110453659A CN113220080A CN 113220080 A CN113220080 A CN 113220080A CN 202110453659 A CN202110453659 A CN 202110453659A CN 113220080 A CN113220080 A CN 113220080A
Authority
CN
China
Prior art keywords
module
power supply
interface
gpu
computing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110453659.2A
Other languages
English (en)
Other versions
CN113220080B (zh
Inventor
赵玺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Longwei System Technology Co ltd
Original Assignee
Chengdu Longwei System Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Longwei System Technology Co ltd filed Critical Chengdu Longwei System Technology Co ltd
Priority to CN202110453659.2A priority Critical patent/CN113220080B/zh
Publication of CN113220080A publication Critical patent/CN113220080A/zh
Application granted granted Critical
Publication of CN113220080B publication Critical patent/CN113220080B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/183Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/183Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
    • G06F1/185Mounting of expansion boards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明公开了一种模块化多计算节点GPU服务器结构,包括底板,底板上设置了多个计算模块插槽、多个GPU卡插槽、管理系统模块接口、网络处理模块接口、散热电源接口和电源输入接口。本发明的优点在于:扩展插槽集中布置,便于高密度布置插槽,有效整合了计算、存储、管理、网络、显卡等各种资源,实现各功能模块的灵活部署和有效扩展等诸多特性,热拔插安装,方便更换和维护,当任何一个模块出现故障时互不影响,且不影响服务器正常运行。

Description

一种模块化多计算节点GPU服务器结构
技术领域
本发明涉及服务器技术领域,特别涉及一种多节点GPU服务器结构,是一种具有高密度、高扩展、基于模块化技术特征的服务器底板结构。。
背景技术
当前,简单GPU产品的计算性能已经无法满足计算密集型工作负载,如GPU计算应用场景中复杂的视觉计算、大规模数据渲染等。如果需要更多的GPU,就只有使用多台GPU服务器堆积,这不仅不利于安装部署,而且必然会导致成本的增加和重复投入。
随着技术发展,刀片服务器的出现实现了在同一个机箱里可以部署多套完整的独立GPU系统,但由于刀片服务器的布局结构与刀片本身结构的影响,往往无法实现高密度扩展,且计算模块16和GPU模块只能整合在同一刀片上。同时刀片服务器作为高性能计算设备,不仅对运维管理、交换性能要求特别高,而且标准不统一,扩展性能差,成本也居高不下。
发明内容
本发明针对现有技术的缺陷,提供了一种模块化多节点GPU服务器结构。
为了实现以上发明目的,本发明采取的技术方案如下:
一种模块化多节点GPU服务器结构,包括:底板1、管理系统模块2、网络处理模块3、散热风扇模块4和PSU电源供应模块5、电源输入背板6、散热风扇模块背板7、机箱8;
底板1上设置计算模块插槽9、GPU卡插槽10、管理系统模块接口11、网络处理模块接口12、散热电源接口13和电源输入接口14。
计算模块插槽9有多个,每个计算模块插槽9插入一个计算模块16,实现计算模块16与底板1的数据通信和电连接,并实现热拔插功能,计算模块16为一台服务器。
GPU卡插槽10有多个,每个GPU卡插槽10对应设置一个的GPU卡附加电源出入接口,GPU卡插槽用于插入显卡15,一个计算模块16对应一个显卡15;
管理系统模块接口11用于连接管理系统模块3,管理系统模块3上设置了两个电口网络连接端口,管理系统模块3用于控制及监视底板1上各模块运行状态,包括启用/断开扩展模板,控制风扇转速与启停。
网络处理模块接口12有两个,网络处理模块接口12用于接入网络处理模块3,网络处理模块3用于实现底板1与外界的数据通信。
散热电源接口13用于连接散热风扇模块背板7,散热风扇模块背板7上设置多个散热风扇模块接口,每个散热风扇模块接口都连接一个散热风扇模块4,散热风扇模块4用于为机箱8散热。
电源输入接口14有两个,分别连接两个电源输入背板6;电源输入背板6上设有两个PSU电源供应模块接口,每个PSU电源供应模块接口上安装一个PSU电源供应模块5。电源供应模块5以负载均衡冗余方式工作,在考虑能源节省的基础上有效提高服务器系统的供电安全性和可靠性。
机箱8为模块化多节点GPU服务器结构的外壳。
作为优选,所述网络处理模块3、散热风扇模块4、计算模块16、显卡15、PSU电源供应模块5和管理系统模块2均可以热插拔;
作为优选,散热风扇模块4数量为八个。
作为优选,网络处理模块3上分别设置了三个光口网络连接端口。
作为优选,GPU卡插槽10数量为十个。
作为优选,计算模块插槽9数量为十个。
作为优选,所述多个计算模块插槽9并排横向布置,GPU卡插槽10的位置与计算模块插槽9对应。
与现有技术相比,本发明的优点在于:
1、支持同时将多个计算模块16和GPU卡集中安置于同一个机箱底板上。
2、具有高可用、高扩展、高密度、基于模块化技术特征的服务器底板结构。
3、以底板作为模块化布局结构的基板,统一对各模块进行融合配置,实现灵活部署和有效扩展等诸多特性。
4、可以在同一张底板上实现多种功能模块的热拔插安装,安装维护操作十分方便。
5、同一张底板上的功能模块根据不同应用需求配置不同型号的计算模块16。
6、同一张底板上的计算模块16和显卡分离,当任何一个模块出现故障时互不影响,且不影响服务器正常运行。
7、通过管理控制模块实现对各功能模块系统运行状态的监视监控,管理方式包括但不限于Web端后台、PC端应用、移动端APP等方式。
附图说明
图1是本发明实施例底板结构示意图;
图2是本发明实施例底板与各模块连接示意图;
图3是本发明实施例显卡和计算模块安装示意图;
图4是本发明实施例管理系统模块、散热风扇模块和PSU电源供应模块的安装示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下根据附图并列举实施例,对本发明做进一步详细说明。
如图1至4所示,一种模块化多节点GPU服务器结构,包括:底板1、管理系统模块2、网络处理模块3、散热风扇模块4和PSU电源供应模块5、电源输入背板6、散热风扇模块背板7、机箱8;
底板1上设置计算模块插槽9、GPU卡插槽10、管理系统模块接口11、网络处理模块接口12、散热电源接口13和电源输入接口14。
计算模块插槽9数量为十个,每个计算模块插槽9插入一个计算模块16,实现计算模块16与底板1的数据通信和电连接,并实现热拔插功能。
GPU卡插槽10数量为十个,每个GPU卡插槽10对应设置一个的GPU卡附加电源出入接口,GPU卡插槽用于插入显卡15;
管理系统模块接口11用于连接管理系统模块3,管理系统模块3上设置了两个电口网络连接端口,管理系统模块3用于控制及监视底板1上各模块运行状态,包括启用/断开扩展模板,控制风扇转速与启停。
网络处理模块接口12有两个,网络处理模块接口12用于接入网络处理模块3,网络处理模块3上分别设置了三个光口网络连接端口,不同用户可以根据需求来选择光口网络连接端口的数量,来实现底板1与外界的数据通信。
散热电源接口13用于连接散热风扇模块背板7,散热风扇模块背板7上设置八个散热风扇模块接口,每个散热风扇模块接口都连接一个散热风扇模块4,散热风扇模块4用于为机箱8散热。
电源输入接口14有两个,分别连接两个电源输入背板6;电源输入背板6上设有两个PSU电源供应模块接口,每个PSU电源供应模块接口上安装一个PSU电源供应模块5。电源供应模块5以负载均衡冗余方式工作,在考虑能源节省的基础上有效提高服务器系统的供电安全性和可靠性。
本发明可以在同一张服务器底板上实现各功能模块的热拔插安装,用户可配置不同数量的计算模块16和显卡15,其中计算模块16有多种配置可选;同时底板上配置的管理控制模块、散热风扇模块、网络处理模块、PSU电源供应模块,可根据不同需求进行选择。
本发明底板作为模块化布局结构的基板,统一对各模块进行配置。而管理控制模块则负责对底板上所配置的各模块运行状态进行监视监控,用户可以很方便地通过管理控制模块对各模块进行操作维护,十分简单。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的实施方法,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (7)

1.一种模块化多节点GPU服务器结构,其特征在于,包括:底板(1)、管理系统模块(2)、网络处理模块(3)、散热风扇模块(4)和PSU电源供应模块(5)、电源输入背板(6)、散热风扇模块背板(7)、机箱(8);
底板(1)上设置计算模块插槽(9)、GPU卡插槽(10)、管理系统模块接口(11)、网络处理模块接口(12)、散热电源接口(13)和电源输入接口(14);
计算模块插槽(9)有多个,每个计算模块插槽(9)插入一个计算模块(16),实现计算模块(16)与底板(1)的数据通信和电连接,并实现热拔插功能,计算模块(16)为一台服务器;
GPU卡插槽(10)有多个,每个GPU卡插槽(10)对应设置一个的GPU卡附加电源出入接口,GPU卡插槽用于插入显卡(15),一个计算模块(16)对应一个显卡(15);
管理系统模块接口(11)用于连接管理系统模块(3),管理系统模块(3)上设置了两个电口网络连接端口,管理系统模块(3)用于控制及监视底板(1)上各模块运行状态,包括启用/断开扩展模板,控制风扇转速与启停;
网络处理模块接口(12)有两个,网络处理模块接口(12)用于接入网络处理模块(3),网络处理模块(3)用于实现底板(1)与外界的数据通信;
散热电源接口(13)用于连接散热风扇模块背板(7),散热风扇模块背板(7)上设置多个散热风扇模块接口,每个散热风扇模块接口都连接一个散热风扇模块(4),散热风扇模块(4)用于为机箱(8)散热;
电源输入接口(14)有两个,分别连接两个电源输入背板(6);电源输入背板(6)上设有两个PSU电源供应模块接口,每个PSU电源供应模块接口上安装一个PSU电源供应模块(5);电源供应模块(5)以负载均衡冗余方式工作,在考虑能源节省的基础上有效提高服务器系统的供电安全性和可靠性;
机箱(8)为模块化多节点GPU服务器结构的外壳。
2.根据权利要求1所述的一种模块化多节点GPU服务器结构,其特征在于:所述网络处理模块(3)、散热风扇模块(4)、计算模块(16)、显卡(15)、PSU电源供应模块(5)和管理系统模块(2)均可以热插拔。
3.根据权利要求1所述的一种模块化多节点GPU服务器结构,其特征在于:散热风扇模块(4)数量为八个。
4.根据权利要求1所述的一种模块化多节点GPU服务器结构,其特征在于:网络处理模块(3)上分别设置了三个光口网络连接端口。
5.根据权利要求1所述的一种模块化多节点GPU服务器结构,其特征在于:GPU卡插槽(10)数量为十个。
6.根据权利要求5所述的一种模块化多节点GPU服务器结构,其特征在于:计算模块插槽(9)数量为十个。
7.根据权利要求6所述的一种模块化多节点GPU服务器结构,其特征在于:所述多个计算模块插槽(9)并排横向布置,GPU卡插槽(10)的位置与计算模块插槽(9)对应。
CN202110453659.2A 2021-04-26 2021-04-26 一种模块化多计算节点gpu服务器结构 Active CN113220080B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110453659.2A CN113220080B (zh) 2021-04-26 2021-04-26 一种模块化多计算节点gpu服务器结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110453659.2A CN113220080B (zh) 2021-04-26 2021-04-26 一种模块化多计算节点gpu服务器结构

Publications (2)

Publication Number Publication Date
CN113220080A true CN113220080A (zh) 2021-08-06
CN113220080B CN113220080B (zh) 2024-05-24

Family

ID=77089244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110453659.2A Active CN113220080B (zh) 2021-04-26 2021-04-26 一种模块化多计算节点gpu服务器结构

Country Status (1)

Country Link
CN (1) CN113220080B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117806438A (zh) * 2024-02-28 2024-04-02 苏州元脑智能科技有限公司 服务器散热设备的控制方法、装置、存储介质和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN206039401U (zh) * 2016-07-30 2017-03-22 济宁市天启联合信息技术有限公司 一种模块化计算机机箱
CN107463224A (zh) * 2017-08-28 2017-12-12 北京嘉楠捷思信息技术有限公司 显卡扩展板及应用其的主机、计算设备
CN108762430A (zh) * 2018-08-02 2018-11-06 成都珑微系统科技有限公司 一种机箱模块化布局结构
CN109062346A (zh) * 2018-08-02 2018-12-21 成都珑微系统科技有限公司 一种机箱承载结构
CN109918199A (zh) * 2019-02-28 2019-06-21 中国科学技术大学苏州研究院 基于gpu的分布式图处理系统
CN110427081A (zh) * 2019-08-27 2019-11-08 成都珑微系统科技有限公司 一种模块化边缘服务器结构
CN214896436U (zh) * 2021-04-26 2021-11-26 成都珑微系统科技有限公司 一种模块化多计算节点gpu服务器结构

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN206039401U (zh) * 2016-07-30 2017-03-22 济宁市天启联合信息技术有限公司 一种模块化计算机机箱
CN107463224A (zh) * 2017-08-28 2017-12-12 北京嘉楠捷思信息技术有限公司 显卡扩展板及应用其的主机、计算设备
CN108762430A (zh) * 2018-08-02 2018-11-06 成都珑微系统科技有限公司 一种机箱模块化布局结构
CN109062346A (zh) * 2018-08-02 2018-12-21 成都珑微系统科技有限公司 一种机箱承载结构
CN109918199A (zh) * 2019-02-28 2019-06-21 中国科学技术大学苏州研究院 基于gpu的分布式图处理系统
CN110427081A (zh) * 2019-08-27 2019-11-08 成都珑微系统科技有限公司 一种模块化边缘服务器结构
CN214896436U (zh) * 2021-04-26 2021-11-26 成都珑微系统科技有限公司 一种模块化多计算节点gpu服务器结构

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117806438A (zh) * 2024-02-28 2024-04-02 苏州元脑智能科技有限公司 服务器散热设备的控制方法、装置、存储介质和电子设备
CN117806438B (zh) * 2024-02-28 2024-05-14 苏州元脑智能科技有限公司 服务器散热设备的控制方法、装置、存储介质和电子设备

Also Published As

Publication number Publication date
CN113220080B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
US11314666B2 (en) Systems and methods for optimizing clock distribution in NVMe storage enclosures
CN214896436U (zh) 一种模块化多计算节点gpu服务器结构
CN107656588B (zh) 一种优化散热的服务器系统及安装方法
CN108664440B (zh) 接口服务器和机箱
CN113220085A (zh) 服务器
CN206235977U (zh) 一种超高密度服务器结构
CN210428286U (zh) 一种模块化边缘服务器结构
CN203786606U (zh) 机柜式服务器装置
CN113220080B (zh) 一种模块化多计算节点gpu服务器结构
CN110908863A (zh) Arm引擎集群服务器
CN202443354U (zh) 多节点无线缆模块化计算机
CN113840489A (zh) 一种基于混合架构的刀片计算机系统
CN103375420A (zh) 机柜系统及其风扇控制系统及其控制方法
CN106919533B (zh) 4u高密度存储型服务器
CN203422706U (zh) 一种双节点高温节能型一体式服务器
CN113157062B (zh) 一种模块化显卡扩展箱结构
CN115481068B (zh) 服务器及数据中心
CN214896435U (zh) 一种模块化显卡扩展箱结构
CN206696775U (zh) 基于现有机箱外连多级jbod双控存储服务器
CN207008492U (zh) 一种模块化服务器及底板
WO2016065741A1 (zh) 一种服务器底板
CN214011980U (zh) 一种具有ras特性的服务器
CN115988047A (zh) 用于支持云游戏的服务器架构
CN212623908U (zh) 一种新型服务器构架
CN215932518U (zh) 一种云计算超融合一体机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant