CN105739652B - 一种新型集成高密度gpu的散热方法 - Google Patents

一种新型集成高密度gpu的散热方法 Download PDF

Info

Publication number
CN105739652B
CN105739652B CN201610058267.5A CN201610058267A CN105739652B CN 105739652 B CN105739652 B CN 105739652B CN 201610058267 A CN201610058267 A CN 201610058267A CN 105739652 B CN105739652 B CN 105739652B
Authority
CN
China
Prior art keywords
video card
temperature
fan
gpu
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610058267.5A
Other languages
English (en)
Other versions
CN105739652A (zh
Inventor
高鹏
张旭东
李海平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201610058267.5A priority Critical patent/CN105739652B/zh
Publication of CN105739652A publication Critical patent/CN105739652A/zh
Application granted granted Critical
Publication of CN105739652B publication Critical patent/CN105739652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means

Abstract

本发明公开了一种新型集成高密度GPU的散热方法,其具体实现过程为:首先将服务器系统通过板卡分成上下两层独立散热空间,上层空间内放置GPU显卡,下层空间内放置交换芯片,两独立空间均通过设置在服务器机箱后部的散热风扇散热;对上层的GPU显卡进行隔断式散热,将前排GPU显卡之间的空隙通过导风罩连接到对应的后排GPU显卡之间的空隙。该一种新型集成高密度GPU的散热方法与现有技术相比,通过分层式架构和隔离式的散热设计,解决了后部GPU显卡的散热,同时能保证交换芯片的散热,进而保证整个服务器系统散热最优;利用独立导风罩,能够高度集成显卡,适用范围广泛,可应用于所有电子产品的散热设计中。

Description

一种新型集成高密度GPU的散热方法
技术领域
本发明涉及计算机服务器散热技术领域,具体地说是一种实用性强、新型集成高密度GPU的散热方法。
背景技术
现在互联网计算机行业为满足对地图、游戏的技术支持,对服务器的图形处理要求越来越高,对显卡的需求也越来越高。但考虑到成本和空间需求,希望能在有限的机箱空间内能高度集成大型显卡,如GPU卡或者MIC卡。这些显卡的功耗大都在200w以上,而且这些组件的本身散热就是一个难题。再者,由于受国标机柜上架尺寸的限制,机箱的宽度不能无限放宽,只能前后两排放置高端板卡。但如果高功耗显卡放在系统后端,很容易受到前方元器件的预热,散热问会非常严重。而且服务器为识别和使用这些显卡,需要在系统内部集成多个交换芯片,而这些芯片的功耗也在30W以上,依然需要重点解决散热问题。这样既要满足高功耗GPU卡的散热,又要保证高功耗交换芯片的散热,对这种类型的服务器散热设计必然是一个很大的散热挑战。
本发明针对这种集成高密度GPU显卡的服务器,发明设计了一种散热方法,能够充分解决GPU显卡和交换芯片的散热。
发明内容
本发明的技术任务是针对以上不足之处,提供一种实用性强、新型集成高密度GPU的散热方法。
一种新型集成高密度GPU的散热方法,其具体实现过程为:
首先将服务器系统通过板卡分成上下两层独立散热空间,上层空间内放置GPU显卡,下层空间内放置交换芯片,两独立空间均通过设置在服务器机箱后部的散热风扇散热;
对上层的GPU显卡进行隔断式散热,具体为,将GPU显卡分成两排,并前后交错放置,即前排每两个GPU显卡之间的空隙对应后排一个GPU显卡,后排每两个GPU显卡之间的空隙对应前排一个GPU显卡;
将前排GPU显卡之间的空隙通过导风罩连接到对应的后排GPU显卡之间的空隙,从而使得后排GPU显卡从前排GPU板卡之间的空隙获得冷风,前排GPU显卡产生的热量进入后排GPU显卡之间的空隙,最后所有的热风均通过散热风扇排出。
所述服务器机箱为4U机箱,GPU显卡放置在上侧的3U空间内,交换芯片放置在下侧的1U空间内。
所述GPU显卡设置的数量不高于16张,当该GPU显卡的设置数量为16时,将其分成两排,每排8张,并前后交错放置在服务器机箱内的主板上,且前侧的GPU显卡对应的机箱上开设有空气进口,配合后侧的散热风扇形成散热风道。
所述交换芯片设置的数量不高于6个,在每个交换芯片的外侧均设置有散热片,该散热片配合后侧的散热风扇辅助交换芯片散热。
所述服务器机箱后侧的散热风扇以后部GPU显卡温度和底部交换芯片显卡的温度为基准进行风扇调控,其调控过程为:
首先在低于室温的工作环境下设计风扇调控,运行各种软件压力测试工具,待软件压力测试显示稳定后,调节风扇转速,使得风扇转速PWM1值保证该服务器系统功耗最优,同时记录下后部显卡的温度值T11和底部交换芯片的温度T12,取两者的最大值,分别以温度T11和T12为横轴起点,风扇转速PWM1值为纵轴起点;然后不断提高工作环境,取得温度提高时对应的一系列PWM值和CPU温度,进而生成两套风扇调控策略,最终输出给风扇的转速指令,取两者最大值。
所述工作环境是指在常温和35度以上环境温度。
所述风扇调控的具体实现过程为:
设定服务器环境温度20、25、30、35、40度,并选择制定包括测试软件PTU、3Dmark的显卡加压软件,设置软件测试参数,分别对显卡和交换芯片部件进行满负荷测试;
在设定的20度环境温度,运行测试软件进行加压测试,通过不断调节风扇PWM值,使得系统关键点显卡、交换芯片满足系统温度规范,记录此时的PWM1值和对应的系统功耗;然后,以此PWM1值为基础,再不断调节风扇PWM值,监测记录系统关键点温度和系统功耗;当系统温度满足散热需求,并且此时的系统功耗达到最低时,并记录此时最大显卡的温度T11、交换模块芯片T12和设定的风扇PWM2值,作为风扇调控策略的起点;
在工作环境25度下,重复步骤一的测试步骤,确认相对应的风扇PWM3值和最大显卡的温度T21、交换模块芯片T22;
在工作环境30度下,重复步骤一的测试步骤,确认相对应的风扇PWM4值和最大显卡的温度T31、交换模块芯片T32;
在工作温度35度下,重复步骤一的步骤,确定相对应的风扇PWM5值和最大显卡的温度T41、交换模块芯片T42;
在工作温度40度下,重复步骤一的步骤,确定相对应的风扇PWM6值和对应的最大显卡的温度T51、交换模块芯片T52,作为风扇调控策略的终点;
根据上述步骤记录的风扇调控PWM值和对应的显卡温度Ti1和交换芯片Ti2,分别设定出两条适合低功耗的风扇调控策略,在风扇调控策略中设定,最终输出的风扇转速以取两者最大值,以保证系统能充分散热。
本发明的一种新型集成高密度GPU的散热方法,具有以下优点:
本发明的一种新型集成高密度GPU的散热方法,通过分层式架构和隔离式的散热设计,解决了后部GPU显卡的散热,同时能保证交换芯片的散热,进而保证整个服务器系统散热最优;利用独立导风罩,能够高度集成显卡,适用范围广泛,可应用于所有电子产品的散热设计中。
附图说明
附图1为本发明的服务器机箱上部结构图。
附图2为本发明的服务器机箱下部结构图。
附图3为本发明的风扇智能调控流程图。
附图中的标记分别表示:
1、服务器机箱,2、GPU显卡,3、散热风扇,4、交换芯片,5、散热片。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
本发明提供一种新型集成高密度GPU的散热方法,如附图1、图2所示,其中涉及的各个数字标记分别表示1、服务器机箱,2、GPU显卡,3、散热风扇,4、交换芯片,5、散热片。
其具体实现过程为:
首先将服务器系统通过板卡分成上下两层独立散热空间,上层空间内放置GPU显卡,下层空间内放置交换芯片,两独立空间均通过设置在服务器机箱后部的散热风扇散热;
对上层的GPU显卡进行隔断式散热,具体为,将GPU显卡分成两排,并前后交错放置,即前排每两个GPU显卡之间的空隙对应后排一个GPU显卡,后排每两个GPU显卡之间的空隙对应前排一个GPU显卡;
将前排GPU显卡之间的空隙通过导风罩连接到对应的后排GPU显卡之间的空隙,从而使得后排GPU显卡从前排GPU板卡之间的空隙获得冷风,前排GPU显卡产生的热量进入后排GPU显卡之间的空隙,最后所有的热风均通过散热风扇排出。
所述服务器机箱为4U机箱,GPU显卡放置在上侧的3U空间内,交换芯片放置在下侧的1U空间内。
所述GPU显卡设置的数量不高于16张,当该GPU显卡的设置数量为16时,将其分成两排,每排8张,并前后交错放置在服务器机箱内的主板上,且前侧的GPU显卡对应的机箱上开设有空气进口,配合后侧的散热风扇形成散热风道。
所述交换芯片设置的数量不高于6个,在每个交换芯片的外侧均设置有散热片,该散热片配合后侧的散热风扇辅助交换芯片散热。
如附图3所示,所述服务器机箱后侧的散热风扇以后部GPU显卡温度和底部交换芯片显卡的温度为基准进行风扇调控,其调控过程为:
首先在低于室温的工作环境下设计风扇调控,运行各种软件压力测试工具,待软件压力测试显示稳定后,调节风扇转速,使得风扇转速PWM1值保证该服务器系统功耗最优,同时记录下后部显卡的温度值T11和底部交换芯片的温度T12,取两者的最大值,分别以温度T11和T12为横轴起点,风扇转速PWM1值为纵轴起点;然后不断提高工作环境,取得温度提高时对应的一系列PWM值和CPU温度,进而生成两套风扇调控策略,最终输出给风扇的转速指令,取两者最大值。
所述工作环境是指在常温和35度以上环境温度。
所述风扇调控的具体实现过程为:
设定服务器环境温度20、25、30、35、40度,并选择制定包括测试软件PTU、3Dmark的显卡加压软件,设置软件测试参数,分别对显卡和交换芯片部件进行满负荷测试;
在设定的20度环境温度,运行测试软件进行加压测试,通过不断调节风扇PWM值,使得系统关键点显卡、交换芯片满足系统温度规范,记录此时的PWM1值和对应的系统功耗;然后,以此PWM1值为基础,再不断调节风扇PWM值,监测记录系统关键点温度和系统功耗;当系统温度满足散热需求,并且此时的系统功耗达到最低时,并记录此时最大显卡的温度T11、交换模块芯片T12和设定的风扇PWM2值,作为风扇调控策略的起点;
在工作环境25度下,重复步骤一的测试步骤,确认相对应的风扇PWM3值和最大显卡的温度T21、交换模块芯片T22;
在工作环境30度下,重复步骤一的测试步骤,确认相对应的风扇PWM4值和最大显卡的温度T31、交换模块芯片T32;
在工作温度35度下,重复步骤一的步骤,确定相对应的风扇PWM5值和最大显卡的温度T41、交换模块芯片T42;
在工作温度40度下,重复步骤一的步骤,确定相对应的风扇PWM6值和对应的最大显卡的温度T51、交换模块芯片T52,作为风扇调控策略的终点;
根据上述步骤记录的风扇调控PWM值和对应的显卡温度Ti1和交换芯片Ti2,分别设定出两条适合低功耗的风扇调控策略,在风扇调控策略中设定,最终输出的风扇转速以取两者最大值,以保证系统能充分散热。
本发明采用分层式和隔断式的散热设计方法,重点优化后部GPU显卡的散热,进而优化整个系统散热,确保该服务器的散热系统和功耗达到最优,应用范围是指所有需要进行散热设计的电子产品,系统布局要求高功率元件在高度上或者平面上错开摆放。
设计的两个通道相互隔离,这样交换芯片的散热不会受到高功耗GPU显卡的影响。这两个通道最后由后部的系统散热风扇来集中散热。
实际制作时,在4U机箱内分成2个通道,上部3U空间放置16张显卡,下部放置交换芯片模块。机箱后部放置3个140*140*38mm风扇(W*H*D),来统一散热。
系统中放置16张高功率的显卡,前排8张,后排8张。前后两排的显卡在同一高度上,错开摆放。
在实际制作时,可通过A和B两个独立的风道设计实现GPU显卡的不同散热。风道A为前排高功率显卡散热。新鲜空气进入系统直接为前排的高功率显卡散热,其热空气经过导风罩的引导进入后排显卡的缝隙,避开后排显卡直接流出系统。风道B为系统后排显卡散热,该风道通过前部显卡间的间隙,通过中部导风罩,流向后部GPU显卡。这样系统的新鲜空气进入系统后,不会经过前排显卡预热,直接对后排显卡进行散热,然后流出系统。
本发明在服务器机箱系统的1U空间放置交换芯片,与上部3U 空间隔离。该模块放有6个交换芯片,该芯片可以通过增加散热片来解决散热。而且该模块后部空间留有足够的开孔区域,可以由后部的系统风扇来辅助散热。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的一种新型集成高密度GPU的散热方法的权利要求书的且任何所述技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。

Claims (6)

1.一种新型集成高密度GPU的散热方法,其特征在于,其具体实现过程为:
首先将服务器系统通过板卡分成上下两层独立散热空间,上层空间内放置GPU显卡,下层空间内放置交换芯片,两独立空间均通过设置在服务器机箱后部的散热风扇散热;
对上层的GPU显卡进行隔断式散热,具体为,将GPU显卡分成两排,并前后交错放置,即前排每两个GPU显卡之间的空隙对应后排一个GPU显卡,后排每两个GPU显卡之间的空隙对应前排一个GPU显卡;
将前排GPU显卡之间的空隙通过导风罩连接到对应的后排GPU显卡之间的空隙,从而使得后排GPU显卡从前排GPU板卡之间的空隙获得冷风,前排GPU显卡产生的热量进入后排GPU显卡之间的空隙,最后所有的热风均通过散热风扇排出;
服务器机箱后侧的散热风扇以后部GPU显卡温度和底部交换芯片显卡的温度为基准进行风扇调控,其调控过程为:
首先在低于室温的工作环境下设计风扇调控,运行各种软件压力测试工具,待软件压力测试显示稳定后,调节风扇转速,使得风扇转速PWM1值保证该服务器系统功耗最优,同时记录下后部显卡的温度值T11和底部交换芯片的温度T12,分别以温度T11和T12为横轴起点,风扇转速PWM1值为纵轴起点;然后不断提高工作环境,取得温度提高时对应的一系列PWM值和CPU温度,进而生成两套风扇调控策略,最终在不同工作环境温度值下,取两套风扇调控策略中对应的最大风扇转速指令,输出给风扇。
2.根据权利要求1所述的一种新型集成高密度GPU的散热方法,其特征在于,所述服务器机箱为4U机箱,GPU显卡放置在上侧的3U空间内,交换芯片放置在下侧的1U空间内。
3.根据权利要求2所述的一种新型集成高密度GPU的散热方法,其特征在于,所述GPU显卡设置的数量不高于16张,当该GPU显卡的设置数量为16时,将其分成两排,每排8张,并前后交错放置在服务器机箱内的主板上,且前侧的GPU显卡对应的机箱上开设有空气进口,配合后侧的散热风扇形成散热风道。
4.根据权利要求2所述的一种新型集成高密度GPU的散热方法,其特征在于,所述交换芯片设置的数量不高于6个,在每个交换芯片的外侧均设置有散热片,该散热片配合后侧的散热风扇辅助交换芯片散热。
5.根据权利要求1所述的一种新型集成高密度GPU的散热方法,其特征在于,所述工作环境是指在常温和35度以上环境温度。
6.根据权利要求5所述的一种新型集成高密度GPU的散热方法,其特征在于,所述风扇调控的具体实现过程为:
设定服务器环境温度20、25、30、35、40度,并选择制定包括测试软件PTU、3Dmark的显卡加压软件,设置软件测试参数,分别对显卡和交换芯片部件进行满负荷测试;
步骤一、在设定的20度环境温度,运行测试软件进行加压测试,通过不断调节风扇PWM值,使得系统关键点显卡、交换芯片满足系统温度规范,记录此时的PWM1值和对应的系统功耗;然后,以此PWM1值为基础,再不断调节风扇PWM值,监测记录系统关键点温度和系统功耗;当系统温度满足散热需求,并且此时的系统功耗达到最低时,并记录此时显卡的温度T11、交换模块芯片温度T12和设定的风扇PWM2值,作为风扇调控策略的起点;
步骤二、在工作环境25度下,重复步骤一的测试步骤,确认相对应的风扇PWM3值和显卡的温度T21、交换模块芯片温度T22;
步骤三、在工作环境30度下,重复步骤一的测试步骤,确认相对应的风扇PWM4值和显卡的温度T31、交换模块芯片温度T32;
步骤四、在工作温度35度下,重复步骤一的步骤,确定相对应的风扇PWM5值和显卡的温度T41、交换模块芯片温度T42;
步骤五、在工作温度40度下,重复步骤一的步骤,确定相对应的风扇PWM6值和对应的显卡的温度T51、交换模块芯片温度T52,作为风扇调控策略的终点;
步骤六、根据上述步骤记录的风扇调控PWM值和对应的显卡温度和交换芯片温度,分别设定出两条适合低功耗的风扇调控策略,在风扇调控策略中设定风扇转速,最终在不同服务器环境温度下,输出的风扇转速取此时两风扇调控策略中最大值,以保证系统能充分散热。
CN201610058267.5A 2016-01-28 2016-01-28 一种新型集成高密度gpu的散热方法 Active CN105739652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610058267.5A CN105739652B (zh) 2016-01-28 2016-01-28 一种新型集成高密度gpu的散热方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610058267.5A CN105739652B (zh) 2016-01-28 2016-01-28 一种新型集成高密度gpu的散热方法

Publications (2)

Publication Number Publication Date
CN105739652A CN105739652A (zh) 2016-07-06
CN105739652B true CN105739652B (zh) 2019-01-01

Family

ID=56246856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610058267.5A Active CN105739652B (zh) 2016-01-28 2016-01-28 一种新型集成高密度gpu的散热方法

Country Status (1)

Country Link
CN (1) CN105739652B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109931285B (zh) * 2019-03-06 2021-10-26 郑州云海信息技术有限公司 一种风扇调速方法、装置及电子设备
CN109992078A (zh) * 2019-04-16 2019-07-09 苏州浪潮智能科技有限公司 支持高密度高功耗gpu服务器散热结构及设计方法
CN112114631B (zh) * 2020-09-28 2022-03-01 苏州科达科技股份有限公司 显卡服务器、控制方法、系统、设备及存储介质
CN114690867B (zh) * 2022-03-03 2023-02-10 珠海精实测控技术股份有限公司 一种自动化散热验证平台及验证方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101813950A (zh) * 2009-02-23 2010-08-25 联想(北京)有限公司 一种控制设备散热的装置和具有该装置的设备
CN102495663A (zh) * 2011-11-24 2012-06-13 曙光信息产业股份有限公司 服务器和服务器机箱
CN104915320A (zh) * 2015-05-28 2015-09-16 浪潮电子信息产业股份有限公司 一种gpu服务器
CN204883577U (zh) * 2015-09-08 2015-12-16 浪潮电子信息产业股份有限公司 一种解决高密度集成显卡散热的服务器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101813950A (zh) * 2009-02-23 2010-08-25 联想(北京)有限公司 一种控制设备散热的装置和具有该装置的设备
CN102495663A (zh) * 2011-11-24 2012-06-13 曙光信息产业股份有限公司 服务器和服务器机箱
CN104915320A (zh) * 2015-05-28 2015-09-16 浪潮电子信息产业股份有限公司 一种gpu服务器
CN204883577U (zh) * 2015-09-08 2015-12-16 浪潮电子信息产业股份有限公司 一种解决高密度集成显卡散热的服务器

Also Published As

Publication number Publication date
CN105739652A (zh) 2016-07-06

Similar Documents

Publication Publication Date Title
CN105739652B (zh) 一种新型集成高密度gpu的散热方法
EP3113592B1 (en) Cabinet air-conditioning guiding mechanism
US20080266807A1 (en) Electronic assembly with emi shielding heat sink
WO2008115608A3 (en) Method and apparatus for cooling integrated circuit chips using recycled power
CN204883577U (zh) 一种解决高密度集成显卡散热的服务器
DE102010051962A1 (de) Kühlanordnung und Arbeitsverfahren für eine Lüftersteuerung
US8295982B2 (en) Heat dissipation apparatus, heat dissipation method thereof, and container data center utilizing the heat dissipation apparatus
US20120077427A1 (en) Container data center and heat dissipation system
CN109992078A (zh) 支持高密度高功耗gpu服务器散热结构及设计方法
CN107252980A (zh) 风冷激光打标装置
CN106970662A (zh) 智能控制方法与装置
CN201601919U (zh) 一种通信机柜
US20180261748A1 (en) Thermoelectric heat pump cascade using multiple printed circuit boards with thermoelectric modules
JP6448732B2 (ja) モジュール型冷却装置を利用した放熱装置
CN101284332A (zh) 电子纸激光切割方法
CN202111974U (zh) 器件温度控制装置
CN207753612U (zh) 一种节能调速变频器
US20120024515A1 (en) Data center and heat dissipating system thereof
CN107072119B (zh) 一种用于风冷变流设备的机柜
CN206421300U (zh) 一种高散热效率机箱结构
US8659899B2 (en) Cooling system for electronic device
CN209560472U (zh) 支持高密度高功耗gpu服务器散热结构
CN210666665U (zh) 一种计算机高性能散热器
CN105353854A (zh) 一种高密度集成显卡的新型服务器散热设计方法
CN203773446U (zh) 一种通用型工控机箱

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant