CN102662444B - 一种应用于刀片服务器的智能散热控制方法 - Google Patents

一种应用于刀片服务器的智能散热控制方法 Download PDF

Info

Publication number
CN102662444B
CN102662444B CN201210040452.3A CN201210040452A CN102662444B CN 102662444 B CN102662444 B CN 102662444B CN 201210040452 A CN201210040452 A CN 201210040452A CN 102662444 B CN102662444 B CN 102662444B
Authority
CN
China
Prior art keywords
blade
fan
smc
maincenter
system administration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210040452.3A
Other languages
English (en)
Other versions
CN102662444A (zh
Inventor
王欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201210040452.3A priority Critical patent/CN102662444B/zh
Publication of CN102662444A publication Critical patent/CN102662444A/zh
Application granted granted Critical
Publication of CN102662444B publication Critical patent/CN102662444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供一种应用于刀片服务器的智能散热控制方法,系统包括刀片计算节点,风扇系统和系统管理中枢SMC,刀片节点与系统管理中枢SMC之间通过IPMI协议相连,系统管理中枢SMC通过IPMI协议从刀片节点读取其当前计算负载和温度,或发送指令至刀片节点来调节其CPU和内存的频率控制刀片功耗;同时,每个风扇也独立的与系统管理中枢SMC通过I2C协议相连,将转速信息反馈给系统管理中枢SMC,或接收来自系统管理中枢SMC的指令来调节风扇转速;另外,各刀片与各风扇均是以独立地址与系统管理中枢SMC通讯,以保证在控制系统中的独立性。

Description

一种应用于刀片服务器的智能散热控制方法
技术领域
本发明涉及一种服务器散热技术领域,具体地说是一种应用于刀片服务器的智能散热控制方法。
背景技术
随着云计算技术的发展,人们对高密度计算的服务器的需求越来越强烈,而刀片服务器,作为一种小体积,高密度服务器架构,日益受到大型机房建造者们的欢迎,成为服务器应用的主流机种,但是,高密度带来系统散热能力的需求日益增加,这样对风扇转速和风压的要求也会随之不断增加,这种现象会带来两个负面的问题。
第一,风扇转速和风压的增加,必将会带来风扇功耗的增加,而作为高密度计算集群应用的刀片服务器对电功率的要求本身就比较大,风扇功耗的增大将会使刀片系统不得不牺牲一部分应用或性能来保证刀片系统整体的电能供应。
第二,由于风扇高转速和高风压所带来设计技术难度的增加,使得风扇的故障率也趋于升高,而且一旦系统的一枚风扇发生故障,所有的系统刀片都要进入保护状态,可能将造成整个服务器直接停机或低效能运行。
发明内容
本发明的目的是提供一种应用于刀片服务器的智能散热控制方法。
本发明的目的是按以下方式实现的,系统包括刀片计算节点,风扇系统和系统管理中枢SMC,刀片节点与系统管理中枢SMC之间通过IPMI协议相连,系统管理中枢SMC通过IPMI协议从刀片节点读取其当前计算负载和温度,或发送指令至刀片节点来调节其CPU和内存的频率控制刀片功耗;同时,每枚风扇也独立地与系统管理中枢SMC通过I2C协议相连,将转速信息反馈给系统管理中枢SMC,或接收来自系统管理中枢SMC的指令来调节风扇转速;另外,各刀片与各风扇均是以独立地址与系统管理中枢SMC通讯,以保证在控制系统中的独立性;具体控制步骤如下:
1)每一枚风扇对应给两片刀片散热,当各个刀片负载与温度大致相同时,风扇的转速比较接近,而当其中某一刀片节点的负载增大时,系统管理中枢SMC就会得到其负载和温度变化的信息,之后系统管理中枢SMC会发出转速增加指令到与刀片对应的风扇,使其提高风量,而其他的刀片与风扇则不受影响,当某一刀片负载较小时,系统管理中枢SMC则会采取相反的动作,使其风量减小,实现各个刀片对风量的“各取所需”,最大地节约了风扇的总功耗;
2)当某一枚风扇发生故障时,系统管理中枢SMC将会读取到该风扇的转速异常,当连续几次读取均为异常后,系统管理中枢SMC将向该风扇所对应的刀片发出降低其负载的指令,刀片节点负载的降低,使其运行温度也随之降低,这样就最大程度地保护了运行在刀片上的信息数据不会损失,等待系统管理员对数据进行备份,以及对风扇的修复,在这种情况下,其他的刀片节点并不受到影响,实现了风扇的独立故障处理。
本发明的有益效果是:包含两个方面的内容:
1)同一刀片服务器系统的每一枚风扇都可以根据自己负责散热的刀片计算节点的计算负载和运行温度来调节自己的转速,实现同一系统内的各个风扇的分区散热控制;
2)当某一枚风扇发生故障导致转速不正常时,只有与其对应散热的刀片计算节点会通过降频率,降电压的方法降低刀片的负载,其他的刀片并不会受到影响,从而实现刀片过热保护的独立控制。
附图说明
图1是服务器风扇正常散热工况示意图;
图2是根据刀片负载状况调整散热系统的工况示意图;
图3是风扇出现故障时的系统散热工况示意图。
具体实施方式
本发明是一种应用于刀片服务器的智能散热控制管理方法,意在克服刀片服务器在风扇和温度管理上的各个难点,设计出一种适用于刀片服务器的智能散热控制管理系统,可以实现系统刀片散热的分区风扇控制和风扇独立故障处理。
参照说明书附图对本发明的方法作以下详细地说明。
(1)整个散热控制方案主要由三部分组成,分别是刀片计算节点,风扇系统和系统管理中枢(SMC),如图1,刀片节点与SMC之间通过IPMI协议相连,SMC可以通过IPMI协议从刀片节点读取其当前计算负载和温度,也可以发送指令至刀片节点来调节其CPU和内存的频率,控制刀片功耗。同时,每枚风扇也独立地与SMC通过I2C协议相连,可以反馈转速信息给SMC,也可以接收来自SMC的指令来调节风扇转速。另外,各刀片与各风扇均是以独立地址与SMC通讯,这样可以保证它们在控制系统中的独立性;
(2)现以单机箱20刀10风扇的刀片服务器为例,每一枚风扇对应给两片刀片散热,如图1所示,当各个刀片负载与温度大致相同时,风扇的转速比较接近,而当其中某一刀片节点(比如刀片1,如图2)的负载增大时,SMC就会得到其负载和温度变化的信息,之后SMC会发出转速增加指令到与刀片1对应的风扇0,使其提高风量,而其他的刀片与风扇则不受影响。当某一刀片负载较小时,SMC则会采取相反的动作,使其风量减小。总之,实现了各个刀片对风量的“各取所需”,最大地节约了风扇的总功耗;
(3)当某一枚风扇(比如风扇1,如图3)发生故障时,SMC将会读取到风扇1的转速异常,当连续几次读取均为异常后,SMC将向风扇1所对应的刀片2和3发出降低其负载的指令,刀片节点负载的降低,使其运行温度也随之降低,这样就最大程度地保护了运行在刀片2、3上的信息数据不会损失,等待系统管理员对数据进行备份,以及对风扇的修复,在这种情况下,其他的刀片节点并不受到影响,实现了风扇的独立故障处理。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1.一种应用于刀片服务器的智能散热控制方法,其特征在于系统包括刀片计算节点,风扇系统和系统管理中枢SMC,刀片节点与系统管理中枢SMC之间通过IPMI协议相连,系统管理中枢SMC通过IPMI协议从刀片节点读取其当前计算负载和温度,或发送指令至刀片节点来调节其CPU和内存的频率控制刀片功耗;同时,每枚风扇也独立地与系统管理中枢SMC通过I2C协议相连,将转速信息反馈给系统管理中枢SMC,或接收来自系统管理中枢SMC的指令来调节风扇转速;另外,各刀片与各风扇均是以独立地址与系统管理中枢SMC通讯,以保证在控制系统中的独立性;具体控制步骤如下:
1)每一枚风扇对应给两片刀片散热,当各个刀片负载与温度大致相同时,风扇的转速比较接近,而当其中某一刀片节点的负载增大时,系统管理中枢SMC就会得到其负载和温度变化的信息,之后系统管理中枢SMC会发出转速增加指令到与刀片对应的风扇,使其提高风量,而其他的刀片与风扇则不受影响,当某一刀片负载较小时,系统管理中枢SMC则会采取相反的动作,使其风量减小,实现各个刀片对风量的“各取所需”,最大地节约了风扇的总功耗;
2)当某一枚风扇发生故障时,系统管理中枢SMC将会读取到该风扇的转速异常,当连续几次读取均为异常后,系统管理中枢SMC将向该风扇所对应的刀片发出降低其负载的指令,刀片节点负载的降低,使其运行温度也随之降低,这样就最大程度地保护了运行在刀片上的信息数据不会损失,等待系统管理员对数据进行备份,以及对风扇的修复,在这种情况下,其他的刀片节点并不受到影响,实现了风扇的独立故障处理。
CN201210040452.3A 2012-02-22 2012-02-22 一种应用于刀片服务器的智能散热控制方法 Active CN102662444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210040452.3A CN102662444B (zh) 2012-02-22 2012-02-22 一种应用于刀片服务器的智能散热控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210040452.3A CN102662444B (zh) 2012-02-22 2012-02-22 一种应用于刀片服务器的智能散热控制方法

Publications (2)

Publication Number Publication Date
CN102662444A CN102662444A (zh) 2012-09-12
CN102662444B true CN102662444B (zh) 2016-06-01

Family

ID=46771949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210040452.3A Active CN102662444B (zh) 2012-02-22 2012-02-22 一种应用于刀片服务器的智能散热控制方法

Country Status (1)

Country Link
CN (1) CN102662444B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2901237A4 (en) * 2012-09-27 2016-05-04 Hewlett Packard Development Co ASSIGNMENT OF WORKLOADS BASED ON AIR TRAFFIC PRIORITY
CN103034309B (zh) * 2012-12-29 2015-10-28 齐贸屋贸易(深圳)有限公司 一种预先制冷系统
CN104238691B (zh) * 2013-06-07 2017-08-25 英业达科技有限公司 服务器系统及其散热方法
CN103995574A (zh) * 2014-06-04 2014-08-20 浪潮集团有限公司 一种私有云系统中实现风扇智能散热方法
CN104612994B (zh) * 2014-12-26 2017-03-08 郑州云海信息技术有限公司 一种服务器电源pwm风机控制的设计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7275248B2 (en) * 2004-04-28 2007-09-25 Kabushiki Kaisha Toshiba Information processing apparatus and method of system control of the apparatus
CN101211205A (zh) * 2006-12-26 2008-07-02 联想(北京)有限公司 一种刀片式服务器系统及其散热方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7275248B2 (en) * 2004-04-28 2007-09-25 Kabushiki Kaisha Toshiba Information processing apparatus and method of system control of the apparatus
CN101211205A (zh) * 2006-12-26 2008-07-02 联想(北京)有限公司 一种刀片式服务器系统及其散热方法

Also Published As

Publication number Publication date
CN102662444A (zh) 2012-09-12

Similar Documents

Publication Publication Date Title
CN102662444B (zh) 一种应用于刀片服务器的智能散热控制方法
CN206647293U (zh) 一种基于cpld的服务器风扇转速控制系统
CN101825938A (zh) 一种大型服务器散热风扇的集中控制管理方法
CN103926992A (zh) 电源管理电路、伺服器与其电源管理方法
Witkowski et al. Enabling sustainable clouds via environmentally opportunistic computing
CN104074784A (zh) 风扇控制系统及方法
CN103016381B (zh) 服务器风扇调速系统
CN103970632A (zh) 一种Smart Rack机柜恢复风扇默认转速的方法
CN107203251A (zh) 一种整机柜服务器散热方法
CN203673427U (zh) 应用于pc-based自动化设备的冷却风扇智能控制系统
CN110213950B (zh) 一种水冷电堆散热风扇控制系统
CN111190468B (zh) 一种ocp网卡散热装置及方法
CN102852845B (zh) 一种风扇调速方法及装置
CN205158163U (zh) 一种服务器液冷散热节能控制系统
CN203276144U (zh) 一种嵌入式计算机的温控模块
CN102645290B (zh) 一种基于服务器的针对系统温度传感器故障的处理方法
CN111156187A (zh) 一种服务器风扇转速控制方法及装置
CN203422706U (zh) 一种双节点高温节能型一体式服务器
TW201322697A (zh) 基板管理控制器、電子裝置及其控制方法
CN206757516U (zh) 一种具备监控多服务器的服务器架构
CN204705982U (zh) 一种计算机cpu降温系统
CN205354012U (zh) 一种基于三极管控制的can总线收发器控制电路
CN210898922U (zh) 一种应用于换流单元的双套阀控系统
CN206077261U (zh) 低压电机再启动控制装置
CN206159091U (zh) 一种风扇控制系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant