CN104035849A - 一种防止Rack机柜风扇管理失效的方法 - Google Patents

一种防止Rack机柜风扇管理失效的方法 Download PDF

Info

Publication number
CN104035849A
CN104035849A CN201410275029.0A CN201410275029A CN104035849A CN 104035849 A CN104035849 A CN 104035849A CN 201410275029 A CN201410275029 A CN 201410275029A CN 104035849 A CN104035849 A CN 104035849A
Authority
CN
China
Prior art keywords
fan
management
plate
node
rack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410275029.0A
Other languages
English (en)
Other versions
CN104035849B (zh
Inventor
郭猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201410275029.0A priority Critical patent/CN104035849B/zh
Publication of CN104035849A publication Critical patent/CN104035849A/zh
Application granted granted Critical
Publication of CN104035849B publication Critical patent/CN104035849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明提供一种防止Rack机柜风扇管理失效的方法,其具体实现过程为:将Rack机柜采用多级风扇设计,并采用多级风扇管理,这里的多级风扇管理包括每一级板卡失效时执行的失效时风扇管理策略、fw失效时自动重启恢复的策略。该一种防止Rack机柜风扇管理失效的方法和现有技术相比,解决风扇管理失效的问题,提高Rack服务器机柜的风扇管理的稳定性,实用性强,适用范围广泛,易于推广。

Description

一种防止Rack机柜风扇管理失效的方法
技术领域
本发明涉及计算机技术领域,具体的说是一种实用性强、防止Rack机柜风扇管理失效的方法。
背景技术
随着IT行业的不断发展,云计算、大数据(Big Data)时代的来临。随着用户业务需求的不断增长对IT基础架构提出了更高的要求,对网络服务器的计算及存储性能要求越来越大,高密度服务器机柜系统已经逐渐成为趋势。
Rack服务器机柜的出现正好顺应了云计算和大数据的发展要求。这种Rack服务器机柜具有46U的高度,每U高度空间可以自由布置计算节点或者存储节点,而且1U空间可以部署最多3个计算节点,这使得Rack服务器机柜系统的整体运算处理能力大幅度地提高,能够满足对大量数据处理的需要。这种Rack服务器机柜系统处理数据的能力越高、存储的密度越大,必然导致机柜的功耗越来越大,对整机柜散热的管理提出了更高的要求。
在满足Rack机柜散热需求的风扇智能管理应用中,经常出现因更换机柜内故障板卡或板卡失效造成的风扇管理失效的问题。风扇管理失效会造成整个Rack服务器机柜散热无法满足需求,进而导致整个Rack机柜停止工作。为解决风扇管理失效的问题,就必须设计出一种防止Rack机柜风扇管理失效的方法,来满足Rack机柜的风扇失效管理要求。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种实用性强、防止Rack机柜风扇管理失效的方法。
本发明的技术方案是按以下方式实现的,该一种防止Rack机柜风扇管理失效的方法,其具体实现过程为:
一、设置风扇管理的系统架构:在Rack机柜内均匀分布若干个风扇,所述若干个风扇由风扇控制板控制和供电,所述风扇控制板包括两级管理,第一级为管理主板,第二级为节点中板、与节点中板互连的风扇控制板,其中
管理主板负责整个机柜的风扇管理策略的指定、基于IPMI协议风扇管理策略的命令下发;
节点中板负责风扇管理策略的执行和风扇固定转速切换;
风扇控制板负责风扇的供电、风扇转速信号互联、风扇固定转速输出;
二、当管理主板失效时,节点中板进行实时温度监控,并根据管理主板失效前收到的风扇转速调控策略进行风扇转速调整及监控,保证整机柜的散热满足系统需求;
三、当节点中板失效时,节点中板控制风扇控制板固定转速切换的信号还原到初始状态,从而导致风扇切换到固定转速运转;
四、当风扇管理板FW失效时,自动重启恢复管理功能。
所述步骤一中的风扇分布结构为:将整个机柜设置成10层,每层高度为4U,每层为一个风扇窗,风扇窗通过风道隔离分成3个独立散热区域,每个散热区域内置一个散热风扇;每个风扇窗内的风扇由一个风扇控制板控制和供电,其中风扇控制板中的管理主板设置有1块,节点中板、风扇控制板均设置有10块。
所述步骤三中风扇转速管理的详细过程为:在节点中板与风扇之间设置转速切换电路,该转速切换电路还连接固定转速控制电路,从节点中板引入1个风扇转速切换信号,通过该风扇转速切换信号控制风扇转速自动切换电路;当机柜内节点中板失效时,风扇控制板自动切换到预设的固定风扇转速运转;当节点中板恢复正常工作时,控制风扇转速切换信号的电平变化,切换到由机柜管理系统控制风扇转速的模式。
所述固定转速电路设置3个开关,该三个开关可分别选择36%、48%、52%、64%转速的电路。
所述步骤四的详细过程为:在管理主板和节点中板上均设计看门狗电路;当板卡FW失效时,看门口电路触发板卡自动重启,从而恢复风扇管理功能。
所述看门狗电路自重启的详细内容为:管理主板或节点中板主芯片每间隔1~2秒进行喂狗操作;若板卡FW失效,喂狗操作取消,看门狗电路触发失效的板卡重新启动,从而恢复到正常功能。
本发明与现有技术相比所产生的有益效果是:
本发明的一种防止Rack机柜风扇管理失效的方法通过多级风扇管理的系统架构,并采用多级风扇管理的方式降低风扇管理失效风险;设计有板卡失效时的风扇管理策略,针对每一级板卡失效状态均制定了失效时的风扇管理策略,保障整机柜的风扇管理处于非失效状态,时刻保障机柜的散热需求;设计风扇管理板卡FW失效时自动重启恢复管理功能,当板卡FW失效时,看门狗电路触发失效板卡自动重启,进而恢复管理功能;解决风扇管理失效的问题,提高Rack服务器机柜的风扇管理的稳定性;实用性强,适用范围广泛,易于推广。
附图说明
附图1为本发明的风扇管理构架示意图。
附图2为本发明的风扇自动切换转速管理示意图。
附图3为本发明的看门狗电路连接示意图。
具体实施方式
下面结合附图对本发明的一种防止Rack机柜风扇管理失效的方法作以下详细说明。
本发明的设计思路为:通过多种风扇管理策略的设计,实现板卡失效时风扇功能的正常管理。基于此设计思路,如附图1、图2、图3所示,现提供一种防止Rack机柜风扇管理失效的方法,其具体实现过程为:
设置风扇管理的系统架构:该构架内均匀分布若干个风扇,所述若干个风扇由风扇控制板控制和供电,所述风扇控制板包括两级管理,第一级为管理主板,第二级为节点中板、与节点中板互连的风扇控制板,其中
管理主板负责整个机柜的风扇管理策略的指定、基于IPMI协议风扇管理策略的命令下发;
节点中板负责风扇管理策略的执行和风扇固定转速切换;
风扇控制板负责风扇的供电、风扇转速信号互联、风扇固定转速输出。
由于Rack机柜高度为46U,这样根据上述方法,将整个机柜设置成10层,每层高度为4U,每层为一个风扇窗,风扇窗通过风道隔离分成3个独立散热区域,每个散热区域内置一个散热风扇;每个风扇窗内的风扇由一个风扇控制板控制和供电,其中风扇控制板中的管理主板设置有1块,节点中板、风扇控制板均设置有10块。
这样采用多级管理的方式将风扇管理失效的风险分到每个板卡,从而降低风扇管理失效的风险。
为解决风扇管理失效问题,提出了一种针对每个板卡失效时的风扇管理策略,具体如下:
当管理主板失效时,节点中板进行实时温度监控,并根据管理主板失效前收到的风扇转速调控策略进行风扇转速调整及监控,保证整机柜的散热满足系统需求。
当节点中板失效时,节点中板控制风扇控制板固定转速切换的信号还原到初始状态,从而导致风扇切换到固定转速运转。
风扇管理失效时风扇自动切换为可选的固定转速功。当上级管理失效时,自动切换到固定转速而保证节点的散热有效性
风扇自动切换转速的管理拓扑图如附图2所示。
风扇控制板支持整个机柜管理系统对其风扇转速管理,在常用的风扇控制电路上加入了固定转速电路、转速自动切换电路。其中:固定转速电路上增加了3个开关,控制3个开关,可分别选择36%、48%、52%、64%转速的电路,根据实际应用进行预设风扇固定转速。
从节点中板引入1个风扇转速切换信号,通过该风扇转速切换信号控制风扇转速自动切换电路。当机柜内节点中板失效时,风扇控制板自动切换到预设的固定风扇转速运转;当节点中板恢复正常工作时,控制风扇转速切换信号的电平变化,切换到由机柜管理系统控制风扇转速的模式。
如附图3所示,当风扇管理板FW失效时,自动重启恢复管理功能。
在管理主板和节点中板上均设计看门狗电路;当板卡FW失效时,看门口电路触发板卡自动重启,从而恢复风扇管理功能。
所述看门狗电路自重启的详细内容为:管理主板或节点中板主芯片每间隔1~2秒进行喂狗操作;若板卡FW失效,喂狗操作取消,看门狗电路触发失效的板卡重新启动,从而恢复到正常功能。
通过以上设计,即可解决因管理主板FW运行时效导致风扇管理失效的风险。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (6)

1.一种防止Rack机柜风扇管理失效的方法,其特征在于其具体实现过程为:
一、设置风扇管理的系统架构:在Rack机柜内均匀分布若干个风扇,所述若干个风扇由风扇控制板控制和供电,所述风扇控制板包括两级管理,第一级为管理主板,第二级为节点中板、与节点中板互连的风扇控制板,其中
管理主板负责整个机柜的风扇管理策略的指定、基于IPMI协议风扇管理策略的命令下发;
节点中板负责风扇管理策略的执行和风扇固定转速切换;
风扇控制板负责风扇的供电、风扇转速信号互联、风扇固定转速输出;
二、当管理主板失效时,节点中板进行实时温度监控,并根据管理主板失效前收到的风扇转速调控策略进行风扇转速调整及监控,保证整机柜的散热满足系统需求;
三、当节点中板失效时,节点中板控制风扇控制板固定转速切换的信号还原到初始状态,从而导致风扇切换到固定转速运转;
四、当风扇管理板FW失效时,自动重启恢复管理功能。
2.根据权利要求1所述的一种防止Rack机柜风扇管理失效的方法,其特征在于:所述步骤一中的风扇分布结构为:将整个机柜设置成10层,每层高度为4U,每层为一个风扇窗,风扇窗通过风道隔离分成3个独立散热区域,每个散热区域内置一个散热风扇;每个风扇窗内的风扇由一个风扇控制板控制和供电,其中风扇控制板中的管理主板设置有1块,节点中板、风扇控制板均设置有10块。
3.根据权利要求1所述的一种防止Rack机柜风扇管理失效的方法,其特征在于:所述步骤三中风扇转速管理的详细过程为:在节点中板与风扇之间设置转速切换电路,该转速切换电路还连接固定转速控制电路,从节点中板引入1个风扇转速切换信号,通过该风扇转速切换信号控制风扇转速自动切换电路;当机柜内节点中板失效时,风扇控制板自动切换到预设的固定风扇转速运转;当节点中板恢复正常工作时,控制风扇转速切换信号的电平变化,切换到由机柜管理系统控制风扇转速的模式。
4.根据权利要求3所述的一种防止Rack机柜风扇管理失效的方法,其特征在于:所述固定转速电路设置3个开关,该三个开关可分别选择36%、48%、52%、64%转速的电路。
5.根据权利要求1所述的一种防止Rack机柜风扇管理失效的方法,其特征在于:所述步骤四的详细过程为:在管理主板和节点中板上均设计看门狗电路;当板卡FW失效时,看门口电路触发板卡自动重启,从而恢复风扇管理功能。
6.根据权利要求5所述的一种防止Rack机柜风扇管理失效的方法,其特征在于:所述看门狗电路自重启的详细内容为:管理主板或节点中板主芯片每间隔1~2秒进行喂狗操作;若板卡FW失效,喂狗操作取消,看门狗电路触发失效的板卡重新启动,从而恢复到正常功能。
CN201410275029.0A 2014-06-19 2014-06-19 一种防止Rack机柜风扇管理失效的方法 Active CN104035849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410275029.0A CN104035849B (zh) 2014-06-19 2014-06-19 一种防止Rack机柜风扇管理失效的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410275029.0A CN104035849B (zh) 2014-06-19 2014-06-19 一种防止Rack机柜风扇管理失效的方法

Publications (2)

Publication Number Publication Date
CN104035849A true CN104035849A (zh) 2014-09-10
CN104035849B CN104035849B (zh) 2017-02-15

Family

ID=51466623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410275029.0A Active CN104035849B (zh) 2014-06-19 2014-06-19 一种防止Rack机柜风扇管理失效的方法

Country Status (1)

Country Link
CN (1) CN104035849B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820479A (zh) * 2015-04-24 2015-08-05 北京百度网讯科技有限公司 整机柜服务器风扇的控制方法和装置
CN105425932A (zh) * 2015-11-12 2016-03-23 浪潮(北京)电子信息产业有限公司 一种整机柜服务器电源的管理方法及系统
CN105607982A (zh) * 2014-11-24 2016-05-25 英业达科技有限公司 逐层回复状态的机架服务器系统
CN106250255A (zh) * 2016-07-22 2016-12-21 迈普通信技术股份有限公司 一种系统异常的管理方法及装置
CN106774752A (zh) * 2017-01-11 2017-05-31 郑州云海信息技术有限公司 一种Rack服务器备用风扇控制方法
CN107357676A (zh) * 2017-08-04 2017-11-17 郑州云海信息技术有限公司 重启机箱管理系统的方法、装置、可读介质及存储控制器
CN107420340A (zh) * 2017-09-29 2017-12-01 迈普通信技术股份有限公司 散热风扇控制方法及系统
CN108334418A (zh) * 2018-02-02 2018-07-27 郑州云海信息技术有限公司 一种机柜风扇调速异常处理方法、系统、介质及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264956A1 (en) * 2009-07-16 2011-10-27 Hitachi, Ltd. Management system for outputting information denoting recovery method corresponding to root cause of failure
CN102394779A (zh) * 2011-11-07 2012-03-28 百度在线网络技术(北京)有限公司 多机柜的集中管理系统及方法
CN102968166A (zh) * 2012-12-12 2013-03-13 曙光信息产业(北京)有限公司 服务器系统的散热装置
CN103605413A (zh) * 2013-11-20 2014-02-26 曙光信息产业(北京)有限公司 机架式服务器系统的机柜、机架式服务器系统及其管理方法
US20140088788A1 (en) * 2012-09-26 2014-03-27 Inventec Corporation Rack Server System and Operating Method Thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264956A1 (en) * 2009-07-16 2011-10-27 Hitachi, Ltd. Management system for outputting information denoting recovery method corresponding to root cause of failure
CN102394779A (zh) * 2011-11-07 2012-03-28 百度在线网络技术(北京)有限公司 多机柜的集中管理系统及方法
US20140088788A1 (en) * 2012-09-26 2014-03-27 Inventec Corporation Rack Server System and Operating Method Thereof
CN102968166A (zh) * 2012-12-12 2013-03-13 曙光信息产业(北京)有限公司 服务器系统的散热装置
CN103605413A (zh) * 2013-11-20 2014-02-26 曙光信息产业(北京)有限公司 机架式服务器系统的机柜、机架式服务器系统及其管理方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105607982A (zh) * 2014-11-24 2016-05-25 英业达科技有限公司 逐层回复状态的机架服务器系统
CN104820479A (zh) * 2015-04-24 2015-08-05 北京百度网讯科技有限公司 整机柜服务器风扇的控制方法和装置
WO2016169222A1 (zh) * 2015-04-24 2016-10-27 北京百度网讯科技有限公司 整机柜服务器风扇的控制方法和装置
CN105425932A (zh) * 2015-11-12 2016-03-23 浪潮(北京)电子信息产业有限公司 一种整机柜服务器电源的管理方法及系统
CN106250255A (zh) * 2016-07-22 2016-12-21 迈普通信技术股份有限公司 一种系统异常的管理方法及装置
CN106250255B (zh) * 2016-07-22 2018-12-28 迈普通信技术股份有限公司 一种系统异常的管理方法及装置
CN106774752A (zh) * 2017-01-11 2017-05-31 郑州云海信息技术有限公司 一种Rack服务器备用风扇控制方法
CN107357676A (zh) * 2017-08-04 2017-11-17 郑州云海信息技术有限公司 重启机箱管理系统的方法、装置、可读介质及存储控制器
CN107420340A (zh) * 2017-09-29 2017-12-01 迈普通信技术股份有限公司 散热风扇控制方法及系统
CN108334418A (zh) * 2018-02-02 2018-07-27 郑州云海信息技术有限公司 一种机柜风扇调速异常处理方法、系统、介质及设备

Also Published As

Publication number Publication date
CN104035849B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN104035849A (zh) 一种防止Rack机柜风扇管理失效的方法
US9880602B2 (en) Power characteristics in a system of disparate storage drives
Shuja et al. Survey of techniques and architectures for designing energy-efficient data centers
CN107346163B (zh) 服务器机架电力管理
US9703357B2 (en) Power management method and apparatus, and power supply system
KR102414047B1 (ko) 통합 메모리 디바이스 및 그의 동작 방법
CN103092138B (zh) 一种机柜系统的控制方法
CN103077079B (zh) 虚拟机迁移控制方法和装置
CN104503932A (zh) 多主板服务器主基板管理控制器仲裁方法及系统
CN105446657A (zh) 一种监控raid卡的方法
CN103294641A (zh) 用于系统管理的有限状态机
CN104777890A (zh) 一种多路服务器的功耗管理系统
CN111209241A (zh) 整机柜服务器的管理系统
US10303241B2 (en) System and method for fine-grained power control management in a high capacity computer cluster
CN104102301A (zh) 一种2u超高密度存储服务器
CN103970632A (zh) 一种Smart Rack机柜恢复风扇默认转速的方法
CN107329801B (zh) 一种节点管理方法及装置、多子星服务器
CN105446770A (zh) 一种可节省存储芯片的集中存储方法及多功能模块系统
CN107203251A (zh) 一种整机柜服务器散热方法
CN102681650B (zh) 一种电源控制节能方法及其对应的存储系统
CN103092677A (zh) 一种适用于虚拟化平台的内存节能系统和方法
CN104135838A (zh) 一种高密度机柜散热集中管理方法
US20170142190A1 (en) Blade server
US20140337650A1 (en) System and Method for Power Management in a Multiple-Initiator Storage System
US11700705B2 (en) Method, system and apparatus for enabling live and/or hot migration of physical resources

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant