CN103454016A - 一种基于服务器的针对系统温度传感器故障的处理方法 - Google Patents
一种基于服务器的针对系统温度传感器故障的处理方法 Download PDFInfo
- Publication number
- CN103454016A CN103454016A CN 201310438962 CN201310438962A CN103454016A CN 103454016 A CN103454016 A CN 103454016A CN 201310438962 CN201310438962 CN 201310438962 CN 201310438962 A CN201310438962 A CN 201310438962A CN 103454016 A CN103454016 A CN 103454016A
- Authority
- CN
- China
- Prior art keywords
- temperature sensor
- fan
- management unit
- monitoring
- monitoring management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract 3
- 238000012544 monitoring process Methods 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 2
- 238000010168 coupling process Methods 0.000 claims description 2
- 238000005859 coupling reaction Methods 0.000 claims description 2
- 238000011084 recovery Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
Landscapes
- Cooling Or The Like Of Electrical Apparatus (AREA)
Abstract
本发明提供一种基于服务器的针对系统温度传感器故障的处理方法,系统温度传感器和监控管理单元,当系统温度传感器遭遇故障,监控管理单元会立即启动温控应急措施,即将风扇转速开启为全速,保证风扇不会因温度监控失灵而降低转速,从而导致服务器死机或shutdown;于此同时监控管理单元会通过I2C总线复位并重新配置系统温度传感器,如果温度传感器再次工作正常,监控单元则取消温控应急措施,结合系统实际温度,恢复对风扇的正常控制。
Description
技术领域
本发明涉及计算机应用领域,具体地说是一种基于服务器的针对系统温度传感器故障的处理方法。
背景技术
在服务器领域中,由于主板尺寸通常比一般计算机要大,结构也更加复杂;监控管理单元与各温度传感器之间可能相隔很远,这样会增加I2C总线的损耗,或者同一条I2C总线挂载传感器过多,降低I2C总线的驱动能力;在实际的PCB布线设计中,同一条I2C总线会形成分叉,导致信号延迟增加。综上,在服务器中,监控管理单元与温度传感器之间的I2C的信号质量不容易被保障,会产生一定几率的误码,使温度传感器被配置成不正常的状态,监控管理单元不能正确获取系统温度信息,风扇系统失控,严重影响服务器的可靠性及稳定性。
本文阐述的是一种基于服务器的针对系统温度传感器故障的处理方法,虽然不能避免I2C总线误码的发生;但是可以在温度传感器遇到问题或监控单元不能正常获取温度信息时及时采取措施,保证系统稳定运行。同时,此方法还可以有机会重新配置温度传感器,修正温度传感器因I2C误码导致的配置错误。因此,此方法实用性极强,具有极高的商业价值。
发明内容
本发明的目的是提供一种基于服务器的针对系统温度传感器故障的处理方法。
本发明的目的是按以下方式实现的,系统包括:系统温度传感器和监控管理单元,当系统温度传感器遭遇故障,监控管理单元会立即启动温控应急措施,即将风扇转速开启为全速,保证风扇不会因温度监控失灵而降低转速导致服务器死机;于此同时监控管理单元会通过I2C总线复位并重新配置系统温度传感器,如果温度传感器再次工作正常,监控单元则取消温控应急措施,结合系统实际温度,恢复对风扇的正常控制,故障处理方法如下:
1)监控管理单元通过I2C总线轮询温度传感器,获取即时的系统温度信息,并根据当前系统温度状况,控制风扇控制器的输出占空比;
2)温度传感器正常工作时,监控管理单元输出高电平GATE信号,使Mosfet完全导通,此时系统风扇受控于PWM信号;
3)当温度传感器遭遇故障或监控管理单元不能收集正确的温度信息时,监控管理单元立即拉低GATE信号,使Mosfet处于关闭状态,此时风扇的转速控制信号直接上拉到直流电压VCC,风扇全速旋转。
本发明的有益效果是:可以在复杂的服务器中,当遭遇温度传感器故障或监控不到正常的系统温度信息时,采取应急措施,保障系统不会因为过热而导致死机或shutdown;同时复位并重新配置温度传感器,使系统温控系统再次正常工作。
附图说明
图1是系统工作原理图。
具体实施方式
参照说明书附图对本发明的方法作以下详细地说明。
本发明提出了一种基于服务器的针对系统温度传感器故障的处理方法,可以在复杂的服务器中,当遭遇温度传感器故障或监控不到正常的系统温度信息时,采取应急措施,保障系统不会因为过热而导致死机或shutdown;同时复位并重新配置温度传感器,使系统温控系统再次正常工作。
本发明的体系架构如下:
1. 监控管理单元通过I2C总线轮询温度传感器,获取即时的系统温度信息,并根据当前系统温度状况,控制风扇控制器的输出占空比(图1中PWM信号);
2. 温度传感器正常工作时,监控管理单元输出高电平GATE信号,使Mosfet完全导通,此时系统风扇受控于PWM信号;
3. 当温度传感器遭遇故障,或监控管理单元不能收集正确的温度信息时,监控管理单元立即拉低GATE信号,使Mosfet处于关闭状态。此时风扇的转速控制信号直接上拉到直流电压VCC,风扇全速旋转。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。
Claims (1)
1.一种基于服务器的针对系统温度传感器故障的处理方法, 其特征在于系统温度传感器和监控管理单元,当系统温度传感器遭遇故障,监控管理单元会立即启动温控应急措施,即将风扇转速开启为全速,保证风扇不会因温度监控失灵而降低转速导致服务器死机;于此同时监控管理单元会通过I2C总线复位并重新配置系统温度传感器,如果温度传感器再次工作正常,监控单元则取消温控应急措施,结合系统实际温度,恢复对风扇的正常控制,故障处理方法如下:
1)监控管理单元通过I2C总线轮询温度传感器,获取即时的系统温度信息,并根据当前系统温度状况,控制风扇控制器的输出占空比;
2)温度传感器正常工作时,监控管理单元输出高电平GATE信号,使Mosfet完全导通,此时系统风扇受控于PWM信号;
3)当温度传感器遭遇故障或监控管理单元不能收集正确的温度信息时,监控管理单元立即拉低GATE信号,使Mosfet处于关闭状态,此时风扇的转速控制信号直接上拉到直流电压VCC,风扇全速旋转。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201310438962 CN103454016A (zh) | 2013-09-25 | 2013-09-25 | 一种基于服务器的针对系统温度传感器故障的处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201310438962 CN103454016A (zh) | 2013-09-25 | 2013-09-25 | 一种基于服务器的针对系统温度传感器故障的处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103454016A true CN103454016A (zh) | 2013-12-18 |
Family
ID=49736635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201310438962 Pending CN103454016A (zh) | 2013-09-25 | 2013-09-25 | 一种基于服务器的针对系统温度传感器故障的处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103454016A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103970640A (zh) * | 2014-05-08 | 2014-08-06 | 浪潮电子信息产业股份有限公司 | 一种处理服务器的系统温度传感器故障的方法及系统 |
CN105224049A (zh) * | 2015-09-24 | 2016-01-06 | 浪潮电子信息产业股份有限公司 | 一种防止bmc失效后服务器系统过热的方法 |
CN108880916A (zh) * | 2018-08-21 | 2018-11-23 | 郑州云海信息技术有限公司 | 一种基于iic总线的故障定位方法及系统 |
-
2013
- 2013-09-25 CN CN 201310438962 patent/CN103454016A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103970640A (zh) * | 2014-05-08 | 2014-08-06 | 浪潮电子信息产业股份有限公司 | 一种处理服务器的系统温度传感器故障的方法及系统 |
CN105224049A (zh) * | 2015-09-24 | 2016-01-06 | 浪潮电子信息产业股份有限公司 | 一种防止bmc失效后服务器系统过热的方法 |
CN105224049B (zh) * | 2015-09-24 | 2018-10-09 | 浪潮电子信息产业股份有限公司 | 一种防止bmc失效后服务器系统过热的方法 |
CN108880916A (zh) * | 2018-08-21 | 2018-11-23 | 郑州云海信息技术有限公司 | 一种基于iic总线的故障定位方法及系统 |
CN108880916B (zh) * | 2018-08-21 | 2021-06-29 | 郑州云海信息技术有限公司 | 一种基于iic总线的故障定位方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103970640A (zh) | 一种处理服务器的系统温度传感器故障的方法及系统 | |
JP6015178B2 (ja) | 安全システム | |
CN104660440A (zh) | 一种刀片服务器管理系统及其控制方法 | |
CN105677500A (zh) | 一种实时服务器故障诊断的方法 | |
CN102681909A (zh) | 一种基于内存错误的服务器预警方法 | |
CN104461809A (zh) | 一种故障信息管理方法及系统 | |
CN103605596B (zh) | 用于atca刀片上的fpga芯片与bmc芯片协同电源管理系统和方法 | |
CN1728044A (zh) | 一种自动掉电重启装置 | |
TW201119173A (en) | Method of using power supply to execute remote monitoring of an electronic system | |
CN103454016A (zh) | 一种基于服务器的针对系统温度传感器故障的处理方法 | |
CN109699196B (zh) | 电力转换装置和电力转换装置系统 | |
US20120136970A1 (en) | Computer system and method for managing computer device | |
CN102495786B (zh) | 服务器系统 | |
CN102110040A (zh) | Bmc根据不同功率cpu来调整cpu报警温度的方法 | |
CN105226818A (zh) | 一种直流控制保护平台机箱监视控制装置 | |
CN106610712A (zh) | 基板管理控制器复位系统及方法 | |
CN203241986U (zh) | 一种国产服务器的远程控制装置 | |
CN102645290B (zh) | 一种基于服务器的针对系统温度传感器故障的处理方法 | |
CN104035855A (zh) | 硬盘监测方法和装置 | |
US20150100816A1 (en) | Anticipatory protection of critical jobs in a computing system | |
EP3639486B1 (en) | Arrangement and method for connecting various integrated circuits in an automotive control system | |
JP4858886B2 (ja) | 入力電力の監視装置及び入力電力の監視方法 | |
CN108023506B (zh) | 一种磁轴承磁悬浮鼓风机故障检测系统 | |
CN103189641B (zh) | 风力发电设备和用于风力发电设备的受控停机的方法 | |
CN107276832B (zh) | 一种提升psu和系统通信可靠性的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131218 |
|
WD01 | Invention patent application deemed withdrawn after publication |