CN103454016A - 一种基于服务器的针对系统温度传感器故障的处理方法 - Google Patents

一种基于服务器的针对系统温度传感器故障的处理方法 Download PDF

Info

Publication number
CN103454016A
CN103454016A CN 201310438962 CN201310438962A CN103454016A CN 103454016 A CN103454016 A CN 103454016A CN 201310438962 CN201310438962 CN 201310438962 CN 201310438962 A CN201310438962 A CN 201310438962A CN 103454016 A CN103454016 A CN 103454016A
Authority
CN
China
Prior art keywords
temperature sensor
fan
management unit
monitoring
monitoring management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201310438962
Other languages
English (en)
Inventor
李博乐
娄山林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN 201310438962 priority Critical patent/CN103454016A/zh
Publication of CN103454016A publication Critical patent/CN103454016A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明提供一种基于服务器的针对系统温度传感器故障的处理方法,系统温度传感器和监控管理单元,当系统温度传感器遭遇故障,监控管理单元会立即启动温控应急措施,即将风扇转速开启为全速,保证风扇不会因温度监控失灵而降低转速,从而导致服务器死机或shutdown;于此同时监控管理单元会通过I2C总线复位并重新配置系统温度传感器,如果温度传感器再次工作正常,监控单元则取消温控应急措施,结合系统实际温度,恢复对风扇的正常控制。

Description

一种基于服务器的针对系统温度传感器故障的处理方法
技术领域
本发明涉及计算机应用领域,具体地说是一种基于服务器的针对系统温度传感器故障的处理方法。
背景技术
在服务器领域中,由于主板尺寸通常比一般计算机要大,结构也更加复杂;监控管理单元与各温度传感器之间可能相隔很远,这样会增加I2C总线的损耗,或者同一条I2C总线挂载传感器过多,降低I2C总线的驱动能力;在实际的PCB布线设计中,同一条I2C总线会形成分叉,导致信号延迟增加。综上,在服务器中,监控管理单元与温度传感器之间的I2C的信号质量不容易被保障,会产生一定几率的误码,使温度传感器被配置成不正常的状态,监控管理单元不能正确获取系统温度信息,风扇系统失控,严重影响服务器的可靠性及稳定性。
本文阐述的是一种基于服务器的针对系统温度传感器故障的处理方法,虽然不能避免I2C总线误码的发生;但是可以在温度传感器遇到问题或监控单元不能正常获取温度信息时及时采取措施,保证系统稳定运行。同时,此方法还可以有机会重新配置温度传感器,修正温度传感器因I2C误码导致的配置错误。因此,此方法实用性极强,具有极高的商业价值。
发明内容
本发明的目的是提供一种基于服务器的针对系统温度传感器故障的处理方法。
本发明的目的是按以下方式实现的,系统包括:系统温度传感器和监控管理单元,系统温度传感器遭遇故障,监控管理单元会立即启动温控应急措施,即将风扇转速开启为全速,保证风扇不会因温度监控失灵而降低转速导致服务器死机;于此同时监控管理单元会通过I2C总线复位并重新配置系统温度传感器,如果温度传感器再次工作正常,监控单元则取消温控应急措施,结合系统实际温度,恢复对风扇的正常控制,故障处理方法如下:
1)监控管理单元通过I2C总线轮询温度传感器,获取即时的系统温度信息,并根据当前系统温度状况,控制风扇控制器的输出占空比;
2)温度传感器正常工作时,监控管理单元输出高电平GATE信号,使Mosfet完全导通,此时系统风扇受控于PWM信号;
3)当温度传感器遭遇故障或监控管理单元不能收集正确的温度信息时,监控管理单元立即拉低GATE信号,使Mosfet处于关闭状态,此时风扇的转速控制信号直接上拉到直流电压VCC,风扇全速旋转。
本发明的有益效果是:可以在复杂的服务器中,当遭遇温度传感器故障或监控不到正常的系统温度信息时,采取应急措施,保障系统不会因为过热而导致死机或shutdown;同时复位并重新配置温度传感器,使系统温控系统再次正常工作。
附图说明
图1是系统工作原理图。
具体实施方式
 参照说明书附图对本发明的方法作以下详细地说明。
本发明提出了一种基于服务器的针对系统温度传感器故障的处理方法,可以在复杂的服务器中,当遭遇温度传感器故障或监控不到正常的系统温度信息时,采取应急措施,保障系统不会因为过热而导致死机或shutdown;同时复位并重新配置温度传感器,使系统温控系统再次正常工作。
本发明的体系架构如下:
1. 监控管理单元通过I2C总线轮询温度传感器,获取即时的系统温度信息,并根据当前系统温度状况,控制风扇控制器的输出占空比(图1中PWM信号);
2. 温度传感器正常工作时,监控管理单元输出高电平GATE信号,使Mosfet完全导通,此时系统风扇受控于PWM信号;
3. 当温度传感器遭遇故障,或监控管理单元不能收集正确的温度信息时,监控管理单元立即拉低GATE信号,使Mosfet处于关闭状态。此时风扇的转速控制信号直接上拉到直流电压VCC,风扇全速旋转。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1.一种基于服务器的针对系统温度传感器故障的处理方法, 其特征在于系统温度传感器和监控管理单元,系统温度传感器遭遇故障,监控管理单元会立即启动温控应急措施,即将风扇转速开启为全速,保证风扇不会因温度监控失灵而降低转速导致服务器死机;于此同时监控管理单元会通过I2C总线复位并重新配置系统温度传感器,如果温度传感器再次工作正常,监控单元则取消温控应急措施,结合系统实际温度,恢复对风扇的正常控制,故障处理方法如下:
1)监控管理单元通过I2C总线轮询温度传感器,获取即时的系统温度信息,并根据当前系统温度状况,控制风扇控制器的输出占空比;
2)温度传感器正常工作时,监控管理单元输出高电平GATE信号,使Mosfet完全导通,此时系统风扇受控于PWM信号;
3)当温度传感器遭遇故障或监控管理单元不能收集正确的温度信息时,监控管理单元立即拉低GATE信号,使Mosfet处于关闭状态,此时风扇的转速控制信号直接上拉到直流电压VCC,风扇全速旋转。
CN 201310438962 2013-09-25 2013-09-25 一种基于服务器的针对系统温度传感器故障的处理方法 Pending CN103454016A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201310438962 CN103454016A (zh) 2013-09-25 2013-09-25 一种基于服务器的针对系统温度传感器故障的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201310438962 CN103454016A (zh) 2013-09-25 2013-09-25 一种基于服务器的针对系统温度传感器故障的处理方法

Publications (1)

Publication Number Publication Date
CN103454016A true CN103454016A (zh) 2013-12-18

Family

ID=49736635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201310438962 Pending CN103454016A (zh) 2013-09-25 2013-09-25 一种基于服务器的针对系统温度传感器故障的处理方法

Country Status (1)

Country Link
CN (1) CN103454016A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103970640A (zh) * 2014-05-08 2014-08-06 浪潮电子信息产业股份有限公司 一种处理服务器的系统温度传感器故障的方法及系统
CN105224049A (zh) * 2015-09-24 2016-01-06 浪潮电子信息产业股份有限公司 一种防止bmc失效后服务器系统过热的方法
CN108880916A (zh) * 2018-08-21 2018-11-23 郑州云海信息技术有限公司 一种基于iic总线的故障定位方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103970640A (zh) * 2014-05-08 2014-08-06 浪潮电子信息产业股份有限公司 一种处理服务器的系统温度传感器故障的方法及系统
CN105224049A (zh) * 2015-09-24 2016-01-06 浪潮电子信息产业股份有限公司 一种防止bmc失效后服务器系统过热的方法
CN105224049B (zh) * 2015-09-24 2018-10-09 浪潮电子信息产业股份有限公司 一种防止bmc失效后服务器系统过热的方法
CN108880916A (zh) * 2018-08-21 2018-11-23 郑州云海信息技术有限公司 一种基于iic总线的故障定位方法及系统
CN108880916B (zh) * 2018-08-21 2021-06-29 郑州云海信息技术有限公司 一种基于iic总线的故障定位方法及系统

Similar Documents

Publication Publication Date Title
CN103970640A (zh) 一种处理服务器的系统温度传感器故障的方法及系统
JP6015178B2 (ja) 安全システム
CN104660440A (zh) 一种刀片服务器管理系统及其控制方法
CN105677500A (zh) 一种实时服务器故障诊断的方法
CN102681909A (zh) 一种基于内存错误的服务器预警方法
CN104461809A (zh) 一种故障信息管理方法及系统
CN103605596B (zh) 用于atca刀片上的fpga芯片与bmc芯片协同电源管理系统和方法
CN1728044A (zh) 一种自动掉电重启装置
TW201119173A (en) Method of using power supply to execute remote monitoring of an electronic system
CN103454016A (zh) 一种基于服务器的针对系统温度传感器故障的处理方法
CN109699196B (zh) 电力转换装置和电力转换装置系统
US20120136970A1 (en) Computer system and method for managing computer device
CN102495786B (zh) 服务器系统
CN102110040A (zh) Bmc根据不同功率cpu来调整cpu报警温度的方法
CN105226818A (zh) 一种直流控制保护平台机箱监视控制装置
CN106610712A (zh) 基板管理控制器复位系统及方法
CN203241986U (zh) 一种国产服务器的远程控制装置
CN102645290B (zh) 一种基于服务器的针对系统温度传感器故障的处理方法
CN104035855A (zh) 硬盘监测方法和装置
US20150100816A1 (en) Anticipatory protection of critical jobs in a computing system
EP3639486B1 (en) Arrangement and method for connecting various integrated circuits in an automotive control system
JP4858886B2 (ja) 入力電力の監視装置及び入力電力の監視方法
CN108023506B (zh) 一种磁轴承磁悬浮鼓风机故障检测系统
CN103189641B (zh) 风力发电设备和用于风力发电设备的受控停机的方法
CN107276832B (zh) 一种提升psu和系统通信可靠性的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131218

WD01 Invention patent application deemed withdrawn after publication