TW201523239A - 風扇錯誤偵測系統及方法 - Google Patents

風扇錯誤偵測系統及方法 Download PDF

Info

Publication number
TW201523239A
TW201523239A TW102145017A TW102145017A TW201523239A TW 201523239 A TW201523239 A TW 201523239A TW 102145017 A TW102145017 A TW 102145017A TW 102145017 A TW102145017 A TW 102145017A TW 201523239 A TW201523239 A TW 201523239A
Authority
TW
Taiwan
Prior art keywords
fan
controller
server
duration
pin voltage
Prior art date
Application number
TW102145017A
Other languages
English (en)
Inventor
Yu-Chen Huang
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Priority to TW102145017A priority Critical patent/TW201523239A/zh
Publication of TW201523239A publication Critical patent/TW201523239A/zh

Links

Landscapes

  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

一種風扇錯誤偵測及方法應用於伺服器中,該伺服器包括BMC控制器,該BMC控制器藉由通訊管腳將伺服器與風扇控制器相連接,該風扇控制器藉由電氣連接至風扇牆,該風扇牆安裝有一組或多組風扇。所述之風扇錯誤偵測系統包括電位偵測模組,異常報告模組及異常處理模組。電位偵測模組持續監控伺服器與風扇控制器之間的通訊管腳之腳位電壓,異常報告模組根據腳位電壓偵測風扇或風扇控制器是否發生異常,當風扇或風扇控制器發生異常時,異常處理模組藉由降低伺服器的CPU頻率來降低伺服器的系統溫度。

Description

風扇錯誤偵測系統及方法
本發明涉及一種伺服器散熱監控系統及方法,尤其涉及一種風扇錯誤偵測系統及方法。
在伺服器開發專案中,一般採用機櫃共用風扇控制的方法,整個機櫃中共有許多(39部)伺服器共用一組風扇牆。風扇牆的構成包含一組風扇控制器與30組風扇。其中,有3部伺服器與風扇控制器相連,藉此得知風扇的運作狀況是否正常。
其中,風扇及風扇控制器運行狀態的判斷真值表及所包含的意義如下:GPIOO3_TACH3_VPR1的二元值為高(HIGH)表示風扇控制器異常;GPIOO3_TACH3_VPR1的二元值為低(LOW)表示風扇轉速異常,異常情形包含轉速過慢,轉速過快,連接線脫落。在這種二元判斷狀況下,系統無法同時監控風扇控制器與風扇的運作狀況,而客戶又堅持使用這種離散訊號來判斷風扇控制是否正常,如何提供一種有效方法讓伺服器同時監控風扇控制器與風扇的運行狀態就變得非常重要。
鑒於以上內容,有必要提供一種風扇錯誤偵測系統及方法,能夠同時偵測風扇或風扇控制器是否發生異常,當風扇或風扇控制器發生異常時,藉由降低伺服器的CPU頻率來降低伺服器的系統溫度。
所述之風扇錯誤偵測系統運行於伺服器中,該伺服器包括BMC控制器,該BMC控制器藉由通訊管腳將伺服器與風扇控制器相連接,該風扇控制器藉由電氣連接至風扇牆,該風扇牆安裝有一組或多組風扇。所述之風扇錯誤偵測系統包括:電位偵測模組,用於當伺服器開機啟動後持續監控伺服器與風扇控制器之間的通訊管腳之腳位電壓,當BMC控制器接收到風扇控制器產生的中斷訊號時,判斷所述腳位電壓為低電位的持續時間大於預設的週期時間還是所述腳位電壓為高電位的持續時間大於預設的週期時間;異常報告模組,用於當所述腳位電壓為低電位的持續時間大於預設的週期時間,產生風扇轉速發生異常的狀況訊息,當所述腳位電壓為高電位的持續時間大於預設的週期時間,產生風扇控制器發生異常的狀況訊息;異常處理模組,用於藉由降低伺服器的CPU頻率來降低伺服器的系統溫度。
所述之風扇錯誤偵測方法運行於電腦中,該伺服器包括BMC控制器,該BMC控制器藉由通訊管腳將伺服器與風扇控制器相連接,該風扇控制器藉由電氣連接至風扇牆,該風扇牆安裝有一組或多組風扇。該方法包括步驟:當伺服器開機啟動後,持續監控伺服器與風扇控制器之間的通訊管腳之腳位電壓;當BMC控制器接收到風扇控制器產生的中斷訊號時,判斷所述腳位電壓為低電位的持續時間大於預設的週期時間還是所述腳位電壓為高電位的持續時間大於預設的週期時間;當所述腳位電壓為低電位的持續時間大於預設的週期時間,產生風扇轉速發生異常的狀況訊息;當所述腳位電壓為高電位的持續時間大於預設的週期時間,產生風扇控制器發生異常的狀況訊息;及藉由降低伺服器的CPU頻率來降低伺服器的系統溫度。
相較於習知技術,本發明所述之風扇錯誤偵測系統及方法應用於伺服器的BMC控制器中,能夠同時偵測風扇或風扇控制器是否發生異常,當風扇或風扇控制器發生異常時,藉由降低伺服器的CPU頻率來降低伺服器的系統溫度。
圖1係本發明風扇錯誤偵測系統較佳實施例之運行環境示意圖。
圖2係本發明風扇錯誤偵測方法較佳實施例之流程圖。
圖3係伺服器與風扇控制器之間的通訊管腳的電位變化示意圖。
參閱圖1所示,係本發明風扇錯誤偵測系統100較佳實施例之運行環境示意圖。於本實施例中,所述之風扇錯誤偵測系統100安裝並運行於伺服器1中,該伺服器1包括,但不僅限於,BMC控制器(Baseboard Management Controller)10、儲存器12、中央處理器(CPU)13及顯示器14。該BMC控制器包括通訊管腳(Communication Pin)11,並藉由通訊管腳11將伺服器1與風扇控制器2相連接,該風扇控制器2藉由電氣連接至風扇牆3。所述之風扇牆3安裝有一組或多組風扇30,用於對伺服器1進行散熱而降溫。所述之儲存器12可以為記憶體(memory)、Flash儲存器(Flash ROM)、硬碟(Hard disk)或其它磁碟等。
於本實施例中,當通訊管腳11的電位為高電位持續5S時,則判定風扇控制器2毀損;當通訊管腳11的電位為低電位持續5S時,則判定風扇30轉速異常;當通訊管腳11的電位為在100ms的高電位與100ms的低電位之間相位波動時,即判定為風扇30以及風扇控制器2皆運行在正常的狀態,進而有效的同時監控風扇控制器2與風扇30的運行狀態。
所述之風扇錯誤偵測系統100儲存於BMC控制器10中的Flash記憶體(例如Flash ROM)中,能夠藉由偵測伺服器1與風扇控制器2之間的通訊管腳11的電位變化來判斷風扇30或風扇控制器2是否發生異常,並藉由降低伺服器1的CPU頻率來降低伺服器1的系統溫度。所述之風扇錯誤偵測系統100包括電位偵測模組101、異常報告模組102及異常處理模組103。本發明所稱之功能模組是指一種能夠被伺服器1之中央處理器13所執行並且能夠完成固定功能之一系列程式指令段,其儲存於伺服器1之儲存器12或BMC控制器10之Flash記憶體中。關於各功能模組101-104將於圖2及圖3之流程圖中作描述。
參閱圖2所示,係本發明風扇錯誤偵測方法較佳實施例之流程圖。於本實施例中,該方法應用於伺服器1的BMC控制器10中,能夠同時偵測風扇30或風扇控制器2是否發生異常,當風扇30或風扇控制器2發生異常時藉由降低伺服器1的CPU頻率來降低伺服器1的系統溫度。
步驟S21,當伺服器1開機啟動後,電位偵測模組101持續監控伺服器1與風扇控制器2之間的通訊管腳11的腳位電壓。參考圖3A所示,當通訊管腳11的腳位電壓是在預定時間(例如100ms)內的高電位與預定時間(例如100ms)內的低電位之間進行相位波動時,所述電位偵測模組判定風扇30以及風扇控制器2皆運行在正常的狀態。
步驟S22,電位偵測模組101判斷BMC控制器10是否接收到風扇控制器2產生的中斷訊號。於本實施例中,當風扇30的轉速過低或是風扇30被拔除,風扇控制器2將會觸發一個中斷,而此中斷將會把風扇控制器2之間的通訊管腳11的腳位電壓拉低,BMC控制器藉由監控通訊管腳11的腳位電壓而接收到一個中斷訊號,進而得知風扇控制器2的通訊管腳11的腳位電壓為低電位。若BMC控制器10接收到風扇控制器2產生的中斷訊號,則流程執行步驟S23;若BMC控制器10未接收到風扇控制器2產生的中斷訊號,則流程返回步驟S21。
步驟S23,電位偵測模組101判斷所述腳位電壓為低電位的持續時間大於預設的週期時間還是所述腳位電壓為高電位的持續時間大於預設的週期時間。於本實施例中,所述預設的週期時間可以定義為5S,或者依據客戶之需求定義其他週期時間。若通訊管腳11的腳位電壓為低電位的持續時間大於一段週期時間,則流程執行步驟S24;若所述腳位電壓為高電位的持續時間大於預設的週期時間,則流程執行步驟S25。
步驟S24,異常報告模組102產生風扇轉速發生異常的狀況訊息,並將風扇轉速發生異常的狀況訊息顯示在伺服器1的顯示器14上。參考圖3B,當通訊管腳11的腳位電壓為低電位的持續時間大於5S以上時,異常報告模組102即會發佈風扇30轉速發生異常的異常狀況訊息,並且記錄一筆系統事件日誌(system event log)於BMC控制器10的記憶體裡,且同時顯示在顯示器14上以回報風扇30異常情況給系統管理者。
步驟S25,異常報告模組102產生風扇控制器2發生異常的狀況訊息,並將風扇控制器2的異常狀況訊息顯示在伺服器1的顯示器14上。參考圖3C,當通訊管腳11的腳位電壓為高電位的持續時間大於5S以上時,異常報告模組102即會發佈風扇控制器2發生異常的狀況訊息,並且記錄一筆系統事件日誌(system event log)於BMC控制器10的記憶體裡,且同時顯示在伺服器1以回報風扇控制器2異常情況給系統管理者。
步驟S26,異常處理模組103藉由降低伺服器1的CPU頻率來降低伺服器1的系統溫度。於本實施例中,同時間BMC控制器10經由PECI介面觸發中央處理器13之散熱電位管腳(Processor Hot Pin)把CPU頻率在最短時間內拉到最低,以期快速降低伺服器1的系統溫度,避免伺服器1因高溫而毀損。
以上所述僅為本發明之較佳實施例而已,且已達廣泛之使用功效,凡其他未脫離本發明所揭示之精神下所完成之均等轉換或修飾,均應包含於下述之申請專利範圍內。
1‧‧‧伺服器
10‧‧‧BMC控制器
100‧‧‧風扇錯誤偵測系統
101‧‧‧電位偵測模組
102‧‧‧異常報告模組
103‧‧‧異常處理模組
11‧‧‧通訊管腳
12‧‧‧儲存器
13‧‧‧中央處理器
14‧‧‧顯示器
2‧‧‧風扇控制器
3‧‧‧風扇牆
30‧‧‧風扇
1‧‧‧伺服器
10‧‧‧BMC控制器
100‧‧‧風扇錯誤偵測系統
101‧‧‧電位偵測模組
102‧‧‧異常報告模組
103‧‧‧異常處理模組
11‧‧‧通訊管腳
12‧‧‧儲存器
13‧‧‧中央處理器
14‧‧‧顯示器
2‧‧‧風扇控制器
3‧‧‧風扇牆
30‧‧‧風扇

Claims (10)

  1. 一種風扇錯誤偵測系統,運行於伺服器中,該伺服器包括BMC控制器,該BMC控制器藉由通訊管腳將伺服器與風扇控制器相連接,該風扇控制器藉由電氣連接至風扇牆,該風扇牆安裝有一組或多組風扇,其中,所述之風扇錯誤偵測系統包括:
    電位偵測模組,用於當伺服器開機啟動後持續監控伺服器與風扇控制器之間的通訊管腳之腳位電壓,當BMC控制器接收到風扇控制器產生的中斷訊號時,判斷所述腳位電壓為低電位的持續時間大於預設的週期時間還是所述腳位電壓為高電位的持續時間大於預設的週期時間;
    異常報告模組,用於當所述腳位電壓為低電位的持續時間大於預設的週期時間,產生風扇轉速發生異常的狀況訊息,當所述腳位電壓為高電位的持續時間大於預設的週期時間,產生風扇控制器發生異常的狀況訊息;及
    異常處理模組,用於藉由降低伺服器的CPU頻率來降低伺服器的系統溫度。
  2. 如申請專利範圍第1項所述之風扇錯誤偵測系統,其中,當所述之腳位電壓是在預定時間內的高電位與預定時間內的低電位之間進行相位波動時,所述之電位偵測模組判定風扇及風扇控制器皆運行在正常的狀態。
  3. 如申請專利範圍第1項所述之風扇錯誤偵測系統,其中,當風扇轉速過低或是風扇被拔除時,風扇控制器觸發一個中斷而產生中斷訊號,該中斷訊號所述之腳位電壓拉低變為低電位。
  4. 如申請專利範圍第1項所述之風扇錯誤偵測系統,其中,當所述之腳位電壓為低電位的持續時間大於預設的週期時間時,所述之異常報告模組將所述風扇轉速發生異常的狀況訊息記錄在BMC控制器的系統事件日誌裡,並且顯示在伺服器的顯示器上以便回報風扇異常情況給系統管理者。
  5. 如申請專利範圍第1項所述之風扇錯誤偵測系統,其中,當所述之腳位電壓為高電位的持續時間大於預設的週期時間時,所述之異常報告模組將所述風扇控制器發生異常的狀況訊息記錄在BMC控制器的系統事件日誌裡,並且顯示在伺服器的顯示器上以便回報風扇控制器異常情況給系統管理者。
  6. 一種風扇錯誤偵測方法,應用於伺服器中,該伺服器包括BMC控制器,該BMC控制器藉由通訊管腳將伺服器與風扇控制器相連接,該風扇控制器藉由電氣連接至風扇牆,該風扇牆安裝有一組或多組風扇,其中,該方法包括步驟:
    當伺服器開機啟動後,持續監控伺服器與風扇控制器之間的通訊管腳之腳位電壓;
    當BMC控制器接收到風扇控制器產生的中斷訊號時,判斷所述腳位電壓為低電位的持續時間大於預設的週期時間還是所述腳位電壓為高電位的持續時間大於預設的週期時間;
    當所述腳位電壓為低電位的持續時間大於預設的週期時間,產生風扇轉速發生異常的狀況訊息;
    當所述腳位電壓為高電位的持續時間大於預設的週期時間,產生風扇控制器發生異常的狀況訊息;及
    藉由降低伺服器的CPU頻率來降低伺服器的系統溫度。
  7. 如申請專利範圍第6項所述之風扇錯誤偵測方法,該方法還包括步驟:
    當所述之腳位電壓是在預定時間內的高電位與預定時間內的低電位之間進行相位波動時,判定風扇及風扇控制器皆運行在正常的狀態。
  8. 如申請專利範圍第6項所述之風扇錯誤偵測方法,其中,當風扇轉速過低或是風扇被拔除時,風扇控制器觸發一個中斷而產生中斷訊號,該中斷訊號將所述之腳位電壓拉低變為低電位。
  9. 如申請專利範圍第6項所述之風扇錯誤偵測方法,其中,該方法還包括步驟:
    所述之腳位電壓為低電位的持續時間大於預設的週期時間時,將所述風扇轉速發生異常的狀況訊息記錄在BMC控制器的系統事件日誌裡,並且顯示在伺服器的顯示器上以便回報風扇異常情況給系統管理者。
  10. 如申請專利範圍第6項所述之風扇錯誤偵測方法,其中,該方法還包括步驟:
    當所述之腳位電壓為高電位的持續時間大於預設的週期時間時,將所述風扇控制器發生異常的狀況訊息記錄在BMC控制器的系統事件日誌裡,並且顯示在伺服器的顯示器上以便回報風扇控制器異常情況給系統管理者。
TW102145017A 2013-12-06 2013-12-06 風扇錯誤偵測系統及方法 TW201523239A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW102145017A TW201523239A (zh) 2013-12-06 2013-12-06 風扇錯誤偵測系統及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102145017A TW201523239A (zh) 2013-12-06 2013-12-06 風扇錯誤偵測系統及方法

Publications (1)

Publication Number Publication Date
TW201523239A true TW201523239A (zh) 2015-06-16

Family

ID=53935628

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102145017A TW201523239A (zh) 2013-12-06 2013-12-06 風扇錯誤偵測系統及方法

Country Status (1)

Country Link
TW (1) TW201523239A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107870660A (zh) * 2016-09-26 2018-04-03 技嘉科技股份有限公司 电子装置的风扇控制方法
TWI635401B (zh) * 2017-09-11 2018-09-11 技嘉科技股份有限公司 Arm架構伺服器及其管理方法
TWI665459B (zh) * 2018-07-12 2019-07-11 應廣科技股份有限公司 風扇旋轉異常偵測方法與電路
CN110043498A (zh) * 2019-04-11 2019-07-23 苏州浪潮智能科技有限公司 一种服务器风扇转速调控装置、方法及系统
CN111927809A (zh) * 2020-07-10 2020-11-13 苏州浪潮智能科技有限公司 一种基于控制芯片的服务器风扇控制装置及方法
CN117110770A (zh) * 2023-10-23 2023-11-24 深圳华夏恒泰电子有限公司 一种工业风扇安全性能检测装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107870660A (zh) * 2016-09-26 2018-04-03 技嘉科技股份有限公司 电子装置的风扇控制方法
CN107870660B (zh) * 2016-09-26 2020-09-22 技嘉科技股份有限公司 电子装置的风扇控制方法
TWI635401B (zh) * 2017-09-11 2018-09-11 技嘉科技股份有限公司 Arm架構伺服器及其管理方法
TWI665459B (zh) * 2018-07-12 2019-07-11 應廣科技股份有限公司 風扇旋轉異常偵測方法與電路
CN110043498A (zh) * 2019-04-11 2019-07-23 苏州浪潮智能科技有限公司 一种服务器风扇转速调控装置、方法及系统
CN111927809A (zh) * 2020-07-10 2020-11-13 苏州浪潮智能科技有限公司 一种基于控制芯片的服务器风扇控制装置及方法
WO2022007414A1 (zh) * 2020-07-10 2022-01-13 苏州浪潮智能科技有限公司 一种基于控制芯片的服务器风扇控制装置及方法
CN117110770A (zh) * 2023-10-23 2023-11-24 深圳华夏恒泰电子有限公司 一种工业风扇安全性能检测装置
CN117110770B (zh) * 2023-10-23 2024-01-02 深圳华夏恒泰电子有限公司 一种工业风扇安全性能检测装置

Similar Documents

Publication Publication Date Title
CN108181977B (zh) 一种服务器
TW201523239A (zh) 風扇錯誤偵測系統及方法
US7346468B2 (en) Method and apparatus for detecting heat sink faults
US10156987B1 (en) Temperature management in a data storage system
TWI477956B (zh) 電源狀態檢測系統及方法
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
TW201743210A (zh) 風扇故障偵測及回報
US20180164795A1 (en) Fan monitoring system
TW201327490A (zh) 風扇異常報警系統及方法
US10863653B2 (en) Thermal testing system and method of thermal testing
TW201351132A (zh) 伺服器風扇運轉監視系統及方法
JP2013168107A (ja) 情報処理装置、異常検出方法、及び、プログラム
TW201416854A (zh) 伺服器風扇狀態監控方法及系統
CN105426289A (zh) 基板管理控制器及侦测风扇及风扇控制器的方法
US20140379162A1 (en) Server system and monitoring method
US20140321015A1 (en) Power distribution and information handling
TW201445295A (zh) 風扇轉數控制系統及方法
TW201541244A (zh) 動態調整監控模式的系統、方法及伺服器
TWI710895B (zh) 一種電子系統內的風扇控制方法
TW201823989A (zh) 風扇監控系統
WO2017072904A1 (ja) 計算機システム、及び、障害検知方法
TW201816276A (zh) 機櫃風扇控制方法及模組
CN106762771B (zh) 风扇控制系统、散热系统以及风扇控制方法
CN102662820A (zh) 数据保护方法和装置
CN114816013A (zh) 一种服务器温度控制的方法、装置、设备及介质