TW201743210A - 風扇故障偵測及回報 - Google Patents

風扇故障偵測及回報 Download PDF

Info

Publication number
TW201743210A
TW201743210A TW106113857A TW106113857A TW201743210A TW 201743210 A TW201743210 A TW 201743210A TW 106113857 A TW106113857 A TW 106113857A TW 106113857 A TW106113857 A TW 106113857A TW 201743210 A TW201743210 A TW 201743210A
Authority
TW
Taiwan
Prior art keywords
fan
fans
group
duty cycle
logic
Prior art date
Application number
TW106113857A
Other languages
English (en)
Inventor
布萊恩D 凱利
布蘭登A 路賓斯汀
Original Assignee
微軟技術授權有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 微軟技術授權有限責任公司 filed Critical 微軟技術授權有限責任公司
Publication of TW201743210A publication Critical patent/TW201743210A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/001Testing thereof; Determination or simulation of flow characteristics; Stall or surge detection, e.g. condition monitoring
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/004Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids by varying driving speed
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D29/00Details, component parts, or accessories
    • F04D29/58Cooling; Heating; Diminishing heat transfer
    • F04D29/582Cooling; Heating; Diminishing heat transfer specially adapted for elastic fluid pumps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mechanical Engineering (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Thermal Sciences (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

描述了一種風扇故障偵測及回報系統。該系統將具有類似特性的風扇組織成群組。該系統針對一給定的風扇群組建立一或更多個參考特性,且針對各參考特性識別一容差度量。該系統將具有一效能特性(經由監測獲取)的一風扇識別為一問題風扇,該效能特性相對於該風扇所屬的該群組的一相對應參考特性超過該相對應參考特性的容差度量,且該系統產生至少識別該問題風扇的一通知。在實施例中,該系統能夠決定用於分組及用於藉由在該等風扇的運作期間監測該等風扇來識別問題風扇的該等風扇特性。從而,該系統即使在該系統一開始具有關於該等風扇的受限的知識或不具有關於該等風扇的知識時亦能夠偵測問題風扇。

Description

風扇故障偵測及回報
此揭示案關於風扇故障偵測及回報。
風扇通常用以冷卻電子設備及藉此防止這樣的設備過熱。例如,在資料中心,風扇在確保伺服器不過熱時扮演著關鍵的角色。這樣的風扇可包括(但不限於)安裝在塔式伺服器及機架伺服器內及用以冷卻其內部元件的風扇、用以冷卻刀鋒型伺服器(blade server)及收容在機殼(chasis)內之其他電子元件的以機殼安裝的風扇、用以冷卻伺服器及收容在機架(rack)內之其他電子元件的以機架安裝的風扇、及用作資料中心之空氣調節及空氣處置系統之部件的大型風扇。
在許多資料中心中,用以冷卻伺服器的風扇可被移除且由具有不同特性的其他風扇替換。例如,可以每分鐘5,000轉(RPM)的最大轉速運行的以機殼安裝的風扇可被移除且由可以7,000 RPM的最大轉速運行的風扇替換。換出風扇的此能力允許管理資料中心的一方取決於各種因素(包括成本及效能)選擇性地安裝各種不同類型的風扇(例如由不同製造商所製作的風扇、由相同製造商所製作的不同模型的風扇及具有不同特性的其他風扇)。例如,一方可選擇安裝提供最高可能效能的風扇而不論成本。另一方可選擇安裝僅提供對於進行適當的伺服器冷卻來說是必要的效能位準的風扇,藉此節省成本。
在本文中描述了一種風扇故障偵測及回報系統,該系統被配置為將具有類似特性的風扇組織成群組。風扇故障偵測及回報系統更被配置為針對給定的風扇群組建立一或更多個參考特性及針對各參考特性識別容差度量(measure of tolerance)。風扇故障偵測及回報系統又更被配置為將具有透過監測所獲取之至少一個效能特性的風扇識別為問題風扇及產生至少識別問題風扇的通知,該至少一個效能特性與該風扇所屬之群組的相對應參考特性相差一量,該量超過該相對應的參考特性的容差度量。在實施例中,風扇故障偵測及回報系統有利地能夠決定用於分組及用於藉由在風扇的運作期間監測風扇來識別問題風扇的風扇特性。從而,風扇故障偵測及回報系統即使在系統一開始具有關於風扇的受限的知識或不具有關於風扇的知識時亦能夠偵測問題風扇。
係提供此發明內容以使用簡化形式來介紹一系列的概念,該等概念係在實施方式中於以下進一步描述。此發明內容不欲識別申請標的之關鍵特徵或必要特徵,亦不欲用來限制申請標的之範圍。並且,應注意,請求標的不限於實施方式及/或此文件的其他章節中所描述的特定實施例。這樣的實施例僅為了說明目的而呈現於本文中。基於本文中所包含的教示,對於相關領域(或多個)中具技藝者而言,額外的實施例將是明確的。
I.介紹 以下詳細說明參照繪示本發明之示例性實施例的隨附繪圖。然而,本發明的範圍係不限於這些實施例,而是由隨附的請求項所定義。因此,隨附繪圖中所示的那些實施例以外的實施例(例如所繪示實施例的更改版本)還是可由本發明所包括。
說明書中對於「一個實施例」、「一實施例」、「一示例實施例」等等的指稱指示的是,所述的實施例可包括特定特徵、結構或特性,但每個實施例可能不一定包括該特定特徵、結構或特性。並且,這樣的用句不一定指相同的實施例。並且,在將特定的特徵、結構或特性與一實施例結合描述時,認為的是,無論是否明確描述,與其他實施例結合實施這樣的特徵、結構或特性是在相關領域中具技藝者的知識內的。
風扇通常用以冷卻電子設備及藉此防止這樣的設備過熱。例如,在資料中心,風扇在確保伺服器不過熱時扮演著關鍵的角色。這樣的風扇可包括(但不限於)安裝在塔式及機架伺服器內及用以冷卻其內部元件的風扇、用以冷卻刀鋒型伺服器(blade server)及收容在機殼內之其他電子元件的以機殼安裝的風扇、用以冷卻伺服器及收容在機架內之其他電子元件的以機架安裝的風扇、及用作資料中心之空氣調節及空氣處置系統之部件的大型風扇。
在許多資料中心中,用以冷卻伺服器的風扇可被移除且由具有不同特性的其他風扇替換。例如,可以5,000 RPM的最大轉速運行的以機殼安裝的風扇可被移除且由可以7,000 RPM的最大轉速運行的風扇替換。換出風扇的此能力允許管理資料中心的一方取決於各種因素(包括成本及效能)選擇性地安裝各種不同類型的風扇(例如由不同製造商所製作的風扇、由相同製造商所製作的不同模型的風扇及具有不同特性的其他風扇)。例如,一方可選擇安裝提供最高可能效能的風扇而不論成本。另一方可選擇安裝僅提供對於進行適當的伺服器冷卻來說是必要的效能位準的風扇,藉此節省成本。
可能希望監測一或更多個經安裝風扇的效能以偵測已發生故障的風扇以及以異常的、次佳的、不另人滿意的或指示日後風扇故障的方式運作的風扇(在本文中亦一般稱為「問題風扇」)。特別是在風扇本身並不具有內建的診斷控制單元時尤其如此。在例如上述的環境(其中各種不同的風扇類型可安裝在給定的伺服器、機殼、機架或資料中心內)中,可能經安裝風扇或風扇群組的期望特性對於監測實體而言將是未知的。在這樣的情況下,在風扇沒有非常低的效能位準或完全關機的情況下,若可能的話則難以決定風扇是否如期望地運作,因為不存在關於用以與風扇的受監測效能比較的所期望特性的資料。
在本文中描述了解決使用基於習知風扇的冷卻系統的這些及其他問題的風扇故障偵測及回報系統。風扇故障偵測及回報系統被配置為將具有類似特性的風扇組織成群組。風扇故障偵測及回報系統更被配置為針對給定的風扇群組建立一或更多個參考特性及針對各參考特性識別容差度量(measure of tolerance)。風扇故障偵測及回報系統又更被配置為將具有透過監測所獲取之至少一個效能特性的風扇識別為問題風扇及產生至少識別問題風扇的通知,該至少一個效能特性與該風扇所屬之群組的相對應參考特性相差一量,該量超過該相對應的參考特性的容差度量。
在實施例中,風扇故障偵測及回報系統有利地能夠決定用於分組及用於藉由在風扇的運作期間監測風扇來識別問題風扇的風扇特性。從而,風扇故障偵測及回報系統即使在系統一開始具有關於風扇的受限的知識或不具有關於風扇的知識時亦能夠偵測問題風扇。將在本文中更詳細地討論風扇故障偵測及回報系統的這些及其他的優點。
第II節描述各種示例冷卻系統,其中的各者包括具有與上述那些特徵類似之特徵的風扇故障偵測及回報系統。第II節亦描述這樣的風扇故障偵測及回報系統的示例操作方法。第III節描述可用以實施本文中所述之各種實施例的示例的基於處理器的電腦系統。第IV節描述某些額外的示例性實施例。第V節提供某些總結的評論。 II. 用於風扇故障偵測及回報的示例系統及方法
圖1為冷卻系統100的方塊圖。冷卻系統100包括複數個風扇110。在冷卻系統100中,複數個風扇110包括風扇124、風扇126、風扇128、風扇130、風扇132及風扇134。然而,複數個風扇110相較於圖1中所示的數量可包括更多或更少的風扇。
複數個風扇110中的各風扇可用以藉由使空氣(例如經冷卻空氣)朝、跨或通過一或更多個電子設備流動來向這樣的設備提供冷卻。例如,複數個風扇110可用以向資料中心內的一或更多個伺服器提供冷卻,然而這僅是一個非限制性示例。
在一個實施例中,複數個風扇110中的各風扇包括具有可變轉速控制的風扇。例如,複數個風扇110中的各風扇可包括具有可變轉速控制的4線風扇。依據這樣的實施例,連接至4線風扇的第一線用以向該風扇提供恆定的電壓供應,連接至4線風扇的第二線連接至接地,連接至4線風扇的第三線用以向該風扇提供脈衝寬度調變(PWM)訊號(該訊號的工作週期決定了風扇轉速),而連接至4線風扇的第四線從被包括在風扇內的轉速計輸出可用以度量風扇轉速的訊號。然而,這僅為一個示例,且相關領域中具技藝者將理解的是,任何的各式各樣不同的風扇類型可被包括在複數個風扇110中。
複數個風扇110中的各風扇透過風扇管理系統102的相對應連接器連接至風扇管理系統102。如在此背景下所使用的,用語「連接器」應包括適用於在風扇管理系統102及複數個風扇110中的任何風扇之間承載電力及/或訊號的任何實體媒體,且可包括(但決不限於)一或更多個導線或適用於連接到一或更多個導線的介面。一般而言,風扇管理系統102被配置為管理複數個風扇110中之風扇的運作,使得將對上述的電子設備施用所需的冷卻程度。在下文中,要了解的是,風扇管理系統102及風扇110的各種元件之間的交互作用(例如風扇的啟用/停用、控制風扇的轉速及監測風扇效能)可透過上述的連接器來實現。
如圖1中所示,風扇管理系統102包括風扇控制邏輯112、風扇監測邏輯114及風扇故障偵測及回報邏輯116。這些元件中的各者可以硬體實施(例如使用一或更多個數位及/或類比電路實施)、實施為軟體(例如由一或更多個微處理器或微控制器所執行的軟體或韌體)或實施為硬體及軟體的組合。
風扇控制邏輯112被配置為例如藉由開啟及關閉複數個風扇110內之各風扇的電壓供應源來選擇性地啟用及停用該風扇。風扇控制邏輯112亦可被配置為例如藉由變化透過如上文所討論的導線提供至各風扇之PWM訊號的工作週期,來在啟用各風扇時控制複數個風扇110內之各風扇的轉速。在一實施例中,風扇控制邏輯112被配置為與上述的電子設備相關聯、從一或更多個溫度感測器獲取的監測溫度資料,及基於這樣的溫度資料啟用或停用風扇及/或將風扇驅動至所需的風扇轉速。
風扇監測邏輯114被配置為從被包括在複數個風扇110中之各風扇中或定位在該風扇附近的一或更多個感測器接收資料。例如,如上文所討論地,風扇監測邏輯114可接收由被包括在風扇中的各者內的轉速計所產生及透過連接至該風扇的導線所輸出的訊號,其中這樣的轉速計訊號可用以運算風扇的目前轉速。可由風扇監測邏輯114接收的其他感測器資料可包括(但不限於)適用於運算風扇轉速的光或磁感測器資料、來自風速計或適於量測風扇附近之氣流之其他感測器的資料、表示由風扇所消耗之功率量的資料等等。
由風扇監測邏輯114所接收的感測器資料及從其導出的資訊可被提供至風扇控制邏輯112以供其使用。例如,風扇控制邏輯112可將由風扇監測邏輯114所提供的風扇轉速資訊用作一類型的反饋以針對特定風扇決定是否已達到所需的風扇轉速。
由風扇監測邏輯114所接收的感測器資料及從其導出的資訊亦可被提供至風扇故障偵測及回報邏輯112以供其使用,下文將對此討論。
一般而言,風扇故障偵測及回報邏輯116被配置為偵測複數個風扇110之中的問題風扇且向至少一個使用者回報這樣的風扇,使得可維護及/或替換問題風扇。如本文中所使用的,用語「問題風扇」可用以指已發生故障的風扇以及以異常、次佳、不另人滿意或指示日後風扇將發生故障的方式運作的風扇。
風扇故障偵測及回報邏輯116包括風扇分組邏輯118。風扇分組邏輯118被配置為將具有類似特性之複數個風扇110內的風扇組織成群組。因此,例如且如圖1中所示,風扇分組邏輯118已將風扇128及風扇130組織成第一風扇群組140,且已將風扇132及風扇134組織成第二風扇群組142。
為了執行此程序,風扇分組邏輯118可參照儲存在記憶體中的風扇資訊122,該記憶體被包括在風扇管理系統102內或可被該風扇管理系統以其他方式存取。風扇資訊122可包括關於複數個風扇110中之一或更多個風扇的使用者提供的資訊。風扇資訊122亦可包括關於複數個風扇110中之一或更多個風扇之效能特性的資訊,該等效能特性已在風扇運作的同時透過監測而獲取。因此,例如,關於複數個風扇110內之一或更多個風扇的資訊可由風扇監測邏輯114獲取且儲存在記憶體中,該記憶體被包括在風扇管理系統102內或可被該風扇管理系統以其他方式存取。
風扇分組邏輯118更被配置為將其所建立為風扇群組資訊120的關於各風扇群組的資訊儲存在記憶體內,該記憶體被包括在風扇管理系統120內或可被該風扇管理系統以其他方式存取。風扇群組資訊120可例如包括由風扇分組邏輯118所建立之各風扇群組的識別符以及屬於各風扇群組之各風扇的識別符。
風扇故障偵測及回報邏輯116被配置為針對由風扇分組邏輯118所識別的各風扇群組建立一或更多個參考特性。參考特性是被用作用於決定群組中的各風扇是否如所期望地運作之標準或基準的特性。風扇故障偵測及回報邏輯116亦被配置為針對各參考特性識別容差度量(measure of tolerance)。容差度量定義了風扇的受監測效能可能從風扇群組的參考特性偏離但仍不被視為問題風扇的程度或量。給定風扇群組的參考特性及相關聯的容差度量可由風扇故障偵測及回報邏輯116儲存為風扇群組資訊120的一部分或相對於該風扇群組資訊單獨儲存。
如上文所討論的,在複數個風扇110內的風扇在運作時(例如在風扇控制邏輯112的控制下的正常運作期間),風扇監測邏輯114將用以將關於風扇的受監測資訊傳遞至風扇故障偵測及回報邏輯116。風扇故障偵測及回報邏輯116被配置為利用此受監測的資訊來識別一或更多個問題風扇。具體而言,風扇故障偵測及回報邏輯116被配置為將具有至少一個效能特性(透過上述的監測步驟獲取)的風扇識別為問題風扇,該至少一個效能特性與該風扇所屬的群組的相對應參考特性相差一量,該量超過該相對應參考特性的容差度量。
風扇故障偵測及回報邏輯116更被配置為向至少一個使用者回報各問題風扇(亦即提供應關於各問題風扇的資訊)。例如,如圖1中所示,風扇管理系統102透過一或更多個網路104連接至計算設備106及計算設備108。網路104可例如包括部分的或所有的資料中心組構、區域網路(例如企業網路)、廣域網路(例如網際網路)或其某些組合。網路104可包括有線及/或無線網路。風扇故障偵測及回報邏輯116可透過網路104向計算設備136及計算設備138發送關於問題風扇的報告。這樣的報告可由計算設備106的使用者透過該計算設備的使用者介面136檢視或以其他方式感知。同樣地,這樣的報告可由計算設備108的使用者透過該計算設備的使用者介面138檢視或以其他方式感知。如此,可通知這樣的使用者問題風扇,使得可維護或替換問題風扇。可使用向使用者回報問題風扇的又其他的方法。
在實施例中,風扇故障偵測及回報邏輯116能夠決定皆用於分組風扇及用於藉由在該等風扇的運作期間監測風扇(例如藉由從風扇監測邏輯114獲取資訊)來識別群組內的問題風扇的風扇資訊。依據這樣的實施例,風扇故障偵測及回報邏輯116即使在這樣的邏輯一問始具有關於風扇的受限的知識或不具有關於風扇的知識時亦能夠偵測問題風扇。將在下文提供關於風扇故障偵測及回報邏輯116之運作方式的進一步細節。
可在各種不同背景下實施本文中所述的風扇故障偵測及回報技術。例如,圖2為冷卻系統200的方塊圖,該冷卻系統包括了包括依據一實施例之風扇故障偵測及回報邏輯216的機殼管理器202。
具體而言,圖2的冷卻系統200包括了包括複數個風扇210(其包括風扇224、風扇226、風扇228、風扇230、風扇232及風扇234)的機殼250,該等風扇用以針對收容在機殼250內的複數個刀鋒型伺服器252(包括刀鋒型伺服器254及刀鋒型伺服器256)提供冷卻。
複數個風扇210中的各風扇連接至機殼管理器202。機殼管理器202為收容在機殼250內的自動化元件。機殼管理器被配置為執行各種功能,該等功能包括管理複數個風扇210中之風扇的運作,使得將對複數個刀鋒型伺服器252施用所需的冷卻程度。
如圖2中所示,機殼管理器102包括風扇控制邏輯212、風扇監測邏輯214及風扇故障偵測及回報邏輯216。這些元件中的各者可以硬體實施(例如使用一或更多個數位及/或類比電路實施)、實施為軟體(例如由一或更多個微處理器或微控制器所執行的軟體或韌體)或實施為硬體及軟體的組合。這些元件中的各者分別以與如上文參照圖1所描述之風扇控制邏輯112、風扇監測邏輯114及風扇故障偵測及回報邏輯116類似的方式運作。
因此,例如,風扇故障偵測及回報邏輯216內的風扇分組邏輯218可用以將具有類似特性之複數個風扇210內的風扇組織成群組。因此,例如且如圖2中所示,風扇分組邏輯218已將風扇228及風扇230組織成第一風扇群組240,且已將風扇232及風扇234組織成第二風扇群組242。為了執行此程序,風扇分組邏輯218可參照儲存在記憶體中且與圖1的風扇資訊122類似的風扇資訊222,該記憶體被包括在機殼管理器202內或可被該機殼管理器以其他方式存取。風扇分組邏輯218更被配置為將其所建立為風扇群組資訊220的關於各風扇群組的資訊儲存在記憶體內,該記憶體被包括在機殼管理器202內或可被該機殼管理器以其他方式存取。風扇群組資訊220與圖1的風扇群組資訊120類似。
與圖1的風扇故障偵測及回報邏輯116類似,風扇故障偵測及回報邏輯216被配置為針對由風扇分組邏輯218所識別的各風扇群組建立一或更多個參考特性及針對各參考特性識別容差度量。風扇故障偵測及回報邏輯216更被配置為將具有至少一個效能特性(透過監測步驟獲取)的風扇識別為問題風扇,該至少一個效能特性與該風扇所屬的群組的相對應參考特性相差一量,該量超過該相對應參考特性的容差度量。
風扇故障偵測及回報邏輯216更被配置為向至少一個使用者回報各問題風扇(亦即提供應關於各問題風扇的資訊)。例如,風扇故障偵測及回報邏輯216可向計算設備206及/或計算設備208發送關於問題風扇的報告,該等計算設備中的各者透過一或更多個網路204連接至機殼管理器202。這樣的報告可由計算設備206的使用者透過該計算設備的使用者介面236檢視或以其他方式感知。同樣地,這樣的報告可由計算設備208的使用者透過該計算設備的使用者介面238檢視或以其他方式感知。
在進一步實施例中,與圖2中所示之配置類似的配置可實施在機架中而不是機殼中。例如,複數個風扇可附接至機架或被包括在該機架內且用以冷卻收容在其中的複數個塔式或機架伺服器。這樣的風扇可連接至機架管理器,該機架管理器包括以與風扇故障偵測及回報邏輯116類似的方式運作的風扇故障偵測及回報邏輯,以識別問題風扇及向一或更多個使用者回報該等問題風扇。
圖3提供另一實施背景的示例。具體而言,圖3為冷卻系統300的方塊圖,該冷卻系統包括了包括依據一實施例之風扇故障偵測及回報邏輯316的伺服器350。
具體而言,圖3的冷卻系統300包括了包括複數個風扇310(其包括風扇324、風扇326、風扇328、風扇330、風扇332及風扇334)的伺服器350,該等風扇用以針對收容在伺服器350內的複數個伺服器元件352(包括伺服器元件354及伺服器元件356)提供冷卻。
複數個風扇310中的各風扇連接至伺服器冷卻系統302。伺服器冷卻系統302被配置為管理複數個風扇310中之風扇的運作,使得將對複數個風扇伺服器元件352施用所需的冷卻程度。
如圖3中所示,伺服器冷卻系統302包括風扇控制邏輯312、風扇監測邏輯314及風扇故障偵測及回報邏輯316。這些元件中的各者可以硬體實施(例如使用一或更多個數位及/或類比電路實施)、實施為軟體(例如由一或更多個微處理器或微控制器所執行的軟體或韌體)或實施為硬體及軟體的組合。這些元件中的各者分別以與如上文參照圖1所描述之風扇控制邏輯112、風扇監測邏輯114及風扇故障偵測及回報邏輯116類似的方式運作。
因此,例如,風扇故障偵測及回報邏輯316內的風扇分組邏輯318可用以將具有類似特性之複數個風扇310內的風扇組織成群組。因此,例如且如圖3中所示,風扇分組邏輯318已將風扇328及風扇330組織成第一風扇群組340,且已將風扇332及風扇334組織成第二風扇群組342。為了執行此程序,風扇分組邏輯318可參照儲存在記憶體中且與圖1的風扇資訊122類似的風扇資訊322,該記憶體被包括在伺服器冷卻系統302內或可被該伺服器冷卻系統以其他方式存取。風扇分組邏輯318更被配置為儲存其所建立為風扇群組資訊120的關於各風扇群組的資訊,該資訊儲存在記憶體中,該記憶體被包括在伺服器冷卻系統302內或可被該伺服器冷卻系統以其他方式存取。風扇群組資訊320與圖1的風扇群組資訊120類似。
與圖1的風扇故障偵測及回報邏輯116類似,風扇故障偵測及回報邏輯316被配置為針對由風扇分組邏輯318所識別的各風扇群組建立一或更多個參考特性及針對各參考特性識別容差度量。風扇故障偵測及回報邏輯316更被配置為將具有至少一個效能特性(透過監測步驟獲取)的風扇識別為問題風扇,該至少一個效能特性與該風扇所屬的群組的相對應參考特性相差一量,該量超過該相對應參考特性的容差度量。
風扇故障偵測及回報邏輯316更被配置為向至少一個使用者回報各問題風扇(亦即提供應關於各問題風扇的資訊)。例如,風扇故障偵測及回報邏輯316可向計算設備306及/或計算設備308發送關於問題風扇的報告,該等計算設備中的各者透過一或更多個網路304連接至伺服器350。這樣的報告可由計算設備306的使用者透過該計算設備的使用者介面336檢視或以其他方式感知。同樣地,這樣的報告可由計算設備308的使用者透過該計算設備的使用者介面338檢視或以其他方式感知。
圖4提供又另一實施背景的示例。具體而言,圖4為冷卻系統400的方塊圖,該冷卻系統包括了包括依據一實施例之風扇故障偵測及回報邏輯416的空氣處置系統402。
具體而言,圖4的冷卻系統400包括了包括複數個風扇410(其包括風扇424、風扇426、風扇428、風扇430、風扇432及風扇434)的資料中心450,該等風扇用以針對收容在資料中心450內的複數個伺服器機架452(包括伺服器機架454及伺服器機架456)提供冷卻。
複數個風扇410中的各風扇連接至空氣處置系統402。空氣處置系統402被配置為管理複數個風扇410中之風扇的運作,使得將對複數個伺服器機架452施用所需的冷卻程度。
如圖4中所示,空氣處置系統402包括風扇控制邏輯412、風扇監測邏輯414及風扇故障偵測及回報邏輯416。這些元件中的各者可以硬體實施(例如使用一或更多個數位及/或類比電路實施)、實施為軟體(例如由一或更多個微處理器或微控制器所執行的軟體或韌體)或實施為硬體及軟體的組合。這些元件中的各者分別以與如上文參照圖1所描述之風扇控制邏輯112、風扇監測邏輯114及風扇故障偵測及回報邏輯116類似的方式運作。
因此,例如,風扇故障偵測及回報邏輯416內的風扇分組邏輯418可用以將具有類似特性之複數個風扇410內的風扇組織成群組。因此,例如且如圖4中所示,風扇分組邏輯418已將風扇428及風扇430組織成第一風扇群組440,且已將風扇432及風扇434組織成第二風扇群組442。為了執行此程序,風扇分組邏輯418可參照儲存在記憶體中且與圖1的風扇資訊122類似的風扇資訊422,該記憶體被包括在空氣處置系統402內或可被該空氣處置系統以其他方式存取。風扇分組邏輯418更被配置為將其所建立為風扇群組資訊420的關於各風扇群組的資訊儲存在記憶體內,該記憶體被包括在空氣處置系統402內或可被該空氣處置系統以其他方式存取。風扇群組資訊420與圖1的風扇群組資訊120類似。
與圖1的風扇故障偵測及回報邏輯116類似,風扇故障偵測及回報邏輯416被配置為針對由風扇分組邏輯418所識別的各風扇群組建立一或更多個參考特性及針對各參考特性識別容差度量。風扇故障偵測及回報邏輯416更被配置為將具有至少一個效能特性(透過監測步驟獲取)的風扇識別為問題風扇,該至少一個效能特性與該風扇所屬的群組的相對應參考特性相差一量,該量超過該相對應參考特性的容差度量。
風扇故障偵測及回報邏輯416更被配置為向至少一個使用者回報各問題風扇(亦即提供應關於各問題風扇的資訊)。例如,風扇故障偵測及回報邏輯416可向計算設備406及/或計算設備408發送關於問題風扇的報告,該等計算設備中的各者透過一或更多個網路404連接至空氣處置系統402。這樣的報告可由計算設備406的使用者透過該計算設備的使用者介面436檢視或以其他方式感知。同樣地,這樣的報告可由計算設備408的使用者透過該計算設備的使用者介面438檢視或以其他方式感知。
現將參照圖5-8的流程圖來描述冷卻系統100之風扇故障偵測及回報邏輯116可用以偵測及回報問題風扇的各種方式。相關領域中具技藝者將輕易理解的是,亦可由冷卻系統200的風扇故障偵測及回報邏輯216、冷卻系統300的風扇故障偵測及回報邏輯316及冷卻系統400的風扇故障偵測及回報邏輯416執行將描述的方法。並且,亦可由本文中所明確描述的那些系統以外的其他基於風扇的冷卻系統執行所述的方法。
圖5描繪用於偵測及回報在一系統中經歷運作問題之風扇之方法的流程圖500,該系統包括用於依據一實施例冷卻電子設備的複數個風扇。
如圖5中所示,流程圖500的方法開始於步驟502處,其中建立了風扇群組。可例如由風扇故障偵測及回報邏輯116內的風扇分組邏輯118執行此步驟。進一步依據此示例,風扇分組邏輯118可建立至少包括風扇128及風扇130的第一風扇群組140。同樣地,風扇分組邏輯118可建立至少包括風扇132及風扇134的第二風扇群組142。
於步驟504處,識別了在步驟502中所建立之風扇群組內的一或更多個問題風扇。可例如由風扇故障偵測及回報邏輯116執行此步驟。進一步依據此示例,風扇故障偵測及回報邏輯116可識別第一風扇群組140內的一或更多個問題風扇。同樣地,風扇故障偵測及回報邏輯116可識別第二風扇群組142內的一或更多個問題風扇。如上文所討論地,風扇故障偵測及回報邏輯116可將具有至少一個效能特性(透過監測步驟獲取)的風扇識別為問題風扇,該至少一個效能特性與該風扇所屬的群組的相對應參考特性相差一量,該量超過該相對應參考特性的容差度量。
於步驟506處(其是可選的),可在步驟504期間所識別的各問題風扇上執行診斷測試。可例如由風扇故障偵測及回報邏輯116執行此步驟。進一步依據此示例,風扇故障偵測及回報邏輯116可在步驟504期間所識別的各問題風扇上執行診斷測試。這樣的診斷測試可被設計為針對各問題風扇決定風扇損傷的類型、風扇損傷的程度、風扇損傷的嚴重性等等。
於步驟508處,產生了關於在步驟504期間所識別之各問題風扇的通知。可取決於實施方式而產生單一通知或多個通知。各通知可識別一或更多個問題風扇。該等通知可被供應至至少一個使用者。可例如由風扇故障偵測及回報邏輯116執行此步驟。依據此步驟,足以識別各問題風扇的資訊可透過任何合適的通訊媒體傳達至使用者。這樣的回報可允許排程各問題風扇以供進行維護及/或替換。
現將在下文的子節中更詳細地描述流程圖500之上述步驟中的各者。 A.建立風扇群組
風扇故障偵測及回報邏輯116內的風扇分組邏輯118可利用不同的技術來將風扇分配至風扇群組。例如,在一個實施例中,風扇分組邏輯118可被配置為將給定伺服器、機殼或機架內的所有風扇分配至相同的群組。在此情況下,基本假設是,已安裝在伺服器、機殼或機架內的所有風扇屬於相同的類型。基於此假設,期望風扇將具有類似的特性是合理的。類似的邏輯可用以將給定伺服器、機殼或機架內之共享某些實體及/或邏輯特性的風扇(例如同排或列的風扇內的風扇)分配至相同的風扇群組。
在另一實施例中,風扇分組邏輯118被配置為基於針對各風扇之使用者提供的或使用者輸入的風扇資訊來分組風扇。例如,針對圖1的實施例,計算設備106的使用者可與使用者介面136互動來針對複數個風扇110中的一或更多個風扇輸入資訊。同樣地,計算設備108的使用者可與使用者介面138互動來針對複數個風扇110中的一或更多個風扇輸入資訊。可使用又其他的方法來輸入風扇資訊。由使用者所提交的資訊可被儲存為風扇資訊122的一部分且由風扇分組邏輯118利用來決定風扇分組。
使用者輸入的風扇資訊可例如包括且不限於風扇製造商識別符、風扇模型識別符、風扇運作電壓、轉速計輸出訊號特性及PWM控制輸入訊號特性。使用者輸入的風扇資訊可更包括各風扇的一或更多個期望的效能特性。這樣的期望效能特性可包括(但不限於)期望的最大風扇轉速(例如100%工作週期下的風扇轉速)、期望的最小風扇轉速及相對應的工作週期、給定工作週期或提供該工作週期之功能下的期望的風扇轉速、期望的加速時間(亦即在將工作週期從第一值增加至第二(且更大的)值之後使風扇轉速穩定所花費的時間)及期望的減速時間(亦即在將工作週期從第一值減少至第二(且更少的)值之後使風扇轉速穩定所花費的時間)。
一般而言,風扇分組邏輯118可將具有相同或類似的使用者輸入的風扇資訊的風扇分配至相同的風扇群組。因此,例如,具有相同製造商及模型識別符的所有風扇可被分配至相同的群組。作為另一示例,具有相同的期望的最大風扇轉速的所有風扇可被分配至相同的群組。然而,這些僅為一些示例,且相關領域中具技藝者將理解的是,使用者輸入的風扇資訊的任何子集合或組合可用以將風扇分配至風扇群組。
在另一實施例中,風扇分組邏輯118可基於藉由在風扇的運作期間監測該等風扇自動收集的風扇資訊來將風扇分配至群組。依據這樣的實施例,在風扇運作的同時,風扇監測邏輯114可用以從風扇中的各者收集資料,該資料可接著被儲存且由風扇分組邏輯118使用以建立風扇群組。例如,這樣的實施例可完全基於自動收集的風扇資訊且在不使用任何使用者輸入的風扇資訊的情況下,將一或更多個風扇分配至風扇群組。
可經由監測來決定之風扇資訊的示例包括(但不限於)最大風扇轉速(例如100%工作週期下的風扇轉速)、最小風扇轉速及相對應的工作週期、給定工作週期下期望的風扇轉速、期望的加速時間及期望的減速時間。例如,可從完全停止(0 RPM)直到風扇達到該風扇在全工作週期下的最大記錄轉速的10%、25%、37%、50%、90%或95%為止而量測加速時間。可從穩定的較低RPM(例如25%、37%、50%的工作週期)到穩定的較高RPM(例如50%、37%、80%、100%的工作週期)而量測加速時間。如此背景下所使用的,用語「穩定」是要指示相對於可能隨時間連續變化的瞬時轉速而言在給定時段內不大範圍變化的平均轉速。可經由監測來決定的又其他的風扇資訊包括(但不限於)功率消耗量、風扇附近的氣流量等等。可經由監測來決定的又其他的風扇資訊包括(但不限於)相對應於環境改變的受量測的風扇轉速改變。例如,若在資料中心內存在具有實質類似的效能特性的200個風扇,且靜態壓力在一定時間段內改變,且只有一半的風扇展現效能特性上的特定改變,則分組可基於分組的因素(例如兩個靜態壓力中的各者下的量測的效能)。
一般而言,風扇分組邏輯118可將具有經由監測所獲取之相同或類似風扇效能特性的風扇分配至相同的風扇群組。因此,例如,具有相同或類似的最大風扇轉速的所有風扇可被分配至相同的群組。作為另一示例,具有相同或類似的工作週期與風扇轉速的關係(duty-cycle-to-fan-speed relationship)的所有風扇可被分配至相同的群組。然而,這些僅為一些示例,且相關領域中具技藝者將理解的是,經由監測所獲取之風扇特性的任何子集合或組合可用以將風扇分配至風扇群組。
在進一步實施例中,風扇分組邏輯118可依賴使用者輸入的風扇資訊及自動偵測的風扇資訊的組合來將風扇分配至風扇群組。這在具有單一製造商及模型識別符組合的風扇具有不同的效能特性分組(例如由於風扇是來自多個製造場所、多次製造運行或有著不具有外部可識別的改變或標記的硬體改變)時可能是特別有價值的。例如,具有透過使用者輸入所指定的相同製造商及由監測風扇運作所決定的相同或類似最大風扇轉速的風扇一開始可被分配至相同的群組。在某些實施例中,在使用者輸入的風扇資訊過期、具有多個效能特性分組或被錯誤輸入的情況下,可相對於使用者輸入的風扇資訊給予經由監測所獲取的風扇資訊優先性。
為了進一步繪示上文,圖6描繪用於將冷卻系統中的風扇依據一實施例分配至一或更多個群組之方法的流程圖600。可例如由圖1之風扇故障偵測及回報邏輯116內的風扇分組邏輯118執行流程圖600的方法。然而,該方法不限於該實施例。
如圖6中所示,流程圖600的方法開始於步驟602處,其中針對複數個風扇中的各風扇獲取資訊。如上文所討論地,可透過使用者輸入從使用者獲取或藉由在複數個風扇中的各風扇的運作期間監測該風扇來獲取這樣的資訊。可使用又其他的技術以供獲取各風扇的資訊。例如,針對線上資料庫的自動化搜尋可用以收集各風扇的資訊。作為另一示例,可與各風扇實現顯露協定,各風扇透過該協定自行回報關於本身的某些資訊。
於步驟604處,分析與該複數個風扇中的各風扇相關聯的資訊。可實現此分析以例如識別具有相同或類似資訊的風扇。例如,可執行此分析以識別具有相同或類似製造商或模型識別符的風扇。作為另一示例,可執行此分析以識別具有相同或類似效能特性(例如相同或類似的最大風扇轉速、相同或類似的工作週期與風扇轉速的關係、或相同或類似的加速或減速時間)的風扇。在至少某些實施方式中,類似的效能特性分析可包括關聯的環境特性(例如靜態壓力或溫度),該等環境特性可幫助分組類似的風扇。
於步驟606處,至少基於在步驟604期間所執行的分析,該複數個風扇的一或更多個風扇被分配至一群組。例如,在此步驟期間,被決定為具有相同或類似的一或更多個特性或其他資訊的風扇可被分配至相同的群組。
在某些實施例中,可基於至少一個實體風扇及至少一個邏輯風扇間之特性或其他資訊的相似性來建立風扇群組。如本文中所使用的,用語「邏輯風扇」用以指風扇之基於軟體的表示或模型。例如,風扇管理系統102可維護一或更多個邏輯風扇,該等風扇中的各者為真實世界的實體風扇的模型或表示。這些邏輯風扇可例如為被包括在用於資料中心之合格元件列表(QCL)中之風扇之基於軟體的表示或模型。若一或更多個風扇被決定為是與邏輯風扇類似,則這樣的風扇可被添加至與該邏輯風扇相關聯的風扇群組。邏輯風扇本身可被添加至風扇群組,且可作為識別問題風扇之步驟的一部分而監測這樣的邏輯風扇的效能,將在以下子節討論。
在另一實施例中,風扇可藉由適當的機器學習演算法來分配至群組。可離線及/或線上地訓練這樣的機器學習演算法以識別風扇的特徵或特性,該等特徵或特性指示這樣的風扇是否將在運作期間以類似的方式執行。
在進一步實施例中,關於風扇群組的資訊被維護在非揮發性記憶體中,使得可在系統關機及接著再次開機之後參照該等資訊。亦可維護各風扇群組的資訊。此所維護的資訊可用以將新安裝的風扇分配至現存的風扇群組。這樣的所維護的資訊亦可用以產生表示群組的邏輯風扇,而新安裝的風扇可基於新風扇的特性及邏輯風扇的那些特性之間的所決定相似性來分配至該群組。 B.識別風扇群組內的問題風扇
風扇故障偵測及回報邏輯116可利用不同的技術來識別給定風扇群組內的問題風扇。例如,圖7描繪用於依據一實施例識別給定風扇群組內之問題風扇之第一方法的流程圖700。
如圖7中所示,流程圖700的方法開始於步驟702處,其中啟用了風扇群組。步驟702中啟用風扇群組的步驟可包括向風扇群組中的各風扇供應運作電壓。步驟702中啟用風扇群組的步驟可包括向風扇群組中的各風扇驅動具有特定工作週期的PWM訊號以獲取目標風扇轉速。
可例如作為風扇群組所屬之冷卻系統的常態或例行運作的一部分而在步驟702中啟用風扇群組。因此,例如且繼續參照圖1的冷卻系統100,可由風扇控制邏輯112基於一或更多個溫度讀數已超過閾值的決定或基於預定的風扇啟用排程而啟用風扇群組。然而,這些示例不欲為限制性的,且在替代實施例中,可作為診斷程序的一部分而實現在702中啟用風扇群組的步驟。例如,可作為診斷程序的一部分而實現在702中啟用風扇群組的步驟,該診斷程序被設計為識別冷卻系統內的問題風扇。
在步驟704處,在各風扇已啟用之後針對風扇群組中的各風扇經由監測獲取了一或更多個效能特性。在一個實施例中,這樣的監測步驟在已向風扇驅動具有必要工作週期的PWM訊號之後起始於某個預定的時間點,藉此允許風扇的變速延遲(ramp delay)。
可在步驟704期間經由針對風扇群組中的各風扇監測來獲取的效能特性可包括(但不限於)最大風扇轉速(例如100%工作週期下的風扇轉速)、最小風扇轉速及相對應的工作週期、給定工作週期下的期望的風扇轉速、期望的加速時間(亦即在將工作週期從第一值增加至第二(及較大的)值之後使風扇轉速穩定所花費的時間)及期望的減速時間(亦即在將工作週期從第一值減少至第二(且較少的)值之後使風扇轉速穩定所花費的時間)。可經由監測來決定的又其他的效能資訊包括(但不限於)功率消耗量、風扇附近的氣流量等等。
於步驟706處,基於在步驟704期間所決定的效能特性針對風扇群組建立了一或更多個參考特性。如上所述,參考特性是被用作用於決定風扇群組中的各風扇是否如所期望地運作之標準或基準的特性。
在一實施例中,參考特性是藉由比較及/或結合給定風扇群組內之多個風扇的效能特性來決定的。例如且非限制地,風扇群組的參考最大風扇轉速可藉由以下步驟來決定:比較風扇群組中之某些或所有風扇的資訊,以決定哪個風扇具有最大的最大風扇轉速,且接著將該最大的最大風扇轉速用作該風扇群組的參考最大風扇轉速。作為另一示例,風扇群組的參考最大風扇轉速可藉由以下步驟來決定:針對風扇群組中的某些或所有風扇運算平均或中位的最大風扇轉速,且接著將該平均或中位的值用作該風扇群組的參考最大風扇轉速。類似的基於比較的或基於組合的方法可用以決定風扇群組在給定工作週期下的參考風扇轉速、風扇群組的參考加速時間或風扇群組的參考減速時間。
在某些實施例中,可從被包括在給定風扇群組內的一或更多個邏輯風扇收集資料,且將該資料用於決定該風扇群組的參考特性。例如,邏輯風扇可被配置為針對給定的工作週期設定提供風扇轉速資訊(例如RPM或轉速計讀數),且此風扇轉速資訊可用於決定給定風扇群組的參考特性。在某些實例中,風扇群組可包括僅單一的實體風扇及一或更多個邏輯風扇。
於步驟708處,在針對風扇群組建立該一或更多個參考特性之後,針對該一或更多個參考特性中的各者識別容差度量。給定參考特性的容差度量表示相對於參考特性的一偏離程度,該偏離程度被視為是可接受的且因此將不使得將風扇識別為問題風扇。
在一個實施例中,給定參考特性的容差度量可被硬編碼進用於識別問題風扇的演算法。在另一實施例中,給定參考特性的容差度量可由冷卻系統的使用者選擇性地配置。例如,容差度量可包括配置檔案內的可編輯的值,或可包括可由使用者透過與合適的使用者介面(例如命令行介面、圖形使用者介面等等)進行的互動來更改的值。
給定參考特性的容差度量可被選擇為使其包括肇因於回報不精確性之監測風扇特性中的期望的偏離。例如,在參考特性為給定PWM工作週期下之期望的風扇轉速的實施例中,容差度量可被選擇為包括肇因於預期的回報不精確性之監測風扇轉速中的期望的偏離(+/-)。
給定參考特性的容差度量亦可被選擇為考慮由給定的製造商或工業所允許之效能上之典型的或被接受的變異值。例如,若風扇轉速典型變化+/- 10%,則參考風扇轉速的容差度量可被選擇為使其等於+/- 10%或更大(例如+/- 15%)。
在某些實施例中,取決於目標風扇轉速或實際風扇轉速,容差度量可為不同的。因此,例如,在相對低的工作週期或風扇轉速下,容差度量可被設定為使其允許+/- 8%的偏離,而在相對高的工作週期或風扇轉速下,容差度量可被設定為使其允許+/- 3%的偏離。可使用此方法,使得冷卻系統在系統中的電子設備需要高的冷卻程度時將較不容忍降級的效能。例如,若系統中的伺服器接近過熱,則降級的效能的後果可能更大。
在進一步實施例中,容差度量可被運算為相對應參考特性的函數。因此,例如,若參考特性為風扇轉速,則可使用一函數來運算容差度量,該函數使得容差度量隨著風扇轉速增加而減少。
進一步注意的是,給定參考特性的容差度量可被指定為參考特性的百分比(例如如以RPM指定之參考風扇轉速的+/- 10%),或被指定為原始值(例如+/- N RPM,其中N為大於零的某個值)。並且,給定參考特性的容差度量可被設定為零,在此情況下,系統可將風扇群組中以任何方式偏離於參考特性的任何風扇識別為問題風扇。
於步驟710處,在風扇群組中識別問題風扇。問題風扇被識別為風扇群組中的一風扇,該風扇具有與相對應的參考特性相差一量的至少一個效能特性,該量超過該相對應參考特性的容差度量。
例如,一風扇可被識別為問題風扇,因為該風扇具有低於參考風扇轉速一量的最大風扇轉速或給定工作週期下的風扇轉速,該量超過與參考風扇轉速相關聯的容差度量。這可例如指示故障或磨損的風扇馬達。
在另一示例中,一風扇可被識別為問題風扇,因為該風扇具有大於參考風扇轉速一量的最大風扇轉速或給定工作週期下的風扇轉速,該量超過與參考風扇轉速相關聯的容差度量。這可例如指示潤滑劑的損耗及因此指示即將發生的燒毀,或指示安裝風扇不正確。
作為又另一示例,一風扇可被識別為問題風扇,因為該風扇在從第一工作週期設定切換至第二工作週期設定之後具有加速或減速時間,該加速或減速時間大於或小於參考加速時間或參考減速時間一量,該量超過容差度量。例如,緩慢的變速時間可指示潛在的空氣堵塞或風扇降級。
然而,上文僅為某些示例,且其他類型的相對於參考特性的量測偏離可用以識別問題風扇。並且,在某些實施例中,一風扇可僅在其多個效能特性被決定為從多個相對應的參考特性偏離超過那些參考特性的各種容差度量的量時被識別為問題風扇。
圖8描繪用於依據一實施例識別及回報給定群組內之問題風扇之第二方法的流程圖800。如圖8中所示,流程圖800的方法開始於步驟802處,其中針對風扇群組建立了一或更多個參考特性。
在流程圖800的方法中,可基於以各種方式獲取的風扇資訊來決定參考特性。例如,用以建立參考特性的風扇資訊可為用以建立風扇群組的相同的使用者輸入的或系統獲得的資料(例如參照流程圖600之步驟602的上述說明)或以類似方式獲取的資訊。因此,可用以在步驟802中建立參考特性的風扇資訊不限於經由監測所獲取的風扇效能特性。
於步驟804處,針對在步驟802期間所建立之該一或更多個參考特性中的各者獲取容差度量。可以與如上文參照圖7所述之流程圖700的步驟708類似的方式執行此步驟。
於步驟806處,啟用風扇群組。可以與如上文參照圖7所述之流程圖700的步驟702類似的方式執行此步驟。
在步驟808處,在各風扇已啟用之後針對風扇群組中的各風扇經由監測獲取了一或更多個效能特性。可以與如上文參照圖7所述之流程圖700的步驟704類似的方式執行此步驟。
於步驟810處,在風扇群組中識別問題風扇。問題風扇被識別為風扇群組中的一風扇,該風扇具有與相對應的參考特性相差一量的至少一個效能特性,該量超過該相對應參考特性的容差度量。可以與如上文參照圖7所述之流程圖700的步驟710類似的方式執行此步驟。 C. 在問題風扇上執行診斷測試
如上文參照流程圖500的步驟506所述,可在由風扇故障偵測及回報邏輯116識別的各問題風扇上執行診斷測試。例如,風扇故障偵測及回報邏輯116可執行診斷測試以針對各問題風扇決定風扇損傷的類型、風扇損傷的程度、風扇損傷的嚴重性等等。
在一個實施例中,這樣的診斷測試可能涉及以下。若一風扇被決定為在給定的工作週期下具有不是在該給定工作週期下之參考風扇轉速之容差度量內的風扇轉速,則可經由高達最大工作週期(亦即100%)的不同工作週期設定將該風扇變速,且在各工作週期設定下,可將相對應的風扇轉速與參考風扇轉速比較。若決定風扇超過多於一個工作週期設定下或所有工作週期設定下的容差度量,則可增加問題風扇的嚴重性分級或維護優先性。然而,這僅是診斷測試的一個示例,且相關領域中具技藝者將理解的是,可施用各種其他類型的診斷測試以針對各問題風扇決定風扇損傷的類型、風扇損傷的程度、風扇損傷的嚴重性等等。 D.回報問題風扇
一旦已識別風扇群組內的問題風扇,則可產生至少識別問題風扇的通知,且可將該通知供應至一或更多個使用者,使得可測試、維護或替換該問題風扇。這樣的使用者可例如包括維護工程師、技師或資料中心內的其他人員,然而這些僅為示例。在至少某些實施方式中,可延緩回報,除非一風扇已被識別為問題風扇至少某個時間量(例如連續10秒),以減少偽陽性報告。在至少某些實施方式中,在多個風扇同時故障時增加該時間量,以減少由環境因素(無論是否量測)所造成的偽陽性。例如,(未量測的)靜態空氣壓力上的短暫但顯著的增加可能使得1500個個別的風扇上的RPM落在容差外面,但除了24個風扇以外的所有風扇接著在20秒內回到期望的RPM,使得只識別24個風扇(而不是1500個)。
關於問題風扇的報告或通知可包括各種資訊。此資訊可例如包括(且不限於)問題風扇的識別符、內有風扇的伺服器、機殼、機架及/或資料中心區的識別符、關於風扇的運作資料、何時獲取了關於風扇的運作資料的指示、問題風扇超過哪些容差度量(及針對哪些參考特性)的識別、問題風扇超過容差度量之量的指示等等。報告或通知亦可包括在問題風扇偵測程序期間及/或在識別問題風扇之後發生的診斷測試期間所分配的問題嚴重性分級或維護優先性。
各式各樣不同的自動化方法可用以向使用者傳達關於問題風扇的資訊。例如,這樣的資訊可被公佈在被列印或發送至使用者終端機的報告中。作為另一示例,可將這樣的資訊透過簡訊、電子郵件信息或警示發送至使用者設備。亦可將這樣的資訊透過安裝在使用者設備上或從使用者設備取用的資料中心管理應用程式供應至使用者。可使用又其他的方法。 III. 示例電腦系統實施方式
圖9描繪示例的基於處理器的電腦系統900,該系統可用以實施本文中所述的各種實施例。例如,電腦系統900可用以實施如上文參照圖1-4所描述的風扇管理系統102、計算設備106、計算設備108、機殼管理器202、計算設備206、計算設備208、伺服器冷卻系統302、計算設備306、計算設備308、空氣處置系統402、計算設備406或計算設備408。電腦系統900亦可用以實施圖5-8中所描繪的任何或所有流程圖的任何或所有步驟。是為了說明的目的而在本文中提供電腦系統900的說明,且該說明不是限制性的。實施例可以在其他類型的電腦系統中實施,如相關領域中具技藝者會習知的。
如圖9中所示,電腦系統900包括處理單元902、系統記憶體904及匯流排906,該匯流排將包括系統記憶體904的各種系統元件耦合至處理單元902。處理單元902可包括一或更多個微處理器或微處理器核心。匯流排906表示任何若干類型匯流排結構中的一或更多者,包括記憶體匯流排或記憶體控制器、周邊匯流排、加速圖形埠、及使用任何的各種匯流排架構的處理器或本端匯流排。系統記憶體904包括唯讀記憶體(ROM)908及隨機存取記憶體(RAM)910。基本輸入/輸出系統912(BIOS)係儲存於ROM 908中。
電腦系統900亦具有以下驅動機中的一或更多者:用於從硬碟讀取及寫入至該硬碟的硬碟機914、用於從可移除式磁碟918讀取或寫入至該可移除式磁碟的磁碟機916、及用於從可移除式光碟922(例如CD ROM、DVD ROM、BLU-RAYTM光碟或其他光學媒體)讀取或寫入至該可移除式光碟的光碟機920。硬碟機914、磁碟機916及光碟機920係分別藉由硬碟機介面924、磁碟機介面926及光碟機介面928連接至匯流排906。驅動機及它們相關聯的電腦可讀取媒體提供用於電腦之電腦可讀取指令、資料結構、程式模組及其他資料的非揮發性儲存器。雖然描述了硬碟、可移除式磁碟及可移除式光碟,可使用其他類型的電腦可讀取記憶體設備及儲存結構來儲存資料,例如快閃記憶卡、數位影音光碟、隨機存取記憶體(RAM)、唯讀記憶體(ROM)等等。
許多程式模組可儲存於硬碟、磁碟、光碟、ROM或RAM上。這些程式模組包括作業系統930、一或更多個應用程式932、其他程式模組934及程式資料936。依據各種實施例,程式模組可包括可由處理單元902執行以執行如上文參照圖1-4所描述的風扇管理系統102、計算設備106、計算設備108、機殼管理器202、計算設備206、計算設備208、伺服器冷卻系統302、計算設備306、計算設備308、空氣處置系統402、計算設備406或計算設備408的任何或所有功能及特徵的電腦程式邏輯。程式模組亦可包括電腦程式邏輯,該電腦程式邏輯在由處理單元902執行時,執行參照圖5-8的流程圖所圖示或描述的任何步驟或操作。
使用者可經由輸入設備(例如鍵盤938及指向設備940)將命令及資訊鍵入進電腦系統900。其他輸入設備(未圖示)可包括麥克風、搖桿、遊戲控制器、掃描器等等。在一個實施例中,觸控螢幕被提供為與顯示器944結合以允許使用者透過施用觸碰(例如藉由手指或觸控筆)向觸控螢幕上的一或更多個點提供使用者輸入。這些及其他的輸入設備通常經由耦合至匯流排906的序列埠介面942連接至處理單元902,但可藉由其他介面來連接,例如平行埠、遊戲埠或通用序列匯流排(USB)。這樣的介面可為有線或無線介面。
顯示器944亦透過介面(例如視訊配接器946)連接至匯流排906。除了顯示器944以外,電腦系統900可包括其他的周邊輸出設備(未圖示),例如揚聲器及印表機。
電腦系統900經由網路介面或配接器950、數據機952或用於在網路上建立通訊的其他合適手段來連接至網路948(例如區域網路或廣域網路(例如網際網路))。數據機952(其可為內部或外部的)透過序列埠介面942連接至匯流排906。
如本文中所使用的,用語「電腦程式媒體」、「電腦可讀取媒體」及「電腦可讀取儲存媒體」一般用以指記憶體設備或儲存結構,例如與硬碟機914相關聯的硬碟、可移除式磁碟918、可移除式光碟922以及其他的記憶體設備或儲存結構,例如快閃記憶卡、數位影音光碟、隨機存取記憶體(RAM)、唯讀記憶體(ROM)等等。這樣的電腦可讀取儲存媒體與通訊媒體區分且不與通訊媒體重疊(不包括通訊媒體)。通訊媒體一般將電腦可讀取指令、資料結構、程式模組或其他資料包括在調變資料訊號(例如載波)中。用語「調變資料訊號」意指一訊號,該訊號具有其特性集合中的一或更多者或以一方式改變使得將資訊編碼於該訊號中。藉由示例而非限制的方式,通訊媒體包括無線媒體,例如聲學、RF、紅外線及其他的無線媒體。實施例亦針對這樣的通訊媒體。
如上所述,電腦程式及模組(包括應用程式932及其他程式模組934)可儲存在硬碟、磁碟、光碟、ROM或RAM上。亦可透過網路介面950、序列埠介面942或任何其他介面類型來接收這樣的電腦程式。這樣的電腦程式在由應用程式執行或加載時,允許電腦系統900實施本文中所討論之本發明的實施例的特徵。據此,這樣的電腦程式表示電腦系統900的控制器。
實施例亦針對包括儲存在任何電腦可使用媒體上之軟體的電腦程式產品。這樣的軟體在一或更多個資料處理設備中執行時,使得資料處理設備如本文中所述地運作。本發明的實施例採用目前已知或未來的任何電腦可使用或電腦可讀取的媒體。電腦可讀取媒體的示例包括(但不限於)記憶體設備及儲存結構,例如RAM、硬碟機、軟碟、CD ROM、DVD ROM、zip磁碟、磁帶、磁式儲存設備、光學儲存設備、MEM、基於奈米技術的儲存設備等等。
在替代性的實施方式中,電腦系統900可被實施為硬體邏輯/電路系統或韌體。依據進一步實施例,這些元件中的一或更多者可以在晶片上系統(SoC)中實施。SoC可包括積體電路晶片,該積體電路晶片包括以下中的一或更多者以執行其功能:處理器(例如微控制器、微處理器、數位訊號處理器(DSP)等等)、記憶體、一或更多個通訊介面、及/或進一步的電路及/或嵌入式的韌體。 IV. 額外的示例性實施例
在本文中描述了一種用於自動偵測及回報在一系統中經歷運作問題之風扇的方法,該系統包括用於冷卻電子設備的複數個風扇。該方法包括以下步驟:啟用一風扇群組;經由監測,在啟用該風扇群組之後決定該風扇群組中之各風扇的一或更多個效能特性;基於該等經決定的效能特性針對該風扇群組建立一或更多個參考特性;針對該一或更多個參考特性中的各者識別一容差度量;將該風扇群組中的一風扇識別為一問題風扇,該風扇具有至少一個效能特性,該至少一個效能特性與一相對應的參考特性相差一量,該量超過該相對應的參考特性的該容差度量;及產生至少識別該問題風扇的一通知。
在上述方法的一個實施例中,基於該等經決定的效能特性針對該風扇群組建立該一或更多個參考特性的步驟包括:比較或組合與該風扇群組中的二或更多個風扇相關聯的該等經決定的效能特性。
在上述方法的另一實施例中,針對該風扇群組建立該一或更多個參考特性的步驟包括以下步驟中的一或更多者:針對該風扇群組建立一參考最大風扇轉速;針對該風扇群組建立一給定工作週期設定下的一參考風扇轉速;針對該風扇群組建立一參考加速時間,該參考加速時間表示在從一第一工作週期設定切換至一第二工作週期設定之後使一風扇的一轉速穩定所需的一時間量,該第二工作週期設定大於該第一工作週期設定;或針對該風扇群組建立一參考減速時間,該參考減速時間表示在從一第三工作週期設定切換至一第四工作週期設定之後使一風扇的一轉速穩定所需的一時間量,該第四工作週期設定小於該第三工作週期設定。
在上述方法的又另一實施例中,該風扇群組包括一或更多個實體風扇及一或更多個邏輯風扇,其中各邏輯風扇包括一風扇的一軟體模型。
在上述方法的又另一實施例中,針對該一或更多個參考特性中的各者識別該容差度量的步驟包括:識別一或更多個使用者可配置的容差度量。
在上述方法的進一步實施例中,針對該一或更多個參考特性中的各者識別該容差度量的步驟包括:將該一或更多個參考特性中之一特定一者的一容差度量決定為該特定參考特性之一值的一函數。
在上述方法的又進一步的實施例中,該方法更包括以下步驟:在該問題風扇上執行診斷測試。
在上述方法的另一實施例中,產生至少識別該問題風扇的該通知的步驟包括:基於該診斷測試的結果,將一嚴重性分級與該問題風扇相關聯,且將該嚴重性分級包括在該通知中。
在本文中亦描述了一種風扇管理系統。該風扇管理系統包括複數個連接器、風扇分組邏輯及風扇故障偵測及回報邏輯。該複數個連接器被配置為連接至複數個風扇,該風扇管理系統可用以針對該複數個風扇中的各風扇獲取監測的效能特性。該風扇分組邏輯被配置為分析與該複數個風扇中的各風扇相關聯的資訊,且至少基於該分析來選擇性地將該複數個風扇中的一或更多者分配至一群組。該風扇故障偵測及回報邏輯被配置為針對該群組決定一或更多個參考特性,以將該群組內的一風扇識別為一問題風扇及產生至少識別該問題風扇之通知,該風扇具有至少一個受監測的效能特性,該至少一個受監測的效能特性從該一或更多個參考特性中的一個相對應的參考特性偏離一量,該量超過與該一或更多個參考特性中的該相對應的參考特性相關聯的一容差度量。
在上述系統的一個實施例中,與該複數個風扇中的至少一個風扇相關聯之該資訊中的至少某些部分是透過使用者輸入來提供的。
在上述系統的另一實施例中,與該複數個風扇中的至少一個風扇相關聯之該資訊中的至少某些部分透過自動監測該至少一個風扇來獲取的。
在上述系統的又另一實施例中,該風扇分組邏輯被配置為藉由分析以下中的一或更多者來分析與該複數個風扇中的各風扇相關聯的該資訊:一最大風扇轉速;各風扇之一或更多個工作週期設定下的一風扇轉速;或在從一第一工作週期設定切換至一第二工作週期設定之後使各風扇的一轉速穩定的一時間。
在上述系統的又另一實施例中,該風扇分組邏輯被配置為藉由將與該複數個風扇中的各風扇相關聯的該資訊跟與一風扇的一軟體模型相關聯的資訊進行比較,來分析與該複數個風扇中的各風扇相關聯的該資訊。
在本文中亦描述了一種電腦程式產品。該電腦程式產品包括一電腦可讀取記憶體,該電腦可讀取記憶體具有記錄於該電腦可讀取記憶體上的電腦程式邏輯,該電腦程式邏輯在由至少一個處理器執行時,使得該至少一個處理器執行一種用於自動偵測及回報在一系統中經歷運作問題之風扇的方法,該系統包括用於冷卻電子設備的複數個風扇。該方法包括以下步驟:針對一群組建立一或更多個參考特性;針對該一或更多個參考特性中的各者識別一容差度量;啟用該風扇群組;經由監測,在啟用該風扇群組之後決定該風扇群組中之各風扇的一或更多個效能特性;將該風扇群組中的一風扇識別為一問題風扇,該風扇具有至少一個效能特性,該至少一個效能特性與一相對應的參考特性相差一量,該量超過該相對應的參考特性的該容差度量;及產生至少識別該問題風扇的一通知。
在上述電腦程式產品的一個實施例中,針對該風扇群組建立該一或更多個參考特性的步驟包括以下步驟中的一或更多者:針對該風扇群組建立一參考最大風扇轉速;針對該風扇群組建立一給定工作週期設定下的一參考風扇轉速;針對該風扇群組建立一參考加速時間,該參考加速時間表示在從一第一工作週期設定切換至一第二工作週期設定之後使一風扇的一轉速穩定所需的一時間量,該第二工作週期設定大於該第一工作週期設定;或針對該風扇群組建立一參考減速時間,該參考減速時間表示在從一第三工作週期設定切換至一第四工作週期設定之後使一風扇的一轉速穩定所需的一時間量,該第四工作週期設定小於該第三工作週期設定。
在上述電腦程式產品的另一實施例中,該風扇群組包括一或更多個實體風扇及一或更多個邏輯風扇,其中各邏輯風扇包括一風扇的一軟體模型。
在上述電腦程式產品的又另一實施例中,針對該一或更多個參考特性中的各者識別該容差度量的步驟包括:識別一或更多個使用者可配置的容差度量。
在上述電腦程式產品的又另一實施例中,針對該一或更多個參考特性中的各者識別該容差度量的步驟包括:將該一或更多個參考特性中之一特定一者的一容差度量決定為該特定參考特性之一值的一函數。
在上述電腦程式產品的進一步的實施例中,該方法更包括以下步驟:在該問題風扇上執行診斷測試。
在上述電腦程式產品的又進一步實施例中,產生至少識別該問題風扇的該通知的步驟包括:基於該診斷測試的結果,將一嚴重性分級與該問題風扇相關聯,且將該嚴重性分級包括在該通知中。 V. 結論
雖然已在上文描述了各種實施例,應了解,僅是藉由示例而非限制的方式來呈現該等實施例。相關領域中具技藝者將理解的是,可在其中作出形式及細節上的各種改變而不脫離本發明的精神及範圍。因此,本發明的廣度及範圍不應受到任何上述的示例性實施例所限制,而是應僅依據以下的請求項及它們的等效物來定義。
100‧‧‧冷卻系統
102‧‧‧風扇管理系統
104‧‧‧網路
106‧‧‧計算設備
108‧‧‧計算設備
110‧‧‧複數個風扇
112‧‧‧風扇控制邏輯
114‧‧‧風扇監測邏輯
116‧‧‧風扇故障偵測及回報邏輯
118‧‧‧風扇分組邏輯
120‧‧‧風扇群組資訊
122‧‧‧風扇資訊
124‧‧‧風扇
126‧‧‧風扇
128‧‧‧風扇
130‧‧‧風扇
132‧‧‧風扇
134‧‧‧風扇
136‧‧‧計算設備
138‧‧‧使用者介面
140‧‧‧第一風扇群組
142‧‧‧第二風扇群組
200‧‧‧冷卻系統
202‧‧‧機殼管理器
204‧‧‧網路
206‧‧‧計算設備
208‧‧‧計算設備
210‧‧‧複數個風扇
212‧‧‧風扇控制邏輯
214‧‧‧風扇監測邏輯
216‧‧‧風扇故障偵測及回報邏輯
218‧‧‧風扇分組邏輯
220‧‧‧風扇群組資訊
222‧‧‧風扇資訊
224‧‧‧風扇
226‧‧‧風扇
228‧‧‧風扇
230‧‧‧風扇
232‧‧‧風扇
234‧‧‧風扇
236‧‧‧使用者介面
238‧‧‧使用者介面
240‧‧‧第一風扇群組
242‧‧‧第二風扇群組
250‧‧‧機殼
252‧‧‧複數個刀鋒型伺服器
254‧‧‧刀鋒型伺服器
256‧‧‧刀鋒型伺服器
300‧‧‧冷卻系統
302‧‧‧伺服器冷卻系統
304‧‧‧網路
306‧‧‧計算設備
308‧‧‧計算設備
310‧‧‧複數個風扇
312‧‧‧風扇控制邏輯
314‧‧‧風扇監測邏輯
316‧‧‧風扇故障偵測及回報邏輯
318‧‧‧風扇分組邏輯
320‧‧‧風扇群組資訊
322‧‧‧風扇資訊
324‧‧‧風扇
326‧‧‧風扇
328‧‧‧風扇
330‧‧‧風扇
332‧‧‧風扇
334‧‧‧風扇
336‧‧‧使用者介面
338‧‧‧使用者介面
340‧‧‧第一風扇群組
342‧‧‧第二風扇群組
350‧‧‧伺服器
352‧‧‧複數個伺服器元件
354‧‧‧伺服器元件
356‧‧‧伺服器元件
400‧‧‧冷卻系統
402‧‧‧空氣處置系統
404‧‧‧網路
406‧‧‧計算設備
408‧‧‧計算設備
410‧‧‧複數個風扇
412‧‧‧風扇控制邏輯
414‧‧‧風扇監測邏輯
416‧‧‧風扇故障偵測及回報邏輯
418‧‧‧風扇分組邏輯
420‧‧‧風扇群組資訊
422‧‧‧風扇資訊
424‧‧‧風扇
426‧‧‧風扇
428‧‧‧風扇
430‧‧‧風扇
432‧‧‧風扇
434‧‧‧風扇
436‧‧‧使用者介面
438‧‧‧使用者介面
440‧‧‧第一風扇群組
442‧‧‧第二風扇群組
450‧‧‧資料中心
452‧‧‧複數個伺服器機架
454‧‧‧伺服器機架
456‧‧‧伺服器機架
500‧‧‧流程圖
502‧‧‧步驟
504‧‧‧步驟
506‧‧‧步驟
508‧‧‧步驟
600‧‧‧流程圖
602‧‧‧步驟
604‧‧‧步驟
606‧‧‧步驟
700‧‧‧流程圖
702‧‧‧步驟
704‧‧‧步驟
706‧‧‧步驟
708‧‧‧步驟
710‧‧‧步驟
800‧‧‧流程圖
802‧‧‧步驟
804‧‧‧步驟
806‧‧‧步驟
808‧‧‧步驟
810‧‧‧步驟
900‧‧‧電腦系統
902‧‧‧處理單元
904‧‧‧系統記憶體
906‧‧‧匯流排
908‧‧‧ROM
910‧‧‧RAM
912‧‧‧BIOS
914‧‧‧硬碟機
916‧‧‧磁碟機
918‧‧‧可移除式磁碟
920‧‧‧光碟機
922‧‧‧可移除式光碟
924‧‧‧硬碟機介面
926‧‧‧磁碟機介面
928‧‧‧光碟機介面
930‧‧‧作業系統
932‧‧‧應用程式
934‧‧‧其他程式模組
936‧‧‧程式資料
938‧‧‧鍵盤
940‧‧‧指向設備
942‧‧‧序列埠介面
944‧‧‧顯示器
946‧‧‧視訊配接器
948‧‧‧網路
950‧‧‧網路介面
952‧‧‧數據機
隨附的繪圖(其併入本文中且形成本說明書的一部分)繪示了本發明的實施例,且與本說明書一起用以進一步解釋本發明的原理及允許相關領域中具技藝者作出及使用本發明。
圖1為一冷卻系統的方塊圖,該冷卻系統包括了包括依據一實施例之風扇故障及偵測回報邏輯的風扇管理系統。
圖2為一冷卻系統的方塊圖,該冷卻系統包括了包括依據一實施例之風扇故障偵測及回報邏輯的機殼管理器。
圖3為一冷卻系統的方塊圖,該冷卻系統包括了包括依據一實施例之風扇故障偵測及回報邏輯的伺服器。
圖4為一冷卻系統的方塊圖,該冷卻系統包括了包括依據一實施例之風扇故障偵測及回報邏輯的空氣處置系統。
圖5描繪用於偵測及回報在一系統中經歷運作問題之風扇之方法的流程圖,該系統包括用於依據一實施例冷卻電子設備的複數個風扇。
圖6描繪用於將冷卻系統中的風扇依據一實施例分配至一或更多個群組之方法的流程圖。
圖7描繪用於依據一實施例識別給定的風扇群組內之問題風扇之第一方法的流程圖。
圖8描繪用於依據一實施例識別給定的風扇群組內之問題風扇之第二方法的流程圖。
圖9為示例的基於處理器的電腦系統的方塊圖,該系統可用以實施各種實施例。
當與繪圖結合採用時,藉由下文所闡述的詳細說明,本發明的特徵及優點將變得更明確,在該等繪圖中,類似的參考字符在各處識別相對應的構件。在該等繪圖中,類似的參考標號一般指示相同的、功能上類似的及/或結構上類似的構件。一構件第一次出現的繪圖係由相對應參考標號中的最左數字(或多個數字)所指示。
國內寄存資訊 (請依寄存機構、日期、號碼順序註記) 無
國外寄存資訊 (請依寄存國家、機構、日期、號碼順序註記) 無
(請換頁單獨記載) 無
100‧‧‧冷卻系統
102‧‧‧風扇管理系統
104‧‧‧網路
106‧‧‧計算設備
108‧‧‧計算設備
110‧‧‧複數個風扇
112‧‧‧風扇控制邏輯
114‧‧‧風扇監測邏輯
116‧‧‧風扇故障偵測及回報邏輯
118‧‧‧風扇分組邏輯
120‧‧‧風扇群組資訊
122‧‧‧風扇資訊
124‧‧‧風扇
126‧‧‧風扇
128‧‧‧風扇
130‧‧‧風扇
132‧‧‧風扇
134‧‧‧風扇
136‧‧‧計算設備
138‧‧‧使用者介面
140‧‧‧第一風扇群組
142‧‧‧第二風扇群組

Claims (20)

  1. 一種用於自動偵測及回報在一系統中經歷運作問題之風扇的方法,該系統包括用於冷卻電子設備的複數個風扇,該方法包括以下步驟: 啟用一風扇群組; 經由監測,在啟用該風扇群組之後決定該風扇群組中之各風扇的一或更多個效能特性; 基於該等經決定的效能特性針對該風扇群組建立一或更多個參考特性; 針對該一或更多個參考特性中的各者識別一容差度量; 將該風扇群組中的一風扇識別為一問題風扇,該風扇具有至少一個效能特性,該至少一個效能特性與一相對應的參考特性相差一量,該量超過該相對應的參考特性的容差度量;及 產生至少識別該問題風扇的一通知。
  2. 如請求項1所述之方法,其中基於該等經決定的效能特性針對該風扇群組建立該一或更多個參考特性的步驟包括: 比較或組合與該風扇群組中的二或更多個風扇相關聯的該等經決定的效能特性。
  3. 如請求項1所述之方法,其中針對該風扇群組建立該一或更多個參考特性的步驟包括以下步驟中的一或更多者: 針對該風扇群組建立一參考最大風扇轉速; 針對該風扇群組建立一給定工作週期設定下的一參考風扇轉速; 針對該風扇群組建立一參考加速時間,該參考加速時間表示在從一第一工作週期設定切換至一第二工作週期設定之後使一風扇的一轉速穩定所需的一時間量,該第二工作週期設定大於該第一工作週期設定;或 針對該風扇群組建立一參考減速時間,該參考減速時間表示在從一第三工作週期設定切換至一第四工作週期設定之後使一風扇的一轉速穩定所需的一時間量,該第四工作週期設定小於該第三工作週期設定。
  4. 如請求項1所述之方法,其中該風扇群組包括一或更多個實體風扇及一或更多個邏輯風扇,其中各邏輯風扇包括一風扇的一軟體模型。
  5. 如請求項1所述之方法,其中針對該一或更多個參考特性中的各者識別該容差度量的步驟包括: 識別一或更多個使用者可配置的容差度量。
  6. 如請求項1所述之方法,其中針對該一或更多個參考特性中的各者識別該容差度量的步驟包括: 將該一或更多個參考特性中之一特定一者的一容差度量決定為該特定參考特性之一值的一函數。
  7. 如請求項1所述之方法,更包括以下步驟: 在該問題風扇上執行診斷測試。
  8. 如請求項7所述之方法,其中產生至少識別該問題風扇的該通知的步驟包括: 基於該診斷測試的結果,將一嚴重性分級與該問題風扇相關聯,且將該嚴重性分級包括在該通知中。
  9. 一種風扇管理系統,包括: 複數個連接器,被配置為連接至複數個風扇,該風扇管理系統可用以針對該複數個風扇中的各風扇獲取監測的效能特性; 風扇分組邏輯,被配置為分析與該複數個風扇中的各風扇相關聯的資訊,且至少基於該分析來選擇性地將該複數個風扇中的一或更多者分配至一群組;及 風扇故障偵測及回報邏輯,被配置為:針對該群組決定一或更多個參考特性;將該群組內的一風扇識別為一問題風扇,該風扇具有至少一個監測的效能特性,該至少一個監測的效能特性從該一或更多個參考特性中的一個相對應的參考特性偏離一量,該量超過與該一或更多個參考特性中的該相對應的參考特性相關聯的一容差度量;及產生至少識別該問題風扇的一通知。
  10. 如請求項9所述之系統,其中與該複數個風扇中的至少一個風扇相關聯之該資訊中的至少某些部分是透過使用者輸入來提供的。
  11. 如請求項9所述之系統,其中與該複數個風扇中的至少一個風扇相關聯之該資訊中的至少某些部分是透過自動監測該至少一個風扇來獲取的。
  12. 如請求項9所述之系統,其中該風扇分組邏輯被配置為藉由分析以下中的一或更多者來分析與該複數個風扇中的各風扇相關聯的該資訊: 一最大風扇轉速; 各風扇之一或更多個工作週期設定下的一風扇轉速;或 在從一第一工作週期設定切換至一第二工作週期設定之後使各風扇的一轉速穩定的一時間。
  13. 如請求項9所述之系統,其中該風扇分組邏輯被配置為藉由將與該複數個風扇中的各風扇相關聯的該資訊跟與一風扇的一軟體模型相關聯的資訊進行比較,來分析與該複數個風扇中的各風扇相關聯的該資訊。
  14. 一種電腦程式產品,包括一電腦可讀取記憶體,該電腦可讀取記憶體具有記錄於該電腦可讀取記憶體上的電腦程式邏輯,該電腦程式邏輯在由至少一個處理器執行時,使該至少一個處理器執行一種用於自動偵測及回報在一系統中經歷運作問題之風扇的方法,該系統包括用於冷卻電子設備的複數個風扇,該方法包括以下步驟: 針對一風扇群組建立一或更多個參考特性; 針對該一或更多個參考特性中的各者識別一容差度量; 啟用該風扇群組; 經由監測,在啟用該風扇群組之後決定該風扇群組中之各風扇的一或更多個效能特性; 將該風扇群組中的一風扇識別為一問題風扇,該風扇具有至少一個效能特性,該至少一個效能特性與一相對應的參考特性相差一量,該量超過該相對應的參考特性的該容差度量;及 產生至少識別該問題風扇的一通知。
  15. 如請求項14所述之電腦程式產品,其中針對該風扇群組建立該一或更多個參考特性的步驟包括以下步驟中的一或更多者: 針對該風扇群組建立一參考最大風扇轉速; 針對該風扇群組建立一給定工作週期設定下的一參考風扇轉速; 針對該風扇群組建立一參考加速時間,該參考加速時間表示在從一第一工作週期設定切換至一第二工作週期設定之後使一風扇的一轉速穩定所需的一時間量,該第二工作週期設定大於該第一工作週期設定;或 針對該風扇群組建立一參考減速時間,該參考減速時間表示在從一第三工作週期設定切換至一第四工作週期設定之後使一風扇的一轉速穩定所需的一時間量,該第四工作週期設定小於該第三工作週期設定。
  16. 如請求項14所述之電腦程式產品,其中該風扇群組包括一或更多個實體風扇及一或更多個邏輯風扇,其中各邏輯風扇包括一風扇的一軟體模型。
  17. 如請求項14所述之電腦程式產品,其中針對該一或更多個參考特性中的各者識別該容差度量的步驟包括: 識別一或更多個使用者可配置的容差度量。
  18. 如請求項14所述之電腦程式產品,其中針對該一或更多個參考特性中的各者識別該容差度量的步驟包括: 將該一或更多個參考特性中之一特定一者的一容差度量決定為該特定參考特性之一值的一函數。
  19. 如請求項14所述之電腦程式產品,其中該方法更包括以下步驟: 在該問題風扇上執行診斷測試。
  20. 如請求項14所述之電腦程式產品,其中產生至少識別該問題風扇的該通知的步驟包括: 基於該診斷測試的結果,將一嚴重性分級與該問題風扇相關聯,且將該嚴重性分級包括在該通知中。
TW106113857A 2016-06-07 2017-04-26 風扇故障偵測及回報 TW201743210A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US15/175,844 US10519960B2 (en) 2016-06-07 2016-06-07 Fan failure detection and reporting

Publications (1)

Publication Number Publication Date
TW201743210A true TW201743210A (zh) 2017-12-16

Family

ID=59055306

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106113857A TW201743210A (zh) 2016-06-07 2017-04-26 風扇故障偵測及回報

Country Status (2)

Country Link
US (1) US10519960B2 (zh)
TW (1) TW201743210A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI721411B (zh) * 2019-01-30 2021-03-11 廣達電腦股份有限公司 感測和補償系統和補償溫度效應的方法
TWI782219B (zh) * 2018-07-25 2022-11-01 矽創電子股份有限公司 風扇控制系統

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6312645B2 (ja) * 2015-10-09 2018-04-18 ファナック株式会社 ファンの動作異常を報知可能なモータ駆動装置、およびその方法
WO2017072198A1 (en) * 2015-10-29 2017-05-04 Inventio Ag Drive engine arrangement with sensor-monitored fan for an elevator system
US10620674B2 (en) * 2017-06-21 2020-04-14 Cisco Technology, Inc. Predictive monitoring of computer cooling systems
US11609810B2 (en) * 2017-12-07 2023-03-21 Intel Corporation Technologies for predicting computer hardware performance with machine learning
US11221905B2 (en) * 2018-05-17 2022-01-11 International Business Machines Corporation System to monitor computing hardware in a computing infrastructure facility
US11668534B2 (en) * 2018-12-13 2023-06-06 Baltimore Aircoil Company, Inc. Fan array fault response control system
US11762437B2 (en) * 2019-12-13 2023-09-19 Hewlett Packard Enterprise Development Lp Expansion fan device with adjustable fan
CN113641230B (zh) * 2020-04-27 2024-06-25 捷普科技(上海)有限公司 电脑系统
US11366502B2 (en) * 2020-05-18 2022-06-21 Quanta Computer Inc. Fan failure detection
US11614782B2 (en) * 2021-02-25 2023-03-28 Dell Products L.P. Fan blockage detection for an information handling system
CN114658681A (zh) * 2022-04-15 2022-06-24 长虹美菱股份有限公司 一种冰箱风扇检测方法
CN117271272B (zh) * 2023-11-22 2024-02-02 湖南博匠信息科技有限公司 一种基于bmc的风扇在位状态的监测方法及系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6407672B1 (en) 1999-05-18 2002-06-18 Steven A. Grenz Adaptive CPU cooling fan speed monitor device
US6725132B2 (en) * 2002-06-20 2004-04-20 Minebea Co., Ltd. Intelligent cooling fan
US6932696B2 (en) 2003-01-08 2005-08-23 Sun Microsystems, Inc. Cooling system including redundant fan controllers
JP2007513279A (ja) * 2003-11-18 2007-05-24 ディストリビュテッド サーマル システムズ リミテッド 気流調節機器を用いた直列送風機
US7239968B2 (en) 2004-01-28 2007-07-03 Valere Power, Inc. Method and apparatus for predicting fan failure
US7142125B2 (en) 2005-01-24 2006-11-28 Hewlett-Packard Development Company, L.P. Fan monitoring for failure prediction
US7424396B2 (en) 2005-09-26 2008-09-09 Intel Corporation Method and apparatus to monitor stress conditions in a system
US7667967B1 (en) 2008-08-06 2010-02-23 Sun Microsystems, Inc. Liquid-cooled rack with optimized rack heat exchanger design for non-uniform power dissipation
JP5176813B2 (ja) 2008-09-19 2013-04-03 日本電気株式会社 冷却ファンの故障診断システム、故障診断装置、故障診断方法、故障診断プログラムおよび冷却装置
US20100321874A1 (en) 2009-06-18 2010-12-23 Neeloy Bhattacharyya Computer server chassis
CA2769768C (en) 2009-10-27 2013-11-12 Huntair, Inc. Fan array control system
US8788111B2 (en) 2011-08-31 2014-07-22 Hewlett-Packard Development Company, L.P. Identifying a fan connected to a computing device
CN103161746B (zh) 2011-12-08 2016-02-24 鸿富锦精密工业(深圳)有限公司 服务器系统及风扇故障侦测方法
US10257959B2 (en) 2011-12-20 2019-04-09 Maxim Integrated Products, Inc. Method and apparatus for monitoring electromechanical device performance and reliability
TW201344060A (zh) 2012-04-27 2013-11-01 Hon Hai Prec Ind Co Ltd 機櫃系統及其風扇控制系統及其控制方法
US9863852B2 (en) 2012-10-24 2018-01-09 Marvell World Trade Ltd. Failure prediction in a rotating device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI782219B (zh) * 2018-07-25 2022-11-01 矽創電子股份有限公司 風扇控制系統
TWI721411B (zh) * 2019-01-30 2021-03-11 廣達電腦股份有限公司 感測和補償系統和補償溫度效應的方法

Also Published As

Publication number Publication date
US20170350403A1 (en) 2017-12-07
US10519960B2 (en) 2019-12-31

Similar Documents

Publication Publication Date Title
TW201743210A (zh) 風扇故障偵測及回報
US10147048B2 (en) Storage device lifetime monitoring system and storage device lifetime monitoring method thereof
CN109611367B (zh) 基于cpld的风扇控制系统及服务器
US10345774B2 (en) Fan characterization and control system
US20150193325A1 (en) Method and system for determining hardware life expectancy and failure prevention
EP2313831B1 (en) Data center thermal monitoring
CN111486121B (zh) 风扇运作状态诊断装置及其方法
US20060142901A1 (en) Microcontroller methods of improving reliability in DC brushless motors and cooling fans
US9355010B2 (en) Deriving an operational state of a data center using a predictive computer analysis model
CN112069035B (zh) 用于机箱的ipmi板卡健康管理系统以及健康监控方法
CN108181977B (zh) 一种服务器
CN102928690B (zh) 用于电子器件的异常检测方法
TWI721411B (zh) 感測和補償系統和補償溫度效應的方法
CN114153693B (zh) 一种服务器风扇状态监控方法、装置及存储介质
CN104346221A (zh) 服务器硬件设备等级划分、调度管理方法及装置、服务器
JP2019133635A (ja) 分類可能な熱放散調節を有する電子デバイス
CN103729279A (zh) 硬盘温度侦测系统
US9176564B2 (en) Systems and methods for thermal control of a storage enclosure
JP2014182018A (ja) 計測データの補正方法、計測データ監視システム及び計測データ監視プログラム
JP6079578B2 (ja) ストレージ制御装置、ストレージ制御プログラム、およびストレージ制御方法
CN114201021B (zh) 一种存储系统温度管理方法及系统
US8667202B2 (en) Method of powering on HDD modules via connectors in server
CN114816013A (zh) 一种服务器温度控制的方法、装置、设备及介质
US11748674B2 (en) System and method for health reporting in a data center
US8892389B1 (en) Determining a condition of a system based on plural measurements