JP2003150279A - コンピュータ・システムにおける管理システム及びバックアップ管理方法 - Google Patents

コンピュータ・システムにおける管理システム及びバックアップ管理方法

Info

Publication number
JP2003150279A
JP2003150279A JP2002219464A JP2002219464A JP2003150279A JP 2003150279 A JP2003150279 A JP 2003150279A JP 2002219464 A JP2002219464 A JP 2002219464A JP 2002219464 A JP2002219464 A JP 2002219464A JP 2003150279 A JP2003150279 A JP 2003150279A
Authority
JP
Japan
Prior art keywords
management
management processor
controller
power
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002219464A
Other languages
English (en)
Inventor
David R Maciorowski
ディビッド・アール・マッキオロウスキー
Michael John Erickson
マイケル・ジョン・エリックソン
Paul J Mantey
ポール・ジェイ・マンテイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JP2003150279A publication Critical patent/JP2003150279A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Power Sources (AREA)

Abstract

(57)【要約】 【課題】 管理プロセッサの状況を監視する高可用性コ
ントローラを提供する。 【解決手段】 コンピュータ・システムにおける電力,
温度,及び冷却ファン速度をそれぞれ検出する複数のシ
ステム・センサ120と、システム・センサ120に結
合された管理プロセッサ105と、管理プロセッサ10
5及びシステム・センサ120に動作可能に結合された
高可用性コントローラ101と、管理プロセッサ105
の動作状態を示すために、高可用性コントローラ101
に結合された管理プロセッサ105によって生成される
管理プロセッサ状況信号108とを含む。システム・セ
ンサ120は、コンピュータ・システム内の関連した電
源の状態をそれぞれ監視し、コンピュータ・システムへ
の電力をそれぞれ制御する複数の電源コントローラ15
0と、冷却ファン速度を検出しかつ制御する少なくとも
1つの冷却ファン・コントローラ140とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に、コンピュ
ータ・システムに関し、より詳しくは、1つ又は複数の
システム管理プロセッサに障害が発生したときに基本シ
ステム制御機能を提供するバックアップ用の管理プロセ
ッサを含むシステム、すなわち、プロセッサの障害を処
理するバックアップ管理機能を備えたコンピュータ・シ
ステムに関する。また、本発明は、コンピュータ・シス
テムにおいて基本システム機能をバックアップ管理する
ための方法に関する。
【0002】
【従来の技術】特定の既存のコンピュータ・システム
は、電力,電源逐次開閉,温度などのシステム環境の態
様を監視して制御すると共に、前面パネルのインジケー
タを更新するために、管理プロセッサを含んでいる。こ
の管理プロセッサに障害が発生すると、システムの状
況,電力,温度などを監視しかつ制御することができな
いため、システムに障害が生じることがある。
【0003】
【発明が解決しようとする課題】しかしながら、同位
(peer)又はバックアップの管理プロセッサを有す
るシステムでさえ、全ての管理プロセッサに共通するフ
ァームウェアのバグがあると、システム・プロセッサが
効果的に稼働しなくなることがあり、これは、一般に、
それらのプロセッサが全て本質的に同じコードでプログ
ラムされているためであり、従って、欠陥のあるコード
・シーケンスが実行されたきに、全てのプロセッサが同
じ問題に屈する可能性が高い。
【0004】
【課題を解決するための手段】本発明のシステムは、前
述の問題を解決し、管理プロセッサの状況を監視する高
可用性コントローラを提供することによって当該分野で
の進歩を達成する。管理プロセッサに障害が発生する
と、コントローラは、システムが確実に動作し続けるこ
とができるのに必要な機能の少なくとも最小限のセット
の機能を提供する。さらに、高可用性コントローラは、
管理プロセッサによって実行されるコードと同じ一連の
操作を実行せず、従って、管理プロセッサに障害を引き
起こす可能性のある特定の「バグ」による故障の影響を
受けにくい。
【0005】本発明のシステムは、全てのシステム・エ
ンティティへの電力を制御し、システム・ハードウェア
を電源障害及び環境的障害から守る電源管理サブシステ
ムを含む。また、電源管理サブシステムは、前面パネル
のLEDを制御し、電源スイッチによってバルク電源オ
ン/オフ制御を提供する。
【0006】正常のシステム動作中に、管理プロセッサ
が、システムの電力,温度,及び冷却ファンの状況を検
出するシステム・センサを監視すると共に、必要な調整
を行うか或いは問題(プロブレム)を報告する。また、
管理プロセッサは、様々なインジケータを更新し、電源
のオン・オフなどのユーザが始めた事象を監視する。
【0007】管理プロセッサは、常時、適切に動作して
いることを示す出力信号を提供する。高可用性コントロ
ーラは、この信号を監視して、動作管理プロセッサが動
作していることを確認する。管理プロセッサが適切に動
作していることを示していないときには、高可用性コン
トローラは、システム・センサを監視し、システム・イ
ンジケータを更新する。電源の故障や潜在的に危険な温
度上昇などの問題が生じた場合には、高可用性コントロ
ーラは、システムを破損から守るために該当する装置の
電源を順次切断する。さらに、システム・ユーザが、シ
ステムの電源を切断するように決定した場合には、高可
用性コントローラは、電源スイッチに応答し、電源スイ
ッチを使用して、管理プロセッサに障害が発生したとき
にシステムの電源を切断させることができる。
【0008】図1は、本発明のシステム100の基本構
成要素を示すブロック図である。図1に示したように、
システム100のハイ・レベル(高水準)の構成要素
は、1つ又は複数の管理プロセッサ105、高可用性コ
ントローラ101、電力センサ,ファンセンサ,及び温
度センサなどのシステム・センサ120、前面パネルの
インジケータ130、冷却ファン制御モジュール(冷却
ファン・コントローラ)140、複数の電源コントロー
ラ150(15x)、及び電源スイッチ110を含んで
いる。
【0009】管理プロセッサ105は、システム環境の
様々な態様を監視すると共に、例えば、電源コントロー
ラ15x(図2に示したローカル電源モジュール(LP
M)151,152,153)によって電源を制御し、
モジュール140で制御された冷却ファン145によっ
て温度を制御し、かつ、前面パネルのインジケータ13
0を更新する。また、管理プロセッサ105は、周辺装
置やバス管理などのための入出力コントローラを含むコ
ア入出力(コアI/O)ボード104と関連した動作を
管理する。高可用性コントローラ101は、管理プロセ
ッサ105の状況、並びに、電力センサ,ファンセン
サ,及び温度センサなどのシステム・センサ120を監
視する。高可用性コントローラ101が全ての管理プロ
セッサ105の故障を検出するような状況下において、
後に詳細に示すようなシステム100の制御がなされ
る。
【0010】高可用性コントローラ101は、管理プロ
セッサ105によって実行されるコードと同じ一連の操
作を実行しないので、管理プロセッサ105の障害を引
き起こす可能性のある特定の「バグ」によって生じる障
害の影響を受けにくい。
【0011】正常のシステム動作 管理プロセッサ105が適切に動作している間に、以下
の事象が起こる。前面パネルの電源スイッチ110が押
されたとき、高可用性コントローラ101は、これを認
識し、割り込み(インタラプト)によって主管理プロセ
ッサに通知する。管理プロセッサ105は、有能電力に
対する必要電源を評価し、少なくとも1つのシステム電
源が使用可能でかつ適切に動作している場合は、管理プ
ロセッサ105は、高可用性コントローラ101にシス
テムの電源を投入するようにコマンドを送る。
【0012】図2は、本発明のシステムの例示的な実施
形態に用いられている構成要素をより詳細に示してい
る。正常のシステム動作中に前面パネルの電源スイッチ
110が押されると、以下の構成要素の電源が投入され
る。 (1) システム・バックプレーン118 (2) PCI(入出力カード)バックプレーン125 (3) 関連するセル・ボード102
【0013】システム100は、複数のPCIバックプ
レーン125を含むことができ、それぞれのPCIバッ
クプレーン125が、複数の関連したセル・ボード10
2を含むことができることに留意されたい。本発明のシ
ステムにおいて、セル(ボード)102は、複数のプロ
セッサ115及びそれと関連したハードウェア/ファー
ムウェア及びメモリ(図示せず)と、セルへの電力を制
御するローカル電源モジュール152と、プロセッサ1
15と管理プロセッサ105を含む外部エンティティと
の間の情報の流れを管理するローカル・サービス・プロ
セッサ116とを含んでいる。
【0014】前面パネルの電源スイッチ110は、ハー
ド切換モードとソフト切換モードの両方においてシステ
ム100への電力を制御する。これにより、管理プロセ
ッサ105が機能しない場合でも、システムに電力を供
給しそして切断することができる。前面パネルの電源ス
イッチ110が押されたとき、セル・ボード102が存
在しない場合には、そのPCIバックプレーン125の
電源が投入されない。セル・ボード102は存在する
が、PCIバックプレーン125が存在しない場合に
は、セル・ボード102の電源が投入される。前面パネ
ルの電源スイッチ110が再び押されたとき、管理プロ
セッサ105には再び割り込みにより通知される。次
に、管理プロセッサ105は、適切なシステム・エンテ
ィティに通知し、システムは電源が切断される。
【0015】セル存在(Cell Present)信号114が、
セル・ボード102上のコネクタに配置されたピンを介
して、システム・ボード(及び、高可用性コントローラ
101)に送られる。セル・ボード102が、システム
・ボードから引き抜かれた場合には、セル存在信号11
4が中断(インタラプト)され、システム・ボードが非
アクティブ状態になる。高可用性コントローラ101
は、セル存在信号114を監視し、セル電源イネーブル
(Cell Power Enable)信号113がアクティブであ
り、セル・ボード102の「セル存在」信号114が非
アクティブの場合には、ボードへの電力は直ぐにディス
エーブル(disable)され、セル・ボードへの電力が明
示的に再びイネーブル(re-enable)されるまでディス
エーブルされたままである。「コア入出力存在(Core I
/O present)」信号109は、コア入出力ボード・コ
ネクタ上に配置されたピンを介してシステム・ボードに
送られる。コア入出力ボード104がシステム・ボード
から引き抜かれた場合には、コア入出力存在信号109
が中断されて、システム・ボードが非アクティブ状態に
なる。
【0016】コア入出力ボード104は、管理プロセッ
サ105の応答を監視して、プロセッサが適切に動作し
ているかどうかを判定するための支援を行う監視タイマ
117を含んでいる。管理プロセッサ105は、システ
ム動作環境の完全性を確認するファームウェア・タスク
を含んでおり、それにより、管理プロセッサの適切な操
作性の基準が追加される。
【0017】管理プロセッサなしの動作 図3は、本発明のシステムによる方法を実施する際に実
行される例示的な一連のステップを示すフローチャート
である。システムの動作は、互いに関連した図2と図3
を見ることによってより良く理解することができる。本
発明のシステムの例示的な実施形態において、図3に示
した動作は、オペレーション・ステートマシン(動作状
態機械;operation state machine)103、すなわち
非ソフトウェア・コード化ステートマシン103によっ
て実行される。図3に示したように、ステップ300に
おいて、高可用性コントローラ101のステートマシン
103は、「管理プロセッサOK」(動作中)[MP_
OK]信号108(すなわち、管理プロセッサ状況信号
108)によって管理プロセッサ105の状況を監視す
る。ステップ305において、MP_OK信号108が
アクティブとして検出された場合には、管理プロセッサ
105は、適切に動作しているものと仮定され、ステー
トマシン103は、ステップ300において、監視プロ
セスを続行する。
【0018】ステートマシン103が、MP_OK信号
108をアクティブでないと検出した場合には、高可用
性コントローラ(HAC)101は、ステップ310に
おいて、管理プロセッサ105がシステム内に存在しな
いか或いは動作していないと想定して、システム100
の管理を引き継ぎ、管理プロセッサ105に障害が生じ
る直前と同じ動作状態にする。
【0019】高可用性コントローラ101は、冷却ファ
ンモジュール(ファン・コントローラ・モジュール)1
40によってシステム及びコアI/Oの冷却ファン14
5をイネーブル(動作可能)する。冷却ファンモジュー
ル140は、高可用性コントローラ101からの非アク
ティブSP_OK(管理プロセッサOK)信号141に
よって、管理プロセッサ105が動作していないことを
認識し、そのファン速度を、非監視動作に適切なデフォ
ルトにセットする。冷却ファンモジュール140によっ
てファン障害が検出された場合には、高可用性コントロ
ーラ101は、これを認識し(冷却ファンモジュール1
40からのファン障害インタラプトにより)、システム
の電源を切断する。
【0020】「セル存在」信号114は、セル・ボード
・コネクタ上に配置されたピンを介して高可用性コント
ローラ101に送られる。セル・ボードが引き抜かれた
場合には、セル存在信号が中断され、高可用性コントロ
ーラ101が非アクティブになる。ステートマシン10
3が、セル存在信号114を監視し、そして、セル・ボ
ードへのセル電力イネーブル信号113がアクティブで
あって、セル・ボードのセル存在信号114が非アクテ
ィブになった場合には、ボードへの電力が直ちにディス
エーブルされ、ボードへの電力が明示的に再びイネーブ
ルされるまでディスエーブルされたままになる。コア入
出力存在信号109は、コア入出力ボード・コネクタ上
のピンを介して高可用性コントローラ101に送られ
る。コア入出力ボード104が引き抜かれた場合には、
コア入出力存在信号109が中断され、それにより高可
用性コントローラ101が非アクティブになる。
【0021】各々の電力供給可能(powerable)なエン
ティティ(セル102,システム・バックプレーン11
8,及びPCIバックプレーン125)から提供される
以下の基本信号が、高可用性コントローラ(HAC)1
01によって使用される。 (1) 高可用性コントローラ(HAC)101からエ
ンティティ・ローカル電源モジュール(LPM)への
「電力イネーブル」信号(113,122) (2) 高可用性コントローラ101への「デバイス存
在」信号(109,114) (3) 高可用性コントローラ101への「装置準備完
了」信号 (4) 高可用性コントローラ101への「電源良好」
信号 (5) 高可用性コントローラ101への「電源障害」
信号(セルのローカル・サービス・プロセッサ116に
提供されるセルLPM障害指示を除く) 分かりやすくするために、後ろの3つの信号[(3)〜
(5)]は、それぞれ、セル102,システム・バック
プレーン118,及びPCIバックプレーン125につ
いてそれぞれライン112,119及び121で示した
ような図2の信号ラインに組み込まれる。
【0022】ステップ315において、ステートマシン
103が、管理プロセッサOK信号108を監視して、
管理プロセッサ105が再び正常に動作しているかどう
かを判定する。管理プロセッサ105が動作しているこ
とを判定したとき、制御が管理プロセッサ105に渡さ
れ、高可用性コントローラ101は、ステップ300に
おいて、その状況監視機能を再開する。
【0023】高可用性コントローラのロジック 図4は、本発明のシステムの高可用性コントローラ10
1をより詳細に示すブロック図である。図4に示したよ
うに、高可用性コントローラ(HAC)101は、管理
プロセッサ105によるアクセスのために制御及び状況
情報を集中化する。本発明のシステムの例示的な実施形
態において、高可用性コントローラ101は、フィール
ド・プログラマブル・ゲート・アレイ(FPGA)とし
て実現されているが、代替として、他のソフトウェアコ
ード化装置を使用することができる。何れにしても、高
可用性コントローラ101は、管理プロセッサ105に
よって実行されるコードと同じ一連の操作を実行しない
ようになっている。
【0024】システム100の動作を監視している間
に、高可用性コントローラ101は、次のようなセンサ
信号及び制御信号を受け取るか或いは生成する。 (1) 前面パネルの電源スイッチ110は、高可用性
コントローラ101によって監視される。 (2) ファン障害信号は、冷却ファンモジュール14
0によって検出された冷却ファン145の問題点を報告
する。ファン障害並びにバックプレーン電源障害は、セ
ル・ボード102を除いて、割り込みバス401によっ
て報告され、ファン障害信号は、そこから対応するロー
カル・サービス・プロセッサ116に送られる。 (3) システムにボードが適切に差し込まれたことを
示す「デバイス存在」信号405が、各主要ボード、す
なわちシステム内のセル102,入出力バックプレーン
125,及びコア入出力管理プロセッサ104(並び
に、前面パネル及び大容量記憶ボード[図示せず])か
ら送られる。 (4) それぞれの関連した電力供給可能なエンティテ
ィの電力を制御するために、「電源イネーブル」信号4
20が、それぞれのローカル電源モジュール15xに送
られる。「電源良好」の状況は、主電源及び電力供給可
能なエンティティからの信号410によって、各エンテ
ィティ毎に適切な電源の投入と切断を確定する。 (5) システム内の各ボードから「LPM準備完了」
信号415が来る。この信号は、特定のローカル電源モ
ジュール(LPM)15xが適切にリセットされたこ
と、必要なリソースが全て存在していること、及び、ロ
ーカル電源モジュール15xが関連ボードの電源を投入
する準備ができていることを示す。 (6) 主電源,予備電源,及び管理プロセッサOKの
前面パネル・インジケータ(LEDや他の表示装置)1
30、及び、オペレーティング・システムによって制御
される他のインジケータが、高可用性コントローラ10
1によって制御可能である。
【0025】ライン402,403で示されたバスは、
高可用性コントローラ101のフィールド・プログラマ
ブル・ゲート・アレイ(FPGA)の内部にあり、それ
ぞれ「データ出力」と「データ入力」としての役割をす
る。本発明のシステムの例示的な実施形態において、ブ
ロック106(図2及び図4参照)は、管理プロセッサ
105と複数のセンサとの間のリモート・インタフェー
スを提供して前述の制御を行う12Cバス・インタフェ
ースである。
【0026】高可用性コントローラのオペレーション・
ステートマシン 図5は、高可用性コントローラ101のオペレーション
・ステートマシン103によって実行される例示的な一
連のステップを示すフローチャートである。図5に示し
たように、ステップ505におけるシステム・ブート操
作の後に、ステップ510において、全ての管理プロセ
ッサ105(1)〜105(N)が、その各々のオペレ
ーティング・システムの実行をそれぞれ開始し、デフォ
ルトの主管理プロセッサ105(P)として指定された
管理プロセッサ105は、高可用性コントローラ101
に、その主プロセッサの状況を知らせる。次に、高可用
性コントローラ101は、管理プロセッサ105(P)
をイネーブルし、それにより、I2Cバス111によ
り、前述の監視機能と制御機能を含む、管理プロセッサ
が担当する全てのシステム機能を制御する。管理プロセ
ッサ105は、全て、電力センサ,ファンセンサ,及び
温度センサ120から入力を受け取るが(I2Cバス1
11を介して)、主管理プロセッサ105Pだけは、関
連するシステム機能を制御する。
【0027】ステップ515において、全ての管理プロ
セッサ105(1)〜105(N)が、その監視タイマ
117を始動(リセット)する。この例示的な実施形態
において、各監視タイマ117は、ユーザが調整可能な
約6〜10秒のタイムアウト期間を有するが、特定のシ
ステム100に適したように他のタイマ設定値を選択す
ることができる。ステップ520において、監視タイマ
117が動作している限りアクティブ状態に保持される
管理プロセッサOK(MP_OK)信号108が、高可
用性コントローラ101に送信される。所定の管理プロ
セッサ105が適切に機能しているときには、この管理
プロセッサ105が、監視タイマ117にタイムアウト
期間を再始動させるために監視タイマ117に周期的に
リセット信号を送る。特定の管理プロセッサ105に障
害が発生した場合には、そのプロセッサが監視タイマ1
17をリセットせず、監視タイマ117がタイムアウト
して、MP_OK信号108が非アクティブになる。高
可用性コントローラ101が、非アクティブMP_OK
信号を検出すると、コントローラは、図3のステップ3
10に関連して前に説明したように、システム100の
制御を引き継ぐ。
【0028】ステップ525において、監視タイマ11
7のリセット信号が、主管理プロセッサ105(P)か
ら送られた場合には、監視タイマ117は、ステップ5
15においてリセットされる。或いは、ステップ530
において、管理プロセッサ105(P)は、システム環
境の状況を調べる。管理プロセッサ105は、システム
の電力,温度,及びファン速度を所定の値と比較して、
システム動作環境の完全性を調べるファームウェア・タ
スクを含んでいる。システム環境パラメータが、受け入
れ可能な範囲にない場合には、管理プロセッサ105
(P)は、監視タイマ117をリセットせず、それによ
り、ステップ540において、管理プロセッサOK(M
P_OK)信号108が非アクティブになる。次に、高
可用性コントローラ101が、前述のように、システム
100の制御を引き継ぐ。システム環境パラメータが、
受け入れ可能な範囲内にあり、ステップ535において
監視タイマ117がタイムアウトしなかった場合には、
管理プロセスはステップ525に戻る。
【0029】以上を要約すると、次の通りである。すな
わち、本発明のシステム100は、コンピュータ・シス
テム内の管理プロセッサ105の故障時(障害発生時)
に基本的なシステム制御機能を提供する。正常のシステ
ム動作中において、管理プロセッサ105は、システム
の電力,温度,及び冷却ファン145の状況を検知する
システム・センサ120を監視すると共に、必要な調整
を行う。管理プロセッサ105は、通常、管理プロセッ
サ105が正常に動作していることを示す出力信号(管
理プロセッサOK信号)108を提供(供給)する。高
可用性コントローラ101は、少なくとも1つの動作中
の管理プロセッサ105があることを確かめるために、
これらの信号108の各々を監視する。管理プロセッサ
105の何れもが、それらが正常に動作していることを
示さない場合には、高可用性コントローラ101は、シ
ステム・センサ120を監視して、システム・インジケ
ータ130を更新する。電源の故障、或いは温度の危険
領域への上昇などのような問題が生じた場合には、管理
プロセッサ105は、システムを危害から保護するため
に、特定の装置への電源供給を逐次に遮断する。
【0030】以上、本発明の好ましい実施形態を図面に
示し説明したが、当業者には、本発明の様々な実施形態
が可能であることは明らかであろう。例えば、図1,図
2,及び図4に示したようなシステムの特定の構成、並
びに、図3及び図5において前に説明した特定の一連の
ステップは、本明細書で説明した特定の実施形態に限定
するように解釈されるべきではない。併記の特許請求の
範囲に示したような趣旨及び意図から逸脱することな
く、本発明の以上その他の特定の要素に修正を行うこと
ができる。
【図面の簡単な説明】
【図1】本発明のシステムの基本構成要素を示すブロッ
ク図である。
【図2】本発明のシステムの1つの実施形態で用いられ
る例示的な構成要素を示すブロック図である。
【図3】本発明のシステムによる高可用性コントローラ
によって実行される例示的な一連のステップを示すフロ
ーチャートである。
【図4】本発明の高可用性コントローラの構成要素を詳
細に示すブロック図である。
【図5】高可用性コントローラのオペレーション・ステ
ートマシンによって実行される例示的な一連のステップ
を示すフローチャートである。
【符号の説明】
100 システム 101 高可用性コントローラ 105 管理プロセッサ 103 ステートマシン 108 管理プロセッサOK信号(管理プロセッサ状況
信号) 110 電源スイッチ 117 監視タイマ 120 システム・センサ 140 冷却ファン制御モジュール(冷却ファン・コン
トローラ) 150(15x) 電源コントローラ
フロントページの続き (72)発明者 マイケル・ジョン・エリックソン アメリカ合衆国コロラド州80537,ラブラ ンド,メリッサ・ドライブ 1507 (72)発明者 ポール・ジェイ・マンテイ アメリカ合衆国コロラド州80525,フォー ト・コリンズ,グリーンビュー・ドライブ 5212 Fターム(参考) 5B011 DB11 HH02 KK01 KK02 MA01

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータ・システムにおいて基本シ
    ステム機能を提供するためのバックアップ用の管理シス
    テムであって、(a) コンピュータ・システムにおけ
    る電力,温度,及び冷却ファン速度をそれぞれ検出する
    複数のシステム・センサと、(b) 前記システム・セ
    ンサに結合された管理プロセッサと、(c) 前記管理
    プロセッサ及び前記システム・センサに動作可能に結合
    された高可用性コントローラと、(d) 前記管理プロ
    セッサの動作状態を示すために、前記高可用性コントロ
    ーラに結合された前記管理プロセッサによって生成され
    る管理プロセッサ状況信号と、を含み、 前記システム・センサが、(e) 前記コンピュータ・
    システム内の関連した電源の状態をそれぞれ監視し、前
    記コンピュータ・システムへの電力をそれぞれ制御する
    複数の電源コントローラと、(f) 前記冷却ファン速
    度を検出しかつ制御する少なくとも1つの冷却ファン・
    コントローラと、を備え、 前記コンピュータ・システムの正常動作中には、前記管
    理プロセッサが、前記システム・センサからの出力を監
    視し、制御信号を前記電源コントローラ及び前記ファン
    ・コントローラに送り、 前記管理プロセッサ状況信号が非アクティブであること
    を検出したときには、前記高可用性・コントローラが、
    前記システム・センサからの出力に応じて制御信号を生
    成し、前記電源コントローラ及び前記冷却ファン・コン
    トローラの動作を制御するようにしたこと、を特徴とす
    る管理システム。
  2. 【請求項2】 前記管理プロセッサ状況信号を監視し、
    前記管理プロセッサ状況信号が非アクティブなときに前
    記高可用性コントローラに前記制御信号を生成させる非
    ソフトウェア・コード化ステートマシンを含み、 前記ステートマシンが、前記管理プロセッサによって実
    行されるコードと異なる一連の操作を実行すること、を
    特徴とする請求項1に記載の管理システム。
  3. 【請求項3】 前記コンピュータ・システムへのバルク
    電力を制御するための電源スイッチであって、前記管理
    プロセッサ及び前記高可用性コントローラに結合された
    電源スイッチを含み、 前記高可用性コントローラが、前記電源スイッチからの
    出力に応答して、前記管理プロセッサに障害が発生した
    ときに前記各電源を切断し始めること、を特徴とする請
    求項1に記載の管理システム。
  4. 【請求項4】 前記ステートマシンが、フィールド・プ
    ログラマブル・ゲート・アレイであることを特徴とする
    請求項1に記載の管理システム。
  5. 【請求項5】 前記管理プロセッサは、前記管理プロセ
    ッサが所定の期間内にタイマをリセットしないときに前
    記プロセッサ状況信号を非アクティブにセットする監視
    タイマを含むことを特徴とする請求項1に記載の管理シ
    ステム。
  6. 【請求項6】 コンピュータ・システムにおいて基本シ
    ステム機能をバックアップ管理するための方法であっ
    て、(a) 管理プロセッサにより、前記コンピュータ
    ・システムにおける電力,温度,及び冷却ファン速度を
    検出する複数のシステム・センサを監視するステップ
    と、(b) 前記管理プロセッサの動作状態を示すプロ
    セッサ状況信号を生成するステップと、(c) 前記プ
    ロセッサ状況信号を監視するステップと、(d) 前記
    プロセッサ状況信号が非アクティブであることを検出し
    たときに、前記センサからの出力に応答して、バックア
    ップ制御信号を生成し、関連したコントローラの動作を
    制御するステップと、を含み、 前記バックアップ制御信号が、前記管理プロセッサ,前
    記センサ,及び前記コントローラに動作可能に結合され
    た非ソフトウェア・コード化ステートマシンによって生
    成されること、を特徴とするバックアップ管理方法。
  7. 【請求項7】 前記ステートマシンが、前記管理プロセ
    ッサによって実行されるコードと異なる一連の操作を実
    行することを特徴とする請求項6に記載のバックアップ
    管理方法。
  8. 【請求項8】 前記システム・センサが、前記冷却ファ
    ン速度を検出しかつ制御する少なくとも1つの冷却ファ
    ン・コントローラと、複数の電源コントローラとを含
    み、前記電源コントローラが、それぞれ、前記コンピュ
    ータ・システム内の関連した電源の状態を監視し、か
    つ、前記コンピュータ・システムへの電力を制御し、 前記制御信号及び前記バックアップ制御信号を、前記電
    源コントローラ及び前記冷却ファン・コントローラに送
    るステップを含むこと、を特徴とする請求項6に記載の
    バックアップ管理方法。
  9. 【請求項9】 冷却ファンの障害が検出された場合或い
    はバックプレーン電源良好信号が検出されない場合に
    は、全ての前記管理プロセッサからの非アクティブなプ
    ロセッサ状況信号に応答して、システムの電源を逐次に
    切断するステップを含むことを特徴とする請求項6に記
    載のバックアップ管理方法。
  10. 【請求項10】 前記コンピュータ・システムへのバル
    ク電力を制御する電源スイッチを含み、 前記管理プロセッサに障害がある状態の下で前記電源ス
    イッチが押されたときに、各々の前記電源の切断を開始
    するステップを含むこと、を特徴とする請求項6に記載
    のバックアップ管理方法。
JP2002219464A 2001-07-30 2002-07-29 コンピュータ・システムにおける管理システム及びバックアップ管理方法 Pending JP2003150279A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/918027 2001-07-30
US09/918,027 US20030023887A1 (en) 2001-07-30 2001-07-30 Computer system with backup management for handling embedded processor failure

Publications (1)

Publication Number Publication Date
JP2003150279A true JP2003150279A (ja) 2003-05-23

Family

ID=25439674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002219464A Pending JP2003150279A (ja) 2001-07-30 2002-07-29 コンピュータ・システムにおける管理システム及びバックアップ管理方法

Country Status (3)

Country Link
US (1) US20030023887A1 (ja)
JP (1) JP2003150279A (ja)
DE (1) DE10232919A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100392612C (zh) * 2004-11-12 2008-06-04 国际商业机器公司 用于环境控制的方法和系统
JP2017062726A (ja) * 2015-09-25 2017-03-30 パナソニックIpマネジメント株式会社 電子機器及び電子機器の温度制御方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6915441B2 (en) * 2001-07-30 2005-07-05 Hewlett-Packard Development Company, L.P. Computer system with multiple backup management processors for handling embedded processor failure
US6954358B2 (en) * 2002-08-09 2005-10-11 Sun Microsystems, Inc. Computer assembly
GB2393817B (en) * 2002-08-09 2006-01-25 Sun Microsystems Inc Computer system having data and commands routed via service processor
US7424555B2 (en) * 2002-08-09 2008-09-09 Sun Microsystems, Inc. Computer assembly
US6813150B2 (en) * 2002-08-09 2004-11-02 Sun Microsystems, Inc. Computer system
US7047056B2 (en) * 2003-06-25 2006-05-16 Nellcor Puritan Bennett Incorporated Hat-based oximeter sensor
US8970562B2 (en) * 2005-03-01 2015-03-03 Apple Inc. LCD module with thermal sensor integrated and its implementation
US20070288813A1 (en) * 2006-05-01 2007-12-13 Belady Christian L Cell board interconnection architecture with serviceable switch board
CN101482757A (zh) * 2008-01-07 2009-07-15 联想(北京)有限公司 一种温度控制的方法、系统及硬件装置
CN103138940B (zh) * 2011-11-28 2016-06-01 英业达科技有限公司 服务器机架系统
CN111767186A (zh) * 2020-05-04 2020-10-13 上海英众信息科技有限公司 一种电脑状态监控系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151689A (en) * 1992-12-17 2000-11-21 Tandem Computers Incorporated Detecting and isolating errors occurring in data communication in a multiple processor system
DE19716197A1 (de) * 1997-04-18 1998-10-22 Itt Mfg Enterprises Inc Mikroprozessorsystem für sicherheitskritische Regelungen
US5984504A (en) * 1997-06-11 1999-11-16 Westinghouse Electric Company Llc Safety or protection system employing reflective memory and/or diverse processors and communications
US6528987B1 (en) * 2000-06-19 2003-03-04 Analog Devices, Inc. Method and apparatus for determining fan speed
US6915441B2 (en) * 2001-07-30 2005-07-05 Hewlett-Packard Development Company, L.P. Computer system with multiple backup management processors for handling embedded processor failure

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100392612C (zh) * 2004-11-12 2008-06-04 国际商业机器公司 用于环境控制的方法和系统
JP2017062726A (ja) * 2015-09-25 2017-03-30 パナソニックIpマネジメント株式会社 電子機器及び電子機器の温度制御方法

Also Published As

Publication number Publication date
DE10232919A1 (de) 2003-02-20
US20030023887A1 (en) 2003-01-30

Similar Documents

Publication Publication Date Title
US6915441B2 (en) Computer system with multiple backup management processors for handling embedded processor failure
CN107122321B (zh) 硬件修复方法、硬件修复系统以及计算机可读取存储装置
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
JP2003150279A (ja) コンピュータ・システムにおける管理システム及びバックアップ管理方法
JP6130520B2 (ja) 多重系システムおよび多重系システム管理方法
US8078335B2 (en) Storage system, storage system control method and storage system control apparatus
TW201911813A (zh) 網路切換控制系統
CN114691408B (zh) 一种基板管理控制器故障检测装置
JP4886558B2 (ja) 情報処理装置
JP4655718B2 (ja) コンピュータシステム及びその制御方法
JP3285807B2 (ja) 電源及びハードウェア障害の切り分け装置及びその方法
JP5445572B2 (ja) コンピュータシステム、待機電力削減方法、及びプログラム
CN114356062B (zh) 服务器的电源控制系统及其相关电源控制方法
KR101494000B1 (ko) 시스템 종료 후 자기진단 수행시스템 및 방법, 그리고 그를이용한 부팅방법
JP6800935B2 (ja) 電子システムでのファンの制御方法
CN116449800A (zh) 一种控制逻辑切换方法、装置、设备及介质
JP5300059B2 (ja) 電源供給システム、その診断方法及びプログラム
JPH10307635A (ja) コンピュータシステム及び同システムに適用する温度監視方法
US10921875B2 (en) Computer system, operational method for a microcontroller, and computer program product
JP4675567B2 (ja) 大画面表示システム
TWM556046U (zh) 網路切換控制系統
JP2004094455A (ja) コンピュータ装置
JPH10207742A (ja) 情報処理装置
CN114168393B (zh) 一种服务器测试方法、系统、设备以及介质
JP7001236B2 (ja) 情報処理装置、障害監視方法及び障害監視用コンピュータプログラム