JP4957631B2 - フォールトトレラントサーバの動作確認方法及び検査支援プログラム - Google Patents

フォールトトレラントサーバの動作確認方法及び検査支援プログラム Download PDF

Info

Publication number
JP4957631B2
JP4957631B2 JP2008102938A JP2008102938A JP4957631B2 JP 4957631 B2 JP4957631 B2 JP 4957631B2 JP 2008102938 A JP2008102938 A JP 2008102938A JP 2008102938 A JP2008102938 A JP 2008102938A JP 4957631 B2 JP4957631 B2 JP 4957631B2
Authority
JP
Japan
Prior art keywords
bmc
detection result
switch
switch detection
inspection support
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008102938A
Other languages
English (en)
Other versions
JP2009252188A (ja
Inventor
隆信 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008102938A priority Critical patent/JP4957631B2/ja
Publication of JP2009252188A publication Critical patent/JP2009252188A/ja
Application granted granted Critical
Publication of JP4957631B2 publication Critical patent/JP4957631B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、フォールトトレラントサーバの出荷前における動作確認検査を支援するための技術に関する。
今日の企業等においては、1台のサーバの障害が、業務に著しい支障をきたす重大なトラブルに展開する可能性が多分にあり、サーバのダウンタイムを最小限に抑える、あるいは完全に防止するという高い可用性(耐障害性)の実現が望まれている。
これに対し、CPU、メモリ、HDD(ハードディスクドライブ)等の主要なハードウェアコンポーネントを2重化して、2つの系統に分け、一方の系統に障害が発生しても、他方の系統により連続運用を可能とするフォールトトレラントサーバ(例えば、特許文献1等)が知られている。
かかるフォールトトレラントサーバの製造工程には、通常、状態を表示するためのLED(ステータスLED)や障害時にデバッグ情報を採取するためのスイッチ(メモリダンプ用スイッチ)の動作確認を検査員が目視にて行う工程が設けられている。
上記動作確認(以下、マニュアル検査という。)は、従来より、専用の検査用プログラム(以下、検査支援プログラムという。)を使用して行われる。具体的には、検査支援プログラムを実行することで、検査対象のフォールトトレラントサーバが備えるBMC(Baseboard Management Controller)にステータスLEDを点灯させ、メモリダンプ用スイッチの押下を検出させる。BMCは、IPMI(Intelligent Platform Management Interface)に準拠して、ハードウェアコンポーネントに対して、その状態を監視し、また、制御も行う集積回路である。フォールトトレラントサーバは、系統毎に対応するBMCを1つ備えている。
従来のマニュアル検査では、先ず、一方の系統のDC電源をONにし、検査支援プログラムをセットして、起動させる。そして、検査支援プログラムの処理により、当該系統のハードウェアコンポーネントを監視するBMCに、当該系統の全ステータスLEDを所定の順番で順次点灯させる。検査員は、かかる点灯を目視にて確認する。
それから、検査員は、当該系統のダンプスイッチを押下する。BMCは、ダンプスイッチの押下を検出すると、自己が保有するレジスタの所定領域の値を書き換える(所定値を書き込む)。検査支援プログラム(厳密には、当該系統のCPU)は、レジスタの当該所定領域を監視し、値の変化を検出すると、表示装置(例えば、当該フォールトトレラントサーバが備えるモニタや検査用のモニタ)にその旨を示すメッセージ等(例えば、“スイッチを検出しました”等)を表示させる。検査員は、かかるメッセージ等を目視にて確認する。
次に、検査員は、検査支援プログラムの実行を停止し、当該系統のHDD等から当該検査支援プログラムを削除する。そして、検査した系統のDC電源をOFFにする。
続いて、他方の系統のDC電源をONにし、検査支援プログラムをセットして、起動させる。そして、上記と同じ手順で検査が行われる。
特開2005−301350号公報
上記したように、従来のマニュアル検査では、一のフォールトトレラントサーバにおいて、同一手順の検査を各系統毎に繰り返し行う必要がある。その際、検査員は、検査支援プログラムを起動させる等の下準備(セットアップ)を2回行う必要がある。したがって、手間及び時間がかかり、作業性がよくないという問題がある。
本発明は、上記実情に鑑みてなされたものであり、検査員による検査前のセットアップが1回で済み、作業効率の向上が図れるフォールトトレラントサーバの動作確認方法及び検査支援プログラムを提供することを目的とする。
本発明に係るフォールトトレラントサーバの動作確認方法は、
サーバの機能を実現する系統を複数有するフォールトトレラントサーバの動作確認方法であって、
第1の系統に対応する第1のBMC(Baseboard Management Controller)に前記第1の系統の状態を示すLEDを点灯させる第1のLED点灯ステップと、
前記第1のBMCから、第2の系統に対応し、前記第1のBMCと所定の通信パスを介して接続する第2のBMCに所定の制御信号を送出させ、前記第2のBMCに前記第2の系統の状態を示すLEDを点灯させる第2のLED点灯ステップと、
前記第1の系統にて障害が発生した際にデバッグ情報を採取するための第1のダンプスイッチが押下された際、前記第1のBMCによる当該押下の検出結果を取得する第1のスイッチ検出結果取得ステップと、
該第1のスイッチ検出結果取得ステップにて取得した前記検出結果を所定の態様で出力する第1のスイッチ検出結果出力ステップと
前記第2の系統にて障害が発生した際にデバッグ情報を採取するための第2のダンプスイッチが押下された際、前記第2のBMCによる当該押下の検出結果を前記第1のBMCを介して取得する第2のスイッチ検出結果取得ステップと、
該第2のスイッチ検出結果取得ステップにて取得した前記検出結果を所定の態様で出力する第2のスイッチ検出結果出力ステップと、を有することを特徴とする。
また、本発明に係る検査支援プログラムは、
サーバの機能を実現する系統を複数有するフォールトトレラントサーバの動作確認のための検査支援処理をコンピュータに実行させる検査支援プログラムであって、
前記コンピュータを
第1の系統に対応する第1のBMC(Baseboard Management Controller)に前記第1の系統の状態を示すLEDを点灯させる第1のLED点灯手段、
前記第1のBMCから、第2の系統に対応し、前記第1のBMCと所定の通信パスを介して接続する第2のBMCに所定の制御信号を送出させ、前記第2のBMCに前記第2の系統の状態を示すLEDを点灯させる第2のLED点灯手段、
前記第1の系統にて障害が発生した際にデバッグ情報を採取するための第1のダンプスイッチが押下された際、前記第1のBMCによる当該押下の検出結果を取得する第1のスイッチ検出結果取得手段、
該第1のスイッチ検出結果取得手段が取得した前記検出結果を所定の出力装置に出力させる第1のスイッチ検出結果出力手段、
前記第2の系統にて障害が発生した際にデバッグ情報を採取するための第2のダンプスイッチが押下された際、前記第2のBMCによる当該押下の検出結果を前記第1のBMCを介して取得する第2のスイッチ検出結果取得手段、
該第2のスイッチ検出結果取得手段が取得した前記検出結果を前記出力装置に出力させる第2のスイッチ検出結果出力手段、として機能させることを特徴とする。
以上の如く、本発明によれば、一のフォールトトレラントサーバに対して行われるマニュアル検査において、検査員による検査前のセットアップが1回で済み、作業効率の向上が図れる。
以下、図面を参照して本発明を詳細に説明する。図1は、本実施形態において検査対象となるフォールトトレラントサーバ(FTサーバ)1の構成を概略的に示すブロック図である。FTサーバ1は、サーバの機能(演算機能や入出力機能)を実現するための主要なハードウェアコンポーネントが2重化された構成を有し、それぞれのハードウェアコンポーネントは、系統(第1系統10及び第2系統20)毎にまとめられている。
第1系統10は、制御部100と、ステータスLED群101と、ダンプスイッチ102と、BMC103と、を備える。第2系統20は、制御部200と、ステータスLED群201と、ダンプスイッチ202と、BMC203と、を備える。BMC103とBMC203は、通信パス30を介して接続している。
制御部100(200)は、図示しないCPU、RAM、ROM等により構成され、第1系統10(第2系統20)全体の制御を行う。制御部100と制御部200は、図示しないフォールトトレラント用LSIにより同期制御され、通常時において、両者は同一処理を実行する。
ステータスLED群101(201)は、第1系統10(第2系統20)の状態を示すために使用され、図2に示すように複数のLED(LED〜LED)で構成される。ステータスLED群101(201)の各LEDは、制御部100(200)又はBMC103(203)からの制御信号に従って、点灯あるいは消灯する。
ダンプスイッチ102(202)は、当該系統で障害が発生した際に、デバッグ情報(メモリダンプ)を採取するためのスイッチである。
BMC(Baseboard Management Controller)103(203)は、IPMI(Intelligent Platform Management Interface)に準拠し、第1系統10(第2系統20)内のハードウェアコンポーネントの状態を監視し、また、ハードウェアコンポーネントの制御も行う。例えば、BMC103(203)は、ステータスLED群101(201)を点灯/消灯させることができ、ダンプスイッチ102(202)の押下を検出することができる。
BMC103(203)は、ハードウェアコンポーネントの異常を検出すると、上記のフォールトトレラント用LSIに当該異常を通知する。すると、フォールトトレラント用LSIは、異常(障害)が発生した系統を切り離し、片側の系統のみでサーバの機能を実現させる。
BMC103とBMC203との間の通信パス30は、本実施形態では、双方向シリアルバスであるIC(Inter-Integrated Circuit)バスで実現する。具体的には、BMC103とBMC203とは、シリアル・クロックとシリアル・データの2本の信号線で接続される。これにより、BMC103とBMC203との間でデータのやり取りが行われる。
続いて、以上のように構成されたFTサーバ1に対して行うマニュアル検査について説明する。マニュアル検査とは、フォールトトレラントサーバの製造時における検査工程で実施される一検査である。具体的には、ステータスLED群101及び201と、ダンプスイッチ102及び202の動作確認を検査員が目視等にて行う検査である。このマニュアル検査の手順を図3のフローチャートに沿って説明する。
先ず、検査員は、検査用の表示装置(図4(a)のモニタ40)を第1系統10に接続する(M1)。そして、第1系統10及び第2系統20のそれぞれの電源(DC電源)をONにする(M2)。
検査員は、検査支援プログラム(詳細には、実行ファイル等)を第1系統10に対応する図示しないHDD(ハードディスクドライブ)にセットする(M3)。そして、このセットした検査支援プログラムを起動させる(M4)。
この検査支援プログラムにより、第1系統10のステータスLED群101及び第2系統20のステータスLED群201の点灯が行われる。検査員は、かかる点灯を目視にて確認する(M5)。
続いて、検査員は、第1系統10のダンプスイッチ102を押下し、その検出結果をモニタ40で確認する(M6)。同様に、第2系統20のダンプスイッチ202を押下し、その検出結果をモニタ40で確認する(M7)。このM6、M7の手順は、その順序が逆になってもよい。
第1系統10のダンプスイッチ102及び第2系統20のダンプスイッチ202の動作確認が終わると、検査員は、検査支援プログラムの実行を停止し(M8)、検査支援プログラム(実行ファイル等)を上記HDDから削除する(M9)。
そして、検査員は、第1系統10及び第2系統20の電源(DC電源)をOFFにし(M10)、モニタ40を第1系統10から取り外す(M11)。以上で、FTサーバ1についてのマニュアル検査が完了する。
なお、検査支援プログラムが、制御部100のROM等に予め格納されていてもよい。この場合、上記マニュアル検査のM3及びM9の作業は不要である。また、FTサーバ1が表示装置を備えている場合には、当該表示装置を介してダンプスイッチ102(202)の動作確認ができるようにすればよい。この場合、M1及びM11の作業は不要となる。
続いて、検査支援プログラムに従って制御部100のCPUが実行する検査支援処理について図5のフローチャートを用いて説明する。
先ず、制御部100のCPUは、BMC103に対して、ステータスLED群101を点灯させるための制御信号を送出する(ステップS101)。制御部100のCPUは、ステータスLED群101のLED〜LEDを所定の順番で順次点灯させるため、点灯させるLEDを指定した制御信号を一定の時間間隔で順次送出する。例えば、制御部100のCPUは、LED、LED、LED、・・・、LEDの順番で順次点灯させる。
次に、制御部100のCPUは、BMC203がステータスLED群201を点灯させるための制御信号をBMC103に対して送出する(ステップS102)。かかる制御信号を受信したBMC103は、通信パス30を介して、当該制御信号をBMC203に送出する。そして、かかる制御信号を受信したBMC203によって、ステータスLED群201の点灯制御が行われる。なお、ここでも、制御部100のCPUは、ステータスLED群201のLED〜LEDを所定の順番で順次点灯させるため、点灯させるLEDを指定した制御信号を一定の時間間隔で順次、BMC103に送出する。
次に、制御部100のCPUは、図6(a)に示すような、BMC103が備えるレジスタ130の所定領域(第1の領域1300及び第2の領域1301)を監視する。なお、制御部100のCPUは、検査支援プログラムの起動直後からレジスタ130の監視を開始してもよい。
一般的仕様として、BMCは、自系統のダンプスイッチの押下を検出すると、自己のレジスタの所定領域に所定の値を書き込む。本実施形態では、BMC103は、ダンプスイッチ102の押下を検出すると、レジスタ130の第1の領域1300に所定の値を書き込む。同様に、図6(b)に示すように、BMC203もレジスタ230を備え、ダンプスイッチ202の押下を検出すると、レジスタ230の第1の領域2300に所定の値を書き込む。したがって、制御部100(200)のCPUは、第1の領域1300(2300)の格納値の変化を検出することで、自系統のダンプスイッチの押下を検出することが可能となる。
また、BMC間に通信パスが存在する場合、通常、一方の系統のBMCが自系統のダンプスイッチの押下を検出すると、その情報(検出信号)は、他方のBMCに送出される。かかる信号を受信したBMCは、自己のレジスタの所定領域に所定の値を書き込む。例えば、BMC203は、ダンプスイッチ202の押下を検出すると、レジスタ230の第1の領域2300に所定の値を書き込むと共に、検出信号をBMC103に通信パス30を介して送出する。
BMC103は、かかる検出信号を受信すると、レジスタ130の第2の領域1301に所定の値を書き込む。したがって、制御部100のCPUは、レジスタ130の第1の領域1301の格納値の変化を検出することで、第2系統20のダンプスイッチ202の押下を検出することが可能となる。
図5のフローチャートに戻り、制御部100のCPUは、BMC103が備えるレジスタ130の第1の領域1300の格納値の変化を検出すると(ステップS103でYES)、ダンプスイッチ102の押下が検出されたとして、モニタ40に検出された旨を示すメッセージ(例えば、“ダンプスイッチが押されました”)を表示させる(ステップS105)。
また、制御部100のCPUは、レジスタ130の第2の領域1301の格納値の変化を検出すると(ステップS104でYES)、ダンプスイッチ202の押下が検出されたとして、モニタ40に検出された旨を示す上記同様のメッセージを表示させる(ステップS105)。第1系統10のダンプスイッチ102及び第2系統20のダンプスイッチ202の押下が検出された場合のモニタ40による表示例を図4(b)に示す。
そして、検査員により、検査支援プログラムの実行停止操作が行われると(ステップS106でYES)、本処理は終了する。
以上説明したように、本発明によれば、フォールトトレラントサーバのマニュアル検査において、検査員による検査前のセットアップが1回で済む。したがって、従来に比べ作業性が格段に向上する。
なお、本発明は、上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲での種々の変更は勿論可能である。
例えば、上記実施形態のFTサーバ1は、主要なハードウェアコンポーネントを2重化したフォールトトレラントサーバであったが、本発明は、ハードウェアコンポーネントを3重化以上に多重化したフォールトトレラントサーバにも勿論適用し得る。以下、その場合の適用例について説明する。
図7に示すフォールトトレラントサーバ(FTサーバ)2は、主要なハードウェアコンポーネントが3重化されている。具体的には、FTサーバ2は、FTサーバ1(図1参照)に第3系統70が新たに追加された構成を有する。第3系統70は、制御部700と、ステータスLED群701と、ダンプスイッチ702と、BMC703と、を備える。BMC703は、第2系統20のBMC203と通信パス30を介して接続している。
かかる構成のFTサーバ2を対象として行われるマニュアル検査の手順を図8に示す。先ず、検査員は、FTサーバ1の場合と同様、検査用のモニタ40を第1系統10に接続する(M1)。そして、第1系統10、第2系統20及び第3系統70のそれぞれの電源(DC電源)をONにする(M2)。
検査員は、検査支援プログラムを第1系統10にセットし(M3)、起動させる(M4)。この検査支援プログラムにより、第1系統10のステータスLED群101、第2系統20のステータスLED群201及び第3系統70のステータスLED群701の点灯が行われる。検査員は、かかる点灯を目視にて確認する(M5)。
続いて、検査員は、第1系統10のダンプスイッチ102を押下し、その検出結果をモニタ40で確認する(M6)。同様に、第2系統20及び第3系統70についても、それぞれダンプスイッチ202及びダンプスイッチ702を押下し、それらの検出結果をモニタ40で確認する(M7、M8)。このM6〜M8の手順は順不同である。
全系統のダンプスイッチの動作確認が終わると、検査員は、検査支援プログラムの実行を停止し(M9)、第1系統10のHDD等から削除する(M10)。
そして、検査員は、全系統のDC電源をOFFにし(M11)、モニタ40を第1系統10から取り外す(M12)。以上で、FTサーバ2についてのマニュアル検査が完了する。
なお、検査支援プログラムが、制御部100のROM等に予め格納されている場合では、上記M3及びM10の作業は不要である。また、FTサーバ2が表示装置を備えている場合には、当該表示装置を介してダンプスイッチ102、202及び702の動作確認ができるようにすればよい。この場合、M1及びM12の作業は不要となる。
続いて、本例の検査支援プログラムに従って制御部100のCPUが実行する検査支援処理について図9及び図10のフローチャートを用いて説明する。
先ず、制御部100のCPUは、BMC103に対して、ステータスLED群101を点灯させるための制御信号を送出する(ステップS201)。
次に、制御部100のCPUは、BMC203がステータスLED群201を点灯させるための制御信号をBMC103に対して送出する(ステップS202)。かかる制御信号を受信したBMC103は、通信パス30を介して、当該制御信号をBMC203に送出する。そして、かかる制御信号を受信したBMC203によって、ステータスLED群201の点灯制御が行われる。
次に、制御部100のCPUは、BMC703がステータスLED群701を点灯させるための制御信号をBMC103に対して送出する(ステップS203)。かかる制御信号を受信したBMC103は、通信パス30を介して、当該制御信号をBMC203に送出する。この制御信号を受信したBMC203は、通信パス30を介して、当該制御信号をBMC703に送出する。そして、かかる制御信号を受信したBMC703によって、ステータスLED群701の点灯制御が行われる。
次に、制御部100のCPUは、BMC103が備えるレジスタ130の所定領域を監視する。なお、制御部100のCPUは、検査支援プログラムの起動直後からレジスタ130の監視を開始してもよい。
上述したように、BMCは、自系統のダンプスイッチの押下を検出すると、自己のレジスタの所定領域に所定の値を書き込むと共に、検出信号を他の系統のBMCに送出する。本例のBMCは、他の2系統のBMCからの検出信号を受信すると、自己のレジスタのそれぞれ専用領域に所定の値を書き込む。具体的には、本例のBMC130は、図11に示すように、自系統のダンプスイッチの押下を検出すると、レジスタ130の第1の領域1300に所定の値を書き込み、第2系統20のBMC203からの検出信号を受信すると、第2の領域1301に所定の値を書き込み、第3系統70のBMC703からの検出信号を受信すると、第3の領域1302に所定の値を書き込む。
制御部100のCPUは、BMC103が備えるレジスタ130の第1の領域1300の格納値の変化を検出すると(図10のステップS204でYES)、ダンプスイッチ102の押下が検出されたとして、モニタ40にその旨を示すメッセージ(例えば、“ダンプスイッチが押されました”)を表示させる(ステップS207)。
また、制御部100のCPUは、レジスタ130の第2の領域1301の格納値の変化を検出すると(ステップS205でYES)、ダンプスイッチ202の押下が検出されたとして、モニタ40にその旨を示す上記同様のメッセージを表示させる(ステップS207)。
また、制御部100のCPUは、レジスタ130の第3の領域1302の格納値の変化を検出すると(ステップS206でYES)、ダンプスイッチ702の押下が検出されたとして、モニタ40にその旨を示す上記同様のメッセージを表示させる(ステップS207)。
そして、検査員により、検査支援プログラムの実行停止操作が行われると(ステップS208でYES)、本処理は終了する。
以上のように、本発明は、3重化以上に多重化したフォールトトレラントサーバにも適用することができる。
また、ダンプスイッチ押下の検出結果は、様々な態様で出力し、検査員に報知することが可能である。例えば、音声やブザー音で報知してもよいし、LEDの点灯等により報知してもよい。
また、マニュアル検査には、LED及びダンプスイッチの動作確認の他にも様々なハードウェアコンポーネント(例えば、スピーカやマイク等)の動作確認を含めることができる。
本発明の一実施形態に係るFTサーバの構成を示す図である。 図1のステータスLED群の構成を示す図である。 マニュアル検査手順を示すフローチャートである。 (a)は、第1系統に接続するモニタを示す図であり、(b)は(a)のモニタによる表示例を示す図である。 検査支援処理の手順を示すフローチャートである。 (a)は、第1系統のBMCが備えるレジスタを説明するための図であり、(b)は、第2系統のBMCが備えるレジスタを説明するための図である。 他の実施形態に係るFTサーバの構成を示す図である。 他の実施形態のマニュアル検査手順を示すフローチャートである。 他の実施形態の検査支援処理の手順を示すフローチャート(前段)である。 他の実施形態の検査支援処理の手順を示すフローチャート(後段)である。 他の実施形態において、第1系統のBMCが備えるレジスタを説明するための図である。
符号の説明
1、2 FTサーバ
10 第1系統
20 第2系統
30 通信パス
40 モニタ
70 第3系統
100、200、700 制御部
101、201、701 ステータスLED群
102、202、702 ダンプスイッチ
103、203、703 BMC
130、230 レジスタ
1300、2300 第1の領域
1301、2301 第2の領域
1302 第3の領域

Claims (8)

  1. サーバの機能を実現する系統を複数有するフォールトトレラントサーバの動作確認方法であって、
    第1の系統に対応する第1のBMC(Baseboard Management Controller)に前記第1の系統の状態を示すLEDを点灯させる第1のLED点灯ステップと、
    前記第1のBMCから、第2の系統に対応し、前記第1のBMCと所定の通信パスを介して接続する第2のBMCに所定の制御信号を送出させ、前記第2のBMCに前記第2の系統の状態を示すLEDを点灯させる第2のLED点灯ステップと、
    前記第1の系統にて障害が発生した際にデバッグ情報を採取するための第1のダンプスイッチが押下された際、前記第1のBMCによる当該押下の検出結果を取得する第1のスイッチ検出結果取得ステップと、
    該第1のスイッチ検出結果取得ステップにて取得した前記検出結果を所定の態様で出力する第1のスイッチ検出結果出力ステップと
    前記第2の系統にて障害が発生した際にデバッグ情報を採取するための第2のダンプスイッチが押下された際、前記第2のBMCによる当該押下の検出結果を前記第1のBMCを介して取得する第2のスイッチ検出結果取得ステップと、
    該第2のスイッチ検出結果取得ステップにて取得した前記検出結果を所定の態様で出力する第2のスイッチ検出結果出力ステップと、を有する、
    ことを特徴とするフォールトトレラントサーバの動作確認方法。
  2. 前記第1のBMCと前記第2のBMCは、ICバスを介して接続される、
    ことを特徴とする請求項1に記載のフォールトトレラントサーバの動作確認方法。
  3. 前記第1のスイッチ検出結果出力ステップ及び前記第2のスイッチ検出結果出力ステップでは、それぞれ取得した前記検出結果を表示装置を介して表示する、
    ことを特徴とする請求項1に記載のフォールトトレラントサーバの動作確認方法。
  4. 前記LEDは各系統毎に複数設けられ、前記第1のLED点灯ステップ及び前記第2のLED点灯ステップでは、それぞれ、前記第1のBMC及び前記第2のBMCに複数の前記LEDを所定の順番で順次点灯させる、
    ことを特徴とする請求項1に記載のフォールトトレラントサーバの動作確認方法。
  5. サーバの機能を実現する系統を複数有するフォールトトレラントサーバの動作確認のための検査支援処理をコンピュータに実行させる検査支援プログラムであって、
    前記コンピュータを
    第1の系統に対応する第1のBMC(Baseboard Management Controller)に前記第1の系統の状態を示すLEDを点灯させる第1のLED点灯手段、
    前記第1のBMCから、第2の系統に対応し、前記第1のBMCと所定の通信パスを介して接続する第2のBMCに所定の制御信号を送出させ、前記第2のBMCに前記第2の系統の状態を示すLEDを点灯させる第2のLED点灯手段、
    前記第1の系統にて障害が発生した際にデバッグ情報を採取するための第1のダンプスイッチが押下された際、前記第1のBMCによる当該押下の検出結果を取得する第1のスイッチ検出結果取得手段、
    該第1のスイッチ検出結果取得手段が取得した前記検出結果を所定の出力装置に出力させる第1のスイッチ検出結果出力手段、
    前記第2の系統にて障害が発生した際にデバッグ情報を採取するための第2のダンプスイッチが押下された際、前記第2のBMCによる当該押下の検出結果を前記第1のBMCを介して取得する第2のスイッチ検出結果取得手段、
    該第2のスイッチ検出結果取得手段が取得した前記検出結果を前記出力装置に出力させる第2のスイッチ検出結果出力手段、として機能させる、
    ことを特徴とする検査支援プログラム。
  6. 前記第1のBMCと前記第2のBMCは、ICバスを介して接続される、
    ことを特徴とする請求項5に記載の検査支援プログラム。
  7. 前記出力装置は表示装置である、
    ことを特徴とする請求項5に記載の検査支援プログラム。
  8. 前記LEDは各系統毎に複数設けられ、前記第1のLED点灯手段及び前記第2のLED点灯手段は、それぞれ、前記第1のBMC及び前記第2のBMCに複数の前記LEDを所定の順番で順次点灯させる、
    ことを特徴とする請求項5に記載の検査支援プログラム。
JP2008102938A 2008-04-10 2008-04-10 フォールトトレラントサーバの動作確認方法及び検査支援プログラム Expired - Fee Related JP4957631B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008102938A JP4957631B2 (ja) 2008-04-10 2008-04-10 フォールトトレラントサーバの動作確認方法及び検査支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008102938A JP4957631B2 (ja) 2008-04-10 2008-04-10 フォールトトレラントサーバの動作確認方法及び検査支援プログラム

Publications (2)

Publication Number Publication Date
JP2009252188A JP2009252188A (ja) 2009-10-29
JP4957631B2 true JP4957631B2 (ja) 2012-06-20

Family

ID=41312784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008102938A Expired - Fee Related JP4957631B2 (ja) 2008-04-10 2008-04-10 フォールトトレラントサーバの動作確認方法及び検査支援プログラム

Country Status (1)

Country Link
JP (1) JP4957631B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9712382B2 (en) 2014-10-27 2017-07-18 Quanta Computer Inc. Retrieving console messages after device failure
US9713215B2 (en) * 2015-07-16 2017-07-18 Quanta Computer Inc. Identification of storage device for trouble shooting

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2526265B2 (ja) * 1988-02-19 1996-08-21 富士通株式会社 多重試験方式
JP3025732B2 (ja) * 1993-07-16 2000-03-27 株式会社ピーエフユー 多重化コンピュータシステムの制御方式
US7437258B2 (en) * 2003-06-26 2008-10-14 Hewlett-Packard Development Company, L.P. Use of I2C programmable clock generator to enable frequency variation under BMC control

Also Published As

Publication number Publication date
JP2009252188A (ja) 2009-10-29

Similar Documents

Publication Publication Date Title
JP5509730B2 (ja) フォールトトレラントコンピュータ及び電源制御方法
TWI362588B (en) Monitor apparatus, a monitoring method thereof and computer apparatus therewith
JP4957631B2 (ja) フォールトトレラントサーバの動作確認方法及び検査支援プログラム
JP2007034479A (ja) 稼働系装置、待機系装置、稼働・待機システム、稼働系制御方法、待機系制御方法、および、稼働系・待機系制御方法
JP2010218510A (ja) 状態監視システムおよび状態監視方法
CN104035855A (zh) 硬盘监测方法和装置
JP5030873B2 (ja) 画面表示システム
CN104991846A (zh) 一种移动终端工作模式的切换系统和方法
JP5605672B2 (ja) 電圧監視システムおよび電圧監視方法
JP4893746B2 (ja) アドレス線故障処理装置、アドレス線故障処理方法、アドレス線故障処理プログラム、情報処理装置およびメモリコントローラ
JP2010003132A (ja) 情報処理装置、その入出力装置の故障検出方法及びプログラム
JP6138591B2 (ja) 制御システム
JP2008198055A (ja) ディスクアレイ障害処理システム、装置、方法、及びプログラム
CN105306256B (zh) 一种基于VxWorks设备的双机热备实现方法
JP4830698B2 (ja) 担当lun制御を用いたraid制御を行うディスクコントローラおよび診断制御方法
JP2014146110A (ja) 情報処理装置、エラー検出機能診断方法およびコンピュータプログラム
JP6608875B2 (ja) 診断制御装置、診断制御方法およびプログラム
JP4209866B2 (ja) 監視装置、監視方法および情報処理装置
JP2011022741A (ja) コンピュータシステム、サービスプロセッサ、及びその診断方法
JP2017142705A (ja) フォールトトレラントサーバ装置及び通信制御装置の切替プログラム
JP2685061B2 (ja) マイクロ初期診断方式
JP2010170169A (ja) クライアントへの非同期異常通知方式
JP6364862B2 (ja) 浄水設備監視システム
CN114003426A (zh) 故障处理方法、系统和电子设备
JP2012059201A (ja) シリアルパラレル変換システムの異常検出装置及び異常検出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4957631

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees