JP4568764B2 - システム監視装置の制御方法、プログラム及びコンピュータシステム - Google Patents
システム監視装置の制御方法、プログラム及びコンピュータシステム Download PDFInfo
- Publication number
- JP4568764B2 JP4568764B2 JP2007556715A JP2007556715A JP4568764B2 JP 4568764 B2 JP4568764 B2 JP 4568764B2 JP 2007556715 A JP2007556715 A JP 2007556715A JP 2007556715 A JP2007556715 A JP 2007556715A JP 4568764 B2 JP4568764 B2 JP 4568764B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- hardware
- software
- state information
- system monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1441—Resetting or repowering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1438—Restarting or rejuvenating
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
本発明は、システム監視装置の制御方法を提供する。即ち本発明は、コンピュータシステムのハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を保持してコンピュータシステム全体を監視制御するシステム監視装置の制御方法に於いて、
ハードウェア状態情報及びOSソフトウェア状態情報の状態変化を認識した際に退避情報として不揮発メモリに記憶するシステム情報退避ステップと、
故障したシステム監視装置の制御方法の活性交換に伴う再起動を認識した際に、不揮発メモリから退避情報を読み出して装置故障前のハードウェア状態情報及びOSソフトウェア状態情報を復元する退避情報復元ステップと、
退避情報から動作中のハードウェアを認識し、認識したハードウェアについて活性交換中に発生したハードウェア状態情報を復元するハードウェア状態情報復元ステップと、
退避情報から動作中のOSソフトウェアを認識し、認識したOSソフトウェアについて活性交換中に発生したOSソフトウェア状態情報を復元するソフトウェア状態情報復元ステップと、
を備えたことを特徴とする。
退避情報は、
システム全体の停電情報、
1又は複数のシステムボードの組合せ又は1つのシステムボード内に分割設定されるパーティションのブート、ランニング、停止等のパーティション情報、
システムボードの動的構成変更、メモリ縮退、ボード上のLSI縮退、PCIスロット縮退等のシステムボード情報、
あるいはCPU縮退情報及びキャッシュ縮退情報等のCPU情報、のうち少なくとも一つを含む。
システム名、空調投入待ち時間、暖気待ち時間、システムの設置場所の高度、システム監視装置の制御方法のIPアドレス、自動運転スケジュールに使用するカレンダ情報、システム全体かステップ分かを指定する縮退モード、あるいは停電から復電した際の動作を指定する復電モード等のいずれか一つを含むシステム全体情報と、
ホストID、パーティションで使用するLAN情報、電源制御コマンドの送受信の可否を設定する遠隔電源制御モード、診断方法を決定する診断レベル、パーティション起動に必要な環境変数等のいずれか一つを含むパーティション情報と、
次回起動時のパーティションを指定するパーティション番号、システムボードを論理的にパーティションに分割する場合に設定する分割モード、メモリをミラーで使用する場合に設定するミラーモード、メモリをインタリーブで使用するインタリーブモード等のいずれか一つを含むシステムボード情報と、
のうち少なくも一つを含む。
ハードウェア状態情報復元ステップは退避情報から動作中のハードウェアを認識し、認識したハードウェアについてファームウェア更新中に発生したハードウェア状態情報を復元し、
ソフトウェア状態情報復元ステップは、退避情報から動作中のOSソフトウェアを認識し、ファームウェア更新中に発生したOSソフトウェア状態情報を復元する。
本発明は、システム監視装置のコンピュータにより実行されるプログラムを提供する。
本発明のプログラムは、コンピュータシステムのハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を保持してコンピュータシステム全体を監視制御するシステム監視装置のコンピュータに、
ハードウェア状態情報及びOSソフトウェア状態情報の状態変化を認識した際に退避情報として不揮発メモリに記憶するシステム情報退避ステップと、
故障したプログラムの活性交換に伴う再起動を認識した際に、不揮発メモリから退避情報を読み出して対応する装置故障前のハードウェア状態情報及びOSソフトウェア状態情報を復元する退避情報復元ステップと、
退避情報から動作中のハードウェアを認識し、認識したハードウェアについて活性交換中に発生したハードウェア状態情報を復元するハードウェア状態情報復元ステップと、
退避情報から動作中のOSソフトウェアを認識し、認識したOSソフトウェアについて活性交換中に発生したOSソフトウェア状態情報を復元するソフトウェア状態情報復元ステップと、
を実行させることを特徴とする。
本発明は、コンピュータシステムを提供する。即ち本発明は、複数のCPU、メモリ等を実装した複数のシステムボード、複数のシステムボードを接続するクロスバ型システムバス、電源装置及び冷却ファンを備えたハードウェアと、複数のシステムボード上で実行される複数のOSソフトウェアとで構成されたコンピュータシステムに於いて、
コンピュータシステムのハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を保持してコンピュータシステム全体を監視制御するシステム監視装置を設け、
システム監視装置は、
ハードウェア状態情報及びOSソフトウェア状態情報の状態変化を認識した際に退避情報として不揮発メモリに記憶するシステム情報退避部と、
故障したシステム監視装置の活性交換に伴う再起動を認識した際に、不揮発メモリから退避情報を読み出して対応する装置故障前のハードウェア状態情報及びOSソフトウェア状態情報を復元する退避情報復元部と、
退避情報から動作中のハードウェアを認識し、認識したハードウェアについて活性交換中に発生したハードウェア状態情報を復元するハードウェア状態情報復元部と、
退避情報から動作中のOSソフトウェアを認識し、認識したOSソフトウェアについて活性交換中に発生したOSソフトウェア状態情報を復元するソフトウェア状態情報復元部と、
を備えたことを特徴とする。
本発明によるシステム監視装置の制御方法の別の形態にあっては、コンピュータシステムのハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を含むシステム情報を保持してコンピュータシステム全体を監視制御する共に異常発生時に通知するシステム監視装置を2台設けて2重化したシステム制御装置の制御方法に於いて、
ハードウェア状態情報及びOSソフトウェア状態情報の状態変化を認識した際に退避情報として不揮発メモリに記憶するシステム情報退避ステップと、
2台のシステム監視装置の同時故障に伴う活性交換により先行装置としての再起動を認識した際に、不揮発メモリから退避情報を読み出して対応する装置故障前のハードウェア状態情報及びOSソフトウェア状態情報を復元する退避情報復元ステップと、
退避情報から動作中のハードウェアを認識し、認識したハードウェアについて活性交換中に発生したハードウェア状態情報を復元するハードウェア状態情報復元ステップと、
退避情報から動作中のOSソフトウェアを認識し、認識したOSソフトウェアについて活性交換中に発生したOSソフトウェア状態情報を復元するソフトウェア状態情報復元ステップと、
2台のシステム監視装置の同時故障に伴う活性交換により後続装置としての再起動を認識した際に、先行起動したシステム監視装置が保持しているシステム情報をコピーして復元するコピー復元ステップと、
を備えたことを特徴とする。
本発明によるプログラムの別の形態にあっては、コンピュータシステムのハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を含むシステム情報を保持してコンピュータシステム全体を監視制御する共に異常発生時に通知する2重化したシステム監視装置のコンピュータに、
ハードウェア状態情報及びOSソフトウェア状態情報の状態変化を認識した際に退避情報として不揮発メモリに記憶するシステム情報退避ステップと、
2台のシステム監視装置の同時故障に伴う活性交換により先行続装置としての再起動を認識した際に、不揮発メモリから退避情報を読み出して対応する装置故障前のハードウェア状態情報及びOSソフトウェア状態情報を復元する退避情報復元ステップと、
退避情報から動作中のハードウェアを認識し、認識したハードウェアについて活性交換中に発生したハードウェア状態情報を復元するハードウェア状態情報復元ステップと、
退避情報から動作中のOSソフトウェアを認識し、認識したOSソフトウェアについて活性交換中に発生したOSソフトウェア状態情報を復元するソフトウェア状態情報復元ステップと、
2台のシステム監視装置の同時故障に伴う活性交換により後続装置としての再起動を認識した際に、先行起動したシステム監視装置が保持しているシステム情報をコピーして復元するコピー復元ステップと、
を実行させることを特徴とする。
本発明によるコンピュータシステムの別の形態にあっては、
複数のCPU、メモリ等を実装した複数のシステムボード、複数のシステムボードを接続するクロスバ型システムバス、電源装置及び冷却ファンを備えたハードウェアと、複数のシステムボード上で実行される複数のOSソフトウェアとで構成されたコンピュータシステムに於いて、
コンピュータシステムのハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を保持してコンピュータシステム全体を監視制御するシステム監視装置を2台設け、
システム監視装置の各々は、
システム情報の内、システム監視装置にのみ保持されて故障時に失われて復元できなくなるハードウェア状態情報及びOSソフトウェア状態情報の状態変化を認識した際に退避情報として不揮発メモリに記憶するシステム情報退避部と、
2台のシステム監視装置の同時故障に伴う活性交換により先行装置としての再起動を認識した際に、不揮発メモリから退避情報を読み出して対応する装置故障前のハードウェア状態情報及びOSソフトウェア状態情報を復元する退避情報復元部と、
退避情報から動作中のハードウェアを認識し、認識したハードウェアについて活性交換中に発生したハードウェア状態情報を復元するハードウェア状態情報復元部と、
退避情報から動作中のOSソフトウェアを認識し、認識したOSソフトウェアについて活性交換中に発生したOSソフトウェア状態情報を復元するソフトウェア状態情報復元部と、
2台のシステム監視装置の同時故障に伴う活性交換により後続装置としての再起動を認識した際に、先行起動したシステム監視装置が保持しているシステム情報をコピーして復元するコピー復元部と、
を備えたことを特徴とする。
更に本発明は次のように構成される。
状態情報の状態変化を認識した際に、状態情報を退避情報として不揮発メモリに記憶するステップと、
システム監視装置の起動を認識した際に、不揮発メモリから退避情報を読み出して、退避情報に対応する状態情報を復元するステップと、
を備えたことを特徴とする。
コンピュータシステムの状態を示す状態情報を保持して、状態情報により前記コンピュータシステムを監視制御するシステム監視装置を設け、
システム監視装置は、
状態状態情報を保持する第一のメモリと、
状態情報を退避情報として記憶する第二のメモリと、
状態情報を退避情報として第二のメモリに記憶するシステム情報退避部と、
システム監視装置の再起動が行われたときに、第二のメモリから退避情報を読み出して、状態情報を第一のメモリに復元する退避情報復元部と、を備えたことを特徴とする。
退避情報を参照して動作中のソフトウェアを認識し、認識したソフトウェアについての状態情報を第一のメモリに復元するソフトウェア状態情報復元部を更に備える。
状態状態情報を保持する、第一の部位に設けられた第一のメモリと、
状態情報を退避情報として記憶する、第一の部位とは物理的に異なる第二の部位に設けられた第二のメモリと、
状態情報を退避情報として第二のメモリに記憶するシステム情報退避部と、
システム監視装置の再起動が行われたときに、第二のメモリから退避情報を読み出して、状態情報を第一のメモリに復元する退避情報復元部と、を備える。
コンピュータシステムの状態情報を保持してコンピュータシステムを監視制御する複数の監視装置を有し、
監視装置は、
状態情報を保持する第一の記憶部と、
第一の記憶部に格納された状態情報を、不揮発性の第二の記憶部に記憶させる情報退避部と、
他の監視装置に先駆けて監視装置が起動されたときに、第二の記憶部から状態情報を読み出し、読み出した状態情報を第一の記憶部に復元させる第一の復元部と、
他の監視装置が起動した後に監視装置が起動したときに、他の監視装置が保持する状態情報をコピーして、第一の記憶部に復元させる第二の復元部と、を備えたことを特徴とする。
(1)システム名
(2)空調投入待ち時間
(3)暖気待ち時間
(4)装置のコードを格納するコード設定
(5)システム監視装置25のIPアドレス
(6)自動運転のためのスケジュールに用いるカレンダー情報
(7)処理装置本体の部分または全体となる縮退モードの指定
(8)停電から復電したときの動作を指定する復電モード
などがある。
(1)顧客が購入したIDであるホストID
(2)パーティションで使用するLAN設定情報
(3)電源制御コマンドの送受信を可能とする設定である遠隔電源制御モード
(4)診断方法を決定する診断レベル
(5)ブートデバイスの指定などパーティション起動に必要な環境変数であるOBP環境変数
(1)次回起動時に動作するパーティション番号の指定
(2)システムボードを論理的に分割する場合に設定する分割モード
(3)メモリをミラーモードで使用する場合に設定するメモリミラーモード
(4)メモリをインタリーブモードで使用する場合に設定するインタリーブモード
(1)システム全体については、停電時に動作していたパーティションを記録する停電情報
(2)パーティションについては、停止,ブート中,OSランニング中などの状態を示すパーティション情報
(3)システムボードについては、
A.動的構成変更の状態を記録するTRステータス
B.メモリの部分縮退している情報を記憶するメモリ縮退情報
C.システムボード上にある各LSIの縮退状態を記憶したLSI縮退情報
D.PCIスロットの縮退状態を記憶したPCI縮退情報
がある。
(4)CPUの退避情報としては
A.各CPUの縮退情報を記憶したCPU縮退情報
B.CPUのキャッシュの縮退情報を記憶したキャッシュ縮退情報
がある。
(1)システムボードからのハードウェア割込みとしては
A.温度異常、キャッシュ異常、その他のCPUからの割込み
B.1ビット異常、2ビット異常、その他のメモリコントローラからの割込み
C.CPU間の経路異常などのシステムコントローラからの割込み
(2)パリティエラーなどのクロスバー型システムバス15を実装したクロスバーボードからの割込み
(3)電源異常や環境温度異常などの電源割込み
(4)回転異常などのファン割込み
がある。
(1)各種のハードウェアコンポーネントに対する状態通知
(2)パーティション電源制御指示
(3)OBP環境変数の読出しと保存
(4)動的構成変更指示
などがある。
(1)システム監視装置25のシリアルポート35に保守用端末装置36を接続し、システム監視装置25に新しい版数のファームウェアを書き込む。
(2)システム監視装置25をリセットした後に起動する。
(3)システム監視装置25の起動に伴い、ユーザ設定情報、ハードウェア状態情報及びOSソフトウェア状態情報の復元処理が行われ、復元が完了して正常な動作状態になると、保守用端末装置36にファームウェアの更新終了が表示される。
(1)システム監視装置25−1,25−2が故障停止すると、ハードウェア60からのハードウェア割込みに応答せずにハードウェア割込マスク62が設定され、OSソフトウェア56はオフラインとなり、OSソフトウェア56のハードウェア制御指示は監視装置オフラインレジスタ58に格納される。
(2)保守担当者が到着し、故障した2台のシステム監視装置25−1,25−2を、処理装置本体10を停止することなく交換する。
(3)プライマリ側のシステム監視装置25−1のシリアルポート35−1に保守用端末装置36を接続して起動する。
(4)プライマリ側のシステム監視装置25−1の起動で退避情報が復元されて正常に起動すると、交換終了が保守用端末装置36に表示される。
(5)続いてセカンダリ側のシステム監視装置25−2のシリアルポート35−2に保守用端末装置36を接続して起動する。
(6)セカンダリ側のシステム監視装置25−2が起動し、そのコピー復元部78により、既に正常に起動したプライマリ側のシステム監視装置25−1の情報保持部48−1からユーザ設定情報50、ハードウェア状態情報52及びOSソフトウェア状態情報54を読み出して情報保持部48−2にコピーすることで復元し、復元が完了すると保守用端末装置36にシステム監視装置25−2の交換終了が表示される。
12:システムボード
14,64:CPU
15:クロスバ型システムバス
16:メモリ
18:コマンドレジスタ
20:電源装置
22:ファントレイ
24:電源プラグ
25:システム監視装置
26:監視制御部
27:復元処理部
28:オペレータパネル
30:EEPROM(ユーザ情報保存領域)
32:SRAM
34:退避情報記憶領域
35:シリアルポート
36:保守端末装置
38:パーティション
40:情報退避部
42:退避情報復元部
44:ソフトウェア情報復元部
46:ハードウェア情報復元部
48:情報保持部
50:ユーザ設定情報
52:OSソフトウェア状態情報
54:ハードウェア状態情報
56:OSソフトウェア
58:オフラインレジスタ
60:ハードウェア
62:ハードウェア割込マスク
66:バス
68:RAM
70:ROM
72:ハードディスクドライブ
74:ネットワークアダプタ
Claims (8)
- コンピュータシステムのハードウェアの状態を示すハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を保持して前記コンピュータシステム全体を監視制御するシステム監視装置の制御方法に於いて、
前記ハードウェア状態情報あるいはOSソフトウェア状態情報の状態変化を認識した際に、状態変化したハードウェア状態情報あるいはOSソフトウェア状態情報を、前記システム監視装置に記憶すると共に、退避情報として不揮発メモリに記億するシステム情報退避ステップと、
故障したシステム監視装置の活性交換に伴う再起動を認識した際に、前記不揮発メモリから退避情報を読み出して、対応するシステム監視装置の故障前に発生したハードウェア状態情報及びOSソフトウェア状態情報を、交換した後のシステム監視装置に復元する退避情報復元ステップと、
前記復元されたハードウェア状態情報を参照して動作中のハードウェアを認識し、システム監視装置の活性交換中に発生した、認識したハードウェアのハードウェア状態情報を復元するハードウェア状態情報復元ステップと、
前記復元されたOSソフトウェア状態情報を参照して動作中のOSソフトウェアを認識し、システム監視装置の活性交換中に発生した、認識したOSソフトウェアのOSソフトウェア状態情報を復元するソフトウェア状態情報復元ステップと、
を備えたことを特徴とするシステム監視装置の制御方法。 - コンピュータシステムのハードウェアの状態を示すハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を保持して前記コンピュータシステム全体を監視制御するシステム監視装置のコンピュータに、
前記システム情報の内、前記ハードウェア状態情報あるいはOSソフトウェア状態情報の状態変化を認識した際に、状態変化したハードウェア状態情報あるいはOSソフトウェア状態情報を、前記システム監視装置に記憶すると共に、退避情報として不揮発メモリに記憶するシステム情報退避ステップと、
故障したプログラムの活性交換に伴う再起動を認識した際に、前記不揮発メモリから退避情報を読み出して、対応するシステム監視装置の故障前に発生したハードウェア状態情報及びOSソフトウェア状態情報を、交換した後のシステム監視装置に復元する退避情報復元ステップと、
前記復元されたハードウェア状態情報を参照して動作中のハードウェアを認識し、システム監視装置の活性交換中に発生した、認識したハードウェアのハードウェア状態情報を復元するハードウェア状態情報復元ステップと、
前記復元されたOSソフトウェア状態情報を参照して動作中のOSソフトウェアを認識し、システム監視装置の活性交換中に発生した、認識したOSソフトウェアのOSソフトウェア状態情報を復元するソフトウェア状態情報復元ステップと、
を実行させることを特徴とするプログラム。 - コンピュータシステムに於いて、
前記コンピュータシステムのハードウェア状態を示すハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を保持して前記コンピュータシステム全体を監視制御するシステム監視装置を設け、
前記システム監視装置は、
前記ハードウェア状態情報あるいはOSソフトウェア状態情報の状態変化を認識した際に、状態変化したハードウェア状態情報あるいはOSソフトウェア状態情報を、前記システム監視装置に記憶すると共に退避情報として不揮発メモリに記憶するシステム情報退避部と、
故障したシステム監視装置の活性交換に伴う再起動を認識した際に、前記不揮発メモリから退避情報を読み出して、対応するシステム監視装置の故障前に発生したハードウェア状態情報及びOSソフトウェア状態情報を、交換した後のシステム監視装置に復元する退避情報復元部と、
前記復元されたハードウェア状態情報を参照して動作中のハードウェアを認識し、前記システム監視装置の活性交換中に発生した、認識したハードウェアのハードウェア状態情報を復元するハードウェア状態情報復元部と、
前記復元されたOSソフトウェア状態情報を参照して動作中のOSソフトウェアを認識し、前記システム監視装置の活性交換中に発生した、認識したOSソフトウェアのOSソフトウェア状態情報を復元するソフトウェア状態情報復元部と、
を備えたことを特徴とするコンピュータシステム。 - コンピュータシステムのハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を保持して前記コンピュータシステム全体を監視制御するシステム監視装置を2台配置して2重化したシステム監視装置の制御方法に於いて、
前記ハードウェア状態情報及びOSソフトウェア状態情報の状態変化を認識した際に、状態変化したハードウェア状態情報及びOSソフトウェア状態情報を前記システム監視装置に記憶すると共に、退避情報として不揮発メモリに記憶するシステム情報退避ステップと、
前記2台のシステム監視装置の同時故障に伴う活性交換を行った際、前記2台のシステム監視装置のうち先行して再起動した先行装置の再起動を認識した際に、前記不揮発メモリから退避情報を読み出して、対応するシステム監視装置の故障前に発生したハードウェア状態情報及びOSソフトウェア状態情報を先行装置に復元する退避情報復元ステップと、
前記復元されたハードウェア状態情報から動作中のハードウェアを認識し,認識したハードウェアについてシステム監視装置の活性交換中に発生したハードウェア状態情報を復元するハードウェア状態情報復元ステップと、
前記復元されたOSソフトウェア状態情報から動作中のOSソフトウェアを認識し、認識したOSソフトウェアについて前記システム監視装置の活性交換中に発生したOSソフトウェア状態情報を復元するソフトウェア状態情報復元ステップと、
前記2台のシステム監視装置のうち後続して再起動した後続装置の再起動を認識した際に、前記先行装置が保持しているシステム情報を後続装置にコピーして復元するコピー復元ステップと、
を備えたことを特徴とするシステム監視装置の制御方法。 - コンピュータシステムのハードウェア状態情報及びOSソフトウェアによるハードウェア制御指示のOSソフトウェア状態情報を含むシステム情報を保持して前記コンピュータシステム全体を監視制御する2重化したシステム監視装置のコンピュータに、
前記ハードウェア状態情報及びOSソフトウェア状態情報の状態変化を認識した際に、状態変化したハードウェア状態情報及びOSソフトウェア状態情報を前記システム監視装置に記憶すると共に、退避情報として不揮発メモリに記憶するシステム情報退避ステップと、
2台のシステム監視装置の同時故障に伴う活性交換を行った際、前記2台のシステム監視装置のうち先行して再起動した先行装置の再起動を認識した際に、不揮発メモリから退避情報を読み出して、対応するシステム監視装置の故障前に発生したハードウェア状態情報及びOSソフトウェア状態情報を先行装置に復元する退避情報復元ステップと、
前記復元されたハードウェア状態情報から動作中のハードウェアを認識し、認識したハードウェアについてシステム監視装置の活性交換中に発生したハードウェア状態情報を復元するハードウェア状態情報復元ステップと、
前記復元されたOSソフトウェア状態情報から動作中のOSソフトウェアを認識し、認識したOSソフトウェアについて前記システム監視装置の活性交換中に発生したOSソフトウェア状態情報を復元するソフトウェア状態情報復元ステップと、
2台のシステム監視装置のうち後続して再起動した後続装置の再起動を認識した際に、先行装置が保持しているシステム情報を後続装置にコピーして復元するコピー復元ステップと、
を実行させることを特徴とするプログラム。 - コンピュータシステムにおいて、
前記コンピュータシステムの状態情報を保持して前記コンピュータシステムを監視制御する複数の監視装置と、不揮発性の第二の記憶部とを有し、
前記監視装置は、
前記状態情報を保持する第一の記憶部と、
前記第一の記憶部に格納された状態情報を、前記第二の記憶部に記憶させる情報退避部と、
他の監視装置に先駆けて前記監視装置が起動されたときに、前記第二の記憶部から前記状態情報を読み出し、読み出した状態情報を前記第一の記憶部に復元させる第一の復元部と、
他の監視装置が起動した後に前記監視装置が起動したときに、前記他の監視装置が保持する状態情報をコピーして、前記第一の記憶部に復元させる第二の復元部と、を備えたことを特徴とするコンピュータシステム。 - 請求項1記載のシステム監視装置の制御方法において、
前記ハードウェア状態情報復元ステップでは、前記ハードウェアのハードウェア割込マスクの解除制御を行うことにより、前記ハードウェア状態情報を復元することを特徴とする、システム監視装置の制御方法。 - 請求項1記載のシステム監視装置の制御方法において、
前記ソフトウェア状態情報復元ステップでは、前記OSソフトウェアに対してオフライン解除通知を行うことで、前記ソフトウェア状態情報を復元することを特徴とする、システム監視装置の制御方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2006/301516 WO2007088575A1 (ja) | 2006-01-31 | 2006-01-31 | システム監視装置の制御方法、プログラム及びコンピュータシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007088575A1 JPWO2007088575A1 (ja) | 2009-06-25 |
JP4568764B2 true JP4568764B2 (ja) | 2010-10-27 |
Family
ID=38327162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007556715A Expired - Fee Related JP4568764B2 (ja) | 2006-01-31 | 2006-01-31 | システム監視装置の制御方法、プログラム及びコンピュータシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US8230258B2 (ja) |
EP (1) | EP1980943B1 (ja) |
JP (1) | JP4568764B2 (ja) |
DE (1) | DE602006020782D1 (ja) |
WO (1) | WO2007088575A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8589534B2 (en) | 2007-09-13 | 2013-11-19 | Ricoh Company, Ltd. | Device information management apparatus, device information management method, and storage medium which operates during a failure |
JP5228652B2 (ja) * | 2007-09-13 | 2013-07-03 | 株式会社リコー | 機器情報管理装置、機器方法管理方法、および機器情報管理プログラム |
JP2009259197A (ja) * | 2008-03-18 | 2009-11-05 | Ricoh Co Ltd | 情報処理装置およびその起動方法 |
JP5332257B2 (ja) * | 2008-03-26 | 2013-11-06 | 日本電気株式会社 | サーバシステム、サーバ管理方法、およびそのプログラム |
WO2009147716A1 (ja) * | 2008-06-02 | 2009-12-10 | 富士通株式会社 | データ処理システム、データ処理方法およびデータ処理プログラム |
US8245214B2 (en) * | 2008-06-05 | 2012-08-14 | International Business Machines Corporation | Reliably updating computer firmware while performing command and control functions on a power/thermal component in a high-availability, fault-tolerant, high-performance server |
US8219794B1 (en) * | 2009-11-03 | 2012-07-10 | Network Appliance, Inc. | Non-disruptive firmware upgrade of a storage shelf |
JP5515766B2 (ja) | 2010-01-20 | 2014-06-11 | 富士通株式会社 | 情報処理装置、情報処理装置のハードウェア設定方法及びそのプログラム |
WO2012026035A1 (ja) * | 2010-08-27 | 2012-03-01 | 富士通株式会社 | 障害処理方法,障害処理システム,障害処理装置及び障害処理プログラム |
JP5598235B2 (ja) * | 2010-10-05 | 2014-10-01 | 富士通株式会社 | 複合イベント処理装置および複合イベント処理方法 |
WO2013136462A1 (ja) * | 2012-03-14 | 2013-09-19 | 富士通株式会社 | 監視装置,情報処理装置,監視方法,および監視プログラム |
GB2504728A (en) * | 2012-08-08 | 2014-02-12 | Ibm | Second failure data capture in co-operating multi-image systems |
WO2014045453A1 (ja) * | 2012-09-24 | 2014-03-27 | 富士通株式会社 | 環境変数保存方法、情報処理装置およびプログラム |
JP6090335B2 (ja) * | 2013-01-15 | 2017-03-08 | 富士通株式会社 | 情報処理装置 |
CN103257908A (zh) * | 2013-05-24 | 2013-08-21 | 浪潮电子信息产业股份有限公司 | 一种软硬件协同的多控制器磁盘阵列设计方法 |
WO2015073009A1 (en) * | 2013-11-14 | 2015-05-21 | Hewlett-Packard Development Company, L.P. | Mark cache entry |
JP6307858B2 (ja) * | 2013-11-29 | 2018-04-11 | 富士通株式会社 | 伝送装置、伝送システム、及び監視制御方法 |
RU2547232C1 (ru) * | 2014-01-09 | 2015-04-10 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Воронежский государственный технический университет" | Устройство для контроля эвм |
US10176033B1 (en) * | 2015-06-25 | 2019-01-08 | Amazon Technologies, Inc. | Large-scale event detector |
US9904543B2 (en) * | 2015-10-26 | 2018-02-27 | Hewlett-Packard Development Company, L.P. | Setting a build indicator to enable or disable a feature |
US9652896B1 (en) | 2015-10-30 | 2017-05-16 | Snap Inc. | Image based tracking in augmented reality systems |
US9984499B1 (en) | 2015-11-30 | 2018-05-29 | Snap Inc. | Image and point cloud based tracking and in augmented reality systems |
US10031778B2 (en) | 2015-12-10 | 2018-07-24 | Vmware, Inc. | Providing fault tolerance in a virtualized computing environment through a swapping approach |
US10074381B1 (en) | 2017-02-20 | 2018-09-11 | Snap Inc. | Augmented reality speech balloon system |
US10387730B1 (en) * | 2017-04-20 | 2019-08-20 | Snap Inc. | Augmented reality typography personalization system |
US10997760B2 (en) | 2018-08-31 | 2021-05-04 | Snap Inc. | Augmented reality anthropomorphization system |
US11972529B2 (en) | 2019-02-01 | 2024-04-30 | Snap Inc. | Augmented reality system |
US10942820B2 (en) * | 2019-06-27 | 2021-03-09 | EMC IP Holding Company LLC | Stream level uninterrupted restore operation using an interrupt service routine approach |
WO2021010039A1 (ja) * | 2019-07-12 | 2021-01-21 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695944A (ja) * | 1992-09-14 | 1994-04-08 | Fujitsu Ltd | ファイル入替方法 |
JPH0916288A (ja) * | 1995-06-27 | 1997-01-17 | Nec Corp | 監視制御システム |
JPH09288637A (ja) * | 1996-04-19 | 1997-11-04 | Nec Corp | 周辺装置の再接続方式およびインタフェース装置 |
JP2002333935A (ja) * | 2001-03-15 | 2002-11-22 | Hewlett Packard Co <Hp> | 冗長コントローラシステムにコントローラを活線挿入する方法およびシステム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2032067A1 (en) * | 1989-12-22 | 1991-06-23 | Douglas E. Jewett | Fault-tolerant computer system with online reintegration and shutdown/restart |
JPH0484230A (ja) | 1990-07-26 | 1992-03-17 | Fujitsu Ltd | 監視装置の活性保守方式 |
JPH04326843A (ja) | 1991-04-26 | 1992-11-16 | Matsushita Electric Ind Co Ltd | 活性挿抜可能な装置及びその方法 |
US6795966B1 (en) * | 1998-05-15 | 2004-09-21 | Vmware, Inc. | Mechanism for restoring, porting, replicating and checkpointing computer systems using state extraction |
US6698017B1 (en) * | 1999-07-16 | 2004-02-24 | Nortel Networks Limited | Software migration on an active processing element |
US6601186B1 (en) * | 2000-05-20 | 2003-07-29 | Equipe Communications Corporation | Independent restoration of control plane and data plane functions |
JP4326843B2 (ja) | 2003-06-06 | 2009-09-09 | 独立行政法人産業技術総合研究所 | 気孔傾斜多孔質体の作製方法 |
US7739403B1 (en) * | 2003-10-03 | 2010-06-15 | Juniper Networks, Inc. | Synchronizing state information between control units |
US7571349B2 (en) * | 2006-08-18 | 2009-08-04 | Microsoft Corporation | Configuration replication for system recovery and migration |
US7809985B2 (en) * | 2007-09-28 | 2010-10-05 | Microsoft Corporation | Offline hardware diagnostic environment |
-
2006
- 2006-01-31 JP JP2007556715A patent/JP4568764B2/ja not_active Expired - Fee Related
- 2006-01-31 EP EP06712659A patent/EP1980943B1/en not_active Expired - Fee Related
- 2006-01-31 DE DE602006020782T patent/DE602006020782D1/de active Active
- 2006-01-31 WO PCT/JP2006/301516 patent/WO2007088575A1/ja active Application Filing
-
2008
- 2008-07-17 US US12/174,731 patent/US8230258B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695944A (ja) * | 1992-09-14 | 1994-04-08 | Fujitsu Ltd | ファイル入替方法 |
JPH0916288A (ja) * | 1995-06-27 | 1997-01-17 | Nec Corp | 監視制御システム |
JPH09288637A (ja) * | 1996-04-19 | 1997-11-04 | Nec Corp | 周辺装置の再接続方式およびインタフェース装置 |
JP2002333935A (ja) * | 2001-03-15 | 2002-11-22 | Hewlett Packard Co <Hp> | 冗長コントローラシステムにコントローラを活線挿入する方法およびシステム |
Also Published As
Publication number | Publication date |
---|---|
DE602006020782D1 (de) | 2011-04-28 |
US20080276222A1 (en) | 2008-11-06 |
US8230258B2 (en) | 2012-07-24 |
EP1980943A1 (en) | 2008-10-15 |
JPWO2007088575A1 (ja) | 2009-06-25 |
WO2007088575A1 (ja) | 2007-08-09 |
EP1980943A4 (en) | 2010-04-28 |
EP1980943B1 (en) | 2011-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4568764B2 (ja) | システム監視装置の制御方法、プログラム及びコンピュータシステム | |
JP4870915B2 (ja) | ストレージ装置 | |
US7007192B2 (en) | Information processing system, and method and program for controlling the same | |
JP5392594B2 (ja) | 仮想計算機冗長化システム、コンピュータシステム、仮想計算機冗長化方法、及びプログラム | |
EP1290556A1 (en) | Fast relief swapping of processors in a data processing system | |
US20040153738A1 (en) | Redundancy management method for BIOS, data processing apparatus and storage system for using same | |
JP5183542B2 (ja) | 計算機システム及び設定管理方法 | |
JP2006277205A (ja) | 記憶装置システムおよびその制御方法、制御プログラム | |
US20230129037A1 (en) | Board management controller and method for starting thereof | |
JP3301992B2 (ja) | 電源故障対策を備えたコンピュータシステム及びその動作方法 | |
JP2007025933A (ja) | ストレージシステム及びそのファームウェア自動更新方法 | |
JP5314731B2 (ja) | データ処理装置間の基本入出力プログラムの同期化方法及びコンピュータシステム | |
JPH10154085A (ja) | 二重化された監視/制御プロセッサによるシステム監視・制御方法および二重化監視/制御プロセッサ・システム | |
JP2010198314A (ja) | 情報管理装置 | |
JP6911591B2 (ja) | 情報処理装置、制御装置および情報処理装置の制御方法 | |
JP2017041110A (ja) | マルチコンピュータシステム,管理装置および管理プログラム | |
JP4165423B2 (ja) | コアi/oカードを実装したシステムボード | |
JPWO2009066336A1 (ja) | 情報処理装置及び情報処理システム並びにそれらの制御方法 | |
JP4830698B2 (ja) | 担当lun制御を用いたraid制御を行うディスクコントローラおよび診断制御方法 | |
TWI777664B (zh) | 嵌入式系統的開機方法 | |
JP5345655B2 (ja) | 基本入出力プログラムの冗長管理方法及びデータ処理装置 | |
JP2010147803A (ja) | 通信装置および通信装置起動時の運用情報復元方法 | |
US20090313509A1 (en) | Control method for information storage apparatus, information storage apparatus, program and computer readable information recording medium | |
JP6519266B2 (ja) | 情報処理装置、デバイス、および復旧方法、並びにコンピュータ・プログラム | |
JP3679412B6 (ja) | 故障から立直りが速い/故障に対する耐性がある計算処理 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100427 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100720 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100809 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130813 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |