JP2001101034A

JP2001101034A - 異種ｏｓ間制御による障害復旧方法

Info

Publication number: JP2001101034A
Application number: JP27573399A
Authority: JP
Inventors: Noboru Sakoyama; 昇佐子山; Yasuoi Mizuno; 養老水野; Toshikazu Umetsu; 利和梅都
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1999-09-29
Filing date: 1999-09-29
Publication date: 2001-04-13

Abstract

(57)【要約】【課題】特別なハードウェアを必要としないで、ソフト
ウェア技術だけで、主なるＯＳ及びＡＰの動作環境とは
独立したハードウェア環境を作り、その上で監視する機
能を持ったＯＳ及びＡＰを動作させて、監視及び再起動
と、独立したハードウェア環境のリアルタイム性を利用
し、障害情報の蓄積及び回線等を通じて外部への情報連
絡、又は外部からの指示で監視や再起動を実現し、計算
機システムの信頼性の向上とシステム管理機能を提供す
る。【解決手段】一つのＣＰＵ上でハードウェア資源を独立
させた環境で、複数のＯＳが動作する、ソフトウェアで
実現されたマルチＯＳ構成機能を利用するＯＳ２がＯＳ
１を監視する手段と、ＯＳ２がＯＳ１を再起動する手段
とこれらを制御するシステム管理機能を具備する事でＯ
Ｓの監視及び再起動を実現し、装置及びシステムの信頼
性を向上させる事を特徴とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、計算機システムの
信頼性及びシステム管理に関し、装置内に複数のＯＳが
同時に動作して、ファイルシステムやメモリ等ＩＯ資源
を各ＯＳに独立させてハードウェア障害及びＯＳ障害の
影響を受けない環境で監視するＯＳ又はＡＰが、障害発
生ＯＳ又はＡＰを即時、自動的に再起動する事でシステ
ムの信頼性及びを実現し、又独立したハード環境でのリ
アルタイム処理を可能とする事を特徴とする異種ＯＳ間
制御を使った障害復旧方法に関する。

【０００２】

【従来の技術】特開平１１−２４９４３「計算機再起動
方法及び計算機停止方法」等の技術により実現されるの
は、マルチＯＳの構成機能であるが、システムの障害検
出方式やシステムの再起動等の管理については解決して
いない。システムの停止検出や、障害検出した場合の再
起動方法及び障害情報の取得等は、従来からシステムの
二重系等汎用大型計算機では専用ハードウェアを使い実
現している。しかしながらＰＣ／ＡＴ互換機等に代表さ
れるパーソナルコンピュータ又はクライアント／サーバ
機では、大掛かりな専用ハードを使うのはコスト的にも
現実的でなく、又専用ボードでＯＳの動作を監視する方
式も有るが、ＯＳの障害時はリセットで装置全体を再起
動する方法しかない。

【０００３】

【発明が解決しようとする課題】特別なハードウェアを
必要としないで、ソフトウェア技術だけで、主なるＯＳ
及びＡＰの動作環境とは独立したハードウェア環境を作
り、その上で監視する機能を持ったＯＳ及びＡＰを動作
させて、監視及び再起動と、独立したハードウェア環境
のリアルタイム性を利用し、障害情報の蓄積及び回線等
を通じて外部への情報連絡、又は外部からの指示で監視
や再起動を実現し、計算機システムの信頼性の向上とシ
ステム管理機能を提供する。

【０００４】ＯＳの障害の一つに、そのＯＳ上のＡＰが
メモリの確保、開放をダイナミックに行う時、メモリ確
保不可やＯＳ内で矛盾が発生し重大な障害となる事が有
るが、その回避策として事前に障害回避の為にメモリ等
を初期化する事が有効である。その一例でＯＳ及びＡＰ
の再起動を行う方法が有るが、システムの終了後再起動
に失敗するとそのままシステムダウンとなる。システム
の終了と再起動を、マルチＯＳ構成機能を利用するＯＳ
２の監視で保証し、システムの信頼性を向上させる機能
として提供する。

【０００５】

【課題を解決するための手段】一つのＣＰＵ上でハード
ウェア資源を独立させた環境で、複数のＯＳが動作す
る、ソフトウェアで実現されたマルチＯＳ構成機能を利
用するＯＳ２がＯＳ１を監視する手段と、ＯＳ２がＯＳ
１を再起動する手段とこれらを制御するシステム管理機
能を具備する事でＯＳの監視及び再起動を実現し、装置
及びシステムの信頼性を向上させる事を特徴とする。

【０００６】また、ソフトウェア技術だけで実現する独
立したハードウェア環境を使い、ＯＳ１が障害中もリア
ルタイムに動作するＯＳ２から、ＯＳ１の動作情報や障
害情報の判断と蓄積、外部との通信等によりＯＳ１動作
状況の伝達を可能として、動作情報や障害情報からシス
テム停止に至る前に保守によりシステムの安全な停止、
再起動等の対応を可能とする事で、装置及びシステムの
信頼性を向上させる事を特徴とする。

【０００７】また、ＯＳ１の終了動作を監視して、終了
しない時、強制的に終了させて、その後指定された手順
で判断しＯＳ１を再起動させる場合は、再起動させる事
で装置及びシステムの信頼性を向上させる事を特徴とす
る。

【０００８】

【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。図１は本発明を明示する為の図２と
の比較である。従来のシステムの特徴である図１のＯＳ
１００は、監視プログラム１０４とアプリケーションで
あるＡＰ１０２を制御している。この様な計算機システ
ムではＯＳ１００及びハードウェア資源の障害で、監視
プログラム１０４も停止してしまう恐れが有り信頼性に
欠ける。

【０００９】図２は、ＯＳ１２００とＯＳ２２０４が、
論理的な壁２０２で隔離されている事を示す。この二つ
のＯＳはハードウェア資源、たとえばメモリ１０３等を
独立したものとみなすマルチＯＳ構成機能で分離されて
いる。

【００１０】図３は本発明における実施形態の計算機を
示す図である。複数のＯＳが同時動作する装置をハード
ウェア３００とする時、その入出力装置としてＤＫ３０
２、ＫＢ３０３、通信を行うポート１３０４とポート２
３０５が接続されている。ハードウェア３００にはＯＳ
１２００及びＯＳ２２０４を制御するＣＰＵ３０７が有
る。ＩＯ制御プログラム３０１はハードウェア３００か
らの割り込みやＣＰＵの処理時間をＯＳ１２００とＯＳ
２２０４に振り分ける機能が有り、仮想ハードウェア３
０８はソフトウェアであるが、ＯＳ１２００に対しハー
ドウェア３００の様に見せることでＯＳ１２００から見
えるハードウエア資源をＯＳ２２０４から分離独立させ
ている。この仮想ハードウェア３０８とＩＯ制御プログ
ラム３０１でマルチＯＳ構成機能を実現している。

【００１１】ファイヤウォールはＯＳ１２００とＯＳ２
２０４を分離する概念的な壁２０２で、ＯＳを含むソフ
トウェア及びメモリ、ＩＯ等の資源が分離される境界線
を示す。ＯＳ２２０４はその上で動作するＡＰ２０３や
ＯＳ１２００から特別な手続きで参照できる疑似不揮発
メモリ３１１、ＯＳ１２００が再起動後それまで動作し
ていたＡＰの動作を、仕掛かり途中から再開し可能な情
報を持つ引継ぎデータ３１０をもつ。疑似不揮発メモリ
３１１は、ＯＳ１２００を再ロード中もメモリ資源とし
てＯＳ２２０４に保証された、ＯＳ１２００から見ると
不揮発メモリに見える。

【００１２】ボード３０６は、ＯＳ２２０４の制御下に
有り通信する手段でデバイス３０９と通信が可能で有り
ＯＳ１２００の障害情報やＯＳ２２０４の情報を外部に
も転送が可能である。このボード３０６或いはＯＳ２２
０４側に割り当てられたポート２３０５を使い、外部か
らの指示でＯＳＩ２００のみまたはＯＳ２２０４も含め
た再起動を可能とするリセットの発行や、装置全体の電
源オフも可能とする。

【００１３】以下で、本発明の実施の形態の詳細につい
て説明する。図４はＯＳ１２００の上でＯＳ１監視３１
５が動作している。ＯＳ１監視３１５はＯＳ１２００が
動作している限り、ＯＳ１２００のサービス４０４を受
けている。０Ｓ１監視３１５は一定時間ごとにＯＳ２２
０４に信号を送り、ＯＳ１２００が停止すると、ＯＳ１
監視３１５へのサービス４０４が停止し、ＯＳのスケジ
ュール４０２が停止する事でＯＳ１監視３１５が停止し
て、ＯＳ２２０４への信号が停止する。ＯＳ２２０４
は、ＯＳ１監視３１５からの信号停止を検知すると、Ｏ
Ｓ１２００が停止したと判断して、ＯＳ１２００を再ロ
ードした後、再起動する事でＯＳ１２００の障害回復を
無人で実施し、システムの信頼性が向上する。ＯＳ１２
００の障害情報はＯＳ２２０４がが持つ疑似不揮発メモ
リ３１１上の監視状態モニタデータ４０１に格納し、Ｏ
Ｓ１２００の回復時参照する事で障害原因を知る事が可
能である。また監視状態モニタデータ４０１はＯＳ２２
０４の制御下に有るボード３０６やポート２３０５から
外部に伝達ができる。ＯＳ１２００の監視には、ＯＳ２
２０４からＯＳ１２００へ信号を送りその応答信号の有
無或いは応答信号の内容から、ＯＳ２２０４がＯＳ１２
００の障害を判断する方法も有る。

【００１４】次にメモリ構造について図５で説明する。
ＣＰＵ３０７はシステムで物理的な一つのメモリをもつ
が、仮想ハードウェア３０８はＯＳ１２００用のメモリ
であるＯＳ１メモリ５０３とＯＳ用のメモリ５０４に、
概念的な壁２０２で分離独立させている。ＯＳ１２００
の制御下に有るＯＳ１監視３１５からはＯＳ２２０４の
ＯＳ２メモリ５０４が見えないが、仮想ハードウェア３
０８が提供するアクセス機構５００を使う事でＯＳ１メ
モリ５０３の内容を読み取り５０１、ＯＳ２メモリ５０
４に書き込む５０２事が可能である。またその逆も可能
である。この様にＯＳ１２００やそのＡＰ１０２等はＯ
Ｓ２メモリ５０４に直接アクセスができない事でメモリ
資源の独立性を保証している。ＯＳ２メモリ５０４は、
ＯＳ１が再ロード、再起動中もその内容が保証される事
から疑似不揮発メモリ３１１としてＯＳ１２００に対し
不揮発性を持ったメモリで有る。図６は、疑似不揮発メ
モリ３１１の構成を示す物で、共有メモリ６００、引き
継ぎデータエリア６０１ＯＳ２専用メモリ６０２、ＯＳ
２プログラム６０３、ＯＳ２ＡＰ用メモリ６０４から構
成される。図７はメモリ構成時のフローで、電源オン直
後メモリのチェック終了後に実行される。ステップ７０
０でメモリの物理的な最大値を検出して、ステップ７０
１でメモリを指定された値で分割し、ステップ７０２で
ＯＳ１に物理メモリからＯＳ２メモリ分を差し引いたメ
モリが割り当てられる。ＯＳ１はこのメモリを計算機シ
ステム内の全メモリとして動作する。

【００１５】次に、ＯＳ１２００が正常に動作中にＡＰ
１０２或いはＡＰ監視３１４が、ＡＰの動作状態を疑似
不揮発メモリ３１１内引き継ぎデータ３１０にモニタし
ておき、ＯＳ１２００が停止した後、ＯＳ２２０４によ
り再起動した時ＡＰ１０２は初期状態から処理を開始す
るのではなく、引継ぎデータ３１０を参照して、停止し
た状態から、それ以前の処理を引き継いで処理を開始す
る事で最新の状態に復旧する事ができる。処理の引継ぎ
は、ＯＳ１２００側のファイル装置であるＤＫ３０２に
も格納可能であるが、プログラムから見てＤＫライトが
終了してもキャッシュメモリ上に書かれているだけの時
に、ＯＳ１２００の障害が発生するとその情報が失われ
る事になる。この状態を解決する手段として、疑似不揮
発メモリ３１１引継ぎデータ３１０を置く方法が有効で
ある。

【００１６】次に、図８の実施例は、ＯＳ１２００上で
動作するアプリケーションが２４時間、３６５日無人動
作する場合、メモリリークや原因不明の障害に陥る場合
が有るが、一度システムの再立ち上げを行うと未然に防
ぐ事が出来る。この場合でもシステムの終了処理中にデ
ットロック等の障害が発生する危険性が有る。その場合
でもＯＳ２２０４によるＯＳ１２００監視で、ＯＳ１２
００が再起動していない事を検知すると、ＯＳ２２０４
はＯＳ１２００を再ロード、再起動する事が出来る。あ
らかじめ決められた計画的なＯＳ１２００の停止時間、
たとえば毎日のある特定の時間、週に１回、月に１回等
に設定時間と計算機装置の時間が一致した時、今から停
止する警告をだして、一定時間が経過するとＯＳ１２０
０の停止処理を起動する。停止処理が失敗した時、既に
ＯＳ１は正常に動作できない状態に有り、ＯＳ１監視３
１５でＯＳ１２００の障害検出してＯＳ１２００を指定
された方法で再起動する。

【００１７】ＯＳ１２００の停止処理が成功した場合、
監視選択８０２に監視の終了を設定し、終了処理開始を
知らせる開始フラグ８０３を設定８０６する。ＯＳ２２
０４のタイマ処理８０１は開始フラグが設定８０６され
ると、停止処理以降での失敗時、強制的にＯＳ１２００
を停止、再起動させる為のタイマ監視を開始する。タイ
マ監視がタイムアウトすると、タイマ処理８０１は、Ｏ
Ｓ１２００の状態に関わらず、仮想ハードウェア３０８
からＯＳ１２００に対し不当割り込を発生させる。仮想
ハードウェア３０８はＯＳ１２００側からの不当割り込
みをＯＳ２２０４に、ＯＳ１２００の障害として連絡す
る。ＯＳ２２０４はその応答で、仮想ハードウェア３０
８にＯＳ１２００の再起動を指示する。指定によりＣＰ
Ｕ３０７のリセット、ＯＳ１２００のみの再ロード、再
起動を行う。

【００１８】ＯＳ２２０４の判断で、たとえば時計機構
の不正により停止処理や、再起動とＯＳ１監視３１５に
よる障害検出でＯＳ１２００の再起動の様に、再起動を
繰り返す時、疑似不揮発メモリ３１１内に連続再起動の
制限値と現在の再起動回数を記憶しておき、回数が一致
したらこれ以上の再起動はＤＫ３０２のファイル破壊の
恐れも有り、再起動をせずにシステム停止とする事で無
限回再起動の防止を行う。障害情報は停止情報８０５と
して疑似不揮発メモリ３１１に記憶して、指示によりＯ
Ｓ２２０４からボード３０６やポート２３０５を通じて
外部へ情報の転送を行う。

【００１９】次に、図９の実施例は、自動で電源をオフ
する場合、確実にオフする事を目的とする。図３の電源
制御３１３はハードウェア３００からキーボードである
ＫＢ３０３からの指示或いは計算機装置の特定のスイッ
チが押下されると、電源オフ要求を検知してシステム管
理ＡＰ３１２に連絡する。システム管理ＡＰ３１２は、
システム全体の業務の終了処理を実施し、その結果を電
源制御３１３に連絡する。電源制御３１３はシステム管
理ＡＰ３１２からの連絡を受けて、ＯＳ１２００の終了
処理を起動する。ＯＳ１２００の終了の最後に、ハード
ウェア３００に対し電源オフの指示を出す事で、計算機
システムの電源をオフする。この時ＯＳ１２００の終了
処理或いは最後の電源オフ処理が正常に動作できなかっ
た場合、システムとしての信頼性が損なわれる。この様
な場合ＯＳ１２００の電源制御３１３がＯＳ２２０４に
強制電源オフ時間と電源オフ監視有りを設定しておく事
でＯＳ２２００からの指示で電源オフを実行できる。図
９のフローはＯＳ２側の処理である。ステップ９０１で
電源オフ開始を検出するとステップ９０２で監視タイマ
を設定し、ステップ９０３でタイムアウトを待つ。通常
はここでＯＳ１２００からの電源オフで、以降のステッ
プは意味を持たなくなるが、タイムアウトする場合は、
ＳＯ１２００からの電源オフが失敗したものと判断し
て、ＯＳ２２０４による電源オフ制御に入る。この時Ｄ
Ｋ３０２等のＩＯが動作中はファイル等の破壊につなが
るので、仮想ハードウェア３０８によりＩＯのモニタを
行いＩＯが一定時間動作しない時、電源オフして可能と
判断する。ステップ９０４でＩＯ動作中は強制終了の有
無を確認し、ＩＯ動作なし、或いは強制終了を指示され
た場合、ステップ９０６で強制電源をオフする。この方
法で、障害時でも安全に、確実に電源のオフが可能とな
る。

【００２０】図１０は、ＯＳ２２０４が停止するする障
害を救済する手段で、ＯＳ２２０４制御下の監視ボード
１００２が、ＯＳ２２０４との間で生き死にの監視をす
る事でＯＳ２２０４の障害を検出する。たとえばＯＳ２
２０４が定時間間隔で監視ボード１００２のレジスタに
フラグをセットし、監視ボード１００２はフラグ設定さ
れなくなるとＯＳ２２０４の障害を認識し、一定の監視
時間後にハードウェア３００のＣＰＵ３０７をリセット
する方法がある。図１１は監視ボード１００２内の処理
例を示す。レジスタにフラグが設定されるとステップ１
１０１はＯＳ２２０４の動作中を認識する。フラグが設
定されなくなるとＯＳ２２０４停止と判断してステップ
１１０２で一定時間監視いて後、ステップ１１０３でＣ
ＯＵ３０７をリセットする。

【００２１】図１２は、ＯＳ２２０４の障害回復にＣＯ
Ｕ３０７のリセットだけでなく、計算機システムの電源
オフ後オンする所からの再開しを行う者で、図１０の監
視ボードに計算機システムとは別系統の電源装置である
サブ電源１００１を持ち、図１２のフローで示すＯＳ２
２０４の監視ステップ１２０１とステップ１２０２によ
る障害の検出後、ステップ１２０３で再電源オン待ち時
間を設定し、ステップ１２０４で電源をオフする。監視
ボード１００２は設定されたタイマをステップ１２０５
で更新した後、ステップ１２０６電源オン時間になった
と判断した場合計算機システムの電源をオンする。この
様な監視ボードはＯＳ１側でも実行する事ができる。し
かし信頼性の上で、ＯＳ１２００から独立したハードウ
ェア環境で動作するＯＳ２２０４から制御される事を特
徴とする監視ボード１００２により信頼性が向上し、遠
隔地及び２４時間、３６５日の無人運転を可能とする。

【００２２】

【発明の効果】以上に述べたように、ハードウェア資源
が分離独立した上で動作するＯＳ２により、ＯＳ１の障
害を判断し検出して、重要なデータを引き継いでＯＳ１
の自動再立ち上げを行う事で、重要なシステムが動作す
るＯＳ１及びＡＰを２４時間、３６５日稼動するシステ
ムで、安心した自動運転を、特別なハードウェアを使う
事無くソフトウェアのみで実現し、安価に提供できる効
果が有る。さらに、ＯＳ１及びＡＰの終了や電源オフさ
れる事の監視、ＣＰＵの再起動、計算機システムの電源
等のオフ及びオンがＯＳ１障害で動作しない場合でも確
実に実施でき、ＯＳ２からの外部への情報伝達する高度
な信頼性を構築する事も可能で、システムに合わせた信
頼性向上策を提供できる効果がある。

【図面の簡単な説明】

【図１】本発明と比較する為の現状を示す。

【図２】本発明の概要を示す図。

【図３】本発明の構成を示す図。

【図４】ＯＳ１とＯＳ２間の監視及びＡＰ監視を示す
図。

【図５】ＯＳとメモリの関連を示す図。

【図６】ＯＳ２の疑似不揮発メモリの構成を示す図。

【図７】メモリ割り当ての手順を示すフローチャート。

【図８】監視処理とメモリ構成を示す図。

【図９】電源オフ時のＯＳ２のＩＯ監視を示すフローチ
ャート。

【図１０】監視ボードを使ったＣＰＵ再起動を示す図。

【図１１】監視ボードを使ったＣＰＵ再起動を示すフロ
ーチャート。

【図１２】監視ボードを使った電源オフとオンを示すフ
ローチャート。

【符号の説明】

１００…ＯＳ、１０１…監視処理、１０２…ＡＰ、１０
３…メモリ、２００…ＯＳ１２０１…監視プログラム、２０２…ファイヤウォール、
２０３…ＡＰ、２０４…ＯＳ２３００…ハードウェア、３０１…ＩＯ制御プログラム、
３０２…記憶装置、３０３…キーボード、３０４…ポー
ト１、３０５…ポート２、３０６…ボード、３０７…Ｃ
ＰＵ３０８…仮想ハードウェア、３０９…デバイス、３１０
…引継ぎデータ、３１１…疑似不揮発メモリ、３１２…
システム管理ＡＰ、３１３…電源制御、３１４…ＡＰ監
視３１５…ＯＳ１監視、４０１…監視状態モニタデータ、
４０２…スケジュール、４０３…ドライバ、４０４…Ｏ
Ｓ１サービス処理、５００…アクセス機構、５０１…読
み出し５０２…書き込み、５０３…ＯＳ１メモリ、５０４…Ｏ
Ｓ２メモリ、６００…共有メモリ６０１…引継ぎデータ、６０２…ＯＳ２専用メモリ、６
０３…ＯＳ２プログラム６０４…ＯＳ２ＡＰ用メモリ、７００〜７０２…メモリ
確保フローチャート、８００…監視モニタ、８０１…タ
イマ処理、８０２…監視選択、８０３…開始フラグ、８
０４…強制リブート、８０５…停止情報、８０６…セッ
ト、８０７…参照、９０１〜９０６…監視フローチャー
ト、１００１…サブ電源、１００２…監視ボード、１０
０３…リセット１１０１〜１２０７…処理フローチャート

───────────────────────────────────────────────────── フロントページの続き (72)発明者梅都利和愛知県尾張旭市晴丘町池上１番地株式会社日立製作所情報機器事業部内Ｆターム(参考） 5B042 GA13 GA22 GA23 GC00 GC08 GC16 JJ05 JJ22 KK02 KK03 KK09 LA26 NN51 5B098 HH01 JJ08

Claims

【特許請求の範囲】

【請求項１】ＣＰＵを持つ装置内のオペレーティングシ
ステムで、第一ＯＳであるＯＳ１と第二ＯＳであるＯＳ
２又はそれ以上のＯＳが動作する複数ＯＳ同時実行の計
算機システムにおいて、ハードウェア資源を各ＯＳに割
り当てて、ハードウェア及びＯＳの障害が他のＯＳの実
行に影響を与えずに、ソフトとハードを含めて独立させ
る仮想的な壁であるファイヤウオールをソフトウェア技
術で実現し、各ＯＳ間で情報を伝達する手段と、独立し
た動作環境からＯＳ及びアプリケーションの動作状態を
監視しＯＳの障害又は停止、動作不能状態を検出する手
段と、障害ＯＳを正常に或いは強制的に止める手段と、
ＯＳの再起動により回復させる手段とを持ち、これらを
組み合わせて障害発生時、自動的に回復することを特徴
とする異種ＯＳ間制御による障害復旧方法。
【請求項２】請求項１記載の障害復旧方法において、Ｏ
Ｓ1が動作中の時はＯＳ１の監視処理が一定時間毎にＯ
Ｓ２に信号を送り、その信号が停止又は信号の内容をＯ
Ｓ２が判断してＯＳ１に障害が有ると判断した場合、Ｏ
Ｓ２がＯＳ１を再起動する事を特徴とする異種ＯＳ間制
御による障害復旧方法。
【請求項３】請求項１記載の障害復旧方法において、Ｏ
Ｓ２がＯＳ１に一定時間毎に信号を送り、ＯＳ１は動作
状態を応答信号としてＯＳ２に返す時、ＯＳ２はＯＳ１
からの応答が停止、或いは応答の内容を判断してＯＳ１
に障害が有ると判断した場合、ＯＳ２がＯＳ１を再起動
することを特徴とする異種ＯＳ間制御による障害復旧方
法。
【請求項４】請求項１記載の障害復旧方法において、Ｏ
Ｓ１及びＯＳ１の上で動作するＡＰが正常に動作してい
る時の動作状態をＯＳ２の、ＯＳ１が再起動中もメモリ
の内容が保証される疑似不揮発メモリ内の引き継ぎデー
タエリアにモニタリングしておき、ＯＳ１或いはＯＳ１
の上で動作するＡＰが障害で、ＯＳ２から再起動された
時ＯＳ１又はＯＳ１の上で動作するＡＰは、引継ぎデー
タを参照して停止した状態から継続して動作することを
特徴とする異種ＯＳ間制御による障害復旧方法。
【請求項５】請求項１記載の障害復旧方法において、Ｏ
Ｓ１又はＯＳ１の上で動作するＡＰの動作履歴、障害情
報をＯＳ２の疑似不揮発メモリに格納し、ＯＳ１の動作
状態或いはＯＳ１の障害情報をＯＳ２制御下の通信回線
を経由して管理システムに連絡することを特徴とする異
種ＯＳ間制御による障害復旧方法。
【請求項６】請求項１記載の障害復旧方法において、Ｏ
Ｓ１或いはＯＳ１の上で動作するＡＰを再起動する時、
ＯＳ１のソフトウェア又はＯＳ１に割り当てたハードウ
ェア環境に障害が有り、動作異常、再起動を繰り返す
時、ＯＳ１或いはＯＳ１の上で動作するＡＰの再起動回
数や障害情報をＯＳ２の疑似不揮発メモリに保存し、再
起動前にこれらのデータを判断する事で無限に再起動を
繰り返す事を防止する事を特徴とする異種ＯＳ間制御に
よる障害復旧方法。
【請求項７】請求項１記載の障害復旧方法において、Ｏ
Ｓ１の障害内容により、予め決められた手順のＣＰＵの
リセットからの再起動と、ＯＳ２の疑似不揮発メモリの
ロード情報や初期復旧情報を参照してＯＳ１或いはＡＰ
のみを再起動することを特徴とする異種ＯＳ間制御によ
る障害復旧方法。
【請求項８】請求項１記載の障害復旧方法において、ハ
ードウェア資源をＯＳ１とＯＳ２に分離独立させる仮想
ハードウェアには、実際のハードウェアからの入出力情
報、割り込みやＩＯ制御情報等のハードウェア情報を取
り込む手段と、この情報をＯＳ２の疑似不揮発メモリに
モニタしておく手段と、そのモニタした情報をＯＳ１或
いはハードウェア障害時の解析情報とすることを特徴と
する異種ＯＳ間制御による障害復旧方法。
【請求項９】請求項８記載の障害復旧方法において、計
算機システムの電源を自動でオフする時、ＯＳ１等の障
害で電源オフシーケンスが正常に動作しない時、ＯＳ２
からの状態監視によりＯＳ１障害を検出して強制的に電
源オフし、更に、ハードウェアの入出力信号をモニタし
てファイル装置が一定時間動作していない事を確認して
ＯＳ２が強制的に電源オフする事を特徴とする異種ＯＳ
間制御による障害復旧方法。
【請求項１０】請求項１記載の障害復旧方法において、
ＯＳ１の障害発生有無をＯＳ２が監視する時、ＯＳ２の
動作を含めてＯＳ１が動作不能になった場合、ＣＰＵに
よってＯＳ２からの信号が一定時間止った事を検出する
手段と、専用ボードがＯＳ１及びＯＳ２を動作させてい
るＣＰＵに対しリセット信号を出す手段を具備して、Ｃ
ＰＵリセットからの再起動をすることを特徴とする異種
ＯＳ間制御による障害復旧方法。
【請求項１１】請求項１記載の障害復旧方法において、
計算機システムの電源オフ後電源オンで障害から復旧す
る時、ＯＳ１が正常に終了する事を監視する手段と、Ｏ
Ｓ１が終了しない事を検出し強制的に終了させる手段
と、電源オフを監視して電源オフしない事を検出する手
段と、強制的に電源オフする手段と、電源オフ後指定時
間後にサブ電源から電源が供給させていて電源オン時間
を待って電源オンする手段を持ち、ＯＳ１障害時は計算
機システムの電源オフ後電源オンからの回復をする事を
特徴とする異種ＯＳ間制御による障害復旧方法。
【請求項１２】請求項１記載の障害復旧方法において、
これらを実現するソフトウェアが記録され格納された記
録媒体を特徴とする異種ＯＳ間制御による障害復旧方
法。