JP2001101034A - 異種os間制御による障害復旧方法 - Google Patents

異種os間制御による障害復旧方法

Info

Publication number
JP2001101034A
JP2001101034A JP27573399A JP27573399A JP2001101034A JP 2001101034 A JP2001101034 A JP 2001101034A JP 27573399 A JP27573399 A JP 27573399A JP 27573399 A JP27573399 A JP 27573399A JP 2001101034 A JP2001101034 A JP 2001101034A
Authority
JP
Japan
Prior art keywords
failure
recovery method
oss
hardware
operating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP27573399A
Other languages
English (en)
Inventor
Noboru Sakoyama
昇 佐子山
Yasuoi Mizuno
養老 水野
Toshikazu Umetsu
利和 梅都
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP27573399A priority Critical patent/JP2001101034A/ja
Publication of JP2001101034A publication Critical patent/JP2001101034A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】特別なハードウェアを必要としないで、ソフト
ウェア技術だけで、主なるOS及びAPの動作環境とは
独立したハードウェア環境を作り、その上で監視する機
能を持ったOS及びAPを動作させて、監視及び再起動
と、独立したハードウェア環境のリアルタイム性を利用
し、障害情報の蓄積及び回線等を通じて外部への情報連
絡、又は外部からの指示で監視や再起動を実現し、計算
機システムの信頼性の向上とシステム管理機能を提供す
る。 【解決手段】一つのCPU上でハードウェア資源を独立
させた環境で、複数のOSが動作する、ソフトウェアで
実現されたマルチOS構成機能を利用するOS2がOS
1を監視する手段と、OS2がOS1を再起動する手段
とこれらを制御するシステム管理機能を具備する事でO
Sの監視及び再起動を実現し、装置及びシステムの信頼
性を向上させる事を特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、計算機システムの
信頼性及びシステム管理に関し、装置内に複数のOSが
同時に動作して、ファイルシステムやメモリ等IO資源
を各OSに独立させてハードウェア障害及びOS障害の
影響を受けない環境で監視するOS又はAPが、障害発
生OS又はAPを即時、自動的に再起動する事でシステ
ムの信頼性及びを実現し、又独立したハード環境でのリ
アルタイム処理を可能とする事を特徴とする異種OS間
制御を使った障害復旧方法に関する。
【0002】
【従来の技術】特開平11−24943「計算機再起動
方法及び計算機停止方法」等の技術により実現されるの
は、マルチOSの構成機能であるが、システムの障害検
出方式やシステムの再起動等の管理については解決して
いない。システムの停止検出や、障害検出した場合の再
起動方法及び障害情報の取得等は、従来からシステムの
二重系等汎用大型計算機では専用ハードウェアを使い実
現している。しかしながらPC/AT互換機等に代表さ
れるパーソナルコンピュータ又はクライアント/サーバ
機では、大掛かりな専用ハードを使うのはコスト的にも
現実的でなく、又専用ボードでOSの動作を監視する方
式も有るが、OSの障害時はリセットで装置全体を再起
動する方法しかない。
【0003】
【発明が解決しようとする課題】特別なハードウェアを
必要としないで、ソフトウェア技術だけで、主なるOS
及びAPの動作環境とは独立したハードウェア環境を作
り、その上で監視する機能を持ったOS及びAPを動作
させて、監視及び再起動と、独立したハードウェア環境
のリアルタイム性を利用し、障害情報の蓄積及び回線等
を通じて外部への情報連絡、又は外部からの指示で監視
や再起動を実現し、計算機システムの信頼性の向上とシ
ステム管理機能を提供する。
【0004】OSの障害の一つに、そのOS上のAPが
メモリの確保、開放をダイナミックに行う時、メモリ確
保不可やOS内で矛盾が発生し重大な障害となる事が有
るが、その回避策として事前に障害回避の為にメモリ等
を初期化する事が有効である。その一例でOS及びAP
の再起動を行う方法が有るが、システムの終了後再起動
に失敗するとそのままシステムダウンとなる。システム
の終了と再起動を、マルチOS構成機能を利用するOS
2の監視で保証し、システムの信頼性を向上させる機能
として提供する。
【0005】
【課題を解決するための手段】一つのCPU上でハード
ウェア資源を独立させた環境で、複数のOSが動作す
る、ソフトウェアで実現されたマルチOS構成機能を利
用するOS2がOS1を監視する手段と、OS2がOS
1を再起動する手段とこれらを制御するシステム管理機
能を具備する事でOSの監視及び再起動を実現し、装置
及びシステムの信頼性を向上させる事を特徴とする。
【0006】また、ソフトウェア技術だけで実現する独
立したハードウェア環境を使い、OS1が障害中もリア
ルタイムに動作するOS2から、OS1の動作情報や障
害情報の判断と蓄積、外部との通信等によりOS1動作
状況の伝達を可能として、動作情報や障害情報からシス
テム停止に至る前に保守によりシステムの安全な停止、
再起動等の対応を可能とする事で、装置及びシステムの
信頼性を向上させる事を特徴とする。
【0007】また、OS1の終了動作を監視して、終了
しない時、強制的に終了させて、その後指定された手順
で判断しOS1を再起動させる場合は、再起動させる事
で装置及びシステムの信頼性を向上させる事を特徴とす
る。
【0008】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。図1は本発明を明示する為の図2と
の比較である。従来のシステムの特徴である図1のOS
100は、監視プログラム104とアプリケーションで
あるAP102を制御している。この様な計算機システ
ムではOS100及びハードウェア資源の障害で、監視
プログラム104も停止してしまう恐れが有り信頼性に
欠ける。
【0009】図2は、OS1200とOS2204が、
論理的な壁202で隔離されている事を示す。この二つ
のOSはハードウェア資源、たとえばメモリ103等を
独立したものとみなすマルチOS構成機能で分離されて
いる。
【0010】図3は本発明における実施形態の計算機を
示す図である。複数のOSが同時動作する装置をハード
ウェア300とする時、その入出力装置としてDK30
2、KB303、通信を行うポート1304とポート2
305が接続されている。ハードウェア300にはOS
1200及びOS2204を制御するCPU307が有
る。IO制御プログラム301はハードウェア300か
らの割り込みやCPUの処理時間をOS1200とOS
2204に振り分ける機能が有り、仮想ハードウェア3
08はソフトウェアであるが、OS1200に対しハー
ドウェア300の様に見せることでOS1200から見
えるハードウエア資源をOS2204から分離独立させ
ている。この仮想ハードウェア308とIO制御プログ
ラム301でマルチOS構成機能を実現している。
【0011】ファイヤウォールはOS1200とOS2
204を分離する概念的な壁202で、OSを含むソフ
トウェア及びメモリ、IO等の資源が分離される境界線
を示す。OS2204はその上で動作するAP203や
OS1200から特別な手続きで参照できる疑似不揮発
メモリ311、OS1200が再起動後それまで動作し
ていたAPの動作を、仕掛かり途中から再開し可能な情
報を持つ引継ぎデータ310をもつ。疑似不揮発メモリ
311は、OS1200を再ロード中もメモリ資源とし
てOS2204に保証された、OS1200から見ると
不揮発メモリに見える。
【0012】ボード306は、OS2204の制御下に
有り通信する手段でデバイス309と通信が可能で有り
OS1200の障害情報やOS2204の情報を外部に
も転送が可能である。このボード306或いはOS22
04側に割り当てられたポート2305を使い、外部か
らの指示でOSI200のみまたはOS2204も含め
た再起動を可能とするリセットの発行や、装置全体の電
源オフも可能とする。
【0013】以下で、本発明の実施の形態の詳細につい
て説明する。図4はOS1200の上でOS1監視31
5が動作している。OS1監視315はOS1200が
動作している限り、OS1200のサービス404を受
けている。0S1監視315は一定時間ごとにOS22
04に信号を送り、OS1200が停止すると、OS1
監視315へのサービス404が停止し、OSのスケジ
ュール402が停止する事でOS1監視315が停止し
て、OS2204への信号が停止する。OS2204
は、OS1監視315からの信号停止を検知すると、O
S1200が停止したと判断して、OS1200を再ロ
ードした後、再起動する事でOS1200の障害回復を
無人で実施し、システムの信頼性が向上する。OS12
00の障害情報はOS2204がが持つ疑似不揮発メモ
リ311上の監視状態モニタデータ401に格納し、O
S1200の回復時参照する事で障害原因を知る事が可
能である。また監視状態モニタデータ401はOS22
04の制御下に有るボード306やポート2305から
外部に伝達ができる。OS1200の監視には、OS2
204からOS1200へ信号を送りその応答信号の有
無或いは応答信号の内容から、OS2204がOS12
00の障害を判断する方法も有る。
【0014】次にメモリ構造について図5で説明する。
CPU307はシステムで物理的な一つのメモリをもつ
が、仮想ハードウェア308はOS1200用のメモリ
であるOS1メモリ503とOS用のメモリ504に、
概念的な壁202で分離独立させている。OS1200
の制御下に有るOS1監視315からはOS2204の
OS2メモリ504が見えないが、仮想ハードウェア3
08が提供するアクセス機構500を使う事でOS1メ
モリ503の内容を読み取り501、OS2メモリ50
4に書き込む502事が可能である。またその逆も可能
である。この様にOS1200やそのAP102等はO
S2メモリ504に直接アクセスができない事でメモリ
資源の独立性を保証している。OS2メモリ504は、
OS1が再ロード、再起動中もその内容が保証される事
から疑似不揮発メモリ311としてOS1200に対し
不揮発性を持ったメモリで有る。図6は、疑似不揮発メ
モリ311の構成を示す物で、共有メモリ600、引き
継ぎデータエリア601OS2専用メモリ602、OS
2プログラム603、OS2AP用メモリ604から構
成される。図7はメモリ構成時のフローで、電源オン直
後メモリのチェック終了後に実行される。ステップ70
0でメモリの物理的な最大値を検出して、ステップ70
1でメモリを指定された値で分割し、ステップ702で
OS1に物理メモリからOS2メモリ分を差し引いたメ
モリが割り当てられる。OS1はこのメモリを計算機シ
ステム内の全メモリとして動作する。
【0015】次に、OS1200が正常に動作中にAP
102或いはAP監視314が、APの動作状態を疑似
不揮発メモリ311内引き継ぎデータ310にモニタし
ておき、OS1200が停止した後、OS2204によ
り再起動した時AP102は初期状態から処理を開始す
るのではなく、引継ぎデータ310を参照して、停止し
た状態から、それ以前の処理を引き継いで処理を開始す
る事で最新の状態に復旧する事ができる。処理の引継ぎ
は、OS1200側のファイル装置であるDK302に
も格納可能であるが、プログラムから見てDKライトが
終了してもキャッシュメモリ上に書かれているだけの時
に、OS1200の障害が発生するとその情報が失われ
る事になる。この状態を解決する手段として、疑似不揮
発メモリ311引継ぎデータ310を置く方法が有効で
ある。
【0016】次に、図8の実施例は、OS1200上で
動作するアプリケーションが24時間、365日無人動
作する場合、メモリリークや原因不明の障害に陥る場合
が有るが、一度システムの再立ち上げを行うと未然に防
ぐ事が出来る。この場合でもシステムの終了処理中にデ
ットロック等の障害が発生する危険性が有る。その場合
でもOS2204によるOS1200監視で、OS12
00が再起動していない事を検知すると、OS2204
はOS1200を再ロード、再起動する事が出来る。あ
らかじめ決められた計画的なOS1200の停止時間、
たとえば毎日のある特定の時間、週に1回、月に1回等
に設定時間と計算機装置の時間が一致した時、今から停
止する警告をだして、一定時間が経過するとOS120
0の停止処理を起動する。停止処理が失敗した時、既に
OS1は正常に動作できない状態に有り、OS1監視3
15でOS1200の障害検出してOS1200を指定
された方法で再起動する。
【0017】OS1200の停止処理が成功した場合、
監視選択802に監視の終了を設定し、終了処理開始を
知らせる開始フラグ803を設定806する。OS22
04のタイマ処理801は開始フラグが設定806され
ると、停止処理以降での失敗時、強制的にOS1200
を停止、再起動させる為のタイマ監視を開始する。タイ
マ監視がタイムアウトすると、タイマ処理801は、O
S1200の状態に関わらず、仮想ハードウェア308
からOS1200に対し不当割り込を発生させる。仮想
ハードウェア308はOS1200側からの不当割り込
みをOS2204に、OS1200の障害として連絡す
る。OS2204はその応答で、仮想ハードウェア30
8にOS1200の再起動を指示する。指定によりCP
U307のリセット、OS1200のみの再ロード、再
起動を行う。
【0018】OS2204の判断で、たとえば時計機構
の不正により停止処理や、再起動とOS1監視315に
よる障害検出でOS1200の再起動の様に、再起動を
繰り返す時、疑似不揮発メモリ311内に連続再起動の
制限値と現在の再起動回数を記憶しておき、回数が一致
したらこれ以上の再起動はDK302のファイル破壊の
恐れも有り、再起動をせずにシステム停止とする事で無
限回再起動の防止を行う。障害情報は停止情報805と
して疑似不揮発メモリ311に記憶して、指示によりO
S2204からボード306やポート2305を通じて
外部へ情報の転送を行う。
【0019】次に、図9の実施例は、自動で電源をオフ
する場合、確実にオフする事を目的とする。図3の電源
制御313はハードウェア300からキーボードである
KB303からの指示或いは計算機装置の特定のスイッ
チが押下されると、電源オフ要求を検知してシステム管
理AP312に連絡する。システム管理AP312は、
システム全体の業務の終了処理を実施し、その結果を電
源制御313に連絡する。電源制御313はシステム管
理AP312からの連絡を受けて、OS1200の終了
処理を起動する。OS1200の終了の最後に、ハード
ウェア300に対し電源オフの指示を出す事で、計算機
システムの電源をオフする。この時OS1200の終了
処理或いは最後の電源オフ処理が正常に動作できなかっ
た場合、システムとしての信頼性が損なわれる。この様
な場合OS1200の電源制御313がOS2204に
強制電源オフ時間と電源オフ監視有りを設定しておく事
でOS2200からの指示で電源オフを実行できる。図
9のフローはOS2側の処理である。ステップ901で
電源オフ開始を検出するとステップ902で監視タイマ
を設定し、ステップ903でタイムアウトを待つ。通常
はここでOS1200からの電源オフで、以降のステッ
プは意味を持たなくなるが、タイムアウトする場合は、
SO1200からの電源オフが失敗したものと判断し
て、OS2204による電源オフ制御に入る。この時D
K302等のIOが動作中はファイル等の破壊につなが
るので、仮想ハードウェア308によりIOのモニタを
行いIOが一定時間動作しない時、電源オフして可能と
判断する。ステップ904でIO動作中は強制終了の有
無を確認し、IO動作なし、或いは強制終了を指示され
た場合、ステップ906で強制電源をオフする。この方
法で、障害時でも安全に、確実に電源のオフが可能とな
る。
【0020】図10は、OS2204が停止するする障
害を救済する手段で、OS2204制御下の監視ボード
1002が、OS2204との間で生き死にの監視をす
る事でOS2204の障害を検出する。たとえばOS2
204が定時間間隔で監視ボード1002のレジスタに
フラグをセットし、監視ボード1002はフラグ設定さ
れなくなるとOS2204の障害を認識し、一定の監視
時間後にハードウェア300のCPU307をリセット
する方法がある。図11は監視ボード1002内の処理
例を示す。レジスタにフラグが設定されるとステップ1
101はOS2204の動作中を認識する。フラグが設
定されなくなるとOS2204停止と判断してステップ
1102で一定時間監視いて後、ステップ1103でC
OU307をリセットする。
【0021】図12は、OS2204の障害回復にCO
U307のリセットだけでなく、計算機システムの電源
オフ後オンする所からの再開しを行う者で、図10の監
視ボードに計算機システムとは別系統の電源装置である
サブ電源1001を持ち、図12のフローで示すOS2
204の監視ステップ1201とステップ1202によ
る障害の検出後、ステップ1203で再電源オン待ち時
間を設定し、ステップ1204で電源をオフする。監視
ボード1002は設定されたタイマをステップ1205
で更新した後、ステップ1206電源オン時間になった
と判断した場合計算機システムの電源をオンする。この
様な監視ボードはOS1側でも実行する事ができる。し
かし信頼性の上で、OS1200から独立したハードウ
ェア環境で動作するOS2204から制御される事を特
徴とする監視ボード1002により信頼性が向上し、遠
隔地及び24時間、365日の無人運転を可能とする。
【0022】
【発明の効果】以上に述べたように、ハードウェア資源
が分離独立した上で動作するOS2により、OS1の障
害を判断し検出して、重要なデータを引き継いでOS1
の自動再立ち上げを行う事で、重要なシステムが動作す
るOS1及びAPを24時間、365日稼動するシステ
ムで、安心した自動運転を、特別なハードウェアを使う
事無くソフトウェアのみで実現し、安価に提供できる効
果が有る。さらに、OS1及びAPの終了や電源オフさ
れる事の監視、CPUの再起動、計算機システムの電源
等のオフ及びオンがOS1障害で動作しない場合でも確
実に実施でき、OS2からの外部への情報伝達する高度
な信頼性を構築する事も可能で、システムに合わせた信
頼性向上策を提供できる効果がある。
【図面の簡単な説明】
【図1】本発明と比較する為の現状を示す。
【図2】本発明の概要を示す図。
【図3】本発明の構成を示す図。
【図4】OS1とOS2間の監視及びAP監視を示す
図。
【図5】OSとメモリの関連を示す図。
【図6】OS2の疑似不揮発メモリの構成を示す図。
【図7】メモリ割り当ての手順を示すフローチャート。
【図8】監視処理とメモリ構成を示す図。
【図9】電源オフ時のOS2のIO監視を示すフローチ
ャート。
【図10】監視ボードを使ったCPU再起動を示す図。
【図11】監視ボードを使ったCPU再起動を示すフロ
ーチャート。
【図12】監視ボードを使った電源オフとオンを示すフ
ローチャート。
【符号の説明】
100…OS、101…監視処理、102…AP、10
3…メモリ、200…OS1 201…監視プログラム、202…ファイヤウォール、
203…AP、204…OS2 300…ハードウェア、301…IO制御プログラム、
302…記憶装置、303…キーボード、304…ポー
ト1、305…ポート2、306…ボード、307…C
PU 308…仮想ハードウェア、309…デバイス、310
…引継ぎデータ、311…疑似不揮発メモリ、312…
システム管理AP、313…電源制御、314…AP監
視 315…OS1監視、401…監視状態モニタデータ、
402…スケジュール、403…ドライバ、404…O
S1サービス処理、500…アクセス機構、501…読
み出し 502…書き込み、503…OS1メモリ、504…O
S2メモリ、600…共有メモリ 601…引継ぎデータ、602…OS2専用メモリ、6
03…OS2プログラム 604…OS2AP用メモリ、700〜702…メモリ
確保フローチャート、800…監視モニタ、801…タ
イマ処理、802…監視選択、803…開始フラグ、8
04…強制リブート、805…停止情報、806…セッ
ト、807…参照、901〜906…監視フローチャー
ト、1001…サブ電源、1002…監視ボード、10
03…リセット 1101〜1207…処理フローチャート
───────────────────────────────────────────────────── フロントページの続き (72)発明者 梅都 利和 愛知県尾張旭市晴丘町池上1番地 株式会 社日立製作所情報機器事業部内 Fターム(参考) 5B042 GA13 GA22 GA23 GC00 GC08 GC16 JJ05 JJ22 KK02 KK03 KK09 LA26 NN51 5B098 HH01 JJ08

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】CPUを持つ装置内のオペレーティングシ
    ステムで、第一OSであるOS1と第二OSであるOS
    2又はそれ以上のOSが動作する複数OS同時実行の計
    算機システムにおいて、ハードウェア資源を各OSに割
    り当てて、ハードウェア及びOSの障害が他のOSの実
    行に影響を与えずに、ソフトとハードを含めて独立させ
    る仮想的な壁であるファイヤウオールをソフトウェア技
    術で実現し、各OS間で情報を伝達する手段と、独立し
    た動作環境からOS及びアプリケーションの動作状態を
    監視しOSの障害又は停止、動作不能状態を検出する手
    段と、障害OSを正常に或いは強制的に止める手段と、
    OSの再起動により回復させる手段とを持ち、これらを
    組み合わせて障害発生時、自動的に回復することを特徴
    とする異種OS間制御による障害復旧方法。
  2. 【請求項2】請求項1記載の障害復旧方法において、O
    S1が動作中の時はOS1の監視処理が一定時間毎にO
    S2に信号を送り、その信号が停止又は信号の内容をO
    S2が判断してOS1に障害が有ると判断した場合、O
    S2がOS1を再起動する事を特徴とする異種OS間制
    御による障害復旧方法。
  3. 【請求項3】請求項1記載の障害復旧方法において、O
    S2がOS1に一定時間毎に信号を送り、OS1は動作
    状態を応答信号としてOS2に返す時、OS2はOS1
    からの応答が停止、或いは応答の内容を判断してOS1
    に障害が有ると判断した場合、OS2がOS1を再起動
    することを特徴とする異種OS間制御による障害復旧方
    法。
  4. 【請求項4】請求項1記載の障害復旧方法において、O
    S1及びOS1の上で動作するAPが正常に動作してい
    る時の動作状態をOS2の、OS1が再起動中もメモリ
    の内容が保証される疑似不揮発メモリ内の引き継ぎデー
    タエリアにモニタリングしておき、OS1或いはOS1
    の上で動作するAPが障害で、OS2から再起動された
    時OS1又はOS1の上で動作するAPは、引継ぎデー
    タを参照して停止した状態から継続して動作することを
    特徴とする異種OS間制御による障害復旧方法。
  5. 【請求項5】請求項1記載の障害復旧方法において、O
    S1又はOS1の上で動作するAPの動作履歴、障害情
    報をOS2の疑似不揮発メモリに格納し、OS1の動作
    状態或いはOS1の障害情報をOS2制御下の通信回線
    を経由して管理システムに連絡することを特徴とする異
    種OS間制御による障害復旧方法。
  6. 【請求項6】請求項1記載の障害復旧方法において、O
    S1或いはOS1の上で動作するAPを再起動する時、
    OS1のソフトウェア又はOS1に割り当てたハードウ
    ェア環境に障害が有り、動作異常、再起動を繰り返す
    時、OS1或いはOS1の上で動作するAPの再起動回
    数や障害情報をOS2の疑似不揮発メモリに保存し、再
    起動前にこれらのデータを判断する事で無限に再起動を
    繰り返す事を防止する事を特徴とする異種OS間制御に
    よる障害復旧方法。
  7. 【請求項7】請求項1記載の障害復旧方法において、O
    S1の障害内容により、予め決められた手順のCPUの
    リセットからの再起動と、OS2の疑似不揮発メモリの
    ロード情報や初期復旧情報を参照してOS1或いはAP
    のみを再起動することを特徴とする異種OS間制御によ
    る障害復旧方法。
  8. 【請求項8】請求項1記載の障害復旧方法において、ハ
    ードウェア資源をOS1とOS2に分離独立させる仮想
    ハードウェアには、実際のハードウェアからの入出力情
    報、割り込みやIO制御情報等のハードウェア情報を取
    り込む手段と、この情報をOS2の疑似不揮発メモリに
    モニタしておく手段と、そのモニタした情報をOS1或
    いはハードウェア障害時の解析情報とすることを特徴と
    する異種OS間制御による障害復旧方法。
  9. 【請求項9】請求項8記載の障害復旧方法において、計
    算機システムの電源を自動でオフする時、OS1等の障
    害で電源オフシーケンスが正常に動作しない時、OS2
    からの状態監視によりOS1障害を検出して強制的に電
    源オフし、更に、ハードウェアの入出力信号をモニタし
    てファイル装置が一定時間動作していない事を確認して
    OS2が強制的に電源オフする事を特徴とする異種OS
    間制御による障害復旧方法。
  10. 【請求項10】請求項1記載の障害復旧方法において、
    OS1の障害発生有無をOS2が監視する時、OS2の
    動作を含めてOS1が動作不能になった場合、CPUに
    よってOS2からの信号が一定時間止った事を検出する
    手段と、専用ボードがOS1及びOS2を動作させてい
    るCPUに対しリセット信号を出す手段を具備して、C
    PUリセットからの再起動をすることを特徴とする異種
    OS間制御による障害復旧方法。
  11. 【請求項11】請求項1記載の障害復旧方法において、
    計算機システムの電源オフ後電源オンで障害から復旧す
    る時、OS1が正常に終了する事を監視する手段と、O
    S1が終了しない事を検出し強制的に終了させる手段
    と、電源オフを監視して電源オフしない事を検出する手
    段と、強制的に電源オフする手段と、電源オフ後指定時
    間後にサブ電源から電源が供給させていて電源オン時間
    を待って電源オンする手段を持ち、OS1障害時は計算
    機システムの電源オフ後電源オンからの回復をする事を
    特徴とする異種OS間制御による障害復旧方法。
  12. 【請求項12】請求項1記載の障害復旧方法において、
    これらを実現するソフトウェアが記録され格納された記
    録媒体を特徴とする異種OS間制御による障害復旧方
    法。
JP27573399A 1999-09-29 1999-09-29 異種os間制御による障害復旧方法 Withdrawn JP2001101034A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27573399A JP2001101034A (ja) 1999-09-29 1999-09-29 異種os間制御による障害復旧方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27573399A JP2001101034A (ja) 1999-09-29 1999-09-29 異種os間制御による障害復旧方法

Publications (1)

Publication Number Publication Date
JP2001101034A true JP2001101034A (ja) 2001-04-13

Family

ID=17559639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27573399A Withdrawn JP2001101034A (ja) 1999-09-29 1999-09-29 異種os間制御による障害復旧方法

Country Status (1)

Country Link
JP (1) JP2001101034A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100783088B1 (ko) 2005-03-18 2007-12-07 후지쯔 가부시끼가이샤 정보처리 장치
JP2008135009A (ja) * 2006-09-29 2008-06-12 Intel Corp プラットフォームのブート効率を増加するシステムおよび方法
JP2008251000A (ja) * 2007-03-16 2008-10-16 Symantec Corp フェイルセーフ式コンピュータ支援アシスタント
US7644252B2 (en) 2004-03-23 2010-01-05 Nec Corporation Multi-processor system and memory accessing method
JP2010020621A (ja) * 2008-07-11 2010-01-28 Toyota Infotechnology Center Co Ltd プログラム修復システムおよび方法
JP2011022833A (ja) * 2009-07-16 2011-02-03 Toshiba Tec Corp 情報処理装置
WO2014132466A1 (ja) * 2013-02-28 2014-09-04 日本電気株式会社 ソフトウェア安全停止システム、ソフトウェア安全停止方法、およびプログラム
KR101842836B1 (ko) 2017-06-20 2018-03-28 전자부품연구원 가상 머신 기반 디지털 정보 디스플레이 장치 및 전자장치

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644252B2 (en) 2004-03-23 2010-01-05 Nec Corporation Multi-processor system and memory accessing method
KR100783088B1 (ko) 2005-03-18 2007-12-07 후지쯔 가부시끼가이샤 정보처리 장치
JP2008135009A (ja) * 2006-09-29 2008-06-12 Intel Corp プラットフォームのブート効率を増加するシステムおよび方法
CN101226478A (zh) * 2006-09-29 2008-07-23 英特尔公司 提高平台引导效率的系统和方法
JP2008251000A (ja) * 2007-03-16 2008-10-16 Symantec Corp フェイルセーフ式コンピュータ支援アシスタント
JP2010020621A (ja) * 2008-07-11 2010-01-28 Toyota Infotechnology Center Co Ltd プログラム修復システムおよび方法
JP2011022833A (ja) * 2009-07-16 2011-02-03 Toshiba Tec Corp 情報処理装置
WO2014132466A1 (ja) * 2013-02-28 2014-09-04 日本電気株式会社 ソフトウェア安全停止システム、ソフトウェア安全停止方法、およびプログラム
JPWO2014132466A1 (ja) * 2013-02-28 2017-02-02 日本電気株式会社 ソフトウェア安全停止システム、ソフトウェア安全停止方法、およびプログラム
US9588798B2 (en) 2013-02-28 2017-03-07 Nec Corporation Software safe shutdown system, software safe shutdown method, and program to prevent a problem caused by a system failure
KR101842836B1 (ko) 2017-06-20 2018-03-28 전자부품연구원 가상 머신 기반 디지털 정보 디스플레이 장치 및 전자장치

Similar Documents

Publication Publication Date Title
US5978911A (en) Automatic error recovery in data processing systems
US6393560B1 (en) Initializing and restarting operating systems
US7644302B2 (en) Restarting method using a snapshot
JP2001101033A (ja) オペレーティングシステム及びアプリケーションプログラムの障害監視方法
US6505298B1 (en) System using an OS inaccessible interrupt handler to reset the OS when a device driver failed to set a register bit indicating OS hang condition
US20040034816A1 (en) Computer failure recovery and notification system
US6425093B1 (en) Methods and apparatuses for controlling the execution of software on a digital processing system
US7089413B2 (en) Dynamic computer system reset architecture
CN113360347B (zh) 一种服务器及其控制方法
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
JP2002259130A (ja) 情報処理システムおよびその起動制御方法
EP3499373B1 (en) Method and apparatus for processing process
US5983359A (en) Processor fault recovering method for information processing system
CN115658113A (zh) 服务器自启动方法、装置、可读存储介质及电子设备
JP2001101034A (ja) 異種os間制御による障害復旧方法
CN115904793B (zh) 一种基于多核异构系统的内存转存方法、系统及芯片
JP2001101032A (ja) 異種os間制御によるos監視方式
JP3690666B2 (ja) マルチコンピュータシステム
KR101100894B1 (ko) 임베디드 장치의 오류검출 및 복구방법
KR102211853B1 (ko) 이종의 멀티 cpu가 탑재된 시스템-온-칩 및 cpu 리부팅을 제어하는 방법
TWI461905B (zh) 可遠端當機復原的運算裝置、用於運算裝置之遠端當機復原之方法及電腦可讀取媒體
JP2785992B2 (ja) サーバプログラムの管理処理方式
CN116991637B (zh) 嵌入式系统的运行控制方法及装置、电子设备及存储介质
JPH0534877B2 (ja)
JP4068277B2 (ja) ハードウェアシステム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050208

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050223

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20050411