JPH0812616B2 - オペレーティングシステムカーネル用受動回復方法およびシステム - Google Patents

オペレーティングシステムカーネル用受動回復方法およびシステム

Info

Publication number
JPH0812616B2
JPH0812616B2 JP4192282A JP19228292A JPH0812616B2 JP H0812616 B2 JPH0812616 B2 JP H0812616B2 JP 4192282 A JP4192282 A JP 4192282A JP 19228292 A JP19228292 A JP 19228292A JP H0812616 B2 JPH0812616 B2 JP H0812616B2
Authority
JP
Japan
Prior art keywords
instruction
recovery
address
routine
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4192282A
Other languages
English (en)
Other versions
JPH05204686A (ja
Inventor
バリー、フィリップ、ルーバート
トマス、バン、ウィーバー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH05204686A publication Critical patent/JPH05204686A/ja
Publication of JPH0812616B2 publication Critical patent/JPH0812616B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル情報処理シ
ステムの動作、より詳細には、そのような情報処理シス
テムの動作中に発生した誤り状態の処理のためのシステ
ムおよび方法に関する。さらに詳しく言えば、本発明
は、実行中のプロセスによって受動的に動作する回復環
境による障害回復のためのシステムおよび方法に関す
る。
【0002】
【従来の技術およびその課題】現代の情報処理システム
は、システム機能を管理するためにオペレーティングシ
ステムを利用している。オペレーティングシステムは、
データ処理システム内でタスクをスケジュールする機
能、ならびに、記憶域、外部記憶装置およびコンピュー
タシステムの他の資源を管理する機能を行う。オペレー
ティングシステムは、コンピュータシステムで数百もの
プロセスとして実行される複雑なソフトウエア構造に発
展している。
【0003】基本的なオペレーティングシステムの機能
は通常、特にUNIX系オペレーティングシステム(U
NIXはUNIX Systems Laborato
ries, Inc.の登録商標である)で使用される
名称である、カーネルにまとめられている。カーネル
は、必要に応じて実行される無数のプロセスを備えた単
一の大規模なオペレーティングプログラムとして作成さ
れている。
【0004】いずれかのコンピュータシステムの動作
は、時折、ソフトウエアの誤り、ハードウエアの誤りま
たは装置の故障などによる、システム故障に遭遇する。
システム故障に遭遇した場合、オペレーティングシステ
ムプログラムは、その故障の原因を分析し、可能な場
合、その問題を正して処理を続行できる能力を持たなけ
ればならない。誤り回復は、故障から回復させるために
システム全体を停止し再始動することが実際的ではな
い、大規模マルチユーザシステムでは特に重要である。
【0005】従来、各オペレーティングシステムプロセ
スによって、独自の回復ルーチンが指定され構築されて
いる。実行中のプロセスの要求により、カーネルはその
ルーチンにもとづいて回復環境を確立する。動作中、従
来技術のカーネルは、図1に示す状態によって手続きす
る。オペレーティングシステムはまず、102で初期化
すべきプロセスを選択し、104で回復環境を確立し、
106でそのプロセスを実行し始める。その実行が成功
すれば、システムは108で回復環境を終了させ、10
2で次のプロセスを初期化する。106でのプロセスの
実行中の故障の検出は110で故障処理ルーチンを呼び
出し、これは、112で適切な回復環境に入り、その故
障を修正しようと試みる。回復が成功し、そのプロセス
の実行が続行できれば、制御は106のプロセスの実行
に復帰する。成功しなければ、資源ロックを解除するな
どして資源は解放され、計算は以前の安全な状態まで復
元され、そのルーチンは終了する。その後、終了プロセ
スは、108で回復環境を終了させ、102でプロセス
のスケジューリングに戻る。
【0006】従来技術は、各プロセスの実行について、
回復環境を確立し、その環境を終了させる必要性によっ
て、大きなシステムオーバヘッドを生じるという技術的
な課題を被っていた。故障はまれにしか発生しないの
で、すべてのプロセスでの回復環境の確立は、多大かつ
非生産的なオーバヘッドを生じる。一部のオペレーティ
ングシステムでは、このオーバヘッドは、そのコンピュ
ータシステムの能力の最大20%をも消費する可能性が
ある。
【0007】従って、コンピュータシステムによる故障
によって要求された場合にのみ確立され、呼び出される
回復機構を付与することが望ましい。これは、回復機能
の損失を伴わずにオペレーティングシステムのオーバヘ
ッドの大きな低減をもたらすであろう。解決すべき課題
は、現在消費されている高いプロセッサオーバヘッドを
招くことなく、故障回復の処理に備えることである。
【0008】
【課題を解決するための手段】本発明の目的は、オペレ
ーティングシステムのオーバヘッドを最小限にする受動
回復システムを供することである。「受動」という用語
は、回復環境を確立することが実行時システムオーバヘ
ッドをまったく要求しない状況に関連する。この回復環
境は、故障が検出されるまで「受動的に」存在し、検出
された場合に、その環境は処理のために活性化される。
【0009】本発明は、オペレーティングシステムルー
チンがカーネルを形成するために結合された時、およ
び、オペレーティングシステム初期化時に、回復環境を
生成することによって受動回復環境を付与する。この静
的回復環境は、オペレーティングシステムに存在し、い
ずれかのシステム故障の命令アドレスから適切な回復ル
ーチンへの相互参照を付与する。ソフトウエア/ハード
ウエア誤り検出機構は、いずれの回復ルーチンを開始さ
せるべきかを決定するためにこの静的相互参照にアクセ
スする。その後、制御は、オペレーティングシステムの
現在の文脈において全部のレジスタおよび変数へのアク
セス権を有する適切な回復ルーチンへ渡される。本発明
は、その入れ子形機能のそれぞれが必要な何らかの回復
動作を実行するための機会が持てるような、そうした入
れ子形回復機能を可能にする。各回復ルーチン自体が回
復ルーチンを有することができる。
【0010】
【実施例】本発明は、オペレーティングシステムカーネ
ルへの受動回復システムの付与に関する。本発明は、オ
ペレーティングシステムカーネルに関して、特に、AI
Xオペレーティングシステム(AIXはIBM Cor
porationの登録商標である)に関して説明す
る。しかし、AIXオペレーティングシステムカーネル
に関して説明するその技法は、他のオペレーティングシ
ステム、および、コンピュータシステムでのいずれのプ
ロセスにも適用できることが理解されよう。受動回復シ
ステムの利点は、プロセスの数の多さおよび実行の頻度
の点から、オペレーティングシステムの場合に最も顕著
である。しかし、その技法は、たとえそれほど頻繁に実
行されるものでなくても、いずれのコンピュータプロセ
スに適用可能であり、有益である。
【0011】本発明が動作するコンピュータシステム環
境を図2に略示する。オペレーティングシステムカーネ
ル210は、一定範囲のアドレスでコンピュータの記憶
域212にロードされる。カーネルの各種部分を結合す
るプロセスは、カーネル210内の各ルーチンが他の全
部のルーチンに知られている規定のアドレスを有するよ
うに、全部のアドレス参照を分解する。オペレーティン
グシステムは、実行要素214を用いて実行される。実
行は、プログラム210からの命令を論理順に処理する
ことによって行われる。論理順序は、逐次的、または、
分岐形式の命令による指示に従ってのいずれかとするこ
とができる。
【0012】実行は、故障が検出されるまで、要求通り
に継続される。このコンピュータシステムは、実行プロ
セス214を監視するソフトウエア/ハードウエア故障
検出機構216を備える。故障を検出すると、システム
は回復プロセス218を実行しなければならない。本発
明は、オペレーティングシステムプログラム210の一
部として記憶されている回復ルーチン相互参照テーブル
220を使用する。故障検出プロセス216はテーブル
220を参照し、回復ルーチンアドレスを回復処理21
8に与える。
【0013】上述の動作の順序は、図3の状態図に図示
する。処理は状態302で初期化される。初期化される
と、実行は304に進み、成功すれば、制御は次のプロ
セスを初期化するために状態302に戻る。故障が発生
すると、システムは故障処理状態306にされ、適切な
処理ルーチンを決定し回復処理308を初期化する。こ
れは通常、プロセス初期化302によって処理される回
復ルーチンへの分岐につながる。
【0014】本発明の受動回復は、図1と図3とを比較
することによってわかる通り、従来技術よりも少ない段
階を含む。回復環境の確立は、各プロセスから抽出さ
れ、カーネルが結合されている時に一度に実行される。
【0015】回復ルーチン相互参照テーブルの例を図4
に示す。好ましい実施例では、処理ルーチンのアドレス
の範囲が、そのアドレスの故障時に実行される回復ルー
チンのアドレスの相互参照とともにテーブルに記入され
る。この回復ルーチンアドレスは、故障時に実行され得
るオペレーティングシステムへの入口点である。好まし
い実施例では、これらのアドレスはルーチンの長さとと
もに開始オフセットとして示されているが、他のいずれ
の形式のアドレス範囲指定を付与することができる。こ
のテーブルのアドレス範囲は、重なり合うことができ、
相互排他的である必要はない。故障処理ルーチンは、全
部の適用可能回復ルーチンを決定し、それらを主ルーチ
ンの入れ子に従って実行する。
【0016】回復ルーチン相互参照テーブルは、オペレ
ーティングシステムカーネルの連結または結合中に生成
される。この結合プロセスは、最終的なカーネルを構成
するプロセス構成要素を一緒にする。重要な結合タスク
のなかに、モジュール内でのアドレスの分解がある。結
合プロセスは、全部のアドレスを、全部のプロセスに知
られている相対アドレスに分解しようと試みる。本発明
に従った回復機構は、それぞれの主処理ルーチンのため
の回復ルーチンが結合中に指定されるように要求する。
結合プロセスは、回復ルーチン入口点アドレスを指定さ
れたプロセスのアドレス範囲に関係づける。全部のアド
レスがバインダによって分解されているので、構築され
るテーブルは全部の必要な相対アドレス指定情報を有す
ることになる。テーブルは、故障処理ルーチンによって
容易に参照することができるように、最終的なオペレー
ティングシステムカーネルに構築され、結合される。
【0017】上述のプロセスは、静的回復ルーチン相互
参照テーブルを生じる。このテーブルは、オペレーティ
ングシステムがコンピュータにロードされ、実行される
ので、変更されないままである。本発明の代替実施例で
は、この回復ルーチンテーブルを動的に修正できる能力
が付与される。その動的回復修正ルーチンは、オペレー
ティングシステムカーネルがそのコンピュータ内で動的
に修正可能であることを必要とする。カーネルの動的修
正は、アドレス分解を含み、主処理論理および回復ルー
チン相互参照の両者でのアドレスの修正または変更を可
能にする。このようにして、回復ルーチンは必要に応じ
て動的に変更することができる。
【0018】本発明は、ソフトウエア/ハードウエア故
障処理ルーチンが、回復プロセスの入口点を決定するた
めに回復ルーチン相互参照テーブルにアクセスできるよ
うに修正されることを必要とする。故障機構は、回復ル
ーチン入口点を決定し、そのルーチンの実行を開始す
る。障害ルーチンは、その故障構成要素の同一の環境的
文脈の一部として回復ルーチンを呼び出す。これによ
り、回復ルーチンは回復に必要なレジスタおよび変数へ
のアクセス権を有することができる。
【0019】このシステム故障処理は、プラットフォー
ム依存性であるが、各プラットフォームで同様の機能を
実行する。本明細書に開示した技法は、多数の各種プラ
ットフォームに対して適用できる。回復ルーチン処理の
完了時には、その誤りが回復され、故障点から計算が続
行できるという指示、誤りは回復できず、故障システム
は何らかの措置をとらなければならないという指示、ま
たは、最終的にその資源は回復されたが計算は続けられ
ないという指示のいずれかがその故障プロセッサに返さ
れる。計算が続行できない場合、故障プロセッサは、そ
の故障機能を呼び出すルーチンを(呼出しスタックを調
べるなどして)判定し、その呼出しルーチンの回復ルー
チンを呼び出さなければならない。このプロセスは、計
算が再開され得る、または、回復不可能であるとわかる
まで、継続される。回復不可能な誤りが検出された場
合、プラットフォームの特定動作がとられる。
【0020】本発明は、正常動作が回復処理のための付
加的な命令をまったく要求しないという利点を有する。
このことは、オペレーティングシステム構成要素のオー
バヘッドの著しい低減をもたらす。しかし、本発明は、
強力な故障処理および回復処理を付与する。
【図面の簡単な説明】
【図1】回復環境を備えた従来技術のオペレーティング
システムの状態図。
【図2】本発明に従ったコンピュータシステムの物理構
造の説明図。
【図3】本発明に従ったコンピュータシステムの処理状
態を示す状態図。
【図4】本発明に従った回復ルーチン相互参照テーブル
の例示レイアウトの説明図。
【図5】オペレーティングシステムの結合プロセスにお
いて回復ルーチン相互参照テーブルの確立を例示する流
れ図。
【符号の説明】
212 記憶域 210 オペレーティングシステムカーネル 220 回復ルーチン相互参照テーブル
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭55−23571(JP,A) 特開 平1−232440(JP,A) 特開 平2−66636(JP,A)

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】記憶装置に各自の命令アドレスで記憶され
    ている命令のシークエンスからなる処理ルーチンの1又
    は複数を実行するプロセッサを有するコンピュータシス
    テムにおける、前記処理ルーチンの1つの実行の際のエ
    ラーから回復する方法であって、 (a) 前記処理ルーチンのいずれかが実行される前
    に、前記命令アドレスの複数の範囲の各々を回復ルーチ
    ンのアドレスに関連付けると共に、前記命令アドレスの
    各々が前記複数の範囲の少なくとも1つに含まれるよう
    にするステップと、 (b) 前記処理ルーチンの1つの命令の処理における
    エラーの検出に応答して、 (1) 前記命令の命令アドレスを含む1又は複数の命
    令アドレス範囲を決定すると共に、 (2) 前記命令の命令アドレスを含んでいる前記1又
    は複数のアドレス範囲の各々について、前記アドレス範
    囲に関連する回復ルーチンが実行されるステップと、を
    備える、 ことを特徴とするエラー回復処理方法。
  2. 【請求項2】請求項1記載の方法であって、 前記ステップ(a)は、命令アドレス範囲の各々に対応
    する複数のエントリを有する相互参照テーブルを記憶す
    るステップを含み、 前記複数のエントリの各々は、対応する命令アドレス範
    囲に関連する回復ルーチンのアドレスを表している、 ことを特徴とする方法。
  3. 【請求項3】請求項2記載の方法であって、 前記ステップ(b)(1)は、前記命令アドレスを含ん
    でいるアドレス範囲について前記相互参照テーブルをサ
    ーチするステップを含む、 ことを特徴とする方法。
  4. 【請求項4】請求項2記載の方法であって、 前記エントリの各々は、開始アドレスと対応する範囲の
    広がりを表す、 ことを特徴とする方法。
  5. 【請求項5】請求項1記載の方法であって、 前記ステップ(b)(2)は、前記命令アドレス範囲に
    関連する回復ルーチンアドレスに分岐するステップを含
    む、 ことを特徴とする方法。
  6. 【請求項6】請求項1記載の方法であって、 更に、回復が成功したならば処理ルーチンの実行を再開
    し、さもなければ前記処理ルーチンの実行を終了するス
    テップを含む、 ことを特徴とする方法。
  7. 【請求項7】記憶装置に各自の命令アドレスで記憶され
    ている命令のシークエンスからなる処理ルーチンの1又
    は複数を実行するプロセッサを有するコンピュータシス
    テムにおける、前記処理ルーチンの1つの実行の際のエ
    ラーから回復する装置であって、 前記処理ルーチンのいずれかが実行される前に前記命令
    アドレスの複数の範囲の各々を回復ルーチンのアドレス
    に関連付けると共に、前記命令アドレスの各々が前記複
    数の範囲の少なくとも1つに含まれるようにする操作手
    段と、 前記命令の命令アドレスを含む1又は複数の命令アドレ
    ス範囲を決定するために前記処理ルーチンの1つの命令
    の処理におけるエラーの検出に応答する手段と、 前記1又は複数の命令アドレス範囲に関連する1又は複
    数の回復ルーチンを決定する手段と、 前記1又は複数の回復ルーチンの実行を前記プロセッサ
    にさせる手段と、 を備える装置。
  8. 【請求項8】請求項7記載の装置であって、 前記操作手段は、各々が対応する命令アドレス範囲に関
    連する回復ルーチンのアドレスを表す、命令アドレス範
    囲の各々に対応した複数のエントリを有する相互参照テ
    ーブルを記憶する手段を含む、 ことを特徴とする装置。
  9. 【請求項9】請求項1記載の方法であって、 前記ステップ(a)は、実行可能なプログラムを形成す
    るために前記処理ルーチンと前記回復ルーチンが互いに
    結合されてから実行される、 ことを特徴とする方法。
  10. 【請求項10】請求項1記載の方法であって、 前記命令アドレスの少なくとも1つは複数の前記命令ア
    ドレス範囲内に含まれている、 ことを特徴とする方法。
  11. 【請求項11】請求項7記載の装置であって、 前記操作手段は、前記処理ルーチンと前記回復処理ルー
    チンが実行可能なプログラムを形成するために互いに結
    合されてから動作可能となる、 ことを特徴とする装置。
  12. 【請求項12】請求項7記載の装置であって、 前記命令アドレスの少なくとも1つは複数の前記命令ア
    ドレス範囲内に含まれている、 ことを特徴とする装置。
JP4192282A 1991-09-11 1992-07-20 オペレーティングシステムカーネル用受動回復方法およびシステム Expired - Lifetime JPH0812616B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US75787391A 1991-09-11 1991-09-11
US757873 1991-09-11

Publications (2)

Publication Number Publication Date
JPH05204686A JPH05204686A (ja) 1993-08-13
JPH0812616B2 true JPH0812616B2 (ja) 1996-02-07

Family

ID=25049575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4192282A Expired - Lifetime JPH0812616B2 (ja) 1991-09-11 1992-07-20 オペレーティングシステムカーネル用受動回復方法およびシステム

Country Status (3)

Country Link
US (1) US5528750A (ja)
EP (1) EP0532334A3 (ja)
JP (1) JPH0812616B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5630047A (en) * 1995-09-12 1997-05-13 Lucent Technologies Inc. Method for software error recovery using consistent global checkpoints
US6035419A (en) * 1995-12-27 2000-03-07 International Business Machines Corporation Logical execution sequence error recovery method and system
US5805785A (en) * 1996-02-27 1998-09-08 International Business Machines Corporation Method for monitoring and recovery of subsystems in a distributed/clustered system
US5708776A (en) * 1996-05-09 1998-01-13 Elonex I.P. Holdings Automatic recovery for network appliances
US5732206A (en) * 1996-07-23 1998-03-24 International Business Machines Corporation Method, apparatus and program product for disruptive recovery in a data processing system
US6119170A (en) * 1997-12-29 2000-09-12 Bull Hn Information Systems Inc. Method and apparatus for TCP/IP multihoming on a host system configured with multiple independent transport provider systems
GB2359384B (en) * 2000-02-16 2004-06-16 Data Connection Ltd Automatic reconnection of partner software processes in a fault-tolerant computer system
US7024663B2 (en) * 2002-07-10 2006-04-04 Micron Technology, Inc. Method and system for generating object code to facilitate predictive memory retrieval
US6954836B2 (en) * 2002-07-11 2005-10-11 Micron Technology, Inc. System and method for processor with predictive memory retrieval assist
JP4346929B2 (ja) * 2003-03-10 2009-10-21 三菱電機株式会社 量子鍵配送方法および通信装置
US7484125B2 (en) * 2003-07-07 2009-01-27 Hewlett-Packard Development Company, L.P. Method and apparatus for providing updated processor polling information
US7200800B2 (en) * 2003-07-16 2007-04-03 Hewlett-Packard Development Company, L.P. Platform independent file manipulation
US7353433B2 (en) * 2003-12-08 2008-04-01 Intel Corporation Poisoned error signaling for proactive OS recovery
WO2005076520A1 (ja) * 2004-02-10 2005-08-18 Mitsubishi Denki Kabushiki Kaisha 量子鍵配送方法および通信装置
US7500145B2 (en) * 2004-05-28 2009-03-03 International Business Machines Corporation Anomaly-driven software switch to capture event responses and automate recovery
US7308610B2 (en) * 2004-12-10 2007-12-11 Intel Corporation Method and apparatus for handling errors in a processing system
US7783920B2 (en) * 2007-02-20 2010-08-24 International Business Machines Corporation Recovery routine masking and barriers to support phased recovery development
US7793149B2 (en) * 2007-02-20 2010-09-07 International Business Machines Corporation Kernel error recovery disablement and shared recovery routine footprint areas
US7937610B2 (en) * 2007-04-27 2011-05-03 International Business Machines Corporation Fast node failure detection via disk based last gasp mechanism
JP5504876B2 (ja) * 2009-12-24 2014-05-28 日本電気株式会社 プロセス異常復旧装置及びプロセス異常復旧方法
JP2013236337A (ja) * 2012-05-10 2013-11-21 Funai Electric Co Ltd 機器異常対応システムおよび通信対応機器
CN114077519B (zh) * 2020-08-21 2022-11-18 荣耀终端有限公司 一种系统服务恢复方法、装置和电子设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5396379A (en) * 1977-02-02 1978-08-23 Kanebo Ltd Peocess for producing microbial cells
JPS5855529B2 (ja) * 1978-08-07 1983-12-10 富士通株式会社 デ−タ処理装置のエラ−処理方式
FR2503900A1 (fr) * 1981-04-13 1982-10-15 Grandjean Bernard Dispositif de reprise pour installation de traitement de donnees
US4697266A (en) * 1983-03-14 1987-09-29 Unisys Corp. Asynchronous checkpointing system for error recovery
US4566063A (en) * 1983-10-17 1986-01-21 Motorola, Inc. Data processor which can repeat the execution of instruction loops with minimal instruction fetches
US4703481A (en) * 1985-08-16 1987-10-27 Hewlett-Packard Company Method and apparatus for fault recovery within a computing system
US4907150A (en) * 1986-01-17 1990-03-06 International Business Machines Corporation Apparatus and method for suspending and resuming software applications on a computer
NL8602653A (nl) * 1986-10-23 1988-05-16 Philips Nv Halfgeleiderlaser en werkwijze ter vervaardiging daarvan.
DE3735828C2 (de) * 1986-10-24 1994-11-10 Hitachi Ltd Verfahren zur Wiederaufnahme der Ausführung von Anweisungen nach einer Unterbrechung in einer mikroprogrammgesteuerten Datenverarbeitungsvorrichtung
US4819234A (en) * 1987-05-01 1989-04-04 Prime Computer, Inc. Operating system debugger
US4912707A (en) * 1988-08-23 1990-03-27 International Business Machines Corporation Checkpoint retry mechanism
WO1990005951A1 (en) * 1988-11-14 1990-05-31 Heinrich Hummel Method of handling unintended software interrupt exceptions
US4956842A (en) * 1988-11-16 1990-09-11 Sundstrand Corporation Diagnostic system for a watchdog timer
US5222217A (en) * 1989-01-18 1993-06-22 International Business Machines Corporation System and method for implementing operating system message queues with recoverable shared virtual storage
US5220668A (en) * 1990-09-21 1993-06-15 Stratus Computer, Inc. Digital data processor with maintenance and diagnostic system

Also Published As

Publication number Publication date
US5528750A (en) 1996-06-18
EP0532334A3 (en) 1993-11-24
JPH05204686A (ja) 1993-08-13
EP0532334A2 (en) 1993-03-17

Similar Documents

Publication Publication Date Title
JPH0812616B2 (ja) オペレーティングシステムカーネル用受動回復方法およびシステム
US8978028B2 (en) Transactional multi-package installation
CA2347404C (en) System and method for recovering applications
US5815651A (en) Method and apparatus for CPU failure recovery in symmetric multi-processing systems
US8046540B2 (en) Shared closures on demand
EP0319034B1 (en) Method of recovering failure of online control program
JP2010522932A (ja) インストールシーケンスのためのブックマークおよび構成ファイル
US7552434B2 (en) Method of performing kernel task upon initial execution of process at user level
US7546600B2 (en) Method of assigning virtual process identifier to process within process domain
US6275930B1 (en) Method, computer, and article of manufacturing for fault tolerant booting
JPH06324885A (ja) 例外条件処理方法及び装置
US5758155A (en) Method for displaying progress during operating system startup and shutdown
US5590347A (en) Method and system for specifying alternate behavior of a software system using alternate behavior indicia
US5740359A (en) Program execution system having a plurality of program versions
US6901589B2 (en) System and method for determining a root cause of a failure
EP0417916A2 (en) Procedure state descriptor system for digital data processors
Garbacki et al. Transparent fault tolerance for grid applications
CN112817986B (zh) 适用于Linux生产环境的数据结构修复方法及装置
JPS6376028A (ja) 仮想計算機システムにおける命令ステツプ実行制御方式
KR102057524B1 (ko) 위성 관제 시스템이 수행하는 실행 시점 복원 방법
CN116339788A (zh) 大数据平台的系统更新方法、装置、设备和存储介质
JPS62203240A (ja) 情報処理装置の試験方式
JP5504876B2 (ja) プロセス異常復旧装置及びプロセス異常復旧方法
JP2835896B2 (ja) テストプログラムの実行制御方式
JPH0564933U (ja) 電子計算機