JPS62172436A - 論理装置のエラ−回復方式 - Google Patents

論理装置のエラ−回復方式

Info

Publication number
JPS62172436A
JPS62172436A JP61014584A JP1458486A JPS62172436A JP S62172436 A JPS62172436 A JP S62172436A JP 61014584 A JP61014584 A JP 61014584A JP 1458486 A JP1458486 A JP 1458486A JP S62172436 A JPS62172436 A JP S62172436A
Authority
JP
Japan
Prior art keywords
error
logical unit
retry
logical device
logical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61014584A
Other languages
English (en)
Inventor
Mamoru Ishibashi
石橋 守
Kiyoaki Takahashi
高橋 清昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61014584A priority Critical patent/JPS62172436A/ja
Publication of JPS62172436A publication Critical patent/JPS62172436A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野〕 本発明は論理装置のエラー回復方式に関し、特に複数の
論理装置が主記憶装置を共有した情報処理システムにお
いて何れかの論理装置にエラーが発生した場合に他の正
常な論理装置でエラー回復処理を行なう方式に関する。
〔従来の技術〕
従来、この種のエラー回復方式としては、例えば特開昭
57−064849号公報(特願昭55−141323
号)に見られる方式が知られている。
上記従来方式は、ある論理装置(中央処理装置)でエラ
ーが発生し、このエラーを発生した命令がメモリ書換え
の条件等で再試行可能と判断された場合、先ずエラーを
発生した論理装置で所定回数の再試行を行なわせ、それ
でもエラーの回復が行なわれなかったときに、その命令
を他の正常な論理装置で再試行させるように構成されて
いる。
〔発明が解決しようとする問題点〕
上述した従来のエラー回復方式では、エラーの原因が間
欠故障で且つ再試行可能であって然もエラーの発生した
論理装置での再試行に成功すれば、システムダウン等を
回避でき、またエラー原因が固定故障によるものであっ
ても再試行可能であれば正常な他の論理装置で再試行が
成功することによりシステムダウン等を回避できる。
しかし、間欠故障であっても常に再試行可能となるもの
ではなく、命令実行中のメモリ書換えタイミングによっ
ては再試行不可能となる場合もある。また、間欠故障を
一度おこした論理装置は再び間欠故障をおこす確率が高
いと考えられるから、再試行を先ずエラーの発生した論
理装置で行なわせる従来の方式では、その再試行の途中
において再び間欠故障によるエラーが発生しそのエラー
の命令が今度は再試行不可能となる可能性がある。
このような場合、再試行不可能であるが故にシステムダ
ウンやジョブアボート等につながるという問題点がある
本発明はこのような従来の問題点を解決したもので、そ
の目的は、システムダウンやジョブアボート等を招く危
険性の少ない方法で論理装置のエラー回復を行なうこと
にある。
〔問題点を解決するための手段〕
本発明は上記目的を達成するために、複数の論理装置が
主記憶装置を共有する情報処理システムにおける前記論
理装置のエラー回復方式において、前記論理装置でエラ
ーが発生した場合で且つ該エラーの命令が再試行可能と
判断されたとき、該エラーを発生した論理装置で再試行
することなく他の正常な論理装置に前記エラーの命令か
らの再試行を行なわせるように構成する。
〔作用〕
再試行可能なエラーの命令をエラーを発生した論理装置
で再試行せずに、間欠故障をおこす確率の小さい正常な
他の論理装置で再試行させるので、再試行中に再び間欠
故障によるエラーが発生しそのエラーの命令が再試行不
可能となってシステムダウンやジョブアボート等につな
がる危険性が改善される。
〔実施例〕
次に本発明の実施例について図面を参照して説明する。
第1図は本発明の実施例の情報処理システムのブロック
図であり、lは情報処理装置、2は診断処理装置、3は
情報処理装置1と診断処理装置2とを接続する診断イン
タフェイスである。
情報処理装置lは、例えば中央処理装置である複数の論
理装置11.13と、これら複数の論理装置IL 13
に接続され両輪理装置からアクセス可能な主記憶装置1
2と、論理袋ff1l、 13および主記憶装置12に
接続された監視手段14とを含み、一つのオペレーティ
ング・システムで制御されている。上記監視手段14は
、論理装置11.13の故障(エラー)を検出する機能
と、故障を検出するとその故障した論理装置の内部状態
を保存して診断インクフェイス3を介して診断処理装置
2にその旨を通知する機能とを有している。なお、第1
図では論理装置が2台の場合を図示したが、論理装置が
3台以上備わっている情報処理システムに対しても本発
明は適用可能である。
また、診断処理装置2は、内部状態の読出し手段21と
、再試行可能性の判断手段22と、引継ぎ情報の編集・
作成手段23と、引継ぎ情報の設定手段24と、引継ぎ
処理の再実行・継続の指示手段25とを含む。このうち
、内部状態の読出し手段21は、監視手段14から上記
通知があったときに監視手段14によって保存された故
障発生論理装置の内部状態を読出す手段であり、再試行
可能性の判断手段22は、その続出された内部状態に基
づいてエラーを発生した命令の再試行の可能性を判断す
る手段である。また、引継ぎ情報の編集・作成手段23
は、再試行可能性の判断手段22で再試行可能と判断さ
れたときに、故障した論理装置上で実行していた処理の
引継ぎ情報を前記内部状態から編集・作成する手段であ
り、引継ぎ情報の設定手段24は、引継ぎ情報の編集・
作成手段23で作成された引継ぎ情報を故障が検出され
た論理装置以外の他の正常な論理装置に設定する手段で
ある。更に、引継ぎ処理の再実行・継続の指示手段25
は、引継ぎ情報の設定手段24により設定された情報を
もとにその正常な論理装置上で故障の検出された論理装
置で行なわれていた処理を引継いで再実行させることを
指示する手段である。
次に、第1図において論理装置11に故障が発生した場
合を例にして本実施例の動作を説明する。
論理装置11に故障が発生すると、これが監視手段14
で検出される。監視手段14はこれを検出すると、論理
装置11の処理を中断させてその内部状態を保存し、診
断インタフェイス3を介して診断処理装置2に論理装置
11が故障した旨の通知を行なう。
これに応答して診断処理装置2は内部状態の続出し手段
21を起動し、第2図の処理51に示すようにこの手段
21により監視手段14で保存された論理装置11の内
部状態を読出す。次に診断処理装置2は、上記読出され
た内部状態から検出された故障が再試行可能なものであ
るか否かを再試行可能性の判断手段22で判断しく処理
52)、再試行不可能と判断された場合には故障発生の
論理装置11の障害処理を行なってシステムから切り離
す。
一方、処理52で再試行可能と判断されたときは、引継
ぎ情報の編集・作成手段23により続出した内部状態か
ら引継ぎ情報を編集・作成しく処理53)、この引継ぎ
情報を設定手段24によって正常な論理装置13に対し
設定させる(処理54)。そして次に、引継ぎ処理の再
実行・継続の指示手段25により正常な論理装置13に
処理の引継ぎを指示しく処理55)論理装置13に引継
いだ処理の再実行・m続を行なわせる。これにより、再
試行可能な故障の検出された論理装置で実行されていた
エラー発生時の処理が故障の検出された論理装置上では
なく他の正常な論理装置上で再実行され、論理装置11
で発生したエラーの回復が行なわれると共に、その後の
処理も故障の発生した論理装置ではな(正常な論理装置
に引継がれる。この場合、エラーの回復処理だけを正常
な論理装置で行なわせ、エラー回復成功の結果を受取っ
た故障側の論理装置でその後の処理を継続することも考
えられるが、一度故障を発生した論理装置は再び故障を
おこす確率が正常な論理装置に比べて高いので、本実施
例の如くその後の一切の処理を正常な論理装置に引継ぐ
ように構成することにより、より信転性を高めることが
可能となる。なお、正常な論理装置が故障した論理装置
の処理を引継いた場合、通常その故障した論理装置は論
理的にシステムから切り離される。
以上の説明は、論理装置11が故障した場合であるが、
論理装置13が故障した場合も上述で説明したように診
断処理装置2の制御のもとに正常な論理装置11に処理
を引継いで、論理装置13上で行なわれていた処理を継
続して行なうことができる。
〔発明の効果〕
以上説明したように、本発明は、再試行可能なエラーの
命令をエラーを発生した論理装置では再試行することな
く、他の正常な論理装置でその再試行を行なわせるもの
であり、他の正常な論理装置はエラーを発生した論理装
置より間欠故障をおこす確率は小さいので、再試行中に
間欠故障によるエラーが発生しそのエラーの命令が再試
行不可能となってシステムダウンやジョブアボート等を
招く危険性を少なくすることができ、情報処理システム
の信転性を向上させることができる。
【図面の簡単な説明】
第1図は本発明の実施例の情報処理システムのブロック
図および、 第2図は診断処理装置2の処理例の流れ図であ図におい
て、1・・・情報処理装置、2・・・診断処理装置、3
・・・診断インタフェイス、11.13・・・論理装置
、12・・・主記憶装置、14・・・監視手段、21・
・・内部状態の読出し手段、22・・・再試行可能性の
判断手段、23・・・引継ぎ情報の編集・作成手段、2
4・・・引継ぎ情報の設定手段、25・・・引継ぎ処理
の再実行・継続の指示手段。

Claims (1)

  1. 【特許請求の範囲】 複数の論理装置が主記憶装置を共有する情報処理システ
    ムにおける前記論理装置のエラー回復方式において、 前記論理装置でエラーが発生した場合で且つ該エラーの
    命令が再試行可能と判断されたとき、該エラーを発生し
    た論理装置で再試行することなく他の正常な論理装置に
    前記エラーの命令からの再試行を行なわせるようにした
    ことを特徴とする論理装置のエラー回復方式。
JP61014584A 1986-01-25 1986-01-25 論理装置のエラ−回復方式 Pending JPS62172436A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61014584A JPS62172436A (ja) 1986-01-25 1986-01-25 論理装置のエラ−回復方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61014584A JPS62172436A (ja) 1986-01-25 1986-01-25 論理装置のエラ−回復方式

Publications (1)

Publication Number Publication Date
JPS62172436A true JPS62172436A (ja) 1987-07-29

Family

ID=11865213

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61014584A Pending JPS62172436A (ja) 1986-01-25 1986-01-25 論理装置のエラ−回復方式

Country Status (1)

Country Link
JP (1) JPS62172436A (ja)

Similar Documents

Publication Publication Date Title
US6065135A (en) Error detection and fault isolation for lockstep processor systems
JPH0820965B2 (ja) プログラムの実行を続行する方法
JPS62172436A (ja) 論理装置のエラ−回復方式
JPS63136142A (ja) 論理装置のエラ−回復方式
JPS6341943A (ja) 論理装置のエラ−回復方式
JPS6146543A (ja) 転送装置の障害処理方式
JPS63140341A (ja) 論理装置のエラ−回復方式
KR0152240B1 (ko) 메모리 데이타 불일치 검출 및 복구 방법
JPH0430224A (ja) タスクの実行継続方法
JPS6128141B2 (ja)
JPS6143739B2 (ja)
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
JPS635779B2 (ja)
JPS62113241A (ja) 障害回復装置
JPH08329025A (ja) プロセスマイグレーション方式
JP2002108638A (ja) マイクロコンピュータのエラー検出方法及びエラー検出回路及びマイクロコンピュータシステム
JP2518652B2 (ja) 多重系バス同期システムの割込み診断装置
JPS6258344A (ja) 障害回復装置
JPS60195649A (ja) マイクロプログラム制御型デ−タ処理装置におけるエラ−報告方式
JPH06139089A (ja) 情報処理装置の障害処理装置
JPH02135535A (ja) 情報処理システム
JPS59135553A (ja) 障害情報保持方式
JPS6130297B2 (ja)
JPS6130296B2 (ja)
JPH05297901A (ja) プロセス制御装置