JPS635779B2 - - Google Patents

Info

Publication number
JPS635779B2
JPS635779B2 JP57208552A JP20855282A JPS635779B2 JP S635779 B2 JPS635779 B2 JP S635779B2 JP 57208552 A JP57208552 A JP 57208552A JP 20855282 A JP20855282 A JP 20855282A JP S635779 B2 JPS635779 B2 JP S635779B2
Authority
JP
Japan
Prior art keywords
error
retry
circuit
information
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57208552A
Other languages
English (en)
Other versions
JPS5999556A (ja
Inventor
Akira Jitsuho
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP57208552A priority Critical patent/JPS5999556A/ja
Publication of JPS5999556A publication Critical patent/JPS5999556A/ja
Publication of JPS635779B2 publication Critical patent/JPS635779B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】 発明の属する技術分野 本発明は、情報処理装置に関し、特に多重構成
の論理装置の障害時におけるエラー回復機能の向
上に関する。
従来技術 ストアドプログラム方式を採用する情報処理装
置においては、命令の読み出し、命令の解読,解
読した命令の実行という一連の動作をくり返すこ
とによつて所定の処理が実行される。これらの動
作は、すべてレジスタ間の情報の転送,シフト動
作,加算器の使用等数十種の基本動作の組合せに
よつて実行される。上記基本動作の組合せを指定
するのがマイクロ命令であり、これを組合せて各
命令の実行を行なうのがマイクロプログラム制御
方式による情報処理装置である。マイクロプログ
ラムを制御記憶にロードしデータ処理を行なう論
理装置を複数個備えた情報処理装置において、エ
ラーが発生した場合、エラーを発生した論理装置
で命令を再実行することによつてエラー回復可能
の場合が多い。
論理装置において、ある命令を実行中にエラー
が発生した場合、その命令を再実行するために
は、論理装置内の当該命令に関する全ての情報
を、当該命令の実行前の状態に戻して命令を再実
行すれば良い。命令実行前の状態の再現とは、基
本的には、論理装置内のソフトウエアビジブルな
レジスタ,メモリ状態の再現である。そのため
に、ソフトウエアビジブルなレジスタに対して、
命令実行前の状態を常に保存するヒストリーレジ
スタを設けておき、ある命令を実行中にエラーが
生じた場合、該ヒストリーレジスタの内容をソフ
トウエアビジブルなレジスタに復元できるように
しておく。しかし、ソフトウエアビジブルなレジ
スタに情報をセツトする過程の障害とか、命令実
行中に主記憶の内容を書きかえた場合とか、前記
ヒストリーレジスタの内容を2回以上書き替えた
ような場合は、命令実行前の状態の再現が極めて
困難である。このような場合にはリトライ可否回
路をリトライ不可にセツトするようにしておく。
そして、命令実行中にエラーが発生した場合、上
記リトライ可否回路の出力を参照して命令の再試
行可否を判定し、再試行可能の場合、ヒストリー
レジスタからリカバリーの必要のあるときは前記
ヒストリーレジスタの内容によりソフトウエアビ
ジブルなレジスタを命令実行前の状態に復元して
命令を再実行してエラーを回復する。
上述の従来方式では、エラーが固定障害である
ときは、命令の再試行によつても同じエラーを発
生するからエラー回復ができないという欠点があ
る。
上述の欠点を解決するために、命令再試行失販
時に、さらに命令の再試行可能の状態であれば、
その時の状態を他の正常な論理装置に移して再試
行可能な命令から処理を再開できるようにするこ
と(プロセツサーリリーフという)により処理中
のジヨブを放棄しなくてもすむようにした装置も
ある。しかし、このような装置であつても、命令
再試行失敗時の状態ではプロセツサーリリーフで
きないが最初のエラー発生時の情報を用いてなら
まだプロセツサーリリーフ可能であるというよう
な場合(例えばリトライ時のデータのリカバリ失
敗のような場合)に、その区別がつかずプロセツ
サーリリーフ不可と判断するため、放棄しなくて
もよいジヨブを放棄してしまうという欠点があ
る。
発明の目的 本発明の目的は、上述の従来の欠点を解決し、
少なくとも1回目のエラー発生時の情報で命令再
試行できるような場合はジヨブ放棄しないでエラ
ー回復することが可能な高信頼度の情報処理装置
を提供することにある。
発明の構成 本発明の情報処理装置は、自己のエラー検出機
能,エラー検出時の命令再実行可否判断機能等を
有し、これらの結果によりセツトまたはリセツト
される障害検出回路,リトライ可否回路等を含む
複数の論理装置を備え、エラー検出時に命令再実
行可能なエラーの回復を行なう情報処理装置にお
いて、前記論理装置内にリトライ中のエラー発生
が少なくとも最初のエラー発生時点の情報により
再リトライ可能か否かを示す再リトライ可否回路
を設け、前記複数の論理装置に接続されて該論理
装置内の情報を退避させ退避させた情報を任意の
前記論理装置へ復元するためのメモリ回路と、前
記複数の論理装置に接続され前記障害検出回路,
リトライ可否回路および再リトライ可否回路等の
出力信号に応じて前記論理装置の内容を前記メモ
リ回路に退避させ退避させた内容を任意の前記論
理装置へ復元するエラー回復制御回路とを備え
て、いずれかの前記論理装置が最初にエラー発生
したときで前記リトライ可否回路の出力がリトラ
イ可のときは、該エラー発生した論理装置内の情
報を前記メモリ回路へ退避させて該退避した内容
を前記エラーを発生した方の論理装置に復元して
命令の再実行を行ない、命令再実行中にエラー発
生したときは、前記リトライ可否回路の出力がリ
トライ可であれば再びエラー発生時点の情報を前
記メモリ回路へ退避させ、この情報を任意の前記
論理装置に復元させ、前記リトライ可否回路の出
力がリトライ不可を示しかつ前記再リトライ可否
回路の出力が可であるときは最初に前記メモリ回
路へ退避させた最初のエラー発生時点の情報を他
方の論理装置へ復元して該他方の論理装置によつ
て命令の再実行を行ない前記エラーを回復するこ
とを特徴とする。
発明の実施例 次に、本発明について、図面を参照して詳細に
説明する。
図は、本発明の一実施例を示すブロツク図であ
る。すなわち、複数の論理装置1および2は、そ
れぞれ、マイクロプログラムを記憶する制御記憶
4,5と、制御記憶4,5から読み出されたマイ
クロ命令データ30,31によつて制御され、ソ
フトウエアビジブルなレジスタおよび該レジスタ
の内容をセーブするためのヒストリーレジスタを
内蔵し主要な演算および装置全体の制御等を行な
う演算制御部6,7(次に読出すべきマイクロ命
令のアドレス信号32,33の生成も行なう)
と、論理装置のエラー検出信号をセツトする障害
検出回路8,9と、エラー検出時点での命令再実
行可否を示すリトライ可否回路12,13と、ソ
フトウエアビジブルなレジスタのうちヒストリー
レジスタの内容から復元する必要があるものを示
すヒストリー回路10,11と、命令の再試行が
失敗したとき1回目の命令実行失敗時の情報を用
いれば命令の再々実行が可能かどうかを示す再リ
トライ可否回路14,15とを含んで構成され
る。エラー検出時点での命令を再実行させるため
の情報は、シフトアウトデータパス34,35に
よつてメモリ回路17に退避させ、メモリ回路1
7に退避された内容は、シフトインデータパス3
6,37によつて論理装置1,2の状態復元に使
用される。リトライ可否回路12,13は、演算
制御部6,7が主記憶書き替え又はヒストリーレ
ジスタの2回以上の書き替え等を行なつたときお
よびリカバリ動作中等にセツトされてリトライ不
可であることを示し、再リトライ可否回路14,
15は、1回目のエラー時の情報を用いても再リ
トライ不可であるような動作、例えばリトライ中
における主記憶書き替え等によつてセツトされ
る。
エラー回復回路3は、前記メモリー回路17お
よびエラー回復制御回路16から構成される。エ
ラー回復制御回路16は、前記障害検出回路8,
9の出力する障害検出指示信号50,51,ヒス
トリー回路10,11の出力するヒストリー指示
信号52,53,リトライ可否回路62,63の
出力するリトライ可否指示信号54,55,再リ
トライ可否回路14,15の出力する再リトライ
可否指示信号56,57等および演算制御部6,
7の出力するリトライ成功指示信号46,47,
リリーフ可指示信号48,49を入力し、これら
の状況に応じてメモリ回路制御信号66によつて
メモリ回路17の書込み読出し等を制御し、演算
制御部6,7にはリセツト信号38,39,命令
実行指示信号40,41,命令リトライ指示信号
42,43,リリーフ指示信号44,45等を送
る。
リリーフ指示信号44,45により、エラーを
生じていない方の論理装置(1又は2)は、エラ
ーを起した論理装置が処理中のジヨブを継続でき
るように、現在実行中のジヨブを区切りで停止
し、停止したことを示すリリーフ可指示信号(4
8又は49)を出す。停止後メモリ回路17から
ジヨブを継続すべき論理装置(1又は2)へシフ
トインデータパス(36又は37)により命令の
再々実行に必要なデータをセツトする。
次に、本実施例の動作について説明する。通常
の動作時には、論理装置1,2は、それぞれ独立
に、アドレス信号32,33によつて制御記憶
4,5から命令データ30,31を読出して演算
制御部6,7でそれぞれのデータ処理が実行され
ている。今、仮りに、論理装置1がエラーを発生
した場合、障害検出回路8がセツトされ、演算制
御部6は、エラーが生じた時の状態で論理装置1
がホールドされ停止するように制御する。このと
きヒストリー回路10は、ヒストリーレジスタか
ら回復する必要のあるソフトウエアビジブルなレ
ジスタを示し、リトライ可否回路12は、該障害
がリトライ可能であるかどうかを示している。再
リトライ可否回路14は未だ動作していない。
エラー回復制御回路16は、障害検出回路8の
出力50により障害が通知されると、リトライ可
否回路12の出力54を見て、リトライ可否を知
り、リトライ可であれば、障害発生時点の演算制
御部6内のソフトウエアビジブルなレジスタおよ
び対応するヒストリーレジスタ等の内容をシフト
アウトデータパス34を用いてメモリ回路17に
退避させた後、リセツト信号38を演算制御部6
に送り、論理装置1の制御記憶4を除く回路をリ
セツトし、初期立上げの状態にする。このとき論
理装置1は停止状態のままである。論理装置1内
のソフトウエアビジブルなレジスタのうち、命令
実行中に更新されてしまつたレジスタには、メモ
リ回路17に退避させたヒストリーレジスタの内
容を復元させてやらなければならない。命令実行
中に更新されていないレジスタには、メモリ回路
17に退避させた当該レジスタの内容を復元して
やれば良い。エラー回復制御回路16は、どのレ
ジスタにヒストリーレジスタの内容を復元してや
る必要があるかをヒストリー回路10の出力信号
52によつて知り、メモリ回路制御信号66によ
つてメモリ回路17上の退避された情報を編集し
てシフトインデータパス36を介して論理装置1
に送り、命令を再実行するための情報を復元す
る。その後命令リトライ指示信号42によつて演
算制御部6に命令の再実行を指示する。演算制御
部6は、命令の再実行が成功すると、リトライ成
功指示信号46をエラー回復制御回路16に送
り、論理装置1は次の命令から再開可能なように
ホールドされ停止する。エラー回復制御回路16
は、リトライ成功指示信号46を受けると、命令
実行指示信号40を論理装置1に送り、論理装置
1はエラーを起した命令の次の命令から実行を再
開する。
論理装置1で検出されたエラーが一時的な障害
であれば、上述のような手順で1回もしくは複数
回のリトライにより処理中のジヨブを放棄するこ
となく継続実行することができる。しかし、論理
装置1で検出されたエラーが固定障害であるよう
な場合は、論理装置1によるリトライを何回くり
返してもジヨブの継続は不可能である。
本実施例では、論理装置1が命令の再実行を失
敗してエラーを発生すると障害検出回路8がセツ
トされ、論理装置1はエラーを生じた時の状態で
ホールドされ停止する。このとき命令再実行失敗
時の情報を用いて再び命令の再実行ができるかど
うかはリトライ可否回路12に示される。リトラ
イ可であれば、エラー回復制御回路16は、前述
と同様な処理でリトライ失敗時における論理装置
1内の情報をメモリ回路17に退避させ、この情
報を論理装置1に復元して論理装置1で命令の再
実行を行ない成功すれば次の命令を継続実行する
ことができる。この場合、後述するように前記リ
トライ失敗時における情報を用いて論理装置2に
リリーフさせ、固定障害による再失敗を避けるこ
とも可能である。
リトライ可否回路12の出力がリトライ不可を
示しているような場合でも、命令再実行失敗時の
情報ではリトライ不可であるが、1回目にエラー
を生じたときの情報を用いればリトライ可能な場
合がある。例えば、1回目のエラー時の情報をメ
モリ回路17に退避させ、該情報により論理装置
1のソフトウエアビジブルなレジスタに復元する
途中(リカバリ動作中)でエラーになつたような
場合は制御レジスタの復元が未だ完了していない
ため、その時の情報ではリトライすることはでき
ないが、1回目にエラーを生じたときの情報(メ
モリ回路17に退避されている)では未だリトラ
イ可能である。従つて、再リトライ可否回路14
はリセツト状態である。本実施例では、このよう
な場合に、エラー回復制御回路16の制御により
論理装置2にジヨブの継続を依頼することができ
る。すなわち、エラー回復制御回路16は、命令
リトライ実行中であることを記憶しており、リト
ライ中に障害検出回路8の出力50により障害発
生を通知されると、リトライ可否回路12の出力
54を参照してリトライ可否を知り(リトライ可
の場合は前述のような再リトライ動作の制御を行
なうが)、リトライ不可の場合は、再リトライ可
否回路14の出力を見て、再リトライ可であれば
リリーフ指示信号45を論理装置2に送り、論理
装置2に現在実行中のジヨブを区切りで停止する
ように指示する。論理装置2は、実行中のジヨブ
を区切りで停止した後、リリーフ可指示信号49
によりエラー回復制御回路に通知する。そして、
エラー回復制御回路は、メモリ回路17に退避さ
れている1回目のエラー時における情報によつ
て、シフトインデータパス37を使用して論理装
置2に復元した後、命令実行指示信号41によ
り、前記エラーの命令からの再実行を指示する。
上述のリリーフ動作は、前述のリトライ中にお
けるエラー発生時にリトライ可否回路12がリト
ライ可を示している場合であつても行なうことが
できる。ただしこの場合はリトライ中のエラー発
生時点の論理装置1内の情報をメモリ回路17に
退避させ、該情報を用いて論理装置2に復元する
ようにする。なお、ヒストリーレジスタを持たな
い論理装置に対しても上述と同様な構成(ヒスト
リー回路等は除く)を適用することが可能であ
る。
以上のように、本実施例では、論理装置1の固
定障害により中断されたジヨブを放棄することな
く論理装置2によつてエラー回復を行ないジヨブ
を継続実行することができる効果がある。論理装
置2がエラーを生じたときも同様である。
発明の効果 以上のように、本発明においては、複数の論理
装置の一方がエラーを発生した場合に、エラー発
生時点の情報を退避させるメモリ回路を設けて、
該メモリ回路の内容によつて前記エラーを発生し
た方の論理装置で命令再実行を行ない、リトライ
失敗時に、リトライ失敗時の情報によつては再リ
トライ不可であるが最初のエラー時の情報を用い
れば再リトライ可である場合は、前記メモリ回路
に退避させた1回目のエラー発生時の情報を他方
の論理装置に移送することによつてエラー回復可
能なように構成したから、エラー回復可能な領域
が従来より拡大される効果がある。すなわち、プ
ロセツサーリリーフの可能性を高め、固定障害に
よつて起つたエラーであつても処理中のジヨブを
放棄しないで、エラー回復してジヨブを継続で
き、装置の信頼性を向上できる効果がある。
【図面の簡単な説明】
図は本発明の一実施例を示すブロツク図であ
る。 図において、1,2……論理装置、3……エラ
ー回復回路、4,5……制御記憶、6,7……演
算制御部、8,9……障害検出回路、10,11
……ヒストリー回路、12,13……リトライ可
否回路、14,15……再リトライ可否回路、1
6……エラー回復制御回路、17……メモリ回
路、34,35……シフトアウトデータパス、3
6,37……シフトインデータパス。

Claims (1)

  1. 【特許請求の範囲】 1 自己のエラー検出、エラー検出時の命令再実
    行可否判断を行い、これらの結果によりセツトま
    たはリセツトされる障害検出回路8と、リトライ
    可否回路12を含む複数の論理装置を備え、エラ
    ー検出時に命令再実行可能なエラーの回復を行う
    情報処理装置において、 前記論理装置のひとつとしてリトライ中のエラ
    ー発生が少なくとも最初のエラー発生時点の情報
    により再リトライ可能か否かを示す再リトライ可
    否回路14を設け、 前記複数の論理装置に接続されて該論理装置内
    の情報を退避させ退避させた情報を任意の前記論
    理装置へ復元するためのメモリ回路17と、 前記複数の論理装置に接続され前記障害検出回
    路、リトライ可否回路および再リトライ可否回路
    の出力信号に応じて前記論理装置の内容を前記メ
    モリ回路に退避させ退避させた内容を任意の前記
    論理装置へ復元するエラー回復制御回路16とを
    備え、 該エラー回復制御回路は、前記論理装置のいず
    れかが最初にエラー発生したときで前記リトライ
    可否回路の出力がリトライ可のときは、該エラー
    発生した論理装置内の情報を前記メモリ回路へ退
    避させて該退避した内容を前記エラーを発生した
    方の論理装置に復元して命令の再実行をする手段
    と、命令再実行中にエラー発生したときは前記リ
    トライ可否回路の出力がリトライ可であれば再び
    エラー発生時点の情報を前記メモリ回路へ退避さ
    せ、この情報を任意の前記論理装置に復元させる
    手段と、前記リトライ可否回路の出力がリトライ
    不可を示しかつ前記再リトライ可否回路の出力が
    可であるときは最初に前記メモリ回路へ退避させ
    た最初のエラー発生時点の情報を他方の論理装置
    へ復元して該他方の論理装置によつて命令の再実
    行する手段とを含むことを特徴とする情報処理装
    置。 2 特許請求の範囲第1項記載の情報処理装置に
    おいて、前記エラー回復制御回路は、前記リトラ
    イ中のエラー発生時に前記リトライ可否回路の出
    力がリトライ可であれば、該エラー発生時点の情
    報を前記メモリ回路に退避させ、該退避させた情
    報を他方の論理装置に復元させる手段を含むこと
    を特徴とするもの。
JP57208552A 1982-11-30 1982-11-30 情報処理装置 Granted JPS5999556A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57208552A JPS5999556A (ja) 1982-11-30 1982-11-30 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57208552A JPS5999556A (ja) 1982-11-30 1982-11-30 情報処理装置

Publications (2)

Publication Number Publication Date
JPS5999556A JPS5999556A (ja) 1984-06-08
JPS635779B2 true JPS635779B2 (ja) 1988-02-05

Family

ID=16558072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57208552A Granted JPS5999556A (ja) 1982-11-30 1982-11-30 情報処理装置

Country Status (1)

Country Link
JP (1) JPS5999556A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5352310B2 (ja) * 2009-03-30 2013-11-27 株式会社日立製作所 バッチ処理実行システム及びその方法

Also Published As

Publication number Publication date
JPS5999556A (ja) 1984-06-08

Similar Documents

Publication Publication Date Title
EP0788052B1 (en) I/O control apparatus having check recovery function
US6622263B1 (en) Method and apparatus for achieving system-directed checkpointing without specialized hardware assistance
EP0505706B1 (en) Alternate processor continuation of the task of a failed processor
JPH07117903B2 (ja) 障害回復方法
JPS635779B2 (ja)
JPH07121315A (ja) ディスクアレイ
JPS6128141B2 (ja)
JP2009169515A (ja) コンピュータシステム及びシステム回復装置
JP2010061258A (ja) デュプレックスプロセッサシステム及びプロセッサ二重化方法
JPH04252339A (ja) 故障処理装置の切り離し処理方式
JPS622334B2 (ja)
JPS6156537B2 (ja)
JP2922981B2 (ja) タスクの実行継続方法
JPS597982B2 (ja) 計算機システムのシステム障害時の再開始方式
JPS6143739B2 (ja)
JPS585856A (ja) 論理装置のエラ−回復システム
JPS62284440A (ja) 端末装置のソフトウエア資源保守方式
JPS6059611B2 (ja) 情報処理装置
JPS6130297B2 (ja)
JPS6258344A (ja) 障害回復装置
JPS608962A (ja) 記憶情報一時障害検出方式
JPH04211841A (ja) 二重化処理装置
JPS6336014B2 (ja)
JPS6130296B2 (ja)
JPS63136142A (ja) 論理装置のエラ−回復方式