JPS585856A - 論理装置のエラ−回復システム - Google Patents

論理装置のエラ−回復システム

Info

Publication number
JPS585856A
JPS585856A JP56103539A JP10353981A JPS585856A JP S585856 A JPS585856 A JP S585856A JP 56103539 A JP56103539 A JP 56103539A JP 10353981 A JP10353981 A JP 10353981A JP S585856 A JPS585856 A JP S585856A
Authority
JP
Japan
Prior art keywords
logical device
storage means
instruction
error
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56103539A
Other languages
English (en)
Inventor
Tsunetaka Fujiwara
藤原 庸隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP56103539A priority Critical patent/JPS585856A/ja
Publication of JPS585856A publication Critical patent/JPS585856A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 ′本発明は、情報処理システムにおける論理装置に関し
、特にマルチプロセッサシステムにおける論m装置の工
2−回復方式に関する。
従来、命令再試行手段を肴する論理装置(以下CPU)
においては、命令実行中に発生したエラーに応答して、
[CPU自身が該命令の再試行可否を判断し、咳命令の
再試行が可能であるならば該命令を再試行することによ
シ骸CPUの工2−回後しているoしかし、この方式で
は該エラーが固定故障であるならば、たとえ命令再試行
可能であって屯、骸エラーの回復は期待できないという
欠点がある0このため、マルチプロセッサシステムでは
特開昭55−87251号公報に示されるような正常な
CPUを利用してエラーの回復を行う方式が採用されて
いる。すなわち、エラーが発生し九〇PUの命令再試行
可能な内部状態をエラーが発生していない正常なCPU
に移すことによシ、鉄工y−CPU上で実行されていた
処理を正常なCPUがエラー発生時点から引継ぐ方式で
ある。しかし、この方式ではエラーが発生した時点に実
行されていた処理の性質によってはエラーが発生したC
PUの命令再試行可能な内部状態をエラーが発生してい
立い正常愈CPUへ移すことができない場合があるとい
う欠点がある。
エラーを発生したCPUの内部状態を正常なCPJc移
すことができないケースとしては割込み処理における次
のようなケースなどがある。すなわち、主記憶装fk(
以後MMU)を複数のCPUが共用するマルチプロセッ
サシステムにおいては、各CPυがお互いの干渉、例え
ば、割込み処理を防ぎ、同時動作が可能となるようにす
るため、各CPU@に諌CPυの制御情報格納領域がM
MU上に割当てられていゐ0 あるCPUK割込みが発生し九場合、誼OPυはその時
点ClCPUの制御情報を骸CPUに割当てられ九制御
情報格納領域へ退避後、割込み処理を開始し、割込み処
理終了後、該制御情報を骸CPUK復帰することKより
割込み発生前の状態に戻る。
この割込み処!!夷行中、骸CPUにエラーか発生した
場合、骸エラーを発生したCPUの内部状態を工2−が
発生していない他の正常なCPUに移して4割込み処理
終了時にFi咳正常なCPUに割当てられた制御情報格
納領域から制御情報が咳正常なCPUに復帰される仁と
になル、処理上の矛盾を引き起こす。
本発明の目的は、前述のCPUの内部状態遷移可能性の
低下という欠点を解決し、エラー発生時CPUが実行し
ていた処理の性質とは無関係に常にCPUのエラーをW
A後することができるようにした論11装置用エラー回
復システムを提供することKめる◎ 本発−の@lC)@成は、命令を読み出したシ実行させ
るための情報群を格納する第1の格納手段と、論理装置
番号を格納する第2の格納手段と、骸#!1の格納手段
の情報群と該第2の格納手段の論理装置番号とに基づい
て命令が実行されているときに発生したエラーを通知す
るエラー通知手段と、このエラー通知後該命令の実行を
停止させる停止手段と、この停止手段によシ停止された
骸命令を再試行できるか否かを表示する表示情報を送信
する送信手段とを有する第1の論理装置と、前記エラー
通知手段で工2−の通知を受けた時前記送信手段からの
表示情報が命令再試行できる仁とを表示しているときけ
該第1の論理装置の第1の格納手段から情報群を退避す
る退避手段と、#第1の論理装置と同等の構成を有する
lit!2の論理装置の処理の区切シで蚊退避手段に退
避した情報群を該第2の論理装置の対応する籐1の格納
手段に格納する手段と、該第2の論理装置の第2の格納
手段の論理装置番号を前記第1の論理装置の第2の格納
手段の論理装置番号へ置換える手段と、該第2の論理装
置の[1の格納手段の情報群と第2の格納手段の論理装
置番号とに基づいて命令の実行の再−を指示する制御手
段とを有する回復制御装置と、命令の実行を再開した後
火の処理の区切夛で前記第2の格納手段を操作し論理装
置番号を初期値へ戻す手段を有する前記第2の論理装置
とから表ることを特徴とする論理装置のエラー同復シス
テムである。
また、本発明の第2の構成は命令を読み出した如実行さ
せるためo’rttm群を格納する第1の格納手段と、
論理装置番号を格納する第2の格納手段と、該第1の格
納手段の情報群と該第2の格納手段の論理装置番号とに
基づいて命令が実行されているときに発生したエラーを
通知する工2−通知手段と、このエラー通知後肢命令の
実行を停止させる停止手段と、この停止手段によシ停止
された該命令を再試行できるか否かを青水する表示情報
を送信する送信手段とを有する第1の論理装置と、前記
エラー通知手段でエラーの通知を受けた時、前記送信手
段からの表示情報が命令再試行できることを表示してい
るときは該第1の論理装置と同等の構成を有する第2の
論理装置の処理の区切ルで該第1の論理装置の第1の格
納手段の情報群−を該第2の論理装置の対応する第1の
格納手段へ格納する手段と、該第2の論理装置の第2の
格納手段の論理装置番号を前記第1の論理装置の第2の
格納手段の論理装置番号へ置換える手段と、該第2の論
理装置の第1の格納手段の情報群と第2の格納手段の論
理装置番号とに基づいて命令の実行を再開する手段と、
命令の実行を再開した後該第2の論理装置の次の処理の
区切シで該第2の論理装置の12C)格納手段を操作し
て論理装置番号を初期値へ戻す手段とを有する該第2の
論理装置とから構成されることを特徴とする論理装置の
エラー回復システムである0 次に本発明の一実施例について図面を参照して説明する
181図を参照すると、本発明の第10寮施例はエラー
を検出したCPUI O、エラーの回復処理を行うCP
U20 、およびエラーの回復処理を制御する回復制御
装置30から構成されている。前記CPUl0は、CP
Ul0のエラーを回復制御装置30に報告するためのエ
ラー報告用インタフ翼−ス120.CPUl0のプログ
ラム操作可能レジスタI1111−119 、CPUI
 Oの論理装置番号を格納するためのプログラム操作可
能な論11装置番号格納レジスタ150.前記レジスタ
群111〜119の情報を退避させるための退避用イン
タフェース121.従来技術であるパリティチェック回
路等によ〕実現されているエラー検出回路130.クロ
ック発振回路131.命令再試行が可能か否かを示す命
令再試行不可インディケータ132.論理装置番号復帰
回路160.データレジスタ138.および1392選
択制御グー)群1401選択レジスタ136.インタフ
ェース制御回路1331回復用インタフェース122゜
制御1[12B、124.および125.書込みデータ
バス135.および読出しデータバス137から構成さ
れている0前記CPU20の構成は前記CPUI Gの
構成と同一である。
次に本夷總例の動作を詳細に説明する0いま、CPUl
0において割込み処理を実行中にエラーが発生し、工2
−検出回路130にて工2−検出されると、制御線12
3を介してクロック発振回路131が停止され、工2−
発生時点のCPUl0の内部状態が凍結されるとともに
制御線124からインタフェース制御回路133を介し
て回復制御装置30にエラー発生報告が行なわれる。回
復制御装置30は通常入出力制御尋別業務を処理中であ
るが、CPUl0からの工2−発生報告を受けあと、回
復制御装置30の制御部31が処理中の業務を中断し、
回復処理の制御を開始する0す表わち、咳制御部31の
制御によ〕退避用インタフェース121を介してCPU
l0の10グラム操作可能レジスタ群111〜119、
および論理装置番号格納レジスタ150の内容が読込ま
れる。
CPUl0内のレジスタの読出し動作は次のようにして
行なわれる0レジスタ1 ll〜119、および150
のうち読出したいレジスタの番号が選択レジスタ136
にセットされる0図には示されていないが回復制御装置
30から読出しの指令ができ、該読出し指令を出すとと
によシ選択しジス/136で指定されたレジスタが選択
制御ゲート群140によシ選択され、データバス137
およびデータレジスタ138を介して読出すことができ
る。
CPUl0の1pルブラム作可能レジスタ群111〜1
19C)読込みII&理中はCPUl0のクロックは停
止させておき、読込み処理によシCPUl0の内部状態
は変らないようにしておく。
回復制御装置30はエラーの発生時点でCPU10にて
実行されていた命令が再試行可能か否かを命令再試行不
可インディケータ132の内容を本って判断する。命令
再試行不可インディケータ132は各命令奥行開始時点
でオフにリセットされ、命令実行中メモリ書換え勢の条
件で命令再試行不可としてオンにセットされる0誼命令
再試行不可インディケータがオフの場合、エラー発生時
での命令は再試行可能であるので、回復制御装置30か
らの信号によ、90PUx Oにおいて誼命令の再試行
を行わせる孔示が出されるが、CPUl0での命令の再
試行が不可能であるならば、制御線234を介してCP
Ul0の回復処理をCPU20に依頼する。
回復制御装置30から工2−を発生し九〇PUlOの回
復依頼を受は九〇PU2GはCPUIGとは独立に本業
務を処理中であシ、処理中の業務を区切シのよい時点で
中断し、その旨制御@ 234を介して回復制御装置3
0に報告する。その後、クロック発振回路231を停止
させ、それ以後のCPU20での本業務処理を一時中断
する〇報告を受けた回復制御装置3(l退避用インタフ
ェース121を介して退避したCPUl0の10グラム
操作可能レジスタ群111〜119の情報とCPUI 
Oの論理装置番号が格納されている論理装置番号格納レ
ジスタ150の情報とを、回復用インタフェース222
を介してCPU20のプログラム操作可能レジスタ群2
11〜219とCPU20の論理装置番号格納レジスタ
250とにそれぞれ書込む口 CPU20へのレジスタ書込みは次のようにして行う。
レジスタ211〜219、および250のうち書込みた
いレジスタの番号を選択レジスタ236にセットする。
図には示されていないが回復制御装置30から書込み指
令を出すことができ。
書込みたいレジスタ番号を選択レジスタ236にセ、ト
シデータレジスタ239にデータを書込んだ後、書込み
指令を出すことによシデータパス235を介して所望の
レジスタにデータを書込むことができる。
CPUIGのプログラム操作可能レジスタ群111−1
19の情報と論理装置番号格納レジスタ15Gの情報と
がCPU20のプログラム操作可能レジスタ群211〜
219と論現装置番号格納レジスタ250とにそれぞれ
設定された後、回復制御懺[3GKよシ制御線225を
介してCPO200クロック発振停止解除が行われるこ
とによj9cPU20に対して命令開始起動がかけられ
エラー〇丸め、CPUl0で中断していた割込み処理、
はCPU20にて再−される0 CPUIOで中断していた割込み処理を再開し九CPU
20は鋏割込み処理を終了した後、cPiJ100割込
み時の制御情報が格納されている制御情報格納領域から
該制御情報を復帰するとともに論理装置番号復帰回路2
60を起動しCPU20の論理装置番号格納レジスタの
内容を初期化し割込み発生前の状態へ戻る。以上述べた
ように、CPU1oの内部状態をCPU20に移送後C
PU20の論理装置番号を操作することによりエラー発
生時にCPUl0で実行されて−た処理内容とは無関係
KCPUI Oのエラーを回復することができる。本実
細例はCPUl0のエラーなCPU20で回復する場合
であるが、CPU10とCPU20とは全く同じ構成で
あるため、CPO20にエラーが発生した場合、同様の
手順でCPo 10にて該エラーを回復することができ
るのは明らかである◎ 本発明は、#Ilの実施例で述べた回復制御装置を使用
せず直接論理装置間で互−に他の論理装置のエラー回復
を行う場合にも適用できる。
第2図を参照すると、本発明の112の実施例は第1の
実施例で述べ九回復制御装置30およびその制御部31
を含まず、代シにレジスタ退避制御回路170および2
70論理装置間のエラー報告用インタフェース120お
よびデータバス171を含む。
次KjllI2の実施例の動作を詳細に説明する。
CPUl0で工2−が発生したならば、エラー検出回路
130から制御線124.インタフェース制御回路13
3、およびエラー報告用インタフェース120を介して
CPU20に工2−通知を行い、レジスタ退避制御回路
170の指示によシCPUl0のプログラム操作可能レ
ジスタ群111〜119と論理装置番号格納レジスタ1
50の内容が読出され、データバス171を介してCP
U20のレジスタ退避制御回路270に送られ、それら
をCPU20のプログラム操作可能レジスタ群211〜
219、および論理装置番号格納レジスタ250に書込
んだ後CPU20を起動すればよい〇 本発明には、回復不可能なエラーが発生したCPU0状
態を他の正常なCPUへ移すとともに、該CPUの論理
装置番号を操作することによシ、工2−が発生した時点
の処理の性質とは無関係に処理の連続性を保ちながら、
CPUの回復処理を行うことができるという効果がある
【図面の簡単な説明】
第1図は本発明の第1の実施例を示す図、および8に2
図は本発明の第2の実施例を示す図である。 第1図および第2図において、10.20・川・・CP
U、30・・・・・・回復制御回路、31・・・・・・
制御部、111〜119,211〜219・・・・・・
レジスタ群、120.220・・・・・・故障報告用イ
ンタフェース、121.221・・・−・・退避用イン
タフェース、122゜222・・・・・・回復用インタ
フェース、123,124゜125.223,224,
225−−−−・・制御線、130.230・・・−・
・・故障検出回路、131,231・・・・・・クロッ
ク発生回路、132,232・・・・・・命令再試行不
可インディケータ、133,233・・・・・・インタ
フェース制御回路、134,234・・・・・・制御線
、135,235・・−・・・書込みデータバス、13
6.236・・・・・・選択レジスタ、137,237
・・・・・・読出しデータバス、138,238・・・
・・・f−タレジスタ、139,239・・・・・・デ
ータレジスタ、140.240・・・・・・選択制御ゲ
ート詳、15o。 250・・・・・・論理装置番号格納レジスタ、160
゜260・・・・・・論理装置番号復帰回路、171・
・・・・・データバス。

Claims (1)

  1. 【特許請求の範囲】 1、命令を読み出したシ実行させるための情報群格納す
    る第1c)格納手段と、論l1装置番号を格納する第2
    の格納手段と、該第1の格納手段の情報群と第2の格納
    手段の論理装置番号とに基づいて命令が実行されている
    ときに発生したエラーを通知するエラー通知手段と、こ
    の工2−通知後諌命令の実行を停止させる停止手段と、
    この停止手段によル停止された該命令を再試行できるか
    否かを表示情報を送信する送信手段とを有する第1の論
    理装置と、 前記工2−通知手段で工2−の通知を受けた時前記送信
    手段からの表示情報が命令再試行できることを表示して
    いるときは前記第1の論理装置の第1の格納手段から情
    報群を退避する退避手段と、第2の論理装置の処理の区
    切シでl皺退避手段に退避した情報群を該第2の論理装
    置の対応する第1の格納手段に格納する丸めに送付する
    手段と、*tSZの論理装置の第2の格納手段の論理装
    置番号を前記第1の論理装置の第2の格納手段の論理装
    置番号に置換える手段と、前記第2の論理装置の第1の
    格納手段の情報群と第2の格納手段の論理装置番号とに
    基づいて命令の実行の再開を指示する制御手段とを有す
    る回復制御装置と、 命令の実行を再開した後、次の処理の区切シで前記第2
    の格納手段を操作し論理装置番号を初期値に戻す手段を
    有する前記第2の論理装置とを備えたことを特徴とする
    論理装置のエラー回復システム。 2、命令を読み出したシ実行させるための情報群を格納
    する第1の格納手段と、論理装置番号を格納する第2の
    格納手段と、該第1の格納手段の情報群と該第2の格納
    手段の論理装置番号とに基づいて命令が実行されている
    ときに発生したエラーを通知する工2−通知手段と、と
    の工2−通知後、該命令の実行を停止させる停止手段と
    、この停止手段によシ停止された該命令を再試行できる
    か否かを表示する表示情報を送信する送信手段とを有す
    る第1の論理装置と、前記エラー通知手段でエラーの通
    知を受けた時前記送信手段からの表示情報が命令再試行
    できることを表示しているときは該第1の論理装置と同
    等の構成を有する第2の論理装置の処理の区切)で該第
    1の論理装置の第1の格納手段の情報群を該第2の論理
    装置の対応する第1の格納手段に格納する手段と、 #第2の論理装置の第2の格納手段の論理装置番号を前
    記第1の論理装置の第2の格納手段の論理装置番号に置
    換える手段と、骸M2の論理装置の第1の格納手段の情
    報群と第2の格納手段の論理装置番号とに基づいて命令
    の実行を再開する手段と、命令の実行を再開したvk骸
    落第2論理装置の次の処理の区切シで該第2の論理装置
    の第2の格納手段を操作して論理装置番号を初期値へ戻
    す手段とを有する該第2の論理装置とを備えたことを特
    徴とする論理装置の工2−回復システム。
JP56103539A 1981-07-02 1981-07-02 論理装置のエラ−回復システム Pending JPS585856A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56103539A JPS585856A (ja) 1981-07-02 1981-07-02 論理装置のエラ−回復システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56103539A JPS585856A (ja) 1981-07-02 1981-07-02 論理装置のエラ−回復システム

Publications (1)

Publication Number Publication Date
JPS585856A true JPS585856A (ja) 1983-01-13

Family

ID=14356641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56103539A Pending JPS585856A (ja) 1981-07-02 1981-07-02 論理装置のエラ−回復システム

Country Status (1)

Country Link
JP (1) JPS585856A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH051068U (ja) * 1991-06-24 1993-01-08 忠男 戸塚 シールリング

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH051068U (ja) * 1991-06-24 1993-01-08 忠男 戸塚 シールリング

Similar Documents

Publication Publication Date Title
US6622263B1 (en) Method and apparatus for achieving system-directed checkpointing without specialized hardware assistance
USRE37038E1 (en) Method and system for automated termination and resumption in a time zero backup copy process
US7840768B2 (en) Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
JPS6053339B2 (ja) 論理装置のエラ−回復方式
US20060150010A1 (en) Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
JPS638835A (ja) 障害回復方法
JPS585856A (ja) 論理装置のエラ−回復システム
JPH07121315A (ja) ディスクアレイ
JPH10133926A (ja) ミラー化ディスク復旧方法と復旧システム
JP4358943B2 (ja) 自動バックアップシステム及び自動バックアッププログラムを記録した記録媒体
USRE45632E1 (en) Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
JP3185446B2 (ja) 計算機システム
JPS6156537B2 (ja)
JPH0395634A (ja) 計算機システム再起動制御方式
JP2624106B2 (ja) 交換システムにおけるバックアップファイルの自動検証処理方法
JP2000267936A (ja) ディスクサブシステム
JP2002244885A (ja) コンピュータシステム監視システム
JPH07141120A (ja) 情報記憶媒体障害処理方法
JPH02118745A (ja) メモリバックアップ装置
JPS58114152A (ja) 磁気デイスクバツクアツプ装置
JPS6336014B2 (ja)
JPH04273553A (ja) 計算機システム
JPH06187102A (ja) 二重化ディスク処理方式
JPH0335339A (ja) Os障害発生時における後始末処理方式
JPS635779B2 (ja)