JPS6024651A - 障害処理方式 - Google Patents

障害処理方式

Info

Publication number
JPS6024651A
JPS6024651A JP58133221A JP13322183A JPS6024651A JP S6024651 A JPS6024651 A JP S6024651A JP 58133221 A JP58133221 A JP 58133221A JP 13322183 A JP13322183 A JP 13322183A JP S6024651 A JPS6024651 A JP S6024651A
Authority
JP
Japan
Prior art keywords
processor
retry
failure
circuit
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58133221A
Other languages
English (en)
Other versions
JPS6334492B2 (ja
Inventor
Haruo Kohama
小浜 晴雄
Seijiro Tajima
多嶋 清次郎
Ichigaku Asano
浅野 一学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58133221A priority Critical patent/JPS6024651A/ja
Publication of JPS6024651A publication Critical patent/JPS6024651A/ja
Publication of JPS6334492B2 publication Critical patent/JPS6334492B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は障害処理方式に係り、詳しくは、情報処理装置
内のプロセッサ部でハードウェア障害を検出した時の処
理方式に関する。
〔従来技術〕
第1図は情報処理装置の構成例である。図において、1
a、1bはプロセッサ部(CPLI)であり、それぞれ
バスbを通してメモリ部2よりプログラムをフェッチし
て実行すると共に、該メモリ部2に対してデータの読出
しあるいは渥込みを行う。又、プロセッサ部1a、1b
は必要に応じてそれぞれインタフェース73.74を通
してデータチャネル部(DCH)3a、3bに入出力動
作を指示し、これを受けてデータチャネル部3a、3b
はメモリ部2と入出力装置6a、、6bあるいはプロセ
ツサ部1a、lbと入出力装置6a、6b間の入出力動
作を制御する。4は該情報処理装置の保守・運転制御を
行うサービスプロセッサ部(SVP)であり、5はサー
ビスプロセッサ部4への指示の投入あるいはサービスプ
ロセッサ部4からの情報の表示を行う入出力装置である
このような情報処理装置における従来のプロセッサ部の
障害処理に関するハードウェアの一例を第2図に示す。
第2図は便宜上、第1図におけるプロセッサ部1aに関
する構成を示したもので、10は障害検出回路、11は
再試行可能か否かを示す表示子(再試行不可の時オンと
なるン、17は再試行中を示す表示子、12はオア回路
、j3はアンド回路、14は割込制御回路、15はイン
バータ、16は再試行制御回路、18はサービスプロセ
ッサ部4あるいはプロセッサ部1bとのインタフェース
制御回路、加はプログラム実行部である。
再試行可能か否かを示す表示子11の状態は、プロセッ
サ部la上での命令の実行状況(命令読出し、命令デコ
ード、演算実行、結果の格納等)に応じて刻々変化する
。障害検出回路10により障害が検出された時、表示子
11がオフで再試行が可能であり、かつ表示子17がオ
フで再試行動作中でなければ、アンド回路の出力がオフ
で、インバータ15の出力はオンであり、この時、再試
行制御回路16により障害発生時点に実行されていた命
令の再試行が行われる(再試行中は表示子17はオンと
なる)。そして、再試行が成功すると、再試行*1fl
J御回路16から割込制御回路14に通知され、破割込
み制御回路工4により再試行成功の障害が発生したこと
を示す内部マシンチェック割込みを起こし、自プロセッ
サ部19上のプログラムで再試行成功障害発生を記録す
る。
一方、障害検出回路10により障害が検出された時、表
示子11がオンで再試行が不能あるいは表示子17がオ
ンで再試行に失敗したならば、オア回路12の出力はオ
ン、アンド回路13の出力もオンで、この時、割込制御
回路14により内部マシンチェック割込みを起こし、自
プロセッサ部la上のプログラムに障害発生を通知する
とともに、インタフェ−ス制御回路18、インタフェー
ス72を介してプロセッサ部1bに外部マシンチェック
割込み信号を送り、プロセッサ部lb上のプログラムに
も障害発生を通知する。さらに、インクみ斗−ス剛御回
路18はインタフェース71を介してサービスプロセッ
サ部4にも障害発生を通知する。割込みにより障害の通
知を受けたプロセッサ部1aおよびIb上のプログラム
は、それぞれ独立にデータチャネル部3a、3bを介し
て入出力装置6aおよび6bにプロセッサ部1aの障害
を報告するメツセージを表示する。また、プロセッサ部
1aかもの障害通知を受けたサービスプロセッサ部4は
、プロセッサ部1aあるいはIb上のプログラムとは別
に、入出力装置5にプロセッサ部1aの障害を示すメツ
セージを表示する。
第3図は上記プロセッサ部1aで障害が検出された時の
、プロセッサ部1aのノ・−ドウエア動作、たものであ
る。
ところで、このような従来の障害処理方式には次のよう
な問題があった。
(1) プロセッサ部で再試行不能な障害あるいは再試
行失敗となった障害が検出されたにもかかわらず、該プ
ロセッサ部でのプログラム実行が継続されているため、
該プログラム動作により、他プロセツサ部でのプログラ
ム処理に擾乱を与えたり、システムに必須のファイルを
破壊する恐れがある。
(2) プロセッサ部で再試行不能な障害あるいは再試
行失敗となった障害が検出されたとき、他プロセツサ部
によりシステム運転が継続できる場合でも、障害プロセ
ッサ部上のプログラムあるいはサービスプロセッサ部に
よりシステム運転が継続できない場合と同様の報告が運
用者に対して行われるため、運用者に混乱を与える。
〔発明の目的〕
本発明の目的は、プロセッサ部でゼ)試行不能な障害が
検出された時、あるいは再試行に失敗した時、障害によ
るシステムへの擾乱を防ぐと共に、運用者に混乱を与え
ることのない障害処理方式を提供することにある。
〔発明の概要〕
本発明は、プロセッサ部には障害検出回路からの信号に
よりプロセッサ部の動作を停止する停止指示回路を設け
ると共に、サービスプロセッサ部には障害処理指示回路
を設けて、プロセッサ部で再試行不能な2、−ドウエア
障害を検出した時あるいは障害の再試行が失敗した時、
該プロセッサ部でのプログラム実行を停止し障害による
システムへの擾乱を防止するとともに、他プロセツサ部
上で実行中のプログラムがあれば該プログラムに連用者
への障害報告を行うか否か等の障害処理を妄ね、いずれ
のプロセッサ部でもプログラム実行が行われていない時
又は障害プロセッサ部以外のプロセッサ部が存在しない
時だけサービスプロセッサ部が運用者への障害報告を行
うようにしたものである。
〔発明の実施例〕
以下、本発明の一実施例を説明するが、ここでfflc
l図におけるプロセッサ1aの障害処理に胸するハード
ウェア構成の本発明の一実施例を@4図に示す。泥4図
において、lOは障害検出回路、11は再試行可能か否
かを示す表示子、17は再試行中を示す表示子、14は
割込制御回路、16は再試行制御回路、18はサービス
プロッサ部4とのインタフェース制御回路、19はプロ
セッサ部の動作停止指示回路、加はプログラム実行部で
ある。又、第5図は第1図におけるサービスプロセッサ
部4の障害処理に関するハードウェアM4成の本発明の
一実施例であって、40はプロセッサ部1a、lbとの
インタフェース制御回路、41は再試行可能か否かを判
定し、プロセッサ部に再試行を指示する再試行指示回路
、42は他のプロセッサ部の状態を調べ他のプロセッサ
に障害処理を指示する回路、43は入出力装@5に障害
表示を行う表示制御回路である。
今、プロセッサ部1aの障害検出回路lOで障害が検出
されると、インタフェース制御回路18によりt−ビス
プロセッサ4に障害発生を通知するとともに、停止指示
回路19によりプロセッサ部la上でのプログラム実行
動作を停止せしめる。
上記プロセッサ部1aからの障害発生の通知は、サービ
スプロセッサ4のインタフェース制G’l iB 40
を介して再試行指示回路41に渡される。プロセッサ部
1aから障害発生の通知を受けた再試行指示回路41は
、インタフェース制御部40を介してまずプロセッサ部
1aの内部情報を読出し、プロセッサ部1aでの再試行
が可能か否かを判別する。もし表示子11 、17がと
もにオフでプロセッサ部1aでの再試行が可能ならば、
再試行指示回路41はプロセッサ部1aに再試行を指示
する。
サービスプロセッサ4かもの再試行指示は、インタフェ
ース制御回路18を介してプロセッサ部1aの再試行制
御回路16に渡される。サービスプロセッサ部4から再
試行の指示を受けた再試行制御回路16は、障害発生に
より実行が中断された命令の再試行を行い、再試行に成
功すると割込制御回路14に通知し割込制御回路14は
自プロセッサ部1a上のプログラムに対して再試行成功
の障害が発ログラムは、割込みレベル及び割込みコード
により割込み原因を知り、プロセッサ部1aで再試行成
功の障害が発生したことをメモリ部あるいは外部記憶装
置に記録した後、プログラム動作を継続する。この再試
行成功の障害に関する記録は、ノ・−ドウエアの保守診
断時に利用される。
サービスプロセッサ部4から再試行を受けたプロセッサ
部1aで、命令の再試行に失敗した時、プロセッサ部1
aはインタフェース71を介してサービスプロセッサ部
4に再試行失敗を通知し、自らは再び停止状態になる。
プロセッサ部1aから障害発生の通知を受け、その障害
がセ■試行不能な1憩害(プロセッサ部1aの表示子1
1がオン)あるいは再試行に失敗した障害(プロセッサ
部1aの表示子17がオン)であった時、サービスプロ
セラ・す°部4の再試行指示回路41は障害処理指示回
路42に制御を渡す。この時、プロセッサ部1aは停止
状態のままである。制御を引き継いだ障害処理指示回路
42は、まず他プロセツサ部ibの状態を調べ、プロセ
ッサ部1bにおいてプログラム実行中であれば、該指示
回路42はインタフェース制御回路40、インタフェー
ス71を介してプロセッサ部lb内の外部マシンチェッ
ク割込原因表示レジスタ(図示せず)のプロセッサ部1
aに対応する障害表示ビットをセット(“1″′をスキ
ャンイン)し、表示制御回路43かも入出力装置5への
障害発生メツセージの表示は行わない。外部マシンチェ
ック割込原因表示レジスタかセットされると、プロセッ
サ部1bは外部マシンチェック割込みを起こし、プロセ
ッサ部lb上のプログラムにプロセッサ部1aでのハー
ドウェア障害発生を知らせる。割込みを受付だプロセッ
サ部lb上のプログラムは、割込みレベル、割込みコー
ドにより他プロセツサ部1aでのハードウェア障害発生
を知ると、システム運転を継続するか否か、プロセッサ
部1aの障害を運用者に通知するか否か等を判断し、必
要があれば、データチャネル部3bを介して入出力装置
6bにプロセッサ部1a陣害を示すメツセージを表示す
る。
プロセッサ部1bが停止状態でプログラム実行が行われ
ていない場合、あるいはシングル・プロセッサ構成でプ
ロセッサ部1bが接続されていない@合、障害処理指示
回路42は、プロセッサ部1bへの指示(スキャンイン
〕動作は行わず、表示制御回路4jに入出力装置5への
障害報告メツセージ表示を指示する。表示制御回路43
は、障害処理指示回路42からの指示に基づき、入出力
装置5に障害発生を報告するメツセージを表示する。
第6図は上記プロセッサ部1aで障害が発生したとぎり
プロセッサ部、サービスプロセッサ部の動作をフローで
示したもので、(a)はサービスプロセッサ部4の動作
、(b)はプロセッサ部1aの動作、(C)はプロセッ
サ部1bの動作である。
本実施例では、運用者への障害報乞は入出力装ff1(
5,6a、6b)により行われるとしたが、回線を介し
て遠隔へメツセージ送出、あるいは警報(ベル等)の鳴
動等によって障害の表示を行うこともできる。
また、プロセッサ部1aで障害が検出された時、再試行
可能な障害か、再試行不能な障害かの切分けをプロセッ
サ部1aのハードウェアで行い、再試行不能な障害が検
出されたとき、あるいは再試行失敗のときにプロセッサ
部1aからサービスプロセッサ部4に通知し、丹試行成
功の場合はサービスプロセッサ部4に通知しない方法も
考えられる。
抜だ、プロセッサ部1aで再試行不能な障害が検出又は
再試行失敗となったとき、プロセッサ部1aからサービ
スプロセッサ部4に障害を通知するとともに、プロセッ
サ部1aからプロセッサ部1bに対して、直接、外部マ
シンチェック割込み要求信号を送出することとし、サー
ビスプロセッサ部4からプロセッサ部1bへのスキャン
イン(障害表示ビットを1にセット)を行わないように
する方法も考えられる。
なお、情報処理装置内にプロセッサ部が3つ以上ある場
合は、サービスプロセッサ部から障害を通知するプロセ
ッサ部の優先順位をあらかじめ決めておき、いずれかの
プロセッサ部で再試行不能なハードウェア障害が検出さ
れたとき、あるいはハードウェア障害の再試行が失敗と
なったとき、プログラム実行中でかつ最も優先順位の高
いプロセッサ部に障害発生を通知することにより、本実
施例と同様に行うことかできる。あるいは、優先順位の
判定は外部マシンチェック割込みマスクのオン/オンに
よりプログラムが行うこととし、プロセッサ部での再試
行不能な障害が検出されたときあるいは再試行失敗のと
きは他の全てのプロセッサ部に通知する方法も考えられ
る。
〔発明の効果〕
以上の通り、本発明によれば、プロセッサ部で再試行不
能な障害か検出された時、あるいは再試行に失敗した時
、次のような効果が得られる。
(1)障害プロセッサ部でのプログラム実行は停止させ
るため、障害によるシステムへのj憂乱を防ぐことがで
きる。
(2)他のプロセッサ部がプログラム実行中であれば、
該プログラムに運、;5者への障害報告等の障害処理を
委ね、サービスプロセッサ部からの障害報告メツセージ
表示は行わないため、運用者に混乱を与えることがない
(3)他のプロセッサ部でプログラムが実行されていな
い場合、あるいは他プロセツサ部が存在しない場合は、
サービスプロセッサ部が運用者への障害報告を行うため
、プロセッサ部の障害によりシステムの運用が停止した
場合でも、運用者への障害報告は確実に行われる。
【図面の簡単な説明】
第1図は情報処理装置の構成例を示す図、第2図は従来
の障害処理方式のハードウェア構成の一例を示す図、第
3図は第2図の処理フローを示す図、第4図及び第5図
は本発明による障害処理方式のハードウェア構成の一実
施例を示す図、第6図は本発明による処理フローを示す
図である。 1a+1b・・・プロセッサ部(CPU)、2・・・メ
モリ部(M E M )、 3a、3b・・・データチ
ャネ#1(DCH)、4・・・サービスプロセッサ部(
SVP)、 5,6a、6b−入出力装置、 10・・
・障害積出回路、 11・・・再試行可屈/不可能表示
子、 12・・・OR回路、 13・・・A N D回
路、14・・・割込制御回路、 15・・・インノく一
タ、16・・・再試行制御回路、 17・・・再試行中
表示子、18°°゛インタフ工−スtlilJ御回路、
 19・・・停止]旨ボ回路、 40・・・インタフェ
ース制御回路、 41・・・再試行指示回路、 42・
・・障害処理指示回路、43・・・表示制御回路。 代理人弁理士 鈴 木 誠 第2図 /4 /コ 幇3図

Claims (1)

    【特許請求の範囲】
  1. (1) プログラムの実行を行う1つ又は複数のプロセ
    ッサ部と、前記プロセッサ部の保守・運転制御を行うサ
    ービスプロセッサ部とを具備してなる情報処理装置にお
    いて、プロセッサ部には、該プロセッサ部で再試行不能
    なハードウェア障害を検出した時、あるいは該プロセッ
    サ部でハードウェア障害の再試行に失敗した時、該プロ
    セッサ部は自プロセッサ部上でのプログラム実行を停止
    するとともに障害発生をサービスプロセッサ部に通知す
    る手段を設け、サービスプロセッサには、前記プロセッ
    サ部から障害発生の通知を受けると、他のプロセッサ部
    の状態を調べ、他のいずれかのプロセッサ部がプログラ
    ム実行中であれば、該プログラムに対し障害発生を通知
    して障害処理を該プログラムに委ね、他のいずれのプロ
    セッサ部に2いてもプログラム実行が行われていない場
    合、又は他のプロセッサ部が存在しない場合は、該サー
    ビスプロセッサの入出力装置を通じて運用者に障害発生
    を通知する手段を設けたことを特徴とする障害処理方式
JP58133221A 1983-07-21 1983-07-21 障害処理方式 Granted JPS6024651A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58133221A JPS6024651A (ja) 1983-07-21 1983-07-21 障害処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58133221A JPS6024651A (ja) 1983-07-21 1983-07-21 障害処理方式

Publications (2)

Publication Number Publication Date
JPS6024651A true JPS6024651A (ja) 1985-02-07
JPS6334492B2 JPS6334492B2 (ja) 1988-07-11

Family

ID=15099559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58133221A Granted JPS6024651A (ja) 1983-07-21 1983-07-21 障害処理方式

Country Status (1)

Country Link
JP (1) JPS6024651A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63221443A (ja) * 1987-03-11 1988-09-14 Nec Corp 情報処理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS556672A (en) * 1978-06-30 1980-01-18 Fujitsu Ltd Data processing system with service processor
JPS57143646A (en) * 1981-03-03 1982-09-04 Nec Corp Error recovery system for logical device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS556672A (en) * 1978-06-30 1980-01-18 Fujitsu Ltd Data processing system with service processor
JPS57143646A (en) * 1981-03-03 1982-09-04 Nec Corp Error recovery system for logical device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63221443A (ja) * 1987-03-11 1988-09-14 Nec Corp 情報処理装置

Also Published As

Publication number Publication date
JPS6334492B2 (ja) 1988-07-11

Similar Documents

Publication Publication Date Title
JPH09251443A (ja) 情報処理システムのプロセッサ障害回復処理方法
JPS6024651A (ja) 障害処理方式
JP2679575B2 (ja) 入出力チャネルの障害処理システム
JPH02183852A (ja) データ処理装置
JPH0582614B2 (ja)
JPH0264745A (ja) インターフェース制御装置
EP0112672B1 (en) System for processing machine check interruption
JP3008851B2 (ja) マルチコンピュータシステムの系間監視方式
KR20000033245A (ko) 장애 발생 신호를 갖는 에스씨에스아이 장치의실시간 장애 검출 장치 및 그 방법
JPH04369046A (ja) 活性チェック回路のテスト方式
JPS61224056A (ja) チヤネル障害検出処理方式
JP2814988B2 (ja) 障害処理方式
JPS59119451A (ja) 電子計算機システムの診断方式
JPH022180B2 (ja)
JPH02151937A (ja) サービスプロセッサダメージ処理方式
JPS60195649A (ja) マイクロプログラム制御型デ−タ処理装置におけるエラ−報告方式
JPS6112585B2 (ja)
JPH0683667A (ja) 情報処理装置の診断方式
JPS61237138A (ja) デ−タ処理装置
JPH01231153A (ja) 障害処理方式
JPH0756874A (ja) マルチプロセッサシステム及びその障害発生時の再起動方法
JPH01314340A (ja) 情報処理装置の障害処理方式
JP2001256081A (ja) 情報処理装置
JPH0391841A (ja) 異常回復処理方式
JPH0460852A (ja) 異常通知方法