JPH01216438A - 障害通知方式 - Google Patents

障害通知方式

Info

Publication number
JPH01216438A
JPH01216438A JP63040658A JP4065888A JPH01216438A JP H01216438 A JPH01216438 A JP H01216438A JP 63040658 A JP63040658 A JP 63040658A JP 4065888 A JP4065888 A JP 4065888A JP H01216438 A JPH01216438 A JP H01216438A
Authority
JP
Japan
Prior art keywords
diagnostic
mpu
execution
communication
microprocessor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63040658A
Other languages
English (en)
Inventor
Masanobu Nakajima
中島 正信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63040658A priority Critical patent/JPH01216438A/ja
Publication of JPH01216438A publication Critical patent/JPH01216438A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、高信頼性を得るマルチ中央処理装置(以下
CPUという)を備えたマイクロコンピュータ制御シス
テムにおける障害通知方式に関するものである。
〔従来の技術〕
第2図は、たとえば特開昭58−96352号公報に示
された従来の障害通知方式を示す構成図であシ、図にお
いて、10は実行マイクロプロセッサユニット(以下、
実行MPUという)、11は基本CPU、12はローカ
ルメモリ、13は通信ポーと、14は診断入力/出力(
以下、Iloという)ポーと、15はローカルバス、1
6はバッファ”c’sp、実行MPUIGはこれらの基
本CPU11とローカルメモリ12と通信ポート13と
診断I10ポート14とパスバッファ16とから構成さ
れ、これらの各素子はそれぞれローカルバス15によっ
て接続されている。
11は上記実行MPUl0のパスバッフ716と。
診断MPU18のシステム監視回路25およびメインメ
モリ26が接続されている0 また、診断MPU18は実行MPU10を監視するもの
で、 診McPU19とローカルメモリ20とタイマな
どの周辺大規模集積回路(以下、LSIという)21と
通信ポート22と診断I10ポート23とシステム監視
回路25とから構成され、各素子のそれぞれがローカル
バス24によりて接続されている。
21は実行MPUl0の通信ポート13と診断MPUl
8の通信ポート22とを接続する通信ラインであシ、2
8は実行MPU1Gの診断工んポート14と診断MPU
18の診断I10ポート23とを接続する診断I10ラ
イン28である。
次に動作について説明する。実行MPU10および診断
MPU18は電源投入後システムをスタートする。診断
MPU18は自己のローカルメモリ20内のプログラム
を実行し、実行MPU10は自己のローカルメモリ12
あるいはシステムパス17に接続されたメインメモリ2
6のプログラムを実行する。
診断MPU18はローカルメモリ20に収納されている
診断プログラムによりシステム全体の各種診断を行う。
診゛断MPU18は実行MPU10よシも高優先となっ
ている。
システムが正常に動作しているときは、診断MPU18
はある定められた周期で実行MPUl0に対して、シス
テムの各部の定期診断要求を発する。
定期診断要求を受信した実行MPUl0はその要求のメ
ニユ―によシ診断を行い、結果を通信ライン21を介し
て診断MPU18に報告する。
診断MPU18はシステム診断要求によシ、実行MPU
l0が実行するパス上の動作と診断結果とを照合し、シ
ステム全体の状態を認識する。
また、診断結果のデータをシステムパス11に接続され
ている不揮発性の外部記憶装置に時系列的に格納する。
このようにして、実行MPU10と診断MPU18は通
信回線2Tを介して粗結合されている。
システム異常時、エラーの信号で診断MPU1Bはバス
上のデータを収集し、実行MPUl0の状態を監視し、
そのエラーが実行MPUl0の計算機動作の連続性に支
障ないものであれば、データ収集のみとする。
実行MPU1Gがそのエラーよりシステム的に回復動作
を行うため、エラー情報の詳細を必要とする場合は、診
vfrMPU18に通信ポート22を介して要求する。
その情報から命令の再試行やシステムの再構築が可能と
なる。同時にエラー情報も外部記憶装置に収納される。
次に実行MPU1gが計算機動作を続行できないような
エラーの場合、まずバス上のデータを診断MPU1Bが
収集する。
次に実行MPUl0の動作を止め、ウオッチドタイマな
どのエラースティタスも診断I10ポート14よ)出力
される診断I10ポート信号よシ判定する。
診断MPU18は最新のエラー情報と実行MPU 10
の動作を分析し、オペレータに知らせるのが、再起動を
するのかを判断する。再起動を決定した場合、実行MP
U18は診断I10ポート23内の実行MPUリセット
信号を動作させて診断I10ライン28を介して、実行
MPU10を再起動する。この再起動信号は実行MPU
l0がどのような状態にあっても初期状態とする。
診断MPt11Bのリセット信号により再起動された実
行MPU10は再起動が診断MPU18よシのものであ
ることを認識する。そして、システムバス11を使用し
ない状態で実行MPU10内の自己診断を行う。
この診断が完了したら、次に通信回線27を用いて診断
MPU18と通信を行い、システム異常直前のデータを
入手する。この診断MPU18のデータとメインメモリ
26内に残っている各機のテーブル類から異常発生要因
の分析、異常部の切り離しなどのシステム再構成を行い
、システム処理の連続できる最も小さなブロックの先頭
よシシステムをスタートする。。
〔発明が解決しようとする課題〕
従来の障害通知方式は以上のように構成されているので
、一つの診断MPU18に一つの実行MPU10しか接
続できないため、複数の実行MPUを持つマイクロコン
ビエータシステムでは、その台数に和尚する診断MPU
が必要であり、ノ・−ドウエア ゛が大きくなる課題が
あった。
この発明は上記のような課題を解消するためになされた
もので、複数の実行MPUを含むシステムにおいても一
つの診断MPUだけですべての実行MPUの状態を監視
できる障害通知方式を得ることを目的とする。
〔課題を解決するための手段〕
この発明に係る障害通知方式は、複数の実行MPUに各
々異なる識別子を設けて診断MPUが各実行MPUを区
別できるようにするとともに、診断MPU内の診断I1
0ポートを実行MPUと同じ個数だけ設け、各実行MP
Uの診断I10ポートと診断I10ラインで接続したも
のである。
〔作用〕
この発明における診断MPUは識別子を用いて実行MP
Uの各々と通信ラインを介して交信し、エラー情報を収
集するとともに、実行MPUの各ステータスの情報およ
び実行MPUリセット時のリセット信号などは該当実行
MPUと接続された診断I10ラインを介して受は渡し
を行う。
〔実施例〕
以下、この発明の一実施例を図について説明する。第1
図において、17は実行MPUa3Gと実行MPUb3
1と診断MPU32とメインメモリ26とを接続するシ
ステムパスである。
メインメモリ26およびシステムバス17は第2図の従
来例と同一のものである。また、実行MPUa30 、
実行MPUb31は従来の実行MPU10と同一のもの
である。図示の実施例ではこの二つの実行MPUa30
 、実行MPUb 31を診断する場合を例示している
19は診断MPU32内の診断CPU、2Gはローカル
メモリ、21は周辺LSI、22は通信ポーと、24は
ローカルバス、25はシステム監視回路、33は実行M
PUa30の診断用の診断I10ポートa。
34は実行MPUb 31の診断用の診断I10ポート
bである。
診断MPU32はこれらの実行MPUa30および実行
MPUb 31を監視するもので、診断CPU19と、
ローカルメモリ20と、タイマなどの周辺LSI21と
、通信ポート22と、システム監視回路25と、診断I
10ポートa33と、診断I10ポートb34とから構
成されておシ、各素子のそれぞれがローカルバス24に
よって接続されている。
21は診断MPU32内の通信ポート22と、実行MP
Ua3G内の通信ポート13と、実行MPUb31内の
通信ポー)13bとを接続し、実行MPUa30と実行
MPUb 31および診断MPU32を接続する通信ラ
インである。
また、35は実行MPUa3Gの診断I10ポート14
aと診断MPU32の診断I10ポート33とを接続し
、実行MPUa30と診断MPU32とを接続する診断
l10−)インaである。
36は診断MPU32の診断I10ポート34と実行M
PUb 31の診断I10ポート14bとを接続し、診
断MPU32と実行MPUb 31とを接続する診断I
10ラインbである。
11aは実行MPUa3G内の基本CPU、 12aは
ローカルメモリ、13aは通信ポーと、14aは診断I
10ポーと、15aFio−カルパス、16mはパスバ
ッファであシ、これらの基本CPU11a、ローカルメ
モリ12a1通信ポート13a9診断I10ポー) 1
4a eローカルバス15a、パスバッファ16aKJ
:C実行MPUa30を構成している。
flbは実行MPUa31内の基本CPU、 12bは
ローカルメモリ、13bは通信ポー)、14bは診断I
10ポート、16bはバスバッファであシ、これらの基
本CPU11b、ローカルメモリ12b9通信ポート1
3b9診断I10ボー)14b、ローカルバス15b、
パスバッファ16bによシ実行MPUb31が構成され
ている。
次に動作について説明する。実行MPUa3G 、実行
MPUb31 、診断MPU32は電源投入後システム
をスタートする。診断MPU32は自己のローカルメモ
リ20内のプログラムを実行し、実行M P U a3
0、実行MPUb 31はそれぞれ自己のローカルメモ
リ12a 、 12bあるいはシステムバス1Tに接続
されたメインメモリ26のプログラムを実行する。
診断MPU32は内部の四−カルメモリ20に収納され
ている診断プログラムによりシステム全体の各種診断を
行う。診断MPU32は実行MPUa30゜実行MPU
b 31よシも高優先となりている。
システムが正常に動作しているときは、診断MPU32
はある定められた周期で実行MPUa30 、実行MP
Ub 31に対し、システムの各部の診断要求を通信ラ
イン27を介して発する。このとき、通信ライン27は
実行MPUa30 、実行MPUb 31の双方に接な
かっているため、どちらの実行MPUかを識別するため
の識別子も同時に発する。
定期診断要求を発した二つの実行MPUa30 、実行
MPUb31はそれぞれその要求が自身にきたものかど
うかを、同時に送られてきた識別紙を見て判断し、自身
にきたものであればその要求のメニユーによシ診断を行
い、診断結果を通信ライン27を介して診断CPU32
に報告する。もし、定期診断要求が自身にきたものでな
ければ実行MPUは何も行われない。
実行MPUa30 、実行MPUb 31のいずれかか
らの報告を受けた診断MPU32はバス上の動作と診断
結果とを照合し、システム全体の状態を認識する。
また、診断結果のデータをシステムバス17に接続され
ている不揮発性の外部記憶装置に実行MPUa30、実
行MPUb31別に分けて格納する。
システム異常時、診断MPU32はバス上のデータを収
集し、実行MPUa30 、実行MPUb31の状態を
監視し、そのエラーがどちらの実行MPUで起ζったか
を判断する。たとえば実行MPUa30でエラーが発生
したとする。実行MPUa30のエラーが計算機動作の
連続性に支障ないものであれば、診断MPU32は実行
MPU3Gのデータを収集するのみである。
実行MPUa30がそのエラーからの回復動作を行うた
め、エラー情報の詳細を必要とする場合は診断MPU3
2に通信ポート13a1通信2イン2Tを介して要求す
る。
診断MPU32は実行MPUa30の回復に必要なデー
タを前記不揮発性、メモリよ、シ取シ出し、通信ライン
2Tを介して実行MPUa30に送る。その情報をもと
に実行MPUa30は自身の回復を行う。
これらのデータの送受信は実行MPUa30内の通信ポ
ート13a0診断MPU32内の通信ポート22間で通
信ライン2Tを介して前述の識別子を用いて行われる。
次に、エラーを起こした実行MPU (この場合は実行
MPUa30が計算機動作を続行できないようなエラー
の場合)に対して、まず診断MPU32はバス上のデー
タを収集する。
次に、診断MPU32は実行MPUa3Gの動作を止め
、最新のエラー情報と実行MPUa30の動作を分析し
、オペレータに知らせるのか再起動をするのかを判断す
る。
再起動を決定し死場合、診断MPU32は診断I10ポ
ートa33内の実行MPUリセット信号を動作させて診
断I10ラインa35を介した実行MPUa30を再起
動する。この再起動信号は実行MPUa30がどのよう
な状態にあっても初期状態とする。
診断MPU32のリセット信号によシ再起動された実行
MPUa3Gは再起動が診断MPU32よシのものであ
ることを認識した後、従来と同様にシステムの再構築を
図る。このときの通信ボー)13aと22間の交信は前
述のごとく識別子を用いて行われることは言うまでもな
い。
なお、上記実施例では、実行MPUが二つの場合につい
て示したが、診断MPU32内の診断I10ポートを追
加し、実行MPUの識別子を増やすことで三つ以上の実
行MPUの場合でも同様のシステム診断処理ができるこ
とは明らかである。
〔発明の効果〕
以上のように仁の発明によれば、一つの診断MPUによ
シ識別子を用いて複数の実行MPUのそれぞれと交信し
てエラーの情報を収集して各実行MPUの障害を検知し
て回復できるようにするとともに、実行MPUの各ステ
ータスの情報と実行MPUリセット時のリセット信号な
どを該当MPUと接続した診断I10ラインを通して伝
送するように構成したので、従来に比べ少ないハードウ
ェアで実現できる効果がある。
【図面の簡単な説明】
第1図はこの発明の一実施例による障害通知方式の構成
図、第2図は従来の障害通知方式の構成図である。 11a 、11bは基本CPU、 12a 、 12b
はローカルメモリ、13a、13b、22は通信ポート
、14a。 14bは診断I10ポート、15a 、15b 、 2
4はロー・カルパス、16a 、 16bはパスバッフ
ァ、17tljニジステムバス、19は診断CPU、 
21は周辺LSI。 25はシステム監視回路、26はメインメモリ、2Tは
通信ライン、30は実行MPUa、31は実行MPUb
132は診断MPU、33は診断I10ボー)a、34
は診断I10ポートb135は診断I10ラインa13
6は診断I10ラインb0なお、図中同一符号は同一、
又は相当部分を示す0

Claims (1)

    【特許請求の範囲】
  1. ローカルバスに接続される基本中央処理装置、上記ロー
    カルバスに接続されるローカルメモリ、上記ローカルバ
    スとシステムバスとを接続するバスバッファ、通信を行
    うための通信ポートと診断入力/出力ポートとを有しか
    つそれぞれの識別を設けた複数の実行マイクロプロセッ
    サユニットと、この複数の実行マイクロプロセッサユニ
    ットを監視するために診断中央処理装置、ローカルメモ
    リとタイマなどの周辺大規模集積回路、通信ポート、上
    記各実行マイクロプロセッサユニットに対する診断入力
    /出力ポート、システム監視回路とを有しかつ上記各実
    行マイクロプロセッサユニットの状態を監視する診断マ
    イクロプロセッサユニットと、この診断マイクロプロセ
    ッサユニット内の上記通信ポートと上記各実行マイクロ
    プロセッサ内の通信ポートと接続され上記診断マイクロ
    プロセッサユニットが上記各実行マイクロプロセッサユ
    ニットと上記各識別子を用いて交信するための通信ライ
    ンと、上記各実行マイクロプロセッサユニット内の診断
    入力/出力ポートと上記診断マイクロプロセッサユニッ
    ト内の上記診断入力/出力ポート間に接続され上記実行
    マイクロプロセッサユニットのステータスの情報および
    各実行マイクロプロセッサのリセット時のリセット信号
    などを該当する実行マイクロプロセッサユニットに伝送
    するための診断入力/出力ラインと、上記各実行マイク
    ロプロセッサユニット内の上記バスラインおよび上記診
    断マイクロプロセッサユニット内の上記システム監視回
    路とメインメモリとを接続するシステムバスとを備えた
    障害通知方式。
JP63040658A 1988-02-25 1988-02-25 障害通知方式 Pending JPH01216438A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63040658A JPH01216438A (ja) 1988-02-25 1988-02-25 障害通知方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63040658A JPH01216438A (ja) 1988-02-25 1988-02-25 障害通知方式

Publications (1)

Publication Number Publication Date
JPH01216438A true JPH01216438A (ja) 1989-08-30

Family

ID=12586640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63040658A Pending JPH01216438A (ja) 1988-02-25 1988-02-25 障害通知方式

Country Status (1)

Country Link
JP (1) JPH01216438A (ja)

Similar Documents

Publication Publication Date Title
JPH03131939A (ja) 高信頼性コンピュータ診断システム
JPH0950424A (ja) ダンプ採取装置およびダンプ採取方法
CN113535448B (zh) 一种多重看门狗控制方法及其控制系统
JPH09251443A (ja) 情報処理システムのプロセッサ障害回復処理方法
KR100279204B1 (ko) 자동제어시스템에서현장제어장치의콘트롤러이중화제어방법및그장치
CN115408240B (zh) 一种冗余系统主备方法、装置、设备及储存介质
JPH01216438A (ja) 障害通知方式
JPH02132529A (ja) 自動監視切替制御装置
JP2538876B2 (ja) 共通バス構造を持つデ−タ処理装置
JPH1188471A (ja) 試験方法及び試験装置
JPH11120154A (ja) コンピュータシステムにおけるアクセス制御装置および方法
JPH01244552A (ja) 障害通知方式
JPH0630069B2 (ja) 多重化システム
JPH0582614B2 (ja)
JPS6290068A (ja) 予備系監視方式
JPS6213700B2 (ja)
JPS6123246A (ja) マルチプロセツサシステムの監視方式
JPH03253945A (ja) データ処理システムの異常回復処理機能確認方式
KR100257162B1 (ko) 이중화 시스템에서 상대 시스템의 감시방법 및 장치
JPS6113627B2 (ja)
JPH07114521A (ja) マルチマイクロコンピュータシステム
JPS626265B2 (ja)
CN117743008A (zh) 多核处理器故障诊断与异常处理方法、主控板卡及设备
JPH0436857A (ja) マルチプロセッサシステムにおけるバス診断方式
JPH03156646A (ja) 障害情報の出力方式