JPS62180454A - 通信システムの障害情報収集方法 - Google Patents

通信システムの障害情報収集方法

Info

Publication number
JPS62180454A
JPS62180454A JP61021251A JP2125186A JPS62180454A JP S62180454 A JPS62180454 A JP S62180454A JP 61021251 A JP61021251 A JP 61021251A JP 2125186 A JP2125186 A JP 2125186A JP S62180454 A JPS62180454 A JP S62180454A
Authority
JP
Japan
Prior art keywords
processor
cpu
program
communication system
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61021251A
Other languages
English (en)
Other versions
JPH0746344B2 (ja
Inventor
Masahiro Kumon
久門 正弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61021251A priority Critical patent/JPH0746344B2/ja
Publication of JPS62180454A publication Critical patent/JPS62180454A/ja
Publication of JPH0746344B2 publication Critical patent/JPH0746344B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の背景〕 本発明は、複数のプロセッサがマルチプロセッシングシ
ステムとして互いに通信する通信システムにおいて、1
台のプロセッサに障害が発生した場合の障害解析の効率
化を図るのに好適な通信システムの障害情報収集方法に
関する。
〔発明の背景〕
従来、複数のプロセッサがマルチプロセッシングシステ
ムとして通信する通信システムにおいて1.4のプロセ
ッサに障害が発生した場合の処理に、次の様な問題点が
あった。即ち、従来技術では、プロセッサにおいてプロ
グラムの暴走や無限ループにおちる等の障害が発生した
場合、当該プロセッサ自身でその原因を解析する事が困
難であった。
壕だ、プロセッサにおいて、障害が発生した場合、処理
中のデータ等を一時的に退避メモリに格納して、消失を
防ぐ必要があるが、その場合全てのデータを退避させる
必要があるため、退避メモリとして大容量のものが必要
であるという問題点があった。
尚、本発明と関連する先行技術としては、特開昭59−
63851号公報に記載された発明が存在する。
しかし、上記公報に記載された発明においては、障害原
因の解析に必要な障害情報の収集について配慮されてお
らず、本発明とはその技術的思想を異にしている。
〔発明の目的〕
本発明は上記した従来技術の問題点に鑑みなされたもの
で、プログラムの暴走や無限ループにおちる等の障害が
発生した場合でも、障害原因の解析を確実に行なうこと
を可能にし、かつ退避メモリの容量を少なくすることを
可能にすることにより、通信システムの信頼性及び障害
原因の解析の効率を向上させない様にした通信7ステム
の障害情報収集方法を提供することを目的としている。
〔発明の概要〕
本発明の通信システムの障害情報収集方法は複数のプロ
セッサがマルチプロセッシングシステムとして通信路を
介して互いに通信する通信システムに適用されるもので
あシ、次の様な特徴を有している。即ち、第1のプロセ
ッサは第2のプロセッサの正常性を確認する信号を送出
し、第2のプロセッサは応答信号を送出する。第1のプ
ロセッサが、第2のプロセッサの異常を上記応答信号か
ら検出したとき、第1のプロセッサは第2のプロセッサ
にノンマスカブル割込信号を送出する。ノンマスカブル
割込信号は、プロセッサがどんな状態でも割込みを可能
とするものである。第2のプロセッサは上記ノンマスカ
ブル割込信号を受け、プログラムカウンタと内部レジス
タの内容を退避させる。その後、第1のプロセッサは第
2のプロセッサに対しリセット信号を送出する。第2の
プロセッサは、リセット信号を受け、内部機構だけを初
期設定する。このリセット信号による割込処理により、
第2のプロセッサの主記憶装置の内容を退避することが
可能になる。その後、第1のプロセッサは、第2のプロ
セッサから送出される各種データを障害情報として収集
する。
また、第2のプロセッサの主記憶装置内の退避エリアを
最小限とするため、次の様にしても良い。
即ち、リセット信号とは独立して、主記憶装置内のワー
クエリアを初期設定するプログラムワークエリア初期設
定要求信号を第1のプロセッサから筆2のプロセッサに
送出上ぜL第2のプロセツサハ、上記プログラムワーク
エリア初期設定要求信号を受信するまで、主記憶装置内
のワークエリアの内容を保存する。これにより、第2の
プロセッサの異常発生時のデータの退避エリア(第2の
プロセッサの主記憶装置内のエリア)を最小とすること
が可能になる。
〔発明の実施例〕
以下、添付の図面に示す実施例により、更に詳細に本発
明について説明する。第1図は、本発明による障害情報
収集方式の一実施例を示すシステム構成図である。第1
図において、1は中央制御プロセッサ(以下CPU )
と略称する)、2はCPU1の主記憶装置、3は端末制
御プロセッサ(以下CPUと略称する)、4はCPU3
の主記憶装置、5人5Bは通信制御装置、6はノンマス
カブル割込み線、7はリセット信号線である。本システ
ムにおいて、CPUIは、CPU3と通信によって端末
制御に関する制御データを送受し、CPU3による端末
制御を実行させる。
第2図は、第1図に示す実施例の動作の概略を示すフロ
ーチャートである。第2図において、プログラムAはC
PUIに収容されるプログラムであシ、プログラムBは
CPU2に収容されるプログラムである。プログラムA
はCPU l内にて一定周期毎に実行され、先ずCPU
2に対し、 CPU2の正常性確認のだめの信号送信を
行なう。プログラムBはCPU3において実行され、C
PUIから送信された正常性確認のだめの信号を受信す
ると、CPUIに対し正常性確認応答の信号を送信する
。CPUIは、正常性確認のための信号送信後、所定時
間経過してもCPU 3から正常性確認の応答がない場
合、CPU3の異常を認識する。所定時間内に正常性確
認の応答を受信した場合には、CPUIはCPU3の正
常性を確認する。
次に、CPUIがCPU3の異常を認識した場合の動作
について、第3図(a)、 (b)及び第4図を用いて
説明する。第3図(aJは、CPUa内のプログラムカ
ウンタ71と内部レジスタ72を示し、第3図(b)は
CPU3で実行されるプログラムで使用する可変データ
エリア8の構成を示している。CPU3の可変データエ
リア8は、CPUIとの通信時に送受信データを格納す
る送受信バッファ81と、CPUIとの通信処理を実行
する通信制御プログラムを格納した通信制御プログラム
ワークエリア82と、更に端末制御を実行する端末制御
プログラムを格納した端末制御プログラムワークエリア
83と、プログラムカウンタ71の内容を退避するプロ
グラムカウンタ・内部レジスタ退避エリア84と、送受
信バッファ81の内容を退避する送受信バッファ退避エ
リア語と、通信制御プログラムワークエリア82の内容
を退避する通信制御プログラムワークエリア退避エリア
86とから構成されている。
第4図は、 CPUIがCPU3の異常を検出したとき
、CPU3から異常状態情報を収集する処理手順を示す
70−チ・ヤードである。第4図において、プログラム
CはCPU 1に収容されるプログラムであシ、プログ
ラムDおよびプログラムEはCPU2に収容されるプロ
グラムであp、CPU2の異常時にもプログラムが破壊
されないようROMに収容される。
第3図に示したCPU 1によるCPU3の異常監視に
よって、CPU 1が異常を検出した場合、先ずCPU
I内のプログラムCが起動される。プログラムCは、先
ずCPU3に対しノンマスカブル割込線3を介してノン
マスカブル割込みをかける。CPU3は、上記ノンマス
カル割込みを受けて、図示する様に割込処理を開始する
。CPU2においては、上記割込処理によって、プログ
ラムカウンタ71と内部レジスタ72の内容が、プログ
ラムカウンタ・内部レジスタ退避エリア関に退避される
。CPU 1は、CP[J3にノンマスカブル割込みを
起動した後、ノンマスカブル割込みによる割込処理が終
了するのに十分な時間をg1°数する。その後、 CP
UIは、リセット信号線7を介して、リセット信号をC
PU3に対して送出する。ノンマスカル割込み及びリセ
ット信号の送出動作については、周知であるため、その
詳しい説明は省略する。
CPU 3はリセット信号を受け、 CPU3の内部初
期設定のみを行ない、 CPUa内のプログラムDを起
動する。CPU3は、プログラムDにおいて、先ず送受
信バッファ81の内容を送受信バッファ退避エリア8に
退避する。次に、通信制御プログラムワークエリア82
の内容を通信制御プログラムワークエリア退避エリア8
6に退避する。次に、通信制御プログラムを初期設定し
、通信制御プログラムワークエリア82に格納する。以
上の処理を終了すると、CPU3からCPUIIに対し
て、リセット処理完了信号が送信される。
CPUIは、CPU3から送信されるリセット処理完了
信号を、リセット信号送出後所定時間内に受信すると、
CPU2において各種情報退避が完了したことを認識す
る。そして、CPU1は、CP[J3内のプログラムカ
ウンタ71、内部レジスタ72、送受信バッファ81、
通信制御プログラム内部データエリア83、端末制御プ
ログラム内部データエリア83内の各データから成る障
害情報を転送させ、収集する。
CPUIは、上記障害情報の収集後、端末制御プログラ
ムワークエリア初期設定要求信号をCPU3に送出する
。CPU3は、上記端末制御プログラムワークエリア初
期設定要求信号を受け、プログラムEを起動する。プロ
グラムEにおいて、CPU3は、端末制御プログラムの
初期設定を行ない、端末制御プログラムワークエリア8
3に格納する。
以上の説明から明らかな様に、本実施例によれば、リセ
ット信号と端末制御プログラム初期設定要求信号とを独
立に設けたため、CPU3の内部データを退避するため
の退避メモリとして、CPUIとの通信制御関連のデー
タを退避する退避メモリだけを主記憶装置4に設ければ
良く、端末制御プログラムを退避するためのエリアを退
避メモリに設ける必要がない。そのため、従来技術と比
較して主記憶装置4を小型化することが可能になる。
〔発明の効果〕
本発明によれば以下効果がある。
(イ) 自プロセッサにて検出不可能な障害(プログラ
ム暴走およびプログラム無限ループ)が、他の正常プロ
セッサによって確実に検出できるため、通信システムの
信頼性が向上する。
(ロ)異常プロセッサの異常発生時の全データ内容が、
他の正常プロセッサによって収集できるため、障害解析
を確実に効率よく行なうことができる。
(ハ)異常発生時のデータの退避メモリとして、通信制
御プログラム関連データの容量分だけ用意すれば良いた
め、主記憶装置としてメモリ容量の少ないものを備えた
プロセッサにおいても、異常発生時に全ての障害情報の
収集が可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図に示す実施例におけるCPU3の正常性確認処理
の一例を示すフローチャート、第3図(a)は第1図に
示すCPU3の内部レジスタを示す説明図、第3図(b
)は第1図に示すCPU 3の可変データエリアを示す
説明図、第4図は第1図に示す実施例における異常状態
情報の収集処理手順を示すフローチャートである。 1・・・中央制御プロセッサ(CPU)、2.4・・・
主記憶装置、3・・・端末制御プロセッサ(CPU)、
5A。 5B・・・通信制御装置、6・・・ノンマスカブル割込
線、7・・・リセット信号線。 代理人 弁理士 秋 本 正 実 第1図 ■ 第2図 第3図 (a)     (b)

Claims (1)

  1. 【特許請求の範囲】 1、複数のプロセッサがマルチプロセッシングシステム
    として通信路を介して相互に通信を行なう通信システム
    において、第1のプロセッサから第2のプロセッサに対
    し第2のプロセッサの正常性を確認する信号を送出し、
    第1のプロセッサがその応答信号により第2のプロセッ
    サの異常を検出したとき、ノンマスカブル割込信号を第
    2のプロセッサに送出し、第2のプロセッサは上記ノン
    マスカブル割込信号を受けてプログラムカウンタと内部
    レジスタの内容を退避させ、次に第1のプロセッサはリ
    セット信号を第2のプロセッサに送出し、第2のプロセ
    ッサは上記リセット信号を受けてその内部機構だけを初
    期化し、その後第2のプロセッサから第1のプロセッサ
    へ各種データを障害情報として送出し、第1のプロセッ
    サが上記障害情報を受信することを特徴とする通信シス
    テムの障害情報収集方法。 2、前記内部機構の初期化により、通信制御に関連した
    データだけを退避させることを特徴とする特許請求の範
    囲第1項記載の通信システムの障害情報収集方法。 3、前記障害情報の収集後、第1のプロセッサが第2の
    プロセッサに対し第2のプロセッサに設けられた主記憶
    装置のワークエリアを初期設定するプログラムワークエ
    リア初期設定要求信号を送出し、第2のプロセッサは上
    記プログラムワークエリア初期設定要求信号を受信する
    まで、異常時の主記憶装置内のプログラムワークエリア
    を保存することを特徴とする特許請求の範囲第1項記載
    の通信システムの障害情報収集方法。
JP61021251A 1986-02-04 1986-02-04 通信システムの障害情報収集方法 Expired - Lifetime JPH0746344B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61021251A JPH0746344B2 (ja) 1986-02-04 1986-02-04 通信システムの障害情報収集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61021251A JPH0746344B2 (ja) 1986-02-04 1986-02-04 通信システムの障害情報収集方法

Publications (2)

Publication Number Publication Date
JPS62180454A true JPS62180454A (ja) 1987-08-07
JPH0746344B2 JPH0746344B2 (ja) 1995-05-17

Family

ID=12049851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61021251A Expired - Lifetime JPH0746344B2 (ja) 1986-02-04 1986-02-04 通信システムの障害情報収集方法

Country Status (1)

Country Link
JP (1) JPH0746344B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012198805A (ja) * 2011-03-22 2012-10-18 Denso Corp 制御装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254362A (ja) * 1984-05-31 1985-12-16 Fujitsu Ltd デ−タ処理装置における状態情報の退避方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254362A (ja) * 1984-05-31 1985-12-16 Fujitsu Ltd デ−タ処理装置における状態情報の退避方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012198805A (ja) * 2011-03-22 2012-10-18 Denso Corp 制御装置

Also Published As

Publication number Publication date
JPH0746344B2 (ja) 1995-05-17

Similar Documents

Publication Publication Date Title
US5878205A (en) Method and system for processing complex recovery using polling signals in a shared medium
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US5442777A (en) Firmware trace data acquisition method
US5600808A (en) Processing method by which continuous operation of communication control program is obtained
CN115904793B (zh) 一种基于多核异构系统的内存转存方法、系统及芯片
JPS62180454A (ja) 通信システムの障害情報収集方法
JP2956849B2 (ja) データ処理システム
JP3025732B2 (ja) 多重化コンピュータシステムの制御方式
JP3420919B2 (ja) 情報処理装置
JP2001154999A (ja) 並列計算機システム及びその立上げ処理方法
JPH11232143A (ja) マルチスレッドの監視方法
JP2785992B2 (ja) サーバプログラムの管理処理方式
JP2879480B2 (ja) 冗長計算機システムの同期外れ時の切替方式
JPH0271336A (ja) プロセッサの障害状態監視方式
JP2545856B2 (ja) メモリダンプ採取装置
JPS62105243A (ja) システム障害の復旧装置
JP2908430B1 (ja) マルチプロセッサシステムのホストプロセッサ監視装置および監視方法
JPH05224964A (ja) バス異常通知方式
JP3470454B2 (ja) マルチプロセッサシステムの通信制御方法
JPS6385939A (ja) 情報処理システム
JPH02310755A (ja) ヘルスチェック方式
JP2001075935A (ja) プロセッサ間通信方法
KR19990050461A (ko) 고 가용성 시스템의 오류 처리방법
JPH10222401A (ja) 装置間インタフェース制御方式
JPH02244940A (ja) プロトコル変換システム