JPS60189542A - プロセツサ暴走検出方式 - Google Patents
プロセツサ暴走検出方式Info
- Publication number
- JPS60189542A JPS60189542A JP59044024A JP4402484A JPS60189542A JP S60189542 A JPS60189542 A JP S60189542A JP 59044024 A JP59044024 A JP 59044024A JP 4402484 A JP4402484 A JP 4402484A JP S60189542 A JPS60189542 A JP S60189542A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- memory
- sum check
- area
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0763—Error or fault detection not based on redundancy by bit configuration check, e.g. of formats or tags
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
- G06F11/0724—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は、プロセッサ暴走検出方式に関し、特に共有メ
モリを介して接続されたマルチプロセッサ・システムの
自動診断が可能なプ四セッサ暴走−勇−r−++i−z
珍t−1■1吻□□□−h優■か〔発明の背景〕 従来のプロセッサ・システムにおけるプロセッサ暴走検
出方法は、例えば特開昭57−86956号公報に示さ
れるよう忙、特別なハードウェア回路を用いて行ってい
たので、プロセッサが複′#になると、プ田セッサ対応
に暴走検出のためのハードウェア回路が必要となる。す
なわち、グローバル・プロセッサと複数の田−カル・プ
ロセッサからなるマルチプロセッサ・システムでは、第
1図に示すように1メイン・メモリ1とグルーパル・プ
ロセッサ7が1つのLSIに組み込まれ、各ローカル・
プロセッサ8もそれぞれ対応するローカル・メモリ2と
ともに各LSIに組み込まれている。
モリを介して接続されたマルチプロセッサ・システムの
自動診断が可能なプ四セッサ暴走−勇−r−++i−z
珍t−1■1吻□□□−h優■か〔発明の背景〕 従来のプロセッサ・システムにおけるプロセッサ暴走検
出方法は、例えば特開昭57−86956号公報に示さ
れるよう忙、特別なハードウェア回路を用いて行ってい
たので、プロセッサが複′#になると、プ田セッサ対応
に暴走検出のためのハードウェア回路が必要となる。す
なわち、グローバル・プロセッサと複数の田−カル・プ
ロセッサからなるマルチプロセッサ・システムでは、第
1図に示すように1メイン・メモリ1とグルーパル・プ
ロセッサ7が1つのLSIに組み込まれ、各ローカル・
プロセッサ8もそれぞれ対応するローカル・メモリ2と
ともに各LSIに組み込まれている。
この場合、グ田−バル・プロセッサ7はメイン・メモリ
1と他のすべてのLSIのり一カル・メモリ2に対して
リード/ライトすることができるが、各ローカル・プロ
セッサ8は、各自に割り当てられた四−カル・メモリ2
をリード/ライトできるのみである〇 ゲ四−バル・プv:1士ツ廿7)−久ローカル拳プロセ
ッサ8は、それぞれ独立してプログラムを実行し、別個
のジョブを遂行するが、何らかの原因でp−カル・プば
セッサ8が障害を起したり、プログラム動作を生じたと
きには、それらを検出した後、そのプロセッサのみをシ
ステムから切り離す必要がある。
1と他のすべてのLSIのり一カル・メモリ2に対して
リード/ライトすることができるが、各ローカル・プロ
セッサ8は、各自に割り当てられた四−カル・メモリ2
をリード/ライトできるのみである〇 ゲ四−バル・プv:1士ツ廿7)−久ローカル拳プロセ
ッサ8は、それぞれ独立してプログラムを実行し、別個
のジョブを遂行するが、何らかの原因でp−カル・プば
セッサ8が障害を起したり、プログラム動作を生じたと
きには、それらを検出した後、そのプロセッサのみをシ
ステムから切り離す必要がある。
しかし、グルーパル・プロセッサ7とローカル・プロセ
ッサ8は、それぞれ独立にプログラムを実行しており、
プログラム相互間は、直接連結されていないため、一方
のプログラムで他方のプログラムの暴走を検出すること
は、不可能である。そこで従来は、第1図に示すように
各LSIにハードウェア回路9を外付けし、常時各自の
プロセッサのプログラム動作を監視して、プログラム暴
走を検出したときグローバル・プロセッサ7にこれを報
告している。グルーパル・プロセッサ7からの指示によ
り、報告のあったハードウェア回路9を起動させ、その
ハードウェア回路9に接続されたLSIの四−カル・プ
ロセッサ8を停止する。
ッサ8は、それぞれ独立にプログラムを実行しており、
プログラム相互間は、直接連結されていないため、一方
のプログラムで他方のプログラムの暴走を検出すること
は、不可能である。そこで従来は、第1図に示すように
各LSIにハードウェア回路9を外付けし、常時各自の
プロセッサのプログラム動作を監視して、プログラム暴
走を検出したときグローバル・プロセッサ7にこれを報
告している。グルーパル・プロセッサ7からの指示によ
り、報告のあったハードウェア回路9を起動させ、その
ハードウェア回路9に接続されたLSIの四−カル・プ
ロセッサ8を停止する。
しかし、この方法では、プロセッサ8の暴走検出および
動作停止のために特別なハードウェア回路9が必要とな
る。したがつ゛(第3.@4とプロセッサが増加した場
合、プロセッサ対応に暴走検出停止用のハードウェア回
路9が必要となり製品原価が高くなる欠点があった。
動作停止のために特別なハードウェア回路9が必要とな
る。したがつ゛(第3.@4とプロセッサが増加した場
合、プロセッサ対応に暴走検出停止用のハードウェア回
路9が必要となり製品原価が高くなる欠点があった。
本発明の目的は、このような従来の欠点を除去し、特別
なハードウェア回路を使用せず、簡単かつ安価な方法に
より、マルチプロセッサのプログラム暴走を検出するこ
とができるプ四セッサ暴走検出方式を提供することにあ
る。
なハードウェア回路を使用せず、簡単かつ安価な方法に
より、マルチプロセッサのプログラム暴走を検出するこ
とができるプ四セッサ暴走検出方式を提供することにあ
る。
上記目的を達成するため、本発明のプロセッサ暴走検出
方式は、共有メモリを介して複数個のプロセッサが接続
されたマルチプVセッサ・システムにおいて、各プロセ
ッサがリードできるメモリ・エリア内に1各プロセツサ
がサムチェックするエリアの先頭アドレスと最終アドレ
スを格納したサムチェック範囲指定テーブルを設け、各
プロセッサは該指定テーブルで指定された互いに異なる
プロセッサのプログラム等が格納されているメモリ・エ
リアをサムチェツタして、データの破壊を検出すること
に特徴がある。
方式は、共有メモリを介して複数個のプロセッサが接続
されたマルチプVセッサ・システムにおいて、各プロセ
ッサがリードできるメモリ・エリア内に1各プロセツサ
がサムチェックするエリアの先頭アドレスと最終アドレ
スを格納したサムチェック範囲指定テーブルを設け、各
プロセッサは該指定テーブルで指定された互いに異なる
プロセッサのプログラム等が格納されているメモリ・エ
リアをサムチェツタして、データの破壊を検出すること
に特徴がある。
以下、本発明の一実施例を、第2図により説明する。第
2図において、メモリlとり一カルメモリ2を総称して
グローバル・メモリと呼ぶ。グ四−バル・メモリ1,2
は互いに重複しないグローバル・メモリ・アドレスを持
っている。メモリ1は、バッファチーゾル・エリアl上
、サムチェック範囲指定テーブル12、グ四−バル・コ
ントワール・プログラム13およびローカル監視プログ
ラム14からlRmされている。ここで、バッファテー
ブル・エリア11は、グ四−パル・プロセッサ7が処理
したデータを一時格納するエリアであり、サムチェック
範囲指定テープ#12は、グローバル・プロセッサ7が
サムチェック(サムチェックとは、メモリ1.2に格納
されているプログラム、チェックテーブル等の各エリア
のデータ内容の総合的なチェックをいう)を行うエリア
な指定するテーブルであり、グルーパル・コントロール
・プログラム13はグ四−バル・プロセッサ7によって
実行されるプログラムであり、ジ−カル監視7’ El
グラム14は、グローバル・プロセッサ7がローカル・
メモリ2を監視するためのプログラムである。
2図において、メモリlとり一カルメモリ2を総称して
グローバル・メモリと呼ぶ。グ四−バル・メモリ1,2
は互いに重複しないグローバル・メモリ・アドレスを持
っている。メモリ1は、バッファチーゾル・エリアl上
、サムチェック範囲指定テーブル12、グ四−バル・コ
ントワール・プログラム13およびローカル監視プログ
ラム14からlRmされている。ここで、バッファテー
ブル・エリア11は、グ四−パル・プロセッサ7が処理
したデータを一時格納するエリアであり、サムチェック
範囲指定テープ#12は、グローバル・プロセッサ7が
サムチェック(サムチェックとは、メモリ1.2に格納
されているプログラム、チェックテーブル等の各エリア
のデータ内容の総合的なチェックをいう)を行うエリア
な指定するテーブルであり、グルーパル・コントロール
・プログラム13はグ四−バル・プロセッサ7によって
実行されるプログラムであり、ジ−カル監視7’ El
グラム14は、グローバル・プロセッサ7がローカル・
メモリ2を監視するためのプログラムである。
一;L vs−カル・メモリ2は、ローカル・コントロ
ール・プログラム21、バッファ・テーブル・エリア2
2、サムチェック範囲指定テーブル23から構成されて
いる。ここで、ローカル・コントルール・プログラム2
1は、ローカル・プロセッサ8によって実行されるプロ
グラムであり、バッファ・テーブル・エリア22は、ロ
ーカル・プロセッサ8が処理したデータを一時格納する
エリアであり、サムチェック範囲指定テーブル23は、
田−カル・プロセッサ8がサムチェックを行うエリアを
指定するテーブルである。ローカル・メモリ制御回路δ
は、クロックパルス・ジェネレータ6からのタイミング
パルスにより、グローバルメモリゃバス3とローカルメ
モリ・バス養の接続または、切断を周期的に行っている
ため、グルーパル・プロセッサ7は、ローカルメモリ制
御回路δを経由してローカルメモリ2をアクセスするこ
とができるシステム構成となっている。
ール・プログラム21、バッファ・テーブル・エリア2
2、サムチェック範囲指定テーブル23から構成されて
いる。ここで、ローカル・コントルール・プログラム2
1は、ローカル・プロセッサ8によって実行されるプロ
グラムであり、バッファ・テーブル・エリア22は、ロ
ーカル・プロセッサ8が処理したデータを一時格納する
エリアであり、サムチェック範囲指定テーブル23は、
田−カル・プロセッサ8がサムチェックを行うエリアを
指定するテーブルである。ローカル・メモリ制御回路δ
は、クロックパルス・ジェネレータ6からのタイミング
パルスにより、グローバルメモリゃバス3とローカルメ
モリ・バス養の接続または、切断を周期的に行っている
ため、グルーパル・プロセッサ7は、ローカルメモリ制
御回路δを経由してローカルメモリ2をアクセスするこ
とができるシステム構成となっている。
第3図に本発明の特徴であるサムチェック範囲指定テー
ブル12.23の内容を示す。上記テーブル12.23
は、それぞれサムチェック・エリアを指定するテーブル
であり、サムチェックするエリアの先頭アドレスと最終
アドレスを格納する。
ブル12.23の内容を示す。上記テーブル12.23
は、それぞれサムチェック・エリアを指定するテーブル
であり、サムチェックするエリアの先頭アドレスと最終
アドレスを格納する。
先頭アドレス(Al〜人N)と最終アドレスCBl〜B
N)を1組として、複数組格納し、複数箇所のエリア(
81−8N) 、例えばプロセッサにより書き替えるこ
とができないサムチェック範囲指示テーブル12.23
、グローバル−コントロール−プログラム13、ローカ
ル・コントレール9プpグラム21、監視プログラム1
4等のエリアを指定する。
N)を1組として、複数組格納し、複数箇所のエリア(
81−8N) 、例えばプロセッサにより書き替えるこ
とができないサムチェック範囲指示テーブル12.23
、グローバル−コントロール−プログラム13、ローカ
ル・コントレール9プpグラム21、監視プログラム1
4等のエリアを指定する。
第2図、第3図において、グ四−バル・プロセッサ7は
1スケジユーリング(1周期)毎に動作するローカル監
視プログラム14によって、サムチェック範囲指定テー
プ/I/12で決められたエリアのサムチェックの実行
およびローカルメモリ2の監視を行う。サムチェックの
結果、エリアが破壊されていること(すなわち、サムチ
ェックエラー)を検出すれば、ローカルメモリ2内のバ
ッファ・テーブル・エリア22に設けであるローカル・
プロセッサ8とのインターフェース用エリアに暴走検出
情報をセットし、グローバル・プロセッサ7は停止する
。またローカル・プロセッサ8は、1スケジユーリング
毎に、サムチェック範囲指定テーブル23で決められた
p−カルメモリ2上のエリアのサムチェックを実行する
。サムチェックの結果、エリアが破壊されていること(
すなわち、サムチェックエラー)を検出すれば、ローカ
ルメモリ2内のバッファ・テーブル・エリア22に設け
であるグルーパル・プ奮セッサ7とのインターフェイス
用エリアに暴走検出情報をセットし、ローカル・プロセ
ッサ8は停止する。このように、第2図の実施例では、
(1)システムプログラム作成時のリンクおよびpチー
9日ンのミス、(1)プログラムの不良などによるエリ
ア破壊のため忙起こるプログラムの異常処理および暴走
を検出することができる。
1スケジユーリング(1周期)毎に動作するローカル監
視プログラム14によって、サムチェック範囲指定テー
プ/I/12で決められたエリアのサムチェックの実行
およびローカルメモリ2の監視を行う。サムチェックの
結果、エリアが破壊されていること(すなわち、サムチ
ェックエラー)を検出すれば、ローカルメモリ2内のバ
ッファ・テーブル・エリア22に設けであるローカル・
プロセッサ8とのインターフェース用エリアに暴走検出
情報をセットし、グローバル・プロセッサ7は停止する
。またローカル・プロセッサ8は、1スケジユーリング
毎に、サムチェック範囲指定テーブル23で決められた
p−カルメモリ2上のエリアのサムチェックを実行する
。サムチェックの結果、エリアが破壊されていること(
すなわち、サムチェックエラー)を検出すれば、ローカ
ルメモリ2内のバッファ・テーブル・エリア22に設け
であるグルーパル・プ奮セッサ7とのインターフェイス
用エリアに暴走検出情報をセットし、ローカル・プロセ
ッサ8は停止する。このように、第2図の実施例では、
(1)システムプログラム作成時のリンクおよびpチー
9日ンのミス、(1)プログラムの不良などによるエリ
ア破壊のため忙起こるプログラムの異常処理および暴走
を検出することができる。
なお、第2図の実施例では、p−カル・プロセッサ8は
メモリの一部、つまり四−カル・メモリ2のみをリード
/ライトできる構成釦なっているが、田−カル・メモリ
制御回路5のスイッチ構成ヲ変更することKより、ロー
カル・プロセッサ8からメモリ全部、つまりグローバル
・メモリlもリード/ライトできるように変更できる。
メモリの一部、つまり四−カル・メモリ2のみをリード
/ライトできる構成釦なっているが、田−カル・メモリ
制御回路5のスイッチ構成ヲ変更することKより、ロー
カル・プロセッサ8からメモリ全部、つまりグローバル
・メモリlもリード/ライトできるように変更できる。
また、第2図では、グ四−バル・メモリlと胃−カル・
メモリ2とに分離されているが、共有メモリとしてlW
i所Kv置装ることも可能であり、さら九サムチェック
範囲指定テーブル12.23は2箇所に分離して格納せ
ずに、1wJ所Kまとめて格納することも勿論可能であ
る。
メモリ2とに分離されているが、共有メモリとしてlW
i所Kv置装ることも可能であり、さら九サムチェック
範囲指定テーブル12.23は2箇所に分離して格納せ
ずに、1wJ所Kまとめて格納することも勿論可能であ
る。
以上説明したように1本発明によれば、各プロセッサが
サムチェック範囲指定テーブルで指定されたエリア内の
サムチェックを行うので、特別なハードウェア回路を設
ける必要がなく、簡単かつ安価にプ四グラム暴走を検出
することができる。
サムチェック範囲指定テーブルで指定されたエリア内の
サムチェックを行うので、特別なハードウェア回路を設
ける必要がなく、簡単かつ安価にプ四グラム暴走を検出
することができる。
第1図は従来のプ四セッサ暴走検出方法を示すプリンク
図、第2図は、本発明の一実施例を示すマルチプレセッ
サ・システムのブロック図、第3図はローカル・プロセ
ッサおよびグローバル・プロセッサの暴走を検出するた
めのグローバルメモリ1.2内に設けたサムチェック範
囲指定テーブルのメモリ割付図である。 1.2ニゲ四〜パル・メモリ (メイン・メモリとロー
カルメモリ)、3.4:バスライン(メイン・メモリ用
とり一カルメモリ用)1.5:ローカル・メモリ制御回
路、6:りリンク・パルス・ジェネレータ(CPG)、
7:グローバル・プロセッサ、8:ローカル・プロセッ
サ、12.23 :サムチェック範囲指定テーブル。
図、第2図は、本発明の一実施例を示すマルチプレセッ
サ・システムのブロック図、第3図はローカル・プロセ
ッサおよびグローバル・プロセッサの暴走を検出するた
めのグローバルメモリ1.2内に設けたサムチェック範
囲指定テーブルのメモリ割付図である。 1.2ニゲ四〜パル・メモリ (メイン・メモリとロー
カルメモリ)、3.4:バスライン(メイン・メモリ用
とり一カルメモリ用)1.5:ローカル・メモリ制御回
路、6:りリンク・パルス・ジェネレータ(CPG)、
7:グローバル・プロセッサ、8:ローカル・プロセッ
サ、12.23 :サムチェック範囲指定テーブル。
Claims (1)
- (ト)共有メモリを介して複数個のプロセッサが接続さ
れたマルチプロセッサ・システムにおいて、各プロセッ
サがリードできるメモリ・エリア内に1各プ四セツサが
サムチェックするエリアの先頭アドレスと最終アドレス
を格納したサムチェック範囲指定テーブルを設け、各プ
ロセッサは該指定テーブルで指定された互いに異なるプ
ロセッサのプログラム等が格納されているメモリ・エリ
アをサムチェックして、データの破壊を検出することを
特徴とするプロセッサ暴走検出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59044024A JPS60189542A (ja) | 1984-03-09 | 1984-03-09 | プロセツサ暴走検出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59044024A JPS60189542A (ja) | 1984-03-09 | 1984-03-09 | プロセツサ暴走検出方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60189542A true JPS60189542A (ja) | 1985-09-27 |
Family
ID=12680086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59044024A Pending JPS60189542A (ja) | 1984-03-09 | 1984-03-09 | プロセツサ暴走検出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60189542A (ja) |
-
1984
- 1984-03-09 JP JP59044024A patent/JPS60189542A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5758113A (en) | Refresh control for dynamic memory in multiple processor system | |
US5890003A (en) | Interrupts between asynchronously operating CPUs in fault tolerant computer system | |
US5317726A (en) | Multiple-processor computer system with asynchronous execution of identical code streams | |
US5384906A (en) | Method and apparatus for synchronizing a plurality of processors | |
JPS60189542A (ja) | プロセツサ暴走検出方式 | |
JP2845616B2 (ja) | マルチプロセッサシステム | |
JPH03149629A (ja) | メモリ試験方式 | |
JPH0754947B2 (ja) | 予備系監視方式 | |
JPH0120465B2 (ja) | ||
JPS59221755A (ja) | プロセツサ暴走検出方式 | |
JP2550708B2 (ja) | デバッグ方式 | |
JPS6155748A (ja) | 電子計算機システム | |
JPH0149975B2 (ja) | ||
JP2558902B2 (ja) | 半導体集積回路装置 | |
JPS63255743A (ja) | マルチプロセツサ監視方式 | |
JPH0341528A (ja) | 計算機における診断装置 | |
JPS62212865A (ja) | マルチプロセツサ制御方式 | |
JPH03252831A (ja) | Dma転送によるras情報収集方法 | |
JPS63304333A (ja) | 情報処理装置 | |
JPH02216576A (ja) | マルチプロセッサ制御方式 | |
JPH0784933A (ja) | 入出力制御ボード | |
JPS61264445A (ja) | 二重化デ−タ取込み方式 | |
JPH02297225A (ja) | マイクロプロセッサ | |
JPH04222031A (ja) | 障害部位切り分け方式 | |
JPS63192141A (ja) | マルチプロセサシステムの障害情報ログアウト方式 |