JP2943926B2 - Error recovery control device - Google Patents

Error recovery control device

Info

Publication number
JP2943926B2
JP2943926B2 JP63119748A JP11974888A JP2943926B2 JP 2943926 B2 JP2943926 B2 JP 2943926B2 JP 63119748 A JP63119748 A JP 63119748A JP 11974888 A JP11974888 A JP 11974888A JP 2943926 B2 JP2943926 B2 JP 2943926B2
Authority
JP
Japan
Prior art keywords
main storage
latch
latches
busy
input port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63119748A
Other languages
Japanese (ja)
Other versions
JPH01288945A (en
Inventor
信男 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63119748A priority Critical patent/JP2943926B2/en
Publication of JPH01288945A publication Critical patent/JPH01288945A/en
Application granted granted Critical
Publication of JP2943926B2 publication Critical patent/JP2943926B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】 [概要] 端末装置から複数個の主記憶装置へのアクセスを制御
する主記憶制御装置のエラー回復装置に関し、 主記憶装置へのアクセス時においてチェック停止、又
はハング状態を回避して主記憶装置へのアクセスを可能
にすることを目的とし、 複数個の主記憶装置と複数個の端末装置とが2個の主
記憶制御装置を介してクロスバー接続されたシステムに
おいて、主記憶制御装置内に前記主記憶装置のバンクの
総数に対応するバンクのビジー状態を記憶するラッチ
と、入力部に各端末装置からのリクエスト信号を受ける
ローカル入力ポートと、相手主記憶制御装置からのリク
エスト信号を入力するリモート入力ポートと、これら一
対のラッチの対応するビットが一致しているかどうかを
比較する比較回路とを具備し、各端末装置からのリクエ
ストによるビジー状態を前記ラッチに全く同じ値が格納
されるように構成しておき、前記比較回路出力により一
対のラッチの対応するビットが一致しなくなる同期くず
れが生じたことを検出したら、互いにラッチの全ての内
容をリセットするように構成する。
DETAILED DESCRIPTION OF THE INVENTION [Summary] The present invention relates to an error recovery device of a main storage control device that controls access to a plurality of main storage devices from a terminal device. In a system in which a plurality of main storage devices and a plurality of terminal devices are cross-bar-connected via two main storage control devices, with a view to avoiding and enabling access to the main storage device, A latch for storing a busy state of the bank corresponding to the total number of banks of the main storage device in the main storage control device, a local input port for receiving a request signal from each terminal device at an input portion, and a counterpart main storage control device. And a comparison circuit for comparing whether corresponding bits of the pair of latches match each other. The busy state due to the request from the terminal device is configured so that the same value is stored in the latch, and the output of the comparison circuit detects the occurrence of synchronization loss in which the corresponding bits of the pair of latches do not match. Then, all the contents of the latch are reset to each other.

[産業上の利用分野] 本発明は、端末装置から複数個の主記憶装置へのアク
セスを制御する主記憶制御装置のエラー回復装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an error recovery device of a main storage control device that controls access from a terminal device to a plurality of main storage devices.

[従来の技術] 第3図は、従来装置の構成例を示すブロック図であ
る。複数個の主記憶装置(MSU)1と、複数個の端末装
置2とが2個の主記憶制御装置3を介してクロスバー接
続されている。主記憶制御装置3と主記憶装置1間は出
力ポート3bで接続され、主記憶制御装置3と端末装置2
は入力ポート3cでそれぞれ接続されている。入力ポート
3cは、ローカル用とリモート用にそれぞれ分かれ、一方
のローカルポートと他方のリモートポートとがそれぞれ
互いに接続されている。
[Prior Art] FIG. 3 is a block diagram showing a configuration example of a conventional device. A plurality of main storage units (MSUs) 1 and a plurality of terminal devices 2 are cross-bar-connected via two main storage control units 3. The main storage control device 3 and the main storage device 1 are connected by an output port 3b, and the main storage control device 3 and the terminal device 2
Are connected at the input port 3c. Input port
3c is divided into a local port and a remote port, and one local port and the other remote port are connected to each other.

端末装置2としては、CPUやベクトルプロセッサVU等
が用いられる。3aは、主記憶装置1のバンク総数に対応
した数だけのビジー状態を記憶するラッチであり、両方
の主記憶制御装置3にそれぞれ設けられている。
As the terminal device 2, a CPU, a vector processor VU, or the like is used. Reference numeral 3a denotes latches that store busy states corresponding to the total number of banks of the main storage device 1, and are provided in both main storage control devices 3, respectively.

第4図は、各主記憶装置の分割状態を示す図である。
1個の記憶装置が例えば128バンクより構成されてお
り、図の斜線領域が1個のバンクである。この記憶装置
へのアクセスは、このバンク単位でなされる。第3図に
示す例の場合、主記憶装置が4個あるので、バンク総数
は128×4の512個となる。従って、ラッチ3aのビット数
は512ビットとなり、アクセスされているバンクに対応
した番地のビットがビジー状態で1になる。各端末装置
2は、主記憶装置1をアクセスする場合、ビジーチェッ
ク(Busy Check)を行い、アクセスするバンクがビジー
状態(1が立っている状態)の場合には、アクセスが禁
止される。アクセスされたバンクは、書込み又は読出し
が終了したらリセットされ、0になる。0になったバン
クに対しては、端末装置2からのアクセスが可能とな
る。
FIG. 4 is a diagram showing a divided state of each main storage device.
One storage device is composed of, for example, 128 banks, and the hatched area in the figure is one bank. Access to this storage device is made on a bank-by-bank basis. In the example shown in FIG. 3, since there are four main storage devices, the total number of banks is 128 × 4 = 512. Therefore, the number of bits of the latch 3a is 512 bits, and the bit at the address corresponding to the bank being accessed becomes 1 in a busy state. Each terminal device 2 performs a busy check (Busy Check) when accessing the main storage device 1, and when the bank to be accessed is in a busy state (a state where 1 stands), the access is prohibited. The accessed bank is reset to 0 when writing or reading is completed. The bank that has become 0 can be accessed from the terminal device 2.

この種のマルチプロセッサシステムでは、例えばMCU0
側のCPU0からのリクエストがあったものとすると、その
リクエストはローカルの入力ポート3cに入ると共に、同
じ情報が相手側(MCU1)のリモート入力ポート3cに入
る。逆にMCU1側のCPU2からリクエストがあったものとす
ると、そのリクエストはローカルの入力ポート3cに入る
と共に、同じ情報が相手側(MCU0)のリモート入力ポー
ト3cに入る。そして、それぞれの入力ポートから入った
リクエスト情報により、ラッチ3aの対応する番地にビジ
ー状態を示す“1"が書込まれる。この結果、両方のラッ
チ3aには全く同じビジー状態を示すデータが書込まれる
ことになる。但し、実際の主記憶装置1へのアクセスは
ローカル入力ポート3cからのみによる。
In this type of multiprocessor system, for example, MCU0
If there is a request from the CPU 0 on the side, the request enters the local input port 3c, and the same information enters the remote input port 3c on the other side (MCU1). Conversely, if there is a request from the CPU 2 of the MCU 1, the request enters the local input port 3 c and the same information enters the remote input port 3 c of the partner (MCU 0). Then, "1" indicating a busy state is written into the corresponding address of the latch 3a according to the request information input from each input port. As a result, data indicating the same busy state is written to both latches 3a. However, the actual access to the main storage device 1 is performed only from the local input port 3c.

このようなマルチプロセッサシステムが用いられる理
由は、ベクトル処理装置の場合1サイクルに要求される
スループットが高いことや、端末装置から出るリクエス
トが複数個のバンクに対して行われること等があり、こ
れらの要求に対して速やかに応答する必要があるためで
ある。
The reason why such a multiprocessor system is used is that, in the case of a vector processing device, the throughput required in one cycle is high, and a request issued from a terminal device is made to a plurality of banks. This is because it is necessary to respond quickly to the request.

[発明が解決しようとする課題] 上述したようなシステムでは、各種記憶制御装置3内
のビジーラッチ3aの内容が全て一致しなくなった場合、
即ち同期くずれが発生した場合、いずれかの主記憶制御
装置にエラーが発生したことになるが、そのどちらがエ
ラーを発生したのかチェックする手段がなく、従ってこ
の同期くずれを回復する手段がなく、チェック停止状態
で終了する場合が多い。また、従来のこの種のシステム
では、リクエストがある一定時間待たされた場合、即ち
ハング状態が発生した場合の回復処理が必要となり、こ
のための回復手段が設けられている。
[Problems to be Solved by the Invention] In the system as described above, if all the contents of the busy latches 3a in the various storage control devices 3 do not match,
That is, when a synchronization loss occurs, an error has occurred in one of the main storage controllers, but there is no means for checking which of the main storage devices has caused the error. It often ends in a stopped state. Further, in this type of conventional system, a recovery process is required when a request is waited for a certain period of time, that is, when a hung state occurs, and a recovery means for this is provided.

本発明はこのような課題に鑑みてなされたものであっ
て、チェック停止、又はハング状態を回避して信頼度を
向上させることができるエラー回復制御装置を提供する
ことを目的としている。
The present invention has been made in view of such a problem, and an object of the present invention is to provide an error recovery control device that can improve reliability by avoiding a check stop or a hang state.

[課題を解決するための手段] 第1図は本発明の原理ブロック図である。第3図と同
一のものは同一の符号を付して示す。但し入力ポートは
ローカル用を3c,リモート用を3c′とする。図におい
て、3dは2個のラッチ3aの対応する番地のビットデータ
の一致、不一致を検出する比較回路、3eは両方の比較回
路3dの出力を受けるオアゲートである。これらオアゲー
ト3eの出力はそれぞれのラッチ3aに全ビジーリセット信
号として与えられている。なお、図では主記憶装置1と
してMSU0〜MSU3までの4個の場合を示したが、本発明は
これに限るものではなく任意の数であってもよい。CPU
等の端末装置2についても同様である。
[Means for Solving the Problems] FIG. 1 is a principle block diagram of the present invention. The same components as those in FIG. 3 are denoted by the same reference numerals. However, the input port is 3c for the local port and 3c 'for the remote port. In the figure, reference numeral 3d denotes a comparison circuit for detecting the coincidence or non-coincidence of the bit data at the corresponding addresses of the two latches 3a, and 3e denotes an OR gate receiving the outputs of both the comparison circuits 3d. The outputs of these OR gates 3e are supplied to the respective latches 3a as all-busy reset signals. Although four main storage devices MSU0 to MSU3 are shown in the figure, the present invention is not limited to this, and any number may be used. CPU
And the like for the terminal device 2.

[作用] 2つの主記憶制御装置3内のビジーラッチ3aの対応す
る番地のデータはビット毎に比較回路3dで比較されてお
り、もし、チェック停止,又はハング状態が発生する前
状態になると、ラッチ3aの対応する番地のビジーデータ
に不一致が発生する。これら不一致状態が1組でも発生
すると、比較回路3dの少なくとも1つが“1"になる。少
なくとも1つが“1"になると、その出力は相手方のオア
回路にも入っているから、双方のラッチ3aの全てのビジ
ー状態が“0"にリセットされる。この結果、主記憶制御
装置3は、マインチェック割り込み等によりエラー処理
ルーチンに入る。このようにして、本発明によればチェ
ック停止、又はハング状態を回避して信頼度を向上させ
ることができるエラー回復制御装置を提供することがで
きる。
[Operation] The data at the corresponding addresses of the busy latches 3a in the two main memory controllers 3 are compared bit by bit by the comparison circuit 3d. If the check stops or the state before the hang state occurs, the latch A mismatch occurs in the busy data at the corresponding address of 3a. If any one of these mismatch states occurs, at least one of the comparison circuits 3d becomes "1". When at least one becomes "1", its output is also in the other OR circuit, so that all the busy states of both latches 3a are reset to "0". As a result, the main memory control device 3 enters an error processing routine due to a main check interrupt or the like. Thus, according to the present invention, it is possible to provide an error recovery control device that can improve the reliability by avoiding a check stop or a hang state.

[実施例] 以下、図面を参照して本発明の実施例を詳細に説明す
る。
[Example] Hereinafter, an example of the present invention will be described in detail with reference to the drawings.

第2図は本発明の一実施例を示す構成ブロック図であ
る。第1図と同一のものは、同一の符号を付して示す。
図において、3gはラッチ3aの3種類の端末装置のビジー
信号の内そのいずれを優先して出力するかを決定する優
先回路、3hは優先回路3gから出力されるMSU GO信号を受
ける度毎に、ラッチ3a内の対応する番地をリセットする
リセットパイプラインである。比較回路3dは、各優先回
路3gから出力されるMSU GO信号(自己のものと相手方の
ものを含む。ビジー信号の一種)を受けて、これら両信
号の一致,不一致を検出する。
FIG. 2 is a configuration block diagram showing one embodiment of the present invention. 1 are denoted by the same reference numerals.
In the figure, 3g is a priority circuit that determines which of the three types of busy signals of the terminal device of the latch 3a is to be output with priority, and 3h is each time the MSU GO signal output from the priority circuit 3g is received. , A reset pipeline for resetting the corresponding address in the latch 3a. The comparison circuit 3d receives the MSU GO signal (including its own and the other party's signal, a kind of busy signal) output from each priority circuit 3g, and detects a match or mismatch between these two signals.

第1図に示す原理図と、第2図の実施例との相違点
は、第1図の原理図がラッチの各ビット毎に比較してい
たのに対し、実施例では各端末装置毎に出力されるビジ
ー信号同志を比較している点である。ラッチの各ビット
毎に比較すると回路構成が複雑になることから、端末装
置毎に出力されるビジー信号同志を比較しているもので
ある。このような比較でも、実用上は十分である。優先
回路3gから出力されるビジー信号(MSU GO信号)はMSU
リクエスト信号として各主記憶装置1にクロスバー形式
で接続されている。このように構成された装置の実施例
を説明すれば、以下のとおりである。
The difference between the principle diagram shown in FIG. 1 and the embodiment of FIG. 2 is that the principle diagram of FIG. The point is that the output busy signals are compared with each other. Since the circuit configuration becomes complicated when the comparison is made for each bit of the latch, the busy signals output for each terminal device are compared. Such a comparison is practically sufficient. The busy signal (MSU GO signal) output from the priority circuit 3g is MSU
It is connected to each main storage device 1 in the form of a crossbar as a request signal. An embodiment of the apparatus configured as described above will be described below.

例えばMCU0のCPU0からリクエストが発生したものとす
ると、そのリクエスト信号は対応するローカル用入力ポ
ート3cに入る。同時に相手側主記憶装置MSU1のリモート
用入力ポート3c′にも入る。これらリクエスト状態は、
それぞれの対応ラッチ3aの対応する番地をビジー状態
(“1"が立った状態)にする。MSU0側で他にもリクエス
トがあったものとすると、優先回路3gは、その内の最優
先のビジー信号をセレクトして出力する。この出力(MS
U GO)は、出力ポート3bを介して、対応する主記憶装置
(MSU)をビジー状態にする。それと同時に、優先回路3
gの出力は、リセットパイプライン3hを経て、対応する
ラッチ3aの内容をリセットして“0"にする。この結果、
他の端末装置は当該バンクをアクセスすることが可能と
なる。このリセット操作は、相手方主記憶装置3でも行
われる。
For example, if a request is generated from CPU0 of MCU0, the request signal enters corresponding local input port 3c. At the same time, it enters the remote input port 3c 'of the other main storage device MSU1. These request states are:
The corresponding address of each corresponding latch 3a is set to a busy state (a state where "1" is set). Assuming that there is another request on the MSU0 side, the priority circuit 3g selects and outputs the highest priority busy signal. This output (MS
UGO) makes the corresponding main storage unit (MSU) busy via the output port 3b. At the same time, priority circuit 3
The output of g is reset to “0” by resetting the contents of the corresponding latch 3a via the reset pipeline 3h. As a result,
Other terminal devices can access the bank. This reset operation is also performed in the other party's main storage device 3.

ここで、一対のラッチ3aの一部に不一致が発生したも
のとすると、システムダメージ扱いとし、全ての主記憶
制御装置3のラッチを全てリセットし、主記憶制御装置
3の残存リクエストを全て処理し終った後に、マシンチ
ェック割込みを起こしてエラー処理ルーチンに入る。従
って、本発明によれば、ビジーラッチ3aのデータに不一
致が起きたらチェック停止又はハング状態になる前にこ
れら状態の発生を回避して信頼度を上げることができ
る。
Here, if a mismatch occurs in a part of the pair of latches 3a, it is treated as system damage, all the latches of all the main memory control devices 3 are reset, and all the remaining requests of the main memory control device 3 are processed. After completion, a machine check interrupt is generated and an error processing routine is entered. Therefore, according to the present invention, if a mismatch occurs in the data of the busy latch 3a, the occurrence of these states can be avoided before the check is stopped or a hang state is reached, and the reliability can be increased.

[発明の効果] 以上詳細に説明したように、本発明によれば一対の主
記憶制御装置内に設けたラッチの内容が常に同一データ
となるように構成しておき、両者の対応する番地の内容
に不一致が生じたら同期くずれと判断して所定のアラー
ム処理を施すことによりチェック停止、又はハング状態
を回避して信頼度を向上させることができるエラー回復
制御装置を提供することができる。
[Effects of the Invention] As described in detail above, according to the present invention, the contents of the latches provided in the pair of main memory control devices are always configured to be the same data, and the addresses of the corresponding addresses of the two are controlled. It is possible to provide an error recovery control device that can improve the reliability by avoiding a check stop or a hang state by performing a predetermined alarm process by determining that the synchronization is lost when the contents do not match.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の原理ブロック図、 第2図は本発明の一実施例を示す構成ブロック図、 第3図は従来システムの構成例を示す図、 第4図は主記憶装置の分割状態を示す図である。 第1図において、 1は主記憶装置、 2は端末装置、 3は主記憶制御装置、 3aはラッチ、 3bは出力ポート、 3cは入力ポート(ローカル)、 3c′は入力ポート(リモート)、 3dは比較回路、 3eはオアゲートである。 1 is a block diagram showing the principle of the present invention, FIG. 2 is a block diagram showing an embodiment of the present invention, FIG. 3 is a diagram showing a configuration example of a conventional system, and FIG. FIG. In FIG. 1, 1 is a main storage device, 2 is a terminal device, 3 is a main storage control device, 3a is a latch, 3b is an output port, 3c is an input port (local), 3c 'is an input port (remote), and 3d. Is a comparison circuit, and 3e is an OR gate.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】複数個の主記憶装置(1)と複数個の端末
装置(2)とが2個の主記憶制御装置(3)を介してク
ロスバー接続されたシステムにおいて、 主記憶制御装置(3)内に前記主記憶装置(1)のバン
クの総数に対応するバンクのビジー状態を記憶するラッ
チ(3a)と、 入力部に各端末装置からのリクエスト信号を受けるロー
カル入力ポート(3c)と、 相手主記憶制御装置(3)からのリクエスト信号を入力
するリモート入力ポート(3c′)と、 前記一対のラッチ(3a)の対応するビットが一致してい
るかどうかを比較する比較回路(3d)とを具備し、 各端末装置(2)からのリクエストによるビジー状態を
前記ラッチ(3a)に全く同じ値が格納されるように構成
しておき、 前記比較回路(3d)出力により一対のラッチの対応する
ビットが一致しなくなる同期くずれが生じたことを検出
したら、互いにラッチの全ての内容をリセットするよう
に構成したエラー回復制御装置。
1. A system in which a plurality of main storage devices (1) and a plurality of terminal devices (2) are cross-bar-connected via two main storage control devices (3). (3) a latch (3a) for storing a busy state of a bank corresponding to the total number of banks of the main storage device (1), and a local input port (3c) for receiving a request signal from each terminal device at an input section. A remote input port (3c ') for inputting a request signal from the other party's main memory control device (3); and a comparison circuit (3d) for comparing whether corresponding bits of the pair of latches (3a) match. ), And the busy state due to the request from each terminal device (2) is configured so that the same value is stored in the latch (3a), and a pair of latches are output by the output of the comparison circuit (3d). Corresponding bit of There upon detecting that the sync collapse no longer match occurs, the error recovery control unit configured to reset all the contents of the latch together.
JP63119748A 1988-05-16 1988-05-16 Error recovery control device Expired - Fee Related JP2943926B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63119748A JP2943926B2 (en) 1988-05-16 1988-05-16 Error recovery control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63119748A JP2943926B2 (en) 1988-05-16 1988-05-16 Error recovery control device

Publications (2)

Publication Number Publication Date
JPH01288945A JPH01288945A (en) 1989-11-21
JP2943926B2 true JP2943926B2 (en) 1999-08-30

Family

ID=14769173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63119748A Expired - Fee Related JP2943926B2 (en) 1988-05-16 1988-05-16 Error recovery control device

Country Status (1)

Country Link
JP (1) JP2943926B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0266657A (en) * 1988-08-31 1990-03-06 Nec Corp Memory selection controller

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62120566A (en) * 1985-11-20 1987-06-01 Fujitsu Ltd Access control system for high-speed main storage in multi-processor system

Also Published As

Publication number Publication date
JPH01288945A (en) 1989-11-21

Similar Documents

Publication Publication Date Title
US4308580A (en) Data multiprocessing system having protection against lockout of shared data
JP2943926B2 (en) Error recovery control device
JPH0316655B2 (en)
JPS6049952B2 (en) Busy control method of memory control device
JPS61134856A (en) Ram check circuit
JPS58169264A (en) Memory access system
JP2929631B2 (en) Communication device between processors
JPS6043541B2 (en) data processing equipment
JPS62249250A (en) Memory device
JPH04257042A (en) Diagnostic system for memory
JPS58127254A (en) Data inspecting system of controller
JPH0367346A (en) Address control circuit
JPS6113266B2 (en)
JPS58219646A (en) Pipeline control system
JPH0421040A (en) Illegal access detecting device
JPH02297650A (en) Receiver
JPH0414149A (en) Test device for parity check circuit
JPS6118061A (en) Shared memory control system
JPH0540583A (en) Information processing system
JPS61294556A (en) Detection system for program malfunction
JPH02113648A (en) Error information storing device
JPH02199562A (en) Duplicated memory copy system
JPH04369030A (en) Fault detecting system
JPS62249251A (en) Memory device
JPH03231351A (en) Inter-processor communication receiving circuit

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees