JP3137970B2 - Shared storage control system - Google Patents

Shared storage control system

Info

Publication number
JP3137970B2
JP3137970B2 JP02198767A JP19876790A JP3137970B2 JP 3137970 B2 JP3137970 B2 JP 3137970B2 JP 02198767 A JP02198767 A JP 02198767A JP 19876790 A JP19876790 A JP 19876790A JP 3137970 B2 JP3137970 B2 JP 3137970B2
Authority
JP
Japan
Prior art keywords
access
source device
access source
shared memory
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02198767A
Other languages
Japanese (ja)
Other versions
JPH0484258A (en
Inventor
暢彦 栗林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP02198767A priority Critical patent/JP3137970B2/en
Publication of JPH0484258A publication Critical patent/JPH0484258A/en
Application granted granted Critical
Publication of JP3137970B2 publication Critical patent/JP3137970B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】 [概要] アクセス元となる複数のクラスタと共用メモリ部の間
で共用メモリ制御部を介してパケット転送を行う共用記
憶制御方式に関し、 通信中にクラスタ側での回復不能なエラー発生で通信
が遮断した時のデットロックと他のクラスタでのオーバ
ーヘッドを防止することを目的とし、 クラスタ側のエラー発生により通信状態が遮断された
際に、共用メモリ制御部内のクラスタ専用回路及び共通
回路の初期化、ロックレジスタのロック解除、更には共
用メモリ部からのレシーバ回路のアクセスタイム以上に
亘るデータチェックとバリッドの抑止を行うように構成
する。
DETAILED DESCRIPTION OF THE INVENTION [Overview] Regarding a shared storage control method in which packets are transferred between a plurality of clusters serving as access sources and a shared memory unit via a shared memory control unit, the cluster side cannot recover during communication The purpose of this is to prevent deadlock when communication is interrupted due to a serious error and to prevent overhead in other clusters. When communication is interrupted due to an error on the cluster side, the dedicated circuit in the shared memory control unit In addition, the configuration is such that initialization of the common circuit, unlocking of the lock register, and data checking and inhibition of validity over the access time of the receiver circuit from the shared memory unit are performed.

[産業上の利用分野] 本発明は、パケット転送によりアクセス元装置となる
複数のクラスタの共用メモリ部との間のデータ転送を共
用メモリ制御部を介して行う共用記憶制御システムに関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a shared storage control system for performing data transfer between a shared memory unit of a plurality of clusters serving as access devices by packet transfer via a shared memory control unit.

クラスタは1又は複数のCPU、CPUとチャネル装置(C
H)及び主記憶(MSU)等を接続してアクセスする主記憶
制御ユニット(MCU)により1つのシステムを構成して
おり、このようなクラスタでなる1又は複数のシステム
をシステムストレージユニット(SSU)としての共用メ
モリ部に接続し、クラスタの主記憶に比べて大容量の共
用記憶部を用いた巨大プログラムの実行、複数のクラス
タにおいてマルチタスクでプログラムを実行させること
による高速実行、更に共用記憶とクラスタを2重化構成
とすることでシステムの二重化等を行っている。
The cluster consists of one or more CPUs, CPU and channel devices (C
H) and a main storage control unit (MCU) that connects and accesses a main storage (MSU) and the like, and constitutes one system. One or a plurality of such clustered systems are connected to a system storage unit (SSU). Execution of a huge program using a shared storage unit having a large capacity compared to the main storage of the cluster, high-speed execution by executing a program with multiple tasks in a plurality of clusters, and The system is duplicated by making the cluster redundant.

クラスタから共用メモリに対するアクセス及びデータ
転送はパケット転送により行っている。例えばクラスタ
からリードアクセスを受けるとクラスタとの間に通信状
態を確立し、共用メモリ部のリードアクセスで得られた
データのクラスタへのパケット転送が終了するまで通信
状態を維持する。
Access and data transfer from the cluster to the shared memory are performed by packet transfer. For example, when a read access is received from a cluster, a communication state is established with the cluster, and the communication state is maintained until packet transfer of data obtained by read access of the shared memory unit to the cluster is completed.

しかし、通信中にクラスタ側で回復不能なエラーが発
生した場合、最悪の場合は共用メモリ制御部の機能が完
全に停止するデットロックを起こし、またデッドロック
に至らなくともエラーを発生したクラスタのアクセス制
御状態から離脱する処理に時間がかかり、他のクラスタ
からのアクセスにオーバーヘッドを生ずる。従って、ク
ラスタエラー発生時の通信遮断によるデットロックを回
避し、且つ他のクラスタからのアクセスに対する影響を
最小限に抑えることが望まれる。
However, if an unrecoverable error occurs on the cluster side during communication, in the worst case, a deadlock occurs in which the function of the shared memory control unit is completely stopped. It takes time to leave the access control state, and this causes overhead for access from other clusters. Therefore, it is desirable to avoid deadlock due to communication interruption when a cluster error occurs, and to minimize the influence on access from other clusters.

[従来の技術] 従来、1つのシステムを構成するアクセス元装置とし
ての複数のクラスタ、共用メモリ制御部、及び共用メモ
リ部を備えた共用記憶制御方式にあっては、共用メモリ
部に対する各クラスタからのアクセスに対し共用メモリ
制御部のプライオリティ制御、ロックアドレスを使用し
たメモリ領域の占有制御、パイプライン制御によるメモ
リアクセス、共用メモリに対するアクセスデータのパケ
ット転送を行っている。
2. Description of the Related Art Conventionally, in a plurality of clusters as an access source device configuring one system, a shared memory control unit, and a shared storage control method including a shared memory unit, each cluster for the shared memory unit has Priority control of the shared memory control unit, occupation control of the memory area using the lock address, memory access by pipeline control, and packet transfer of access data to the shared memory are performed for the access of the shared memory.

[発明が解決しようとする課題] しかしながら、このような従来の共用記憶制御方式に
あっては、共用メモリ制御装置に接続されたクラスタ
が、メモリアクセスの通信中に回復不能なハードエラー
等を起こして通信を突然遮断する可能性がある。このよ
うにエラー発生で通信が遮断されると、共用メモリ制御
回路部内はエラー発生クラスタとの間でパケット転送を
可能とする各種制御パラメータの設定や回路動作状態に
あり、突然通信が遮断して正常なアクセスを継続できな
いため、エラー発生後に暴走して制御不能となるデット
ロックに陥ったり、初期状態への回復に手間取って他の
クラスタからのアクセスがオーバーヘッドとなってしま
う問題があった。
[Problems to be Solved by the Invention] However, in such a conventional shared storage control method, the cluster connected to the shared memory control device causes an unrecoverable hard error or the like during the memory access communication. Communication may be suddenly interrupted. When the communication is interrupted due to the occurrence of an error, the shared memory control circuit unit is in the setting of various control parameters for enabling packet transfer with the cluster in which the error has occurred and in a circuit operating state. Since normal access cannot be continued, there is a problem that a runaway occurs and an out-of-control deadlock occurs after an error occurs, and that access from another cluster becomes an overhead because it takes time to recover to an initial state.

本発明は、このような従来の問題点に鑑みてなされた
もので、クラスタ側での回復不能なエラー発生による通
信遮断が起きても共用記憶制御のデットロックと他のク
ラスタでのオーバーヘッド発生を防止する共用記憶制御
システムを提供することを目的とする。
The present invention has been made in view of such a conventional problem, and even if communication is interrupted due to the occurrence of an unrecoverable error on the cluster side, the deadlock of shared storage control and the occurrence of overhead in other clusters are avoided. It is an object of the present invention to provide a shared storage control system for preventing such a situation.

[課題を解決するための手段] 第1図は本発明の原理説明図である。[Means for Solving the Problems] FIG. 1 is an explanatory view of the principle of the present invention.

まず本発明は、アクセス元装置と共用メモリ部の間で
共用メモリ制御部の制御のもとにリード又はライトのア
クセスのためにパケット転送を行う共用記憶制御システ
ムに於いて、 前記共用メモリ制御部は、 前記アクセス元装置毎に設けられ、対応するアクセス
元装置から受信したアクセスデータを格納する複数の受
信バッファと、 前記受信バッファに続いて前記アクセス元装置毎に設
けられ、前記共有メモリ部にライトデータを出力すると
共に前記共用メモリ部を制御するアクセスパイプライン
にライト又はリードのアクセスコマンドを出力する複数
のムーバと、 前記アクセス元装置から同時に2以上の前記ムーバに
アクセスを受けた際に、予め定めた手順に従って特定の
ムーバの出力を許可するプライオリティ回路と、 前記アクセス元装置毎に設けられ、アクセス元装置に
転送する前記共用メモリ部からのリードデータを保持す
る送信バッファと、 前記アクセス元装置毎に設けられ、アクセス元装置か
らのアクセスデータを受信して対応する前記受信バッフ
ァに格納すると共に前記送信バッファのリードデータを
対応するアクセス元装置に送信する送受信回路と、 を有してなり、 前記アクセス元装置は、接続のためのオペレーション
アウト信号を送出する送受信回路を各アクセス元装置毎
に備え、 前記共用メモリ制御部の送受信回路は、前記アクセス
元装置の送受信回路からオペレーションアウト信号を受
信すると接続のためのオペレーションイン信号をオンし
て対応するアクセス元装置との通信状態を作り出し、 前記エラー処理手段は、前記共用メモリ制御部が任意
のアクセス元装置と通信中に該アクセス元装置側の回復
不能なエラー発生によりアクセス元装置の送受信回路か
ら発生していたオペレーションアウト信号が遮断される
ことに基づいて、対応する共用メモリ制御部側の送受信
回路から発生していたオペレーションイン信号が遮断さ
れることによって、前記共用メモリ制御部の内部にイン
タフェースクリア信号を発生して、通信遮断により生ず
るデッドロック及びオーバーヘッドを抑止するように回
復処理を行うエラー処理手段を備え、 前記エラー処理手段は、 前記インタフェースクリア信号に基づいてエラーが発
生したアクセス元装置の専用回路を初期化する第1初期
化手段と; 前記インタフェースクリア信号に基づいて各アクセス
元装置に共通の共通制御回路を初期化する第2初期化手
段と; 前記インタフェースクリア信号に基づいて前記共用メ
モリ部のロックアドレスを格納したロックレジスタのア
クセス元識別コードがエラー発生のアクセス元装置と一
致したときにのみ有効ビットをクリアしてロックを解除
させるクリア手段と: 前記インタフェースクリア信号に基づいて前記共用メ
モリ部からの信号を受信するレシーバ回路に対し共用メ
モリアクセスタイム以上の間、エラーを発生したアクセ
ス元装置のアクセスによりリードデータの出力を抑止す
る抑止手段と; を設け、 前記クリア手段は、 前記ロックレジスタに格納されたアクセス元IDを解読
するデコーダと; 該デコーダの解読出力とエラー発生時に有効となるア
クセス元装置に対応したインタフェースクリア信号との
論理積をアクセス元装置毎に検出する複数のANDゲート
と; 該複数のANDゲートのいずれかより得られた論理積出
力による前記ロックレジスタの有効ビットをオフするク
リアゲートと備え、 エラーの発生したアクセス元装置に対してエラー回復
処理を行うことを特徴とする。
First, the present invention provides a shared storage control system for performing packet transfer for read or write access between an access source device and a shared memory unit under the control of a shared memory control unit. A plurality of reception buffers provided for each access source device and storing access data received from a corresponding access source device, provided for each access source device following the reception buffer, and provided in the shared memory unit. A plurality of movers that output write data and output a write or read access command to an access pipeline that controls the shared memory unit, and when two or more movers are simultaneously accessed from the access source device, A priority circuit for permitting output of a specific mover according to a predetermined procedure; A transmission buffer provided for each access device and holding read data from the shared memory unit for transferring to the access source device; and a transmission buffer provided for each access source device for receiving and responding to access data from the access source device. A transmission / reception circuit for storing the read data in the transmission buffer to a corresponding access source device while storing the data in the reception buffer, and the access source device includes a transmission / reception circuit for transmitting an operation-out signal for connection. The transmission / reception circuit of the shared memory control unit is provided for each access source device, and upon receiving an operation-out signal from the transmission / reception circuit of the access source device, turns on an operation-in signal for connection and communicates with the corresponding access source device. A communication state is created, and the error processing means is configured such that the shared memory During communication with the access source device, the operation out signal generated from the transmission / reception circuit of the access source device is interrupted due to the occurrence of an unrecoverable error on the access source device side. When the operation-in signal generated from the transmission / reception circuit is cut off, an interface clear signal is generated inside the shared memory control unit, and recovery processing is performed so as to suppress deadlock and overhead caused by communication cut-off. An error processing unit, wherein the error processing unit initializes a dedicated circuit of an access source device in which an error has occurred based on the interface clear signal; and an access source based on the interface clear signal. Second initialization means for initializing a common control circuit common to the devices; Clearing means for clearing the valid bit and releasing the lock only when the access source identification code of the lock register storing the lock address of the shared memory unit matches the access source device in which the error has occurred based on the interface clear signal. Means for suppressing output of read data by an access of an access source device in which an error has occurred for a receiver circuit for receiving a signal from the shared memory unit based on the interface clear signal for a time equal to or longer than a shared memory access time; Wherein the clearing means comprises: a decoder for decoding an access source ID stored in the lock register; and a logical product of a decoded output of the decoder and an interface clear signal corresponding to the access source device which becomes valid when an error occurs. AND gates that detect And a clear gate for turning off a valid bit of the lock register by an AND output obtained from any of the plurality of AND gates, and performing an error recovery process on an access source device in which an error has occurred. And

ここで第2初期化手段26は共用制御回路24としてのプ
ライオリティ回路を初期化する。
Here, the second initialization means 26 initializes the priority circuit as the shared control circuit 24.

更に抑止手段は、 前記共用メモリ部を制御する前記アクセスパイプライ
ンの所定段数位置に格納されたアクセス元IDを解読して
エラー発生したアクセス元装置を識別するデコーダと; エラー発生時にインタフェースクリア信号により前記
共用メモリ部のアクセスタイム以上となる所定時間値の
プリセットを受けてスタートするアクセス元装置毎に設
けられた複数のタイマカウンタと、 前記デコーダの出力端子と前記複数のタイマカウンタ
の出力をアクセス元装置毎に入力し、アクセス元装置の
識別出力が得られた状態でタイマカウンタがプリセット
時間に到達するまでの間、前記共用メモリからの前記レ
シーバ回路へのリードデータの出力を抑止するゲート回
路と; を備えたことを特徴とする。
Further, the suppression means includes a decoder for decoding an access source ID stored at a predetermined number of stages of the access pipeline controlling the shared memory unit and identifying an access source device in which an error has occurred; A plurality of timer counters provided for each access source device which start upon receiving a preset of a predetermined time value which is equal to or longer than the access time of the shared memory unit; and an output terminal of the decoder and an output terminal of the plurality of timer counters. A gate circuit for inputting for each device and suppressing output of read data from the shared memory to the receiver circuit until the timer counter reaches a preset time in a state where the identification output of the access source device is obtained; Characterized by having;

[作用] このような構成を備えた本発明の共用記憶制御システ
ムによれば、アクセス元装置としてのクラスタ側で回復
不能なエラーが発生すると、共用メモリ制御部で通信手
段を検知してインタフェースクリア信号を生成し、エラ
ー発生クラスタの専用回路、例えば受信バッファやムー
バー等を初期化し、同時に共通制御回路としてのプライ
オリティ回路を初期化する。またエラー発生クラスタが
ロック付きアクセスにより共用メモリ部のアクセス領域
を占有するロック獲得状態にあったならば、ロックレジ
スタの有効ビットをクリアOFFしてロックを解除する。
更にエラー発生後に共用メモリ部から異常なリードデー
タがレシーバ回路に転送されてくるので、アクセスタイ
ム以上の所定時間はレシーバ回路のデータチェックを抑
止して不必要なエラー検知を解除する。
[Operation] According to the shared storage control system of the present invention having such a configuration, when an unrecoverable error occurs on the cluster side as the access source device, the shared memory control unit detects the communication means and clears the interface. A signal is generated, and a dedicated circuit of the cluster in which an error has occurred, such as a reception buffer and a mover, is initialized, and at the same time, a priority circuit as a common control circuit is initialized. If the cluster in which the error has occurred is in a lock acquisition state occupying the access area of the shared memory unit by the access with the lock, the valid bit of the lock register is cleared to OFF and the lock is released.
Further, since abnormal read data is transferred from the shared memory unit to the receiver circuit after the occurrence of the error, the data check of the receiver circuit is suppressed for a predetermined time longer than the access time, and unnecessary error detection is canceled.

その結果、クラスタ側でエラーが発生して通信遮断が
起きても、共用メモリ制御部はアクセスタイムをわずか
に越える時間を要するだけでエラー発生クラスタとの通
信が正常終了したと同じ状態にデットロックを起こすこ
となく回復させることができる。また他の正常なクラス
タから見ると、共用メモリ制御部は途中でクラスタがエ
ラーを起していても、エラーなしの場合と同じ程度の時
間で他のクラスタのアクセス受付けに移行するため、正
常なクラタスにオーバーヘッドを起こさせることもな
い。
As a result, even if an error occurs on the cluster side and communication is interrupted, the shared memory control unit requires a time slightly exceeding the access time, and deadlocks to the same state as when communication with the cluster where the error occurred ended normally. It can be recovered without causing a problem. From the viewpoint of other normal clusters, the shared memory control unit shifts to accepting access to other clusters in about the same time as when there is no error, even if the cluster has an error in the middle. There is no overhead for Kratus.

[実施例] 第2図は本発明の共用記憶制御システムが適用される
システムの全体構成図である。
Embodiment FIG. 2 is an overall configuration diagram of a system to which the shared storage control system of the present invention is applied.

第2図において、10−1,10−2,・・・,10−nはアク
セス元装置としてのクラスタ、12は共用メモリ制御部、
14は共用メモリ部である。クラスタ10−1〜10−nは送
受信回路200−1〜200−nを備え、この送受信回路200
−1〜200−nを共用メモリ部12の送受信回路300−1〜
300−nと接続し、クラスタ側からのアクセス(リード
またはライト)に対し共用メモリ制御部12による制御の
もとに共用メモリ14との間でパケット転送を行なってメ
モリアクセスを実行する。
2, 10-1, 10-2,..., 10-n are clusters as access source devices, 12 is a shared memory control unit,
14 is a shared memory unit. Each of the clusters 10-1 to 10-n includes transmission / reception circuits 200-1 to 200-n.
-1 to 200-n are the transmission / reception circuits 300-1 to 300-1 of the shared memory unit 12.
Connected to the shared memory 14 for access (read or write) from the cluster side under the control of the shared memory controller 12 to execute memory access.

第3図は第2図のクラスタの構成をクラスタ10−1を
代表して示したもので、1又は複数のCPU100−1〜100
−n、とチャネル装置(CH)102及び主記憶(MSU 10
4)等を接続してアクセスする主記憶制御ユニット(MC
U)106により1つのシステムを構成しており、このよう
なクラスタでなる1又は複数のシステムをシステムスト
レージユニット(SSU)を構成する共用メモリ部14に共
用メモリ制御部12を介して接続し、クラスタの主記憶に
比べて大容量の共用記憶部を用いた巨大プログラムの実
行、複数のクラスタにおいてマルチタスクでプログラム
を実行させることによる高速実行、更に共用記憶とクラ
スタを2重化構成とすることでシステムの二重化等を行
っている。
FIG. 3 shows the configuration of the cluster of FIG. 2 as a representative of the cluster 10-1, and includes one or more CPUs 100-1 to 100-100.
-N, the channel device (CH) 102 and the main memory (MSU 10
4) Main memory control unit (MC
U) 106 constitutes one system, and one or a plurality of such cluster systems are connected to a shared memory unit 14 constituting a system storage unit (SSU) via a shared memory control unit 12, Executing a huge program using a shared storage unit having a larger capacity than the main storage of the cluster, high-speed execution by executing the program with multiple tasks in a plurality of clusters, and a dual configuration of the shared storage and the cluster The system is being duplicated.

第4図は第2図における共用メモリ制御部12の実施例
構成図である。
FIG. 4 is a block diagram of an embodiment of the shared memory control unit 12 in FIG.

第4図において、クラスタ10−1〜10−nからの受信
部として、クラスタ毎に受信バッファ38−1〜38−n,ム
ーバー40−1〜40−nがクラスタ専用回路20として設け
られる。ムーバー40−1〜40−nに対しては共通制御回
路としてプライオリティ回路24が設けられ、同時に2以
上のクラスタよりアクセスを受けた際に、予め定めた手
順に従って特定のクラスタからのアクセスを許可する。
In FIG. 4, as receiving units from the clusters 10-1 to 10-n, reception buffers 38-1 to 38-n and movers 40-1 to 40-n are provided as the cluster dedicated circuit 20 for each cluster. A priority circuit 24 is provided as a common control circuit for the movers 40-1 to 40-n, and when two or more clusters are simultaneously accessed, access from a specific cluster is permitted according to a predetermined procedure. .

プライオリティ回路24に対してはロックレジスタ30が
設けられ、共用メモリ部14のロック制御を可能としてい
る。このロックレジスタ30は共用メモリ部14がロック状
態にあることを示す有効ビットVと、共用メモリ部14の
ロックアドレス、具体的にはロックスタートアドレスの
格納部と、現在ロックを獲得しているクラスタを示すク
ラスタIDが格納されている。ロックレジスタ30により共
用メモリ部14のロックが獲得された状態で他のクラスタ
から通常のアクセス、即ちロック付きでないアクセスが
行なわれてアクセスアドレスがロックアドレスに重複す
ることがロックレジスタ30のロックアドレスから比較判
断されると、プライオリティ回路24はそのアクセスをロ
ック解除まで待たせるようになる。
A lock register 30 is provided for the priority circuit 24, and lock control of the shared memory unit 14 is enabled. The lock register 30 includes a valid bit V indicating that the shared memory unit 14 is in a locked state, a lock address of the shared memory unit 14, specifically, a storage unit of a lock start address, and a cluster that currently acquires a lock. Is stored. While the lock of the shared memory unit 14 has been acquired by the lock register 30, normal access from another cluster, that is, access without lock is performed, and the access address overlaps with the lock address. When the comparison is determined, the priority circuit 24 waits until the access is released.

ムーバー40−1〜40−nからのデータ出力は転送イン
タフェース42を介して共用メモリ部14にライトデータと
して与えられる。また、ムーバー40−1〜40−nからの
アクセス情報、即ちリード又はライトのアクセスコマン
ド(スタートアドレス、レングス、ディスクタンス等)
は転送インタフェース44を介してアクセスパイプライン
46に与えられ、アクセスライプパイン46によるパイプラ
イン制御で共用メモリ部14のメモリアクセス(リード又
はライト)及び共用メモリ制御部12側の転送インタフェ
ース45に対するリードデータの転送受信制御(リードア
クセス時)が行なわれる。転送インタフェース45に続い
てはクラスタ毎に送信バッファ(リードバッファ)48−
1〜48−n及び各クラスタへリードデータをパケット転
送するための転送インタフェース50−1〜50−nが設け
られる。
Data outputs from the movers 40-1 to 40-n are supplied to the shared memory unit 14 as write data via the transfer interface 42. Also, access information from the movers 40-1 to 40-n, that is, a read or write access command (start address, length, discance, etc.)
Is an access pipeline via the transfer interface 44
The memory access (read or write) of the shared memory unit 14 and the transfer reception control (at the time of read access) of the read data to the transfer interface 45 of the shared memory control unit 12 are performed by pipeline control by the access loop pine 46. Done. Following the transfer interface 45, a transmission buffer (read buffer) 48-
Transfer interfaces 50-1 to 50-n for transferring read data to each cluster as packets are provided.

このような共用メモリ制御部12の構成に対し本発明に
あっては、特定のクラスタとの通信中にクラスタ側でエ
ラーが発生して通信遮断が起きた際に、デッドロックや
他のクラスタでのオーバーヘッドを起こすことなく回復
処理を行なうエラー処理手段として第1初期化回路22,
第2初期化回路26,ロックレジスタクリア回路32及びレ
シーブチェック抑止回路36が設けられる。
In the present invention with respect to such a configuration of the shared memory control unit 12, when an error occurs on the cluster side during communication with a specific cluster and communication is interrupted, deadlock or other clusters may occur. The first initialization circuit 22 as an error processing means for performing a recovery process without causing overhead
A second initialization circuit 26, a lock register clear circuit 32, and a receive check suppression circuit 36 are provided.

これらの第1初期化回路22,第2初期化回路26,ロック
レジスタクリア回路32及びレシーブチェック抑止回路36
は、クラスタエラー発生時に共用メモリ制御部12側で発
生するクラスタ毎のインタフェースクリア信号INT−CL1
〜nのいずれかを受けてエラー回復動作を実行する。
The first initialization circuit 22, the second initialization circuit 26, the lock register clear circuit 32, and the receive check suppression circuit 36
Is an interface clear signal INT-CL1 for each cluster generated on the shared memory control unit 12 side when a cluster error occurs.
To n, an error recovery operation is performed.

第5図は本発明におけるクラスタ10−1〜10−nと共
用メモリ制御部12との間の通信制御状態を示した説明図
であり、同図(a)に正常時を示し、同図(b)にクラ
スタエラー発生時を示す。
FIG. 5 is an explanatory diagram showing a communication control state between the clusters 10-1 to 10-n and the shared memory control unit 12 according to the present invention, and FIG. FIG. 2B shows a case where a cluster error occurs.

まず正常時にあっては、第5図(a)に示すように、
例えばクラスタ10−1からのアクセスを例にとると、共
用メモリ制御部12との間の通信状態を確立するため、ま
ずクラスタ10−1の送受信回路200−1がオペレーショ
ンアウト信号OP−OUTをオンする。このクラスタ10−1
からのオペレーションアウト信号OP−OUTのオンを受け
て、対応する共用メモリ制御部12の送受信回路300−1
はオペレーションイン信号OP−INをオンする。この2つ
のオペレーションアウト信号OP−OUTとオペレーション
イン信号OP−INがオンしている状態でクラスタ10−1と
共用メモリ制御部12の間で送受信回路200−1と300−1
による通信可能状態が作り出される。
First, in the normal state, as shown in FIG.
For example, taking the access from the cluster 10-1 as an example, first, the transmission / reception circuit 200-1 of the cluster 10-1 turns on the operation-out signal OP-OUT to establish the communication state with the shared memory control unit 12. I do. This cluster 10-1
Receiving the ON of the operation-out signal OP-OUT from the communication circuit 300-1 of the corresponding shared memory control unit 12
Turns on the operation-in signal OP-IN. The transmission / reception circuits 200-1 and 300-1 between the cluster 10-1 and the shared memory control unit 12 while the two operation-out signals OP-OUT and OP-IN are on.
Communicable state is created.

一方、第5図(b)に示すようにクラスタ10−1でオ
ペレーションアウト信号OP−OUTをオンし、これに伴っ
て共用メモリ制御部12側でオペレーションイン信号OP−
INをオンした通信中にクラスタ10−1側で回復不能なエ
ラーが発生すると、クラスタ10−1側からのオペレーシ
ョンアウト信号OP−OUTはエラー発生により遮断され、
オフとなってしまう。このクラスタ10−1の回復不能な
エラー発生に伴なうオペレーションアウト信号OP−OUT
のオフを受けて共用メモリ制御部12の送受信回路300−
1はオペレーションイン信号OP−INをオフすると同時に
インタフェースクリア信号INT−CL1を発行し、以下の説
明で明らかにするインタフェースクリア動作、即ちエラ
ー回復の処理動作が起動される。
On the other hand, as shown in FIG. 5 (b), the operation-out signal OP-OUT is turned on in the cluster 10-1, and accordingly, the operation-in signal OP-OUT is caused in the shared memory control unit 12 side.
If an unrecoverable error occurs on the cluster 10-1 side during the communication with IN turned on, the operation out signal OP-OUT from the cluster 10-1 side is cut off due to the occurrence of the error,
It turns off. An operation out signal OP-OUT accompanying the occurrence of an unrecoverable error of the cluster 10-1
Of the transmission / reception circuit 300-
1 issues an interface clear signal INT-CL1 at the same time as turning off the operation-in signal OP-IN, and an interface clear operation, that is, an error recovery processing operation, which will be described below, is started.

尚、回復不能なエラーを起こしたクラスタ側は、その
後、共用メモリ部14に対するアクセスが不可能となるた
め、共用メモリ部14に対する構成制御を全て解除し、自
分のシステム内でのアクセスのみに移行する。
Since the cluster that has caused the unrecoverable error cannot access the shared memory unit 14 thereafter, release all configuration control for the shared memory unit 14 and shift to only access within its own system. I do.

クラスタ側でのエラー発生に伴って共用メモリ制御部
12側で発生されたインタフェースクリア信号INT−CL1は
第3図に示す第1初期化回路22,第2初期化回路26及び
ロックレジスタクリア回路32、更にレシーブチェック抑
止回路36のそれぞれに与えられ、現在通信中にあったク
ラスタ、例えばクラスタ10−1のエラー発生に対しエラ
ー回復処理を開始する。
Shared memory controller when an error occurs on the cluster side
The interface clear signal INT-CL1 generated on the 12 side is applied to each of the first initialization circuit 22, the second initialization circuit 26, the lock register clear circuit 32, and the receive check suppression circuit 36 shown in FIG. An error recovery process is started when an error occurs in a cluster that is currently communicating, for example, in the cluster 10-1.

まず、第1初期化回路22はクラスタ10−1〜10−nか
らの受信回路部に位置する受信バッファ38−1〜38−n,
ムーバー40−1〜40−nを初期化し、同時にクラスタ10
−1〜10−nへの送信回路部に位置する送信バッファ48
−1〜48−n及び転送インタフェース50−1〜50−nの
それぞれを初期化する。
First, the first initialization circuit 22 includes reception buffers 38-1 to 38-n, located in the reception circuit units from the clusters 10-1 to 10-n.
The movers 40-1 to 40-n are initialized and the cluster 10
Transmission buffer 48 located in the transmission circuit section for -1 to 10-n
-1 to 48-n and the transfer interfaces 50-1 to 50-n are initialized.

次に、第2初期化回路26はプライオリティ回路24を第
6図に示すようにして初期化する。
Next, the second initialization circuit 26 initializes the priority circuit 24 as shown in FIG.

第6図は(a)に正常終了時のプライオリティ回路の
動作を示し、(b)にクラスタエラー発生時のプライオ
リティ回路の動作を示す。
FIG. 6A shows the operation of the priority circuit at the time of normal termination, and FIG. 6B shows the operation of the priority circuit at the time of occurrence of a cluster error.

まず、第6図(a)の正常時にあっては、例えばムー
バー40−1におけるクラスタ10−1との間の通信による
アクセスを受けると、プライオリティリクエスト信号PR
−REQをプライオリティ回路24に発行する。ムーバー40
−1からプライオリティリクエスト信号PR−REQを受け
たプライオリティ回路24は、同時に優先度の高い他のク
ラスタからのアクセスを受けていなければプライオリテ
ィ許可信号PR−OKを発行し、ムーバー40−1は共用メモ
リ部14のアクセスを実行する。ムーバー40−1からのア
クセスで1つのパケット転送が終了すると、ムーバー40
−1はプライオリティエンド信号PR−ENDを発行し、こ
れによりプライオリティ回路24のプライオリティ許可信
号PR−OKが終了して初期状態に戻る。
First, in the normal state shown in FIG. 6A, for example, when an access by communication with the cluster 10-1 in the mover 40-1 is received, the priority request signal PR
-REQ is issued to the priority circuit 24. Movers 40
The priority circuit 24, which has received the priority request signal PR-REQ from -1, issues a priority permission signal PR-OK if no access has been received from another cluster having a higher priority at the same time, and the mover 40-1 has the shared memory. The access of the unit 14 is executed. When one packet transfer is completed by access from the mover 40-1, the mover 40-1
-1 issues a priority end signal PR-END, which terminates the priority permission signal PR-OK of the priority circuit 24 and returns to the initial state.

これに対し第6図(b)に示すクラスタエラー発生時
にあっては、ムーバー40−1からのプライオリティリク
エスト信号PR−REQによりプライオリティ許可信号PR−O
Kが出されている状態でクラスタエラーによりインタフ
ェースクリア信号INT−CL1が発行されると、強制的にプ
ライオリティ終了信号PR−ENDが発行され、プライオリ
ティ許可信号PR−OKをオフしてプライオリティ回路24を
初期状態に復旧させる。
On the other hand, when a cluster error occurs as shown in FIG. 6 (b), the priority permission signal PR-O is transmitted by the priority request signal PR-REQ from the mover 40-1.
When the interface clear signal INT-CL1 is issued due to a cluster error while K is being issued, the priority end signal PR-END is forcibly issued, the priority enable signal PR-OK is turned off, and the priority circuit 24 is turned off. Restore to the initial state.

次に、第4図のロックレジスタクリア回路32の実施例
を第7図を参照して説明する。
Next, an embodiment of the lock register clear circuit 32 of FIG. 4 will be described with reference to FIG.

第7図において、ロックレジスタ30は有効ビットVと
共用メモリ部14のロックアドレス、具体的にはロックス
タートアドレスと、ロックを獲得したクラスタIDの格納
エリアを有する。ロックレジスタ30の有効ビットVはプ
ライオリティ回路24でロック付きアクセスに対しプライ
オリティ許可が出された際に有効ビットVをオンにセッ
トする。同時に、ロックアドレス(ロックスタートアド
レス)が格納され、またロックを獲得したクラスタIDが
セットされる。
In FIG. 7, the lock register 30 has a valid bit V, a lock address of the shared memory unit 14, specifically, a lock start address, and a storage area of a cluster ID that has acquired the lock. The valid bit V of the lock register 30 turns on the valid bit V when the priority circuit 24 gives a priority permission for the access with lock. At the same time, the lock address (lock start address) is stored, and the ID of the cluster that has acquired the lock is set.

この状態で他のクラスタよりロック付きでない通常の
アクセスが行なわれると、ロックアドレス比較判断部54
にアクセスアドレス、具体的にはアクセススタートアド
レスが与えられ、ロックレジスタ30のロックアドレスと
の比較判断により現在ロックが獲得されている共用メモ
リ部14のロックアドレスにアクセスアドレスが含まれる
か否か比較判断し、含まれなければNORゲート56(入力
にインバータをもつたANDゲート、即ちNORゲート)を介
してアクセス許可を発行し、含まれればアクセス禁止を
発行する。
In this state, if a normal access without a lock is performed by another cluster, the lock address comparison determination unit 54
An access address, specifically an access start address, is given to the shared memory unit 14 in which the access address is included in the lock address of the shared memory unit 14 in which the lock is currently acquired based on a comparison with the lock address of the lock register 30. Judgment is made, and if not included, an access permission is issued via a NOR gate 56 (an AND gate having an inverter at the input, that is, a NOR gate), and if included, an access prohibition is issued.

このようなロックレジスタ30の回路部に対し、ロック
レジスタクリア回路32としてデコーダ58,NORゲート60−
1〜60−n,ORゲート62でなる回路が設けられる。デコー
ダ58はロックレジスタ30のクラスタIDを解読し、現在ロ
ックを獲得しているクラスタの識別出力を生ずる。デコ
ーダ58の各クラスタ識別出力はNORゲート60−1〜60−
nの一方に入力される。NORゲート60−1〜60−nの他
方には各クラスタ毎に負極性のインタフェースクリア信
号INT−CL1〜CLnが与えられている。従って、例えばク
ラスタ10−1との通信中にエラーが発生してクラスタ10
−1に対応したインタフェースクリア信号INT−CL1がオ
ンすると、このときクラスタ10−1のアクセスでロック
が獲得されていれば、クラスタ10−1のクラスタIDがロ
ックレジスタ30に格納されているため、NORゲート60−
1に対するデコーダ58の出力がオンし(出力にインバー
タが接続されているので、即ち出力0の状態)、NORゲ
ート60−1のオン出力がORゲート62,52を介してロック
レジスタ30にクリアオフ信号として与えられ、そのとき
オン状態にある有効ビットVを強制的にオフする。
For such a circuit portion of the lock register 30, a decoder 58 and a NOR gate 60-
A circuit including 1 to 60-n and an OR gate 62 is provided. Decoder 58 decodes the cluster ID in lock register 30 and produces an identification output of the cluster currently acquiring the lock. Each cluster identification output of the decoder 58 is output to NOR gates 60-1 to 60-
n. The other of the NOR gates 60-1 to 60-n is supplied with interface clear signals INT-CL1 to CLn of negative polarity for each cluster. Therefore, for example, an error occurs during communication with the cluster 10-1 and the cluster 10-1
When the interface clear signal INT-CL1 corresponding to -1 is turned on, if the lock has been acquired by accessing the cluster 10-1 at this time, the cluster ID of the cluster 10-1 is stored in the lock register 30. NOR gate 60−
The output of the decoder 58 corresponding to 1 is turned on (because the inverter is connected to the output, that is, the state of output 0), and the on output of the NOR gate 60-1 is cleared to the lock register 30 via the OR gates 62 and 52. The valid bit V, which is provided as a signal and is on at that time, is forcibly turned off.

次に、第4図のアクセスパイプライン46に対し設けら
れたレシーブチェックを抑止回路36を、第8図を参照し
て説明する。
Next, the receive check suppression circuit 36 provided for the access pipeline 46 of FIG. 4 will be described with reference to FIG.

第8図のレシーブチェック抑止回路36にはデコーダ64
が設けられ、デコーダ64にはアクセスパイプライン46の
所定のパイプライン段数目、即ちN段目出力が与えら
れ、このアクセスパイプライン46には現在アクセス中の
クラスタIDが格納されているため、このN段目のクラス
タIDをデコーダ64に入力し、クラスタIDに対応したN段
目のクラスタ識別出力を得るようにしている。
The receive check suppression circuit 36 shown in FIG.
Is provided to the decoder 64, the output of a predetermined number of pipeline stages of the access pipeline 46, that is, the output of the Nth stage. Since the access pipeline 46 stores the ID of the cluster currently being accessed, The N-th cluster ID is input to the decoder 64, and the N-th cluster identification output corresponding to the cluster ID is obtained.

一方、クラスタ10−1〜10−nに対応してタイマカウ
ンタ66−1〜66−nが設けられる。カウンタ66−1〜66
−nに対しては、対応するクラスタのエラー発生で得ら
れたインタフェースクリア信号のオンにより初期値Tが
プリセットされる。カウンタ66−1〜66−nは減算器74
−1〜74−nを備え、所定のクロックサイクル毎にカウ
ンタプリセット値の減算を繰り返す。カウンタ66−1〜
66−nのカウンタ出力はカウンタプリセット値が0にな
るまでの間、オン状態(出力にインバータが接続されて
いるので、即ち出力0の状態)に置かれる。
On the other hand, timer counters 66-1 to 66-n are provided corresponding to clusters 10-1 to 10-n. Counters 66-1 to 66
For −n, the initial value T is preset by turning on the interface clear signal obtained by the occurrence of an error in the corresponding cluster. The counters 66-1 to 66-n are a subtractor 74.
-1 to 74-n, and repeats the subtraction of the counter preset value every predetermined clock cycle. Counter 66-1
The counter output of 66-n is kept in the on state (since the inverter is connected to the output, that is, the state of output 0) until the counter preset value becomes zero.

カウンタ66−1〜66−nのカウンタ出力はクラスタ毎
に設けられたNORゲート68−1〜68−nの一方に入力さ
れ、NORゲート68−1〜68−nの他方にはデコーダ64か
らの各クラスタ識別出力が入力される。従って、NORゲ
ート68−1〜68−nはデコーダ64からクラスタ識別出力
が得られ、即ち出力0が得られ、且つカウンタ66−1〜
66−nからプリセット値が0未満となるまでのカウンタ
オン出力、即ち0出力が得られている間、0出力を生ず
る。NORゲート68−1〜68−nの出力はNORゲート70で取
りまとめられ、NORゲート72の一方に入力される。NORゲ
ート72の他方には、第4図に示した共用メモリ部14から
の読出データを受信する転送インタフェース45に対しア
クセスパイプライン46から出力する負極性のチェック有
効信号が入力されている。
The counter outputs of the counters 66-1 to 66-n are input to one of NOR gates 68-1 to 68-n provided for each cluster, and the other of the NOR gates 68-1 to 68-n is supplied from the decoder 64 to the other. Each cluster identification output is input. Therefore, the NOR gates 68-1 to 68-n obtain the cluster identification output from the decoder 64, that is, output 0, and the counters 66-1 to 68-n.
The counter-on output from 66-n until the preset value becomes less than 0, that is, 0 output is generated while the 0 output is obtained. The outputs of the NOR gates 68-1 to 68-n are collected by a NOR gate 70 and input to one of the NOR gates 72. A negative check valid signal output from the access pipeline 46 to the transfer interface 45 that receives read data from the shared memory unit 14 shown in FIG.

ここで、タイマカウンタ66−1〜66−nにプリセット
する初期値Tは共用メモリ部14のアクセスタイムに等し
いかそれ以上かの時間となる。
Here, the initial value T preset in the timer counters 66-1 to 66-n is equal to or longer than the access time of the shared memory unit 14.

次に第8図の動作を説明すると、今、クラスタ10−1
との通信中にエラーが発生したとすると、デコーダ64に
対してはアクセスパイプライン46のN段目出力としてク
ラスタ10−1を示すクラスタIDが入力され、NORゲート6
8−1に対するデコーダ出力が0となってNORゲート68−
1に与えられる。
Next, the operation of FIG. 8 will be described.
Assuming that an error occurs during the communication with the decoder 64, the cluster ID indicating the cluster 10-1 is input to the decoder 64 as the N-th output of the access pipeline 46, and the NOR gate 6
The decoder output for 8-1 becomes 0 and the NOR gate 68-
Given to one.

一方、クラスタ10−1のエラー発生で、対応するイン
タフェースクリア信号INT−CL1の発行に伴ってカウンタ
66−1に対し初期値Tがプリセットされる。初期値Tの
プリセットを受けたタイムカウンタ66−1は所定のクロ
ックサイクル毎にカウンタ内容を減算器68−1で1つデ
ィクリメントし、カウンタ内容が0となるまでディクリ
メント動作を繰り返す。タイマカウンタ66−1の出力は
カウンタ内容が0となるまでの間、出力0を維持する。
従って、NOR68−1の出力は1となり、ORゲート70を介
してNORゲート72を禁止状態とし、タイマカウンタ66−
1にプリセットされた初期値Tで定まる共用メモリ部14
のアクセスタイム以上の所定時間の間、共用メモリ部14
からのレシーバ回路である転送インタフェース45に対す
るリードデータの出力を抑止するようになる。
On the other hand, when an error occurs in the cluster 10-1, the counter is issued with the issuance of the corresponding interface clear signal INT-CL1.
The initial value T is preset for 66-1. The time counter 66-1, having received the preset value of the initial value T, decrements the counter content by one at a predetermined clock cycle by the subtracter 68-1, and repeats the decrement operation until the counter content becomes zero. The output of the timer counter 66-1 maintains the output 0 until the content of the counter becomes 0.
Accordingly, the output of the NOR 68-1 becomes 1, and the NOR gate 72 is disabled via the OR gate 70, and the timer counter 66-
Shared memory unit 14 determined by initial value T preset to 1
For a predetermined time longer than the access time of
The output of read data to the transfer interface 45, which is a receiver circuit, is suppressed.

以上がクラスタエラー発生時の共用メモリ制御部12に
おけるエラー回復処理であるが、更にクラスタ10−1〜
10−n毎に設けているクラスタ対応のステートマシン
を、そのときエラーを起こしたクラスタに対応するイン
タフェースクリア信号INT−CLによりアイドル状態とす
る。
The above is the error recovery processing in the shared memory control unit 12 when a cluster error occurs.
The state machine corresponding to the cluster provided every 10-n is set to the idle state by the interface clear signal INT-CL corresponding to the cluster in which the error has occurred at that time.

尚、第4図の実施例構成図にあっては、説明の都合
上、回復不能なクラスタエラー発生時にエラー回復を行
なう第1初期化回路22,第2初期化回路26,ロックレジス
タクリア回路32及びレシーブチェック抑止回路36を個別
に取り出して示しているが、実際には各処理対象回路部
の一部の回路として一体に形成されている。
4, the first initialization circuit 22, the second initialization circuit 26, and the lock register clear circuit 32 that perform error recovery when an unrecoverable cluster error occurs for convenience of explanation. Although the receiving check suppression circuit 36 is separately extracted and shown, it is actually integrally formed as a part of each circuit to be processed.

[発明の効果] 以上説明してきたように本発明によれば、クラスタ側
での回復不能なエラー発生による通信遮断が起きても、
エラー発生クラスタに対応した制御回路及び共通回路部
がそれぞれエラー発生に伴うインタフェースクリア信号
に基づいて初期状態に回復でき、クラスタエラー発生に
よりシステム全体のデットロックを確実に防止できる。
[Effects of the Invention] As described above, according to the present invention, even if communication is interrupted due to occurrence of an unrecoverable error on the cluster side,
The control circuit and the common circuit unit corresponding to the cluster in which the error has occurred can be restored to the initial state based on the interface clear signal accompanying the occurrence of the error, and deadlock of the entire system can be reliably prevented by the occurrence of the cluster error.

また、クラスタエラー発生時の回復処理は、共用メモ
リ部のアクセスタイムもしくはこれを僅かに上回る時間
の間に終了するため、他のクラスタから見ると、エラー
無しの場合と略同程度の時間で他のクラスタのアクセス
受付けに移行し、従って他のクラスタの動作にオーバー
ヘッドを与えることがない。
In addition, since the recovery processing when a cluster error occurs is completed during the access time of the shared memory unit or a time slightly longer than the access time, when viewed from other clusters, the other processing takes about the same time as no error. Of the other cluster, and therefore does not impose any overhead on the operation of other clusters.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の原理説明図; 第2図は本発明の全体構成図; 第3図は本発明のクラスタ構成図; 第4図は本発明の共用メモリ制御部の構成図; 第5図はクラスタエー発生時の動作説明図; 第6図は本発明のプライオリティ回路初期化説明図; 第7図は本発明によるロックレジスタのクリア回路構成
図; 第8図は本発明のレシーブチェック抑止回路構成図であ
る。 図中、 10−1〜10−n:クラスタ 12:共用メモリ制御部 14:共用メモリ部 18:エラー処理手段 20:クラスタ専用回路 22:第1初期化手段(回路) 24:共通制御回路(プライオリティ回路) 26:第2初期化手段(回路) 30:ロックレジスタ 32:クリア手段(ロックレジスタクリア回路) 34:レシーバ回路部 36:抑止手段(レシーバチェック抑止回路) 38−1〜38−n:データバッファ 40−1〜40−n:ムーバー 42,44,46,50−1〜50−n:転送インタフェース 46:アクセスパイプライン 48−1〜48−n:送信バッファ(リードバッファ) 52,62:ORゲート 54:ロックアドレス比較判断部 56,60−1〜2,68−1〜n,70,72:NORゲート 58,64:デコーダ 66−1〜66−n:タイマカウンタ 74−1〜74−n:減算器 100−1〜100−n:CPU 102:チャネル装置 104:主記憶(MSU) 106:主記憶制御ユニット(MCU) 200−1〜200−n,300−1〜300−n:送受信回路
FIG. 1 is a diagram illustrating the principle of the present invention; FIG. 2 is a diagram illustrating the overall configuration of the present invention; FIG. 3 is a diagram illustrating the cluster configuration of the present invention; FIG. FIG. 6 is a diagram for explaining the operation when a cluster error occurs; FIG. 6 is a diagram for explaining the initialization of a priority circuit according to the present invention; FIG. 7 is a diagram showing the configuration of a clear circuit of a lock register according to the present invention; It is a circuit block diagram. In the figure, 10-1 to 10-n: cluster 12: shared memory control unit 14: shared memory unit 18: error processing means 20: cluster dedicated circuit 22: first initialization means (circuit) 24: common control circuit (priority) Circuit) 26: second initialization means (circuit) 30: lock register 32: clear means (lock register clear circuit) 34: receiver circuit unit 36: suppression means (receiver check suppression circuit) 38-1 to 38-n: data Buffers 40-1 to 40-n: Mover 42,44,46,50-1 to 50-n: Transfer interface 46: Access pipeline 48-1 to 48-n: Transmission buffer (read buffer) 52,62: OR Gate 54: Lock address comparison judging unit 56, 60-1 to 2, 68-1 to n, 70, 72: NOR gate 58, 64: Decoder 66-1 to 66-n: Timer counter 74-1 to 74-n : Subtractors 100-1 to 100-n: CPU 102: Channel device 104: Main storage (MSU) 106: Main storage control unit (MCU) 200-1 to 200-n, 300-1 300-n: transmission and reception circuit

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】アクセス元装置と共用メモリ部の間で共用
メモリ制御部の制御のもとにリード又はライトのアクセ
スのためにパケット転送を行う共用記憶制御システムに
於いて、 前記共用メモリ制御部は、 前記アクセス元装置毎に設けられ、対応するアクセス元
装置から受信したアクセスデータを格納する複数の受信
バッファと、 前記受信バッファに続いて前記アクセス元装置毎に設け
られ、前記共有メモリ部にライトデータを出力すると共
に前記共用メモリ部を制御するアクセスパイプラインに
ライト又はリードのアクセスコマンドを出力する複数の
ムーバと、 前記アクセス元装置から同時に2以上の前記ムーバにア
クセスを受けた際に、予め定めた手順に従って特定のム
ーバの出力を許可するプライオリティ回路と、 前記アクセス元装置毎に設けられ、アクセス元装置に転
送する前記共用メモリ部からのリードデータを保持する
送信バッファと、 前記アクセス元装置毎に設けられ、アクセス元装置から
のアクセスデータを受信して対応する前記受信バッファ
に格納すると共に前記送信バッファのリードデータを対
応するアクセス元装置に送信する送受信回路と、 を有してなり、 前記アクセス元装置は、接続のためのオペレーションア
ウト信号を送出する送受信回路を各アクセス元装置毎に
備え、 前記共用メモリ制御部の送受信回路は、前記アクセス元
装置の送受信回路からオペレーションアウト信号を受信
すると接続のためのオペレーションイン信号をオンして
対応するアクセス元装置との通信状態を作り出し、 前記エラー処理手段は、前記共用メモリ制御部が任意の
アクセス元装置と通信中に該アクセス元装置側の回復不
能なエラー発生によりアクセス元装置の送受信回路から
発生していたオペレーションアウト信号が遮断されるこ
とに基づいて、対応する共用メモリ制御部側の送受信回
路から発生していたオペレーションイン信号が遮断され
ることによって、前記共用メモリ制御部の内部にインタ
フェースクリア信号を発生して、通信遮断により生ずる
デッドロック及びオーバーヘッドを抑止するように回復
処理を行うエラー処理手段を備え、 前記エラー処理手段は、 前記インタフェースクリア信号に基づいてエラーが発生
したアクセス元装置の専用回路を初期化する第1初期化
手段と; 前記インタフェースクリア信号に基づいて各アクセス元
装置に共通の共通制御回路を初期化する第2初期化手段
と; 前記インタフェースクリア信号に基づいて前記共用メモ
リ部のロックアドレスを格納したロックレジスタのアク
セス元識別コードがエラー発生のアクセス元装置と一致
したときにのみ有効ビットをクリアしてロックを解除さ
せるクリア手段と: 前記インタフェースクリア信号に基づいて前記共用メモ
リ部からの信号を受信するレシーバ回路に対し共用メモ
リアクセスタイム以上の間、エラーを発生したアクセス
元装置のアクセスによりリードデータの出力を抑止する
抑止手段と; を設け、 前記クリア手段は、 前記ロックレジスタに格納されたアクセス元IDを解読す
るデコーダと; 該デコーダの解読出力とエラー発生時に有効となるアク
セス元装置に対応したインタフェースクリア信号との論
理積をアクセス元装置毎に検出する複数のANDゲート
と; 該複数のANDゲートのいずれかより得られた論理積出力
による前記ロックレジスタの有効ビットをオフするクリ
アゲートと備え、 エラーの発生したアクセス元装置に対してエラー回復処
理を行うことを特徴とする共用記憶制御システム。
1. A shared memory control system for performing packet transfer for read or write access between an access source device and a shared memory unit under the control of a shared memory control unit. A plurality of reception buffers provided for each access source device and storing access data received from a corresponding access source device, provided for each access source device following the reception buffer, and provided in the shared memory unit. A plurality of movers that output write data and output a write or read access command to an access pipeline that controls the shared memory unit, and when two or more movers are simultaneously accessed from the access source device, A priority circuit for permitting output of a specific mover according to a predetermined procedure; A transmission buffer provided for each of the access source devices and holding read data from the shared memory unit for transferring to the access source device; and a reception buffer provided for each of the access source devices for receiving and responding to access data from the access source device. A transmission / reception circuit for storing the read data of the transmission buffer to a corresponding access source device while storing the data in a buffer, and the access source device includes a transmission / reception circuit for transmitting an operation-out signal for connection. The transmission / reception circuit of the shared memory control unit is provided for each access source device, and upon receiving an operation-out signal from the transmission / reception circuit of the access source device, turns on an operation-in signal for connection to communicate with the corresponding access source device. A state is created, and the error processing means is configured so that the shared memory When the operation out signal generated from the transmission / reception circuit of the access source device is interrupted due to the occurrence of an unrecoverable error on the access source device side during communication with the source device, the corresponding shared memory control unit side When the operation-in signal generated from the transmission / reception circuit is cut off, an interface clear signal is generated inside the shared memory control unit, and recovery processing is performed so as to suppress deadlock and overhead caused by communication cut-off. An error processing unit, wherein the error processing unit initializes a dedicated circuit of an access source device in which an error has occurred based on the interface clear signal; and an access source based on the interface clear signal. Second initialization means for initializing a common control circuit common to the devices; Clearing means for clearing a valid bit and releasing the lock only when an access source identification code of a lock register storing a lock address of the shared memory unit matches an access source device in which an error has occurred based on an interface clear signal: Inhibiting means for inhibiting output of read data by an access of an access source device having an error during a shared memory access time or more for a receiver circuit for receiving a signal from the shared memory unit based on the interface clear signal; And a decoder for decoding an access source ID stored in the lock register; and a logical product of a decoded output of the decoder and an interface clear signal corresponding to an access source device that is enabled when an error occurs. Multiple AND gates detected for each access source device A clear gate for turning off a valid bit of the lock register by a logical product output obtained from any of the plurality of AND gates, and performing error recovery processing on an access source device in which an error has occurred. Shared storage control system.
【請求項2】請求項1記載の共用記憶制御システムに於
いて、 前記第2初期化手段は共通制御回路としてのプライオリ
ティ回路を初期化することを特徴とする共用記憶制御シ
ステム。
2. The shared storage control system according to claim 1, wherein said second initialization means initializes a priority circuit as a common control circuit.
【請求項3】請求項1記載の共用記憶制御システムに於
いて、 前記抑止手段は、 前記共用メモリ部を制御する前記アクセスパイプライン
の所定段数位置に格納されたアクセス元IDを解読してエ
ラー発生したアクセス元装置を識別するデコーダと; エラー発生時にインタフェースクリア信号により前記共
用メモリ部のアクセスタイム以上となる所定時間値のプ
リセットを受けてスタートするアクセス元装置毎に設け
られた複数のタイマカウンタと、 前記デコーダの出力端子と前記複数のタイマカウンタの
出力をアクセス元装置毎に入力し、アクセス元装置の識
別出力が得られた状態でタイマカウンタがプリセット時
間に到達するまでの間、前記共用メモリからの前記レシ
ーバ回路へのリードデータの出力を抑止するゲート回路
と; を備えたことを特徴とする共用記憶制御システム。
3. The shared storage control system according to claim 1, wherein said inhibiting means decodes an access source ID stored at a predetermined stage number position of said access pipeline controlling said shared memory unit, and generates an error. A decoder for identifying an access source device which has occurred; and a plurality of timer counters provided for each access source device which start upon receiving an preset of a predetermined time value which is equal to or longer than the access time of the shared memory unit by an interface clear signal when an error occurs. And inputting the output terminal of the decoder and the output of the plurality of timer counters for each access source device, and until the timer counter reaches a preset time in a state where the identification output of the access source device is obtained, the common use. A gate circuit for suppressing output of read data from the memory to the receiver circuit. And a shared storage control system.
JP02198767A 1990-07-26 1990-07-26 Shared storage control system Expired - Fee Related JP3137970B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02198767A JP3137970B2 (en) 1990-07-26 1990-07-26 Shared storage control system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02198767A JP3137970B2 (en) 1990-07-26 1990-07-26 Shared storage control system

Publications (2)

Publication Number Publication Date
JPH0484258A JPH0484258A (en) 1992-03-17
JP3137970B2 true JP3137970B2 (en) 2001-02-26

Family

ID=16396596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02198767A Expired - Fee Related JP3137970B2 (en) 1990-07-26 1990-07-26 Shared storage control system

Country Status (1)

Country Link
JP (1) JP3137970B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2797969A1 (en) * 1999-08-31 2001-03-02 Koninkl Philips Electronics Nv DEVICE WITH MULTIPLE PROCESSORS SHARING A COLLECTIVE MEMORY
BR112016011691B1 (en) * 2013-12-26 2022-02-22 Intel Corporation APPLIANCE, METHOD AND SYSTEM TO SUPPORT ACCESS TO COMPUTER MEMORY.

Also Published As

Publication number Publication date
JPH0484258A (en) 1992-03-17

Similar Documents

Publication Publication Date Title
US7519856B2 (en) Fault tolerant system and controller, operation method, and operation program used in the fault tolerant system
US6321346B1 (en) External storage
US7493517B2 (en) Fault tolerant computer system and a synchronization method for the same
JPH03232045A (en) Protocol for transferring dma data
US20120066545A1 (en) Fault-tolerant system and fault-tolerant control method
JP4132322B2 (en) Storage control device and control method thereof
US5905875A (en) Multiprocessor system connected by a duplicated system bus having a bus status notification line
JP3137970B2 (en) Shared storage control system
WO2010100757A1 (en) Arithmetic processing system, resynchronization method, and firmware program
JPH11191073A (en) Pci bus processor
JP3123844B2 (en) Redundant device
JP2590239B2 (en) Lock circuit lock acquisition method
KR100228306B1 (en) Hot-standby multiplexer and implementation method
JP2511542B2 (en) Information processing system
JPH05210620A (en) Exclusive control processing system for shared memory
JP2772713B2 (en) Fault-tolerant multiprocessor system
JPS63254555A (en) Shared dual memory control system
JPH0751633Y2 (en) Memory control circuit
JPH0258155A (en) Configuration control system
JPH05265790A (en) Microprocessor device
JPS5938872A (en) Multiplex system electronic computer device
JP4597484B2 (en) Compound computer system
JPH0764876A (en) Fault detecting device between bus handler
JPS5923677B2 (en) Redundant system for exchange processing equipment
JPH09282292A (en) Memory copying device for information processing system

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees