JPH0658664B2 - Data processing device with distributed shared memory - Google Patents

Data processing device with distributed shared memory

Info

Publication number
JPH0658664B2
JPH0658664B2 JP62223100A JP22310087A JPH0658664B2 JP H0658664 B2 JPH0658664 B2 JP H0658664B2 JP 62223100 A JP62223100 A JP 62223100A JP 22310087 A JP22310087 A JP 22310087A JP H0658664 B2 JPH0658664 B2 JP H0658664B2
Authority
JP
Japan
Prior art keywords
signal
data
output
bus
shared memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62223100A
Other languages
Japanese (ja)
Other versions
JPS6466769A (en
Inventor
邦夫 鈴木
良一 高松
学 荒岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP62223100A priority Critical patent/JPH0658664B2/en
Publication of JPS6466769A publication Critical patent/JPS6466769A/en
Publication of JPH0658664B2 publication Critical patent/JPH0658664B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、共有メモリを持つマルチコンピユータシステ
ムに係り、特に個々のコンピユータにメモリを分散設置
し、該メモリ同士の同報通信によつて内容一致化を行つ
て成る共有メモリ装置に好適にデータ処理装置に関す
る。
Description: TECHNICAL FIELD The present invention relates to a multi-computer system having a shared memory, and in particular, the memory is distributedly installed in each computer, and the contents are realized by broadcast communication between the memories. The present invention relates to a data processing device suitable for a shared memory device that performs matching.

〔従来技術〕[Prior art]

分散形共有メモリの例には、特開昭57-189257号,特開
昭58-35624号がある。前者は、複数のCPUを設け、各
CPU対応に固有の共有メモリを接続せしめた計算機シ
ステムである。後者は双方向データバス上での転送回路
故障診断についての記載がある。
Examples of the distributed shared memory include JP-A-57-189257 and JP-A-58-35624. The former is a computer system in which a plurality of CPUs are provided and a shared memory unique to each CPU is connected. The latter describes the transfer circuit failure diagnosis on the bidirectional data bus.

〔発明が解決しようとする問題点〕[Problems to be solved by the invention]

各々の情報処理装置(以下CPUと記す。)に個有のメ
モリを持ち、そのメモリへの書き込み時に同報転送を行
うことによつて各々のメモリの内容を一致化させ、個々
のメモリに共有メモリの機能を持たせた分散形共有メモ
リシステムに於ては、メモリの内容の一致度がシステム
全体の信頼性に大きな影響を与える。すなわち、例えば
3台のCPUが各々共有メモリを持つたシステムを考え
た場合、任意の1台のデータ受信回路もしくは送信回路
が故障していた場合、その共有メモリの内容は他の共有
メモリの内容と一致せず、この状態でシステムを運転し
た場合、当該CPUのみマルチシステムに於ける共有デ
ータの授受が行えない為、非常に危険な状態となる。従
つて上記した様な不具合を解決する為には、即座に障害
部位を検出すると共に、当該CPUに異常を伝える事が
不可欠である。
Each information processing device (hereinafter referred to as CPU) has its own memory, and when writing to the memory, the contents of each memory are made consistent by performing broadcast transfer, and shared by each memory. In a distributed shared memory system having a memory function, the degree of coincidence of the contents of memory has a great influence on the reliability of the entire system. That is, for example, when considering a system in which three CPUs each have a shared memory, if one arbitrary data receiving circuit or transmitting circuit has a failure, the content of that shared memory is the content of another shared memory. If the system is operated in this state, the shared data cannot be sent / received in the multi-system only for the relevant CPU, resulting in a very dangerous state. Therefore, in order to solve the above-mentioned problems, it is indispensable to immediately detect the faulty part and report the abnormality to the CPU.

前記した特開昭57-189257号ではデータ転送時の障害に
関する配慮は行われていない。また、特開昭58-35624号
では、双方向データバス上での転送回路故障診断につい
て述べられているが、本例によれば自己診断のためにデ
ータ受信装置をアドレス付けによつて選択しているた
め、本発明で対象とする1台から複数台の装置へ同報転
送する様なシステムでは転送効率が低下してしまうとい
い問題があつた。
In the above-mentioned Japanese Patent Laid-Open No. 57-189257, no consideration is given to a failure during data transfer. Further, Japanese Patent Laid-Open No. 58-35624 describes transfer circuit failure diagnosis on a bidirectional data bus, but according to this example, a data receiving device is selected by addressing for self-diagnosis. Therefore, there is a problem in that the transfer efficiency is lowered in a system in which one device, which is the object of the present invention, performs broadcast transfer to a plurality of devices.

本発明の目的は、上記従来技術の問題点を解決し、マル
チコンピユータシステムに適用するに好適な分散形共有
メモリを有するデータ処理装置を提供するにある。
An object of the present invention is to solve the above-mentioned problems of the prior art and to provide a data processing device having a distributed shared memory suitable for being applied to a multi-computer system.

〔問題点を解決するための手段〕[Means for solving problems]

本発明は、装置(計算機、以下同じ)間の同報通信時の
転送データを各装置が同時にチエツクし、自己のチエツ
ク結果と自己以外の装置のチエツク結果とを照合し、自
己の正当性を合理的に判断する手段を共有メモリ内に設
けた。
According to the present invention, each device simultaneously checks transfer data at the time of broadcast communication between devices (computers, the same applies below), collates the check results of its own with the check results of devices other than itself, and verifies its own validity. A means to reasonably judge is provided in the shared memory.

〔作用〕[Action]

装置を接続するバス上に、各々の装置が受信データをチ
エツクした結果を出力する信号線を各装置個別に用意
し、各装置は他装置の出力した上記チエツク結果を取り
込み、自己の判定結果が正しくかつ他装置の少なくとも
1台が正しいと判定している場合のみ他装置からのデー
タを受け入れ、それ以外はエラーと判定するようにし、
かつ、データ出力元は自己を含む少なくとも1台のメモ
リ装置のチエツク結果が誤である場合、所定の回数のリ
トライを行うようにする。これにより、リトライを行つ
た後も前記判定結果がエラーである場合は以下の様に故
障箇所を判定できる。
On the bus connecting the devices, prepare a signal line for each device to output the result of checking the received data for each device, and each device captures the check result output by the other device and Accept data from other devices only when it is correct and at least one of the other devices determines that it is correct, and otherwise judge it as an error.
In addition, the data output source performs a predetermined number of retries when the check result of at least one memory device including itself is incorrect. As a result, if the determination result is an error even after retrying, the failure location can be determined as follows.

即ち自己を含み複数装置がエラーと判定している場合は
データ出力装置の出力回路故障、唯一の装置がエラーと
判定している場合その装置の受信回路が故障である。
That is, the output circuit of the data output device has a failure when a plurality of devices including itself has determined an error, and the reception circuit of the device has a failure when only one device has an error.

以上の判定法によれば、故障箇所が一か所である場合、
合理的にその部位をその装置自身が検出できる。
According to the above judgment method, if there is only one failure point,
The device can reasonably detect the part.

〔実施例〕〔Example〕

第2図に本発明の実施例であるシステムの全体構成を示
す。
FIG. 2 shows the overall configuration of a system which is an embodiment of the present invention.

各々CPU1−a〜1−cは、共有メモリ(GM)2−
a〜2−cを持ち、更に共有メモリ同士はバス3によつ
て接続されている。更に、CPU1−a〜1−cはバス
60−a〜60−cを介してプライベートメモリ50−
a〜50−cと接続する。プライベートメモリ(PM)
には一台のCPU個別のプログラム及びデータを格納
し、GMには複数のCPUに共通なデータを格納する。
設備の動作に併せPMとGMからデータをCPUに取込
み、データの加工を行い、自己CPU個のデータはPM
に書込み、次に他CPUへも渡したい共通のデータはG
Mに書込む。
Each of the CPUs 1-a to 1-c has a shared memory (GM) 2-
a to 2-c, and the shared memories are connected to each other by a bus 3. Further, the CPUs 1-a to 1-c are connected to the private memory 50- via the buses 60-a to 60-c.
a to 50-c. Private memory (PM)
Each of the CPUs stores a program and data for one CPU, and the GM stores data common to a plurality of CPUs.
The data from PM and GM is taken into the CPU along with the operation of the equipment, the data is processed, and the data of the own CPU is PM.
Common data that you want to write to and then pass to another CPU is G
Write to M.

今、例えばCPU1−aが共有メモリ2−aに対してデ
ータを書き込んだとすると、共有メモリ2−aのコピー
機能によつてバス3を介して他の共有メモリ2−b及び
2−c内の同一アドレスに同一のデータが書き込まれ
る。よつて、CPU1−a〜1−cは自分に接続された
共有メモリのみをアクセスするだけで、他CPUとデー
タを共有することができる。
Now, for example, if the CPU 1-a writes data to the shared memory 2-a, the copy function of the shared memory 2-a causes the same data in the other shared memories 2-b and 2-c via the bus 3. The same data is written in the address. Therefore, the CPUs 1-a to 1-c can share data with other CPUs only by accessing only the shared memory connected thereto.

さて、第1図は一実施例である共有メモリ2(2−a〜
2−cは全て同じハードウエアであるので以下共通に共
有メモリ2とする。)の内部を表わした図である。
Now, FIG. 1 shows a shared memory 2 (2-a ...
Since 2-c have the same hardware, they are commonly referred to as shared memory 2 hereinafter. ) Is a diagram showing the inside.

以下、第2図により、共有メモリ2の動作を説明する。The operation of the shared memory 2 will be described below with reference to FIG.

CPU1からのデータ読み出しは次の様に行なわれる。
すなわち、アドレス信号4にメモリアドレスが出され、
読出しを行うREAD信号8が出力される。アドレスは
ゲート11を通り、セレクタ21によりセレクトされメ
モリ23のアドレスを指定する。READ信号8はゲー
ト16を通り選択回路24へ入力される。選択回路24
は3つの入力信号16−1,17−1,27−1のうち
唯一の信号を選んでその応答を返すと共に、メモリの読
み書きを行う回路であり、入力信号16−1を選んだ時
はメモリの読み出し信号24−2と応答信号24−2を
出力、入力信号17−1を選んだ時はメモリの書込み信
号24−1と応答信号24−4を出力、入力出力27−
1を選んだ時はメモリの書込み信号24−1と応答信号
24−3を出力する。
Data reading from the CPU 1 is performed as follows.
That is, the memory address is output to the address signal 4,
A READ signal 8 for reading is output. The address passes through the gate 11 and is selected by the selector 21 to specify the address of the memory 23. The READ signal 8 is input to the selection circuit 24 through the gate 16. Selection circuit 24
Is a circuit that reads and writes the memory while selecting only one of the three input signals 16-1, 17-1, 27-1 and returning the response. When selecting the input signal 16-1, the memory is Read signal 24-2 and response signal 24-2 are output. When input signal 17-1 is selected, memory write signal 24-1 and response signal 24-4 are output, input output 27-
When 1 is selected, the memory write signal 24-1 and the response signal 24-3 are output.

この結果、メモリ23は読み出され、その出力はゲート
13に入力され、ゲート13は信号16−1によつてイ
ネーブル状態のため、そのデータはバス5に出力されC
PUへ届く。CPUはゲート14を介して与えられた応
答信号6によつてデータの読み出しが完了した事を知
り、READ信号8を止める。尚、説明が前後するが、
セレクタ21と22は、信号27−1が選ばれている間
だけ信号24−bによりB側入力を選ぶようになつてお
り、従つてCPUからのアクセス時(信号16−1また
は信号17−1が選ばれている時)はA側入力を選ぶ。
As a result, the memory 23 is read out, its output is input to the gate 13, and the data is output to the bus 5 because the gate 13 is enabled by the signal 16-1.
It reaches PU. The CPU knows that the reading of the data is completed by the response signal 6 given through the gate 14, and stops the READ signal 8. The explanation goes back and forth,
The selectors 21 and 22 are adapted to select the B side input by the signal 24-b only while the signal 27-1 is selected, and accordingly, when the CPU accesses (signal 16-1 or signal 17-1). Is selected), select the A side input.

次にCPUからのデータ書込みは以下の様に行なわれ
る。アドレス信号4,データ信号5、及び書き込みを行
うWRITE信号9がCPU1から出力される。アドレ
ス及びデータは及びゲート11,12を通り、セレクタ
21,22によつて選ばれ、各々メモリ23のアドレス
及び入力データとなる。WRITE信号9はゲート17
を通り選択回路24に選ばれた結果信号24−1がメモ
リ23の書込みを行い、応答信号24−4がゲート15
を介してCPU1へ出力される。CPU1はこれにより
書き込みの終了を知り、WRITE信号9を止める。こ
の間に更に次の事が同時に行われる。すなわち、ゲート
11及び12を通つたアドレスとデータはストアバツフ
ア19へ与えられ、更に信号17−1によつてストアバ
ツフア19内に格納される。さて、ストアバツフア19
は、フアーストイン−フアーストアウトのメモリであ
り、自己内部にデータが貯えられている時、信号19−
3を出力し、信号18−1によりデータが読み出され、
全てなくなると信号19−3の出力が止まる。バス制御
回路18は、信号19−3を受けると、バス3へ占有要
求信号18−2を出力する。本発明には直接関与しない
ためバス3の占有制御に関する具体的説明は開示しない
が、バス3を占有すると占有信号18−3をバスへ出力
しつつ、信号18−1を出力する。信号18−1はスト
アバツフア19への読出し信号になると同時にゲート3
1と32をイネーブル状態とし、ストアバツフアの内容
すなわちメモリのアドレスとそのデータをバス3へ出力
する。更にタイミング回路20は書き込みタイミングを
発生し、ゲート33を介してバス3へ書込み信号33−
1を出力する。この結果、更に共有メモリ2は以下の動
作を行うが、これから説明する動作はバス3に接続され
た共有メモリ2の全てについて同時に行なわれるもので
ある。すなわち、ゲート31及び32から出力されたア
ドレスとデータはバス3を介して各々ゲート34及び3
5で受信され、信号33−1も同様にゲート38で共通
に受信されるからである。
Next, data writing from the CPU is performed as follows. The address signal 4, the data signal 5, and the WRITE signal 9 for writing are output from the CPU 1. The address and the data pass through the gates 11 and 12 and are selected by the selectors 21 and 22 to be the address and the input data of the memory 23, respectively. WRITE signal 9 is gate 17
The result signal 24-1 selected by the selection circuit 24 passes through the memory 23 and the response signal 24-4 is transmitted to the gate 15
Is output to the CPU 1 via. The CPU 1 thereby knows the end of writing and stops the WRITE signal 9. During this time, the following things are done at the same time. That is, the address and data passed through the gates 11 and 12 are given to the store buffer 19 and further stored in the store buffer 19 by the signal 17-1. Well, store store 19
Is a first-in first-out memory, and when data is stored in the self, the signal 19-
3 is output and the data is read by the signal 18-1,
The output of the signal 19-3 stops when all the signals are exhausted. When receiving the signal 19-3, the bus control circuit 18 outputs the occupancy request signal 18-2 to the bus 3. Although the specific description of the occupancy control of the bus 3 is not disclosed because it is not directly involved in the present invention, when the bus 3 is occupied, the occupancy signal 18-3 is output to the bus while the signal 18-1 is output. The signal 18-1 becomes a read signal to the store buffer 19, and at the same time, the gate 3
1 and 32 are enabled, and the contents of the store buffer, that is, the memory address and its data are output to the bus 3. Further, the timing circuit 20 generates a write timing, and the write signal 33− is sent to the bus 3 via the gate 33.
1 is output. As a result, the shared memory 2 further performs the following operation, but the operation described below is performed simultaneously for all the shared memories 2 connected to the bus 3. That is, the address and data output from the gates 31 and 32 are transferred to the gates 34 and 3 via the bus 3, respectively.
5 and the signal 33-1 is also commonly received by the gate 38.

さて、ゲート34及び35で受信されたアドレス及びデ
ータは、ゲート38の出力信号により各各レジスタ2
5,26へセツトされ、かつゲート38の出力信号はフ
リツプフロツプ27(以下、FF27と略記)をセツト
する。この結果、信号27−1が出力され選択回路24
へ与えられると共にゲート39を介してバス3へビジー
信号39−1を出力する。選択回路24が信号27−1
を選ぶと、信号24−6によりセレクタ21及び22の
B入力を選ぶと共に書込信号24−1を出力し、更に応
答信号24−3を出力するので、バス3上のアドレス,
データによりメモリ23への書込みが行われ、更にFF
27がリセツトされビジー信号39−1が止まる。
Now, the address and data received by the gates 34 and 35 are output from the gate 38 to the respective registers 2 and 3.
5 and 26, and the output signal of the gate 38 sets a flip-flop 27 (hereinafter abbreviated as FF27). As a result, the signal 27-1 is output and the selection circuit 24
And a busy signal 39-1 is output to the bus 3 via the gate 39. The selection circuit 24 outputs the signal 27-1.
Is selected, the B input of the selectors 21 and 22 is selected by the signal 24-6, the write signal 24-1 is output, and the response signal 24-3 is further output.
The data is written to the memory 23, and the FF
27 is reset and the busy signal 39-1 stops.

さて、今まで説明を省いてきたが、実施例に於いてはデ
ータに関してデータ線5,メモリ23,ストアバツフア
19,バス3上に全てパリテイビツトを有している。そ
して、レジスタ26は、バス3から受信したデータのパ
リテイチエツクを行い、エラーである場合エラー信号を
出力し、その結果ゲート36,37がバス上の個別線へ
エラー信号と正常信号のいずれかを出力する。次に、再
びデータ送信を行つている側の共有メモリの動作に戻
る。前述したビジー信号39−1及びエラー信号36−
1〜3は、バス上の誰かが出力していればそれを受信で
きる。尚信号36−4〜6は信号36−1〜3のペアを
なす正常信号である。ビジー信号は共有メモリのうち全
てが動作終了した事を検知する為に用い、エラー信号は
誰かがエラーを検出している事を検知する為に用いられ
る。即ちゲート40の出力が止まつた場合、バス制御回
路18は1回の転送の終了とみなしてバス占有を解除す
るが、この時信号36−1〜36−3のいずれかが有る
場合、判定回路42から信号42−1が出力され、リト
ライ信号18−4を出力し、書込信号の再出力を行う。
Although not described so far, in the embodiment, all the data lines 5, the memory 23, the store buffer 19, and the bus 3 have parity bits for data. Then, the register 26 performs parity check on the data received from the bus 3 and outputs an error signal when there is an error, so that the gates 36 and 37 send either an error signal or a normal signal to an individual line on the bus. Is output. Next, the operation returns to the operation of the shared memory on the side transmitting the data again. The busy signal 39-1 and the error signal 36-
1 to 3 can receive it if someone on the bus outputs it. The signals 36-4 to 36-6 are normal signals forming a pair with the signals 36-1 to 36-3. The busy signal is used to detect that all of the shared memories have finished operating, and the error signal is used to detect that someone is detecting an error. That is, when the output of the gate 40 stops, the bus control circuit 18 regards it as the end of one transfer and releases the bus occupation. However, if any of the signals 36-1 to 36-3 is present at this time, the determination circuit The signal 42-1 is output from 42, the retry signal 18-4 is output, and the write signal is output again.

以上により、バス3上のどの占有メモリが受信エラーと
なつても、リトライが実行され、全ての共有メモリ内の
データの一致化が保たれる。
As described above, no matter which occupied memory on the bus 3 causes a reception error, the retry is executed and the data in all the shared memories are kept consistent.

さて、第1図で本発明の実施例での特徴点を挙げれば、
バス3から受信したデータのパリテイチエツクの結果、
エラーと正常のどちらも出力していること、上記各々の
信号は、バス3上で個別線になつており、共有メモリ2
は自己を含む全てのエラー、正常信号を受けている事、
更に、上記信号のパターンを照合して、エラーの有無を
判定する判定回路42が付加されている事である。
Now, referring to FIG. 1, the features of the embodiment of the present invention are:
As a result of the parity check of the data received from bus 3,
Both error and normal are output, and each of the above signals is on an individual line on the bus 3, and the shared memory 2
Is receiving all errors including self, normal signal,
Furthermore, a judging circuit 42 for judging the presence or absence of an error by collating the pattern of the above signals is added.

そして、上記の個別線に着目してみると、第4図に示す
如く、各々自己の出力した信号が判定回路の固定位置に
入力されるよう接続している。更に判定回路42へは、
自分が今バスを占有していることを示すバス占有信号1
8−3によつてトリガーされた信号18−1が与えられ
ており、本信号によつて今自分がバス3へデータを送信
している事を検知できる。そして、判定回路42は、以
下の判定を行う。
Focusing on the above-mentioned individual lines, as shown in FIG. 4, the signals output by each of the individual lines are connected so as to be input to a fixed position of the determination circuit. Further, to the determination circuit 42,
Bus occupancy signal 1 to indicate that you are now occupying the bus
A signal 18-1 triggered by 8-3 is given, and this signal can detect that the user is now transmitting data to the bus 3. Then, the determination circuit 42 makes the following determination.

(1)自己が送信者であり、1つでもエラー信号を受けた
場合、リトライを行うために信号42−1を出力し、バ
ス制御回路18にリトライをさせる。
(1) If the self is the sender and at least one error signal is received, the signal 42-1 is output to perform the retry, and the bus control circuit 18 is made to retry.

(2)自己が送信者であり、最後のリトライを実施した
時、全てのエラー信号を受けた時、自己を故障とみな
し、信号42−2を出力し、CPUへ故障を報告する。
(2) When the self is the sender and the last retry is performed, when all error signals are received, the self is regarded as a failure, the signal 42-2 is output, and the failure is reported to the CPU.

(3)自己が送信者か受信者かにかかわらず、自己がチエ
ツクした結果が正常でかつ他者が1台でも正常信号を出
力している時以外は、信号42−3によりバス3からメ
モリ23への書き込みを禁止する。
(3) Regardless of whether the user is the sender or the receiver, the signal from the bus 3 is stored in the memory by the signal 42-3 except when the result of the check made by the user is normal and one other person outputs a normal signal. Writing to 23 is prohibited.

(4)自己が送信者か受信者かにかかわらず、最後にリト
ライした時、自己のチエツク結果のみがエラーである場
合、自己を故障とみなし、信号42−2を出力する。
(4) Regardless of whether the sender is the sender or the recipient, if only the check result of the self is an error at the last retry, the self is regarded as a failure and the signal 42-2 is output.

以上の判定論理によれば、以下の様な故障を正しく判定
できる。すなわち、第5図に示すケースで、送信側は2
−aであるとの前提で考えると、 2−aの送信回路故障時は下記判定論理(2)で2−aは
故障となり、2−b,2−cは判定論理(3)により書込
みを行わない。
According to the above judgment logic, the following failures can be correctly judged. That is, in the case shown in FIG.
Assuming that it is −a, when the transmission circuit of 2-a fails, 2-a becomes a failure by the following decision logic (2), and 2-b and 2-c write by the decision logic (3). Not performed.

2−bの受信回路故障時は、2−a,2−cは判定論理
(3)により書込みを行い、2−bは書込みを行わない。
更に(1)により2−aがリトライを行うが、最後に判定
論理(4)により2−bが自己の故障を検出する。
When the receiving circuit of 2-b is faulty, 2-a and 2-c are decision logics.
Writing is performed according to (3), but writing is not performed for 2-b.
Further, 2-a retries by (1), but finally 2-b detects its own failure by the decision logic (4).

尚、説明が前後するが、第1図に於て、バス制御回路1
8は、所定のリトライを実施した時、最後のリトライ実
行時ゲート43を介してバス上に信号43−1を出力す
ると共に、全ての共有メモリは該信号を受信し、判定回
路42へ取り込んでいる。
In addition, although the description will be changed, in FIG. 1, the bus control circuit 1
When a predetermined retry is carried out, 8 outputs a signal 43-1 on the bus through the final retry execution time gate 43, and all shared memories receive the signal and fetch it into the decision circuit 42. There is.

また、判定回路42の具体的回路は図示していないが、
前記した判定論理は単純なAND,ORの組み合せで実
現できる程度のものであり、周知の技術である。
Although the specific circuit of the determination circuit 42 is not shown,
The above-mentioned decision logic is a known technique as it can be realized by a simple combination of AND and OR.

本実施例によれば、故障した共有メモリが自己の故障を
CPUへ報告できるため、CPUが誤つて他のメモリと
一致しないデータを使用することを確実に防止できる。
According to the present embodiment, the failed shared memory can report its own failure to the CPU, so that it is possible to reliably prevent the CPU from erroneously using data that does not match other memory.

第3図に本発明の第2の実施例を示す。FIG. 3 shows a second embodiment of the present invention.

第3図に於て、第1図の実施例と異る主な点は以下のと
おりである。
In FIG. 3, the main points different from the embodiment of FIG. 1 are as follows.

(1)受信データの判定結果、エラー信号のみをバスに出
力しており、かつ、自己が送信者である場合はゲート3
6の出力を抑えてバスにエラー信号を出力していないこ
と。
(1) If only the error signal is output to the bus as a result of the reception data determination, and the self is the sender, the gate 3
Do not suppress the output of 6 and output an error signal to the bus.

(2)上記エラー信号は、全ての共有メモリ装置について
共通の信号線であること。
(2) The error signal must be a common signal line for all shared memory devices.

一方、同じ番号を付したものは、同じ機能である。尚、
第1図に於ては、故障検出を判定回路42にて行つてい
たが、第3図の実施例に於てはバス制御回路18内にて
行つている。
On the other hand, those having the same number have the same function. still,
In FIG. 1, the failure detection is performed by the determination circuit 42, but in the embodiment of FIG. 3, it is performed in the bus control circuit 18.

第3図に示した実施例では、自己が送信者になつた時に
のみ自己の故障を検出する方式をとつている。すなわ
ち、自己が送信者なる場合、自己が送信したデータをレ
ジスタ26で受信し、そのエラー判定結果であるエラー
信号26−1、バス6上のエラー信号すなわちゲート4
1の出力をバス制御回路18にて照合する。この照合を
行う際には以下の判定論理をもつて故障診断を行つてい
る。
The embodiment shown in FIG. 3 employs a method of detecting its own failure only when it becomes a sender. That is, when the self is the sender, the data transmitted by the self is received by the register 26, and the error signal 26-1 which is the error judgment result, the error signal on the bus 6, that is, the gate 4
The output of 1 is collated by the bus control circuit 18. When performing this collation, failure diagnosis is performed using the following judgment logic.

(1)自己の判定結果及び他メモリの判定結果が伴にエラ
ーである時、自己の送信回路故障とする。
(1) If the self-determination result and the determination results of other memories are accompanied by an error, it is determined that the transmission circuit of the self is defective.

(2)自己の判定結果がエラーで、他メモリの判定結果が
エラーでない時、自己の受信回路故障とする。
(2) When the judgment result of its own is an error and the judgment result of other memory is not an error, it is regarded as its own receiving circuit failure.

上記にて自己の故障を検出した場合、バス制御回路18
は、エラー信号42−2を出力してCPUに故障を報告
する。
When the self failure is detected as described above, the bus control circuit 18
Outputs an error signal 42-2 to report the failure to the CPU.

本実施例によれば、送信者である場合しか自己の故障を
検出できないということになるが、第1図に較べてバス
の信号線が共通化できるため拡張性の面で改良を図るこ
とができる。しかるに共有メモリの任意のエリアを保守
用として確保しておき、各々のCPUがそのエリアへ逐
次書き込みを行うなどの配慮を行うことで事前に故障を
検出できることは云うまでもない。
According to the present embodiment, the failure of itself can be detected only by the sender, but since the signal line of the bus can be shared as compared with FIG. 1, it is possible to improve the expandability. it can. However, it goes without saying that a failure can be detected in advance by ensuring that an arbitrary area of the shared memory is reserved for maintenance and each CPU sequentially writes data to that area.

〔発明の効果〕〔The invention's effect〕

本発明によれば、従来技術で考慮されていなかつたメモ
リ間のデータ転送回路の故障検出をデータ転送効率を低
下させることなく行える。
According to the present invention, failure detection of a data transfer circuit between memories, which has not been considered in the prior art, can be performed without lowering the data transfer efficiency.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例である共有メモリの内部回路
図、第2図は本発明の一実施例であるシステム構成図、
第3図は本発明の第2の実施例である共有メモリの内部
回路図、第4図は第2の実施例における共有メモリ間の
接続図、第5図は第2の実施例の動作説明の為の構成図
である。 36……エラー検出信号出力ゲート、37……正常検出
信号出力ゲート、42……判定回路(故障及びエラーの
合理性判定回路)。
FIG. 1 is an internal circuit diagram of a shared memory which is an embodiment of the present invention, and FIG. 2 is a system configuration diagram which is an embodiment of the present invention.
FIG. 3 is an internal circuit diagram of the shared memory according to the second embodiment of the present invention, FIG. 4 is a connection diagram between the shared memories in the second embodiment, and FIG. 5 is an operation explanation of the second embodiment. It is a block diagram for the. 36 ... Error detection signal output gate, 37 ... Normal detection signal output gate, 42 ... Judgment circuit (fault and error rationality judgment circuit).

フロントページの続き (56)参考文献 特開 昭62−57049(JP,A) 特開 昭62−57048(JP,A) 特開 昭60−178572(JP,A)Continuation of the front page (56) References JP 62-57049 (JP, A) JP 62-57048 (JP, A) JP 60-178572 (JP, A)

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】共通バスと、該共通バスに並列に接続され
た複数個の共有メモリと、該各共有メモリに接続された
複数個のCPUとより成り、対応する共有メモリとCP
Uとは1台の計算機を構成し、任意の一台の計算機から
他の複数台の計算機に対して上記共通バスを介して互い
にデータを同報転送する形式の分散形共有メモリを持つ
データ処理装置において、 各共有メモリは、上記同報転送時に共通バスから受信し
たデータの正誤を判定する判定手段と、該判定手段の判
定結果を共通バスに乗せる手段と、自己のエラー判定結
果と共通バスを介して送られてくる自己以外のエラーの
判定結果とを照合し、エラー発生の有無及び故障部位の
検出を行う手段と、を備えてなる分散形共有メモリを持
つデータ処理装置。
1. A common bus, a plurality of shared memories connected in parallel to the common bus, and a plurality of CPUs connected to each of the shared memories.
U is a data processing having a distributed shared memory that constitutes one computer and broadcasts data from any one computer to other computers via the common bus. In the apparatus, each shared memory includes a determination unit that determines whether the data received from the common bus at the time of the broadcast transfer is correct, a unit that puts the determination result of the determination unit on the common bus, an error determination result of itself, and the common bus. A data processing device having a distributed shared memory, which is provided with a means for checking whether or not an error has occurred and for detecting a faulty part by collating with a determination result of an error other than its own sent via.
JP62223100A 1987-09-08 1987-09-08 Data processing device with distributed shared memory Expired - Lifetime JPH0658664B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62223100A JPH0658664B2 (en) 1987-09-08 1987-09-08 Data processing device with distributed shared memory

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62223100A JPH0658664B2 (en) 1987-09-08 1987-09-08 Data processing device with distributed shared memory

Publications (2)

Publication Number Publication Date
JPS6466769A JPS6466769A (en) 1989-03-13
JPH0658664B2 true JPH0658664B2 (en) 1994-08-03

Family

ID=16792826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62223100A Expired - Lifetime JPH0658664B2 (en) 1987-09-08 1987-09-08 Data processing device with distributed shared memory

Country Status (1)

Country Link
JP (1) JPH0658664B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60178572A (en) * 1984-02-27 1985-09-12 Toshiba Corp Multiprocessor device
JPS6257049A (en) * 1985-09-06 1987-03-12 Nec Corp Decentralized processor system

Also Published As

Publication number Publication date
JPS6466769A (en) 1989-03-13

Similar Documents

Publication Publication Date Title
US4438494A (en) Apparatus of fault-handling in a multiprocessing system
US4503535A (en) Apparatus for recovery from failures in a multiprocessing system
US5838899A (en) Digital data processing methods and apparatus for fault isolation
US4926315A (en) Digital data processor with fault tolerant peripheral bus communications
EP0165603B1 (en) Resilient data processing bus system
US5838900A (en) Digital data processing methods and apparatus for fault detection and fault tolerance
JPH01293450A (en) Troubled device specifying system
JP4132322B2 (en) Storage control device and control method thereof
JP2996440B2 (en) Diagnosis method of data processing system
US20060212749A1 (en) Failure communication method
JP2637742B2 (en) Information processing device
JPH0658664B2 (en) Data processing device with distributed shared memory
JP3127941B2 (en) Redundant device
JPS6113266B2 (en)
JPS584427A (en) Multi-computer system having plural serial bus loops
JP2645021B2 (en) Bus abnormality inspection system
JPH02173852A (en) Bus diagnostic device
JPH0152774B2 (en)
JP2919366B2 (en) Bus failure handling method
JPH03502619A (en) Data bus enable verification logic
JP2871966B2 (en) Fault detection circuit inspection system
JPS6232517B2 (en)
JPH05173819A (en) Common bus route diagnostic method
JPS6218943B2 (en)
JPS61267860A (en) Inter-processor communication system