JPS5816362A - Controller for double shared memory - Google Patents

Controller for double shared memory

Info

Publication number
JPS5816362A
JPS5816362A JP56112995A JP11299581A JPS5816362A JP S5816362 A JPS5816362 A JP S5816362A JP 56112995 A JP56112995 A JP 56112995A JP 11299581 A JP11299581 A JP 11299581A JP S5816362 A JPS5816362 A JP S5816362A
Authority
JP
Japan
Prior art keywords
data
shared memory
memory
cpu
shared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56112995A
Other languages
Japanese (ja)
Other versions
JPS6113266B2 (en
Inventor
Yoshihiro Miyazaki
義弘 宮崎
Susumu Kato
猛 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP56112995A priority Critical patent/JPS5816362A/en
Publication of JPS5816362A publication Critical patent/JPS5816362A/en
Publication of JPS6113266B2 publication Critical patent/JPS6113266B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To increase greatly the reliability of a system, by using a changeable storage means in each processor and fetching either one of the systems by the on-/off-mode of the storage means. CONSTITUTION:A storage means which can be set and reset by a program or another means is set in each memory expander 4 or CPU3, and the transmission of either one of both reading data to the CPU is decided by the on-/off-mode of this storage means when these two reading data are normal. In such way, some group of plural CPUs 3 uses the data of a shared memory M1 with priority, and the rest groups of CPU3 use the data of a shared memory M2 with priority respectively. As a result, the breakdown of all CPUs can be avoided although the errors occur frequently at a single system sharing memory for the data to which the detection of error is impossible.

Description

【発明の詳細な説明】 本発明は、複数処m装置間の二重化共有メモリの制御装
置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a control device for duplex shared memory between multiple processing devices.

まず、本発明の前提となる、二重化共有メモリを含む複
数処理装置の全体構成例を第1図を参照して説明する。
First, an example of the overall configuration of a multiple processing device including a dual shared memory, which is the premise of the present invention, will be described with reference to FIG.

第18ii)は、4つの処理装置8(CPUI〜CPU
4)が二重化共有メモ!71(Ml、M2)t−共有す
る構成であシ、処理装置3(以下CPUと称す)は、共
有メモリlとの接続機構4(MEI〜MB4):以下メ
モリエクスパンダと称す)t−有し、共有メモ+71は
各CPUに対応して設けた処理装**g機@2(PI〜
P4:以下ポートと称す)を有する。第1図では、同一
の構成のものには、代表して1つの符号がつけられてい
るだけである。例えばC以H〜CPU4に対しては%C
PU1に符号3がつけられ、CPU2〜CPO4には符
号をつけていない、これは他の部分に対しても同様であ
る。
No. 18 ii) includes four processing units 8 (CPUI to CPU
4) is a duplicate shared memo! 71 (Ml, M2) t-shared configuration, the processing device 3 (hereinafter referred to as CPU) has connection mechanism 4 (MEI to MB4) with shared memory 1 (hereinafter referred to as memory expander) t- However, the shared memo +71 is a processing unit installed corresponding to each CPU.
P4: hereinafter referred to as port). In FIG. 1, only one reference numeral is given to the same configuration. For example, for CPU4 from C to H, %C
The code 3 is attached to PU1, and no code is attached to CPU2 to CPO4, and the same applies to other parts.

したがって、以下の説明では、CPU5という場合は、
CPUI〜CPU4を代表しえものとする。
Therefore, in the following explanation, when CPU5 is used,
Let CPUI to CPU4 be representative.

メモリエクスパンダ4七、両共有メモリのポート2は共
有メモリ〜CPU間インターフェイス5によシ接続され
、各CPUからメモリエクスパンダ4、共有メ%す〜C
PU間インタインターフェイス5トj!を介して共有メ
モlとのデータ転送が行われる0両共有メ七り0間は、
共有メモリー共有メ4にす閲インターフェイス6によj
PII絖され両共有メモリは同期して一作する。各CP
Uは人出カパスγを有し、各種入出力装置9を動作させ
、020間連絡パス8を用いて、相互割込通信、相互監
視が行なわれるようになっている。
The memory expander 47 and ports 2 of both shared memories are connected to the shared memory-CPU interface 5, and each CPU connects the memory expander 4 and the shared memory ports 2 to the shared memory-CPU interface 5.
5 inter-PU interfaces! Data is transferred to and from the shared memory via the shared memory.
Shared memory sharing method 4 View interface 6
PII is connected and both shared memories are synchronously created. Each CP
U has a crowd path γ, operates various input/output devices 9, and uses a 020 communication path 8 to perform mutual interrupt communication and mutual monitoring.

このようなシステム構成においてメモリエクスパンダ4
は、内部構成tsgz図に示すように一〇Pυからアド
レスA1書込みデータWDt−受取って、両共有メモ替
M1.M2にそれぞれアドレスA1書込2、書込みデー
タWD1.WD2をイン/−7エイス5.5′を介して
送出し、両共有メ峰りからO続出しデータRDI、RD
2を受取ってチェックし、正常な方のデータRDtCP
Uに送出する。このとき、両系のデータRDI。
In such a system configuration, memory expander 4
As shown in the internal configuration tsgz diagram, receives address A1 write data WDt- from 10Pυ and transfers both shared memory memory M1. Address A1 write 2, write data WD1 . Sends WD2 through In/-7 Eighth 5.5', and outputs data RDI and RD from both shared channels.
2 received and checked, the normal data RDtCP
Send to U. At this time, the data RDI of both systems.

RD2ともエラー検出されず正常であるが、両データが
異なるとい)ケースが起と9うみ、(1ビツトパリテイ
チエツクを行っているならは2ビツト誤〕は正常とみな
される)尚第2図において、10はアドレスバッファ、
1lrj:書込みデータバッファ、12は胱出しデータ
選択回路、13゜13′は胱出しデータバッファ、14
.14’は続出しデータ選択回路大刀、15は絖出しデ
ータ選択回路出力である。
There are 9 cases in which RD2 is normal with no error detected, but the two data are different (if a 1-bit parity check is performed, a 2-bit error is considered normal), as shown in Figure 2. , 10 is an address buffer,
1lrj: write data buffer, 12: bladder ejection data selection circuit, 13° 13': bladder ejection data buffer, 14
.. Reference numeral 14' denotes a continuous output data selection circuit, and 15 represents an output of the output data selection circuit.

従来の読出しデータ選択回路の代表的な具体例を第3図
、第4図に示している・ #I3図は、両系共正常ならばそのデータをオアしてC
PUへ送出する方式である0両系を各々l系、z系と呼
ぶこ、!:KI、%1系からの続出しデータ14tエラ
ー検出回路tgKてデータチェックし、エラーがあれば
、戒iは、1系タイムアウトエラー25を検出すれtf
l系エシエラ−検出信号17ンし、l系から0データ1
4はインヒビットされCPUへ送出されなり、2系につ
いても同様である0本方式は、エラー検出回路16で検
出されないデータm6でも同系データをオアすることに
よりCPUでエラー検出できるケースがあ)、データの
品質を上げるこ七はできるが、片系0共有メモリがアド
レス系中タイ2ング系の故障にょ〕、ζOようなエラー
検出回路で検出できないデータ誤pt続発すると、全て
のCPUがダウンする結果となる。
Typical specific examples of conventional read data selection circuits are shown in Figures 3 and 4. Figure #I3 shows that if both systems are normal, the data is ORed and the
The 0 and 0 systems that are used to send data to the PU are called the l and z systems, respectively. :KI, % Continuous data from 1 system 14t Error detection circuit tgK checks the data, and if there is an error, Kai i detects 1 system timeout error 25 tf
l system Esiera - detection signal 17, 0 data 1 from l system
4 is inhibited and sent to the CPU, and the same applies to the 2nd system.In the 0 line method, even if data m6 is not detected by the error detection circuit 16, the CPU can detect an error by ORing the same data). Although it is possible to improve the quality of the system, if one system 0 shared memory fails in the addressing system and the timing system fails], if data errors that cannot be detected by an error detection circuit such as ζO occur repeatedly, all CPUs will go down. becomes.

第4mは、両系正常ならばあらかじめ定まった方のデー
タ[−CPUK送出する方式である0本方式もあらかじ
め定まった方の共有メモリがエラー検出で龜ないデータ
g*nt続発すると、全てのCPUがダウンする結果と
なる。最近C)CPUの使用状況は、これがダウンした
とき、人手によるバックアップは不可能な時が多く、一
方このようなシステムでは高信頼度化のためにCPUの
完全二重系、入出力O同期、一致チェック、合理性チェ
ツタ、相互診断等、片系のCPUが誤った計算を行って
も、システムダウンとならぬよう、あらゆる考慮がなさ
れており、このようなシステムにおいて片系共有メ°モ
リが故障したからという塩山で、全て0CPUがダウン
するのは望ましくない。
In the 4th m, if both systems are normal, the predetermined data [-CPUK] is sent.If the predetermined shared memory is slow to detect an error and data g * nt is generated one after another, all CPUs This results in the downtime. Recently, C)CPU usage is such that when it goes down, it is often impossible to back it up manually.On the other hand, in order to improve reliability in such systems, CPU full duplex system, input/output O synchronization, Every consideration has been made to ensure that the system does not go down even if one CPU performs an incorrect calculation, such as consistency checking, rationality checking, and mutual diagnosis. It is undesirable for all 0 CPUs to go down just because of a failure.

本発@O目的は、このような片系共有メモリのエラー検
出不可なデータ誤p発生時に1全てのCPUがダウンす
ることを防止するようにした二重化共有メモリ制御装置
をII供するにある。
The purpose of this invention is to provide a duplex shared memory control device II that prevents all CPUs from going down when such an undetectable data error p occurs in a single shared memory.

本発l1io特徴はい第5図に一例を示すように各メモ
リエクスパンダ(ある使は、各C5Pυ)内に、プログ
ツムあるいは何らかの手段にて七ット、リセットが可能
な記憶手段(優先選択7リツプフロツグ20)を設け、
両系l!出しデータ共正常なと龜、どちらtCPUに送
出するかをこの記憶手段のオン/オフによシ決めるよう
にしていることである。このようにすることにより、複
数CPU0内、一部0CPU群は共有メモリl系のデー
タを優先的に使用し、残pOcPU評は共有メモリ2系
のデータを優先的に使用することによって、片系共有メ
モリにてエラー検出不可なデータWAシが続発しても全
てのCPUがダウンすることは防止できる。
Features of the present invention As shown in Figure 5, each memory expander (in some cases, each C5Pυ) has a memory means (7 bits for priority selection) that can be reset by a program or some other means. 20),
Both systems! If the output data is normal, which tCPU to send to is determined by turning on/off this storage means. By doing this, some of the 0 CPU groups in multiple CPU 0 preferentially use the data of the shared memory 1 system, and the remaining pOcPU evaluation preferentially uses the data of the shared memory 2 system, so that one system Even if undetectable data WA errors occur one after another in the shared memory, all CPUs can be prevented from going down.

本発明の実施例をgsg〜第12WJt参照して説明す
る。
An embodiment of the present invention will be described with reference to gsg to 12th WJt.

第6図はCPU5 (メそリエクスバンダ4t−含む)
の構成を示したものである。CPU内バス制脚装置1(
BC)30にて制御されるCPU内パス2faKti、
メモリエクスパンダ(MJi: ) 4、メモリ制御装
置(MCυ)28、基本演算機all(BPU)32、
入出力制御機構(IOP)33が接続される。メモリ前
脚装置28は、プログラム及びそのCPU専用のデータ
を格納し九メインメ峰り27tW御する。基本演算機#
1lB2には浮動小数点演算機構(PPP)31等オプ
ション機#Iが接続される0、入出力制御機11133
は、入出カバスフを、制御し、入出力鋏置〜メインメモ
リ、或いは共有メ毫讐関Oデータ転送を行う、メモリエ
クスパンダ4は、2本の共有メモリ〜CPU間インター
フェイス6を介し、−二重化共有メモリMl、M2と接
I!される。メインメモリ27と共有メモリl(Ml、
MりD区別はメモリアドレスにて区別され、 41m!
メモリアドレス以上のメモリアドレスが、共有メモリに
割当てられる。
Figure 6 shows CPU5 (including Mesori Exbander 4t)
This shows the configuration of CPU internal bus leg restraint device 1 (
BC) intra-CPU path 2faKti controlled by 30,
Memory expander (MJi: ) 4, memory control unit (MCυ) 28, basic computing unit all (BPU) 32,
An input/output control mechanism (IOP) 33 is connected. The memory front gear unit 28 stores programs and data dedicated to its CPU, and controls nine main points. Basic computing machine #
0, input/output controller 11133 to which optional machine #I such as floating point arithmetic unit (PPP) 31 is connected to 1lB2.
The memory expander 4 controls the input/output capacitor and transfers data between the input/output pin and the main memory or the shared memory via the two shared memories and the CPU interface 6. Shared memory Ml, M2 and I! be done. Main memory 27 and shared memory l (Ml,
M and D are distinguished by memory address, 41m!
Memory addresses greater than or equal to the memory address are allocated to shared memory.

第7図は共有メモリ1(ポート怠を含む)の構成を示し
たものである。共有メモリ内バス制御装置37にて制御
される共有メモリ内パス36には、メモリ制御装置3!
s1ポート2が接続される。メモリ制御装置3sは、複
数CPU間共有データを格納するメモリ34を制御する
。ボー)2(Pi〜P4)は共有メモリ〜CPU間イン
ターフェイスst介し% CPUI〜4と接続される。
FIG. 7 shows the configuration of the shared memory 1 (including ports). The shared memory path 36 controlled by the shared memory bus control device 37 includes the memory control device 3!
s1 port 2 is connected. The memory control device 3s controls a memory 34 that stores shared data among multiple CPUs. 2 (Pi-P4) is connected to CPUI-4 via a shared memory-CPU interface st.

共有メモリ内パス制御装置37は、共有メ峰り〜共有メ
モリインター7エイス6を介し、他系共有メモリの共有
メモリ内パス制御装置と接続され(図示せず)、両系の
共有メモリが同時KIfIiI定0CPUとのデータ転
送を行うよう、同期化制御を行う。
The shared memory path control device 37 is connected to the shared memory path control device of the other system shared memory (not shown) via the shared memory interface 7 and the shared memory interface 6, so that the shared memory of both systems can be connected at the same time. Synchronization control is performed to perform data transfer with the KIfIiI constant 0 CPU.

@fHIJBメモリエクスパンダ40構成〇−例を示し
たtのでToイ。CPυ内パスのアドレス4丁をそのア
ドレスが共有メモリのアドレス(41定アドレス以上の
アドレスが共有メモリに割当てられゐ)かどうかをアド
レス比較−路44にて検出し、共有メモリのアドレスに
て、メモリ起動信4I49を受けると共有メ峰り起動信
号46がオンし、アドレス人、データWDtアドレス/
(ツ7ア1G%書込ミデータパツファllICセツシし
、両系共有メモリM1.M2にアドレス38(A1.A
2)、書込みデータ81 (WDI −WD2 )%起
動信号40 (RIQl、REQi)t−!!出する0
両系共有メモリMl、M!かも、続出しデータ41(a
pl、iDg)、応答信号42(ANSI。
@fHIJB Memory expander 40 configuration 〇-I have shown an example, so I will give it to you. The address comparison path 44 detects whether or not the four addresses of the paths within CPυ are shared memory addresses (addresses greater than or equal to 41 are allocated to the shared memory), and the shared memory address is When the memory start signal 4I49 is received, the share memory start signal 46 turns on, and the address person, data WDt address/
(7A 1G% write data pack ll IC is set and address 38 (A1.A
2), write data 81 (WDI - WD2)% activation signal 40 (RIQl, REQi) t-! ! Output 0
Both systems shared memory Ml, M! Maybe, a series of data 41 (a
pl, iDg), response signal 42 (ANSI.

ムN82Fが:IL送される七、WR出しデータバッフ
ァ1B、13’にデータセットすると共に応答制御回路
43を起動する。応答制御回路43は両系共有メ令9M
1 、M2からの応答がそろうと応答@−It!$2を
CPU内バス29を介して基本演算機構32、入出力制
御機構33に返答する。このとき、l!出しデータ選択
回路12によp前記の方式にで選択され九両系どちらか
のデータが続出しデータ50として出力される。また、
応答制御回路43はタイムアウトエラーの検aSを行−
1l系タイムアクト工ラー検出信号25.2系タイムア
ウト工ラー検出信号26tデータ選択回路12に出カナ
ゐ、tた、データ選択回路12にて両系データ共エラー
検出したときは、エラー信号(ERB)51が応答信号
(AN8)52と共に返答される。
The program N82F sets the data in the WR output data buffers 1B and 13' and activates the response control circuit 43. The response control circuit 43 is a shared mail order 9M for both systems.
1. When the responses from M2 are complete, the response @-It! $2 is returned to the basic calculation mechanism 32 and input/output control mechanism 33 via the CPU internal bus 29. At this time, l! The outgoing data selection circuit 12 selects the data in the above-mentioned manner and outputs the data of either of the nine systems as the successive outgoing data 50. Also,
The response control circuit 43 performs a timeout error check aS.
1l system time act error detection signal 25. 2 system timeout error detection signal 26t is output to the data selection circuit 12. When the data selection circuit 12 detects an error in both system data, an error signal (ERB) is output. ) 51 is replied along with a response signal (AN8) 52.

読出しデータ選択回路12内には後述する優先選択ツリ
ツブフロップが設けられているが、その書キ換えは、レ
ジスタアドレスtaico ADDR>54がそのツリ
ツブ70ツブ用Oレジスタアドレスになっていることt
レジスタアドレスデコード回路(DECODE)45に
て検出しているときくレジスタ書込み信号(Rli:G
 WRITE ) 55がオンすると行われ、レジスタ
デー!(REGDATA)5Bの特定ヒツトが@l”の
ときセット、′″o”oときリセットされる。
The read data selection circuit 12 is provided with a priority selection block flop, which will be described later, and its rewriting requires that the register address taico ADDR>54 become the O register address for the block 70.
When the register address decoding circuit (DECODE) 45 detects the register write signal (Rli:G
WRITE ) 55 is turned on, register day! (REGDATA) Set when the specific hit of 5B is @l'', and reset when ``o''o.

読出しデータ選択回路120詳細構成を第5図に示して
いる。両系共有メ毫りからll!出され、メモリエクス
パンダ内胱出しデータバッファ13゜13’にセットさ
れたデータ14.14’は一エラー検出回路16.18
にでエラーチェックされる。エラーチェックにてエラー
〇あった場合、もしくはタイムアウトエラー検出信−9
25,26がオンO場合、読出しデータエラー検、出信
号17゜19がオンとな〕、その系Oデータt−CPU
へ送ることt禁止し、他系データをCPUへ送るように
する0両系共正常な場合は優先選択7リツプ7ロックZ
ooの出力である読出しデータl優先選択信号21、続
出しデータ2優先選択信号22いずれかオンの方のデー
タt−CPUへ送出する。両系共エラ−〇ときは、両系
読出しデータエラー信号(ERR)20がオンとなる。
The detailed configuration of the read data selection circuit 120 is shown in FIG. From the sharing of both types! The data 14.14' output and set in the bladder output data buffer 13゜13' in the memory expander is detected by an error detection circuit 16.18.
The error will be checked. If there is an error in error check, or timeout error detection signal -9
When 25 and 26 are on, read data error is detected, output signals 17 and 19 are on, and the system O data t-CPU
Prohibit sending data to the other system and send data from other systems to the CPU 0 If both systems are normal, select priority 7 Lip 7 Lock Z
Either the read data 1 priority selection signal 21 or the continuous output data 2 priority selection signal 22, which is the output of oo, is sent to the data t-CPU. When both systems have an error, the read data error signal (ERR) 20 for both systems is turned on.

優先選択フリップ70ツブ100は、そのセット信号2
4がオンし九と自書換えられ、そのデータ信号23が1
1”のをき続出しデータ1遺択信号21がオン、続出し
データ2遺択信号22がオフとなシ、ま九データ信号2
3が@O”のときその逆となる。
The priority selection flip 70 knob 100 has its set signal 2
4 turns on and is rewritten as 9, and the data signal 23 becomes 1.
1", the successive data 1 selection signal 21 is on, the successive data 2 selection signal 22 is off, and the data signal 2 is turned on.
The opposite is true when 3 is @O”.

応答制御回路43の構成を第9図に示している。The configuration of the response control circuit 43 is shown in FIG.

両系共有メモリからの応答の内、まず1系Mlの応答信
号(AN81)5が返信されるとl系応答記憶回路56
を七ッ卜すると共に2系タイムアウト検a$al115
Gヲ起動スル、そ01t2系M20応答信号5′がなけ
れはタイムアウト検出し%2系タイムアウト検出回路6
1がセットされ、2系タイムアウト工ラー信号26がオ
/するが、規定時間内に2系の応答信号5′が返信され
ると、2系タイムアウト検出回路59のリセットを行う
と共に応答信号52がオンとなる。CPUは応答信号5
2t−受けると起動信号をオフとするので共有メモリ起
動信号46もオフとなシ、本応答制御1回路4゛3内0
ζi記憶回路56,57.タイムアウト回路60.61
はリセットされ、初期状態となる。
Among the responses from the shared memory for both systems, when the response signal (AN81) 5 of the 1st system Ml is sent back, the 1st system Ml response memory circuit 56
7 times and 2 system timeout inspection a$115
G is started, and if there is no 01t2 system M20 response signal 5', a timeout is detected and the %2 system timeout detection circuit 6
1 is set and the 2nd system timeout error signal 26 is turned on, but if the 2nd system response signal 5' is returned within the specified time, the 2nd system timeout detection circuit 59 is reset and the response signal 52 is turned on. Turns on. CPU responds with response signal 5
If 2t- is received, the activation signal is turned off, so the shared memory activation signal 46 is also turned off.
ζi storage circuits 56, 57. Timeout circuit 60.61
is reset to its initial state.

次にポート2の構成を第10図に示す、メモリエクスパ
ンダ4からの起動信号(REQ)40がオンすると、共
有メモリ内パスにパス占有要求信号(B −Rli:Q
 I) 64をオンする。パス制御回路30にて各ポー
トからの要求信号を優先判定し、選択され九ポートに対
し、パス占有許可信号(B4ELt )65が出力され
る。ポート2は、この信号を受けると、アドレス、書込
みデータを共有メモリパスにのせ、メモリ起動7リツプ
70ツブ69をセットし、その出力であるメモリ起動信
号66を共有メモリパス36に出力する。メモリ書込み
または読出し動作終了後、絖出しデータ(RD)$7、
応答信号(AN8)68が共有メモリパス36t−介し
て返信されるのでメモリエクスパンダ4へそれらを送出
し、また応答信号68にてメモリ起動7リツプフロツプ
69t−リセットする。
Next, the configuration of the port 2 is shown in FIG. 10. When the activation signal (REQ) 40 from the memory expander 4 is turned on, a path occupation request signal (B - Rli:Q
I) Turn on 64. The path control circuit 30 prioritizes the request signals from each port and outputs a path occupancy permission signal (B4ELt) 65 to the nine selected ports. When the port 2 receives this signal, it puts the address and write data on the shared memory path, sets the memory activation 7 lip 69, and outputs the memory activation signal 66 as its output to the shared memory path 36. After the memory write or read operation is completed, the threading data (RD) $7,
A response signal (AN8) 68 is returned via the shared memory path 36t, so it is sent to the memory expander 4, and the response signal 68 resets the memory activation 7 flip-flop 69t.

以上、実施例の各部の説1jlIを行ったが、メモリア
クセス時Oタイムチャートを第11図に、優先選択ツリ
ツブフロップlOoの書′換え時のタイムチャートを第
12図に示す。なお、両者は同時に行なわれることがな
いよう、プログラム上インターロックされて使用される
The various parts of the embodiment have been described above. FIG. 11 shows a time chart for memory access, and FIG. 12 shows a time chart for rewriting the priority selection tree flop lOo. Note that both are interlocked in the program so that they are not performed at the same time.

次に、本実施例にてどのように優先選択アリラグフロッ
プ100を制御するかの使用例を第13図、第14図を
参照して説明する。
Next, an example of how to control the priority selection alli-lag flop 100 in this embodiment will be described with reference to FIGS. 13 and 14.

第1311はCPO2台系の場合であシ、(A)は全て
0機器が正常時の状態を示し、CPU1は内蔵する優先
選択アリラグフロップをオンし、l系共有メモリMlの
耽出しデータを使用し、CPU2は同じく内蔵する優先
選択7リツプフロツプをオフし、2系共有メモリM2の
−出しデータを使用している。CPUIは大系業務、C
PU2はB系桑務を行っておシ、どちらかの業務が存続
できれとシステムダウンにはならないものとする。図に
おいて実線は読出しデータ使用、破線は続出しデータ使
用せずを示している。また、Ml@故障、M2軽故障は
、メモリエクスパンダにてエラー検出可能なエラーを発
生したときであシ、この場合は(B)、(C)に示す如
く、正しい系の共有メモリのデータが使用されるので、
何ら影響はない。
No. 1311 is for a two-CPO system, (A) shows the state when all 0 devices are normal, CPU1 turns on the built-in priority selection alli-lag flop, and outputs the indulged data in the l-system shared memory Ml. The CPU 2 also turns off the built-in priority selection 7 lip-flop and uses the output data from the 2-system shared memory M2. CPUI is for large-scale business, C
It is assumed that PU2 is carrying out the work of system B, and that the system will not go down in order to ensure that either of the services can continue. In the figure, a solid line indicates that read data is used, and a broken line indicates that continuous data is not used. In addition, Ml @ failure and M2 minor failure occur when a detectable error occurs in the memory expander. In this case, as shown in (B) and (C), the data in the shared memory of the correct system is used, so
There is no effect.

また、Mt重故障、M2重故障は、メモリエクスパンダ
にてエラー検出不可なエラーを発生したときであシ、こ
の場合、そのデータを使用しているCPUは自己合理性
チェック、相互診断チェック等にて異常検出しダウンす
る。しかし、他系のCPUは重故障を発生したメモリの
データを使用しないのでそれぞれ(D)、(E)のごと
く業務を続行することができる。
In addition, Mt major failure and M2 major failure occur when an undetectable error occurs in the memory expander. In this case, the CPU using the data performs self-rationality check, mutual diagnostic check, etc. Detects an abnormality and shuts down. However, since the CPUs of other systems do not use the data in the memory where the major failure occurred, they can continue their work as shown in (D) and (E), respectively.

第14図は、CPU3台で、1台は待機系の場合である
。この場合、共有メモリの軽故障、重故障については第
13図0CP02台のときとほぼ同一であるが、CPU
が故障した場合、優先選択フリップフロツブtプ党グラ
ムにて書換えられるということを利用して次のようなシ
ステム再構成  ゛・・が可能である。今、第14図(
A)において、CPU2が故障にてダウンし九とき、C
PUaは相互監視にてCPU2のダウンを検出し、バッ
クアップtS始するが、このとき、CPU2が共有メモ
リのどちら側を優先選択していなかを調べ(この情報は
各CPUのメインメモリ上のO8の構成管層テーブルに
格納しておく。)本図の場合、2系共有メ401を優先
選択してい九ので、CP!8自身の優先選択アリツブフ
ロップをオフし、2系共有メ−@:9M2のデータを使
用するととによシ第14図(B)のごとく故障前と全く
同等のシステム再構成が可能である。CPUI故障時は
、第14図(C)のごとくなる。
FIG. 14 shows a case where there are three CPUs, one of which is a standby system. In this case, minor failures and major failures in the shared memory are almost the same as in the case of 0CP02 units in Figure 13, but the CPU
If the system fails, the following system reconfiguration is possible by utilizing the fact that the priority selection flip-flop program is rewritten. Now, Figure 14 (
In A), when CPU2 goes down due to a failure, C
PUa detects that CPU2 is down through mutual monitoring and starts backup tS, but at this time, it checks which side of the shared memory is prioritized by CPU2 (this information is stored in O8 on the main memory of each CPU). (It is stored in the configuration pipe layer table.) In the case of this figure, the 2-system shared method 401 is selected as a priority, so the CP! By turning off the priority selection flop of 8 itself and using the data of 2-system shared memory @: 9M2, it is possible to reconfigure the system exactly the same as before the failure, as shown in Figure 14 (B). . When the CPU fails, the situation is as shown in FIG. 14(C).

嬉1saioは、第14図(A)OCPU2/つ7のと
きO手順を示し九ものである。更に注意深くやるならば
、2系共有メモリM2の重故障にてCPU2がダウンし
たかもしれないので、まず最初は1系共有メモリM1の
データを使って一旦システム再構成を行い、共有メモリ
M2t−診断した後、共有メモリM2の内容を使うよう
に切換えることもできる。
Figure 14 (A) shows the O procedure when the OCPU is 2/7. If you were to be more careful, the CPU2 might have gone down due to a serious failure in the 2nd system shared memory M2, so first reconfigure the system using the data in the 1st system shared memory M1, then run the shared memory M2t-diagnosis. After that, it is also possible to switch to using the contents of the shared memory M2.

第16図は本発明の他の実施例であり、第5図と異なる
とζろは、プログラムにて書換え可能な両系データオア
方式指定クリップ70ツブ70を付加していることであ
る。この両系データオア方式指定アリラグフロップ70
をオンさせることにより、第3図の従来例と同じく両系
讐正常時は両系データをオアしてCPUへ送出すること
がで自る。CPUKてそのデータ音チェックしているの
で両系データが相違するとき、エラー検出し、ストップ
する。使用状況によっては、−ったデータが処理装置内
に取込まれることが非常にまずく、むしろ、処理装置全
てストップの方がよいという状況の場合に適する。
FIG. 16 shows another embodiment of the present invention, which differs from FIG. 5 in that a clip 70 for specifying a dual-system data OR method that can be rewritten by a program is added. This dual-system data-OR method specified alli-lag flop 70
By turning on, it is possible to OR the data of both systems and send it to the CPU when both systems are normal, as in the conventional example shown in FIG. Since CPUK checks the data sound, if the data of both systems is different, an error is detected and the process is stopped. Depending on the usage situation, it may be very difficult for the data to be taken into the processing device, and it is suitable for situations where it would be better to stop all the processing devices.

第17図は本発明の更に他O実施例である。どちらの共
有メモリのデータを使用するかを決める、メモリエクス
パンダ内の優先選択フリップ70ツブをスイッチ7sK
[I換え良もので69、スイッチ73がオンのとき、1
系共有メモ!jM1t、。
FIG. 17 shows yet another embodiment of the present invention. Switch 7sK on the priority selection flip 70 knob in the memory expander, which determines which shared memory data is used.
[69 if it is a good replacement, 1 when switch 73 is on
Shared notes! jM1t,.

オフのとき2系共有メそ!JM2t−選択する。本スイ
ッチをオペレータの手元に設置すれは、オペレータ04
1断にて切換えることができる。このように本発明によ
れば、二重化共有メモリの片系にて、データll!出し
時、エラー検出子゛町のデータIllが続発しても、全
てのCPUがダウンすることをさけることができる。ま
た、本発@oiltLい実施例によれif、CPU故障
のバックアップの際にも、故障前と岡等のシステム構成
をとることができ、システムの信II性を大幅に向上さ
せることができる。
Share 2 types when you are off! JM2t-Select. To install this switch at the operator's hand, Operator 04
It can be switched in one turn. As described above, according to the present invention, data ll! is stored in one system of the duplex shared memory. At the time of output, even if data Ill of the error detector occurs one after another, all CPUs can be prevented from going down. Furthermore, according to the present embodiment, even when backing up a CPU after a failure, the system configuration can be the same as before the failure, and the reliability of the system can be greatly improved.

[1110簡単な説明 第imlは、本発明の前提となる一般的な二重化共有メ
そ9を含む複数処理装置の全体構成図、第31aは、本
発@0前提となる処理装置内の共有メ峰り接続機構の構
成図、第゛3図、第4図は、第2rxto両系読出しデ
ータ選択回路の従来例の構成図、第61図は、両系読出
しデータ選択回路の本発明の実施例図、第6図〜菖10
図はそれぞれ本Jjl明に適用される各部の具体的な実
施例の構成図、第till、第1意図は本発明の動作説
明用タイムチャー)、lll5図〜篇1513は本発明
を使用したと亀の制御手順をポリ説明図、第16図、第
17図は第5図に対応する本発明の他の実施例図である
[1110 Brief explanation iml is an overall configuration diagram of a plurality of processing devices including a general duplex shared method 9 which is a premise of the present invention, and No. 31a is a shared memory in the processing device which is a premise of the present invention @0. The configuration diagram of the peak connection mechanism, FIGS. 3 and 4 are the configuration diagrams of the conventional example of the 2nd rxto dual-system read data selection circuit, and FIG. 61 is the embodiment of the present invention of the dual-system read data selection circuit. Figure, Figure 6 ~ Iris 10
The figures are configuration diagrams of specific embodiments of each part applied to this Jjl light, the first intention is a time chart for explaining the operation of the present invention), and Figures 5 to 1513 are diagrams showing the use of the present invention. 16 and 17 are diagrams showing other embodiments of the present invention corresponding to FIG. 5.

l・・・二重化共有メモリ、2・・・共有メモリ儒処堀
装置接続機l11(ボート)、3−・処m装置(CPU
)、4・・・処理装置側共有メモリ接続機all(メモ
リエクスパンダ)、5・・・共有メモリ〜処II装置閲
インタフェース、12・・・耽出しデータ選択回路、1
00・・・優先選択7リツプフロツグ。
1--Duplicated shared memory, 2--Shared memory processing device connection device l11 (boat), 3--Processing device (CPU
), 4... Processing device side shared memory connection device all (memory expander), 5... Shared memory to processing II device viewing interface, 12... Enthusiasm data selection circuit, 1
00...Priority selection 7 lipfrog.

代理人 弁理士 秋本正実 早  5 図 sz 2    − CPc/ t     CP(/2    0PU5C
F(/4第  8  図 早  77 第  !3  国 (C)                    (δ
)(A)
Agent Patent Attorney Masamisaya Akimoto 5 Figure sz 2 - CPc/t CP(/2 0PU5C
F (/4th Figure 8 Early 77th !3 Country (C) (δ
)(A)

Claims (1)

【特許請求の範囲】[Claims] 1、複数OtS厘装置と、該複数O処理装置よp共通に
アクセスされる二重化共有メモリとで構成され、各処理
装置がそれぞれ二重化された共有メモリの両系よシデー
タを読み出し、各データの工2−チェックを行い正常デ
ータを処理装置内に取込む二真化共有メモリ制御装置に
おいて、プログラムまたはそO他の手段にて変更可能な
記憶手段を冬処場装置内に設け、当該記憶手段のオン・
オフ内容によって、両系データ共正常なときどちらのデ
ータを処m義置内に取込むかを決定し、複数処[Ito
中で一部の処理装置は一方の系の共有メモリOデータを
取込み、残n oisML装置は他系の共有メモリのデ
ータを取込むようにしたことt−特徴とする二重化共有
メモリ制御装置。
1. It is composed of multiple OtS processing devices and a duplexed shared memory that is commonly accessed by the multiple OtS processing devices, and each processing device reads data from both systems of the duplicated shared memory and processes each data. 2-In a dual shared memory control device that performs a check and imports normal data into the processing device, a storage device that can be changed by a program or other means is provided in the winter storage device, and the storage device is on·
Depending on the off content, determine which data to import into the processing definition when both system data are normal, and select multiple processing [Ito
A duplex shared memory control device characterized in that some of the processing devices take in data from the shared memory of one system, and the remaining noisML devices take in data from the shared memory of the other system.
JP56112995A 1981-07-21 1981-07-21 Controller for double shared memory Granted JPS5816362A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56112995A JPS5816362A (en) 1981-07-21 1981-07-21 Controller for double shared memory

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56112995A JPS5816362A (en) 1981-07-21 1981-07-21 Controller for double shared memory

Publications (2)

Publication Number Publication Date
JPS5816362A true JPS5816362A (en) 1983-01-31
JPS6113266B2 JPS6113266B2 (en) 1986-04-12

Family

ID=14600782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56112995A Granted JPS5816362A (en) 1981-07-21 1981-07-21 Controller for double shared memory

Country Status (1)

Country Link
JP (1) JPS5816362A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6502167B1 (en) 1999-03-17 2002-12-31 Hitachi, Ltd. Duplicated shared memory controller for disk array
US6564294B1 (en) 1999-03-17 2003-05-13 Hitachi, Ltd. Broadcast system in disk array controller

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6502167B1 (en) 1999-03-17 2002-12-31 Hitachi, Ltd. Duplicated shared memory controller for disk array
US6564294B1 (en) 1999-03-17 2003-05-13 Hitachi, Ltd. Broadcast system in disk array controller
US6629204B2 (en) 1999-03-17 2003-09-30 Hitachi, Ltd. Disk array controller including a plurality of access paths
US6658529B2 (en) 1999-03-17 2003-12-02 Hitachi, Ltd. Broadcast system in disk array controller
US6925532B2 (en) 1999-03-17 2005-08-02 Hitachi, Ltd. Broadcast system in disk array controller

Also Published As

Publication number Publication date
JPS6113266B2 (en) 1986-04-12

Similar Documents

Publication Publication Date Title
US4503535A (en) Apparatus for recovery from failures in a multiprocessing system
US5423024A (en) Fault tolerant processing section with dynamically reconfigurable voting
US3668644A (en) Failsafe memory system
US4503534A (en) Apparatus for redundant operation of modules in a multiprocessing system
CA1176337A (en) Distributed signal processing system
US4466098A (en) Cross channel circuit for an electronic system having two or more redundant computers
US5345566A (en) Method and apparatus for controlling dual bus system
CN100361096C (en) Memory based cross compare for cross checked systems
JPH05242060A (en) Multi-processor and data equalizing method
JP2006024230A (en) Data storage system
US5005172A (en) Diagnostic system in a data processing system
JPS63184146A (en) Information processor
JPS5816362A (en) Controller for double shared memory
JPH06259343A (en) Multiple bus control method and system using the same
GB1595471A (en) Computer system
IE892223A1 (en) Improvements in and relating to stable memory circuits
JP2855633B2 (en) Fault diagnosis device for dual port memory in multiprocessor system
JPS5845116B2 (en) Duplex storage device
JPS6326903B2 (en)
JPH0238969B2 (en)
JP2716571B2 (en) Redundant data security device
JPS63254555A (en) Shared dual memory control system
JPH06259275A (en) Information processor
JPH0635736A (en) Duplex processor
JPH06124242A (en) Duplex shared memory equivalency guarantee system