JP3438986B2 - Multiplexed computer system and failure recovery method - Google Patents

Multiplexed computer system and failure recovery method

Info

Publication number
JP3438986B2
JP3438986B2 JP07880395A JP7880395A JP3438986B2 JP 3438986 B2 JP3438986 B2 JP 3438986B2 JP 07880395 A JP07880395 A JP 07880395A JP 7880395 A JP7880395 A JP 7880395A JP 3438986 B2 JP3438986 B2 JP 3438986B2
Authority
JP
Japan
Prior art keywords
arithmetic processing
synchronization
failure
access
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07880395A
Other languages
Japanese (ja)
Other versions
JPH08278950A (en
Inventor
雄一朗 守田
伸一朗 山口
哲明 中三川
直人 宮崎
壮一 高谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP07880395A priority Critical patent/JP3438986B2/en
Publication of JPH08278950A publication Critical patent/JPH08278950A/en
Application granted granted Critical
Publication of JP3438986B2 publication Critical patent/JP3438986B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、多重化コンピュータシ
ステムに関し、特に、多重化されたコンピュータシステ
ムのいずれかに障害が発生した場合に、発生した障害か
らの回復を迅速に行う多重化コンピュータシステムおよ
び障害回復方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multiplexed computer system, and more particularly to a multiplexed computer system which, when a failure occurs in any of the multiplexed computer systems, quickly recovers from the failure. And a method for recovering from a disaster.

【0002】[0002]

【従来の技術】複数の演算処理装置が同一の演算を同期
して実行する、従来の多重化コンピュータシステムで
は、各演算処理装置が、システムによって与えられるク
ロックに同期した状態で多重化動作を行なう構成になっ
ているため、起動時あるいは動作中における同期化が必
要な場合に、全ての演算処理装置を一斉に同期させる手
段を備えることが必要であった。
2. Description of the Related Art In a conventional multiplexed computer system in which a plurality of arithmetic processing units execute the same arithmetic operation in synchronization, each arithmetic processing unit performs a multiplexing operation in synchronization with a clock given by the system. Because of the configuration, it is necessary to provide a means for simultaneously synchronizing all the arithmetic processing devices when synchronization is required at startup or during operation.

【0003】なお、動作中における同期化は、障害が発
生したために、ある演算処理装置が動作不能となった
り、ある演算処理装置の定期点検を行なったりした後
に、再度多重化動作を行なわせるための再同期を行なう
ために必要となる。
In the synchronization during operation, a certain arithmetic processing unit becomes inoperable due to a failure, or a certain arithmetic processing unit is periodically inspected, and then the multiplexing operation is performed again. It is necessary to resynchronize the.

【0004】そして、例えば2重化動作している全演算
処理装置を同期させる1つの方式として、以下の方式が
一般的に採用されている。
Then, for example, the following method is generally adopted as one method for synchronizing all the arithmetic processing units operating in duplicate.

【0005】すなわち、2重化動作しているコンピュー
タシステムにおいて、動作している演算処理装置(正常
系)が備えるメモリ装置の記憶内容と、動作している演
算処理装置が備えるメモリ装置によって受け取られた全
てのデータとを、動作していない演算処理装置(異常
系)が備えるメモリ装置へ転送し、正常系のメモリ装置
の記憶内容が完全に転送された時点で、両演算処理装置
を同一状態となるように一時的にリセット処理し、両演
算処理装置内において、オペレーティングシステムを再
起動することによって両系の同期化を行う。これに関連
する技術を開示した特許公報例として、特開平3−18
2958号公報等が挙げられる。
That is, in a computer system operating in a duplicated manner, the contents stored in a memory device included in an operating arithmetic processing unit (normal system) and the memory contents included in the operating arithmetic processing unit are received. When all the data and all the data are transferred to the memory device of the non-operational processing device (abnormal system) and the stored contents of the normal memory device are completely transferred, both processing devices are in the same state. Then, the reset processing is performed temporarily so that both systems are synchronized by restarting the operating system in both arithmetic processing units. As an example of a patent publication disclosing a technique related to this, Japanese Patent Laid-Open No. 3-18
No. 2958, etc. are mentioned.

【0006】[0006]

【発明が解決しようとする課題】ところで、多重化され
耐障害性機能を有するコンピュータシステムは、たとえ
そのダウン時間(故障発生から、再度多重化動作を行な
うようになるまでの時間)がいかに短くとも極めて弊害
が大きく、プラント運営コスト等のコストを増大させて
しまうようなシステム、例えば、航空交通管制システム
や核処理プラントの制御等の各種の分野に使用される。
したがって、ダウン時間が長期化すればするほど、シス
テムダウンによってもたらされる実際の弊害や該弊害が
他のシステムの運営に与える潜在的な弊害は増大してし
まうことになる。
By the way, in a computer system which is multiplexed and has a fault tolerance function, no matter how short the down time (the time from the occurrence of a failure to the time when the multiplexing operation starts again) is, no matter how short. It is used in various fields such as an air traffic control system and a control of a nuclear processing plant, which has a great adverse effect and increases costs such as plant operation costs.
Therefore, the longer the down time is, the more the actual adverse effects caused by the system down and the potential adverse effects that the adverse effects have on the operation of other systems.

【0007】しかしながら、上述した従来方式によれ
ば、同期化を行うために全演算処理装置をリセットし、
さらに、起動に時間を要するオペレーティングシステム
を再起動する処理を行なう必要があるために、システム
全体が長時間動作不能となる事態が発生してしまい、弊
害の増大を招いてしまうという問題があった。
However, according to the above-mentioned conventional method, all the arithmetic processing units are reset in order to perform synchronization,
Furthermore, since it is necessary to perform a process of restarting the operating system that requires a long time to boot, the situation in which the entire system becomes inoperable occurs for a long time, which causes a problem. .

【0008】そこで、本発明の目的は、複数の演算処理
装置で構成された多重化コンピュータシステムにおい
て、障害から復旧した演算処理装置を再同期させる際
に、極力短時間内の動作停止で同期化させることを可能
とする多重化コンピュータシステムおよび障害回復方法
を提供することにある。
Therefore, an object of the present invention is, in a multiplexed computer system composed of a plurality of arithmetic processing units, when resynchronizing an arithmetic processing unit that has recovered from a failure, it is possible to synchronize by stopping the operation within the shortest possible time. It is an object of the present invention to provide a multiplexed computer system and a failure recovery method that enable the above.

【0009】[0009]

【課題を解決するための手段】前記目的を達成するため
に、以下のようなシステムが考えられる。
In order to achieve the above object, the following system can be considered.

【0010】すなわち、多重化コンピュータシステム
は、同一の演算処理を同期して行なう複数の演算処理装
置と、前記各演算処理装置に接続され再同期の処理を行
なう同期処理装置と、を備え、前記各演算処理装置は、
他の演算処理装置の、故障からの回復を検出する故障
検出手段と、前記故障回復検出手段が他の演算処理装
置の故障からの回復を検出した場合および自演算処理
装置が故障から回復した場合に、それぞれ、予め定めら
れたアドレスに対するアクセス要求を、自演算処理装置
の同期処理装置に行なう手段と、前記アドレス要求に対
するアクセス許可に応じて、前記アドレスに対するアク
セスを行なうアクセス手段と、を備える。
That is, the multiplexed computer system is provided with a plurality of arithmetic processing devices for synchronously performing the same arithmetic processing and a synchronous processing device connected to each of the arithmetic processing devices for performing resynchronization processing. Each processor is
Other processing units, failure times for detecting recovery from failure
A recovery detection unit, the fault recovery detection means other processing unit, when the case is detected recovery from the failure and the own processor has recovered from the failure, respectively, an access request to a predetermined address , A means for performing the synchronous processing device of the self-processing device, and an access means for accessing the address according to the access permission for the address request.

【0011】そして、同期処理装置前記正常動作す
る演算処理装置による前記アクセス要前記故障から
回復した演算処理装置による前記アクセス要との時間
差が、予め定めた時間差以内である場合には、前記正常
動作する演算処理装置および前記故障から回復した演算
処理装置の双方のアクセス手段に、同時に、前記アクセ
ス許可を与える同期化手段を備える。
[0011] The synchronization processing apparatus, when the time difference between the access requests Prefecture by the access request and by normal operation to the arithmetic processing unit has recovered from the failure processor is within the time difference predetermined Is the above normal
Operating processor and operation recovered from the failure
Both access means of the processing device are provided with a synchronization means for simultaneously giving the access permission.

【0012】[0012]

【0013】[0013]

【0014】[0014]

【0015】また、以下のような障害回復方法も考えら
れる。
The following failure recovery method is also conceivable.

【0016】すなわち、同一演算処理を同期して行なう
演算処理装置のいずれかが故障した場合、故障から回復
した演算処理装置を、他の演算処理装置の演算処理動作
に再同期させる障害回復方法であって、正常動作するい
ずれかの演算処理装置が、他の演算処理装置の故障及び
当該故障からの回復を検出した場合に、予め定められた
アドレスに対するアクセス要求を行なう処理と、故障か
ら回復した演算処理装置が、前記アドレスに対するアク
セス要求を行なう処理と、前記正常動作する演算処理装
による前記アクセス要前記故障から回復した演算
処理装置によるアクセス要との時間差が、予め定めた
時間差以内である場合には、前記正常動作する演算処理
装置及び前記故障から回復した演算処理装置に接続され
た同期処理装置が、前記正常動作する演算処理装置及び
前記故障から回復した演算処理装置に、同時に、前記ア
ドレス要求に対するアクセス許可を与える処理と、 を含
That is, when one of the arithmetic processing devices that performs the same arithmetic processing in synchronization fails, the failure recovery method is to resynchronize the arithmetic processing device recovered from the failure with the arithmetic processing operation of another arithmetic processing device. there, one of the processing units for normal operation, the failure of the other processing units and
When detecting the recovery from the failure, the process will row an access request to a predetermined address, the processing unit has recovered from the failure, the process will row an access request to the address, the normal operation processing the time difference of the access requests Prefecture by the processing unit which recovers processor the access request by from the fault that is, if within a predetermined time difference, wherein for normal operation
Device and the process failed synchronization are connected to the processing unit recovering from device, processing device and the normal operation
At the same time, the above-mentioned
A process of Ru granted permission for the dress request, the free
Mu .

【0017】[0017]

【0018】[0018]

【0019】[0019]

【0020】[0020]

【作用】複数の演算処理装置は、同一演算処理を同期し
て行なっており、各演算処理装置に接続された同期処理
装置は、再同期の処理を行なう。
A plurality of arithmetic processing devices perform the same arithmetic processing in synchronization, and the synchronous processing device connected to each arithmetic processing device performs resynchronization processing.

【0021】演算処理装置が備える故障検出手段は、他
演算処理装置の故障を検出する。
The fault detecting means provided in the arithmetic processing unit detects a fault in another arithmetic processing unit.

【0022】なお、演算処理装置は、故障検出手段
演算処理装置の故障及び当該故障からの回復を検出し
た場合に、予め定められたアドレスに対するアクセス要
求を、例えば、所定時間間隔で行なう。
Note that the arithmetic processing unit has other failure detecting means.
When the failure of the arithmetic processing unit and the recovery from the failure are detected, the access request to the predetermined address is issued at a predetermined time interval, for example.

【0023】また、演算処理装置は、自演算処理装置が
故障から回復した場合、前記アドレスに対するアクセス
要求を行なう。
Further, the arithmetic processing unit issues an access request to the address when the self arithmetic processing unit recovers from the failure.

【0024】さらに、演算処理装置が備えるアクセス手
段は、処理装置からのアクセス許可に対して、前記アド
レスに対するアクセスを行なう。
Further, the access means included in the arithmetic processing unit accesses the address in response to the access permission from the processing unit.

【0025】そして、前記同期処理装置は、前記正常動
作する演算処理装置による前記アクセス要前記故障
から回復した演算処理装置による前記アクセス要との
時間差が、予め定めた時間差以内であ場合には、前記
正常動作する演算処理装置および前記故障から回復した
演算処理装置の双方のアクセス手段に、同時に、前記
クセス許可を与える。
[0025] Then, the synchronization processing apparatus, the time difference between the access requests Prefecture by the arithmetic processing device has recovered from the access request and the failure by the arithmetic processing unit, wherein for normal operation, Ru der within time difference predetermined In this case, the access permission is given to the access means of both the normally operating arithmetic processing unit and the arithmetic processing unit recovered from the failure at the same time .

【0026】なわち、両演算処理装置の動作タイミン
グを調整する。
[0026] ie, to adjust the operation timing of both the processing unit.

【0027】[0027]

【0028】すなわち、再同期手段は、正常動作する演
算処理装置および故障から回復した演算処理装置が備え
るアクセス手段からのアクセスを同期化のための基準信
号とし、両演算処理装置の動作を再同期する。
That is, the resynchronization means resynchronizes the operations of both arithmetic processing devices with the access from the access means provided in the arithmetic processing device operating normally and the arithmetic processing device recovered from the failure as a reference signal for synchronization. To do.

【0029】[0029]

【実施例】以下、本発明にかかる実施例を図面を参照し
て説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0030】図1に、本発明にかかる多重化コンピュー
タシステム10の構成図を示す。
FIG. 1 shows a block diagram of a multiplexed computer system 10 according to the present invention.

【0031】この多重化コンピュータシステム10は、
クロック装置190とA系サブシステム20aとB系サ
ブシステム20bとを有して構成され、さらに、両系サ
ブシステムと端末装置170とは、端末接続装置180
を介して接続されている。
The multiplexed computer system 10 is
It is configured to have a clock device 190, an A system subsystem 20a, and a B system subsystem 20b. Further, both system subsystems and the terminal device 170 are the terminal connection device 180.
Connected through.

【0032】また、A系サブシステム20aは、予め定
められた所定の演算処理を行なう演算処理装置30a
と、複数の多重化バス制御装置100a、110aと複
数のI/O装置160aとを少なくとも備えた構成を有
し、同様に、B系サブシステム20bは、予め定められ
た所定の演算処理を行なう演算処理装置30bと、複数
の多重化バス制御装置100b、110bと、複数のI
/O装置160bとを少なくとも備えた構成を有してい
る。
The A-system subsystem 20a has an arithmetic processing unit 30a for performing a predetermined arithmetic processing.
And at least a plurality of multiplexed bus control devices 100a and 110a and a plurality of I / O devices 160a. Similarly, the B system subsystem 20b performs a predetermined arithmetic processing. The arithmetic processing unit 30b, the plurality of multiplexed bus control units 100b and 110b, and the plurality of I's.
The I / O device 160b is provided at least.

【0033】両系の対応(同一の番号が付された)する
構成要素は、同一の機能を有しており、両系は、同一の
構成となっている。
Corresponding constituent elements of the two systems (having the same numbers) have the same function, and both systems have the same configuration.

【0034】クロック装置190は、同一周波数、か
つ、同一位相を有するクロックを、A系サブシステム2
0aおよびB系サブシステム20bに供給する装置であ
る。
The clock device 190 supplies clocks having the same frequency and the same phase to the A-system subsystem 2
0a and B system subsystem 20b.

【0035】A系サブシステム20aとB系サブシステ
ム20bは、上述したように同一の構成であって、クロ
ック装置190によって供給されるクロックの周期にし
たがって、同一動作、即ち、同期動作を行っている。つ
まり、A系サブシステム20aとB系サブシステム20
bとは、同一の演算処理を行なう2重系動作を行なって
いる。
The A-system subsystem 20a and the B-system subsystem 20b have the same configuration as described above, and perform the same operation, that is, the synchronous operation according to the cycle of the clock supplied by the clock device 190. There is. That is, the A system subsystem 20a and the B system subsystem 20
With b, a double system operation is performed which performs the same arithmetic processing.

【0036】端末装置170は、本装置をオペレータが
操作することによって、例えば、多重化コンピュータシ
ステム10の保守操作を行なえる。
The terminal device 170 can perform maintenance operation of the multiplexed computer system 10, for example, by an operator operating this device.

【0037】ユーザーが、端末装置170を操作するこ
とによって、多重化コンピュータシステム10に、予め
定められた処理を行なうように要求すると、多重化コン
ピュータシステム10は、要求された処理をA系サブシ
ステム20aとB系サブシステム20bの双方で同時に
実行する。このため、一方のサブシステムに故障が発生
して処理が停止したとしても、他方のサブシステムによ
り、処理が継続して実行され、要求した処理が行なわれ
ることになる。
When the user operates the terminal device 170 to request the multiplexed computer system 10 to perform a predetermined process, the multiplexed computer system 10 performs the requested process. 20a and the B subsystem 20b are executed simultaneously. For this reason, even if a failure occurs in one subsystem and the processing is stopped, the processing is continuously executed by the other subsystem and the requested processing is performed.

【0038】さらに詳細な構成を述べると、A系サブシ
ステム20aは、さらに、複数のI/O装置160aを
接続するI/Oバス140aと、I/O装置160aや
端末接続装置180をI/Oバス140aに接続するI
/Oインターフェース150aと、複数のI/O装置1
60aによるDMAアクセス(Direct Memory Access)
を調停する機能を有するI/Oバス制御装置130a
と、I/Oバス制御装置130aとA系の多重化バス制
御装置100aとB系の多重化バス制御装置100bと
を接続する多重化バス120aと、I/Oバス制御装置
130bとA系の多重化バス制御装置110aとB系の
多重化バス制御装置110bとを接続する多重化バス1
20bと、I/O装置160aのDMAアクセスと演算
処理装置30aのPIOアクセスとを調停する多重化バ
ス制御装置100aと、I/O装置160bのDMAア
クセスと演算処理装置30aのPIOアクセスとを調停
する多重化バス制御装置110aと、演算処理装置30
aと多重化バス制御装置100aと多重化バス制御装置
110aを接続するシステムバス90aとを備えてい
る。
More specifically, the A-system subsystem 20a further includes an I / O bus 140a for connecting a plurality of I / O devices 160a, an I / O device 160a, and a terminal connecting device 180. I connected to the O-bus 140a
/ O interface 150a and a plurality of I / O devices 1
DMA access by 60a (Direct Memory Access)
I / O bus controller 130a having a function of arbitrating
Of the I / O bus controller 130a, the A-system multiplexed bus controller 100a and the B-system multiplexed bus controller 100b, and the I / O bus controller 130b and the A-system multiplexed bus 120a. Multiplexed bus 1 for connecting the multiplexed bus controller 110a and the B-system multiplexed bus controller 110b
20b, the multiplex bus controller 100a that arbitrates the DMA access of the I / O device 160a and the PIO access of the arithmetic processing device 30a, and the DMA access of the I / O device 160b and the PIO access of the arithmetic processing device 30a. Multiplexing bus control device 110a and arithmetic processing device 30
a, a multiplex bus control device 100a, and a system bus 90a for connecting the multiplex bus control device 110a.

【0039】なお、図を見れば分かるように、B系サブ
システム20bもA系サブシステム20aと同一の構成
であるので、A系サブシステム20a側のみについて、
その構成を説明する。
As can be seen from the figure, since the B system subsystem 20b has the same configuration as the A system subsystem 20a, only the A system subsystem 20a side is
The configuration will be described.

【0040】また、信号線105は、多重化バス制御装
置100aと多重化バス制御装置100bとの間で、多
重化バス制御装置に与える制御信号を互いに送受信する
ための信号線であり、信号線115は、多重化バス制御
装置110aと多重化バス制御装置110bとの間で、
多重化バス制御装置に与える制御信号を互いに送受信す
るための信号線である。
Further, the signal line 105 is a signal line for transmitting and receiving a control signal to be given to the multiplex bus control device between the multiplex bus control device 100a and the multiplex bus control device 100b. The reference numeral 115 indicates between the multiplexed bus control device 110a and the multiplexed bus control device 110b.
It is a signal line for transmitting and receiving control signals to and from the multiplexed bus control device.

【0041】また、演算処理装置30aは、供給される
クロックの同期にしたがって同一処理を行う2台のプロ
セッサ40aと50aと、メモリ装置60aと、系間イ
ンターフェイス80aと、所定のプログラムが内蔵され
ているROM88aとを有して構成され、さらに、コン
トロールユニット70aには、システムバス90aが、
また、系間インターフェイス80aには、系間バス85
が接続されている。
Further, the arithmetic processing unit 30a contains two processors 40a and 50a which perform the same processing in synchronization with the supplied clock, a memory device 60a, an intersystem interface 80a, and a predetermined program. And a ROM 88a that is included in the control unit 70a.
The intersystem interface 80a includes an intersystem bus 85.
Are connected.

【0042】コントロールユニット70aは、2台のプ
ロセッサ40aとプロセッサ4050aとから出力され
る出力データを比較して、それらのデータが不一致なら
ばプロセッサ40aまたはプロセッサ50aにおいて、
エラーが発生したと判断するエラー検出機能、メモリ装
置60aのエラーをECCコードにより検出する機能、
および、システムバス90aの故障(エラー)をパリテ
ィチェックにより検出する機能を備えている。演算処理
装置30bは、演算処理装置30aと同一の構成要素を
有しているため、演算処理装置30aと同様な機能を有
する。なお、本発明においては、エラー検出機能は本質
的なものではないので、その詳細な説明は省略すること
にする。
The control unit 70a compares the output data output from the two processors 40a and 4050a, and if the data do not match, the processor 40a or the processor 50a
An error detection function that determines that an error has occurred, a function that detects an error in the memory device 60a using an ECC code,
It also has a function of detecting a failure (error) of the system bus 90a by a parity check. The arithmetic processing device 30b has the same components as the arithmetic processing device 30a, and thus has the same function as the arithmetic processing device 30a. In the present invention, the error detection function is not essential, so a detailed description thereof will be omitted.

【0043】また、演算処理装置30aと演算処理装置
30bとが備える系間インターフェース80aと80b
は、サブシステムの動作状態等の情報を互いに交換する
ためのインターフェースとして機能する。系間インター
フェース80aと80bとの間の情報の伝送は、系間バ
ス85を介して行なわれる。
Further, intersystem interfaces 80a and 80b provided in the arithmetic processing unit 30a and the arithmetic processing unit 30b.
Functions as an interface for exchanging information such as the operating state of subsystems with each other. Information transmission between the inter-system interfaces 80a and 80b is performed via the inter-system bus 85.

【0044】信号線880aは、系間インターフェース
80aがサブシステムの動作状態を、多重化バス制御装
置100aおよび多重化バス制御装置110aに通知す
るための信号線であり、信号線880bは、系間インタ
ーフェース80bがサブシステムの動作状態を、多重化
バス制御装置100bおよび多重化バス制御装置110
bに通知するための信号線であり、両信号線は、同一の
役目を行なう。
The signal line 880a is a signal line for the intersystem interface 80a to notify the operating state of the subsystem to the multiplex bus control device 100a and the multiplex bus control device 110a, and the signal line 880b is an intersystem line. The interface 80b indicates the operating states of the subsystems by the multiplexed bus controller 100b and the multiplexed bus controller 110.
It is a signal line for notifying b, and both signal lines perform the same role.

【0045】系間インターフェース80a、80bに
は、それぞれ、立ち上げ処理プログラムおよび障害回復
処理プログラムとを少なくとも、予め内蔵するROM8
8a、88bが備えられている。前記立ち上げ処理プロ
グラムは、サブシステムを起動するためのプログラムで
あり、サブシステムの起動時に実行される。また、前記
障害回復処理プログラムは、例えば、一方のサブシステ
ムに故障が発生したために動作が停止した場合、サブシ
ステムの故障部分を、システムの保守者であるユーザ等
が交換した後、処理を継続している他方のサブシステム
と再び同期動作を行わせる(これを「同期化」あるいは
「再同期」と称する)ために実行させるプログラムであ
る。なお、前記立ち上げ処理プログラム、障害回復処理
プログラムの実行開始は、例えば、端末装置170の操
作により指示すれば行なわれるように、システム構成を
行なっておけば良い。
The inter-system interfaces 80a and 80b respectively include at least a start-up processing program and a failure recovery processing program in advance in the ROM 8
8a and 88b are provided. The startup processing program is a program for starting the subsystem, and is executed when the subsystem is started. Further, the failure recovery processing program, for example, when the operation is stopped due to a failure in one subsystem, continue the processing after the user who is the system maintainer replaces the failed part of the subsystem. This program is executed in order to perform the synchronization operation again with the other subsystem that is operating (this is referred to as "synchronization" or "resynchronization"). The system configuration may be configured such that the start-up processing program and the failure recovery processing program are started by, for example, being operated by operating the terminal device 170.

【0046】次に、図2を参照して、特に本発明の主要
部である系間インターフェース80aおよび系間インタ
ーフェース80b、さらには、その付随構成要素構成の
構成および動作を説明する。
Next, with reference to FIG. 2, the configuration and operation of the intersystem interface 80a and intersystem interface 80b, which are the main part of the present invention, and the configuration and operation of their associated components will be described.

【0047】系間インターフェース80aは、A系演算
処理装置30aおよびB系演算処理装置30bの双方が
同期動作中であることを示すフラグである同期フラグ8
1aと、B系の演算処理装置30bがA系の演算処理装
置30aに対して同期化を要求していることを示すフラ
グである同期化要求フラグ82aと、A系の演算処理装
置30aがB系の演算処理装置30bに対して同期化を
要求していることを示すフラグである同期待ちフラグ8
3aと、A系の演算処理装置30aが故障したことを示
すフラグである故障フラグ84aと、A系の演算処理装
置30aが障害からの復旧中であることを示すフラグで
ある復旧フラグ89aと、各種の論理演算素子とを有し
て構成される。
The inter-system interface 80a is a synchronization flag 8 which is a flag indicating that both the A-system arithmetic processing unit 30a and the B-system arithmetic processing unit 30b are in synchronous operation.
1a, a synchronization request flag 82a, which is a flag indicating that the B-system arithmetic processing unit 30b requests the A-system arithmetic processing unit 30a for synchronization, and the A-system arithmetic processing unit 30a stores B Synchronization wait flag 8 which is a flag indicating that the system arithmetic processing unit 30b is requested to be synchronized.
3a, a failure flag 84a that is a flag that indicates that the A-system arithmetic processing device 30a has failed, and a recovery flag 89a that is a flag that indicates that the A-system arithmetic processing device 30a is recovering from the failure. It is configured to have various logical operation elements.

【0048】信号線73aは、コントロールユニット7
0aが、A系の演算処理装置30aで発生したエラーを
検出したことを系間インターフェース80aに通知する
エラー検出信号を伝送する信号線であり、信号線86a
は、A系の演算処理装置30aおよびB系の演算処理装
置30bの双方が同期化を試みる状態であることを、系
間インターフェース80aが多重化バス制御装置100
aと110aに通知する同期化モード信号を送信する信
号線であり、さらに、信号線108aは、多重化バス制
御装置100aまたは110aが、系間インターフェー
ス80aに、同期化の成功を通知する同期化成功信号を
伝送する信号線である。
The signal line 73a is connected to the control unit 7
0a is a signal line for transmitting an error detection signal notifying the inter-system interface 80a that an error occurred in the A-system arithmetic processing device 30a has been detected.
Indicates that both the A-system arithmetic processing unit 30a and the B-system arithmetic processing unit 30b are in a state of attempting synchronization, and the intersystem interface 80a indicates that the multiplex bus control unit 100
a and 110a is a signal line for transmitting a synchronization mode signal, and the signal line 108a is a synchronization line for the multiplexing bus control device 100a or 110a to notify the intersystem interface 80a of successful synchronization. It is a signal line that transmits a success signal.

【0049】系間インターフェース80bも同様な構成
である。
The intersystem interface 80b has the same structure.

【0050】故障フラグ84aは、信号線73a上のエ
ラー検出信号73aがアサートされるとセットされ、プ
ロセッサ40a、50aによるレジスタライト動作によ
ってリセットされる。
The fault flag 84a is set when the error detection signal 73a on the signal line 73a is asserted and reset by the register write operation by the processors 40a and 50a.

【0051】同様に、故障フラグ84bは、信号線73
b上のエラー検出信号がアサートされるとセットされ、
プロセッサ40b、50bによるレジスタライト動作に
よって、リセットされる。
Similarly, the failure flag 84b indicates that the signal line 73
Set when the error detect signal on b is asserted,
It is reset by the register write operation by the processors 40b and 50b.

【0052】同期フラグ81aは、同期化要求フラグ8
2aと同期待ちフラグ83aがセットされている場合で
あって、同期化成功信号108aがアサートされるとセ
ットされる。ここで各種フラグのセットとは、各フラグ
の内容として、例えば、デジタル信号「1」が格納され
た状態、また、リセットとは、各フラグの内容として、
デジタル信号「0」が格納された状態に対応すると考え
れば良い。また、そのように、セット、リセット動作が
行なわれる。
The synchronization flag 81a is the synchronization request flag 8
2a and the synchronization wait flag 83a are set, and are set when the synchronization success signal 108a is asserted. Here, the setting of various flags means the content of each flag, for example, a state in which the digital signal “1” is stored, and the reset means the content of each flag.
It may be considered that it corresponds to the state in which the digital signal “0” is stored. In addition, the set and reset operations are performed in this way.

【0053】本実施例では、ORゲートは、リセットス
イッチとして機能する、即ち、ORゲート出力(出力
「1」の状態)によってリセット動作が行なわれ、AN
Dゲートは、セットスイッチとして機能する、即ち、A
NDゲート出力(出力「1」の状態)によってリセット
動作が行なわれるものとする。
In this embodiment, the OR gate functions as a reset switch, that is, the OR gate output (state of output "1") performs the reset operation, and AN
The D gate functions as a set switch, that is, A
It is assumed that the reset operation is performed by the ND gate output (state of output "1").

【0054】同様に、同期フラグ81bは、同期化要求
フラグ82bと同期待ちフラグ83bがセットされてい
る場合であって、同期化成功信号108bがアサートさ
れるとセットされる。
Similarly, the synchronization flag 81b is set when the synchronization request flag 82b and the synchronization wait flag 83b are set and the synchronization success signal 108b is asserted.

【0055】故障フラグ84aまたは84bがセットさ
れると、同期フラグ81aと81bの双方ともがリセッ
トされる。同期化要求フラグ82bと同期待ちフラグ8
3aと復旧フラグ89aとは、プロセッサ40a、50
aによるレジスタライト動作によって、セット/リセッ
トされる。
When the failure flag 84a or 84b is set, both the synchronization flags 81a and 81b are reset. Synchronization request flag 82b and synchronization wait flag 8
3a and the recovery flag 89a indicate that the processors 40a, 50
It is set / reset by the register write operation by a.

【0056】同様に、同期化要求フラグ82aと同期待
ちフラグ83bと復旧フラグ89bとは、プロセッサ4
0b、50bによるレジスタライト動作でセット/リセ
ットされる。
Similarly, the synchronization request flag 82a, the synchronization wait flag 83b, and the recovery flag 89b indicate the processor 4
It is set / reset by the register write operation by 0b and 50b.

【0057】プロセッサ40a、50aと40b、50
bは、図2に示す総てのフラグの状態をレジスタリード
動作により調べることが可能である。
Processors 40a, 50a and 40b, 50
b, the state of all the flags shown in FIG. 2 can be checked by the register read operation.

【0058】同期化モード信号86aは、同期化要求フ
ラグ82aと同期待ちフラグ83aとがセットさるとア
サートされ、同期化要求フラグ82a、または、同期待
ちフラグ83aがリセットされるとネゲートされる。同
様に、同期化モード信号86bは、同期化要求フラグ8
2bと同期待ちフラグ83bとがセットさるとアサート
され、同期化要求フラグ82b、または、同期待ちフラ
グ83bがリセットされるとネゲートされる。
The synchronization mode signal 86a is asserted when the synchronization request flag 82a and the synchronization wait flag 83a are set, and negated when the synchronization request flag 82a or the synchronization wait flag 83a is reset. Similarly, the synchronization mode signal 86b includes the synchronization request flag 8
It is asserted when 2b and the synchronization wait flag 83b are set, and negated when the synchronization request flag 82b or the synchronization wait flag 83b is reset.

【0059】このような動作によって、故障の検出を行
ない、同期化を行なうために多重化制御装置側に同期化
モード信号を出力し、同期化が成功した場合には、多重
化制御装置側から同期化成功信号を受信する処理を行な
うことができる。
By such an operation, a failure is detected, a synchronization mode signal is output to the multiplexing control device side for synchronization, and when the synchronization is successful, the multiplexing control device side The process of receiving the synchronization success signal can be performed.

【0060】次に、図3に、本発明にかかる多重化バス
制御装置100aおよび100b、さらに、その周辺構
成要素の構成図を示す。
Next, FIG. 3 shows a configuration diagram of the multiplexed bus control devices 100a and 100b according to the present invention and peripheral components thereof.

【0061】多重化バス制御装置100aは、アドレス
/データバッファ101aと、演算処理装置30aおよ
びI/Oバス制御装置130a間のアクセスを調停する
調停手段102aと、演算処理装置30aと演算処理装
置30bの同期化を行う同期化手段103aとを有して
構成される。
The multiplexed bus controller 100a includes an address / data buffer 101a, an arbitration unit 102a for arbitrating access between the arithmetic processing unit 30a and the I / O bus controller 130a, an arithmetic processing unit 30a and an arithmetic processing unit 30b. And a synchronization means 103a for performing synchronization.

【0062】同期化手段103aと系間インターフェイ
ス80aとは、前述した、信号線86a、信号線108
aによって接続されており、それぞれの信号線に対応す
る信号が送受信されている。
The synchronizing means 103a and the inter-system interface 80a are connected to the signal line 86a and the signal line 108 described above.
They are connected by a, and signals corresponding to the respective signal lines are transmitted and received.

【0063】また、図3に示す信号線91aと信号線9
2aと信号線93aは、それぞれシステムバス90aを
構成する信号線であり、信号線91aは、アドレス/デ
ータ情報を伝送する信号線であるアドレス/データ線、
信号線92aは、演算処理装置30aから多重化バス制
御装置100aへのアクセス要求信号を伝送する信号
線、信号線93aは、多重化バス制御装置100aから
演算処理装置30aへのアクセス許可信号を伝送する信
号線である。
The signal line 91a and the signal line 9 shown in FIG.
2a and the signal line 93a are signal lines which respectively configure the system bus 90a, and the signal line 91a is an address / data line which is a signal line for transmitting address / data information,
The signal line 92a is a signal line for transmitting an access request signal from the arithmetic processing unit 30a to the multiplex bus controller 100a, and the signal line 93a is a signal line for transmitting an access permission signal from the multiplex bus controller 100a to the arithmetic processing unit 30a. Signal line.

【0064】また、信号線121aと信号線122aと
信号線123aは、それぞれシステムバス90aを構成
する信号線であり、信号線121aは、アドレス/デー
タ情報を伝送する信号線であるアドレス/データ線と、
信号線122aは、I/Oバス制御装置130aから多
重化バス制御装置100aへのアクセス要求信号を伝送
する信号線、信号線123aは、多重化バス制御装置1
00aからI/Oバス制御装置130aへのアクセス許
可信号を伝送する信号線である。
Further, the signal line 121a, the signal line 122a and the signal line 123a are signal lines constituting the system bus 90a, and the signal line 121a is an address / data line which is a signal line for transmitting address / data information. When,
The signal line 122a is a signal line for transmitting an access request signal from the I / O bus controller 130a to the multiplexed bus controller 100a, and the signal line 123a is the multiplexed bus controller 1
A signal line for transmitting an access permission signal from 00a to the I / O bus controller 130a.

【0065】信号線106aは、調停手段102aが演
算処理装置30aにアクセス権を与えることを決定した
ことを示すアクセス可能信号を、B系に伝送する信号線
である。多重化バス制御装置100aは、演算処理装置
30aおよびI/Oバス制御装置130aから、アクセ
ス要求を行なうためにアクセス要求信号が出力される
と、調停手段102aによって、アクセス要求の調停を
行う。
The signal line 106a is a signal line for transmitting to the B system an accessible signal indicating that the arbitration means 102a has decided to give the arithmetic processing unit 30a an access right. When the access request signal for outputting an access request is output from the arithmetic processing unit 30a and the I / O bus control unit 130a, the multiplexed bus control device 100a arbitrates the access request by the arbitration means 102a.

【0066】調停手段102aが、演算処理装置30a
にアクセス権を与えることを決定した場合、調停手段1
02aは、アクセス可能信号(106a)をアサートす
る。
The arbitration means 102a is the arithmetic processing unit 30a.
Arbitration means 1 when it is decided to give access right to
02a asserts the accessible signal (106a).

【0067】アクセス可能信号(106a)がアサート
されると、同期化手段103aは、後に説明する制御動
作によって、アクセス許可信号(信号線93a)をアサ
ートする。そして、調停手段102aは、アクセス許可
信号93aがアサートされると、アクセス可能信号10
6aをネゲートする。
When the access enable signal (106a) is asserted, the synchronization means 103a asserts the access permission signal (signal line 93a) by the control operation described later. Then, when the access permission signal 93a is asserted, the arbitration unit 102a receives the access enable signal 10
6a is negated.

【0068】一方、調停手段102aがI/Oバス制御
装置130aにアクセス権を与えることを決定した場
合、調停手段102aは、アクセス許可信号(123
a)をアサートする。
On the other hand, when the arbitration means 102a decides to give the access right to the I / O bus controller 130a, the arbitration means 102a causes the access permission signal (123).
Assert a).

【0069】なお、多重化バス制御装置100b、11
0aおよび11bも、上述したような、多重化バス制御
装置100aと同様の動作を行なう。
The multiplexed bus control devices 100b, 11
0a and 11b perform the same operation as that of the multiplexed bus control device 100a as described above.

【0070】また、演算処理装置30aと演算処理装置
30bとが同期動作中であれば、多重化バス制御装置1
00aと多重化バス制御装置100bの動作も同期して
行なわれる。多重化バス制御装置100aと多重化バス
制御装置100bは、システムの立ち上げ時に、それぞ
れ、プライマリ・モードとセカンダリ・モードに設定さ
れる。プライマリ・モードでは、多重化バス120aに
よる信号の入出力が可能な状態である。また、セカンダ
リ・モードは、多重化バス120aからの、信号の入力
のみが可能状態であり、多重化バス120aへの、信号
の出力は不可能である。
If the arithmetic processing unit 30a and the arithmetic processing unit 30b are operating in synchronization, the multiplexed bus control unit 1
00a and the operation of the multiplexed bus control device 100b are also performed in synchronization. The multiplexed bus control device 100a and the multiplexed bus control device 100b are set to the primary mode and the secondary mode, respectively, when the system is started up. In the primary mode, signals can be input / output through the multiplexed bus 120a. In the secondary mode, only signals can be input from the multiplexing bus 120a, and signals cannot be output to the multiplexing bus 120a.

【0071】すなわち、演算処理装置30aと演算処理
装置30bの双方の装置から、同時にI/Oバス制御装
置130aへアクセスを行なう場合、実際には、演算処
理装置30aのみがアクセス動作を行ない、I/Oバス
制御装置130aから、演算処理装置30aと演算処理
装置30bへのアクセスは同時に行われる。
That is, when the I / O bus controller 130a is accessed simultaneously from both the arithmetic processing unit 30a and the arithmetic processing unit 30b, only the arithmetic processing unit 30a actually performs the access operation. The / O bus controller 130a simultaneously accesses the arithmetic processing units 30a and 30b.

【0072】以上のように、多重化バス制御装置は、演
算装置およびI/Oバス制御装置からのアクセス要求の
調停、調停手段が自系の演算処理装置にアクセス権を与
えることを、他系に伝える動作、演算処理装置へのアク
セス許可信号を伝送する動作等を行なう。
As described above, the multiplex bus controller arbitrates access requests from the arithmetic unit and the I / O bus controller, and the arbitration means gives the access right to the arithmetic processing unit of its own system. And an operation of transmitting an access permission signal to the arithmetic processing unit.

【0073】次に図4に、同期化手段103aの構成を
示す。同期化手段103aは、コントロール部1031
aとタイマー部1032aとを有して構成される。
Next, FIG. 4 shows the structure of the synchronization means 103a. The synchronization means 103a includes a control unit 1031
a and a timer unit 1032a.

【0074】タイマー部1032aは、調停手段102
aがアクセス可能信号106aをアサートしてから、予
めユーザーが設定したタイムアウト時間内に、調停手段
102bがアクセス可能信号106bをアサートしなか
ったことをコントロール部1031aに通知する機能を
有する。
The timer section 1032a has an arbitration means 102.
It has a function of notifying the control unit 1031a that the arbitration means 102b has not asserted the accessible signal 106b within a timeout time set in advance by the user after the a has asserted the accessible signal 106a.

【0075】すなわち、タイマー部1032aは、アク
セス可能信号106aがアサートされると内蔵する、時
間を計測する機能を有する時間計測手段(図示せず)を
起動し、起動時から予め定めたタイムアウト時間が経過
するとタイムアウト信号(1033a)をアサートし、
また、アクセス可能信号106bがアサートされると、
前記時間計測手段がリセットされる。タイムアウト時間
の設定は、タイマー部1032aが備えるレジスタへの
書き込み操作によって行うことができるようにしておけ
ばよい。
That is, the timer unit 1032a activates a time measuring means (not shown) having a function of measuring time, which is built in when the accessible signal 106a is asserted, and a predetermined time-out time from the time of activation. When the time has passed, assert the timeout signal (1033a),
Also, when the accessible signal 106b is asserted,
The time measuring means is reset. The timeout time may be set by a writing operation to a register included in the timer unit 1032a.

【0076】コントロール部1031aは、同期化モー
ド信号(86a)、アクセス可能信号(106a)、ア
クセス可能信号(106b)、および、タイマー部10
32aからのタイムアウト信号(1033a)を入力
し、これらの入力信号に基いて、アクセス許可信号(9
3a)と同期化成功信号(108a)を出力する処理を
行なう。
The control unit 1031a includes the synchronization mode signal (86a), the accessible signal (106a), the accessible signal (106b), and the timer unit 10.
The time-out signal (1033a) from 32a is input, and the access permission signal (9
3a) and a synchronization success signal (108a) are output.

【0077】コントロール部1031aは、各種の論理
素子の組み合わせ回路で実現でき、コントロール部10
31aにおける具体的な制御動作の態様は、以下に示す
ものがある。
The control unit 1031a can be realized by a combinational circuit of various logic elements,
The specific control operation mode in 31a is as follows.

【0078】(1)第1のケース:同期化モード信号8
6aがアサートされていない場合には、アクセス可能信
号(106a)がアサートされると、コントロール部1
031aは、アクセス許可信号93aのみをアサートす
る。
(1) First case: synchronization mode signal 8
When the accessible signal (106a) is asserted when 6a is not asserted, the control unit 1
031a asserts only the access permission signal 93a.

【0079】(2)第2のケース:同期化モード信号
(86a)がアサートされ、かつ、アクセス可能信号
(106a)とアクセス可能信号(106b)がアサー
トされた場合、コントロール部(1031a)は、アク
セス許可信号(93a)と同期化成功信号(108a)
をアサートする。
(2) Second case: When the synchronization mode signal (86a) is asserted and the access enable signal (106a) and the access enable signal (106b) are asserted, the control unit (1031a) Access permission signal (93a) and synchronization success signal (108a)
Assert.

【0080】(3)第3のケース:同期化モード信号
(86a)がアサートされ、かつ、アクセス可能信号
(106a)とタイムアウト信号(1033a)がアサ
ートされた場合、コントロール部(1031a)は、ア
クセス許可信号93aのみをアサートする。
(3) Third case: When the synchronization mode signal (86a) is asserted, and the access enable signal (106a) and the timeout signal (1033a) are asserted, the control unit (1031a) Only the permission signal 93a is asserted.

【0081】以上のように、同期化手段は、各種の信号
に基づいて同期化成功信号(108a)をアサートし、
該信号を系間インターフェイスに伝える機能を有する。
As described above, the synchronization means asserts the synchronization success signal (108a) based on various signals,
It has a function of transmitting the signal to the inter-system interface.

【0082】次に、図5に、B系演算処理装置30bに
エラーが発生した場合の、障害回復処理プログラムの実
行による障害回復動作を説明するためのフローチャート
を示す。
Next, FIG. 5 shows a flowchart for explaining the failure recovery operation by executing the failure recovery processing program when an error occurs in the B-system arithmetic processing unit 30b.

【0083】図中、左側には、A系演算処理装置におけ
る動作、右側には、B系演算処理装置における動作を示
す。
In the figure, the left side shows the operation in the A system arithmetic processing device, and the right side shows the operation in the B system arithmetic processing device.

【0084】まず、B系演算処理装置30bにおいてエ
ラー(故障の発生)が検出されると(ステップ501
0)、エラー検出信号(73b)がアサートされ、故障
フラグ84bがセットされる(ステップ5020)。
First, when an error (occurrence of a failure) is detected in the B-system arithmetic processing unit 30b (step 501)
0), the error detection signal (73b) is asserted, and the failure flag 84b is set (step 5020).

【0085】さらに、ステップ5030において、同期
フラグ81aと81bがリセットされる。
Further, in step 5030, the synchronization flags 81a and 81b are reset.

【0086】そして、B系演算処理装置30bは、処理
を停止し(ステップ5040)、A系演算処理装置30
aが、単独で処理を継続することになる。この時点で、
2重系動作が行なわれなくなる。
Then, the B-system arithmetic processing unit 30b stops the processing (step 5040), and the A-system arithmetic processing unit 30b
a independently continues the processing. at this point,
Double system operation is not performed.

【0087】システムの保守管理を行なうユーザーは、
B系演算処理装置30bの故障部分、例えば、故障した
プロセッサやメモリ等を、正常動作する同一の機能を有
するデバイスと交換する作業を行ない(ステップ505
0)、作業完了後に、端末装置170の操作等によっ
て、B系演算処理装置30bを起動する(ステップ50
60)。
The user who manages the system is
Work is performed to replace a failed part of the B-system arithmetic processing unit 30b, such as a failed processor or memory, with a device having the same function and operating normally (step 505).
0), after the work is completed, the B-system arithmetic processing device 30b is activated by operating the terminal device 170 or the like (step 50).
60).

【0088】なお、B系演算処理装置30bの起動は、
端末装置170の操作により行なえるようにシステムを
構成してもよいし、B系演算処理装置30bに起動スイ
ッチを設け、この起動スイッチの操作によって、起動操
作に対応した処理を行なうプログラムを実行するように
しておいてもよい。
The B-system arithmetic processing unit 30b is started up as follows.
The system may be configured so that the operation can be performed by operating the terminal device 170, or a startup switch is provided in the B-system arithmetic processing device 30b, and a program that performs a process corresponding to the startup operation is executed by operating the startup switch. You may leave it like this.

【0089】さて、B系演算処理装置30bは、起動操
作が行なわれると、ROM88bに内蔵してある、初期
化プログラムの実行により、プロセッサ40b、50b
が備えるキャッシュメモリやメモリ装置60bの記憶内
容等をクリアするとともに、故障フラグ84bをリセッ
トし、復旧フラグ89aをセットする(ステップ507
0)。
When the start-up operation is performed, the B-system arithmetic processing unit 30b executes the initialization program contained in the ROM 88b to cause the processors 40b and 50b to operate.
The cache memory provided in the memory device and the storage contents of the memory device 60b are cleared, the failure flag 84b is reset, and the recovery flag 89a is set (step 507).
0).

【0090】一方、A系演算処理装置30aのプロセッ
サ40a、50aは、例えば、通常行なっている処理の
合間をみて、B系の故障フラグ84bの内容を適宜リー
ドして監視する動作を行なっている(ステップ508
0)。もちろん、所定時間間隔で故障フラグ84bの内
容をリードして監視する動作を行なうようにしても良
い。
On the other hand, the processors 40a and 50a of the A-system arithmetic processing unit 30a perform an operation of appropriately reading and monitoring the contents of the B-system failure flag 84b, for example, while watching the normally performed processing. (Step 508
0). Of course, the operation of reading and monitoring the content of the failure flag 84b may be performed at predetermined time intervals.

【0091】そして、故障フラグ84bがリセットされ
た場合(5090)、メモリ装置60aの内容を、メモ
リ装置60bにコピーするメモリコピー処理を行う(ス
テップ5100)。
When the failure flag 84b is reset (5090), a memory copy process for copying the contents of the memory device 60a to the memory device 60b is performed (step 5100).

【0092】メモリコピー処理とは、プロセッサ40
a、50aが、メモリ装置60aを一定領域単位に所定
時間間隔でリードし、リードした内容を、コントロール
ユニット70a、システムバス90a、多重化バス制御
装置100aと110a、多重化バス120aと120
bを介し、さらに、多重化バス制御装置100bと11
0b、システムバス90b、コントロールユニット70
bを介して、メモリ装置60bにライトする処理であ
る。
The memory copy process is the processor 40.
a and 50a read the memory device 60a in units of a predetermined area at predetermined time intervals, and the read contents are read by the control unit 70a, the system bus 90a, the multiplexing bus control devices 100a and 110a, and the multiplexing buses 120a and 120.
b through the multiplexed bus controllers 100b and 11
0b, system bus 90b, control unit 70
This is a process of writing to the memory device 60b via b.

【0093】このような処理によって、両系の同期化の
ための準備が行なわれる。
By such processing, preparation for synchronization of both systems is performed.

【0094】また、コントロールユニット70aは、メ
モリコピーを開始してから、A系演算処理装置30aと
B系演算処理装置30bの同期化が成功するまで、プロ
セッサ40a、50aまたはI/O装置160aから、
メモリ装置60aへのライトデータも上記の経路によっ
て、メモリ装置60bにライトする機能を有する。
Further, the control unit 70a operates from the processors 40a, 50a or the I / O device 160a from the start of the memory copy to the successful synchronization of the A-system arithmetic processing unit 30a and the B-system arithmetic processing unit 30b. ,
The write data to the memory device 60a also has a function of writing to the memory device 60b through the above path.

【0095】以上の処理により、メモリ装置60bの記
憶内容と、メモリ装置60aの記憶内容とが一致する。
By the above processing, the stored contents of the memory device 60b and the stored contents of the memory device 60a match.

【0096】次に、プロセッサ40a、50aが、メモ
リ装置60aの全記憶領域のリード動作を完了すると、
即ち、メモリ装置60aの全記憶内容をメモリ装置60
bにライトすると、プロセッサ40a、50aは、同期
化タスクを実行する(ステップ5110)。
Next, when the processors 40a and 50a complete the read operation of the entire storage area of the memory device 60a,
That is, the entire contents stored in the memory device 60a are stored in the memory device 60a.
When writing to b, the processors 40a and 50a execute the synchronization task (step 5110).

【0097】同期化タスクは、A系演算処理装置30a
とB系演算処理装置30bを再同期させるための処理で
ある。プロセッサ40a、50aは、故障していないた
め、通常処理の合間をみて同期化タスクを実行すればよ
いが、1回目の同期化タスク実行で同期化を実現できる
とは限られないため、2回以上、同期化タスクを実行す
る場合もある(ステップ5120等)。このような、リ
トライ処理を行なうようにプログラミングしておけばよ
い。
The synchronization task is performed by the A system arithmetic processing unit 30a.
And the B-system arithmetic processing device 30b are resynchronized. Since the processors 40a and 50a have not failed, it is only necessary to execute the synchronization task at intervals of normal processing, but it is not always possible to realize the synchronization by executing the first synchronization task. As described above, the synchronization task may be executed (step 5120 etc.). It suffices to perform programming so as to perform such retry processing.

【0098】例えば、予め定めた所定時間内に同期化が
実現しない場合、自動的にリトライ処理を行なうように
してもよい。
For example, if synchronization is not realized within a predetermined time, a retry process may be automatically performed.

【0099】この2回目以降の同期化タスクは、連続し
て実行する必要はなく、通常処理の合間に実行すればよ
い。上記の同期化タスクは、後述するように、他系の同
期要求フラグをセットする処理を含んでおり、この処理
によって、プロセッサ40a、50aは、同期化タスク
の実行時に、同期要求フラグ82bをセットする。
The second and subsequent synchronization tasks do not have to be executed continuously, but may be executed between normal processing. The synchronization task includes a process of setting a synchronization request flag of another system, as will be described later. By this process, the processors 40a and 50a set the synchronization request flag 82b when the synchronization task is executed. To do.

【0100】また、B系のプロセッサ40b、50b
は、同期要求フラグ82bの内容を定期的にリードして
おり(ステップ5130)、同期要求フラグ82bがセ
ットされると(5140)、プロセッサ40b、50b
も同期化タスクを実行する(ステップ5150)。
Further, the B-system processors 40b and 50b
Periodically reads the content of the synchronization request flag 82b (step 5130), and when the synchronization request flag 82b is set (5140), the processors 40b, 50b.
Also executes the synchronization task (step 5150).

【0101】同期化タスクによってA系演算処理装置3
0aとB系演算処理装置30bが同期化すると、A系プ
ロセッサ40a、50aおよびB系プロセッサ40b、
50bは同期化タスクを終了し(ステップ5160)、
通常処理を開始する。
By the synchronization task, the A-system arithmetic processing unit 3
0a and B system arithmetic processing unit 30b are synchronized, A system processors 40a and 50a and B system processor 40b,
50b terminates the synchronization task (step 5160),
Start normal processing.

【0102】このような一連の処理によって、一方の系
に障害が発生しても、他系に障害回復動作のための過大
な処理時間を要求しないで障害回復を行ない、再同期を
行なうことができる。
By such a series of processing, even if a failure occurs in one system, failure recovery can be performed and resynchronization can be performed without requiring an excessive processing time for the failure recovery operation in the other system. it can.

【0103】図6は、同期化タスクの動作内容を表わす
フローチャートである。
FIG. 6 is a flowchart showing the operation contents of the synchronization task.

【0104】まず、A系の演算処理装置30aにおいて
同期化タスクが実行されると、プロセッサ40a、50
aによって、(他系)同期化要求フラグ82bおよび
(自系)同期化待ちフラグ83aをセットする(ステッ
プ6010)。
First, when the synchronization task is executed in the A-system arithmetic processing unit 30a, the processors 40a, 50
According to a, the (other system) synchronization request flag 82b and the (local system) synchronization wait flag 83a are set (step 6010).

【0105】さらに、B系の演算処理装置30bが同期
化タスクを実行することによって、同期化要求フラグ8
2aがセットされたならば、系間インターフェース80
aは、同期化モード信号86aをアサートする。次に、
特定のアドレスに対するアクセスである、PIOアクセ
スを発行する(ステップ6020)。
Further, the B-system arithmetic processing unit 30b executes the synchronization task, so that the synchronization request flag 8
If 2a is set, the inter-system interface 80
a asserts the synchronization mode signal 86a. next,
A PIO access, which is an access to a specific address, is issued (step 6020).

【0106】ここで、特定のアドレスとは、同期化タス
クのプログラムにおいて、予め指定した多重化バス制御
装置の内部レジスタのアドレスやI/O装置におけるア
ドレス等である。
Here, the specific address is, for example, an address of an internal register of the multiplexed bus control device or an address of an I / O device which is designated in advance in the program of the synchronization task.

【0107】アクセス先を指定しておく理由は、A系の
演算処理装置30aによるPIOアクセスと、B系の演
算処理装置30bによるPIOアクセスとの、アクセス
時間を等しくするためである。
The reason for specifying the access destination is to make the access times of the PIO access by the A-system arithmetic processing unit 30a and the PIO access by the B-system arithmetic processing unit 30b equal.

【0108】なお、A系およびB系が、アクセスするア
ドレスは、完全に一致させるのが好ましいが、例えば、
所定のエリアが有するアドレス(アドレスの値に幅があ
る)をアクセスするようにしてもよい。
It is preferable that the addresses accessed by the A system and the B system are completely the same.
You may make it access the address (the value of an address has width) which a predetermined area has.

【0109】また、演算処理装置以外のシステム構成部
を、複数に分割し、各分割部分に前記特定アドレスを格
納しておき、いずれかの特定アドレスを用いて本発明に
かかる処理を行なうようにしてもよい。
Further, the system components other than the arithmetic processing unit are divided into a plurality of parts, the specific addresses are stored in the respective divided parts, and the process according to the present invention is performed using any one of the specific addresses. May be.

【0110】PIOアクセスにおいて、A系の演算処理
装置30aは、アクセス要求信号92aをアサートす
る。そして、調停手段102aは、アクセス要求信号9
2aに対し、アクセス可能信号106aをアサートす
る。同期化手段103aは、前述したように、アクセス
許可信号93aをアサートと、条件が満足すれば同期化
成功信号108aもアサートする。
In PIO access, the A-system arithmetic processing unit 30a asserts the access request signal 92a. Then, the arbitration means 102a uses the access request signal 9
For 2a, the accessible signal 106a is asserted. As described above, the synchronization means 103a asserts the access permission signal 93a, and also asserts the synchronization success signal 108a if the condition is satisfied.

【0111】そして、同期化成功信号108aがアサー
トされると同期フラグ81aが、セットされる。プロセ
ッサ40a、50aは、PIOアクセスが完了した後
に、同期フラグ81aの内容を調べる(ステップ603
0)。
When the synchronization success signal 108a is asserted, the synchronization flag 81a is set. The processors 40a and 50a check the contents of the synchronization flag 81a after the PIO access is completed (step 603).
0).

【0112】そして、同期フラグ81aがセットされて
いれば(Yes)、(他系)同期化要求フラグ82b
と、(自系)同期待ちフラグ83aと、(自系)復旧フ
ラグ89aをリセットして(ステップ6040)、同期
化タスクの処理を終了する。
If the synchronization flag 81a is set (Yes), the (other system) synchronization request flag 82b is set.
Then, the (local system) synchronization wait flag 83a and the (local system) recovery flag 89a are reset (step 6040), and the processing of the synchronization task is ended.

【0113】一方、同期フラグ81aがセットされてい
なければ(No)、復旧フラグ89aの内容を調べ(ス
テップ6050)、復旧フラグ89aがセットされてい
れば(Yes)、再び、PIOアクセスを発行し(60
20)、復旧フラグ89aがセットされていなければ
(No)、(他系)同期化要求フラグ82bと、(自
系)同期待ちフラグ83aと、(自系)復旧フラグ89
aをリセットして(ステップ6040)同期化タスクの
処理を終了する。
On the other hand, if the synchronization flag 81a is not set (No), the contents of the recovery flag 89a are checked (step 6050). If the recovery flag 89a is set (Yes), the PIO access is issued again. (60
20) If the recovery flag 89a is not set (No), the (other system) synchronization request flag 82b, the (local system) synchronization wait flag 83a, and the (local system) recovery flag 89
a is reset (step 6040), and the processing of the synchronization task ends.

【0114】なお、上記動作例では、特定アドレスに対
する(PIO)アクセス動作が許可されて、PIOアク
セスが実際に行なわれることによって、両演算装置の再
同期を行なうもの、すなわち、実際のPIOアクセスを
基準信号として、同期化を行なっているが、特定のアド
レスに対するアクセス許可信号93a、93bが生成さ
れる際、これらの許可信号を、両演算装置の再同期を行
なうための基準信号として、両演算装置の動作のタイミ
ング調整を行なっても良い。
In the above operation example, the (PIO) access operation to the specific address is permitted and the PIO access is actually performed to resynchronize the two arithmetic units, that is, the actual PIO access. Although synchronization is performed as a reference signal, when the access permission signals 93a and 93b for a specific address are generated, these permission signals are used as reference signals for resynchronization of both arithmetic units. The timing of the operation of the device may be adjusted.

【0115】以上に説明してきた動作により、同期化タ
スクの処理が実行される。
The processing of the synchronization task is executed by the operation described above.

【0116】図7は、同期化タスクによって、A系の演
算処理装置30aとB系の演算処理装置30bが行なう
同期化までの動作の変化状態を示した図である。
FIG. 7 is a diagram showing a change state of the operation up to the synchronization performed by the A-system arithmetic processing unit 30a and the B-system arithmetic processing unit 30b by the synchronization task.

【0117】図中、左側は、A系のプロセッサ40a、
50a、多重化バス制御装置100a、系間インターフ
ェイス80aの動作状態の変化を示し、右側は、B系の
系間インターフェイス80b、多重化バス制御装置10
0b、プロセッサ40b、50bの動作状態の変化を示
す。
In the figure, the left side is the A-system processor 40a,
50a, the multiplexed bus control device 100a, and the inter-system interface 80a change in operating state, and the right side shows the inter-system interface 80b of the B system and the multiplexed bus control device 10.
0b, changes in the operating states of the processors 40b and 50b are shown.

【0118】A系のプロセッサ40a、50aが、同期
化タスクを起動すると(7010)、同期化要求フラグ
82bおよび同期待ちフラグ83aをセットする(70
20)。
When the A system processors 40a and 50a activate the synchronization task (7010), the synchronization request flag 82b and the synchronization wait flag 83a are set (70).
20).

【0119】B系のプロセッサ40b、50bは、定期
的に同期化要求フラグ82bの内容をリードしており
(7030)、同期化要求フラグ82bがセットされて
いると同期化タスクを起動する(7040)。
The B system processors 40b and 50b periodically read the content of the synchronization request flag 82b (7030), and when the synchronization request flag 82b is set, activate the synchronization task (7040). ).

【0120】A系のプロセッサ40a、50aは、多重
化バス制御装置100aにPIOアクセスを要求するが
(7050)、B系のプロセッサ40b、50bによる
同期化要求フラグ82aおよび同期待ちフラグ83bの
セット(7060)が遅れると、系間インターフェース
80aは同期化モード信号86aをアサートしないの
で、多重化バス制御装置100aは、アクセス許可信号
93aだけをアサートする(7070)。
The A-system processors 40a and 50a request PIO access to the multiplexed bus controller 100a (7050), but the B-system processors 40b and 50b set the synchronization request flag 82a and the synchronization wait flag 83b ( 7060) is delayed, the intersystem interface 80a does not assert the synchronization mode signal 86a, so the multiplex bus control device 100a asserts only the access permission signal 93a (7070).

【0121】また、A系のプロセッサ40a、50a
は、アクセス許可信号93aがアサートされるとPIO
アクセスを実行する(7080)。
Also, the A-system processors 40a and 50a
Is PIO when the access permission signal 93a is asserted.
Access is executed (7080).

【0122】B系の系間インターフェース80bの同期
化要求フラグ82bと同期待ちフラグ83bはセットさ
れているので、B系の系間インターフェース80bは、
同期化モード信号86bをアサートする(7090)。
Since the synchronization request flag 82b and the synchronization wait flag 83b of the B-system intersystem interface 80b are set, the B-system intersystem interface 80b is
The synchronization mode signal 86b is asserted (7090).

【0123】B系のプロセッサ40b、50bは、多重
化バス制御装置100bにPIOアクセスを要求するが
(7100)、同期化モード信号86bがアサートされ
ているので、多重化バス制御装置100bは、多重化バ
ス制御装置100aがアクセス可能信号106aをアサ
ートするか、系間インターフェース80bが同期化モー
ド信号86bをネゲートするか、同期化手段103bの
タイマー部1032bがタイムアウトを通知するまで、
アクセス許可信号93bおよび同期化成功信号108b
のいずれもアサートしない(7110)。
The B system processors 40b and 50b request PIO access to the multiplexed bus controller 100b (7100), but since the synchronization mode signal 86b is asserted, the multiplexed bus controller 100b is Until the integrated bus control device 100a asserts the accessible signal 106a, the intersystem interface 80b negates the synchronization mode signal 86b, or the timer unit 1032b of the synchronization means 103b notifies the timeout.
Access permission signal 93b and synchronization success signal 108b
Is not asserted (7110).

【0124】A系のプロセッサ40a、50aは、PI
Oアクセス終了後、同期フラグ81aの内容をリード
し、同期フラグ81aがセットされていないと、同期化
要求フラグ82bおよび同期待ちフラグ83aをリセッ
トして(7120)、同期化タスクを終了し(713
0)、通常処理のタスクを起動する(7140)。
The A system processors 40a and 50a are
After the O access is completed, the content of the synchronization flag 81a is read, and if the synchronization flag 81a is not set, the synchronization request flag 82b and the synchronization wait flag 83a are reset (7120), and the synchronization task is terminated (713).
0), the task of normal processing is activated (7140).

【0125】また、系間インターフェース80bは、同
期化要求フラグ82bがリセットされると同期化モード
信号86bをネゲートする(7150)。多重化バス制
御装置100bは、同期化モード信号86bがネゲート
されると、アクセス許可信号93bだけをアサートする
(7160)。
The intersystem interface 80b negates the synchronization mode signal 86b when the synchronization request flag 82b is reset (7150). When the synchronization mode signal 86b is negated, the multiplexed bus control device 100b asserts only the access permission signal 93b (7160).

【0126】B系のプロセッサ40b、50bは、アク
セス許可信号93bがアサートされると、PIOアクセ
スを実行する(7170)。プロセッサ40b、50b
は、PIOアクセス終了後に同期フラグ81bの内容を
リードし、同期フラグ81bがセットされていなけれ
ば、再度PIOアクセス要求を試みる(7180)。
When the access permission signal 93b is asserted, the B system processors 40b and 50b execute the PIO access (7170). Processor 40b, 50b
Reads the content of the synchronization flag 81b after the PIO access is completed, and if the synchronization flag 81b is not set, tries the PIO access request again (7180).

【0127】A系のプロセッサ40a、50aは、切り
の良い時に(例えば、1つのサブルーチンに対する処理
の終了後等)通常処理のタスクを終了させ(719
0)、再度同期化タスクを起動する(7200)。
The A system processors 40a and 50a terminate the task of the normal processing at a good time (for example, after completion of the processing for one subroutine) (719).
0), the synchronization task is activated again (7200).

【0128】以下、再度の同期化タスクの起動処理に対
する、各構成要素の動作について説明する。
The operation of each component with respect to the synchronization task activation process again will be described below.

【0129】A系のプロセッサ40a、50aが、同期
化要求フラグ82bおよび同期待ちフラグ83aをセッ
トすると(7210)、同期化要求フラグ82aおよび
同期待ちフラグ83bは、既にセットされているので、
系間インターフェース80aと80bは、同期化モード
信号(86a)と同期化モード信号(86b)をアサー
トする(7220)。
When the A system processors 40a and 50a set the synchronization request flag 82b and the synchronization wait flag 83a (7210), the synchronization request flag 82a and the synchronization wait flag 83b have already been set.
The intersystem interfaces 80a and 80b assert the synchronization mode signal (86a) and the synchronization mode signal (86b) (7220).

【0130】そして、A系のプロセッサ40a、50a
が、多重化バス制御装置100aに対し、PIOアクセ
スを要求すると(7230)、多重化バス制御装置10
0aは、アクセスの調停結果として、アクセス可能信号
(106a9をアサートする(7240)。
The A system processors 40a and 50a
However, when the PIO access is requested to the multiplexed bus control device 100a (7230), the multiplexed bus control device 10
0a asserts the accessible signal (106a9 (7240)) as a result of access arbitration.

【0131】この時、多重化バス制御装置100aの同
期化手段103aは、多重化バス制御装置100bがア
クセス可能信号(106b)をアサートするか、タイマ
ー部1032aがタイムアウトを通知するまで、アクセ
ス許可信号(93a)および同期化成功信号(108
a)のいづれもアサートしない。
At this time, the synchronization means 103a of the multiplexed bus control device 100a continues to access the access permission signal until the multiplexed bus control device 100b asserts the accessible signal (106b) or the timer unit 1032a notifies the timeout. (93a) and the synchronization success signal (108
Neither of a) is asserted.

【0132】さて、B系のプロセッサ40b、50b
が、多重化バス制御装置100bに対し、PIOアクセ
スを要求すると(7250)、多重化バス制御装置10
0bは、アクセスの調停結果として、アクセス可能信号
(106b)をアサートする(7260)。
Now, the B-system processors 40b and 50b
However, when the PIO access is requested to the multiplexed bus control device 100b (7250), the multiplexed bus control device 10
0b asserts the accessible signal (106b) as a result of access arbitration (7260).

【0133】この時、多重化バス制御装置100aの同
期化手段103aと多重化バス制御装置100bの同期
化手段103bとは、アクセス許可信号(93a)とア
クセス許可信号(93b)、および、同期化成功信号
(108a)と同期化成功信号(108b)のすべてを
同時にアサートする(7270)。
At this time, the synchronization means 103a of the multiplex bus control device 100a and the synchronization means 103b of the multiplex bus control device 100b are synchronized with the access permission signal (93a) and the access permission signal (93b). The success signal (108a) and the synchronization success signal (108b) are all asserted simultaneously (7270).

【0134】そして、アクセス許可信号(93a)とア
クセス許可信号(93b)が同時にアサートされると、
A系のプロセッサ40a、50aとB系のプロセッサ4
0b、50bは、同時にPIOアクセスを実行する(7
280)。
When the access permission signal (93a) and the access permission signal (93b) are asserted at the same time,
A system processors 40a and 50a and B system processor 4
0b and 50b simultaneously execute PIO access (7
280).

【0135】さらに、同期化成功信号(108a)と同
期化成功信号(108b)とがアサートされると、系間
インターフェース80aと系間インターフェース80b
は、同期フラグ81aと同期フラグ81bとをセットす
る(7290)。
Furthermore, when the synchronization success signal (108a) and the synchronization success signal (108b) are asserted, the intersystem interface 80a and the intersystem interface 80b.
Sets the synchronization flag 81a and the synchronization flag 81b (7290).

【0136】次に、A系のプロセッサ40a、50a
と、B系のプロセッサ40b、50bとは、PIOアク
セス終了後に、それぞれ自系の同期フラグ81a、同期
フラグ81bの内容をリードし、同期フラグ81a、8
1bがセットされていると、同期化要求フラグ82a、
同期化要求フラグ82b、同期待ちフラグ83a、同期
待ちフラグ83a、および、復旧フラグ89a、復旧フ
ラグ89bをリセットして(7300)、同期化タスク
の処理を終了し(7310)、通常処理のタスクを起動
する(7320)。以後、A系の演算処理装置30aと
B系の演算処理装置30bは同期動作を行うことにな
る。
Next, the A system processors 40a and 50a
And the processors 40b and 50b of the B system read the contents of the synchronization flag 81a and the synchronization flag 81b of the own system after the PIO access ends, and the synchronization flags 81a and 8b are read.
If 1b is set, the synchronization request flag 82a,
The synchronization request flag 82b, the synchronization wait flag 83a, the synchronization wait flag 83a, and the recovery flag 89a and the recovery flag 89b are reset (7300), the processing of the synchronization task is ended (7310), and the normal processing task is executed. It is activated (7320). After that, the A-system arithmetic processing unit 30a and the B-system arithmetic processing unit 30b perform a synchronous operation.

【0137】なお、以上の説明においては、主として2
重系の動作にを行なうシステムについて説明してきた
が、3重系以上の多重化コンピュータシステムについて
も本発明を適用できることは、いうまでもない。
In the above description, mainly 2
Although the system for performing the operation of the heavy system has been described, it goes without saying that the present invention can be applied to a multiplexed computer system of a triple system or more.

【0138】以上説明してきたように、PIOアクセス
を行なう際に、演算処理装置は、アクセス要求に対する
信号であるアクセス許可信号を受け取るまでアクセス許
可待ち状態であることを利用し、さらに、演算処理装置
30a、30bに、PIOアクセスのアクセス許可信号
93a、93bを同時にアサートすることにより、演算
処理装置30a、30bにPIOアクセスを同時に実行
させて、演算処理装置30a、30bの同期化を実現す
ることを可能にする。
As described above, when performing PIO access, the arithmetic processing unit utilizes the fact that it is in the access permission waiting state until it receives the access permission signal which is a signal for the access request. By simultaneously asserting the access permission signals 93a and 93b for PIO access to 30a and 30b, it is possible to cause the arithmetic processing units 30a and 30b to execute PIO access at the same time and realize the synchronization of the arithmetic processing units 30a and 30b. to enable.

【0139】このため、従来のように同期化のためのリ
セット動作等を不要とし、極めて短時間内のの通常動作
の停止で、両装置の同期化を実現できることになる。さ
らに、本発明によれば、従来のように、複数の演算処理
装置を同期化するための特別なリセット手段を設ける必
要ななく、通常のシステム構成に、複数種類のフラグと
単純な組み合わせ回路を有した手段を備えることにより
簡単に構成でき、同期化を行なうための手段を設ける際
のコスト増加も低減できる。
For this reason, it is possible to realize the synchronization of both devices by eliminating the reset operation for synchronization as in the conventional case and stopping the normal operation within an extremely short time. Furthermore, according to the present invention, it is not necessary to provide a special reset means for synchronizing a plurality of arithmetic processing devices as in the conventional case, and a plurality of types of flags and a simple combination circuit are added to a normal system configuration. It can be simply configured by including the provided means, and the increase in cost when providing the means for performing synchronization can be reduced.

【0140】[0140]

【発明の効果】本発明によれば、複数の演算処理装置で
構成された耐障害性機能を有するコンピュータシステム
において、所定のアドレスをアクセスした応答信号を複
数の演算処理装置に同時に送信することにより、障害か
ら復旧した演算処理装置の再同期化を行なう構成にする
ことによって、同期化を行なうためのシステムリセット
を不要とし、極めて短時間内の動作停止によって再同期
化を行なえ、迅速な再同期処理を行なうことを可能にす
る。
According to the present invention, in a computer system having a fault-tolerant function composed of a plurality of arithmetic processing units, a response signal for accessing a predetermined address is simultaneously transmitted to the plurality of arithmetic processing units. , By re-synchronizing the processing unit that has recovered from the failure, system reset for synchronization is not required, and re-synchronization can be performed by stopping the operation within an extremely short time. Allows processing to take place.

【0141】また、同期化を行なうための手段を設ける
際のコスト増加も低減できる。
Further, it is possible to reduce the cost increase when providing the means for performing the synchronization.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明にかかる実施例の構成図である。FIG. 1 is a configuration diagram of an embodiment according to the present invention.

【図2】本発明にかかる実施例の構成図である。FIG. 2 is a configuration diagram of an embodiment according to the present invention.

【図3】本発明にかかる実施例の構成図である。FIG. 3 is a configuration diagram of an embodiment according to the present invention.

【図4】本発明にかかる実施例の構成図である。FIG. 4 is a configuration diagram of an embodiment according to the present invention.

【図5】障害回復処理を示すフローチャート図である。FIG. 5 is a flowchart showing a failure recovery process.

【図6】同期化タスクを示すフローチャート図である。FIG. 6 is a flow chart diagram showing a synchronization task.

【図7】同期化処理を示すフローチャート図である。FIG. 7 is a flowchart showing a synchronization process.

【符号の説明】[Explanation of symbols]

40a…プロセッサ、40b…プロセッサ、50a…プ
ロセッサ、50b…プロセッサ、60a…メモリ装置、
60b…メモリ装置、70a…コントロールユニット、
70b…コントロールユニット、80a…系間インター
フェース、80b…系間インターフェース、88a…障
害回復プログラム格納用ROM、88b…障害回復プロ
グラム格納用ROM、90a…システムバス、90b…
システムバス、100a…多重化バス制御装置、110
a…多重化バス制御装置、100b…多重化バス制御装
置、110b…多重化バス制御装置、120a…多重化
バス、120b…多重化バス、130a…I/Oバスア
ダプタ、130b…I/Oバスアダプタ、140a…I
/Oバス、140b…I/Oバス、150a…I/Oイ
ンターフェース、150b…I/Oインターフェース、
152a…I/Oインターフェース、152b…I/O
インターフェース、160a…I/O装置、160b…
I/O装置、170…端末装置
40a ... Processor, 40b ... Processor, 50a ... Processor, 50b ... Processor, 60a ... Memory device,
60b ... Memory device, 70a ... Control unit,
70b ... Control unit, 80a ... Intersystem interface, 80b ... Intersystem interface, 88a ... Fault recovery program storage ROM, 88b ... Fault recovery program storage ROM, 90a ... System bus, 90b ...
System bus, 100a ... Multiplex bus controller, 110
a ... Multiplex bus controller, 100b ... Multiplex bus controller, 110b ... Multiplex bus controller, 120a ... Multiplex bus, 120b ... Multiplex bus, 130a ... I / O bus adapter, 130b ... I / O bus Adapter, 140a ... I
/ O bus, 140b ... I / O bus, 150a ... I / O interface, 150b ... I / O interface,
152a ... I / O interface, 152b ... I / O
Interface, 160a ... I / O device, 160b ...
I / O device, 170 ... Terminal device

フロントページの続き (72)発明者 宮崎 直人 茨城県日立市大みか町七丁目1番1号 株式会社 日立製作所 日立研究所内 (72)発明者 高谷 壮一 茨城県日立市大みか町五丁目2番1号 株式会社 日立製作所 大みか工場内 (56)参考文献 特開 平6−324901(JP,A) 特開 昭63−196901(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 15/16 - 15/177 G06F 11/16 - 11/20 Front Page Continuation (72) Inventor Naoto Miyazaki 7-1-1 Omika-cho, Hitachi City, Ibaraki Hitachi, Ltd. Hitachi Research Laboratory (72) Inventor Soichi Takatani 5-2-1 Omika-cho, Hitachi City, Ibaraki Hitachi, Ltd. Omika factory (56) Reference JP-A-6-324901 (JP, A) JP-A-63-196901 (JP, A) (58) Fields investigated (Int.Cl. 7 , DB name) G06F 15/16-15/177 G06F 11/16-11/20

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】同一の演算処理を同期して行なう複数の演
算処理装置と、 前記各演算処理装置に接続され再同期の処理を行なう同
期処理装置と、 を備え、 前記各演算処理装置は、 他の演算処理装置の、故障からの回復を検出する故障
検出手段と、 前記故障回復検出手段が他の演算処理装置の、故障から
の回復を検出した場合および自演算処理装置が故障から
回復した場合に、それぞれ、予め定められたアドレスに
対するアクセス要求を行なう手段と、 前記アドレス要求に対するアクセス許可に応じて、前記
アドレスに対するアクセスを行なうアクセス手段と、 を備え、 前記同期処理装置は、 前記正常動作する演算処理装置による前記アクセス要求
と前記故障から回復した演算処理装置による前記アクセ
ス要求との時間差が、予め定めた時間差以内である場合
には、前記正常動作する演算処理装置および前記故障か
ら回復した演算処理装置の双方のアクセス手段に、同時
に、前記アクセス許可を与える同期化手段を備える、 ことを特徴とする多重化コンピュータシステム。
1. A plurality of arithmetic processing devices that perform the same arithmetic processing in synchronization, and a synchronization processing device that is connected to each of the arithmetic processing devices and performs resynchronization processing. Each of the arithmetic processing devices comprises: other processing units, failure times for detecting recovery from failure
A recovery detection unit, the fault recovery detection means other processing unit, the fault
If the recovery of the detected and when the own processor has recovered from the failure, respectively, and means for performing an access request to a predetermined address, in accordance with the access permission for the address request and the access to the address And a time difference between the access request by the arithmetic processing device operating normally and the access request by the arithmetic processing device recovered from the failure is within a predetermined time difference. And a synchronization means for simultaneously granting the access permission to the access means of both the arithmetic processing device that operates normally and the arithmetic processing device that has recovered from the failure.
【請求項2】同一演算処理を同期して行なう演算処理装
置のいずれかが故障した場合、故障から回復した演算処
理装置を、他の演算処理装置の演算処理動作に再同期さ
せる障害回復方法であって、 正常動作するいずれかの演算処理装置が、他の演算処理
装置の故障からの回復を検出した場合に、予め定めら
れたアドレスに対するアクセス要求を行なう処理と、 故障から回復した演算処理装置が、前記アドレスに対す
るアクセス要求を行なう処理と、 前記正常動作する演算処理装置による前記アクセス要求
と前記故障から回復した演算処理装置によるアクセス要
求との時間差が、予め定めた時間差以内である場合に
は、前記正常動作する演算処理装置及び前記故障から回
復した演算処理装置に接続された同期処理装置が、前記
正常動作する演算処理装置及び前記故障から回復した演
算処理装置に、同時に、前記アドレス要求に対するアク
セス許可を与える処理と、 を含むことを特徴とする障害回復方法。
2. A failure recovery method for resynchronizing an arithmetic processing unit recovered from a failure with an arithmetic processing operation of another arithmetic processing unit when one of the arithmetic processing units performing the same arithmetic processing synchronously fails. there are, one of the processing units for normal operation, the other processing unit, when detecting a recovery from the failure, a process of performing an access request to a predetermined address, processing recovery from failure When the time difference between the processing for making an access request to the address and the access request by the normally operating arithmetic processing apparatus and the access request by the arithmetic processing apparatus recovered from the failure is within a predetermined time difference. The synchronous processing device connected to the arithmetic processing device that operates normally and the arithmetic processing device that has recovered from the failure operates normally. A calculation processing device and processing unit has recovered from the failure, at the same time, failure recovery method which comprises the a treatment that gives permission for the address request.
【請求項3】請求項1記載の多重化コンピュータシステ
ムにおいて、 前記各演算処理装置は、 前記複数の演算処理装置のいずれかの演算処理装置が故
障した場合には、同期フラグをリセットし、前記正常動
作する演算処理装置による前記アクセス要求と前記故障
から回復した演算処理装置によるアクセス要求との時間
差が前記予め定めた時間差以内である場合には、前記同
期フラグをセットする同期フラグ設定部を備えることを
特徴とする多重化コンピュータシステム。
3. The multiplexed computer system according to claim 1, wherein each of the arithmetic processing units resets a synchronization flag when any one of the arithmetic processing units of the plurality of arithmetic processing units fails. And a synchronization flag setting unit that sets the synchronization flag when the time difference between the access request by the normally operating processor and the access request by the processor recovered from the failure is within the predetermined time difference. A multiplexed computer system characterized by the above.
【請求項4】請求項1記載の多重化コンピュータシステ
ムにおいて、 前記各演算処理装置は、 他の演算処理装置から同期化を行なうことを要求されて
いることを示すフラグである同期化要求フラグを設定す
る同期化要求フラグ設定部と、 自演算処理装置が前記他の演算処理装置に同期化を行な
うことを要求することを示すフラグである同期化待ちフ
ラグを設定する同期化待ちフラグ設定部と、 を備え、 前記各演算処理装置の、前記アクセス要求を行う手段
は、 前記同期化要求フラグ設定部および前記同期化待ちフラ
グ設定部の双方にフラグが設定されている場合に、前記
アドレスに対するアクセス要求を行うことを特徴とする
多重化コンピュータシステム。
4. The multiplexed computer system according to claim 1, wherein each arithmetic processing unit has a synchronization request flag which is a flag indicating that the other arithmetic processing unit is requested to perform synchronization. A synchronization request flag setting unit for setting, and a synchronization waiting flag setting unit for setting a synchronization waiting flag, which is a flag indicating that the own arithmetic processing unit requests the other arithmetic processing unit to perform synchronization. The means for making the access request of each of the arithmetic processing devices is configured to access the address when a flag is set in both the synchronization request flag setting unit and the synchronization waiting flag setting unit. A multiplexed computer system characterized by making a request.
【請求項5】請求項4記載の多重化コンピュータシステ
ムにおいて、 前記同期処理装置は、 前記同期化要求フラグ設定部および前記同期化待ちフラ
グ設定部の双方にフラグが設定されている場合であっ
て、全演算処理装置に対してアクセス許可を与える際
に、全演算処理装置に同期化が成功した旨を報告する手
段を備えることを特徴とする多重化コンピュータシステ
ム。
5. The multiplexed computer system according to claim 4, wherein the synchronization processing device has a flag set in both the synchronization request flag setting unit and the synchronization waiting flag setting unit. , A multiplexing computer system comprising means for reporting to all arithmetic processing units that synchronization has been successful when granting access permission to all arithmetic processing units.
【請求項6】請求項1記載の多重化コンピュータシステ
ムにおいて、 前記各演算処理装置は、 予め定めた所定時間内に、前記アドレスに対するアクセ
ス許可を受け取れない場合に、前記アドレスに対するア
クセス要求を再度行うリトライ手段を備えることを特徴
とする多重化コンピュータシステム。
6. The multiplexed computer system according to claim 1, wherein each of the arithmetic processing units reissues an access request for the address when the access permission for the address cannot be received within a predetermined time. A multiplexed computer system comprising a retry means.
JP07880395A 1995-04-04 1995-04-04 Multiplexed computer system and failure recovery method Expired - Fee Related JP3438986B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07880395A JP3438986B2 (en) 1995-04-04 1995-04-04 Multiplexed computer system and failure recovery method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07880395A JP3438986B2 (en) 1995-04-04 1995-04-04 Multiplexed computer system and failure recovery method

Publications (2)

Publication Number Publication Date
JPH08278950A JPH08278950A (en) 1996-10-22
JP3438986B2 true JP3438986B2 (en) 2003-08-18

Family

ID=13672022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07880395A Expired - Fee Related JP3438986B2 (en) 1995-04-04 1995-04-04 Multiplexed computer system and failure recovery method

Country Status (1)

Country Link
JP (1) JP3438986B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4558111B2 (en) * 1998-08-17 2010-10-06 株式会社Ihi Data change method for triple fault tolerant system
JP4492035B2 (en) * 2003-04-21 2010-06-30 日本電気株式会社 Data processing device

Also Published As

Publication number Publication date
JPH08278950A (en) 1996-10-22

Similar Documents

Publication Publication Date Title
US5005174A (en) Dual zone, fault tolerant computer system with error checking in I/O writes
EP1078317B1 (en) Method for switching between multiple system processors
EP0306244A2 (en) Fault tolerant computer system with fault isolation
EP0306209A2 (en) Dual rail processors with error checking at single rail interfaces
EP0306348A2 (en) Dual rail processors with error checking on i/o reads
EP0306252A2 (en) Fault tolerant computer system input/output interface
EP0433979A2 (en) Fault-tolerant computer system with/config filesystem
US7493517B2 (en) Fault tolerant computer system and a synchronization method for the same
JP2002518734A (en) Tracking memory page changes in bridges for multiprocessor systems
JP2002518745A (en) Bus controller with cycle end monitor
JP2002518738A (en) Processor bridge with posted write buffer
AU2005246990A1 (en) Fault tolerant computer system and interrupt control method for the same
JP2002518739A (en) Multiprocessor system bridge
JP2002518736A (en) Multiprocessor system bridge with controlled access
US6961826B2 (en) Processor state reintegration using bridge direct memory access controller
EP0683456A1 (en) Fault-tolerant computer system with online reintegration and shutdown/restart
JP3329986B2 (en) Multiprocessor system
GB2369690A (en) A dirty memory using redundant entries indicating that blocks of memory associated with the entries have been written to
JP2002518737A (en) Processor bridge with heterogeneous data access
JP3438986B2 (en) Multiplexed computer system and failure recovery method
US6981172B2 (en) Protection for memory modification tracking
JP3424968B2 (en) Computer system, processor chip and fault recovery method
JPH06242979A (en) Dual computer device
JPH0916535A (en) Multiprocessor computer
JPH0916426A (en) Fault tolerant computer with two-port console

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080613

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080613

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090613

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100613

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100613

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees