JPH09179836A - Multiplied computer and its fault detection processing method - Google Patents

Multiplied computer and its fault detection processing method

Info

Publication number
JPH09179836A
JPH09179836A JP7333773A JP33377395A JPH09179836A JP H09179836 A JPH09179836 A JP H09179836A JP 7333773 A JP7333773 A JP 7333773A JP 33377395 A JP33377395 A JP 33377395A JP H09179836 A JPH09179836 A JP H09179836A
Authority
JP
Japan
Prior art keywords
processing
state
exception
address
processing state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7333773A
Other languages
Japanese (ja)
Inventor
Katsuhiro Obara
克裕 小原
Yoshihiro Miyazaki
義弘 宮崎
Hideji Ishikura
秀司 石倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information and Control Systems Inc
Original Assignee
Hitachi Ltd
Hitachi Process Computer Engineering Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Process Computer Engineering Inc filed Critical Hitachi Ltd
Priority to JP7333773A priority Critical patent/JPH09179836A/en
Publication of JPH09179836A publication Critical patent/JPH09179836A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PROBLEM TO BE SOLVED: To carry on a process even when it can not be demarcated which processing unit is abnormal by conventional technology. SOLUTION: Memory controllers 330A and 330B monitor the consistency of data among processing units in their systems 310 (31-A-1 and 310A-2, and 310B-1 and 310B-2). Further, an address detecting circuit 350A monitors addresses outputted by the processing units 310 to judge whether or not the processing units 310 are in exceptional process states. In case of data inconsistency, interface controllers 340 (340A and 340B) disconnect the system. Even when an exceptional process state is entered although the data are consistent, the system is also disconnected. The disconnection, however, is made after collating circuits 360A and 350B confirm the state of the other system. A system which takes over the process is made to perform a self-diagnosing process.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、複数のプロセッシ
ング装置が同期に同一処理を行う中央処理装置を有する
多重化計算機およびその障害検出処理方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multiplexing computer having a central processing unit in which a plurality of processing units synchronously perform the same processing, and a failure detection processing method thereof.

【0002】[0002]

【従来の技術】近年、交通管制システム、金融システム
等の社会基盤を支える要素として、データ処理システム
が重要な位置を占めている。このような社会背景におい
て、データ処理システムの故障により不当なデータが発
生しこれによってデータ処理システムが停止すること
は、社会にとって多大な影響を与える。従って、処理シ
ステムが扱うデータの正当性および処理の継続性を保つ
ことは、非常に重要な課題である。
2. Description of the Related Art In recent years, a data processing system has been playing an important role as an element supporting a social infrastructure such as a traffic control system and a financial system. In such a social background, the improper data generated due to the failure of the data processing system and the suspension of the data processing system due to the improper data has a great influence on the society. Therefore, it is a very important issue to maintain the validity of the data handled by the processing system and the continuity of the processing.

【0003】このような高信頼化が要求される処理シス
テムにおけるデータの不当性を検出する技術としては、
例えば、米国特許第5020024号がある。この技術
では、デュアルプロセッサ間の出力データの比較を行う
機能を有した中央処理装置を2重化した構成をとってい
る。そして、各中央処理装置間で同一であるべき制御信
号の不一致を検出している。この技術では各中央処理装
置内のデータ比較だけでは検出できなかった障害も検出
できるため、障害検出率が高い。
As a technique for detecting the unjustness of data in a processing system that requires such high reliability,
For example, there is US Pat. No. 5020024. In this technique, a central processing unit having a function of comparing output data between dual processors is duplicated. Then, the inconsistency of the control signals that should be the same between the central processing units is detected. This technique has a high fault detection rate because it can detect faults that could not be detected only by comparing the data in each central processing unit.

【0004】[0004]

【発明が解決しようとする課題】前述の公知例では、多
重化したプロセッシング装置の異常検出は、系内での制
御信号の不一致、系間での制御信号の不一致を検出する
ことで行っている。仮にいずれかの系のデータが正当で
あっても不一致が発生した場合には、プロセッシング装
置の処理は停止してしまう。このような機能により、障
害検出率を向上することは、高信頼性を要求される計算
機システムでは、重要な要素の1つではある。しかし、
障害検出後、システムダウンにいたらしめることなく処
理を継続させることもまた重要な要素である。この処理
継続性はプログラムの完成度に依存する割合が高いが、
ハードウエア面からも改善の余地がある。
In the above-mentioned known example, the abnormality of the multiplexed processing device is detected by detecting the inconsistency of the control signals within the system and the inconsistency of the control signals between the systems. . Even if the data of either system is valid, if a mismatch occurs, the processing of the processing device is stopped. Improving the fault detection rate by such a function is one of the important factors in a computer system that requires high reliability. But,
After the failure is detected, it is also important to continue the processing without causing the system to go down. This processing continuity depends on the degree of completion of the program, but
There is also room for improvement in terms of hardware.

【0005】本発明は、従来方式ではいずれのプロセッ
シング装置が異常であるかを判断できなかった異常時で
も、システムダウンにいたらしめることなく処理を継続
することのできる多重化計算機およびその障害検出処理
方法を提供することを目的とする。
The present invention provides a multiplex computer capable of continuing processing without causing a system down even when an abnormal condition cannot be determined by the conventional system, and a fault detection process therefor. The purpose is to provide a method.

【0006】本発明は、障害発生時に処理を引き継ぐ
(あるいは継続する)プロセッシング装置、周辺ハード
ウエアに真に異常のないことを確認することのできる多
重化計算機を提供することを目的とする。
It is an object of the present invention to provide a processing device that takes over (or continues) processing when a failure occurs, and a multiplexing computer capable of confirming that there is no real abnormality in peripheral hardware.

【0007】[0007]

【課題を解決するための手段】本発明は上記目的を達成
するためになされたもので、その第1の態様としては、
多重化された複数個のプロセッシング装置を備えた系を
複数備え、異常の発生時にはこれら系と外部装置との接
続関係を変更することで処理を継続する多重化計算機に
おける障害検出処理方法において、上記異常が上記プロ
セッシング装置それぞれの出力のうちのどれが正当であ
るかを判別できないものである場合には、上記系それぞ
れの上記プロセッシング装置の処理状態を確認し、上記
確認の結果、上記プロセッシング装置があらかじめ定め
られた例外処理を実行している状態(以下“例外処理状
態”という)にある系と、上記プロセッシング装置があ
らかじめ定められた例外処理を実行していない状態(以
下“通常処理状態”という)にある系とがあった場合に
は、通常処理状態にある系によってそれ以降の処理を引
き継ぐこと、を特徴とする多重化計算機における障害検
出処理方法が提供される。
Means for Solving the Problems The present invention has been made to achieve the above-mentioned object, and the first aspect thereof is as follows.
A failure detection processing method in a multiplexing computer, which comprises a plurality of systems having a plurality of multiplexed processing devices, and continues processing by changing the connection relationship between these systems and an external device when an abnormality occurs If the abnormality cannot determine which of the outputs of each of the processing devices is valid, check the processing state of each of the processing devices of each of the systems, and as a result of the check, the processing device is A system in a state where predetermined exception processing is being executed (hereinafter referred to as “exception processing state”), and a state in which the processing device is not executing predetermined exception processing (hereinafter referred to as “normal processing state”) If there is a system in), it is special that the process after that is taken over by the system in the normal processing state. Fault detection processing method in multiplexing computer and is provided.

【0008】本発明の第2の態様としては、多重化され
た複数個のプロセッシング装置を備えた系を複数備え、
これら系と外部装置との接続関係を変更することで障害
発生時にも処理を継続する多重化計算機において、上記
系のそれぞれは、自系の多重化された上記プロセッシン
グ装置間での処理結果の不一致を検出する不一致検出手
段と、自系の多重化された上記プロセッシング装置の処
理状態は、あらかじめ定められた例外処理プログラムを
実行している状態(以下“例外処理状態”という)と、
上記例外処理プログラムを実行していない状態(以下
“通常処理状態”という)とのいずれであるかを判定す
る処理状態判定手段と、他の系の多重化された上記プロ
セッシング装置の処理状態は、上記例外処理状態と上記
通常処理状態とのいずれであるかを確認する他系処理状
態確認手段と、自系の上記不一致検出手段が不一致を検
出した場合、または、自系の上記処理状態判定手段が例
外処理状態であると判定し且つ上記他系処理状態確認手
段が上記通常処理状態となっている系が存在することを
確認した場合、自系を上記外部装置から切り離させる切
換手段と、を有することを特徴とする多重化計算機が提
供される。
According to a second aspect of the present invention, a plurality of systems including a plurality of multiplexed processing devices are provided,
In a multiplexing computer that continues processing even when a failure occurs by changing the connection relationship between these systems and external devices, each of the above systems may not have the same processing result between the processing devices of its own system. And a processing state of the processing device that is multiplexed in its own system, a state in which a predetermined exception processing program is being executed (hereinafter referred to as "exception processing state"),
The processing state determining means for determining whether the exception processing program is not being executed (hereinafter referred to as “normal processing state”) and the processing states of the multiplexed processing devices of other systems are When the other system processing state confirming means for confirming the exceptional processing state or the normal processing state and the inconsistency detecting means of the own system detect a mismatch, or the processing state determining means of the own system When it is determined that the system is in an exceptional processing state and the other system processing state confirmation means confirms that there is a system in the normal processing state, a switching means for disconnecting the own system from the external device, There is provided a multiplexing computer characterized by having.

【0009】上記系のそれぞれは、さらに、自系の上記
不一致検出手段が不一致を検出した場合、または、自系
の上記処理状態判定手段が例外処理状態であると判定し
且つ上記他系処理状態確認手段が上記通常処理状態とな
っている系が存在することを確認した場合、自系を上記
外部装置から切り離してもよいか否かの確認を、他の系
に対して要求する要求手段と、他の系から当該他の系を
切り離してもよいか否かの確認を要求された場合、自系
の状態を確認し、当該他の系の行っていた処理を引き継
ぐことが可能であれば当該他の系を上記外部装置から切
り離すことを許す許可信号を当該他の系に対して出力す
る応答手段と、を備え、上記切換手段は、自系の上記要
求手段による要求に対し他の系の上記応答手段から許可
信号が返された場合に限り、自系を上記外部装置から切
り離させるものであることが好ましい。
Each of the above-mentioned systems further determines that the mismatch detection means of its own system detects a mismatch, or that the processing state determination means of its own system is in an exceptional processing state and the other system processing state. When the confirming means confirms that the system in the normal processing state exists, the requesting means for requesting the other system to confirm whether or not the own system may be disconnected from the external device. , If it is requested to confirm whether or not the other system may be disconnected from the other system, if it is possible to confirm the status of the own system and take over the processing that the other system was performing. Response means for outputting to the other system a permission signal permitting disconnection of the other system from the external device, and the switching means responds to the request from the requesting means of the other system. When the permission signal is returned from the above response means of Only, it is preferable autologous those which separated from the external device.

【0010】上記切換手段は、上記応答手段が他の系に
対して上記許可信号を出力した場合には、自系を上記外
部装置に接続させるものであることが好ましい。
It is preferable that the switching means connects the own system to the external device when the response means outputs the permission signal to another system.

【0011】上記処理状態判定手段は、上記例外処理プ
ログラムの格納されている領域を示すアドレス(以下
“例外処理アドレス”という)をあらかじめ備え、上記
プロセッシング装置がアクセスするアドレスが上記例外
処理アドレスであるか否かを判定し、該判定の結果、上
記例外処理アドレスをアクセスしていた場合には例外処
理状態にあると判定するものであってもよい。
The processing state determining means is provided with an address (hereinafter referred to as "exception processing address") indicating an area in which the exception processing program is stored, and the address accessed by the processing device is the exception processing address. It may be determined whether or not, and as a result of the determination, if the exception processing address is accessed, it is determined that the exception processing state is in effect.

【0012】上記処理状態判定手段は通常状態であると
判定し且つ他系処理状態確認手段が例外処理状態となっ
ている他の系の存在を確認した場合には、当該通常状態
であった系のプロセッシング装置は自己診断を行うもの
であってもよい。
When the processing state determining means determines that the system is in the normal state and the other system processing state confirming means confirms the existence of another system in the exceptional processing state, the system in the normal state is detected. The processing device may be for self-diagnosis.

【0013】本発明の第2の態様としては、多重化され
た複数個のプロセッシング装置を備えた系を複数備え、
障害発生時にはこれら系と外部装置との接続関係を変更
することで処理を継続する多重化計算機における障害検
出処理方法において、上記系それぞれの上記プロセッシ
ング装置の処理状態を確認し、上記プロセッシング装置
があらかじめ定められた例外処理プログラムを実行して
いる状態(以下“例外処理状態”という)にある系と、
上記プロセッシング装置があらかじめ定められた例外処
理プログラムを実行していない状態(以下“通常処理状
態”という)にある系とがあった場合には、通常処理状
態にある系によってそれ以降の処理を引き継ぐこと、を
特徴とする多重化計算機における障害検出処理方法が提
供される。
According to a second aspect of the present invention, a plurality of systems including a plurality of multiplexed processing devices are provided,
When a failure occurs, in the failure detection processing method in the multiplex computer that continues processing by changing the connection relationship between these systems and external devices, check the processing status of each processing device of each system, A system that is in the state of executing a specified exception handling program (hereinafter referred to as "exception handling state"),
If there is a system in a state where the processing device is not executing a predetermined exception handling program (hereinafter referred to as "normal processing state"), the system in the normal processing state takes over the subsequent processing. A failure detection processing method in a multiplexed computer is provided.

【0014】本発明の作用を上述した構成に基づいて説
明する。
The operation of the present invention will be described based on the above-mentioned configuration.

【0015】不一致検出手段は、自系の多重化されたプ
ロセッシング装置間での処理結果に不一致が生じていな
いかを監視している。これと並行して、処理状態判定手
段は、自系のプロセッシング装置が、例外処理状態と通
常処理状態とのいずれの状態になっているかを判定して
いる。この判定は、例えば、プロセッシング装置のアク
セスするアドレスを監視することで行う。アクセスされ
たアドレスが、例外処理プログラムの格納されている領
域であれば例外処理状態となっていることがわかる。ま
た、他系処理状態確認手段は、他の系のプロセッシング
装置が例外処理状態と通常処理状態とのいずれの状態に
なっているかを確認している。
The inconsistency detecting means monitors whether or not inconsistency occurs in the processing result between the processing devices which are multiplexed in the own system. In parallel with this, the processing state determination means determines whether the processing device of its own system is in the exceptional processing state or the normal processing state. This determination is made, for example, by monitoring the address accessed by the processing device. If the accessed address is the area in which the exception processing program is stored, it can be seen that it is in the exception processing state. The other system processing state confirmation means confirms whether the processing device of the other system is in the exceptional processing state or the normal processing state.

【0016】切換手段は、下記いずれかの場合には
自系を外部装置から切り離す。
The switching means disconnects its own system from the external device in any of the following cases.

【0017】自系の不一致検出手段が不一致を検出し
た場合。
When the mismatch detection means of the own system detects a mismatch.

【0018】自系の処理状態判定手段が例外処理状態
であると判定し且つ他系処理状態確認手段が通常処理状
態となっている系が存在することを確認した場合。
When the processing status judging means of the own system judges that it is in the exception processing status and the other system processing status checking means judges that there is a system in the normal processing status.

【0019】外部装置と多重化計算機との接続が多重化
されている場合(つまり、外部装置自体も多重化されて
おり、各系と各外部装置とがそれぞれ接続されている場
合)には、このように単に自系を切り離すだけでも構わ
ない。この後は、多重化されている他の系によって処理
が引き継がれる。
When the connection between the external device and the multiplexing computer is multiplexed (that is, when the external device itself is also multiplexed and each system is connected to each external device), In this way, it is possible to simply separate the own system. After this, the processing is taken over by the other multiplexed system.

【0020】しかし、外部装置と多重化計算機との接続
関係が多重化されていない場合には、いきなり切り離し
たのでは、他系が処理を引き継ぐことができず処理が中
断してしまうことも考えられる。従って、このような場
合には以下のように切り離しの可否を確認してから切り
離しを行うことが好ましい。
However, when the connection relationship between the external device and the multiplexing computer is not multiplexed, sudden disconnection may prevent other systems from taking over the processing and interrupting the processing. To be Therefore, in such a case, it is preferable to perform the disconnection after confirming the possibility of disconnection as described below.

【0021】つまり、上記、のいずれかの場合、要
求手段は、自系を外部装置から切り離してもよいか否か
の確認を他の系に対して要求する。この要求を受けた系
の応答手段は、自分の属している系の状態を確認する。
そして、該要求をしてきた系の行っていた処理を自系が
引き継ぐことが可能であれば、許可信号を当該他の系
(切り離しの可否の確認を要求してきた系)に対して出
力する。自系の要求手段が出力した要求に対し他の系の
応答手段から許可信号が返された場合、切換手段は自系
を外部装置から切り離す。一方、許可信号を出力した系
の切換手段は、自系を外部装置に接続する。
That is, in any of the above cases, the requesting means requests the other system to confirm whether or not the own system may be disconnected from the external device. The response means of the system receiving this request confirms the state of the system to which it belongs.
If the own system can take over the processing performed by the requesting system, the permission signal is output to the other system (the system requesting confirmation of the possibility of disconnection). When the permission signal is returned from the response means of the other system in response to the request output by the request means of the own system, the switching means disconnects the own system from the external device. On the other hand, the system switching means that has output the permission signal connects its own system to an external device.

【0022】また、処理状態判定手段が自系は通常状態
であると判定し、且つ、他系処理状態確認手段が例外処
理状態となっている他の系の存在を確認される場合(つ
まり、通常状態にある系と、例外処理状態となっている
系との両方が存在している場合)もある。このような場
合には、通常状態であった系のプロセッシング装置は自
己診断を行う。これにより、この通常状態であった系の
プロセッシング装置は、自らの系が正常であることを確
認できる。
When the processing state judging means judges that the own system is in the normal state, and the other system processing state checking means confirms the existence of another system in the exceptional processing state (that is, If both the system in the normal state and the system in the exception handling state exist). In such a case, the processing device of the system in the normal state performs self-diagnosis. As a result, the processing device of the system in this normal state can confirm that its own system is normal.

【0023】[0023]

【発明の実施の形態】以下、本発明の実施形態を図面を
用いて説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings.

【0024】本実施形態は、本発明の多重化計算機にお
ける障害処理方法が適用された2重化計算機である。ま
ず、本実施形態の2重化計算機の概要を図2を用いて説
明する。
This embodiment is a dual computer to which the fault processing method in the multiple computer of the present invention is applied. First, the outline of the duplicated computer of this embodiment will be described with reference to FIG.

【0025】この計算機は、2つの系(A系、B系)を
備えたフォールトトレラントコンピュータシステムであ
る。
This computer is a fault-tolerant computer system having two systems (A system and B system).

【0026】A系は、プロセッシング装置310A−
1,310A−2を備えた中央処理装置300Aと、入
出力装置群等とからなる。プロセッシング装置310A
−1とプロセッシング装置310A−2とは、互いに同
期に同一処理を実行するようになっている。
The A system is a processing device 310A-
A central processing unit 300A including 1,310A-2, an input / output device group, and the like. Processing device 310A
-1 and the processing device 310A-2 execute the same processing in synchronization with each other.

【0027】B系は、A系と同一の構成を採っており、
プロセッシング装置310B−1,310B−2を備え
た中央処理装置300Bと、入出力装置群等とからな
る。
The B system has the same configuration as the A system,
The central processing unit 300B includes processing units 310B-1 and 310B-2, an input / output unit group, and the like.

【0028】フォールトトレラントコンピュータシステ
ムにおいては、系内のみならず系間においても(すなわ
ち、A系とB系とは)互いに同期に同一処理を行ってい
る。そして、2つある系のうちいずれかを主系とし、他
方を従系としている。主系になんらかの要因で障害が発
生すると、直ちに主系を切り離し、それ以降は従系によ
って処理を継続するようになっている。
In the fault-tolerant computer system, the same processing is performed not only within the system but also between the systems (that is, the A system and the B system) in synchronization with each other. One of the two systems is the master system and the other is the slave system. When a failure occurs in the master system for some reason, the master system is immediately disconnected, and after that, the slave system continues processing.

【0029】これ以降は、A系を主系として、B系を従
系として稼働させることを前提として説明を行う。ま
た、以下において述べる“例外処理状態”とは、プロセ
ッサに何らかの異常が発生した場合に行われる特別の処
理(例外処理)を実行している状態である。
Hereinafter, the description will be made on the assumption that the A system is operated as the main system and the B system is operated as the slave system. Further, the "exception processing state" described below is a state in which special processing (exception processing) performed when some abnormality occurs in the processor.

【0030】上述のように図の右半分(B系)と左半分
(A系)は、全く同じ構成なので、ここでは、左半分の
A系部分について説明する。
As described above, the right half (B system) and the left half (A system) of the figure have exactly the same configuration, and therefore, the left half A system portion will be described here.

【0031】A系の中央処理装置300Aについて説明
する。
The A-system central processing unit 300A will be described.

【0032】中央処理装置300Aは、プロセッシング
装置310A−1,310A−2、主記憶装置320
A、プロセッサメモリ制御装置330A、プロセッサ系
間インタフェース制御装置340A、例外処理アドレス
アクセス検出回路350A、他系例外処理照合回路36
0Aからなる。また、これら各部間,B系,伝送バスと
の間でデータ等を授受するための各種信号線を備えてい
る。なお、以下においては各信号線を通じて入出力され
ている信号を、当該信号線に付されている符号を付して
呼ぶ場合がある。例えば、信号線610を通じて入出力
される信号を、信号610と呼ぶ場合がある。
The central processing unit 300A includes processing units 310A-1 and 310A-2 and a main storage unit 320.
A, processor memory control device 330A, inter-processor system interface control device 340A, exception processing address access detection circuit 350A, other system exception processing collation circuit 36
It consists of 0A. Further, various signal lines for exchanging data and the like between these respective units, the B system, and the transmission bus are provided. In the following, the signals input / output through each signal line may be referred to by the reference numerals attached to the signal line. For example, a signal input / output through the signal line 610 may be referred to as a signal 610.

【0033】プロセッシング装置310A−1及びプロ
セッシング装置310A−2は、全く同一の汎用プロセ
ッシング装置である。
The processing device 310A-1 and the processing device 310A-2 are completely the same general-purpose processing device.

【0034】主記憶装置320Aは、命令やデータを格
納するものである。
The main memory 320A stores instructions and data.

【0035】プロセッサメモリ制御装置330Aは、プ
ロセッシング装置310A−1,310A−2と、主記
憶装置320Aと、システムバス370Aとを接続する
ものである。これは、主にプロセッシング装置310A
−1,310A−2からのアクセスを、データ線504
を介して主記憶装置320Aやシステムバス370Aに
伝える役割を果たしている。また、システムバス370
Aからのアクセスを主記憶装置320Aに伝える役割を
果たしている。さらに、プロセッサメモリ制御装置33
0Aは、プロセッシング装置310A−1の出力信号5
00Aと、プロセッシング装置310A−2の出力信号
502Aとを比較することで、プロセッシング装置31
0の異常の有無を監視する役割も果たしている。2つの
プロセッシング装置310A−1,310A−2の出力
が不一致であれば、いずれかのプロセッシング装置にお
いて何らかの異常が発生していることになる。
The processor memory control unit 330A connects the processing units 310A-1 and 310A-2, the main storage unit 320A and the system bus 370A. This is mainly the processing device 310A.
-1,310A-2 access to the data line 504
It plays a role of transmitting to the main storage device 320A and the system bus 370A via the. Also, the system bus 370
It plays a role of transmitting the access from A to the main storage device 320A. Further, the processor memory controller 33
0A is the output signal 5 of the processing device 310A-1.
00A and the output signal 502A of the processing device 310A-2, the processing device 31
It also plays the role of monitoring the presence or absence of 0 abnormalities. If the outputs of the two processing devices 310A-1 and 310A-2 do not match, it means that some abnormality has occurred in one of the processing devices.

【0036】例外処理アドレスアクセス検出回路350
Aは、プロセッシング装置310A−1が例外処理状態
になっているか否かを検出するためのものである。この
例外処理アドレスアクセス検出回路350Aは例外処理
ルーチンの格納されているアドレスを備えている。そし
て、プロセッシング装置310A−1がアクセスしたア
ドレスを監視することで、この例外処理ルーチンにアク
セスが行われたか否か(すなわちプロセッシング装置3
10A−1が例外処理状態にあるか否か)を検出してい
る。
Exception processing address access detection circuit 350
A is for detecting whether or not the processing device 310A-1 is in the exception processing state. The exception handling address access detection circuit 350A has an address where the exception handling routine is stored. Then, by monitoring the address accessed by the processing device 310A-1, it is determined whether or not this exception handling routine is accessed (that is, the processing device 3).
10A-1 is in the exception processing state).

【0037】他系例外処理照合回路360Aは、A系と
B系との状態を確認することで、その時の状態が後述す
る特例の状態に該当するか否かを判定するものである。
この特例の状態に該当していた場合には、該他系例外処
理照合回路360Aは、A系の切り離しを求める信号6
06Aを出力する。該他系例外処理照合回路360A
は、例外処理アドレスアクセス検出回路350Aの出力
信号610と、プロセッサメモリ制御装置330Aの出
力信号604Aと、によってA系の状態を獲得してい
る。一方、B系の状態は、中央処理装置300AとB系
の中央処理装置300Bとの間の信号線612,624
を通じて獲得している。なお、特例の状態とは、A系内
においてはデータ不一致は発生してはいないものプロセ
ッシング装置310Aが例外処理状態となっており、一
方B系はプロセッシング装置310Bが例外処理状態と
はなっておらず、データの不一致も発生していない状態
を指す。なお、この点については後ほど図6を用いて詳
細に説明する。
The other-system exception handling collation circuit 360A checks the states of the A-system and the B-system to determine whether the state at that time corresponds to a special state described later.
In the case of this special case, the other-system exception handling collation circuit 360A outputs the signal 6 for requesting disconnection of the A-system.
06A is output. The other system exception handling collation circuit 360A
Has acquired the state of the A system by the output signal 610 of the exception processing address access detection circuit 350A and the output signal 604A of the processor memory control device 330A. On the other hand, the state of the B system is the signal lines 612 and 624 between the central processing unit 300A and the B processing central processing unit 300B.
Have earned through. It should be noted that the special state means that the data inconsistency does not occur in the A system, but the processing device 310A is in the exception processing state, while the B system has the processing device 310B in the exception processing state. In addition, it refers to the state where no data inconsistency has occurred. Note that this point will be described later in detail with reference to FIG.

【0038】プロセッサ系間インタフェース制御装置3
40Aは、中央処理装置300AとB系の中央処理装置
300Bとの間において、信号線622,624を通じ
て、中央処理装置の状態を示す情報の受け渡しを行うた
めのものである。該プロセッサ系間インタフェース制御
装置340Aは、他系例外処理照合回路360Aから信
号606Aが出力された場合には、A系を切り離しても
よいか否かの確認を求める要求信号622を中央処理装
置300Bに対して出力するようになっている。また、
プロセッサメモリ制御装置330Aからエラー信号60
4Aが出力された場合も同様に、A系を切り離してよい
か否かの確認を求める要求信号622を出力するように
なっている。逆に、B系から要求信号があった場合に
は、これに応えて確認などを行い返答するようになって
いる。このプロセッサ系間インタフェース制御装置34
0Aの詳細および該受け渡しを行う情報の詳細について
は、後ほど説明する。
Inter-processor system interface controller 3
Reference numeral 40A is for passing information indicating the state of the central processing unit through the signal lines 622 and 624 between the central processing unit 300A and the B-system central processing unit 300B. When the signal 606A is output from the other system exception handling collation circuit 360A, the inter-processor system interface control device 340A sends a request signal 622 for confirming whether or not the A system may be disconnected, to the central processing unit 300B. It is designed to output to. Also,
Error signal 60 from processor memory controller 330A
Similarly, when 4A is output, a request signal 622 for confirming whether or not the A system may be disconnected is also output. On the other hand, when there is a request signal from the B system, in response to this, confirmation and the like are made and a reply is made. This processor-system interface controller 34
Details of 0A and details of the information to be transferred will be described later.

【0039】本実施形態のシステムでは、中央処理装置
300のみならず、入出力バス520も2重化されてい
る。上述の中央処理装置300Aおよび中央処理装置3
00Bは、それぞれ、入出力バス520A,520Bに
接続されている。このような接続関係を実現するため、
入出力バス520と中央処理装置300とを繋ぐシステ
ムバス518も2重化されている。つまり、2重化シス
テムバス518Aは、中央処理装置300Aおよび中央
処理装置300Bと、入出力バス520Aとを繋いでい
る。同様に、2重化システムバス518Bは、中央処理
装置300Aおよび中央処理装置300Bと、入出力バ
ス520Bとを繋いでいる。これらの2重化システムバ
ス518A,518Bは、多重システムバスアダプタ3
80A−1,380A−2,380B−1,380B−
2によって制御されており、各中央処理装置300と入
出力バス520との接続/切り離しがそれぞれ独立して
行えるようになっている。つまり、多重システムバスア
ダプタ380は、中央処理装置300と入出力バス52
0との対応関係を変更するための一種のセレクタを構成
している。通常は、中央処理装置300Aの入出力は入
出力バス520Aを通じて、一方、中央処理装置300
Bの入出力は入出力バス520Bを通じて行うように設
定されている。
In the system of this embodiment, not only the central processing unit 300 but also the input / output bus 520 is duplicated. Central processing unit 300A and central processing unit 3 described above
00B is connected to input / output buses 520A and 520B, respectively. In order to realize such a connection relationship,
The system bus 518 that connects the input / output bus 520 and the central processing unit 300 is also duplicated. That is, the duplex system bus 518A connects the central processing unit 300A and the central processing unit 300B to the input / output bus 520A. Similarly, the duplex system bus 518B connects the central processing units 300A and 300B to the input / output bus 520B. These duplex system buses 518A and 518B are the multiple system bus adapters 3
80A-1, 380A-2, 380B-1, 380B-
The central processing unit 300 and the input / output bus 520 can be connected / disconnected independently of each other. That is, the multiple system bus adapter 380 is connected to the central processing unit 300 and the input / output bus 52.
It constitutes a kind of selector for changing the correspondence with 0. Normally, the input / output of the central processing unit 300A is through the input / output bus 520A, while the central processing unit 300A
Input / output of B is set to be performed through the input / output bus 520B.

【0040】既に述べたとおり、中央処理装置300A
および中央処理装置300Bは、同時に同じ処理を行っ
ている。従って、多重システムバスアダプタ380A−
1は中央処理装置300Aから、また、多重システムバ
スアダプタ380B−1は中央処理装置300Bから、
同時に2重化システムバス518Aへのアクセスを受け
る。しかし、通常は、多重システムバスアダプタ380
A−1によって中央処理装置300Aからのアクセスの
みが2重化システムバス518Aに伝えられる。中央処
理装置300Bからのアクセスは、多重システムバスア
ダプタ380B−1によって遮断されている。
As described above, the central processing unit 300A
And the central processing unit 300B is simultaneously performing the same processing. Therefore, the multi-system bus adapter 380A-
1 is from the central processing unit 300A, and the multi-system bus adapter 380B-1 is from the central processing unit 300B.
At the same time, the access to the duplex system bus 518A is received. However, typically, the multi-system bus adapter 380
Only the access from the central processing unit 300A is transmitted to the duplex system bus 518A by A-1. Access from the central processing unit 300B is blocked by the multi-system bus adapter 380B-1.

【0041】一方、2重化システムバス518Aからの
アクセスは、多重システムバスアダプタ380A−1,
380B−1が同時に受けて、それぞれの中央処理装置
300Aと300Bに同じタイミングで伝える。多重シ
ステムバスアダプタ380A−2,380B−2につい
ても同様である。
On the other hand, access from the duplex system bus 518A is performed by the multiple system bus adapter 380A-1,
380B-1 receives it at the same time and transmits it to each central processing unit 300A and 300B at the same timing. The same applies to the multiple system bus adapters 380A-2 and 380B-2.

【0042】次に、系内で処理データの不一致が発生し
た場合の動作を説明する。
Next, the operation when a mismatch of processed data occurs in the system will be described.

【0043】ここでは、主記憶装置320Aへのアクセ
スを伴う動作において、プロセッシング装置310A−
1の処理データと、プロセッシング装置310A−2の
処理データとが不一致であった場合について述べる。プ
ロセッシング装置310B−1とプロセッシング装置3
10B−2との処理データは一致しているものとする。
Here, in an operation involving access to the main storage device 320A, the processing device 310A-
A case where the processing data of No. 1 and the processing data of the processing device 310A-2 do not match will be described. Processing device 310B-1 and processing device 3
It is assumed that the processing data of 10B-2 match.

【0044】主記憶装置320Aへのライト時、プロセ
ッシング装置310A−1からのアクセスは、プロセッ
サメモリ制御装置330Aを経由して主記憶装置320
Aに対して出力される。この場合、プロセッサメモリ制
御装置330Aは、プロセッシング装置310A−1か
ら出力された処理データと、プロセッシング装置310
A−2から出力された処理データとを比較する。そし
て、この比較の結果、不一致を検出した場合には、他系
例外処理照合回路360Aおよびプロセッサ系間インタ
フェース制御装置340Aにエラー信号604Aを出力
する。なお、図2では、図を簡単にするため、論理素子
602Aを省略したかたちで回路構成を描いている。し
かし、実際には、該エラー信号は、図1に示すとおり、
論理和素子602Aを介して入力されるようになってい
る。
At the time of writing to the main storage device 320A, the access from the processing device 310A-1 is made via the processor memory control device 330A.
It is output to A. In this case, the processor memory control device 330A has the processing data output from the processing device 310A-1 and the processing device 310A.
The processed data output from A-2 is compared. Then, as a result of this comparison, if a mismatch is detected, an error signal 604A is output to the other system exception processing collation circuit 360A and the inter-processor system interface control device 340A. Note that in FIG. 2, the circuit configuration is drawn in a form in which the logic element 602A is omitted for the sake of simplicity. However, in reality, the error signal is, as shown in FIG.
It is adapted to be inputted through the logical sum element 602A.

【0045】エラー信号604Aを入力されたプロセッ
サ系間インタフェース制御装置340Aは、系間インタ
フェース信号線622を通じて、プロセッサ系間インタ
フェース制御装置340Bに、A系を切り離してもよい
か否かの確認を要求する。
The inter-processor interface controller 340A, to which the error signal 604A is input, requests the inter-processor interface controller 340B via the inter-system interface signal line 622 to confirm whether or not the A system can be disconnected. To do.

【0046】すると、プロセッサ系間インタフェース制
御装置340Bは、中央処理装置300Bの状態を確認
する。該確認の結果、B系がこの後の処理を引き継ぐこ
とのできる状態にあった場合には、中央処理装置300
Aの切り離しを許可する信号(A系切り離し許可信号)
を、系間インタフェース信号線624を通じてプロセッ
サ系間インタフェース制御装置340Aに出力する。ま
た、プロセッサ系間インタフェース制御装置340B
は、中央処理装置300Bを2重化システムバス518
A(すなわち、入出力バス520A)に接続させる指示
信号(A系接続指示信号)を、インタフェース信号線6
14Bを通じて多重システムバスアダプタ380B−1
に出力する。
Then, the inter-processor system interface controller 340B confirms the state of the central processing unit 300B. As a result of the confirmation, when the B system is in a state where it can take over the subsequent processing, the central processing unit 300
Signal for permitting disconnection of A (system A disconnection permission signal)
Is output to the processor intersystem interface control device 340A through the intersystem interface signal line 624. Further, the inter-processor system interface control device 340B
Makes the central processing unit 300B a duplicated system bus 518.
The interface signal line 6 transmits an instruction signal (A system connection instruction signal) to be connected to A (that is, the input / output bus 520A).
14B through multiple system bus adapter 380B-1
Output to

【0047】A系接続指示信号を受けた多重システムバ
スアダプタ380B−1は、中央処理装置300Bから
のアクセスを、2重化システムバス518Aへ伝えられ
るようにする。これにより、中央処理装置300Bは、
入出力バスアダプタ390A及び入出力アダプタ400
Aへのアクセスが可能となる。
The multiple system bus adapter 380B-1 which has received the A system connection instruction signal enables the access from the central processing unit 300B to be transmitted to the duplex system bus 518A. Thereby, the central processing unit 300B is
Input / output bus adapter 390A and input / output adapter 400
Access to A becomes possible.

【0048】また、上述のA系切り離し許可信号を受け
取ったプロセッサ系間インタフェース制御装置340A
は、中央処理装置300Aを2重化システムバス518
Aから切り離させるべく切り離し指示信号を、多重シス
テムバスアダプタ380A−1に出力する。この切り離
し指示信号を受けた多重システムバスアダプタ380A
−1は、これ以後、中央処理装置300Aからのアクセ
スを2重化システムバス518Aへ伝えないようにす
る。
Further, the inter-processor system interface control device 340A which has received the above-mentioned A-system disconnection permission signal
Makes the central processing unit 300A a duplicated system bus 518.
A disconnection instruction signal for disconnecting from A is output to the multiple system bus adapter 380A-1. The multi-system bus adapter 380A that has received this disconnection instruction signal
-1 prevents the access from the central processing unit 300A from being transmitted to the duplex system bus 518A thereafter.

【0049】なお、多重システムバスアダプタ380A
−2は、通常の状態では、中央処理装置300Aと2重
化システムバス518Bと切り離した状態とされてい
る。従って、多重システムバスアダプタ380A−2に
はその状態を維持させる。
The multiple system bus adapter 380A
In the normal state, -2 is a state in which the central processing unit 300A and the duplicated system bus 518B are separated. Therefore, the multi-system bus adapter 380A-2 is kept in that state.

【0050】以上のようにして系の切り替えが完了す
る。これ以降は、中央処理装置300Bによって処理が
引き継がれることになる。この後は、中央処理装置30
0Bが真に正常に機能しているか否かを確認するため
に、適当なタイミングを見計らって中央処理装置300
Bの自己診断処理が実行される。この自己診断処理につ
いては、後ほど図7などを用いて説明する。
The system switching is completed as described above. After that, the processing is taken over by the central processing unit 300B. After this, the central processing unit 30
In order to confirm whether or not 0B is truly functioning properly, the central processing unit 300 should be timed appropriately.
The self-diagnosis processing of B is executed. This self-diagnosis process will be described later with reference to FIG.

【0051】次に、系内でのデータの不一致は発生して
いないものの、プロセッシング装置が例外処理状態とな
っている場合の動作を図1および図3を用いて説明す
る。
Next, the operation when the processing device is in the exception processing state, although no data inconsistency occurs in the system, will be described with reference to FIGS. 1 and 3.

【0052】ここでは、A系,B系それぞれの系内にお
いてはデータが一致しているものの、A系のプロセッシ
ング装置310Aが例外処理状態となっている場合につ
いて述べる。
Here, a case will be described in which the data is the same in each of the A system and the B system, but the processing device 310A of the A system is in the exception processing state.

【0053】図1は、図2の中央処理装置300の詳細
を示す図である。既に述べたが、エラー信号604A
は、実際にはこの図1のごとく論理和素子602Aを通
じてプロセッサ系間インタフェース制御装置340に入
力されるようになっている。図3のフローチャートは、
プロセッシング装置のマシンサイクル毎に実行される処
理である。
FIG. 1 is a diagram showing details of the central processing unit 300 of FIG. As mentioned above, the error signal 604A
Is actually input to the inter-processor system interface controller 340 through the logical sum element 602A as shown in FIG. The flowchart of FIG.
This is a process executed every machine cycle of the processing device.

【0054】先ず、プロセッサメモリ制御装置330A
は、プロセッシング装置310A−1がデータバス50
0A−1に出力したデータと、プロセッシング装置31
0A−2がデータバス502A−1に出力したデータと
を比較する。また、同様に、プロセッシング装置310
A−1がアドレスバス500A−2に出力したアドレス
と、プロセッシング装置310A−2がアドレスバス5
02A−2に出力したアドレスとを比較する(ステップ
200)。
First, the processor memory controller 330A
Indicates that the processing device 310A-1 is connected to the data bus 50.
The data output to 0A-1 and the processing device 31
0A-2 compares the data output to the data bus 502A-1. Further, similarly, the processing device 310
The address output from A-1 to the address bus 500A-2 and the address output from the processing device 310A-2 to the address bus 5A
02A-2 is compared with the output address (step 200).

【0055】この比較結果が不一致であった場合には、
プロセッサメモリ制御機構330Aは、他系例外処理照
合回路360Aおよびプロセッサ系間インタフェース制
御装置340Aにエラー信号604Aを出力する(ステ
ップ202)。この後は、ステップ214、216、2
18の処理を経て、A系が切り離される。なお、A系を
切り離す一連の処理(ステップ202→ステップ214
→ステップ216→ステップ218)については、系内
で不一致が発生した場合の処理動作として既に述べたと
おりである。
If the comparison results do not match,
The processor memory control mechanism 330A outputs an error signal 604A to the other system exception handling collation circuit 360A and the inter-processor system interface control device 340A (step 202). After this, steps 214, 216, 2
Through the processing of 18, the A system is disconnected. A series of processes for disconnecting the A system (step 202 → step 214)
→ Step 216 → Step 218) is as described above as the processing operation when a mismatch occurs in the system.

【0056】ステップ200における比較の結果データ
及びメモリアドレスが一致していた場合、プロセッサメ
モリ制御装置330Aは、データバス504A−1を通
じてデータを主記憶装置320Aへ出力する。また、ア
ドレスバス504A−2を通じて、メモリアドレスを主
記憶装置320Aへ出力する。アドレスバス504A−
2は、例外処理アドレスアクセス検出回路350Aにも
接続されている。従って、このアドレスは例外処理アド
レスアクセス検出回路350Aにも入力されることにな
る。
If the comparison result data and the memory address in step 200 match, the processor memory control device 330A outputs the data to the main memory device 320A through the data bus 504A-1. Further, the memory address is output to the main storage device 320A through the address bus 504A-2. Address bus 504A-
2 is also connected to the exception processing address access detection circuit 350A. Therefore, this address is also input to the exception processing address access detection circuit 350A.

【0057】例外処理アドレスアクセス検出回路350
Aは、この時アドレスバス504A−2に出力されたア
ドレスが、あらかじめ定められた例外処理アドレスであ
るか否かを確認する(ステップ204)。この確認は、
アドレスバス504A−2を通じて入力されたアドレス
が、例外処理ルーチンの格納されているメモリ領域を示
すアドレスと、一致するか否かを判定することで行う。
Exception processing address access detection circuit 350
A confirms whether the address output to the address bus 504A-2 at this time is a predetermined exception processing address (step 204). This confirmation
This is performed by determining whether the address input through the address bus 504A-2 matches the address indicating the memory area in which the exception handling routine is stored.

【0058】ステップ204の結果、例外処理アドレス
でなかった場合には、例外処理アドレスアクセス検出回
路350Aは中央処理装置Aは正常状態であると判断し
て何もしない。
If the result of step 204 is that it is not an exception processing address, the exception processing address access detection circuit 350A judges that the central processing unit A is in a normal state and does nothing.

【0059】一方、ステップ204の結果、例外処理ア
ドレスであった場合、例外処理アドレスアクセス検出回
路350Aは、他系例外処理照合回路360Aおよび他
系例外処理照合回路360Bに、A系例外処理アドレス
検出信号610を出力する(ステップ208)。
On the other hand, if the result of step 204 is that the address is an exception processing address, the exception processing address access detection circuit 350A causes the other system exception processing verification circuit 360A and the other system exception processing verification circuit 360B to detect the A system exception processing address. The signal 610 is output (step 208).

【0060】ところで、B系でもA系と同期して同様の
処理が行われている。B系が例外処理状態となっている
場合には、例外処理アドレス検出回路350BからB系
例外処理アドレス検出信号612が他系例外処理照合回
路360Aに入力される。また、B系においてデータの
不一致が発生した場合には、プロセッサ系間インタフェ
ース制御装置340BからB系切り離し要求信号624
が入力される。
By the way, similar processing is performed in the B system in synchronization with the A system. When the B system is in the exception processing state, the B system exception processing address detection signal 612 is input from the exception processing address detection circuit 350B to the other system exception processing collation circuit 360A. If a data mismatch occurs in the B system, the B system disconnection request signal 624 is output from the inter-processor system interface controller 340B.
Is entered.

【0061】他系例外処理照合回路360Aは、B系例
外処理アドレス検出信号612、エラー信号604A、
B系切り離し要求信号624の状態に基づいて、A系切
り離し要求信号606Aの出力判定を行う(ステップ2
10)。なお、この判定論理については後ほど図5、図
6を用いて他系例外処理照合回路360Aの詳細と共に
説明する。
The other system exception processing collation circuit 360A has a B system exception processing address detection signal 612, an error signal 604A,
Based on the state of the B system disconnection request signal 624, the output determination of the A system disconnection request signal 606A is performed (step 2).
10). The determination logic will be described later with reference to FIGS. 5 and 6 together with the details of the other system exception handling collation circuit 360A.

【0062】ステップ210において出力要と判定され
た場合、他系例外処理照合回路360Aは、A系切り離
し要求信号606Aを、論理和素子602Aへ出力する
(ステップ212)。
If it is determined in step 210 that the output is necessary, the other system exception handling collation circuit 360A outputs the A system disconnection request signal 606A to the logical sum element 602A (step 212).

【0063】論理和素子602Aは、エラー信号604
AまたはA系切り離し要求信号606Aが出力されてい
る場合、A系切り離し要求信号608Aをプロセッサ系
間インタフェース制御装置340Aに出力する。A系切
り離し要求信号608Aが入力されると、プロセッサ系
間インタフェース制御装置340Aは、A系を切り離し
てもよいか否かの確認を要求する信号(A系切り離し要
求信号)622を、プロセッサ系間インタフェース制御
装置340Bに対して出力する(ステップ214)。
The logical sum element 602A receives the error signal 604.
When the A or A system disconnection request signal 606A is output, the A system disconnection request signal 608A is output to the inter-processor system interface control device 340A. When the A-system disconnection request signal 608A is input, the inter-processor system interface controller 340A sends a signal (A-system disconnection request signal) 622 requesting confirmation of whether or not the A-system may be disconnected between the processor systems. It is output to the interface control device 340B (step 214).

【0064】A系切り離し要求信号622を受けたプロ
セッサ系間インタフェース制御装置340Bは、B系の
プロセッシング装置310が正常であることを確認す
る。この確認は、B系切り離し要求信号608Bの出力
の有無を判定することで行う。B系切り離し要求信号6
08Bが出力されていない場合には、B系のプロセッシ
ング装置310が正常であるとプロセッサ系間インタフ
ェース制御装置340Bは判断し、A系の切り離しを許
可するべくA系プロセッサ系間インタフェース制御装置
340AにA系切り離し許可信号624を出力する。ま
た、多重システムバスアダプタ380B−1に、A系接
続指示信号614Bを出力する。
The inter-processor system interface controller 340B, which has received the A-system disconnection request signal 622, confirms that the B-system processing device 310 is normal. This confirmation is performed by determining whether or not the B-system disconnection request signal 608B is output. B system disconnection request signal 6
If 08B is not output, the inter-processor system interface control device 340B determines that the B-system processing device 310 is normal, and the A-system inter-processor system interface control device 340A permits the disconnection of the A system. The A-system disconnection permission signal 624 is output. Further, the A system connection instruction signal 614B is output to the multiplex system bus adapter 380B-1.

【0065】A系切り離し許可信号624を受信したA
系プロセッサ系間インタフェース制御装置340Aは、
切り離し指示信号614Aを多重システムバスアダプタ
380A−1に出力する(ステップ216,218)。
A that has received the A-system disconnection permission signal 624
System processor inter-system interface controller 340A,
The disconnection instruction signal 614A is output to the multi-system bus adapter 380A-1 (steps 216 and 218).

【0066】これに応じて多重システムバスアダプタ3
80B−1は、中央処理装置300Bと2重化システム
バス518Aとを接続する。一方、多重システムバスア
ダプタ380A−1は、中央処理装置300Aを2重化
システムバス518Aから切り離す。
In accordance with this, the multi-system bus adapter 3
80B-1 connects the central processing unit 300B and the duplex system bus 518A. On the other hand, the multiple system bus adapter 380A-1 disconnects the central processing unit 300A from the duplex system bus 518A.

【0067】このように例外処理状態にあるか否かを判
定することでいずれの系を信頼すべきかを決定してい
る。そして、例外処理状態になっていない方の系によっ
て処理を継続することとしている。この後は、処理を継
続することとなった系の自己診断処理を適当なタイミン
グを見計らって実行する。この自己診断処理については
後ほど、図7などを用いて説明する。
As described above, which system should be trusted is determined by determining whether or not the system is in the exception processing state. Then, the processing is continued by the system that is not in the exception processing state. After this, the self-diagnosis process of the system which is supposed to continue the process is executed at an appropriate timing. This self-diagnosis process will be described later with reference to FIG.

【0068】次に、上記各部ごとのより詳細な構成を説
明する。
Next, a more detailed configuration of each of the above parts will be described.

【0069】プロセッサメモリ制御装置330Aの詳細
を図4を用いて説明する。なお、プロセッサメモリ制御
装置330Bは、プロセッサメモリ制御装置330Aと
全く同じ構成である。
Details of the processor memory controller 330A will be described with reference to FIG. The processor memory control device 330B has exactly the same configuration as the processor memory control device 330A.

【0070】プロセッサメモリ制御装置330Aは、大
きく分けて、プロセッサインタフェースユニット(以下
“PIU”と呼ぶ)700、メモリインタフェースユニ
ット(以下“MIU”と呼ぶ)702、システムバスイ
ンタフェースユニット(以下“SBIU”と呼ぶ)70
4、論理和素子706およびプロセッシング装置出力比
較器708からなる。また、該装置内の各所には、必要
に応じて適宜ラッチLが配置されている。
The processor memory control unit 330A is roughly divided into a processor interface unit (hereinafter referred to as "PIU") 700, a memory interface unit (hereinafter referred to as "MIU") 702, and a system bus interface unit (hereinafter referred to as "SBIU"). Call) 70
4, an OR element 706 and a processing device output comparator 708. In addition, latches L are appropriately arranged at various places in the apparatus as needed.

【0071】PIU700は、プロセッシング装置31
0からのアクセスを受け付けるものである。プロセッシ
ング装置310A−1の外部アクセスがメモリアクセス
の場合、PIU700は、プロセッシング装置310A
−1の出力するメモリアドレスおよびデータを、バス5
00A−1,500A−2を通じて受信バッファ714
に取り込むようになっている。プロセッシング装置31
0A−1の外部アクセスが入出力バスへのアクセスの場
合も同様に、プロセッシング装置310A−1の出力す
るメモリアドレスおよびデータを受信バッファ712に
格納するようになっている。
The PIU 700 includes a processing device 31.
Access from 0 is accepted. When the external access of the processing device 310A-1 is a memory access, the PIU 700 determines that the processing device 310A-1
-1 outputs the memory address and data to the bus 5
00A-1, 500A-2 to receive buffer 714
It is designed to be taken into. Processing device 31
Similarly, when the external access of 0A-1 is an access to the input / output bus, the memory address and data output from the processing device 310A-1 are stored in the reception buffer 712.

【0072】SBIU704は、システムバス370A
からのDMAアクセスと、PIU700からの入出力バ
スへのアクセスを処理するものである。
The SBIU 704 is connected to the system bus 370A.
To access the I / O bus from the PIU 700.

【0073】PIU700からのアクセスが入出力バス
リードアクセスである場合、SBIU704はシステム
バス権を獲得した後、受信バッファ712に格納された
アドレスをセレクタ734を通じてシステムバス370
Aに出力する。また、システムバス370Aから入力さ
れたリードデータを、セレクタ732を介して、一旦、
送信バッファ716に格納させる。このリードデータは
この後、プロセッシング装置310A−1,310A−
2に返される。一方、PIU700からのアクセスが入
出力バスライトアクセスである場合、SBIU704
は、システムバス権を獲得した後、受信バッファ712
に格納されているリードアドレスとライトデータをセレ
クタ734等を介してシステムバス370Aに出力す
る。
When the access from the PIU 700 is an input / output bus read access, the SBIU 704 acquires the system bus right, and then uses the address stored in the reception buffer 712 through the selector 734 to the system bus 370.
Output to A. Further, the read data input from the system bus 370A is temporarily transferred to the selector 732,
It is stored in the transmission buffer 716. This read data is then processed by the processing devices 310A-1 and 310A-.
Returned to 2. On the other hand, if the access from the PIU 700 is an I / O bus write access, the SBIU 704
After acquiring the system bus right, the reception buffer 712
And outputs the read address and the write data stored in the system bus 370A via the selector 734 and the like.

【0074】システムバス370AからのアクセスがD
MAリードである場合、SBIU704は受信バッファ
720に格納されているリードアドレスを、MIU70
2のセレクタ736に出力する。また、システムバス3
70AからのアクセスがDMAライトである場合は、受
信バッファ720に格納されたライトアドレスとライト
データを、MIU702のセレクタ736に出力する。
Access from the system bus 370A is D
In the case of MA read, the SBIU 704 sets the read address stored in the reception buffer 720 to the MIU 70.
2 to the selector 736. Also, the system bus 3
If the access from 70A is a DMA write, the write address and write data stored in the receive buffer 720 are output to the selector 736 of the MIU 702.

【0075】MIU702は、PIU700からのメモ
リアクセスとSBIU704からのDMAアクセスとを
セレクタ736で受け付け、これに応じて主記憶装置3
20Aにアクセスする。そして、その応答結果を、それ
ぞれPIU700あるいはSBIU704に返す。
The MIU 702 accepts the memory access from the PIU 700 and the DMA access from the SBIU 704 at the selector 736, and in response to this, the main memory 3
Access 20A. Then, the response result is returned to the PIU 700 or the SBIU 704, respectively.

【0076】MIU702がPIU700から受けるア
クセスには、メモリリードとメモリライトとがある。メ
モリリードの場合、受信バッファ714に格納されたリ
ードアドレスがセレクタ736を介して、主記憶装置3
20Aに伝えられる。そして、読み出されたデータは、
セレクタ732を介して、一旦、送信バッファ716に
格納される。そして、この後、プロセッシング装置31
0A−1,310A−2に返される。一方、PIU70
0から受けたアクセスがメモリライトの場合、受信バッ
ファ714に格納されているライトアドレスおよびライ
トデータがセレクタ736を介して、主記憶装置320
Aに伝えられる。主記憶装置320Aは、このライトア
ドレスにこのライトデータを書き込む。
The access that MIU 702 receives from PIU 700 includes memory read and memory write. In the case of memory read, the read address stored in the reception buffer 714 is transferred via the selector 736 to the main storage device 3.
It is transmitted to 20A. Then, the read data is
It is temporarily stored in the transmission buffer 716 via the selector 732. Then, after this, the processing device 31
0A-1, 310A-2. On the other hand, PIU70
When the access received from 0 is a memory write, the write address and write data stored in the reception buffer 714 are transferred via the selector 736 to the main storage device 320.
A is told. The main storage device 320A writes this write data to this write address.

【0077】MIU702がSBIU704から受ける
アクセスには、DMAリードとDMAライトとがある。
DMAリードの場合、MIU702はSBIU704の
受信バッファ720から送られてきたリードアドレスを
セレクタ736を介して主記憶装置320Aに伝える。
そして、主記憶装置302Aから読み出されたデータ
を、セレクタ732を介して一旦SBIU704の送信
バッファ718に格納する。この後、この読み出された
データは、システムバス370Aを介して入出力バスあ
るいは入出力装置に返される。一方、SBIU704か
ら受けたアクセスがDMAライトの場合、MIU702
はSBIU704の受信バッファ720から送られてき
たライトアドレスとライトデータを、セレクタ736を
介して、主記憶装置320Aに伝える。すると、主記憶
装置320Aは、このライトアドレスにこのライトデー
タを書き込む。
The access that MIU 702 receives from SBIU 704 includes DMA read and DMA write.
In the case of DMA read, the MIU 702 transmits the read address sent from the receive buffer 720 of the SBIU 704 to the main storage device 320A via the selector 736.
Then, the data read from the main storage device 302A is temporarily stored in the transmission buffer 718 of the SBIU 704 via the selector 732. After that, the read data is returned to the input / output bus or the input / output device via the system bus 370A. On the other hand, if the access received from SBIU 704 is DMA write, MIU 702
Sends the write address and write data sent from the receive buffer 720 of the SBIU 704 to the main storage device 320A via the selector 736. Then, the main memory 320A writes this write data to this write address.

【0078】プロセッサメモリ制御装置330Aは、プ
ロセッシング装置310A−2の出力するメモリアドレ
ス/データも信号線502A−1、502A−2を介し
て取り込んでいる。しかし、PIU700は、これらを
受信バッファ712,714には格納しない。プロセッ
シング装置310A−2の出力するメモリアドレス/デ
ータは、プロセッシング装置310A−1から送られて
来たアドレス/データおよび制御信号との比較にのみ用
いられる。この比較は、プロセッシング装置310A−
1が書き込みアクセスを出力した時に、プロセッシング
装置出力比較器708によって行われる。比較の結果、
値が不一致であった場合には、プロセッシング装置出力
比較器708は、エラー信号722をアサートする。こ
のエラー信号722は論理和素子706に出力されてい
る。
The processor memory control device 330A also takes in the memory address / data output from the processing device 310A-2 via the signal lines 502A-1 and 502A-2. However, the PIU 700 does not store these in the reception buffers 712 and 714. The memory address / data output from the processing device 310A-2 is used only for comparison with the address / data and the control signal sent from the processing device 310A-1. This comparison is based on the processing device 310A-
Performed by processing device output comparator 708 when 1 outputs a write access. As a result of the comparison,
If the values do not match, processing device output comparator 708 asserts error signal 722. The error signal 722 is output to the logical sum element 706.

【0079】次に、例外処理アドレスアクセス検出回路
350Aおよび他系例外処理照合回路360Aを図5を
用いて説明する。
Next, the exception processing address access detection circuit 350A and the other system exception processing collation circuit 360A will be described with reference to FIG.

【0080】なお、B系の例外処理アドレスアクセス検
出回路350B、他系例外処理照合回路360Bは、例
外処理アドレスアクセス検出回路350Aおよび他系例
外処理照合回路360Aと全く同じ構成である。
The B system exception processing address access detection circuit 350B and the other system exception processing collation circuit 360B have exactly the same configuration as the exception processing address access detection circuit 350A and the other system exception processing collation circuit 360A.

【0081】例外処理アドレスアクセス検出回路350
Aは、メモリ734,736等と、比較器738,74
0等と、論理和素子742とからなる。また、該装置内
の各所には、必要に応じて適宜ラッチLが配置されてい
る。
Exception processing address access detection circuit 350
A is a memory 734, 736 and the like, and comparators 738, 74.
0 and the like, and an OR element 742. In addition, latches L are appropriately arranged at various places in the apparatus as needed.

【0082】メモリ734,736・・・には、主記憶
装置320A上において例外処理ルーチンの格納されて
いる領域を示すアドレス(以下“例外処理アドレス”と
いう)があらかじめ格納されている。
In the memories 734, 736, ..., Addresses (hereinafter referred to as "exception processing addresses") indicating areas in the main memory 320A where exception processing routines are stored are stored in advance.

【0083】比較器738,740は、アドレスバス5
04−2に出力されたメモリアドレスと、メモリ73
4、736等に格納されている例外処理アドレスとを比
較するものである。該比較の結果、両者が一致していた
場合には、該比較器738等は、その旨を示す信号を出
力する。
The comparators 738 and 740 are connected to the address bus 5
The memory address output to 04-2 and the memory 73
It is for comparing with the exception processing address stored in 4, 736 and the like. As a result of the comparison, when the two match, the comparator 738 and the like output a signal indicating that.

【0084】なお、これらのメモリおよび比較器は、検
出したい例外処理アドレスの個数分だけ設ければよい。
It should be noted that these memories and comparators may be provided as many as the number of exception processing addresses to be detected.

【0085】論理和素子742は、例外処理アドレス一
致を検出したことを他系例外処理照合回路360Aに伝
えるためのものであり、比較器738,740等の出力
信号が入力されている。
The OR element 742 is for notifying the other system exception handling collation circuit 360A that the exception handling address match has been detected, and the output signals of the comparators 738, 740 etc. are inputted.

【0086】他系例外処理照合回路360Aには、エラ
ー信号604Aと、B系切り離し要求信号624と、B
系例外処理アドレス検出信号612と、A系例外処理ア
ドレス検出信号610が入力されている。他系例外処理
照合回路360AのA系切り離し要求/A系自己診断要
求出力判定部744は、これらの入力信号の状態に基づ
いて出力判定を行う。そして、その判定結果に応じて、
A系切り離し要求信号606AとA系自己診断要求割込
信号620Aを出力する。他系例外処理照合回路360
Aによるこの出力判定の判定論理を図6に示した。この
図はA系についてのものであるため、図中における“他
系”とは“B系に相当する。また、”自系“とはA系に
相当する。他の図中での記載についても同様である。
The other system exception processing collation circuit 360A has an error signal 604A, a B system disconnection request signal 624, and a B system disconnection request signal 624.
The system exception handling address detection signal 612 and the A system exception handling address detection signal 610 are input. The A-system disconnection request / A-system self-diagnosis request output determination unit 744 of the other-system exception processing collation circuit 360A makes an output determination based on the states of these input signals. Then, according to the determination result,
The A-system disconnection request signal 606A and the A-system self-diagnosis request interrupt signal 620A are output. Other system exception handling collation circuit 360
The decision logic of this output decision by A is shown in FIG. Since this figure is for system A, "other system" in the figure corresponds to "system B.""Selfsystem" corresponds to system A. Description in other figures Is also the same.

【0087】図6からわかるとおり、A系切り離し要求
信号606Aがアサートされるのは、図6(f)の場
合、つまり、エラー信号604A,B系切り離し要求6
24およびB系例外処理アドレス検出信号612はアサ
ートされず、A系例外処理アドレス検出610のみがア
サートされている場合である。但し、信号608Aは、
図6(f)の場合のみならず、図6(a),(b)の場
合にも出力される。これは、論理和素子602Aにはエ
ラー信号604Aが直接入力されているからである。つ
まり、他系例外処理照合回路360Aは下記のの状態
(特例)が発生しているか否かを見極めるための回路で
ある。A系からB系に対してA系切り離し要求622が
出力されるのは以下のの場合(原則)と、の場合
(特例)とである。
As can be seen from FIG. 6, the A system disconnection request signal 606A is asserted in the case of FIG. 6F, that is, the error signals 604A, B system disconnection request 6
24 and B system exception handling address detection signal 612 is not asserted, and only A system exception handling address detection 610 is asserted. However, the signal 608A is
This is output not only in the case of FIG. 6 (f) but also in the cases of FIGS. 6 (a) and 6 (b). This is because the error signal 604A is directly input to the logical sum element 602A. That is, the other-system exception handling collation circuit 360A is a circuit for determining whether or not the following state (special case) has occurred. The A-system disconnection request 622 is output from the A-system to the B-system in the following cases (in principle) and in the following cases (special cases).

【0088】原則 A系内でデータ不一致が発生しエラー信号604Aが出
力された場合。
In principle, when a data mismatch occurs in the A system and an error signal 604A is output.

【0089】特例 A系内においてはデータ不一致は発生してはいないもの
プロセッシング装置310Aが例外処理状態となってお
り、一方B系はプロセッシング装置310Bが例外処理
状態とはなっておらず、データの不一致も発生していな
い場合。
Special case Although no data inconsistency occurs in the A system, the processing device 310A is in the exceptional processing state, while in the B system, the processing device 310B is not in the exceptional processing state and the data If no discrepancy has occurred.

【0090】また、A系自己診断要求割込信号620A
がアサートされるのは、図6(e)の場合、つまり、エ
ラー信号604A,B系切り離し要求信号624および
A系例外処理アドレス検出信号610はアサートされて
おらず、B系例外処理アドレス検出信号612のみがア
サートされている場合である。
Also, the A-system self-diagnosis request interrupt signal 620A
6 (e), that is, the error signals 604A, B system disconnection request signal 624 and A system exception handling address detection signal 610 are not asserted, and the B system exception handling address detection signal is asserted. This is the case when only 612 is asserted.

【0091】なお、図6(a)は、A系内,B系内にお
いてともにデータの不一致が発生している場合であり、
A系切り離し要求信号622、B系切り離し要求信号6
24が共に出力されることになる。(b)は、A系内に
おいてのみデータの不一致が発生している場合であり、
必ずA系切り離し要求信号622が出力される。(c)
は、B系においてのみデータの不一致が発生している場
合であり、B系切り離し要求信号624が出力される。
(d)は、A系,B系ともに正常な場合である。(e)
は、A系内,B系内においてはともにデータが一致して
はいるものの、B系が例外処理状態となっている場合で
ある。この場合には、A系がこの後も引き続き処理を担
当する。但し、A系は自己診断を実行することで、正常
であることを確認する。(f)は、A系内,B系内にお
いてはともにデータが一致してはいるものの、A系が例
外処理状態となっている場合である。この場合には、B
系が処理を引き継ぐ。また、図には記載していないが、
B系は自己診断を実行することで、正常であることを確
認する。(g)は、 A系内,B系内においてはともに
データが一致してはいるものの、A系,B系ともに例外
処理状態となっている場合である。この場合は、主系た
るA系によって処理を引き続き行う。
FIG. 6 (a) shows the case where data inconsistency occurs in both the A system and the B system.
A-system disconnection request signal 622, B-system disconnection request signal 6
24 will be output together. (B) is the case where the data mismatch occurs only in the A system,
The A-system disconnection request signal 622 is always output. (C)
In the case where data mismatch occurs only in the B system, the B system disconnection request signal 624 is output.
(D) is a case where both the A system and the B system are normal. (E)
In this case, the data is the same in both the A system and the B system, but the B system is in the exception processing state. In this case, the A system continues to take charge of the processing even after this. However, system A confirms that it is normal by executing self-diagnosis. (F) is a case where the data is the same in both the A system and the B system, but the A system is in the exception processing state. In this case, B
The system takes over the processing. Also, although not shown in the figure,
System B confirms that it is normal by executing self-diagnosis. (G) is a case where the data is the same in both the A system and the B system, but in the exception processing state in the A system and the B system. In this case, the processing is continued by the main system A.

【0092】次に、他系例外処理照合回路360Aが自
己診断要求割込620Aを出力した場合に行われる自己
診断処理を図7を用いて説明する。
Next, the self-diagnosis processing performed when the other-system exception processing collation circuit 360A outputs the self-diagnosis request interrupt 620A will be described with reference to FIG.

【0093】ここでは、他系例外処理照合回路360A
が自己診断要求割込信号620Aをプロセッシング装置
310A−1,310A−2に出力した場合(上述の図
6(e)の場合)について述べる。
Here, the other system exception handling collation circuit 360A
Will output the self-diagnosis request interrupt signal 620A to the processing devices 310A-1 and 310A-2 (the case of FIG. 6E described above).

【0094】自己診断要求割込信号620Aが入力され
ると、プロセッシング装置310A−1,310A−2
は、その時実行中の命令終了後に、あらかじめ定められ
た自己診断用の四則演算を実行する(ステップ23
0)。
When the self-diagnosis request interrupt signal 620A is input, the processing units 310A-1 and 310A-2 are processed.
Executes the predetermined four arithmetic operations for self-diagnosis after the end of the instruction being executed at that time (step 23).
0).

【0095】中央処理装置300A内の自己診断プログ
ラム(図示せず)は、この四則演算の結果に異常がある
か否かを判定する(ステップ231)。判定の結果、正
常であった場合には、続いて、主記憶装置320Aに対
する任意データのライト/リード比較チェックを実行さ
せる(ステップ232)。そして、同様に、その結果が
正常であるか否かを判定する(ステップ233)。判定
の結果、正常であった場合は、この自己診断のために一
時停止していたプログラムの実行を再開する。再開位置
は、自己診断の開始直前に実行していた命令の次の命令
からとする。
The self-diagnosis program (not shown) in the central processing unit 300A determines whether or not the result of the four arithmetic operations is abnormal (step 231). If the result of the determination is that it is normal, then a write / read comparison check of arbitrary data to the main memory 320A is executed (step 232). Then, similarly, it is determined whether or not the result is normal (step 233). If the result of determination is normal, execution of the program suspended for this self-diagnosis is resumed. The restart position is from the instruction next to the instruction executed immediately before the start of self-diagnosis.

【0096】ステップ231またはステップ233で異
常があった場合には、自己診断部は、プロセッシング装
置310A−1,310A−2に対して処理停止要求割
込を入力する(ステップ234)。すると、プロセッシ
ング装置310A−1,310A−2は処理を停止す
る。
If an abnormality is found in step 231 or step 233, the self-diagnosis unit inputs a processing stop request interrupt to the processing devices 310A-1 and 310A-2 (step 234). Then, the processing devices 310A-1 and 310A-2 stop processing.

【0097】尚、ここでは診断内容としてプロセッシン
グ装置の演算と主記憶装置のライト/リード比較のみ記
述したが、必要に応じプロセッシング装置周辺のハード
ウェア診断も実行する。
Note that, here, only the calculation of the processing device and the write / read comparison of the main storage device are described as the diagnosis contents, but hardware diagnosis around the processing device is also executed if necessary.

【0098】次に、プロセッサ系間インタフェース制御
装置340Aの詳細を、図8,図9を用いて説明する。
なお、プロセッサ系間インタフェース制御装置340B
は、プロセッサ系間インタフェース制御装置340Aと
全く同じ構成である。
Details of the inter-processor system interface controller 340A will be described below with reference to FIGS.
The inter-processor interface controller 340B
Has exactly the same configuration as the inter-processor system interface control device 340A.

【0099】プロセッサ系間インタフェース制御装置3
40Aは、状態レジスタ768と、切り離し判定回路7
64とを備えている。また、該装置内の各所には、必要
に応じて適宜ラッチLが配置されている。
Inter-processor system interface controller 3
40A includes a status register 768 and a disconnection determination circuit 7
And 64. In addition, latches L are appropriately arranged at various places in the apparatus as needed.

【0100】状態レジスタ768は、中央処理装置30
0Aの状態を保持するものである。
The status register 768 is used by the central processing unit 30.
It holds the state of 0A.

【0101】切り離し判定回路764は、どちらの系を
切り離すべきかを判定するためのものである。この切り
離し判定回路764は、後述する判定論理に従って、い
ずれの系を切り離すかを決定する。
The disconnection determination circuit 764 is for determining which system should be disconnected. The disconnection determination circuit 764 determines which system is disconnected according to the determination logic described later.

【0102】A系切り離し要求信号608Aは、エラー
信号604AとA系切り離し要求信号606Aとの論理
和をとったものである。A系切り離し要求信号608A
は切り離し判定回路764に入力されている。また、こ
の信号608Aは、そのままA系切り離し要求信号62
2−1として、プロセッサ系間インタフェース制御装置
340Bに対して出力されている。このA系切り離し要
求信号622−1に対する応答としてプロセッサ系間イ
ンタフェース制御装置340Bから返されてくるのが、
A系切り離し許可信号624−2である。このA系切り
離し許可信号624−2を、ラッチで受けて、タイミン
グ調整した上で出力したのが、中央処理装置300Aの
切り離し指示信号614A−2である。この切り離し指
示信号614A−2によって、中央処理装置300Aを
2重化システムバス518A、518Bから切り離す。
The A-system disconnection request signal 608A is the logical sum of the error signal 604A and the A-system disconnection request signal 606A. A system disconnection request signal 608A
Is input to the disconnection determination circuit 764. Also, this signal 608A is the A system disconnection request signal 62 as it is.
2-1 is output to the inter-processor system interface control device 340B. As a response to the A-system disconnection request signal 622-1, the processor-system interface controller 340B returns:
This is the A-system disconnection permission signal 624-2. It is the disconnection instruction signal 614A-2 of the central processing unit 300A that receives the A-system disconnection permission signal 624-2 by the latch, adjusts the timing, and then outputs the signal. The disconnection instruction signal 614A-2 disconnects the central processing unit 300A from the duplex system buses 518A and 518B.

【0103】これとは反対に、プロセッサ系間インタフ
ェース制御装置340Aには、プロセッサ系間インタフ
ェース制御装置340BからB系切り離し要求信号62
4−1が入力されている。このB系切り離し要求信号6
24−1は、信号770として切り離し判定回路764
へ入力される。そして、これに対する応答としてA系の
切り離し判定回路764がプロセッサ系間インタフェー
ス制御装置340Bに出力するのがB系切り離し許可信
号622−2である。また、中央処理装置300Aと2
重化システムバス518Bとを接続させるべく切り離し
判定回路764が出力するのが、B系接続指示信号61
4A−1である。
On the contrary, the inter-processor system interface controller 340A sends the B system disconnection request signal 62 from the inter-processor system interface controller 340B.
4-1 has been input. This B system disconnection request signal 6
24-1 outputs the signal 770 as the disconnection determination circuit 764.
Is input to Then, in response to this, the A-system disconnection determination circuit 764 outputs the B-system disconnection permission signal 622-2 to the inter-processor system interface controller 340B. In addition, the central processing units 300A and 2
The disconnection determination circuit 764 outputs to connect the redundant system bus 518B to the B system connection instruction signal 61.
4A-1.

【0104】切り離し判定回路764の判定論理を図9
を用いて説明する。
FIG. 9 shows the decision logic of the disconnection decision circuit 764.
This will be described with reference to FIG.

【0105】エラーは、同時に2箇所で発生したり、既
に片系が切り離されているときに残存系でエラーが発生
することがある。そのため、切り離し要求に対してその
まま切り離し許可を出力したのでは、両系とも切り離し
てしまうことになる場合がある。そこで、切り離し判定
回路764は、その時A系が処理を継続できる状態にあ
ることを確認してから、B系切り離し許可信号766
(622−2)と、B系接続指示信号614A−1とを
アサートする。
The error may occur at two locations at the same time, or an error may occur in the remaining system when one system is already disconnected. Therefore, if the disconnection permission is output as it is in response to the disconnection request, both systems may be disconnected. Therefore, the disconnection determination circuit 764 confirms that the A system is in a state where the processing can be continued at that time, and then the B system disconnection permission signal 766.
(622-2) and the B system connection instruction signal 614A-1 are asserted.

【0106】従って、B系切り離し指示信号766とB
系接続信号614A−1がアサートされるのは、図9
(b)の場合、つまり、A系がオンライン状態であっ
て、A系切り離し要求608A(622−1)が入力さ
れておらず、且つ、B系切り離し要求770(624−
1)が出力されている場合のみである。
Therefore, the B system disconnection instruction signal 766 and B
The system connection signal 614A-1 is asserted in FIG.
In the case of (b), that is, the A system is online, the A system disconnection request 608A (622-1) is not input, and the B system disconnection request 770 (624-).
Only when 1) is output.

【0107】なお、図9(a)は、A系,B系ともにデ
ータ不一致となっている場合である(図6(a)に相
当)。図9(b)は、B系のみがデータ不一致となって
いる場合(図6(c)に相当)、あるいは、A系内,B
系内においてはともにデータが一致してはいるもののB
系が例外処理状態となっている場合(図6(e)に相
当)である。また、A系は正常でオンライン状態となっ
ている。図9(c)は、図9(b)と同様の状況ではあ
るものの、A系には他の何らかの障害が発生している場
合である。図9(d)は、A系のみにデータ不一致が発
生している場合(図6(b)に相当)、あるいは、A系
内,B系内においてはともにデータが一致してはいるも
ののA系が例外処理状態となっている場合(図6(f)
に相当)である。図9(e)は、A系,B系ともに正常
な場合(図6(d)に相当)、あるいは、 A系内,B
系内においてはともにデータが一致してはいるもののA
系,B系ともに例外処理状態となっている場合(図6
(g)に相当)である。
Note that FIG. 9A shows a case where the data in both the A system and the B system do not match (corresponding to FIG. 6A). FIG. 9B shows a case where the data in only the B system does not match (corresponding to FIG. 6C), or in the A system, B
Within the system, the data are the same, but B
This is the case where the system is in the exception processing state (corresponding to FIG. 6 (e)). In addition, the A system is normal and online. FIG. 9 (c) shows a situation similar to that of FIG. 9 (b), but with some other fault occurring in the A system. FIG. 9 (d) shows the case where the data mismatch occurs only in the A system (corresponding to FIG. 6 (b)), or the data in the A system and the B system both match, but A When the system is in the exception processing state (Fig. 6 (f))
Is equivalent to). FIG. 9E shows the case where both the A system and the B system are normal (corresponding to FIG. 6D), or
Although the data are the same in the system, A
System B and system B are in exception processing state (Fig. 6)
(Corresponding to (g)).

【0108】以上説明したとおり本実施形態では、単に
データの一致/不一致のみならず、プロセッシング装置
が例外処理状態にあるか否かをも故障系の切り分けの判
断基準としている。そのため、A系,B系それぞれの系
内においては2重化プロセッシング装置間のデータが一
致してはいるものの、その一致しているデータがA系と
B系とで異なっているような事態(系内一致、系間不一
致)が生じても、これに対処して処理を継続することが
できる。
As described above, in the present embodiment, not only the coincidence / non-coincidence of data but also whether or not the processing device is in the exception processing state is used as the criterion for determining the fault system. Therefore, in each of the A system and the B system, although the data between the duplication processing devices match, the matching data is different between the A system and the B system ( Even if the in-system match or the inter-system mismatch occurs, the processing can be continued by coping with this.

【0109】また、処理を引き継ぐプロセッシング装置
および周辺ハードウエアに自己診断処理を行わせること
で、真に異常の無いことを確認できる。
Further, it is possible to confirm that there is no true abnormality by causing the processing device and peripheral hardware that take over the processing to perform the self-diagnosis processing.

【0110】上記実施形態ではいずれかの系を切り離す
場合には、該切り離された系にそれまで接続されていた
バスに、それ以降処理を引き継ぐ系を接続するようにし
ていた。しかし、上記実施形態では中央処理装置300
のみならず入出力バス520およびシステムバス380
も多重化しており、処理を引き継ぐ系も自らのバスを備
えている。従って、単に障害のあった系をそのバスから
切り離すだけでも構わない。例えば、障害の発生したA
系を入出力バス520Aから切り離す場合でも、処理を
引き継ぐB系を入出力バス520Aに接続させなくても
構わない。B系は当初から自らに接続されている入出力
バス520Bを使用して処理を引き継ぐことができる。
In the above embodiment, when disconnecting any of the systems, the system that has succeeded the processing thereafter is connected to the bus that has been connected to the separated system. However, in the above embodiment, the central processing unit 300
Not only input / output bus 520 and system bus 380
Is also multiplexed, and the system that takes over the processing also has its own bus. Therefore, it is possible to simply disconnect the faulty system from the bus. For example, the failure A
Even when the system is disconnected from the I / O bus 520A, the B system that takes over the processing does not have to be connected to the I / O bus 520A. The B system can take over the processing by using the input / output bus 520B connected to itself from the beginning.

【0111】なお、特許請求の範囲において言う“不一
致検出手段”とは、上述の実施形態のA系においてはプ
ロセッサメモリ制御装置330Aに相当する。“処理状
態判定手段”とは例外処理アドレスアクセス検出回路3
50Aに相当する。“他系処理状態確認手段“とは他系
例外処理照合回路360Aに相当する。“切換手段”と
は、他系例外処理照合回路360A、およびプロセッサ
系間インタフェース制御装置340Aに相当する。“要
求手段”および“応答手段”とは、プロセッサ系間イン
タフェース制御装置340A(特に、切り離し判定部7
64)に相当する。“許可信号”とは、信号622−
2、624−2に相当する(図8参照)。“切り離して
もよいか否かの確認の要求”とは、信号624−1、6
22−1に相当する(図8参照)。“外部装置”とは、
入出力バス520A,B、システムバス380A−1,
A−2,B−1,B−2およびこれらを制御するバスア
ダプタ、さらには、これらの入出力バスを通じて接続さ
れる機器に相当する。
The "mismatch detection means" referred to in the claims corresponds to the processor memory controller 330A in the A system of the above-described embodiment. The "processing state determination means" is the exception processing address access detection circuit 3
Equivalent to 50A. The "other system processing state confirmation means" corresponds to the other system exception processing collation circuit 360A. The "switching means" corresponds to the other system exception handling collation circuit 360A and the inter-processor system interface control device 340A. The "requesting means" and the "response means" mean the inter-processor system interface control device 340A (in particular, the disconnection judging section 7).
64). The “permission signal” is the signal 622-
2, 624-2 (see FIG. 8). “Request for confirmation of whether or not to disconnect” means signals 624-1 and 6-24.
22-1 (see FIG. 8). What is an "external device"?
I / O buses 520A, B, system buses 380A-1,
It corresponds to A-2, B-1, B-2, a bus adapter for controlling them, and a device connected through these input / output buses.

【0112】[0112]

【発明の効果】本発明によれば、どのプロセッシング装
置が異常であるか判断できないような場合(例えば、系
内一致系間不一致)でもシステムダウンさせることな
く、処理を継続させることができる。
According to the present invention, even if it is not possible to determine which processing device is abnormal (for example, in-system coincidence, inconsistency between systems), the processing can be continued without bringing down the system.

【0113】また、自己診断処理を行うことで、異常の
ないことを確実に確認することができる。
Further, by performing the self-diagnosis processing, it can be surely confirmed that there is no abnormality.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施形態の要部構成を示すブロ
ック図である。
FIG. 1 is a block diagram showing a configuration of a main part of a first embodiment of the present invention.

【図2】第1の実施形態の全体構成を示すブロック図で
ある。
FIG. 2 is a block diagram showing the overall configuration of the first embodiment.

【図3】動作を示すフローチャートである。FIG. 3 is a flowchart showing an operation.

【図4】プロセッサメモリ制御装置330Aのブロック
図である。
FIG. 4 is a block diagram of processor memory controller 330A.

【図5】例外処理アドレスアクセス検出回路350Aお
よび他系例外処理照合回路360Aの詳細を示すブロッ
ク図である。
FIG. 5 is a block diagram showing details of an exception processing address access detection circuit 350A and another system exception processing collation circuit 360A.

【図6】他系例外処理照合回路360Aの判定論理を示
す図である。
FIG. 6 is a diagram showing a determination logic of another system exception handling collation circuit 360A.

【図7】自己診断処理を示すフローチャートである。FIG. 7 is a flowchart showing a self-diagnosis process.

【図8】プロセッサ系間インタフェース制御装置340
Aの詳細を示すブロック図である。
FIG. 8 is a processor system interface controller 340.
It is a block diagram which shows the detail of A.

【図9】切り離し判定回路764の判定論理を示す図で
ある。
FIG. 9 is a diagram showing the determination logic of a disconnection determination circuit 764.

【符号の説明】[Explanation of symbols]

310・・・プロセッシング装置、320・・・主記憶
装置、330・・・プロセッサメモリ制御装置、340
・・・プロセッサ系間インタフェース制御装置、350
・・・例外処理アドレスアクセス検出回路、360・・
・他系例外処理照合回路
310 ... Processing device, 320 ... Main memory device, 330 ... Processor memory control device, 340
... Processing system interface control device, 350
... Exception processing address access detection circuit 360 ...
・ Other system exception processing collation circuit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 宮崎 義弘 茨城県日立市大みか町五丁目2番1号 株 式会社日立製作所大みか工場内 (72)発明者 石倉 秀司 茨城県日立市大みか町五丁目2番1号 株 式会社日立製作所大みか工場内 ─────────────────────────────────────────────────── ─── Continuation of front page (72) Inventor Yoshihiro Miyazaki 5-2-1 Omika-cho, Hitachi City, Ibaraki Hitachi Ltd. Omika Plant, Hitachi Ltd. (72) Hideji Ishikura 5-2 Omika-cho, Hitachi City, Ibaraki Prefecture No. 1 Stock company Hitachi Ltd. Omika factory

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】多重化された複数個のプロセッシング装置
を備えた系を複数備え、異常の発生時にはこれら系と外
部装置との接続関係を変更することで処理を継続する多
重化計算機における障害検出処理方法において、 上記異常が上記プロセッシング装置それぞれの出力のう
ちのどれが適当であるかを判別できないものである場合
には、上記系それぞれの上記プロセッシング装置の処理
状態を確認し、 上記確認の結果、上記プロセッシング装置があらかじめ
定められた例外処理を実行している状態(以下“例外処
理状態”という)にある系と、上記プロセッシング装置
があらかじめ定められた例外処理を実行していない状態
(以下“通常処理状態”という)にある系とがあった場
合には、通常処理状態にある系によってそれ以降の処理
を引き継ぐこと、 を特徴とする多重化計算機における障害検出処理方法。
1. A fault detection in a multiplexing computer, which comprises a plurality of systems having a plurality of multiplexed processing devices, and which continues processing by changing the connection relationship between these systems and an external device when an abnormality occurs. In the processing method, if the abnormality cannot determine which of the outputs of each of the processing devices is appropriate, check the processing state of each of the processing devices of each of the systems, and check the results. , A system in a state where the processing device is executing a predetermined exception process (hereinafter referred to as “exception processing state”), and a state in which the processing device is not executing a predetermined exception process (hereinafter, “exception process”). If there is a system in the "normal processing state"), the subsequent processing is pulled by the system in the normal processing state. Gukoto, fault detection processing method in multiplexing computer characterized.
【請求項2】多重化された複数個のプロセッシング装置
を備えた系を複数備え、これらの系と上記外部装置との
接続関係を変更することで障害発生時にも処理を継続す
る多重化計算機において、 上記系のそれぞれは、 自系の多重化された上記プロセッシング装置間での処理
結果の不一致を検出する不一致検出手段と、 自系の多重化された上記プロセッシング装置の処理状態
は、あらかじめ定められた例外処理プログラムを実行し
ている状態(以下“例外処理状態”という)と、上記例
外処理プログラムを実行していない状態(以下“通常処
理状態”という)とのいずれであるかを判定する処理状
態判定手段と、 他の系の多重化された上記プロセッシング装置の処理状
態は、上記例外処理状態と上記通常処理状態とのいずれ
であるかを確認する他系処理状態確認手段と、 自系の上記不一致検出手段が不一致を検出した場合、ま
たは、自系の上記処理状態判定手段が例外処理状態であ
ると判定し且つ上記他系処理状態確認手段が上記通常処
理状態となっている系が存在することを確認した場合、
自系を上記外部装置から切り離させる切換手段と、 を有することを特徴とする多重化計算機。
2. A multiplexing computer comprising a plurality of systems having a plurality of multiplexed processing devices, and changing the connection between these systems and the external device to continue processing even when a failure occurs. , Each of the above-mentioned systems has a mismatch detection means for detecting a mismatch of processing results between the processing devices of the own system, and the processing state of the processing device of the own system that has been multiplexed is predetermined. A process for determining whether the exception handling program is running (hereinafter referred to as "exception handling state") or the exception handling program is not running (hereafter referred to as "normal handling state") Whether the processing state of the state determining means and the processing apparatus of the other system multiplexed is the exceptional processing state or the normal processing state is confirmed. If the other system processing state confirmation means and the inconsistency detection means of the own system detect a mismatch, or if the processing state determination means of the own system determines that it is in an exceptional processing state and the other system processing state confirmation means When it is confirmed that there is a system in the above normal processing state,
A switching computer for disconnecting its own system from the external device, and a multiplexing computer.
【請求項3】上記系のそれぞれは、さらに、 自系の上記不一致検出手段が不一致を検出した場合、ま
たは、自系の上記処理状態判定手段が例外処理状態であ
ると判定し且つ上記他系処理状態確認手段が上記通常処
理状態となっている系が存在することを確認した場合、
自系を上記外部装置から切り離してもよいか否かの確認
を、他の系に対して要求する要求手段と、 他の系から当該他の系を切り離してもよいか否かの確認
を要求された場合、自系の状態を確認し、当該他の系の
行っていた処理を引き継ぐことが可能であれば当該他の
系を上記外部装置から切り離すことを許す許可信号を当
該他の系に対して出力する応答手段と、を備え、 上記切換手段は、自系の上記要求手段による要求に対し
他の系の上記応答手段から許可信号が返された場合に限
り、自系を上記外部装置から切り離させるものであるこ
と、 を特徴とする請求項2記載の多重化計算機。
3. Each of the above-mentioned systems further determines that the mismatch detection means of its own system detects a mismatch, or that the processing state determination means of its own system is in an exceptional processing state and the other system. When the processing status confirmation means confirms that there is a system in the normal processing status,
Requesting means for requesting confirmation of whether or not the own system may be disconnected from the external device, and requesting confirmation of whether or not the other system may be disconnected from the other system. If it is possible to check the status of its own system, and if it is possible to take over the processing performed by the other system, send a permission signal to the other system to allow the other system to be disconnected from the external device. Response means for outputting to the external device, and the switching means sets the own system to the external device only when a permission signal is returned from the response means of another system in response to a request from the requesting means of the own system. The computer according to claim 2, wherein the computer is separated from the computer.
【請求項4】上記切換手段は、上記応答手段が他の系に
対して上記許可信号を出力した場合には、自系を上記外
部装置に接続させるものであること、 を特徴とする請求項3記載の多重化計算機。
4. The switching means connects the own system to the external device when the response means outputs the permission signal to another system. The multiplexing computer according to 3.
【請求項5】上記処理状態判定手段は、上記例外処理プ
ログラムの格納されている領域を示すアドレス(以下
“例外処理アドレス”という)をあらかじめ備え、上記
プロセッシング装置がアクセスするアドレスが上記例外
処理アドレスであるか否かを判定し、該判定の結果、上
記例外処理アドレスをアクセスしていた場合には例外処
理状態にあると判定するものであること、 を特徴とする請求項1記載の多重化計算機。
5. The processing state judging means is provided with an address indicating an area where the exception processing program is stored (hereinafter referred to as "exception processing address") in advance, and an address accessed by the processing device is the exception processing address. 2. The multiplexing according to claim 1, wherein it is determined whether or not it is, and as a result of the determination, it is determined to be in an exception processing state when the exception processing address is accessed. calculator.
【請求項6】上記処理状態判定手段は通常状態であると
判定し且つ他系処理状態確認手段が例外処理状態となっ
ている他の系の存在を確認した場合には、当該通常状態
であった系のプロセッシング装置は自己診断を行うもの
であること、を特徴とする請求項2記載の多重化計算
機。
6. If the processing state determining means determines that the system is in the normal state and the other system processing state confirming means confirms the presence of another system in the exception processing state, the system is in the normal state. 3. The multiplexing computer according to claim 2, wherein the processing device of the above system performs self-diagnosis.
JP7333773A 1995-12-21 1995-12-21 Multiplied computer and its fault detection processing method Pending JPH09179836A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7333773A JPH09179836A (en) 1995-12-21 1995-12-21 Multiplied computer and its fault detection processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7333773A JPH09179836A (en) 1995-12-21 1995-12-21 Multiplied computer and its fault detection processing method

Publications (1)

Publication Number Publication Date
JPH09179836A true JPH09179836A (en) 1997-07-11

Family

ID=18269801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7333773A Pending JPH09179836A (en) 1995-12-21 1995-12-21 Multiplied computer and its fault detection processing method

Country Status (1)

Country Link
JP (1) JPH09179836A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262557A (en) * 2008-03-31 2008-10-30 Hitachi Ltd Task management device for controller and task management method for controller
JP2015090501A (en) * 2013-11-05 2015-05-11 三菱電機株式会社 Dual control device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262557A (en) * 2008-03-31 2008-10-30 Hitachi Ltd Task management device for controller and task management method for controller
JP2015090501A (en) * 2013-11-05 2015-05-11 三菱電機株式会社 Dual control device

Similar Documents

Publication Publication Date Title
US5005174A (en) Dual zone, fault tolerant computer system with error checking in I/O writes
EP0306244B1 (en) Fault tolerant computer system with fault isolation
EP0306209B1 (en) Dual rail processors with error checking at single rail interfaces
CA1310129C (en) Interface of non-fault tolerant components to fault tolerant system
JP3206006B2 (en) Duplex bus control method and device
JPH08255115A (en) Method and equipment for fault detection and fault- tolerant digital data processing
JP3595033B2 (en) Highly reliable computer system
JPS59106056A (en) Failsafe type data processing system
JP3329986B2 (en) Multiprocessor system
JPH09179836A (en) Multiplied computer and its fault detection processing method
JP2774675B2 (en) Bus controller
JPH0916426A (en) Fault tolerant computer with two-port console
JPS5931738B2 (en) Parallel triple system configuration method for computer system
JPS6321217B2 (en)
JPH08190494A (en) High-reliability computer with dual processors
JP3624051B2 (en) Information processing device
JPH04241039A (en) High-reliability computer system
JPH07114521A (en) Multimicrocomputer system
JP2001175545A (en) Server system, fault diagnosing method, and recording medium
JPH06187184A (en) Input and output controller for duplex system
JP2815730B2 (en) Adapters and computer systems
JPH03233744A (en) Stand-by system route test system
JPH10240555A (en) Fault-tolerant data processing system and its method
JPS62103756A (en) Multiprocessing system
JPH09146853A (en) Duplex computer and fault system restoration method therefor