JPH0936863A - Redundancy system - Google Patents

Redundancy system

Info

Publication number
JPH0936863A
JPH0936863A JP7188760A JP18876095A JPH0936863A JP H0936863 A JPH0936863 A JP H0936863A JP 7188760 A JP7188760 A JP 7188760A JP 18876095 A JP18876095 A JP 18876095A JP H0936863 A JPH0936863 A JP H0936863A
Authority
JP
Japan
Prior art keywords
data
main memory
processing
unit
main storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7188760A
Other languages
Japanese (ja)
Other versions
JP3340284B2 (en
Inventor
Shigeru Tatezawa
茂 立澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP18876095A priority Critical patent/JP3340284B2/en
Publication of JPH0936863A publication Critical patent/JPH0936863A/en
Application granted granted Critical
Publication of JP3340284B2 publication Critical patent/JP3340284B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To continue the processing without re-processing up to a fault occurrence point of time on the occurrence of a fault of a main storage device in the redundancy system. SOLUTION: On the detection of abnormality in a 1st main storage device 12, a bus interface circuit 1A of a 1st central processing unit reports the occurrence of the abnormality to a 1st standby system main storage access circuit 1B. The 1st standby system main storage access circuit 1B gives a read request to a 2nd main storage device 22. Then substitute data are acquired and they are returned to a 1st microprocessor 19 together with a normal response and the normal response is reported by using the substitute data through a 1st standby system main storage substitute interrupt request line 1C. The program receiving the interrupt request executes the processing up to a good step to leave off and selects a 2nd sub system through changeover for the further processing.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、運用系または待機系と
なる複数のデータ処理装置を備えた冗長システムに関
し、例えば、電子交換機における制御構成に適用し得る
ものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a redundant system provided with a plurality of data processing devices serving as an operating system or a standby system, and can be applied to, for example, a control configuration in an electronic exchange.

【0002】[0002]

【従来の技術】電話が一般的になっている今日において
は、電子交換機におけるシステムダウンは極力避けなけ
ればならず、電子交換機の主要構成には冗長システムが
採用されている。例えば、電子交換機の制御を司る中央
制御モジュールには冗長システムが採用されている。
2. Description of the Related Art Nowadays when telephones have become commonplace, system downs in electronic exchanges must be avoided as much as possible, and redundant systems are adopted as the main components of electronic exchanges. For example, a redundant system is adopted for the central control module that controls the electronic exchange.

【0003】図2は、このような中央制御モジュール等
で採用されている冗長システム、すなわち、二重化計算
機システムの従来構成を示すものである。
FIG. 2 shows a conventional system of a redundant system adopted in such a central control module, that is, a duplicated computer system.

【0004】第1のサブシステム10と第2のサブシス
テム20の装置構成は同一であり、電源を投入すると一
方が運用系になり、他方が待機系になる。運用系の中央
処理装置11又は21は、運用系の各装置の読み書きが
可能で、サブシステム間接続装置13及び23とサブシ
ステム間接続線30を用いて待機系の主記憶装置22又
は12の読み書きも可能である。運用系で、初期設定時
及び処理実行時に何らかのハードウェア障害が発生した
場合、待機系のサブシステム20又は10に切り替え
て、処理を再開する。なお、待機系の中央処理装置21
又は11は停止している。
The device configurations of the first subsystem 10 and the second subsystem 20 are the same. When the power is turned on, one becomes the active system and the other becomes the standby system. The active central processing unit 11 or 21 can read and write each device of the active system, and uses the inter-subsystem connection devices 13 and 23 and the inter-subsystem connection line 30 to store the main storage device 22 or 12 in the standby system. You can read and write. In the active system, if any hardware failure occurs at the time of initial setting and process execution, the subsystem 20 or 10 of the standby system is switched to and the process is restarted. The central processing unit 21 of the standby system
Or 11 is stopped.

【0005】電源投入後の初期設定として、その計算機
システムで処理を実行するための命令語及びデータを中
央処理装置11又は21によりサブシステム内バス15
又は25を用いて入出力装置14又は24から読み出
し、主記憶装置12又は22に書き込む。中央処理装置
11又は21により運用系の主記憶装置12又は22に
書き込む場合、サブシステム間接続装置13及び23
と、サブシステム間接続線30により、運用系主記憶装
置12又は22とは別のアドレスで待機系サブシステム
内バス25又は15にデータ転送を行い、待機系主記憶
装置22又は12にも全く同一の命令語及びデータを書
き込む。
As an initial setting after the power is turned on, an instruction word and data for executing a process in the computer system are provided by the central processing unit 11 or 21 to the bus 15 in the subsystem.
Or 25 to read from the input / output device 14 or 24 and write to the main storage device 12 or 22. When writing to the main storage device 12 or 22 of the operating system by the central processing unit 11 or 21, the inter-subsystem connection devices 13 and 23
And the inter-subsystem connection line 30 transfers data to the standby system subsystem internal bus 25 or 15 at an address different from that of the operating system main storage device 12 or 22, and also to the standby system main storage device 22 or 12 at all. Write the same command word and data.

【0006】初期設定終了後、中央処理装置11又は2
1により運用系主記憶装置12又は22に格納された命
令語を読み出し、処理を実行する。必要に応じて運用系
主記憶装置12又は22に格納されているデータを読み
書きする。運用系主記憶装置12又は22に対して書き
込みを行う場合は上記同様に運用系主記憶装置12又は
22と、待機系主記憶装置22又は12の内容を常に同
一の状態に保つ。
After completion of the initial setting, the central processing unit 11 or 2
The instruction word stored in the active main storage device 12 or 22 is read by 1 and the process is executed. The data stored in the active main storage device 12 or 22 is read and written as necessary. When writing to the active main memory 12 or 22, the contents of the active main memory 12 or 22 and the standby main memory 22 or 12 are always kept in the same state as described above.

【0007】また、一定時間内で、一つまたは複数の一
連の処理の完了が不可欠であることがあるので、それら
の処理の区切れのよいところにチェックポイントを設
け、チェックポイント毎に実行完了結果を主記憶装置1
2及び22内の処理実行進捗データ格納部18又は28
に格納しながら処理を実行する。
Further, since it is sometimes necessary to complete one or more series of processes within a certain time, checkpoints are provided at points where these processes are well separated, and execution is completed for each checkpoint. Results in main memory 1
Process execution progress data storage unit 18 or 28 in 2 and 22
The process is executed while being stored in.

【0008】主記憶装置12又は22は記憶素子回路1
6又は26と記憶データ障害検出回路17又は27を有
しており、主記憶装置12又は22に読み書きを行う際
には、記憶データ障害検出回路17又は27が記憶素子
回路16又は26に格納されているデータを試験し、異
常を検出した場合、中央処理装置11又は21に異常応
答を返す。
The main storage device 12 or 22 is a storage element circuit 1
6 or 26 and the storage data failure detection circuit 17 or 27, the storage data failure detection circuit 17 or 27 is stored in the storage element circuit 16 or 26 when reading or writing to the main storage device 12 or 22. If the data is tested and an abnormality is detected, an abnormal response is returned to the central processing unit 11 or 21.

【0009】第1のサブシステムが運用系の時、中央処
理装置11が異常応答を受信後、第1のサブシステム1
0での処理続行が不可能となるため、第1のサブシステ
ム10と第2のサブシステム20を切り替えて処理を続
行する。これにより、第2のサブシステム20が運用系
となり、第1のサブシステム10が待機系となる。この
とき、入出力装置24から主記憶装置22への初期設定
データ転送等は行わず、処理実行進捗データ格納部18
又28に格納されている実行完了以降の処理を後続処理
として実行することで、処理の引継再開が可能であっ
た。
When the first subsystem is the active system, after the central processing unit 11 receives the abnormal response, the first subsystem 1
Since it becomes impossible to continue the process at 0, the first subsystem 10 and the second subsystem 20 are switched to continue the process. As a result, the second subsystem 20 becomes the active system and the first subsystem 10 becomes the standby system. At this time, the initial setting data is not transferred from the input / output device 24 to the main storage device 22, and the process execution progress data storage unit 18
Further, by executing the process after the completion of execution stored in 28 as a subsequent process, it is possible to resume the process takeover.

【0010】また、異常検出をしたデータが命令語で、
その代替として、待機系主記憶装置内の同一データの使
用を想定した場合の、処理の一例を図3を参照しながら
説明する。
In addition, the data for which the abnormality is detected is an instruction word,
As an alternative to that, an example of the processing in the case where the same data in the standby main memory is assumed to be used will be described with reference to FIG.

【0011】(イ)待機系主記憶装置内の同一データが
格納されているアドレスを算出する。
(B) The address where the same data is stored in the standby main memory is calculated.

【0012】(ロ)待機系主記憶装置から代替データを
読み込み、命令語を解析し、命令語のパラメータがアド
レス情報を持っているときは、パラメータを変換して、
運用系主記憶装置の別領域にコピーする。
(B) The alternative data is read from the main memory of the standby system, the instruction word is analyzed, and when the parameter of the instruction word has address information, the parameter is converted,
Copy to another area of the main storage of the operating system.

【0013】(ハ)異常検出をしたデータのアドレス
と、(イ)の命令語解析から得た情報により、次に実行
する命令語の運用系主記憶装置内のアドレスを求める。
(C) The address of the instruction word to be executed next is found in the main memory of the operation system based on the address of the detected data and the information obtained from the instruction word analysis of (ii).

【0014】(ニ)運用系主記憶装置の別領域にコピー
した命令語を実行し、続いて、(ハ)で算出したアドレ
スにある命令語を実行することで、異常発生後の処理を
続行する。
(D) By executing the instruction word copied to another area of the main memory of the operating system, and then executing the instruction word at the address calculated in (c), the processing after the occurrence of the abnormality is continued. To do.

【0015】[0015]

【発明が解決しようとする課題】従来の冗長システムで
は、チェクポイント間で、主記憶装置に対するデータ転
送で異常が発生した場合、異常発生直前のチェックポイ
ントから異常発生時点までの処理を無効化し、運用系と
予備系の切り替えを行っていたために、異常発生直前の
チェックポイントから異常発生時点までの処理が無駄に
なるという問題点があった。
In the conventional redundant system, when an error occurs in the data transfer to the main memory between check points, the processing from the check point immediately before the error to the time of the error occurrence is invalidated, Since the active system and the standby system are switched, there is a problem that the processing from the checkpoint immediately before the occurrence of the abnormality to the time of the abnormality is wasted.

【0016】また、異常検出をしたデータの代替とし
て、待機系主記憶装置内の同一データの使用を想定した
場合、異常検出をしたデータが命令語であるときは命令
語解析やアドレス算出等に時間を要するために、一定時
間内の処理完了が困難であった。
Assuming that the same data in the standby main memory is used as a substitute for the data for which an abnormality has been detected, if the data for which an abnormality has been detected is an instruction word, it can be used for instruction word analysis or address calculation. Since it takes time, it was difficult to complete the treatment within a fixed time.

【0017】[0017]

【課題を解決するための手段】本発明は、読み出しデー
タの異常検出部を有する主記憶装置と、この主記憶装置
にアクセスする主記憶入出力手段と、処理実行部を有す
るデータ処理手段とを備えた複数のデータ処理装置を有
し、いずれかの上記データ処理装置が運用系となり、他
の上記データ処理装置が待機系となる冗長システムにお
いて、上記各データ処理装置は、自己が運用系の場合に
機能する、以下の手段を備えたことを特徴とする。
According to the present invention, there is provided a main storage device having a read data abnormality detection unit, a main storage input / output unit for accessing the main storage device, and a data processing unit having a processing execution unit. In a redundant system having a plurality of data processing devices equipped with one of the data processing devices as an active system and another data processing device as a standby system, each of the data processing devices has its own active system. It is characterized by comprising the following means that function in each case.

【0018】すなわち、(A)上記異常検出部が異常を
検出したときに、その異常応答を上記主記憶入出力手段
に通知することを抑止する異常応答抑止部と、(B)こ
の例外処理状態に移行したときに、待機系のいずれかの
上記データ処理装置の上記主記憶装置から異常に係る読
み出しデータの代替データを取り出して、この代替デー
タと共に正常応答を上記主記憶入出力手段に返す代替デ
ータ取り出し部と、(C)上記処理実行部に、代替デー
タと共に正常応答を返したことを通知する例外処理通知
部とを備えた。
That is, (A) an abnormal response suppressing unit that suppresses notifying the main memory input / output unit of the abnormal response when the abnormal detecting unit detects an abnormality, and (B) this exception processing state. When the process shifts to, the alternative data of the read data relating to the abnormality is taken out from the main memory of one of the data processing devices of the standby system, and a normal response is returned to the main memory input / output means together with the alternative data. A data fetching unit and (C) an exception process notifying unit for notifying the process executing unit of having returned a normal response together with the alternative data.

【0019】[0019]

【作 用】上記異常検出部が異常を検出したときに、そ
の異常応答を上記主記憶入出力手段に通知することを抑
止する異常応答抑止部を備えることにより、運用系と待
機系の切り替えを一時抑止する。また、待機系のいずれ
かの上記データ処理装置の上記主記憶装置から異常に係
る読み出しデータの代替データを取り出して、この代替
データと共に正常応答を上記主記憶入出力手段に返す代
替データ取り出し部により、代替データを使った処理を
正常時同様に行い、上記処理実行部に、代替データと共
に正常応答を返したことを通知する例外処理通知部によ
り、処理の区切りの良いところまで処理を実施した後、
待機系に切り替える。
[Operation] When the abnormality detection unit detects an abnormality, it is equipped with an abnormal response suppression unit that suppresses notifying the main memory input / output unit of the abnormal response, thereby switching between the active system and the standby system. Temporarily suppress. In addition, by the alternative data extracting unit that extracts the alternative data of the read data relating to the abnormality from the main storage device of any one of the data processing devices of the standby system and returns a normal response to the main storage input / output unit together with the alternative data. After performing the processing using the alternative data in the same manner as normal, and performing the processing up to the point where the processing is separated by the exception processing notification section that notifies the processing execution section that a normal response is returned with the alternative data ,
Switch to the standby system.

【0020】[0020]

【実施例】以下、本発明による冗長システムを二重化計
算機システムに適用した一実施例を図面を参照しながら
詳述する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment in which a redundant system according to the present invention is applied to a redundant computer system will be described in detail below with reference to the drawings.

【0021】(実施例の構成)図1はこの実施例の全体
構成を示すブロック図であり、従来に係る図2との同
一、対応部分には同一符号を付して示している。
(Structure of Embodiment) FIG. 1 is a block diagram showing the entire structure of this embodiment, in which the same or corresponding portions as those of FIG. 2 according to the prior art are designated by the same reference numerals.

【0022】図1において、この実施例の二重化計算機
システムも、大きくは従来と同様に、各サブシステム1
0,20内に設けられた中央処理装置11,21、主記
憶装置12,22、入出力装置14,24、サブシステ
ム内バス15,25及び、サブシステム間接続装置1
3,23と、両サブシステム10,20間を接続するサ
ブシステム間接続線30とでなる。主記憶装置11,2
1を除いた構成は従来と同様に機能するのでその説明は
省略する。
In FIG. 1, the duplicated computer system of this embodiment is also similar to the conventional system and each subsystem 1
Central processing units 11 and 21, main storage devices 12 and 22, input / output devices 14 and 24, intra-subsystem buses 15 and 25, and inter-subsystem connection device 1
3 and 23 and an inter-subsystem connection line 30 that connects the two subsystems 10 and 20. Main storage device 11 and 2
Since the configuration other than 1 functions in the same manner as the conventional one, the description thereof will be omitted.

【0023】この実施例における中央処理装置11又は
21は、従来とは異なって、マイクロプロセッサ19又
は29と中央処理装置バスインターフェイス回路1A又
は2Aと、待機系主記憶アクセス回路1B又は2Bと、
主記憶代替割り込み要求線1C又は2Cとを備えてい
る。中央処理装置バスインターフェイス回路1A又は2
Aは主記憶装置12又は22からマイクロプロセッサ1
9又は29への異常応答を抑止し、待機系主記憶アクセ
ス回路1B又は2Bは、待機系の主記憶装置22又は1
2から代替データを取得し、正常応答と共に代替データ
を運用系マイクロプロセッサ19又は29に返すもので
ある。また主記憶代替割り込み要求線1C又は2Cは、
代替データと共に正常応答を返したことをマイクロプロ
セッサ19又は29に通知するものである。
The central processing unit 11 or 21 in this embodiment differs from the conventional one in that it has a microprocessor 19 or 29, a central processing unit bus interface circuit 1A or 2A, and a standby main memory access circuit 1B or 2B.
The main memory substitute interrupt request line 1C or 2C is provided. Central processing unit bus interface circuit 1A or 2
A is the main memory 12 or 22 to the microprocessor 1
The standby main memory access circuit 1B or 2B suppresses an abnormal response to 9 or 29.
The substitute data is acquired from the step 2, and the substitute data is returned to the operational microprocessor 19 or 29 together with the normal response. Further, the main memory substitute interrupt request line 1C or 2C is
The microprocessor 19 or 29 is notified that a normal response has been returned together with the substitute data.

【0024】運用系中央処理装置11又は21内のマイ
クロプロセッサ19又は29は、命令語又はその処理で
扱うデータのアドレスと共に読み出し要求を運用系主記
憶装置12又は22にサブシステム内バス15又は25
を用いて転送する。読み出し要求を受信した主記憶装置
12又は22はそのアドレスを用い記憶素子回路16又
は26からデータを引き出し後、記憶データ障害検出回
路17又は27に読み出しデータを転送する。
The microprocessor 19 or 29 in the operating system central processing unit 11 or 21 issues a read request to the operating system main storage device 12 or 22 together with the address of the instruction word or the data handled in the processing thereof in the subsystem bus 15 or 25.
To transfer. Upon receiving the read request, the main storage device 12 or 22 extracts the data from the storage element circuit 16 or 26 by using the address, and then transfers the read data to the storage data failure detection circuit 17 or 27.

【0025】あらかじめ、主記憶装置12及び22にデ
ータを書き込むときに、一定単位毎に、書き込みデータ
に対して、一定の規則に従って冗長ビットを付加してお
く。障害検出回路では、主記憶装置12又は22のデー
タを読み込むときに、データと冗長ビットとの関係が、
書き込み時の規則通りになっているか試験する。試験の
結果が正常の場合は、サブシステム内バス15又は25
を介し中央処理装置11又は21に正常応答と共にデー
タを返送する。
When data is written in the main storage devices 12 and 22, redundant bits are added to the write data for each fixed unit according to a fixed rule in advance. In the failure detection circuit, when the data in the main storage device 12 or 22 is read, the relationship between the data and the redundant bit is
Test if it follows the rules for writing. If the test result is normal, the subsystem bus 15 or 25
The data is sent back to the central processing unit 11 or 21 together with the normal response via.

【0026】(実施例の動作)上記システムにおいて、
第1のサブシステムが運用系であるときに、主記憶装置
の障害が発生した場合の動作を説明する。運用系の主記
憶装置12での正常性試験で異常を検出した場合、主記
憶装置12はその読み出しデータは返送せず異常応答の
みを中央処理装置11内の中央処理装置バスインターフ
ェイス回路1Aに返す。異常応答を受信した中央処理装
置バスインターフェイス1Aは、直接マイクロプロセッ
サ19にそのことを通知せず待機系主記憶アクセス回路
1Bに主記憶装置12で異常が発生したことを通知す
る。
(Operation of Embodiment) In the above system,
An operation when a failure of the main storage device occurs when the first subsystem is the active system will be described. When an abnormality is detected in the normality test in the main memory unit 12 of the operating system, the main memory unit 12 does not return the read data but returns only an abnormal response to the central processing unit bus interface circuit 1A in the central processing unit 11. . The central processing unit bus interface 1A that has received the abnormality response does not directly notify the microprocessor 19 of this, but notifies the standby main memory access circuit 1B that an abnormality has occurred in the main memory 12.

【0027】待機系主記憶アクセス回路1Bでは運用系
の主記憶装置12のアクセスアドレスを基に同一データ
を格納している待機系の主記憶装置22のアドレスを算
出し、中央処理装置バスインターフェイス回路1Aを介
し運用系の主記憶装置22に対し読み出し要求を発行す
る。サブシステム内バス15、サブシステム間接続装置
13及び23、サブシステム間接続線30、並びに待機
系のサブシステム内バス25を介しその要求を受信した
待機系の主記憶装置22は通常運用系の主記憶装置12
で実施する処理同様に記憶素子回路26からデータを引
き出し、障害検出回路27で正常性の試験を実施した
後、正常応答と共にその読み出しデータを運用系の中央
処理装置11に返す。
In the standby system main memory access circuit 1B, the address of the standby system main memory device 22 storing the same data is calculated based on the access address of the active system main memory device 12, and the central processing unit bus interface circuit is calculated. A read request is issued to the main storage device 22 of the operating system via 1A. The main memory 22 of the standby system, which has received the request via the intra-subsystem bus 15, the inter-subsystem connection devices 13 and 23, the inter-subsystem connection line 30, and the inter-subsystem bus 25 of the standby system, is of the normal operation system. Main memory 12
Similarly to the processing performed in step 1, data is extracted from the storage element circuit 26, a normality test is performed by the failure detection circuit 27, and then the read data is returned to the central processing unit 11 of the operating system together with a normal response.

【0028】待機系の主記憶装置22より正常データを
受信した運用系の中央処理装置バスインターフェイス回
路1Aはそのデータを運用系の主記憶装置12アクセス
に対する受信データとして、マイクロプロセッサ19に
正常応答と共に返す。これにより、マイクロプロセッサ
19上で走行するプログラムは、命令語解析等の処理を
行うことなく、代替データを使用して正常時と同様に処
理を進める。
The central processing unit bus interface circuit 1A of the operating system, which has received the normal data from the main memory 22 of the standby system, sends the data to the microprocessor 19 together with a normal response as the received data for the access to the main memory 12 of the operating system. return. As a result, the program running on the microprocessor 19 advances the processing in the same manner as in the normal case by using the alternative data without performing processing such as instruction word analysis.

【0029】同時に待機系主記憶アクセス回路1Bより
マイクロプロセッサ19に対し待機系の主記憶装置22
からの受信データを用いて正常応答したことを、第1の
サブシステム10内の待機系主記憶代替割り込み要求線
1Cにて通知する。
At the same time, the standby main memory access circuit 1B instructs the microprocessor 19 to wait for the main memory 22 of the standby system.
The fact that a normal response has been made using the received data from is notified by the standby system main memory alternate interrupt request line 1C in the first subsystem 10.

【0030】プログラムではその割り込み要求を受信し
て次のチェックポイントまで処理を実施した後、処理実
行データ格納部18及び28に処理実行進捗状況を引継
データとして格納し、第1のサブシステム10と第2の
サブシステム20の切り替えを実施する。切り替え後運
用状態となった第2のサブシステム20では、第1の処
理実行進捗データ格納部18又28を参照し、後続処理
を行う。
In the program, after receiving the interrupt request and performing the processing up to the next checkpoint, the processing execution progress status is stored in the processing execution data storage units 18 and 28 as takeover data, and the first subsystem 10 and The switching of the second subsystem 20 is performed. In the second subsystem 20, which is in the operating state after switching, the subsequent processing is performed by referring to the first processing execution progress data storage unit 18 or 28.

【0031】(実施例の効果)以上の実施例により、待
機系の主記憶装置22内の代替データを使用して区切れ
の良いところまで処理を行ってから第1のサブシステム
10と第2のサブシステム20を切り替えるようにした
ので、障害発生時点までの再処理を行うことなく、処理
の引継再開が可能となる。
(Effects of the Embodiment) According to the above embodiment, the first subsystem 10 and the second subsystem 10 are processed after the processing is performed up to the point where the division is good by using the alternative data in the main storage device 22 of the standby system. Since the subsystem 20 is switched, the processing can be resumed without performing the reprocessing until the failure occurs.

【0032】(他の実施例)上記実施例においては、運
用系にある中央処理装置11内の待機系主記憶アクセス
回路1Bが待機系の主記憶装置22内の代替データのア
ドレス算出及び代替データの要求をする構成になってい
たが、運用系の主記憶装置12から待機系の主記憶装置
22に対し代替データの要求をし、待機系の主記憶装置
22で代替データのアドレスを算出して代替データを出
力するようにしてもよい。
(Other Embodiment) In the above embodiment, the standby main memory access circuit 1B in the central processing unit 11 in the active system calculates the address of the alternative data in the main memory 22 of the standby system and the alternative data. However, the main memory 12 of the operating system requests the alternative data to the main memory 22 of the standby system, and the main memory 22 of the standby system calculates the address of the alternative data. Alternatively, the alternative data may be output.

【0033】また、本発明は、三重以上の計算機システ
ムにも適用することができる。
The present invention can also be applied to a computer system of triple or more.

【0034】さらに、主記憶装置へのアクセスを伴うシ
ステムであれば、主記憶入出力手段としてDMAコント
ローラ等を用いたシステムにも、本発明を適用すること
ができる。
Further, the present invention can be applied to a system using a DMA controller or the like as main memory input / output means as long as the system involves access to the main memory device.

【0035】[0035]

【発明の効果】以上説明したように、運用系の主記憶装
置障害発生時、異常応答を抑止し、障害発生データの代
替として待機系の主記憶データを使用して代替データと
共に正常応答を返し、代替データを使用したことを伝え
るという一連の処理を行い、区切れの良いところで運用
系と待機系の切り替えるようにしたので、障害発生時点
までの再処理を行うことなく処理の引継再開が可能とな
る。これにより、運用系と待機系の切り替え時間である
運用状態一時中断時間を短縮でき、システムの即時処理
性の向上が実現できる。
As described above, when a failure occurs in the main memory of the operating system, an abnormal response is suppressed, and the main memory data of the standby system is used as a substitute for the data in which the failure occurs to return a normal response together with the substitute data. By performing a series of processing to notify that alternative data has been used and switching between the active system and the standby system at a good break, it is possible to resume processing without reprocessing up to the point of failure Becomes As a result, it is possible to shorten the operating state temporary interruption time, which is the switching time between the active system and the standby system, and improve the immediate processability of the system.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係る冗長システムの実施例を示す構成
図である。
FIG. 1 is a configuration diagram showing an embodiment of a redundant system according to the present invention.

【図2】従来の冗長システムの構成図である。FIG. 2 is a configuration diagram of a conventional redundant system.

【図3】従来の冗長システムで代替データの使用例を示
す説明図である。
FIG. 3 is an explanatory diagram showing an example of using alternative data in a conventional redundant system.

【符号の説明】[Explanation of symbols]

10 第1のサブシステム 20 第2のサブシステム 11,21 中央処理装置 12,22 主記憶装置 17,27 記憶データ障害検出回路 19,29 マイクロプロセッサ 1A,2A 中央処理装置バスインターフェイス回路 1B,2B 待機系主記憶アクセス回路 1C,2C 待機系主記憶代替割り込み要求線 10 First Subsystem 20 Second Subsystem 11,21 Central Processing Unit 12,22 Main Storage Device 17,27 Storage Data Failure Detection Circuit 19,29 Microprocessor 1A, 2A Central Processing Unit Bus Interface Circuit 1B, 2B Standby Main memory access circuit 1C, 2C standby main memory alternate interrupt request line

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 読み出しデータの異常検出部を有する主
記憶装置と、この主記憶装置にアクセスする主記憶入出
力手段と、処理実行部を有するデータ処理手段とを備え
た複数のデータ処理装置を有し、いずれかの上記データ
処理装置が運用系となり、他の上記データ処理装置が待
機系となる冗長システムにおいて、 上記各データ処理装置は、自己が運用系の場合に機能す
る、 上記異常検出部が異常を検出したときに、その異常応答
を上記主記憶入出力手段に通知することを抑止する異常
応答抑止部と、 この例外処理状態に移行したときに、待機系のいずれか
の上記データ処理装置の上記主記憶装置から異常に係る
読み出しデータの代替データを取り出して、この代替デ
ータと共に正常応答を上記主記憶入出力手段に返す代替
データ取り出し部と、 上記処理実行部に、代替データと共に正常応答を返した
ことを通知する例外処理通知部とを有することを特徴と
する冗長システム。
1. A plurality of data processing devices comprising: a main memory device having a read data abnormality detection unit; a main memory input / output unit for accessing the main memory device; and a data processing unit having a process execution unit. A redundant system in which any one of the data processing devices serves as an active system and another data processing device serves as a standby system, each of the data processing devices functions when it is an active system. When an abnormal state is detected by a section, an abnormal response suppression section that suppresses notifying the main memory input / output means of the abnormal response, and any one of the above-mentioned data of the standby system when shifting to this exception processing state An alternative data extracting unit that extracts alternative data of read data relating to an abnormality from the main memory of the processing device and returns a normal response to the main memory input / output means together with the alternative data. A redundant system comprising: an exception processing notification unit that notifies the processing execution unit that a normal response has been returned together with the alternative data.
【請求項2】 上記データ処理手段が中央処理装置であ
り、上記処理実行部及び上記主記憶入出力手段が共にマ
イクロプロセッサであることを特徴とする請求項1に記
載の冗長システム。
2. The redundant system according to claim 1, wherein the data processing means is a central processing unit, and the processing execution unit and the main memory input / output means are both microprocessors.
JP18876095A 1995-07-25 1995-07-25 Redundant system Expired - Fee Related JP3340284B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18876095A JP3340284B2 (en) 1995-07-25 1995-07-25 Redundant system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18876095A JP3340284B2 (en) 1995-07-25 1995-07-25 Redundant system

Publications (2)

Publication Number Publication Date
JPH0936863A true JPH0936863A (en) 1997-02-07
JP3340284B2 JP3340284B2 (en) 2002-11-05

Family

ID=16229298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18876095A Expired - Fee Related JP3340284B2 (en) 1995-07-25 1995-07-25 Redundant system

Country Status (1)

Country Link
JP (1) JP3340284B2 (en)

Also Published As

Publication number Publication date
JP3340284B2 (en) 2002-11-05

Similar Documents

Publication Publication Date Title
US5295258A (en) Fault-tolerant computer system with online recovery and reintegration of redundant components
US7493517B2 (en) Fault tolerant computer system and a synchronization method for the same
JP3447404B2 (en) Multiprocessor system
US5742851A (en) Information processing system having function to detect fault in external bus
JPS6375963A (en) System recovery system
JP3424968B2 (en) Computer system, processor chip and fault recovery method
JPS6119061B2 (en)
JPH0936863A (en) Redundancy system
JP2772052B2 (en) Resource information inheritance processing method
JPWO2004040451A1 (en) System controller, control system, and system control method
JP3239935B2 (en) Tightly-coupled multiprocessor system control method, tightly-coupled multiprocessor system, and recording medium therefor
KR100431467B1 (en) System of Duplicating between Two Processors and Managing Method thereof
JPS59180897A (en) Double structure system of battery back-up memory
JPH08179994A (en) Computer system
JPH05265790A (en) Microprocessor device
JP2002063047A (en) Doubling system switching device and switching method therefor
JPS6119060B2 (en)
JP2002007220A (en) Multiple memory system
JPS6343771B2 (en)
JPH10105527A (en) Multiprocessor computer and fault recovery method therefor
JPH06195235A (en) Controller and processor
JPH1063528A (en) Memory controller
JPH06259269A (en) Diagnostic circuit for multiprocessor
JPH10187355A (en) Disk control system
JPH05233466A (en) Fault recovery system of doubled auxiliary storage device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070816

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080816

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090816

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090816

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100816

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100816

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110816

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120816

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130816

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees