JPH05224970A - Error detection system - Google Patents

Error detection system

Info

Publication number
JPH05224970A
JPH05224970A JP4025624A JP2562492A JPH05224970A JP H05224970 A JPH05224970 A JP H05224970A JP 4025624 A JP4025624 A JP 4025624A JP 2562492 A JP2562492 A JP 2562492A JP H05224970 A JPH05224970 A JP H05224970A
Authority
JP
Japan
Prior art keywords
data processing
error
processing device
output
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4025624A
Other languages
Japanese (ja)
Inventor
Satoshi Hashimoto
智 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4025624A priority Critical patent/JPH05224970A/en
Publication of JPH05224970A publication Critical patent/JPH05224970A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To enhance the processing efficiency for restoration of the faults by discriminating the position of an error when it is detected. CONSTITUTION:Registers 107-1 to 107-4 hold the results of comparison carried out between the bits of the output 101 of one of both data processors 11 and 12 of a duplex system and the bits of the output 102 of the other processor. The information held in those registers are read by each CPU of both processors 11 and 12, thereby the bit position of an error can be easily detected. Thus it is possible to easily discriminate the type of the error, a specific faulty part of hardware, etc., and to simplify the fault restore operation.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、デ―タ処理装置の2
重化システムにおける誤り検出方式に関する。
BACKGROUND OF THE INVENTION The present invention relates to a data processing device 2
An error detection method in a redundant system.

【0002】[0002]

【従来の技術】従来の2重化システムにおける誤り検出
機構について、図6を例にして説明をする。ここでは、
2重化システム内を区別するために、1つの系をA系、
他の系をB系とする。
2. Description of the Related Art An error detection mechanism in a conventional duplex system will be described with reference to FIG. here,
In order to distinguish the inside of the duplex system, one system is A system,
The other system is system B.

【0003】図6においては、4ビットのA系信号20
1と4ビットのB系信号202について比較器203−
1〜203−4によって値を比較している。比較器20
3−1〜203−4は、入力される2つの信号が同じ場
合には論理“0”、異なる場合には論理“1”の比較結
果信号C0〜C4をそれぞれ発生する。比較結果信号C
0〜C4は、論理和回路から成るエラー検出回路205
にて検出信号206として1つの信号にまとめる。
In FIG. 6, a 4-bit A-system signal 20
Comparator 203-for 1- and 4-bit B-system signal 202
1 to 203-4 are used to compare the values. Comparator 20
3-1 to 203-4 generate comparison result signals C0 to C4 of logic "0" when the two input signals are the same, and logic "1" when they are different. Comparison result signal C
0 to C4 are error detection circuits 205 each including an OR circuit.
Are combined into one signal as the detection signal 206.

【0004】詳しく説明すると、A系信号201(a
0,a1,a2,a3)が(0,1,1,0)であり、
B系信号202(b0,b1,b2,b3)が(0,
1,1,0)であった場合には、比較器203−1〜2
03−4の出力である比較結果信号C0〜C4は
“0”,“0”,“0”,“0”となり、エラー検出回
路205を通して出力される誤り検出信号206は論理
“0”となる。論理“0”の場合には、A系,B系の動
作が同じで正常であると見なされる。
More specifically, the A system signal 201 (a
0, a1, a2, a3) is (0,1,1,0),
The B system signal 202 (b0, b1, b2, b3) is (0,
1, 1, 0), the comparators 203-1 and 203-1
The comparison result signals C0 to C4 output from the circuit 03-4 are "0", "0", "0", "0", and the error detection signal 206 output through the error detection circuit 205 is logic "0". .. When the logical value is "0", the operations of the A system and B system are the same and are considered to be normal.

【0005】また、A系信号201(a0,a1,a
2,a3)が(0,0,1,1)であり、B系信号20
2(b0,b1,b2,b3)が(0,1,1,1)で
あった場合には、比較器203−1〜203−4の出力
である比較結果信号C0〜C3は“0”,“1”,
“0”,“0”となり、エラー検出回路205を通して
出力される誤り検出信号206は論理“1”の値とな
る。論理“1”の場合には、A系,B系の動作に違いが
あり、即ち、誤りが検出されたことになる。
Further, the A system signal 201 (a0, a1, a
2, a3) is (0, 0, 1, 1), and the B-system signal 20
When 2 (b0, b1, b2, b3) is (0,1,1,1), the comparison result signals C0 to C3 output from the comparators 203-1 to 203-4 are "0". , "1",
The error detection signal 206 is "0" or "0", and the error detection signal 206 output through the error detection circuit 205 has a logic "1" value. In the case of logic "1", there is a difference between the operations of the A system and the B system, that is, an error has been detected.

【0006】このように構成された従来の2重化システ
ムの誤り検出機構にあっては、誤りが発生した情報は誤
り検出信号としてCPUや外部に通知できるが、誤りの
発生した位置を判定するための情報は不足しており、シ
ステムに幾つかのテストパタンを与えて回路を検証しな
がら誤り位置を見つけていく必要があるという問題点が
あった。
In the error detecting mechanism of the conventional duplex system configured as described above, the information in which an error has occurred can be notified to the CPU or the outside as an error detection signal, but the position in which the error has occurred is determined. There is a problem that it is necessary to find some error position while verifying the circuit by giving some test patterns to the system.

【0007】[0007]

【発明が解決しようとする課題】従来では、誤り発生位
置の検出のために改めて外部からテストデ―タを用いて
テストを行う必要があり、障害復旧に時間がかかる欠点
があった。
Conventionally, it is necessary to perform a test from the outside again using test data in order to detect an error occurrence position, and there is a drawback that it takes time to recover from a failure.

【0008】この発明はこのような点に鑑みてなされた
もので、誤り検出時にその誤り発生位置を判定できるよ
うにし、障害復旧を容易に行うことができる誤り検出方
式を提供することを目的とする。
The present invention has been made in view of the above circumstances, and an object thereof is to provide an error detection system capable of determining an error occurrence position at the time of error detection and facilitating failure recovery. To do.

【0009】[0009]

【課題を解決するための手段および作用】この発明によ
る誤り検出方式は、同一処理を並行して実行する第1お
よび第2のデータ処理装置を有する2重化システムにお
いて、前記第1のデ―タ処理装置からの複数ビットから
成る出力とこの出力に対応する前記第2のデ―タ処理装
置の複数ビットから成る出力とをビット単位で比較する
比較手段と、この比較手段による比較結果を各ビット毎
に保持する保持手段と、前記比較手段によって前記第1
のデ―タ処理装置と前記第2のデ―タ処理装置の出力間
の不一致が検出された際、前記保持手段に保持されてい
る比較結果に基づいて誤りが発生したビット位置を検出
する手段とを具備したことを特徴とする。
According to the error detecting method of the present invention, in the duplication system having the first and second data processing devices that execute the same processing in parallel, the first data A comparison means for comparing the output of a plurality of bits from the data processing device and the output of a plurality of bits of the second data processing device corresponding to this output in bit units, and a comparison result by the comparison means. Holding means for holding each bit and the first means by the comparing means
Means for detecting a bit position in which an error has occurred based on the comparison result held in the holding means when a mismatch between the outputs of the data processing device and the second data processing device is detected. And is provided.

【0010】この誤り検出方式においては、各ビットに
ついての比較結果を保持手段で保持しているので、その
保持されている情報をリ―ドすることにより誤りビット
位置を容易に検出することができる。通常、誤りビット
位置はどのような誤動作が生じたか、あるいはハードウ
エアのどの部分の故障か等を判定するための目安として
有効に利用できるので、誤りビット位置を検出すること
で、障害復旧動作が容易になると共に、交換すべきハ―
ドウェアの選定処理が簡略化される。
In this error detection system, since the comparison result for each bit is held by the holding means, the error bit position can be easily detected by reading the held information. .. Normally, the error bit position can be effectively used as a guide for determining what kind of malfunction has occurred, what part of the hardware has failed, etc., so the error recovery operation can be performed by detecting the error bit position. It ’s easy, and it ’s a hur
The selection process of hardware is simplified.

【0011】[0011]

【実施例】以下、図面を参照してこの発明の実施例を説
明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0012】図1にはこの発明の一実施例に係わる2重
化システムのエラー検出機構が示されている。第1およ
び第2のデータ処理装置11,12は2重化システム
(デュアルシステム)を構成するものであり、それぞれ
同一のCPU、記憶装置、その他各種周辺回路等を有し
ている。これら第1および第2のデータ処理装置11,
12のCPUは、同一プログラムを実行することによっ
て、同一処理を並行して実行する。
FIG. 1 shows an error detecting mechanism of a duplex system according to an embodiment of the present invention. The first and second data processing devices 11 and 12 compose a duplicated system (dual system) and each have the same CPU, storage device, and other various peripheral circuits. These first and second data processing devices 11,
The 12 CPUs execute the same processing in parallel by executing the same program.

【0013】第1のデータ処理装置(A)11の出力で
あるA系信号101(a0,a1,a2,a3)と、第
2のデータ処理装置(B)12の出力であるB系信号1
02(b0,b1,b2,b3)は、4つの比較器10
3−1〜103−4に入力される。すなわち、比較器1
03−1〜103−4それぞれには、A系信号101と
B系信号102の対応するビットの信号(a0とb0,
a1とb1,a2とb2,a3とb3)が接続されてい
る。
An A system signal 101 (a0, a1, a2, a3) output from the first data processing device (A) 11 and a B system signal 1 output from the second data processing device (B) 12.
02 (b0, b1, b2, b3) is the four comparators 10
3-1 to 103-4 are input. That is, the comparator 1
03-1 to 103-4 respectively have corresponding bit signals (a0 and b0, of A system signal 101 and B system signal 102).
a1 and b1, a2 and b2, a3 and b3) are connected.

【0014】比較器103−1〜103−4は、それぞ
れ入力される2つの信号を比較して、同じであるのなら
論理“0”、異なる場合には論理“1”を比較結果信号
C0〜C3として出力する。これら比較器103−1〜
103−4の各々は、排他的論理和回路(EXOR)に
よって容易に実現することができる。
The comparators 103-1 to 103-4 compare the two signals respectively inputted, and if they are the same, the logic "0" is given, and if they are different, the logic "1" is given and the comparison result signals C0 to C0 are given. Output as C3. These comparators 103-1 to 103-1
Each of 103-4 can be easily realized by an exclusive OR circuit (EXOR).

【0015】エラー検出回路105は、論理和回路から
構成されるものであり、4つの比較器103−1〜10
3−4から出力される比較結果信号C0〜C3の少なく
とも1つに論理“1”が存在する場合には、論理“1”
の誤り検出信号(E)を出力するものである。また、4
つの比較器103−1〜103−4から出力される比較
結果信号C0〜C3の全てが論理“0”であるのなら
ば、論理“0”の誤り検出信号(E)を出力する。
The error detection circuit 105 is composed of a logical sum circuit, and has four comparators 103-1 to 10-3.
If there is a logic "1" in at least one of the comparison result signals C0 to C3 output from 3-4, a logic "1"
The error detection signal (E) is output. Also, 4
If all the comparison result signals C0 to C3 output from the one comparator 103-1 to 103-4 are logic "0", the error detection signal (E) of logic "0" is output.

【0016】論理“1”の誤り検出信号(E)は、誤り
を検出したことを通知する信号であり、データ処理装置
11,12それぞれのCPUの割り込み入力(INT)
に供給される。誤り検出信号(E)が論理“1”になっ
たら、CPUに割り込みが発生し、誤り処理プログラム
が実行される。誤り処理プログラムでは、ユ―ザ―への
サ―ビスが停止され、システムの誤りについての診断が
それぞれのCPUで行われる。
The error detection signal (E) of logic "1" is a signal for notifying that an error has been detected, and is an interrupt input (INT) to the CPU of each of the data processors 11 and 12.
Is supplied to. When the error detection signal (E) becomes logic "1", an interrupt occurs in the CPU and the error processing program is executed. In the error processing program, the service to the user is stopped and the diagnosis of the system error is performed by each CPU.

【0017】診断の結果が正常であり一時的な故障であ
るならば誤り部分を復旧させて、ユ―ザ―へのサ―ビス
が再開される。また、異常があるならば、その障害が発
生したほうのデータ処理装置がシステムから切り離さ
れ、正常なほうのデータ処理装置だけでシステムが運用
される。この場合、障害が発生したほうのデータ処理装
置では復旧処理が行われ、例えば、誤りの原因となった
ハ―ドウェアの交換等が行われる。
If the result of the diagnosis is normal and it is a temporary failure, the erroneous portion is restored and the service to the user is restarted. If there is an abnormality, the data processing device in which the failure has occurred is disconnected from the system, and the system is operated only by the normal data processing device. In this case, the data processing device in which the failure has occurred performs a recovery process, for example, replacement of the hardware causing the error.

【0018】4個のレジスタ107−1〜107−4に
は、比較器103−1〜103−4によって比較した結
果、つまり比較結果信号C0〜C3がそれぞれ格納され
る。これらレジスタ107−1〜107−4の各々は、
Dフリップフロップによって構成されており、クロック
信号の立ち上がりのタイミングでその時の比較結果信号
の値を格納する。また、レジスタ107−1〜107−
4の各々に格納された値は、クリア信号によって消去さ
れる。
The four registers 107-1 to 107-4 store the results of comparison by the comparators 103-1 to 103-4, that is, the comparison result signals C0 to C3, respectively. Each of these registers 107-1 to 107-4 is
It is composed of a D flip-flop and stores the value of the comparison result signal at that time at the rising timing of the clock signal. In addition, the registers 107-1 to 107-
The value stored in each of 4 is erased by the clear signal.

【0019】レジスタ107−1〜107−4の出力e
0〜e3は、データ処理装置11,12各々のCPUか
らメモリの一部として見え、誤り処理プログラムによっ
てリ―ドされたり、システム診断を行うサ―ビスプロセ
ッサに詳細な誤り検出情報として提供される。次に、実
際の動作を示しながら説明を行う。
Output e of registers 107-1 to 107-4
0 to e3 are seen as a part of the memory from the CPUs of the data processing devices 11 and 12, read by an error processing program, and provided as detailed error detection information to a service processor for system diagnosis. .. Next, a description will be given while showing the actual operation.

【0020】まず、A系信号101(a0,a1,a
2,a3)が(1,1,0,1)に、B系信号102
(b0,b1,b2,b3)が(1,1,0,1)に設
定される。
First, the A system signal 101 (a0, a1, a
2, a3) becomes (1, 1, 0, 1), and the B system signal 102
(B0, b1, b2, b3) is set to (1, 1, 0, 1).

【0021】これらA系信号101とB系信号102
は、比較器103−1〜103−4によって比較され、
比較結果信号C0〜C3の値が決定される。この場合に
は、全てのビットのペア(a0とb0,a1とb1,a
2とb2,a3とb3)は同じ値の信号であるので、C
0,C1,C2,C3は、“0”,“0”,“0”,
“0”となる。
These A system signal 101 and B system signal 102
Are compared by the comparators 103-1 to 103-4,
The values of the comparison result signals C0 to C3 are determined. In this case, all bit pairs (a0 and b0, a1 and b1, a
2 and b2, a3 and b3) are signals of the same value, so C
0, C1, C2, C3 are "0", "0", "0",
It becomes "0".

【0022】エラー検出回路105では、比較結果信号
C0〜C3の論理和が取られる。比較結果信号C0〜C
3が全て“0”であるので、誤り検出信号(E)は
“0”となり、誤りは検出されていないことを示す。
The error detection circuit 105 takes the logical sum of the comparison result signals C0 to C3. Comparison result signals C0 to C
Since all 3 are "0", the error detection signal (E) becomes "0", indicating that no error has been detected.

【0023】レジスタ107−1〜107−4は、クロ
ック信号の立ち上がりで比較結果信号C0〜C3を取り
込み格納する。ここでは、比較結果信号C0〜C3は全
て“0”なので、4つのレジスタ107−1〜107−
4には“0”が格納される。したがって、レジスタ出力
e0,e1,e2,e3は、“0”,“0”,“0”,
“0”となる。
The registers 107-1 to 107-4 fetch and store the comparison result signals C0 to C3 at the rising edge of the clock signal. Here, since the comparison result signals C0 to C3 are all "0", the four registers 107-1 to 107-
“0” is stored in 4. Therefore, the register outputs e0, e1, e2, e3 are "0", "0", "0",
It becomes "0".

【0024】次に、A系信号101(a0,a1,a
2,a3)が(1,1,1,0)、B系信号102(b
0,b1,b2,b3)が(1,1,1,1)に設定さ
れた場合を想定する。
Next, the A system signal 101 (a0, a1, a
2, a3) is (1, 1, 1, 0), and B system signal 102 (b
Assume that 0, b1, b2, b3) is set to (1,1,1,1).

【0025】この場合は、a3とb3に違いが検出され
るので比較結果信号C0,C1,C2,C3は、
“0”,“0”,“0”,“1”となる。エラー検出回
路105は、比較結果信号C0,C1,C2,C3が示
す値を入力として論理和を行う。a3とb3の比較結果
信号C3が“1”であるので、誤り検出信号(E)は
“1”となる。したがって、誤りを検出したことにな
る。この誤り検出信号(E)は、誤りの発生を通知する
ために、2重化されたデータ処理装置11,12の各C
PUの割り込み入力(INT)に伝えられる。
In this case, since the difference between a3 and b3 is detected, the comparison result signals C0, C1, C2 and C3 are
It becomes "0", "0", "0", "1". The error detection circuit 105 inputs the values indicated by the comparison result signals C0, C1, C2 and C3 and performs a logical sum. Since the comparison result signal C3 of a3 and b3 is "1", the error detection signal (E) becomes "1". Therefore, an error has been detected. This error detection signal (E) is used for each C of the duplicated data processing devices 11 and 12 to notify the occurrence of an error.
It is transmitted to the interrupt input (INT) of PU.

【0026】レジスタ107−1〜107−4は、クロ
ック信号の立ち上がりで比較結果信号C0,C1,C
2,C3をそれぞれ取り込み格納する。ここでは、比較
結果信号C0,C1,C2,C3は“0”,“0”,
“0”,“1”であるので、レジスタ107−1〜10
7−4には“0”,“0”,“0”,“1”が格納され
る。したがって、107−1〜107−4の出力e0〜
e3は、“0”,“0”,“0”,“1”となる。デー
タ処理装置11,12の各CPUでの誤り処理では、次
のような処理が行われる。
The registers 107-1 to 107-4 have comparison result signals C0, C1 and C at the rising edge of the clock signal.
2 and C3 are respectively captured and stored. Here, the comparison result signals C0, C1, C2 and C3 are "0", "0",
Since they are “0” and “1”, the registers 107-1 to 10-10
"0", "0", "0", and "1" are stored in 7-4. Therefore, outputs e0 of 107-1 to 107-4
e3 becomes "0", "0", "0", "1". In the error processing in each CPU of the data processing devices 11 and 12, the following processing is performed.

【0027】すなわち、図2のフローチャートに示され
ているように、論理“1”の誤り検出信号(E)による
割り込みである場合には(ステップS11)、データ処
理装置11,12の各CPUはエラー処理プログラムを
実行し、誤りが発生した出力のビット位置を見つけるた
めに、4つのレジスタ107−1〜107−4の値をリ
―ドする(ステップS12)。各CPUは、4つのレジ
スタ107−1〜107−4の値(e0〜e3)をリ―
ドすることで、e3の値が“1”であることを知る。こ
の情報に基づき、各CPUは誤りが発生したビット位置
の解析処理を行い(ステップS13)、これによってa
3とb3の信号に誤りが生じたと判定することができ
る。
That is, as shown in the flow chart of FIG. 2, in the case of an interrupt due to an error detection signal (E) of logic "1" (step S11), each CPU of the data processing devices 11 and 12 The error processing program is executed, and the values of the four registers 107-1 to 107-4 are read in order to find the bit position of the output in which the error has occurred (step S12). Each CPU reads the values (e0 to e3) of the four registers 107-1 to 107-4.
By doing so, it is known that the value of e3 is “1”. Based on this information, each CPU analyzes the bit position where the error has occurred (step S13).
It can be determined that an error has occurred in the signals of 3 and b3.

【0028】この場合、、各CPUは対応する出力(a
3またはb3)について自装置の障害の有無を調べ、障
害の発生したほうのCPUは、必要な回復処理(ステッ
プS14)を行った後、復旧が可能であるのならクリア
信号によってレジスタ107−1〜107−4に格納さ
れている値を(0,0,0,0)にリセットし、通常動
作に戻る。
In this case, each CPU has a corresponding output (a
3 or b3), the presence or absence of a fault in its own device is checked, and the CPU with the fault performs the necessary recovery processing (step S14), and if restoration is possible, the clear signal causes the register 107-1 to register. The value stored in 107-4 is reset to (0,0,0,0), and the normal operation is resumed.

【0029】このように、図1の誤り検出機構において
は、出力101と102の各ビットについての比較結果
をレジスタ107−1〜107−4で保持しているの
で、その保持されている情報をリ―ドすることにより誤
りビット位置を容易に検出することができる。したがっ
て、どのような誤動作が生じたか、あるいはハードウエ
アのどの部分の故障か等を容易に判定できるようにな
り、障害復旧動作が簡単になる。次に、図3を参照し
て、この発明の第2実施例について説明する。
As described above, in the error detection mechanism of FIG. 1, since the comparison results of the bits of the outputs 101 and 102 are held in the registers 107-1 to 107-4, the held information is stored. By reading, the error bit position can be easily detected. Therefore, it becomes possible to easily determine what malfunction has occurred, which part of the hardware has failed, and the failure recovery operation is simplified. Next, a second embodiment of the present invention will be described with reference to FIG.

【0030】図1と同様に、4つの比較器103−1〜
103−4には、A系信号101(a0,a1,a2,
a3)とB系信号102(b0,b1,b2,b3)の
各信号のペア(a0とb0,a1とb1,a2とb2,
a3とb3)がそれぞれ接続されている。比較器103
−1〜103−4は、入力される2つの信号を比較して
同じであるのなら論理“0”、異なるならば論理“1”
を比較結果信号C0〜C3としてそれぞれ出力する。こ
れら比較器103−1〜103−4の各々は、排他的論
理和回路(EXOR)によって容易に実現することがで
きる。
Similar to FIG. 1, four comparators 103-1 to 103-3 are provided.
103-4 includes A system signals 101 (a0, a1, a2,
a3) and a pair of signals of the B system signal 102 (b0, b1, b2, b3) (a0 and b0, a1 and b1, a2 and b2).
a3 and b3) are respectively connected. Comparator 103
-1 to 103-4 compare two input signals, and if they are the same, logic "0", and if they are different, logic "1"
Are output as comparison result signals C0 to C3, respectively. Each of these comparators 103-1 to 103-4 can be easily realized by an exclusive OR circuit (EXOR).

【0031】レジスタ108−1〜108−4には、比
較器103−1〜103−4からの比較結果信号C0〜
C3が格納される。この場合、レジスタ108−1〜1
08−4の現在の記憶状態(出力e0〜e3)は入力側
にフィ―ドバックされており、論理“1”の比較結果信
号については累積して保持される。さらに、状態設定信
号S0〜S3によって、レジスタ108−1〜108−
4に“1”を強制設定できるようになっている。これ
は、誤り処理プログラムの動作テスト等の目的で、行わ
れるものである。
Registers 108-1 to 108-4 have comparison result signals C0 to C0 from the comparators 103-1 to 103-4.
C3 is stored. In this case, the registers 108-1 to 1
The current storage state (outputs e0 to e3) of 08-4 is fed back to the input side, and the comparison result signal of logic "1" is accumulated and held. Further, by the status setting signals S0 to S3, the registers 108-1 to 108-
4 can be set to "1" forcibly. This is performed for the purpose of an operation test of the error processing program.

【0032】これらレジスタ108−1〜108−4の
各々は、図4に示されているように、Dフリップフロッ
プ201と3入力論理和回路202とから構成されてお
り、クロック信号の立ち上がりのタイミングでその時の
論理和回路202の出力の値を格納する。したがって、
状態設定信号Sn(n=0〜3)が“0”の状態で、
“1”の比較結果信号Cn(n=0〜3)が一旦入力さ
れると、それ以降に入力される比較結果信号Cnが
“0”であっても、Dフリップフロップ201には
“1”が保持される。また、レジスタ108−1〜10
8−4の各々に格納された値は、Dフリップフロップ2
01に供給されるクリア信号によって消去される。
As shown in FIG. 4, each of these registers 108-1 to 108-4 is composed of a D flip-flop 201 and a 3-input logical sum circuit 202, and the rising timing of the clock signal. Then, the value of the output of the OR circuit 202 at that time is stored. Therefore,
When the state setting signal Sn (n = 0 to 3) is “0”,
Once the comparison result signal Cn (n = 0 to 3) of “1” is input, the D flip-flop 201 receives “1” even if the comparison result signal Cn input thereafter is “0”. Is retained. Also, the registers 108-1 to 10
The value stored in each of 8-4 is the D flip-flop 2
It is erased by the clear signal supplied to 01.

【0033】レジスタ108−1〜108−4の出力e
0〜e3は、データ処理装置11,12各々のCPUか
らメモリの一部として見え、エラー監視プログラムによ
って定期的にリ―ドされたり、システム診断を行うサ―
ビスプロセッサに詳細な誤り検出情報として提供され
る。
Output e of registers 108-1 to 108-4
0 to e3 are seen as a part of the memory from the CPUs of the data processing devices 11 and 12, and are read regularly by the error monitoring program, or a server for performing system diagnosis.
It is provided to the bisprocessor as detailed error detection information.

【0034】エラー監視プログラムは、定期的にレジス
タ108−1〜108−4をリ―ドすることで2重化シ
ステムに誤りがないかを検査する。もし、誤りがあれば
誤り処理プログラムを実行する。誤り処理プログラムで
は、ユ―ザ―へのサ―ビスを停止し、システムの誤りに
ついて診断をおこなう。診断の結果が正常であり一時的
な故障であるならば誤り部分を復旧させて、ユ―ザ―へ
のサ―ビスを再開する。異常があるならば、誤りを発生
したハ―ドウェアを交換、又は隔離した後にシステムを
復旧させる。次に、実際の動作を示しながら説明を行
う。
The error monitoring program periodically reads the registers 108-1 to 108-4 to check the duplex system for errors. If there is an error, the error processing program is executed. The error handling program stops the service to the user and diagnoses the system error. If the result of the diagnosis is normal and it is a temporary failure, the erroneous part is restored and service to the user is restarted. If there is an abnormality, replace the faulty hardware or isolate it and then restore the system. Next, a description will be given while showing the actual operation.

【0035】まず、A系信号101(a0,a1,a
2,a3)が(1,1,0,1)に、B系信号102
(b0,b1,b2,b3)が(1,1,0,1)に設
定される。
First, the A system signal 101 (a0, a1, a
2, a3) becomes (1, 1, 0, 1), and the B system signal 102
(B0, b1, b2, b3) is set to (1, 1, 0, 1).

【0036】これらA系信号101とB系信号102
は、比較器103−1〜103−4によって比較され、
比較結果信号C0〜C3の値が決定される。この場合に
は、全てのビットのペア(a0とb0,a1とb1,a
2とb2,a3とb3)は同じ値の信号であるので、C
0,C1,C2,C3は、“0”,“0”,“0”,
“0”となる。
These A system signal 101 and B system signal 102
Are compared by the comparators 103-1 to 103-4,
The values of the comparison result signals C0 to C3 are determined. In this case, all bit pairs (a0 and b0, a1 and b1, a
2 and b2, a3 and b3) are signals of the same value, so C
0, C1, C2, C3 are "0", "0", "0",
It becomes "0".

【0037】レジスタ108−1〜108−4は、クロ
ック信号の立ち上がりで比較結果信号C0〜C3を取り
込み格納する。ここでは、比較結果信号C0〜C3は全
て“0”なので、4つのレジスタ108−1〜108−
4には“0”が格納される。したがって、レジスタ出力
e0,e1,e2,e3は、“0”,“0”,“0”,
“0”となる。
The registers 108-1 to 108-4 fetch and store the comparison result signals C0 to C3 at the rising edge of the clock signal. Here, since the comparison result signals C0 to C3 are all "0", the four registers 108-1 to 108-
“0” is stored in 4. Therefore, the register outputs e0, e1, e2, e3 are "0", "0", "0",
It becomes "0".

【0038】ここで誤り監視プログラムによって、レジ
スタ108−1〜108−4をリ―ドしてCPU上でシ
ステムの状態を解析する。レジスタ108−1〜108
−4は全て“0”なので正常であると認知され、通常動
作に戻る。
Here, the error monitoring program reads the registers 108-1 to 108-4 and analyzes the system state on the CPU. Registers 108-1 to 108
Since all -4 are "0", it is recognized as normal and the normal operation is resumed.

【0039】次に、A系信号101(a0,a1,a
2,a3)が(1,1,1,0)、B系信号102(b
0,b1,b2,b3)が(1,1,1,1)に設定さ
れた場合を想定する。この場合は、a3とb3に違いが
検出されるので比較結果信号C0,C1,C2,C3
は、“0”,“0”,“0”,“1”となる。
Next, the A system signal 101 (a0, a1, a
2, a3) is (1, 1, 1, 0), and B system signal 102 (b
Assume that 0, b1, b2, b3) is set to (1,1,1,1). In this case, since the difference between a3 and b3 is detected, the comparison result signals C0, C1, C2, C3
Becomes "0", "0", "0", "1".

【0040】レジスタ108−1〜108−4は、クロ
ック信号の立ち上がりで比較結果信号C0,C1,C
2,C3をそれぞれ取り込み格納する。ここでは、比較
結果信号C0,C1,C2,C3は“0”,“0”,
“0”,“1”であるので、レジスタ108−1〜10
8−4には“0”,“0”,“0”,“1”が格納され
る。したがって、レジスタ108−1〜108−4の出
力e0〜e3は、“0”,“0”,“0”,“1”とな
る。
The registers 108-1 to 108-4 receive the comparison result signals C0, C1 and C at the rising edge of the clock signal.
2 and C3 are respectively captured and stored. Here, the comparison result signals C0, C1, C2 and C3 are "0", "0",
Since they are "0" and "1", the registers 108-1 to 108-10
"0", "0", "0", "1" are stored in 8-4. Therefore, the outputs e0 to e3 of the registers 108-1 to 108-4 are "0", "0", "0", "1".

【0041】誤りの状態“1”を格納したレジスタ10
8−4は、出力eのフィ―ドバックによって、次のサイ
クルにおいても誤りが生じたことを示す値“1”を保持
する。
Register 10 storing error state "1"
The output 8-4 holds the value "1" indicating that an error has occurred in the next cycle due to the feedback of the output e.

【0042】次に、A系信号101(a0,a1,a
2,a3)が(0,0,1,1)、B系信号102(b
0,b1,b2,b3)が(0,0,0,1)に設定さ
れるとする。比較結果信号C0〜C3は、“0”,
“0”,“1”,“0”となる。
Next, the A system signal 101 (a0, a1, a
2, a3) is (0, 0, 1, 1), and the B system signal 102 (b
0, b1, b2, b3) is set to (0, 0, 0, 1). The comparison result signals C0 to C3 are "0",
It becomes "0", "1", "0".

【0043】レジスタ108−1〜108−4の入力に
は、比較結果信号C0〜C3とフィ―ドバックされた出
力信号e0〜e3の論理和が入力される。いま、CPU
からの状態設定は行わないとすると(S0〜S3=
“0”)、比較結果信号C0〜C3(0,0,1,0)
とフィ―ドバックされた出力信号e0〜e3(0,0,
0,1)との論理和された値が選ばれる。したがって、
レジスタ108−1〜108−4の入力は“0”,
“0”,“1”,“1”となって、この値が、次のクロ
ックの立ち上がりでレジスタ108−1〜108−4に
それぞれ格納される。
The logical sums of the comparison result signals C0 to C3 and the feedback output signals e0 to e3 are input to the inputs of the registers 108-1 to 108-4. CPU now
(S0 to S3 =
"0"), comparison result signals C0 to C3 (0,0,1,0)
And output signals e0 to e3 (0, 0,
The value obtained by ORing with 0, 1) is selected. Therefore,
The inputs of the registers 108-1 to 108-4 are "0",
The values become "0", "1", "1", and these values are stored in the registers 108-1 to 108-4 at the rising edge of the next clock.

【0044】データ処理装置11,12の各CPUは、
図5のフローチャートに示されているように、誤り監視
プログラムによって各チェックポイント毎にレジスタ1
08−1〜108−4をリ―ドし(ステップS21、S
22)、“1”が保持されているか否かに応じてエラー
発生の有無を調べる(ステップS23)。レジスタ10
8−1〜108−4のいずれかに“1”が保持されてい
た場合には、エラー発生が生じたものと判断して、誤り
処理プログラムを実行する。また、レジスタ108−1
〜108−4のいずれにも“1”が保持されてない場合
にはエラー発生が無かったと判断して、処理を終了す
る。この例では、レジスタ108−3と108−4に
“1”が保持されているので、、誤り処理プログラムが
実行される。
The CPUs of the data processing devices 11 and 12 are
As shown in the flow chart of FIG. 5, the error monitoring program registers 1 for each checkpoint.
08-1 to 108-4 are read (steps S21, S
22), it is checked whether or not an error has occurred depending on whether or not "1" is held (step S23). Register 10
When "1" is held in any of 8-1 to 108-4, it is determined that an error has occurred, and the error processing program is executed. In addition, the register 108-1
If "1" is not held in any of the items 108 to 108-4, it is determined that no error has occurred, and the process ends. In this example, since "1" is held in the registers 108-3 and 108-4, the error processing program is executed.

【0045】誤り処理では、各CPUは、リ―ドしたレ
ジスタ108−1〜108−4の中で“1”を保持して
いた出力e2,e3に基づいて誤りが発生したビット位
置の解析処理を行い(ステップS24)、これによって
a3,b3、およびa4,b4に誤りが生じたと判定す
る。
In the error processing, each CPU analyzes the bit position in which an error has occurred based on the outputs e2 and e3 holding "1" in the read registers 108-1 to 108-4. Is performed (step S24), and it is determined that an error has occurred in a3, b3, and a4, b4.

【0046】この場合、各CPUは対応する出力(デー
タ処理装置11ではa3,a4、データ処理装置12で
はb3,b4)について自装置の障害の有無を調べ、障
害の発生したほうのCPUは、必要な回復処理(ステッ
プS25)を行った後、復旧が可能であるのならクリア
信号によってレジスタ108−1〜108−4に格納さ
れている値を(0,0,0,0)にリセットし、通常動
作に戻る。
In this case, each CPU examines the corresponding output (a3, a4 in the data processing device 11 and b3, b4 in the data processing device 12) for a fault in its own device, and the CPU in which the fault has occurred is After performing necessary recovery processing (step S25), if recovery is possible, the value stored in the registers 108-1 to 108-4 is reset to (0,0,0,0) by a clear signal. , Return to normal operation.

【0047】この誤り検出機構によると、誤りが発生し
たことをレジスタ108−1〜108−4で累積して格
納しているので、任意の時刻にCPUからレジスタ10
8−1〜108−4に格納された誤り情報を調べること
ができる。即ち、図1に示した第1実施例のように誤り
検出機構からのCPUへの割り込みによる誤り通知では
なく、CPUの通常の動作であるレジスタリ―ドとして
誤りを検出することができる。
According to this error detection mechanism, since the occurrence of an error is accumulated and stored in the registers 108-1 to 108-4, the CPU can register the register 10 at any time.
The error information stored in 8-1 to 108-4 can be checked. That is, the error can be detected as a register read, which is a normal operation of the CPU, instead of the error notification by the interrupt from the error detection mechanism to the CPU as in the first embodiment shown in FIG.

【0048】具体的には、処理をブロックに分割し、ブ
ロック間にチェックポイントを設定する。処理を進める
に当たってチェックポイントに達したらブロックでの環
境を退避させる。そして、レジスタ108−1〜108
−4を調べて誤りがなければ次のブロックの処理に進
む。誤りがなければ、クリア信号でレジスタ108−1
〜108−4に保持している誤り状態をクリアしてから
前回のチェックポイントまで戻り、そのブロックでの環
境をリストアして処理を再実行して一時的な故障を回避
することができる。
Specifically, the processing is divided into blocks, and check points are set between the blocks. When the process reaches the checkpoint, the environment in the block is saved. Then, the registers 108-1 to 108
-4 is checked, and if there is no error, the process proceeds to the next block. If there is no error, register 108-1 with a clear signal.
It is possible to avoid a temporary failure by clearing the error state held in 108-4, returning to the previous checkpoint, restoring the environment in that block, and re-executing the processing.

【0049】また、このように出力を比較した結果から
不一致の情報を累積して保持することにより、例えば複
数のチェックポイントに亙って誤り発生位置の統計を取
れば、その統計結果をハ―ドウェアの交換時期やシステ
ムの信頼性についての目安として使用することもでき
る。
Further, by accumulating and holding the information of disagreement from the results of comparing the outputs in this way, if the statistics of the error occurrence positions are collected over a plurality of check points, the statistical results are displayed. It can also be used as a guide for when to replace hardware and for system reliability.

【0050】尚、以上の説明においてA系出力101お
よびB系出力102についてその出力内容については特
定しなかったが、例えば、A系出力101およびB系出
力102を機能的(デ―タやアドレスなど)に区分し、
その区分毎に誤り検出機構を設けて誤り検出を行うこと
ができる。
Although the output contents of the A-system output 101 and the B-system output 102 are not specified in the above description, for example, the A-system output 101 and the B-system output 102 are functional (data and address). Etc.),
Error detection can be performed by providing an error detection mechanism for each section.

【0051】また、ここでは、データ処理装置11,1
2の各CPU自体が誤り処理プログラムの実行によって
レジスタリードを行ったが、2重化システム内に設けら
れたサービスプロセッサを利用してレジスタリードを行
うことも可能である。
Further, here, the data processing devices 11 and 1 are
Although each of the two CPUs themselves read the register by executing the error processing program, it is also possible to perform the register read by using the service processor provided in the duplex system.

【0052】[0052]

【発明の効果】以上詳述したように、この発明によれ
ば、2重化システムにおける誤り検出について詳細な誤
り位置情報を容易に得ることができる。
As described above in detail, according to the present invention, it is possible to easily obtain detailed error position information regarding error detection in a duplex system.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の第1実施例に係わる誤り検出機構の
構成を示すブロック図。
FIG. 1 is a block diagram showing the configuration of an error detection mechanism according to a first embodiment of the present invention.

【図2】同第1実施例の動作を説明するフローチャー
ト。
FIG. 2 is a flowchart for explaining the operation of the first embodiment.

【図3】この発明の第2実施例に係わる誤り検出機構の
構成を示すブロック図。
FIG. 3 is a block diagram showing the configuration of an error detection mechanism according to the second embodiment of the present invention.

【図4】同第2実施例で使用されるレジスタの具体的構
成の一例を示す回路図。
FIG. 4 is a circuit diagram showing an example of a specific configuration of a register used in the second embodiment.

【図5】同第2実施例の動作を説明するフローチャー
ト。
FIG. 5 is a flowchart for explaining the operation of the second embodiment.

【図6】従来の誤り検出機構を示すブロック図。FIG. 6 is a block diagram showing a conventional error detection mechanism.

【符号の説明】[Explanation of symbols]

101…A系信号、102…B系信号、103−1〜1
03−4…比較器、105…エラー検出回路、107−
1〜107−4,108−1〜108−4…レジスタ。
101 ... A system signal, 102 ... B system signal, 103-1 to 1
03-4 ... comparator, 105 ... error detection circuit, 107-
1 to 107-4, 108-1 to 108-4 ... Registers.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 同一処理を並行して実行する第1および
第2のデータ処理装置を有する2重化システムにおい
て、 前記第1のデ―タ処理装置からの複数ビットから成る出
力とこの出力に対応する前記第2のデ―タ処理装置の複
数ビットから成る出力とをビット単位で比較する比較手
段と、 この比較手段による比較結果を各ビット毎に保持する保
持手段と、 前記比較手段によって前記第1のデ―タ処理装置と前記
第2のデ―タ処理装置の出力間の不一致が検出された
際、前記保持手段に保持されている比較結果に基づいて
誤りが発生したビット位置を検出する手段とを具備した
ことを特徴とする2重化システムの誤り検出方式。
1. In a duplex system having first and second data processing devices that execute the same processing in parallel, an output consisting of a plurality of bits from the first data processing device and this output are provided. Comparing means for comparing the corresponding output of the second data processing device consisting of a plurality of bits on a bit-by-bit basis, holding means for holding the comparison result by the comparing means for each bit, and the comparing means When a mismatch between the outputs of the first data processing device and the second data processing device is detected, the bit position in which an error has occurred is detected based on the comparison result held in the holding means. An error detection method for a duplex system, comprising:
【請求項2】 同一の回路を有する第1のデ―タ処理装
置と第2のデ―タ処理装置とを用いて2重化し、前記第
1のデ―タ処理装置と前記第2のデ―タ処理装置で同じ
プログラムを実行し、前記第1のデ―タ処理装置の出力
と前記第2のデ―タ処理装置の出力を比較して不一致に
より誤りを検出する2重化システムにおいて、 前記第1のデ―タ処理装置の複数ビットから成る出力と
前記第2のデ―タ処理装置の複数ビットから成る出力と
を比較した結果を各ビット毎に保持する手段と、 前記第1および第2のデ―タ処理装置の出力間に不一致
が発生した際、前記第1および第2のデ―タ処理装置そ
れぞれに割り込み、前記第1および第2のデ―タ処理装
置各々に誤り発生を通知する手段と、 前記通知に応答して起動され、前記保持手段に保持され
た比較結果情報に基づいて、誤りが発生したビット位置
を検出する手段とを具備することを特徴とする2重化シ
ステムの誤り検出方式。
2. A first data processing device and a second data processing device having the same circuit are duplicated, and the first data processing device and the second data processing device are duplicated. -In a duplex system in which the same program is executed in the data processing device, the output of the first data processing device and the output of the second data processing device are compared, and an error is detected due to a mismatch. Means for holding, for each bit, the result of comparing the output of the first data processing device consisting of a plurality of bits and the output of the second data processing device consisting of a plurality of bits; When a mismatch occurs between the outputs of the second data processing device, the first and second data processing devices are interrupted and an error occurs in each of the first and second data processing devices. And a means for notifying and holding in the holding means that is activated in response to the notification. An error detecting method for a duplex system, comprising means for detecting a bit position where an error has occurred based on the compared result information.
【請求項3】 同一の回路を有する第1のデ―タ処理装
置と第2のデ―タ処理装置とを用いて2重化し、前記第
1のデ―タ処理装置と前記第2のデ―タ処理装置で同じ
プログラムを実行し、前記第1のデ―タ処理装置の出力
と前記第2のデ―タ処理装置の出力を比較して不一致に
より誤りを検出する2重化システムにおいて、 前記第1のデ―タ処理装置の複数ビットから成る出力と
前記第2のデ―タ処理装置の複数ビットから成る出力と
の不一致情報を各ビット毎に累積して保持する保持手段
と、 前記保持手段に累積保持された不一致情報を定期的にリ
ードし、その不一致情報に基づいて誤り発生の有無と誤
りが発生したビット位置とを検出する手段とを具備する
ことを特徴とする2重化システムの誤り検出方式。
3. A first data processing device and a second data processing device having the same circuit are duplicated, and the first data processing device and the second data processing device are duplicated. -In a duplex system in which the same program is executed in the data processing device, the output of the first data processing device and the output of the second data processing device are compared, and an error is detected due to a mismatch. Holding means for accumulating and holding, for each bit, the disagreement information between the plurality of bits of the output of the first data processing apparatus and the plurality of bits of the output of the second data processing apparatus; The duplication is characterized by further comprising: means for periodically reading the inconsistency information accumulated and retained in the retaining means, and detecting the presence / absence of an error and the bit position in which the error has occurred based on the inconsistency information. System error detection method.
JP4025624A 1992-02-13 1992-02-13 Error detection system Pending JPH05224970A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4025624A JPH05224970A (en) 1992-02-13 1992-02-13 Error detection system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4025624A JPH05224970A (en) 1992-02-13 1992-02-13 Error detection system

Publications (1)

Publication Number Publication Date
JPH05224970A true JPH05224970A (en) 1993-09-03

Family

ID=12171034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4025624A Pending JPH05224970A (en) 1992-02-13 1992-02-13 Error detection system

Country Status (1)

Country Link
JP (1) JPH05224970A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018169920A (en) * 2017-03-30 2018-11-01 富士通株式会社 Management device, management method and management program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018169920A (en) * 2017-03-30 2018-11-01 富士通株式会社 Management device, management method and management program

Similar Documents

Publication Publication Date Title
US6192489B1 (en) Fault tolerant design for identification of AC defects including variance of cycle time to maintain system operation
US6604177B1 (en) Communication of dissimilar data between lock-stepped processors
US6751749B2 (en) Method and apparatus for computer system reliability
CN100375050C (en) On-die mechanism for high-reliability processor
US6829729B2 (en) Method and system for fault isolation methodology for I/O unrecoverable, uncorrectable error
EP0474451A2 (en) Method and apparatus for error recovery in storage arrays
US20090006916A1 (en) Method for cache correction using functional tests translated to fuse repair
US6845469B2 (en) Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex
KR100304319B1 (en) Apparatus and method for implementing time-lag duplexing techniques
JP2003015900A (en) Follow-up type multiplex system and data processing method capable of improving reliability by follow-up
JPH0375834A (en) Apparatus and method of sequentially correcting parity
JPH05224970A (en) Error detection system
JP3063334B2 (en) Highly reliable information processing equipment
JP3210527B2 (en) Redundant computer system
JPS6256538B2 (en)
JPH07160587A (en) Multiplex memory device
JPS62113241A (en) Fault recovery device
JPH02135535A (en) Information processing system
KR960020563A (en) Self-diagnosis and recovery method of redundant common bus resources and processors in electronic switching
JPS59121552A (en) System for detecting failure
JPH02302834A (en) Fault processor
JPH02268336A (en) Fault tolerant system
Markas et al. A bus-monitor unit for fault-tolerant system configurations
JPS6367646A (en) Information processing system with faulty area separating function
JPS6258344A (en) Fault recovering device