JPH08179994A - Computer system - Google Patents

Computer system

Info

Publication number
JPH08179994A
JPH08179994A JP6322617A JP32261794A JPH08179994A JP H08179994 A JPH08179994 A JP H08179994A JP 6322617 A JP6322617 A JP 6322617A JP 32261794 A JP32261794 A JP 32261794A JP H08179994 A JPH08179994 A JP H08179994A
Authority
JP
Japan
Prior art keywords
main memory
read
error
write
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6322617A
Other languages
Japanese (ja)
Inventor
Toru Nakamura
徹 中村
Katsuji Makiyama
勝次 牧山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6322617A priority Critical patent/JPH08179994A/en
Publication of JPH08179994A publication Critical patent/JPH08179994A/en
Pending legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)

Abstract

PURPOSE: To provide a system low in cost and high in reliability by applying change only to add respective error check mechanisms by duplicating main memory and always storing information of the same content in both main memories. CONSTITUTION: A CPU 3 makes an external data write processing part 4 read in first prescribed program data and numeric data from an external memory device FDD1 or HDD2, and write them on the same addresses of the main memories M1, M2, respectively. In the execution of an intruction, when no error is detected in the parity check of the instruction read out from the main memory M1 on a master side, however, noncoincidence occurs as a result of comparison of the same instruction by reading out from the main memory M2 on a slave side, read/write check processing is performed on both main memories M1, M2. When a read/write error is detected in either main memory M1 or M2, the instruction of the main memory M1 or M2 on a normal side in which no error is detected is executed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明はコンピュータシステム
に関する。
This invention relates to computer systems.

【0002】[0002]

【従来の技術】従来一般に、コンピュータシステムでは
CPUが実行するプログラムや演算処理に必要なデータ
を補助記憶装置から読み出して記憶し、またCPUの演
算処理結果のデータを一時的に書き込むメインメモリが
備えられている。
2. Description of the Related Art Generally, a computer system is generally provided with a main memory for reading a program executed by a CPU and data required for arithmetic processing from an auxiliary storage device and storing the data, and temporarily writing data of the arithmetic processing result of the CPU. Has been.

【0003】[0003]

【発明が解決しようとする課題】このメインメモリはコ
ンピュータシステムにとって各種のプログラムの演算処
理の実行に重要な部分であるが、メインメモリとして広
く利用されているDRAMにはある確率でエラーが発生
することが避けられない。ところが、従来のコンピュー
タシステムではメインメモリエリアが1つしか備えられ
ていなかったので、エラーチェック機能でメインメモリ
にエラーが発生したことが検出された場合には直ちにシ
ステムダウンしなければならず、重要な計算を実行して
いる最中にこのようなエラー発生が起これば、システム
の再立上げ後に、その計算を最初からやり直さなければ
ならなくなる問題点があった。
The main memory is an important part for the computer system to execute the arithmetic processing of various programs, but an error occurs with a certain probability in the DRAM which is widely used as the main memory. Is inevitable. However, since the conventional computer system was provided with only one main memory area, if the error check function detects that an error has occurred in the main memory, the system must be immediately shut down. If such an error occurs during the execution of various calculations, there is a problem that the calculations must be restarted from the beginning after the system is restarted.

【0004】そこで、コンピュータシステムの信頼性を
向上させるために、従来からシステムの二重化を行い、
同じシステムを2系統設置しておき、同一の入力信号を
各システムに同時に入力し、それぞれの外部記憶装置か
ら必要なデータを読み込んで並行して演算を実行し、得
られた結果はそれぞれの外部記憶装置に記憶するが、シ
ステムの一方をマスター、他方をスレーブと決めておい
て、通常時にはマスター側のシステムの演算結果を主に
使用してディスプレイ表示、プラント制御、アラーム発
報などを行い、マスター側のシステムに異常が発生した
場合には、直ちにそれまでのスレーブ側のシステムをマ
スター側に切り替えて使用するようにして、信頼性を向
上させていた。
Therefore, in order to improve the reliability of the computer system, the system has conventionally been duplicated,
The same system is installed in two systems, the same input signal is input to each system at the same time, the necessary data is read from each external storage device, the operation is executed in parallel, and the obtained result is obtained from each external device. Although it is stored in the storage device, one of the systems is set as the master and the other is set as the slave, and normally, the display result, plant control, alarm notification, etc. are mainly performed by using the calculation result of the system on the master side. When an abnormality occurs in the system on the master side, the system on the slave side up to that point is immediately switched to the master side for use to improve reliability.

【0005】しかしながら、このような従来の二重化シ
ステムは、外部記憶装置やCPUなどもすべて二重化す
るものであるために、機器自体を2台ずつ購入する必要
があってコストが高くなり、また機器の設置スペースが
ほぼ2倍必要となる問題点があった。
However, in such a conventional duplex system, since the external storage device and the CPU are all duplicated, it is necessary to purchase two units of the device itself, resulting in a high cost and a device cost. There was a problem that the installation space was almost doubled.

【0006】この発明はこのような従来の問題点に鑑み
てなされたもので、単にメインメモリを二重化し、それ
ぞれのエラーチェック機構を追加するだけの変更で低コ
ストで、信頼性の高いシステムを実現することができる
コンピュータシステムを提供することを目的とする。
The present invention has been made in view of the above-mentioned problems of the prior art, and a low cost and highly reliable system can be obtained by simply duplicating the main memory and adding an error check mechanism for each. It is an object to provide a computer system that can be realized.

【0007】[0007]

【課題を解決するための手段】請求項1の発明のコンピ
ュータシステムは、二重化されたメインメモリと、CP
Uからの書込み命令に対して、同一情報を前記二重化さ
れたメインメモリそれぞれに並行して書き込む情報書込
み処理部と、二重のメインメモリそれぞれのエラーチェ
ックを行うエラーチェック部と、エラーチェック部が現
在マスターとして使用中のメインメモリのエラーを検出
したときに、スレーブ側となっているメインメモリをマ
スター側に切り替えて使用するメモリ切替え処理部とを
備えたものである。
According to a first aspect of the present invention, there is provided a computer system including a dual main memory and a CP.
In response to a write command from U, an information writing processing unit that writes the same information in parallel to each of the duplicated main memories, an error check unit that performs an error check of each duplicated main memory, and an error check unit. When an error of the main memory currently being used as the master is detected, the main memory on the slave side is switched to the master side and is used as a memory switching processing unit.

【0008】[0008]

【作用】請求項1の発明のコンピュータシステムでは、
メインメモリを二重化し、CPUが実行するプログラム
やデータを並行して同時にそれぞれのメインメモリに書
き込み、両方のメインメモリが常に同一の内容の情報を
記憶しているようにする。
According to the computer system of the invention of claim 1,
The main memory is duplicated so that the programs and data executed by the CPU are written in parallel to the respective main memories at the same time so that both main memories always store the same content information.

【0009】そして、エラーチェック機能部によってマ
スター側のメモリチェックを行い、エラーが発生すれば
直ちにメモリ切替え処理部によってそれまでスレーブ側
になっていたメインメモリをマスター側に切り替えて使
用し、メインメモリのエラー発生によってもシステムダ
ウンすることなく演算を継続して実行し、システムの信
頼性を向上させる。
Then, the error check function unit checks the memory on the master side, and when an error occurs, the memory switching processing unit immediately switches the main memory on the slave side to the master side and uses it. Even if an error occurs, the operation is continuously executed without the system going down, and the reliability of the system is improved.

【0010】[0010]

【実施例】以下、この発明の実施例を図に基づいて詳説
する。図1はこの発明の一実施例のハードウェア構成を
示しており、二重化された二つのメインメモリM1,M
2と、外部記憶装置としてフロッピーディスクドライブ
装置(FDD)1及びハードディスクドライブ装置(H
DD)2と、CPU3が備える機構として、外部記憶装
置1,2からメインメモリM1,M2の同じアドレスエ
リアにファイルを転送する制御を行う外部データ書込み
処理部4、メインメモリM1,M2から1命令ごとに同
じアドレスのファイルデータを読み出すと共に、マスタ
ー側のファイルを実行する命令レジスタ5、読み出され
たファイルデータのパリティチェックを行うパリティチ
ェック処理部6、命令実行時にメインメモリM1,M2
の同じアドレスエリアのデータの比較を行う比較処理部
7、そしてパリティチェックで検出できないエラーを検
出するためにメインメモリM1,M2それぞれのリード
/ライトチェックを行うリード/ライトチェック処理部
8,9を備えている。
Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 1 shows a hardware configuration of an embodiment of the present invention, in which two main memories M1 and M that are duplicated are provided.
2, a floppy disk drive device (FDD) 1 and a hard disk drive device (H
DD) 2 and a mechanism provided in the CPU 3, an external data write processing unit 4 for controlling transfer of files from the external storage devices 1 and 2 to the same address area of the main memories M1 and M2, and one instruction from the main memories M1 and M2. Each time the file data of the same address is read, the instruction register 5 that executes the file on the master side, the parity check processing unit 6 that performs the parity check of the read file data, the main memories M1 and M2 at the time of executing the instruction
Of the same address area, and the read / write check processing units 8 and 9 for performing read / write checks of the main memories M1 and M2 in order to detect an error that cannot be detected by the parity check. I have it.

【0011】なお、実際の二重化に際しては、DRAM
のメモリエリアを2分割してそれぞれのメモリエリアを
メインメモリM1,M2のエリアとして割り当てること
になる。
In the actual duplication, a DRAM is used.
Memory area is divided into two and each memory area is allocated as an area of the main memories M1 and M2.

【0012】次に、上記構成のコンピュータシステムの
動作について図2のフローチャートに基づいて説明す
る。CPU3では、最初に二重化されたメインメモリM
1,M2についていずれをマスター(M)側、スレーブ
(S)側とするかを決定しておく。ここでは説明の便宜
上、メインメモリM1をマスター側、メインメモリM2
をスレーブ側とする。
Next, the operation of the computer system having the above configuration will be described with reference to the flowchart of FIG. In the CPU 3, the main memory M which is the first duplicated
Which one of the master (M) side and the slave (S) side of 1 and M2 is determined. Here, for convenience of description, the main memory M1 is on the master side and the main memory M2 is
Is the slave side.

【0013】そしてCPU3はまず外部データ書込み処
理部4によって外部記憶装置のFDD1あるいはHDD
2より所定のプログラムデータや数値データを読み込ま
せ、メインメモリM1,M2それぞれの同一のアドレス
エリアに書き込ませる。ここでは、ファイルA,B,C
がそれぞれ同じアドレスエリアに書き込まれているとす
る。
Then, the CPU 3 first causes the external data write processing unit 4 to operate the FDD 1 or the HDD of the external storage device.
Predetermined program data and numerical data are read from No. 2 and written in the same address area of each of the main memories M1 and M2. Here, files A, B, C
Are written in the same address area.

【0014】命令を実行するに当たっては、命令レジス
タ5がメインメモリM1,M2から1命令ごとに同じア
ドレスのファイルデータを読み出すと共に、マスター側
のメインメモリM1から読み出したファイルをセットし
(ステップS1)、パリティチェック処理部6がパリテ
ィチェックし(ステップS2)、パリティエラーがなけ
れば比較処理部7において当該ファイルデータをスレー
ブ側のメインメモリM2の該当するデータと比較して一
致するかどうか確認し(ステップS3)、一致すればマ
スター側のファイルデータの命令を実行する(ステップ
S4)。なお、演算結果の書込みが必要であれば、メイ
ンメモリM1,M2それぞれの同じアドレスエリアを書
き込む。
In executing an instruction, the instruction register 5 reads the file data of the same address from the main memories M1 and M2 for each instruction, and sets the file read from the main memory M1 on the master side (step S1). Then, the parity check processing unit 6 performs a parity check (step S2), and if there is no parity error, the comparison processing unit 7 compares the file data with the corresponding data in the main memory M2 on the slave side and confirms whether or not they match ( In step S3), if they match, the command of the file data on the master side is executed (step S4). If it is necessary to write the calculation result, the same address area of each of the main memories M1 and M2 is written.

【0015】ステップS2のパリティチェックで、マス
ター側から読み出した命令データにパリティエラーが検
出されれば、スレーブ側のメインメモリM2から同じ命
令データを読み出してパリティチェックを行い(ステッ
プS5,S6)、パリティエラーがなければその命令を
実行する(ステップS7)。そしてこの場合にも、演算
結果の書込みが必要であれば、メインメモリM1,M2
それぞれの同じアドレスエリアを書き込む。
If a parity error is detected in the instruction data read from the master side in the parity check in step S2, the same instruction data is read from the main memory M2 on the slave side to perform a parity check (steps S5 and S6). If there is no parity error, the instruction is executed (step S7). Also in this case, if it is necessary to write the calculation result, the main memories M1 and M2
Write the same address area for each.

【0016】スレーブ側のメインメモリM2のパリティ
チェックでもエラー検出された場合には、システム全体
の異常としてシステム停止を行う(ステップS8)。
If an error is also detected in the parity check of the main memory M2 on the slave side, the system is judged to be abnormal and the system is stopped (step S8).

【0017】上記のマスター側のメインメモリM1から
読み出した命令のパリティチェックでエラーが検出され
なかったものの、ステップS3において同じ命令をスレ
ーブ側のメインメモリM2から読み出して比較した結
果、不一致となった場合には、両方のメインメモリM
1,M2それぞれのリード/ライトチェック処理部8,
9でリード/ライトチェック処理を行い(ステップS
9)、いずれかのメインメモリのリード/ライトにエラ
ーが検出されれば、そのエラーが検出されない正常な側
のメインメモリM1又はM2の命令を実行する(ステッ
プS10)。そしてこの場合にも、演算結果の書込みが
必要であれば、メインメモリM1,M2それぞれの同じ
アドレスエリアを書き込む。
Although an error was not detected in the parity check of the instruction read from the master side main memory M1 as described above, the same instruction was read from the slave side main memory M2 in step S3, and as a result of comparison, there was a mismatch. In case of both main memory M
1, read / write check processing unit 8 for each M2,
Read / write check processing is performed in step 9 (step S
9) If an error is detected in the read / write of any of the main memories, the instruction of the main memory M1 or M2 on the normal side where the error is not detected is executed (step S10). Also in this case, if it is necessary to write the calculation result, the same address area of each of the main memories M1 and M2 is written.

【0018】ここでリード/ライトチェック処理は、次
による。すなわち、特定のアドレスを指定してそこに格
納されているデータをいったん待避させ、空いたメモリ
エリアに特定のデータを書き込み、その書き込んだデー
タをすぐに読み出し、読み出してデータが元の特定のデ
ータと一致するかどうか判断し、一致すればリード/ラ
イト機能が正常、不一致であればリード/ライト機能が
異常と判定する。そして正常であれば、いったん待避さ
せたデータを元のアドレスに書き込んでリード/ライト
チェック処理を終了する。
The read / write check process is as follows. In other words, by specifying a specific address, the data stored in it is temporarily saved, the specific data is written to an empty memory area, the written data is immediately read, and the read data is the original specific data. It is determined whether or not the read / write function is normal, and if they do not match, the read / write function is abnormal. If it is normal, the temporarily saved data is written to the original address, and the read / write check process ends.

【0019】両メインメモリM1,M2のファイルデー
タが異なっているにもかかわらず、ステップS9のリー
ド/ライトチェックの結果、メインメモリにも異常がな
い場合、あるいは両方のメインメモリに共に異常が検出
される場合にはシステム全体の異常とみなし、システム
停止を行う(ステップS11)。
Despite the fact that the file data in both main memories M1 and M2 are different, as a result of the read / write check in step S9, there is no abnormality in the main memory, or an abnormality is detected in both main memories. If so, the system is considered to be abnormal and the system is stopped (step S11).

【0020】このようにして、この実施例のコンピュー
タシステムでは、単にメインメモリを二重化し、CPU
のメインメモリに対するリード/ライト処理に若干の変
更を加えるだけで、従来ではDRAMの性能上、システ
ムダウンを避けられなかったような状況でもシステムダ
ウンを避けることができ、ハードウェアとして全体を二
重化することなくシステム全体の信頼性を向上させるこ
とができることになる。
Thus, in the computer system of this embodiment, the main memory is simply duplicated and the CPU
By making a slight change to the read / write processing for the main memory of, the system down can be avoided even in the situation where the system down could not be avoided by the performance of DRAM in the past, and the entire hardware is duplicated. Without this, the reliability of the entire system can be improved.

【0021】[0021]

【発明の効果】以上のように請求項1の発明によれば、
メインメモリを二重化し、CPUが実行するプログラム
やデータを並行して同時にそれぞれのメインメモリに書
き込み、両方のメインメモリが常に同一の内容の情報を
記憶しているようにし、エラーチェック機能部によって
マスター側のメモリチェックを行い、エラーが発生すれ
ば直ちにメモリ切替え処理部によってそれまでスレーブ
側になっていたメインメモリをマスター側に切り替えて
使用するようにしているので、いずれかのメインメモリ
にエラーが発生してもシステムダウンすることなく演算
を継続して実行することができ、システムの信頼性を向
上させることができ、しかもシステムの信頼性の向上に
ハードウェア全体の二重化を行う必要がないために設置
スペースの拡大やコストの増加を抑えることができる。
As described above, according to the invention of claim 1,
The main memory is duplicated, and the programs and data executed by the CPU are written in parallel to each main memory at the same time so that both main memories always store the same information, and the error check function unit is used to master the data. Side memory check, and if an error occurs, the memory switching processing section immediately switches the main memory that was on the slave side to the master side and uses it. Even if it occurs, the operation can be executed continuously without the system going down, the system reliability can be improved, and there is no need to duplicate the entire hardware to improve the system reliability. In addition, it is possible to suppress an increase in installation space and cost.

【図面の簡単な説明】[Brief description of drawings]

【図1】請求項1の発明の一実施例のハードウェア構成
を示すブロック図。
FIG. 1 is a block diagram showing a hardware configuration of an embodiment of the invention of claim 1;

【図2】上記実施例のメインメモリのエラーチェック動
作を示すフローチャート。
FIG. 2 is a flowchart showing an error check operation of the main memory of the above embodiment.

【符号の説明】 1 フロッピーディスクドライブ装置 2 ハードディスクドライブ装置 3 CPU 4 外部データ書込み処理部 5 命令レジスタ 6 パリティチェック処理部 7 比較処理部 8 リード/ライトチェック処理部 9 リード/ライトチェック処理部 M1,M2 メインメモリ[Explanation of Codes] 1 floppy disk drive device 2 hard disk drive device 3 CPU 4 external data write processing unit 5 instruction register 6 parity check processing unit 7 comparison processing unit 8 read / write check processing unit 9 read / write check processing unit M1, M2 main memory

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 二重化されたメインメモリと、 CPUからの書込み命令に対して、同一情報を前記二重
化されたメインメモリそれぞれに並行して書き込む情報
書込み処理部と、前記二重のメインメモリそれぞれのエ
ラーチェックを行うエラーチェック部と、 前記エラーチェック部が現在マスターとして使用中のメ
インメモリのエラーを検出したときに、スレーブ側とな
っているメインメモリをマスター側に切り替えて使用す
るメモリ切替え処理部とを備えて成るコンピュータシス
テム。
1. A dual main memory and an information write processing unit that writes the same information in parallel to each of the dual main memories in response to a write command from a CPU, and each of the dual main memories. An error check unit that performs an error check, and a memory switching processing unit that switches the main memory on the slave side to the master side when the error check unit detects an error in the main memory currently used as the master. A computer system comprising:
JP6322617A 1994-12-26 1994-12-26 Computer system Pending JPH08179994A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6322617A JPH08179994A (en) 1994-12-26 1994-12-26 Computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6322617A JPH08179994A (en) 1994-12-26 1994-12-26 Computer system

Publications (1)

Publication Number Publication Date
JPH08179994A true JPH08179994A (en) 1996-07-12

Family

ID=18145721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6322617A Pending JPH08179994A (en) 1994-12-26 1994-12-26 Computer system

Country Status (1)

Country Link
JP (1) JPH08179994A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100422929B1 (en) * 2001-12-29 2004-03-12 엘지전자 주식회사 RAID Duplexing Method
JP2007233568A (en) * 2006-02-28 2007-09-13 Toshiba Corp Storage device and digital controller
JP2012238376A (en) * 2005-09-02 2012-12-06 Metallum Inc Method and apparatus of stacking drams
JP2015022450A (en) * 2013-07-18 2015-02-02 富士通株式会社 Writing control program and method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100422929B1 (en) * 2001-12-29 2004-03-12 엘지전자 주식회사 RAID Duplexing Method
JP2012238376A (en) * 2005-09-02 2012-12-06 Metallum Inc Method and apparatus of stacking drams
JP2007233568A (en) * 2006-02-28 2007-09-13 Toshiba Corp Storage device and digital controller
JP2015022450A (en) * 2013-07-18 2015-02-02 富士通株式会社 Writing control program and method

Similar Documents

Publication Publication Date Title
KR950000550B1 (en) Semiconductor memory unit
US8275959B2 (en) Failover control of dual controllers in a redundant data storage system
JPH11272427A (en) Method for saving data and outside storage device
JPH07271403A (en) Inactive system memory updating system
JP2710195B2 (en) Storage controller
JPH05233162A (en) Data saving system and data processing system provided with maintenance function
JPH08179994A (en) Computer system
JP4483876B2 (en) Storage device control method in duplex system
JPS6119061B2 (en)
JPH01118921A (en) Control method for duplex disk
JP3021955B2 (en) Duplicate file system operation method
KR100204576B1 (en) Structure of common block register built-in memory and shadow recovery structure & method
JPH083807B2 (en) Automatic switching device for dual magnetic disk device
JPS641809B2 (en)
JP2716571B2 (en) Redundant data security device
JP2904117B2 (en) Device storage unit redundancy method and device
JPS6119060B2 (en)
JPH07168673A (en) Dual system device
JP2817458B2 (en) Disk cache re-online system
JP2810265B2 (en) Data storage device and information processing system
JPH02110723A (en) Mirroring continuation system for disk device
JPH03259346A (en) Control method for duplex disk system
JPH06259199A (en) Disk switching controller
JPS608962A (en) Temporary fault detecting system of storage information
JPH09259047A (en) Recovery device for duplexed disk