JPS59168997A - Method of main memory patrolling of computer - Google Patents

Method of main memory patrolling of computer

Info

Publication number
JPS59168997A
JPS59168997A JP58044786A JP4478683A JPS59168997A JP S59168997 A JPS59168997 A JP S59168997A JP 58044786 A JP58044786 A JP 58044786A JP 4478683 A JP4478683 A JP 4478683A JP S59168997 A JPS59168997 A JP S59168997A
Authority
JP
Japan
Prior art keywords
error
main memory
bit error
bit
patrol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58044786A
Other languages
Japanese (ja)
Inventor
Mitsuyuki Maruyama
丸山 光行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58044786A priority Critical patent/JPS59168997A/en
Publication of JPS59168997A publication Critical patent/JPS59168997A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Detection And Correction Of Errors (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

PURPOSE:To complete main memory patrolling in a short time by connecting a 1 bit error flag and an error address register to a main memory, holding 1 bit error detected during arithmetic processing in the register and allowing CPU to detect an error easily when main memory patrolling which is carried out periodically. CONSTITUTION:A 1 bit error flag 25 connected to an error detecting and correcting section 23 and an error address register 26 connected to an address register 21 are incorporated in SCU2 and input to a patrol controlling section 12 incorporated in CPU1 respectively. The 1 bit error flag 25 is normally in off state, and made on when data reading is made when arithmetic processing is made by CPU1 and when the error detecting and correcting section 23 detects 1 bit error, and informs of presence of 1 bit error in main memory patrolling. Further, the error address register 26 holds an address in which the error concerned is present when a bit error is detected.

Description

【発明の詳細な説明】 (1)発明の技術分野 本発明は、コンピュータの主記憶装置におけるエラー修
正方法、特に迅速且つ簡便な操作で主記憶装置のエラー
を修正する方法に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (1) Technical Field of the Invention The present invention relates to a method for correcting errors in a main memory of a computer, and particularly to a method for correcting errors in the main memory with quick and simple operations.

(2)技術の背景 コンピュータの主記憶装置では、主記憶の信頼度を向上
させるために、主記憶パトロールが行われる。これは、
中央処理装置(以下、CPUで表わす)における通常処
理を一時的に中断し、パトロール信号によって主記憶を
読み出してエラーを検出し、エラーがある場合はこれを
修正の上書込むことによってソフトエラーを修正する一
方、機械的な固定障害によるバーストエラーがある場合
には交替チップに切換えることによってエラーを修正し
、主記憶の信頼度を向上させるものである。このような
主記憶パトロールは、コンピュータの本来の作業である
CPUによる通常処理操作、即ちO8(オペレーティン
グシステム)の制御の下で行う演算処理を一時的に中断
して、割込形式で行うものであるから、その間はコンピ
ュータは不作動状態とあまり違わない状態におかれる。
(2) Background of the Technology In the main memory of a computer, main memory patrol is performed in order to improve the reliability of the main memory. this is,
It temporarily suspends normal processing in the central processing unit (hereinafter referred to as CPU), reads the main memory using a patrol signal, detects errors, and corrects and overwrites any errors to correct soft errors. On the other hand, if there is a burst error due to a fixed mechanical failure, the error is corrected by switching to a replacement chip, thereby improving the reliability of the main memory. This type of main memory patrol is performed in the form of an interrupt by temporarily suspending the normal processing operations by the CPU, which is the original work of the computer, that is, the arithmetic processing performed under the control of the O8 (operating system). During that time, the computer is placed in a state not unlike an inactive state.

このため、コンピュータの有効利用を図るためには、主
記憶パトロールに要する時間は出来るだけ短いことが望
まれる。
Therefore, in order to make effective use of the computer, it is desirable that the time required for main memory patrol be as short as possible.

(3)従来技術と問題点 第1図は、従来における主記憶パトロールのブロック構
成図の一例を示す図である。この図において、符号1は
CPU、符号2け80U (記憶コントロール装置)、
符号3はMSU (主記憶装置)を示す。CPU 1は
、メモリアクセス部11と、パトロール制御部12と、
このパトロール制御部12の始動、停止を行わせるタイ
マ13とを有する。
(3) Prior Art and Problems FIG. 1 is a diagram showing an example of a block diagram of a conventional main memory patrol. In this figure, numeral 1 is the CPU, numeral 2 is 80U (storage control unit),
Reference numeral 3 indicates an MSU (main storage unit). The CPU 1 includes a memory access section 11, a patrol control section 12,
It has a timer 13 that starts and stops the patrol control section 12.

ECU 2は、アドレスレジスタ21と、チェックビッ
ト発生部22と、誤り検出訂正部nと、チップ交替制御
部24とを備えている。メモリアクセス部11は、通常
の演算部(図示してない)及びパトロール制御部12等
からメモリアクセスの要求を仲介する。パトロール制御
部12は、主記憶パトロールを行うための制御信号を発
し、主記憶パトロールを行う。アドレスレジスタ2H1
、演算に使用するデータを記憶させるMSUの記憶場所
を指定する。チェックビット発生部22は、メモリアク
セス部11に接続され、CPU1からMSU3ヘデータ
を書込むに際して、書込データにFCC(エラーチェッ
ク・アンドコレクト)ビットを付加するものである。ま
た、誤り検出訂正部Bは、MSU 3における1ピツF
エラーを検出し且つ訂正するか、又はMSU 3におけ
る2ビツトエラーの検出を行う。更にチップ交替制御部
24は、誤り検出訂正部BによってMSU 3のバース
トエラーが検知された場合、パトロール制御部12から
の信号を受けてMSU 3内のチップ交替を制御する。
The ECU 2 includes an address register 21, a check bit generation section 22, an error detection and correction section n, and a chip replacement control section 24. The memory access unit 11 mediates memory access requests from a normal calculation unit (not shown), the patrol control unit 12, and the like. The patrol control unit 12 issues a control signal for performing main memory patrol, and performs main memory patrol. Address register 2H1
, specifies the storage location of the MSU where the data used for the calculation is to be stored. The check bit generating section 22 is connected to the memory access section 11 and adds an FCC (error check and correct) bit to the write data when writing data from the CPU 1 to the MSU 3. In addition, the error detection and correction unit B
Detect and correct errors or detect 2-bit errors in MSU 3. Furthermore, when the error detection and correction unit B detects a burst error in the MSU 3, the chip replacement control unit 24 receives a signal from the patrol control unit 12 and controls chip replacement within the MSU 3.

MSU 3には、例えば第2図に示すように、縦方向に
数百キロ或はそれ以上の個数のアドレスにわかれてデー
タが組込まれ、横方向には各データを所定数のビット(
例えば64ビツト)によって構成し、更に各データの端
部にはデータ書込み時にチェックビット発生部22によ
って付加されたECCビットが並設されている。
For example, as shown in FIG. 2, the MSU 3 stores data divided into addresses of several hundred kilometers or more in the vertical direction, and horizontally stores each data into a predetermined number of bits (
For example, 64 bits), and ECC bits added by the check bit generator 22 at the time of data writing are arranged in parallel at the ends of each data.

かかる構成例において、コンピュータに通常の演算処理
を行わせる場合は、O8等からのメモリアクセスが行わ
れ、所定のアドレス(Aとする)のデータが読出される
が、この読出しアクセス時に1ビツトエラーがあれば誤
り検出訂正部nで当該アドレスAのエラーピッ)(A1
とする)を検出、訂正してCPU 1に送り、そこで演
算処理を行う。
In such a configuration example, when the computer performs normal arithmetic processing, memory access is performed from O8, etc., and data at a predetermined address (assumed A) is read, but if a 1-bit error occurs during this read access. If so, the error detection and correction unit n detects the error of the address A) (A1
) is detected, corrected, and sent to CPU 1, where arithmetic processing is performed.

他方、主記憶パトロールを行う場合には、タイマ13か
ら割込信号が出てO8の通常の演算処理が停止される一
方、パトロール制御部12からの制御信号によって主記
憶パトロール、即ちMSU3のエラー検出、訂正が行わ
れる。この主記憶ハ)ロールにおいては、0PUI!パ
トロ一ル制御部12からの信号に基づき、MSU3の全
てのアドレスについて順次データを読出し、そのデータ
に1ビットエラーA、がある場合は、5CU2の誤シ検
出訂正部nにてエラーを訂正した後同じアドレスに正し
いデータを再書込みする。
On the other hand, when performing main memory patrol, an interrupt signal is output from the timer 13 and the normal arithmetic processing of O8 is stopped, while a control signal from the patrol control unit 12 is used to perform main memory patrol, that is, error detection of MSU3. , corrections are made. In this main memory C) roll, 0PUI! Based on the signal from the patrol control unit 12, data is read out sequentially for all addresses of MSU3, and if there is a 1-bit error A in the data, the error is corrected by the error detection correction unit n of 5CU2. Then rewrite the correct data to the same address.

ところで、このような主記憶パトロール方式は、主記憶
全域をカバーすることによりMSU 3に書込まれた全
てのデータについてパトロールが行われるものである。
By the way, in such a main memory patrol method, all data written to the MSU 3 is patrolled by covering the entire main memory.

しかし、現実には、主記憶上はO8の制御下でプログラ
ムが走っており、またこの主記憶のほとんどの領域は頻
繁にデータの書込みが行われ、データ読出しのみを行う
領域は少ない。このため、主記憶全域で読出し、書込み
をしてパトロールすることは、コンピュータの信頼性や
有用性を維持するために動くハードウェアを極力小さく
するという点からは大きな無駄を生じる。
However, in reality, a program runs on the main memory under the control of the O8, and data is frequently written to most areas of the main memory, and there are only a few areas where only data is read. Therefore, reading, writing, and patrolling the entire main memory causes great waste in terms of minimizing the amount of hardware that operates in order to maintain the reliability and usefulness of the computer.

(4)発明の目的 本発明は、上記従来の問題点に着目してなされたもので
、その目的は、簡便な操作によって主記憶のエラーを検
知し且つ訂正することのできる方法を提供することによ
り、主記憶パトロールに要する時間の短縮化を図り、コ
ンピュータの信頼性や有用性を向上させることである。
(4) Purpose of the Invention The present invention has been made by focusing on the above-mentioned conventional problems, and its purpose is to provide a method that can detect and correct errors in main memory with simple operations. This aims to shorten the time required for main memory patrol and improve the reliability and usefulness of computers.

(5)発明の構成 本発明は、上記の目的を達成するために、アドレスレジ
スタとパトロール制御部との間にエラーアドレスレジス
タを接続する一方、課り検出訂正部とパトロール制御部
との間に1ビツトエラーフラグを接続し、CPUが演算
処理を行う際に発見した1ビツトエラーとそのアドレス
を上記1ビツトエラー7ラグとエラーアドレスレジスタ
に保持しておき、主記憶パトロール時に、これら1ビツ
トエラーフラグとエラーアドレスレジスタを検索するこ
とにより、主記憶内での1ビツトエラーの有無を検知し
、当該1ビツトエラーがある場合にはこのエラーを訂正
の上、主記憶に再書込みするようにした主記憶パトロー
ル方法を実現することを要旨とするものである。以下、
本発明の実施例を添付の図面を参照して詳細に説明する
(5) Structure of the Invention In order to achieve the above object, the present invention connects an error address register between an address register and a patrol control section, and connects an error address register between an imposition detection correction section and a patrol control section. A 1-bit error flag is connected, and a 1-bit error discovered when the CPU performs arithmetic processing and its address are held in the 1-bit error 7 lag and error address register, and these 1-bit error flags and their addresses are stored during main memory patrol. A main memory patrol method detects the presence or absence of a 1-bit error in main memory by searching an error address register, and if there is a 1-bit error, the error is corrected and rewritten to main memory. The purpose is to realize the following. below,
Embodiments of the present invention will be described in detail with reference to the accompanying drawings.

(6)発明の実施例 第3図は本発明を適用するための主記憶パトロールのブ
ロック構成の一実施例を示す図である。この図から明ら
かなように、SOU 2内においては、誤シ検出訂正部
23に接続された1ビツトエラーフラグ5と、アドレス
レジスタ21に接続されたエラーアドレスレジスタ26
とが組込まれ、それぞれCPU i内に組込まれたパト
ロール制御部12に出力する様になっている。そして、
パトロール制御部12は、上記アドレスレジスタ21及
びエラーアドレスレジスタル、或は誤り検出訂正部n及
び1ビツトエラー7ラグ25ト介してMSU 3に接続
されている。1ビツトエラーフラグbは通常はオフ状態
にあり、CPU 1によって演算処理を行うに際してデ
ータ読出しをしたとき、誤シ検出訂正部nが1ビツトエ
ラーを検出した時にオン作動し、主記憶パトロール時に
当該1ビツトエラーの存在を知らせると共に、上記ff
lパトロール終了後にはリセットされるものである。ま
た、エラーアドレスレジスタ26ハ、上記1ビツトエラ
ーが検出されたときに、当該エラーがあるアドレスを保
持するためのものである。なお、SOU 2内における
他の構成及びCPU 1、MSU 3の構成は上記従来
におけると同様である。
(6) Embodiment of the Invention FIG. 3 is a diagram showing an embodiment of the block configuration of main memory patrol to which the present invention is applied. As is clear from this figure, in the SOU 2, there is a 1-bit error flag 5 connected to the error detection and correction section 23, and an error address register 26 connected to the address register 21.
are built in, and output to the patrol control unit 12 built into the CPU i. and,
The patrol control section 12 is connected to the MSU 3 via the address register 21 and the error address register, or the error detection and correction section n and the 1-bit error 7 lag 25 port. The 1-bit error flag b is normally in an OFF state, and is turned on when the error detection and correction unit n detects a 1-bit error when data is read during arithmetic processing by the CPU 1. In addition to notifying the existence of a bit error, the above ff
1 It is reset after the patrol ends. Further, the error address register 26 is used to hold the address where the error occurs when the 1-bit error is detected. Note that the other configurations within the SOU 2 and the configurations of the CPU 1 and MSU 3 are the same as in the above-mentioned conventional system.

かかる構成において、通常の演算処理を行う場合は、上
記従来におけると同様、O8等からのメモリアクセスが
行われ、所定のアドレスAのデータが読出される。この
読出しアクセス時に1ビツトエラーがあれば、誤り検出
訂正部nで当該アドレスAのエラービットA、と検出、
訂正してCPU 1に送り、そこで演算処理を行う一方
、1ビツト工ラー検出信号が1ビツトエラー7ラグbへ
送られてこれとオン作動させ、そのときのアドレスAを
エラーアドレスレジスタ26に写しておく。なお、この
演算処理においてはMSU3内の該当アドレスAの訂正
は行われない。
In such a configuration, when performing normal arithmetic processing, memory access is performed from O8 etc. and data at a predetermined address A is read out, as in the above-mentioned conventional case. If there is a 1-bit error during this read access, the error detection and correction unit n detects the error bit A of the address A.
It is corrected and sent to the CPU 1, where arithmetic processing is performed, while the 1-bit error detection signal is sent to the 1-bit error 7lag b and turned on, and the address A at that time is copied to the error address register 26. put. Note that in this arithmetic processing, the corresponding address A in MSU3 is not corrected.

次に、主記憶パトロールを行う際には、先ずタイマ13
が作動し割込み信号を出力する。このタイマ13は所定
の時間毎に作動してその度毎に割込み信号を出すが、こ
の割込信号によってO8は通常の演算処理を中断し、パ
トロール制御部12け起動する。このパトロール制御部
12は、1ビツトエラー7ラグ3を検索し、当該1ビツ
トエラーフラグ25がオフであれば、これで主記憶パト
ロールを終了し、O8に対して終了報告を出し、O8は
中断されていた演算処理を再開する。
Next, when performing main memory patrol, first the timer 13
is activated and outputs an interrupt signal. This timer 13 operates at predetermined time intervals and outputs an interrupt signal each time, and the interrupt signal causes O8 to interrupt normal arithmetic processing and activates the patrol control section 12. This patrol control unit 12 searches for 1-bit error 7 lag 3, and if the 1-bit error flag 25 is off, it ends the main memory patrol, sends a completion report to O8, and O8 is interrupted. Resume the arithmetic processing that was being performed.

他方、上記主記憶パトロールにおいては′、1ビットエ
ラーフラグbがオンであるときは、エラーアドレスレジ
スタ26に格納されたアドレスAを読み取ると共に1ビ
ツトエラーフラグ25分リセットし、メモリアクセス部
11ft介してそのアドレスレジスタしアクセスをかけ
る。読出しなデータは誤シ検出訂正部nにおいてエラー
訂正がなされ、再度MSU 3の同じアドレスに書込ま
れ、更にこのアドレスAに対して再読出しを行う。ここ
で、パトロール制御部12は、もう一度1ビットエラー
7ラグδを検索し、当該1ビツトエラー7ラグbがオフ
であれば、これで主記憶パトロールを終了する。即ち、
二度目の検索によって1ビツトエラーフラグ匹がオフで
あったということは、データの再書込みによってソフト
エラーが修正されたことを意味している。
On the other hand, in the above main memory patrol, when the 1-bit error flag b is on, the address A stored in the error address register 26 is read, the 1-bit error flag is reset for 25 minutes, and the data is read via the memory access unit 11ft. Register that address and access it. The read data undergoes error correction in the error detection and correction section n, is written again to the same address of the MSU 3, and is then reread from this address A. Here, the patrol control unit 12 once again searches for the 1-bit error 7 lag δ, and if the 1-bit error 7 lag b is off, it ends the main memory patrol. That is,
The fact that the 1-bit error flags were turned off by the second search means that the soft error was corrected by rewriting the data.

ところが、上記二度目の検索において再度1ビットエラ
ー7ラグbがオンであるならば、このアドレスAに固定
障害(八−ドエラー)カすることになる。この場合は、
主記憶のバーストエラーの有無、即ちアドレスAのエラ
ービットA、と同一ビット位置における他のアドレス(
第2図中例えばBで示す)のビット(同図中B、 )に
もエラーがあるか否かをチェックする。このチェックは
、上記エラービットAIに対応するメモリセルを含む同
一メモリチップの他のビットB、に続出しアクセスをか
け、この場合における1ビツトエラー7ラグ3がオンに
なるか否かを調べることによって行う。このチェック操
作に際して他の数カ所のビットを調べてエラーが生じて
いなかったときは、バーストエラーではないことを示す
のでそれで主記憶パトロールを終了する。
However, if the 1-bit error 7lag b is turned on again in the second search, a fixed fault (8-dead error) will occur at this address A. in this case,
Check whether there is a burst error in the main memory, that is, error bit A of address A, and other addresses at the same bit position (
It is also checked whether there is an error in the bits (indicated by B in FIG. 2, for example) (B, in the same figure). This check is performed by successively accessing other bits B of the same memory chip that include the memory cell corresponding to the error bit AI, and checking whether 1-bit error 7 lag 3 is turned on in this case. conduct. During this check operation, if several other bits are checked and no error has occurred, this indicates that it is not a burst error, and the main memory patrol is then terminated.

そして、上記とは異なり、同一メモリチップの他の数カ
所のビットを調べたときエラーを生じたときにはバース
トエラーとみなし、このメモリチップを交替チップと交
替させる。交替チップは、第2図中Sで示すように、デ
ータビット及びEOOビットに対して並置されており、
通常はデータの書込みが行われず、バーストエラー訂正
時に、エラーを生じたチップに代って書込みが行われる
。なお、上記1ビツトエラー、即ちソフトエラーの場合
でも交替チップに交替させてエラー修正を行うことはで
きるが、これでは交替チップが無駄に使われることにな
って好ましくない。即ち、1ビツトエラーのチップを交
替するのは、同一データ中でさらにもう一ビットのエラ
ーが生じて2ビツトエラーとなり、エラーの訂正が不可
能になるのを防ぐのに有効であるが、同一のデータ(数
十ビットのチップで構成される)の中で2ビツトがエラ
ーになる確率は非常に小さいから、特に1ビツトエラー
に対してチップ交替と行う必要はない。これに対し、バ
ーストエラ一時には、一連のメモリチップ全部(数キロ
ル数百キ四ワード分)がエラーとなるので、その中のい
ずれかのワードにおいて更にもう1ビツトのエラーの生
じる率は無視できなくなる。よってバーストエラ一時に
のみ、メモリチップの交替という方法でエラー修正する
のがコンビエータの信頼性や有用性を維持するのに効果
的である。バーストエラーを生じたメモリチップは各ワ
ード中でのエラービット位置とアドレスとから判別する
ことが出来、エラーピッ) A1. B、位置は誤り検
出訂正部nによって検出される。
Unlike the above, if an error occurs when checking several other bits of the same memory chip, it is regarded as a burst error and this memory chip is replaced with a replacement chip. The replacement chip is juxtaposed to the data bit and the EOO bit, as shown by S in FIG.
Normally, data is not written, but when a burst error is corrected, data is written in place of the chip in which the error occurred. Note that even in the case of the above-mentioned 1-bit error, ie, a soft error, it is possible to correct the error by replacing the chip with a replacement chip, but this is not preferable because the replacement chip would be wasted. In other words, replacing the chip with a 1-bit error is effective in preventing another bit error from occurring in the same data, resulting in a 2-bit error, making it impossible to correct the error, but replacing the chip with the same data Since the probability that 2 bits will become an error in a chip (consisting of several tens of bits) is very small, there is no need to replace chips especially for a 1-bit error. On the other hand, in the case of a burst error, the entire series of memory chips (several kilograms and hundreds of kilograms) is in error, so the probability of one more bit error occurring in one of the words cannot be ignored. It disappears. Therefore, it is effective to correct the error by replacing the memory chip only once a burst error occurs, in order to maintain the reliability and usefulness of the combiator. The memory chip that caused the burst error can be identified from the error bit position and address in each word, and the error pin is detected.A1. B, the position is detected by the error detection and correction unit n.

(力 発明の詳細 な説明したように、本発明によれば、主記憶装置に1ビ
ツトエラーフラグとこの1ビツトエラーアドレスを保持
するエラーアドレスレジスタを接続し、演算処理中に検
知し21ビツトエラーを上記レジスタに保持しておき、
定期的に行われる主記憶パトロール時にCPUが上記1
ビツトエラーフラグとエラーアドレスレジスタを検索す
ることによってエラーの有無を検知し且つソフトエラー
及びバーストエラーの訂正を行うようにしたため、主記
憶パトロールがより一層簡便に行い得るようになると共
に、当該主記憶パトロールを短時間で完了させることが
出来るようになり、その分コンピュータの通常の演算処
理時間を増大させることが出来る等、種々の効果を奏す
ることができる。
As described in detail, according to the present invention, a 1-bit error flag and an error address register that holds this 1-bit error address are connected to the main memory, and a 21-bit error is detected during arithmetic processing. Keep it in the above register,
During main memory patrol, which is carried out periodically, the CPU
By searching the bit error flag and error address register, the presence or absence of an error is detected, and soft errors and burst errors are corrected. Various effects can be produced, such as being able to complete the patrol in a short time and increasing the normal calculation processing time of the computer.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来における主記憶パトロール機能を備えたコ
ンピュータの構成図、第2図は主記憶装置におけるデー
タの記憶方式をモデル化して示す図、第3図は本発明の
一実施例に係る主記憶パ(ロール方法を実践するための
コンピュータの構成図である。 1・・・CPU       2・・・5OU3・・・
MSU       11・・・メモリアクセス部12
・・・パトロール制御部 13・・・タイマ21・・・
アドレスレジスタ 22・・・チェックビット発生部n
・・・誤り検出訂正部 24・・・チップ交替制御部3
・・・1ビツトエラーフラグ 26・・・エラーアドレ
スレジスタ′艶部」 第1図 第2図
FIG. 1 is a block diagram of a conventional computer equipped with a main memory patrol function, FIG. 2 is a diagram showing a model of the data storage system in the main memory, and FIG. This is a configuration diagram of a computer for practicing the memory roll method. 1...CPU 2...5OU3...
MSU 11...Memory access unit 12
...Patrol control unit 13...Timer 21...
Address register 22...Check bit generation section n
...Error detection and correction unit 24...Chip replacement control unit 3
...1-bit error flag 26...Error address register 'glossy part' Fig. 1 Fig. 2

Claims (1)

【特許請求の範囲】[Claims] パトロール制御部と誤り検出、訂正部との間に1ビツト
エラー7ラグを接続する一方、パトロール制御部とアド
レスレジスタとの間にエラーアドレスレジスタを接続し
、中央処理装置が通常の主記憶アクセスを行う際に発見
した1ビツトエラーとそのアドレスを上記1ビツトエラ
ーフラグとエラーアドレスレジスタに保持しておき、主
記憶パトロール時に、これら1ビツトエラーフラグとエ
ラーアドレスレジスタを検索することにより、主記憶内
での1ビツトエラーの有無及び1ビットエラー有りの場
合にはそのアドレス?検知し、当該1ビツトエラーがあ
る場合には、このエラーを訂正した上で主記憶に再度書
込むことによりエラー修正を行うようにしたことを特徴
とする主記憶パトロール方法。
A 1-bit error 7 lag is connected between the patrol control unit and the error detection/correction unit, while an error address register is connected between the patrol control unit and the address register, and the central processing unit performs normal main memory access. The 1-bit error and its address found at the time of execution are retained in the 1-bit error flag and error address register mentioned above, and by searching these 1-bit error flag and error address register during main memory patrol, the 1-bit error and its address are stored in the main memory. Is there a 1-bit error, and if so, what is the address? 1. A main memory patrol method characterized in that when a 1-bit error is detected, the error is corrected and then written to the main memory again to correct the error.
JP58044786A 1983-03-17 1983-03-17 Method of main memory patrolling of computer Pending JPS59168997A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58044786A JPS59168997A (en) 1983-03-17 1983-03-17 Method of main memory patrolling of computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58044786A JPS59168997A (en) 1983-03-17 1983-03-17 Method of main memory patrolling of computer

Publications (1)

Publication Number Publication Date
JPS59168997A true JPS59168997A (en) 1984-09-22

Family

ID=12701087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58044786A Pending JPS59168997A (en) 1983-03-17 1983-03-17 Method of main memory patrolling of computer

Country Status (1)

Country Link
JP (1) JPS59168997A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014093092A (en) * 2012-11-01 2014-05-19 Samsung Electronics Co Ltd Memory module, memory system including the same, and method of driving the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014093092A (en) * 2012-11-01 2014-05-19 Samsung Electronics Co Ltd Memory module, memory system including the same, and method of driving the same

Similar Documents

Publication Publication Date Title
CA1209269A (en) Faulty-memory processing method and apparatus
JPS59168997A (en) Method of main memory patrolling of computer
JPH0991206A (en) Memory controller and memory check method
JPH0314054A (en) Electronic disk device
JPH03108044A (en) Storage device
JPH04125753A (en) On-lined diagnostic system for memory
JPS63187500A (en) Semiconductor storage device
JPH05210597A (en) Patrol circuit for storage device
JPH0529934B2 (en)
JPS6356751A (en) Memory patrol control system
JPH03127241A (en) Memory control method for paging virtual storage system
JPS62130444A (en) Memory access controller
JPH01309421A (en) Error correction system
JPH01133147A (en) Data processor
JPH0481953A (en) Memory device
JPH08305637A (en) Storage
JPS63170756A (en) Main storage initializing system
JPH02132539A (en) Memory patrol control system
JPS60225941A (en) Microprogram control device
JPH03157744A (en) Error correction rewrite system
JPS617947A (en) Control storage device
JPS6022773B2 (en) Storage device
JPS58225445A (en) Error processing system
JPS62130443A (en) Memory access controller
JPS59154696A (en) System for verifying automatically error in storage device