JPS61259351A - Buffer storage error processing system - Google Patents

Buffer storage error processing system

Info

Publication number
JPS61259351A
JPS61259351A JP60099204A JP9920485A JPS61259351A JP S61259351 A JPS61259351 A JP S61259351A JP 60099204 A JP60099204 A JP 60099204A JP 9920485 A JP9920485 A JP 9920485A JP S61259351 A JPS61259351 A JP S61259351A
Authority
JP
Japan
Prior art keywords
error
storage unit
state
data
control bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60099204A
Other languages
Japanese (ja)
Other versions
JPH045221B2 (en
Inventor
Noriyuki Toyoki
豊木 則行
Koichi Inoue
浩一 井上
Shohei Ito
昌平 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60099204A priority Critical patent/JPS61259351A/en
Publication of JPS61259351A publication Critical patent/JPS61259351A/en
Publication of JPH045221B2 publication Critical patent/JPH045221B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To apply buffer storage error processing by providing an error control circuit detecting the presence of an error in a data detected from the storage unit after move-in by a separate access and applying error processing. CONSTITUTION:An error control bit indicating the 1st state representing the absence of an error in each storage unit in a buffer storage array 111, the 2nd state representing generation of an error, and the 3rd state disconnected with the storage unit is provided to an error control bit memory 130 in each storage unit. When an error is detected in the data of the storage unit of the array 111, the error control circuit 140 revises the error control bit in the storage unit in the memory 130 from the 1st state into the end state, the storage unit is made ineffective, the presence of the error in a data read from the storage unit after move-in by separate access is detected to apply error processing.

Description

【発明の詳細な説明】 〔目 次〕 本発明を、以下の項目の順序で説明する。[Detailed description of the invention] 〔table of contents〕 The present invention will be described in the order of the following items.

A1m要 B、産業上の利用分野 C9従来の技術 り0発明が解決しようとする問題点 E9問題点を解決するための手段(第1図)F9作用 G、実施例(第2図、第3図) G1.構成の説明 G2.動作の説明 H0効果 A、 ill要 ハードウェアによるストア・スル一方式のバッファ・ス
トレイシェラ−処理方式において、エラー発生後エラー
発生箇所を無効化し別のアクセスにおいてnon Hi
tになったエラー発生箇所に主記憶からムーブ・インさ
れたデータを読み出した時にエラーの有無により発生エ
ラーがハード(固定)エラーかソフト(間欠)エラーで
あるかを判別してエラー処理を行う。
A1mRequired B, Industrial field of application C9 Prior art 0 Problems to be solved by the invention E9 Means for solving the problems (Fig. 1) F9 Effects G, Examples (Figs. 2 and 3) Figure) G1. Configuration description G2. Explanation of operation H0 Effect A: In the store-through one-sided buffer strainer processing method using ill-required hardware, after an error occurs, the error location is invalidated and a non-Hi is returned in another access.
When the data moved in from the main memory is read to the location where the error occurred at t, it is determined whether the error is a hard (fixed) error or a soft (intermittent) error based on the presence or absence of an error, and error handling is performed. .

B、産業上の利用分野 本発明は、ストア・スル一方式で書き込みが行われるバ
ッファ・ストレイジにエラーが生じた場合に、そのエラ
ーがソフト(間欠)エラーであるかハード(固定)・エ
ラーであるかを簡単なハードウェアの制御により判別し
て処理するバッファ・ストレイジ・エラー処理方式に関
する。
B. Industrial Field of Application The present invention provides a method for determining whether an error occurs in a buffer storage in which writing is performed using a store-through method, whether the error is a soft (intermittent) error or a hard (fixed) error. This invention relates to a buffer storage error handling method that determines whether there is a buffer storage error by simple hardware control and processes the error.

バッファ・ストレイジ(以下、BSという)は、主記憶
とは別個に設けられた高速・小容量の記憶装置で、主記
憶上のデータの一部が格納されている。CPUは、この
BSをアクセスすることにより主記憶をアクセスする時
間を短縮し、全体のデータ処理を高速化することが出来
る。
Buffer storage (hereinafter referred to as BS) is a high-speed, small-capacity storage device provided separately from main memory, and stores part of the data on main memory. By accessing this BS, the CPU can shorten the time required to access the main memory and speed up the overall data processing.

BSにデータを書き込む方式には、ストア・スルー(s
tore−through )方式とスワップ(SWA
P)方式がある。ストア・スル一方式においては主記憶
とBSの双方のブロックにデータが書き込まれ、両者の
ブロックの内容は常に一致している。スワップ方式にお
いては、BSのみ書き込みを行い主記憶に書き込みは行
われない。
Methods of writing data to the BS include store-through (s
tore-through) method and swap (SWA)
P) There is a method. In the store/slew system, data is written to blocks in both the main memory and the BS, and the contents of both blocks always match. In the swap method, only the BS is written and the main memory is not written.

本発明は、ストア・スル一方式のBSのエラー処理方式
に関するものであり、以下の説明におけるBSは、スト
ア・スル一方式のものであるとする。
The present invention relates to an error processing method for a store-through type BS, and the BS in the following description is assumed to be a store-through type BS.

このBSから取り出されたデータにエラーが発生した場
合、そのエラーがBSのハード・エラーである場合とソ
フト・エラーである場合で処理が異なる。前者の場合は
、BSを構成するメモリ素子の故障であるので、例えば
そのブロックを切り離して使用させない様にする必要が
あり、後者の場合はノイズ、α線等によるデータの一時
的破壊であって、BSのハードウェアは正常である。従
って、BSにエラーが発生した場合は、そのエラーがハ
ード?エラーとソフト・エラーの何れであるかを判別し
て処理することが必要である。
When an error occurs in the data retrieved from the BS, processing is different depending on whether the error is a hard error in the BS or a soft error. In the former case, it is a failure of the memory element that makes up the BS, so it is necessary to separate the block and prevent it from being used, and in the latter case, it is a temporary destruction of data due to noise, alpha rays, etc. , the BS hardware is normal. Therefore, if an error occurs in the BS, is the error caused by hardware? It is necessary to determine whether the error is an error or a soft error and then process it.

C・従来の技術 BSにエラーが発生した場合、CPUのマイクロプログ
ラムによるエラー処理方式とハードウェアによるエラー
処理方式が用いられている。
C. Conventional Technology When an error occurs in the BS, an error processing method using a CPU microprogram and an error processing method using hardware are used.

マイクロプログラムによる方式においては、マイクロプ
ログラムは、BSの制御部からBSエラーの発生を通知
されると、エラー個所について一定回数のりトライを行
う。このリトライが失敗すると、ハード・エラーによる
ものであるとして、BS制御部からエラーの発生と同時
に通知されたエラーアドレスを元にBSのブロック単位
やWAY単位での切離しを行うのが一般的である。
In the microprogram method, when the microprogram is notified of the occurrence of a BS error from the control unit of the BS, the microprogram performs a predetermined number of attempts at the error location. If this retry fails, it is assumed that it is due to a hard error, and the BS is generally disconnected in block units or WAY units based on the error address notified from the BS control unit at the same time as the error occurs. .

この様なエラー処理はハードウェアによって行うことは
可能であるが、ハードウェアによる場合はエラー発生個
所にリトライする制御が複雑である為、簡単なハードウ
ェア制御によりBSエラーがソフト・エラーであるかハ
ード・エラーであるかを判別することが困難であった。
Although it is possible to handle such errors using hardware, since the control to retry at the location where the error occurs is complicated, it is possible to determine whether a BS error is a soft error using simple hardware control. It was difficult to determine whether it was a hard error.

この為、BSのエラー処理に対しては、従来はCPUの
マイクロプログラムによるエラー処理方式が用いられる
ことが多かった。
For this reason, conventionally, an error processing method using a CPU microprogram has often been used for error processing in the BS.

D0発明が解決しようとする問題点 マイクロプログラムによるBSSニラ−理方式゛は、発
生したエラーがハード・エラーとソフト・エラーの何れ
であるかの判別は容易であるが、反面、BS@御部から
マイクロプログラムへエラーアドレスを通知する手段や
マイクロプログラムからB5Ir1@部へ障害ブロック
の切り離しを指示する手段が必要である為、ハード量の
増加や制御の複雑化を招きBSとマイクロプログラムと
のインタフェースが複雑化するという問題があった。
Problems that the D0 Invention attempts to solve With the microprogram-based BSS error management method, it is easy to determine whether an error that has occurred is a hard error or a soft error. Since it is necessary to have a means to notify the error address from the BS to the microprogram and a means to instruct the B5Ir1@ unit to disconnect the faulty block, this increases the amount of hardware and complicates the control, resulting in an increase in the interface between the BS and the microprogram. The problem was that it became complicated.

これに対し、ハードウェアによるBSエラー処理方式は
、BSとマイクロプログラムとのインタフェースは簡単
化出来るが、前述の様に、BSエラーがソフト・エラー
とハード・エラーの何れによるものかを簡単に判別出来
ないという問題があった。
On the other hand, the hardware-based BS error processing method can simplify the interface between the BS and the microprogram, but as mentioned above, it is difficult to easily determine whether a BS error is caused by a soft error or a hard error. The problem was that it couldn't be done.

E0問題点を解決するための手段 前記問題点を解決する為に本発明が講じた手段を、第1
図により説明する。第1図は、本発明の構成をブロック
図で示したものである。
Means for solving the E0 problem The means taken by the present invention to solve the above problem are as follows.
This will be explained using figures. FIG. 1 is a block diagram showing the configuration of the present invention.

第1図において、110はバッファストレイジ(BS)
装置で、従来のBS装置と同様に、内部にBSを構成す
るBSアレイ111及びタグ(TAG)112と、その
他BSに対して書き込みや読み出しを行うに必要な周辺
部(図示せず)が設けられている。BSアレイ111に
は、成る格納単位でデータが格納されている。又、TA
GII2には、格納単位のデータが有効か無効を指示す
る制御ビフl−(V)が設けられている。格納単位は通
常ブロックである。
In FIG. 1, 110 is a buffer storage (BS)
The device is equipped with a BS array 111 and a tag (TAG) 112 that constitute the BS, as well as other peripheral parts (not shown) necessary for writing to and reading from the BS, as in conventional BS devices. It is being The BS array 111 stores data in storage units. Also, T.A.
The GII2 is provided with a control bifurcation l-(V) that instructs whether data in a storage unit is valid or invalid. The storage unit is usually a block.

120はエラー検出回路で、BSアレイ111から読み
出されたデータにおけるエラーの有無を検出する。
Reference numeral 120 denotes an error detection circuit that detects the presence or absence of an error in data read from the BS array 111.

130はエラー制御ビット・メモリ(ECBM)で、B
Sアレイ111とは別個に設けられ、BSアレイ111
の各ブロックのデータにエラーが無い第1の状態、エラ
ーが発生した第2の状態、格納単位が切り離された第3
の状態の何れであるかを指示するエラー制御ビットが、
各格納単位に対応して設けられている。
130 is an error control bit memory (ECBM); B
The BS array 111 is provided separately from the S array 111.
The first state in which there is no error in the data of each block, the second state in which an error occurs, and the third state in which the storage unit is separated.
The error control bit that indicates which state is in
It is provided corresponding to each storage unit.

140はエラー制御回路で、BSアレイ111の格納単
位のデータにエラーが検出された時はECBMI 30
におけるその格納単位のエラー制御ビットを第1の状態
(例えば“00”)から第2の状!@(例えば“01″
)に更新すると共に該格納単位を無効化する。更にエラ
ー制御ビットが第2の状態(01)になった後に別のア
クセスによるムーブ・インが終了してから前記格納単位
から読み出されたデータにエラーが検出された場合は、
ECBMI 30における対応するエラー制御ビットを
第2の状態(01)から第3の状態(例えば“11”)
に更新すると共に前記格納単位を無効化して切り離す。
140 is an error control circuit, and when an error is detected in the storage unit data of the BS array 111, the ECBMI 30
The error control bit of the storage unit in the first state (for example, "00") to the second state! @ (for example “01”
) and invalidates the storage unit. Furthermore, if an error is detected in the data read from the storage unit after the move-in due to another access is completed after the error control bit becomes the second state (01),
The corresponding error control bit in ECBMI 30 is changed from the second state (01) to the third state (e.g. “11”).
At the same time, the storage unit is invalidated and separated.

ムーブ・イン後の読み出しデータにエラーが検出されな
い場合は、前記エラー制御ビットを第2の状態(01)
からエラーの無い第1の状態(00)に戻す。
If no error is detected in the read data after the move-in, the error control bit is set to the second state (01).
The state is returned to the first state (00) where there is no error.

150はリプレース決定手段で、エラー制御回路140
によって無効化された前記格納単位がその後アクセスさ
れてヒツトしなかった時に、前記無効化された格納単位
に主記憶(MSU)のデータをムーブ・イン(Move
 In )する。
150 is a replacement determining means, which is an error control circuit 140;
When the storage unit that has been invalidated is subsequently accessed and there is no hit, data in the main memory (MSU) is moved into the invalidated storage unit.
In).

F9作用 最初、フェッチ要求によりMSUからBSアレイ111
の各格納単位にデータが書き込まれ、TAG112には
各格納単位のアドレスが書き込まれ、制御ピッl−Vは
有効“1”にセットされる。
F9 action: Initially, the fetch request causes the BS array 111 to be sent from the MSU to the BS array 111.
Data is written to each storage unit, the address of each storage unit is written to the TAG 112, and the control pin l-V is set to valid "1".

又、ECBMI 30は、データにエラーの無い第1の
状態(00)に初期化動作によりセットされている。
Further, the ECBMI 30 is set to the first state (00) in which there is no error in the data by the initialization operation.

CPUからBSへの読み出し要求アドレスによってアク
セスされたBSアレイ111から読み出されたデータは
、CPUに転送されると共に、エラー検出回路120に
加えられる。
Data read from the BS array 111 accessed by the read request address from the CPU to the BS is transferred to the CPU and also applied to the error detection circuit 120.

エラー検出回路120は、データにエラーが検出される
とエラー制御回路140にエラー発生を通知する。
When an error is detected in the data, the error detection circuit 120 notifies the error control circuit 140 of the occurrence of the error.

エラー制御回路140は、エラー発生通知を受けると、
ECBMI 30のその格納単位におけるエラー制御ビ
ットを第1の状態(00)からエラー発生を指示する第
2の状態(01)に更新すると共に、該格納単位を無効
化する、具体的には、TAG112の該格納単位に対す
るエントリの制御とットvを無効“0”にする。
When the error control circuit 140 receives the error occurrence notification,
The TAG 112 updates the error control bit in the storage unit of the ECBMI 30 from the first state (00) to the second state (01) indicating the occurrence of an error, and invalidates the storage unit. Control of the entry for the storage unit and invalidates the bit v to "0".

その後、前記無効化された格納単位に対する他のアクセ
ス又はCPUのマイクロプログラムによるリトライがB
Sにヒツトしなかった(non Hit )ときは、n
on Hit信号がリプレース決定手段150に送られ
る。
Thereafter, another access to the invalidated storage unit or a retry by the CPU microprogram is performed by B.
When S is not hit (non Hit), n
The on Hit signal is sent to the replacement determining means 150.

リプレース決定手段150は、このnon Bit信号
を受けるとリプレース・ウェイ (WAY)即ちリプレ
ースする格納単位を決定するが、先にエラーが検出され
た格納単位が無効化されているので(TAG112にお
ける対応するエントリの制御ビット■が“0″)、この
格納単位がリプレースされる様にする。
When the replacement determining means 150 receives this non-Bit signal, it determines the replacement way (WAY), that is, the storage unit to be replaced. However, since the storage unit in which the error was detected earlier has been invalidated (the corresponding one in the TAG 112 If the control bit (2) of the entry is "0"), this storage unit will be replaced.

リプレース処理が終ると、MSUのデータは、リプレー
ス決定手段150の指示に従って、このリプレースされ
た格納単位にムーブ・インされる。
When the replacement process is completed, the data of the MSU is moved into the replaced storage unit according to instructions from the replacement determining means 150.

このときTAG112には新しいアドレスが書き込まれ
ると共に制御ビット■は有効″1”にセットされるが、
ECBMI 30のエラー制御ビットは第2の状態(0
1)のままである。
At this time, a new address is written to the TAG112 and the control bit ■ is set to valid "1".
The error control bit of ECBMI 30 is in the second state (0
1) remains the same.

その後、別のアクセスが最初にこの格納単位のデータを
読み出したとき、エラー検出回路120は、このデータ
におけるエラーの有無を検出する。
Thereafter, when another access reads the data of this storage unit for the first time, the error detection circuit 120 detects the presence or absence of an error in this data.

読み出されたデータに再度エラーが検出された場合は、
同じ格納単位からムーブ・インによる書き込みを挟んで
2回続けてエラーが検出されたことからエラー制御回路
140はBSにおけるハード・エラーと判断し、ECB
MI 30における前記格納単位に対応するエラー制御
ビットを第2の状態(01)から第3の状態(11)に
更新すると共に前記格納単位を無効化して切り離す。切
り離された格納単位は、以後旧を検出の為のアドレス比
較やリプレースの対称とはならない。
If an error is detected again in the read data,
The error control circuit 140 determines that it is a hard error in the BS because the error was detected twice in a row with the move-in writing in between from the same storage unit, and the ECB
The error control bit corresponding to the storage unit in the MI 30 is updated from the second state (01) to the third state (11), and the storage unit is invalidated and separated. The separated storage unit will no longer be a target for address comparison or replacement to detect the old one.

ムーブ・イン後の読み出しでエラーが検出されない場合
は、エラー制御回路140は、最初のエラーはソフト・
エラー(間欠エラー)と見なして、ECBMI 30の
対応するエラー制御ビットを第2の状fl (01)か
ら第1の状態(00)に戻す。
If no error is detected in the read after the move-in, the error control circuit 140 determines that the first error is a soft error.
Assuming an error (intermittent error), the corresponding error control bit of the ECBMI 30 is returned from the second state fl (01) to the first state (00).

以上の様にして小容量のECBMI 30及び簡単な回
路構成で済むエラー制御回路140を追加するだけで(
リプレース決定手段150は通常のBS処理方式にも用
いられている)、BSエラー処理を行うことが出来る。
By simply adding the small-capacity ECBMI 30 and the error control circuit 140, which requires a simple circuit configuration, as described above (
The replacement determining means 150 is also used in a normal BS processing method) and can perform BS error processing.

又、エラー発生後のデータの書き込みを行う為に専用の
書き込みサイクルを設けず、BSのnon Hit時の
MSUからBSアレイ111へのデータのムーブ・イン
を利用して行っているので、BSエラー処理制御が簡単
化される。
In addition, a dedicated write cycle is not provided to write data after an error occurs, and data is moved in from the MSU to the BS array 111 when the BS is non-hit. Processing control is simplified.

BSアレイ111を構成するRAMに生じた間欠エラー
は、正常なデータを書き込めば回復する。
Intermittent errors occurring in the RAM constituting the BS array 111 can be recovered by writing normal data.

本発明は、この性質に着目し、エラー発生後のデータ書
き込みの後でエラーが検出されなかった場合には間欠エ
ラーと見なして、格納処理の切り離しは行わない。これ
により不必要な切り離し処理が阻止され、BSエラー処
理が簡単化される。
The present invention focuses on this property, and if no error is detected after data is written after an error occurs, it is regarded as an intermittent error and storage processing is not separated. This prevents unnecessary disconnection processing and simplifies BS error handling.

G、実施例 本発明の一実施例を第2図及び第3図を参照して説明す
る。第2図は本発明の構成のブロック説明図、′第3図
はTAGエントリ及びそこに設けられたエラー制御ビッ
ト・メモリの説明図である。
G. Embodiment An embodiment of the present invention will be described with reference to FIGS. 2 and 3. FIG. 2 is a block diagram illustrating the configuration of the present invention, and FIG. 3 is a diagram illustrating a TAG entry and an error control bit memory provided therein.

G+、構成の説明 第2図において、エラー検出回路120,208M13
0、エラー制御回路140及びリプレース決定手段15
0以外の部分は、BS装置110である。
G+, explanation of the configuration In FIG. 2, error detection circuits 120, 208M13
0, error control circuit 140 and replacement determining means 15
The part other than 0 is the BS device 110.

BS装置110において、BSアレイ111は2WAY
構成(111A、 111B)になっており、ブロック
からなる格納単位でデータの書き込み又は読み出しが行
われ、アドレス中の下位アドレスによってアクセスされ
る。TAG112も2WAY構成(112A、112B
)になっており、アドレス中の下位のアドレスによって
アクセスされる。BSアレイ111の各ブロックに対応
するTAGエントリには、第3図に示す様に、対応する
ブロックの上位アドレスとそのブロックが有効か無効か
を示す制御ビットvが設けられている他、後に説明する
様にECBMI 30のエラー制御ビット(ECo  
、ECI )が設けられている。BSアレイ111及び
TAG112により、BSが構成される。
In the BS device 110, the BS array 111 is a 2WAY
It has a configuration (111A, 111B), and data is written or read in a storage unit consisting of a block, and is accessed by a lower address among addresses. TAG112 also has a 2WAY configuration (112A, 112B
), and is accessed by lower-order addresses. As shown in FIG. 3, the TAG entry corresponding to each block in the BS array 111 is provided with the upper address of the corresponding block and a control bit v indicating whether the block is valid or invalid, as well as a control bit v that will be explained later. The error control bit (ECo
, ECI) are provided. The BS array 111 and TAG 112 constitute a BS.

113はアドレス・レジスタ(ADH)で、BSをアク
セスするアドレスがセットされる。アドレスはMSUに
送られて、そのアドレスのデータを読み出し、下位アド
レスはBSアレイ111、TAG112及びLRUメモ
リ (後出)に加えられ、上位アドレスは比較器114
に加えられる。
113 is an address register (ADH) in which an address for accessing the BS is set. The address is sent to the MSU to read the data at that address, the lower address is added to the BS array 111, TAG 112 and LRU memory (described later), and the upper address is added to the comparator 114.
added to.

比較器114はTAG112に合せて2個(114A、
114B)設けられ、ADR113の上位アドレスと2
WAYのTAGエントリ内の各上位アドレスを比較する
There are two comparators 114 (114A,
114B) is provided, and the upper address of ADR113 and 2
Compare each upper address in the TAG entry of WAY.

115はゲートで、比較器114A及び114Bの両者
において上位アドレスの一致が検出されなかった時にn
on Hit信号を出力して、CPU及びリプレース決
定回路150に送る。
Reference numeral 115 is a gate, and when a match of upper addresses is not detected in both comparators 114A and 114B, n
An on Hit signal is output and sent to the CPU and replacement determination circuit 150.

116は主記憶データ・レジスタ(MSDR)で、MS
Uのデータがセットされる。117はバッファストレイ
ジ・データ・レジスタ(B S D R)で、BSアレ
イ111から読み出されたデータがセットされる。11
8はBSアレイ・セレクタ(BS−3EL)で、比較器
114の出力を受けて、TAG112Aがヒツトした時
はBSアレイエIIAのデータをセレクトし、TAG1
12Bがヒツトした時はBSアレイ111Bのデータを
セレクトしてBSDR117に書き込む。119は制御
ビット・セレクタ(V−3EL)で、比較器114Aの
出力を受け、TAG112Aがヒツトした時はTAG1
12Aの制御ビットVをセレクトし、TA0112Bが
ヒツトした時はTAG112Bの制御ビットVをセレク
トして、リプレース決定回路150に加える。
116 is a main memory data register (MSDR);
The data of U is set. Reference numeral 117 denotes a buffer storage data register (BSDR) in which data read from the BS array 111 is set. 11
8 is a BS array selector (BS-3EL) which receives the output of the comparator 114, selects the data of BS array IIA when TAG112A is hit, and selects the data of TAG1
When 12B is hit, data in BS array 111B is selected and written to BSDR 117. 119 is a control bit selector (V-3EL) which receives the output of comparator 114A, and when TAG112A is hit, TAG1
12A is selected, and when TA0112B is hit, the control bit V of TAG112B is selected and added to the replacement determination circuit 150.

エラー検出回路120は、パリティ・チェックによりB
Sアレイ111から読み出されたデータにおけるエラー
の有無を検出する。
The error detection circuit 120 performs a parity check to detect B.
The presence or absence of an error in the data read from the S array 111 is detected.

ECBMI 30は、TAG112内に設けられTAG
112と同様に2WAY構成(130A。
The ECBMI 30 is provided in the TAG 112 and the TAG
2WAY configuration (130A) similar to 112.

130B)になっており、第3図に示す様に、各TAG
エントリ中に対応するBSアレイ111のブロックのデ
ータのエラー情報がセットされる2ビツトのエラー制御
ビットECo及びEC1が設けられている。データにエ
ラーが無い第1の状態ではエラー制御ビットE Coと
ECIは00”にセットされ、エラーが発生した第2の
状態では01”にセットされ、ブロックが切り離された
第3の状態では“11”にセットされる。131はエラ
ー制御ビット・セレクタ(ECB −5EL)で、比較
器114の出力を受けて、TAG112Aがヒツトした
時はECBMI 30Aをセレクトし、TA0112B
がヒツトした時はECBM130Bをセレクトして、エ
ラー制御回路140に送る。
130B), and as shown in Figure 3, each TAG
Two error control bits ECo and EC1 are provided in which error information of data in the corresponding block of BS array 111 is set in the entry. In the first state where there is no error in the data, the error control bits E Co and ECI are set to 00", in the second state where an error occurs they are set to 01", and in the third state where the block is detached, they are set to "00". 11”. 131 is an error control bit selector (ECB-5EL) which receives the output of the comparator 114, selects ECBMI 30A when TAG112A is hit, and selects TA0112B.
When the signal is hit, the ECBM 130B is selected and sent to the error control circuit 140.

エラー制御回路140については、第1図で説明した通
りである。
The error control circuit 140 is as described in FIG.

リプレース決定手段150において、151はL RU
 (Least Recently Used )テー
ブルで、BSアレイ111の各ブロックの過去の使用状
況が記録されている。152はLRUレジスタ(LRU
R)で、LRUテーブル151から取り出されたリプレ
ースされるべきBSアレイ111のブロックのi D 
(WA YoかW A Y lのいずれか)が書き込ま
れる。153はリプレース決定回路で、ゲート115か
らnon Hit信号を受けると、LRUテーブル15
1を用いた公知のLRU法によりリプレースするブロッ
クを決定するが、その際、先にデータにエラーが発生し
た為無効化されたブロックがリプレースされる様に制御
される。つまり、LRUか・らの値によるよりも、TA
Gの制御ビットv−oであるブロックを優先的にリプレ
ースする。
In the replacement determining means 150, 151 is L RU
The (Least Recently Used) table records the past usage status of each block of the BS array 111. 152 is the LRU register (LRU
R), i D of the block of the BS array 111 to be replaced taken out from the LRU table 151
(Either WA Yo or WA Y l) is written. Reference numeral 153 denotes a replacement determination circuit which, when receiving a non-hit signal from the gate 115, selects the LRU table 15.
A block to be replaced is determined by a well-known LRU method using 1. At this time, control is performed so that a block that has been invalidated due to a data error occurring first is replaced. In other words, rather than depending on the value from LRU, TA
The block with control bits vo of G is preferentially replaced.

G2.動作の説明 最初、フェッチ要求によりMSUからBSアレイ111
の各ブロックにデータが書き込まれ、TAG112には
各ブロックの上位アドレスが書き込まれ、制御ビットV
は有効“1”にセットされる。又、ECBMI 30の
エラー制御ビフトECO及びEC1は、エラーの無い第
1の状態“00”に初期化動作によりセットされている
G2. Description of operation: First, a fetch request is sent from the MSU to the BS array 111.
Data is written to each block, the upper address of each block is written to TAG112, and the control bit V
is set to valid "1". Further, the error control bits ECO and EC1 of the ECBMI 30 are set to the first state "00" with no error by the initialization operation.

CPUからBSへの読み出し要求アドレスはADR11
3にセットされ、その下位アドレスにTAG112、B
Sアレイ111及びLRUテーブル151が同時にアク
セスされる。TAG112に下位アドレスが供給される
と、そのTAG内の上位アドレスが読み出されて比較器
114に加えられる。
The read request address from the CPU to the BS is ADR11.
3, and TAG112, B is set to the lower address.
S array 111 and LRU table 151 are accessed simultaneously. When a lower address is provided to TAG 112, the upper address within that TAG is read and applied to comparator 114.

比較器114は、ADR113とTAG112の上位ア
ドレス同志を比較する。一致した上位アドレスを持った
TAG112に対応するBSアレイ111にあるブロッ
ク・データがBSDRII8にセットされ、CPU及び
エラー検出回路120加えられる。
Comparator 114 compares the upper addresses of ADR 113 and TAG 112. The block data in the BS array 111 corresponding to the TAG 112 with the matching upper address is set in the BSDR II 8 and applied to the CPU and error detection circuit 120.

エラー検出回路120は、パリティ・チェックによりエ
ラー検出を行い、データ中にエラーが検出されると、エ
ラー制御回路140及びCPUのマイクロプログラムに
通知する。
The error detection circuit 120 performs error detection by parity checking, and when an error is detected in the data, it notifies the error control circuit 140 and the microprogram of the CPU.

エラー制御回路140は、エラー発生通知を受けると、
ECBMI 30におけるそのブロックのエラー制御ビ
ン)ECO及びEC1を第1の状態(00)からエラー
発生を指示する第2の状態(01)に更新すると共に、
そのブロックの制御ビットVを一〇′にしてブロックを
無効化する。
When the error control circuit 140 receives the error occurrence notification,
Error control bins of that block in the ECBMI 30) Update ECO and EC1 from the first state (00) to the second state (01) indicating the occurrence of an error;
The control bit V of the block is set to 10' to invalidate the block.

その後、エラーしたアクセスと下位アドレスが等しい他
のアクセス又はCPUのマイクロプログラムによるリト
ライが上位アドレスが一致しない為BSにヒツトしなか
った時は、比較器114、ゲート115によりnon 
Hit信号がリプレース決定回路153に送られる。一
方、制御ビット・セレクタ119からは、その下位アド
レスのブロックが無効化されていることを指示する制御
ビット“O”が送られる。
After that, when another access with the same lower address as the error access or a retry by the CPU microprogram does not hit the BS because the upper address does not match, the comparator 114 and gate 115 select
The Hit signal is sent to the replacement determination circuit 153. On the other hand, control bit selector 119 sends a control bit "O" indicating that the block at the lower address is invalidated.

リプレース決定回路153は、LRUテーブル151を
用いた公知のLRU法によりリプレースするブロックを
決定するが、その際、LRU法より優先して先にデータ
にエラーが発生した為無効化されたブロックがリプレー
スされる様に制御する。
The replacement determination circuit 153 determines a block to be replaced by a known LRU method using the LRU table 151, but at this time, blocks that were invalidated due to an error occurring in data are replaced first, giving priority to the LRU method. control so that it is done.

一方、BSをアクセスしたアドレスはADR113から
MSUに送られる。一定時間後MSUから送られてきた
データはMSDR116にセットされた後、リプレース
決定回路153の指示するBSアレイ (111A又は
11B)のブロックに書き込まれる。
On the other hand, the address that accessed the BS is sent from the ADR 113 to the MSU. After a certain period of time, the data sent from the MSU is set in the MSDR 116 and then written into the block of the BS array (111A or 11B) specified by the replacement determination circuit 153.

この時、書き込みの行われるブロックを有するBSアレ
イ (111A又はIIIB)に対応するTAG (1
12A又は112B)のエントリには新しい上位アドレ
スが書き込まれると共に、そのエントリの制御ビットV
は有効″1”にセットされる。然し、そのエントリにお
けるエラー制御ビットECoおよびEC!は、第2の状
態(01)のままである。
At this time, TAG (1
12A or 112B), a new upper address is written to the entry, and the control bit V of that entry is written.
is set to valid "1". However, the error control bits ECo and EC! in that entry remains in the second state (01).

その後、別のアクセスが最初にこのリプレースされたブ
ロックのデータを読み出すと、エラー検出回路120は
、このデータにおけるエラーの有無をパリティ・チェッ
クにより検出する。
Thereafter, when another access first reads the data of this replaced block, the error detection circuit 120 detects the presence or absence of an error in this data by parity checking.

読み出されたデータに再度エラーが検出された場合は、
エラー制御回路140はこのエラーをBSにおけるハー
ド・エラーであると判断し、TAG112にある当該ブ
ロックに対応するTAGエントリにおけるエラー制御ビ
ットECo及びEC1を第2の状態(01)から第3の
状態(11)に更新すると共に制御ビットBを無効“0
”にセフトして、前記ブロックの切り離しを行う。切り
離されたブロックは、以後は旧を検出の為のアドレス比
較やリプレースの対象とはならない。
If an error is detected again in the read data,
The error control circuit 140 determines this error to be a hard error in the BS, and changes the error control bits ECo and EC1 in the TAG entry corresponding to the block in the TAG 112 from the second state (01) to the third state ( 11) and disable control bit B to “0”.
” and detach the block. The detached block will no longer be subject to address comparison or replacement to detect the old one.

エラーが検出されない場合は、エラー制御回路140は
、最初のエラーはBSアレイ111を構成するRAMに
生じた間欠エラーであってムーブ・インによりRAM内
の情報は正常に回復したと判断し、前記TAGエントリ
におけるエラー制御ビットECo及びEC1を第2の状
態(01)からエラーの無いことを指示する第1の状態
(00)に戻す。制御ビットvは、有効“1”がセット
されているので、TAGエントリは、対応するBSアレ
イ111のブロックがデータに誤りなく有効なものであ
ることを指示することになる。
If no error is detected, the error control circuit 140 determines that the first error is an intermittent error that occurred in the RAM constituting the BS array 111, and that the information in the RAM has been successfully recovered by the move-in. The error control bits ECo and EC1 in the TAG entry are returned from the second state (01) to the first state (00) indicating no error. Since the control bit v is set to valid "1", the TAG entry indicates that the corresponding block of the BS array 111 has valid data without errors.

以上、本発明の一実施例について説明したが、本発明の
各構成は、この実施例の構成に限定されるものではない
Although one embodiment of the present invention has been described above, each structure of the present invention is not limited to the structure of this embodiment.

例えば、エラー制御ビット・メモリ (ECBM)13
0は、TAG112と共用することなく別個に設ける様
にしても良いはもちろんである。
For example, error control bit memory (ECBM)13
Of course, 0 may be provided separately without being shared with the TAG 112.

又、BSアレイ111のブロックと通常の読み出しを行
う格納単位が異なる場合には、TAG 112内にブロ
ック内のエラー箇所を示す識別情報iDを設け、同一箇
所の再読み出しでエラーが発生した場合は切り離し、同
一箇所の再読み出しでエラーが無い場合はエラー無しの
第1の状態に戻す様に制御することにより、ハード・エ
ラーが発生しても正常な部分を、無駄に切り離すこと無
くエラー箇所だけを切り離す様にすることが出来る。
In addition, if the storage unit for normal reading is different from the block in the BS array 111, identification information ID is provided in the TAG 112 that indicates the error location within the block, and if an error occurs when rereading the same location, If there is no error when disconnecting and re-reading the same location, control is restored to the first state with no error, so even if a hard error occurs, only the error location is removed without needlessly disconnecting the normal section. It can be made to separate.

H0発明の効果 本発明は、次の様な効果を奏するものである。Effect of H0 invention The present invention has the following effects.

(イ)小容量のエラー制御ビット・メモリ及び簡単な構
成のエラー制御回路を追加するだけでバッファ・ストレ
イジ・エラー処理を間欠エラー/固定エラーを区別して
行うことが出来るので、小量のハード量の追加でハード
ウェアによるバッファ・ストレイジ・エラー処理を実現
することが出来る。
(b) Buffer storage error processing can be performed by distinguishing between intermittent errors and fixed errors by simply adding a small-capacity error control bit memory and a simple error control circuit, so a small amount of hardware is required. By adding , it is possible to implement buffer storage and error handling in hardware.

(ロ)エラー発生後、エラー処理の為にデータの書き込
みを行う専用の書き込みサイクルを設けず、通常のバッ
ファ・ストレイジのnon Hit時の主記憶からバッ
ファ・ストレイジ・アレイへのデータのムーブ・インを
利用して行っているので、BSエラー処理制御が簡単化
することが出来る。
(b) After an error occurs, there is no dedicated write cycle for writing data for error processing, and data is moved in from the main memory to the buffer storage array when the buffer storage is non-hit. Since this is done by using the BS error processing control, it is possible to simplify the BS error processing control.

【図面の簡単な説明】[Brief explanation of drawings]

第1図一本発明の構成のブロック説明図、第2図一本発
明の一実施例のブロック説明図、第3図−同実施例にお
けるタグ(T A G)エントリ及びエラー制御ビット
・メモリの 説明図。 第1図において 110−バッファ・ストレイジ(BS)装置、111−
バッファ・ストレイジ(B S)アレイ、112−タグ
 (TAG)  、 120−エラー検出回路、 130−エラー制御ビット・メモリ (ECBM)、1
40−エラー制御回路、 150−リプレース決定手段。
FIG. 1: A block explanatory diagram of the configuration of the present invention; FIG. 2: A block explanatory diagram of an embodiment of the present invention; FIG. 3: Tag (TAG) entry and error control bit memory in the embodiment. Explanatory diagram. In FIG. 1, 110-buffer storage (BS) device, 111-
Buffer storage (BS) array, 112-tag (TAG), 120-error detection circuit, 130-error control bit memory (ECBM), 1
40-Error control circuit; 150-Replacement determining means.

Claims (3)

【特許請求の範囲】[Claims] (1)ストア・スルー方式で書き込みが行われるバッフ
ァ・ストレイジにエラーが発生した時、ハードウェアに
よりエラー処理を行うバッファ・ストレイジ・エラー処
理方式において、 (a)バッファ・ストレイジ・アレイ(111)とは別
個に設けられ、バッファ・ストレイジ・アレイ(111
)にある各格納単位がエラーの無い第1の状態、エラー
が発生した第2の状態、格納単位が切り離された第3の
状態の何れであるかを指示するエラー制御ビットが、各
格納単位に対応して設けられているエラー制御ビット・
メモリ(130)と、 (b)バッファ・ストレイジ・アレイ(111)の格納
単位のデータにエラーが検出された時はエラー制御ビッ
ト・メモリ(130)におけるその格納単位のエラー制
御ビットを第1の状態から第2の状態に更新すると共に
該格納単位を無効化し、別アクセスによるムーブイン後
に前記格納単位から読み出されたデータにおけるエラー
の有無を検出してエラー処理を行うエラー制御回路(1
40)と、 (c)前記無効化された格納単位がアクセスされてヒッ
トしなかった時に、前記無効化された格納単位に主記憶
のデータをムーブ・インするリプレース決定手段(15
0)、 を備えたことを特徴とするバッファ・ストレイジ・エラ
ー処理方式。
(1) In the buffer storage error handling method in which error processing is performed by hardware when an error occurs in the buffer storage where writing is performed using the store-through method, (a) the buffer storage array (111) and is provided separately and includes a buffer storage array (111
), each storage unit has an error control bit that indicates whether it is in a first state with no errors, a second state with an error, or a third state in which the storage unit is disconnected. Error control bits and
(b) When an error is detected in the data in the storage unit of the buffer storage array (111), the error control bit of the storage unit in the error control bit memory (130) is set to the first an error control circuit (1) that updates the storage unit from a state to a second state, invalidates the storage unit, detects the presence or absence of an error in data read from the storage unit after move-in by another access, and performs error processing;
40), and (c) a replacement determining means (15) for moving data in the main memory into the invalidated storage unit when the invalidated storage unit is accessed and does not result in a hit.
0), a buffer storage error handling method comprising:
(2)エラー制御回路(140)における前記エラー処
理が、前記格納単位から読み出されたデータに再度エラ
ーが検出された場合は、エラー制御ビット・メモリ(1
30)における対応するエラー制御ビットを第2の状態
から第3の状態に更新すると共に前記格納単位を無効化
して切り離しを行う処理であることを特徴とする特許請
求の範囲第1項記載のバッファ・ストレイジ・エラー処
理方式。
(2) If the error processing in the error control circuit (140) detects an error again in the data read from the storage unit, the error control bit memory (140)
30) The buffer according to claim 1 is a process of updating the corresponding error control bit from the second state to the third state and invalidating and separating the storage unit. -Storage error handling method.
(3)エラー制御回路(140)における前記エラー処
理が、前記格納単位から読み出されたデータにエラーが
検出されなかった場合は、エラー制御ビット・メモリ(
130)における対応するエラー制御ビットを第2の状
態から第1の状態に戻す処理であることを特徴とする特
許請求の範囲第1項記載のバッファ・ストレイジ・エラ
ー処理方式。
(3) If the error processing in the error control circuit (140) detects no error in the data read from the storage unit, the error control bit memory (
130) The buffer storage error handling method according to claim 1, characterized in that the process returns the corresponding error control bit in step 130) from the second state to the first state.
JP60099204A 1985-05-10 1985-05-10 Buffer storage error processing system Granted JPS61259351A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60099204A JPS61259351A (en) 1985-05-10 1985-05-10 Buffer storage error processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60099204A JPS61259351A (en) 1985-05-10 1985-05-10 Buffer storage error processing system

Publications (2)

Publication Number Publication Date
JPS61259351A true JPS61259351A (en) 1986-11-17
JPH045221B2 JPH045221B2 (en) 1992-01-30

Family

ID=14241118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60099204A Granted JPS61259351A (en) 1985-05-10 1985-05-10 Buffer storage error processing system

Country Status (1)

Country Link
JP (1) JPS61259351A (en)

Also Published As

Publication number Publication date
JPH045221B2 (en) 1992-01-30

Similar Documents

Publication Publication Date Title
US8977820B2 (en) Handling of hard errors in a cache of a data processing apparatus
US6006311A (en) Dynamic updating of repair mask used for cache defect avoidance
US8589763B2 (en) Cache memory system
US8205136B2 (en) Fault tolerant encoding of directory states for stuck bits
US6023746A (en) Dual associative-cache directories allowing simultaneous read operation using two buses with multiplexors, address tags, memory block control signals, single clock cycle operation and error correction
US8190951B2 (en) Handling of errors in a data processing apparatus having a cache storage and a replicated address storage
US20030037280A1 (en) Computer memory error management system and method
US5958068A (en) Cache array defect functional bypassing using repair mask
JP2006510071A (en) Various methods and apparatus for tracking failed memory locations to enable execution to invalidate repeatedly failed memory locations
JPH06202922A (en) Processing method for writing error detection check bit
US10545879B2 (en) Apparatus and method for handling access requests
US6085288A (en) Dual cache directories with respective queue independently executing its content and allowing staggered write operations
US5883904A (en) Method for recoverability via redundant cache arrays
US6226763B1 (en) Method and apparatus for performing cache accesses
US5867511A (en) Method for high-speed recoverable directory access
US5943686A (en) Multiple cache directories for non-arbitration concurrent accessing of a cache memory
KR20010078055A (en) Method and apparatus for tolerating unrecoverable errors in a multi-processor data processing system
US5381544A (en) Copyback memory system and cache memory controller which permits access while error recovery operations are performed
US7689891B2 (en) Method and system for handling stuck bits in cache directories
JPS61259351A (en) Buffer storage error processing system
JP3483296B2 (en) Information processing equipment
JP3080030B2 (en) Hierarchical cache device
JP3555847B2 (en) Cache memory failure processing apparatus, cache memory failure processing method, and multiprocessor system
EP0128353A2 (en) Error recovery of non-store-through cache
JPS617959A (en) Control system of tag storage device