JP2021111325A - Memory system for selecting counter-error operation by analyzing errors previously occurred, and data processing system including memory system - Google Patents
Memory system for selecting counter-error operation by analyzing errors previously occurred, and data processing system including memory system Download PDFInfo
- Publication number
- JP2021111325A JP2021111325A JP2020130222A JP2020130222A JP2021111325A JP 2021111325 A JP2021111325 A JP 2021111325A JP 2020130222 A JP2020130222 A JP 2020130222A JP 2020130222 A JP2020130222 A JP 2020130222A JP 2021111325 A JP2021111325 A JP 2021111325A
- Authority
- JP
- Japan
- Prior art keywords
- error
- memory
- memory device
- memory devices
- error correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
- G11C29/12—Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
- G11C29/18—Address generation devices; Devices for accessing memories, e.g. details of addressing circuits
- G11C29/26—Accessing multiple arrays
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1068—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices in sector programmable memories, e.g. flash disk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1064—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices in cache or content addressable memories
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0778—Dumping, i.e. gathering error/state information after a fault for later diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1044—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices with specific ECC/EDC distribution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1048—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices using arrangements adapted for a specific error detection or correction feature
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
- G11C29/12—Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
- G11C29/44—Indication or identification of errors, e.g. for repair
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/88—Monitoring involving counting
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C2029/0411—Online error correction
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
- G11C29/12—Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
- G11C2029/1202—Word line control
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
- G11C29/12—Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
- G11C2029/1204—Bit line control
Abstract
Description
本発明は、データ処理システムに関し、具体的に、以前に発生したエラー分析を介してエラー対応動作を選択できるメモリシステム及びメモリシステムを含むデータ処理システムに関する。 The present invention relates to a data processing system, and specifically to a data processing system including a memory system and a memory system capable of selecting an error handling operation through a previously generated error analysis.
コンピュータ装置あるいは有無線電子装置、例えば、サーバ、デスクトップコンピュータ、ラップトップコンピュータのようなコンピュータ装置あるいは携帯電話、ゲーム機、TV、プロジェクタなどのような電子装置は、動作過程で非常に多くのデータを生成し、処理することができる。このように、動作過程で生成され、処理されるデータを格納するために、一般的に、メモリ装置を利用するメモリシステム、言い換えれば、データ格納装置を使用できる。データ格納装置は、コンピュータ装置あるいは電子装置の主記憶装置または補助記憶装置として使用されることができる。 Computer devices or wireless electronic devices, such as computers such as servers, desktop computers, laptop computers, or electronic devices such as mobile phones, game consoles, televisions, projectors, etc., carry a great deal of data in the process of operation. Can be generated and processed. In this way, a memory system that generally utilizes a memory device, in other words, a data storage device, can be used to store the data generated and processed in the operation process. The data storage device can be used as a main storage device or an auxiliary storage device of a computer device or an electronic device.
一方、メモリシステムには、複数のメモリ装置が含まれ得るし、複数のメモリ装置からデータを書き込み/読み出しする過程で一部データが正常に書き込み/読み出しされないエラーが発生する可能性がある。一般的に、エラーを復旧するアルゴリズムを介してエラーが発生したほとんどのデータを正常なデータとして処理が可能ではある。しかし、エラーを復旧するアルゴリズムを介しても処理できない深刻なエラーが存在する可能性があり、このような深刻なエラーが発生する場合、メモリシステム全体の信頼性を大きく低下させることがある。 On the other hand, the memory system may include a plurality of memory devices, and there is a possibility that an error may occur in which some data is not normally written / read in the process of writing / reading data from the plurality of memory devices. In general, it is possible to process most of the data in which an error has occurred as normal data via an error recovery algorithm. However, there may be serious errors that cannot be handled through the error recovery algorithm, and when such serious errors occur, the reliability of the entire memory system may be significantly reduced.
したがって、深刻なエラーがある時点で、ある領域で発生するかを予め予測する動作は極めて重要でありうる。しかし、従来では、エラーの発生回数をカウントする動作を介して統計的な方式でエラーの発生を予測したため、その正確度が非常に低くなるという問題点があった。 Therefore, the action of predicting in advance whether a serious error will occur in a certain area at a certain point in time can be extremely important. However, in the past, since the occurrence of an error was predicted by a statistical method through the operation of counting the number of occurrences of the error, there was a problem that the accuracy was very low.
本発明の実施形態は、複数のメモリ装置を含むメモリシステムにおいて、以前に発生したエラーを分析して複数のメモリ装置の各々にエラー対応動作を行うことができる装置及び方法を含むデータ処理システムを提供する。 In the embodiment of the present invention, in a memory system including a plurality of memory devices, a data processing system including a device and a method capable of analyzing a previously generated error and performing an error handling operation for each of the plurality of memory devices is provided. offer.
本発明の実施形態に係るデータ処理システムは、複数のワードライン及び複数のビットラインに複数のメモリセルがアレイ形態で接続された複数のセルアレイ領域及び第1のエラー訂正部を各々備える複数のメモリ装置を含むメモリシステムと、第2のエラー訂正部を備え、前記メモリシステムから伝達されたデータのエラーを前記第2のエラー訂正部が訂正し、前記第2のエラー訂正部のエラー訂正動作に対するエラー訂正情報を生成し、前記エラー訂正情報及び前記複数のメモリ装置の各々で生成されたログ(log)情報を利用して前記複数のメモリ装置の各々に対してエラー強度を設定し、前記エラー強度によって前記複数のメモリ装置の各々に対してエラー対応動作を行うホストとを備え、前記複数のメモリ装置の各々は、前記複数のセルアレイ領域に対するアクセス動作中に発生したアクセスデータのエラーを前記第1のエラー訂正部が訂正し、前記第1のエラー訂正部のエラー訂正動作に対する前記ログ(log)情報を生成できる。 The data processing system according to the embodiment of the present invention has a plurality of memories each including a plurality of cell array areas in which a plurality of memory cells are connected in an array form to a plurality of word lines and a plurality of bit lines, and a first error correction unit. A memory system including a device and a second error correction section are provided, and the second error correction section corrects an error in data transmitted from the memory system, with respect to an error correction operation of the second error correction section. The error correction information is generated, and the error strength is set for each of the plurality of memory devices by using the error correction information and the log information generated by each of the plurality of memory devices, and the error is described. Each of the plurality of memory devices includes a host that performs an error handling operation for each of the plurality of memory devices depending on the strength, and each of the plurality of memory devices causes an error of access data generated during the access operation for the plurality of cell array areas. The error correction unit of 1 can correct the data, and the log information for the error correction operation of the first error correction unit can be generated.
また、前記複数のメモリ装置の各々は、読み出し/書き込み動作を含むアクセス動作の実行中、アクセスデータにエラーが発生する場合、発生したエラーを訂正するために、内部に含まれた前記第1のエラー訂正部を動作させ、前記第1のエラー訂正部によりエラーが訂正されたデータのローデータ(raw data)を内部の情報格納領域に累積、格納して前記ログ情報を生成し、前記ホストの要請に応じて前記ログ情報を前記メモリシステムを介して前記ホストに出力することができる。 Further, when an error occurs in the access data during the execution of the access operation including the read / write operation, each of the plurality of memory devices includes the first one internally in order to correct the error. The error correction unit is operated, and the raw data (raw data) of the data whose error has been corrected by the first error correction unit is accumulated and stored in the internal information storage area to generate the log information, and the host The log information can be output to the host via the memory system upon request.
また、前記ホストは、前記エラー訂正情報をリアルタイムまたは設定された時点で収集し、前記設定された時点で前記メモリシステムから前記ログ情報を収集するエラー収集部と、前記ログ情報及び前記エラー訂正情報を分析して、前記複数のメモリ装置の各々で発生したエラーの個数及び種類を確認し、確認結果に応じて前記複数のメモリ装置の各々に対するエラー等級を決定する第1のエラー分析部と、前記第1のエラー分析部で決定されたエラー等級によって前記複数のメモリ装置のうち、一部のメモリ装置に対しては、前記ログ情報及び前記エラー訂正情報の追加分析を介してエラーの形態及び個数を確認してエラー強度を決定し、残りのメモリ装置に対しては、前記第1のエラー分析部で決定されたエラー等級に対応するようにエラー強度を決定する第2のエラー分析部と、前記第2のエラー分析部で決定されたエラー強度によって前記複数のメモリ装置の各々に対して前記エラー対応動作を行う対応動作部とを備えることができる。 Further, the host collects the error correction information in real time or at a set time, and collects the log information from the memory system at the set time, and the log information and the error correction information. The first error analysis unit, which confirms the number and types of errors generated in each of the plurality of memory devices, and determines the error grade for each of the plurality of memory devices according to the confirmation result. Among the plurality of memory devices according to the error grade determined by the first error analysis unit, for some of the memory devices, the error form and the error form and the error form and the error are obtained through additional analysis of the log information and the error correction information. A second error analysis unit that confirms the number and determines the error intensity, and for the remaining memory devices, determines the error intensity so as to correspond to the error grade determined by the first error analysis unit. It is possible to provide a corresponding operation unit that performs the error handling operation for each of the plurality of memory devices according to the error intensity determined by the second error analysis unit.
また、前記第1のエラー分析部は、前記複数のメモリ装置のうち、内部で発生したエラーの個数が第1基準個数以上であるメモリ装置を第1のメモリ装置に区分し、前記第1のメモリ装置のうち、発生したエラーの種類が第2基準個数以上のワードラインで発生した第1のエラーである場合、対応する前記第1のメモリ装置を第1のエラー等級を有する第2のメモリ装置に区分し、前記第1のメモリ装置のうち、発生したエラーの種類が前記第1のエラーでない他の種類のエラーである場合、対応する前記第1のメモリ装置を第2のエラー等級を有する第3のメモリ装置に区分することができる。 Further, the first error analysis unit classifies the memory devices in which the number of errors generated internally is equal to or greater than the first reference number among the plurality of memory devices into the first memory device, and the first memory device is described. Among the memory devices, when the type of error generated is the first error generated in the word line of the second reference number or more, the corresponding first memory device is the second memory having the first error grade. When the first memory device is classified into devices and the type of error that has occurred is an error of another type other than the first error, the corresponding first memory device is given a second error grade. It can be classified into a third memory device having.
また、前記第1及び第2のエラー訂正部の各々は、前記複数のメモリ装置の各々から入出力されるデータに対するエラー訂正動作をエラー訂正コード(ECC、Error Correction Code)が含まれたコードワード(code word)単位で行い、前記第2のエラー分析部は、前記第2のメモリ装置のうち、発生したエラーの形態が第3基準個数以上のコードワード単位にまたがり(across)、含まれたエラー個数の合計が第4基準個数以上である場合、対応する前記第2のメモリ装置を第1のエラー強度を有する第4のメモリ装置に区分し、前記第2のメモリ装置のうち、発生したエラーの形態が、前記第3基準個数以上のコードワードにまたがり、含まれたエラー個数の合計が前記第4基準個数未満である場合、または前記第3基準個数未満のコードワードにまたがる場合、対応する前記第2のメモリ装置を第2のエラー強度を有する第5のメモリ装置に区分し、前記第3のメモリ装置に前記第2のエラー強度を付与して前記第5のメモリ装置に区分することができる。 Further, each of the first and second error correction units is a code word including an error correction code (ECC, Error Correction Code) for error correction operation for data input / output from each of the plurality of memory devices. This is performed in (code word) units, and the second error analysis unit includes the second memory device in which the form of the error that has occurred spans (aclosses) the code word units of the third reference number or more. When the total number of errors is equal to or greater than the fourth reference number, the corresponding second memory device is classified into the fourth memory device having the first error strength, and the second memory device is generated. When the form of the error spans the code words of the third reference number or more and the total number of errors included is less than the fourth reference number, or when the code words span the code words less than the third reference number. The second memory device is classified into a fifth memory device having a second error strength, and the third memory device is given the second error strength to be classified into the fifth memory device. be able to.
また、前記対応動作部は、前記第4のメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作と、前記第4のメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作と、前記第4のメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作とのうち、いずれか1つの動作を前記第4のメモリ装置の状態に応じて前記エラー対応動作として選択して行うことができる。 Further, the corresponding operation unit selects an area in which an error has occurred in the fourth memory device to block access, and selects an area in which an error has occurred in the fourth memory device to repair (repair). ) And the operation of selecting and disabling the area in which the error occurred in the fourth memory device, the operation of any one of the operations is performed according to the state of the fourth memory device. It can be selected and performed as an error handling operation.
また、前記ホストは、前記メモリシステムに電源が供給された時点から特定時間間隔毎に繰り返される時点を前記設定された時点として指定する動作と、前記メモリシステムに対するアクセス動作中にアクセスデータで発生したエラー個数をカウントして、第5基準個数を超過する度に、超過する時点を前記設定された時点として指定した後、エラー個数のカウントを初期化する動作と、前記メモリシステムに対するアクセス動作中にアクセスデータで発生したエラーを訂正するためのエラー訂正動作に特定時間以上かかる時点を前記設定された時点として指定する動作とのうち、少なくとも1つの動作を選択して行うことができる。 Further, the host generates an operation of designating a time point repeated at specific time intervals from the time when power is supplied to the memory system as the set time point, and an access data during an access operation to the memory system. The number of errors is counted, and each time the number of errors exceeds the fifth reference number, the time point at which the error number is exceeded is specified as the set time point, and then during the operation of initializing the count of the number of errors and the operation of accessing the memory system. At least one operation can be selected from the operation of designating the time point at which the error correction operation for correcting the error generated in the access data takes a specific time or more as the set time point.
本発明の実施形態に係るメモリシステムは、複数のワードライン及び複数のビットラインに複数のメモリセルがアレイ形態で接続された複数のセルアレイ領域及び第1のエラー訂正部を各々備え、前記複数のセルアレイ領域に対するアクセス動作中に発生したアクセスデータのエラーを前記第1のエラー訂正部が訂正し、前記第1のエラー訂正部のエラー訂正動作に対するログ(log)情報を生成する複数のメモリ装置と、第2のエラー訂正部を備え、前記複数のメモリ装置から伝達されたデータのエラーを前記第2のエラー訂正部が訂正し、前記第2のエラー訂正部のエラー訂正動作に対するエラー訂正情報を生成し、前記ログ情報及び前記エラー訂正情報を利用して前記複数のメモリ装置の各々に対してエラー強度を設定し、前記複数のメモリ装置の各々に対して前記エラー強度に対応するエラー対応動作を行うコントローラとを備えることができる。 The memory system according to the embodiment of the present invention includes a plurality of cell array regions in which a plurality of memory cells are connected in an array form to a plurality of word lines and a plurality of bit lines, and a first error correction section, respectively. With a plurality of memory devices, the first error correction unit corrects an error of access data generated during an access operation to the cell array area, and generates log information for the error correction operation of the first error correction unit. , The second error correction section is provided, and the error of the data transmitted from the plurality of memory devices is corrected by the second error correction section, and the error correction information for the error correction operation of the second error correction section is provided. Generate, use the log information and the error correction information to set an error strength for each of the plurality of memory devices, and perform an error handling operation corresponding to the error strength for each of the plurality of memory devices. It can be provided with a controller that performs the above.
また、前記複数のメモリ装置の各々は、読み出し/書き込み動作を含むアクセス動作の実行中、アクセスデータにエラーが発生する場合、発生したエラーを訂正するために、内部に含まれた前記第1のエラー訂正部を動作させ、前記第1のエラー訂正部によりエラーが訂正されたデータのローデータ(raw data)を内部の情報格納領域に累積、格納して前記ログ情報を生成し、前記コントローラの要請に応じて前記ログ情報を前記コントローラに出力することができる。 Further, when an error occurs in the access data during the execution of the access operation including the read / write operation, each of the plurality of memory devices includes the first one internally in order to correct the error. The error correction unit is operated, and the raw data (raw data) of the data whose error has been corrected by the first error correction unit is accumulated and stored in the internal information storage area to generate the log information, and the controller of the controller. The log information can be output to the controller upon request.
また、前記コントローラは、前記エラー訂正情報をリアルタイムまたは設定された時点で収集し、前記設定された時点で前記複数のメモリ装置の各々から前記ログ情報を収集するエラー収集部と、前記ログ情報及び前記エラー訂正情報を分析して、前記複数のメモリ装置の各々で発生したエラーの個数及び種類を確認し、確認結果に応じて前記複数のメモリ装置の各々に対するエラー等級を決定する第1のエラー分析部と、前記第1のエラー分析部で決定されたエラー等級によって前記複数のメモリ装置のうち、一部のメモリ装置に対しては、前記ログ情報及び前記エラー訂正情報の追加分析を介してエラーの形態及び個数を確認してエラー強度を決定し、残りのメモリ装置に対しては、前記第1のエラー分析部で決定されたエラー等級に対応するようにエラー強度を決定する第2のエラー分析部と、前記第2のエラー分析部で決定されたエラー強度によって前記複数のメモリ装置の各々に対して前記エラー対応動作を行う対応動作部とを備えることができる。 Further, the controller collects the error correction information in real time or at a set time, and collects the log information from each of the plurality of memory devices at the set time, and the log information and the log information. The first error that analyzes the error correction information, confirms the number and types of errors that have occurred in each of the plurality of memory devices, and determines the error grade for each of the plurality of memory devices according to the confirmation result. For some of the plurality of memory devices according to the error class determined by the analysis unit and the first error analysis unit, the log information and the error correction information are additionally analyzed. A second error strength is determined by confirming the form and number of errors, and for the remaining memory devices, the error intensity is determined so as to correspond to the error grade determined by the first error analysis unit. An error analysis unit and a response operation unit that performs the error response operation for each of the plurality of memory devices according to the error intensity determined by the second error analysis unit can be provided.
また、前記第1のエラー分析部は、前記複数のメモリ装置のうち、内部で発生したエラーの個数が第1基準個数以上であるメモリ装置を第1のメモリ装置に区分し、前記第1のメモリ装置のうち、発生したエラーの種類が第2基準個数以上のワードラインで発生した第1のエラーである場合、対応する前記第1のメモリ装置を第1のエラー等級を有する第2のメモリ装置に区分し、前記第1のメモリ装置のうち、発生したエラーの種類が前記第1のエラーでない他の種類のエラーである場合、対応する前記第1のメモリ装置を第2のエラー等級を有する第3のメモリ装置に区分することができる。 Further, the first error analysis unit classifies the memory devices in which the number of errors generated internally is equal to or greater than the first reference number among the plurality of memory devices into the first memory device, and the first memory device is described. Among the memory devices, when the type of error generated is the first error generated in the word line of the second reference number or more, the corresponding first memory device is the second memory having the first error grade. When the first memory device is classified into devices and the type of error that has occurred is an error of another type other than the first error, the corresponding first memory device is given a second error grade. It can be classified into a third memory device having.
また、前記第1及び第2のエラー訂正部の各々は、前記複数のメモリ装置の各々から入出力されるデータに対するエラー訂正動作をエラー訂正コード(ECC、Error Correction Code)が含まれたコードワード(code word)単位で行い、前記第2のエラー分析部は、前記第2のメモリ装置のうち、発生したエラーの形態が第3基準個数以上のコードワード単位にまたがり(across)、含まれたエラー個数の合計が第4基準個数以上である場合、対応する前記第2のメモリ装置を第1のエラー強度を有する第4のメモリ装置に区分し、前記第2のメモリ装置のうち、発生したエラーの形態が、前記第3基準個数以上のコードワードにまたがり、含まれたエラー個数の合計が前記第4基準個数未満である場合、または前記第3基準個数未満のコードワードにまたがる場合、対応する前記第2のメモリ装置を第2のエラー強度を有する第5のメモリ装置に区分し、前記第3のメモリ装置に前記第2のエラー強度を付与して前記第5のメモリ装置に区分することができる。 Further, each of the first and second error correction units is a code word including an error correction code (ECC, Error Correction Code) for error correction operation for data input / output from each of the plurality of memory devices. This is performed in (code word) units, and the second error analysis unit includes the second memory device in which the form of the error that has occurred spans (aclosses) the code word units of the third reference number or more. When the total number of errors is equal to or greater than the fourth reference number, the corresponding second memory device is classified into the fourth memory device having the first error strength, and the second memory device is generated. When the form of the error spans the code words of the third reference number or more and the total number of errors included is less than the fourth reference number, or when the code words span the code words less than the third reference number. The second memory device is classified into a fifth memory device having a second error strength, and the third memory device is given the second error strength to be classified into the fifth memory device. be able to.
また、前記対応動作部は、前記第4のメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作と、前記第4のメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作と、前記第4のメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作とのうち、いずれか1つの動作を前記第4のメモリ装置の状態に応じて前記エラー対応動作として選択して行うことができる。 Further, the corresponding operation unit selects an area in which an error has occurred in the fourth memory device to block access, and selects an area in which an error has occurred in the fourth memory device to repair (repair). ) And the operation of selecting and disabling the area in which the error occurred in the fourth memory device, the operation of any one of the operations is performed according to the state of the fourth memory device. It can be selected and performed as an error handling operation.
また、前記コントローラは、電源が供給された時点から特定時間間隔毎に繰り返される時点を前記設定された時点として指定する動作と、前記複数のメモリ装置に対するアクセス動作中にアクセスデータで発生したエラー個数をカウントして、第5基準個数を超過する度に、超過する時点を前記設定された時点として指定した後、エラー個数のカウントを初期化する動作と、前記複数のメモリ装置に対するアクセス動作中にアクセスデータで発生したエラーを訂正するためのエラー訂正動作に特定時間以上かかる時点を前記設定された時点として指定する動作とのうち、少なくとも1つの動作を選択して行うことができる。 Further, the controller specifies an operation of designating a time point repeated at specific time intervals from the time when power is supplied as the set time point, and the number of errors generated in the access data during the access operation to the plurality of memory devices. Is counted, and each time the fifth reference number is exceeded, the time when the number is exceeded is specified as the set time, and then during the operation of initializing the count of the number of errors and the operation of accessing the plurality of memory devices. At least one operation can be selected from the operation of designating the time point at which the error correction operation for correcting the error generated in the access data takes a specific time or more as the set time point.
また、本発明の実施形態に係るメモリシステムの動作方法は、複数のワードライン及び複数のビットラインに複数のメモリセルがアレイ形態で接続された複数のセルアレイ領域及びエラー訂正部を各々備える複数のメモリ装置を含むメモリシステムの動作方法において、前記複数のメモリ装置の各々に対するアクセス動作中に発生したアクセスデータのエラーを前記エラー訂正部が訂正し、前記エラー訂正部のエラー訂正動作に対するログ(log)情報を生成する生成ステップと、前記ログ情報を利用して前記複数のメモリ装置の各々に対するエラー等級を設定する分析ステップと、前記エラー等級によって前記複数のメモリ装置の各々に対してエラー対応動作を行う対応ステップとを含むことができる。 Further, the operation method of the memory system according to the embodiment of the present invention includes a plurality of cell array areas in which a plurality of memory cells are connected in an array form to a plurality of word lines and a plurality of bit lines, and a plurality of error correction sections. In the operation method of the memory system including the memory device, the error correction section corrects an error of access data generated during the access operation for each of the plurality of memory devices, and the log (log) for the error correction operation of the error correction section. ) A generation step for generating information, an analysis step for setting an error grade for each of the plurality of memory devices using the log information, and an error handling operation for each of the plurality of memory devices according to the error grade. Can include corresponding steps to perform.
また、前記生成ステップは、前記複数のメモリ装置の各々に対するアクセス動作の実行中、アクセスデータにエラーが発生する場合、発生したエラーを訂正するために前記エラー訂正部を動作させる動作ステップと、前記動作ステップで前記エラー訂正部によりエラーが訂正されたデータに対するローデータ(raw data)を前記複数のメモリ装置の各々に含まれた情報格納領域に累積、格納して前記ログ情報を生成するステップとを含むことができる。 Further, the generation step includes an operation step of operating the error correction unit in order to correct the error when an error occurs in the access data during the execution of the access operation for each of the plurality of memory devices. In the operation step, the raw data (raw data) for the data whose error has been corrected by the error correction unit is accumulated and stored in the information storage area included in each of the plurality of memory devices, and the log information is generated. Can be included.
また、前記分析ステップは、設定された時点毎に前記情報格納領域に格納された前記ログ情報を収集する収集ステップと、前記収集ステップで収集された前記ログ情報を分析して、前記複数のメモリ装置の各々で発生したエラーの個数及び種類を確認し、確認結果に応じて前記複数のメモリ装置の各々に対するエラー等級を決定するエラー分析ステップとを含むことができる。 In addition, the analysis step analyzes the collection step for collecting the log information stored in the information storage area at each set time point and the log information collected in the collection step, and analyzes the log information, and the plurality of memories. It can include an error analysis step of confirming the number and types of errors that have occurred in each of the devices and determining the error grade for each of the plurality of memory devices according to the confirmation result.
また、前記エラー分析ステップは、前記複数のメモリ装置のうち、内部で発生したエラーの個数が第1基準個数以上であるメモリ装置を第1のメモリ装置に区分するステップと、前記第1のメモリ装置のうち、発生したエラーの種類が第2基準個数以上のワードラインで発生した第1のエラーである場合、対応する前記第1のメモリ装置を第1のエラー等級を有する第2のメモリ装置に区分するステップと、前記第1のメモリ装置のうち、発生したエラーの種類が前記第1のエラーでない他の種類のエラーである場合、対応する前記第1のメモリ装置を第2のエラー等級を有する第3のメモリ装置に区分するステップとを含むことができる。 Further, the error analysis step includes a step of classifying a memory device in which the number of errors generated internally is equal to or greater than the first reference number among the plurality of memory devices into a first memory device, and the first memory. Among the devices, when the type of error that occurred is the first error that occurred in the word line equal to or greater than the second reference number, the corresponding first memory device is the second memory device having the first error grade. If the type of error that occurred is an error of another type other than the first error, the corresponding first memory device is classified into a second error grade. It can include a step of classifying into a third memory device having the above.
また、前記対応ステップは、前記第2のメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作と、前記第2のメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作と、前記第2のメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作とのうち、いずれか1つの動作を前記第2のメモリ装置の状態に応じて選択して前記エラー対応動作として行うことができる。 Further, in the corresponding step, an operation of selecting an area in which an error has occurred in the second memory device to block access and a repair in selecting an area in which an error has occurred in the second memory device are performed. One of the operation of performing the operation and the operation of selecting and disabling the area in which the error occurred in the second memory device is selected according to the state of the second memory device. This can be performed as the error handling operation.
また、電源が供給された時点から特定時間間隔毎に繰り返される時点を前記設定された時点として指定するステップと、前記複数のメモリ装置に対するアクセス動作中にアクセスデータで発生したエラー個数をカウントして、第5基準個数を超過する度に、超過する時点を前記設定された時点として指定した後、エラー個数のカウントを初期化するステップと、前記複数のメモリ装置に対するアクセス動作中にアクセスデータで発生したエラーを訂正するためのエラー訂正動作に特定時間以上かかる時点を前記設定された時点として指定するステップとのうち、少なくとも1つのステップをさらに含むことができる。 Further, the step of designating the time point repeated at specific time intervals from the time when the power is supplied as the set time point and the number of errors generated in the access data during the access operation to the plurality of memory devices are counted. , Each time the fifth reference number is exceeded, a step of initializing the count of the number of errors after designating the excess time point as the set time point, and an access data generated during the access operation to the plurality of memory devices. It is possible to further include at least one step among the steps of designating a time point at which a specific time or more is required for the error correction operation for correcting the error as the set time point.
本技術は、複数のメモリ装置を含むメモリシステムにおいて複数のメモリ装置の各々に対するアクセス動作中に発生したエラーのログ情報を生成した後、エラーのログ情報をエラーの個数と種類及び形態を基準に分析して複数のメモリ装置の各々に対してエラー強度を異なるように設定することで、複数のメモリ装置の各々に対してエラー対応動作を行うことができる。 This technology generates log information of errors that occur during access operation to each of a plurality of memory devices in a memory system including a plurality of memory devices, and then obtains error log information based on the number, type, and form of errors. By analyzing and setting the error strength to be different for each of the plurality of memory devices, it is possible to perform an error handling operation for each of the plurality of memory devices.
これにより、複数のメモリ装置のうち、深刻なエラーが発生する可能性の高いメモリ装置またはメモリ装置の特定領域を予め予測して、それに合うエラー対応動作を行うという効果がある。 This has the effect of predicting in advance a specific area of the memory device or the memory device in which a serious error is likely to occur among the plurality of memory devices, and performing an error handling operation corresponding to the prediction.
以下、添付された図面を参照して本発明の好ましい実施形態を説明する。しかし、本発明は、以下において開示される実施形態に限定されるものではなく、互いに異なる様々な形態で構成されることができ、ただし、本実施形態は、本発明の開示が完全なようにし、通常の知識を有する者に本発明の範疇を完全に知らせるために提供されるものである。 Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, and may be configured in various forms different from each other, provided that the present embodiment completes the disclosure of the present invention. , Provided to fully inform those with ordinary knowledge of the scope of the invention.
図1Aは、本発明の第1実施形態に係るデータ処理システムの構成を説明するために示した図である。 FIG. 1A is a diagram shown for explaining the configuration of the data processing system according to the first embodiment of the present invention.
図1Aに示すように、本発明の第1実施形態に係るデータ処理システムは、ホスト102及びメモリシステム110を備えることができる。ここで、メモリシステム110は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508を備えることができる。そして、ホスト102は、エラー収集部1021と、第1のエラー分析部1023と、第2のエラー分析部1024と、対応動作部1025と、ホストECC1026とを備えることができる。
As shown in FIG. 1A, the data processing system according to the first embodiment of the present invention can include a
そして、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、複数のメモリバンクBK<1:4>と、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)と、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8とを備えることができる。
Each of the plurality of
参考までに、図1Aに示された図面は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々がDRAMであることと仮定し、メモリ装置10が他の種類のメモリ装置である場合、詳細構成が変更され得る。具体的に、複数のメモリバンクBK<1:4>の各々には、複数のワードラインWL1、WL2、...、WLXと複数のビットラインBL1、BL2、BL3、...、BLYとにアレイ(Array)形態で接続された複数のメモリセル(CELL)を備えることができ、複数のメモリセルの各々は、少なくとも1ビットのデータを格納することができる。すなわち、複数のメモリバンクBK<1:4>の各々は、複数のメモリセルがアレイ形態で備えられた「セルアレイ領域」とみなすことができる。したがって、「複数のメモリバンク」という表現は、メモリ装置10がDRAMであることと仮定したことであって、他の種類のメモリ装置である場合、「複数のセルアレイ領域」という表現に代替され得るであろう。まとめると、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々の内部構成は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々の特性、メモリシステム110が使用される目的、あるいはホスト102で要求するメモリシステム110の仕様などによって設計変更されることができる。
For reference, the drawings shown in FIG. 1A assume that each of the plurality of
そして、メモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作、例えば、データの読み出し/書き込み動作を行う過程でエラーが発生して、内部に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)の動作を介してエラーが復旧される場合、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたデータに対するログ情報LOG_INFOを生成できる。すなわち、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作中、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたアクセス動作のエラーと関連したローデータ(raw data)を情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8に累積、格納してログ情報LOG_INFOを生成できる。このとき、ログ情報LOG_INFOに含まれるエラーと関連したローデータ(raw data)は、エラーの発生と関連して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で生成できる全てのデータを意味できる。すなわち、ログ情報LOG_INFOに含まれるエラーと関連したローデータは、エラーの発生時点と、発生位置と、発生形態と、種類、及び発生個数を表すデータでありうる。例えば、エラーが発生したデータのビット数、エラーが発生したデータの物理的な格納位置、絶対的なエラー発生時点、エラーが発生した物理的な領域の範囲、及び発生したエラーの種類等を表すデータでありうる。そして、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々にレジスタ(register)形態で含まれた格納空間でありうる。また、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に備えられた複数のバンクBK<1:4>のうち、少なくとも1つのバンクで少なくとも一部空間でありうる。
Then, each of the plurality of
そして、ホスト102は、次のような動作を介してメモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で発生したエラーと関連したローデータ(raw data)を収集できる。
Then, the
1番目の動作は、前述した説明のように、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス動作中、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたアクセス動作のエラーと関連したローデータがログ情報LOG_INFOとして情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8に累積されて格納されることができる。したがって、ホスト102は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々の情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8からログ情報LOG_INFOを収集できる。
The first operation is the memory ECC (ECC1, ECC2, ECC3, ECC4,) during the access operation for each of the plurality of
2番目の動作は、ホスト102は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス動作、例えば、データの読み出し動作中、内部に備えられたホストECC1026によりエラーが復旧されたアクセス動作のエラーと関連したローデータをエラー訂正情報ERR_CO_INFOとして生成して収集することができる。このとき、ホスト102に備えられたホストECC1026によりエラーが復旧されたアクセス動作の場合、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)でエラーを復旧できなかったアクセス動作であると仮定することができる。このとき、エラー訂正情報ERR_CO_INFOに含まれるエラーと関連したローデータは、エラーの発生と関連してホストECC1026で生成できる全てのデータを意味できる。すなわち、エラー訂正情報ERR_CO_INFOに含まれるエラーと関連したローデータは、エラーの発生時点と、発生位置と、発生形態と、種類、及び発生個数を表すデータでありうる。例えば、エラーが発生したデータのビット数、エラーが発生したデータの物理的な格納位置、絶対的なエラー発生時点、エラーが発生した物理的な領域の範囲、及び発生したエラーの種類等を表すデータでありうる。
In the second operation, the
ホスト102は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で発生したエラーの個数と種類及び形態を把握することが可能である。したがって、ホスト102は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOをエラーの個数と種類及び形態を基準に分析してメモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー強度を設定できる。また、ホスト102は、エラー強度によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー対応動作を行うことができる。
The
より具体的に、ホスト102に備えられたエラー収集部1021は、設定された時点で情報収集のためのコマンド(図示せず)をメモリシステム110に伝達した後、情報収集のためのコマンドに応答してメモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8から出力されるログ情報LOG_INFOを伝達されて収集することができる。また、エラー収集部1021は、ホストECC1026で生成されたエラー訂正情報ERR_CO_INFOをリアルタイムまたは設定された時点毎に収集することができる。
More specifically, the
ここで、ホスト102は、設定された時点を次のようないくつかの時点のうち、少なくとも1つ以上の時点を選択して指定することができる。
Here, the
1番目に、メモリシステム110に電源が供給された時点から特定時間間隔毎に繰り返される時点を設定された時点として指定することができる。
First, a time point that is repeated at specific time intervals from the time when power is supplied to the
2番目に、メモリシステム110に対するアクセス動作、すなわち、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508に対するアクセス動作中に発生したエラー個数をカウントし、カウント個数が予め決められた基準個数を超過する度に、超過する時点を設定された時点として指定することができる。このとき、設定された時点が指定される度にカウント個数は初期化されることができる。例えば、エラー個数のカウントは、ホストECC1026で行われることができる。
Second, the number of errors that occur during the access operation to the
3番目に、メモリシステム110に対するアクセス動作、すなわち、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508に対するアクセス動作中に発生したエラーを復旧するためのエラー復旧動作を行い、エラー復旧動作にかかった時間が特定時間以上かかる時点を設定された時点として指定することができる。このとき、エラー復旧動作にかかった時間が特定時間以上かかるとは、発生したエラーを復旧する過程でハミングコード(hamming code)を使用する相対的に簡単なエラー復旧動作が失敗して、リードソロモンコードを使用する相対的に複雑なエラー復旧動作が使用されたということを意味できる。例えば、エラー復旧動作は、ホストECC1026で行われることができる。
Third, the access operation to the
そして、エラー収集部1021は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOをホスト102内部の設定された空間に格納することができる。このとき、図面に示されたように、エラー収集部1021内部は、別の格納領域になることができる。また、ホスト102内部の設定された空間は、図面に直接図示されていないが、ホスト102内部に含まれてホスト102の動作メモリとして使用されるホストメモリの特定格納空間になることができる。そして、第1のエラー分析部1023は、エラー収集部1021で収集したログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で発生したエラーの個数及び種類を確認し、確認されたエラーの個数及び種類に応じて複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級を決定できる。このとき、第1のエラー分析部1023で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級に関連した情報は、ホスト102内部の設定された空間に格納されることができる。
Then, the
そして、第2のエラー分析部1024は、第1のエラー分析部1023で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、一部のメモリ装置を選択できる。また、第2のエラー分析部1024は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、選択された一部のメモリ装置に対しては、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOの追加分析を介してエラーの形態及び個数を確認してエラー強度を決定し、一部のメモリ装置を除いた残りのメモリ装置に対しては、第1のエラー分析部1023で決定されたエラー等級に対応するようにエラー強度を決定できる。このとき、第2のエラー分析部1024は、第1のエラー分析部1023で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー強度をホスト102内部の設定された空間で読み出すことができる。また、第2のエラー分析部1024で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級に関連した情報は、ホスト102内部の設定された空間に格納されることができる。
Then, the second
そして、対応動作部1025は、第2のエラー分析部1024で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー強度によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー対応動作を行うことができる。このとき、対応動作部1025は、第2のエラー分析部1024で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー強度をホスト102内部の設定された空間から読み出すことができる。
Then, the
そして、ホストECC1026は、メモリシステム110に格納するために生成したデータに対してエラー訂正エンコード(error correction encoding)動作を行ってエラー訂正コード(ECC、Error Correction Code)を生成できる。ホスト102は、メモリシステム110に格納するデータにエラー訂正コードを含めたコードワード(code word)単位のデータをメモリシステム110に伝達することができる。メモリシステム110は、ホスト102から入力されたコードワード単位のデータを複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508に格納することができる。また、ホストECC1026は、メモリシステム110から入力されたデータにエラーが発生したか否かを確認する動作及び入力されたデータにエラーが発生した場合、エラー訂正デコード(error correction decoding)、すなわち、エラー復旧動作を行ってエラー発生以前の正常データを復旧できる。このとき、ホスト102からメモリシステム110に伝達したデータがコードワード単位のデータであるから、メモリシステム110からホスト102に入力されたデータもコードワード単位のデータでありうる。したがって、ホストECC1026は、ホスト102に入力されたコードワード単位のデータに含まれたエラー訂正コードを使用してエラー復旧動作を行うことができる。このとき、ホストECC1026は、エラービット個数が訂正可能なエラービット限界値以上発生すれば、エラー復旧動作が失敗する可能性があり、エラーが発生したビットを訂正することができない。一方、ホストECC1026は、ハミングコード(hamming code)、LDPC(low density parity check)コード(code)、BCH(Bose、Chaudhri、Hocquenghem)コード、ターボコード(turbo code)、リード−ソロモンコード(Reed−Solomon code)、コンボリューションコード(convolution code)、RSC(recursive systematic code)、TCM(trellis−coded modulation)、BCM(Block coded modulation)などのコーデッドモジュレーション(coded modulation)を使用してエラー訂正を行うことができ、これに限定されるものではない。また、ホストECC1026は、エラー訂正のためのコード、回路、モジュール、システム、または装置を全て含むことができる。
Then, the
参考までに、ホスト102に備えられたホストECC1026と、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)とは、エラー訂正可能なデータのサイズ差を有することができる。例えば、ホストECC1026でエラー訂正可能なデータのサイズがメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)で訂正可能なデータのサイズよりさらに大きいことができる。また、前述した説明では、ホストECC1026とメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)とが共にエラー訂正動作を行うことができることと説明したことがあるが、これはあくまでも1つの実施形態であり、限定されるものではない。例えば、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)は、エラーの発生可否を確認する動作のみ行い、ホストECC1026は、エラーの発生可否確認動作及びエラー訂正動作を共に行う実施形態もいくらでも可能である。
For reference, the host ECC1026 provided in the
図1Bは、本発明の第2実施形態に係るデータ処理システムの構成を説明するために示した図である。 FIG. 1B is a diagram shown for explaining the configuration of the data processing system according to the second embodiment of the present invention.
図1Bに示すように、本発明の第2実施形態に係るデータ処理システムは、ホスト102及びメモリシステム110を備えることができる。ここで、メモリシステム110は、コントローラ130及び複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508を備えることができる。そして、コントローラ130は、エラー収集部1301と、第1のエラー分析部1303と、第2のエラー分析部1304と、対応動作部1305と、システムECC1306とを備えることができる。
As shown in FIG. 1B, the data processing system according to the second embodiment of the present invention can include a
そして、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、複数のメモリバンクBK<1:4>と、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)と、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8とを備えることができる。
Each of the plurality of
参考までに、図1Bに示された図面は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々がDRAMであることと仮定し、メモリ装置10が他の種類のメモリ装置である場合、詳細構成が変更され得る。具体的に、複数のメモリバンクBK<1:4>の各々には、複数のワードラインWL1、WL2、...、WLXと複数のビットラインBL1、BL2、BL3、...、BLYとにアレイ(Array)形態で接続された複数のメモリセル(CELL)を備えることができ、複数のメモリセルの各々は、少なくとも1ビットのデータを格納することができる。すなわち、複数のメモリバンクBK<1:4>の各々は、複数のメモリセルがアレイ形態で備えられた「セルアレイ領域」とみなすことができる。したがって、「複数のメモリバンク」という表現は、メモリ装置10がDRAMであることと仮定したことであり、他の種類のメモリ装置である場合、「複数のセルアレイ領域」という表現に代替され得るであろう。まとめると、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々の内部構成は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々の特性、メモリシステム110が使用される目的、あるいはホスト102で要求するメモリシステム110の仕様などによって設計変更されることができる。
For reference, the drawings shown in FIG. 1B assume that each of the plurality of
そして、メモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作、例えば、データの読み出し/書き込み動作を行う過程でエラーが発生して内部に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)の動作を介してエラーが復旧される場合、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたデータに対するログ情報LOG_INFOを生成できる。すなわち、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作中、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたアクセス動作のエラーと関連したローデータ(raw data)を情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8に累積、格納してログ情報LOG_INFOを生成できる。このとき、ログ情報LOG_INFOに含まれるエラーと関連したローデータ(raw data)は、エラーの発生と関連して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で生成できる全てのデータを意味できる。すなわち、ログ情報LOG_INFOに含まれるエラーと関連したローデータは、エラーの発生時点と、発生位置と、発生形態と、種類、及び発生個数を表すデータでありうる。例えば、エラーが発生したデータのビット数、エラーが発生したデータの物理的な格納位置、絶対的なエラー発生時点、エラーが発生した物理的な領域の範囲、及び発生したエラーの種類等を表すデータでありうる。そして、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々にレジスタ(register)形態で含まれた格納空間でありうる。また、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に備えられた複数のバンクBK<1:4>のうち、少なくとも1つのバンクで少なくとも一部空間でありうる。
Then, each of the plurality of
そして、コントローラ130は、次のような動作を介してメモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で発生したエラーと関連したローデータ(raw data)を収集できる。
Then, the
1番目の動作は、前述した説明のように、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス動作中、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたアクセス動作のエラーと関連したローデータがログ情報LOG_INFOとして情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8に累積されて格納されることができる。したがって、コントローラ130は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々の情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8からログ情報LOG_INFOを収集できる。
The first operation is the memory ECC (ECC1, ECC2, ECC3, ECC4,) during the access operation for each of the plurality of
2番目の動作は、コントローラ130は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス動作、例えば、データの読み出し動作中、内部に備えられたシステムECC1306によりエラーが復旧されたアクセス動作のエラーと関連したローデータをエラー訂正情報ERR_CO_INFOとして生成して収集することができる。このとき、コントローラ130に備えられたシステムECC1306によりエラーが復旧されたアクセス動作の場合、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)でエラーを復旧できなかったアクセス動作であると仮定することができる。このとき、エラー訂正情報ERR_CO_INFOに含まれるエラーと関連したローデータは、エラーの発生と関連してシステムECC1306で生成できる全てのデータを意味できる。すなわち、エラー訂正情報ERR_CO_INFOに含まれるエラーと関連したローデータは、エラーの発生時点と、発生位置と、発生形態と、種類、及び発生個数を表すデータでありうる。例えば、エラーが発生したデータのビット数、エラーが発生したデータの物理的な格納位置、絶対的なエラー発生時点、エラーが発生した物理的な領域の範囲、及び発生したエラーの種類等を表すデータでありうる。
In the second operation, the
コントローラ130は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で発生したエラーの個数と種類及び形態を把握することが可能である。したがって、コントローラ130は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOをエラーの個数と種類及び形態を基準に分析してメモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー強度を設定できる。また、コントローラ130は、エラー強度によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー対応動作を行うことができる。
The
より具体的に、コントローラ130に備えられたエラー収集部1301は、設定された時点で情報収集のためのコマンド(図示せず)をメモリシステム110に伝達した後、情報収集のためのコマンドに応答してメモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8から出力されるログ情報LOG_INFOを伝達されて収集することができる。また、エラー収集部1301は、システムECC1306で生成されたエラー訂正情報ERR_CO_INFOをリアルタイムまたは設定された時点毎に収集することができる。
More specifically, the
ここで、コントローラ130は、設定された時点を次のようないくつかの時点のうち、少なくとも1つ以上の時点を選択して指定することができる。
Here, the
1番目に、メモリシステム110に電源が供給された時点から特定時間間隔毎に繰り返される時点を設定された時点として指定することができる。
First, a time point that is repeated at specific time intervals from the time when power is supplied to the
2番目に、メモリシステム110に対するアクセス動作、すなわち、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508に対するアクセス動作中に発生したエラー個数をカウントし、カウント個数が予め決められた基準個数を超過する度に、超過する時点を設定された時点として指定することができる。このとき、設定された時点が指定される度に、カウント個数は初期化されることができる。例えば、エラー個数のカウントは、システムECC1306で行われることができる。
Second, the number of errors that occur during the access operation to the
3番目に、メモリシステム110に対するアクセス動作、すなわち、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508に対するアクセス動作中に発生したエラーを復旧するためのエラー復旧動作を行い、エラー復旧動作にかかった時間が特定時間以上かかる時点を設定された時点として指定することができる。このとき、エラー復旧動作にかかった時間が特定時間以上かかるとは、発生したエラーを復旧する過程でハミングコード(hamming code)を使用する相対的に簡単なエラー復旧動作が失敗して、リードソロモンコードを使用する相対的に複雑なエラー復旧動作が使用されたということを意味できる。例えば、エラー復旧動作は、システムECC1306で行われることができる。
Third, the access operation to the
そして、エラー収集部1301は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOをコントローラ130内部の設定された空間に格納することができる。このとき、図面に示されたように、エラー収集部1301内部は、別の格納領域になることができる。また、コントローラ130内部の設定された空間は、図面に直接図示されていないが、コントローラ130内部に含まれてメモリシステム110の動作メモリとして使用されるシステムメモリの特定格納空間になることができる。
Then, the
そして、第1のエラー分析部1303は、エラー収集部1301で収集したログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で発生したエラーの個数及び種類を確認し、確認されたエラーの個数及び種類に応じて複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級を決定できる。このとき、第1のエラー分析部1303で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級に関連した情報は、コントローラ130内部の設定された空間に格納されることができる。
Then, the first
そして、第2のエラー分析部1304は、第1のエラー分析部1303で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、一部のメモリ装置を選択できる。また、第2のエラー分析部1304は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、選択された一部のメモリ装置に対しては、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOの追加分析を介してエラーの形態及び個数を確認してエラー強度を決定し、一部のメモリ装置を除いた残りのメモリ装置に対しては、第1のエラー分析部1303で決定されたエラー等級に対応するようにエラー強度を決定できる。このとき、第2のエラー分析部1304は、第1のエラー分析部1303で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー強度をコントローラ130内部の設定された空間から読み出すことができる。また、第2のエラー分析部1304で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級に関連した情報は、コントローラ130内部の設定された空間に格納されることができる。
Then, the second
そして、対応動作部1305は、第2のエラー分析部1304で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー強度によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー対応動作を行うことができる。このとき、対応動作部1305は、第2のエラー分析部1304で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー強度をコントローラ130内部の設定された空間から読み出すことができる。
Then, the
そして、システムECC1306は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に格納するためのデータに対してエラー訂正エンコード(error correction encoding)動作を行ってエラー訂正コード(ECC、Error Correction Code)を生成できる。コントローラ130は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に格納するデータにエラー訂正コードを含めたコードワード(code word)単位のデータを複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に伝達することができる。複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、コントローラ130から入力されたコードワード単位のデータを格納することができる。また、システムECC1306は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々から読み出されたデータにエラーが発生したか否かを確認する動作及び読み出されたデータにエラーが発生した場合、エラー訂正デコード(error correction decoding)、すなわち、エラー復旧動作を行ってエラー発生以前の正常データを復旧できる。このとき、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に格納されたデータがコードワード単位のデータであるから、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々から読み出されたデータもコードワード単位のデータでありうる。したがって、システムECC1306は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々から読み出されたコードワード単位のデータに含まれたエラー訂正コードを使用してエラー復旧動作を行うことができる。このとき、システムECC1306は、エラービット個数が訂正可能なエラービット限界値以上発生すれば、エラー復旧動作に失敗する可能性があり、エラーが発生したビットを訂正することができない。一方、システムECC1306は、ハミングコード(hamming code)、LDPC(low density parity check)コード(code)、BCH(Bose、Chaudhri、Hocquenghem)コード、ターボコード(turbo code)、リード−ソロモンコード(Reed−Solomon code)、コンボリューションコード(convolution code)、RSC(recursive systematic code)、TCM(trellis−coded modulation)、BCM(Block coded modulation)などのコーデッドモジュレーション(coded modulation)を使用してエラー訂正を行うことができ、これに限定されるものではない。また、システムECC1306は、エラー訂正のためのコード、回路、モジュール、システム、または装置を全て含むことができる。
Then, the system ECC1306 performs an error correction encoding operation on the data to be stored in each of the plurality of
参考までに、コントローラ130に備えられたシステムECC1306と、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)とは、エラー訂正可能なデータのサイズ差を有することができる。例えば、システムECC1306でエラー訂正可能なデータのサイズがメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)で訂正可能なデータのサイズよりさらに大きいことができる。また、前述した説明では、システムECC1306とメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)とが共にエラー訂正動作を行うことができることと説明したことがあるが、これはあくまでも1つの実施形態であり、限定されるものではない。例えば、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)は、エラーの発生可否を確認する動作のみ行い、システムECC1306は、エラーの発生可否確認動作及びエラー訂正動作を共に行う実施形態もいくらでも可能である。
For reference, the system ECC1306 provided in the
図1Cは、本発明の第3実施形態に係るメモリシステムの構成を説明するために示した図である。 FIG. 1C is a diagram shown for explaining the configuration of the memory system according to the third embodiment of the present invention.
図1Cに示すように、本発明の第3実施形態に係るメモリシステム110は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508を備えることができる。そして、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、複数のメモリバンクBK<1:4>と、エラー収集部1511と、エラー分析部1513と、対応動作部1515と、メモリECC1516と、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8とを備えることができる。
As shown in FIG. 1C, the
参考までに、図1Cに示された図面は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々がDRAMであることと仮定し、メモリ装置10が他の種類のメモリ装置である場合、詳細構成が変更されることができる。具体的に、複数のメモリバンクBK<1:4>の各々には、複数のワードラインWL1、WL2、...、WLXと複数のビットラインBL1、BL2、BL3、...、BLYとにアレイ(Array)形態で接続された複数のメモリセル(CELL)を備えることができ、複数のメモリセルの各々は、少なくとも1ビットのデータを格納することができる。すなわち、複数のメモリバンクBK<1:4>の各々は、複数のメモリセルがアレイ形態で備えられた「セルアレイ領域」とみなすことができる。したがって、「複数のメモリバンク」という表現は、メモリ装置10がDRAMであることと仮定したことであり、他の種類のメモリ装置である場合、「複数のセルアレイ領域」という表現に代替され得るであろう。まとめると、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々の内部構成は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々の特性、メモリシステム110が使用される目的、あるいはメモリシステム110の仕様などによって設計変更されることができる。
For reference, the drawings shown in FIG. 1C assume that each of the plurality of
そして、メモリシステム110に備えられた複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作、例えば、複数のメモリバンクBK<1:4>の各々に対するデータの読み出し/書き込み動作を行う過程でエラーが発生して、内部に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)の動作を介してエラーが復旧される場合、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたデータに対するログ情報LOG_INFOを生成できる。すなわち、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作中、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたアクセス動作のエラーと関連したローデータ(raw data)を情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8に累積、格納してログ情報LOG_INFOを生成できる。このとき、ログ情報LOG_INFOに含まれるエラーと関連したローデータ(raw data)は、エラーの発生と関連して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で生成できる全てのデータを意味できる。すなわち、ログ情報LOG_INFOに含まれるエラーと関連したローデータは、エラーの発生時点と、発生位置と、発生形態と、種類、及び発生個数を表すデータでありうる。例えば、エラーが発生したデータのビット数、エラーが発生したデータの物理的な格納位置、絶対的なエラー発生時点、エラーが発生した物理的な領域の範囲、及び発生したエラーの種類等を表すデータでありうる。そして、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々にレジスタ(register)形態で含まれた格納空間でありうる。また、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に備えられた複数のバンクBK<1:4>のうち、少なくとも1つのバンクで少なくとも一部空間でありうる。
Then, each of the plurality of
具体的に、エラー収集部1511は、メモリECC1516で生成されて情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8に格納されたログ情報LOG_INFOをリアルタイムまたは設定された時点毎に収集することができる。
Specifically, the
ここで、エラー収集部1511は、設定された時点を次のようないくつかの時点のうち、少なくとも1つ以上の時点を選択して指定することができる。
Here, the
1番目に、メモリシステム110に電源が供給された時点から特定時間間隔毎に繰り返される時点を設定された時点として指定することができる。
First, a time point that is repeated at specific time intervals from the time when power is supplied to the
2番目に、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508に対するアクセス動作中に発生したエラー個数をカウントし、カウント個数が予め決められた基準個数を超過する度に、超過する時点を設定された時点として指定することができる。このとき、設定された時点が指定される度に、カウント個数は初期化されることができる。例えば、エラー個数のカウントは、メモリECC1516で行われることができる。
Second, the number of errors that occur during the access operation to the plurality of
3番目に、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508に対するアクセス動作中に発生したエラーを復旧するためのエラー復旧動作を行い、エラー復旧動作にかかった時間が特定時間以上かかる時点を設定された時点として指定することができる。このとき、エラー復旧動作にかかった時間が特定時間以上かかるとは、発生したエラーを復旧する過程でハミングコード(hamming code)を使用する相対的に簡単なエラー復旧動作が失敗して、リードソロモンコードを使用する相対的に複雑なエラー復旧動作が使用されたということを意味できる。例えば、エラー復旧動作は、メモリECC1516で行われることができる。
Third, an error recovery operation is performed to recover an error that occurred during an access operation to a plurality of
そして、エラー分析部1513は、エラー収集部1511で収集されたログ情報LOG_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で発生したエラーの個数と種類及び形態を把握することが可能である。具体的に、エラー分析部1513は、エラー収集部1511で収集したログ情報LOG_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々で発生したエラーの個数及び種類を確認し、確認されたエラーの個数及び種類に応じて複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級を決定できる。このとき、エラー分析部1513で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級に関連した情報は、情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8に格納されることができる。
Then, the
そして、対応動作部1515は、エラー分析部1513で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー対応動作を行うことができる。このとき、対応動作部1515は、エラー分析部1513で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級を情報格納領域PA1、PA2、PA3、PA4、PA5、PA6、PA7、PA8から読み出すことができる。
Then, the
そして、メモリECC1516は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に格納するためのデータに対してエラー訂正エンコード(error correction encoding)動作を行ってエラー訂正コード(ECC、Error Correction Code)を生成できる。メモリECC1516は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に格納するデータにエラー訂正コードを含めたコードワード(code word)単位のデータを複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508に格納することができる。また、メモリECC1516は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々から読み出されたデータにエラーが発生したか否かを確認する動作及び読み出されたデータにエラーが発生した場合、エラー訂正デコード(error correction decoding)、すなわち、エラー復旧動作を行ってエラー発生以前の正常データを復旧できる。このとき、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に格納されたデータがコードワード単位のデータであるから、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々から読み出されたデータもコードワード単位のデータでありうる。したがって、メモリECC1516は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々から読み出されたコードワード単位のデータに含まれたエラー訂正コードを使用してエラー復旧動作を行うことができる。このとき、メモリECC1516は、エラービット個数が訂正可能なエラービット限界値以上発生すれば、エラー復旧動作に失敗する可能性があり、エラーが発生したビットを訂正することができない。一方、メモリECC1516は、パリティコード(parity code)、ハミングコード(hamming code)、LDPC(low density parity check)コード(code)、BCH(Bose、Chaudhri、Hocquenghem)コード、ターボコード(turbo code)、リード−ソロモンコード(Reed−Solomon code)、コンボリューションコード(convolution code)、RSC(recursive systematic code)、TCM(trellis−coded modulation)、BCM(Block coded modulation)などのコーデッドモジュレーション(coded modulation)を使用してエラー訂正を行うことができ、これに限定されるものではない。また、メモリECC1516は、エラー訂正のためのコード、回路、モジュール、システム、または装置を全て含むことができる。
Then, the
図2〜図5Bは、本発明の実施形態に係るデータ処理システムのログ情報分析動作を説明するために示した図である。 2 to 5B are diagrams shown for explaining the log information analysis operation of the data processing system according to the embodiment of the present invention.
まず、図1A及び図2に示すように、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級がどのような方式で決定されるか分かることができる。
First, as shown in FIGS. 1A and 2, what is the error grade for each of the plurality of
具体的に、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作、例えば、データの読み出し/書き込み動作を行う過程でエラーが発生して、内部に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)の動作を介してエラーが復旧される場合、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたデータに対するログ情報LOG_INFOを生成できる。
Specifically, each of the plurality of
そして、ホスト102は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス動作、例えば、データの読み出し動作中、内部に備えられたホストECC1026の動作を介してエラーが復旧される場合、ホストECC1026によりエラーが復旧されたデータに対するエラー訂正情報ERR_CO_INFOを生成できる。
Then, the
そして、ホスト102は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを収集して分析することができる。すなわち、ホスト102は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級及びエラー強度を決定できる。
Then, the
参考までに、図面に具体的に図示されていないが、メモリシステム110は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508とホスト102との間で信号を伝達するためのホストインターフェース(図示せず)をさらに備えることができる。すなわち、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、内部で生成されたログ情報LOG_INFOをホストインターフェースを介してホスト102に出力することができる。
For reference, although not specifically illustrated in the drawings, the
同様に、図面に具体的に図示されていないが、ホスト102は、メモリシステム110とホスト102内部の他の構成要素1021、1023、1024、1025、1026との間で信号を伝達するためのメモリインターフェース(図示せず)をさらに備えることができる。すなわち、ホスト102は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508がメモリシステム110を介して出力したログ情報LOG_INFOをメモリインターフェースを介して伝達されることができる。
Similarly, although not specifically illustrated in the drawings, the
一方、ホスト102に備えられた第1のエラー分析部1023は、エラー収集部1021で収集されたログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、エラー発生個数が第1基準個数以上であるメモリ装置を確認し、該当するメモリ装置を「第1のメモリ装置」に区分することができる(S10)。
On the other hand, the first
例えば、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、1番目のメモリ装置1501に対するアクセス過程でメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)またはホストECC1026により復旧されたエラーの個数が12個であり、残りのメモリ装置1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス過程でメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)またはホストECC1026により各々復旧されたエラーの個数が10個未満であると仮定することができる。そして、第1基準個数は、10個であると仮定することができる。このような場合、第1のエラー分析部1023は、1番目のメモリ装置1501を「第1のメモリ装置」に区分し、残りのメモリ装置1502、1503、1504、1505、1506、1507、1508の各々に対してはエラー等級を決定しないことができる。
For example, among a plurality of
具体的に、第1のエラー分析部1023は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して、「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類を確認することができる(S10のYES)。このとき、第1のエラー分析部1023は、「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類をワードライン単位で発生したエラー(S20)と、シングルビット単位で発生したエラー(S30)と、ビットライン単位で発生したエラー(S40)と、その他のエラー(S50)とに区分することができる。
Specifically, the first
ここで、ワードライン単位で発生したエラー(S20)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが同じバンク内の同じワードラインで発生する場合を意味できる。そして、シングルビット単位で発生したエラー(S30)が意味することは、同じワード、同じビットラインで1個以下のエラーが発生した場合を意味できる。そして、ビットライン単位で発生したエラー(S40)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが同じビットラインで発生する場合を意味できる。そして、その他のエラー(S50)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが特定の分布を有さない場合、例えば、ワードライン単位と、シングルビット単位と、ビットライン単位とで発生したことと判断されない場合を意味できる。 Here, the error (S20) generated in word line units means that at least two or more errors generated in the memory device classified as the "first memory device" are in the same word line in the same bank. It can mean when it occurs. And, the meaning of the error (S30) generated in a single bit unit can mean the case where one or less errors occur in the same word and the same bit line. The error (S40) that occurs in bit line units means that at least two or more errors that occur in the memory device classified as the "first memory device" occur in the same bit line. can. Then, the other error (S50) means that at least two or more errors generated in the memory device classified as the "first memory device" do not have a specific distribution, for example, a word line. It can mean a case where it is not determined that the occurrence occurs in units, single bit units, and bit line units.
そして、第1のエラー分析部1023において「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類を確認した結果、ワードライン単位で発生したエラー(S20)である場合、「第1のメモリ装置」に区分されたメモリ装置で同じワードラインで発生したエラーの個数をカウントすることができる(S60)。カウント結果、エラーの個数が第2基準個数以上である場合(S70のYES)、当該メモリ装置を第1のエラー等級と決定して「第2のメモリ装置」に区分することができる(S90)。カウント結果、エラーの個数が第2基準個数未満である場合(S70のNO)、当該メモリ装置を第2のエラー等級と決定して「第3のメモリ装置」に区分することができる(S80)。
Then, as a result of confirming the type of the error generated in the memory device classified into the "first memory device" by the first
そして、第1のエラー分析部1023において「第1のメモリ装置」に区分されたメモリ装置1501で発生したエラーの種類を確認した結果、シングルビット単位で発生したエラー(S30のYES)と、ビットライン単位で発生したエラー(S40のYES)と、その他のエラー(S50のYES)とのみ存在するメモリ装置の場合、当該メモリ装置を第2のエラー等級と決定して「第3のメモリ装置」に区分することができる(S80)。
Then, as a result of confirming the type of the error that occurred in the
例を挙げてまとめると、「第1のメモリ装置」に区分された1番目のメモリ装置1501で発生したエラーがワードライン単位で発生したエラーであり、同じワードラインで発生したエラーの個数が第2基準個数以上であることと仮定することができる。したがって、第1のエラー分析部1023は、「第1のメモリ装置」に区分された1番目のメモリ装置1501を第1のエラー等級と決定して「第2のメモリ装置」に区分することができる。
To summarize by giving an example, the error that occurred in the
図1Aと図2及び図3に示すように、ホスト102に含まれた第2のエラー分析部1024は、第1のエラー分析部1023で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、一部のメモリ装置を選択できる。また、第2のエラー分析部1024は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、選択された一部のメモリ装置に対しては、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOの追加分析を介してエラーの形態及び個数を確認してエラー強度を決定し、一部のメモリ装置を除いた残りのメモリ装置に対しては、第1のエラー分析部1023で決定されたエラー等級に対応するようにエラー強度を決定できる。
As shown in FIGS. 1A, 2 and 3, the second
具体的に、第1のエラー分析部1023は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508をエラー等級が決定されなかったメモリ装置と、第1のエラー等級と決定された「第2のメモリ装置」と、第2のエラー等級と決定された「第3のメモリ装置」とに区分したことがある。
Specifically, the first
そして、第2のエラー分析部1024は、第1のエラー分析部1023で決定されたエラー等級が第1のエラー等級であるか否かを確認(K10)できる。
Then, the second
K10動作の確認結果、第2のエラー分析部1024は、第1のエラー分析部1023で第1のエラー等級と決定されなかったメモリ装置の場合(K10のNO)、すなわち、エラー等級が決定されなかったメモリ装置及び第2のエラー等級と決定された「第3のメモリ装置」に対して第2のエラー強度を付加して「第5のメモリ装置」に区分することができる(K70)。このとき、第2のエラー強度が付加されて「第5のメモリ装置」に区分されたメモリ装置に対しては、対応動作部1025で第2のエラー対応動作を行うことができる(K80)。
As a result of confirming the operation of K10, the second
K10動作の確認結果、第2のエラー分析部1024は、第1のエラー分析部1023で第1のエラー等級と決定されたメモリ装置の場合(K10のYES)、すなわち、第1のエラー等級と決定された「第2のメモリ装置」の場合、追加にログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析してエラーの形態及び個数を確認した後、エラー強度を決定できる。具体的に、第2のエラー分析部1024は、第1のエラー等級と決定された「第2のメモリ装置」に対するログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを追加に分析して「第2のメモリ装置」で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがって(across)いるか否かを確認できる(K30)。
As a result of confirming the operation of K10, the second
ここで、コードワード単位に「またがって(across)」いるエラーを確認する動作がいかなる意味を有するかを説明するために、図4〜図5Bを参照すれば、次のとおりである。 Here, with reference to FIGS. 4 to 5B, it is as follows in order to explain what the operation of confirming the error "accross" in codeword units has.
まず、図4に示すように、コードワード単位の基本的な意味は、ホスト102に備えられたホストECC1026でエラーを訂正する動作を行うとき、動作の基準になるデータの量を表す単位を意味できる。例えば、ホスト102でメモリシステム110に格納するために、512ビットのデータを生成した場合(401)、ホストECC1026は、512ビットのデータに対してエラー訂正エンコード動作(402)を行って64ビットのエラー訂正コードを生成(403)できる。このとき、ホスト102は、内部で生成された512ビットのデータと64ビットのエラー訂正コードとを合わせた合計572ビットのデータを2個のコードワード単位に分けて管理(404)することができる。すなわち、1つのコードワード単位には、ホスト102内部で生成された256ビットのデータと32ビットのエラー訂正コードとを合わせた288ビットのデータが含まれ得る。ホスト102は、572ビットのデータをメモリシステム110に出力することができる(405)。参考までに、図面では、572ビットのデータを2個のコードワード単位に管理することを例示したが、実際には、より少ない個数のコードワード単位に管理するか、さらに多くの個数のコードワード単位に管理することもいくらでも可能である。
First, as shown in FIG. 4, the basic meaning of the code word unit means a unit representing the amount of data that serves as a reference for the operation when the host ECC1026 provided in the
そして、図4においてメモリシステム110は、図1の実施形態とは異なり、合計18個のメモリ装置(18 devices)を含むことと仮定させる。このとき、メモリシステム110は、ホスト102から入力された572ビットのデータ(405)を18個のメモリ装置(18 devices)に分散させて格納することができる。したがって、18個のメモリ装置(18 devices)の各々に32ビットのデータが格納され得る。また、メモリシステム110は、ホスト102で572ビットを2個のコードワード単位に分けて管理することによって18個のメモリ装置(18 devices)の各々に2個のコードワード単位に対応するデータを格納することができる。したがって、18個のメモリ装置(18 devices)の各々に1番目のコードワード単位(Codeword0)に対応する16ビットのデータと2番目のコードワード単位(Codeword1)に対応する16ビットのデータとが格納され得る。すなわち、メモリシステム110は、1番目のコードワード単位(Codeword0)に対応する288ビットのデータ及び2番目のコードワード単位(Codeword1)に対応する288ビットのデータを18個のメモリ装置(18 devices)に分散させて格納することができる。
Then, in FIG. 4, unlike the embodiment of FIG. 1, it is assumed that the
そして、メモリシステム110は、ホスト102から入力された572ビットのデータを18個のメモリ装置(18 devices)の各々に格納するとき、572ビットのデータが連続したデータであるということを認識して、バーストランス(Burst Length、BL)を設定して格納することができる。このとき、18個のメモリ装置(18 devices)の各々が4個のデータ入出力端(×4)を有することと仮定することができる。したがって、メモリシステム110は、1番目のコードワード単位(Codeword0)に対応する288ビットのデータを18個のメモリ装置(18 devices)に上位バーストランス4(BL4)と指定して16ビットずつ格納し、2番目のコードワード単位(Codeword1)に対応する288ビットのデータを18個のメモリ装置(18 devices)に下位バーストランス4(BL4)と指定して16ビットずつ格納することができる。
Then, when the
図4を参照して説明した内容のように、ホスト102は、少なくとも1つ以上のコードワード単位で管理されるデータをメモリシステム110に出力することができる。また、メモリシステム110は、ホスト102から入力されたデータをコードワード単位に対応する形態で複数のメモリ装置に分散させて格納することができる。
As described with reference to FIG. 4, the
図5Aに示すように、図4において説明したように、1個のメモリ装置(Device)に32ビットのデータが2個のコードワード単位(Codeword0、Codeword1)の各々に対応する16ビットずつのデータに分けられた後、4個のデータ入出力端(×4、DQ<0:3>)に読み出されることが分かる。このとき、図面では、特定データ入出力端、例えば、1番及び3番のデータ入出力端DQ<1、3>を介して読み出されたデータにエラービット(ERROR BIT)が発生したことをわかることができる。すなわち、エラーの発生原因まで図面に含まれてはいないが、特定データ入出力端に読み出されたデータにエラーが発生したことにより、エラービット(ERROR BIT)が2個のコードワード単位(Codeword0、Codeword1)にまたがっている状態(across)になることが分かる。 As shown in FIG. 5A, as described in FIG. 4, 32-bit data in one memory device (Device) is 16-bit data corresponding to each of two codeword units (Codeword0, Codeword1). After being divided into, it can be seen that the data is read out at four data input / output ends (x4, DQ <0: 3>). At this time, in the drawing, it is shown that an error bit (ERROR BIT) has occurred in the data read through the specific data input / output ends, for example, the data input / output ends DQ <1, 3> of Nos. 1 and 3. I can understand. That is, although the cause of the error is not included in the drawing, the error bit (ERROR BIT) is two codeword units (Codeword0) due to the error occurring in the data read at the specific data input / output end. , Codeword1), it can be seen that the state (errors) is straddled.
図5Bに示すように、図5Aと同様に、1個のメモリ装置(Device)に32ビットのデータが2個のコードワード単位(Codeword0、Codeword1)の各々に対応する16ビットずつのデータに分けられた後、4個のデータ入出力端(×4、DQ<0:3>)に読み出されることが分かる。このとき、図面では、1番目のコードワード単位(Codeword0)に含まれた読み出しデータにはエラービット(ERROR BIT)が発生するが、2番目のコードワード単位(Codeword1)に含まれた読み出しデータではエラーが発生しなかったことをわかることができる。すなわち、エラーの発生原因まで図面に含まれてはいないが、エラービット(ERROR BIT)は、1個のコードワード単位(Codeword0)にのみ含まれ、2個のコードワード単位(Codeword0、Codeword1)にまたがっている状態(across)でないことが分かる。 As shown in FIG. 5B, similarly to FIG. 5A, 32-bit data is divided into 16-bit data corresponding to each of two codeword units (Codeword0, Codeword1) in one memory device (Device). It can be seen that the data is read to the four data input / output terminals (x4, DQ <0: 3>). At this time, in the drawing, an error bit (ERROR BIT) is generated in the read data included in the first codeword unit (Codeword0), but in the read data included in the second codeword unit (Codeword1). It can be seen that no error occurred. That is, although the cause of the error is not included in the drawing, the error bit (ERROR BIT) is included in only one codeword unit (Codeword0) and in two codeword units (Codeword0, Codeword1). It can be seen that it is not in a straddling state (acloss).
さらに、図1Aと図2及び図3に示すように、第2のエラー分析部1024で第1のエラー等級と決定された「第2のメモリ装置」に対するログ情報LOG_INFOを追加に分析して「第2のメモリ装置」で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがって(across)いるか否かを確認する動作(K30)は、第3基準個数を2個であると仮定するとき、「第2のメモリ装置」で発生したエラーの形態が図5Aにおいて例示したように、2個のコードワード単位にまたがった形態であるか、それとも、図5Bにおいて例示したように、1個のコードワード単位にのみ含まれた形態であるかを確認する動作でありうる。
Further, as shown in FIGS. 1A, 2 and 3, the log information LOG_INFO for the "second memory device" determined to be the first error grade by the second
K30動作の確認結果、「第2のメモリ装置」で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがった形態である場合(K30のYES)、第2のエラー分析部1024は、第3基準個数以上のコードワードにまたがったエラー個数の合計が第4基準個数以上であるか否かを確認できる(K40)。例えば、第4基準個数を8個であると仮定するとき、図5Aにおいて例示したように、2個のコードワード単位(Codeword0、Codeword1)にまたがったエラービットの合計が16個であるから、8個である第4基準個数でありうる。
As a result of confirming the operation of K30, when the form of the error generated in the "second memory device" is a form straddling the codeword unit of the third reference number or more (YES of K30), the second
K40動作の確認結果、「第2のメモリ装置」で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがった形態(K30のYES)であり、第3基準個数以上のコードワードにまたがったエラー個数の合計が第4基準個数以上である場合(K40のYES)、第2のエラー分析部1024は、該当する「第2のメモリ装置」に対して第1のエラー強度を付加して「第4のメモリ装置」に区分することができる(K50)。このとき、第1のエラー強度が付加されて「第4のメモリ装置」に区分されるメモリ装置に対しては、対応動作部1025で第1のエラー対応動作を行うことができる(K60)。
As a result of confirming the operation of K40, the form of the error generated in the "second memory device" is a form that straddles the codeword unit of the third reference number or more (YES of K30), and the codeword has the codeword of the third reference number or more. When the total number of straddled errors is equal to or greater than the fourth reference number (YES in K40), the second
K30動作の確認結果、「第2のメモリ装置」で発生したエラーの形態が第3基準個数未満のコードワード単位にのみ含まれた形態である場合(K30のNO)、第2のエラー分析部1024は、該当する「第2のメモリ装置」に対して第2のエラー強度を付加して「第5のメモリ装置」に区分することができる(K70)。このとき、第2のエラー強度が付加されて「第5のメモリ装置」に区分されるメモリ装置に対しては、対応動作部1025で第2のエラー対応動作を行うことができる(K80)。
As a result of confirming the operation of K30, when the form of the error generated in the "second memory device" is included only in the codeword unit less than the third reference number (NO of K30), the second error analysis unit. 1024 can be classified as a "fifth memory device" by adding a second error strength to the corresponding "second memory device" (K70). At this time, for the memory device to which the second error strength is added and classified as the "fifth memory device", the
第2のエラー分析部1024の動作を例を挙げて説明すれば、次のとおりである。
The operation of the second
まず、図2において例を挙げて説明したように、第1のエラー分析部1023は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、1番目のメモリ装置1501を第1のエラー等級と決定して「第2のメモリ装置」に区分し、残りのメモリ装置1502、1503、1504、1505、1506、1507、1508に対してはエラー等級を決定しなかったし、第2のエラー等級と決定されて「第3のメモリ装置」に区分されたメモリ装置はないことと仮定したことがある。
First, as described with reference to FIG. 2, the first
このとき、第2のエラー分析部1024は、第1のエラー分析部1023で第1のエラー等級と決定されなかったメモリ装置の場合(K10のNO)、すなわち、エラー等級が決定されなかったメモリ装置及び第2のエラー等級と決定された「第3のメモリ装置」に対して第2のエラー強度を付加して「第5のメモリ装置」に区分することができる(K70)。したがって、第2のエラー分析部1024は、エラー等級が決定されなかった残りのメモリ装置1502、1503、1504、1505、1506、1507、1508に対して第2のエラー強度を付加して「第5のメモリ装置」に区分することができる(K70)。
At this time, the second
そして、第2のエラー分析部1024は、第1のエラー分析部1023で第1のエラー等級と決定されたメモリ装置の場合(K10のYES)、すなわち、第1のエラー等級と決定された「第2のメモリ装置」の場合、追加にログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析してエラーの形態及び個数を確認した後、エラー強度を決定できる。したがって、第2のエラー分析部1024は、第1のエラー等級と決定されて「第2のメモリ装置」に区分された1番目のメモリ装置1501に対して追加にログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析してエラーの形態及び個数を確認した後、エラー強度を決定できる。
Then, the second
具体的に、第2のエラー分析部1024は、1番目のメモリ装置1501に対して追加にログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析してエラーの形態が第3基準個数以上のコードワード単位にまたがっているか否かを確認できる(K30)。その結果、1番目のメモリ装置1501で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがっていることと仮定することができる(K30のYES)。したがって、第2のエラー分析部1024は、1番目のメモリ装置1501で第3基準個数以上のコードワード単位にまたがっているエラーに含まれたエラービット個数の合計が第4基準個数以上であるか否かを確認できる(K40)。確認結果、1番目のメモリ装置1501で第3基準個数以上のコードワード単位にまたがっているエラーの個数が第4基準個数以上であることと仮定することができる(K40のYES)。したがって、第2のエラー分析部1023は、1番目のメモリ装置1501に対して第1のエラー強度を付加して「第4のメモリ装置」に区分することができる(K60)。
Specifically, the second
一方、ホスト102に含まれた対応動作部1025は、第2のエラー分析部1024で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー強度によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー対応動作を行うことができる。
On the other hand, the
具体的に、対応動作部1025は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、第2のエラー分析部1024で第1のエラー強度を付加して「第4のメモリ装置」に区分されたメモリ装置に対して第1のエラー対応動作を行うことができる。また、対応動作部1025は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、第2のエラー分析部1024で第2のエラー強度を付加して「第5のメモリ装置」に区分されたメモリ装置に対して第2のエラー対応動作を行うことができる。
Specifically, the
ここで、第1のエラー対応動作は、次のような動作のうち、少なくともいずれか1つの動作を含むことができる。 Here, the first error handling operation can include at least one of the following operations.
1番目の動作は、「第4のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作である。例えば、対応動作部1025は、「第4のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインを選択してアクセスを遮断できる。このとき、対応動作部1025は、アクセス遮断対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを複写して「他の領域」に格納した後、アクセス遮断動作を行うことができる。このとき、「他の領域」は、1番目のメモリ装置1501の他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。また、「他の領域」は、1番目のメモリ装置1501でない他のメモリ装置1502、1503、1504、1505、1506、1507、1508に含まれた他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。参考までに、アクセス遮断対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを「他の領域」に格納する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してアクセス遮断動作対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The first operation is an operation of blocking access by selecting an area in which an error has occurred in the memory device classified into the "fourth memory device". For example, the
2番目の動作は、「第4のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作である。例えば、対応動作部1025は、「第4のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインを他の正常なリダンダンシーブロックまたはリダンダンシーワードラインまたはリダンダンシービットラインでリペアすることができる。このとき、ホスト102は、リペア対象になる1番目のメモリ装置1501でリペア動作が完了するまで1番目のメモリ装置1501に対するアクセスが中断されるようにすることができる。そして、リペア対象になる1番目のメモリ装置1501は、リペア対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを内部の情報格納領域PA1に複写した後、リペア動作を行うことができる。リペア動作が完了した後、1番目のメモリ装置1501は、情報格納領域PA1に複写されたデータをリペア完了したリダンダンシーブロックまたはリダンダンシーワードラインまたはリダンダンシービットラインに復旧することができる。参考までに、リペア対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを内部の情報格納領域PA1に複写する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してリペア対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The second operation is an operation of selecting and repairing an area in which an error has occurred in the memory device classified into the "fourth memory device". For example, the
3番目の動作は、「第4のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作である。例えば、対応動作部1025は、「第4のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインをディセーブルさせることができる。このとき、ディセーブル対象になる1番目のメモリ装置1501は、ディセーブル対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを複写して「他の領域」に格納することができ、データが「他の領域」へ移動したことをホスト102に通知することができる。このとき、「他の領域」は、1番目のメモリ装置1501の他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。また、「他の領域」は、1番目のメモリ装置1501でない他のメモリ装置1502、1503、1504、1505、1506、1507、1508に含まれた他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。参考までに、ディセーブル対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを内部の「他の領域」に格納する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してディセーブル対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The third operation is an operation of selecting and disabling an area in which an error has occurred in the memory device classified into the "fourth memory device". For example, the
そして、第2のエラー対応動作は、「第5のメモリ装置」に区分されたメモリ装置に対するアクセス動作中にエラーが発生する場合、ホストECC1026を介してエラーが発生したコードワード単位のデータに対してエラー訂正コードを使用したエラー復旧動作を含むことができる。 Then, in the second error handling operation, when an error occurs during the access operation to the memory device classified into the "fifth memory device", the data in codeword units where the error occurs via the host ECC1026 It can include error recovery operations using error correction codes.
そして、図1B及び図2に示すように、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級がどのような方式で決定されるか分かることができる。
Then, as shown in FIGS. 1B and 2, what is the error grade for each of the plurality of
具体的に、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作、例えば、データの読み出し/書き込み動作を行う過程でエラーが発生して内部に備えられたメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)の動作を介してエラーが復旧される場合、メモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)によりエラーが復旧されたデータに対するログ情報LOG_INFOを生成できる。
Specifically, each of the plurality of
そして、コントローラ130は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス動作、例えば、データの読み出し動作中、内部に備えられたシステムECC1306によりエラーが復旧される場合、システムECC1306によりエラーが復旧されたデータに対するエラー訂正情報ERR_CO_INFOを生成できる。
Then, the
そして、コントローラ130は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを収集して分析することができる。すなわち、コントローラ130は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級及びエラー強度を決定できる。
Then, the
一方、コントローラ130に備えられた第1のエラー分析部1303は、エラー収集部1301で収集されたログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、エラー発生個数が第1基準個数以上であるメモリ装置を確認し、該当するメモリ装置を「第1のメモリ装置」に区分することができる(S10)。
On the other hand, the first
例えば、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、1番目のメモリ装置1501に対するアクセス過程でメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)またはシステムECC1306により復旧されたエラーの個数が12個であり、残りのメモリ装置1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス過程でメモリECC(ECC1、ECC2、ECC3、ECC4、ECC5、ECC6、ECC7、ECC8)またはシステムECC1306により各々復旧されたエラーの個数が10個未満であると仮定することができる。そして、第1基準個数は、10個であると仮定することができる。このような場合、第1のエラー分析部1303は、1番目のメモリ装置1501を「第1のメモリ装置」に区分し、残りのメモリ装置1502、1503、1504、1505、1506、1507、1508の各々に対してはエラー等級を決定しないことができる。
For example, among a plurality of
具体的に、第1のエラー分析部1303は、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析して「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類を確認することができる(S10のYES)。このとき、第1のエラー分析部1303は、「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類をワードライン単位で発生したエラー(S20)と、シングルビット単位で発生したエラー(S30)と、ビットライン単位で発生したエラー(S40)と、その他のエラー(S50)とに区分することができる。
Specifically, the first
ここで、ワードライン単位で発生したエラー(S20)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが同じバンク内の同じワードラインで発生する場合を意味できる。そして、シングルビット単位で発生したエラー(S30)が意味することは、同じワード、同じビットラインで1個以下のエラーが発生した場合を意味できる。そして、ビットライン単位で発生したエラー(S40)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが同じビットラインで発生する場合を意味できる。そして、その他のエラー(S50)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが特定の分布を有さない場合、例えば、ワードライン単位と、シングルビット単位と、ビットライン単位とで発生したことと判断されない場合を意味できる。 Here, the error (S20) generated in word line units means that at least two or more errors generated in the memory device classified as the "first memory device" are in the same word line in the same bank. It can mean when it occurs. And, the meaning of the error (S30) generated in a single bit unit can mean the case where one or less errors occur in the same word and the same bit line. The error (S40) that occurs in bit line units means that at least two or more errors that occur in the memory device classified as the "first memory device" occur in the same bit line. can. Then, the other error (S50) means that at least two or more errors generated in the memory device classified as the "first memory device" do not have a specific distribution, for example, a word line. It can mean a case where it is not determined that the occurrence occurs in units, single bit units, and bit line units.
そして、第1のエラー分析部1303で「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類を確認した結果、ワードライン単位で発生したエラー(S20)である場合、「第1のメモリ装置」に区分されたメモリ装置で同じワードラインで発生したエラーの個数をカウントすることができる(S60)。カウント結果、エラーの個数が第2基準個数以上である場合(S70のYES)、当該メモリ装置を第1のエラー等級と決定して「第2のメモリ装置」に区分することができる(S90)。カウント結果、エラーの個数が第2基準個数未満である場合(S70のNO)、当該メモリ装置を第2のエラー等級と決定して「第3のメモリ装置」に区分することができる(S80)。
Then, as a result of confirming the type of the error that occurred in the memory device classified into the "first memory device" by the first
そして、第1のエラー分析部1303において「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類を確認した結果、シングルビット単位で発生したエラー(S30のYES)と、ビットライン単位で発生したエラー(S40のYES)と、その他のエラー(S50のYES)とのみ存在するメモリ装置の場合、当該メモリ装置を第2のエラー等級と決定して「第3のメモリ装置」に区分することができる(S80)。
Then, as a result of confirming the types of errors that occurred in the memory devices classified into the "first memory device" in the first
例を挙げてまとめると、「第1のメモリ装置」に区分された1番目のメモリ装置1501で発生したエラーがワードライン単位で発生したエラーであり、同じワードラインで発生したエラーの個数が第2基準個数以上であることと仮定することができる。したがって、第1のエラー分析部1303は、「第1のメモリ装置」に区分された1番目のメモリ装置1501を第1のエラー等級と決定して「第2のメモリ装置」に区分することができる。
To summarize by giving an example, the error that occurred in the
図1Bと図2及び図3に示すように、コントローラ130に含まれた第2のエラー分析部1304は、第1のエラー分析部1303で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、一部のメモリ装置を選択できる。また、第2のエラー分析部1304は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、選択された一部のメモリ装置に対しては、ログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOの追加分析を介してエラーの形態及び個数を確認してエラー強度を決定し、一部のメモリ装置を除いた残りのメモリ装置に対しては、第1のエラー分析部1303で決定されたエラー等級に対応するようにエラー強度を決定できる。
As shown in FIGS. 1B, 2 and 3, the second
具体的に、第1のエラー分析部1303は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508をエラー等級が決定されなかったメモリ装置と、第1のエラー等級と決定された「第2のメモリ装置」と、第2のエラー等級と決定された「第3のメモリ装置」とに区分したことがある。
Specifically, the first
そして、第2のエラー分析部1304は、第1のエラー分析部1303で決定されたエラー等級が第1のエラー等級であるか否かを確認(K10)できる。
Then, the second
K10動作の確認結果、第2のエラー分析部1304は、第1のエラー分析部1303で第1のエラー等級と決定されなかったメモリ装置の場合(K10のNO)、すなわち、エラー等級が決定されなかったメモリ装置と、第2のエラー等級と決定された「第3のメモリ装置」に対して第2のエラー強度を付加して「第5のメモリ装置」に区分することができる(K70)。このとき、第2のエラー強度が付加されて「第5のメモリ装置」に区分されたメモリ装置に対しては、対応動作部1305で第2のエラー対応動作を行うことができる(K80)。
As a result of confirming the operation of K10, the second
K10動作の確認結果、第2のエラー分析部1304は、第1のエラー分析部1303で第1のエラー等級と決定されたメモリ装置の場合(K10のYES)、すなわち、第1のエラー等級と決定された「第2のメモリ装置」の場合、追加にログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析してエラーの形態及び個数を確認した後、エラー強度を決定できる。具体的に、第2のエラー分析部1304は、第1のエラー等級と決定された「第2のメモリ装置」に対するログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを追加に分析して「第2のメモリ装置」で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがって(across)いるか否かを確認できる(K30)。
As a result of confirming the operation of K10, the second
ここで、コードワード単位に「またがって(across)」いるエラーを確認する動作がいかなる意味を有するかは、図1A及び図4ないし図5Bに関連した説明において前述したことがある。したがって、ここでは、より具体的な説明を省略する。 Here, what the meaning of the operation of confirming the error of "crossing" in codeword units has been described above in the description related to FIGS. 1A and 4 to 5B. Therefore, a more specific description will be omitted here.
そして、第2のエラー分析部1304で第1のエラー等級と決定された「第2のメモリ装置」に対するログ情報LOG_INFOを追加に分析して「第2のメモリ装置」で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがって(across)いるか否かを確認する動作(K30)は、第3基準個数を2個であると仮定するとき、「第2のメモリ装置」で発生したエラーの形態が図5Aにおいて例示したように、2個のコードワード単位にまたがった形態であるか、それとも、図5Bにおいて例示したように、1個のコードワード単位にのみ含まれた形態であるかを確認する動作でありうる。
Then, the log information LOG_INFO for the "second memory device" determined by the second
K30動作の確認結果、「第2のメモリ装置」で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがった形態である場合(K30のYES)、第2のエラー分析部1304は、第3基準個数以上のコードワードにまたがったエラー個数の合計が第4基準個数以上であるか否かを確認できる(K40)。例えば、第4基準個数を8個であると仮定するとき、図5Aにおいて例示したように、2個のコードワード単位(Codeword0、Codeword1)にまたがったエラービットの合計が16個であるから、8個である第4基準個数以上でありうる。
As a result of confirming the operation of K30, when the form of the error generated in the "second memory device" is a form straddling the codeword unit of the third reference number or more (YES of K30), the second
K40動作の確認結果、「第2のメモリ装置」で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがった形態(K30のYES)であり、第3基準個数以上のコードワードにまたがったエラー個数の合計が第4基準個数以上である場合(K40のYES)、第2のエラー分析部1304は、該当する「第2のメモリ装置」に対して第1のエラー強度を付加して「第4のメモリ装置」に区分することができる(K50)。このとき、第1のエラー強度が付加されて「第4のメモリ装置」に区分されるメモリ装置に対しては、対応動作部1305で第1のエラー対応動作を行うことができる(K60)。
As a result of confirming the operation of K40, the form of the error generated in the "second memory device" is a form that straddles the codeword unit of the third reference number or more (YES of K30), and the codeword has the codeword of the third reference number or more. When the total number of straddled errors is equal to or greater than the fourth reference number (YES in K40), the second
K30動作の確認結果、「第2のメモリ装置」で発生したエラーの形態が第3基準個数未満のコードワード単位にのみ含まれた形態である場合(K30のNO)、第2のエラー分析部1304は、該当する「第2のメモリ装置」に対して第2のエラー強度を付加して「第5のメモリ装置」に区分することができる(K70)。このとき、第2のエラー強度が付加されて「第5のメモリ装置」に区分されるメモリ装置に対しては、対応動作部1305で第2のエラー対応動作を行うことができる(K80)。
As a result of confirming the operation of K30, when the form of the error generated in the "second memory device" is included only in the codeword unit less than the third reference number (NO of K30), the second error analysis unit. 1304 can be classified into a "fifth memory device" by adding a second error strength to the corresponding "second memory device" (K70). At this time, for the memory device to which the second error strength is added and classified as the "fifth memory device", the
第2のエラー分析部1304の動作を例を挙げて説明すれば、次のとおりである。
The operation of the second
まず、図2において例を挙げて説明したように、第1のエラー分析部1303は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、1番目のメモリ装置1501を第1のエラー等級と決定して「第2のメモリ装置」に区分し、残りのメモリ装置1502、1503、1504、1505、1506、1507、1508に対してはエラー等級を決定しなかったし、第2のエラー等級と決定されて「第3のメモリ装置」に区分されたメモリ装置はないことと仮定したことがある。
First, as described with reference to FIG. 2, the first
このとき、第2のエラー分析部1304は、第1のエラー分析部1303で第1のエラー等級と決定されなかったメモリ装置の場合(K10のNO)、すなわち、エラー等級が決定されなかったメモリ装置及び第2のエラー等級と決定された「第3のメモリ装置」に対して第2のエラー強度を付加して「第5のメモリ装置」に区分することができる(K70)。したがって、第2のエラー分析部1304は、エラー等級が決定されなかった残りのメモリ装置1502、1503、1504、1505、1506、1507、1508に対して第2のエラー強度を付加して「第5のメモリ装置」に区分することができる(K70)。
At this time, the second
そして、第2のエラー分析部1304は、第1のエラー分析部1303で第1のエラー等級と決定されたメモリ装置の場合(K10のYES)、すなわち、第1のエラー等級と決定された「第2のメモリ装置」の場合、追加にログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析してエラーの形態及び個数を確認した後、エラー強度を決定できる。したがって、第2のエラー分析部1304は、第1のエラー等級と決定されて「第2のメモリ装置」に区分された1番目のメモリ装置1501に対して追加にログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析してエラーの形態及び個数を確認した後、エラー強度を決定できる。
Then, the second
具体的に、第2のエラー分析部1304は、1番目のメモリ装置1501に対して追加にログ情報LOG_INFO及びエラー訂正情報ERR_CO_INFOを分析してエラーの形態が第3基準個数以上のコードワード単位にまたがっているか否かを確認できる(K30)。その結果、1番目のメモリ装置1501で発生したエラーの形態が第3基準個数以上のコードワード単位にまたがっていることと仮定することができる(K30のYES)。したがって、第2のエラー分析部1304は、1番目のメモリ装置1501で第3基準個数以上のコードワード単位にまたがっているエラーに含まれたエラービット個数の合計が第4基準個数以上であるか否かを確認できる(K40)。確認結果、1番目のメモリ装置1501で第3基準個数以上のコードワード単位にまたがっているエラーの個数が第4基準個数以上であることと仮定することができる(K40のYES)。したがって、第2のエラー分析部1303は、1番目のメモリ装置1501に対して第1のエラー強度を付加して「第4のメモリ装置」に区分することができる(K60)。
Specifically, the second
一方、コントローラ130に含まれた対応動作部1305は、第2のエラー分析部1304で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー強度によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー対応動作を行うことができる。
On the other hand, the
具体的に、対応動作部1305は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、第2のエラー分析部1304で第1のエラー強度を付加して「第4のメモリ装置」に区分されたメモリ装置に対して第1のエラー対応動作を行うことができる。また、対応動作部1305は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、第2のエラー分析部1304で第2のエラー強度を付加して「第5のメモリ装置」に区分されたメモリ装置に対して第2のエラー対応動作を行うことができる。
Specifically, the
ここで、第1のエラー対応動作は、次のような動作のうち、少なくともいずれか1つの動作を含むことができる。 Here, the first error handling operation can include at least one of the following operations.
1番目の動作は、「第4のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作である。例えば、対応動作部1305は、「第4のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインを選択してアクセスを遮断できる。このとき、対応動作部1305は、アクセス遮断対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを複写して「他の領域」に格納した後、アクセス遮断動作を行うことができる。このとき、「他の領域」は、1番目のメモリ装置1501の他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。また、「他の領域」は、1番目のメモリ装置1501でない他のメモリ装置1502、1503、1504、1505、1506、1507、1508に含まれた他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。参考までに、アクセス遮断対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを「他の領域」に格納する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してアクセス遮断動作対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The first operation is an operation of blocking access by selecting an area in which an error has occurred in the memory device classified into the "fourth memory device". For example, the
2番目の動作は、「第4のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作である。例えば、対応動作部1305は、「第4のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインを他の正常なリダンダンシーブロックまたはリダンダンシーワードラインまたはリダンダンシービットラインでリペアすることができる。このとき、コントローラ130は、リペア対象になる1番目のメモリ装置1501でリペア動作が完了するまでアクセスが中断されるようにすることができる。そして、リペア対象になる1番目のメモリ装置1501は、リペア対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを内部の情報格納領域PA1に複写した後、リペア動作を行うことができる。リペア動作が完了した後、1番目のメモリ装置1501は、情報格納領域PA1に複写されたデータをリペア完了したリダンダンシーブロックまたはリダンダンシーワードラインまたはリダンダンシービットラインに復旧することができる。参考までに、リペア対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを内部の情報格納領域PA1に複写する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してリペア対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The second operation is an operation of selecting and repairing an area in which an error has occurred in the memory device classified into the "fourth memory device". For example, the
3番目の動作は、「第4のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作である。例えば、対応動作部1305は、「第4のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインをディセーブルさせることができる。このとき、ディセーブル対象になる1番目のメモリ装置1501は、ディセーブル対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを複写して「他の領域」に格納することができ、データが「他の領域」へ移動したことをコントローラ130に通知することができる。このとき、「他の領域」は、1番目のメモリ装置1501の他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。また、「他の領域」は、1番目のメモリ装置1501でない他のメモリ装置1502、1503、1504、1505、1506、1507、1508に含まれた他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。参考までに、ディセーブル対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを内部の「他の領域」に格納する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してディセーブル対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The third operation is an operation of selecting and disabling an area in which an error has occurred in the memory device classified into the "fourth memory device". For example, the
そして、第2のエラー対応動作は、「第5のメモリ装置」に区分されたメモリ装置に対するアクセス動作中にエラーが発生する場合、システムECC1306を介してエラーが発生したコードワード単位のデータに対してエラー訂正コードを使用したエラー復旧動作を含むことができる。 Then, in the second error handling operation, when an error occurs during the access operation to the memory device classified into the "fifth memory device", the data in codeword units where the error occurs via the system ECC1306 is obtained. It can include error recovery operations using error correction codes.
そして、図1C及び図2に示すように、ログ情報LOG_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級がどのような方式で決定されるか分かることができる。
Then, as shown in FIGS. 1C and 2, the log information LOG_INFO is analyzed to determine the error grade for each of the plurality of
具体的に、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々は、アクセス動作、例えば、データの読み出し/書き込み動作を行う過程でエラーが発生して内部に備えられたメモリECC1516の動作を介してエラーが復旧される場合、メモリECC1516によりエラーが復旧されたデータに対するログ情報LOG_INFOを生成できる。
Specifically, each of the plurality of
そして、エラー収集部1511及びエラー分析部1513は、ログ情報LOG_INFOを収集して分析することができる。すなわち、エラー収集部1511及びエラー分析部1513は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級を決定できる。
Then, the
具体的に、エラー分析部1513は、エラー収集部1511で収集されたログ情報LOG_INFOを分析して複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、エラー発生個数が第1基準個数以上であるメモリ装置を確認し、該当するメモリ装置を「第1のメモリ装置」に区分することができる(S10)。
Specifically, the
例えば、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、1番目のメモリ装置1501に対するアクセス過程でメモリECC1516により復旧されたエラーの個数が12個であり、残りのメモリ装置1502、1503、1504、1505、1506、1507、1508の各々に対するアクセス過程でメモリECC1516により各々復旧されたエラーの個数が10個未満であると仮定することができる。そして、第1基準個数は10個であると仮定することができる。このような場合、エラー分析部1513は、1番目のメモリ装置1501を「第1のメモリ装置」に区分し、残りのメモリ装置1502、1503、1504、1505、1506、1507、1508の各々に対してはエラー等級を決定しないことができる。
For example, among the plurality of
より具体的に、エラー分析部1513は、ログ情報LOG_INFOを分析して「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類を確認できる(S10のYES)。このとき、エラー分析部1513は、「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類をワードライン単位で発生したエラー(S20)と、シングルビット単位で発生したエラー(S30)と、ビットライン単位で発生したエラー(S40)と、その他のエラー(S50)とに区分することができる。
More specifically, the
ここで、ワードライン単位で発生したエラー(S20)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが同じバンク内の同じワードラインで発生する場合を意味できる。そして、シングルビット単位で発生したエラー(S30)が意味することは、同じワード、同じビットラインで1個以下のエラーが発生した場合を意味できる。そして、ビットライン単位で発生したエラー(S40)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが同じビットラインで発生する場合を意味できる。そして、その他のエラー(S50)が意味することは、「第1のメモリ装置」に区分されたメモリ装置で発生した少なくとも2個以上のエラーが特定の分布を有さない場合、例えば、ワードライン単位と、シングルビット単位と、ビットライン単位とで発生したことと判断されない場合を意味できる。 Here, the error (S20) generated in word line units means that at least two or more errors generated in the memory device classified as the "first memory device" are in the same word line in the same bank. It can mean when it occurs. And, the meaning of the error (S30) generated in a single bit unit can mean the case where one or less errors occur in the same word and the same bit line. The error (S40) that occurs in bit line units means that at least two or more errors that occur in the memory device classified as the "first memory device" occur in the same bit line. can. Then, the other error (S50) means that at least two or more errors generated in the memory device classified as the "first memory device" do not have a specific distribution, for example, a word line. It can mean a case where it is not determined that the occurrence occurs in units, single bit units, and bit line units.
そして、エラー分析部1513において「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類を確認した結果、ワードライン単位で発生したエラー(S20)である場合、「第1のメモリ装置」に区分されたメモリ装置で同じワードラインで発生したエラーの個数をカウントすることができる(S60)。カウント結果、エラーの個数が第2基準個数以上である場合(S70のYES)、当該メモリ装置を第1のエラー等級と決定して「第2のメモリ装置」に区分することができる(S90)。カウント結果、エラーの個数が第2基準個数未満である場合(S70のNO)、当該メモリ装置を第2のエラー等級と決定して「第3のメモリ装置」に区分することができる(S80)。
Then, as a result of confirming the type of error generated in the memory device classified into the "first memory device" in the
そして、エラー分析部1513において「第1のメモリ装置」に区分されたメモリ装置で発生したエラーの種類を確認した結果、シングルビット単位で発生したエラー(S30のYES)と、ビットライン単位で発生したエラー(S40のYES)と、その他のエラー(S50のYES)とのみ存在するメモリ装置の場合、当該メモリ装置を第2のエラー等級と決定して「第3のメモリ装置」に区分することができる(S80)。
Then, as a result of confirming the types of errors that occurred in the memory devices classified into the "first memory device" in the
例を挙げてまとめると、「第1のメモリ装置」に区分された1番目のメモリ装置1501で発生したエラーがワードライン単位で発生したエラーであり、同じワードラインで発生したエラーの個数が第2基準個数以上であることと仮定することができる。したがって、エラー分析部1513は、「第1のメモリ装置」に区分された1番目のメモリ装置1501を第1のエラー等級と決定して「第2のメモリ装置」に区分することができる。
To summarize by giving an example, the error that occurred in the
そして、対応動作部1515は、エラー分析部1513で決定された複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対するエラー等級によって複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508の各々に対して互いに異なるエラー対応動作を行うことができる。
Then, the
具体的に、対応動作部1515は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、エラー分析部1513で第1のエラー等級を付加して「第2のメモリ装置」に区分されたメモリ装置に対して第1のエラー対応動作を行うことができる。また、対応動作部1515は、複数のメモリ装置1501、1502、1503、1504、1505、1506、1507、1508のうち、エラー分析部1513で第2のエラー等級を付加して「第3のメモリ装置」に区分されたメモリ装置に対して第2のエラー対応動作を行うことができる。
Specifically, the
ここで、第1のエラー対応動作は、次のような動作のうち、少なくともいずれか1つの動作を含むことができる。 Here, the first error handling operation can include at least one of the following operations.
1番目の動作は、「第2のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作である。例えば、対応動作部1515は、「第2のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインを選択してアクセスを遮断できる。このとき、対応動作部1515は、アクセス遮断対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを複写して「他の領域」に格納した後、アクセス遮断動作を行うことができる。このとき、「他の領域」は、1番目のメモリ装置1501の他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。また、「他の領域」は、1番目のメモリ装置1501でない他のメモリ装置1502、1503、1504、1505、1506、1507、1508に含まれた他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。参考までに、アクセス遮断対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを「他の領域」に格納する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してアクセス遮断動作対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The first operation is an operation of blocking access by selecting an area in which an error has occurred in the memory device classified into the "second memory device". For example, the
2番目の動作は、「第2のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作である。例えば、対応動作部1515は、「第2のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインを他の正常なリダンダンシーブロックまたはリダンダンシーワードラインまたはリダンダンシービットラインでリペアすることができる。このとき、1番目のメモリ装置1501は、リペア動作が行われる区間でアクセスが中断され得る。そして、リペア対象になる1番目のメモリ装置1501は、リペア対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを内部の情報格納領域PA1に複写した後、リペア動作を行うことができる。リペア動作が完了した後、1番目のメモリ装置1501は、情報格納領域PA1に複写されたデータをリペア完了したリダンダンシーブロックまたはリダンダンシーワードラインまたはリダンダンシービットラインに復旧することができる。参考までに、リペア対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを内部の情報格納領域PA1に複写する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してリペア対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The second operation is an operation of selecting and repairing an area in which an error has occurred in the memory device classified into the "second memory device". For example, the
3番目の動作は、「第2のメモリ装置」に区分されたメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作である。例えば、対応動作部1515は、「第2のメモリ装置」に区分された1番目のメモリ装置1501で特定ブロックまたは特定ワードラインまたは特定ビットラインをディセーブルさせることができる。このとき、対応動作部1515は、ディセーブル対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを複写して「他の領域」に格納することができる。このとき、「他の領域」は、1番目のメモリ装置1501の他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。また、「他の領域」は、1番目のメモリ装置1501でない他のメモリ装置1502、1503、1504、1505、1506、1507、1508に含まれた他の正常なブロックまたは他の正常なワードラインまたは他の正常なビットラインになることができる。参考までに、ディセーブル対象である特定ブロックまたは特定ワードラインまたは特定ビットラインに格納されたデータを「他の領域」に格納する動作が正常に行われ得る理由は、特定ブロックまたは特定ワードラインまたは特定ビットラインの場合、隣接した未来時点に復旧不可能なエラーが発生する可能性が高いと予想してディセーブル対象と選択されただけであり、現在時点では、正常動作する状態または復旧可能なエラーのみ発生する状態であるためである。
The third operation is an operation of selecting and disabling an area in which an error has occurred in the memory device classified into the "second memory device". For example, the
そして、第2のエラー対応動作は、「第3のメモリ装置」に区分されたメモリ装置に対するアクセス動作中にエラーが発生する場合、システムECC1516を介してエラーが発生したコードワード単位のデータに対してエラー訂正コードを使用したエラー復旧動作を含むことができる。 Then, in the second error handling operation, when an error occurs during the access operation to the memory device classified into the "third memory device", the data in codeword units in which the error occurs via the system ECC1516 It can include error recovery operations using error correction codes.
Claims (20)
第2のエラー訂正部を備え、前記メモリシステムから伝達されたデータのエラーを前記第2のエラー訂正部が訂正し、前記第2のエラー訂正部のエラー訂正動作に対するエラー訂正情報を生成し、前記エラー訂正情報及び前記複数のメモリ装置の各々で生成されたログ(log)情報を利用して前記複数のメモリ装置の各々に対してエラー強度を設定し、前記エラー強度によって前記複数のメモリ装置の各々に対してエラー対応動作を行うホストと、
を備え、
前記複数のメモリ装置の各々は、
前記複数のセルアレイ領域に対するアクセス動作中に発生したアクセスデータのエラーを前記第1のエラー訂正部が訂正し、前記第1のエラー訂正部のエラー訂正動作に対する前記ログ(log)情報を生成するデータ処理システム。 A memory system including a plurality of memory devices each including a plurality of cell array areas in which a plurality of memory cells are connected in an array form to a plurality of word lines and a plurality of bit lines, and a first error correction unit.
The second error correction section is provided, the error of the data transmitted from the memory system is corrected by the second error correction section, and error correction information for the error correction operation of the second error correction section is generated. The error strength is set for each of the plurality of memory devices by using the error correction information and the log information generated by each of the plurality of memory devices, and the plurality of memory devices are set according to the error strength. The host that performs error handling operation for each of
With
Each of the plurality of memory devices
Data in which the first error correction unit corrects an error in access data generated during an access operation to the plurality of cell array regions, and generates the log information for the error correction operation of the first error correction unit. Processing system.
読み出し/書き込み動作を含むアクセス動作の実行中、アクセスデータにエラーが発生する場合、発生したエラーを訂正するために、内部に含まれた前記第1のエラー訂正部を動作させ、前記第1のエラー訂正部によりエラーが訂正されたデータのローデータ(raw data)を内部の情報格納領域に累積、格納して前記ログ情報を生成し、前記ホストの要請に応じて前記ログ情報を前記メモリシステムを介して前記ホストに出力する請求項1に記載のデータ処理システム。 Each of the plurality of memory devices
If an error occurs in the access data during the execution of the access operation including the read / write operation, the first error correction unit included inside is operated to correct the error, and the first error correction unit is operated. The raw data (raw data) of the data whose error has been corrected by the error correction unit is accumulated and stored in the internal information storage area to generate the log information, and the log information is stored in the memory system at the request of the host. The data processing system according to claim 1, wherein the data is output to the host via the above.
前記エラー訂正情報をリアルタイムまたは設定された時点で収集し、前記設定された時点で前記メモリシステムから前記ログ情報を収集するエラー収集部と、
前記ログ情報及び前記エラー訂正情報を分析して、前記複数のメモリ装置の各々で発生したエラーの個数及び種類を確認し、確認結果に応じて前記複数のメモリ装置の各々に対するエラー等級を決定する第1のエラー分析部と、
前記第1のエラー分析部で決定されたエラー等級によって前記複数のメモリ装置のうち、一部のメモリ装置に対しては、前記ログ情報及び前記エラー訂正情報の追加分析を介してエラーの形態及び個数を確認してエラー強度を決定し、残りのメモリ装置に対しては、前記第1のエラー分析部で決定されたエラー等級に対応するようにエラー強度を決定する第2のエラー分析部と、 前記第2のエラー分析部で決定されたエラー強度によって前記複数のメモリ装置の各々に対して前記エラー対応動作を行う対応動作部と、
を備える請求項2に記載のデータ処理システム。 The host
An error collecting unit that collects the error correction information in real time or at a set time, and collects the log information from the memory system at the set time.
The log information and the error correction information are analyzed to confirm the number and types of errors that have occurred in each of the plurality of memory devices, and the error grade for each of the plurality of memory devices is determined according to the confirmation result. The first error analysis department and
Among the plurality of memory devices according to the error grade determined by the first error analysis unit, for some of the memory devices, the error form and the error form and the error form and the error are obtained through additional analysis of the log information and the error correction information. A second error analysis unit that confirms the number and determines the error intensity, and for the remaining memory devices, determines the error intensity so as to correspond to the error grade determined by the first error analysis unit. , A corresponding operation unit that performs the error handling operation for each of the plurality of memory devices according to the error intensity determined by the second error analysis unit.
The data processing system according to claim 2.
前記複数のメモリ装置のうち、内部で発生したエラーの個数が第1基準個数以上であるメモリ装置を第1のメモリ装置に区分し、
前記第1のメモリ装置のうち、発生したエラーの種類が第2基準個数以上のワードラインで発生した第1のエラーである場合、対応する前記第1のメモリ装置を第1のエラー等級を有する第2のメモリ装置に区分し、
前記第1のメモリ装置のうち、発生したエラーの種類が前記第1のエラーでない他の種類のエラーである場合、対応する前記第1のメモリ装置を第2のエラー等級を有する第3のメモリ装置に区分する請求項3に記載のデータ処理システム。 The first error analysis unit
Among the plurality of memory devices, the memory devices in which the number of errors generated internally is equal to or greater than the first reference number are classified into the first memory devices.
When the type of error generated in the first memory device is a first error generated in a word line equal to or larger than the second reference number, the corresponding first memory device has a first error grade. Divided into the second memory device
When the type of error generated in the first memory device is an error of another type other than the first error, the corresponding first memory device is referred to as a third memory having a second error grade. The data processing system according to claim 3, which is classified into devices.
前記第2のエラー分析部は、
前記第2のメモリ装置のうち、発生したエラーの形態が第3基準個数以上のコードワード単位にまたがり(across)、含まれたエラー個数の合計が第4基準個数以上である場合、対応する前記第2のメモリ装置を第1のエラー強度を有する第4のメモリ装置に区分し、
前記第2のメモリ装置のうち、発生したエラーの形態が、前記第3基準個数以上のコードワードにまたがり、含まれたエラー個数の合計が前記第4基準個数未満である場合、または前記第3基準個数未満のコードワードにまたがる場合、対応する前記第2のメモリ装置を第2のエラー強度を有する第5のメモリ装置に区分し、
前記第3のメモリ装置に前記第2のエラー強度を付与して前記第5のメモリ装置に区分する請求項4に記載のデータ処理システム。 Each of the first and second error correction units performs an error correction operation for data input / output from each of the plurality of memory devices with a code word (code) including an error correction code (ECC, Error Correction Code). word) unit,
The second error analysis unit
Among the second memory devices, when the form of the generated error is across codeword units of the third reference number or more and the total number of included errors is the fourth reference number or more, the corresponding said. The second memory device is divided into a fourth memory device having the first error strength.
Among the second memory devices, when the form of the generated error spans the codewords of the third reference number or more and the total number of errors included is less than the fourth reference number, or the third reference number. When the number of code words is less than the reference number, the corresponding second memory device is classified into a fifth memory device having a second error strength.
The data processing system according to claim 4, wherein the second error strength is imparted to the third memory device to classify the third memory device into the fifth memory device.
前記第4のメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作と、
前記第4のメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作と、
前記第4のメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作とのうち、いずれか1つの動作を前記第4のメモリ装置の状態に応じて前記エラー対応動作として選択して行う請求項5に記載のデータ処理システム。 The corresponding operation unit is
The operation of selecting the area where the error occurred in the fourth memory device and blocking the access,
The operation of selecting and repairing the area where the error occurred in the fourth memory device, and
One of the operations of selecting and disabling the area in which the error occurred in the fourth memory device is selected as the error handling operation according to the state of the fourth memory device. The data processing system according to claim 5.
前記メモリシステムに電源が供給された時点から特定時間間隔毎に繰り返される時点を前記設定された時点として指定する動作と、
前記メモリシステムに対するアクセス動作中にアクセスデータで発生したエラー個数をカウントして、第5基準個数を超過する度に、超過する時点を前記設定された時点として指定した後、エラー個数のカウントを初期化する動作と、
前記メモリシステムに対するアクセス動作中にアクセスデータで発生したエラーを訂正するためのエラー訂正動作に特定時間以上かかる時点を前記設定された時点として指定する動作とのうち、少なくとも1つの動作を選択して行う請求項3に記載のデータ処理システム。 The host
An operation of designating a time point that is repeated at specific time intervals from the time when power is supplied to the memory system as the set time point.
The number of errors generated in the access data during the access operation to the memory system is counted, and each time the fifth reference number is exceeded, the time when the error is exceeded is specified as the set time, and then the number of errors is initially counted. And the behavior
Select at least one of the operations that specify the time point at which the error correction operation for correcting the error that occurred in the access data during the access operation to the memory system takes a specific time or more as the set time point. The data processing system according to claim 3.
第2のエラー訂正部を備え、前記複数のメモリ装置から伝達されたデータのエラーを前記第2のエラー訂正部が訂正し、前記第2のエラー訂正部のエラー訂正動作に対するエラー訂正情報を生成し、前記ログ情報及び前記エラー訂正情報を利用して前記複数のメモリ装置の各々に対してエラー強度を設定し、前記エラー強度によって前記複数のメモリ装置の各々に対してエラー対応動作を行うコントローラと、
を備えるメモリシステム。 Each of a plurality of cell array areas in which a plurality of memory cells are connected in an array form to a plurality of word lines and a plurality of bit lines and a first error correction section are provided, and access data generated during an access operation to the plurality of cell array areas. The first error correction section corrects the error, and a plurality of memory devices that generate log information for the error correction operation of the first error correction section, and a plurality of memory devices.
The second error correction section is provided, and the second error correction section corrects an error of data transmitted from the plurality of memory devices, and generates error correction information for the error correction operation of the second error correction section. A controller that sets an error strength for each of the plurality of memory devices by using the log information and the error correction information, and performs an error handling operation for each of the plurality of memory devices according to the error strength. When,
Memory system with.
読み出し/書き込み動作を含むアクセス動作の実行中、アクセスデータにエラーが発生する場合、発生したエラーを訂正するために、内部に含まれた前記第1のエラー訂正部を動作させ、前記第1のエラー訂正部によりエラーが訂正されたデータのローデータ(raw data)を内部の情報格納領域に累積、格納して前記ログ情報を生成し、前記コントローラの要請に応じて前記ログ情報を前記コントローラに出力する請求項8に記載のメモリシステム。 Each of the plurality of memory devices
If an error occurs in the access data during the execution of the access operation including the read / write operation, the first error correction unit included inside is operated to correct the error, and the first error correction unit is operated. Raw data (raw data) of data whose error has been corrected by an error correction unit is accumulated and stored in an internal information storage area to generate the log information, and the log information is sent to the controller at the request of the controller. The memory system according to claim 8 for output.
前記エラー訂正情報をリアルタイムまたは設定された時点で収集し、前記設定された時点で前記複数のメモリ装置の各々から前記ログ情報を収集するエラー収集部と、
前記ログ情報及び前記エラー訂正情報を分析して、前記複数のメモリ装置の各々で発生したエラーの個数及び種類を確認し、確認結果に応じて前記複数のメモリ装置の各々に対するエラー等級を決定する第1のエラー分析部と、
前記第1のエラー分析部で決定されたエラー等級によって前記複数のメモリ装置のうち、一部のメモリ装置に対しては、前記ログ情報及び前記エラー訂正情報の追加分析を介してエラーの形態及び個数を確認してエラー強度を決定し、残りのメモリ装置に対しては、前記第1のエラー分析部で決定されたエラー等級に対応するようにエラー強度を決定する第2のエラー分析部と、
前記第2のエラー分析部で決定されたエラー強度によって前記複数のメモリ装置の各々に対して前記エラー対応動作を行う対応動作部と、
を備える請求項9に記載のメモリシステム。 The controller
An error collecting unit that collects the error correction information in real time or at a set time, and collects the log information from each of the plurality of memory devices at the set time.
The log information and the error correction information are analyzed to confirm the number and types of errors that have occurred in each of the plurality of memory devices, and the error grade for each of the plurality of memory devices is determined according to the confirmation result. The first error analysis department and
Among the plurality of memory devices according to the error grade determined by the first error analysis unit, for some of the memory devices, the error form and the error form and the error form and the error are obtained through additional analysis of the log information and the error correction information. A second error analysis unit that confirms the number and determines the error intensity, and for the remaining memory devices, determines the error intensity so as to correspond to the error grade determined by the first error analysis unit. ,
A corresponding operation unit that performs the error handling operation for each of the plurality of memory devices according to the error intensity determined by the second error analysis unit, and a corresponding operation unit.
9. The memory system according to claim 9.
前記複数のメモリ装置のうち、内部で発生したエラーの個数が第1基準個数以上であるメモリ装置を第1のメモリ装置に区分し、
前記第1のメモリ装置のうち、発生したエラーの種類が第2基準個数以上のワードラインで発生した第1のエラーである場合、対応する前記第1のメモリ装置を第1のエラー等級を有する第2のメモリ装置に区分し、
前記第1のメモリ装置のうち、発生したエラーの種類が前記第1のエラーでない他の種類のエラーである場合、対応する前記第1のメモリ装置を第2のエラー等級を有する第3のメモリ装置に区分する請求項10に記載のメモリシステム。 The first error analysis unit
Among the plurality of memory devices, the memory devices in which the number of errors generated internally is equal to or greater than the first reference number are classified into the first memory devices.
When the type of error generated in the first memory device is a first error generated in a word line equal to or larger than the second reference number, the corresponding first memory device has a first error grade. Divided into the second memory device
When the type of error generated in the first memory device is an error of another type other than the first error, the corresponding first memory device is referred to as a third memory having a second error grade. The memory system according to claim 10, which is classified into devices.
前記第2のエラー分析部は、
前記第2のメモリ装置のうち、発生したエラーの形態が第3基準個数以上のコードワード単位にまたがり(across)、含まれたエラー個数の合計が第4基準個数以上である場合、対応する前記第2のメモリ装置を第1のエラー強度を有する第4のメモリ装置に区分し、
前記第2のメモリ装置のうち、発生したエラーの形態が、前記第3基準個数以上のコードワードにまたがり、含まれたエラー個数の合計が前記第4基準個数未満である場合、または前記第3基準個数未満のコードワードにまたがる場合、対応する前記第2のメモリ装置を第2のエラー強度を有する第5のメモリ装置に区分し、
前記第3のメモリ装置に前記第2のエラー強度を付与して前記第5のメモリ装置に区分する請求項11に記載のメモリシステム。 Each of the first and second error correction units performs an error correction operation for data input / output from each of the plurality of memory devices with a code word (code) including an error correction code (ECC, Error Correction Code). word) unit,
The second error analysis unit
Among the second memory devices, when the form of the generated error is across codeword units of the third reference number or more and the total number of included errors is the fourth reference number or more, the corresponding said. The second memory device is divided into a fourth memory device having the first error strength.
Among the second memory devices, when the form of the generated error spans the codewords of the third reference number or more and the total number of errors included is less than the fourth reference number, or the third reference number. When the number of code words is less than the reference number, the corresponding second memory device is classified into a fifth memory device having a second error strength.
The memory system according to claim 11, wherein the second error strength is imparted to the third memory device to classify the third memory device into the fifth memory device.
前記第4のメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作と、
前記第4のメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作と、
前記第4のメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作とのうち、いずれか1つの動作を前記第4のメモリ装置の状態に応じて前記エラー対応動作として選択して行う請求項12に記載のメモリシステム。 The corresponding operation unit is
The operation of selecting the area where the error occurred in the fourth memory device and blocking the access,
The operation of selecting and repairing the area where the error occurred in the fourth memory device, and
One of the operations of selecting and disabling the area in which the error occurred in the fourth memory device is selected as the error handling operation according to the state of the fourth memory device. The memory system according to claim 12.
電源が供給された時点から特定時間間隔毎に繰り返される時点を前記設定された時点として指定する動作と、
前記複数のメモリ装置に対するアクセス動作中にアクセスデータで発生したエラー個数をカウントして、第5基準個数を超過する度に、超過する時点を前記設定された時点として指定した後、エラー個数のカウントを初期化する動作と、
前記複数のメモリ装置に対するアクセス動作中にアクセスデータで発生したエラーを訂正するためのエラー訂正動作に特定時間以上かかる時点を前記設定された時点として指定する動作とのうち、少なくとも1つの動作を選択して行う請求項10に記載のメモリシステム。 The controller
An operation that specifies a time point that is repeated at specific time intervals from the time when power is supplied as the set time point, and
The number of errors generated in the access data during the access operation to the plurality of memory devices is counted, and each time the fifth reference number is exceeded, the time when the error is exceeded is specified as the set time, and then the number of errors is counted. And the operation to initialize
Select at least one of the operations that specify the time point at which the error correction operation for correcting the error that occurred in the access data during the access operation to the plurality of memory devices takes a specific time or more as the set time point. The memory system according to claim 10.
前記複数のメモリ装置の各々に対するアクセス動作中に発生したアクセスデータのエラーを前記エラー訂正部が訂正し、前記エラー訂正部のエラー訂正動作に対するログ(log)情報を生成する生成ステップと、
前記ログ情報を利用して前記複数のメモリ装置の各々に対するエラー等級を設定する分析ステップと、
前記エラー等級によって前記複数のメモリ装置の各々に対してエラー対応動作を行う対応ステップと、
を含むメモリシステムの動作方法。 In the operation method of a memory system including a plurality of memory devices each including a plurality of cell array areas in which a plurality of memory cells are connected in an array form to a plurality of word lines and a plurality of bit lines and an error correction unit.
A generation step in which the error correction unit corrects an error in access data generated during an access operation to each of the plurality of memory devices and generates log information for the error correction operation of the error correction unit.
An analysis step of setting an error grade for each of the plurality of memory devices using the log information, and
A response step for performing an error response operation for each of the plurality of memory devices according to the error grade, and
How the memory system works, including.
前記複数のメモリ装置の各々に対するアクセス動作の実行中、アクセスデータにエラーが発生する場合、発生したエラーを訂正するために前記エラー訂正部を動作させる動作ステップと、
前記動作ステップで前記エラー訂正部によりエラーが訂正されたデータに対するローデータ(raw data)を前記複数のメモリ装置の各々に含まれた情報格納領域に累積、格納して前記ログ情報を生成するステップと、
を含む請求項15に記載のメモリシステムの動作方法。 The generation step
When an error occurs in the access data during the execution of the access operation for each of the plurality of memory devices, the operation step of operating the error correction unit to correct the error, and the operation step.
A step of accumulating and storing raw data (raw data) for data whose error has been corrected by the error correction unit in the operation step in an information storage area included in each of the plurality of memory devices to generate the log information. When,
The operation method of the memory system according to claim 15.
設定された時点毎に前記情報格納領域に格納された前記ログ情報を収集する収集ステップと、
前記収集ステップで収集された前記ログ情報を分析して、前記複数のメモリ装置の各々で発生したエラーの個数及び種類を確認し、確認結果に応じて前記複数のメモリ装置の各々に対するエラー等級を決定するエラー分析ステップと、
を含む請求項16に記載のメモリシステムの動作方法。 The analysis step
A collection step for collecting the log information stored in the information storage area at each set time point, and
The log information collected in the collection step is analyzed to confirm the number and types of errors that have occurred in each of the plurality of memory devices, and the error grade for each of the plurality of memory devices is determined according to the confirmation result. Error analysis steps to determine and
16. The method of operating a memory system according to claim 16.
前記複数のメモリ装置のうち、内部で発生したエラーの個数が第1基準個数以上であるメモリ装置を第1のメモリ装置に区分するステップと、
前記第1のメモリ装置のうち、発生したエラーの種類が第2基準個数以上のワードラインで発生した第1のエラーである場合、対応する前記第1のメモリ装置を第1のエラー等級を有する第2のメモリ装置に区分するステップと、
前記第1のメモリ装置のうち、発生したエラーの種類が前記第1のエラーでない他の種類のエラーである場合、対応する前記第1のメモリ装置を第2のエラー等級を有する第3のメモリ装置に区分するステップと、
を含む請求項17に記載のメモリシステムの動作方法。 The error analysis step
Among the plurality of memory devices, a step of classifying a memory device in which the number of errors generated internally is equal to or greater than the first reference number into a first memory device, and a step of classifying the memory devices into the first memory device.
When the type of error generated in the first memory device is a first error generated in a word line equal to or larger than the second reference number, the corresponding first memory device has a first error grade. The step of dividing into the second memory device and
When the type of error generated in the first memory device is an error of another type other than the first error, the corresponding first memory device is referred to as a third memory having a second error grade. Steps to divide into devices and
The operation method of the memory system according to claim 17.
前記第2のメモリ装置でエラーが発生した領域を選択してアクセスを遮断する動作と、
前記第2のメモリ装置でエラーが発生した領域を選択してリペア(repair)する動作と、
前記第2のメモリ装置でエラーが発生した領域を選択してディセーブル(disable)させる動作とのうち、いずれか1つの動作を前記第2のメモリ装置の状態に応じて選択して前記エラー対応動作として行う請求項18に記載のメモリシステムの動作方法。 The corresponding step is
The operation of selecting the area where the error occurred in the second memory device and blocking the access,
The operation of selecting and repairing the area where the error occurred in the second memory device, and
One of the operations of selecting and disabling the area in which the error occurred in the second memory device is selected according to the state of the second memory device to deal with the error. The method of operating a memory system according to claim 18, which is performed as an operation.
前記複数のメモリ装置に対するアクセス動作中にアクセスデータで発生したエラー個数をカウントして、第5基準個数を超過する度に、超過する時点を前記設定された時点として指定した後、エラー個数のカウントを初期化するステップと、
前記複数のメモリ装置に対するアクセス動作中にアクセスデータで発生したエラーを訂正するためのエラー訂正動作に特定時間以上かかる時点を前記設定された時点として指定するステップとのうち、少なくとも1つのステップをさらに含む請求項17に記載のメモリシステムの動作方法。 A step of designating a time point that is repeated at specific time intervals from the time when power is supplied as the set time point, and
The number of errors generated in the access data during the access operation to the plurality of memory devices is counted, and each time the fifth reference number is exceeded, the time when the error is exceeded is specified as the set time, and then the number of errors is counted. And the steps to initialize
At least one step is further added to the step of designating a time point at which a specific time or more is required for the error correction operation for correcting an error generated in the access data during the access operation to the plurality of memory devices as the set time point. The method of operating the memory system according to claim 17, which includes.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200001998A KR20210088916A (en) | 2020-01-07 | 2020-01-07 | Apparatus and method for selecting an error solution operation of memory system by analyzing previously occurring error and data process system including the same |
KR10-2020-0001998 | 2020-01-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021111325A true JP2021111325A (en) | 2021-08-02 |
Family
ID=76432369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020130222A Pending JP2021111325A (en) | 2020-01-07 | 2020-07-31 | Memory system for selecting counter-error operation by analyzing errors previously occurred, and data processing system including memory system |
Country Status (5)
Country | Link |
---|---|
US (1) | US11609813B2 (en) |
JP (1) | JP2021111325A (en) |
KR (1) | KR20210088916A (en) |
CN (1) | CN113157484A (en) |
DE (1) | DE102020208450A1 (en) |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009129070A (en) * | 2007-11-21 | 2009-06-11 | Hitachi Ltd | Control method for flash memory storage device, flash memory storage device using the method and storage system |
US9312885B2 (en) * | 2012-08-15 | 2016-04-12 | Kabushiki Kaisha Toshiba | Nonvolatile semiconductor memory system error correction capability of which is improved |
KR102143517B1 (en) * | 2013-02-26 | 2020-08-12 | 삼성전자 주식회사 | Semiconductor Memory Device including error correction circuit and Operating Method thereof |
US8891303B1 (en) * | 2014-05-30 | 2014-11-18 | Sandisk Technologies Inc. | Method and system for dynamic word line based configuration of a three-dimensional memory device |
JP6396225B2 (en) * | 2015-01-23 | 2018-09-26 | 株式会社東芝 | Quantum key distribution device, quantum key distribution system and program |
KR20160144560A (en) | 2015-06-08 | 2016-12-19 | 삼성전자주식회사 | Nonvolatile memory module, storage device, and electronic device generating error information accessed by host |
US20190019569A1 (en) * | 2016-01-28 | 2019-01-17 | Hewlett Packard Enterprise Development Lp | Row repair of corrected memory address |
US10055159B2 (en) | 2016-06-20 | 2018-08-21 | Samsung Electronics Co., Ltd. | Morphic storage device |
KR101941105B1 (en) | 2017-10-27 | 2019-01-22 | 주식회사 지음 | A method of collectively managing the occurrence of errors in the hardware included in the computer system and performing backup and recovery to inform the external terminal |
US10997516B2 (en) * | 2017-12-15 | 2021-05-04 | Dell Products L.P. | Systems and methods for predicting persistent memory device degradation based on operational parameters |
KR102453437B1 (en) * | 2018-01-25 | 2022-10-12 | 삼성전자주식회사 | Semiconductor memory devices, memory systems including the same and method of operating semiconductor memory devices |
US10496477B1 (en) * | 2018-05-23 | 2019-12-03 | Dell Products L.P. | System and method of utilizing memory modules |
KR20200001998A (en) | 2018-06-28 | 2020-01-07 | 서강대학교산학협력단 | Polymer electrolyte composition, and polymer electrolyte membrane containing the same |
-
2020
- 2020-01-07 KR KR1020200001998A patent/KR20210088916A/en active Search and Examination
- 2020-07-07 DE DE102020208450.5A patent/DE102020208450A1/en active Pending
- 2020-07-08 US US16/923,819 patent/US11609813B2/en active Active
- 2020-07-31 JP JP2020130222A patent/JP2021111325A/en active Pending
- 2020-08-12 CN CN202010809375.8A patent/CN113157484A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN113157484A (en) | 2021-07-23 |
US11609813B2 (en) | 2023-03-21 |
KR20210088916A (en) | 2021-07-15 |
DE102020208450A1 (en) | 2021-07-08 |
US20210208966A1 (en) | 2021-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6044483A (en) | Error propagation operating mode for error correcting code retrofit apparatus | |
US7797609B2 (en) | Apparatus and method for merging data blocks with error correction code protection | |
US8171377B2 (en) | System to improve memory reliability and associated methods | |
US8352806B2 (en) | System to improve memory failure management and associated methods | |
US8566682B2 (en) | Failing bus lane detection using syndrome analysis | |
US8181094B2 (en) | System to improve error correction using variable latency and associated methods | |
JP2001249854A (en) | Shared error correction for designing memory | |
TWI684857B (en) | Flash memory apparatus and storage management method for flash memory | |
US8185801B2 (en) | System to improve error code decoding using historical information and associated methods | |
US11030040B2 (en) | Memory device detecting an error in write data during a write operation, memory system including the same, and operating method of memory system | |
US10514980B2 (en) | Encoding method and memory storage apparatus using the same | |
CN112612637B (en) | Memory data storage method, memory controller, processor chip and electronic device | |
US11372720B2 (en) | Systems and methods for encoding metadata | |
US8103934B2 (en) | High speed memory error detection and correction using interleaved (8,4) LBCs | |
US20060075287A1 (en) | Detecting data integrity | |
US20230214295A1 (en) | Error rates for memory with built in error correction and detection | |
US6519735B1 (en) | Method and apparatus for detecting errors in data output from memory and a device failure in the memory | |
JP2021111325A (en) | Memory system for selecting counter-error operation by analyzing errors previously occurred, and data processing system including memory system | |
JP5772192B2 (en) | Semiconductor device, information processing apparatus, and error detection method | |
JP2006323434A (en) | Data processor and memory correction method therefor | |
US20050228842A1 (en) | Apparatus for checking data coherence, raid controller and storage system having the same, and method therefor | |
US11928027B1 (en) | System and method for error checking and correction with metadata storage in a memory controller | |
JPH01286060A (en) | Ecc error processing system for memory | |
JPS6024493B2 (en) | Memory control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230705 |