JP2016066337A - Information processor, storage device, and information processing system - Google Patents
Information processor, storage device, and information processing system Download PDFInfo
- Publication number
- JP2016066337A JP2016066337A JP2015000822A JP2015000822A JP2016066337A JP 2016066337 A JP2016066337 A JP 2016066337A JP 2015000822 A JP2015000822 A JP 2015000822A JP 2015000822 A JP2015000822 A JP 2015000822A JP 2016066337 A JP2016066337 A JP 2016066337A
- Authority
- JP
- Japan
- Prior art keywords
- data
- failure
- storage device
- information processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
- For Increasing The Reliability Of Semiconductor Memories (AREA)
Abstract
Description
本発明は、情報処理装置、記憶装置及び情報処理システムに関する。 The present invention relates to an information processing device, a storage device, and an information processing system.
近年、情報処理に必要なメモリ容量の増大に伴い、マザーボード等の本体部分に着脱可能なDIMM(Dual Inline Memory Module)等のメモリモジュールを装着して接続することにより、データの書き込みや読み出しが行われている。その際、メモリモジュールの信頼性を高めるため、書き込み及び読み出しの対象となるデータに対して誤り検出訂正処理(ECC: Error Check and Correct)を行い、メモリモジュールの故障を検出することが行われている(例えば、特許文献1)。 In recent years, with the increase in memory capacity required for information processing, data can be written and read by attaching and connecting a removable memory module such as a DIMM (Dual Inline Memory Module) to the main body such as a motherboard. It has been broken. At that time, in order to improve the reliability of the memory module, error detection and correction processing (ECC: Error Check and Correct) is performed on the data to be written and read to detect a failure of the memory module. (For example, Patent Document 1).
かかる誤り検出訂正処理は、書き込み及び読み出しの対象となるデータに対し誤り訂正符号(ECC符号)を付加してECC符号化データを生成し、これを復号することによって行う。誤り検出訂正処理に対応したメモリモジュールは、通常のデータの記憶領域の他にECC符号化データのための記憶領域を有しており、情報処理装置は、メモリモジュールの当該記憶領域からECC符号化データを読み出して誤り検出訂正処理を行う。 Such error detection and correction processing is performed by adding error correction code (ECC code) to data to be written and read to generate ECC encoded data and decoding it. The memory module corresponding to the error detection / correction processing has a storage area for ECC encoded data in addition to a storage area for normal data, and the information processing apparatus performs ECC encoding from the storage area of the memory module. Data is read and error detection and correction processing is performed.
しかし、誤り検出訂正処理に対応したメモリモジュールを用いる場合であっても、誤り検出訂正処理を実際に行うのはメモリモジュールではなく情報処理装置本体であるため、データの誤りを検出しても、それが情報処理装置本体内で生じたものかメモリモジュール内で生じたものかを判定することができない。したがって、情報処理装置又はメモリモジュールに故障が生じている可能性があることを検出することはできても、故障部位が情報処理装置本体なのかメモリモジュールなのかを特定することができず、故障部位を特定するためには別途調査が必要となる。また、故障部位が特定されるまでは情報処理装置本体及びメモリモジュールの双方が故障被疑状態となるため、どちらも使用することができないという問題があった。 However, even when using a memory module that supports error detection and correction processing, the error detection and correction processing is actually performed by the information processing apparatus body, not the memory module. It cannot be determined whether the error occurred in the information processing apparatus main body or in the memory module. Therefore, although it is possible to detect that a failure may have occurred in the information processing device or the memory module, it is not possible to specify whether the failure part is the information processing device main body or the memory module. A separate survey is required to identify the site. Further, since both the information processing apparatus main body and the memory module are in a suspicious failure state until the failure part is specified, there is a problem that neither of them can be used.
本発明は、上記問題点に鑑みてなされたものであり、データに対する誤り検出処理の結果に基づいて、情報処理装置と記憶装置のいずれが故障しているかを判定することが可能な情報処理装置を提供することを目的とする。 The present invention has been made in view of the above problems, and is an information processing apparatus capable of determining which one of the information processing apparatus and the storage device has failed based on the result of error detection processing on data. The purpose is to provide.
本発明による情報処理装置は、着脱可能に装着されて接続されている記憶装置との間でデータの書き込み及び読み出しを行う情報処理装置であって、前記記憶装置へのデータの書き込み及び前記記憶装置からのデータの読み出しを制御する制御部と、前記記憶装置に書き込む書き込みデータに誤り訂正符号を付加して符号化データを生成する符号化部と、前記符号化データを用いて、前記書き込みデータ又は前記記憶装置からの読み出しデータに対して誤り検出処理を行う誤り検出部と、前記記憶装置における誤り検出処理の結果を受信し、受信した前記記憶装置における誤り検出処理の結果と前記誤り検出部における誤り検出処理の結果とに基づいて、前記情報処理装置又は前記記憶装置のいずれが故障しているかを判定する故障部位判定部と、を備えることを特徴とする。 An information processing apparatus according to the present invention is an information processing apparatus that writes and reads data to and from a storage device that is detachably mounted and connected to the storage device, and writes the data to the storage device and the storage device A control unit that controls reading of data from the storage unit, an encoding unit that generates encoded data by adding an error correction code to the write data to be written to the storage device, and the write data or An error detection unit for performing error detection processing on read data from the storage device; and receiving an error detection processing result in the storage device; and receiving the error detection processing result in the storage device and the error detection unit Failure part determination for determining which of the information processing device or the storage device is failed based on the result of error detection processing Characterized in that it comprises a and.
また、本発明による記憶装置は、情報処理装置に着脱可能に装着され、前記情報処理装置から供給されたデータを記憶する記憶装置であって、前記情報処理装置から供給されたデータを記憶するデータ記憶領域と、前記データに誤り訂正符号を付加した符号化データを記憶する符号化データ記憶領域と、前記符号化データを用いて、前記データに対して誤り検出処理を行う誤り検出部とを備えることを特徴とする。 In addition, a storage device according to the present invention is a storage device that is detachably attached to an information processing device, stores data supplied from the information processing device, and stores data supplied from the information processing device A storage area; an encoded data storage area that stores encoded data obtained by adding an error correction code to the data; and an error detection unit that performs an error detection process on the data using the encoded data. It is characterized by that.
また、本発明による情報処理システムは、情報処理装置と、前記情報処理装置に着脱可能に装着され接続されている記憶装置とを含む情報処理システムであって、前記情報処理装置は、前記記憶装置へのデータの書き込み及び前記記憶装置からのデータの読み出しを制御する制御部と、前記記憶装置に書き込む書き込みデータに誤り訂正符号を付加して符号化データを生成する符号化部と、前記符号化データを用いて、前記書き込みデータ又は前記記憶装置からの読み出しデータに対して誤り検出処理を行う第1誤り検出部と、前記第1誤り検出部における前記誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第1異常検出信号を生成する第1異常検出部と、前記情報処理装置又は前記記憶装置のいずれが故障しているかを判定する故障部位判定部と、を備え、前記記憶装置は、前記情報処理装置から供給された前記書き込みデータを記憶するデータ記憶領域と、前記書き込みデータに誤り訂正符号を付加した符号化データを記憶する符号化データ記憶領域と、前記符号化データを用いて、前記書き込みデータ又は前記読み出しデータに対して誤り検出処理を行う第2誤り検出部と、前記第2誤り検出部における誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第2異常検出信号を生成して前記情報処理装置に供給する第2異常検出部と、を備え、前記故障部位判定部は、前記第1異常検出信号と前記第2異常検出信号とに基づいて、情報処理装置又は前記記憶装置のいずれが故障しているかを判定することを特徴とする。 An information processing system according to the present invention is an information processing system including an information processing device and a storage device that is detachably attached to the information processing device, and the information processing device includes the storage device. A control unit that controls writing of data to and reading of data from the storage device, an encoding unit that generates encoded data by adding an error correction code to the write data to be written to the storage device, and the encoding A first error detection unit that performs an error detection process on the write data or read data from the storage device using data, and the write based on a result of the error detection process in the first error detection unit A first abnormality detection unit that generates a first abnormality detection signal indicating the presence or absence of an error included in the data or the read data; A failure location determination unit that determines which of the storage devices is faulty, wherein the storage device stores a data storage area for storing the write data supplied from the information processing device, and an error in the write data An encoded data storage area for storing encoded data to which a correction code is added; a second error detection unit that performs error detection processing on the write data or the read data using the encoded data; A second abnormality detection unit that generates a second abnormality detection signal indicating the presence or absence of an error included in the write data or the read data based on the result of the error detection process in the two error detection unit and supplies the second abnormality detection signal to the information processing apparatus And the failure site determination unit based on the first abnormality detection signal and the second abnormality detection signal based on the information processing device or the storage device And judging whether one is faulty.
本発明によれば、データに対する誤り検出処理の結果に基づいて、情報処理装置と記憶装置のいずれが故障しているかを判定することが可能となる。 According to the present invention, it is possible to determine which of the information processing device and the storage device is out of order based on the result of error detection processing on data.
以下、本発明の実施例を図面を参照しつつ詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、情報処理装置10及びメモリモジュール20からなる情報処理システムの構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an information processing system including the
情報処理装置10は、制御部11、ECC部12及びエラー収集/メモリ判定部17を含む。情報処理装置10には、メモリモジュール20が着脱可能に装着されて接続される。情報処理装置10は、メモリモジュール20に対してデータの書き込み及び読み出しを行う。
The
制御部11は、CPU(Central Processing Unit)等からなるマイクロプロセッサであり、情報処理装置10の各部の制御を行う。また、制御部11は、バスラインBLを介してメモリモジュール20との間でデータの授受を行い、メモリモジュール20に対するデータの書き込み及び読み出しを制御する。
The
ECC部12は、ECC符号化部13、第1誤り検出部14、第1異常検出部15及び故障部位判定部16を含む。
The
ECC符号化部13は、メモリモジュール20へのデータの書き込み時にデータに対して誤り訂正符号化処理を施し、符号化データCDを生成する。誤り訂正符号化処理は、例えばハミング符号を用いて行う。
The
第1誤り検出部14は、符号化データCDを復号化し、データに対して誤り検出訂正処理(ECC: Error Check and Correct)を行う。第1誤り検出部14は、誤り検出の結果を示す誤り検出信号ES1を第1異常検出部15に供給する。
The first
第1異常検出部15は、第1誤り検出部14における誤り検出訂正処理の結果に基づいて、データに含まれる誤り(以下、データ異常と称する)の有無を示す2値(0、1)の第1異常検出信号AS1を生成し、故障部位判定部16に供給する。
The first
故障部位判定部16は、第1異常検出部15から第1異常検出信号AS1の供給を受ける一方、メモリモジュール20の第2異常検出部24から第2異常検出信号AS2を受信する。故障部位判定部16は、第1異常検出信号AS1及び第2異常検出信号AS2の組合せによって、情報処理装置10の本体の故障(以下、本体故障と称する)とメモリモジュール20の故障(以下、メモリ故障と称する)のいずれが生じているのかを判定する。
The failure
故障部位判定部16は、判定結果を示す故障部位判定信号FSをエラー収集/メモリ判定部17に供給する。
The failure
エラー収集/メモリ判定部17は、故障部位判定部16から供給された故障部位判定信号FSを蓄積し、エラー情報EIとして記憶する。エラー収集/メモリ判定部17は、制御部11からの求めに応じてエラー情報EIを制御部11に供給する。
The error collection /
また、エラー収集/メモリ判定部17は、情報処理装置10に接続されているメモリモジュールが本発明に係るメモリモジュール20かどうかを判定するメモリ判定処理を行う。
Further, the error collection /
エラー収集/メモリ判定部17は、メモリ判定信号JSをメモリモジュール20の端子NC1に送信し、端子NC2からメモリ判定信号JSと同じ信号値を有する返信信号RSを受信したか否かに応じてメモリ判定処理を行う。エラー収集/メモリ判定部17は、判定結果を示す情報をメモリ情報MIとして制御部11に供給する。
The error collection /
メモリモジュール20は、DIMM(Dual Inline Memory Module)等からなる記憶装置であり、情報処理装置10のマザーボードに着脱可能に装着され、情報処理装置10と接続される。メモリモジュール20は、データ記憶領域21、符号化データ記憶領域22、第2誤り検出部23、第2異常検出部24、双方向バッファ26及び27を含む。
The
データ記憶領域21は、制御部11から供給されたデータを記憶する。符号化データ記憶領域22は、ECC符号化部13において生成された符号化データCDを記憶する。
The
第2誤り検出部23は、符号化データCDを復号化し、データに対して誤り検出訂正処理を行う。第2誤り検出部23は、誤り検出の結果を示す第2誤り検出信号ES2を第2異常検出部24に供給する。
The second
第2異常検出部24は、第2誤り検出部23から供給された第2誤り検出信号ES2に基づいて、データに含まれる誤り、すなわちデータ異常の有無を示す2値(0、1)の第2異常検出信号AS2を生成し、故障部位判定部16に供給する。
Based on the second error detection signal ES2 supplied from the second
メモリ判定信号返信部25は、通常のDIMMでは未使用とされている端子NC1、NC2に接続されている。メモリ判定信号返信部25は、エラー収集/メモリ判定部17からのメモリ判定信号JSを端子NC1を介して受信すると、受信したメモリ判定信号JSと同じ信号値を有する返信信号RSを、端子NC2を介してエラー収集/メモリ判定部17に送信する。
The memory determination
双方向バッファ26は、データの書き込み時に情報処理装置10から供給されたデータをデータ記憶領域21に供給する。また、双方向バッファ26は、データの読み出し時にデータ記憶領域21から読み出されたデータを情報処理装置10に供給する。
The
双方向バッファ27は、データの書き込み時に情報処理装置10から供給された符号化データCDを符号化データ記憶領域22に供給する。また、双方向バッファ27は、データの読み出し時に符号化データ記憶領域22から読み出された符号化データCDを情報処理装置10に供給する。
The
次に、データの書き込み時における情報処理装置10及びメモリモジュール20の動作について、図2及び図3(a)を参照して説明する。
Next, operations of the
[データ書き込み時]
制御部11は、書き込みデータNDをメモリモジュール20のデータ記憶領域21に供給する。データ記憶領域21は、書き込みデータNDを記憶する。また、制御部11は、書き込みデータNDを、ECC符号化部13、第1誤り検出部14、メモリモジュール20の第2誤り検出部23に供給する。
[When writing data]
The
ECC符号化部13は、制御部11から供給された書き込みデータNDに基づいて符号化データCDを生成する。ECC符号化部13は、第1誤り検出部14、メモリモジュール20の符号化データ記憶領域22及び第2誤り検出部23に、符号化データCDを供給する。
The
第1誤り検出部14は、符号化データCDを復号化し、復号化したデータを用いて、書き込みデータNDに対して誤り検出訂正処理を行う。第1誤り検出部14は、誤り検出の結果を示す第1誤り検出信号ES1を第1異常検出部15に供給する。
The first
第1異常検出部15は、第1誤り検出信号ES1に基づいて、書き込みデータNDに生じている誤り、すなわち書き込みデータNDにおけるデータ異常の有無を示す2値(0、1)の第1異常検出信号AS1を生成し、故障部位判定部16に供給する。
Based on the first error detection signal ES1, the
メモリモジュール20の第2誤り検出部23は、ECC符号化部13から供給された符号化データCDを復号化する。メモリモジュール20は、復号化した符号化データCDを用いて、書き込みデータNDに対して誤り検出訂正処理を行う。
The second
第2誤り検出部23は、誤り検出の結果を示す第2誤り検出信号ES2を第2異常検出部24に供給する。
The second
第2異常検出部24は、第2誤り検出信号ES2に基づいて、書き込みデータNDにおけるデータ異常の有無を示す2値(0、1)の第2異常検出信号AS2を生成し、故障部位判定部16に供給する。
Based on the second error detection signal ES2, the second
故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1及び第2異常検出部24から供給された第2異常検出信号AS2に基づいて、本体故障又はメモリ故障のいずれが生じているかを判定する。
Based on the first abnormality detection signal AS1 supplied from the first
図3(a)は、データの書き込み時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。
FIG. 3A is a diagram illustrating a determination table for failure site determination performed by the failure
故障部位判定部16は、AS1の信号値が0か1かに基づいて、本体故障が生じているか否かを判定する。例えば、AS1が0の場合、故障部位判定部16は、本体故障は生じていないと判定する。AS1が1の場合、故障部位判定部16は、本体故障が生じていると判定する。
The failure
また、故障部位判定部16は、AS1とAS2の信号値が同じであるか否かに基づいて、メモリ故障が生じているか否かを判定する。例えば、AS1とAS2が同じ信号値である場合、故障部位判定部16は、メモリ故障は生じていないと判定する。AS1とAS2が異なる信号値である場合、故障部位判定部16は、メモリ故障が生じていると判定する。
Further, the failure
具体的には、例えばAS1及びAS2がともに0の場合、情報処理装置10でもメモリモジュール20でもデータ異常が検出されていないため、故障部位判定部16は本体故障とメモリ故障のいずれも生じていないと判定する。
Specifically, for example, when AS1 and AS2 are both 0, no data abnormality is detected in either the
AS1が0で且つAS2が1の場合、第1異常検出部15ではデータ異常が検出されず、第2異常検出部24でデータ異常が検出されていることから、故障部位判定部16は、本体故障は生じておらず、メモリ故障が生じていると判定する。
When AS1 is 0 and AS2 is 1, the first
AS1が1で且つAS2が0の場合、第1異常検出部15でデータ異常が検出されているため、故障部位判定部16は、本体故障が生じていると判定する。一方、本来データ異常が検出されるべき第2異常検出部24においてデータ異常が検出されていないことから、故障部位判定部16は、メモリ故障も生じていると判定する。
When AS1 is 1 and AS2 is 0, since the data abnormality is detected by the first
AS1が1で且つAS2が1の場合、第1異常検出部15でデータ異常が検出され、そのデータ異常が第2異常検出部24でもそのまま検出されていることから、故障部位判定部16は、本体故障が生じており、メモリ故障は生じていないと判定する。
When AS1 is 1 and AS2 is 1, since the data abnormality is detected by the first
故障部位判定部16は、判定結果を示す故障部位判定信号FSをエラー収集/メモリ判定部17に供給する。
The failure
次に、データの読み出し時における情報処理装置10及びメモリモジュール20の動作について、図4及び図3(b)を参照して説明する。
Next, operations of the
[データ読み出し時]
制御部11は、メモリモジュール20のデータ記憶領域21から読み出しデータRDを読み出し、第1誤り検出部14と第2誤り検出部23に供給する。また、制御部11は、読み出しデータRDに対応する符号化データCDを符号化データ記憶領域22から読み出し、第1誤り検出部14と第2誤り検出部23に供給する。
[When reading data]
The
第2誤り検出部23は、符号化データCDを復号化し、復号化した符号化データCDを用いて、読み出しデータRDに対して誤り検出訂正処理を行う。第2誤り検出部23は、誤り検出の結果を示す第2誤り検出信号ES2を第2異常検出部24に供給する。
The second
第2異常検出部24は、第2誤り検出部23から供給された第2誤り検出信号ES2に基づいて、読み出しデータRDに含まれる誤り、すなわち読み出しデータRDにおけるデータ異常の有無を示す2値(0、1)の第2異常検出信号AS2を生成し、故障部位判定部16に供給する。
Based on the second error detection signal ES2 supplied from the second
第1誤り検出部14は、符号化データ記憶領域22から読み出された符号化データCDを復号化し、復号化した符号化データCDを用いて、読み出しデータRDに対して誤り検出訂正処理を行う。
The first
第1誤り検出部14は、誤り検出の結果を示す第1誤り検出信号ES1を第1異常検出部15に供給する。
The first
第1異常検出部15は、第1誤り検出部14から供給された第1誤り検出信号ES1に基づいて、読み出しデータRDにおけるデータ異常の有無を示す2値(0、1)の第1異常検出信号AS1を生成し、故障部位判定部16に供給する。
Based on the first error detection signal ES1 supplied from the first
故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1及び第2異常検出部24から供給された第2異常検出信号AS2に基づいて、本体故障又はメモリ故障のいずれが生じているかを判定する。
Based on the first abnormality detection signal AS1 supplied from the first
図3(b)は、データの読み出し時に故障部位判定部16が行う上記判定の判定テーブルを示す図である。
FIG. 3B is a diagram illustrating a determination table for the determination performed by the failure
故障部位判定部16は、AS2の信号値が0か1かに基づいて、メモリ故障が生じているか否かを判定する。例えば、AS2が0の場合、故障部位判定部16は、メモリ故障は生じていないと判定する。AS2が1の場合、故障部位判定部16は、メモリ故障が生じていると判定する。
The failure
また、故障部位判定部16は、AS1とAS2の信号値が同じであるか否かに基づいて、本体故障が生じているか否かを判定する。例えば、AS2とAS1が同じ信号値である場合、本体故障は生じていないと判定する。AS1とAS2が異なる信号値である場合、故障部位判定部16は、本体故障が生じていると判定する。
Moreover, the failure
具体的には、例えばAS1及びAS2がともに0の場合、メモリモジュール20でも情報処理装置10でもデータ異常が検出されていないため、故障部位判定部16はメモリ故障と本体故障のいずれも生じていないと判定する。
Specifically, for example, when AS1 and AS2 are both 0, no data abnormality is detected in either the
AS1が0で且つAS2が1の場合、第2異常検出部24でデータ異常が検出されているにもかかわらず第1異常検出部15ではデータ異常が検出されていないことから、故障部位判定部16は、本体故障とメモリ故障のいずれもが生じていると判定する。
When AS1 is 0 and AS2 is 1, a data abnormality is not detected by the first
AS1が1で且つAS2が0の場合、第2異常検出部24ではデータ異常が検出されず、第1異常検出部15でデータ異常が検出されていることから、故障部位判定部16は、メモリ故障は生じておらず、本体故障が生じていると判定する。
When AS1 is 1 and AS2 is 0, no data abnormality is detected by the second
AS1が1で且つAS2が1の場合、第2異常検出部24でデータ異常が検出され、その異常が第1異常検出部15でもそのまま検出されていることから、故障部位判定部16は、メモリ故障が生じており、本体故障は生じていないと判定する。
When AS1 is 1 and AS2 is 1, since the data abnormality is detected by the second
次に、エラー収集/メモリ判定部17が行うメモリ判定の動作について説明する。
Next, the memory determination operation performed by the error collection /
[メモリ判定]
エラー収集/メモリ判定部17は、情報処理装置10の電源投入直後又はメモリモジュールが接続された直後に、メモリ判定信号JSをメモリモジュールに対して送信する。
[Memory judgment]
The error collection /
エラー収集/メモリ判定部17は、まず「0」の信号値を有するメモリ判定信号JSを、メモリモジュール20の端子NC1に向けて送信する。
The error collection /
エラー収集/メモリ判定部17は、端子NC2から信号値「0」の返信信号RSを受信しない場合、接続されているメモリモジュールは本発明に係るメモリモジュール20ではないと判定する。端子NC2から信号値「0」の返信信号RSを受信した場合、エラー収集/メモリ判定部17は、さらに信号値「1」のメモリ判定信号JSを送信する。
When the error collection /
エラー収集/メモリ判定部17は、端子NC2から信号値「1」の返信信号RSを受信しない場合、接続されているメモリモジュールは本発明に係るメモリモジュール20ではないと判定する。端子NC2から信号値「1」の返信信号RSを受信した場合、エラー収集/メモリ判定部17は、接続されているメモリモジュールは本発明に係るメモリモジュール20であると判定する。
When the error collection /
エラー収集/メモリ判定部17は、接続されているメモリモジュールが本発明に係るメモリモジュール20か否かを示すメモリ情報MIを、制御部11に供給する。
The error collection /
接続されているメモリモジュールが本発明に係るメモリモジュール20である場合、制御部11は、故障部位判定部16を制御して故障部位の判定処理を実行させる。接続されているメモリモジュールが通常のメモリモジュールである場合、制御部11は、故障部位の判定処理を行わないよう故障部位判定部16を制御する。
When the connected memory module is the
以上説明したように、本発明に係る情報処理装置10は、故障判定部16を備える。故障判定部16は、情報処理装置10での誤り検出訂正処理の結果を示す第1異常検出信号AS1と、メモリモジュール20での誤り検出訂正処理の結果を示す第2異常検出信号AS2とを受信し、これらに基づいて故障部位の判定を行う。
As described above, the
したがって、情報処理装置内での誤り検出訂正処理の結果とメモリモジュール内での誤り検出訂正処理の結果とに基づいて、本体故障が生じているかメモリ故障が生じているかを判定することができる。 Therefore, based on the result of the error detection and correction process in the information processing apparatus and the result of the error detection and correction process in the memory module, it can be determined whether a main body failure or a memory failure has occurred.
また、メモリモジュール20は、第2誤り検出部23を有し、情報処理装置10において行われる誤り検出訂正処理とは別に誤り検出訂正処理を行う。したがって、情報処理装置10において、情報処理装置10における誤り検出訂正処理の結果とメモリモジュール20での誤り検出訂正処理の結果とに基づいて故障部位の判定を行うことが可能となる。
In addition, the
また、本発明に係る情報処理装置10は、接続されているメモリモジュールが本発明に係るメモリモジュール20かどうかを判定し、通常のメモリモジュールが接続されていると判定した場合には、故障部位の判定処理を行わない。したがって、通常のメモリモジュールが接続された場合、通常の情報処理装置として動作することが可能である。
In addition, the
なお、エラー収集/メモリ判定部17は、「0」の信号値を有するメモリ判定信号JS及び返信信号RSの送受信の後、さらに「1」の信号値を有するメモリ判定信号JS及び返信信号RSを送受信して、メモリ判定を行っている。したがって、偶然同じ信号値の信号を受信した場合等における誤判定を防止することができる。
The error collection /
図5は、実施例2における情報処理システムの構成を示すブロック図である。本実施例の情報処理装置10は、情報処理装置10とメモリモジュール20との接続を媒介するソケット30を含む。ソケット30以外の構成は、図1に示す実施例1のものと同様である。
FIG. 5 is a block diagram illustrating a configuration of the information processing system according to the second embodiment. The
ソケット30は、例えば情報処理装置10のマザーボードに設けられた差込口の形状を有し、メモリモジュール20と嵌合して、情報処理装置10とメモリモジュール20との間の接続を媒介する。
The
情報処理装置10とメモリモジュール20を接続する際、メモリモジュール20とソケット30との間の嵌合異常等に起因して、情報処理装置10とメモリモジュール20の間に接続不良が生じる場合がある。当該接続不良は、データに誤りが生じる原因となる。
When the
本実施例における故障部位判定部16は、本体故障及びメモリ故障のいずれが生じているかに加えて、情報処理装置10とメモリモジュール20との間に接続不良が生じていないかを判定する。以下、データの書き込み時及び読み出し時における故障部位判定部16の判定動作について説明する。
The failure
[データ書き込み時]
故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1及び第2異常検出部24から供給された第2異常検出信号AS2に基づいて、本体故障が生じているのか、接続不良又はメモリ故障が生じているのかを判定する。
[When writing data]
The failure
図6(a)は、データの書き込み時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。
FIG. 6A is a diagram illustrating a determination table for failure site determination performed by the failure
故障部位判定部16は、AS1の信号値が0か1かに基づいて、本体故障が生じているか否かを判定する。例えば、AS1が0の場合、故障部位判定部16は、本体故障は生じていないと判定する。AS1が1の場合、故障部位判定部16は、本体故障が生じていると判定する。
The failure
また、故障部位判定部16は、AS1とAS2の信号値が同じであるか否かに基づいて、接続不良又はメモリ故障が生じているか否かを判定する。例えば、AS1とAS2が同じ信号値である場合、故障部位判定部16は、接続不良もメモリ故障も生じていないと判定する。AS1とAS2が異なる信号値である場合、故障部位判定部16は、接続不良又はメモリ故障が生じていると判定する。
Further, the failure
具体的には、例えばAS1及びAS2がともに0の場合、情報処理装置10及びメモリモジュール20のいずれにおいてもデータ異常が検出されていないため、故障部位判定部16は、本体故障、接続不良、メモリ故障のいずれも生じていないと判定する。
Specifically, for example, when AS1 and AS2 are both 0, no data abnormality is detected in any of the
AS1が0で且つAS2が1の場合、第1異常検出部15ではデータ異常が検出されず、第2異常検出部24でデータ異常が検出されていることから、故障部位判定部16は、本体故障は生じておらず、接続不良又はメモリ故障が生じていると判定する。
When AS1 is 0 and AS2 is 1, the first
AS1が1で且つAS2が0の場合、第1異常検出部15でデータ異常が検出されているため、故障部位判定部16は、本体故障が生じていると判定する。一方、本来データ異常が検出されるべき第2異常検出部24においてデータ異常が検出されていないことから、故障部位判定部16は、接続不良又はメモリ故障が生じていると判定する。
When AS1 is 1 and AS2 is 0, since the data abnormality is detected by the first
AS1が1で且つAS2が1の場合、第1異常検出部15でデータ異常が検出され、そのデータ異常が第2異常検出部24でもそのまま検出されていることから、故障部位判定部16は、本体故障が生じており、接続不良又はメモリ故障は生じていないと判定する。
When AS1 is 1 and AS2 is 1, since the data abnormality is detected by the first
[データ読み出し時]
故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1及び第2異常検出部24から供給された第2異常検出信号AS2に基づいて、本体故障又は接続不良が生じているのか、メモリ故障が生じているのかを判定する。
[When reading data]
Based on the first abnormality detection signal AS1 supplied from the first
図6(b)は、データの読み出し時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。
FIG. 6B is a diagram illustrating a determination table for failure site determination performed by the failure
故障部位判定部16は、AS2の信号値が0か1かに基づいて、メモリ故障が生じているか否かを判定する。例えば、AS2が0の場合、故障部位判定部16は、メモリ故障は生じていないと判定する。AS2が1の場合、故障部位判定部16は、メモリ故障が生じていると判定する。
The failure
また、故障部位判定部16は、AS1とAS2の信号値が同じであるか否かに基づいて、本体故障又は接続不良が生じているか否かを判定する。例えば、AS2とAS1が同じ信号値である場合、本体故障又は接続不良は生じていないと判定する。AS1とAS2が異なる信号値である場合、故障部位判定部16は、本体故障又は接続不良が生じていると判定する。
Moreover, the failure
具体的には、例えばAS1及びAS2がともに0の場合、メモリモジュール20でも情報処理装置10でもデータ異常が検出されていないため、故障部位判定部16は、メモリ故障、接続不良、本体故障のいずれも生じていないと判定する。
Specifically, for example, when AS1 and AS2 are both 0, no data abnormality is detected in either the
AS1が0で且つAS2が1の場合、第2異常検出部24でデータ異常が検出されているにもかかわらず第1異常検出部15ではデータ異常が検出されていないことから、故障部位判定部16は、メモリ故障が生じており、接続不良又は本体故障も生じていると判定する。
When AS1 is 0 and AS2 is 1, a data abnormality is not detected by the first
AS1が1で且つAS2が0の場合、第2異常検出部24ではデータ異常が検出されず、第1異常検出部15でデータ異常が検出されていることから、故障部位判定部16は、メモリ故障は生じておらず、接続不良又は本体故障が生じていると判定する。
When AS1 is 1 and AS2 is 0, no data abnormality is detected by the second
AS1が1で且つAS2が1の場合、第2異常検出部24でデータ異常が検出され、その異常が第1異常検出部15でもそのまま検出されていることから、故障部位判定部16は、メモリ故障が生じており、接続不良又は本体故障は生じていないと判定する。
When AS1 is 1 and AS2 is 1, since the data abnormality is detected by the second
以上説明したように、本実施例の情報処理システムによれば、データの書き込み時に、本体故障が生じているのか、接続不良又はメモリ故障が生じているのかを判定することができる。また、データの読み出し時に、メモリ故障が生じているのか、接続不良又は本体故障が生じているのかを判定することができる。 As described above, according to the information processing system of this embodiment, it is possible to determine whether a main unit failure, a connection failure, or a memory failure has occurred when data is written. Further, when reading data, it can be determined whether a memory failure has occurred, a connection failure, or a main body failure has occurred.
なお、データ書き込み時の故障部位判定とデータ読み出し時の故障部位判定とを組み合わせることにより、故障部位をさらに特定することが可能である。例えば、データの書き込み時において、AS1が0で且つAS2が1だった場合、図6(a)に示すように、接続不良又はメモリ故障が生じていると判定することはできるが、そのいずれが生じているかを判定することはできない。 In addition, it is possible to further specify the failure part by combining the failure part determination at the time of data writing and the failure part determination at the time of data reading. For example, when AS1 is 0 and AS2 is 1 at the time of data writing, it can be determined that a connection failure or a memory failure has occurred, as shown in FIG. It cannot be determined whether it has occurred.
しかし、図7に示すように、さらにデータ読み出し時の故障判定を行うことにより、データ読み出し時にAS1が1で且つAS2が0の場合には接続不良、AS1が1で且つAS2が1の場合にはメモリ故障が生じていると判定して、故障部位を特定することが可能となる。 However, as shown in FIG. 7, by performing failure determination at the time of data reading, if AS1 is 1 and AS2 is 0 at the time of data reading, a connection failure occurs, and AS1 is 1 and AS2 is 1. It is possible to determine that a memory failure has occurred and identify the failure site.
図8は、実施例3における情報処理装置10、ソケット30及びメモリモジュール20からなる情報処理システムの構成を示すブロック図である。
FIG. 8 is a block diagram illustrating a configuration of an information processing system including the
ECC部12は、ECC符号化部13、第1誤り検出部14、第1異常検出部15、故障部位判定部16、第1パリティ生成部18及びパリティ照合部19を含む。
The
第1パリティ生成部18は、データ(書き込みデータND又は読み出しデータRD)及び符号化データCDの供給を受け、これらのデータのうち所定のビット数毎に含まれる信号値「1」のデータの数に応じて、第1パリティデータPD1を生成する。
The first
例えば、書き込みデータND又は読み出しデータRDが64ビットからなる場合、第1パリティ生成部18は、これを8ビットからなる8のデータ列に分け、各データ列に含まれる「1」の個数が奇数である場合には信号値「1」、「1」の個数が偶数である場合には信号値「0」を、パリティビットとして設定する。そして、第1パリティ生成部18は、各データ列に設定したパリティビットからなる、8ビットの第1パリティデータPD1を生成する。
For example, when the write data ND or the read data RD is composed of 64 bits, the first
パリティ照合部19は、第1パリティ生成部18から第1パリティデータPDの供給を受ける一方、メモリモジュール20の第2パリティ生成部28から第2パリティデータPD2の供給を受ける。パリティ照合部19は、第1パリティデータPD1と第2パリティデータPD2とが一致するか否かを、上位ビットから下位ビットまでそれぞれ対応するビット毎に照合する。パリティ照合部19は、全てのビットについて値が一致する場合には信号値「0」、1ビット以上の不一致がある場合には信号値「1」のパリティ信号PSを生成し、故障部位判定部16に供給する。
The
故障部位判定部16は、第1異常検出信号AS1及び第2異常検出信号AS2の組合せと、パリティ信号PSとによって、情報処理装置10の本体の故障、メモリモジュール20の故障、ソケット30とメモリモジュール20との間の接続不良の有無を判定する。
The failure
メモリモジュール20は、データ記憶領域21、符号化データ記憶領域22、第2誤り検出部23、第2異常検出部24、双方向バッファ26及び27、第2パリティ生成部28を含む。
The
第2パリティ生成部28は、データ(書き込みデータND又は読み出しデータRD)及び符号化データCDの供給を受け、これらのデータのうち所定のビット数毎に含まれる信号値「1」のデータの数に応じて、第2パリティデータPD2を生成する。この際、第2パリティ生成部28は、第1パリティ生成部18と同様、64ビットからなるデータを例えば8ビットからなる8のデータ列に分け、各データ列に含まれる「1」の個数が奇数である場合には信号値「1」、「1」の個数が偶数である場合には信号値「0」をパリティビットとして設定して、8ビットの第2パリティデータPD2を生成する。
The second
次に、データの書き込み時における実施例3の情報処理装置10及びメモリモジュール20の動作について、図9及び図10を参照して説明する。
Next, operations of the
[データ書き込み時]
図9に示すように、制御部11は、書き込みデータNDを、メモリモジュール20のデータ記憶領域21、ECC符号化部13、第1誤り検出部14、メモリモジュール20の第2誤り検出部23に供給するとともに、第1パリティ生成部18及び第2パリティ生成部28に供給する。
[When writing data]
As shown in FIG. 9, the
ECC符号化部13は、書き込みデータNDに基づいて符号化データCDを生成し、第1誤り検出部14、メモリモジュール20の符号化データ記憶領域22及び第2誤り検出部23に供給するとともに、第1パリティ生成部18及び第2パリティ生成部28に供給する。
The
第1パリティ生成部18は、書き込みデータND及び符号化データCDに基づいて第1パリティデータPD1を生成し、パリティ照合部19に供給する。第2パリティ生成部28は、書き込みデータND及び符号化データCDに基づいて第2パリティデータPD2を生成し、パリティ照合部19に供給する。
The first
パリティ照合部19は、第1パリティデータPD1と第2パリティデータPD2とを照合し、照合結果を「0」「1」の2値の信号で示すパリティ信号PSを故障部位判定部16に供給する。
The
故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1、第2異常検出部24から供給された第2異常検出信号AS2、パリティ照合部19から供給されたパリティ信号PSに基づいて、本体故障、メモリ故障及び接続不良の有無を判定する。
The failure
図10は、データの書き込み時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。
FIG. 10 is a diagram illustrating a determination table for failure site determination performed by the failure
故障部位判定部16は、AS1の信号値が0か1かに基づいて、本体故障が生じているか否かを判定する。例えば、AS1が0の場合、故障部位判定部16は、本体故障は生じていないと判定する。AS1が1の場合、故障部位判定部16は、本体故障が生じていると判定する。
The failure
故障部位判定部16は、パリティ信号PSの信号値が0か1かに基づいて、接続不良が生じているか否かを判定する。例えば、PSが0の場合、故障部位判定部16は、接続不良は生じていないと判定する。PSが1の場合、故障部位判定部16は、接続不良が生じていると判定する。
The failure
故障部位判定部16は、PSの信号値が0か1か、及びAS1とAS2の信号値の条件により、メモリ故障が生じているか否かを判定する。例えば、PSの信号値が0であって且つAS1とAS2とが同じ信号値である場合、故障部位判定部16は、メモリ故障は生じていないと判定する。一方、PSの信号値が0であって且つAS1とAS2とが異なる信号値である場合、故障部位判定部16は、メモリ故障が生じていると判定する。
The failure
これに対し、PSの信号値が1の場合、接続不良が生じているにも拘わらずAS2が0ならば、故障部位判定部16はメモリ故障が生じていると判定する。一方、PSの信号値が1であって且つAS2が1の場合、故障部位判定部16は、メモリ故障は生じていないと判定する。
On the other hand, if the PS signal value is 1, if AS2 is 0 even though a connection failure has occurred, the failure
上記法則により、故障部位判定部16は、図10に示すように、本体故障、メモリ故障及び接続不良の有無を判定する。図中、「○」は当該部分に故障や不良がないことを示し、「×」は当該部分に故障や不良があることを示している。このように、情報処理装置10とメモリモジュール20との間にソケット30を含む構成において、データの書き込み時に、故障の有無の判定及び故障部位の特定を行うことができる。
According to the above rule, as shown in FIG. 10, the failure
次に、データの読み出し時における実施例3の情報処理装置10及びメモリモジュール20の動作について、図11及び図12を参照して説明する。
Next, operations of the
[データ読み出し時]
図11に示すように、制御部11は、読み出しデータRDを、第1誤り検出部14と第2誤り検出部23に供給するとともに、第1パリティ生成部18及び第2パリティ生成部28に供給する。また、制御部11は、読み出しデータRDに対応する符号化データCDを符号化データ記憶領域22から読み出し、第1誤り検出部14、第2誤り検出部23、第1パリティ生成部18及び第2パリティ生成部28に供給する。
[When reading data]
As illustrated in FIG. 11, the
第1パリティ生成部18は、読み出しデータRD及び符号化データCDに基づいて第1パリティデータPD1を生成し、パリティ照合部19に供給する。第2パリティ生成部28は、読み出しデータRD及び符号化データCDに基づいて第2パリティデータPD2を生成し、パリティ照合部19に供給する。
The first
パリティ照合部19は、第1パリティデータPD1と第2パリティデータPD2とを照合し、照合結果を「0」「1」の2値の信号で示すパリティ信号PSを故障部位判定部16に供給する。
The
故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1、第2異常検出部24から供給された第2異常検出信号AS2、パリティ照合部19から供給されたパリティ信号PSに基づいて、本体故障、メモリ故障及び接続不良の有無を判定する。
The failure
図12は、データの読み出し時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。
FIG. 12 is a diagram illustrating a determination table for failure site determination performed by the failure
故障部位判定部16は、AS2の信号値が0か1かに基づいて、メモリ故障が生じているか否かを判定する。例えば、AS2が0の場合、故障部位判定部16は、メモリ故障は生じていないと判定する。AS2が1の場合、故障部位判定部16は、メモリ故障が生じていると判定する。
The failure
故障部位判定部16は、パリティ信号PSの信号値が0か1かに基づいて、接続不良が生じているか否かを判定する。例えば、PSが0の場合、故障部位判定部16は、接続不良は生じていないと判定する。PSが1の場合、故障部位判定部16は、接続不良が生じていると判定する。
The failure
故障部位判定部16は、PSの信号値が0か1か、及びAS1とAS2の信号値の条件により、本体故障が生じているか否かを判定する。例えば、PSの信号値が0であって且つAS1とAS2とが同じ信号値である場合、故障部位判定部16は、本体故障は生じていないと判定する。一方、PSの信号値が0であって且つAS1とAS2とが異なる信号値である場合、故障部位判定部16は、本体故障が生じていると判定する。
The failure
これに対し、PSの信号値が1の場合、接続不良が生じているにもかかわらずAS1が0ならば、故障部位判定部16は本体故障が生じていると判定する。一方、PSの信号値が1であって且つAS1が1の場合、故障部位判定部16は、本体故障は生じていないと判定する。
On the other hand, when the signal value of PS is 1, if AS1 is 0 even though connection failure has occurred, the failure
上記法則により、故障部位判定部16は、図12に示すように、本体故障、メモリ故障及び接続不良の有無を判定する。図中、「○」は当該部分に故障や不良がないことを示し、「×」は当該部分に故障や不良があることを示している。このように、情報処理装置10とメモリモジュール20との間にソケット30を含む構成において、データの読み出し時に、故障の有無の判定及び故障部位の特定を行うことができる。
According to the above rule, as shown in FIG. 12, the failure
以上のように、本実施例の情報処理システムによれば、データの書き込み時及びデータの読み出し時の夫々において、情報処理装置10の故障及びメモリモジュール20の故障及びソケット30とメモリモジュール20との間の接続不良の有無を検出し、これらのうちいずれが生じているかを判定することができる。
As described above, according to the information processing system of the present embodiment, at the time of data writing and at the time of data reading, the failure of the
情報処理装置10やメモリモジュール20の故障とソケット30及びメモリモジュール20の接続不良とを区別することができるため、例えば接続不良のみが生じていると判定した場合には、修理の必要性がないことを判定することができる。
Since the failure of the
なお、本発明の実施形態は上記のものに限られない。例えば、上記実施例では、ECC部12の第1誤り検出部14が誤り検出訂正処理を行うとして説明したが、誤り検出処理のみを行うものであってもよい。また、誤り検出処理の方式はハミング方式に限られず、パリティ方式やCRC方式(Cyclic Redundancy Check)等を用いてもよい。
The embodiment of the present invention is not limited to the above. For example, in the above-described embodiment, the first
また、メモリモジュールの種類はDIMMに限られず、例えばRIMM(Rambus Inline Memory Module)やSO−DIMM(Small Outline Dual Inline Memory Module)等の記憶装置を用いるものであってもよい。 The type of the memory module is not limited to DIMM, and a storage device such as a RIMM (Rambus Inline Memory Module) or SO-DIMM (Small Outline Dual Inline Memory Module) may be used.
また、上記実施例では、メモリモジュール20が情報処理装置10のマザーボードに装着されて接続されるとして説明したが、接続方法はマザーボードへの装着に限られない。また、ソケット30の構成は差込口のような形状のものに限られず、情報処理装置10とメモリモジュール20との接続を媒介することが可能なものであればよい。本発明によれば、情報処理装置とメモリモジュールとの接続を媒介する接続部を有する装置において、データに含まれる誤りの原因が接続部の前後いずれにあるかを判定することが可能である。
In the above embodiment, the
また、上記実施例では、故障部位判定部16が、第1異常検出部15からの第1異常検出信号AS1と第2異常検出部24からの第2異常検出信号AS2とに基づいて、故障部位の判定を行う構成について説明した。
In the above embodiment, the failure
しかし、第1異常検出部15及び第2異常検出部24を設けず、故障部位判定部16が第1誤り検出部14からの第1誤り検出信号ES1と第2誤り検出部23からの第2誤り検出信号ES2に基づいて、故障部位の判定を行う構成であってもよい。要するに、情報処理装置10での誤り検出訂正処理の結果とメモリモジュール20での誤り検出訂正処理の結果とに基づいて、故障部位判定部16が故障部位の判定を行う構成であればよい。
However, the first
また、上記実施例では、メモリ判定において、誤判定防止のため「0」の信号値を有する信号の送受信の後、さらに「1」の信号値を有する信号を送受信して判定を行っている。しかし、信号の送受信の回数はこれに限られず、1回の送受信で判定を行ってもよいし、3回以上の送受信を行うものであってもよい。 In the above embodiment, in the memory determination, after the transmission / reception of the signal having the signal value of “0”, the determination is performed by transmitting / receiving the signal having the signal value of “1” to prevent erroneous determination. However, the number of times of signal transmission / reception is not limited to this, and determination may be performed by one transmission / reception, or transmission / reception may be performed three or more times.
また、上記実施例3では、第1パリティ生成部18及び第2パリティ生成部28が、各データ列に含まれる「1」の個数が奇数である場合には信号値「1」、「1」の個数が偶数である場合には信号値「0」をパリティビットとして設定する、いわゆる「偶数パリティ」方式により、第1パリティデータPD1及び第2パリティデータPD2を生成する例について説明した。しかし、これに限られず、各データ列に含まれる「1」の個数が偶数である場合に信号値「1」、「1」の個数が奇数である場合には信号値「0」をパリティビットとして設定する、いわゆる「奇数パリティ」方式を用いてもよい。いずれの方式であっても、第1パリティ生成部18及び第2パリティ生成部28が生成するパリティデータの方式が同じものであればよい。
In the third embodiment, the first
また、上記実施例では、情報処理装置10にメモリモジュール20を接続した場合の例について説明した。しかし、接続する装置はメモリモジュール20に限られず、他の着脱可能な装置を情報処理装置10に接続する構成であってもよい。要するに、本発明によれば、情報処理装置10と他の装置との接続部の前後において発生したデータ誤りを検出することにより、故障部位や接続不良を判定することが可能である。
In the above-described embodiment, an example in which the
10 情報処理装置
11 制御部
12 ECC部
13 ECC符号化部
14 第1誤り検出部
15 第1異常検出部
16 故障部位判定部
17 エラー収集/メモリ判定部
18 第1パリティ生成部
19 パリティ照合部
20 メモリモジュール
21 データ記憶領域
22 符号化データ記憶領域
23 第2誤り検出部
24 第2異常検出部
25 メモリ判定信号返信部
26、27 双方向バッファ
28 第2パリティ生成部
30 ソケット
NC1、NC2 端子
DESCRIPTION OF
Claims (12)
前記記憶装置へのデータの書き込み及び前記記憶装置からのデータの読み出しを制御する制御部と、
前記記憶装置に書き込む書き込みデータに誤り訂正符号を付加して符号化データを生成する符号化部と、
前記符号化データを用いて、前記書き込みデータ又は前記記憶装置からの読み出しデータに対して誤り検出処理を行う誤り検出部と、
前記記憶装置における誤り検出処理の結果を受信し、受信した前記記憶装置における誤り検出処理の結果と前記誤り検出部における誤り検出処理の結果とに基づいて、前記情報処理装置又は前記記憶装置のいずれが故障しているかを判定する故障部位判定部と、を備えることを特徴とする情報処理装置。 An information processing apparatus that writes and reads data to and from a storage device that is detachably mounted and connected,
A control unit that controls writing of data to the storage device and reading of data from the storage device;
An encoding unit that generates encoded data by adding an error correction code to write data to be written to the storage device;
Using the encoded data, an error detection unit that performs error detection processing on the write data or read data from the storage device;
Either the information processing device or the storage device is received based on the received error detection processing result in the storage device and the error detection processing result in the error detection unit. An information processing apparatus comprising: a failure part determination unit that determines whether or not the device is out of order.
前記故障部位判定部は、受信した前記記憶装置内における誤り検出処理の結果と前記誤り検出部における誤り検出処理の結果とに基づいて、前記情報処理装置の故障又は前記記憶装置の故障又は前記ソケットと前記記憶装置との接続異常のいずれが生じているかを判定することを特徴とする請求項1に記載の情報処理装置。 A socket connected to the storage device;
The failure part determination unit is configured to determine whether the information processing device has failed, the storage device has failed, or the socket based on the received error detection processing result in the storage device and the error detection processing result in the error detection unit. 2. The information processing apparatus according to claim 1, wherein a determination is made as to whether a connection abnormality between the storage device and the storage device has occurred.
前記故障部位判定部は、前記記憶装置における前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第2異常検出信号を受信し、前記第1異常検出信号と前記第2異常検出信号とに基づいて前記判定を行うことを特徴とする請求項1又は2に記載の情報処理装置。 Based on the result of the error detection process in the error detection unit, an abnormality detection unit that generates a first abnormality detection signal indicating the presence or absence of an error included in the write data or the read data,
The failure part determination unit receives a second abnormality detection signal indicating the presence or absence of an error included in the write data or the read data in the storage device, and generates a first abnormality detection signal and a second abnormality detection signal. The information processing apparatus according to claim 1, wherein the determination is performed based on the information processing apparatus.
前記情報処理装置内において前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて生成されたパリティデータと、前記記憶装置内において前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて生成されたパリティデータとを照合して、一致するか否かを判定するパリティ照合部と、
を備え、
前記故障部位判定部は、受信した前記記憶装置内における誤り検出処理の結果と前記誤り検出部における誤り検出処理の結果と前記パリティ照合部の照合結果とに基づいて、前記情報処理装置の故障及び前記記憶装置の故障及び前記ソケットと前記記憶装置との間の接続異常のうちいずれが生じているかを判定することを特徴とする請求項1に記載の情報処理装置。 A socket connected to the storage device;
Parity data generated based on the write data or the read data and the encoded data in the information processing device, and based on the write data or the read data and the encoded data in the storage device A parity collation unit that collates the generated parity data and determines whether or not they match,
With
The failure part determination unit is configured to detect a failure of the information processing device based on the received error detection processing result in the storage device, the error detection processing result in the error detection unit, and the verification result of the parity verification unit. The information processing apparatus according to claim 1, wherein a determination is made as to which of the failure of the storage device and the connection abnormality between the socket and the storage device has occurred.
前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて第1パリティデータを生成するパリティ生成部と、
を備え、
前記パリティ照合部は、前記記憶装置において前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて生成された第2パリティデータを受信し、前記第1パリティデータと前記第2パリティデータと照合して、前記第1パリティデータと前記第2パリティデータとが一致するか否かを示すパリティ信号を生成し、
前記故障部位判定部は、前記記憶装置における前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第2異常検出信号を受信し、前記第1異常検出信号と前記第2異常検出信号と前記パリティ信号とに基づいて前記判定を行うことを特徴とする請求項4に記載の情報処理装置。 Based on the result of the error detection process in the error detection unit, an abnormality detection unit that generates a first abnormality detection signal indicating the presence or absence of an error included in the write data or the read data;
A parity generator that generates first parity data based on the write data or the read data and the encoded data;
With
The parity check unit receives second parity data generated based on the write data or the read data and the encoded data in the storage device, and checks the first parity data and the second parity data. And generating a parity signal indicating whether the first parity data and the second parity data match,
The failure part determination unit receives a second abnormality detection signal indicating whether there is an error included in the write data or the read data in the storage device, and receives the first abnormality detection signal, the second abnormality detection signal, and the The information processing apparatus according to claim 4, wherein the determination is performed based on a parity signal.
前記情報処理装置から供給されたデータを記憶するデータ記憶領域と、
前記データに誤り訂正符号を付加した符号化データを記憶する符号化データ記憶領域と、
前記符号化データを用いて、前記データに対して誤り検出処理を行う誤り検出部とを備えることを特徴とする記憶装置。 A storage device that is detachably attached to the information processing device and stores data supplied from the information processing device,
A data storage area for storing data supplied from the information processing apparatus;
An encoded data storage area for storing encoded data obtained by adding an error correction code to the data;
A storage device comprising: an error detection unit that performs error detection processing on the data using the encoded data.
前記情報処理装置は、
前記記憶装置へのデータの書き込み及び前記記憶装置からのデータの読み出しを制御する制御部と、
前記記憶装置に書き込む書き込みデータに誤り訂正符号を付加して符号化データを生成する符号化部と、
前記符号化データを用いて、前記書き込みデータ又は前記記憶装置からの読み出しデータに対して誤り検出処理を行う第1誤り検出部と、
前記第1誤り検出部における前記誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第1異常検出信号を生成する第1異常検出部と、
前記情報処理装置又は前記記憶装置のいずれが故障しているかを判定する故障部位判定部と、を備え、
前記記憶装置は、
前記情報処理装置から供給された前記書き込みデータを記憶するデータ記憶領域と、
前記書き込みデータに誤り訂正符号を付加した符号化データを記憶する符号化データ記憶領域と、
前記符号化データを用いて、前記書き込みデータ又は前記読み出しデータに対して誤り検出処理を行う第2誤り検出部と、
前記第2誤り検出部における誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第2異常検出信号を生成して前記情報処理装置に供給する第2異常検出部と、を備え、
前記故障部位判定部は、前記第1異常検出信号と前記第2異常検出信号とに基づいて、情報処理装置又は前記記憶装置のいずれが故障しているかを判定することを特徴とする情報処理システム。 An information processing system including an information processing device and a storage device that is detachably attached to and connected to the information processing device,
The information processing apparatus includes:
A control unit that controls writing of data to the storage device and reading of data from the storage device;
An encoding unit that generates encoded data by adding an error correction code to write data to be written to the storage device;
A first error detection unit that performs an error detection process on the write data or read data from the storage device using the encoded data;
A first abnormality detection unit that generates a first abnormality detection signal indicating the presence or absence of an error included in the write data or the read data based on a result of the error detection process in the first error detection unit;
A failure site determination unit that determines which of the information processing device or the storage device is faulty,
The storage device
A data storage area for storing the write data supplied from the information processing apparatus;
An encoded data storage area for storing encoded data obtained by adding an error correction code to the write data;
A second error detection unit that performs an error detection process on the write data or the read data using the encoded data;
Based on the result of error detection processing in the second error detection unit, a second abnormality detection signal indicating the presence or absence of an error included in the write data or the read data is generated and supplied to the information processing apparatus A detection unit;
The information processing system, wherein the failure part determination unit determines which of the information processing device or the storage device is in failure based on the first abnormality detection signal and the second abnormality detection signal. .
前記故障部位判定部は、前記第1異常検出信号と前記第2異常検出信号とに基づいて、前記情報処理装置の故障又は前記記憶装置の故障又は前記ソケットと前記記憶装置との接続異常のいずれが生じているかを判定することを特徴とする請求項9に記載の情報処理システム。 The information processing apparatus includes a socket connected to the storage device,
The failure part determination unit is configured to detect either a failure of the information processing device, a failure of the storage device, or a connection failure between the socket and the storage device based on the first abnormality detection signal and the second abnormality detection signal. The information processing system according to claim 9, wherein it is determined whether or not an error has occurred.
前記記憶装置に接続されるソケットと、
前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて第1パリティデータを生成する第1パリティ生成部と、
前記第1パリティデータに基づいてデータの照合を行うパリティ照合部と、
を備え、
前記記憶装置は、
前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて第2パリティデータを生成する第2パリティ生成部を備え、
前記パリティ照合部は、前記第2パリティデータを受信し、前記第1パリティデータと前記第2パリティデータとを照合して、照合結果を示すパリティ信号を前記故障部位判定部に供給し、
前記故障部位判定部は、前記第1異常検出信号と前記第2異常検出信号と前記パリティ信号とに基づいて、前記情報処理装置の故障及び前記記憶装置の故障及び前記ソケットと前記記憶装置との間の接続異常のうちいずれが生じているかを判定することを特徴とする請求項9に記載の情報処理システム。 The information processing apparatus includes:
A socket connected to the storage device;
A first parity generation unit that generates first parity data based on the write data or the read data and the encoded data;
A parity verification unit that performs data verification based on the first parity data;
With
The storage device
A second parity generation unit that generates second parity data based on the write data or the read data and the encoded data;
The parity verification unit receives the second parity data, compares the first parity data and the second parity data, and supplies a parity signal indicating a verification result to the failure site determination unit;
The failure part determination unit is configured to determine whether the information processing device has failed, the storage device has failed, and the socket and the storage device have a failure based on the first abnormality detection signal, the second abnormality detection signal, and the parity signal. The information processing system according to claim 9, wherein any one of the connection abnormalities is determined.
前記記憶装置は、前記所定の端子に接続され、前記メモリ判定信号を受信して前記メモリ判定信号と同じ信号値の返信信号を前記メモリ判定部に送信する返信部を備え、
前記メモリ判定部は、前記所定の端子から前記判定信号と同じ信号値の前記返信信号を受信したか否かに基づいて、前記記憶装置が接続されているか否かを判定することを特徴とする請求項9乃至11のいずれか1に記載の情報処理システム。 The information processing apparatus includes a memory determination unit that transmits a memory determination signal for determining whether or not the storage device is connected to a predetermined terminal of the storage device,
The storage device includes a reply unit that is connected to the predetermined terminal, receives the memory judgment signal, and transmits a reply signal having the same signal value as the memory judgment signal to the memory judgment unit,
The memory determination unit determines whether the storage device is connected based on whether the return signal having the same signal value as the determination signal is received from the predetermined terminal. The information processing system according to any one of claims 9 to 11.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193234 | 2014-09-24 | ||
JP2014193234 | 2014-09-24 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016066337A true JP2016066337A (en) | 2016-04-28 |
Family
ID=55805624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015000822A Pending JP2016066337A (en) | 2014-09-24 | 2015-01-06 | Information processor, storage device, and information processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016066337A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10552261B2 (en) | 2017-06-02 | 2020-02-04 | Renesas Electronics Corporation | Semiconductor device and memory module |
-
2015
- 2015-01-06 JP JP2015000822A patent/JP2016066337A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10552261B2 (en) | 2017-06-02 | 2020-02-04 | Renesas Electronics Corporation | Semiconductor device and memory module |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI465897B (en) | Systems and methods for error checking and correcting for a memory module | |
US9191030B2 (en) | Memory controller, data storage device, and memory controlling method | |
US11646094B2 (en) | Memory system with error detection | |
US8566672B2 (en) | Selective checkbit modification for error correction | |
US8140945B2 (en) | Hard component failure detection and correction | |
KR102267860B1 (en) | Error correction hardware with fault detection | |
US7587658B1 (en) | ECC encoding for uncorrectable errors | |
WO2007136655A3 (en) | System to detect and identify errors in control information, read data and/or write data | |
JP2009527819A (en) | Memory transaction replay mechanism | |
US20120185752A1 (en) | Dram address protection | |
US8966338B2 (en) | Cyclic redundancy check code generating circuit, semiconductor memory device, and method of driving semiconductor memory device | |
JP2009181425A (en) | Memory module | |
JP2008090442A (en) | Memory control device | |
US8738989B2 (en) | Method and apparatus for detecting free page and a method and apparatus for decoding error correction code using the method and apparatus for detecting free page | |
KR20160046225A (en) | Cache memory with fault tolerance | |
TW202105182A (en) | Memory systems and writing methods of the memory systems | |
CN114237972A (en) | End-to-end ECC protection device and method for bus transmission | |
US20140317473A1 (en) | Implementing ecc redundancy using reconfigurable logic blocks | |
WO2015165202A1 (en) | Hamming code-based data access method and integrated random access memory | |
JP2016066337A (en) | Information processor, storage device, and information processing system | |
CN116935940A (en) | Error correction code verification | |
US8683308B2 (en) | Semiconductor device, information processing apparatus, and method of detecting error | |
US20190163569A1 (en) | Memory and method of operating the memory | |
JP2006301784A (en) | Programmable logic controller | |
US11809272B2 (en) | Error correction code offload for a serially-attached memory device |