JP2016066337A - Information processor, storage device, and information processing system - Google Patents

Information processor, storage device, and information processing system Download PDF

Info

Publication number
JP2016066337A
JP2016066337A JP2015000822A JP2015000822A JP2016066337A JP 2016066337 A JP2016066337 A JP 2016066337A JP 2015000822 A JP2015000822 A JP 2015000822A JP 2015000822 A JP2015000822 A JP 2015000822A JP 2016066337 A JP2016066337 A JP 2016066337A
Authority
JP
Japan
Prior art keywords
data
failure
storage device
information processing
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015000822A
Other languages
Japanese (ja)
Inventor
秀行 村上
Hideyuki Murakami
秀行 村上
正宏 近藤
Masahiro Kondo
正宏 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Publication of JP2016066337A publication Critical patent/JP2016066337A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)

Abstract

PURPOSE: To provide an information processor capable of determining which of an information processor and a storage device has broken down.CONSTITUTION: In an information processor on and to which a memory module is attachably and detachably mounted and connected, an ECC coding part adds an error correction code to data to generate coded data, and a first error detection part performs error detection and correction processing to the data, and a first abnormality detection part supplies a first abnormality detection signal indicting the presence/absence of an error included in the data to a failure portion determination part. The memory module includes: a second error detection part and a second abnormality detection part, and the second error detection part performs error detection and correction processing to the data separately from the information processor, and the second abnormality detection part supplies a second abnormality detection signal to the failure portion determination part on the basis of the result of the error detection and correction processing. The failure portion determination part determines which of the information processor main body and the memory module has broken down on the basis of the first abnormality detection signal and the second abnormality detection signal.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理装置、記憶装置及び情報処理システムに関する。   The present invention relates to an information processing device, a storage device, and an information processing system.

近年、情報処理に必要なメモリ容量の増大に伴い、マザーボード等の本体部分に着脱可能なDIMM(Dual Inline Memory Module)等のメモリモジュールを装着して接続することにより、データの書き込みや読み出しが行われている。その際、メモリモジュールの信頼性を高めるため、書き込み及び読み出しの対象となるデータに対して誤り検出訂正処理(ECC: Error Check and Correct)を行い、メモリモジュールの故障を検出することが行われている(例えば、特許文献1)。   In recent years, with the increase in memory capacity required for information processing, data can be written and read by attaching and connecting a removable memory module such as a DIMM (Dual Inline Memory Module) to the main body such as a motherboard. It has been broken. At that time, in order to improve the reliability of the memory module, error detection and correction processing (ECC: Error Check and Correct) is performed on the data to be written and read to detect a failure of the memory module. (For example, Patent Document 1).

かかる誤り検出訂正処理は、書き込み及び読み出しの対象となるデータに対し誤り訂正符号(ECC符号)を付加してECC符号化データを生成し、これを復号することによって行う。誤り検出訂正処理に対応したメモリモジュールは、通常のデータの記憶領域の他にECC符号化データのための記憶領域を有しており、情報処理装置は、メモリモジュールの当該記憶領域からECC符号化データを読み出して誤り検出訂正処理を行う。   Such error detection and correction processing is performed by adding error correction code (ECC code) to data to be written and read to generate ECC encoded data and decoding it. The memory module corresponding to the error detection / correction processing has a storage area for ECC encoded data in addition to a storage area for normal data, and the information processing apparatus performs ECC encoding from the storage area of the memory module. Data is read and error detection and correction processing is performed.

特開2012−198727号公報JP 2012-198727 A

しかし、誤り検出訂正処理に対応したメモリモジュールを用いる場合であっても、誤り検出訂正処理を実際に行うのはメモリモジュールではなく情報処理装置本体であるため、データの誤りを検出しても、それが情報処理装置本体内で生じたものかメモリモジュール内で生じたものかを判定することができない。したがって、情報処理装置又はメモリモジュールに故障が生じている可能性があることを検出することはできても、故障部位が情報処理装置本体なのかメモリモジュールなのかを特定することができず、故障部位を特定するためには別途調査が必要となる。また、故障部位が特定されるまでは情報処理装置本体及びメモリモジュールの双方が故障被疑状態となるため、どちらも使用することができないという問題があった。   However, even when using a memory module that supports error detection and correction processing, the error detection and correction processing is actually performed by the information processing apparatus body, not the memory module. It cannot be determined whether the error occurred in the information processing apparatus main body or in the memory module. Therefore, although it is possible to detect that a failure may have occurred in the information processing device or the memory module, it is not possible to specify whether the failure part is the information processing device main body or the memory module. A separate survey is required to identify the site. Further, since both the information processing apparatus main body and the memory module are in a suspicious failure state until the failure part is specified, there is a problem that neither of them can be used.

本発明は、上記問題点に鑑みてなされたものであり、データに対する誤り検出処理の結果に基づいて、情報処理装置と記憶装置のいずれが故障しているかを判定することが可能な情報処理装置を提供することを目的とする。   The present invention has been made in view of the above problems, and is an information processing apparatus capable of determining which one of the information processing apparatus and the storage device has failed based on the result of error detection processing on data. The purpose is to provide.

本発明による情報処理装置は、着脱可能に装着されて接続されている記憶装置との間でデータの書き込み及び読み出しを行う情報処理装置であって、前記記憶装置へのデータの書き込み及び前記記憶装置からのデータの読み出しを制御する制御部と、前記記憶装置に書き込む書き込みデータに誤り訂正符号を付加して符号化データを生成する符号化部と、前記符号化データを用いて、前記書き込みデータ又は前記記憶装置からの読み出しデータに対して誤り検出処理を行う誤り検出部と、前記記憶装置における誤り検出処理の結果を受信し、受信した前記記憶装置における誤り検出処理の結果と前記誤り検出部における誤り検出処理の結果とに基づいて、前記情報処理装置又は前記記憶装置のいずれが故障しているかを判定する故障部位判定部と、を備えることを特徴とする。   An information processing apparatus according to the present invention is an information processing apparatus that writes and reads data to and from a storage device that is detachably mounted and connected to the storage device, and writes the data to the storage device and the storage device A control unit that controls reading of data from the storage unit, an encoding unit that generates encoded data by adding an error correction code to the write data to be written to the storage device, and the write data or An error detection unit for performing error detection processing on read data from the storage device; and receiving an error detection processing result in the storage device; and receiving the error detection processing result in the storage device and the error detection unit Failure part determination for determining which of the information processing device or the storage device is failed based on the result of error detection processing Characterized in that it comprises a and.

また、本発明による記憶装置は、情報処理装置に着脱可能に装着され、前記情報処理装置から供給されたデータを記憶する記憶装置であって、前記情報処理装置から供給されたデータを記憶するデータ記憶領域と、前記データに誤り訂正符号を付加した符号化データを記憶する符号化データ記憶領域と、前記符号化データを用いて、前記データに対して誤り検出処理を行う誤り検出部とを備えることを特徴とする。   In addition, a storage device according to the present invention is a storage device that is detachably attached to an information processing device, stores data supplied from the information processing device, and stores data supplied from the information processing device A storage area; an encoded data storage area that stores encoded data obtained by adding an error correction code to the data; and an error detection unit that performs an error detection process on the data using the encoded data. It is characterized by that.

また、本発明による情報処理システムは、情報処理装置と、前記情報処理装置に着脱可能に装着され接続されている記憶装置とを含む情報処理システムであって、前記情報処理装置は、前記記憶装置へのデータの書き込み及び前記記憶装置からのデータの読み出しを制御する制御部と、前記記憶装置に書き込む書き込みデータに誤り訂正符号を付加して符号化データを生成する符号化部と、前記符号化データを用いて、前記書き込みデータ又は前記記憶装置からの読み出しデータに対して誤り検出処理を行う第1誤り検出部と、前記第1誤り検出部における前記誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第1異常検出信号を生成する第1異常検出部と、前記情報処理装置又は前記記憶装置のいずれが故障しているかを判定する故障部位判定部と、を備え、前記記憶装置は、前記情報処理装置から供給された前記書き込みデータを記憶するデータ記憶領域と、前記書き込みデータに誤り訂正符号を付加した符号化データを記憶する符号化データ記憶領域と、前記符号化データを用いて、前記書き込みデータ又は前記読み出しデータに対して誤り検出処理を行う第2誤り検出部と、前記第2誤り検出部における誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第2異常検出信号を生成して前記情報処理装置に供給する第2異常検出部と、を備え、前記故障部位判定部は、前記第1異常検出信号と前記第2異常検出信号とに基づいて、情報処理装置又は前記記憶装置のいずれが故障しているかを判定することを特徴とする。   An information processing system according to the present invention is an information processing system including an information processing device and a storage device that is detachably attached to the information processing device, and the information processing device includes the storage device. A control unit that controls writing of data to and reading of data from the storage device, an encoding unit that generates encoded data by adding an error correction code to the write data to be written to the storage device, and the encoding A first error detection unit that performs an error detection process on the write data or read data from the storage device using data, and the write based on a result of the error detection process in the first error detection unit A first abnormality detection unit that generates a first abnormality detection signal indicating the presence or absence of an error included in the data or the read data; A failure location determination unit that determines which of the storage devices is faulty, wherein the storage device stores a data storage area for storing the write data supplied from the information processing device, and an error in the write data An encoded data storage area for storing encoded data to which a correction code is added; a second error detection unit that performs error detection processing on the write data or the read data using the encoded data; A second abnormality detection unit that generates a second abnormality detection signal indicating the presence or absence of an error included in the write data or the read data based on the result of the error detection process in the two error detection unit and supplies the second abnormality detection signal to the information processing apparatus And the failure site determination unit based on the first abnormality detection signal and the second abnormality detection signal based on the information processing device or the storage device And judging whether one is faulty.

本発明によれば、データに対する誤り検出処理の結果に基づいて、情報処理装置と記憶装置のいずれが故障しているかを判定することが可能となる。   According to the present invention, it is possible to determine which of the information processing device and the storage device is out of order based on the result of error detection processing on data.

本発明の実施例1の情報処理装置及びメモリモジュールの構成を示すブロック図である。It is a block diagram which shows the structure of the information processing apparatus and memory module of Example 1 of this invention. データの書き込み時に情報処理装置及びメモリモジュールが行うデータの供給を示す図である。It is a figure which shows supply of the data which an information processing apparatus and a memory module perform at the time of data writing. 実施例1の故障部位判定における判定テーブルを示す図である。It is a figure which shows the determination table in the failure site | part determination of Example 1. FIG. データの読み出し時に情報処理装置及びメモリモジュールが行うデータの供給を示す図である。It is a figure which shows supply of the data which an information processing apparatus and a memory module perform at the time of data reading. 実施例2の情報処理装置、メモリモジュール及びソケットの構成を示すブロック図である。6 is a block diagram illustrating configurations of an information processing apparatus, a memory module, and a socket according to Embodiment 2. FIG. 実施例2の故障部位判定における判定テーブルを示す図である。It is a figure which shows the determination table in the failure site | part determination of Example 2. FIG. 実施例2においてデータ書き込み時とデータ読み出し時の故障部位判定を組み合わせた場合の判定テーブルの一例を示す図である。It is a figure which shows an example of the determination table at the time of combining the failure location determination at the time of data writing and data reading in Example 2. FIG. 実施例3の情報処理装置、メモリモジュール及びソケットの構成を示すブロック図である。FIG. 10 is a block diagram illustrating configurations of an information processing apparatus, a memory module, and a socket according to a third embodiment. 実施例3においてデータの書き込み時に情報処理装置及びメモリモジュールが行うデータの供給を示す図である。FIG. 10 is a diagram illustrating data supply performed by the information processing apparatus and the memory module when data is written in the third embodiment. 実施例3におけるデータ書き込み時の故障部位判定の判定テーブルを示す図である。It is a figure which shows the determination table of the failure location determination at the time of the data writing in Example 3. FIG. 実施例3においてデータの読み出し時に情報処理装置及びメモリモジュールが行うデータの供給を示す図である。FIG. 10 is a diagram illustrating data supply performed by the information processing apparatus and the memory module when data is read in the third embodiment. 実施例3におけるデータ読み出し時の故障部位判定の判定テーブルを示す図である。It is a figure which shows the determination table of the failure location determination at the time of the data reading in Example 3. FIG.

以下、本発明の実施例を図面を参照しつつ詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、情報処理装置10及びメモリモジュール20からなる情報処理システムの構成を示すブロック図である。   FIG. 1 is a block diagram illustrating a configuration of an information processing system including the information processing apparatus 10 and the memory module 20.

情報処理装置10は、制御部11、ECC部12及びエラー収集/メモリ判定部17を含む。情報処理装置10には、メモリモジュール20が着脱可能に装着されて接続される。情報処理装置10は、メモリモジュール20に対してデータの書き込み及び読み出しを行う。   The information processing apparatus 10 includes a control unit 11, an ECC unit 12, and an error collection / memory determination unit 17. A memory module 20 is detachably attached to the information processing apparatus 10 and connected thereto. The information processing apparatus 10 writes and reads data to and from the memory module 20.

制御部11は、CPU(Central Processing Unit)等からなるマイクロプロセッサであり、情報処理装置10の各部の制御を行う。また、制御部11は、バスラインBLを介してメモリモジュール20との間でデータの授受を行い、メモリモジュール20に対するデータの書き込み及び読み出しを制御する。   The control unit 11 is a microprocessor including a CPU (Central Processing Unit) and the like, and controls each unit of the information processing apparatus 10. The control unit 11 exchanges data with the memory module 20 via the bus line BL, and controls writing and reading of data to and from the memory module 20.

ECC部12は、ECC符号化部13、第1誤り検出部14、第1異常検出部15及び故障部位判定部16を含む。   The ECC unit 12 includes an ECC encoding unit 13, a first error detection unit 14, a first abnormality detection unit 15, and a failure site determination unit 16.

ECC符号化部13は、メモリモジュール20へのデータの書き込み時にデータに対して誤り訂正符号化処理を施し、符号化データCDを生成する。誤り訂正符号化処理は、例えばハミング符号を用いて行う。   The ECC encoding unit 13 performs error correction encoding processing on the data when writing the data to the memory module 20 to generate encoded data CD. The error correction coding process is performed using, for example, a Hamming code.

第1誤り検出部14は、符号化データCDを復号化し、データに対して誤り検出訂正処理(ECC: Error Check and Correct)を行う。第1誤り検出部14は、誤り検出の結果を示す誤り検出信号ES1を第1異常検出部15に供給する。   The first error detection unit 14 decodes the encoded data CD and performs error detection and correction processing (ECC: Error Check and Correct) on the data. The first error detection unit 14 supplies an error detection signal ES1 indicating the result of error detection to the first abnormality detection unit 15.

第1異常検出部15は、第1誤り検出部14における誤り検出訂正処理の結果に基づいて、データに含まれる誤り(以下、データ異常と称する)の有無を示す2値(0、1)の第1異常検出信号AS1を生成し、故障部位判定部16に供給する。   The first abnormality detection unit 15 is a binary (0, 1) indicating whether or not there is an error (hereinafter referred to as data abnormality) included in the data based on the result of the error detection and correction process in the first error detection unit 14. The first abnormality detection signal AS1 is generated and supplied to the failure site determination unit 16.

故障部位判定部16は、第1異常検出部15から第1異常検出信号AS1の供給を受ける一方、メモリモジュール20の第2異常検出部24から第2異常検出信号AS2を受信する。故障部位判定部16は、第1異常検出信号AS1及び第2異常検出信号AS2の組合せによって、情報処理装置10の本体の故障(以下、本体故障と称する)とメモリモジュール20の故障(以下、メモリ故障と称する)のいずれが生じているのかを判定する。   The failure part determination unit 16 receives the first abnormality detection signal AS1 from the first abnormality detection unit 15 and receives the second abnormality detection signal AS2 from the second abnormality detection unit 24 of the memory module 20. The failure site determination unit 16 uses a combination of the first abnormality detection signal AS1 and the second abnormality detection signal AS2 to cause a failure of the main body of the information processing apparatus 10 (hereinafter referred to as main body failure) and a failure of the memory module 20 (hereinafter referred to as memory). (Referred to as failure).

故障部位判定部16は、判定結果を示す故障部位判定信号FSをエラー収集/メモリ判定部17に供給する。   The failure part determination unit 16 supplies a failure part determination signal FS indicating the determination result to the error collection / memory determination unit 17.

エラー収集/メモリ判定部17は、故障部位判定部16から供給された故障部位判定信号FSを蓄積し、エラー情報EIとして記憶する。エラー収集/メモリ判定部17は、制御部11からの求めに応じてエラー情報EIを制御部11に供給する。   The error collection / memory determination unit 17 accumulates the failure part determination signal FS supplied from the failure part determination unit 16 and stores it as error information EI. The error collection / memory determination unit 17 supplies error information EI to the control unit 11 in response to a request from the control unit 11.

また、エラー収集/メモリ判定部17は、情報処理装置10に接続されているメモリモジュールが本発明に係るメモリモジュール20かどうかを判定するメモリ判定処理を行う。   Further, the error collection / memory determination unit 17 performs a memory determination process for determining whether or not the memory module connected to the information processing apparatus 10 is the memory module 20 according to the present invention.

エラー収集/メモリ判定部17は、メモリ判定信号JSをメモリモジュール20の端子NC1に送信し、端子NC2からメモリ判定信号JSと同じ信号値を有する返信信号RSを受信したか否かに応じてメモリ判定処理を行う。エラー収集/メモリ判定部17は、判定結果を示す情報をメモリ情報MIとして制御部11に供給する。   The error collection / memory determination unit 17 transmits the memory determination signal JS to the terminal NC1 of the memory module 20, and the memory according to whether or not the return signal RS having the same signal value as the memory determination signal JS is received from the terminal NC2. Judgment processing is performed. The error collection / memory determination unit 17 supplies information indicating the determination result to the control unit 11 as memory information MI.

メモリモジュール20は、DIMM(Dual Inline Memory Module)等からなる記憶装置であり、情報処理装置10のマザーボードに着脱可能に装着され、情報処理装置10と接続される。メモリモジュール20は、データ記憶領域21、符号化データ記憶領域22、第2誤り検出部23、第2異常検出部24、双方向バッファ26及び27を含む。   The memory module 20 is a storage device composed of a DIMM (Dual Inline Memory Module) or the like, is detachably mounted on the motherboard of the information processing apparatus 10, and is connected to the information processing apparatus 10. The memory module 20 includes a data storage area 21, an encoded data storage area 22, a second error detection unit 23, a second abnormality detection unit 24, and bidirectional buffers 26 and 27.

データ記憶領域21は、制御部11から供給されたデータを記憶する。符号化データ記憶領域22は、ECC符号化部13において生成された符号化データCDを記憶する。   The data storage area 21 stores data supplied from the control unit 11. The encoded data storage area 22 stores the encoded data CD generated by the ECC encoding unit 13.

第2誤り検出部23は、符号化データCDを復号化し、データに対して誤り検出訂正処理を行う。第2誤り検出部23は、誤り検出の結果を示す第2誤り検出信号ES2を第2異常検出部24に供給する。   The second error detection unit 23 decodes the encoded data CD and performs error detection and correction processing on the data. The second error detection unit 23 supplies a second error detection signal ES2 indicating a result of error detection to the second abnormality detection unit 24.

第2異常検出部24は、第2誤り検出部23から供給された第2誤り検出信号ES2に基づいて、データに含まれる誤り、すなわちデータ異常の有無を示す2値(0、1)の第2異常検出信号AS2を生成し、故障部位判定部16に供給する。   Based on the second error detection signal ES2 supplied from the second error detection unit 23, the second abnormality detection unit 24 is a binary (0, 1) value indicating an error included in the data, that is, the presence or absence of the data abnormality. (2) The abnormality detection signal AS2 is generated and supplied to the failure site determination unit 16.

メモリ判定信号返信部25は、通常のDIMMでは未使用とされている端子NC1、NC2に接続されている。メモリ判定信号返信部25は、エラー収集/メモリ判定部17からのメモリ判定信号JSを端子NC1を介して受信すると、受信したメモリ判定信号JSと同じ信号値を有する返信信号RSを、端子NC2を介してエラー収集/メモリ判定部17に送信する。   The memory determination signal reply unit 25 is connected to terminals NC1 and NC2 that are not used in a normal DIMM. When the memory judgment signal reply unit 25 receives the memory judgment signal JS from the error collection / memory judgment unit 17 via the terminal NC1, the memory judgment signal reply unit 25 sends the reply signal RS having the same signal value as the received memory judgment signal JS to the terminal NC2. To the error collection / memory determination unit 17.

双方向バッファ26は、データの書き込み時に情報処理装置10から供給されたデータをデータ記憶領域21に供給する。また、双方向バッファ26は、データの読み出し時にデータ記憶領域21から読み出されたデータを情報処理装置10に供給する。   The bidirectional buffer 26 supplies data supplied from the information processing apparatus 10 to the data storage area 21 when data is written. Further, the bidirectional buffer 26 supplies the data read from the data storage area 21 to the information processing apparatus 10 when reading data.

双方向バッファ27は、データの書き込み時に情報処理装置10から供給された符号化データCDを符号化データ記憶領域22に供給する。また、双方向バッファ27は、データの読み出し時に符号化データ記憶領域22から読み出された符号化データCDを情報処理装置10に供給する。   The bidirectional buffer 27 supplies the encoded data CD supplied from the information processing apparatus 10 at the time of data writing to the encoded data storage area 22. The bidirectional buffer 27 supplies the encoded data CD read from the encoded data storage area 22 to the information processing apparatus 10 when reading data.

次に、データの書き込み時における情報処理装置10及びメモリモジュール20の動作について、図2及び図3(a)を参照して説明する。   Next, operations of the information processing apparatus 10 and the memory module 20 at the time of data writing will be described with reference to FIG. 2 and FIG.

[データ書き込み時]
制御部11は、書き込みデータNDをメモリモジュール20のデータ記憶領域21に供給する。データ記憶領域21は、書き込みデータNDを記憶する。また、制御部11は、書き込みデータNDを、ECC符号化部13、第1誤り検出部14、メモリモジュール20の第2誤り検出部23に供給する。
[When writing data]
The control unit 11 supplies the write data ND to the data storage area 21 of the memory module 20. The data storage area 21 stores write data ND. The control unit 11 also supplies the write data ND to the ECC encoding unit 13, the first error detection unit 14, and the second error detection unit 23 of the memory module 20.

ECC符号化部13は、制御部11から供給された書き込みデータNDに基づいて符号化データCDを生成する。ECC符号化部13は、第1誤り検出部14、メモリモジュール20の符号化データ記憶領域22及び第2誤り検出部23に、符号化データCDを供給する。   The ECC encoding unit 13 generates encoded data CD based on the write data ND supplied from the control unit 11. The ECC encoder 13 supplies the encoded data CD to the first error detector 14, the encoded data storage area 22 of the memory module 20, and the second error detector 23.

第1誤り検出部14は、符号化データCDを復号化し、復号化したデータを用いて、書き込みデータNDに対して誤り検出訂正処理を行う。第1誤り検出部14は、誤り検出の結果を示す第1誤り検出信号ES1を第1異常検出部15に供給する。   The first error detection unit 14 decodes the encoded data CD, and performs error detection and correction processing on the write data ND using the decoded data. The first error detection unit 14 supplies a first error detection signal ES1 indicating the error detection result to the first abnormality detection unit 15.

第1異常検出部15は、第1誤り検出信号ES1に基づいて、書き込みデータNDに生じている誤り、すなわち書き込みデータNDにおけるデータ異常の有無を示す2値(0、1)の第1異常検出信号AS1を生成し、故障部位判定部16に供給する。   Based on the first error detection signal ES1, the first anomaly detector 15 detects an error occurring in the write data ND, that is, a binary (0, 1) first anomaly that indicates the presence or absence of data anomaly in the write data ND A signal AS <b> 1 is generated and supplied to the failure site determination unit 16.

メモリモジュール20の第2誤り検出部23は、ECC符号化部13から供給された符号化データCDを復号化する。メモリモジュール20は、復号化した符号化データCDを用いて、書き込みデータNDに対して誤り検出訂正処理を行う。   The second error detection unit 23 of the memory module 20 decodes the encoded data CD supplied from the ECC encoding unit 13. The memory module 20 performs error detection and correction processing on the write data ND using the decoded encoded data CD.

第2誤り検出部23は、誤り検出の結果を示す第2誤り検出信号ES2を第2異常検出部24に供給する。   The second error detection unit 23 supplies a second error detection signal ES2 indicating a result of error detection to the second abnormality detection unit 24.

第2異常検出部24は、第2誤り検出信号ES2に基づいて、書き込みデータNDにおけるデータ異常の有無を示す2値(0、1)の第2異常検出信号AS2を生成し、故障部位判定部16に供給する。   Based on the second error detection signal ES2, the second abnormality detection unit 24 generates a second (0, 1) second abnormality detection signal AS2 indicating the presence / absence of data abnormality in the write data ND, and a failure part determination unit 16 is supplied.

故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1及び第2異常検出部24から供給された第2異常検出信号AS2に基づいて、本体故障又はメモリ故障のいずれが生じているかを判定する。   Based on the first abnormality detection signal AS1 supplied from the first abnormality detection unit 15 and the second abnormality detection signal AS2 supplied from the second abnormality detection unit 24, the failure site determination unit 16 Determine which is occurring.

図3(a)は、データの書き込み時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。   FIG. 3A is a diagram illustrating a determination table for failure site determination performed by the failure site determination unit 16 when data is written.

故障部位判定部16は、AS1の信号値が0か1かに基づいて、本体故障が生じているか否かを判定する。例えば、AS1が0の場合、故障部位判定部16は、本体故障は生じていないと判定する。AS1が1の場合、故障部位判定部16は、本体故障が生じていると判定する。   The failure part determination unit 16 determines whether or not a main body failure has occurred based on whether the signal value of AS1 is 0 or 1. For example, when AS1 is 0, the failure part determination unit 16 determines that a main body failure has not occurred. When AS1 is 1, the failure part determination unit 16 determines that a main body failure has occurred.

また、故障部位判定部16は、AS1とAS2の信号値が同じであるか否かに基づいて、メモリ故障が生じているか否かを判定する。例えば、AS1とAS2が同じ信号値である場合、故障部位判定部16は、メモリ故障は生じていないと判定する。AS1とAS2が異なる信号値である場合、故障部位判定部16は、メモリ故障が生じていると判定する。   Further, the failure site determination unit 16 determines whether or not a memory failure has occurred based on whether or not the signal values of AS1 and AS2 are the same. For example, when AS1 and AS2 have the same signal value, the failure site determination unit 16 determines that no memory failure has occurred. When AS1 and AS2 are different signal values, the failure site determination unit 16 determines that a memory failure has occurred.

具体的には、例えばAS1及びAS2がともに0の場合、情報処理装置10でもメモリモジュール20でもデータ異常が検出されていないため、故障部位判定部16は本体故障とメモリ故障のいずれも生じていないと判定する。   Specifically, for example, when AS1 and AS2 are both 0, no data abnormality is detected in either the information processing apparatus 10 or the memory module 20, and therefore the failure part determination unit 16 has neither a main body failure nor a memory failure. Is determined.

AS1が0で且つAS2が1の場合、第1異常検出部15ではデータ異常が検出されず、第2異常検出部24でデータ異常が検出されていることから、故障部位判定部16は、本体故障は生じておらず、メモリ故障が生じていると判定する。   When AS1 is 0 and AS2 is 1, the first abnormality detection unit 15 detects no data abnormality and the second abnormality detection unit 24 detects the data abnormality. It is determined that no memory failure has occurred and no memory failure has occurred.

AS1が1で且つAS2が0の場合、第1異常検出部15でデータ異常が検出されているため、故障部位判定部16は、本体故障が生じていると判定する。一方、本来データ異常が検出されるべき第2異常検出部24においてデータ異常が検出されていないことから、故障部位判定部16は、メモリ故障も生じていると判定する。   When AS1 is 1 and AS2 is 0, since the data abnormality is detected by the first abnormality detection unit 15, the failure part determination unit 16 determines that a main body failure has occurred. On the other hand, since no data abnormality is detected in the second abnormality detection unit 24 where a data abnormality should be detected, the failure part determination unit 16 determines that a memory failure has also occurred.

AS1が1で且つAS2が1の場合、第1異常検出部15でデータ異常が検出され、そのデータ異常が第2異常検出部24でもそのまま検出されていることから、故障部位判定部16は、本体故障が生じており、メモリ故障は生じていないと判定する。   When AS1 is 1 and AS2 is 1, since the data abnormality is detected by the first abnormality detection unit 15 and the data abnormality is also detected as it is by the second abnormality detection unit 24, the failure site determination unit 16 It is determined that a main unit failure has occurred and no memory failure has occurred.

故障部位判定部16は、判定結果を示す故障部位判定信号FSをエラー収集/メモリ判定部17に供給する。   The failure part determination unit 16 supplies a failure part determination signal FS indicating the determination result to the error collection / memory determination unit 17.

次に、データの読み出し時における情報処理装置10及びメモリモジュール20の動作について、図4及び図3(b)を参照して説明する。   Next, operations of the information processing apparatus 10 and the memory module 20 when reading data will be described with reference to FIGS. 4 and 3B.

[データ読み出し時]
制御部11は、メモリモジュール20のデータ記憶領域21から読み出しデータRDを読み出し、第1誤り検出部14と第2誤り検出部23に供給する。また、制御部11は、読み出しデータRDに対応する符号化データCDを符号化データ記憶領域22から読み出し、第1誤り検出部14と第2誤り検出部23に供給する。
[When reading data]
The control unit 11 reads the read data RD from the data storage area 21 of the memory module 20 and supplies the read data RD to the first error detection unit 14 and the second error detection unit 23. Further, the control unit 11 reads out the encoded data CD corresponding to the read data RD from the encoded data storage area 22 and supplies it to the first error detector 14 and the second error detector 23.

第2誤り検出部23は、符号化データCDを復号化し、復号化した符号化データCDを用いて、読み出しデータRDに対して誤り検出訂正処理を行う。第2誤り検出部23は、誤り検出の結果を示す第2誤り検出信号ES2を第2異常検出部24に供給する。   The second error detection unit 23 decodes the encoded data CD and performs error detection and correction processing on the read data RD using the decoded encoded data CD. The second error detection unit 23 supplies a second error detection signal ES2 indicating a result of error detection to the second abnormality detection unit 24.

第2異常検出部24は、第2誤り検出部23から供給された第2誤り検出信号ES2に基づいて、読み出しデータRDに含まれる誤り、すなわち読み出しデータRDにおけるデータ異常の有無を示す2値(0、1)の第2異常検出信号AS2を生成し、故障部位判定部16に供給する。   Based on the second error detection signal ES2 supplied from the second error detection unit 23, the second abnormality detection unit 24 has a binary value indicating the error included in the read data RD, that is, the presence or absence of data abnormality in the read data RD ( 0, 1) of the second abnormality detection signal AS2 is generated and supplied to the failure site determination unit 16.

第1誤り検出部14は、符号化データ記憶領域22から読み出された符号化データCDを復号化し、復号化した符号化データCDを用いて、読み出しデータRDに対して誤り検出訂正処理を行う。   The first error detection unit 14 decodes the encoded data CD read from the encoded data storage area 22, and performs error detection / correction processing on the read data RD using the decoded encoded data CD. .

第1誤り検出部14は、誤り検出の結果を示す第1誤り検出信号ES1を第1異常検出部15に供給する。   The first error detection unit 14 supplies a first error detection signal ES1 indicating the error detection result to the first abnormality detection unit 15.

第1異常検出部15は、第1誤り検出部14から供給された第1誤り検出信号ES1に基づいて、読み出しデータRDにおけるデータ異常の有無を示す2値(0、1)の第1異常検出信号AS1を生成し、故障部位判定部16に供給する。   Based on the first error detection signal ES1 supplied from the first error detection unit 14, the first abnormality detection unit 15 is a binary (0, 1) first abnormality detection indicating the presence or absence of data abnormality in the read data RD. A signal AS <b> 1 is generated and supplied to the failure site determination unit 16.

故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1及び第2異常検出部24から供給された第2異常検出信号AS2に基づいて、本体故障又はメモリ故障のいずれが生じているかを判定する。   Based on the first abnormality detection signal AS1 supplied from the first abnormality detection unit 15 and the second abnormality detection signal AS2 supplied from the second abnormality detection unit 24, the failure site determination unit 16 Determine which is occurring.

図3(b)は、データの読み出し時に故障部位判定部16が行う上記判定の判定テーブルを示す図である。   FIG. 3B is a diagram illustrating a determination table for the determination performed by the failure site determination unit 16 when reading data.

故障部位判定部16は、AS2の信号値が0か1かに基づいて、メモリ故障が生じているか否かを判定する。例えば、AS2が0の場合、故障部位判定部16は、メモリ故障は生じていないと判定する。AS2が1の場合、故障部位判定部16は、メモリ故障が生じていると判定する。   The failure site determination unit 16 determines whether or not a memory failure has occurred based on whether the signal value of AS2 is 0 or 1. For example, when AS2 is 0, the failure site determination unit 16 determines that no memory failure has occurred. When AS2 is 1, the failure site determination unit 16 determines that a memory failure has occurred.

また、故障部位判定部16は、AS1とAS2の信号値が同じであるか否かに基づいて、本体故障が生じているか否かを判定する。例えば、AS2とAS1が同じ信号値である場合、本体故障は生じていないと判定する。AS1とAS2が異なる信号値である場合、故障部位判定部16は、本体故障が生じていると判定する。   Moreover, the failure part determination part 16 determines whether the main body failure has arisen based on whether the signal value of AS1 and AS2 is the same. For example, when AS2 and AS1 have the same signal value, it is determined that no main body failure has occurred. When AS1 and AS2 are different signal values, the failure part determination unit 16 determines that a main body failure has occurred.

具体的には、例えばAS1及びAS2がともに0の場合、メモリモジュール20でも情報処理装置10でもデータ異常が検出されていないため、故障部位判定部16はメモリ故障と本体故障のいずれも生じていないと判定する。   Specifically, for example, when AS1 and AS2 are both 0, no data abnormality is detected in either the memory module 20 or the information processing apparatus 10, and therefore the failure site determination unit 16 has neither a memory failure nor a main body failure. Is determined.

AS1が0で且つAS2が1の場合、第2異常検出部24でデータ異常が検出されているにもかかわらず第1異常検出部15ではデータ異常が検出されていないことから、故障部位判定部16は、本体故障とメモリ故障のいずれもが生じていると判定する。   When AS1 is 0 and AS2 is 1, a data abnormality is not detected by the first abnormality detection unit 15 even though a data abnormality is detected by the second abnormality detection unit 24. 16 determines that both a main body failure and a memory failure have occurred.

AS1が1で且つAS2が0の場合、第2異常検出部24ではデータ異常が検出されず、第1異常検出部15でデータ異常が検出されていることから、故障部位判定部16は、メモリ故障は生じておらず、本体故障が生じていると判定する。   When AS1 is 1 and AS2 is 0, no data abnormality is detected by the second abnormality detection unit 24, and data abnormality is detected by the first abnormality detection unit 15, so that the failure site determination unit 16 stores the memory It is determined that no failure has occurred and a main unit failure has occurred.

AS1が1で且つAS2が1の場合、第2異常検出部24でデータ異常が検出され、その異常が第1異常検出部15でもそのまま検出されていることから、故障部位判定部16は、メモリ故障が生じており、本体故障は生じていないと判定する。   When AS1 is 1 and AS2 is 1, since the data abnormality is detected by the second abnormality detection unit 24 and the abnormality is also detected as it is by the first abnormality detection unit 15, the failure site determination unit 16 stores the memory It is determined that a failure has occurred and no main unit failure has occurred.

次に、エラー収集/メモリ判定部17が行うメモリ判定の動作について説明する。   Next, the memory determination operation performed by the error collection / memory determination unit 17 will be described.

[メモリ判定]
エラー収集/メモリ判定部17は、情報処理装置10の電源投入直後又はメモリモジュールが接続された直後に、メモリ判定信号JSをメモリモジュールに対して送信する。
[Memory judgment]
The error collection / memory determination unit 17 transmits a memory determination signal JS to the memory module immediately after the information processing apparatus 10 is powered on or immediately after the memory module is connected.

エラー収集/メモリ判定部17は、まず「0」の信号値を有するメモリ判定信号JSを、メモリモジュール20の端子NC1に向けて送信する。   The error collection / memory determination unit 17 first transmits a memory determination signal JS having a signal value of “0” to the terminal NC 1 of the memory module 20.

エラー収集/メモリ判定部17は、端子NC2から信号値「0」の返信信号RSを受信しない場合、接続されているメモリモジュールは本発明に係るメモリモジュール20ではないと判定する。端子NC2から信号値「0」の返信信号RSを受信した場合、エラー収集/メモリ判定部17は、さらに信号値「1」のメモリ判定信号JSを送信する。   When the error collection / memory determination unit 17 does not receive the return signal RS having the signal value “0” from the terminal NC2, the error collection / memory determination unit 17 determines that the connected memory module is not the memory module 20 according to the present invention. When the reply signal RS having the signal value “0” is received from the terminal NC2, the error collection / memory determination unit 17 further transmits the memory determination signal JS having the signal value “1”.

エラー収集/メモリ判定部17は、端子NC2から信号値「1」の返信信号RSを受信しない場合、接続されているメモリモジュールは本発明に係るメモリモジュール20ではないと判定する。端子NC2から信号値「1」の返信信号RSを受信した場合、エラー収集/メモリ判定部17は、接続されているメモリモジュールは本発明に係るメモリモジュール20であると判定する。   When the error collection / memory determination unit 17 does not receive the return signal RS with the signal value “1” from the terminal NC2, the error collection / memory determination unit 17 determines that the connected memory module is not the memory module 20 according to the present invention. When the reply signal RS having the signal value “1” is received from the terminal NC2, the error collection / memory determination unit 17 determines that the connected memory module is the memory module 20 according to the present invention.

エラー収集/メモリ判定部17は、接続されているメモリモジュールが本発明に係るメモリモジュール20か否かを示すメモリ情報MIを、制御部11に供給する。   The error collection / memory determination unit 17 supplies memory information MI indicating whether or not the connected memory module is the memory module 20 according to the present invention to the control unit 11.

接続されているメモリモジュールが本発明に係るメモリモジュール20である場合、制御部11は、故障部位判定部16を制御して故障部位の判定処理を実行させる。接続されているメモリモジュールが通常のメモリモジュールである場合、制御部11は、故障部位の判定処理を行わないよう故障部位判定部16を制御する。   When the connected memory module is the memory module 20 according to the present invention, the control unit 11 controls the failure part determination unit 16 to execute a failure part determination process. When the connected memory module is a normal memory module, the control unit 11 controls the failure site determination unit 16 so as not to perform the failure site determination process.

以上説明したように、本発明に係る情報処理装置10は、故障判定部16を備える。故障判定部16は、情報処理装置10での誤り検出訂正処理の結果を示す第1異常検出信号AS1と、メモリモジュール20での誤り検出訂正処理の結果を示す第2異常検出信号AS2とを受信し、これらに基づいて故障部位の判定を行う。   As described above, the information processing apparatus 10 according to the present invention includes the failure determination unit 16. The failure determination unit 16 receives the first abnormality detection signal AS1 indicating the result of the error detection and correction process in the information processing apparatus 10 and the second abnormality detection signal AS2 indicating the result of the error detection and correction process in the memory module 20. And based on these, the failure part is determined.

したがって、情報処理装置内での誤り検出訂正処理の結果とメモリモジュール内での誤り検出訂正処理の結果とに基づいて、本体故障が生じているかメモリ故障が生じているかを判定することができる。   Therefore, based on the result of the error detection and correction process in the information processing apparatus and the result of the error detection and correction process in the memory module, it can be determined whether a main body failure or a memory failure has occurred.

また、メモリモジュール20は、第2誤り検出部23を有し、情報処理装置10において行われる誤り検出訂正処理とは別に誤り検出訂正処理を行う。したがって、情報処理装置10において、情報処理装置10における誤り検出訂正処理の結果とメモリモジュール20での誤り検出訂正処理の結果とに基づいて故障部位の判定を行うことが可能となる。   In addition, the memory module 20 includes a second error detection unit 23 and performs error detection and correction processing separately from the error detection and correction processing performed in the information processing apparatus 10. Therefore, in the information processing apparatus 10, it is possible to determine a failure site based on the result of the error detection and correction process in the information processing apparatus 10 and the result of the error detection and correction process in the memory module 20.

また、本発明に係る情報処理装置10は、接続されているメモリモジュールが本発明に係るメモリモジュール20かどうかを判定し、通常のメモリモジュールが接続されていると判定した場合には、故障部位の判定処理を行わない。したがって、通常のメモリモジュールが接続された場合、通常の情報処理装置として動作することが可能である。   In addition, the information processing apparatus 10 according to the present invention determines whether or not the connected memory module is the memory module 20 according to the present invention, and determines that the normal memory module is connected. The determination process is not performed. Therefore, when a normal memory module is connected, it can operate as a normal information processing apparatus.

なお、エラー収集/メモリ判定部17は、「0」の信号値を有するメモリ判定信号JS及び返信信号RSの送受信の後、さらに「1」の信号値を有するメモリ判定信号JS及び返信信号RSを送受信して、メモリ判定を行っている。したがって、偶然同じ信号値の信号を受信した場合等における誤判定を防止することができる。   The error collection / memory determination unit 17 transmits and receives the memory determination signal JS having a signal value of “0” and the reply signal RS, and further sends the memory determination signal JS having a signal value of “1” and the reply signal RS. The memory judgment is performed by transmitting and receiving. Therefore, it is possible to prevent erroneous determination when, for example, a signal having the same signal value is received by accident.

図5は、実施例2における情報処理システムの構成を示すブロック図である。本実施例の情報処理装置10は、情報処理装置10とメモリモジュール20との接続を媒介するソケット30を含む。ソケット30以外の構成は、図1に示す実施例1のものと同様である。   FIG. 5 is a block diagram illustrating a configuration of the information processing system according to the second embodiment. The information processing apparatus 10 according to the present exemplary embodiment includes a socket 30 that mediates connection between the information processing apparatus 10 and the memory module 20. The configuration other than the socket 30 is the same as that of the first embodiment shown in FIG.

ソケット30は、例えば情報処理装置10のマザーボードに設けられた差込口の形状を有し、メモリモジュール20と嵌合して、情報処理装置10とメモリモジュール20との間の接続を媒介する。   The socket 30 has, for example, a shape of an insertion port provided on the motherboard of the information processing apparatus 10, and is fitted with the memory module 20 to mediate connection between the information processing apparatus 10 and the memory module 20.

情報処理装置10とメモリモジュール20を接続する際、メモリモジュール20とソケット30との間の嵌合異常等に起因して、情報処理装置10とメモリモジュール20の間に接続不良が生じる場合がある。当該接続不良は、データに誤りが生じる原因となる。   When the information processing apparatus 10 and the memory module 20 are connected, a connection failure may occur between the information processing apparatus 10 and the memory module 20 due to a fitting abnormality between the memory module 20 and the socket 30. . The connection failure causes an error in data.

本実施例における故障部位判定部16は、本体故障及びメモリ故障のいずれが生じているかに加えて、情報処理装置10とメモリモジュール20との間に接続不良が生じていないかを判定する。以下、データの書き込み時及び読み出し時における故障部位判定部16の判定動作について説明する。   The failure part determination unit 16 in this embodiment determines whether a connection failure has occurred between the information processing apparatus 10 and the memory module 20 in addition to whether a main body failure or a memory failure has occurred. Hereinafter, the determination operation of the failure site determination unit 16 at the time of data writing and data reading will be described.

[データ書き込み時]
故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1及び第2異常検出部24から供給された第2異常検出信号AS2に基づいて、本体故障が生じているのか、接続不良又はメモリ故障が生じているのかを判定する。
[When writing data]
The failure site determination unit 16 has a main body failure based on the first abnormality detection signal AS1 supplied from the first abnormality detection unit 15 and the second abnormality detection signal AS2 supplied from the second abnormality detection unit 24. Whether a connection failure or a memory failure has occurred.

図6(a)は、データの書き込み時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。   FIG. 6A is a diagram illustrating a determination table for failure site determination performed by the failure site determination unit 16 when data is written.

故障部位判定部16は、AS1の信号値が0か1かに基づいて、本体故障が生じているか否かを判定する。例えば、AS1が0の場合、故障部位判定部16は、本体故障は生じていないと判定する。AS1が1の場合、故障部位判定部16は、本体故障が生じていると判定する。   The failure part determination unit 16 determines whether or not a main body failure has occurred based on whether the signal value of AS1 is 0 or 1. For example, when AS1 is 0, the failure part determination unit 16 determines that a main body failure has not occurred. When AS1 is 1, the failure part determination unit 16 determines that a main body failure has occurred.

また、故障部位判定部16は、AS1とAS2の信号値が同じであるか否かに基づいて、接続不良又はメモリ故障が生じているか否かを判定する。例えば、AS1とAS2が同じ信号値である場合、故障部位判定部16は、接続不良もメモリ故障も生じていないと判定する。AS1とAS2が異なる信号値である場合、故障部位判定部16は、接続不良又はメモリ故障が生じていると判定する。   Further, the failure site determination unit 16 determines whether a connection failure or a memory failure has occurred based on whether the signal values of AS1 and AS2 are the same. For example, when AS1 and AS2 have the same signal value, the failure site determination unit 16 determines that neither a connection failure nor a memory failure has occurred. When AS1 and AS2 are different signal values, the failure site determination unit 16 determines that a connection failure or a memory failure has occurred.

具体的には、例えばAS1及びAS2がともに0の場合、情報処理装置10及びメモリモジュール20のいずれにおいてもデータ異常が検出されていないため、故障部位判定部16は、本体故障、接続不良、メモリ故障のいずれも生じていないと判定する。   Specifically, for example, when AS1 and AS2 are both 0, no data abnormality is detected in any of the information processing apparatus 10 and the memory module 20, so the failure site determination unit 16 determines that the main body failure, connection failure, memory It is determined that no failure has occurred.

AS1が0で且つAS2が1の場合、第1異常検出部15ではデータ異常が検出されず、第2異常検出部24でデータ異常が検出されていることから、故障部位判定部16は、本体故障は生じておらず、接続不良又はメモリ故障が生じていると判定する。   When AS1 is 0 and AS2 is 1, the first abnormality detection unit 15 detects no data abnormality and the second abnormality detection unit 24 detects the data abnormality. It is determined that no failure has occurred and a connection failure or memory failure has occurred.

AS1が1で且つAS2が0の場合、第1異常検出部15でデータ異常が検出されているため、故障部位判定部16は、本体故障が生じていると判定する。一方、本来データ異常が検出されるべき第2異常検出部24においてデータ異常が検出されていないことから、故障部位判定部16は、接続不良又はメモリ故障が生じていると判定する。   When AS1 is 1 and AS2 is 0, since the data abnormality is detected by the first abnormality detection unit 15, the failure part determination unit 16 determines that a main body failure has occurred. On the other hand, since the data abnormality is not detected in the second abnormality detection unit 24 where a data abnormality should be originally detected, the failure part determination unit 16 determines that a connection failure or a memory failure has occurred.

AS1が1で且つAS2が1の場合、第1異常検出部15でデータ異常が検出され、そのデータ異常が第2異常検出部24でもそのまま検出されていることから、故障部位判定部16は、本体故障が生じており、接続不良又はメモリ故障は生じていないと判定する。   When AS1 is 1 and AS2 is 1, since the data abnormality is detected by the first abnormality detection unit 15 and the data abnormality is also detected as it is by the second abnormality detection unit 24, the failure site determination unit 16 It is determined that a main unit failure has occurred and no connection failure or memory failure has occurred.

[データ読み出し時]
故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1及び第2異常検出部24から供給された第2異常検出信号AS2に基づいて、本体故障又は接続不良が生じているのか、メモリ故障が生じているのかを判定する。
[When reading data]
Based on the first abnormality detection signal AS1 supplied from the first abnormality detection unit 15 and the second abnormality detection signal AS2 supplied from the second abnormality detection unit 24, the failure part determination unit 16 determines whether a main body failure or a connection failure has occurred. It is determined whether or not a memory failure has occurred.

図6(b)は、データの読み出し時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。   FIG. 6B is a diagram illustrating a determination table for failure site determination performed by the failure site determination unit 16 when reading data.

故障部位判定部16は、AS2の信号値が0か1かに基づいて、メモリ故障が生じているか否かを判定する。例えば、AS2が0の場合、故障部位判定部16は、メモリ故障は生じていないと判定する。AS2が1の場合、故障部位判定部16は、メモリ故障が生じていると判定する。   The failure site determination unit 16 determines whether or not a memory failure has occurred based on whether the signal value of AS2 is 0 or 1. For example, when AS2 is 0, the failure site determination unit 16 determines that no memory failure has occurred. When AS2 is 1, the failure site determination unit 16 determines that a memory failure has occurred.

また、故障部位判定部16は、AS1とAS2の信号値が同じであるか否かに基づいて、本体故障又は接続不良が生じているか否かを判定する。例えば、AS2とAS1が同じ信号値である場合、本体故障又は接続不良は生じていないと判定する。AS1とAS2が異なる信号値である場合、故障部位判定部16は、本体故障又は接続不良が生じていると判定する。   Moreover, the failure part determination part 16 determines whether the main body failure or the connection failure has arisen based on whether the signal value of AS1 and AS2 is the same. For example, when AS2 and AS1 have the same signal value, it is determined that no main body failure or poor connection has occurred. When AS1 and AS2 are different signal values, the failure part determination unit 16 determines that a main body failure or a connection failure has occurred.

具体的には、例えばAS1及びAS2がともに0の場合、メモリモジュール20でも情報処理装置10でもデータ異常が検出されていないため、故障部位判定部16は、メモリ故障、接続不良、本体故障のいずれも生じていないと判定する。   Specifically, for example, when AS1 and AS2 are both 0, no data abnormality is detected in either the memory module 20 or the information processing apparatus 10, and therefore, the failure site determination unit 16 determines any of memory failure, connection failure, and main body failure. It is determined that neither has occurred.

AS1が0で且つAS2が1の場合、第2異常検出部24でデータ異常が検出されているにもかかわらず第1異常検出部15ではデータ異常が検出されていないことから、故障部位判定部16は、メモリ故障が生じており、接続不良又は本体故障も生じていると判定する。   When AS1 is 0 and AS2 is 1, a data abnormality is not detected by the first abnormality detection unit 15 even though a data abnormality is detected by the second abnormality detection unit 24. No. 16 determines that a memory failure has occurred and a connection failure or main unit failure has also occurred.

AS1が1で且つAS2が0の場合、第2異常検出部24ではデータ異常が検出されず、第1異常検出部15でデータ異常が検出されていることから、故障部位判定部16は、メモリ故障は生じておらず、接続不良又は本体故障が生じていると判定する。   When AS1 is 1 and AS2 is 0, no data abnormality is detected by the second abnormality detection unit 24, and data abnormality is detected by the first abnormality detection unit 15, so that the failure site determination unit 16 stores the memory It is determined that no failure has occurred and a connection failure or a main unit failure has occurred.

AS1が1で且つAS2が1の場合、第2異常検出部24でデータ異常が検出され、その異常が第1異常検出部15でもそのまま検出されていることから、故障部位判定部16は、メモリ故障が生じており、接続不良又は本体故障は生じていないと判定する。   When AS1 is 1 and AS2 is 1, since the data abnormality is detected by the second abnormality detection unit 24 and the abnormality is also detected as it is by the first abnormality detection unit 15, the failure site determination unit 16 stores the memory It is determined that a failure has occurred and no connection failure or main unit failure has occurred.

以上説明したように、本実施例の情報処理システムによれば、データの書き込み時に、本体故障が生じているのか、接続不良又はメモリ故障が生じているのかを判定することができる。また、データの読み出し時に、メモリ故障が生じているのか、接続不良又は本体故障が生じているのかを判定することができる。   As described above, according to the information processing system of this embodiment, it is possible to determine whether a main unit failure, a connection failure, or a memory failure has occurred when data is written. Further, when reading data, it can be determined whether a memory failure has occurred, a connection failure, or a main body failure has occurred.

なお、データ書き込み時の故障部位判定とデータ読み出し時の故障部位判定とを組み合わせることにより、故障部位をさらに特定することが可能である。例えば、データの書き込み時において、AS1が0で且つAS2が1だった場合、図6(a)に示すように、接続不良又はメモリ故障が生じていると判定することはできるが、そのいずれが生じているかを判定することはできない。   In addition, it is possible to further specify the failure part by combining the failure part determination at the time of data writing and the failure part determination at the time of data reading. For example, when AS1 is 0 and AS2 is 1 at the time of data writing, it can be determined that a connection failure or a memory failure has occurred, as shown in FIG. It cannot be determined whether it has occurred.

しかし、図7に示すように、さらにデータ読み出し時の故障判定を行うことにより、データ読み出し時にAS1が1で且つAS2が0の場合には接続不良、AS1が1で且つAS2が1の場合にはメモリ故障が生じていると判定して、故障部位を特定することが可能となる。   However, as shown in FIG. 7, by performing failure determination at the time of data reading, if AS1 is 1 and AS2 is 0 at the time of data reading, a connection failure occurs, and AS1 is 1 and AS2 is 1. It is possible to determine that a memory failure has occurred and identify the failure site.

図8は、実施例3における情報処理装置10、ソケット30及びメモリモジュール20からなる情報処理システムの構成を示すブロック図である。   FIG. 8 is a block diagram illustrating a configuration of an information processing system including the information processing apparatus 10, the socket 30, and the memory module 20 according to the third embodiment.

ECC部12は、ECC符号化部13、第1誤り検出部14、第1異常検出部15、故障部位判定部16、第1パリティ生成部18及びパリティ照合部19を含む。   The ECC unit 12 includes an ECC encoding unit 13, a first error detection unit 14, a first abnormality detection unit 15, a failure site determination unit 16, a first parity generation unit 18, and a parity verification unit 19.

第1パリティ生成部18は、データ(書き込みデータND又は読み出しデータRD)及び符号化データCDの供給を受け、これらのデータのうち所定のビット数毎に含まれる信号値「1」のデータの数に応じて、第1パリティデータPD1を生成する。   The first parity generation unit 18 is supplied with data (write data ND or read data RD) and encoded data CD, and among these data, the number of data having a signal value “1” included for each predetermined number of bits. In response to this, the first parity data PD1 is generated.

例えば、書き込みデータND又は読み出しデータRDが64ビットからなる場合、第1パリティ生成部18は、これを8ビットからなる8のデータ列に分け、各データ列に含まれる「1」の個数が奇数である場合には信号値「1」、「1」の個数が偶数である場合には信号値「0」を、パリティビットとして設定する。そして、第1パリティ生成部18は、各データ列に設定したパリティビットからなる、8ビットの第1パリティデータPD1を生成する。   For example, when the write data ND or the read data RD is composed of 64 bits, the first parity generation unit 18 divides the data into 8 data strings composed of 8 bits, and the number of “1” included in each data string is an odd number. When the number of signal values “1” and “1” is an even number, the signal value “0” is set as a parity bit. The first parity generation unit 18 generates 8-bit first parity data PD1 including the parity bits set in each data string.

パリティ照合部19は、第1パリティ生成部18から第1パリティデータPDの供給を受ける一方、メモリモジュール20の第2パリティ生成部28から第2パリティデータPD2の供給を受ける。パリティ照合部19は、第1パリティデータPD1と第2パリティデータPD2とが一致するか否かを、上位ビットから下位ビットまでそれぞれ対応するビット毎に照合する。パリティ照合部19は、全てのビットについて値が一致する場合には信号値「0」、1ビット以上の不一致がある場合には信号値「1」のパリティ信号PSを生成し、故障部位判定部16に供給する。   The parity check unit 19 receives supply of the first parity data PD from the first parity generation unit 18 and also receives supply of the second parity data PD2 from the second parity generation unit 28 of the memory module 20. The parity check unit 19 checks whether or not the first parity data PD1 and the second parity data PD2 match for each corresponding bit from the upper bit to the lower bit. The parity check unit 19 generates a parity signal PS with a signal value “0” when the values match for all bits and a mismatch of 1 bit or more, and a failure value determination unit with a signal value “1”. 16 is supplied.

故障部位判定部16は、第1異常検出信号AS1及び第2異常検出信号AS2の組合せと、パリティ信号PSとによって、情報処理装置10の本体の故障、メモリモジュール20の故障、ソケット30とメモリモジュール20との間の接続不良の有無を判定する。   The failure part determination unit 16 determines the failure of the main body of the information processing apparatus 10, the failure of the memory module 20, the socket 30 and the memory module by the combination of the first abnormality detection signal AS1 and the second abnormality detection signal AS2 and the parity signal PS. 20 is determined whether or not there is a connection failure.

メモリモジュール20は、データ記憶領域21、符号化データ記憶領域22、第2誤り検出部23、第2異常検出部24、双方向バッファ26及び27、第2パリティ生成部28を含む。   The memory module 20 includes a data storage area 21, an encoded data storage area 22, a second error detection unit 23, a second abnormality detection unit 24, bidirectional buffers 26 and 27, and a second parity generation unit 28.

第2パリティ生成部28は、データ(書き込みデータND又は読み出しデータRD)及び符号化データCDの供給を受け、これらのデータのうち所定のビット数毎に含まれる信号値「1」のデータの数に応じて、第2パリティデータPD2を生成する。この際、第2パリティ生成部28は、第1パリティ生成部18と同様、64ビットからなるデータを例えば8ビットからなる8のデータ列に分け、各データ列に含まれる「1」の個数が奇数である場合には信号値「1」、「1」の個数が偶数である場合には信号値「0」をパリティビットとして設定して、8ビットの第2パリティデータPD2を生成する。   The second parity generation unit 28 is supplied with data (write data ND or read data RD) and encoded data CD, and among these data, the number of data having a signal value “1” included for each predetermined number of bits. In response to this, the second parity data PD2 is generated. At this time, like the first parity generation unit 18, the second parity generation unit 28 divides 64-bit data into, for example, 8 data strings of 8 bits, and the number of “1” included in each data string is When the number is odd, the signal value “1” is set, and when the number of “1” is an even number, the signal value “0” is set as the parity bit to generate the second parity data PD2 of 8 bits.

次に、データの書き込み時における実施例3の情報処理装置10及びメモリモジュール20の動作について、図9及び図10を参照して説明する。   Next, operations of the information processing apparatus 10 and the memory module 20 according to the third embodiment at the time of data writing will be described with reference to FIGS. 9 and 10.

[データ書き込み時]
図9に示すように、制御部11は、書き込みデータNDを、メモリモジュール20のデータ記憶領域21、ECC符号化部13、第1誤り検出部14、メモリモジュール20の第2誤り検出部23に供給するとともに、第1パリティ生成部18及び第2パリティ生成部28に供給する。
[When writing data]
As shown in FIG. 9, the control unit 11 sends the write data ND to the data storage area 21 of the memory module 20, the ECC encoding unit 13, the first error detection unit 14, and the second error detection unit 23 of the memory module 20. At the same time, it is supplied to the first parity generation unit 18 and the second parity generation unit 28.

ECC符号化部13は、書き込みデータNDに基づいて符号化データCDを生成し、第1誤り検出部14、メモリモジュール20の符号化データ記憶領域22及び第2誤り検出部23に供給するとともに、第1パリティ生成部18及び第2パリティ生成部28に供給する。   The ECC encoding unit 13 generates encoded data CD based on the write data ND, and supplies the encoded data CD to the first error detection unit 14, the encoded data storage area 22 of the memory module 20, and the second error detection unit 23. This is supplied to the first parity generation unit 18 and the second parity generation unit 28.

第1パリティ生成部18は、書き込みデータND及び符号化データCDに基づいて第1パリティデータPD1を生成し、パリティ照合部19に供給する。第2パリティ生成部28は、書き込みデータND及び符号化データCDに基づいて第2パリティデータPD2を生成し、パリティ照合部19に供給する。   The first parity generation unit 18 generates first parity data PD1 based on the write data ND and the encoded data CD, and supplies the first parity data PD1 to the parity verification unit 19. The second parity generation unit 28 generates the second parity data PD2 based on the write data ND and the encoded data CD, and supplies the second parity data PD2 to the parity verification unit 19.

パリティ照合部19は、第1パリティデータPD1と第2パリティデータPD2とを照合し、照合結果を「0」「1」の2値の信号で示すパリティ信号PSを故障部位判定部16に供給する。   The parity check unit 19 checks the first parity data PD1 and the second parity data PD2, and supplies the parity signal PS indicating the check result as a binary signal of “0” and “1” to the failure site determination unit 16. .

故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1、第2異常検出部24から供給された第2異常検出信号AS2、パリティ照合部19から供給されたパリティ信号PSに基づいて、本体故障、メモリ故障及び接続不良の有無を判定する。   The failure part determination unit 16 includes a first abnormality detection signal AS1 supplied from the first abnormality detection unit 15, a second abnormality detection signal AS2 supplied from the second abnormality detection unit 24, and a parity supplied from the parity verification unit 19. Based on the signal PS, it is determined whether there is a main body failure, a memory failure, and a connection failure.

図10は、データの書き込み時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。   FIG. 10 is a diagram illustrating a determination table for failure site determination performed by the failure site determination unit 16 when data is written.

故障部位判定部16は、AS1の信号値が0か1かに基づいて、本体故障が生じているか否かを判定する。例えば、AS1が0の場合、故障部位判定部16は、本体故障は生じていないと判定する。AS1が1の場合、故障部位判定部16は、本体故障が生じていると判定する。   The failure part determination unit 16 determines whether or not a main body failure has occurred based on whether the signal value of AS1 is 0 or 1. For example, when AS1 is 0, the failure part determination unit 16 determines that a main body failure has not occurred. When AS1 is 1, the failure part determination unit 16 determines that a main body failure has occurred.

故障部位判定部16は、パリティ信号PSの信号値が0か1かに基づいて、接続不良が生じているか否かを判定する。例えば、PSが0の場合、故障部位判定部16は、接続不良は生じていないと判定する。PSが1の場合、故障部位判定部16は、接続不良が生じていると判定する。   The failure site determination unit 16 determines whether a connection failure has occurred based on whether the signal value of the parity signal PS is 0 or 1. For example, when PS is 0, the failure site determination unit 16 determines that no connection failure has occurred. When PS is 1, the failure site determination unit 16 determines that a connection failure has occurred.

故障部位判定部16は、PSの信号値が0か1か、及びAS1とAS2の信号値の条件により、メモリ故障が生じているか否かを判定する。例えば、PSの信号値が0であって且つAS1とAS2とが同じ信号値である場合、故障部位判定部16は、メモリ故障は生じていないと判定する。一方、PSの信号値が0であって且つAS1とAS2とが異なる信号値である場合、故障部位判定部16は、メモリ故障が生じていると判定する。   The failure site determination unit 16 determines whether or not a memory failure has occurred based on whether the signal value of PS is 0 or 1 and the signal values of AS1 and AS2. For example, when the PS signal value is 0 and AS1 and AS2 are the same signal value, the failure portion determination unit 16 determines that no memory failure has occurred. On the other hand, when the PS signal value is 0 and AS1 and AS2 are different signal values, the failure part determination unit 16 determines that a memory failure has occurred.

これに対し、PSの信号値が1の場合、接続不良が生じているにも拘わらずAS2が0ならば、故障部位判定部16はメモリ故障が生じていると判定する。一方、PSの信号値が1であって且つAS2が1の場合、故障部位判定部16は、メモリ故障は生じていないと判定する。   On the other hand, if the PS signal value is 1, if AS2 is 0 even though a connection failure has occurred, the failure site determination unit 16 determines that a memory failure has occurred. On the other hand, when the signal value of PS is 1 and AS2 is 1, the failure site determination unit 16 determines that no memory failure has occurred.

上記法則により、故障部位判定部16は、図10に示すように、本体故障、メモリ故障及び接続不良の有無を判定する。図中、「○」は当該部分に故障や不良がないことを示し、「×」は当該部分に故障や不良があることを示している。このように、情報処理装置10とメモリモジュール20との間にソケット30を含む構成において、データの書き込み時に、故障の有無の判定及び故障部位の特定を行うことができる。   According to the above rule, as shown in FIG. 10, the failure site determination unit 16 determines the presence or absence of a main body failure, a memory failure, and a connection failure. In the figure, “◯” indicates that there is no failure or defect in the part, and “X” indicates that there is a failure or defect in the part. As described above, in the configuration including the socket 30 between the information processing apparatus 10 and the memory module 20, it is possible to determine whether or not there is a failure and to specify a failure part when writing data.

次に、データの読み出し時における実施例3の情報処理装置10及びメモリモジュール20の動作について、図11及び図12を参照して説明する。   Next, operations of the information processing apparatus 10 and the memory module 20 according to the third embodiment when reading data will be described with reference to FIGS.

[データ読み出し時]
図11に示すように、制御部11は、読み出しデータRDを、第1誤り検出部14と第2誤り検出部23に供給するとともに、第1パリティ生成部18及び第2パリティ生成部28に供給する。また、制御部11は、読み出しデータRDに対応する符号化データCDを符号化データ記憶領域22から読み出し、第1誤り検出部14、第2誤り検出部23、第1パリティ生成部18及び第2パリティ生成部28に供給する。
[When reading data]
As illustrated in FIG. 11, the control unit 11 supplies the read data RD to the first error detection unit 14 and the second error detection unit 23, and also supplies the read data RD to the first parity generation unit 18 and the second parity generation unit 28. To do. In addition, the control unit 11 reads the encoded data CD corresponding to the read data RD from the encoded data storage area 22, and the first error detection unit 14, the second error detection unit 23, the first parity generation unit 18, and the second This is supplied to the parity generation unit 28.

第1パリティ生成部18は、読み出しデータRD及び符号化データCDに基づいて第1パリティデータPD1を生成し、パリティ照合部19に供給する。第2パリティ生成部28は、読み出しデータRD及び符号化データCDに基づいて第2パリティデータPD2を生成し、パリティ照合部19に供給する。   The first parity generation unit 18 generates first parity data PD1 based on the read data RD and the encoded data CD, and supplies the first parity data PD1 to the parity verification unit 19. The second parity generation unit 28 generates the second parity data PD2 based on the read data RD and the encoded data CD, and supplies the second parity data PD2 to the parity verification unit 19.

パリティ照合部19は、第1パリティデータPD1と第2パリティデータPD2とを照合し、照合結果を「0」「1」の2値の信号で示すパリティ信号PSを故障部位判定部16に供給する。   The parity check unit 19 checks the first parity data PD1 and the second parity data PD2, and supplies the parity signal PS indicating the check result as a binary signal of “0” and “1” to the failure site determination unit 16. .

故障部位判定部16は、第1異常検出部15から供給された第1異常検出信号AS1、第2異常検出部24から供給された第2異常検出信号AS2、パリティ照合部19から供給されたパリティ信号PSに基づいて、本体故障、メモリ故障及び接続不良の有無を判定する。   The failure part determination unit 16 includes a first abnormality detection signal AS1 supplied from the first abnormality detection unit 15, a second abnormality detection signal AS2 supplied from the second abnormality detection unit 24, and a parity supplied from the parity verification unit 19. Based on the signal PS, it is determined whether there is a main body failure, a memory failure, and a connection failure.

図12は、データの読み出し時に故障部位判定部16が行う故障部位判定の判定テーブルを示す図である。   FIG. 12 is a diagram illustrating a determination table for failure site determination performed by the failure site determination unit 16 when data is read.

故障部位判定部16は、AS2の信号値が0か1かに基づいて、メモリ故障が生じているか否かを判定する。例えば、AS2が0の場合、故障部位判定部16は、メモリ故障は生じていないと判定する。AS2が1の場合、故障部位判定部16は、メモリ故障が生じていると判定する。   The failure site determination unit 16 determines whether or not a memory failure has occurred based on whether the signal value of AS2 is 0 or 1. For example, when AS2 is 0, the failure site determination unit 16 determines that no memory failure has occurred. When AS2 is 1, the failure site determination unit 16 determines that a memory failure has occurred.

故障部位判定部16は、パリティ信号PSの信号値が0か1かに基づいて、接続不良が生じているか否かを判定する。例えば、PSが0の場合、故障部位判定部16は、接続不良は生じていないと判定する。PSが1の場合、故障部位判定部16は、接続不良が生じていると判定する。   The failure site determination unit 16 determines whether a connection failure has occurred based on whether the signal value of the parity signal PS is 0 or 1. For example, when PS is 0, the failure site determination unit 16 determines that no connection failure has occurred. When PS is 1, the failure site determination unit 16 determines that a connection failure has occurred.

故障部位判定部16は、PSの信号値が0か1か、及びAS1とAS2の信号値の条件により、本体故障が生じているか否かを判定する。例えば、PSの信号値が0であって且つAS1とAS2とが同じ信号値である場合、故障部位判定部16は、本体故障は生じていないと判定する。一方、PSの信号値が0であって且つAS1とAS2とが異なる信号値である場合、故障部位判定部16は、本体故障が生じていると判定する。   The failure site determination unit 16 determines whether or not a main body failure has occurred based on whether the signal value of PS is 0 or 1 and the signal values of AS1 and AS2. For example, when the signal value of PS is 0 and AS1 and AS2 are the same signal value, the failure part determination unit 16 determines that a main body failure has not occurred. On the other hand, when the signal value of PS is 0 and AS1 and AS2 are different signal values, the failure part determination unit 16 determines that a main body failure has occurred.

これに対し、PSの信号値が1の場合、接続不良が生じているにもかかわらずAS1が0ならば、故障部位判定部16は本体故障が生じていると判定する。一方、PSの信号値が1であって且つAS1が1の場合、故障部位判定部16は、本体故障は生じていないと判定する。   On the other hand, when the signal value of PS is 1, if AS1 is 0 even though connection failure has occurred, the failure site determination unit 16 determines that a main body failure has occurred. On the other hand, when the signal value of PS is 1 and AS1 is 1, the failure site determination unit 16 determines that no main body failure has occurred.

上記法則により、故障部位判定部16は、図12に示すように、本体故障、メモリ故障及び接続不良の有無を判定する。図中、「○」は当該部分に故障や不良がないことを示し、「×」は当該部分に故障や不良があることを示している。このように、情報処理装置10とメモリモジュール20との間にソケット30を含む構成において、データの読み出し時に、故障の有無の判定及び故障部位の特定を行うことができる。   According to the above rule, as shown in FIG. 12, the failure site determination unit 16 determines the presence or absence of a main body failure, a memory failure, and a connection failure. In the figure, “◯” indicates that there is no failure or defect in the part, and “X” indicates that there is a failure or defect in the part. As described above, in the configuration including the socket 30 between the information processing apparatus 10 and the memory module 20, it is possible to determine whether or not there is a failure and to identify a failure part when reading data.

以上のように、本実施例の情報処理システムによれば、データの書き込み時及びデータの読み出し時の夫々において、情報処理装置10の故障及びメモリモジュール20の故障及びソケット30とメモリモジュール20との間の接続不良の有無を検出し、これらのうちいずれが生じているかを判定することができる。   As described above, according to the information processing system of the present embodiment, at the time of data writing and at the time of data reading, the failure of the information processing apparatus 10, the failure of the memory module 20, and the connection between the socket 30 and the memory module 20, respectively. It is possible to detect the presence or absence of a connection failure between them and determine which one of them is occurring.

情報処理装置10やメモリモジュール20の故障とソケット30及びメモリモジュール20の接続不良とを区別することができるため、例えば接続不良のみが生じていると判定した場合には、修理の必要性がないことを判定することができる。   Since the failure of the information processing apparatus 10 or the memory module 20 and the connection failure of the socket 30 and the memory module 20 can be distinguished, for example, when it is determined that only the connection failure occurs, there is no need for repair. Can be determined.

なお、本発明の実施形態は上記のものに限られない。例えば、上記実施例では、ECC部12の第1誤り検出部14が誤り検出訂正処理を行うとして説明したが、誤り検出処理のみを行うものであってもよい。また、誤り検出処理の方式はハミング方式に限られず、パリティ方式やCRC方式(Cyclic Redundancy Check)等を用いてもよい。   The embodiment of the present invention is not limited to the above. For example, in the above-described embodiment, the first error detection unit 14 of the ECC unit 12 has been described as performing the error detection and correction process, but only the error detection process may be performed. Further, the error detection processing method is not limited to the Hamming method, and a parity method, a CRC method (Cyclic Redundancy Check), or the like may be used.

また、メモリモジュールの種類はDIMMに限られず、例えばRIMM(Rambus Inline Memory Module)やSO−DIMM(Small Outline Dual Inline Memory Module)等の記憶装置を用いるものであってもよい。   The type of the memory module is not limited to DIMM, and a storage device such as a RIMM (Rambus Inline Memory Module) or SO-DIMM (Small Outline Dual Inline Memory Module) may be used.

また、上記実施例では、メモリモジュール20が情報処理装置10のマザーボードに装着されて接続されるとして説明したが、接続方法はマザーボードへの装着に限られない。また、ソケット30の構成は差込口のような形状のものに限られず、情報処理装置10とメモリモジュール20との接続を媒介することが可能なものであればよい。本発明によれば、情報処理装置とメモリモジュールとの接続を媒介する接続部を有する装置において、データに含まれる誤りの原因が接続部の前後いずれにあるかを判定することが可能である。   In the above embodiment, the memory module 20 is described as being mounted and connected to the motherboard of the information processing apparatus 10, but the connection method is not limited to mounting on the motherboard. Further, the configuration of the socket 30 is not limited to a shape like an insertion port, and any configuration that can mediate the connection between the information processing apparatus 10 and the memory module 20 may be used. According to the present invention, in an apparatus having a connection unit that mediates connection between an information processing device and a memory module, it is possible to determine whether the cause of an error included in data is before or after the connection unit.

また、上記実施例では、故障部位判定部16が、第1異常検出部15からの第1異常検出信号AS1と第2異常検出部24からの第2異常検出信号AS2とに基づいて、故障部位の判定を行う構成について説明した。   In the above embodiment, the failure part determination unit 16 is based on the first abnormality detection signal AS1 from the first abnormality detection unit 15 and the second abnormality detection signal AS2 from the second abnormality detection unit 24. The configuration for performing the determination has been described.

しかし、第1異常検出部15及び第2異常検出部24を設けず、故障部位判定部16が第1誤り検出部14からの第1誤り検出信号ES1と第2誤り検出部23からの第2誤り検出信号ES2に基づいて、故障部位の判定を行う構成であってもよい。要するに、情報処理装置10での誤り検出訂正処理の結果とメモリモジュール20での誤り検出訂正処理の結果とに基づいて、故障部位判定部16が故障部位の判定を行う構成であればよい。   However, the first abnormality detection unit 15 and the second abnormality detection unit 24 are not provided, and the failure site determination unit 16 performs the first error detection signal ES1 from the first error detection unit 14 and the second error detection unit 23 from the second error detection unit 23. The configuration may be such that the failure part is determined based on the error detection signal ES2. In short, any configuration may be used as long as the failure part determination unit 16 determines the failure part based on the result of the error detection and correction process in the information processing apparatus 10 and the result of the error detection and correction process in the memory module 20.

また、上記実施例では、メモリ判定において、誤判定防止のため「0」の信号値を有する信号の送受信の後、さらに「1」の信号値を有する信号を送受信して判定を行っている。しかし、信号の送受信の回数はこれに限られず、1回の送受信で判定を行ってもよいし、3回以上の送受信を行うものであってもよい。   In the above embodiment, in the memory determination, after the transmission / reception of the signal having the signal value of “0”, the determination is performed by transmitting / receiving the signal having the signal value of “1” to prevent erroneous determination. However, the number of times of signal transmission / reception is not limited to this, and determination may be performed by one transmission / reception, or transmission / reception may be performed three or more times.

また、上記実施例3では、第1パリティ生成部18及び第2パリティ生成部28が、各データ列に含まれる「1」の個数が奇数である場合には信号値「1」、「1」の個数が偶数である場合には信号値「0」をパリティビットとして設定する、いわゆる「偶数パリティ」方式により、第1パリティデータPD1及び第2パリティデータPD2を生成する例について説明した。しかし、これに限られず、各データ列に含まれる「1」の個数が偶数である場合に信号値「1」、「1」の個数が奇数である場合には信号値「0」をパリティビットとして設定する、いわゆる「奇数パリティ」方式を用いてもよい。いずれの方式であっても、第1パリティ生成部18及び第2パリティ生成部28が生成するパリティデータの方式が同じものであればよい。   In the third embodiment, the first parity generation unit 18 and the second parity generation unit 28 have the signal values “1” and “1” when the number of “1” included in each data string is an odd number. In the above description, the example in which the first parity data PD1 and the second parity data PD2 are generated by the so-called “even parity” method in which the signal value “0” is set as a parity bit when the number of data is an even number is described. However, the present invention is not limited to this. When the number of “1” included in each data string is an even number, the signal value “1” is set. When the number of “1” is an odd number, the signal value “0” is set as a parity bit. A so-called “odd parity” method may be used. Whichever method is used, the parity data generated by the first parity generation unit 18 and the second parity generation unit 28 may be the same.

また、上記実施例では、情報処理装置10にメモリモジュール20を接続した場合の例について説明した。しかし、接続する装置はメモリモジュール20に限られず、他の着脱可能な装置を情報処理装置10に接続する構成であってもよい。要するに、本発明によれば、情報処理装置10と他の装置との接続部の前後において発生したデータ誤りを検出することにより、故障部位や接続不良を判定することが可能である。   In the above-described embodiment, an example in which the memory module 20 is connected to the information processing apparatus 10 has been described. However, the device to be connected is not limited to the memory module 20, and another detachable device may be connected to the information processing device 10. In short, according to the present invention, it is possible to determine a fault site or a connection failure by detecting a data error that occurs before and after a connection portion between the information processing apparatus 10 and another apparatus.

10 情報処理装置
11 制御部
12 ECC部
13 ECC符号化部
14 第1誤り検出部
15 第1異常検出部
16 故障部位判定部
17 エラー収集/メモリ判定部
18 第1パリティ生成部
19 パリティ照合部
20 メモリモジュール
21 データ記憶領域
22 符号化データ記憶領域
23 第2誤り検出部
24 第2異常検出部
25 メモリ判定信号返信部
26、27 双方向バッファ
28 第2パリティ生成部
30 ソケット
NC1、NC2 端子
DESCRIPTION OF SYMBOLS 10 Information processing apparatus 11 Control part 12 ECC part 13 ECC encoding part 14 1st error detection part 15 1st abnormality detection part 16 Failure location determination part 17 Error collection / memory determination part 18 1st parity generation part 19 Parity collation part 20 Memory module 21 Data storage area 22 Encoded data storage area 23 Second error detection unit 24 Second abnormality detection unit 25 Memory determination signal return unit 26, 27 Bidirectional buffer 28 Second parity generation unit 30 Socket NC1, NC2 terminal

Claims (12)

着脱可能に装着されて接続されている記憶装置との間でデータの書き込み及び読み出しを行う情報処理装置であって、
前記記憶装置へのデータの書き込み及び前記記憶装置からのデータの読み出しを制御する制御部と、
前記記憶装置に書き込む書き込みデータに誤り訂正符号を付加して符号化データを生成する符号化部と、
前記符号化データを用いて、前記書き込みデータ又は前記記憶装置からの読み出しデータに対して誤り検出処理を行う誤り検出部と、
前記記憶装置における誤り検出処理の結果を受信し、受信した前記記憶装置における誤り検出処理の結果と前記誤り検出部における誤り検出処理の結果とに基づいて、前記情報処理装置又は前記記憶装置のいずれが故障しているかを判定する故障部位判定部と、を備えることを特徴とする情報処理装置。
An information processing apparatus that writes and reads data to and from a storage device that is detachably mounted and connected,
A control unit that controls writing of data to the storage device and reading of data from the storage device;
An encoding unit that generates encoded data by adding an error correction code to write data to be written to the storage device;
Using the encoded data, an error detection unit that performs error detection processing on the write data or read data from the storage device;
Either the information processing device or the storage device is received based on the received error detection processing result in the storage device and the error detection processing result in the error detection unit. An information processing apparatus comprising: a failure part determination unit that determines whether or not the device is out of order.
前記記憶装置に接続されるソケットを備え、
前記故障部位判定部は、受信した前記記憶装置内における誤り検出処理の結果と前記誤り検出部における誤り検出処理の結果とに基づいて、前記情報処理装置の故障又は前記記憶装置の故障又は前記ソケットと前記記憶装置との接続異常のいずれが生じているかを判定することを特徴とする請求項1に記載の情報処理装置。
A socket connected to the storage device;
The failure part determination unit is configured to determine whether the information processing device has failed, the storage device has failed, or the socket based on the received error detection processing result in the storage device and the error detection processing result in the error detection unit. 2. The information processing apparatus according to claim 1, wherein a determination is made as to whether a connection abnormality between the storage device and the storage device has occurred.
前記誤り検出部における前記誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第1異常検出信号を生成する異常検出部を備え、
前記故障部位判定部は、前記記憶装置における前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第2異常検出信号を受信し、前記第1異常検出信号と前記第2異常検出信号とに基づいて前記判定を行うことを特徴とする請求項1又は2に記載の情報処理装置。
Based on the result of the error detection process in the error detection unit, an abnormality detection unit that generates a first abnormality detection signal indicating the presence or absence of an error included in the write data or the read data,
The failure part determination unit receives a second abnormality detection signal indicating the presence or absence of an error included in the write data or the read data in the storage device, and generates a first abnormality detection signal and a second abnormality detection signal. The information processing apparatus according to claim 1, wherein the determination is performed based on the information processing apparatus.
前記記憶装置に接続されるソケットと、
前記情報処理装置内において前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて生成されたパリティデータと、前記記憶装置内において前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて生成されたパリティデータとを照合して、一致するか否かを判定するパリティ照合部と、
を備え、
前記故障部位判定部は、受信した前記記憶装置内における誤り検出処理の結果と前記誤り検出部における誤り検出処理の結果と前記パリティ照合部の照合結果とに基づいて、前記情報処理装置の故障及び前記記憶装置の故障及び前記ソケットと前記記憶装置との間の接続異常のうちいずれが生じているかを判定することを特徴とする請求項1に記載の情報処理装置。
A socket connected to the storage device;
Parity data generated based on the write data or the read data and the encoded data in the information processing device, and based on the write data or the read data and the encoded data in the storage device A parity collation unit that collates the generated parity data and determines whether or not they match,
With
The failure part determination unit is configured to detect a failure of the information processing device based on the received error detection processing result in the storage device, the error detection processing result in the error detection unit, and the verification result of the parity verification unit. The information processing apparatus according to claim 1, wherein a determination is made as to which of the failure of the storage device and the connection abnormality between the socket and the storage device has occurred.
前記誤り検出部における前記誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第1異常検出信号を生成する異常検出部と、
前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて第1パリティデータを生成するパリティ生成部と、
を備え、
前記パリティ照合部は、前記記憶装置において前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて生成された第2パリティデータを受信し、前記第1パリティデータと前記第2パリティデータと照合して、前記第1パリティデータと前記第2パリティデータとが一致するか否かを示すパリティ信号を生成し、
前記故障部位判定部は、前記記憶装置における前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第2異常検出信号を受信し、前記第1異常検出信号と前記第2異常検出信号と前記パリティ信号とに基づいて前記判定を行うことを特徴とする請求項4に記載の情報処理装置。
Based on the result of the error detection process in the error detection unit, an abnormality detection unit that generates a first abnormality detection signal indicating the presence or absence of an error included in the write data or the read data;
A parity generator that generates first parity data based on the write data or the read data and the encoded data;
With
The parity check unit receives second parity data generated based on the write data or the read data and the encoded data in the storage device, and checks the first parity data and the second parity data. And generating a parity signal indicating whether the first parity data and the second parity data match,
The failure part determination unit receives a second abnormality detection signal indicating whether there is an error included in the write data or the read data in the storage device, and receives the first abnormality detection signal, the second abnormality detection signal, and the The information processing apparatus according to claim 4, wherein the determination is performed based on a parity signal.
情報処理装置に着脱可能に装着され、前記情報処理装置から供給されたデータを記憶する記憶装置であって、
前記情報処理装置から供給されたデータを記憶するデータ記憶領域と、
前記データに誤り訂正符号を付加した符号化データを記憶する符号化データ記憶領域と、
前記符号化データを用いて、前記データに対して誤り検出処理を行う誤り検出部とを備えることを特徴とする記憶装置。
A storage device that is detachably attached to the information processing device and stores data supplied from the information processing device,
A data storage area for storing data supplied from the information processing apparatus;
An encoded data storage area for storing encoded data obtained by adding an error correction code to the data;
A storage device comprising: an error detection unit that performs error detection processing on the data using the encoded data.
前記誤り検出部における誤り検出処理の結果に基づいて、前記データに含まれる誤りの有無を示す異常検出信号を生成して前記情報処理装置に供給する異常検出部を備えることを特徴とする請求項6に記載の記憶装置。   The apparatus according to claim 1, further comprising: an abnormality detection unit that generates an abnormality detection signal indicating the presence / absence of an error included in the data based on a result of an error detection process in the error detection unit and supplies the abnormality detection signal to the information processing apparatus. 6. The storage device according to 6. 前記データと前記符号化データとに基づいてパリティデータを生成し、前記情報処理装置に供給するパリティ生成部を備えることを特徴とする請求項6又は7に記載の記憶装置。   The storage device according to claim 6, further comprising a parity generation unit that generates parity data based on the data and the encoded data and supplies the parity data to the information processing device. 情報処理装置と、前記情報処理装置に着脱可能に装着され接続されている記憶装置とを含む情報処理システムであって、
前記情報処理装置は、
前記記憶装置へのデータの書き込み及び前記記憶装置からのデータの読み出しを制御する制御部と、
前記記憶装置に書き込む書き込みデータに誤り訂正符号を付加して符号化データを生成する符号化部と、
前記符号化データを用いて、前記書き込みデータ又は前記記憶装置からの読み出しデータに対して誤り検出処理を行う第1誤り検出部と、
前記第1誤り検出部における前記誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第1異常検出信号を生成する第1異常検出部と、
前記情報処理装置又は前記記憶装置のいずれが故障しているかを判定する故障部位判定部と、を備え、
前記記憶装置は、
前記情報処理装置から供給された前記書き込みデータを記憶するデータ記憶領域と、
前記書き込みデータに誤り訂正符号を付加した符号化データを記憶する符号化データ記憶領域と、
前記符号化データを用いて、前記書き込みデータ又は前記読み出しデータに対して誤り検出処理を行う第2誤り検出部と、
前記第2誤り検出部における誤り検出処理の結果に基づいて、前記書き込みデータ又は前記読み出しデータに含まれる誤りの有無を示す第2異常検出信号を生成して前記情報処理装置に供給する第2異常検出部と、を備え、
前記故障部位判定部は、前記第1異常検出信号と前記第2異常検出信号とに基づいて、情報処理装置又は前記記憶装置のいずれが故障しているかを判定することを特徴とする情報処理システム。
An information processing system including an information processing device and a storage device that is detachably attached to and connected to the information processing device,
The information processing apparatus includes:
A control unit that controls writing of data to the storage device and reading of data from the storage device;
An encoding unit that generates encoded data by adding an error correction code to write data to be written to the storage device;
A first error detection unit that performs an error detection process on the write data or read data from the storage device using the encoded data;
A first abnormality detection unit that generates a first abnormality detection signal indicating the presence or absence of an error included in the write data or the read data based on a result of the error detection process in the first error detection unit;
A failure site determination unit that determines which of the information processing device or the storage device is faulty,
The storage device
A data storage area for storing the write data supplied from the information processing apparatus;
An encoded data storage area for storing encoded data obtained by adding an error correction code to the write data;
A second error detection unit that performs an error detection process on the write data or the read data using the encoded data;
Based on the result of error detection processing in the second error detection unit, a second abnormality detection signal indicating the presence or absence of an error included in the write data or the read data is generated and supplied to the information processing apparatus A detection unit;
The information processing system, wherein the failure part determination unit determines which of the information processing device or the storage device is in failure based on the first abnormality detection signal and the second abnormality detection signal. .
前記情報処理装置は、前記記憶装置に接続されるソケットを備え、
前記故障部位判定部は、前記第1異常検出信号と前記第2異常検出信号とに基づいて、前記情報処理装置の故障又は前記記憶装置の故障又は前記ソケットと前記記憶装置との接続異常のいずれが生じているかを判定することを特徴とする請求項9に記載の情報処理システム。
The information processing apparatus includes a socket connected to the storage device,
The failure part determination unit is configured to detect either a failure of the information processing device, a failure of the storage device, or a connection failure between the socket and the storage device based on the first abnormality detection signal and the second abnormality detection signal. The information processing system according to claim 9, wherein it is determined whether or not an error has occurred.
前記情報処理装置は、
前記記憶装置に接続されるソケットと、
前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて第1パリティデータを生成する第1パリティ生成部と、
前記第1パリティデータに基づいてデータの照合を行うパリティ照合部と、
を備え、
前記記憶装置は、
前記書き込みデータ又は前記読み出しデータと前記符号化データとに基づいて第2パリティデータを生成する第2パリティ生成部を備え、
前記パリティ照合部は、前記第2パリティデータを受信し、前記第1パリティデータと前記第2パリティデータとを照合して、照合結果を示すパリティ信号を前記故障部位判定部に供給し、
前記故障部位判定部は、前記第1異常検出信号と前記第2異常検出信号と前記パリティ信号とに基づいて、前記情報処理装置の故障及び前記記憶装置の故障及び前記ソケットと前記記憶装置との間の接続異常のうちいずれが生じているかを判定することを特徴とする請求項9に記載の情報処理システム。
The information processing apparatus includes:
A socket connected to the storage device;
A first parity generation unit that generates first parity data based on the write data or the read data and the encoded data;
A parity verification unit that performs data verification based on the first parity data;
With
The storage device
A second parity generation unit that generates second parity data based on the write data or the read data and the encoded data;
The parity verification unit receives the second parity data, compares the first parity data and the second parity data, and supplies a parity signal indicating a verification result to the failure site determination unit;
The failure part determination unit is configured to determine whether the information processing device has failed, the storage device has failed, and the socket and the storage device have a failure based on the first abnormality detection signal, the second abnormality detection signal, and the parity signal. The information processing system according to claim 9, wherein any one of the connection abnormalities is determined.
前記情報処理装置は、前記記憶装置が接続されているか否かを判定するためのメモリ判定信号を前記記憶装置の所定の端子に向けて送信するメモリ判定部を備え、
前記記憶装置は、前記所定の端子に接続され、前記メモリ判定信号を受信して前記メモリ判定信号と同じ信号値の返信信号を前記メモリ判定部に送信する返信部を備え、
前記メモリ判定部は、前記所定の端子から前記判定信号と同じ信号値の前記返信信号を受信したか否かに基づいて、前記記憶装置が接続されているか否かを判定することを特徴とする請求項9乃至11のいずれか1に記載の情報処理システム。
The information processing apparatus includes a memory determination unit that transmits a memory determination signal for determining whether or not the storage device is connected to a predetermined terminal of the storage device,
The storage device includes a reply unit that is connected to the predetermined terminal, receives the memory judgment signal, and transmits a reply signal having the same signal value as the memory judgment signal to the memory judgment unit,
The memory determination unit determines whether the storage device is connected based on whether the return signal having the same signal value as the determination signal is received from the predetermined terminal. The information processing system according to any one of claims 9 to 11.
JP2015000822A 2014-09-24 2015-01-06 Information processor, storage device, and information processing system Pending JP2016066337A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014193234 2014-09-24
JP2014193234 2014-09-24

Publications (1)

Publication Number Publication Date
JP2016066337A true JP2016066337A (en) 2016-04-28

Family

ID=55805624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015000822A Pending JP2016066337A (en) 2014-09-24 2015-01-06 Information processor, storage device, and information processing system

Country Status (1)

Country Link
JP (1) JP2016066337A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10552261B2 (en) 2017-06-02 2020-02-04 Renesas Electronics Corporation Semiconductor device and memory module

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10552261B2 (en) 2017-06-02 2020-02-04 Renesas Electronics Corporation Semiconductor device and memory module

Similar Documents

Publication Publication Date Title
TWI465897B (en) Systems and methods for error checking and correcting for a memory module
US9191030B2 (en) Memory controller, data storage device, and memory controlling method
US11646094B2 (en) Memory system with error detection
US8566672B2 (en) Selective checkbit modification for error correction
US8140945B2 (en) Hard component failure detection and correction
KR102267860B1 (en) Error correction hardware with fault detection
US7587658B1 (en) ECC encoding for uncorrectable errors
WO2007136655A3 (en) System to detect and identify errors in control information, read data and/or write data
JP2009527819A (en) Memory transaction replay mechanism
US20120185752A1 (en) Dram address protection
US8966338B2 (en) Cyclic redundancy check code generating circuit, semiconductor memory device, and method of driving semiconductor memory device
JP2009181425A (en) Memory module
JP2008090442A (en) Memory control device
US8738989B2 (en) Method and apparatus for detecting free page and a method and apparatus for decoding error correction code using the method and apparatus for detecting free page
KR20160046225A (en) Cache memory with fault tolerance
TW202105182A (en) Memory systems and writing methods of the memory systems
CN114237972A (en) End-to-end ECC protection device and method for bus transmission
US20140317473A1 (en) Implementing ecc redundancy using reconfigurable logic blocks
WO2015165202A1 (en) Hamming code-based data access method and integrated random access memory
JP2016066337A (en) Information processor, storage device, and information processing system
CN116935940A (en) Error correction code verification
US8683308B2 (en) Semiconductor device, information processing apparatus, and method of detecting error
US20190163569A1 (en) Memory and method of operating the memory
JP2006301784A (en) Programmable logic controller
US11809272B2 (en) Error correction code offload for a serially-attached memory device