JP2012146167A - メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法 - Google Patents

メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法 Download PDF

Info

Publication number
JP2012146167A
JP2012146167A JP2011004602A JP2011004602A JP2012146167A JP 2012146167 A JP2012146167 A JP 2012146167A JP 2011004602 A JP2011004602 A JP 2011004602A JP 2011004602 A JP2011004602 A JP 2011004602A JP 2012146167 A JP2012146167 A JP 2012146167A
Authority
JP
Japan
Prior art keywords
error
memory
access
controller
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011004602A
Other languages
English (en)
Inventor
Shinya Kawaguchi
伸也 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011004602A priority Critical patent/JP2012146167A/ja
Publication of JP2012146167A publication Critical patent/JP2012146167A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

【課題】コントローラやメモリモジュールを交換してもメモリモジュールに発生したエラーを再現する。
【解決手段】メモリモジュール1が、メモリデバイス12−1〜12−Nと、メモリデバイス12−1〜12−Nへのアクセスパターンであってエラーが発生するアクセスパターンを記憶する不揮発性メモリ17と、コントローラ2によるメモリデバイス12−1〜12−Nへのアクセスによってエラーが発生したか否かを判定するエラー検出回路15と、エラー検出回路15によって、エラーが発生したと判定された場合、不揮発性メモリ17にコントローラ2によるアクセスパターンを記録するアクセス情報記録回路16とを備える。
【選択図】図1

Description

本発明は、メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法に関する。
近年、情報処理機器(特にサーバやストレージ製品)において、情報の高信頼性が要求されている。このような要求に対応するため、情報処理機器に搭載されるメインメモリにおいてエラーが発生した場合、当該エラーを再現し、当該エラーに対する対処を施す必要がある。
しかしながら、発生したエラーが特定のアクセスパターンに依存する物であった場合、当該エラーを再現することが困難であることが多い。なお、特定のアクセスパターンでエラーが発生する原因としては、メインメモリの製造上における微細な欠陥が存在する場合などが挙げられる。
この問題を解決する方法として、特許文献1には、メモリエラーの発生したアクセスパターンをメモリコントローラの不揮発性記憶領域に記録することが開示されている。
また、特許文献2には、メモリエラーを検出して訂正する機能を有するバッファと、エラーの内容を記憶する不揮発記憶領域とを備えることが開示されている。
特開2008−210053号公報 特開2009−181425号公報
しかしながら、特許文献1に記載の方法を用いた場合、メモリコントローラを交換した場合に、メインメモリのエラーの再現ができなくなる問題があり、また、メモリモジュールを交換した場合に、不揮発記憶領域に交換前のメモリモジュールのアクセスパターンが残ってしまうという問題があった。
また、特許文献2に記載の方法では、エラーが発生するアクセスパターンが分からないため、エラーを再現することが困難であるという問題がある。
本発明は上記の課題を解決するためになされたものであり、メモリモジュールと、当該メモリモジュールに設けられたメインメモリへのアクセスを行うコントローラとを備えるメモリエラーパターン記録システムであって、前記メモリモジュールに設けられたメインメモリへのアクセスを行うアクセス部と、前記アクセス部によるアクセスによってエラーが発生したか否かを判定するエラー判定部と、前記エラー判定部によってエラーが発生したと判定された場合、前記メモリモジュールに設けられた不揮発性メモリに前記アクセス部によるアクセスパターンを記録するアクセスパターン記録部とを備えることを特徴とする。
また、本発明は、メモリモジュールと、当該メモリモジュールに設けられたメインメモリへのアクセスを行うコントローラとを用いたメモリエラーパターン記録方法であって、前記コントローラのアクセス部は、前記メモリモジュールに設けられたメインメモリへのアクセスを行い、エラー判定部は、前記アクセス部によるアクセスによってエラーが発生したか否かを判定し、アクセスパターン記録部は、前記エラー判定部によってエラーが発生したと判定された場合、前記メモリモジュールに設けられた不揮発性メモリに前記アクセス部によるアクセスパターンを記録することを特徴とする。
また、本発明は、メインメモリと、前記メインメモリへのアクセスパターンであってエラーが発生するアクセスパターンを記憶する不揮発性メモリと、コントローラによる前記メインメモリへのアクセスによってエラーが発生したか否かを判定するエラー判定部と、前記エラー判定部によってエラーが発生したと判定された場合、前記不揮発性メモリに前記アクセス部によるアクセスパターンを記録するアクセスパターン記録部とを備えることを特徴とするメモリモジュールである。
また、本発明は、メインメモリと、前記メインメモリへのアクセスパターンであってエラーが発生するアクセスパターンを記憶する不揮発性メモリとを備えるメモリモジュールを用いたメモリエラーパターン記録方法であって、エラー判定部は、コントローラによる前記メインメモリへのアクセスによってエラーが発生したか否かを判定し、アクセスパターン記録部は、前記エラー判定部によってエラーが発生したと判定された場合、前記不揮発性メモリに前記アクセス部によるアクセスパターンを記録することを特徴とする。
本発明によれば、エラーが発生するアクセスパターンがメモリモジュールの不揮発性メモリに記録されるので、コントローラを交換した場合にも、交換後のコントローラを用いてメインメモリのエラーを再現することができる。また、メモリモジュールを交換した場合にも、コントローラに交換前のメモリモジュールのエラー情報が残らないため、エラー情報をメモリモジュールごとに適切に記録しておくことができる。
本発明の一実施形態によるメモリエラーパターン記録システムの構成を示す概略ブロック図である。 メモリエラーパターン記録システムの動作を示すフローチャートである。
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の一実施形態によるメモリエラーパターン記録システムの構成を示す概略ブロック図である。
メモリエラーパターン記録システムは、メモリモジュール1とコントローラ2とを備える。
メモリモジュール1は、バッファ11、メモリデバイス12−1〜12−N(メインメモリ)、制御回路13、アクセス情報格納用メモリ14、エラー検出回路15(エラー判定部、エラービット記録部)、アクセス情報記録回路16(アクセスパターン記録部)、不揮発性メモリ17を備える。なお、以下メモリデバイス12−1〜12−Nを総称する場合は、メモリデバイス12と記載する。
バッファ11は、コントローラ2からのアドレス、データ、コマンド、クロックなどを示すアクセス信号を一時的に記憶し、アクセス信号が示すメモリデバイス12に当該アクセス信号を出力する。これにより、当該アクセス信号が示すコマンドとクロックタイミングでデータの授受を行う。なお、このときバッファ11は、一時的に記憶したアクセス信号を制御回路13にも出力する。また、バッファ11は、メモリデバイス12から受け付けたデータ信号を一時的に記憶し、コントローラ2に出力する。なお、このときバッファ11は、一時的に記憶したデータ信号をエラー検出回路15にも出力する。
メモリデバイス12は、バッファ11が出力するアクセス信号によってデータの授受が行われる。なお、本明細書では、アクセス信号によるデータの授受を「アクセス」と記載する。
制御回路13は、バッファ11から入力したアクセス信号に基づいてメモリデバイス12へのアクセスが発生するたびにアクセス情報を生成し、当該アクセス情報をアクセス情報格納用メモリ14に書き込む。
アクセス情報格納用メモリ14は、制御回路13が生成したアクセス情報を記憶する。なお、アクセス情報格納用メモリ14は、その容量が一杯になった場合、古い情報を捨て新しい情報を上書きして記憶する。
エラー検出回路15は、バッファ11から入力したデータ信号からエラーの有無を判定し、エラーが検出された場合に、アクセス情報記録回路16にエラー信号を送信する。このときエラー検出回路15は、エラービットを検出し、不揮発性メモリ17にエラービット情報を記録する。
アクセス情報記録回路16は、エラー検出回路15からエラー信号を入力すると、アクセス情報格納用メモリ14が格納するアクセス情報を読み出し、当該アクセス情報を不揮発性メモリ17に記録する。
不揮発性メモリ17は、アクセス情報格納用メモリ14からのアクセス情報とエラー検出回路15からのエラービット情報を格納し保持する。
コントローラ2は、メモリモジュール1に設けられたメモリデバイス12に対するアクセス信号を生成し、メモリモジュール1に出力し、メモリモジュール1から当該アクセス信号に対するデータ信号を入力する。また、コントローラ2は、メモリモジュール1に設けられた不揮発性メモリ17からメモリモジュール1に対するエラーが発生したアクセスパターンを読み出し、当該アクセスパターンのアクセス信号を生成することで、アクセスパターンを再現する。
次に、本実施形態によるメモリエラーパターン記録システムの動作について説明する。
図2は、メモリエラーパターン記録システムの動作を示すフローチャートである。
メモリエラーパターン記録システムが起動すると、コントローラ2は、アドレス、データ、コマンド、クロック等の情報を含むメモリモジュール1へのアクセス信号を生成し、当該アクセス信号をメモリモジュール1に出力する。これにより、メモリモジュール1は、コントローラ2によるメモリデバイス12へのアクセスが発生したことを検知する(ステップS1)。
次に、バッファ11は、コントローラ2からのアクセス信号を一時的に格納し、格納したアクセス信号によってメモリデバイス12へのアクセスを行う(ステップS2)。具体的には、まず、バッファ11に格納されたアクセス信号を該当するメモリデバイス12に出力する。このとき、バッファ11に格納されたアクセス信号は、制御回路13にも出力される。次に、メモリデバイス12はアクセス信号の応答となるデータ信号を出力し、バッファ11は当該データ信号を一時的に格納する。次に、バッファ11は格納したデータ信号をコントローラ2に出力する。このとき、バッファ11に格納されたデータ信号は、エラー検出回路15に出力される。
次に、制御回路13は、バッファ11から入力したアクセス信号に基づいてアクセス情報を生成し、当該アクセス情報をアクセス情報格納用メモリ14に書き込む。これにより、アクセス情報格納用メモリ14には、アクセスパターンが記録される(ステップS3)。なお、アクセス情報格納用メモリ14の容量が一杯になった場合、制御回路13は、アクセス情報格納用メモリ14に格納されている古い情報を捨て、新しい情報を上書きする。
次に、制御回路13は、コントローラ2によるメモリデバイス12へのアクセスが終了したか否かを判定する(ステップS4)。制御回路13は、コントローラ2によるアクセスが終了したと判定した場合(ステップS4:YES)、処理を終了する。
他方、制御回路13が、コントローラ2によるアクセスが終了していないと判定した場合(ステップS4:NO)、エラー検出回路15は、バッファ11から入力したデータ信号に基づいて、メモリデバイス12へのアクセスによってエラーが発生したか否かを判定する(ステップS5)。エラー検出回路15が、エラーが発生していないと判定した場合(ステップS5:NO)、ステップS2に戻り、アクセスパターンの記録を継続する。
他方、エラー検出回路15がエラーの発生を検出した場合(ステップS5:YES)、エラー検出回路15は、アクセス情報記録回路16にエラー信号を出力する。また、エラー検出回路15は、データ信号に基づいてエラービットを検出し、当該エラービットの位置を示すエラービット情報を生成し、不揮発性メモリ17に記録する(ステップS6)。また、エラー検出回路15からエラー信号を入力したアクセス情報記録回路16は、アクセス情報格納用メモリ14に格納されたアクセス情報を不揮発性メモリ17に記録する(ステップS7)。
このように、本実施形態によれば、メモリモジュール1内部の不揮発性メモリ17にエラービット情報とエラー発生時のアクセスパターンを格納する。これにより、コントローラ2は、エラービットの特定および、エラー発生時のアクセスパターンの再現を容易することができる。具体的には、コントローラ2は、メモリモジュール1の不揮発性メモリ17に格納されたアクセス情報及びエラービット情報を読み出し、当該アクセス情報が示すアクセスパターンでメモリデバイス12へのアクセスを行うことで、エラーの再現を行うことができる。また、当該アクセスによって発生したエラービットがエラービット情報が示す位置と同じであるか否かを判定することで、エラーの検証を行うことができる。
加えて、情報格納場所を不揮発性メモリ17にすることで一旦コントローラ2の電源を落としても情報を保持しているのでコントローラ2を変更してもエラー箇所とエラー発生条件を呼び出すことができる。具体的には、ユーザは、エラーが発生し戻ってきたメモリモジュール1を用いてエラー時のアクセスパターンを再現することができるため、解析のスピードアップを図ることが出来る。
また、本実施形態によれば、アクセス情報及びエラービット情報はメモリモジュール1の不揮発性メモリ17に記録されるため、コントローラ2を交換した場合にも、交換後のコントローラ2を用いてメインメモリのエラーを再現することができる。また、メモリモジュール1を交換した場合にも、交換前のメモリモジュール1のエラー情報と交換後のメモリモジュール1のエラー情報とが混交することがない。
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
例えば、本実施形態では、制御回路13、エラー検出回路15、アクセス情報格納用メモリ14、アクセス情報記録回路16をメモリモジュール1に備える場合を説明したが、これに限られず、バッファ11、メモリデバイス12、不揮発性メモリ17以外の構成は、メモリモジュール1とコントローラ2の何れに設けられていても良い。例えば、メモリモジュール1が、制御回路13、エラー検出回路15、アクセス情報格納用メモリ14、アクセス情報記録回路16を備えず、コントローラ2の機能として、制御回路13に相当する機能、エラー検出回路15に相当する機能、アクセス情報格納用メモリ14、アクセス情報記録回路16に相当する機能を備えていても良い。
1…メモリモジュール 2…コントローラ 11…バッファ 12…メモリデバイス 13…制御回路 14…アクセス情報格納用メモリ 15…エラー検出回路 16…アクセス情報記録回路 17…不揮発性メモリ

Claims (6)

  1. メモリモジュールと、当該メモリモジュールに設けられたメインメモリへのアクセスを行うコントローラとを備えるメモリエラーパターン記録システムであって、
    前記メモリモジュールに設けられたメインメモリへのアクセスを行うアクセス部と、
    前記アクセス部によるアクセスによってエラーが発生したか否かを判定するエラー判定部と、
    前記エラー判定部によってエラーが発生したと判定された場合、前記メモリモジュールに設けられた不揮発性メモリに前記アクセス部によるアクセスパターンを記録するアクセスパターン記録部と
    を備えることを特徴とするメモリエラーパターン記録システム。
  2. 前記エラー判定部によってエラーが発生したと判定された場合、前記メインメモリにおけるエラービットを検出し、当該エラービットの情報を前記不揮発性メモリに記録するエラービット記録部を備えることを特徴とする請求項1に記載のメモリエラーパターン記録システム。
  3. メモリモジュールと、当該メモリモジュールに設けられたメインメモリへのアクセスを行うコントローラとを用いたメモリエラーパターン記録方法であって、
    前記コントローラのアクセス部は、前記メモリモジュールに設けられたメインメモリへのアクセスを行い、
    エラー判定部は、前記アクセス部によるアクセスによってエラーが発生したか否かを判定し、
    アクセスパターン記録部は、前記エラー判定部によってエラーが発生したと判定された場合、前記メモリモジュールに設けられた不揮発性メモリに前記アクセス部によるアクセスパターンを記録する
    ことを特徴とするメモリエラーパターン記録方法。
  4. メインメモリと、
    前記メインメモリへのアクセスパターンであってエラーが発生するアクセスパターンを記憶する不揮発性メモリと、
    コントローラによる前記メインメモリへのアクセスによってエラーが発生したか否かを判定するエラー判定部と、
    前記エラー判定部によってエラーが発生したと判定された場合、前記不揮発性メモリに前記コントローラによるアクセスパターンを記録するアクセスパターン記録部と
    を備えることを特徴とするメモリモジュール。
  5. 前記エラー判定部によってエラーが発生したと判定された場合、前記メインメモリにおけるエラービットを検出し、当該エラービットの情報を前記不揮発性メモリに記録するエラービット記録部を備えることを特徴とする請求項4に記載のメモリモジュール。
  6. メインメモリと、前記メインメモリへのアクセスパターンであってエラーが発生するアクセスパターンを記憶する不揮発性メモリとを備えるメモリモジュールを用いたメモリエラーパターン記録方法であって、
    エラー判定部は、コントローラによる前記メインメモリへのアクセスによってエラーが発生したか否かを判定し、
    アクセスパターン記録部は、前記エラー判定部によってエラーが発生したと判定された場合、前記不揮発性メモリに前記コントローラによるアクセスパターンを記録する
    ことを特徴とするメモリエラーパターン記録方法。
JP2011004602A 2011-01-13 2011-01-13 メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法 Pending JP2012146167A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011004602A JP2012146167A (ja) 2011-01-13 2011-01-13 メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011004602A JP2012146167A (ja) 2011-01-13 2011-01-13 メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法

Publications (1)

Publication Number Publication Date
JP2012146167A true JP2012146167A (ja) 2012-08-02

Family

ID=46789664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011004602A Pending JP2012146167A (ja) 2011-01-13 2011-01-13 メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法

Country Status (1)

Country Link
JP (1) JP2012146167A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020501218A (ja) * 2016-09-16 2020-01-16 マイクロン テクノロジー,インク. 不揮発性サブアレイへのメモリアレイ動作情報の蓄積

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132431A (ja) * 1998-10-20 2000-05-12 Matsushita Electric Ind Co Ltd 信号処理装置
JP2002073427A (ja) * 2000-08-31 2002-03-12 Toshiba Tec Corp データ処理システム
JP2005071068A (ja) * 2003-08-25 2005-03-17 Renesas Technology Corp 記憶装置
JP2007183844A (ja) * 2006-01-10 2007-07-19 Hitachi Global Storage Technologies Netherlands Bv 補助記憶装置および記録再生方法
JP2007525740A (ja) * 2003-09-30 2007-09-06 インテル コーポレイション イベントサイン装置、システム及び方法
JP2008210053A (ja) * 2007-02-23 2008-09-11 Nec Corp メモリエラーパターン記録システム、メモリエラーパターン記録方法
JP2009181425A (ja) * 2008-01-31 2009-08-13 Nec Corp メモリモジュール
JP2010204851A (ja) * 2009-03-02 2010-09-16 Hitachi Ltd 記憶装置及び情報処理装置
JP2010238192A (ja) * 2009-03-31 2010-10-21 Fujitsu Ltd メモリ制御装置、メモリモジュール及びメモリ制御方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132431A (ja) * 1998-10-20 2000-05-12 Matsushita Electric Ind Co Ltd 信号処理装置
JP2002073427A (ja) * 2000-08-31 2002-03-12 Toshiba Tec Corp データ処理システム
JP2005071068A (ja) * 2003-08-25 2005-03-17 Renesas Technology Corp 記憶装置
JP2007525740A (ja) * 2003-09-30 2007-09-06 インテル コーポレイション イベントサイン装置、システム及び方法
JP2007183844A (ja) * 2006-01-10 2007-07-19 Hitachi Global Storage Technologies Netherlands Bv 補助記憶装置および記録再生方法
JP2008210053A (ja) * 2007-02-23 2008-09-11 Nec Corp メモリエラーパターン記録システム、メモリエラーパターン記録方法
JP2009181425A (ja) * 2008-01-31 2009-08-13 Nec Corp メモリモジュール
JP2010204851A (ja) * 2009-03-02 2010-09-16 Hitachi Ltd 記憶装置及び情報処理装置
JP2010238192A (ja) * 2009-03-31 2010-10-21 Fujitsu Ltd メモリ制御装置、メモリモジュール及びメモリ制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020501218A (ja) * 2016-09-16 2020-01-16 マイクロン テクノロジー,インク. 不揮発性サブアレイへのメモリアレイ動作情報の蓄積
US11392468B2 (en) 2016-09-16 2022-07-19 Micron Technology, Inc. Storing memory array operational information in non-volatile subarrays

Similar Documents

Publication Publication Date Title
TWI658464B (zh) 記憶體裝置以及記憶體模組
JP5202130B2 (ja) キャッシュメモリ、コンピュータシステム、及びメモリアクセス方法
JP2007133986A (ja) 半導体記憶装置
US8140940B2 (en) Method and apparatus for controlling memory
JP2011054263A (ja) メモリエラーと冗長
KR102214556B1 (ko) 메모리 장치 및 모듈
JP2008139908A (ja) メモリ制御装置、コンピュータシステム及びデータ再生記録装置
JP2007172363A (ja) I2cバスのデータ伝送装置、及びその方法、並びにi2cバスのデータ伝送プログラム
US20110004817A1 (en) Crc management method performed in sata interface and data storage device using crc management method
JP5504604B2 (ja) Ram診断装置
EP3125251A1 (en) Hamming code-based data access method and integrated random access memory
JP2008310896A (ja) 不揮発性記憶装置、不揮発性記憶システムおよび不揮発性記憶装置の制御方法
JP2012146167A (ja) メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法
KR20130136341A (ko) 반도체 장치 및 그 동작 방법
JP5213061B2 (ja) ミラーリング制御装置、ミラーリング制御回路、ミラーリング制御方法およびそのプログラム
JP5361826B2 (ja) 記録ユニット及び故障チップ特定方法
JP5087970B2 (ja) 情報処理装置および情報処理方法
JP2007193905A (ja) 半導体記憶装置
TWI482014B (zh) 具有動態錯誤偵測及更正的記憶體
JP5535113B2 (ja) メモリシステム
US20060179215A1 (en) Apparatus for detecting disk write omissions
JP5907558B2 (ja) マルチインターバルタイマ並びにその制御装置、制御方法及び制御プログラム
JP5652720B2 (ja) Fpgaシステム及び電子機器
JP2009116978A (ja) 半導体記憶装置
JP2011054221A (ja) 記憶装置及び電子機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150324

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150714