JP4877396B2 - メモリ障害処理システム、および、メモリ障害処理方法 - Google Patents
メモリ障害処理システム、および、メモリ障害処理方法 Download PDFInfo
- Publication number
- JP4877396B2 JP4877396B2 JP2010009992A JP2010009992A JP4877396B2 JP 4877396 B2 JP4877396 B2 JP 4877396B2 JP 2010009992 A JP2010009992 A JP 2010009992A JP 2010009992 A JP2010009992 A JP 2010009992A JP 4877396 B2 JP4877396 B2 JP 4877396B2
- Authority
- JP
- Japan
- Prior art keywords
- memory chip
- memory
- switching
- cache line
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1048—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices using arrangements adapted for a specific error detection or correction feature
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/073—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/076—Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1666—Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C16/00—Erasable programmable read-only memories
- G11C16/02—Erasable programmable read-only memories electrically programmable
- G11C16/06—Auxiliary circuits, e.g. for writing into memory
- G11C16/34—Determination of programming status, e.g. threshold voltage, overprogramming or underprogramming, retention
- G11C16/349—Arrangements for evaluating degradation, retention or wearout, e.g. by counting erase cycles
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/70—Masking faults in memories by using spares or by reconfiguring
- G11C29/78—Masking faults in memories by using spares or by reconfiguring using programmable devices
- G11C29/80—Masking faults in memories by using spares or by reconfiguring using programmable devices with improved layout
- G11C29/816—Masking faults in memories by using spares or by reconfiguring using programmable devices with improved layout for an application-specific layout
- G11C29/82—Masking faults in memories by using spares or by reconfiguring using programmable devices with improved layout for an application-specific layout for EEPROMs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
- For Increasing The Reliability Of Semiconductor Memories (AREA)
- Debugging And Monitoring (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Description
前記予備メモリチップ切替後に発生する障害の発生回数を、前記障害の発生箇所に対応するキャッシュライン単位でカウントするキャッシュライン単位カウントステップと、
前記切替後の発生回数総和が前記総和閾値を超える前に前記キャッシュライン単位発生回数がキャッシュライン単位閾値を超えた場合、該キャッシュラインを含むメモリページを閉塞するメモリページ閉塞ステップと、前記キャッシュライン単位発生回数が前記キャッシュライン単位閾値を超える前に前記切替後の発生回数総和が前記総和閾値を超えた以降は、前記障害が発生する毎に前記メモリページを閉塞する障害発生毎ページ閉塞ステップと、を実行する。
前記メモリ装置が前記メモリチップおよび前記予備メモリチップによってそれぞれ構成される複数のランクを有するとき、前記メモリ障害処理システムに、
前記障害が発生したメモリチップを含むランクが前記予備メモリチップ切替前であるか切替後であるかを判断する切替前後判断ステップをさらに実行させ、
前記予備メモリチップ切替ステップは、前記発生回数総和が前記総和閾値を超えたとき前記ランクが前記予備メモリチップ切替前であれば前記メモリチップを前記予備メモリチップへ切り替え、
前記キャッシュライン単位カウントステップは、前記予備メモリチップ切替後であると判断されたランクに含まれるメモリチップで発生した障害の発生回数を前記キャッシュライン単位でカウントすることを特徴とする請求項10に記載のメモリ障害処理プログラム。
2、5 メモリ装置
3、6、8 情報処理装置
21 メモリチップ
22 予備メモリチップ
31 発生回数総和カウント部
32 予備メモリチップ切替部
33 キャッシュライン単位カウント部
34、63 ページ閉塞部
52 ランク
61 切替前後判断部
62 障害ページ通知部
81 ランク単位発生回数カウント部
Claims (10)
- メモリチップおよび予備メモリチップを有するメモリ装置と、
情報処理装置とを含み、
前記情報処理装置は、
前記メモリチップに発生する障害の発生回数の総和をカウントする発生回数総和カウント手段と、
前記発生回数総和が総和閾値を超えると、前記障害が発生したメモリチップを前記予備メモリチップに切り替える予備メモリチップ切替手段と、
前記予備メモリチップ切替後に発生する障害の発生回数を、前記障害の発生箇所に対応するキャッシュライン単位でカウントするキャッシュライン単位カウント手段と、
前記切替後の発生回数総和が前記総和閾値を超える前に前記キャッシュライン単位発生回数がキャッシュライン単位閾値を超えた場合、該キャッシュラインを含むメモリページを閉塞し、前記キャッシュライン単位発生回数が前記キャッシュライン単位閾値を超える前に前記切替後の発生回数総和が前記総和閾値を超えた以降は、前記障害が発生する毎に前記メモリページを閉塞するページ閉塞手段と、
を備えたメモリ障害処理システム。 - 前記メモリ装置は、前記メモリチップおよび前記予備メモリチップによってそれぞれ構成される複数のランクを有し、
前記情報処理装置は、
前記障害が発生したメモリチップを含むランクが前記予備メモリチップ切替前であるか切替後であるかを判断する切替前後判断手段をさらに有し、
前記予備メモリチップ切替手段は、前記発生回数総和が前記総和閾値を超えたとき前記ランクが前記予備メモリチップ切替前であれば前記メモリチップを前記予備メモリチップへ切り替え、
前記キャッシュライン単位カウント手段は、前記予備メモリチップ切替後であると判断されたランクに含まれるメモリチップで発生した障害の発生回数を前記キャッシュライン単位でカウントすることを特徴とする請求項1に記載のメモリ障害処理システム。 - 前記情報処理装置は、
前記予備メモリチップ切替後に発生する障害の発生回数を前記ランク単位でカウントするランク単位カウント手段をさらに備え、
前記ページ閉塞手段は、前記発生回数総和が前記総和閾値を超える前に前記ランク単位発生回数がランク単位閾値を超えた場合、該当するランクに対応付けられた各キャッシュラインをそれぞれ含むメモリページを閉塞すること特徴とする請求項2に記載のメモリ障害処理システム。 - 前記総和閾値は、前記キャッシュライン単位閾値より大きいことを特徴とする請求項1から請求項3のいずれかに記載のメモリ障害処理システム。
- 前記ランク単位閾値は、前記総和閾値より小さく前記キャッシュライン単位閾値より大きいことを特徴とする請求項3に記載のメモリ障害処理システム。
- メモリチップおよび予備メモリチップを有するメモリ装置に接続され、
前記メモリチップに発生する障害の発生回数の総和をカウントする発生回数総和カウント手段と、
前記発生回数総和が総和閾値を超えると、前記障害が発生したメモリチップを前記予備メモリチップに切り替える予備メモリチップ切替手段と、
前記予備メモリチップ切替後に発生する障害の発生回数を、前記障害の発生箇所に対応するキャッシュライン単位でカウントするキャッシュライン単位カウント手段と、
前記切替後の発生回数総和が前記総和閾値を超える前に前記キャッシュライン単位発生回数がキャッシュライン単位閾値を超えた場合、該キャッシュラインを含むメモリページを閉塞し、前記キャッシュライン単位発生回数が前記キャッシュライン単位閾値を超える前に前記切替後の発生回数総和が前記総和閾値を超えた以降は、前記障害が発生する毎に前記メモリページを閉塞するページ閉塞手段と、
を備えた情報処理装置。 - 前記メモリ装置が前記メモリチップおよび前記予備メモリチップによってそれぞれ構成される複数のランクを有するとき、
前記障害が発生したメモリチップを含むランクが前記予備メモリチップ切替前であるか切替後であるかを判断する切替前後判断手段をさらに備え、
前記予備メモリチップ切替手段は、前記発生回数総和が前記総和閾値を超えたとき前記ランクが前記予備メモリチップ切替前であれば前記メモリチップを前記予備メモリチップへ切り替え、
前記キャッシュライン単位カウント手段は、前記予備メモリチップ切替後であると判断されたランクに含まれるメモリチップで発生した障害の発生回数を前記キャッシュライン単位でカウントすることを特徴とする請求項6に記載の情報処理装置。 - メモリチップおよび予備メモリチップを有するメモリ装置と、前記メモリ装置に接続された情報処理装置とを備えたメモリ障害処理システムを用いて、
前記メモリチップに発生する障害の発生回数の総和をカウントする発生回数総和カウントステップと、
前記発生回数総和が総和閾値を超えると、前記障害が発生したメモリチップを前記予備メモリチップに切り替える予備メモリチップ切替ステップと、
前記予備メモリチップ切替後に発生する障害の発生回数を、前記障害の発生箇所に対応するキャッシュライン単位でカウントするキャッシュライン単位カウントステップと、
前記切替後の発生回数総和が前記総和閾値を超える前に前記キャッシュライン単位発生回数がキャッシュライン単位閾値を超えた場合、該キャッシュラインを含むメモリページを閉塞するメモリページ閉塞ステップと、
前記キャッシュライン単位発生回数が前記キャッシュライン単位閾値を超える前に前記切替後の発生回数総和が前記総和閾値を超えた以降は、前記障害が発生する毎に前記メモリページを閉塞する障害発生毎ページ閉塞ステップと、
を実行するメモリ障害処理方法。 - 前記メモリ装置が前記メモリチップおよび前記予備メモリチップによってそれぞれ構成される複数のランクを有するとき、前記メモリ障害処理システムを用いて、
前記障害が発生したメモリチップを含むランクが前記予備メモリチップ切替前であるか切替後であるかを判断する切替前後判断ステップをさらに実行し、
前記予備メモリチップ切替ステップは、前記発生回数総和が前記総和閾値を超えたとき前記ランクが前記予備メモリチップ切替前であれば前記メモリチップを前記予備メモリチップへ切り替え、
前記キャッシュライン単位カウントステップは、前記予備メモリチップ切替後であると判断されたランクに含まれるメモリチップで発生した障害の発生回数を前記キャッシュライン単位でカウントすることを特徴とする請求項8に記載のメモリ障害処理方法。 - メモリチップおよび予備メモリチップを有するメモリ装置と、前記メモリ装置に接続された情報処理装置とを備えたメモリ障害処理システムに、
前記メモリチップに発生する障害の発生回数総和が総和閾値を超えると、前記障害が発生したメモリチップを前記予備メモリチップに切り替える予備メモリチップ切替ステップと、
前記予備メモリチップ切替後に発生する障害の発生回数を、前記障害の発生箇所に対応するキャッシュライン単位でカウントするキャッシュライン単位カウントステップと、
前記切替後の発生回数総和が前記総和閾値を超える前に前記キャッシュライン単位発生回数がキャッシュライン単位閾値を超えた場合、該キャッシュラインを含むメモリページを閉塞するページ閉塞ステップと、
前記キャッシュライン単位発生回数が前記キャッシュライン単位閾値を超える前に前記切替後の発生回数総和が前記総和閾値を超えた以降は、前記障害が発生する毎に前記メモリページを閉塞する障害発生毎ページ閉塞ステップと、
を実行させるメモリ障害処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010009992A JP4877396B2 (ja) | 2010-01-20 | 2010-01-20 | メモリ障害処理システム、および、メモリ障害処理方法 |
US13/009,565 US8261137B2 (en) | 2010-01-20 | 2011-01-19 | Apparatus, a method and a program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010009992A JP4877396B2 (ja) | 2010-01-20 | 2010-01-20 | メモリ障害処理システム、および、メモリ障害処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011150469A JP2011150469A (ja) | 2011-08-04 |
JP4877396B2 true JP4877396B2 (ja) | 2012-02-15 |
Family
ID=44278441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010009992A Expired - Fee Related JP4877396B2 (ja) | 2010-01-20 | 2010-01-20 | メモリ障害処理システム、および、メモリ障害処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8261137B2 (ja) |
JP (1) | JP4877396B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8719493B2 (en) * | 2012-03-21 | 2014-05-06 | Dell Products L.P. | Memory controller-independent memory sparing |
JP6163855B2 (ja) * | 2013-04-30 | 2017-07-19 | 富士通株式会社 | ストレージシステム、制御装置、制御プログラムおよび制御方法 |
WO2015059804A1 (ja) * | 2013-10-24 | 2015-04-30 | 株式会社日立製作所 | ストレージシステムおよびその制御方法 |
CN104991835A (zh) * | 2015-06-11 | 2015-10-21 | 浪潮电子信息产业股份有限公司 | 一种rank的备份方法及装置 |
JP6679122B1 (ja) * | 2019-03-19 | 2020-04-15 | Necプラットフォームズ株式会社 | メモリ障害対処システム、情報処理装置及びメモリ障害対処方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01204165A (ja) * | 1988-02-09 | 1989-08-16 | Fujitsu Ltd | メモリ縮退制御方式 |
JPH03147162A (ja) * | 1989-11-02 | 1991-06-24 | Nec Field Service Ltd | 交代メモリーへの自動切替え方式 |
JP3022687B2 (ja) * | 1992-08-12 | 2000-03-21 | 北陸日本電気ソフトウェア株式会社 | メモリ障害処理方式 |
JPH0827733B2 (ja) * | 1993-07-06 | 1996-03-21 | 日本電気株式会社 | 障害処理システム |
JP3070453B2 (ja) * | 1995-09-20 | 2000-07-31 | 日本電気株式会社 | 計算機システムのメモリ障害回復方法および回復システム |
JPH09146849A (ja) * | 1995-11-21 | 1997-06-06 | Nec Corp | 情報処理システム及びそのメモリ再構成方法 |
US5835930A (en) * | 1996-04-09 | 1998-11-10 | International Business Machines Corporation | One or more logical tracks per physical track in a headerless disk drive |
DE19838861A1 (de) * | 1998-08-26 | 2000-03-02 | Siemens Ag | Verfahren zur Reparatur von defekten Speicherzellen eines integrierten Speichers |
DE19917588A1 (de) * | 1999-04-19 | 2000-11-02 | Siemens Ag | Halbleiterspeicheranordnung mit BIST |
US6691252B2 (en) * | 2001-02-23 | 2004-02-10 | Hewlett-Packard Development Company, L.P. | Cache test sequence for single-ported row repair CAM |
DE10131015C2 (de) * | 2001-06-27 | 2003-12-04 | Infineon Technologies Ag | Verfahren zur Beurteilung der Qualität einer eine Vielzahl von Speicherzellen aufweisenden Speichereinheit |
US20030023922A1 (en) * | 2001-07-25 | 2003-01-30 | Davis James A. | Fault tolerant magnetoresistive solid-state storage device |
US7424663B2 (en) * | 2005-01-19 | 2008-09-09 | Intel Corporation | Lowering voltage for cache memory operation |
JP4369523B2 (ja) * | 2006-02-27 | 2009-11-25 | 富士通株式会社 | 縮退制御装置 |
JP2007299213A (ja) * | 2006-04-28 | 2007-11-15 | Fujitsu Ltd | Raid制御装置および障害監視方法 |
JP2008204041A (ja) * | 2007-02-19 | 2008-09-04 | Hitachi Ltd | ストレージ装置及びデータ配置制御方法 |
US8527819B2 (en) * | 2007-10-19 | 2013-09-03 | Apple Inc. | Data storage in analog memory cell arrays having erase failures |
US8400854B2 (en) * | 2009-09-11 | 2013-03-19 | Sandisk Technologies Inc. | Identifying at-risk data in non-volatile storage |
US7954021B2 (en) * | 2009-10-23 | 2011-05-31 | International Business Machines Corporation | Solid state drive with flash sparing |
-
2010
- 2010-01-20 JP JP2010009992A patent/JP4877396B2/ja not_active Expired - Fee Related
-
2011
- 2011-01-19 US US13/009,565 patent/US8261137B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20110179318A1 (en) | 2011-07-21 |
US8261137B2 (en) | 2012-09-04 |
JP2011150469A (ja) | 2011-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101374455B1 (ko) | 메모리 에러와 리던던시 | |
US7350007B2 (en) | Time-interval-based system and method to determine if a device error rate equals or exceeds a threshold error rate | |
KR100878550B1 (ko) | 메모리 컨트롤러 및 메모리 제어 방법 | |
US8689041B2 (en) | Method for protecting data in damaged memory cells by dynamically switching memory mode | |
US20040168101A1 (en) | Redundant memory system and memory controller used therefor | |
JP4877396B2 (ja) | メモリ障害処理システム、および、メモリ障害処理方法 | |
US7734949B2 (en) | Information error recovery apparatus and methods | |
JP2012113466A (ja) | メモリコントローラ及び情報処理システム | |
US8782485B2 (en) | Hierarchical channel marking in a memory system | |
CN106463179A (zh) | 利用存储器控制器处理数据错误事件的方法、装置和系统 | |
EP2770507B1 (en) | Memory circuits, method for accessing a memory and method for repairing a memory | |
JP5506908B2 (ja) | 集積回路における故障耐性 | |
US20160357650A1 (en) | Dynamic cache row fail accumulation due to catastrophic failure | |
WO2023020031A1 (zh) | 一种内存故障恢复方法、系统以及内存 | |
US20140101481A1 (en) | Per-rank channel marking in a memory system | |
JP2019095893A (ja) | 半導体装置 | |
JP5451087B2 (ja) | 障害処理装置および方法 | |
CN114360623A (zh) | 用于存储器纠错的方法、存储器控制器及计算机系统 | |
CN100437527C (zh) | 存储器装置 | |
CN116401085A (zh) | 内存异常处理方法、设备及存储介质 | |
WO2008004330A1 (fr) | Système à processeurs multiples | |
CN102479119A (zh) | 动态切换存储器模式以保护受损记忆胞数据的方法 | |
JP5910356B2 (ja) | 電子装置、電子装置制御方法及び電子装置制御プログラム | |
CN115421962A (zh) | 可纠正内存故障的处置方法、系统、存储介质和终端 | |
WO2020189617A1 (ja) | メモリ障害対処システム、情報処理装置及びメモリ障害対処方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111101 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4877396 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |