JP2015041175A - Memory management device, control method, program, and recording medium - Google Patents
Memory management device, control method, program, and recording medium Download PDFInfo
- Publication number
- JP2015041175A JP2015041175A JP2013171050A JP2013171050A JP2015041175A JP 2015041175 A JP2015041175 A JP 2015041175A JP 2013171050 A JP2013171050 A JP 2013171050A JP 2013171050 A JP2013171050 A JP 2013171050A JP 2015041175 A JP2015041175 A JP 2015041175A
- Authority
- JP
- Japan
- Prior art keywords
- memory
- storage element
- physical address
- failure
- management device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- For Increasing The Reliability Of Semiconductor Memories (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
Description
本発明は、メモリ管理装置、制御方法、プログラムおよび記録媒体に関する。 The present invention relates to a memory management device, a control method, a program, and a recording medium.
システムにおいて、メモリ障害が生じると、当該障害が生じたメモリを検出し、検出したメモリを使用しないようにする方法が知られている。 When a memory failure occurs in a system, a method is known in which a memory in which the failure has occurred is detected and the detected memory is not used.
例えば、特許文献1には、運用中に、障害が生じたデータ記憶機構を検出し、置換データ及び利用可能データで置き換える装置が記載されている。
For example,
特許文献2には、運用中に、障害が発生したブロックを縮退し、ブロックが縮退していることをあらわす縮退情報をブロックに書き込んで、当該縮退情報の読み出し結果に基づいて当該ブロックの縮退状況を判定するキャッシュメモリ装置が記載されている。
特許文献3には、描画領域が割り当てられたメモリに対し、異常の発生が検知された場合、メモリ領域全体から異常領域を除く領域に対して、描画領域の再割り当てを行う表示装置が記載されている。 Patent Document 3 describes a display device that, when an abnormality is detected in a memory to which a drawing area is assigned, reassigns the drawing area to an area excluding the abnormal area from the entire memory area. ing.
ミッションクリティカルな領域で運用されているハイエンドサーバでは、障害が発生した場合にシステムへの影響を最小限にとどめることが要求される。また、ハイエンドサーバにおいてシステムダウンを伴う障害の場合には、保守による故障部位の交換が必要となる場合がある。 High-end servers operating in mission-critical areas are required to minimize the impact on the system when a failure occurs. Further, in the case of a failure accompanying a system failure in a high-end server, it may be necessary to replace the failed part by maintenance.
しかしながら、システムが基幹系システムなど場合、運用状態によっては、保守を行うことよりも、システムダウンからいち早く回復しなければならない場合がある。このため、障害発生後においても障害の影響を最小限にとどめ、安定してシステムを動作させることが求められる。 However, when the system is a backbone system or the like, depending on the operation state, it may be necessary to quickly recover from the system down rather than performing maintenance. For this reason, it is required to operate the system stably while minimizing the influence of the failure even after the occurrence of the failure.
特許文献1および2の技術では、運用中に障害が生じたブロック等を検出してデータの置換またはブロックの縮退運転を行っているが、システムダウンなどによりシステムが再起動した後では、障害が生じたメモリ自体を検出し、当該メモリを縮退して運転する場合がある。
In the techniques of
近年では、DIMM(Dual Inline Memory Module)などのメモリの容量は大容量化してきており、1枚で64GBの容量を持ったDIMMも存在する。このため、特許文献2の技術のようにメモリを縮退する運転をする場合、このようなDIMM1枚を縮退させることになる。しかしながら、DIMMの大容量化に伴い、DIMM1枚を縮退しただけで、システム全体の性能を低下させ、システムを安定して動作させることができなくなってしまう可能性がある。
In recent years, the capacity of memories such as DIMMs (Dual Inline Memory Modules) has increased, and there is a single DIMM having a capacity of 64 GB. For this reason, when performing the operation | movement which degenerates a memory like the technique of
また、特許文献3の技術では、描画領域や表示領域など、特定の領域において、異常領域を除く領域に対して、描画領域の再割り当てを行っているが、物理的なメモリ(例えば、DIMMなど)の容量を効率的に利用する方法については開示されていない。 In the technique of Patent Document 3, the drawing area is reassigned to the area excluding the abnormal area in a specific area such as the drawing area and the display area. However, the physical memory (for example, DIMM or the like) is used. ) Is not disclosed about a method for efficiently using the capacity.
本発明は、上記問題に鑑みてなされたものであり、その目的は、メモリ障害発生後の再起動後においても、物理的なメモリの使用を効率的に行うメモリ管理装置を提供することにある。 The present invention has been made in view of the above problems, and an object of the present invention is to provide a memory management device that efficiently uses physical memory even after restart after a memory failure occurs. .
本発明の一態様に係るメモリ管理装置は、複数の記憶素子を含むメモリモジュールと、前記メモリモジュールに含まれる複数の記憶素子の夫々を特定するための特定情報から当該特定情報によって特定される記憶素子に割り当てられた物理アドレスを特定するメモリ特定手段と、前記複数の記憶素子のうち、何れの物理アドレスの記憶素子を使用するのかを制御する制御手段と、を備え、前記メモリ特定手段は、前記複数の記憶素子の少なくとも何れかに障害が発生した際、障害が発生した前記記憶素子の特定情報を保持し、再起動後に、保持した特定情報から障害が発生した前記記憶素子の物理アドレスを特定し、前記制御手段は、前記複数の記憶素子のうち、前記メモリ特定手段が特定した物理アドレスの記憶素子以外の記憶素子を使用するよう制御する。 A memory management device according to an aspect of the present invention includes a memory module that includes a plurality of storage elements, and a storage that is specified by the specific information from specific information that specifies each of the plurality of storage elements included in the memory module. A memory specifying means for specifying a physical address assigned to the element, and a control means for controlling which of the plurality of storage elements to use a storage element of, the memory specifying means, When a failure occurs in at least one of the plurality of storage elements, the specific information of the storage element in which the failure has occurred is retained, and after restart, the physical address of the storage element in which the failure has occurred is determined from the retained specific information. The control unit uses a storage element other than the storage element of the physical address specified by the memory specifying unit among the plurality of storage elements. To so that control.
本発明の一態様に係る制御方法は、複数の記憶素子を含むメモリモジュールを備えたメモリ管理装置の制御方法であって、前記複数の記憶素子の少なくとも何れかに障害が発生した際、障害が発生した前記記憶素子を特定するための特定情報を保持し、再起動後に、保持した特定情報から当該特定情報によって特定される記憶素子に割り当てられた物理アドレスであって、障害が発生した前記記憶素子の物理アドレスを特定し、前記複数の記憶素子のうち、前記特定した物理アドレスの記憶素子以外の記憶素子を使用するよう制御する。 A control method according to an aspect of the present invention is a control method of a memory management device including a memory module including a plurality of storage elements, and when a failure occurs in at least one of the plurality of storage elements, the failure occurs. The specific information for specifying the generated storage element is held, and after the restart, the physical address assigned to the storage element specified by the specific information from the held specific information, and the storage in which the failure has occurred A physical address of the element is specified, and control is performed to use a storage element other than the storage element of the specified physical address among the plurality of storage elements.
本発明の一態様に係るプログラムは、メモリモジュールに含まれる複数の記憶素子の少なくとも何れかに障害が発生した際、障害が発生した前記記憶素子を特定するための特定情報を保持し、再起動後に、保持した特定情報から当該特定情報によって特定される記憶素子に割り当てられた物理アドレスであって、障害が発生した前記記憶素子の物理アドレスを特定する処理と、前記複数の記憶素子のうち、前記特定した物理アドレスの記憶素子以外の記憶素子を使用するよう制御する処理と、をコンピュータに実行させる。 The program according to one aspect of the present invention holds specific information for specifying the storage element in which the failure has occurred and restarts when a failure occurs in at least one of the plurality of storage elements included in the memory module. A process of identifying a physical address of the storage element that is a physical address assigned to the storage element specified by the specific information from the stored specific information later, and among the plurality of storage elements, And causing the computer to execute a process of controlling to use a storage element other than the storage element having the specified physical address.
本発明のメモリ管理装置によれば、メモリ障害発生後の再起動後においても、物理的なメモリの使用を効率的に行うことができる。 According to the memory management device of the present invention, physical memory can be used efficiently even after restart after a memory failure occurs.
<実施の形態>
本発明の実施の形態について、図面を参照して詳細に説明する。
<Embodiment>
Embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の一実施の形態に係るメモリ管理装置の構成を示すブロック図である。図1に示すように、本実施の形態に係るメモリ管理装置1は、CPU10と、複数のDIMM11〜18と、を備えている。なお、本実施の形態においてメモリモジュールとしてDIMMを採用して説明を行うが、本発明はこれに限定されるものではない。また、本実施の形態においては、DIMMが8つであることを例に説明を行うが、本発明はこれに限定されるものではない。
FIG. 1 is a block diagram showing a configuration of a memory management device according to an embodiment of the present invention. As shown in FIG. 1, the
CPU10は、メモリ管理装置1の全体を制御する。DIMM11〜18は、図1に示すようにCPU10に接続されている。なお、図1は、CPU10とDIMM11〜18との典型的な接続例を示している。
The
DIMM11〜18の夫々には、6つの記憶素子(DRAM110〜115、120〜125、130〜135、140〜145、150〜155、160〜165、170〜175、180〜185)が含まれている。本実施の形態においては、記憶素子として、DRAM(Dynamic Random Access Memory)を採用して説明を行うが、本発明はこれに限定されるものではない。また、各DIMMに含まれるDRAMの数は6つに限定されるものではない。
Each of the
各DRAMには、物理アドレスが割り当てられている。なお、本実施の形態にて記述する物理アドレスとは、典型的なパーソナルコンピュータ等のハードウェアにおいて割り当てられる実メモリに対する物理アドレスであるとして説明を行う。 A physical address is assigned to each DRAM. In the following description, the physical address described in the present embodiment is a physical address for a real memory allocated in hardware such as a typical personal computer.
次に、本実施の形態に係るメモリ管理装置1の機能構成について、図2を参照して説明する。図2は、本実施の形態に係るメモリ管理装置1の機能構成を示す機能ブロック図である。
Next, the functional configuration of the
図2に示す通り、メモリ管理装置1は、メモリ特定部101と、メモリ制御部102と、を含んでいる。メモリ特定部101およびメモリ制御部102は、CPU10に実現される。また、図2において、図1のDIMM11〜18は、DIMM群として表している。
As shown in FIG. 2, the
メモリ特定部101は、DRAMの少なくとも何れかに障害が発生した際、障害が発生した(故障した)DRAM(故障DRAM)を特定し、特定した故障DRAMの位置情報を保持する。ここで、DRAMの位置情報とは、各DRAMを特定するための情報であり、例えば、故障DRAMがどのDIMMの何番目のDRAMかを示す情報(特定情報)のことである。なお、本実施の形態では、各DRAMの位置を特定する情報として、DRAM番号を採用して説明を行うが、本発明はこれに限定されるものではない。
When a failure occurs in at least one of the DRAMs, the
メモリ特定部101は、保持している故障DRAMの位置情報から当該故障DRAMの物理アドレスを特定し、メモリ制御部102に通知する。
The
なお、メモリ特定部101の動作は、BMCFW(Baseboard Management Controller FirmWare)などの典型的なマネージメントファームウェアの障害特定機能であってもよい。
The operation of the
メモリ制御部102は、複数のDRAMのうち、何れの物理アドレスのDRAMを使用するのかを制御する。つまり、メモリ制御部102は、メモリ特定部101から通知された、故障DRAMの物理アドレスに基づいて、当該物理アドレスによって特定されるDRAMをメモリ管理装置1から除外するよう制御する。具体的には、メモリ制御部102は、上記故障DRAMをメモリ管理装置1にて利用可能なDRAMでないと特定し、メモリ管理装置1のOSで利用可能なDRAMを使用して、メモリ管理装置1を起動する。
The
なお、メモリ制御部102は、メモリ管理装置1のOSに含まれる機能であってもよい。
Note that the
図3は各DRAMのDRAM番号と、各DRAMに割り当てられている物理アドレスと、各DRAMがOSで利用可能か否かを示す情報の一例を示す図である。 FIG. 3 is a diagram showing an example of information indicating the DRAM number of each DRAM, the physical address assigned to each DRAM, and whether each DRAM can be used by the OS.
図3の一番右側の列は、各DRAMが、メモリ管理装置1のOSで利用可能か否かを表す情報(使用可否情報)を示している。図3においては、各DRAMに対し、OSで利用可能である場合「○」を示し、利用可能でない場合「×」を示している。図3に示す通り、各DRAMは、すべて、OS(Operation System)が利用可能であることがわかる。
The rightmost column in FIG. 3 shows information (usability information) indicating whether or not each DRAM can be used by the OS of the
図3に示すように、DRAMを特定するDRAM番号に、DRAMの物理アドレスと、使用可否情報とが関連付けられている。図3に示す情報は、図示しないメモリに記録されてもよいし、CPU10に内蔵されたメモリに記録されていてもよい。
As shown in FIG. 3, the physical number of the DRAM and the availability information are associated with the DRAM number that identifies the DRAM. The information shown in FIG. 3 may be recorded in a memory (not shown) or may be recorded in a memory built in the
次に、メモリ管理装置1の動作について、図4を参照して説明する。図4は、メモリ障害が発生した際のメモリ管理装置1の処理の流れを示すフローチャートである。図4の各処理は、CPU10のプログラム制御によって実行される。
Next, the operation of the
ここで、メモリ障害について説明する。本実施の形態で対象となるメモリ障害は、典型的なDIMMを利用して発生する可能性がある、DRAMのシングルビット(Single bit)エラー(継続運用可能障害)と、マルチビット(Multi bit)エラー(継続運用不可能障害)と、が挙げられる。 Here, the memory failure will be described. A memory failure that is a target of the present embodiment may occur using a typical DIMM, a single bit (single bit) error (continuous operation failure) of a DRAM, and a multi-bit (multi bit). Error (failure that cannot be continued).
本実施の形態におけるメモリ管理装置1は、上記メモリ障害が起こった際に、図4に示す動作を行う。図4において、ステップS1〜S7の夫々は、以下の説明では、単にS1〜S7の符号で表すものとする。
The
図4に示す通り、障害が発生すると、まず、メモリ特定部101が、故障DRAMを特定する(S1)。そして、メモリ特定部101は、特定した故障DRAMの位置情報を図示しない不揮発性のメモリなどに保持する(S2)。
As shown in FIG. 4, when a failure occurs, the
その後、メモリ管理装置1がメモリ障害を含む、各種再起動要因(例えば、OSのアップデートや、その他の運用継続不可能障害発生など)で、再起動する(S3)と、メモリ特定部101は、図3に示す情報を参照し、S2で保持した故障DRAMの位置情報から、当該故障DRAMの物理アドレスを特定する(S4)。
After that, when the
メモリ特定部101は、S4で特定した故障DRAMの物理アドレスを、メモリ制御部102に通知する(S5)。そして、メモリ制御部102は、通知された物理アドレスを、メモリ管理装置1から除外し(S6)、現時点で使用可能なDRAMを使用して、メモリ管理装置1を起動する(S7)。
The
ここで、図1に示すDRAMのうち、DRAM113でマルチビットエラーが発生した場合を例に挙げ、メモリ管理装置1の動作についてさらに説明する。
Here, the operation of the
まずメモリ障害が発生すると、メモリ特定部101は、故障DIMM(本例では、DIMM11)と、故障DRAM(DRAM113)を特定する。そして、メモリ特定部101は、特定した故障DRAM(DRAM113)の位置情報(DRAM番号)を保持する。
First, when a memory failure occurs, the
その後、DIMM11の故障により継続運用不可となった場合や、その他の要因(OS Update等)で、装置再起動が行われると、メモリ特定部101は、再起動時に、保持しておいた故障したDRAM113の位置から物理アドレス「0x00000003」を特定する。
After that, when the continuous operation is not possible due to a failure of the
メモリ特定部101は、特定した物理アドレス「0x00000003」を、メモリ制御部102に通知する。そして、メモリ制御部102は、メモリ特定部101から通知された物理アドレス「0x00000003」をメモリ管理装置1から使用しないように制御する。つまり、メモリ制御部102は、物理アドレス「0x00000003」のDRAM113をメモリ管理装置1が使用するDRAMから除外する。
The
そして、メモリ制御部102は、DRAM113に対し、メモリアクセスを行うことなく、メモリ管理装置1を起動する。
Then, the
これにより、メモリ管理装置1としては、DRAM113のみが縮退された状態で起動し、運用状態となることができる。
As a result, the
この時の、各DRAMのDRAM番号と、各DRAMに割り当てられている物理アドレスと、各DRAMがOSで利用可能か否かを示す情報の一例を図5に示す。図5に示す通り、DRAM113の行における、OSが利用可能か否かを示す欄が「×」になっていることがわかる。
FIG. 5 shows an example of information indicating the DRAM number of each DRAM, the physical address assigned to each DRAM, and information indicating whether each DRAM can be used by the OS at this time. As shown in FIG. 5, it can be seen that the column indicating whether the OS is available or not in the row of the
このように、DRAM113のみ縮退しているため、OSは図5に示す通り、故障したDRAM113分の物理アドレスだけが使用できないことになる。したがって、メモリ管理装置1のメモリ容量は、上記処理後の運用ではメモリ障害発生以前より、DRAM1個分減少している状態となる。
Thus, since only the
<比較の形態>
次に、本発明の上記実施の形態と比較するための比較の形態について、説明する。比較の形態に係るメモリ管理装置2は、従来技術におけるメモリ管理装置2である。比較の形態に係るメモリ管理装置2のハードウェア構成は、図1のメモリ管理装置1と同じであるため、説明を省略する。また、障害発生前のメモリ管理装置2の各DRAMに対する物理アドレスおよびOSが使用可能か否かを示す情報は、図3と同じであるとする。
<Comparison form>
Next, a comparative form for comparison with the above embodiment of the present invention will be described. The
比較の形態に係るメモリ管理装置2において、運用中にメモリ障害が発生した場合の動作について説明する。
In the
メモリ管理装置2で、例えば、シングルビットエラーが発生した場合、典型的なハイエンドサーバの機能である、予防縮退(システムダウンを引き起こすマルチビットエラーになる前に縮退させる)機能によって、縮退運転が行われる。ここで、予防縮退機能とは、例えば、ある一定期間にシングルビットエラーが多発した場合(例えば、同じDIMMから、24時間以内に20回以上のシングルビットエラーが発生したなど)に、DIMMを縮退予約としておき、次回再起動(他要因のエラーなど)で当該DIMMを縮退させるというような機能である。
For example, when a single bit error occurs in the
また、メモリ管理装置2で、例えば、マルチビットエラーが発生した場合、継続運用不可能であるため、例えば、システムダウンから再起動するなどした後に、DIMMの縮退運転を行う。
Further, in the
比較の形態に係るメモリ管理装置2において、DIMM11のDRAM113でメモリ障害が発生した場合、ハイエンドサーバでは一般的なマネージメントファームウェア(BMCなど)の障害特定機能により、故障DIMM(DIMM11)が特定される。
In the
その後、DIMM11の故障により継続運用不可となった場合や、その他の要因(OS Update等)で、装置再起動が行われると、再起動時にマネージメントファームウェアにより自動的に故障したDIMM11が縮退される。そして故障したDIMM11が縮退した状態でメモリ管理装置2が起動し、運用状態となる。
Thereafter, when the continuous operation is disabled due to a failure of the
この時の、各DRAMに割り当てられている物理アドレスと、各DRAMがOSで利用可能か否かを示す情報の一例を図6に示す。図6に示す通り、DIMM11が縮退しているため、OSは、故障したDRAM113を含む、DRAM110、111、112、113、114および115の物理アドレスが使用できない。そのため、比較の形態に係るメモリ管理装置2において、障害発生後の運用では、メモリ障害発生以前よりメモリ容量がDIMM1枚分減少している状態となる。
FIG. 6 shows an example of information indicating the physical address assigned to each DRAM and whether or not each DRAM can be used by the OS. As shown in FIG. 6, since the
(メモリ管理装置1の効果)
以上に説明したように、本発明の実施の形態に係るメモリ管理装置1では、メモリ障害発生後の再起動後においても、物理的なメモリの使用を効率的に行うことができる。
(Effect of the memory management device 1)
As described above, the
その理由は、メモリ特定部101が故障したDRAMの位置を特定し、保持しておき、当該故障したDRAMの物理アドレスを、メモリ制御部102に通知することにより、メモリ制御部102が当該物理アドレスにアクセスせずにメモリ管理装置1を起動させるためである。
The reason is that the
したがって、メモリ障害発生後のシステム再起動後であっても、DRAM単位での縮退が可能となる。これにより、メモリ縮退容量を最小限にとどめることができ、物理的なメモリの使用を効率的に行うことができる。また、メモリ管理装置1のOSから故障したDRAMへのアクセスも行われないことから、安定してシステムを動作させることができる。
Therefore, even after the system is restarted after a memory failure occurs, it is possible to degenerate in units of DRAM. As a result, the memory degeneration capacity can be minimized, and the physical memory can be used efficiently. In addition, since the OS of the
なお、図3および5で示した、DRAMを特定するDRAM番号に、DRAMの物理アドレスと、使用可否情報とが関連付けられた情報は、図示しないメモリに記録されてもよいし、CPU10に内蔵されたメモリに記録されて管理されていてもよい。
3 and 5 may be recorded in a memory (not shown) or built in the
そして、メモリ制御部102は、複数のDIMMの少なくとも何れかに障害が発生した際、障害が発生したDIMMの使用可否情報を、使用不可に更新してもよい。また、メモリ制御部102は、使用可否情報を参照して、複数のDIMMのうち、メモリ管理装置1のOSで使用可能となっているDIMMを使用するよう制御してもよい。
Then, when a failure occurs in at least one of the plurality of DIMMs, the
このような情報を用いた場合であっても、実施の形態に係るメモリ管理装置1は、メモリ障害発生後の再起動後においても、物理的なメモリの使用を効率的に行うことができる。
Even when such information is used, the
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。 Although the present invention has been described with reference to the embodiment, the present invention is not limited to the above embodiment. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
1 メモリ管理装置
10 CPU
11〜18 DIMM
101 メモリ特定部
102 メモリ制御部
1
11-18 DIMM
101
Claims (6)
前記メモリモジュールに含まれる複数の記憶素子の夫々を特定するための特定情報から当該特定情報によって特定される記憶素子に割り当てられた物理アドレスを特定するメモリ特定手段と、
前記複数の記憶素子のうち、何れの物理アドレスの記憶素子を使用するのかを制御する制御手段と、を備え、
前記メモリ特定手段は、前記複数の記憶素子の少なくとも何れかに障害が発生した際、障害が発生した前記記憶素子の特定情報を保持し、再起動後に、保持した特定情報から障害が発生した前記記憶素子の物理アドレスを特定し、
前記制御手段は、前記複数の記憶素子のうち、前記メモリ特定手段が特定した物理アドレスの記憶素子以外の記憶素子を使用するよう制御することを特徴とするメモリ管理装置。 A memory module including a plurality of storage elements;
Memory specifying means for specifying a physical address assigned to a storage element specified by the specific information from specific information for specifying each of the plurality of storage elements included in the memory module;
Control means for controlling which of the plurality of storage elements to use the storage element of which physical address,
The memory specifying unit holds specific information of the storage element in which a failure has occurred when a failure occurs in at least one of the plurality of storage elements, and after restarting, the failure has occurred from the stored specific information. Identify the physical address of the storage element,
The memory control apparatus, wherein the control unit controls to use a storage element other than the storage element of the physical address specified by the memory specifying unit among the plurality of storage elements.
前記制御手段は、前記使用可否情報を参照して、前記複数の記憶素子のうち、何れの物理アドレスの記憶素子を使用するのかを制御する、ことを特徴とする、請求項1に記載のメモリ管理装置。 The specific information of the storage element is associated with availability information indicating whether the storage element is usable in a memory management device,
2. The memory according to claim 1, wherein the control unit controls which of the plurality of storage elements is to be used with reference to the availability information. Management device.
前記複数の記憶素子の少なくとも何れかに障害が発生した際、障害が発生した前記記憶素子を特定するための特定情報を保持し、再起動後に、保持した特定情報から当該特定情報によって特定される記憶素子に割り当てられた物理アドレスであって、障害が発生した前記記憶素子の物理アドレスを特定し、
前記複数の記憶素子のうち、前記特定した物理アドレスの記憶素子以外の記憶素子を使用するよう制御する、ことを特徴とする制御方法。 A method for controlling a memory management device including a memory module including a plurality of storage elements,
When a failure occurs in at least one of the plurality of storage elements, specific information for specifying the storage element in which the failure has occurred is retained, and after restart, specified by the specific information from the retained specific information A physical address assigned to the storage element, wherein the physical address of the storage element in which the failure has occurred is identified;
A control method comprising: controlling a storage element other than the storage element having the specified physical address among the plurality of storage elements.
前記複数の記憶素子のうち、前記特定した物理アドレスの記憶素子以外の記憶素子を使用するよう制御する処理と、をコンピュータに実行させる、ことを特徴とするプログラム。 When a failure occurs in at least one of the plurality of storage elements included in the memory module, the specific information for specifying the storage element in which the failure has occurred is retained, and the specific information is retained from the retained specific information after the restart. A process of specifying a physical address of the storage element in which a failure has occurred, which is a physical address assigned to the storage element specified by
A program for causing a computer to execute a process of controlling to use a storage element other than the storage element of the specified physical address among the plurality of storage elements.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013171050A JP6306300B2 (en) | 2013-08-21 | 2013-08-21 | MEMORY MANAGEMENT DEVICE, CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013171050A JP6306300B2 (en) | 2013-08-21 | 2013-08-21 | MEMORY MANAGEMENT DEVICE, CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015041175A true JP2015041175A (en) | 2015-03-02 |
JP6306300B2 JP6306300B2 (en) | 2018-04-04 |
Family
ID=52695319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013171050A Active JP6306300B2 (en) | 2013-08-21 | 2013-08-21 | MEMORY MANAGEMENT DEVICE, CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6306300B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024012094A1 (en) * | 2022-07-09 | 2024-01-18 | 超聚变数字技术有限公司 | Fault processing method, and computing device |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01214948A (en) * | 1988-02-24 | 1989-08-29 | Oki Electric Ind Co Ltd | Access controller for random access memory |
JP2005050348A (en) * | 2003-07-30 | 2005-02-24 | Hewlett-Packard Development Co Lp | Method for persistently tracking volatile memory fault |
JP2010238192A (en) * | 2009-03-31 | 2010-10-21 | Fujitsu Ltd | Memory controller, memory module and memory control method |
JP2012103999A (en) * | 2010-11-12 | 2012-05-31 | Hitachi Ltd | Memory control method for reducing occurrence of system stoppage due to memory error |
JP2013080288A (en) * | 2011-09-30 | 2013-05-02 | Jvc Kenwood Corp | Location management device, location management system, and location management program |
WO2013080288A1 (en) * | 2011-11-28 | 2013-06-06 | 富士通株式会社 | Memory remapping method and information processing device |
-
2013
- 2013-08-21 JP JP2013171050A patent/JP6306300B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01214948A (en) * | 1988-02-24 | 1989-08-29 | Oki Electric Ind Co Ltd | Access controller for random access memory |
JP2005050348A (en) * | 2003-07-30 | 2005-02-24 | Hewlett-Packard Development Co Lp | Method for persistently tracking volatile memory fault |
JP2010238192A (en) * | 2009-03-31 | 2010-10-21 | Fujitsu Ltd | Memory controller, memory module and memory control method |
JP2012103999A (en) * | 2010-11-12 | 2012-05-31 | Hitachi Ltd | Memory control method for reducing occurrence of system stoppage due to memory error |
JP2013080288A (en) * | 2011-09-30 | 2013-05-02 | Jvc Kenwood Corp | Location management device, location management system, and location management program |
WO2013080288A1 (en) * | 2011-11-28 | 2013-06-06 | 富士通株式会社 | Memory remapping method and information processing device |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024012094A1 (en) * | 2022-07-09 | 2024-01-18 | 超聚变数字技术有限公司 | Fault processing method, and computing device |
Also Published As
Publication number | Publication date |
---|---|
JP6306300B2 (en) | 2018-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10120769B2 (en) | Raid rebuild algorithm with low I/O impact | |
CN102081574B (en) | Method and system for accelerating wake-up time | |
US8812910B2 (en) | Pilot process method for system boot and associated apparatus | |
JP2012198878A (en) | Refresh operation start method and system for semiconductor nonvolatile memory device | |
US20130124801A1 (en) | Sas host controller cache tracking | |
JP5950286B2 (en) | Apparatus and method for writing address conversion table | |
JP2011170589A (en) | Storage control device, storage device, and storage control method | |
JP2008269142A (en) | Disk array device | |
JP5978860B2 (en) | Information processing apparatus, memory control unit, memory control method, and control program | |
US20150254019A1 (en) | Zone Group Reassignment Using Storage Device Signatures | |
US20160011937A1 (en) | Semiconductor memory device, memory controller, and control method of memory controller | |
JP4535371B2 (en) | Disk array control program, method and apparatus | |
JP6306300B2 (en) | MEMORY MANAGEMENT DEVICE, CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM | |
US11531621B2 (en) | Selective endpoint isolation for self-healing in a cache and memory coherent system | |
US20150269020A1 (en) | Cache control device, control method therefor, storage apparatus, and storage medium | |
US20100169572A1 (en) | Data storage method, apparatus and system for interrupted write recovery | |
JP5505329B2 (en) | Disk array device and control method thereof | |
JP5910356B2 (en) | Electronic device, electronic device control method, and electronic device control program | |
JP5447532B2 (en) | Information processing device | |
WO2016139774A1 (en) | Information processing device and information processing system | |
JP2012103999A (en) | Memory control method for reducing occurrence of system stoppage due to memory error | |
US8583968B2 (en) | Data storage apparatus and method for writing data | |
JP2008250671A (en) | Information processor and information processing method | |
WO2019054434A1 (en) | Failure sign detection device, failure sign detection method, and recording medium in which failure sign detection program is stored | |
TW201416852A (en) | Method and system for automatically restoring RAID card |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160715 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170822 |
|
AA91 | Notification that invitation to amend document was cancelled |
Free format text: JAPANESE INTERMEDIATE CODE: A971091 Effective date: 20170919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6306300 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |