JP2014157492A - フォールトトレラントサーバ、そのメモリコピー方法およびライトアドレスデータ格納用メモリモジュール - Google Patents

フォールトトレラントサーバ、そのメモリコピー方法およびライトアドレスデータ格納用メモリモジュール Download PDF

Info

Publication number
JP2014157492A
JP2014157492A JP2013028069A JP2013028069A JP2014157492A JP 2014157492 A JP2014157492 A JP 2014157492A JP 2013028069 A JP2013028069 A JP 2013028069A JP 2013028069 A JP2013028069 A JP 2013028069A JP 2014157492 A JP2014157492 A JP 2014157492A
Authority
JP
Japan
Prior art keywords
memory
write address
data storage
address data
storage memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013028069A
Other languages
English (en)
Other versions
JP6007822B2 (ja
Inventor
Yoji Nakano
洋二 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013028069A priority Critical patent/JP6007822B2/ja
Publication of JP2014157492A publication Critical patent/JP2014157492A/ja
Application granted granted Critical
Publication of JP6007822B2 publication Critical patent/JP6007822B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)

Abstract

【課題】メモリコピー時間の短縮機能を汎用的に利用可能とし、かつ、実装上の困難を回避する。
【解決手段】フォールトトレラントサーバ300は、ライトアドレスデータ格納用メモリモジュール400をメモリスロット305aに実装する。ライトアドレスデータ格納用メモリコントローラ411は、メインメモリ313へのライトアドレスをライトアドレスデータ格納用メモリ410に蓄積する。メモリコピーエンジン306aは、障害発生に起因して片系動作となった時点から片系動作を終了して二重化動作に復旧させる時点の間にかけて蓄積されたライトアドレスをメモリバスへ出力させ、出力されたライトアドレスに対応するメインメモリ313に格納されたデータが読み出されて、障害から復旧した他の片系のメインメモリへとコピーされる。
【選択図】図4

Description

本発明はフォールトトレラントサーバ、そのメモリコピー方法およびライトアドレスデータ格納用メモリモジュールに関する。
2つの系を二重化させて動作するフォールトトレラントサーバ(以下、FTサーバと称する。)では、システムが片系動作から二重化動作へと移行する際に、一方の系のメインメモリに格納されているデータを他系のメインメモリに速やかにコピーして、両系のメインメモリのデータを一致させる必要がある。さらに、メモリデータのコピー中は、コピー元のデータが更新されることを防ぐために、システム全体の動作を一時停止する必要がある。
近年、システムのメインメモリ容量は増加の一途を辿っており、メモリコピー時に発生するシステムの一時停止時間もますます増大している。システムの一時停止は業務に大きな支障をきたすため、一時停止時間を少しでも短くすることが求められている。
なお、特許文献1、2には、障害発生に起因して片系動作となった場合に、メインメモリへの書き込みアドレスをアドレス記憶用のメモリに記憶しておき、方系動作から二重化動作に復旧する際に、前記記憶しておいたアドレスに該当する片系のメインメモリのデータを復旧させる技術が開示されている。
特開2004−46455号公報 特開平10−177498号公報
本発明に関連する公知のFTサーバでは、メインメモリコントローラとメインメモリのアドレスを格納するTraceメモリとを専用チップセットに内蔵する構成を採用している。そして、当該FTサーバは、メモリデータをコピーする際には、片系動作中にデータが更新されたメインメモリの領域のみをコピーすることによって、メインメモリのコピー時間の短縮を図っている。しかしながら、近年のコンピュータアーキテクチャでは、メモリコントローラをCPU内部に内蔵しているため、メインメモリのアドレスを格納するTraceメモリについては、マザーボード上に実装する必要がある。
ところが、Traceメモリはメインメモリのような多ビットインターフェースを有していることから、高密設計されたマザーボード上へTraceメモリを実装することは困難である。また、マザーボード上へのTraceメモリの実装がメモリバス経路長の増大にもつながる結果、信号品質悪化の要因になるなどの実装上の問題がある。
本発明の目的は、上述した課題を解決するフォールトトレラントサーバ、そのメモリコピー方法およびライトアドレスデータ格納用メモリモジュールを提供することにある。
一実施の形態において、フォールトトレラントサーバは、メモリスロットと、前記メモリスロットに実装されるメインメモリと、前記メインメモリへの書き込みまたは読み出しをメモリバスを介して制御するメインメモリコントローラと、前記メインメモリコントローラを介して前記メモリスロットにアクセスするメモリコピーエンジンと、を備え、前記メインメモリへのライトアドレスを格納するライトアドレスデータ格納用メモリと、前記ライトアドレスデータ格納用メモリへの書き込みまたは読み出しを制御するライトアドレスデータ格納用メモリコントローラと、を有するライトアドレスデータ格納用メモリモジュールを前記メモリスロットに実装し、前記ライトアドレスデータ格納用メモリコントローラは、前記メインメモリへのライトアドレスを前記ライトアドレスデータ格納用メモリに蓄積し、前記メモリコピーエンジンは、前記ライトアドレスデータ格納用メモリコントローラに対して、障害発生に起因して片系動作となった時点から当該片系動作を終了して二重化動作に復旧させる時点の間にかけて前記ライトアドレスデータ格納用メモリに蓄積されたライトアドレスを前記メモリバスへ出力するように指示し、前記メインメモリコントローラは、前記ライトアドレスデータ格納用メモリから前記メモリバスへ出力されたライトアドレスを読み出し、当該読み出したライトアドレスに対応する前記メインメモリに格納されたデータを読み出し、当該読み出したデータを前記障害から復旧した他の片系のメインメモリへとコピーする、ものである。
他の一実施の形態において、フォールトトレラントサーバのメモリコピー方法は、メモリスロットと、前記メモリスロットに実装されるメインメモリと、前記メインメモリへの書き込みまたは読み出しをメモリバスを介して制御するメインメモリコントローラと、前記メインメモリコントローラを介して前記メモリスロットにアクセスするメモリコピーエンジンと、がフォールトトレラントサーバに備えられており、前記メインメモリへのライトアドレスを格納するライトアドレスデータ格納用メモリと、前記ライトアドレスデータ格納用メモリへの書き込みまたは読み出しを制御するライトアドレスデータ格納用メモリコントローラと、を有するライトアドレスデータ格納用メモリモジュールを前記メモリスロットに実装され、前記ライトアドレスデータ格納用メモリコントローラが、前記メインメモリへのライトアドレスを前記ライトアドレスデータ格納用メモリに蓄積し、前記メモリコピーエンジンが、前記ライトアドレスデータ格納用メモリコントローラに対して、障害発生に起因して片系動作となった時点から当該片系動作を終了して二重化動作に復旧させる時点の間にかけて前記ライトアドレスデータ格納用メモリに蓄積されたライトアドレスを前記メモリバスへ出力するように指示し、前記メインメモリコントローラが、前記ライトアドレスデータ格納用メモリから前記メモリバスへ出力されたライトアドレスを読み出し、当該読み出したライトアドレスに対応する前記メインメモリに格納されたデータを読み出し、当該読み出したデータを前記障害から復旧した他の片系のメインメモリへとコピーする、ものである。
他の一実施の形態において、ライトアドレスデータ格納用メモリモジュールは、フォールトレラントサーバのメインメモリへのライトアドレスを格納するライトアドレスデータ格納用メモリと、前記ライトアドレスデータ格納用メモリへの書き込みまたは読み出しを制御するライトアドレスデータ格納用メモリコントローラと、を有し、前記フォールトレラントサーバのメモリスロットに実装される、ものである。
本発明により、メモリコピー時間の短縮機能を汎用的に利用可能とし、かつ、実装上の困難を回避可能とするフォールトトレラントサーバ、そのメモリコピー方法およびライトアドレスデータ格納用メモリモジュールを提供することができる。
実施の形態1にかかるフォールトトレラントサーバの構成図の一例である。 実施の形態1にかかるメモリモジュールの構成図の一例である。 実施の形態1にかかるフォールトトレラントサーバによるメモリコピー方法を示すフローチャートである。 本発明の原理を説明するための図である。
まず、本発明の実施の形態の説明に先立って、本発明の原理を説明する。図4に示すように、本発明に係るフォールトトレラントサーバ300は、メモリスロット305aと、メモリスロット305aに実装されるメインメモリ313と、メインメモリ313への書き込みまたは読み出しをメモリバスを介して制御するメインメモリコントローラ303aと、メインメモリコントローラ303aを介してメモリスロット305aにアクセスするメモリコピーエンジン306aと、を少なくとも備えている。さらに、フォールトトレラントサーバ300は、ライトアドレスデータ格納用メモリモジュール400をメモリスロット305aに実装している。
ライトアドレスデータ格納用メモリモジュール400は、メインメモリ313へのライトアドレスを格納するライトアドレスデータ格納用メモリ410と、ライトアドレスデータ格納用メモリ410への書き込みまたは読み出しを制御するライトアドレスデータ格納用メモリコントローラ411と、を有する。
ライトアドレスデータ格納用メモリコントローラ411は、メインメモリ313へのライトアドレスをライトアドレスデータ格納用メモリ410に蓄積する。メモリコピーエンジン306aは、ライトアドレスデータ格納用メモリコントローラ411に対して、障害発生に起因して片系動作となった時点から当該片系動作を終了して二重化動作に復旧させる時点の間にかけてライトアドレスデータ格納用メモリ410に蓄積されたライトアドレスをメモリバスへ出力するように指示する。メインメモリコントローラ304aは、ライトアドレスデータ格納用メモリ410からメモリバスへ出力されたライトアドレスを読み出し、当該読み出したライトアドレスに対応するメインメモリ313に格納されたデータを読み出し、当該読み出したデータを障害から復旧した他の片系のメインメモリへとコピーする。
実施の形態1.
以下、図面を参照して本発明の実施の形態について説明する。
<構成>
図1を参照して、本実施の形態に係るFTサーバの構成を説明する。
FTサーバ100は、モジュール1aと、モジュール1aと同期して動作するモジュール1bと、を備えている。クロスリンクバス2は、モジュール1aとモジュール1bを接続する。モジュール1aとモジュール1bは、クロスリンクバス2を介して、互いの状態を監視する。モジュール1aは、CPU4aと、メモリスロット5aと、メモリスロット5aに実装されるメインメモリ(不図示)と、フォールトトレラント制御チップ(以下、FT制御チップと称す。)7aと、を備えている。なお、モジュール1bについても同様の構成を備えているため、ここではその詳細な説明を省略する。
CPU4aは、メモリバスを介してメインメモリ(不図示)への書き込みまたは読み出しを制御する、メインメモリコントローラの一例としてのメモリコントローラ3aを内蔵している。メモリスロット5aは、複数のメモリスロットを有しており、それぞれのメモリスロットがメモリコントローラ3aに接続する。メモリスロット5aには、メインメモリ(不図示)と、後述するTraceメモリモジュール200とが実装されている。
メモリスロット5aにおいて、メインメモリ(不図示)は、例えば、メモリコントローラ3aに最も近い位置に実装してよく、メインメモリ(不図示)が複数のメモリから構成される場合には、例えば、メモリコントローラ3aに最も近い位置から開始してそれぞれのメモリを実装してもよい。また、Traceメモリモジュール200は、例えば、メモリコントローラ3aから最も遠い位置に実装してよい。なお、メモリスロット5aにおけるメインメモリ(不図示)およびTraceメモリモジュール200の実装位置はこれに限定されず、他の位置に実装するものとしてもよい。
FT制御チップ7aは、メモリコピーエンジン6aを内蔵している。メモリコピーエンジン6aは、メモリコントローラ3aと接続し、メモリコントローラ3aを介して、メモリスロット5aにアクセス可能である。また、データリンクバス8は、CPU4aとCPU4bを接続する。CPU4aおよびCPU4bは、データリンクバス8を介して、メモリコピーを行う。
図2を参照して、本実施の形態に係るライトアドレスデータ格納用モジュールの一例としてのTraceメモリモジュール200の構成を説明する。
ライトアドレスデータ格納用メモリモジュールの一例としてのTraceメモリモジュール200は、メモリモジュールインターフェース9と、ライトアドレスデータ格納用メモリの一例としてのTraceメモリ10と、ライトアドレスデータ格納用メモリコントローラの一例としてのTraceメモリコントローラ11と、切り替えセレクタ12と、を備えている。Traceメモリモジュール200は、モジュール1a、1bのメモリスロット5a、5bに対して、着脱自在に実装可能である。
メモリモジュールインターフェース9は、メモリバス上のコマンドおよびアドレスを読み出すインタフェースである。Traceメモリ10は、メモリバス上のアドレスデータに関して、メインメモリへのライトアドレスのアドレスデータを格納する。Traceメモリコントローラ11は、メモリバス上のコマンドをデコードし、Traceメモリ10への書き込みまたは読み出しを制御する。また、Traceメモリコントローラ11は、Traceメモリ10のライトアドレスについて後述する片系動作開始時の開始アドレスおよび片系動作終了時の終了アドレスを保持する。切り替えセレクタ12は、メモリバス上のライトアドレスのアドレスデータをTraceメモリ10に入力し、また、Traceメモリ10に格納されたライトアドレスデータをメモリバス上のデータバスへ出力する。
図3は、本実施の形態に係るFTサーバ100における特定のメモリ空間にTraceメモリをマッピングする際の処理を示すフローチャートである。
まず、ユーザによって、FTサーバ100の電源がOnされる(S101)。FTサーバ100のBIOSは、POST(Power On Self Test)を実行する(S102)。
BIOSは、Traceメモリ機能を使用するか否かをBIOS設定メニューにおいて表示してユーザに問い合わせる。BIOSは、ユーザからの回答に応じて、Traceメモリ機能を使用するか否かを判断する(S103)。BIOSは、Traceメモリ機能を使用しない場合には、装置(FTサーバ100)を起動する(S104)。
BIOSは、Traceメモリ機能を使用する場合には、Traceメモリ機能をOnに設定する(S105)。そして、BIOSは、装置(FTサーバ100)を再起動する(S106)。
再起動の後、BIOSは、上述したPOSTを実行し、Traceメモリ機能を使用するために、Traceメモリ10を特定のメモリ空間へとマッピングする(S107)。この特定のメモリ空間とは、メモリコピーエンジン6のみがアクセス可能なメモリ空間であり、予め割り当てられる。最後に、BIOSは、装置(FTサーバ100)を起動する(S108)。
このように、本実施の形態に係るTraceメモリモジュールを利用するシステムでは、Traceメモリ機能の使用の要否やその設定をBIOS設定に組み込む。そして、装置(FTサーバ100)起動の際のメモリマッピングの処理時に、メモリコピーエンジン6のみがアクセス可能な特定のメモリ空間へと、Traceメモリ10をマッピングする。これにより、汎用のメモリスロット5aにTraceメモリモジュール200を実装した場合においても、通常のアプリケーションがTraceメモリにアクセスしてしまうことを防止することができる。
<動作>
以下、FTサーバ100による動作を説明する。なお、以下の動作例では、メモリスロット5aにTraceメモリモジュールが実装されている場合を例に説明する。
まず、Traceメモリモジュール200を実装したFTサーバ100は、二重化動作中、モジュール1aのメモリコントローラ3aとメモリスロット5a間のメモリバス上のコマンドおよびアドレスを、メモリモジュールインターフェース9を介して常に監視している。
Traceメモリコントローラ11は、メモリバス上のコマンドをデコードし、当該デコードしたコマンドがメインメモリへのライトコマンドであった場合、Traceメモリ10の入力方向に切り替えセレクタ12を切り替え、メモリバス上の当該ライトコマンドのライトアドレスのアドレスデータをTraceメモリ10に格納する。Traceメモリコントローラ11は、Traceメモリ10への格納を継続することによって、メインメモリへのライトアドレスをTraceメモリ10に蓄積する。Traceメモリコントローラ11は、Traceメモリ10への書き込みを制御し、Traceメモリ10へのライトアドレスのアドレスポインタをインクリメント(例えば、1増加)する。
二重化動作中に障害が発生し、その障害発生に起因してモジュール1bにおいて何らかの異常が検出された場合、モジュール1aのFT制御チップ7aは、クロスリンクバス2を介してモジュール1bの異常を検知する。そして、FT制御チップ7aは、モジュール1bをシステムから切り離して、モジュール1aのみの片系動作へと移行する。FT制御チップ7aのメモリコピーエンジン6aは、片系動作が開始したことを、メモリコントローラ3aおよびTraceメモリコントローラ11に通知する。メモリコピーエンジン6aは、片系動作が開始したことを示すコマンドを用いて、メモリコントローラ3aを介してTraceメモリコントローラ11に通知する。
Traceメモリコントローラ11は、片系動作の開始の通知を受けた場合、当該通知を受けた時点におけるTraceメモリ10へのライトアドレスを、片系動作開始時の開始アドレスとして、Traceメモリコントローラ11の内部に保持する。システムは、モジュール1bが復旧されるまでの間、片系動作を継続するが、この間もTraceメモリコントローラ11は、モジュール1aのメインメモリへのライトアドレスを、Traceメモリ10に格納し続ける。
システムは、モジュール1bの復旧が開始すると片系動作から二重化動作へと移行する。この際に、FT制御チップ7aのメモリコピーエンジン6aは、モジュール1aとモジュール1bのメインメモリの中身を一致させるために、Traceメモリ10に格納されたライトアドレスデータを使用して、片系動作中に更新されたモジュール1aのメインメモリのデータのみをモジュール1bへとコピーする動作を開始する。以下、具体的に説明する。
(i)まず、FT制御チップ7aのメモリコピーエンジン6aは、片系動作が終了したことを、メモリコントローラ3aおよびTraceメモリコントローラ11に通知する。メモリコピーエンジン6aは、Traceメモリ10に対してリードコマンドを発行して、メモリコントローラ3aを介してTraceメモリコントローラ11に通知する。Traceメモリコントローラ11は、Traceメモリ10に対するリードコマンドを受けた場合、当該通知を受けた時点におけるTraceメモリ10へのライトアドレスを、片系動作終了時の終了アドレスとして、Traceメモリコントローラ11の内部に保持する。
(ii)そして、Traceメモリコントローラ11は、Traceメモリ10のアドレスポインタを、保持していた片系動作時の開始アドレスへと移動させ、Traceメモリ10の出力方向に切り替えセレクタ12を切り替える。Traceメモリコントローラ11は、開始アドレスから終了アドレスとなるまでの間、Traceメモリ10のアドレスポインタをインクリメントし、Traceメモリ10に格納していたメインメモリのライトアドレスを、メモリバスのデータバスへと出力させる。これによって、メモリコピーエンジン6aは、Traceメモリコントローラ11に対して、障害発生に起因して片系動作となった時点からその片系動作を終了して二重化動作に復旧させる時点の間にかけてTraceメモリ10に蓄積されたライトアドレスを、メモリバスへ出力させるよう指示する。
(iii)モジュール1aのメモリコントローラ3aは、片系動作の終了通知を受けると、Traceメモリ10のライトアドレスについて片系動作開始時の開始アドレスから片系動作終了時の終了アドレスに関して、Traceメモリ10から出力されるライトアドレスをメモリバスのデータバスから読み出す。メモリコントローラ3aは、読み出したライトアドレスをメモリコピーエンジン6aに保持する。メモリコントローラ3aは、全てのライトアドレスの読み出しを完了すると、当該ライトアドレスのメインメモリのデータを読み出し、モジュール1aからモジュール1bへのメモリコピーを開始する。モジュール1aのメモリコントローラ3aは、モジュール1aとモジュール1bのメインメモリデータが一致するまで、データリンクバス8を介してデータコピーを行う。
以上に説明したように、本実施の形態に係るFTサーバ100は、Traceメモリモジュール200をマザーボード上のメモリスロットに搭載する。ここで、Traceメモリモジュール200はTraceメモリを備えており、当該Traceメモリは、FT制御チップに内蔵されたメモリコピーエンジンがアクセス可能である。そして、Traceメモリモジュール200は、FTサーバ100におけるメインメモリアクセス時のアドレスデータを、Traceメモリへ格納する。メモリコピーエンジン6aは、メインメモリのコピーが発生すると、Traceメモリ10のライトアドレスを取り出し、片系動作中に更新された領域のデータのみをコピーする。
これまでは装置に専用チップセットを採用することによってのみメモリコピー時間の短縮機能を実現してきたが、本実施の形態によれば、専用チップセットを採用する必要がないため、メモリコピー時間の短縮機能を汎用的に利用可能とすることができる。よって、本実施の形態によれば、メモリコピー時に必要なシステムの一時停止時間を短縮することができる。
また、本実施の形態によれば、Traceメモリモジュール200をマザーボード上の空きメモリスロット5aに対して実装することから、マザーボードの実装エリアを損なうことがないという利点を有する。さらに、メモリスロット5aを利用してTraceメモリモジュール200を実装することで、メモリバス経路長への影響を最小限に抑えることが可能である。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
1a、1b モジュール、
2 クロスリンクバス、
3a、3b メモリコントローラ、
4a、4b CPU、
5a、5b メモリスロット、
6a、6b メモリコピーエンジン、
7a、7b FT制御チップ、
8 データリンクバス、
9 メモリモジュールインターフェース、
10 Traceメモリ、
11 Traceメモリコントローラ、
12 切り替えセレクタ、
100 フォールトトレラントサーバ、
200 Traceメモリモジュール、
300 フォールトトレラントサーバ、
303a メインメモリコントローラ、
305a メモリスロット、
306a メモリコピーエンジン、
313 メインメモリ、
400 ライトアドレスデータ格納用メモリモジュール、
410 ライトアドレスデータ格納用メモリ、
411 ライトアドレスデータ格納用メモリコントローラ、

Claims (8)

  1. メモリスロットと、前記メモリスロットに実装されるメインメモリと、前記メインメモリへの書き込みまたは読み出しをメモリバスを介して制御するメインメモリコントローラと、前記メインメモリコントローラを介して前記メモリスロットにアクセスするメモリコピーエンジンと、を備え、
    前記メインメモリへのライトアドレスを格納するライトアドレスデータ格納用メモリと、前記ライトアドレスデータ格納用メモリへの書き込みまたは読み出しを制御するライトアドレスデータ格納用メモリコントローラと、を有するライトアドレスデータ格納用メモリモジュールを前記メモリスロットに実装し、
    前記ライトアドレスデータ格納用メモリコントローラは、前記メインメモリへのライトアドレスを前記ライトアドレスデータ格納用メモリに蓄積し、
    前記メモリコピーエンジンは、前記ライトアドレスデータ格納用メモリコントローラに対して、障害発生に起因して片系動作となった時点から当該片系動作を終了して二重化動作に復旧させる時点の間にかけて前記ライトアドレスデータ格納用メモリに蓄積されたライトアドレスを前記メモリバスへ出力するように指示し、
    前記メインメモリコントローラは、前記ライトアドレスデータ格納用メモリから前記メモリバスへ出力されたライトアドレスを読み出し、当該読み出したライトアドレスに対応する前記メインメモリに格納されたデータを読み出し、当該読み出したデータを前記障害から復旧した他の片系のメインメモリへとコピーする、
    フォールトトレラントサーバ。
  2. 前記ライトアドレスデータ格納用メモリを、前記メモリコピーエンジンのみがアクセス可能なメモリ空間であって、予め割り当てられた特定のメモリ空間にマッピングする、
    ことを特徴とする請求項1に記載のフォールトトレラントサーバ。
  3. 前記メモリコピーエンジンは、障害発生に起因して片系動作となった場合に、前記ライトアドレスデータ格納用メモリコントローラに対して、前記片系動作開始時における前記ライトアドレスデータ格納用メモリへのライトアドレスを開始アドレスとして保持するように指示し、前記片系動作を終了して二重化動作に復旧させる場合に、前記ライトアドレスデータ格納用メモリコントローラに対して、前記片系動作終了時における前記ライトアドレスデータ格納用メモリへのライトアドレスを終了アドレスとして保持するように指示し、前記ライトアドレスデータ格納用メモリコントローラに対して、前記ライトアドレスデータ格納用メモリへのアドレスポインタを前記開始アドレスから開始して前記終了アドレスとなるまでの間増加させて前記ライトアドレスデータ格納用メモリに蓄積したライトアドレスを前記メモリバスへ出力するように指示する、
    ことを特徴とする請求項1または2に記載のフォールトトレラントサーバ。
  4. メモリスロットと、前記メモリスロットに実装されるメインメモリと、前記メインメモリへの書き込みまたは読み出しをメモリバスを介して制御するメインメモリコントローラと、前記メインメモリコントローラを介して前記メモリスロットにアクセスするメモリコピーエンジンと、がフォールトトレラントサーバに備えられており、
    前記メインメモリへのライトアドレスを格納するライトアドレスデータ格納用メモリと、前記ライトアドレスデータ格納用メモリへの書き込みまたは読み出しを制御するライトアドレスデータ格納用メモリコントローラと、を有するライトアドレスデータ格納用メモリモジュールを前記メモリスロットに実装され、
    前記ライトアドレスデータ格納用メモリコントローラが、前記メインメモリへのライトアドレスを前記ライトアドレスデータ格納用メモリに蓄積し、
    前記メモリコピーエンジンが、前記ライトアドレスデータ格納用メモリコントローラに対して、障害発生に起因して片系動作となった時点から当該片系動作を終了して二重化動作に復旧させる時点の間にかけて前記ライトアドレスデータ格納用メモリに蓄積されたライトアドレスを前記メモリバスへ出力するように指示し、
    前記メインメモリコントローラが、前記ライトアドレスデータ格納用メモリから前記メモリバスへ出力されたライトアドレスを読み出し、当該読み出したライトアドレスに対応する前記メインメモリに格納されたデータを読み出し、当該読み出したデータを前記障害から復旧した他の片系のメインメモリへとコピーする、
    フォールトトレラントサーバのメモリコピー方法。
  5. 前記ライトアドレスデータ格納用メモリが、前記メモリコピーエンジンのみがアクセス可能なメモリ空間であって、予め割り当てられた特定のメモリ空間にマッピングされる、
    ことを特徴とする請求項4に記載のフォールトトレラントサーバのメモリコピー方法。
  6. 前記メモリコピーエンジンが、障害発生に起因して片系動作となった場合に、前記ライトアドレスデータ格納用メモリコントローラに対して、前記片系動作開始時における前記ライトアドレスデータ格納用メモリへのライトアドレスを開始アドレスとして保持するように指示し、前記片系動作を終了して二重化動作に復旧させる場合に、前記ライトアドレスデータ格納用メモリコントローラに対して、前記片系動作終了時における前記ライトアドレスデータ格納用メモリへのライトアドレスを終了アドレスとして保持するように指示し、前記ライトアドレスデータ格納用メモリコントローラに対して、前記ライトアドレスデータ格納用メモリへのアドレスポインタを前記開始アドレスから開始して前記終了アドレスとなるまでの間増加させて前記ライトアドレスデータ格納用メモリに蓄積したライトアドレスを前記メモリバスへ出力するように指示する、
    ことを特徴とする請求項4または5に記載のフォールトトレラントサーバのメモリコピー方法。
  7. フォールトレラントサーバのメインメモリへのライトアドレスを格納するライトアドレスデータ格納用メモリと、前記ライトアドレスデータ格納用メモリへの書き込みまたは読み出しを制御するライトアドレスデータ格納用メモリコントローラと、を有し、前記フォールトレラントサーバのメモリスロットに実装される、
    ライトアドレスデータ格納用メモリモジュール。
  8. 前記ライトアドレスデータ格納用メモリは、前記フォールトトレラントサーバのメモリコピーエンジンのみがアクセス可能なメモリ空間であって、予め割り当てられた特定のメモリ空間にマッピングされる、
    ことを特徴とする請求項7に記載のライトアドレスデータ格納用メモリモジュール。
JP2013028069A 2013-02-15 2013-02-15 フォールトトレラントサーバ、およびそのメモリコピー方法 Expired - Fee Related JP6007822B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013028069A JP6007822B2 (ja) 2013-02-15 2013-02-15 フォールトトレラントサーバ、およびそのメモリコピー方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013028069A JP6007822B2 (ja) 2013-02-15 2013-02-15 フォールトトレラントサーバ、およびそのメモリコピー方法

Publications (2)

Publication Number Publication Date
JP2014157492A true JP2014157492A (ja) 2014-08-28
JP6007822B2 JP6007822B2 (ja) 2016-10-12

Family

ID=51578331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013028069A Expired - Fee Related JP6007822B2 (ja) 2013-02-15 2013-02-15 フォールトトレラントサーバ、およびそのメモリコピー方法

Country Status (1)

Country Link
JP (1) JP6007822B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177498A (ja) * 1996-07-01 1998-06-30 Sun Microsyst Inc フォルトトレラント・コンピュータ・システムのメモリ・マネージメント
JP2004046455A (ja) * 2002-07-10 2004-02-12 Nec Corp 情報処理装置
JP2009199197A (ja) * 2008-02-20 2009-09-03 Hitachi Ltd 計算機システム、データ一致化方法およびデータ一致化処理プログラム
US20100318746A1 (en) * 2009-06-12 2010-12-16 Seakr Engineering, Incorporated Memory change track logging

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177498A (ja) * 1996-07-01 1998-06-30 Sun Microsyst Inc フォルトトレラント・コンピュータ・システムのメモリ・マネージメント
JP2004046455A (ja) * 2002-07-10 2004-02-12 Nec Corp 情報処理装置
JP2009199197A (ja) * 2008-02-20 2009-09-03 Hitachi Ltd 計算機システム、データ一致化方法およびデータ一致化処理プログラム
US20100318746A1 (en) * 2009-06-12 2010-12-16 Seakr Engineering, Incorporated Memory change track logging

Also Published As

Publication number Publication date
JP6007822B2 (ja) 2016-10-12

Similar Documents

Publication Publication Date Title
US9507671B2 (en) Write cache protection in a purpose built backup appliance
US20160378344A1 (en) Processor and platform assisted nvdimm solution using standard dram and consolidated storage
KR101410596B1 (ko) 정보 처리 장치, 카피 제어 프로그램 및 카피 제어 방법
US20060056321A1 (en) Recovery of duplex data system after power failure
US11474805B2 (en) System capable of upgrading firmware in background and method for upgrading firmware in background
JP2009157756A (ja) 情報処理装置およびデータ復旧方法
US20190087331A1 (en) Debug data recovery after pli event
KR100827287B1 (ko) 반도체 보조 기억 장치 및 이를 이용한 데이터 저장 방법
US9740423B2 (en) Computer system
US10642674B2 (en) Storage control device with power failure processing and abnormality processing
JP5773446B2 (ja) 記憶装置、冗長性回復方法、およびプログラム
JP6007822B2 (ja) フォールトトレラントサーバ、およびそのメモリコピー方法
JP2008046981A (ja) システム制御装置、情報処理装置および入出力要求制御方法
US9836359B2 (en) Storage and control method of the same
WO2016139774A1 (ja) 情報処理装置、情報処理システム
JP5556086B2 (ja) 二重化システム、及び、二重化方法
JP2010049303A (ja) メモリコントローラ、不揮発性記憶装置、アクセス装置、及び不揮発性記憶システム
JP3793544B2 (ja) ディスクアレイ装置及びその制御方法
JP2008134809A (ja) メモリ制御システム、メモリ制御装置、メモリ制御方法
JP7028503B2 (ja) コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム
US11544012B2 (en) Distributed storage system and data synchronization method applied thereto
JP2011018187A (ja) 試験方法、試験プログラム、試験装置、及び試験システム
JP2011076528A (ja) Raidカードの冗長化方法及びraidカードの冗長化装置
JP6981098B2 (ja) 復旧制御装置、復旧制御システム、復旧制御方法、及び、復旧制御プログラム
WO2014147773A1 (ja) ハードウェア装置およびハードウェア装置の制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140611

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160816

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160829

R150 Certificate of patent or registration of utility model

Ref document number: 6007822

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees