JP5534101B2 - 情報処理システム、共有メモリ装置及びメモリデータ保存方法 - Google Patents
情報処理システム、共有メモリ装置及びメモリデータ保存方法 Download PDFInfo
- Publication number
- JP5534101B2 JP5534101B2 JP2013505706A JP2013505706A JP5534101B2 JP 5534101 B2 JP5534101 B2 JP 5534101B2 JP 2013505706 A JP2013505706 A JP 2013505706A JP 2013505706 A JP2013505706 A JP 2013505706A JP 5534101 B2 JP5534101 B2 JP 5534101B2
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- backup
- section
- shared memory
- storage area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1068—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices in sector programmable memories, e.g. flash disk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1441—Resetting or repowering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2015—Redundant power supplies
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Description
本発明は、情報処理システム、共有メモリ装置及びメモリデータ保存方法に関する。
複数のサーバ装置と共有メモリ装置とを備える情報処理システムがある。情報処理システムの共有メモリ装置は、複数の論理的な区画(以降、セクションという。)に分けられた揮発性のメモリ領域を備える。そして、各セクションのメモリ領域は、各セクションに割り当てられたサーバ装置によって使用される。
ここで、停電が発生し電力供給が絶たれたとき、共有メモリ装置は、メモリ領域上のデータを保持できない。このため、共有メモリ装置は、停電発生時に補助電源(UPS:Uninterruptible Power Supply)からの電源供給を受けてメモリ領域上のデータを保持し、全セクションのデータを不揮発性の記憶装置にバックアップする。
しかしながら、共有メモリ装置は、停電発生時に、メモリ領域上の全セクションのデータを不揮発性の記憶装置にバックアップするのに時間がかかるという問題があった。
開示の技術は、上記に鑑みてなされたものであって、停電発生時に、共有メモリ装置のメモリ領域上のデータをバックアップするのにかかる時間を短縮する情報処理システムなどを提供することを目的とする。
本願の開示する情報処理システムは、一つの態様において、複数の情報処理装置及び前記複数の情報処理装置上で動作するプログラムが共有する共有メモリを有する共有メモリ装置を有する情報処理システムにおいて、前記共有メモリ装置は、システム運用中に、前記複数の情報処理装置が共有する共有メモリの記憶領域のうち所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムが停止したことを検知する検知部と、所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムの停止が前記検知部によって検知されたとき、前記所定の記憶領域に記憶されたデータを不揮発性の記憶領域に保存する保存部とを有する。
本願の開示する情報処理システムの一つの態様によれば、停電発生時に、共有メモリ装置のメモリ領域上のデータをバックアップするのにかかる時間を短縮することができるという効果を奏する。
以下に、本願の開示する情報処理システム、共有メモリ装置及びメモリデータ保存方法の実施例を図面に基づいて詳細に説明する。なお、以下の実施例では、複数の大型サーバ装置(以下、クラスタという。)及び共有メモリ装置を搭載した情報処理システムに適用した場合を示す。しかし、本実施例によりこの発明が限定されるものではなく、本発明は、大規模並列コンピュータシステムやスーパーコンピュータシステムにも適用可能である。
[実施例1に係る情報処理システムの構成]
図1は、本実施例1に係る情報処理システム1の構成を示す機能ブロック図である。図1に示すように、情報処理システム1は、複数のクラスタ10−1〜10−n(nは1より大きい整数、以下同じ)と、監視装置20と、共有メモリ装置30とを有する。複数のクラスタ10−1〜10−nと共有メモリ装置30とは、データ通信用回線(XAUI:10 Gigabit Ethernet(登録商標) Attachment Unit Interface)40で接続される。
図1は、本実施例1に係る情報処理システム1の構成を示す機能ブロック図である。図1に示すように、情報処理システム1は、複数のクラスタ10−1〜10−n(nは1より大きい整数、以下同じ)と、監視装置20と、共有メモリ装置30とを有する。複数のクラスタ10−1〜10−nと共有メモリ装置30とは、データ通信用回線(XAUI:10 Gigabit Ethernet(登録商標) Attachment Unit Interface)40で接続される。
クラスタ10−1〜10−nは、大型サーバ装置である。各クラスタ10−1〜10−nは、共有メモリ装置30の共有メモリ(DIMM:Dual Inline Memory Module)31に割り当てられた記憶領域を使用する。共有メモリ31は、セクションと呼ばれる複数の記憶領域に区切られている。すなわち、各クラスタ10−1〜10−nは、共有メモリ31について、それぞれ割り当てられたセクションを使用する。
さらに、クラスタ10−1〜10−nは、記憶部11とCL制御部(CL−SVP:Cluster−Service Processor)12とを有する。記憶部11は、セクション−CL情報11aを有する。セクション−CL情報11aとは、クラスタ10−1〜10−n毎に使用が割り当てられているセクションを対応付けた情報である。一例として、セクション−CL情報11aは、クラスタ10−1〜10−nの識別番号毎に使用が割り当てられているセクションの識別番号を対応付けて記憶する。そして、クラスタに使用が割り当てられるセクションは、クラスタ毎に全く異なるものであっても良いし、異なるクラスタであっても同じものとなっても良い。以降では、クラスタに使用が割り当てられるセクションは、異なるクラスタであっても同じものとなっても良い場合について説明する。なお、記憶部11は、例えば、RAM(Random Access Memory)、フラッシュメモリ(flash memory)などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置である。
また、CL制御部12は、クラスタ本体を制御する。例えば、CL制御部12は、OS(Operating System)の停止命令を受けると、セクション−CL情報11aに基づいて、自クラスタと同じセクションを割り当てられた全てのクラスタ10に対し、OSが動作中であるか否かを問い合わせる。さらに、CL制御部12は、自クラスタと同じセクションを割り当てられた全てのクラスタ10のOSが全て停止している場合には、このセクションのバックアップ指示を共有メモリ装置30に送信する。一方、CL制御部12は、自クラスタと同じセクションを割り当てられたクラスタ10のうち1台でもOSが動作中である場合には、このセクションのバックアップ指示を送信しない。そして、CL制御部12は、自クラスタ上で動作するOSを停止する。
なお、CL制御部12の機能は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現することができ、所定のプログラムがCPU(Central Processing Unit)を機能させることで実現することができる。
監視装置(SVPM:Service Processor Manager)20は、複数のクラスタ10−1〜10−n及び共有メモリ装置30とそれぞれ保守用回線(LAN:Local Area Network)50で接続される。監視装置20は、情報処理システム1全体を制御するとともに、複数のクラスタ10−1〜10−n及び共有メモリ装置30の動作状態を監視する。例えば、監視装置20は、特定のクラスタ10に対してOSの停止命令を送信する。
共有メモリ装置(SSU:System Storage Unit)30は、複数のクラスタ10−1〜10−n上で動作するOSが共有する共有メモリを備える装置である。さらに、共有メモリ装置30は、共有メモリ(DIMM)31と、不揮発性記憶部32と、補助電源33と、SSU制御部34と、SSD制御部35を有する。共有メモリ31は、停電が発生して電源から給電されなくなると記憶されたデータを失う揮発性メモリである。共有メモリ31は、複数の論理的なメモリ領域(セクション)に区切られている。各セクションのメモリ領域は、セクションに割り当てられたクラスタ10のみが使用できる。ここで、所定のセクションに割り当てられた全てのクラスタ10のOSが動作を停止した場合、このセクションのメモリ領域はアクセスされないので、データは書き変わらない。そこで、共有メモリ装置30は、所定のセクションに割り当てられた全てのクラスタ10のOSが動作を停止したタイミングで、このセクションのメモリ領域のデータを、不揮発性の記憶領域にバックアップする。これにより、共有メモリ装置30は、停電が発生したときに共有メモリ31に記憶されたデータについて、バックアップするデータ量を削減できる。
不揮発性記憶部(SSD:Solid State Drive)32は、電源から給電されなくても記憶されたデータを失わない記憶領域である。例えば、不揮発性記憶部32は、フラッシュメモリ(flash memory)などの半導体メモリ素子、またはハードディスク、光ディスクなどの記憶媒体を含む。補助電源33は、停電が発生したときに主電源の代わりに補助的に給電する。例えば、補助電源33は、無停電電源装置(UPS:Uninterruptible Power Supply)を含む。
SSU制御部(SSU−SVP)34は、SSU30本体を制御する。さらに、SSU制御部34は、OS停止検知部341と、バックアップ依頼部342と、バックアップ実行中フラグ34aと、バックアップ完了フラグ34bと、セクション−CL情報34cとを有する。なお、SSU制御部34の機能は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現することができ、所定のプログラムがCPU(Central Processing Unit)を機能させることで実現することができる。
OS停止検知部341は、システムの運用中に、複数のクラスタ10−1〜10−nが共有する共有メモリ31のセクションのうち所定のセクションを割り当てられた全てのクラスタ10上で動作するOSが停止したことを検知する。例えば、OS停止検知部341は、いずれかのクラスタ10からセクションのバックアップ指示を受信する。この結果、OS停止検知部341は、バックアップを指示したクラスタ10に割り当てられたセクションと同じセクションを割り当てられた全てのクラスタ10のOSが停止したことを検知する。
バックアップ依頼部342は、検知に関わるセクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bに基づいて、当該セクションのバックアップをSSD制御部35に依頼する。ここで、バックアップ実行中フラグ34aとは、セクション毎にバックアップが実行中であるか否かを判定する際に用いられる情報である。一例として、バックアップ実行中フラグ34aは、セクションの識別番号毎にバックアップが実行中であるか否かを示すフラグを対応付けて記憶する。バックアップが実行中(保存中)であればフラグに「ON」が記憶される。バックアップが実行中でなければフラグに「OFF」が記憶される。また、バックアップ完了フラグ34bとは、セクション毎にバックアップが完了しているか否かを判定する際に用いられる情報である。一例として、バックアップ完了フラグ34bは、セクションの識別番号毎にバックアップが完了しているか否かを示すフラグを対応付けて記憶する。バックアップが完了していればフラグに完了済み(保存済み)である「ON」が記憶される。バックアップが完了していなければフラグに「OFF」が記憶される。
例えば、バックアップ依頼部342は、バックアップ指示があったセクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが両方共OFFの場合に、バックアップ実行中フラグ34aを「ON」に設定する。そして、バックアップ依頼部342は、バックアップ指示があったセクションのバックアップをSSD制御部35に指示する。そして、バックアップ依頼部342は、SSD制御部35からバックアップの完了通知を受信すると、バックアップが完了したセクションのバックアップ実行フラグ34aを「OFF」に設定する。また、バックアップ依頼部342は、バックアップが完了したセクションのバックアップ完了フラグ34bを「ON」に設定する。
また、バックアップ依頼部342は、停電を感知した旨の通知を受信した場合、補助電源33を起動する。この結果、共有メモリ装置30は、停電中であっても補助電源33によって給電される。また、バックアップ依頼部342は、全てのセクションのバックアップ実行フラグ34a及びバックアップ完了フラグ34bに基づいて、該当するセクションのバックアップをSSD制御部35に依頼する。例えば、バックアップ依頼部342は、バックアップ実行中フラグ34a及びバックアップ完了フラグ34bが両方共OFFのセクションについて、バックアップ実行中フラグ34aを「ON」に設定する。そして、バックアップ依頼部342は、「ON」に設定したセクションのバックアップをSSD制御部35に指示する。そして、バックアップ依頼部342は、SSD制御部35からバックアップの完了通知を受信すると、バックアップが完了したセクションのバックアップ実行フラグ34aを「OFF」に設定する。また、バックアップ依頼部342は、バックアップが完了したセクションのバックアップ完了フラグ34bを「ON」に設定する。
セクション−CL情報34cは、クラスタ毎に使用が割り当てられているセクションを対応付けた情報である。このセクション−CL情報34cは、クラスタ10−1〜10−nのそれぞれの記憶部11に記憶されたセクション−CL情報11aと同一の情報であり、例えばシステムの運用開始時に設定される。
SSD制御部(MAC)35は、バックアップ依頼部342から依頼された、セクションのバックアップを実行する。具体的には、SSD制御部35は、バックアップ依頼部342からバックアップの依頼を受けると、依頼されたバックアップ対象のセクションについて、共有メモリ31からデータを読み出し、読み出したデータを不揮発性記憶部32に格納する。そして、SSD制御部35は、バックアップが完了したセクションについて、バックアップの完了をバックアップ依頼部342に通知する。
[実施例1に係るOS停止時のCL制御部(CL−SVP)の処理手順]
次に、実施例1に係るOS停止時のCL制御部(CL−SVP)12の処理手順を、図2を参照して説明する。図2は、実施例1に係るOS停止時のCL制御部(CL−SVP)の処理手順を示すフローチャートである。
次に、実施例1に係るOS停止時のCL制御部(CL−SVP)12の処理手順を、図2を参照して説明する。図2は、実施例1に係るOS停止時のCL制御部(CL−SVP)の処理手順を示すフローチャートである。
まず、CL−SVP12は、監視装置(SVPM)20からOSの停止命令を受信したか否かを判定する(ステップS11)。OSの停止命令を受信しなかったと判定した場合(ステップS11;No)、CL−SVP12は、OSの停止命令を受信するまで判定処理を繰り返す。一方、OSの停止命令を受信したと判定した場合(ステップS11;Yes)、CL−SVP12は、自クラスタ(以降、「CL」と略記する。)と同じセクションを使用する全てのCLのCL−SVP12に対し、OSの動作状態を問い合わせる(ステップS12)。
そして、CL−SVP12は、問い合わせをした全てのCLのCL−SVP12からOSの動作状態が返信されたか否かを判定する(ステップS13)。全てのCLのCL−SVP12からOSの動作状態が返信されていないと判定した場合(ステップS13;No)、CL−SVP12は、全てのCLのCL−SVP12から返信されるまで判定処理を繰り返す。
一方、全てのCLのCL−SVP12からOSの動作状態が返信されたと判定した場合(ステップS13;Yes)、CL−SVP12は、問い合わせをしたCLのうちOSが動作中のCLが無かったか否かを判定する(ステップS14)。OSが動作中のCLが有ったと判定した場合(ステップS14;No)、CL−SVP12は、セクションのバックアップ指示を送信しない。
一方、OSが動作中のCLが無かったと判定した場合(ステップS14;Yes)、CL−SVP12は、共有メモリ装置(SSU)30に対し、対象となるセクションのバックアップ指示を送信する(ステップS15)。そして、CL−SVP12は、OSの停止を完了する(ステップS16)。
[実施例1に係るOS停止時のSSU制御部(SSU−SVP)の処理手順]
次に、実施例1に係るOS停止時のSSU制御部(SSU−SVP)34の処理手順を、図3を参照して説明する。図3は、実施例1に係るOS停止時のSSU制御部(SSU−SVP)の処理手順を示すフローチャートである。
次に、実施例1に係るOS停止時のSSU制御部(SSU−SVP)34の処理手順を、図3を参照して説明する。図3は、実施例1に係るOS停止時のSSU制御部(SSU−SVP)の処理手順を示すフローチャートである。
まず、SSU−SVP34のOS停止検知部341は、CL−SVP12からセクションのバックアップ指示を受信したか否かを判定する(ステップS21)。セクションのバックアップ指示を受信しなかったと判定した場合(ステップS21;No)、OS停止検知部341は、セクションのバックアップ指示を受信するまで判定処理を繰り返す。一方、セクションのバックアップ指示を受信したと判定した場合(ステップS21;Yes)、OS停止検知部341は、当該セクションを割り当てられた全てのクラスタ10のOSが停止したことを検知する。
続いて、バックアップ依頼部342は、バックアップ指示があったセクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが両方共OFFであるか否かを判定する(ステップS22)。両方共OFFでない場合(ステップS22;No)、バックアップ依頼部342は、バックアップが実行中であるか、またはバックアップが完了したので、処理を終了する。
一方、両方共OFFである場合(ステップS22;Yes)、バックアップ依頼部342は、バックアップ指示があったセクションのバックアップ実行中フラグ34aを「ON」に設定する(ステップS23)。そして、バックアップ依頼部342は、バックアップ指示があったセクションのバックアップをSSD制御部35に依頼する(ステップS24)。
その後、バックアップ依頼部342は、バックアップ対象であったセクションのバックアップの完了通知を受信したか否かを判定する(ステップS25)。バックアップの完了通知を受信しなかったと判定した場合(ステップS25;No)、バックアップ依頼部342は、バックアップの完了通知を受信するまで判定処理を繰り返す。一方、バックアップの完了通知を受信したと判定した場合(ステップS25;Yes)、バックアップ依頼部342は、バックアップ対象であったセクションのバックアップ完了フラグを「ON」に設定する(ステップS26)。そして、バックアップ依頼部342は、バックアップ対象であったセクションのバックアップ実行中フラグを「OFF」に設定する(ステップS27)。
[実施例1に係る停電発生時のSSU制御部(SSU−SVP)の処理手順]
次に、実施例1に係る停電発生時のSSU制御部(SSU−SVP)34の処理手順を、図4を参照して説明する。図4は、実施例1に係る停電発生時のSSU制御部(SSU−SVP)の処理手順を示すフローチャートである。
次に、実施例1に係る停電発生時のSSU制御部(SSU−SVP)34の処理手順を、図4を参照して説明する。図4は、実施例1に係る停電発生時のSSU制御部(SSU−SVP)の処理手順を示すフローチャートである。
まず、SSU−SVP34のバックアップ依頼部342は、停電を感知した旨の通知を受信したか否かを判定する(ステップS31)。停電を感知した旨の通知を受信しなかったと判定した場合(ステップS31;No)、バックアップ依頼部342は、停電を感知した旨の通知を受信するまで判定処理を繰り返す。
一方、停電を感知した旨の通知を受信したと判定した場合(ステップS31;Yes)、バックアップ依頼部342は、補助電源33を起動し、起動後、バックアップ対象のセクションの識別番号を取得する(ステップS32)。例えば、バックアップ依頼部342は、バックアップ実行中フラグ34a及びバックアップ完了フラグ34bが両方共「OFF」であるセクションの識別番号を取得する。
そして、バックアップ依頼部342は、取得した識別番号に対応するセクション(バックアップ対象セクション)のバックアップ実行中フラグを「ON」に設定する(ステップS33)。そして、バックアップ依頼部342は、バックアップ対象セクションのバックアップをSSD制御部(MAC)35に依頼する(ステップS34)。
その後、バックアップ依頼部342は、バックアップ対象セクションのバックアップの完了通知を受信したか否かを判定する(ステップS35)。バックアップの完了通知を受信しなかったと判定した場合(ステップS35;No)、バックアップ依頼部342は、バックアップの完了通知を受信するまで判定処理を繰り返す。一方、バックアップの完了通知を受信したと判定した場合(ステップS35;Yes)、バックアップ依頼部342は、バックアップ対象セクションのバックアップ完了フラグを「ON」に設定する(ステップS36)。
そして、バックアップ依頼部342は、バックアップ対象セクションのバックアップ実行中フラグを「OFF」に設定する(ステップS37)。その後、バックアップ依頼部342は、SSUの動作停止処理を実行する(ステップS38)。
[実施例1に係るOS停止時のデータフロー]
次に、実施例1に係るOS停止時のデータフローについて、図5を参照して説明する。図5は、実施例1に係るOS停止時のデータフローを説明する図である。図5の例では、クラスタ10−1(CL#0)及びクラスタ10−2(CL#1)は、共有メモリ31の同じセクション1(Sec.1)が割り当てられている。また、全セクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bは「OFF」であるものとする。
次に、実施例1に係るOS停止時のデータフローについて、図5を参照して説明する。図5は、実施例1に係るOS停止時のデータフローを説明する図である。図5の例では、クラスタ10−1(CL#0)及びクラスタ10−2(CL#1)は、共有メモリ31の同じセクション1(Sec.1)が割り当てられている。また、全セクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bは「OFF」であるものとする。
まず、監視装置(SVPM)20が、クラスタ10−1(CL#0)及びクラスタ10−2(CL#1)のCL制御部(CL−SVP)12に対し、OSの停止命令を送信する(s1)。すると、CL#0のCL−SVP12は、自CLと同じセクションを割り当てられた全てのCLに対し、OSが動作中であるか否かを問い合わせる(s2)。ここでは、CL#0のCL−SVP12は、同じセクション1を割り当てられているCL#1に対しOSが動作中であるか否かを問い合わせ、CL#1のOSが動作中であることを確認する。その後、CL#0のCL−SVP12は、OSを停止する。
そして、CL#1のCL−SVP12は、自CLと同じセクションを割り当てられた全てのCLに対し、OSが動作中であるか否かを問い合わせる(s3)。ここでは、CL#1のCL−SVP12は、同じセクション1を割り当てられているCL#0に対しOSが動作中であるか否かを問い合わせ、CL#0のOSが停止済みであることを確認する。この結果、以降、共有メモリ31のセクション1のデータは、アクセスされない。そして、CL#1のCL−SVP12は、セクション1のバックアップ指示を、SVPM20を介して共有メモリ装置(SSU)30に送信する(s4、s5)。その後、CL#1のCL−SVP12は、OSを停止する。
続いて、SSU30のSSU制御部(SSU−SVP)34は、CL#1からセクション1のバックアップ指示を受信すると、セクション1のバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが「OFF」であることを確認する。ここでは、セクション1のバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが「OFF」であるので、SSU−SVP34は、セクション1のバックアップ実行中フラグ34aを「ON」に設定する。そして、SSU−SVP34は、セクション1のバックアップ指示をSSD制御部(MAC)35に送信する(s6)。
続いて、MAC35は、セクション1のバックアップ指示を受けると、共有メモリ31のセクション1のデータを不揮発性記憶部(SSD)32にバックアップする(s7)。そして、MAC35は、バックアップ完了後、セクション1のバックアップ完了通知をSSU−SVP34に返信する(s8)。そして、MAC35は、バックアップ完了通知を受信後、セクション1のバックアップ完了フラグ34bを「ON」に設定するとともに、バックアップ実行中フラグ34aを「OFF」に設定する。
[実施例1に係る停電発生時のデータフロー]
次に、実施例1に係る停電発生時のデータフローについて、図6を参照して説明する。図6は、実施例1に係る停電発生時のデータフローを説明する図である。図6の例では、セクション1(Sec.1)のバックアップ完了フラグ34bは「保存済」を示す「ON」であり、セクション1以外のセクションのバックアップ完了フラグ34bは「OFF」であるものとする。また、全セクションのバックアップ実行中フラグ34aは「OFF」であるものとする。
次に、実施例1に係る停電発生時のデータフローについて、図6を参照して説明する。図6は、実施例1に係る停電発生時のデータフローを説明する図である。図6の例では、セクション1(Sec.1)のバックアップ完了フラグ34bは「保存済」を示す「ON」であり、セクション1以外のセクションのバックアップ完了フラグ34bは「OFF」であるものとする。また、全セクションのバックアップ実行中フラグ34aは「OFF」であるものとする。
停電が発生すると、SSU30のSSU制御部(SSU−SVP)34は、停電を感知した旨の通知を受信する。すると、セクション1以外のセクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが「OFF」であるので、SSU−SVP34は、セクション1を除くセクション2、3、4を取得する。そして、SSU−SVP34は、セクション2、3、4のバックアップ実行中フラグ34aを「ON」に設定し、これらのセクションのバックアップ指示をSSD制御部(MAC)35に送信する(s10)。
続いて、MAC35は、セクション2、3、4のバックアップ指示を受けると、これらセクションのデータを共有メモリ31から読み出し、読み出したデータをデータ不揮発性記憶部(SSD)32にバックアップする(s11)。そして、MAC35は、バックアップ完了後、セクション2、3、4のバックアップ完了通知をSSU−SVP34に返信する(s12)。そして、MAC35は、バックアップ完了通知を受信後、セクション2、3、4のバックアップ完了フラグ34bを「ON」に設定するとともに、バックアップ実行中フラグ34aを「OFF」に設定する。その後、SSU−SVP34は、動作を停止させる。
[実施例1に係るOS停止時のシーケンス]
次に、実施例1に係るOS停止時のシーケンスについて、図7を参照して説明する。図7は、実施例1に係るOS停止時のシーケンスを示す図である。図7の例では、クラスタ(CL)#0及びクラスタ(CL)#1は、共有メモリ31の同じセクション1(Sec.1)に割り当てられている。また、全セクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bは「OFF」であるものとする。
次に、実施例1に係るOS停止時のシーケンスについて、図7を参照して説明する。図7は、実施例1に係るOS停止時のシーケンスを示す図である。図7の例では、クラスタ(CL)#0及びクラスタ(CL)#1は、共有メモリ31の同じセクション1(Sec.1)に割り当てられている。また、全セクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bは「OFF」であるものとする。
まず、SVPM20は、CL#0のCL制御部(CL−SVP)12に対して、OSの停止命令を送信する(s21)。停止命令を受信したCL#0のCL−SVP12は、同じセクションが割り当てられているCL#1のCL−SVP12に対して、OS動作状態を問い合わせる(s22)。このとき、CL#1のCL−SVP12は、OSが動作中であるので、“OS動作中”のレスポンスを、CL#1に対して返信する(s23)。その後、CL#0のCL−SVP12は、OSの停止を完了する。
続いて、SVPM20は、CL#1のCL制御部(CL−SVP)12に対して、OSの停止命令を送信する(s24)。停止命令を受信したCL#1のCL−SVP12は、同じセクションが割り当てられているCL#0のCL−SVP12に対して、OS動作状態を問い合わせる(s25)。このとき、CL#0のCL−SVP12は、OSが停止しているので、“OS非動作中”のレスポンスを、CL#1に対して返信する(s26)。その後、CL#1のCL−SVP12は、SSU制御部(SSU−SVP)34に対してセクション1のバックアップ指示を、保守用回線50を介して送信する(s27)。その後、CL#1のCL−SVP12は、OSの停止を完了する。
セクション1のバックアップ指示を受信したSSU−SVP34は、セクション1のバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが「OFF」であるので、セクション1のバックアップをSSD制御部(MAC)35に指示する(s28)。そして、MAC35は、指示されたセクション1のバックアップを実行し、バックアップ完了後、セクション1のバックアップ完了通知をSSU−SVP34に送信する(s29)。セクション1のバックアップ完了通知を受信したSSU−SVP34は、セクション1のバックアップ完了フラグ34bを「ON」に設定するとともに、バックアップ実行中フラグ34aを「OFF」に設定する。この結果、セクション1のバックアップが完了した。
その後、停電が発生すると、SSU−SVP34は、停電を感知した旨の通知を受信し、補助電源33を起動する。そして、SSU−SVP34は、バックアップが完了したセクション1を除くセクション2〜4のバックアップをMAC35に指示する(s30)。そして、MAC35は、指示されたセクション2〜4のバックアップを実行し、バックアップ完了後、セクション2〜4のバックアップ完了通知をSSU−SVP34に送信する(s31)。セクション2〜4のバックアップ完了通知を受信したSSU−SVP34は、セクション2〜4のバックアップ完了フラグ34bを「ON」に設定するとともに、バックアップ実行中フラグ34aを「OFF」に設定する。この結果、共有メモリ31の全セクションのバックアップが完了し、SSU−SVP34は、共有メモリ装置(SSU)30の動作を停止させる。
[実施例1の効果]
上記実施例1によれば、情報処理システム1は、複数のクラスタ10−1〜10−n及び複数のセクションを備える共有メモリ装置30を有する。そして、共有メモリ装置30は、システムの運用中に、複数のクラスタ10−1〜10−nに割り当てられた共有メモリ31のセクションのうち所定のセクションを割り当てられた全てのクラスタ上で動作するOSが停止したことを検知する。さらに、共有メモリ装置30は、所定のセクションを割り当てられた全てのクラスタ上で動作するOSが停止したことを検知したとき、所定のセクションに記憶されたデータを不揮発性記憶部32にバックアップする。かかる構成によれば、情報処理システム1は、所定のセクションを割り当てられた全てのクラスタ上で動作するOSが停止したことを検知すると、検知後当該セクションにアクセスされることはないので、当該セクションのデータを書き換えられないこととなる。このため、情報処理システム1は、システムの運用中の段階で、書き換えがない当該セクションのデータを不揮発性記憶部32に予めバックアップしておくことで、後に停電が発生した場合にバックアップするデータ量を削減できる。すなわち、情報処理システム1は、停電の発生時に全てのセクションのデータをバックアップする場合と比較して、停電発生時にバックアップするデータ量を削減できる。
上記実施例1によれば、情報処理システム1は、複数のクラスタ10−1〜10−n及び複数のセクションを備える共有メモリ装置30を有する。そして、共有メモリ装置30は、システムの運用中に、複数のクラスタ10−1〜10−nに割り当てられた共有メモリ31のセクションのうち所定のセクションを割り当てられた全てのクラスタ上で動作するOSが停止したことを検知する。さらに、共有メモリ装置30は、所定のセクションを割り当てられた全てのクラスタ上で動作するOSが停止したことを検知したとき、所定のセクションに記憶されたデータを不揮発性記憶部32にバックアップする。かかる構成によれば、情報処理システム1は、所定のセクションを割り当てられた全てのクラスタ上で動作するOSが停止したことを検知すると、検知後当該セクションにアクセスされることはないので、当該セクションのデータを書き換えられないこととなる。このため、情報処理システム1は、システムの運用中の段階で、書き換えがない当該セクションのデータを不揮発性記憶部32に予めバックアップしておくことで、後に停電が発生した場合にバックアップするデータ量を削減できる。すなわち、情報処理システム1は、停電の発生時に全てのセクションのデータをバックアップする場合と比較して、停電発生時にバックアップするデータ量を削減できる。
また、上記実施例1によれば、情報処理システム1は、停電が発生したとき、補助電源33をにより共有メモリ装置30への電源を供給し、所定のセクションと異なるセクションに記憶されたデータを不揮発性記憶部32にバックアップする。かかる構成によれば、情報処理システム1は、停電が発生したとき、補助電源33からの給電により所定のセクションと異なるセクションに記憶されたデータを不揮発性記憶部32にバックアップすることとした。この結果、情報処理システム1は、停電が発生したときにバックアップするデータのデータ量を、所定のセクションに記憶されたデータのデータ量だけ削減できる。この結果、情報処理システム1は、停電が発生したときにバックアップする処理時間を短縮できる。
また、上記実施例1によれば、クラスタ10−1は、OSの停止命令を取得すると、自己と同じ所定のセクションを割り当てられた全てのクラスタに対しOSが動作中であるか否かを判定する。そして、クラスタ10−1は、自己と同じ所定のセクションを割り当てられた全てのクラスタ上で動作するOSが全て動作中でないと判定した場合に、所定のセクションのバックアップ指示を共有メモリ装置30に送信する。そして、共有メモリ装置30は、クラスタ10−1によって送信された所定のセクションのバックアップ指示を取得することにより、所定のセクションを割り当てられた全てのクラスタ上で動作するOSが停止したことを検知する。かかる構成によれば、OSの停止命令を取得したクラスタ10−1が、自己と同じ所定のセクションを割り当てられた全てのクラスタ上で動作するOSが全て動作中でないと判定したときに所定のセクションのバックアップ指示を共有メモリ装置30に送信する。このため、共有メモリ装置30は、所定のセクションのデータが書き換えられなくなったと同時に当該セクションのバックアップをすることができるので、停電前の早い段階に確実にバックアップすることができる。
なお、上記実施例1では、共有メモリ装置30は、システムの運用中に、共有メモリ31のセクションのうち所定のセクションを割り当てられた全てのクラスタ上で動作するOSが停止したことを検知するものとして説明した。しかしながら、共有メモリ装置30は、OSに限定されず、共有メモリ31のセクションのうち所定のセクションを割り当てられた全てのクラスタ上で動作するプログラムが停止したことを検知するものとしても良い。すなわち、共有メモリ31は、複数のクラスタ上で動作するプログラムが共有するメモリであっても良い。この場合、共有メモリ装置30は、所定のセクションを割り当てられた全てのクラスタ上で動作するプログラムが停止したことを検知したとき、所定のセクションに記憶されたデータを不揮発性記憶部32にバックアップすることとなる。
[実施例2に係る情報処理システムの構成]
ところで、実施例1の情報処理システム1は、OS停止命令があったクラスタと同じ所定のセクションを割り当てられた全てのクラスタ上で動作するOSが全て停止したときに、当該セクションのバックアップを実行する場合について説明した。しかしながら、情報処理システム1は、これに限定されず、監視装置20に対してクラスタのOSの動作状態を問い合わせ、所定のセクションを割り当てられた全てのクラスタのOSの動作状態が停止中であるときに、当該セクションのバックアップを実行しても良い。
ところで、実施例1の情報処理システム1は、OS停止命令があったクラスタと同じ所定のセクションを割り当てられた全てのクラスタ上で動作するOSが全て停止したときに、当該セクションのバックアップを実行する場合について説明した。しかしながら、情報処理システム1は、これに限定されず、監視装置20に対してクラスタのOSの動作状態を問い合わせ、所定のセクションを割り当てられた全てのクラスタのOSの動作状態が停止中であるときに、当該セクションのバックアップを実行しても良い。
そこで、実施例2では、情報処理システム2が、監視装置20に対してクラスタのOSの動作状態を問い合わせ、所定のセクションを割り当てられた全てのクラスタのOSの動作状態が停止中であるときに、当該セクションのバックアップを実行する場合を説明する。
[実施例2に係る情報処理システムの構成]
図8は、実施例2に係る情報処理システム2の構成を示す機能ブロック図である。なお、図1に示す情報処理システム1と同一の構成については同一符号を示すことで、その重複する構成及び動作の説明については省略する。実施例1と実施例2とが異なるところは、監視装置20に装置動作状態情報401を追加した点にある。また、実施例1と実施例2とが異なるところは、SSU制御部34にCL動作状態問合せ部402を追加した点にある。
図8は、実施例2に係る情報処理システム2の構成を示す機能ブロック図である。なお、図1に示す情報処理システム1と同一の構成については同一符号を示すことで、その重複する構成及び動作の説明については省略する。実施例1と実施例2とが異なるところは、監視装置20に装置動作状態情報401を追加した点にある。また、実施例1と実施例2とが異なるところは、SSU制御部34にCL動作状態問合せ部402を追加した点にある。
装置動作状態情報401は、装置毎に動作状態を対応付けた情報である。一例として、装置動作状態情報401は、全てのクラスタ10−1〜10−n及び共有メモリ装置30について、電源が投入されている状態(「Power Ready状態」という。)であるか否かの情報を記憶する。なお、監視装置20が、定期的に全てのクラスタ10−1〜10−n及び共有メモリ装置30のPower Ready状態を監視し、各装置についてPower Ready状態であるか否かの情報を装置動作状態情報401に格納する。
CL動作状態問合せ部402は、監視装置20に対して、クラスタのOSの動作状態を定期的に問い合わせる。
OS停止検知部341は、システムの運用中に、所定のセクションを割り当てられた全てのクラスタのOSの動作状態が停止中であることを検知する。例えば、OS停止検知部341は、CL動作状態問合せ部402によってクラスタのOSの動作状態を問い合わせた結果、クラスタのOSの動作状態及びセクション−CL情報34cに基づいて、所定のセクションを使用する全てのクラスタが停止中であることを検知する。すなわち、OS停止検知部341は、所定のセクションを使用する全てのクラスタがPower Ready状態でない電源切断状態であることを検知する。そして、バックアップ依頼部342が、検知に関わるセクションのバックアップの依頼処理を行うこととなる。
[実施例2に係るOS停止時のSSU制御部(SSU−SVP)の処理手順]
次に、実施例2に係るOS停止時のSSU制御部(SSU−SVP)34の処理手順を、図9を参照して説明する。図9は、実施例2に係るOS停止時のSSU制御部(SSU−SVP)の処理手順を示すフローチャートである。
次に、実施例2に係るOS停止時のSSU制御部(SSU−SVP)34の処理手順を、図9を参照して説明する。図9は、実施例2に係るOS停止時のSSU制御部(SSU−SVP)の処理手順を示すフローチャートである。
まず、SSU−SVP34のCL動作状態問合せ部402は、監視装置(SVPM)20に対して、クラスタ(CL)10−1〜10−nの動作状態を定期的に問い合わせる(ステップS41)。そして、OS停止検知部341は、あるセクションを使用する全クラスタ10が動作停止したか否かを判定する(ステップS42)。例えば、OS停止検知部341は、クラスタ10の動作状態を問い合わせた結果、クラスタ10の動作状態及びセクション−CL情報34cに基づいて、あるセクションを使用する全てのクラスタ10が停止中であるか否かを判定する。
あるセクションを使用するいずれかのクラスタ10が停止中でないと判定した場合(ステップS42;No)、OS停止検知部341は、継続してクラスタ10の動作状態を問い合わせるべく、ステップS41に移行する。一方、あるセクションを使用する全てのクラスタ10が停止中であると判定した場合(ステップS42;Yes)、OS停止検知部341は、あるセクションを使用する全てのクラスタ10が停止中であることを検知する。
続いて、バックアップ依頼部342は、該当するセクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが両方共OFFであるか否かを判定する(ステップS43)。両方共OFFでない場合(ステップS43;No)、バックアップ依頼部342は、バックアップが実行中であるか、またはバックアップが完了したので、処理を終了する。
一方、両方共OFFである場合(ステップS43;Yes)、バックアップ依頼部342は、バックアップ指示があったセクションのバックアップ実行中フラグ34aを「ON」に設定する(ステップS44)。そして、バックアップ依頼部342は、該当するセクションのバックアップをSSD制御部35に依頼する(ステップS45)。
その後、バックアップ依頼部342は、バックアップ対象であったセクションのバックアップの完了通知を受信したか否かを判定する(ステップS46)。バックアップの完了通知を受信しなかったと判定した場合(ステップS46;No)、バックアップ依頼部342は、バックアップの完了通知を受信するまで判定処理を繰り返す。一方、バックアップの完了通知を受信したと判定した場合(ステップS46;Yes)、バックアップ依頼部342は、バックアップ対象であったセクションのバックアップ完了フラグを「ON」に設定する(ステップS47)。そして、バックアップ依頼部342は、バックアップ対象であったセクションのバックアップ実行中フラグを「OFF」に設定する(ステップS48)。
[実施例2に係る停電発生時のSSU制御部(SSU−SVP)の処理手順]
図10は、実施例2に係る停電発生時のSSU制御部(SSU−SVP)の処理手順を示すフローチャートである。なお、実施例2に係る停電発生時のSSU−SVPの処理手順は、実施例1に係る停電発生時のSSU−SVPの処理手順と同一であるので、処理手順の説明については省略する。
図10は、実施例2に係る停電発生時のSSU制御部(SSU−SVP)の処理手順を示すフローチャートである。なお、実施例2に係る停電発生時のSSU−SVPの処理手順は、実施例1に係る停電発生時のSSU−SVPの処理手順と同一であるので、処理手順の説明については省略する。
[実施例2に係るOS停止時のデータフロー]
次に、実施例2に係るOS停止時のデータフローについて、図11を参照して説明する。図11は、実施例2に係るOS停止時のデータフローを説明する図である。図11の例では、共有メモリ31の同じセクション2(Sec.2)が割り当てられたクラスタ10−3(CL#2)及びクラスタ10−4(CL#3)が、突然部分停電により、動作停止になったものとする。また、全セクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bは「OFF」であるものとする。
次に、実施例2に係るOS停止時のデータフローについて、図11を参照して説明する。図11は、実施例2に係るOS停止時のデータフローを説明する図である。図11の例では、共有メモリ31の同じセクション2(Sec.2)が割り当てられたクラスタ10−3(CL#2)及びクラスタ10−4(CL#3)が、突然部分停電により、動作停止になったものとする。また、全セクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bは「OFF」であるものとする。
まず、SSU制御部(SSU−SVP)34が、監視装置(SVPM)20に対して、クラスタ10−1〜10−7の動作状態を定期的に問い合わせる(s41)。すると、SVPM20は、SSU−SVP34の問い合わせに対し、CL#2及びCL#3が停止中であることを返信する(s42)。
続いて、SSU−SVP34は、CL#2及びCL#3が停止中であることを受信し、CL#2及びCL#3に割り当てられたセクション2のOSが全て停止していることを確認する。この結果、以降、共有メモリ31のセクション2のデータは、アクセスされない。
続いて、SSU−SVP34は、セクション2のバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが「OFF」であることを確認する。ここでは、セクション2のバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが「OFF」であるので、SSU−SVP34は、セクション2のバックアップ実行中フラグ34aを「保存中」を示す「ON」に設定する。そして、SSU−SVP34は、セクション2のバックアップ指示をSSD制御部(MAC)35に送信する(s43)。
続いて、MAC35は、セクション2のバックアップ指示を受けると、共有メモリ31のセクション2のデータを共有メモリ31から読み出し、読み出したデータを不揮発性記憶部(SSD)32にバックアップする(s44)。そして、MAC35は、バックアップ完了後、セクション2のバックアップ完了通知をSSU−SVP34に返信する(s45)。そして、MAC35は、バックアップ完了通知を受信後、セクション2のバックアップ完了フラグ34bを「ON」に設定するとともに、バックアップ実行中フラグ34aを「OFF」に設定する。
[実施例2に係る停電発生時のデータフロー]
次に、実施例2に係る停電発生時のデータフローについて、図12を参照して説明する。図12は、実施例2に係る停電発生時のデータフローを説明する図である。図12の例では、セクション2(Sec.2)のバックアップ完了フラグ34bは「保存済み」を示す「ON」であり、セクション2以外のセクションのバックアップ完了フラグ34bは「OFF」であるものとする。また、全セクションのバックアップ実行中フラグ34aは「OFF」であるものとする。
次に、実施例2に係る停電発生時のデータフローについて、図12を参照して説明する。図12は、実施例2に係る停電発生時のデータフローを説明する図である。図12の例では、セクション2(Sec.2)のバックアップ完了フラグ34bは「保存済み」を示す「ON」であり、セクション2以外のセクションのバックアップ完了フラグ34bは「OFF」であるものとする。また、全セクションのバックアップ実行中フラグ34aは「OFF」であるものとする。
停電が発生すると、SSU30のSSU制御部(SSU−SVP)34は、停電を感知した旨の通知を受信する。すると、セクション2以外のセクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが「OFF」であるので、SSU−SVP34は、セクション2を除くセクション1、3、4を取得する。そして、SSU−SVP34は、セクション1、3、4のバックアップ実行中フラグ34aを「保存中」を示す「ON」に設定し、これらのセクションのバックアップ指示をSSD制御部(MAC)35に送信する(s51)。
続いて、MAC35は、セクション1、3、4のバックアップ指示を受けると、これらセクションのデータを共有メモリ31から読み出し、読み出したデータを不揮発性記憶部(SSD)32にバックアップする(s52)。そして、MAC35は、バックアップ完了後、セクション1、3、4のバックアップ完了通知をSSU−SVP34に返信する(s53)。そして、MAC35は、バックアップ完了通知を受信後、セクション1、3、4のバックアップ完了フラグ34bを「ON」に設定するとともに、バックアップ実行中フラグ34aを「OFF」に設定する。その後、SSU−SVP34は、動作を停止させる。
[実施例2に係るOS停止時のシーケンス]
次に、実施例2に係るOS停止時のシーケンスについて、図13を参照して説明する。図13は、実施例2に係るOS停止時のシーケンスを示す図である。図13の例では、クラスタ(CL)#2及びクラスタ(CL)#3は、共有メモリ31の同じセクション2(Sec.2)に割り当てられている。また、全セクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bは「OFF」であるものとする。
次に、実施例2に係るOS停止時のシーケンスについて、図13を参照して説明する。図13は、実施例2に係るOS停止時のシーケンスを示す図である。図13の例では、クラスタ(CL)#2及びクラスタ(CL)#3は、共有メモリ31の同じセクション2(Sec.2)に割り当てられている。また、全セクションのバックアップ実行中フラグ34a及びバックアップ完了フラグ34bは「OFF」であるものとする。
まず、全CLが動作しているものとする。SSU制御部(SSU−SVP)34は、監視装置(SVPM)20に対し、全CLの動作状態を問い合わせる(s61)。SVPM20は、全CLが動作しているので、全CLが動作中である旨のレスポンスを返信する(s62)。
ここで、全CLのうちCL#2及びCL#3の動作が停止したものとする。SSU制御部(SSU−SVP)34は、監視装置(SVPM)20に対し、全CLの動作状態を問い合わせる(s63)。SVPM20は、CL#2及びCL#3の動作が停止しているので、CL#2及びCL#3が停止中である旨のレスポンスを返信する(s64)。
CL#2及びCL#3が停止中である旨のレスポンスを受信したSSU−SVP34は、セクション2を使用する全てのクラスタが停止中であることを検知する。そして、SSU−SVP34は、セクション2のバックアップ実行中フラグ34a及びバックアップ完了フラグ34bが「OFF」であるので、セクション2のバックアップをSSD制御部(MAC)35に指示する(s65)。そして、MAC35は、指示されたセクション2のバックアップを実行し、バックアップ完了後、セクション2のバックアップ完了通知をSSU−SVP34に送信する(s66)。セクション2のバックアップ完了通知を受信したSSU−SVP34は、セクション2のバックアップ完了フラグ34bを「ON」に設定するとともに、バックアップ実行中フラグ34aを「OFF」に設定する。この結果、セクション2のバックアップが完了した。
その後、停電が発生すると、SSU−SVP34は、停電を感知した旨の通知を受信し、補助電源33を起動する。そして、SSU−SVP34は、バックアップが完了したセクション2を除くセクション1、3、4のバックアップをMAC35に指示する(s67)。そして、MAC35は、指示されたセクション1、3、4のバックアップを実行し、バックアップ完了後、セクション1、3、4のバックアップ完了通知をSSU−SVP34に送信する(s68)。セクション1、3、4のバックアップ完了通知を受信したSSU−SVP34は、セクション1、3、4のバックアップ完了フラグ34bを「ON」に設定するとともに、バックアップ実行中フラグ34aを「OFF」に設定する。この結果、共有メモリ31の全セクションのバックアップが完了し、SSU−SVP34は、共有メモリ装置(SSU)30の動作を停止させる。
[実施例2の効果]
上記実施例2によれば、情報処理システム2は、複数のクラスタ10−1〜10−n及び複数のセクションを備える共有メモリ装置30を有する。また、情報処理システム2は、クラスタ10−1〜10−n上で動作するOSの動作状態を監視する監視装置20を有する。そして、共有メモリ装置30は、監視装置20に対してクラスタ上で動作するOSの動作状態を問い合わせ、所定のセクションを割り当てられた全てのクラスタ上で動作するOSの動作状態が停止中であることを検知する。さらに、共有メモリ装置30は、所定のセクションを割り当てられた全てのクラスタ上で動作するOSの動作状態が停止中であることを検知したとき、所定のセクションに記憶されたデータを不揮発性記憶部32にバックアップする。かかる構成によれば、情報処理システム2は、所定のセクションを割り当てられた全てのクラスタ上で動作するOSの動作状態が停止中であることを検知すると、検知後当該セクションにアクセスされることはないので、当該セクションのデータを書き換えられないこととなる。このため、情報処理システム2は、システムの運用中の段階で、書き換えのない当該セクションのデータを不揮発性記憶部32に予めバックアップしておくことで、後に停電が発生した場合にバックアップするデータ量を削減できる。すなわち、情報処理システム2は、停電の発生時に全てのセクションのデータをバックアップする場合と比較して、停電発生時にバックアップするデータ量を削減できる。
上記実施例2によれば、情報処理システム2は、複数のクラスタ10−1〜10−n及び複数のセクションを備える共有メモリ装置30を有する。また、情報処理システム2は、クラスタ10−1〜10−n上で動作するOSの動作状態を監視する監視装置20を有する。そして、共有メモリ装置30は、監視装置20に対してクラスタ上で動作するOSの動作状態を問い合わせ、所定のセクションを割り当てられた全てのクラスタ上で動作するOSの動作状態が停止中であることを検知する。さらに、共有メモリ装置30は、所定のセクションを割り当てられた全てのクラスタ上で動作するOSの動作状態が停止中であることを検知したとき、所定のセクションに記憶されたデータを不揮発性記憶部32にバックアップする。かかる構成によれば、情報処理システム2は、所定のセクションを割り当てられた全てのクラスタ上で動作するOSの動作状態が停止中であることを検知すると、検知後当該セクションにアクセスされることはないので、当該セクションのデータを書き換えられないこととなる。このため、情報処理システム2は、システムの運用中の段階で、書き換えのない当該セクションのデータを不揮発性記憶部32に予めバックアップしておくことで、後に停電が発生した場合にバックアップするデータ量を削減できる。すなわち、情報処理システム2は、停電の発生時に全てのセクションのデータをバックアップする場合と比較して、停電発生時にバックアップするデータ量を削減できる。
なお、上記実施例2では、共有メモリ装置30は、監視装置20に対してクラスタ上で動作するOSの動作状態を問い合わせ、所定のセクションを割り当てられた全てのクラスタ上で動作するOSの動作状態が停止中であることを検知するものとして説明した。しかしながら、共有メモリ装置30は、OSに限定されず、監視装置20に対してクラスタ上で動作するプログラムの動作状態を問い合わせ、所定のセクションを割り当てられた全てのクラスタ上で動作するプログラムの動作状態が停止中であることを検知するものとしても良い。この場合、共有メモリ装置30は、所定のセクションを割り当てられた全てのクラスタ上で動作するプログラムの動作状態が停止中であることを検知したとき、所定のセクションに記憶されたデータを不揮発性記憶部32にバックアップすることとなる。
[その他]
なお、クラスタ10−1〜10−nは、既知のパーソナルコンピュータ、ワークステーションなどの情報処理装置に、上記したCL制御部12などの各機能を搭載することによって実現することができる。また、共有メモリ装置30は、既知のパーソナルコンピュータ、ワークステーションなどの情報処理装置に、上記したOS停止検知部341及びバックアップ依頼部342などの各機能を搭載することによって実現することができる。また、監視装置20は、既知のパーソナルコンピュータ、ワークステーションなどの情報処理装置に、上記した各機能を搭載することによって実現することができる。さらに、クラスタ10−1〜10−n、共有メモリ装置30、監視装置20を実現する情報処理装置は、CPU、RAMやハードディスク等の記録装置、ネットワークインタフェース、媒体読取装置等を有する。
なお、クラスタ10−1〜10−nは、既知のパーソナルコンピュータ、ワークステーションなどの情報処理装置に、上記したCL制御部12などの各機能を搭載することによって実現することができる。また、共有メモリ装置30は、既知のパーソナルコンピュータ、ワークステーションなどの情報処理装置に、上記したOS停止検知部341及びバックアップ依頼部342などの各機能を搭載することによって実現することができる。また、監視装置20は、既知のパーソナルコンピュータ、ワークステーションなどの情報処理装置に、上記した各機能を搭載することによって実現することができる。さらに、クラスタ10−1〜10−n、共有メモリ装置30、監視装置20を実現する情報処理装置は、CPU、RAMやハードディスク等の記録装置、ネットワークインタフェース、媒体読取装置等を有する。
また、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的態様は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。例えば、OS停止検知部341とバックアップ依頼部342とを1個の部として統合しても良い。一方、バックアップ依頼部342を、バックアップ指示があったセクションのバックアップをSSD制御部35に依頼する第1の依頼部と、停電を感知後該当するセクションのバックアップをSSD制御部35に依頼する第2の依頼部とに分散しても良い。また、不揮発性記憶部32を共有メモリ装置30の外部装置としてネットワーク経由で接続するようにしても良い。
また、情報処理システム1、2にて行われる各処理機能は、その全部または任意の一部が、CPU(またはMPU、MCU(Micro Controller Unit)などのマイクロ・コンピュータ)あるいは、ワイヤードロジックによるハードウェアとして実現されても良い。また、情報処理システム1、2にて行われる各処理機能は、その全部または任意の一部が、CPU(またはMPU、MCUなどのマイクロ・コンピュータ)にて解析実行されるプログラムにて実現されても良い。
1、2 情報処理システム
10−1〜10−n クラスタ
11 記憶部
11a セクション−CL情報
12 CL制御部(CL−SVP)
20 監視装置(SVPM)
30 共有メモリ装置(SSU)
31 共有メモリ(DIMM)
32 不揮発性記憶部(SSD)
33 補助電源
34 SSU制御部(SSU−SVP)
341 OS停止検知部
342 バックアップ依頼部
34a バックアップ実行中フラグ
34b バックアップ完了フラグ
34c セクション−CL情報
35 SSD制御部(MAC)
401 装置動作状態情報
402 CL動作状態問合せ部
10−1〜10−n クラスタ
11 記憶部
11a セクション−CL情報
12 CL制御部(CL−SVP)
20 監視装置(SVPM)
30 共有メモリ装置(SSU)
31 共有メモリ(DIMM)
32 不揮発性記憶部(SSD)
33 補助電源
34 SSU制御部(SSU−SVP)
341 OS停止検知部
342 バックアップ依頼部
34a バックアップ実行中フラグ
34b バックアップ完了フラグ
34c セクション−CL情報
35 SSD制御部(MAC)
401 装置動作状態情報
402 CL動作状態問合せ部
Claims (6)
- 複数の情報処理装置及び前記複数の情報処理装置上で動作するプログラムが共有する共有メモリを有する共有メモリ装置を有する情報処理システムにおいて、
前記共有メモリ装置は、
システム運用中に、前記複数の情報処理装置が共有する共有メモリの記憶領域のうち所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムが停止したことを検知する検知部と、
所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムの停止が前記検知部によって検知されたとき、前記所定の記憶領域に記憶されたデータを不揮発性の記憶領域に保存する保存部と
を有することを特徴とする情報処理システム。 - 前記保存部は、
停電が発生したとき、バックアップ電源により前記共有メモリ装置への電源を供給し、前記所定の記憶領域と異なる記憶領域に記憶されたデータを前記不揮発性の記憶領域に保存する
ことを特徴とする請求項1に記載の情報処理システム。 - 前記情報処理装置は、
前記情報処理装置上で動作するプログラムの停止命令を取得すると、自己と同じ所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムが動作中であるか否かを判定し、前記全ての情報処理装置上で動作するプログラムが全て動作中でないと判定した場合に、前記所定の記憶領域に記憶されたデータを前記不揮発性の記憶領域に保存する保存指示を前記共有メモリ装置に送信する制御部を有し、
前記検知部は、
前記制御部によって送信された保存指示を取得することにより、前記所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムが停止したことを検知することを特徴とする請求項1に記載の情報処理システム。 - 情報処理装置上で動作するプログラムの動作状態を監視する監視部を有し、
前記検知部は、
前記監視部に対して情報処理装置上で動作するプログラムの動作状態を問い合わせ、前記所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムの動作状態が停止中であることを検知することを特徴とする請求項1に記載の情報処理システム。 - 複数の情報処理装置上で動作するプログラムが共有する共有メモリと、
システムの運用中に、前記複数の情報処理装置が共有する共有メモリの記憶領域のうち所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムが停止したことを検知する検知部と、
所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムの停止が前記検知部によって検知されたとき、前記所定の記憶領域に記憶されたデータを不揮発性の記憶領域に保存する保存部と
を有することを特徴とする共有メモリ装置。 - 複数の情報処理装置及び前記複数の情報処理装置上で動作するプログラムが共有する共有メモリを有する情報処理システムが実行するメモリデータ保存方法であって、
システムの運用中に、前記複数の情報処理装置が共有する共有メモリの記憶領域のうち所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムが停止したことを検知し、
所定の記憶領域を割り当てられた全ての情報処理装置上で動作するプログラムの停止が該検知によって検知されたとき、前記所定の記憶領域に記憶されたデータを不揮発性の記憶領域に保存する
ことを特徴とするメモリデータ保存方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/056854 WO2012127636A1 (ja) | 2011-03-22 | 2011-03-22 | 情報処理システム、共有メモリ装置及びメモリデータ保存方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5534101B2 true JP5534101B2 (ja) | 2014-06-25 |
JPWO2012127636A1 JPWO2012127636A1 (ja) | 2014-07-24 |
Family
ID=46878829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013505706A Expired - Fee Related JP5534101B2 (ja) | 2011-03-22 | 2011-03-22 | 情報処理システム、共有メモリ装置及びメモリデータ保存方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140026019A1 (ja) |
JP (1) | JP5534101B2 (ja) |
WO (1) | WO2012127636A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10956323B2 (en) * | 2018-05-10 | 2021-03-23 | Intel Corporation | NVDIMM emulation using a host memory buffer |
EP3852505B1 (en) | 2020-01-17 | 2023-12-06 | Aptiv Technologies Limited | Electronic control unit |
EP3866013A1 (en) | 2020-02-11 | 2021-08-18 | Aptiv Technologies Limited | Data logging system for collecting and storing input data |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1063586A (ja) * | 1996-08-19 | 1998-03-06 | Fujitsu Ltd | 情報処理装置 |
JP2002132591A (ja) * | 2000-10-20 | 2002-05-10 | Canon Inc | メモリ制御装置およびメモリ制御方法 |
JP2003345528A (ja) * | 2002-05-22 | 2003-12-05 | Hitachi Ltd | 記憶システム |
JP2008276646A (ja) * | 2007-05-02 | 2008-11-13 | Hitachi Ltd | ストレージ装置及びストレージ装置におけるデータの管理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316713A (ja) * | 2002-04-26 | 2003-11-07 | Hitachi Ltd | 記憶装置システム |
-
2011
- 2011-03-22 JP JP2013505706A patent/JP5534101B2/ja not_active Expired - Fee Related
- 2011-03-22 WO PCT/JP2011/056854 patent/WO2012127636A1/ja active Application Filing
-
2013
- 2013-09-20 US US14/032,591 patent/US20140026019A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1063586A (ja) * | 1996-08-19 | 1998-03-06 | Fujitsu Ltd | 情報処理装置 |
JP2002132591A (ja) * | 2000-10-20 | 2002-05-10 | Canon Inc | メモリ制御装置およびメモリ制御方法 |
JP2003345528A (ja) * | 2002-05-22 | 2003-12-05 | Hitachi Ltd | 記憶システム |
JP2008276646A (ja) * | 2007-05-02 | 2008-11-13 | Hitachi Ltd | ストレージ装置及びストレージ装置におけるデータの管理方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2012127636A1 (ja) | 2012-09-27 |
JPWO2012127636A1 (ja) | 2014-07-24 |
US20140026019A1 (en) | 2014-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8751836B1 (en) | Data storage system and method for monitoring and controlling the power budget in a drive enclosure housing data storage devices | |
US20210232198A1 (en) | Method and apparatus for performing power analytics of a storage system | |
US8041976B2 (en) | Power management for clusters of computers | |
US8156381B2 (en) | Storage management apparatus and storage system | |
US8468383B2 (en) | Reduced power failover system | |
US8762648B2 (en) | Storage system, control apparatus and control method therefor | |
US9112887B2 (en) | Mirroring solution in cloud storage environment | |
US20190251027A1 (en) | Cost-effective solid state disk data-protection method for power outages | |
US20110197036A1 (en) | Control method for disk array apparatus and disk array apparatus | |
US9513690B2 (en) | Apparatus and method for adjusting operating frequencies of processors based on result of comparison of power level with a first threshold and a second threshold | |
CN104335187A (zh) | 独立于存储器控制器的存储备份 | |
JP6056554B2 (ja) | クラスタシステム | |
KR101410596B1 (ko) | 정보 처리 장치, 카피 제어 프로그램 및 카피 제어 방법 | |
US10565108B2 (en) | Write-back cache for storage controller using persistent system memory | |
US9442784B2 (en) | Management device, management method, and medium storing management program | |
US9021275B1 (en) | Method and apparatus to exercise and manage a related set of power managed storage devices | |
JP5534101B2 (ja) | 情報処理システム、共有メモリ装置及びメモリデータ保存方法 | |
US9141172B1 (en) | Method and apparatus to manage and control a power state of a device set based on availability requirements of corresponding logical addresses | |
US20130254446A1 (en) | Memory Management Method and Device for Distributed Computer System | |
US10191681B2 (en) | Shared backup power self-refresh mode | |
TWI602059B (zh) | 伺服器節點關機技術 | |
US20170249248A1 (en) | Data backup | |
US11327549B2 (en) | Method and apparatus for improving power management by controlling operations of an uninterruptible power supply in a data center | |
US20140337650A1 (en) | System and Method for Power Management in a Multiple-Initiator Storage System | |
JP7266628B2 (ja) | ストレージ装置、ストレージ装置制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5534101 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140414 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140711 |
|
LAPS | Cancellation because of no payment of annual fees |