JP2021086331A - 情報処理装置、情報処理システム及びプログラム - Google Patents

情報処理装置、情報処理システム及びプログラム Download PDF

Info

Publication number
JP2021086331A
JP2021086331A JP2019213846A JP2019213846A JP2021086331A JP 2021086331 A JP2021086331 A JP 2021086331A JP 2019213846 A JP2019213846 A JP 2019213846A JP 2019213846 A JP2019213846 A JP 2019213846A JP 2021086331 A JP2021086331 A JP 2021086331A
Authority
JP
Japan
Prior art keywords
information processing
processing device
data
server
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019213846A
Other languages
English (en)
Other versions
JP7363413B2 (ja
Inventor
伸一郎 福田
Shinichiro Fukuda
伸一郎 福田
野中 隆
Takashi Nonaka
隆 野中
要 高落
Kaname Takaochi
要 高落
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019213846A priority Critical patent/JP7363413B2/ja
Priority to US17/070,970 priority patent/US11487459B2/en
Publication of JP2021086331A publication Critical patent/JP2021086331A/ja
Application granted granted Critical
Publication of JP7363413B2 publication Critical patent/JP7363413B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0635Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】第1サーバの最新データが第2サーバの古いデータに置き換えられることを防ぎ、データロストを抑止すること。【解決手段】第1サーバが停止から運用系に復旧する際に、第2サーバの判定部が、停止前にミラーリングが未完了で、第2サーバにおいて当該データ更新が未反映であるスライスであるか否かを判定する。そして、停止前にミラーリングが未完了であるスライスでないと判定部により判定されると、第2サーバの実行部が、スライスのデータを第1サーバにコピーする。【選択図】図4

Description

本発明は、情報処理装置、情報処理システム及びプログラムに関する。
データレプリケーション構成のクラスタシステムでは、アプリケーションからのデータ書き込み要求に対して、運用系情報処理装置は、待機系情報処理装置のスライスへの書き込み処理が完了した後にアプリケーションへの書き込み終了応答を行う。ここで、クラスタシステムとは、複数の情報処理装置が連携して1つのシステムとして運用されるシステムである。また、データレプリケーション構成のクラスタシステムとは、運用系情報処理装置のスライスに書き込んだデータを待機系情報処理装置のスライスにも書き込むクラスタシステムである。また、スライスとは、運用系情報処理装置及び待機系情報処理装置がそれぞれ記憶するボリュームである。運用系情報処理装置が記憶するスライスと待機系情報処理装置が記憶するスライスは、ボリュームのミラーリングペアを構成する。
データレプリケーション構成のクラスタシステムにおいてクラスタパーティションが発生すると、待機系情報処理装置のスライスへの書き込み処理にエラーが発生し、データ書き込みが完了せずアプリケーションの処理が中断される。ここで、クラスタパーティションとは、クラスタシステム内の情報処理装置間の通信が途絶した状態である。クラスタパーティションが発生したときのアプリケーションの処理の中断を防ぐ技術としてスライス先行縮退がある。
図7は、スライス先行縮退を説明するための図である。図7において、サーバ#11及びサーバ#12で表される2つのサーバ91は、データレプリケーション構成のクラスタシステム9を構築する情報処理装置である。サーバ#11は運用系情報処理装置であり、サーバ#12は待機系情報処理装置である。
サーバ91ではアプリケーション21が動作する。アプリケーション21は、クラスタ制御部92を介してディスク装置23のスライスへのデータの書き込み及びディスク装置23のスライスからのデータの読み出しを行う。クラスタ制御部92は、クラスタシステム9に関する処理を行い、ディスク制御部90を有する。
ディスク制御部90は、ディスク装置23のスライスへのデータの書き込み及びディスク装置23のスライスからのデータの読み出しを制御する。サーバ#11のディスク制御部90は、自装置のスライスにデータを書き込む際に、サーバ#12のスライスにもデータを書き込む。すなわち、ディスク制御部90は、ミラーリングを行う。
サーバ#11とサーバ#12の通信が不可の場合、サーバ#11のディスク制御部90は、サーバ#12のスライスへのデータ書き込みに失敗する。すると、サーバ#11のディスク制御部90は、スライス先行縮退を行う。具体的には、サーバ#11のディスク制御部90は、データ書き込みに失敗したスライスを識別する情報を故障ディスク情報としてディスク装置23に書き込み、アプリケーション21に書き込み完了を応答する。
このように、サーバ#11のディスク制御部90は、サーバ#12のスライスへのデータ書き込みに失敗すると、スライス先行縮退を行うことで、アプリケーション21の処理の中断を防ぐことができる。ただし、サーバ#12のディスク装置23のスライスは古いままである。
なお、データのリモートコピーに関する従来技術として、複数のストレージ装置を備えた情報システムの可用性を向上させる技術がある。この情報システムでは、第1及び第2のストレージ装置は、第1のストレージ装置の第1のボリュームのデータを第2のストレージ装置の第2のボリュームへコピーするリモートコピーのペアをそれぞれ内部に設定する。また、第1及び第2のストレージ装置は、リモートコピーのペアに第3のストレージ装置の第3のボリュームを関連付ける。そして、ホストコンピュータは、第1のボリュームへのI/Oリクエストが失敗した場合に、第2のボリュームに対するI/Oリクエストを第2のストレージ装置に送信する。また、第1及び第2のストレージ装置は、相手側の第1もしくは第2のストレージ装置の障害、又は第1及び第2のストレージ装置間の接続障害を検出した場合に、当該障害を検出した旨を示す障害情報フラグを第3のボリュームに格納する。
また、従来技術として、Active/Active構成の運用を可能にするとともに、障害時に適切な対応を取ることが可能なストレージシステムがある。このストレージシステムは、それぞれが1以上のボリュームを有する第1ストレージ装置と第2ストレージ装置と、第1ストレージ装置と第2ストレージ装置がアクセス可能な第3ストレージ装置とから構成される。このストレージシステムは、ホストから第1又は第2ストレージ装置内のボリュームに対して書き込まれたデータを、第2又は第1ストレージ装置のボリュームに複製するよう動作する。また、第1ストレージ装置と第2ストレージ装置は、定期的に第3ストレージ装置に対してヘルスチェック情報を書き込む。第1ストレージ装置は、ホストからライト要求を受信したが、ライトデータを第2ストレージ装置へ複製できなかった場合、第3ストレージ装置に書き込まれているヘルスチェック情報を読み出す。そして、第1ストレージ装置は、第2ストレージ装置のボリュームがI/O不可になっていることを確認した後、ホストからのライト要求に係る処理を再開する。
特開2019−82897号公報 特開2009−266120号公報 国際公開第2015/198449号
図7に示したスライス先行縮退が行われた後にサーバ#11が停止すると、サーバ#12が運用系となり、図8に示すように、サーバ#11のスライスは切り離される。そして、サーバ#12でアプリケーション21が動作することで業務が継続される。なお、サーバ#12のスライスは古い状態にあるので、サーバ#12のアプリケーション21が正しい動作を行えない場合がある。そこで、ここでは、アプリケーション21は、例えば、データが一部古くても中断するよりは一定時間継続することが重要であり、所定の時間経過後はデータが最新の状態であることを必要とする業務を行うこととする。
業務が継続され、新しいデータがサーバ#12のスライスに書き込まれると、図9に示すように、サーバ#11のスライスとサーバ#12のスライスのいずれが最新であるかが不明になる。例えば、一部のデータについてはサーバ#11のスライスが最新であり、別の一部のデータについてはサーバ#12のスライスが最新である。
この状態で、サーバ#11が復旧すると、サーバ#11とサーバ#12のスライス内のデータを等価なものとするため、サーバ#11のスライスへサーバ#12のスライスのデータのコピーが行われる。すると、サーバ#11の一部の最新データがサーバ12の古いデータで置き換えられ、図10に示すように、データロストが発生する。
本発明は、1つの側面では、スライス先行縮退を実行した運用系情報処理装置が停止後に復旧するときのデータロストを抑止することを目的とする。
1つの態様では、情報処理装置は、第1の情報処理装置との間でデータのミラーリングを行い、運用系の前記第1の情報処理装置の運用停止にともない待機系から運用系に切り替わり、運用系の第2の情報処理装置として動作し、判定部とコピー制御部とを有する。前記判定部は、運用系の前記第2の情報処理装置として動作した後であって前記第1の情報処理装置が運用系に復旧する際の復旧時コピー処理の対象データが、運用停止前における前記ミラーリングが完了済のデータであるか否かを判定する。前記コピー制御部は、前記判定部により前記対象データが前記ミラーリングが完了済のデータであると判定された場合に、該対象データの自装置から前記第1の情報処理装置へのコピーを行う。
1つの側面では、本発明は、データロストを抑止することができる。
図1は、実施例に係るクラスタシステムの構成を示す図である。 図2は、ディスク制御部の機能構成を示す図である。 図3Aは、故障情報記憶部の一例を示す図である。 図3Bは、クラス、ボリューム、スライスの関係を示す図である。 図4は、復旧時コピー処理のシーケンスを示す図である。 図5は、復旧時コピー処理のフローを示すフローチャートである。 図6は、実施例に係るディスク制御プログラムを実行するコンピュータのハードウェア構成を示す図である。 図7は、スライス先行縮退を説明するための図である。 図8は、スライス先行縮退後にサーバ#11が停止した状態を示す図である。 図9は、サーバ#12にデータの書き込みが行われた状態を示す図である。 図10は、データロストの発生を示す図である。
以下に、本願の開示する情報処理装置、情報処理システム及びプログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例は開示の技術を限定するものではない。
まず、実施例に係るクラスタシステムの構成について説明する。図1は、実施例に係るクラスタシステムの構成を示す図である。図1に示すように、実施例に係るクラスタシステム1は、サーバ#1とサーバ#2で表されるサーバ2を有する。サーバ#1とサーバ#2は、ネットワーク3で接続される。クラスタシステム1は、データレプリケーション構成のクラスタシステムである。なお、クラスタシステム1は、3台以上のサーバ2を用いてクラスタシステムを構築してもよい。
サーバ2ではアプリケーション21が動作する。アプリケーション21は、クラスタ制御部22を介してディスク装置23のスライスへのデータの書き込み及びディスク装置23のスライスからのデータの読み出しを行う。クラスタ制御部22は、クラスタシステム1に関する処理を行い、ディスク制御部30を有する。
ディスク制御部30は、ディスク装置23のスライスへのデータの書き込み及びディスク装置23のスライスからのデータの読み出しを制御する。サーバ#1のディスク制御部30は、自装置のスライスにデータを書き込む際に、サーバ#2のスライスにもデータを書き込む。すなわち、ディスク制御部30は、ミラーリングを行う。
次に、ディスク制御部30の機能構成について説明する。図2は、ディスク制御部30の機能構成を示す図である。図2に示すように、ディスク制御部30は、ドライバ31と、イニシエータ32と、デーモン33と、故障情報記憶部34aと、構成情報記憶部34bとを有する。
ドライバ31は、ディスク装置23からのデータの読み出し及びディスク装置23へのデータの書き込みを制御する。ドライバ31は、アプリケーション21からデータの書き込み要求を受け付けて、ローカルディスク及びリモートディスクへのデータの書き込みを制御する。イニシエータ32は、ドライバ31の指示に基づいて、リモートディスクへのデータの書き込みを行う。ドライバ31は、エラー通知部31aと、完了通知部31bと、コピー部31cを有する。
エラー通知部31aは、イニシエータ32からリモートディスクへのデータの書き込みでI/Oエラーの発生を通知されると、書き込み処理を保留し、デーモン33にI/Oエラーを通知する。
完了通知部31bは、I/Oエラーの発生を通知されたデーモン33から、故障ディスク情報の書き込み完了を通知されると、書き込み処理を再開して書き込み完了をアプリケーション21に通知する。
コピー部31cは、サーバ2の起動時に、他のサーバ2が正常に動作している場合、故障ディスク情報を用いてローカルディスクとリモートディスクの間で整合をとる処理を行う。
また、コピー部31cは、一方のサーバ2が停止から運用系に復旧し、他方のサーバ2が運用系から待機系に戻る場合に、他のサーバ2のコピー部31cと連携して、他のサーバ2のスライスと自装置のスライスの間で整合をとる復旧時コピー処理を行う。復旧時コピー処理では、運用系から待機系に戻るサーバ2はコピー元サーバ2として動作し、停止から運用系へ復旧するサーバ2はコピー先サーバ2として動作する。
運用系から待機系に戻るサーバ2のコピー部31cは、復旧時コピー処理として、自装置のディスク装置23が記憶するスライスのデータの書き込みを他のサーバ2に指示する。ただし、運用系から待機系に戻るサーバ2のコピー部31cは、他のサーバ2の故障ディスク情報に識別情報が含まれるスライスについては、停止前に運用系のサーバ2だけで書き込みが行われたため、コピーの対象とすることなく、警報を出力する。
運用系から待機系に戻るサーバ2のコピー部31cは、他のサーバ2に問い合わせることによって、スライスを識別する情報が他のサーバ2の故障ディスク情報に含まれるか否かを判定する。また、運用系から待機系に戻るサーバ2のコピー部31cは、警報に、例えば、ボリュームを識別する情報、2つのサーバ2のスライスのうちいずれのスライスが最新であるかの確認をユーザに促すメッセージを含める。
停止から運用系へ復旧するサーバ2のコピー部31cは、他のサーバ2のコピー部31cからの問い合わせに対して、スライスを識別する情報が故障ディスク情報に含まれるか否かをチェックし、スライスを識別する情報が記録されているか否かを応答する。また、停止から運用系へ復旧するサーバ2のコピー部31cは、他のサーバ2のコピー部31cからスライスのデータが送られてくると、対応するスライスにデータを書き込む。
コピー部31cは、判定部41と実行部42と応答部43とを有する。判定部41は、復旧時コピー処理において、自装置が運用系から待機系に戻るサーバ2である場合、他のサーバ2に問い合わせることによって、スライスを識別する情報が他のサーバ2の故障ディスク情報に含まれるか否かを判定する。
実行部42は、判定部41によりスライスを識別する情報が他のサーバ2の故障ディスク情報に含まれると判定された場合、警報を出力する。一方、判定部41によりスライスを識別する情報が他のサーバ2の故障ディスク情報に含まれないと判定された場合、実行部42は、スライスのデータを他のサーバ2に送信する。
応答部43は、自装置が停止から運用系に戻るサーバ2である場合、他のサーバ2からの問い合わせを受け取ると、故障情報記憶部34aを参照し、スライスを識別する情報が故障ディスク情報に含まれるか否かを判定する。そして、応答部43は、スライスを識別する情報が故障ディスク情報に含まれるか否かの判定結果を他のサーバ2に送信する。
なお、判定部41は、他のサーバ2から判定結果の代わりに故障ディスク情報を受け取ってもよい。また、判定部41は、他のサーバ2から全てのスライスについて判定結果又は故障ディスク情報を一度に取得してもよい。応答部43は、他のサーバ2からの問い合わせに対して、判定結果の代わりに故障ディスク情報を送信してもよい。また、応答部43は、全てのスライスについて判定結果又は故障ディスク情報を一度に送信してもよい。また、故障情報記憶部34aは、故障ディスク情報として、ミラーリングが完了済又は未完了のスライス更新処理情報も含めて記憶してもよい。
デーモン33は、イベントを受信すると、イベントに対応する処理を行う。イベントには、I/Oエラーの他、ボリューム起動要求、コピー完了通知等がある。
故障情報記憶部34aは、故障ディスク情報を記憶する。故障情報記憶部34aの情報は、他のサーバ2からのアクセスが可能である。図3Aは、故障情報記憶部34aの一例を示す図である。図3Aに示すように、故障情報記憶部34aは、故障ディスク情報として、I/Oエラーが発生したスライス毎に、クラスID、ボリュームID、SCSIIDを記憶する。
クラスIDは、クラスを識別する識別子であり、ボリュームIDは、ボリュームを識別する識別子であり、SCSIIDは、ミラーリングペアのいずれであるかを識別する識別子である。図3Bは、クラス、ボリューム、スライスの関係を示す図である。図3Bに示すように、ミラーリングペアのディスク装置23はクラスとして管理され、クラスには複数のボリュームが含まれる。ボリュームはミラーリングペアのスライスで構成される。したがって、クラスID、ボリュームID、SCSIIDによりスライスが特定される。
構成情報記憶部34bは、構成情報を記憶する。すなわち、構成情報記憶部34bは、クラスタシステム1の構成に関する情報を記憶する。構成情報記憶部34bは、スライス毎の状態を記憶する。
デーモン33は、故障情報書込部35と、切離部36と、起動制御部37と、故障情報削除部38とを有する。故障情報書込部35は、リモートディスクへのデータの書き込みが失敗した場合に、故障ディスク情報を故障情報記憶部34aに書き込む。そして、故障情報書込部35は、故障ディスク情報を故障情報記憶部34aに書き込んだことをドライバ31に通知する。なお、故障情報書込部35は、リモートディスクへのデータの書き込みが失敗した場合に、ミラーリングが未完了状態であることを示す情報を故障情報記憶部34aに書き込んでもよい。
切離部36は、リモートディスクへのデータの書き込みが失敗した場合に、リモートスライスの切離しを行う。具体的には、切離部36は、クラスタロックを取得し、構成情報の変更を行う。また、切離部36は、他のサーバ2が停止して自装置が待機系から運用系になった場合に、リモートスライスの切離しを行う。
起動制御部37は、ボリュームの起動時に、自サーバ2に記録された故障ディスク情報とリモートサーバ2に記録された故障ディスク情報を取得し、取得した故障情報に基づいて、構成情報を更新する。
故障情報削除部38は、ミラーリングペアのスライスの間でコピー処理により整合がとられると、整合がとれたスライスについて故障ディスク情報から情報を削除し、構成情報の当該スライスの状態を正常に変更する。
次に、復旧時コピー処理のフローについて図4及び図5を用いて説明する。図4及び図5において、サーバ#1は、復旧により停止状態から運用系に戻るサーバ2であり、サーバ#2は、運用系から待機系に戻るサーバ2である。また、ディスク制御部#1はサーバ#1のディスク制御部30であり、ディスク制御部#2はサーバ#2のディスク制御部30であり、ディスク装置#1はサーバ#1のディスク装置23であり、ディスク装置#2はサーバ#2のディスク装置23である。ディスク制御部#2は、ディスク装置#2に記憶する全スライスを対象に図4及び図5に示す処理を繰り返す。
図4は、復旧時コピー処理のシーケンスを示す図である。図4に示すように、ディスク制御部#2は、ディスク制御部#1に問い合わせることによって、対象スライスのデータコピーを行ってよいか確認する(t1)。ディスク制御部#2からの問い合わせを対象スライスを識別する情報とともに受信すると、ディスク制御部#1は、故障情報記憶部34aをチェックし(t2)、対象スライスを識別する情報が故障情報記憶部34aに記録されているか否かを判定する。そして、ディスク制御部#1は、判定結果として記録あり(コピー不可)又は記録なし(コピー可)をディスク制御部#2に応答する(t3)。
ディスク制御部#2は、応答が記録あり(コピー不可)か記録なし(コピー可)かを判定し(t4)、記録なしの場合には、ディスク装置#2から対象スライスのデータをリードし(t5)、ディスク装置#2からデータを受け取る(t6)。そして、ディスク制御部#2は、データをディスク制御部#1に送信してデータのライトを指示する(t7)。データを受け取ったディスク制御部#1は、対象スライスにデータをライトし(t8)、ディスク装置#1から応答を受け取る(t9)。そして、ディスク制御部#1は、ライト完了をディスク制御部#2に応答する(t10)。
そして、ディスク制御部#2は、対象スライスのレプリケーション組み込みを指示する(t11)。すると、ディスク制御部#1は、対象スライスをレプリケーションに組み込み(t12)、組み込みの完了をディスク制御部#2に応答する(t13)。そして、ディスク制御部#2は、次のスライスの処理へ移る。
また、t4においてディスク制御部#1からの応答が記録ありの場合には、ディスク制御部#2は、警報を出力し(t14)、データをディスク制御部#1に送信することなく、次のスライスの処理へ移る。
サーバ#2は、全てのスライスについて復旧時コピー処理を完了すると待機系の状態に移る。サーバ#1は、全てのスライスについて復旧時コピー処理を完了すると運用系の状態に移る。
図5は、復旧時コピー処理のフローを示すフローチャートである。図5に示すように、ディスク制御部#2は、サーバ#1に問い合わせることによって、サーバ#1に対象スライスを識別する情報が記録されているか否かを判定する(ステップS1)。そして、対象スライスを識別する情報が記録されていない場合には、ディスク制御部#2は、サーバ#1に対象スライスのデータを送信してコピーを指示する(ステップS2)。そして、ディスク制御部#2は、対象スライスのレプリケーション組み込みを指示し(ステップS3)、次のスライスの処理へ移る。
一方、サーバ#1に対象スライスを識別する情報が記録されている場合には、ディスク制御部#2は、警報を出力し(ステップS4)、次のスライスの処理へ移る。
上述してきたように、実施例では、運用系のサーバ#1がスライス先行縮退を行った後に停止し、待機系のサーバ#2が運用系に変更されサーバ#1が復旧した際に、サーバ#2とサーバ#1ののディスク制御部30が連携して復旧時コピー処理を行う。復旧時コピー処理では、サーバ#2の判定部41が、停止前にミラーリングが未完了で、サーバ#2において当該データ更新が未反映であるスライスであるか否かを判定する。そして、停止前にミラーリングが未完了であるスライスでないと判定部41により判定されると、サーバ#2の実行部42が、スライスのデータをサーバ#1にコピーする。したがって、サーバ#2のディスク制御部30は、サーバ#1に最新データがある場合に、最新データがサーバ#2の古いデータに置き換えられることを防ぎ、データロストを抑止することができる。
また、実施例では、サーバ#2の判定部41は、サーバ#1に問い合わせることで、停止前にミラーリングが未完了のスライスであるか否かを判定するので、クラスタシステム1は、復旧時コピー処理に他の装置を不要とすることができる。
また、実施例では、サーバ#1のコピー部31cは、サーバ#2の判定部41からの問い合わせに対してスライスを識別する情報が故障ディスク情報に記録されているか否かを応答する。したがって、サーバ#2の判定部41は、スライスが停止前にサーバ#1だけでデータ更新がなされ、サーバ#2において当該データ更新が未反映であるか否かを判定することができる。これにより、ミラーリングが完了済か未完了であるかを判定することができる。したがって、管理サーバなどの第3のサーバを使用しないシステムであっても、サーバ#1のデータ更新情報(ディスク故障情報)をサーバ#1自体で管理させる新たな仕組みにより、復旧時コピー処理のコピー元のサーバ#2が主体となってコピーの可否の判断をすることができる。
なお、実施例では、ディスク制御部30について説明したが、ディスク制御部30が有する構成をソフトウェアによって実現することで、同様の機能を有するディスク制御プログラムを得ることができる。そこで、ディスク制御プログラムを実行するコンピュータについて説明する。
図6は、実施例に係るディスク制御プログラムを実行するコンピュータのハードウェア構成を示す図である。図6に示すように、コンピュータ50は、メインメモリ51と、CPU(Central Processing Unit)52と、LAN(Local Area Network)インタフェース53と、HDD(Hard Disk Drive)54とを有する。また、コンピュータ50は、スーパーIO(Input Output)55と、DVI(Digital Visual Interface)56と、ODD(Optical Disk Drive)57とを有する。
メインメモリ51は、プログラムやプログラムの実行途中結果等を記憶するメモリである。CPU52は、メインメモリ51からプログラムを読み出して実行する中央処理装置である。CPU52は、メモリコントローラを有するチップセットを含む。
LANインタフェース53は、コンピュータ50をLAN経由で他のコンピュータに接続するためのインタフェースである。HDD54は、プログラムやデータを格納するディスク装置であり、スーパーIO55は、マウスやキーボード等の入力装置を接続するためのインタフェースである。DVI56は、液晶表示装置を接続するインタフェースであり、ODD57は、DVDの読み書きを行う装置である。
LANインタフェース53は、PCIエクスプレス(PCIe)によりCPU52に接続され、HDD54及びODD57は、SATA(Serial Advanced Technology Attachment)によりCPU52に接続される。スーパーIO55は、LPC(Low Pin Count)によりCPU52に接続される。
そして、コンピュータ50において実行されるディスク制御プログラムは、コンピュータ50により読み出し可能な記録媒体の一例であるCD−Rに記憶され、ODD57によってCD−Rから読み出されてコンピュータ50にインストールされる。あるいは、ディスク制御プログラムは、LANインタフェース53を介して接続された他のコンピュータシステムのデータベース等に記憶され、これらのデータベースから読み出されてコンピュータ50にインストールされる。そして、インストールされたディスク制御プログラムは、HDD54に記憶され、メインメモリ51に読み出されてCPU52によって実行される。
また、実施例では、故障ディスク情報を運用系のサーバ2が記憶する場合について説明したが、復旧したサーバ2にスライスのデータの復旧時コピー処理を行うコピー元のサーバ2が主体となってアクセス可能な場所であれば、運用系のサーバ2以外の装置が故障ディスク情報を記憶してもよい。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)第1の情報処理装置との間でデータのミラーリングを行い、運用系の前記第1の情報処理装置の運用停止にともない待機系から運用系に切り替わり、運用系の第2の情報処理装置として動作する情報処理装置において、
運用系の前記第2の情報処理装置として動作した後であって前記第1の情報処理装置が運用系に復旧する際の復旧時コピー処理の対象データが、運用停止前における前記ミラーリングが完了済のデータであるか否かを判定する判定部と、
前記判定部により前記対象データが前記ミラーリングが完了済のデータであると判定された場合に、該対象データの自装置から前記第1の情報処理装置へのコピーを行うコピー制御部と
を有することを特徴とする情報処理装置。
(付記2)前記判定部は、前記第1の情報処理装置に問い合わせを行うことで前記対象データが運用停止前における前記ミラーリングが完了済のデータであるか否かを判定することを特徴とする付記1に記載の情報処理装置。
(付記3)前記判定部は、前記第1の情報処理装置のデータ更新処理情報を含む応答を前記問い合わせに対して前記第1の情報処理装置から受け取り、受け取った該応答に基づいて前記対象データが、運用停止前の前記第1の情報処理装置のデータ更新が前記第2の情報処理装置において反映済であるミラーリングが完了済のデータであるか、もしくは未反映であるミラーリングが未完了のデータであるかを判定することを特徴とする付記2に記載の情報処理装置。
(付記4)前記データはスライスであり、
前記ミラーリングが未完了の対象データには、スライス先行縮退により前記第1の情報処理装置からアプリケーションに書き込み終了応答が行われたデータが含まれることを特徴とする付記3に記載の情報処理装置。
(付記5)データのミラーリングを行う第1の情報処理装置と第2の情報処理装置を有し、前記第1の情報処理装置は運用系として動作し、前記第2の情報処理装置は第1の情報処理装置の運用停止にともない待機系から運用系に切り替わる情報処理装置システムにおいて、
前記第2の情報処理装置は、
運用系として動作した後であって前記第1の情報処理装置が運用系に復旧する際の復旧時コピー処理の対象データが、運用停止前における前記ミラーリングが完了済のデータであるかの問い合わせを行う問合部と、
前記問合部により前記問い合わせに対して前記対象データが前記ミラーリングが完了済のデータであるとの回答があると、該対象データの自装置から前記第1の情報処理装置へのコピーを行うコピー制御部と
を有し、
前記第1の情報処理装置は、
前記問い合わせを受け取ると、前記対象データが前記ミラーリングが完了済のデータであるか否かを判定し、判定結果を回答する応答部
を有することを特徴とする情報処理システム。
(付記6)第1の情報処理装置との間でデータのミラーリングを行い、運用系の前記第1の情報処理装置の運用停止にともない待機系から運用系に切り替わり、運用系の第2の情報処理装置として動作する情報処理装置で実行されるプログラムにおいて、
運用系の前記第2の情報処理装置として動作した後であって前記第1の情報処理装置が運用系に復旧する際の復旧時コピー処理の対象データが、運用停止前における前記ミラーリングが完了済のデータであるか否かを判定し、
前記対象データが前記ミラーリングが完了済のデータであると判定した場合に、該対象データの自装置から前記第1の情報処理装置へのコピーを行う
処理を前記第2の情報処理装置として動作する情報処理装置に実行させることを特徴とするプログラム。
(付記7)
前記判定する処理は、前記第1の情報処理装置に問い合わせを行うことで前記対象データが運用停止前における前記ミラーリングが完了済のデータであるか否かを判定することを特徴とする付記6に記載のプログラム。
1,9 クラスタシステム
2,91 サーバ
3 ネットワーク
21 アプリケーション
22,92 クラスタ制御部
23 ディスク装置
30,90 ディスク制御部
31 ドライバ
31a エラー通知部
31b 完了通知部
31c コピー部
32 イニシエータ
33 デーモン
34a 故障情報記憶部
34b 構成情報記憶部
35 故障情報書込部
36 切離部
37 起動制御部
38 故障情報削除部
41 判定部
42 実行部
50 コンピュータ
51 メインメモリ
52 CPU
53 LANインタフェース
54 HDD
55 スーパーIO
56 DVI
57 ODD

Claims (6)

  1. 第1の情報処理装置との間でデータのミラーリングを行い、運用系の前記第1の情報処理装置の運用停止にともない待機系から運用系に切り替わり、運用系の第2の情報処理装置として動作する情報処理装置において、
    運用系の前記第2の情報処理装置として動作した後であって前記第1の情報処理装置が運用系に復旧する際の復旧時コピー処理の対象データが、運用停止前における前記ミラーリングが完了済のデータであるか否かを判定する判定部と、
    前記判定部により前記対象データが前記ミラーリングが完了済のデータであると判定された場合に、該対象データの自装置から前記第1の情報処理装置へのコピーを行うコピー制御部と
    を有することを特徴とする情報処理装置。
  2. 前記判定部は、前記第1の情報処理装置に問い合わせを行うことで前記対象データが運用停止前における前記ミラーリングが完了済のデータであるか否かを判定することを特徴とする請求項1に記載の情報処理装置。
  3. 前記判定部は、前記第1の情報処理装置のデータ更新処理情報を含む応答を前記問い合わせに対して前記第1の情報処理装置から受け取り、受け取った該応答に基づいて前記対象データが、運用停止前の前記第1の情報処理装置のデータ更新が前記第2の情報処理装置において反映済であるミラーリングが完了済のデータであるか、もしくは未反映であるミラーリングが未完了のデータであるかを判定することを特徴とする請求項2に記載の情報処理装置。
  4. 前記データはスライスであり、
    前記ミラーリングが未完了の対象データには、スライス先行縮退により前記第1の情報処理装置からアプリケーションに書き込み終了応答が行われたデータが含まれることを特徴とする請求項3に記載の情報処理装置。
  5. データのミラーリングを行う第1の情報処理装置と第2の情報処理装置を有し、前記第1の情報処理装置は運用系として動作し、前記第2の情報処理装置は第1の情報処理装置の運用停止にともない待機系から運用系に切り替わる情報処理装置システムにおいて、
    前記第2の情報処理装置は、
    運用系として動作した後であって前記第1の情報処理装置が運用系に復旧する際の復旧時コピー処理の対象データが、運用停止前における前記ミラーリングが完了済のデータであるかの問い合わせを行う問合部と、
    前記問合部により前記問い合わせに対して前記対象データが前記ミラーリングが完了済のデータであるとの回答があると、該対象データの自装置から前記第1の情報処理装置へのコピーを行うコピー制御部と
    を有し、
    前記第1の情報処理装置は、
    前記問い合わせを受け取ると、前記対象データが前記ミラーリングが完了済のデータであるか否かを判定し、判定結果を回答する応答部
    を有することを特徴とする情報処理システム。
  6. 第1の情報処理装置との間でデータのミラーリングを行い、運用系の前記第1の情報処理装置の運用停止にともない待機系から運用系に切り替わり、運用系の第2の情報処理装置として動作する情報処理装置で実行されるプログラムにおいて、
    運用系の前記第2の情報処理装置として動作した後であって前記第1の情報処理装置が運用系に復旧する際の復旧時コピー処理の対象データが、運用停止前における前記ミラーリングが完了済のデータであるか否かを判定し、
    前記対象データが前記ミラーリングが完了済のデータであると判定した場合に、該対象データの自装置から前記第1の情報処理装置へのコピーを行う
    処理を前記第2の情報処理装置として動作する情報処理装置に実行させることを特徴とするプログラム。
JP2019213846A 2019-11-27 2019-11-27 情報処理装置、情報処理システム及びプログラム Active JP7363413B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019213846A JP7363413B2 (ja) 2019-11-27 2019-11-27 情報処理装置、情報処理システム及びプログラム
US17/070,970 US11487459B2 (en) 2019-11-27 2020-10-15 Information processing apparatus, information processing system, and recording medium storing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019213846A JP7363413B2 (ja) 2019-11-27 2019-11-27 情報処理装置、情報処理システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2021086331A true JP2021086331A (ja) 2021-06-03
JP7363413B2 JP7363413B2 (ja) 2023-10-18

Family

ID=75974135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019213846A Active JP7363413B2 (ja) 2019-11-27 2019-11-27 情報処理装置、情報処理システム及びプログラム

Country Status (2)

Country Link
US (1) US11487459B2 (ja)
JP (1) JP7363413B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249652A (ja) * 2006-03-16 2007-09-27 Nec Corp データミラー型クラスタシステム及びその運用方法
JP2019082897A (ja) * 2017-10-31 2019-05-30 富士通株式会社 情報処理装置、情報処理システム及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7302536B2 (en) * 2003-06-17 2007-11-27 Hitachi, Ltd. Method and apparatus for managing replication volumes
US7809691B1 (en) * 2005-02-22 2010-10-05 Symantec Operating Corporation System and method of applying incremental changes prior to initialization of a point-in-time copy
US20070008890A1 (en) * 2005-07-11 2007-01-11 Tseitlin Eugene R Method and apparatus for non-stop multi-node system synchronization
JP5222617B2 (ja) 2008-04-28 2013-06-26 株式会社日立製作所 情報システム及びi/o処理方法
US10025655B2 (en) 2014-06-26 2018-07-17 Hitachi, Ltd. Storage system
CN111930558B (zh) * 2019-05-13 2023-03-03 华为技术有限公司 数据库系统的故障修复方法、数据库系统和计算设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249652A (ja) * 2006-03-16 2007-09-27 Nec Corp データミラー型クラスタシステム及びその運用方法
JP2019082897A (ja) * 2017-10-31 2019-05-30 富士通株式会社 情報処理装置、情報処理システム及びプログラム

Also Published As

Publication number Publication date
US11487459B2 (en) 2022-11-01
JP7363413B2 (ja) 2023-10-18
US20210157482A1 (en) 2021-05-27

Similar Documents

Publication Publication Date Title
JP4800046B2 (ja) ストレージシステム
JP4477950B2 (ja) リモートコピーシステム及び記憶装置システム
JP2005196683A (ja) 情報処理システム、情報処理装置、及び情報処理システムの制御方法
US7725776B2 (en) Method for displaying pair state of copy pairs
US6510500B2 (en) System and method for minimizing message transactions for fault-tolerant snapshots in a dual-controller environment
US9268659B2 (en) Detecting failover in a database mirroring environment
US7216210B2 (en) Data I/O system using a plurality of mirror volumes
US20100138687A1 (en) Recording medium storing failure isolation processing program, failure node isolation method, and storage system
JP5534024B2 (ja) ストレージ制御装置およびストレージ制御方法
JP5286212B2 (ja) ストレージクラスタ環境でのリモートコピー制御方法及びシステム
JP2007086972A (ja) ストレージシステム、二重化制御方法、及びプログラム
JP2004252686A (ja) 情報処理システム
JPH07239799A (ja) 遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム
JP2012507788A (ja) ストレージ・エリア・ネットワークを使用してコンピュータシステムを復旧するための方法およびシステム
JP2018073231A (ja) ストレージシステムおよびストレージ装置
JP2008287405A (ja) パス管理方法、ホスト計算機及びパス管理プログラム
JP6230707B2 (ja) ストレージシステム
US20090177916A1 (en) Storage system, controller of storage system, control method of storage system
JP2006185108A (ja) ストレージシステムのデータを管理する管理計算機及びデータ管理方法
US11126514B2 (en) Information processing apparatus, information processing system, and recording medium recording program
JP6569476B2 (ja) ストレージ装置、ストレージシステムおよびストレージ制御プログラム
US8131958B2 (en) Storage system, storage device, and data updating method using a journal volume
CN111158955B (zh) 一种基于卷复制的高可用系统以及多服务器数据同步方法
JP7363413B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP4898609B2 (ja) ストレージ装置、データ回復方法及び計算機システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220809

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230918

R150 Certificate of patent or registration of utility model

Ref document number: 7363413

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150