JP2008084264A - ネットワークストレージコンピュータシステム、ネットワークストレージ管理方法、管理サーバ、およびそのためのプログラム - Google Patents
ネットワークストレージコンピュータシステム、ネットワークストレージ管理方法、管理サーバ、およびそのためのプログラム Download PDFInfo
- Publication number
- JP2008084264A JP2008084264A JP2006266478A JP2006266478A JP2008084264A JP 2008084264 A JP2008084264 A JP 2008084264A JP 2006266478 A JP2006266478 A JP 2006266478A JP 2006266478 A JP2006266478 A JP 2006266478A JP 2008084264 A JP2008084264 A JP 2008084264A
- Authority
- JP
- Japan
- Prior art keywords
- storage
- computer
- logical unit
- synchronization
- copy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】確実にコンピュータのシステムが起動するスナップショットデータを作成し、迅速にコンピュータを復旧することができるネットワークストレージコンピュータシステムを提供する。
【解決手段】コンピュータ31のオペレーティングシステムのキャッシュ、キャッシュ装置32、ストレージ12、22と連動することにより、データの一貫性が保たれたスナップショットデータをデータセンタサイト(サイト10)のストレージ12とバックアップセンタサイト(サイト20)のストレージ22に作成し、オフィスサイト(サイト30)の障害時にはデータセンタサイト(サイト10)のスナップショットデータから代替オフィスサイトのコンピュータを起動し、データセンタサイト(サイト10)の障害時にはバックアップセンタサイト(サイト20)のスナップショットデータからオフィスサイト(サイト30)のコンピュータを再起動し、業務を再開できるようにする。
【選択図】図3
【解決手段】コンピュータ31のオペレーティングシステムのキャッシュ、キャッシュ装置32、ストレージ12、22と連動することにより、データの一貫性が保たれたスナップショットデータをデータセンタサイト(サイト10)のストレージ12とバックアップセンタサイト(サイト20)のストレージ22に作成し、オフィスサイト(サイト30)の障害時にはデータセンタサイト(サイト10)のスナップショットデータから代替オフィスサイトのコンピュータを起動し、データセンタサイト(サイト10)の障害時にはバックアップセンタサイト(サイト20)のスナップショットデータからオフィスサイト(サイト30)のコンピュータを再起動し、業務を再開できるようにする。
【選択図】図3
Description
本発明は、コンピュータとストレージがネットワークを介して接続されたネットワークストレージコンピュータシステム、ネットワークストレージ管理方法、管理サーバ、およびそのためのプログラムに関するものである。
近年、ビジネスの遂行に、IT利用が不可欠になってきており、多くの企業では、災害時におけるビジネスの継続性の重要性を認識するようになってきている。このビジネスの継続性において、RTO(目標復旧時間)とRPO(目標復旧時点)は重要な指標であり、その更なる短縮が切望されている。ITシステムにおいて、このRTOとRPOの短縮のため、昨今、ネットワークストレージコンピュータシステムが、注目されている。ネットワークストレージコンピュータシステムは、コンピュータが、IPネットワークを介して、起動に必要なオペレーティングシステム自体のデータやアプリケーション自体のデータ、ユーザがオペレーティングシステム若しくはアプリケーションを使って作成したファイルのデータを格納したストレージにiSCSIプロトコルで接続し起動するシステムである。企業のオフィス(オフィスサイト)にコンピュータを設置し、オフィスサイトのコンピュータが用いるコンピュータのオペレーティングシステム自体のデータやアプリケーション自体のデータ、ユーザがオペレーティングシステム若しくはアプリケーションを使って作成したファイルのデータをデータセンタサイトのストレージの論理ユニットに格納することで、データセンタサイトでデータのバックアップやセキュリティを、集中/一括管理することができる(非特許文献1)。
ネットワークストレージコンピュータシステムの場合、ネットワーク上をオペレーティングシステム自体のデータやアプリケーション自体のデータが転送されるため、ネットワークによる遅延やネットワークの障害がコンピュータの処理性能に大きく影響する。そのため、コンピュータとストレージ間でデータを中継するキャッシュ装置をオフィスサイトに設置し、システムの性能向上をはかるネットワークストレージコンピュータシステムが登場した(特許文献1)。
キャッシュ装置には、ストレージからコンピュータヘ送信されるReadデータをキャッシュするものと、コンピュータからストレージへ送信されるWriteデータをキャッシュするものがある。前記特許文献1はReadデータをキャッシュする技術であり、オペレーティングシステム起動に読込まれるReadデータをキャッシュ装置にキャッシュすることで、コンピュータのオペレーティングシステム起動の性能を向上させる。Writeデータをキャッシュする技術には、キャッシュ装置とストレージとの間のネットワークやストレージの負荷、接続性を管理し、キャッシュ装置でコンピュータからのWriteデータをキャッシュし、ストレージに送信する処理において、ネットワークやストレージの負荷が高い場合、送信を抑止し、接続不可の場合には接続可能になるまで送信を停止する技術がある(特許文献2)。通常、ネットワークストレージコンピュータシステムの場合、コンピュータからのWrite処理中にネットワークやストレージが障害等で接続不可になるとコンピュータからのWrite処理を終了させることができない。しかし、本技術を用いることで、コンピュータからのWrite処理中にネットワークやストレージが障害等で接続不可になった場合にも、コンピュータからのWrite処理を終了させることができる。
ネットワークストレージコンピュータシステムは、IPネットワークを用いるため、例えばFCネットワークを用いたシステムの様に新たにインフラを整備する必要がなく、既存のネットワークインフラを活用できる。さらに、ネットワークストレージコンピュータシステムは上記のキャッシュ装置により、性能を保ちながら、オフィスサイトやコンピュータの設置場所に関わらず、どこからでもコンピュータを起動することができる。そのため、例えば、図1の様にデータセンタサイトのストレージにオフィスサイトのコンピュータが起動するためのオペレーティングシステムやアプリケーション及びユーザデータが格納されたネットワークストレージコンピュータシステムの場合、オフィスサイトが災害で使用できない場合にも、代替オフィスサイトのコンピュータを用い、データセンタサイトのストレージに接続することで、オフィスサイトのコンピュータとまったく同じ環境で、同じデータを扱うコンピュータを瞬時に構築でき、業務を継続することができる。また、図2の様に、データセンタサイトのストレージ内データのスナップショットデータをバックアップセンタサイトのストレージもストレージの遠隔コピー機能等で保有することで、データセンタサイトが災害の場合にも、オフィスサイトまたは代替オフィスサイトからコンピュータをバックアップセンタサイトのストレージに接続することでコンピュータを起動することができ、業務を継続することができる。
したがって、災害以前に、ストレージのスナップショットデータを作成することで、サイト全体が障害にあってもネットワークストレージコンピュータシステムは、迅速にコンピュータを復旧することができる。このスナップショットデータの作成は、管理サーバやバックアップサーバで、予め、定期的にスナップショットデータを作成する時間を設定し、設定された時間に到達した場合に、管理サーバやバックアップサーバが、自動的にスナップショットデータの作成処理を行うことが一般的である(非特許文献2)。
しかしながら、ネットワークストレージコンピュータシステムの場合、ストレージが有する論理ユニットには、コンピュータが起動するために必要なオペレーティングシステム自体のデータやアプリケーション自体のデータが保存されているため、スナップショットデータのデータの一貫性が壊れた場合、最悪、該当するスナップショットデータを用いてコンピュータが起動できない。災害復旧時のスナップショットデータにデータの一貫性を要求するものとして、従来、データベース管理システム(DBMS)が扱うデータがあり、DBMS自身が、整合性を保証するための情報(例えば、ジャーナルデータ)も管理して、災害時の回復を実現している。一方、オペレーティングシステムそのものを保存するストレージのスナップショットデータを作成する場合、一般的に、オペレーティングシステム並びにアプリケーションは、DBMSと同様の整合性を保証する情報の管理機能を備えていないため、従来と同じ方法で、スナップショットデータを作成しても、災害回復できない危険性がある。
本発明の目的は、データセンタサイトの正ストレージと遠隔のバックアップセンタサイトの副ストレージに一貫性が保たれたスナップショットデータ、すなわち、確実にコンピュータのシステムが起動するスナップショットデータを作成し、迅速にコンピュータを復旧することができるネットワークストレージコンピュータシステムを提供することである。
本明細書において開示される発明のうち、代表的なものの概要を簡単に説明すれば、以下のとおりである。
第1の発明のネットワークストレージコンピュータシステムでは、コンピュータからのWriteデータが、コンピュータのオペレーティングシステムのキャッシュ、およびストレージが有する論理ユニットに分散されている条件下で、コンピュータが使用終了し、コンピュータのオペレーティングシステムのキャッシュ内のWriteデータが排出する時に、管理サーバがストレージと連携して同期処理を行うことにより、データの一貫性が保たれたスナップショットデータをデータセンタサイトとバックアップセンタサイトのストレージに作成し、コンピュータが設置されるオフィスサイトの障害時には、データセンタサイトのスナップショットデータから代替オフィスサイトのコンピュータを起動し、データセンタサイトの障害時には、バックアップセンタサイトのスナップショットデータからオフィスサイトのコンピュータを再起動し、業務を再開できるようにする。
すなわち、第1の発明では、管理サーバ、コンピュータ、およびストレージを有するネットワークストレージコンピュータシステム、または管理サーバ、コンピュータ、Readデータをキャッシュするキャッシュ装置、およびストレージを有するネットワークストレージコンピュータシステムにおいて、管理サーバは、前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断を行う同期点管理手段と、前記第一のストレージと第二のストレージの論理ユニットの複製を作成するストレージ制御手段と、同期開始時刻、同期終了時刻、同期結果、同期の結果作成された前記第一のストレージの論理ユニットの複製と前記第二のストレージの論理ユニットの複製を管理する同期管理手段と、コンピュータ障害後のネットワークストレージコンピュータシステム復旧時に第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製を前記コンピュータが接続するシステム起動領域として登録する回復手段と、を備える。
同期管理手段により、データ同期点に達したと判断した論理ユニットに関し、ストレージ制御部が第一のストレージの論理ユニットの複製を作成する。次に、第一のストレージの複製を第二のストレージの論理ユニットに作成する。第一のストレージの論理ユニットの複製を第二のストレージの論理ユニットに作成する方法は、ストレージに備わっている、遠隔同期機能を利用し、第一のストレージの論理ユニットの複製を第二のストレージの論理ユニットに遠隔同期を行い、ストレージ制御手段により、この第二のストレージの論理ユニットの複製を作成しても良いし、キャッシュ装置の転送手段が、Writeデータの複製イメージを第一のストレージの論理ユニットに転送する時に第二のストレージの論理ユニットにも転送し、ストレージ制御手段により、この第一のストレージの論理ユニットの複製と第二のストレージの論理ユニットの複製を作成しても良い。
以上の第1の発明では、コンピュータの使用終了をした場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと管理サーバの同期点管理手段が第1の判断を行い、管理サーバの同期点管理手段、ストレージ制御手段が連動してスナップショットデータを作成するための同期処理を行うことにより、コンピュータのオペレーティングシステムのキャッシュ、ストレージが有する論理ユニットに分散されたWriteデータから、第一のストレージと第二のストレージに一貫性が保たれたスナップショットデータを作成することができる。さらに、管理サーバの同期管理手段によりスナップショットデータである、第一のストレージの論理ユニットの複製または第二のストレージの論理ユニットの複製を管理する。サイト全体が障害の時、管理サーバの回復手段により、コンピュータが接続するシステム起動領域として、データセンタサイトが正常で、オフィスサイトが障害の場合には、第一のストレージの論理ユニットの最新の複製を登録し、データセンタサイトが障害の場合には、第二のストレージの論理ユニットの最新の複製を登録することで、オフィスサイトやデータセンタサイトが障害時にも、代替オフィスサイトやバックアップセンタサイトより迅速にコンピュータを復旧することができる。
また、第2の発明のネットワークストレージコンピュータシステムでは、コンピュータからのWriteデータが、コンピュータのオペレーティングシステムのキャッシュ、キャッシュ装置、およびストレージが有する論理ユニットに分散されている条件下で、コンピュータが使用終了し、コンピュータのオペレーティングシステムのキャッシュ内のWriteデータが排出する時に、管理サーバがキャッシュ装置およびストレージと連携して同期処理を行うことにより、データの一貫性が保たれたスナップショットデータをデータセンタサイトとバックアップセンタサイトのストレージに作成し、コンピュータが設置されるオフィスサイトの障害時には、データセンタサイトのスナップショットデータから代替オフィスサイトのコンピュータを起動し、データセンタサイトの障害時には、バックアップセンタサイトのスナップショットデータからオフィスサイトのコンピュータを再起動し、業務を再開できるようにする。
すなわち、第2の発明では、管理サーバ、コンピュータ、Writeデータをキャッシュするキャッシュ装置、ストレージからなるネットワークストレージコンピュータシステムにおいて、管理サーバは、前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断を行う同期点管理手段と、前記キャッシュ装置に、データ同期点に達した前記論理ユニットに関するキャッシュ装置の有する記憶領域内のWriteデータの複製イメージ作成命令を通知し、前記キャッシュ装置から受信した複製イメージ作成終了通知により、前記キャッシュ装置に、作成されたWriteデータの複製イメージを前記第一のストレージの論理ユニットまたは第二のストレージの論理ユニットまたは第一のストレージと第二のストレージの論理ユニットに転送命令を通知するキャッシュ制御手段と、前記第一のストレージと第二のストレージの論理ユニットの複製を作成するストレージ制御手段と、同期開始時刻、同期終了時刻、同期結果、同期の結果作成された前記第一のストレージの論理ユニットの複製と前記第二のストレージの論理ユニットの複製を管理する同期管理手段と、コンピュータ障害後のネットワークストレージコンピュータシステム復旧時に第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製を前記コンピュータが接続するシステム起動領域として登録する回復手段と、を設け、キャッシュ装置は、前記管理サーバの複製イメージ作成命令に基づき、論理ユニットヘのWriteデータの複製イメージを、前記キャッシュ装置の有する記憶領域に作成し、作成終了を前記管理サーバに通知する複製イメージ作成手段と、前記管理サーバの転送命令に基づき、Writeデータの複製イメージを第一のストレージの論理ユニットまたは第二のストレージの論理ユニットまたは第一のストレージと第二のストレージの論理ユニットに転送する転送手段と、を設ける。
同期管理手段により、データ同期点に達したと判断した論理ユニットに関し、キャッシュ制御手段からのWriteデータの複製イメージ作成命令によりキャッシュ装置の複製イメージ作成手段が、記憶領域内でWriteデータの複製イメージを作成する。ここで言う複製イメージとは、Writeデータの全くの複製、若しくは、Copy on Writeなどによる仮想的な複製イメージでもよく、複製イメージ作成命令の通知以降に、受け付けたWriteデータにより、その内容が更新されないものであれば良い。つまり、キャッシュ装置の複製イメージ作成手段がWriteデータの複製イメージを作成する理由は、データの一貫性が保たれたスナップショットデータを作成するため、データ同期点までのWriteデータを確定するまで、使用終了を行ったユーザが再度、コンピュータを起動することを禁止する必要があるが、一般にキャッシュ装置でWriteデータの複製イメージを作成する時間は、ネットワークを介して第一のストレージの論理ユニットヘのデータ転送にかかる時間より遥かに少なく、キャッシュ装置内でWriteデータの複製イメージを作成し、データ同期点までのWriteデータを確定してから第一のストレージに転送しスナップショットデータを作成した方が、キャッシュ装置でWriteデータを確定せず、第一のストレージでWriteデータを反映し、スナップショットデータを作成するよりも、コンピュータの起動禁止時間を短くすることができるからである。
複製イメージ作成後、キャッシュ制御手段からの転送命令により、キャッシュ装置の転送手段がWriteデータの複製イメージを前記第一のストレージの論理ユニットに転送し、ストレージ制御部が第一のストレージの論理ユニットの複製を作成する。次に、第一のストレージの複製を第二のストレージの論理ユニットに作成する。第一のストレージの論理ユニットの複製を第二のストレージの論理ユニットに作成する方法は、ストレージに備わっている、遠隔同期機能を利用し、第一のストレージの論理ユニットの複製を第二のストレージの論理ユニットに遠隔同期を行い、ストレージ制御手段により、この第二のストレージの論理ユニットの複製を作成しても良いし、キャッシュ装置の転送手段が、Writeデータの複製を第一のストレージの論理ユニットに転送する時に第二のストレージの論理ユニットにも転送し、ストレージ制御手段により、この第一のストレージの論理ユニットの複製と第二のストレージの論理ユニットの複製を作成しても良い。
以上の第2の発明では、コンピュータの使用終了をした場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと管理サーバの同期点管理手段が第1の判断を行い、管理サーバの同期点管理手段、キャッシュ制御手段、ストレージ制御手段と、キャッシュ装置の複製作成手段、転送手段が連動してスナップショットデータを作成するための同期処理を行うことにより、コンピュータのオペレーティングシステムのキャッシュ、キャッシュ装置、ストレージが有する論理ユニットに分散されたWriteデータから、第一のストレージと第二のストレージに一貫性が保たれたスナップショットデータを作成することができる。さらに、管理サーバの同期管理手段によりスナップショットデータである、第一のストレージの論理ユニットの複製または第二のストレージの論理ユニットの複製を管理する。サイト全体が障害の時、管理サーバの回復手段により、コンピュータが接続するシステム起動領域として、データセンタサイトが正常で、オフィスサイトが障害の場合には、第一のストレージの論理ユニットの最新の複製を登録し、データセンタサイトが障害の場合には、第二のストレージの論理ユニットの最新の複製を登録することで、オフィスサイトやデータセンタサイトが障害時にも、代替オフィスサイトやバックアップセンタサイトより迅速にコンピュータを復旧することができる。
以上の第1、第2の発明では、ストレージにデータの一貫性が保たれたスナップショットデータを作成することができ、例えば一日一回、使用終了を行うコンピュータの場合、サイト障害後のネットワークストレージコンピュータシステム復旧時、少なくとも1日前のデータに戻すことが可能である。しかしながら、定期的に使用終了を行わないコンピュータの場合、一サイト障害が生じると、システムを復旧することはできても、例えばアプリケーションによるWriteデータが古すぎて業務では使い物にならない可能性が出てくる。
そこで、第3の発明では、ネットワークストレージコンピュータシステムは、管理サーバの同期点管理手段が、第1の判断と、論理ユニット毎に、または、論理ユニット一律にあらかじめ定められた時間になった場合に、該当する論理ユニットがデータ同期点に達したと判断する第2の判断と、を行い、同期管理手段が、第一のストレージの論理ユニットの複製と第二のストレージの論理ユニットの複製が、第1の判断によりデータ同期点に達したと判断されて作成されたか、第2の判断によりデータ同期点に達したと判断されて作成されたか、を管理し、管理サーバの回復手段が、コンピュータ障害時、第1の判断によりデータ同期点に達したと判断し作成した第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製をシステム起動領域として、第2の判断によりデータ同期点に達したと判断し作成した第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製をリカバリ領域として、登録し、コンピュータが、管理サーバの回復手段により登録されたシステム起動領域とリカバリ領域に接続する手段を備えることにより、コンピュータ障害時、管理サーバの回復手段が登録したコンピュータのシステム起動領域とリカバリ領域に接続し、コンピュータがシステムを起動することで、データの一貫性が保たれたスナップショットデータからシステムを確実に起動しながら、リカバリ領域のデータを利用することで、ユーザが任意に、システム起動領域のデータをより新しいデータに復旧できる。管理サーバの回復手段は、サイト全体障害時、第一のストレージが存在するデータセンタサイトで生じた場合には、バックアップセンタサイトに存在する第二のストレージの論理ユニットの複製を登録し、障害が第二のストレージが存在するバックアップセンタサイトで生じた場合には、データセンタサイトに存在する第一のストレージの論理ユニットの複製を登録する。
以上の第3の発明では、管理サーバの同期点管理手段が、コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットがデータ同期点に達したと判断する第1の判断と、論理ユニット毎に、または、論理ユニット一律にあらかじめ定められた時間になった場合に、該当する論理ユニットがデータ同期点に達したと判断する第2の判断と、を行うため、頻繁に使用終了するコンピュータが存在する場合、スナップショットデータを作成のための同期処理が頻繁に生じ、ネットワークストレージコンピュータシステムの負荷が高くなる。
そこで、第4の発明では、第2の判断において、条件を設定し、定期的なスナップショットデータ作成を抑制し、ネットワークストレージコンピュータシステムの負荷を軽減しつつ、ある一定間隔でスナップショットデータを取得できるようにする。
本発明を用いた場合、第1の発明では、ネットワークストレージコンピュータシステムにおいて、コンピュータのオペレーティングシステムのキャッシュ、ストレージが有する論理ユニットに分散されたWriteデータから、データセンタサイトの正ストレージと遠隔のバックアップセンタサイトの副ストレージに一貫性が保たれたスナップショットデータ、すなわち、確実にコンピュータのシステムが起動するスナップショットデータを作成することができる。よって、オフィスサイトの障害時には、データセンタサイトの正ストレージから代替オフィスサイトのコンピュータを起動し利用が可能となる。また、データセンタサイトの障害時には、直接、遠隔のバックアップセンタサイトの副ストレージの論理ユニットから、コンピュータを起動して利用が可能となるため、コンピュータの復旧のためのデータコピー(まき戻し)が不要となる。
第2の発明では、Writeデータを中継するキャッシュ装置が存在するネットワークストレージコンピュータシステムにおいて、コンピュータのオペレーティングシステムのキャッシュ、キャッシュ装置、ストレージが有する論理ユニットに分散されたWriteデータから、データセンタサイトの正ストレージと遠隔のバックアップセンタサイトの副ストレージに一貫性が保たれたスナップショットデータを作成することができる。よって、第1の発明と同様にオフィスサイトの障害時には、データセンタサイトの正ストレージから代替オフィスサイトのコンピュータを起動し利用が可能となる。また、データセンタサイトの障害時には、直接、遠隔のバックアップセンタサイトの副ストレージの論理ユニットから、コンピュータを起動して利用が可能となるため、コンピュータの復旧のためのデータコピー(まき戻し)が不要となる。
第3の発明では、データ同期点がコンピュータの使用終了時であるスナップショットデータとデータ同期点が定時であるスナップショットデータを取得し、コンピュータ障害時に、コンピュータの使用終了時のスナップショットデータをシステム起動領域に、定時のスナップショットデータをリカバリ領域に接続することにより、データの一貫性が保たれたスナップショットデータからシステムを確実に起動しながら、リカバリ領域のデータを利用することで、ユーザが任意に、システム起動領域のデータをより新しいデータに復旧できる。
第4の発明では、第3の発明の定期的なスナップショットデータ作成を抑制し、ネットワークストレージコンピュータシステムの負荷を軽減しつつ、ある一定間隔でスナップショットデータを取得できるようにする。
以下、本発明の実施例について図面を参照して詳細に説明する。なお、以下の実施例の説明について、キャッシュ装置が作成するWriteデータの「複製イメージ」は、以下、簡略のため、単に、「複製」として表記、説明する。
実施例1のネットワークストレージコンピュータシステムついて図面を参照して詳細に説明する。ここでは、コンピュータを起動するユーザに依存してコンピュータが接続するストレージの論理ユニットが決定されるとする。図3は本実施例のネットワークコンピュータシステムを示しており、コンピュータ31、キャッシュ装置32、管理サーバ11、管理サーバ21、第一のストレージ12、第二のストレージ22がネットワークを介して接続しており、コンピュータ31と第一のストレージ12間のデータまたはコンピュータ31と第二のストレージ22間のデータをキャッシュ装置32が中継している。なお、本実施例では、キャッシュ装置32の有無が、発明の実施に影響を与えないが、典型的な例として、キャッシュ装置32は、コンピュータ31がストレージから読み出すReadデータをキャッシュしているものとする。コンピュータは、通常、複数台設置するが、説明を簡略化するため、ここでは1台とする。また、第一のストレージ12と第二のストレージ22は、各々1台でも良いし、複数台でも良い。第一のストレージ12はサイト10、第二のストレージ22はサイト20、管理サーバ11はサイト10、管理サーバ21はサイト20に存在しており、コンピュータ31とキャッシュ装置32が同じサイト(サイト30)に存在している。ここでは、サイト30に通信距離が近いサイトは、サイト10とし、通常、サイト30のコンピュータは、サイト10の第一のストレージ12に接続するとする。管理サーバ11、21のデータは、完全に同期されており、通常、管理サーバ11が起動しており、管理サーバ21は待機している。サイト10の障害により管理サーバ11が起動不可になった場合に、管理サーバ21が起動される。管理サーバ、キャッシュ装置は、専用ハードウエアでも良いし、通常のコンピュータで実現しても良い。ここでは、ストレージの遠隔同期機能により、第一のストレージ12の論理ユニット13の複製を第二のストレージ22の論理ユニット23に作成すると仮定する。以下、管理サーバ、コンピュータ、キャッシュ装置、ストレージについて、それぞれ説明する。
〈管理サーバ〉
図4は管理サーバ11、21の機能を示す図である。図4に示すように、管理サーバは、CPU41、メモリ42、ネットワークIF40、ハードディスク43を備える。管理サーバのハードディスク43には、管理プログラム44がインストールされており、管理プログラム44は、同期点管理部45、同期管理部46、ストレージ制御部47、回復部48、ユーザ管理部49を有する。管理プログラム44の同期点管理部45、同期管理部46、ストレージ制御部47、回復部48、ユーザ管理部49がCPU41により実行されることにより、同期点管理手段、同期管理手段、ストレージ制御手段、回復手段、ユーザ管理手段が実現される。以下、各部について説明する。
図4は管理サーバ11、21の機能を示す図である。図4に示すように、管理サーバは、CPU41、メモリ42、ネットワークIF40、ハードディスク43を備える。管理サーバのハードディスク43には、管理プログラム44がインストールされており、管理プログラム44は、同期点管理部45、同期管理部46、ストレージ制御部47、回復部48、ユーザ管理部49を有する。管理プログラム44の同期点管理部45、同期管理部46、ストレージ制御部47、回復部48、ユーザ管理部49がCPU41により実行されることにより、同期点管理手段、同期管理手段、ストレージ制御手段、回復手段、ユーザ管理手段が実現される。以下、各部について説明する。
(ストレージ制御部)
ストレージ制御部47は、図5の論理ユニット管理表により、ストレージの論理ユニットのボリュームID、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号を管理する。また、図7の遠隔同期管理表により、第一のストレージ12の論理ユニット13のボリュームIDと第二のストレージ22の論理ユニット23のボリュームIDと、遠隔同期する論理ユニットのペアを一意に識別するペアIDと遠隔同期方向を管理する。遠隔同期方向とは、遠隔同期する方向が、第一のストレージ12の論理ユニット13のデータを元に第二のストレージ22の論理ユニット23のデータを複製とする「第一から第二」か、第二のストレージ22の論理ユニット23のデータを元に第一のストレージ12の論理ユニット13のデータを複製とする「第二から第一」かを表す。ストレージ制御部47は、同期管理部46からの要求に基き、ストレージに論理ユニットの複製命令と、論理ユニットの遠隔同期命令を送信する。
ストレージ制御部47は、図5の論理ユニット管理表により、ストレージの論理ユニットのボリュームID、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号を管理する。また、図7の遠隔同期管理表により、第一のストレージ12の論理ユニット13のボリュームIDと第二のストレージ22の論理ユニット23のボリュームIDと、遠隔同期する論理ユニットのペアを一意に識別するペアIDと遠隔同期方向を管理する。遠隔同期方向とは、遠隔同期する方向が、第一のストレージ12の論理ユニット13のデータを元に第二のストレージ22の論理ユニット23のデータを複製とする「第一から第二」か、第二のストレージ22の論理ユニット23のデータを元に第一のストレージ12の論理ユニット13のデータを複製とする「第二から第一」かを表す。ストレージ制御部47は、同期管理部46からの要求に基き、ストレージに論理ユニットの複製命令と、論理ユニットの遠隔同期命令を送信する。
(ユーザ管理部)
ユーザ管理部49は、図6のユーザ管理表によりユーザ情報の管理を行う。ユーザ情報とは、ユーザID、ユーザパスワード、システム起動用論理ユニットのボリュームID、第一のストレージ12の論理ユニット13のボリュームID、第二のストレージ22の論理ユニット23のボリュームID、起動状態、接続許可、IPアドレスである。ユーザIDとはユーザを一意に識別するIDである。システム起動用論理ユニットは、コンピュータ起動に必要なOSやアプリケーションが保存された論理ユニットで、起動時に必ず接続する必要のある論理ユニットである。第一のストレージ12の論理ユニット13または第二のストレージ22の論理ユニット23がシステム起動用論理ユニットに該当する。ユーザ登録時には、第一のストレージ12の論理ユニット13である。第一のストレージ12の論理ユニット13とは、ユーザが起動するコンピュータが通常接続するストレージの論理ユニットであり、コンピュータ31が存在するサイト30に近いサイトに存在するストレージの論理ユニットである。第二のストレージ22の論理ユニット23とは、第一のストレージ12の論理ユニット13のデータを遠隔同期することにより冗長化しており、第一のストレージ12が存在するサイト10の障害時には、第二のストレージ22の論理ユニット23を用いてコンピュータ31を起動する。起動状態は、コンピュータ31がユーザのシステム起動用論理ユニットを使用して「起動」、または「停止」しているかを管理しており、接続許可情報は、ユーザがコンピュータ31を起動してよいか否かを管理する。値は、起動して良いを示す「許可」、または否を示す「非許可」を取る。ユーザ登録時は、起動状態は「停止」、接続許可情報は「許可」で登録する。IPアドレスとは、ユーザが起動したコンピュータのIPアドレスである。IPアドレスは、ユーザ登録時には空で登録し、コンピュータ31より、ユーザID、コンピュータのIPアドレス情報が記載された起動完了通知を受信した場合に、図6のユーザ管理表の該当するユーザIDの行のIPアドレスを登録する。ユーザ管理部49は、コンピュータ31より、ユーザID、コンピュータのIPアドレス情報が記載された起動停止通知を受信した場合、起動状態を「起動」から「停止」に変更し、登録されたIPアドレスを削除する。さらに、同期点管理部45にユーザIDと起動状態変更通知を送信する。
ユーザ管理部49は、図6のユーザ管理表によりユーザ情報の管理を行う。ユーザ情報とは、ユーザID、ユーザパスワード、システム起動用論理ユニットのボリュームID、第一のストレージ12の論理ユニット13のボリュームID、第二のストレージ22の論理ユニット23のボリュームID、起動状態、接続許可、IPアドレスである。ユーザIDとはユーザを一意に識別するIDである。システム起動用論理ユニットは、コンピュータ起動に必要なOSやアプリケーションが保存された論理ユニットで、起動時に必ず接続する必要のある論理ユニットである。第一のストレージ12の論理ユニット13または第二のストレージ22の論理ユニット23がシステム起動用論理ユニットに該当する。ユーザ登録時には、第一のストレージ12の論理ユニット13である。第一のストレージ12の論理ユニット13とは、ユーザが起動するコンピュータが通常接続するストレージの論理ユニットであり、コンピュータ31が存在するサイト30に近いサイトに存在するストレージの論理ユニットである。第二のストレージ22の論理ユニット23とは、第一のストレージ12の論理ユニット13のデータを遠隔同期することにより冗長化しており、第一のストレージ12が存在するサイト10の障害時には、第二のストレージ22の論理ユニット23を用いてコンピュータ31を起動する。起動状態は、コンピュータ31がユーザのシステム起動用論理ユニットを使用して「起動」、または「停止」しているかを管理しており、接続許可情報は、ユーザがコンピュータ31を起動してよいか否かを管理する。値は、起動して良いを示す「許可」、または否を示す「非許可」を取る。ユーザ登録時は、起動状態は「停止」、接続許可情報は「許可」で登録する。IPアドレスとは、ユーザが起動したコンピュータのIPアドレスである。IPアドレスは、ユーザ登録時には空で登録し、コンピュータ31より、ユーザID、コンピュータのIPアドレス情報が記載された起動完了通知を受信した場合に、図6のユーザ管理表の該当するユーザIDの行のIPアドレスを登録する。ユーザ管理部49は、コンピュータ31より、ユーザID、コンピュータのIPアドレス情報が記載された起動停止通知を受信した場合、起動状態を「起動」から「停止」に変更し、登録されたIPアドレスを削除する。さらに、同期点管理部45にユーザIDと起動状態変更通知を送信する。
ユーザ管理部49は、コンピュータ起動時にコンピュータ31より通知されたユーザIDとパスワードにより認証を行い、図6のユーザ管理表の接続許可が「許可」で、図6のユーザ管理表の起動状態が「停止」の場合、起動状態を「起動」に変更した後、図5の論理ユニット管理表、図6のユーザ管理表よりシステム起動用論理ユニットのボリュームID、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号をコンピュータに返す。もし、図6のユーザ管理表の起動状態が「起動」の場合は、既にユーザがコンピュータを起動していると判断し、処理を終了する。また、図6のユーザ管理表の接続許可が「非許可」の場合は、処理を終了する。
(同期点管理部)
同期点管理部45は、ユーザ管理部49からの起動状態変更通知により、起動状態が「起動」から「停止」になったユーザIDのシステム起動用論理ユニットがデータ同期点に達したと判断する(第1の判断、図12のS105参照)。さらに、第1の判断により、データ同期点に達したと判断した論理ユニットに関し、同期管理部46に、データ同期開始命令を送信する(図12のS106参照)。
同期点管理部45は、ユーザ管理部49からの起動状態変更通知により、起動状態が「起動」から「停止」になったユーザIDのシステム起動用論理ユニットがデータ同期点に達したと判断する(第1の判断、図12のS105参照)。さらに、第1の判断により、データ同期点に達したと判断した論理ユニットに関し、同期管理部46に、データ同期開始命令を送信する(図12のS106参照)。
(同期管理部)
同期管理部46は、同期点管理部45より、データ同期開始命令を受信するとデータ同期処理を開始し、図8のデータ同期管理表により、データ同期を一意に識別する同期ID、データ同期対象の論理ユニットを一意に識別するボリュームID、データ同期処理の開始時刻である同期開始時刻、第一のストレージ12の論理ユニット13の複製を作成した時刻と、その複製を一意に識別する複製ID、第一のストレージ12の論理ユニット13と第二のストレージ22の論理ユニット23の遠隔同期時刻、第二のストレージ22の論理ユニット23の複製を作成した時刻と、その複製を一意に識別する複製IDと、同期の結果が「成功」か「失敗」かを管理する。なお、遠隔同期時刻とは、第一のストレージ12の論理ユニット13の複製と第二のストレージ22の論理ユニット23を遠隔同期し、同期が完了した時刻である。
同期管理部46は、同期点管理部45より、データ同期開始命令を受信するとデータ同期処理を開始し、図8のデータ同期管理表により、データ同期を一意に識別する同期ID、データ同期対象の論理ユニットを一意に識別するボリュームID、データ同期処理の開始時刻である同期開始時刻、第一のストレージ12の論理ユニット13の複製を作成した時刻と、その複製を一意に識別する複製ID、第一のストレージ12の論理ユニット13と第二のストレージ22の論理ユニット23の遠隔同期時刻、第二のストレージ22の論理ユニット23の複製を作成した時刻と、その複製を一意に識別する複製IDと、同期の結果が「成功」か「失敗」かを管理する。なお、遠隔同期時刻とは、第一のストレージ12の論理ユニット13の複製と第二のストレージ22の論理ユニット23を遠隔同期し、同期が完了した時刻である。
(回復部)
回復部48は、ネットワークストレージコンピュータシステム復旧処理において、サイト全体が障害によるコンピュータ障害時、データセンタサイト(サイト10)が正常で、オフィスサイト(サイト30)が障害の場合には、第一のストレージ12の論理ユニット13の最新の複製をコンピュータが接続するシステム起動領域に登録し、データセンタサイト(サイト10)が障害の場合には、第二のストレージ22の論理ユニット23の最新の複製をコンピュータ31が接続するシステム起動領域に登録する。回復部48によるシステム起動領域の登録は、管理サーバが、各サイトヘ通信を行うことで、サイト障害やコンピュータ障害を自動検出し、その結果により、自動的に登録しても良いし、保守者が入力することで、登録しても良い。
回復部48は、ネットワークストレージコンピュータシステム復旧処理において、サイト全体が障害によるコンピュータ障害時、データセンタサイト(サイト10)が正常で、オフィスサイト(サイト30)が障害の場合には、第一のストレージ12の論理ユニット13の最新の複製をコンピュータが接続するシステム起動領域に登録し、データセンタサイト(サイト10)が障害の場合には、第二のストレージ22の論理ユニット23の最新の複製をコンピュータ31が接続するシステム起動領域に登録する。回復部48によるシステム起動領域の登録は、管理サーバが、各サイトヘ通信を行うことで、サイト障害やコンピュータ障害を自動検出し、その結果により、自動的に登録しても良いし、保守者が入力することで、登録しても良い。
〈コンピュータ〉
コンピュータ31は、コンピュータ起動時に起動用プログラムにより、ユーザにユーザIDとパスワードの入力を要求し、ユーザが入力したユーザIDとパスワードを管理サーバに通知する。コンピュータは、管理サーバによるユーザ認証後、管理サーバより通知された、システム起動用論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号により、システム起動用論理ユニットに接続し、コンピュータを起動する。このシステム起動用論理ユニットがコンピュータのシステム起動領域となる。コンピュータは、システム起動後、ユーザIDとコンピュータのIPアドレス情報が記載された起動完了通知を管理サーバに送信する。また、コンピュータ使用終了時には、コンピュータは、ユーザIDとコンピュータのIPアドレス情報が記載された起動停止通知を管理サーバに送信する。
コンピュータ31は、コンピュータ起動時に起動用プログラムにより、ユーザにユーザIDとパスワードの入力を要求し、ユーザが入力したユーザIDとパスワードを管理サーバに通知する。コンピュータは、管理サーバによるユーザ認証後、管理サーバより通知された、システム起動用論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号により、システム起動用論理ユニットに接続し、コンピュータを起動する。このシステム起動用論理ユニットがコンピュータのシステム起動領域となる。コンピュータは、システム起動後、ユーザIDとコンピュータのIPアドレス情報が記載された起動完了通知を管理サーバに送信する。また、コンピュータ使用終了時には、コンピュータは、ユーザIDとコンピュータのIPアドレス情報が記載された起動停止通知を管理サーバに送信する。
〈キャッシュ装置〉
キャッシュ装置32は、図9に示すように、CPU62、メモリ63、ネットワークIF64、ハードディスク65(不揮発性メモリでもよい)からなる。ハードディスク65には、コンピュータ31がストレージから読み出すデータをキャッシュする動作を行うキャッシュ管理部67を含む。なお、キャッシュする方法は、ここでは問わない。
キャッシュ装置32は、図9に示すように、CPU62、メモリ63、ネットワークIF64、ハードディスク65(不揮発性メモリでもよい)からなる。ハードディスク65には、コンピュータ31がストレージから読み出すデータをキャッシュする動作を行うキャッシュ管理部67を含む。なお、キャッシュする方法は、ここでは問わない。
〈ストレージ〉
ストレージ12、22は、図10の論理ユニット表により、ボリュームID、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号、容量を管理する。ストレージは、管理サーバのストレージ制御部47より、論理ユニットの複製作成命令を受信した場合、論理ユニットの複製を作成し、図11の複製管理表により、論理ユニットのボリュームIDと、複製を一意に識別するボリューム複製IDと、複製時刻を管理する。ストレージは、ストレージ制御部47より、論理ユニットの遠隔同期命令を受信した場合、遠隔同期を行い、ストレージ制御部47に遠隔同期時刻を付加した遠隔同期命令応答を返す。
ストレージ12、22は、図10の論理ユニット表により、ボリュームID、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号、容量を管理する。ストレージは、管理サーバのストレージ制御部47より、論理ユニットの複製作成命令を受信した場合、論理ユニットの複製を作成し、図11の複製管理表により、論理ユニットのボリュームIDと、複製を一意に識別するボリューム複製IDと、複製時刻を管理する。ストレージは、ストレージ制御部47より、論理ユニットの遠隔同期命令を受信した場合、遠隔同期を行い、ストレージ制御部47に遠隔同期時刻を付加した遠隔同期命令応答を返す。
次に本実施例のネットワークストレージコンピュータシステムで、スナップショットデータとして第一のストレージ12と第二のストレージ22の論理ユニットのそれぞれの複製を作成する手順を図12、図13を用いて説明する。
図12において、コンピュータ31が管理サーバのユーザ管理部49に起動停止通知を行う(S101)。本実施例においては、管理サーバ11が起動しており、管理サーバ21は待機しているから、図12に示す管理サーバは管理サーバ11である。管理サーバのユーザ管理部49は、図6のユーザ管理表の起動状態を「起動」から「停止」に変更し(S102)、接続許可情報を「許可」から「非許可」に変更し(S103)、同期点管理部45にユーザIDと起動状態変更通知を送信する(S104)。
同期点管理部45では、起動状態変更通知により、起動状態が「起動」から「停止」になったユーザIDのシステム起動用論理ユニットがデータ同期点に達したと判断し(第1の判断、S105)、同期管理部46に、データ同期点に達したシステム起動用論理ユニットのボリュームID(ここでは「volume00A」とする)とユーザIDとデータ同期開始時刻の情報を付加したデータ同期開始命令を送信する(S106)。同期管理部46は、図8のデータ同期管理表に行を追加し、同期処理を識別するための同期IDを割当て(ここでは「001」とする)(S107)、ボリュームID(ここでは「volume00A」)、データ同期開始時刻を記入し、その他の項目については、空で記入する(S108)。同期管理部46は、ストレージ制御部47に、ボリュームIDを付加した複製作成命令を送信する(S109)。ストレージ制御部47は、ボリュームIDより、該当する論理ユニットのIPアドレス、ターゲット名、論理ユニット番号を図5の論理ユニット管理表より検索し(S110)、第一または第二のストレージ(図12の例では第一のストレージ12)に論理ユニットのIPアドレス、ターゲット名、論理ユニット番号、論理ユニットのストレージ内の複製が一意に識別できるボリューム複製ID(ここでは、「SV−00A−1」)を付加した複製作成命令を送信する(S111〜S112)。
複製作成命令を受信したストレージ(図12の例では第一のストレージ12)は該当する論理ユニットの複製を作成し(S113)、ボリューム複製ID(ここでは、「SV−00A−1」)を割当て、図11の複製管理表により、該当するボリュームID、ボリューム複製ID、複製作成時刻を管理する。ストレージは、管理サーバのストレージ制御部47に、複製作成時刻を付加した複製作成命令応答を返す(S114)。
管理サーバのストレージ制御部47は、同期管理部46に、複製作成時刻と、ボリューム複製IDを付加した複製作成命令応答を返す(S115)。同期管理部46は、図8のデータ同期管理表の該当する識別子の行の第一または第二のストレージの論理ユニットの複製作成時刻とボリューム複製IDを記入する(S116)。同期管理部46は、図8のデータ同期管理表の該当する同期IDの行のボリュームIDを付加した接続許可情報変更命令をユーザ管理部49に送信する(図13のS117)。ユーザ管理部49は図6のユーザ管理表のシステム起動用論理ユニットのボリュームIDが、接続許可情報変更命令に付加されたボリュームIDと一致した行を検索し、検索した行の接続許可情報を「許可」に変更して(S118)、同期管理部46に接続許可情報変更命令応答を返す(S119)。同期管理部46は、図7の遠隔同期管理表により、第一のストレージの論理ユニットのボリュームIDが「volume00A」である第二のストレージの論理ユニットのボリュームID(ここでは「volumeRe00A」)を検索し取得する。同期管理部46は、ストレージ制御部47に「volume00A」の複製(ボリューム複製IDが「SV−00A−1」)と第二のストレージの論理ユニット(ここでは「volumeRe00A」)の同期命令を送信する(S120)。ストレージ制御部47は、第一のストレージ12に第一のストレージ12の論理ユニットの複製(ここではボリューム複製IDが「SV−00A−1」)と第二のストレージ22の論理ユニット(ここでは「volumeRe00A」)の同期命令を送信する(S121)。
ストレージは、該当する第一のストレージ12の論理ユニットの複製と第二のストレージ22の論理ユニットを同期し(S122〜S124)、遠隔同期時刻を記載した同期命令応答をストレージ制御部47に通知する(S125)。ストレージ制御部47は同期管理部46に遠隔同期時刻を記載した同期命令応答を通知する(S126)。同期管理部46は、図8のデータ同期管理表の遠隔同期時刻を記入する(S127)。同期管理部46は、ストレージ制御部47に、第二のストレージの論理ユニットのボリュームIDを付加した複製作成命令を送信する(S128)。ストレージ制御部47は、ボリュームIDより、該当する論理ユニットのIPアドレス、ターゲット名、論理ユニット番号を図5の論理ユニット管理表より検索し(S129)、論理ユニットのIPアドレス、ターゲット名、論理ユニット番号、論理ユニットのストレージ内の複製が一意に識別できるボリューム複製ID(ここでは、「SV−Re00A−1」)を割り当て(S130)、これを付加した複製作成命令を第二のストレージ22に送信する(S131)。
ストレージ(図13の例では第二のストレージ22)は該当する論理ユニットの複製を作成し、ボリューム複製ID(ここでは、「SV−Re00A−1」)を割当て、図11の複製管理表により、該当するボリュームID、ボリューム複製ID、複製作成時刻を管理する(S132)。ストレージは、ストレージ制御部47に、複製作成時刻を付加した複製作成命令応答を返す(S133)。ストレージ制御部47は、同期管理部46に、複製作成時刻と、ボリューム複製IDを付加した複製作成命令応答を返す(S134)。同期管理部46は、図8の該当する同期IDの行の第二のストレージの論理ユニットの複製作成時刻とボリューム複製IDとデータ同期結果「成功」を記入し(S135)、処理を終了する(S136)。もし、データ同期処理中に失敗した場合には、処理を途中で中断し、データ同期結果に失敗を記入する。以上より、データの一貫性が保たれた第一のストレージと第二のストレージに論理ユニットの複製を作成することができる。
実施例2のネットワークストレージコンピュータシステムついて次に説明する。実施例1と同様、ここでは、コンピュータを起動するユーザに依存してコンピュータが接続するストレージの論理ユニットが決定されるとする。実施例1と同様、図3は本実施例のネットワークコンピュータシステムを示しており、コンピュータ31、キャッシュ装置32、管理サーバ11、管理サーバ21、第一のストレージ12、第二のストレージ22がネットワークを介して接続しており、コンピュータ31と第一のストレージ12間のデータまたはコンピュータ31と第二のストレージ22間のデータをキャッシュ装置32が中継している。実施例1との違いは、キャッシュ装置32がコンピュータ31からストレージヘのWriteデータを保持し、キャッシュしている点である。コンピュータ31は、通常、複数台設置するが、説明を簡略化するため、ここでは1台とする。また、第一のストレージ12と第二のストレージ22は、各々1台でも良いし、複数台でも良い。第一のストレージ12はサイト10、第二のストレージ22はサイト20、管理サーバ11はサイト10、管理サーバ21はサイト20に存在しており、コンピュータ31とキャッシュ装置32が同じサイト(サイト30)に存在している。ここでは、サイト30に通信距離が近いサイトは、サイト10とし、通常、サイト30のコンピュータ31は、サイト10の第一のストレージ12に接続するとする。管理サーバ11、21のデータは、完全に同期されており、通常、管理サーバ11が起動しており、管理サーバ21は待機している。サイト10の障害により管理サーバ11が起動不可になった場合に、管理サーバ21が起動される。管理サーバ、キャッシュ装置は、専用ハードウエアでも良いし、通常のコンピュータで実現しても良い。ここでは、ストレージの遠隔同期機能により、第一のストレージ12の論理ユニット13の複製を第二のストレージ22の論理ユニット23に作成すると仮定するが、キャッシュ装置32より、第一のストレージ12にデータ転送する際に、同時に同じデータを第二のストレージ22に転送し、第一のストレージ12の論理ユニット13の複製を作成しても良い。コンピュータ、ストレージは、実施例1と同じであるため、ここでは、省略し、管理サーバ、キャッシュ装置について、まず、説明する。
〈管理サーバ〉
図14は管理サーバ11、21の機能を示す図である。管理サーバ11、21のハードディスク43には、管理プログラム50がインストールされており、管理プログラム50は、同期点管理部45、同期管理部46、ストレージ制御部47、回復部48、ユーザ管理部49、キャッシュ制御部51を有する。実施例1と同様に、管理プログラム50の各部がCPU41により実行されることにより、各部に対応する各手段が実現される。同期点管理部45、ストレージ制御部47、回復部48、ユーザ管理部49、およびハードウェア構成は、実施例1と同じであるため、ここでは説明を省略する。
図14は管理サーバ11、21の機能を示す図である。管理サーバ11、21のハードディスク43には、管理プログラム50がインストールされており、管理プログラム50は、同期点管理部45、同期管理部46、ストレージ制御部47、回復部48、ユーザ管理部49、キャッシュ制御部51を有する。実施例1と同様に、管理プログラム50の各部がCPU41により実行されることにより、各部に対応する各手段が実現される。同期点管理部45、ストレージ制御部47、回復部48、ユーザ管理部49、およびハードウェア構成は、実施例1と同じであるため、ここでは説明を省略する。
(キャッシュ制御部)
キャッシュ制御部51は、同期管理部46からの要求に基き、キャッシュ装置32にWriteデータの複製作成命令と、Writeデータの複製のストレージヘの転送命令を送信する。
キャッシュ制御部51は、同期管理部46からの要求に基き、キャッシュ装置32にWriteデータの複製作成命令と、Writeデータの複製のストレージヘの転送命令を送信する。
(同期管理部)
同期管理部46は、同期点管理部45より、データ同期開始命令を受信するとデータ同期処理を開始し、図15のデータ同期管理表により、データ同期を一意に識別する同期ID、データ同期対象の論理ユニットを一意に識別するボリュームID、データ同期処理の開始時刻である同期開始時刻、キャッシュ装置32でキャッシュデータの複製を作成した時刻と、キャッシュデータの複製を一意に識別するキャッシュ複製ID、キャッシュ装置から第一のストレージ12にキャッシュデータの複製をアップロードした時刻と、第一のストレージ12の論理ユニット13の複製を作成した時刻と、その複製を一意に識別する複製ID、第一のストレージ12の論理ユニット13と第二のストレージ22の論理ユニット23の遠隔同期時刻、第二のストレージ22の論理ユニット23の複製を作成した時刻と、その複製を一意に識別する複製IDと、同期の結果が「成功」か「失敗」かを管理する。
同期管理部46は、同期点管理部45より、データ同期開始命令を受信するとデータ同期処理を開始し、図15のデータ同期管理表により、データ同期を一意に識別する同期ID、データ同期対象の論理ユニットを一意に識別するボリュームID、データ同期処理の開始時刻である同期開始時刻、キャッシュ装置32でキャッシュデータの複製を作成した時刻と、キャッシュデータの複製を一意に識別するキャッシュ複製ID、キャッシュ装置から第一のストレージ12にキャッシュデータの複製をアップロードした時刻と、第一のストレージ12の論理ユニット13の複製を作成した時刻と、その複製を一意に識別する複製ID、第一のストレージ12の論理ユニット13と第二のストレージ22の論理ユニット23の遠隔同期時刻、第二のストレージ22の論理ユニット23の複製を作成した時刻と、その複製を一意に識別する複製IDと、同期の結果が「成功」か「失敗」かを管理する。
〈キャッシュ装置〉
キャッシュ装置32は、図16に示すとおり、通信部66、キャッシュ管理部67、複製作成部60、転送部61を有する。ハードウェアは実施例1と同様であるから説明を省略する。以下、キャッシュ装置が有するこれらの部位の機能について説明する。なお、後述の複製作成部60、転送部61がキャッシュ装置内のCPU62により実行されることにより、複製作成手段、転送手段が実現される。
キャッシュ装置32は、図16に示すとおり、通信部66、キャッシュ管理部67、複製作成部60、転送部61を有する。ハードウェアは実施例1と同様であるから説明を省略する。以下、キャッシュ装置が有するこれらの部位の機能について説明する。なお、後述の複製作成部60、転送部61がキャッシュ装置内のCPU62により実行されることにより、複製作成手段、転送手段が実現される。
(通信機能)
キャッシュ装置32の通信機能は、コンピュータ31からWrite要求のためのパケット受信した場合にキャッシュを行う。キャッシュ装置32が、コンピュータ31からのWriteデータをキャッシュする手順の一例を説明する。コンピュータ31から送信されるWrite要求のためのパケットには、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号、開始LBA(論理ブロックアドレス)、ブロックデータ長が含まれており、これらの情報により書き込み先が一意に決定される。よって、キャッシュ装置32は、書込み先である論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号、開始LBA、ブロックデータ長と、Writeデータを同時に管理することにより、Writeデータの書込み先を特定することができる。
キャッシュ装置32の通信機能は、コンピュータ31からWrite要求のためのパケット受信した場合にキャッシュを行う。キャッシュ装置32が、コンピュータ31からのWriteデータをキャッシュする手順の一例を説明する。コンピュータ31から送信されるWrite要求のためのパケットには、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号、開始LBA(論理ブロックアドレス)、ブロックデータ長が含まれており、これらの情報により書き込み先が一意に決定される。よって、キャッシュ装置32は、書込み先である論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号、開始LBA、ブロックデータ長と、Writeデータを同時に管理することにより、Writeデータの書込み先を特定することができる。
キャッシュ装置32は、図17のキャッシュ対象論理ユニット表により、Writeデータをキャッシュする対象であるユーザに割当てられたシステム起動用論理ユニットのボリュームID、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号を管理する。キャッシュ装置32は、図18の割当て表により、ユーザに割当てられたシステム起動用論理ユニットのボリュームIDと、当該論理ユニットヘのWriteデータをキャッシュするために割当てられた一次記憶領域を一意に識別するキャッシュ一時記憶領域IDと、一次記憶領域にキャッシュされたWriteデータや、Writeデータの複製を格納するために割当てられた二次記憶領域を一意に識別するキャッシュ二次記憶領域IDを管理する。
キャッシュ装置32は、ユーザが起動したコンピュータからストレージの論理ユニットヘのWrite要求のためのパケットを受信した場合、Write要求のためのパケットよりWrite論理ユニットを特定し、特定した論理ユニットに割当てられた、キャッシュ装置の一次記憶領域に、開始LBA、ブロックデータ長、Writeデータをパケット到着順に保有し、返答を返す。
(キャッシュ管理機能)
キャッシュ装置32のキャッシュ管理機能は、コンピュータ31がストレージから読み出すデータをキャッシュする動作を行う。キャッシュする方法は、ここでは、問わない。コンピュータ31から送信されるRead要求のためのパケットには、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号、開始LBA(論理ブロックアドレス)、ブロックデータ長が含まれており、これらの情報により読み込み先が一意に決定される。キャッシュ管理機能は、コンピュータ31からRead要求のためのパケットを受信すると、Read要求のためのパケットより論理ユニットを特定し、特定した論理ユニットに割当てられた、キャッシュ装置の一次記憶領域または二次記憶領域に、読み込み先に対するWriteデータが存在するか確認する。存在する場合、キャッシュ装置の一次記憶領域または二次記憶領域のデータをコンピュータ31に返す。存在しない場合、キャッシュ管理機能がキャッシュしているか確認する。キャッシュしている場合、キャッシュしているデータを返す。キャッシュしていない場合、ストレージに、Read要求のためのパケットを中継し、ストレージからの応答をコンピュータに中継する。
キャッシュ装置32のキャッシュ管理機能は、コンピュータ31がストレージから読み出すデータをキャッシュする動作を行う。キャッシュする方法は、ここでは、問わない。コンピュータ31から送信されるRead要求のためのパケットには、論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号、開始LBA(論理ブロックアドレス)、ブロックデータ長が含まれており、これらの情報により読み込み先が一意に決定される。キャッシュ管理機能は、コンピュータ31からRead要求のためのパケットを受信すると、Read要求のためのパケットより論理ユニットを特定し、特定した論理ユニットに割当てられた、キャッシュ装置の一次記憶領域または二次記憶領域に、読み込み先に対するWriteデータが存在するか確認する。存在する場合、キャッシュ装置の一次記憶領域または二次記憶領域のデータをコンピュータ31に返す。存在しない場合、キャッシュ管理機能がキャッシュしているか確認する。キャッシュしている場合、キャッシュしているデータを返す。キャッシュしていない場合、ストレージに、Read要求のためのパケットを中継し、ストレージからの応答をコンピュータに中継する。
(複製作成機能)
キャシュ装置32の複製作成機能は、複製作成部60によって実現される。一次記憶領域の容量が一杯になった場合、または、キャッシュ装置32の複製作成部60が、管理サーバのキャッシュ制御部51よりデータの複製命令を受信した場合、該当する論理ユニットに割当てられた二次記憶領域に一次記憶領域が保有している開始LBA、ブロックデータ長、書込みデータの情報をフラッシュする。二次記憶領域を割当てる理由は、一般的にメモリ等の一次記憶領域は、ディスクより性能が良いが高価であるため、大容量の一次記憶領域を装着することが難しいからである。データの複製命令を受信した場合、さらにデータの複製を作成し、図19のキャッシュ複製管理表により、キャッシュ対象の論理ユニットのボリュームIDと、複製を一意に識別するキャッシュ複製IDとキャッシュ複製時刻を管理する。
キャシュ装置32の複製作成機能は、複製作成部60によって実現される。一次記憶領域の容量が一杯になった場合、または、キャッシュ装置32の複製作成部60が、管理サーバのキャッシュ制御部51よりデータの複製命令を受信した場合、該当する論理ユニットに割当てられた二次記憶領域に一次記憶領域が保有している開始LBA、ブロックデータ長、書込みデータの情報をフラッシュする。二次記憶領域を割当てる理由は、一般的にメモリ等の一次記憶領域は、ディスクより性能が良いが高価であるため、大容量の一次記憶領域を装着することが難しいからである。データの複製命令を受信した場合、さらにデータの複製を作成し、図19のキャッシュ複製管理表により、キャッシュ対象の論理ユニットのボリュームIDと、複製を一意に識別するキャッシュ複製IDとキャッシュ複製時刻を管理する。
(転送機能)
キャッシュ装置32の転送機能は転送部61によって実現される。転送部61は、管理サーバのキャッシュ制御部51より、ボリュームIDとキャッシュ複製IDを付加した転送命令を受信すると、該当するキャッシュ複製IDのキャッシュデータの複製を指定されたボリュームIDの論理ユニットに転送する。
キャッシュ装置32の転送機能は転送部61によって実現される。転送部61は、管理サーバのキャッシュ制御部51より、ボリュームIDとキャッシュ複製IDを付加した転送命令を受信すると、該当するキャッシュ複製IDのキャッシュデータの複製を指定されたボリュームIDの論理ユニットに転送する。
次に本実施例のネットワークストレージコンピュータシステムで、スナップショットデータである第一のストレージ12と第二のストレージ22の論理ユニットの複製を作成する手順を図20〜図22を用いて説明する。
図20において、コンピュータ31が管理サーバのユーザ管理部49に起動停止通知を行う(S201)。本実施例においては、管理サーバ11が起動しており、管理サーバ21は待機しているから、図20に示す管理サーバは管理サーバ11である。ユーザ管理部49は、図6のユーザ管理表の起動状態を「起動」から「停止」に変更し(S202)、ユーザ管理表の接続許可情報を「許可」から「非許可」に変更する(S203)。さらに同期点管理部45にユーザIDと起動状態変更通知を送信する(S204)。同期点管理部45は、起動状態変更通知により、起動状態が「起動」から「停止」になったユーザIDのシステム起動用論理ユニットがデータ同期点に達したと判断し(第1の判断、S205)、同期管理部46に、データ同期点に達したシステム起動用論理ユニットのボリュームID(ここでは「volume00A」とする)とユーザIDとデータ同期開始時刻の情報を付加したデータ同期開始命令を送信する(S206)。同期管理部46は、図8のデータ同期管理表に行を追加し、同期処理を識別するための同期IDを割当て(ここでは「001」とする)(S207)、ボリュームID(ここでは「volume00A」)、データ同期開始時刻を記入し、その他の項目については、空で記入する(S208)。次に、同期管理部46は、キャッシュ制御部51に、ボリュームIDとキャッシュデータ複製命令を送信する(S209)。キャッシュ制御部51は、ボリュームIDと、キャッシュデータの複製を一意に識別するキャッシュ複製ID(ここでは、「SC−00A−1」とする)を割り当て(S210)、これを記載したデータ複製命令をキャッシュ装置32の複製作成部60に送信する(S211)。
キャッシュ装置の複製作成部60は、管理サーバのキャッシュ制御部51より受信したデータ複製命令のボリュームIDと図18の割当て表より、該当するキャッシュ一時記憶領域内のデータを対応するキャッシュ二次記憶領域にフラッシュする(S212)。フラッシュ完了後、キャッシュ二次記憶領域にキャッシュ複製IDが「SC−00A−1」であるキャッシュデータの複製を作成する。キャッシュデータの複製完了時、複製元データに複製先がわかるキャッシュ複製IDを記述する(S213)。キャッシュ装置32の複製作成部60は、管理サーバのキャッシュ制御部51に、複製作成時刻とキャッシュデータ複製命令応答を返す(S214)。
管理サーバのキャッシュ制御部51は、同期管理部46に複製作成時刻と、キャッシュ複製IDと、キャッシュデータ複製命令応答を返す(S215)。同期管理部46は、図15のデータ同期管理表の該当する同期IDの行の複製作成時刻と、キャッシュ複製ID(「SC−00A−1」)を記入する(図21のS216)。同期管理部46は、図15のデータ同期管理表の該当する同期IDの行のボリュームIDを付加した接続許可情報変更命令をユーザ管理部49に送信する(S217)。ユーザ管理部49は図6のユーザ管理表のシステム起動用論理ユニットのボリュームIDが、接続許可情報変更命令に付加されたボリュームIDと一致した行を検索し、検索した行の接続許可情報を「許可」に変更して(S218)、同期管理部46に接続許可情報変更命令応答を返す(S219)。同期管理部46は、キャッシュ制御部51に、ボリュームIDとキャッシュ複製IDを付加した転送命令を送信する(S220)。キャッシュ制御部51は、キャッシュ装置の転送部61にボリュームIDとキャッシュ複製IDを付加した転送命令を送信する(S221)。
キャッシュ装置の転送部61は、該当するキャッシュ複製IDのキャッシュデータの複製を指定されたボリュームIDの論理ユニットに転送する(S222)。転送終了後、管理サーバのキャッシュ制御部51に転送時刻を付加した転送命令応答を返す(S223)。
管理サーバのキャッシュ制御部51は、同期管理部46に転送時刻を付加した転送命令応答を返す(S224)。同期管理部46は、図15のデータ同期管理表にキャッシュデータの複製の転送時刻を転送時刻の欄に記入する(S225)。同期管理部46は、キャッシュ制御部51にキャッシュ複製IDとキャッシュデータ削除命令をする(S226)。キャッシュ制御部51は、キャッシュ装置の複製作成部60にキャッシュ複製IDとキャッシュデータ削除命令を送信する(S227)。
キャッシュ装置の複製作成部60は、二次記憶領域内の該当するキャッシュ複製IDのキャッシュデータの複製と、複製元データを削除し(S228)、キャッシュデータ削除命令応答を管理サーバのキャッシュ制御部51に返す(S229)。
管理サーバのキャッシュ制御部51は、同期管理部46にキャッシュデータ削除命令応答を返す(S230)。同期管理部46は、ストレージ制御部47に、ボリュームIDを付加した複製作成命令を送信する(S231)。ストレージ制御部47は、ボリュームIDより、該当する論理ユニットのIPアドレス、ターゲット名、論理ユニット番号を図5の論理ユニット管理表より検索し(S232)、論理ユニットのIPアドレス、ターゲット名、論理ユニット番号、論理ユニットのストレージ内の複製が一意に識別できるボリューム複製ID(ここでは、「SV−00A−1」)を割り当て(S233)、これを付加した複製作成命令を第一または第二のストレージ(図21の例では第1のストレージ12)に送信する(S234)。
ストレージは該当する論理ユニットの複製を作成し(S235)、ボリューム複製ID(ここでは、「SV−00A−1」)を割当て、図11の複製管理表により、該当するボリュームID、ボリューム複製ID、複製作成時刻を管理する。ストレージは、管理サーバのストレージ制御部47に、複製作成時刻を付加した複製作成命令応答を返す(図22のS236)。
管理サーバのストレージ制御部47は、同期管理部46に、複製作成時刻と、ボリューム複製IDを付加した複製作成命令応答を返す(S237)。同期管理部46は、図15のデータ同期管理表の該当する識別子の行の第一または第二のストレージの論理ユニットの複製作成時刻とボリューム複製IDを記入する(S238)。同期管理部46は、図7の遠隔同期管理表により、第一のストレージ12の論理ユニットのボリュームIDが「volume00A」である第二のストレージ22の論理ユニットのボリュームID(ここでは「volumeRe00A」)を検索し取得する。同期管理部46は、ストレージ制御部47に「volume00A」の複製(ボリューム複製IDが「SV−00A−1」)と第二のストレージ22の論理ユニット(ここでは「volumeRe00A」)の同期命令を送信する(S239)。ストレージ制御部47は、第一のストレージ12に第一のストレージ12の論理ユニットの複製(ここではボリューム複製IDが「SV−00A−1」)と第二のストレージ22の論理ユニット(ここでは「volumeRe00A」)の同期命令を送信する(S240)。
ストレージは、該当する第一のストレージ12の論理ユニットの複製と第二のストレージ22の論理ユニットを同期し(S241〜S243)、遠隔同期時刻を記載した同期命令応答を管理サーバのストレージ制御部47に通知する(S244)。
管理サーバのストレージ制御部47は同期管理部46に遠隔同期時刻を記載した同期命令応答を通知する(S245)。同期管理部46は、図15のデータ同期管理表の遠隔同期時刻を記入する(S246)。同期管理部46は、ストレージ制御部47に、第二のストレージ22の論理ユニットのボリュームIDを付加した複製作成命令を送信する(S247)。ストレージ制御部47は、ボリュームIDより、該当する論理ユニットのIPアドレス、ターゲット名、論理ユニット番号を図5の論理ユニット管理表より検索し(S248)、論理ユニットのIPアドレス、ターゲット名、論理ユニット番号、論理ユニットのストレージ内の複製が一意に識別できるボリューム複製ID(ここでは、「SV−Re00A−1」)を割り当て(S249)、これを付加した複製作成命令を第二のストレージ22に送信する(S250)。
ストレージは該当する論理ユニットの複製を作成し(S251)、ボリューム複製ID(ここでは、「SV−Re00A−1」)を割当て、図11の複製管理表により、該当するボリュームID、ボリューム複製ID、複製作成時刻を管理する。ストレージは、管理サーバのストレージ制御部47に、複製作成時刻を付加した複製作成命令応答を返す(S252)。
管理サーバのストレージ制御部47は、同期管理部46に、複製作成時刻と、ボリューム複製IDを付加した複製作成命令応答を返す(S253)。同期管理部47は、図15の該当する同期IDの行の第二のストレージ22の論理ユニットの複製作成時刻とボリューム複製IDとデータ同期結果「成功」を記入し(S254)、処理を終了する(S255)。もし、データ同期処理中に失敗した場合には、処理を途中で中断し、データ同期結果に失敗を記入する。以上より、データの一貫性が保たれた第一のストレージ12と第二のストレージ22に論理ユニットの複製を作成することができる。
実施例3のネットワークストレージコンピュータシステムついて次に説明する。実施例3は、実施例1、2における同期点管理部45が第1の判断と第2の判断を行う実施例である。実施例3では、同期点管理部45は、コンピュータが起動停止になった場合(第1の判断、S305)と、あらかじめ定められた時間になった場合(第2の判断、S315)に、データ同期点に達したと判断する。
図23の[1]に示すように、実施例1、2と同様、ユーザ管理部49は、図6のユーザ管理表の起動状態が「起動」から「停止」に変更になった場合、同期点管理部45にユーザIDと起動状態変更通知を送信し(S304)、同期点管理部45は、起動状態変更通知により、起動状態が「起動」から「停止」になったユーザIDのシステム起動用論理ユニットがデータ同期点に達したと判断し(第1の判断、S305)、データ同期開始命令を送信する(S306)。これ以降は図12のS107、図20のS207以降と同様である。また、図23の[2]に示すように、同期点管理部45は、ユーザ毎にデータ同期を実行する時間を管理し、論理ユニット毎に、または、論理ユニット一律にあらかじめ時間に達した場合、該当するユーザの論理ユニットがデータ同期点に達したと判断し(第2の判断、S315)、データ同期開始命令を送信する(S316)。これ以降は図12のS107、図20のS207以降と同様である。このように、同期点管理部45は、ある論理ユニットが第1の判断または第2の判断により、データ同期点に達したと判断した場合、同期管理部46にデータ同期開始命令を送信する。同期管理部46へのデータ同期開始命令には、コンピュータが起動停止したことによるデータ同期「起動停止」か、あらかじめ定められた時間になったことによるデータ同期「定時」かを表すデータ同期理由を付加する。
同期管理部46は、データ同期処理実行において、データ同期理由の欄を追加した図25のデータ同期管理表により、データ同期を管理することで、作成されたスナップショットデータが、コンピュータが起動停止したことによるものか、あらかじめ定められた時間になったことによるものか判る。
管理サーバのユーザ管理部49は、リカバリ用論理ユニットの欄を追加したユーザ管理表(図24参照)により、システム起動用論理ユニットとリカバリ用論理ユニットを管理する。
サイト障害時、管理サーバの回復部48は、システム起動用論理ユニットには、同期理由が「起動停止」である論理ユニットの最新の複製をシステム起動用論理ユニットとし、同期理由が「定時」である論理ユニットの最新の複製を新たな論理ユニットとして登録し、リカバリ用論理ユニットとする。上記、同期理由が「起動停止」及び「定時」の最新の複製は、各々、障害が第一のストレージが存在するデータセンタサイト(サイト10)で生じた場合には、バックアップセンタサイト(サイト20)に存在する第二のストレージ22の論理ユニット23の複製を選択する。障害がオフィスサイト(サイト30)や第二のストレージ22が存在するバックアップセンタサイト(サイト20)で生じた場合には、データセンタサイト(サイト10)に存在する第一のストレージ12の論理ユニット13の複製を選択する。
ユーザ管理部49は、コンピュータ31より、ユーザIDとパスワードを通知されると、ユーザ認証後、システム起動用論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号とリカバリ用論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号をコンピュータ31に通知する。
コンピュータ31は、管理サーバより、システム起動用論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号とリカバリ用論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号を受信すると、システム起動用論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号により、システム起動用論理ユニットに接続し、コンピュータを起動し、リカバリ用論理ユニットのIPアドレス、ポート番号、ターゲット名、論理ユニット番号により、リカバリ用論理ユニットをリカバリ領域に接続する。
以上より、ネットワークストレージコンピュータシステムは、コンピュータが起動停止時にデータの一貫性が保たれたスナップショットデータと、より新しい、あらかじめ定められた時間のスナップショットデータを第一のストレージと第二のストレージに作成することができ、コンピュータは、障害時、データの一貫性が保たれたスナップショットデータからコンピュータのオペレーティングシステムを確実に起動しながら、リカバリ領域のデータを利用することで、ユーザが任意に、より新しいデータに復旧できる。
実施例4のネットワークストレージコンピュータシステムついて次に説明する。実施例4は、実施例3の第2の判断に条件をつけ、データ同期処理によるシステムの負荷を軽減したものである。図26の[2]に示すように、同期点管理部45は、第2の判断において、ユーザ毎にデータ同期を実行する時間を管理し、論理ユニット毎に、または、論理ユニット一律にあらかじめ定められた時間になった場合に、あらかじめ定められた条件を満たした場合にのみ、データ同期点に達したと判断する(S415)。あらかじめ定められた時間になった場合であっても、あらかじめ定められた条件を満たしていない場合はデータ同期点に達したと判断しない。その他の点については、実施例3と同様である。
例えば、あるユーザに対し、毎日、12時にシステム起動用論理ユニットのスナップショットデータを作成するように管理しているとする。条件を、過去24時間以内にスナップショットデータを作成していないとすると、時間が12時になった場合、同期点管理部45が、図25のデータ同期管理表とユーザのシステム起動用論理ユニットのボリュームIDより、該当するボリュームIDに関するデータ同期のうち、24時間以内に同期結果が「成功」であるデータ同期が存在するか検索する。もし、存在した場合には、データ同期点に達していないと判断し、処理を終了する。存在しない場合には、データ同期点に達したと判断する。
以上より、条件をつけ、データ同期処理を抑制し、データ同期処理によるシステムの負荷を軽減しつつ、データの一貫性が保たれた第一のストレージと第二のストレージに論理ユニットの複製を作成し、かつ、ある一定間隔で必ず、第一のストレージと第二のストレージに論理ユニットの複製を作成できる。
以上、本発明者によってなされた発明を、前記実施形態に基づき具体的に説明したが、本発明は、前記実施形態に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは勿論である。
10、20、30…サイト、11、21…管理サーバ、12…第一のストレージ、22…第二のストレージ、13、23…論理ユニット、31…コンピュータ、32…キャッシュ装置、40…ネットワークIF、41…CPU、42…メモリ、43…ハードディスク、44…管理プログラム、45…同期点管理部、46…同期管理部、47…ストレージ制御部、48…回復部、49…ユーザ管理部、50…管理プログラム、51…キャッシュ制御部、60…複製作成部、61…転送部、62…CPU、63…メモリ、64…ネットワークIF、65…ハードディスク、66…通信部、67…キャッシュ管理部
Claims (9)
- 管理サーバと、
コンピュータと、
前記コンピュータの起動に必要なデータを保存した複数の論理ユニットを有する少なくとも1台のストレージであって、前記コンピュータまたは前記コンピュータを起動するユーザ毎に、前記コンピュータが接続する前記論理ユニットが割当てられるという構成を有する第一のストレージと、
前記第一のストレージが有する論理ユニットの複製を保存する第二のストレージとが、
ネットワークを介して接続されているネットワークストレージコンピュータシステム、または、
前記管理サーバと、前記コンピュータと、前記第一のストレージと、前記第二のストレージと、前記コンピュータと前記第一ストレージ間または前記コンピュータと前記第二のストレージ間のデータを中継するキャッシュ装置とが、
ネットワークを介して接続されているネットワークストレージコンピュータシステムにおいて、
前記管理サーバは、
前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断を行う同期点管理手段と、
前記第一のストレージと前記第二のストレージの論理ユニットの複製を作成するストレージ制御手段と、
同期開始時間と、同期終了時間と、同期結果と、同期の結果作成された前記第一のストレージの論理ユニットの複製と前記第二のストレージの論理ユニットの複製を管理する、同期管理手段と、
前記コンピュータの障害後のネットワークストレージコンピュータシステム復旧時に、第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製を前記コンピュータが接続するシステム起動領域として登録する回復手段と、
を備えることを特徴とするネットワークストレージコンピュータシステム。 - 管理サーバと、
コンピュータと、
前記コンピュータの起動に必要なデータを保存した複数の論理ユニットを有する少なくとも1台のストレージであって、前記コンピュータまたは前記コンピュータを起動するユーザ毎に、前記コンピュータが接続する前記論理ユニットが割当てられるという構成を有する第一のストレージと、
前記第一のストレージが有する論理ユニットの複製を保存する第二のストレージと、
前記コンピュータと前記第一ストレージ間または前記コンピュータと前記第二のストレージ間のWriteデータを保持し、中継するキャッシュ装置とが、
ネットワークを介して接続されているネットワークストレージコンピュータシステムにおいて、
前記管理サーバは、
前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断を行う同期点管理手段と、
前記キャッシュ装置に、データ同期点に達した前記論理ユニットに関するキャッシュ装置の有する記憶領域内のWriteデータの複製イメージ作成命令を通知し、前記キャッシュ装置から受信した複製イメージ作成終了通知により、前記キャッシュ装置に、作成されたWriteデータの複製イメージから、前記第一のストレージの論理ユニット、前記第二のストレージの論理ユニット、または前記第一のストレージの論理ユニットと前記第二のストレージの論理ユニットに転送する転送命令を通知する、キャッシュ制御手段と、
前記第一のストレージと前記第二のストレージの論理ユニットの複製を作成するストレージ制御手段と、
同期開始時間と、同期終了時間と、同期結果と、同期の結果作成された前記第一のストレージの論理ユニットの複製と前記第二のストレージの論理ユニットの複製を管理する、同期管理手段と、
前記コンピュータの障害後のネットワークストレージコンピュータシステム復旧時に、第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製を前記コンピュータが接続するシステム起動領域として登録する回復手段と、
を備え、
前記キャッシュ装置は、
前記管理サーバの複製イメージ作成命令に基づき、論理ユニットヘのWriteデータの複製イメージを、前記キャッシュ装置の有する記憶領域に作成し、作成終了通知を前記管理サーバに通知する複製イメージ作成手段と、
前記管理サーバの転送命令に基づき、Writeデータの複製イメージを前記第一のストレージ、前記第二のストレージ、または前記第一のストレージと前記第二のストレージに転送する転送手段と、
を備える、
ことを特徴とするネットワークストレージコンピュータシステム。 - 請求項1または2に記載のネットワークストレージコンピュータシステムにおいて、
前記管理サーバの前記同期点管理手段は、
前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断と、
前記論理ユニット毎に、または、前記論理ユニット一律にあらかじめ定められた時間になった場合に、該当する論理ユニットがデータ同期点に達したと判断する第2の判断と、を行い、
前記管理サーバは、
前記第1のストレージの論理ユニットの複製と前記第2のストレージの論理ユニットの複製が、前記第1の判断によりデータ同期点に達したと判断されて作成されたか、前記第2の判断によりデータ同期点に達したと判断されて作成されたか、を管理する同期管理手段と、
前記コンピュータ障害時、前記第1の判断によりデータ同期点に達したと判断し作成した第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製をシステム起動領域として、前記第2の判断によりデータ同期点に達したと判断し作成した第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製をリカバリ領域として、登録する回復手段と、
を備え、
前記コンピュータは、コンピュータ障害時、前記管理サーバの回復手段が登録したシステム起動領域とリカバリ領域に接続する手段を備える、
ことを特徴とするネットワークストレージコンピュータシステム。 - 請求項3のネットワークストレージコンピュータシステムシステムにおいて、
前記同期点管理手段は、前記第2の判断において、
前記論理ユニット毎に、または、前記論理ユニット一律にあらかじめ定められた時間になった場合に、前記論理ユニットがあらかじめ定められた条件を満した場合にのみ、該当する論理ユニットがデータ同期点に達したと判断する
ことを特徴とするネットワークストレージコンピュータシステム。 - 管理サーバと、
コンピュータと、
前記コンピュータの起動に必要なデータを保存した複数の論理ユニットを有する少なくとも1台のストレージであって、前記コンピュータまたは前記コンピュータを起動するユーザ毎に、前記コンピュータが接続する前記論理ユニットが割当てられるという構成を有する第一のストレージと、
前記第一のストレージが有する論理ユニットの複製を保存する第二のストレージとが、
ネットワークを介して接続されているネットワークストレージコンピュータシステム、または、
前記管理サーバと、前記コンピュータと、前記第一のストレージと、前記第二のストレージと、前記コンピュータと前記第一ストレージ間または前記コンピュータと前記第二のストレージ間のデータを中継するキャッシュ装置とが、
ネットワークを介して接続されているネットワークストレージコンピュータシステムにおけるネットワークストレージ管理方法において、
前記管理サーバは、同期点管理手段とストレージ制御手段と同期管理手段と回復手段を備え、
前記同期点管理手段が、前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断を行う同期点管理ステップと、
前記ストレージ制御手段が、前記第一のストレージと前記第二のストレージの論理ユニットの複製を作成するストレージ制御ステップと、
前記同期管理手段が、同期開始時間と、同期終了時間と、同期結果と、同期の結果作成された前記第一のストレージの論理ユニットの複製と前記第二のストレージの論理ユニットの複製を管理する、同期管理ステップと、
前記回復手段が、前記コンピュータの障害後のネットワークストレージコンピュータシステム復旧時に、第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製を前記コンピュータが接続するシステム起動領域として登録する回復ステップと、
を備えることを特徴とするネットワークストレージ管理方法。 - 管理サーバと、
コンピュータと、
前記コンピュータの起動に必要なデータを保存した複数の論理ユニットを有する少なくとも1台のストレージであって、前記コンピュータまたは前記コンピュータを起動するユーザ毎に、前記コンピュータが接続する前記論理ユニットが割当てられるという構成を有する第一のストレージと、
前記第一のストレージが有する論理ユニットの複製を保存する第二のストレージと、
前記コンピュータと前記第一ストレージ間または前記コンピュータと前記第二のストレージ間のWriteデータを保持し、中継するキャッシュ装置とが、
ネットワークを介して接続されているネットワークストレージコンピュータシステムにおけるネットワークストレージ管理方法において、
前記管理サーバは、同期点管理手段とキャッシュ制御手段とストレージ制御手段と同期管理手段と回復手段を備え、
前記同期点管理手段が、前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断を行う同期点管理ステップと、
前記キャッシュ制御手段が、前記キャッシュ装置に、データ同期点に達した前記論理ユニットに関するキャッシュ装置の有する記憶領域内のWriteデータの複製イメージ作成命令を通知し、前記キャッシュ装置から受信した複製イメージ作成終了通知により、前記キャッシュ装置に、作成されたWriteデータの複製イメージから、前記第一のストレージの論理ユニット、前記第二のストレージの論理ユニット、または前記第一のストレージの論理ユニットと前記第二のストレージの論理ユニットに転送する転送命令を通知する、キャッシュ制御ステップと、
前記ストレージ制御手段が、前記第一のストレージと前記第二のストレージの論理ユニットの複製を作成するストレージ制御ステップと、
前記同期管理手段が、同期開始時間と、同期終了時間と、同期結果と、同期の結果作成された前記第一のストレージの論理ユニットの複製と前記第二のストレージの論理ユニットの複製を管理する、同期管理ステップと、
前記回復手段が、前記コンピュータの障害後のネットワークストレージコンピュータシステム復旧時に、第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製を前記コンピュータが接続するシステム起動領域として登録する回復ステップと、
を備え、
前記キャッシュ装置は、複製イメージ作成手段と転送手段とを備え、
前記複製イメージ作成手段が、前記管理サーバの複製イメージ作成命令に基づき、論理ユニットヘのWriteデータの複製イメージを、前記キャッシュ装置の有する記憶領域に作成し、作成終了を前記管理サーバに通知する複製イメージ作成ステップと、
前記転送手段が、前記管理サーバの転送命令に基づき、Writeデータの複製イメージを前記第一のストレージ、前記第二のストレージ、または前記第一のストレージと前記第二のストレージに転送する転送ステップと、
を備える、
ことを特徴とするネットワークストレージ管理方法。 - 管理サーバと、
コンピュータと、
前記コンピュータの起動に必要なデータを保存した複数の論理ユニットを有する少なくとも1台のストレージであって、前記コンピュータまたは前記コンピュータを起動するユーザ毎に、前記コンピュータが接続する前記論理ユニットが割当てられるという構成を有する第一のストレージと、
前記第一のストレージが有する論理ユニットの複製を保存する第二のストレージとが、
ネットワークを介して接続されているネットワークストレージコンピュータシステム、または、
前記管理サーバと、前記コンピュータと、前記第一のストレージと、前記第二のストレージと、前記コンピュータと前記第一ストレージ間または前記コンピュータと前記第二のストレージ間のデータを中継するキャッシュ装置とが、
ネットワークを介して接続されているネットワークストレージコンピュータシステムにおける管理サーバにおいて、
前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断を行う同期点管理手段と、
前記第一のストレージと前記第二のストレージの論理ユニットの複製を作成するストレージ制御手段と、
同期開始時間と、同期終了時間と、同期結果と、同期の結果作成された前記第一のストレージの論理ユニットの複製と前記第二のストレージの論理ユニットの複製を管理する、同期管理手段と、
前記コンピュータの障害後のネットワークストレージコンピュータシステム復旧時に、第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製を前記コンピュータが接続するシステム起動領域として登録する回復手段と、
を備えることを特徴とする管理サーバ。 - 管理サーバと、
コンピュータと、
前記コンピュータの起動に必要なデータを保存した複数の論理ユニットを有する少なくとも1台のストレージであって、前記コンピュータまたは前記コンピュータを起動するユーザ毎に、前記コンピュータが接続する前記論理ユニットが割当てられるという構成を有する第一のストレージと、
前記第一のストレージが有する論理ユニットの複製を保存する第二のストレージと、
前記コンピュータと前記第一ストレージ間または前記コンピュータと前記第二のストレージ間のWriteデータを保持し、中継するキャッシュ装置とが、
ネットワークを介して接続されているネットワークストレージコンピュータシステムにおける管理サーバにおいて、
前記コンピュータの使用終了を検出した場合に、コンピュータが使用終了直前まで接続していた論理ユニットが、データ同期点に達したと判断する第1の判断を行う同期点管理手段と、
前記キャッシュ装置に、データ同期点に達した前記論理ユニットに関するキャッシュ装置の有する記憶領域内のWriteデータの複製イメージ作成命令を通知し、前記キャッシュ装置から受信した複製イメージ作成終了通知により、前記キャッシュ装置に、作成されたWriteデータの複製イメージを前記第一のストレージの論理ユニット、前記第二のストレージの論理ユニット、または前記第一のストレージの論理ユニットと前記第二のストレージの論理ユニットに転送する転送命令を通知する、キャッシュ制御手段と、
前記第一のストレージと前記第二のストレージの論理ユニットの複製を作成するストレージ制御手段と、
同期開始時間と、同期終了時間と、同期結果と、同期の結果作成された前記第一のストレージの論理ユニットの複製と前記第二のストレージの論理ユニットの複製を管理する、同期管理手段と、
前記コンピュータの障害後のネットワークストレージコンピュータシステム復旧時に、第一のストレージの論理ユニットの複製、または、第二のストレージの論理ユニットの複製を前記コンピュータが接続するシステム起動領域として登録する回復手段と、
を備える、
ことを特徴とする管理サーバ。 - 請求項1〜4、7、8のうちいずれか1項に記載の手段としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006266478A JP2008084264A (ja) | 2006-09-29 | 2006-09-29 | ネットワークストレージコンピュータシステム、ネットワークストレージ管理方法、管理サーバ、およびそのためのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006266478A JP2008084264A (ja) | 2006-09-29 | 2006-09-29 | ネットワークストレージコンピュータシステム、ネットワークストレージ管理方法、管理サーバ、およびそのためのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008084264A true JP2008084264A (ja) | 2008-04-10 |
Family
ID=39355021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006266478A Pending JP2008084264A (ja) | 2006-09-29 | 2006-09-29 | ネットワークストレージコンピュータシステム、ネットワークストレージ管理方法、管理サーバ、およびそのためのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008084264A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015007901A (ja) * | 2013-06-25 | 2015-01-15 | 株式会社ゲットワークス | バックアップ方法およびサーバ内蔵コンテナ |
CN113750521A (zh) * | 2020-06-01 | 2021-12-07 | 上海莉莉丝科技股份有限公司 | 数据存储系统及方法 |
-
2006
- 2006-09-29 JP JP2006266478A patent/JP2008084264A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015007901A (ja) * | 2013-06-25 | 2015-01-15 | 株式会社ゲットワークス | バックアップ方法およびサーバ内蔵コンテナ |
CN113750521A (zh) * | 2020-06-01 | 2021-12-07 | 上海莉莉丝科技股份有限公司 | 数据存储系统及方法 |
CN113750521B (zh) * | 2020-06-01 | 2024-03-22 | 上海莉莉丝科技股份有限公司 | 数据存储系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4796854B2 (ja) | 差分リモートコピーにおける中間ボリュームのデータ溢れ対策 | |
EP1179770B1 (en) | File system | |
US7293194B2 (en) | Method and device for switching database access part from for-standby to currently in use | |
US8326805B1 (en) | High-availability file archiving | |
US8285824B2 (en) | Storage system and data replication method that refuses one or more requests for changing the first logical configuration information until the first storage apparatus and second storage apparatus are synchronized | |
JP2948496B2 (ja) | データ処理システム内で複写データ一貫性を維持するためのシステムおよび方法 | |
JP4668763B2 (ja) | ストレージ装置のリストア方法及びストレージ装置 | |
US7302536B2 (en) | Method and apparatus for managing replication volumes | |
JP5026145B2 (ja) | リモートミラーされたクラスタファイルサーバでのフェイルオーバ方法 | |
US20230305936A1 (en) | Methods and systems for a non-disruptive automatic unplanned failover from a primary copy of data at a primary storage system to a mirror copy of the data at a cross-site secondary storage system | |
CN105739924A (zh) | 基于缓存集群的缓存方法和系统 | |
JP2004334574A (ja) | ストレージの運用管理プログラム、運用管理方法及び管理計算機 | |
JP2006023889A (ja) | リモートコピーシステム及び記憶装置システム | |
JP2007286860A (ja) | データ転送方法及び情報処理装置 | |
JP2005084963A (ja) | ファイル共有装置及びファイル共有装置間のデータ移行方法 | |
JP2009157785A (ja) | 待機系計算機の追加方法、計算機及び計算機システム | |
JP2007206759A (ja) | ストレージシステム | |
JP4201447B2 (ja) | 分散処理システム | |
JP2006268531A (ja) | データ処理システム及びデータベースの管理方法 | |
JP5292351B2 (ja) | メッセージキュー管理システム及びロックサーバ及びメッセージキュー管理方法及びメッセージキュー管理プログラム | |
JP4537423B2 (ja) | ユーザ操作端末の記憶装置情報制御方式 | |
US20050278382A1 (en) | Method and apparatus for recovery of a current read-write unit of a file system | |
US8060709B1 (en) | Control of storage volumes in file archiving | |
WO2015198439A1 (ja) | ストレージシステムおよびストレージシステムのバックアップ作成方法 | |
JP2006185108A (ja) | ストレージシステムのデータを管理する管理計算機及びデータ管理方法 |