JP4341897B2 - 記憶装置システム及びデータ複製方法 - Google Patents

記憶装置システム及びデータ複製方法 Download PDF

Info

Publication number
JP4341897B2
JP4341897B2 JP2003168588A JP2003168588A JP4341897B2 JP 4341897 B2 JP4341897 B2 JP 4341897B2 JP 2003168588 A JP2003168588 A JP 2003168588A JP 2003168588 A JP2003168588 A JP 2003168588A JP 4341897 B2 JP4341897 B2 JP 4341897B2
Authority
JP
Japan
Prior art keywords
cluster
storage device
port
remote copy
copy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003168588A
Other languages
English (en)
Other versions
JP2004145855A (ja
Inventor
愛 里山
康友 山本
直人 松並
弘治 荒井
大野  洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003168588A priority Critical patent/JP4341897B2/ja
Priority to US10/641,981 priority patent/US20040103254A1/en
Priority to EP04004379A priority patent/EP1486862A3/en
Publication of JP2004145855A publication Critical patent/JP2004145855A/ja
Application granted granted Critical
Publication of JP4341897B2 publication Critical patent/JP4341897B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2066Optimisation of the communication load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2206/00Indexing scheme related to dedicated interfaces for computers
    • G06F2206/10Indexing scheme related to storage interfaces for computers, indexing schema related to group G06F3/06
    • G06F2206/1012Load balancing

Description

【0001】
【発明の属する技術分野】
本発明は、遠隔地にあるディスク装置間でデータをコピーする技術(リモートコピー技術)に関する。
【0002】
【従来の技術】
地震、火災、ハリケーンといった局地的な災害がディスクシステムの設置サイトを襲った場合、障害が記憶装置システム全体に及ぶ可能性があり、ディスクシステムに格納されているデータを全て喪失する可能性がある。この問題を解決する手段の一つとして、リモートコピー機能がある。
【0003】
リモートコピーとは、ディザスタリカバリを目的として、物理的に離れた場所にある複数の記憶装置システム間で、ホストコンピュータの介在なしにデータの2重書きを行うものである。正側の記憶装置システムに障害が発生した場合には、ホストコンピュータは副側の記憶装置システムを用いて業務を続ける。
【0004】
リモートコピー処理が実行される情報処理システムにおいては、物理的に離れた場所にそれぞれ配置された記憶装置システムが専用回線あるいは公衆回線でお互いに接続されている。ある記憶装置システムが有する論理的な記憶領域(以下,「論理ボリューム」)のうち、第1サイトの記憶装置システム上にあるコピー対象である論理ボリューム(以下「コピー元論理ボリューム」と記す。 )と同容量の論理ボリュームが第2サイトの記憶装置システム上に、コピー元論理ボリュームとペアの論理ボリューム(以下「コピー先論理ボリューム」と記す)として形成される。そして、第1サイトのコピー元論理ボリュームのデータが第2サイトのコピー先論理ボリュームにコピーされる。また、ホストコンピュータが第1サイトにあるコピー元論理ボリューム内のデータを更新した場合、当該更新データは第2サイトの記憶装置システムに転送され、コピー先論理ボリュームにも書き込まれる。このようにリモートコピーの技術では第1サイトと第2サイトにおいて論理ボリュームの2重化状態が保たれる。
【0005】
従って、リモートコピー技術を用いると、複数の記憶装置システムを有する情報処理システムにおいて、複数の記憶装置システムで同一内容の論理ボリュームを保持することができる。このため、地震や洪水などの自然災害、あるいは火災やテロなどの人的災害により第1サイトが使用不能になっても、ホストコンピュータは第2サイトの記憶装置システム上の論理ボリュームを使用して業務を迅速に再開できる。
【0006】
尚、リモートコピー技術は、特許文献1に開示されている。
【0007】
また、第一の記憶装置システム内に存在する記憶領域に格納されているデータを第二の記憶装置システムへ移動し、ホストコンピュータが用いる記憶装置システムを第一の記憶装置システムから第二の記憶装置システムへ変更するデータ移行技術は、記憶装置システムを旧機種から新機種へ変更する場合や、機材保守等のためにホストコンピュータから記憶装置システムへのアクセスを制限したい場合に有効である。データ移行技術の中には、計算機から記憶装置システムに対するアクセスは継続して受けつつ、記憶装置システム間でデータ移行を行うための技術があり、例えば特許文献2や特許文献3に開示されている。
【0008】
【特許文献1】
米国特許第5742792号明細書
【特許文献2】
米国特許第6108748号明細書
【特許文献3】
公開2001−331355号公報
【0009】
【発明が解決しようとする課題】
SAN(Storage Area Network)の普及に伴い、ストレージ装置に対し容量及び性能に関するスケーラビリティが要求されている。特に、容量に比例した性能がストレージ装置に対して要求されている。そこで係る要求に応えるために、従来のストレージ装置を1クラスタ(若しくは1記憶装置サブシステム)とし、複数クラスタをクラスタ間接続機構で接続することにより、クラスタ構成記憶装置システムが構築される。
【0010】
各クラスタはネットワーク経由で計算機からの入出力要求を受け付けるが、計算機からはクラスタ構成記憶装置システムが1台の記憶装置システムとして認識される。
【0011】
係るクラスタ構成記憶装置システムにおいてリモートコピー処理を実行する場合、コピー元ボリュームが属するクラスタ内のリモートコピー用に設定されたチャネルポートを用いてデータが転送される。チャネルポートはリモートコピー専用で使う場合もあれば、通常I/Oと共有して使用する場合もある。リモートコピーペアをリモートコピーポートに割り当てる際には、複数のリモートコピーポート間で順番にリモートコピーポートを選択している。
【0012】
しかし、リモートコピー処理においてコピーすべきデータの量はペア毎に異なることから、特定のクラスタのリモートコピー用ポートやプロセッサに処理が集中する可能性がある。
【0013】
本発明の目的は、記憶装置システム内でリモートコピー処理による負荷を分散させることができる技術を提供することである。
【0014】
本発明の他の目的は、クラスタ構成記憶装置システムが有する複数のリモートコピー用ポート間若しくはクラスタ間で負荷が分散されるよう、リモートコピー処理に用いられるポート若しくはプロセッサを選択できる技術を提供することである。
【0015】
また、本発明の他の目的は、コピーされるデータが格納されているクラスタとは異なるクラスタの制御によって、リモートコピー処理を実行することができる技術を提供することである。
【0016】
【課題を解決するための手段】
上記課題を解決するために、本発明においては、計算機システムにおいて、複数のディスク装置と、該複数のディスク装置を接続する制御部と、ネットワークに接続される複数のポートとを各々が有する、複数の記憶装置サブシステムと、前記複数の記憶装置サブシステムを相互に接続する記憶装置サブシステム間接続部とを有する一又は複数の記憶装置システムと、前記ネットワークに接続された管理計算機とを設け、リモートコピーのコピー元及びコピー先の前記記憶装置システムは、それぞれ自システム内の前記複数のポート各々の負荷状況を示す負荷情報を取得して前記管理計算機に送信し、前記管理計算機は、コピー元の前記記憶装置システムの前記負荷情報に基づいて決定される第一のポートをコピー元の前記記憶装置システムに通知すると共に、コピー先の前記記憶システムの前記負荷情報に基づいて決定される第二のポートをコピー先の前記記憶装置システムに通知する一方、コピー先のディスクとしてコピー先の前記記憶装置システム内の前記第二のポートと同じ記憶装置サブシステム内のディスクが優先的に選択されるように、コピー先とするディスクの選択の支援を行い、コピー元の前記記憶装置システムは、前記第一のポートを用いて、自システム内の複数のディスク装置のいずれかに格納されているデータを、前記ネットワーク及びコピー先の前記記憶装置システムの前記第二のポートを介して、コピー先の前記記憶装置システムにコピーするようにした。
また本発明においては、第一の記憶装置システムに格納されているデータを、ネットワークを介して前記第一の記憶装置システムに接続される第二の記憶装置システムにコピーするデータ複製方法において、前記第一及び第二の記憶装置システムは、それぞれ複数のディスク装置と該複数のディスク装置に対する入出力要求を制御する制御装置と、前記ネットワークに接続される一又は複数のポートとを各々有する、複数の記憶装置サブシステムと、該複数の記憶装置サブシステム間を接続するサブシステム間接続装置とを有しており、前記ネットワークには管理計算機が接続され、リモートコピーのコピー元及びコピー先の前記記憶装置システムが、それぞれ自システム内の前記複数のポート各々の負荷状況を示す負荷情報を取得して前記管理計算機に送信し、前記管理計算機が、コピー元の前記記憶装置システムの前記負荷情報に基づいて決定される第一のポートをコピー元の前記記憶装置システムに通知すると共に、コピー先の前記記憶システムの前記負荷情報に基づいて決定される第二のポートをコピー先の前記記憶装置システムに通知する一方、コピー先のディスクとしてコピー先の前記記憶装置システム内の前記第二のポートと同じ記憶装置サブシステム内のディスクが優先的に選択されるように、コピー先とするディスクの選択の支援を行う第一のステップと、コピー元の前記記憶装置システムが、前記第一のポートを用いて、自システム内の複数のディスク装置のいずれかに格納されているデータを、前記ネットワーク及びコピー先の前記記憶装置システムの前記第二のポートを介して、コピー先の前記記憶装置システムにコピーする第二のステップとを設けるようにした。
【0017】
【発明の実施の形態】
<第一の実施形態>
図1は、本発明が適用される計算機システムの一構成例を示す図である。計算機システムは、2台のクラスタ構成記憶装置システム1(以下、これら2台のクラスタ構成記憶装置システムをそれぞれシステム#1、システム#2と呼ぶ。)、クラスタ構成記憶装置システム1に格納されたデータを使用する計算機(以下サーバと呼ぶ。)3、及びクラスタ構成記憶装置システムを管理するための計算機(以下ユーザ入出力機器と呼ぶ。)4が、ネットワーク2を介して接続された構成を有する。尚ユーザ入出力機器4は、クラスタ構成記憶装置システム1の保守端末を兼ねている場合もある。保守端末は、クラスタ構成記憶装置システム1内に備えられていても、外部に備えられていてもよい。また、図1では計算機システム内にクラスタ構成記憶装置システム1が2台存在する例を示したが、計算機システム内に存在するクラスタ構成記憶装置システム1の台数を2台に限られることはなく、複数台であれば何台であっても良い。
【0018】
クラスタ構成記憶装置システム1は、複数のクラスタ(若しくは記憶装置サブシステムと呼ぶ。)11と、各々のクラスタ11間を接続するクラスタ間接続機構12とを有する。尚、クラスタ間接続機構12は、例えばスイッチである。
【0019】
各クラスタ11は、制御部10、複数のディスク装置15、及び一又は複数のポート18を有する。各クラスタ11は、上位の計算機であるサーバ3及びユーザ入出力機器4とネットワーク2を介して接続される。
【0020】
制御部10は、複数のメモリユニット19、ポートを介してネットワーク2と接続されサーバ3やユーザ入出力機器4との間の入出力を制御する複数台のチャネルアダプタ(以下CHAと呼ぶ)13、及び複数のディスク装置と接続されディスク装置への入出力を制御する複数台のディスクアダプタ(以下、DKAと呼ぶ。)14を有する。
【0021】
CHA13とDKA14は、制御部10内に搭載されたプロセッサである。CHA13は、ポート18を介してクラスタ11に入力されるサーバ3からのコマンドの解析や、サーバ3とクラスタ11間でのデータ転送を制御するためのプログラムを実行する。クラスタ構成記憶装置システム1が、いわゆるオープン系のオペレーティングシステムが実行されているサーバ3からコマンドを受信し、このコマンドに応じた処理を実行しなければならない場合には、サーバ3とクラスタ構成記憶装置システム1との間のインターフェースの違いを克服するために必要なハードウェアとプログラムが、更にCHAの構成要素として追加される。
【0022】
DKA14は、パリティデータの生成等、複数のディスク装置から構成されるディクスアレイの制御と、ディスク装置15と制御部10との間のデータ転送の制御とを実施するためのプログラムを実行する。ディスク装置15は複数のポートを有し,複数のポートは複数のパスを介して各々異なるDKA14と接続されている。したがって複数のDKA14から同一のディスク装置15にアクセスできる。
【0023】
メモリユニット19は、CHA、DKA等の各プロセッサからアクセス可能な共有メモリ17とキャッシュメモリ16を備える。各プロセッサは、各プロセッサが実行するジョブの管理に必要な情報や、キャッシュメモリの管理情報等、各プロセッサで共有されるべきデータを共有メモリ17に格納する。共有メモリ17には、クラスタ内のリソース負荷情報173、ボリュームのペア情報172、処理要求キュー(図示せず)、及びクラスタ間連携時に必要となる他クラスタ情報の格納位置を示す情報171が格納される。尚ここで「ペア」とは、コピーされるデータが格納されるコピー元となる記憶領域(以下「コピー元ボリューム」と呼ぶ)とコピー先となる記憶領域(以下「コピー先ボリューム」)の組のことをいう。
【0024】
共有メモリ17に記憶される情報は、クラスタ構成記憶装置システム1内のある一つのクラスタの共有メモリ17にまとめて格納されていても良いし、複数クラスタ各々の共有メモリ17に同じ情報が重複して格納されていても良い。本実施形態では、クラスタ毎に情報を分散して格納する。尚、各クラスタ内ではメモリユニット19が2重化されており、各クラスタは、共有メモリやキャッシュメモリ中に格納されているデータも重複して有する。
【0025】
クラスタ11(クラスタ#1)は接続機構12を介して,同一クラスタ構成記憶装置システム1(システム#1)内の他クラスタ(例えばクラスタ#2)に情報を通知したり、クラスタ#2が直接クラスタ#1内に格納されている情報を参照することができる。またクラスタ11はネットワーク2を介してサーバ3へ情報を通知できる。
【0026】
ユーザ入出力機器4は、クラスタ構成記憶装置システム1を使用するユーザがクラスタ構成記憶装置システム1にリモートコピー処理を実行させる際に、クラスタ構成記憶装置システム1にコピー先ボリュームを指示するために使用される機器である。具体的には、SVP(Service Processor)等の保守端末である。ユーザ入出力機器4は表示画面41を有する。ユーザ入出力機器4は、表示画面41にコピー先ボリュームの候補を出力してユーザに提示し、ユーザがコピー先ボリュームを選択する際の視覚的支援を行う。なおサーバ3とユーザ入出力機器4は同じ計算機であっても良い。
【0027】
クラスタ11の構成例を図5に示す。クラスタ11は複数のディスク装置15と制御部10を有する。制御部10は複数のCHA13、複数のDKA14、複数の共有メモリ17、複数のキャッシュメモリ16、及びクラスタ11が同じクラスタ構成記憶装置システム1内の他のクラスタと通信するためのデータ転送制御コントローラ130を有する。複数のCHA、複数のDKA、複数のキャッシュメモリ、複数の共有メモリ、及びデータ転送制御コントローラ130はパス(通信路)140により相互に接続されている。尚、図5ではクラスタの信頼性向上のため、パス140が2本備えられ、CHA、DKA、キャッシュメモリ、共有メモリ、及びデータ転送制御コントローラが各々2本のパス140いずれにも接続されているクラスタの構成例を示している。複数のディスク装置15は各々複数のDKAと接続されている。
【0028】
ディスク装置15は物理的記憶領域を有するハードウェアである。サーバ3は、複数のディスク装置15が有する物理的な記憶領域が論理的に分割された、論理的な記憶領域を単位として記憶領域を管理し、使用する。分割された各々の論理的な記憶領域を論理ボリューム151と称する。論理ボリューム151の容量及び論理ボリューム151のクラスタ構成記憶装置システム1内における物理的な位置(即ち論理ボリュームに対応する物理的な記憶領域)は、ユーザ入出力機器4又はサーバ3を用いてユーザが指定できる。論理ボリュームの物理的な位置を示す情報は、共有メモリ17内に保存される。
【0029】
共有メモリ17に格納されるボリュームペア情報172は、ペア情報テーブル21及びボリューム情報テーブル31を有する。図2はペア情報テーブル21の一例を、図3はボリューム情報テーブル31の一例を示す図である。尚、コピーのペアは、複数のコピー元ボリュームと複数のコピー先ボリュームとが組となっている、複数個対複数個のペアでもよい。本実施例では正ボリュームと副ボリュームの対応が1対1である例を示している。尚、複製されるオリジナルデータを保持するボリューム(即ちコピー元ボリューム)のことを正ボリューム、オリジナルデータの複製データを保持するボリューム(即ちコピー先ボリューム)を副ボリュームと称する。
【0030】
図2に示すペア情報テーブル21は、ペア番号22、正ボリュームのシステム番号23、正ボリュームボリューム番号24、正ボリュームクラスタ番号25、副ボリュームのシステム番号26、副ボリュームボリューム番号27、副ボリュームクラスタ番号28、ペア状態29、及びコピーポインタエントリ30の各エントリを有する。
【0031】
ペア番号22には正ボリュームと副ボリュームのペアを示す識別情報、具体的にはペア番号が登録される。正ボリュームのシステム番号23とボリューム番号24とクラスタ番号25には、対応するペアを構成する正ボリュームを示す情報、即ち正ボリュームが属するクラスタ構成記憶装置システム1の識別情報であるシステム番号、正ボリュームを識別するための識別情報であるボリューム番号、及び正ボリュームが属するクラスタの識別情報であるクラスタ番号が各々登録される。副ボリュームのシステム番号26とボリューム番号27とクラスタ番号28には、正ボリュームの場合と同様に、副ボリュームが属するクラスタ構成記憶装置システム1の識別情報であるシステム番号、副ボリュームの識別情報であるボリューム番号、及び副ボリュームを管理しているクラスタの識別情報であるクラスタ番号の各々が登録される。ペア状態29には、対応するペアがコピー中か、コピーが完了したかといったペアの状態を示す情報が登録される。コピーポインタ30には、対応するペアの正ボリュームのどの範囲までのデータが副ボリュームに既にコピーされたかを示す情報が登録される。
【0032】
図3に示すボリューム情報テーブル31には、リモートコピー処理に使用される情報が登録される。尚、本実施形態においては、クラスタ毎にボリューム情報テーブル31が備えられている。ボリューム情報テーブル31は、ボリューム番号32、正/副33、副ボリュームのボリューム番号34、副ボリュームクラスタ番号35、ボリューム属性36、ペア番号37の各エントリを有する。
【0033】
ボリューム番号31には、クラスタ構成記憶装置システム1が有するある記憶領域(以下「ボリューム」)を特定するための識別情報であるボリューム番号が登録される。正/副33には、対応するボリュームが正ボリュームか副ボリュームかを示す情報が登録される。対応するボリュームが正ボリュームである場合、ペアである副ボリュームに関する情報がボリューム情報テーブルに登録される。即ち対応する副ボリュームの識別情報であるボリューム番号が、ボリューム番号34エントリに、又副ボリュームを管理するクラスタの識別情報であるクラスタ番号がクラスタ番号35エントリに登録される。ボリューム属性36には、ボリューム番号32に対応するボリュームのフォーマット形式、容量、状態等の属性情報が登録される。これらの属性情報は、対応するボリュームがリモートコピーのコピー先ボリュームとして設定可能であるか否かを判断する際に用いられる。図3では例として、ボリューム番号が0番であるボリュームに対してペアが3つ生成された場合を示している。図3の場合には、ボリューム番号0番のボリュームのペアの相手は、クラスタ1番のボリューム20番、158番、426番と定義されている。
【0034】
クラスタ構成記憶装置システム1間でリモートコピーを実現するために、本実施形態では、クラスタ構成記憶装置システム1内の複数のクラスタ11各々が、ペア情報テーブル21とボリューム情報テーブル31を有する。そして、ボリューム情報テーブル31には、そのボリューム情報テーブル31を保持するクラスタ11が有する全てのボリュームの情報が格納される。またペア情報テーブル21には、そのペア情報テーブル21を有するクラスタ11が有するボリュームが、正ボリューム若しくは副ボリュームのいずれかとなっている全てのペアに関する情報が登録される。
【0035】
図7はポート管理情報テーブル71の一例を示す。ポート管理情報テーブル71は、クラスタ構成記憶装置システム1の1つないし複数のクラスタの共有メモリ17に格納される。ポート管理情報テーブル71には、自クラスタ構成記憶装置システム1が有するポートが、どの装置に接続されているかを示す情報が登録される。即ち、クラスタ構成記憶装置システムが有する各ポートの識別情報であるポート番号72毎に、ポートを内蔵しているクラスタの識別情報であるクラスタ番号73、そのポートを制御するCHAの識別情報であるホストアダプタ番号74、そのポートの接続先を特定するための接続先情報75、及び当該ポートを使用してアクセスされる一又は複数の論理ボリュームを識別するための一又は複数の論理ボリューム番号76が、ポート管理情報テーブル71に格納される。接続先情報75は、対応するポートの接続先装置の種類を示す情報である“ホスト”“記憶装置システム”“接続なし”等の情報と、接続先の装置を識別するための識別情報である接続先番号を有する。尚、接続先番号としては、たとえば接続先装置の名称が“ホスト”でありポートの先にホストコンピュータが接続されているのであれば、そのホストコンピュータを特定する番号が設定される。又、接続先装置の名称が“記憶装置システム”であり、ポートの先にたとえばクラスタ構成記憶装置システムが接続されている場合には、接続先番号としては、接続先のクラスタ構成記憶装置システム内のクラスタのパス番号が設定される。
【0036】
図4は、共有メモリ17に記憶されている他クラスタ情報格納位置171を示す情報の一例を示す図である。他クラスタ情報格納位置171は、メモリ空間対応テーブル(図示せず)と、他クラスタ情報格納位置テーブル81とから構成される。
【0037】
クラスタ構成記憶装置システム1内の各クラスタ11が有する共有メモリ17のメモリ空間(即ち、クラスタ構成記憶装置システム内に存在する複数の共有メモリのメモリ空間)は、全体で一つの仮想的なメモリ空間として扱われる。この場合各クラスタ11が有する共有メモリのメモリ空間は、仮想的なメモリ空間に連続的に割り当てられても良いしばらばらに割り当てられても良い。各クラスタの共有メモリには、仮想的なメモリ空間内の記憶領域を示すアドレスと、物理的なメモリ空間内の記憶領域(即ち現実の共有メモリ内の記憶領域)を示すアドレスとの対応関係を示すメモリ空間対応テーブルが格納されている。
【0038】
図4は、他のクラスタが有する共有メモリに格納されているペア情報テーブル21やボリューム情報テーブル31にアクセスするために用いられる他クラスタ情報格納位置テーブル81の一例を示す図である。他クラスタ情報格納位置テーブル81は、クラスタ番号エントリ82、ペア情報テーブルの先頭アドレスエントリ83、及びボリューム情報テーブルの先頭アドレスエントリ84を有する。クラスタ番号エントリ82にはクラスタを特定するための識別情報であるクラスタ番号が登録される。ぺア情報テーブルの先頭アドレスエントリ83には、仮想的な共有メモリのメモリ空間におけるペア情報テーブルの格納位置を示す先頭アドレスが登録される。ボリューム情報テーブルの先頭アドレスエントリ84には、仮想的な共有メモリのメモリ空間における、ボリューム情報テーブルの格納位置を示す先頭アドレスが登録される。
【0039】
リモートコピーで正ボリュームのデータを副ボリュームにコピーする処理を実行する場合、CHA13又はDKA14が他クラスタのペア情報テーブル21やボリューム情報テーブル31に格納された情報を参照/更新する必要がある。この場合CHA13やDKA14は、参照したい情報が表すペアやボリュームが属するクラスタのクラスタ番号に基づいて他クラスタ情報格納位置テーブル171を参照し、対応するペアやボリュームに関する情報が登録されている共有メモリ内の記憶領域の位置を算出する。
【0040】
例えばクラスタ1番かつボリューム4番のボリュームについてのボリューム情報(即ち、ボリューム情報テーブル31に登録されている情報のうち当該ボリュームに関する情報)は、以下の式で算出されるアドレスが示す仮想的な共有メモリ空間内の記憶領域に格納されている。
【0041】
クラスタ1番のボリューム4番のボリューム情報格納位置=クラスタ1番のボリューム情報テーブル格納先頭アドレス+1ボリューム当たりの情報量×4 (式1)
そこでCHA若しくはDKAは、上述の式1によって仮想的な共有メモリ空間内のアドレスを求め、この仮想的な共有メモリ空間内のアドレスを用いてメモリ空間対応テーブルを参照して、実際の共有メモリの物理的なメモリ空間内でのアドレスを得る。そしてCHA若しくはDKAは、物理的なメモリ空間内でのアドレスを用いてボリューム情報にアクセスするので、CHA若しくはDKAは、他のクラスタ内の共有メモリに格納されているボリューム情報にもアクセスすることができる。
【0042】
尚、ペア情報(即ちペア情報テーブルに格納されている情報のうち任意のペアに関する情報)に関しても、ボリューム情報と同様の方法でCHA若しくはDKAは他のクラスタ内の共有メモリに格納されているペア情報にアクセスすることができる。
以上のように共有メモリ17を仮想的に一つのメモリ空間として扱うことにより、CHA13やDKA14がクラスタ構成記憶装置システム1が有する全てのクラスタ11の共有メモリ17に格納されている情報を参照/更新することが可能になる。
【0043】
図6は、クラスタ構成記憶装置システム1(システム#1)のボリュームを他のクラスタ構成記憶装置システム1(システム#2)のボリュームにバックアップする手順の一例を示したフローチャートである。
【0044】
最初にコピー元のボリュームを有するシステム#1(即ち正システム)内のポートの中から、リモートコピー処理を行うリモートコピー用ポートを選択する必要がある。システム#1は、システム#1内に存在するポート18のうちリモートコピー処理に使用可能な一又は複数のリモートコピー用ポート各々の負荷状況を、ユーザ入出力機器4に通知する。ユーザ入出力機器4は、通知された負荷状況を表示画面41に出力してユーザに提示し、ユーザは提示された情報をもとにリモートコピー用ポート群からリモートコピーに使用するポートを選択する。そして、ユーザはユーザ入出力機器4に選択したポートの識別情報を入力し、ユーザ入出力機器4は入力されたポートの識別情報をシステム#1に送信する(ステップ6001)。尚、正側システム(システム#1)で各リモートコピー用ポートの負荷状況及び空き状況を解析し、リモートコピーに使用するポートの候補を絞り込んだ上で、候補ポートの情報をユーザ入出力機器4に通知し、ユーザ入出力機器4が提示した候補ポートの中からユーザが使用するポートを選択することとしても良い。またシステム#1がリモートコピー用ポートの負荷状況や空き状況を解析し、解析結果に基づいてリモートコピーに使用するポートを選択することとしても良い。
【0045】
次にユーザがユーザ入出力機器4を用いて、バックアップデータを格納する副ボリューム及び副システム側でリモートコピー処理を行うリモートコピー用ポートを選択する(ステップ6002)。ステップ6002においてもステップ6001と同様に、副側のクラスタ構成記憶装置システム(システム#2)が有するリモートコピー用ポートの負荷状況はユーザ入出力機器4を介してユーザに提示され、その情報をもとにユーザがリモートコピー用ポートを選択する。また勿論、副側システム(システム#2)がリモートコピー用ポートの負荷状況や空き状況を解析し、解析結果に基づいてリモートコピーに使用するポートを選択することとしても良い。尚ステップ6002では更に、ユーザは副ボリュームを選択し、ユーザ入出力機器4を用いて、システム#1及びシステム#2内の共有メモリに格納されているペア情報テーブル21に、正ボリュームと副ボリュームをリモートコピーペアとして登録する(ステップ6002)。
【0046】
次にサーバ3がペアを指定し、そのペアに対するコピー処理をクラスタ構成記憶装置システム1に実行させる。具体的には、サーバ3はリモートコピー実行開始を要求するコマンドをクラスタ構成記憶装置システム1に発行する。このコマンドは、サーバ3が指定したペアの正ボリュームを有するクラスタ記憶装置システム1(システム#1)内のクラスタ11に対して発行される(ステップ6003)。
【0047】
コマンドを受け取ったクラスタ11のCHA13はコマンドを解析して、正ボリュームに格納されているデータを副ボリュームへバックアップするためのリモートコピー処理を行う(ステップ6004)。
【0048】
次に、図6に示したリモートコピー処理のステップ6001において、リモートコピー処理に使用するリモートコピー用ポートを選択する手順の一例を、図8に示すフローチャートに従って説明する。図8は、リモートコピー用ポートの選択手順の一例を示すフローチャートである。図8では、ユーザがユーザ入出力機器4から正側システム(システム#1)に対して、予め「コピー元のボリュームが属するクラスタ内のポートから優先的にリモートコピーに使用するポートを選択する」という条件を送信しており、この条件に従ってリモートコピー用ポートを選択する方法の一例を示している。
【0049】
尚本実施形態においては、各ポートが設定によってリモートコピー用ポート若しくは通常のI/O用ポートに分けられており、制御プロセッサもリモートコピー用若しくは通常I/O用に分けられていることを前提とする。しかし、本発明は係る前提に限定されるものではなく、同一ポートでリモートコピー処理と通常I/O処理の双方を実行する構成であってもよい。
【0050】
正側クラスタ構成記憶装置システム1(システム#1)は、コピー元ボリューム(即ち正ボリューム)となるボリュームAが存在するクラスタ(クラスタ#1)内にあるリモートコピー用ポート群の負荷状態を、予め設定されている時間間隔またはユーザ入出力機器4から指定された時間間隔で取得し、ユーザ入出力機器4に出力する(ステップ8001)。
【0051】
ユーザはクラスタ#1内のリモートコピー用ポートのうち、負荷状況が予め設定したしきい値より低いポートがあるかどうか判定する(ステップ8002)。しきい値より負荷状況が低いポートがあれば、ユーザはそのポートをリモートコピーに使用するポートとして選択する(ステップ8003)。
【0052】
しきい値より負荷状況が低いポートがクラスタ#1内になければ、ユーザは正側システム(システム#1)内の他のクラスタから1つクラスタを選択し選択されたクラスタ(クラスタ#2)の識別情報をユーザ入出力機器4に入力する(ステップ8004)。他のクラスタの識別情報をユーザ入出力機器4から受信した正側システム(システム#1)は、クラスタ#2内に存在するリモートコピー用ポートの負荷状況をステップ8001と同様の方法で取得し、再度ユーザ入出力機器4に出力する。ユーザはユーザ入出力機器4の出力画面を参照して、クラスタ#2内のリモートコピー用ポートのうち負荷状況がしきい値より低いものがあるかどうか判定する(ステップ8005)。そしてしきい値より低いリモートコピー用ポートがあれば、その中から実際にリモートコピー処理に使用するポートをユーザは選択し、そのポートの識別情報を正側システム(システム#1)にユーザ入出力機器4を介して送信する(ステップ8006)。
【0053】
クラスタ#2内のリモートコピー用ポートも全て負荷状況がしきい値より高い場合は、正側システム(システム#1)にクラスタ#1及びクラスタ#2以外の他クラスタがあるかどうかシステム#1が判断し、他のクラスタがあればステップ8004へ進む(ステップ8007)。まだ選択していない他のクラスタがなければ、正側システム(システム#1)がクラスタ#1内のリモートコピー用ポートのうち負荷が最も低いリモートコピー用ポート18を選択し、選択されたポートの識別情報をユーザ入出力機器4に出力してユーザに通知する(ステップ8008)。
【0054】
以上の処理によって、ユーザが指定した条件(図8に示す例では、コピー元ボリュームが属するクラスタに存在するリモートコピー用ポートから優先的に、実際にリモートコピー処理に使用するポートを選択するという条件)に従って、ユーザ入出力機器4の画面にリモートコピー用ポート番号、このポートが属するクラスタの番号、及び各ポートの負荷状況が表示され、ユーザは入出力機器4の入力端末を用いて画面に提示された候補ポート中から実際にリモートコピーに利用するポートを選択することができる。表示の方法としては、全ての候補ポートについて一度負荷情報等を提示する方法や、使用できないポートや負荷の高いポートは予めクラスタ構成記憶装置システム1が候補ポートから排除しておき、それらを除いたポートについての情報をユーザ入出力機器4の出力画面に提示する方法がある。
【0055】
尚、候補ポートを予めクラスタ構成記憶装置システム1側で絞り込んでユーザ入出力機器4に提示する場合には、候補ポートを絞り込む基準、即ちどのような条件で候補ポートを絞り込むかを、ユーザが選択又は指定し、予めクラスタ構成記憶装置システム1に通知しておき、クラスタ構成記憶装置システム1は通知された基準に基づいて候補ポートを絞り込む。
【0056】
尚、図8に示した例のように、ユーザが候補ポートの中からリモートコピーに使用されるポートを選択するのではなく、クラスタ構成記憶装置システム1の共有メモリに格納されているプログラムが制御部10によって実行されることによって、クラスタ構成記憶装置システム1の制御部10がポートの負荷状況を示す負荷情報を取得し、図8に示す判断手順に従って、負荷の低いポートを自動的に選択することとしても良い。また、ユーザ入出力機器4内のメモリに格納されているプログラムがユーザ入出力機器4内の演算部によって実行されることにより、ユーザ入出力機器4が例えば図8に示す判断手順に従ってリモートコピーに使用されるポートを選択することとしても良い。
【0057】
尚、コピー先ボリューム(即ち副ボリューム)を有する副システム(システム#2)のリモートコピー用ポートを選択する際にも図8に示す処理と同様の処理が実行される。
【0058】
クラスタ構成記憶装置システム1内のリモートコピー用ポートの負荷状態は、当該リモートコピー用ポートに割り付けられているリモートコピー処理要求(即ち当該リモートコピー用ポートによって実行されることになっている、現在未処理のリモートコピー処理要求)の数に基づいて、CHAによって判断される。リモートコピー処理要求は共有メモリ17内のリモートコピー処理要求キューに格納される(図示せず)。未実行のリモートコピー処理要求がリモートコピー処理要求キューに多く蓄積されている程、そのリモートコピー用ポートの負荷が高いと判断される。負荷状況を予測した結果を反映しても良い。
【0059】
また一見負荷が高いようでも、イレギュラー的に入った要求によりポートの負荷が上がる場合もある。この場合は、係る高負荷な状態は継続しないことを考慮する必要がある。また,過去の負荷状況の周期性を利用して未来の負荷状況を推定することも考えられる。
【0060】
図11はリモートコピー用ポート毎に備えられている、リモートコピー処理要求キューの一例を示す図である。図11に示す例では、リモートコピー用ポート#2の方がリモートコピー処理要求キュー1101内に蓄積されたリモートコピー処理要求1102の合計数が多いため、負荷が高いと判断される。
【0061】
リモートコピー用ポートの負荷を判断する際に、優先度を考慮することもできる。例えば、リモートコピー用ポート#1に関するリモートコピー処理要求であるリモートコピーペア#7の優先度(優先度2)が他のリモートコピー処理要求(優先度1)より高い場合は、リモートコピー用ポート#1の方が負荷が高いと判断される場合がある。ここで優先度とは数が大きい方ほど高いとし、通常は優先度1であるとする。
【0062】
また、リモートコピー用ポートの負荷を判断する際に、コピーされるデータ量を考慮することもできる。例えばリモートコピー用ポート#1のリモートコピー処理要求であるリモートコピーペア#2のコピーデータ量が大きい場合は、同じ1要求でも処理時間が長くかかるため、リモートコピー用ポート#1は負荷が高いと判断される可能性がある。
【0063】
さらに、最初にペアボリュームを作成する際に実行される形成コピー処理の場合、ボリューム全体のコピー処理を行うため、いくつかの同一データ単位のライト処理が継続することが予想される。
【0064】
そこで例えば、優先度2の要求は優先度1の要求の3つ分である、という法則をユーザが経験から決めて、クラスタ構成記憶装置システム1にユーザ入出力機器4から入力して設定しておいてもよいし、係る情報を初期値として内部で設定しておいてもよい。またリモートコピー処理要求キューの内容をユーザ入出力機器の表示画面41に表示させて、キューに登録されているリモートコピー処理要求の内容に応じて、その都度ユーザがリモートコピー処理要求の優先度を判断し、クラスタ構成記憶装置システム1に設定してもよい。例えばリモートコピー処理要求がコピーデータ量の多い要求であったり、形成コピー要求である場合には、当該リモートコピー処理要求の優先度を高く設定することが考えられる。
【0065】
尚、上述の実施形態では主に、どのリモートコピー用ポートを選択するかをユーザが決定する場合について述べたが、クラスタ構成記憶装置システム内の共有メモリに格納されているプログラムが、制御部10によって実行されることにより、クラスタ構成記憶装置システムがリモートコピーに使用されるリモートコピー用ポートを選択する場合もある。
【0066】
次に、図6のステップ6002の処理である,バックアップ先のボリューム(即ち副ボリューム)の選択方法について図13のフローチャートに従って説明する。尚、本実施形態においては、バックアップ先(即ち副側)のクラスタ構成記憶装置システム1の構成が、バックアップ元のクラスタ構成記憶装置システムと同じ構成である場合の例を述べるが、バックアップ先のクラスタ構成記憶装置システムの構成は問わない。また、バックアップ先の記憶装置システムは、必ずしもクラスタ構成を有する記憶装置システムでなくても良い。
【0067】
本実施形態においては、副側クラスタ構成記憶装置システム(システム#2)及びユーザ入出力機器4が、ユーザが副ボリュームを選択する際の支援を行う。即ち、ユーザが副ボリュームを選択する際に、リモートコピーを実行する副側クラスタ構成記憶装置システム内のポートの負荷状態も考慮できるようにし、負荷の低いポートを有するCHAによってリモートコピーが実施されるよう副ボリュームを選択するための支援を、システム#2及びユーザ入出力機器4が行う。
【0068】
副側クラスタ構成記憶装置システムが複数ある場合には、副側クラスタ構成記憶装置システムの設置場所、システムの稼動状態を各副側クラスタ構成記憶装置システムがユーザ入出力機器4に通知し、ユーザ入出力機器4は通知された情報を表示画面41に表示する。ユーザは表示画面41に表示された情報から、バックアップ用のクラスタ構成記憶装置システムを選択し、ユーザ入出力機器4に接続されている入力装置(図示せず。)を用いて選択されたクラスタ構成記憶装置システムの識別情報を入力する(ステップ13001)。
【0069】
ユーザの選択結果は、ユーザ入出力機器4からネットワーク2を介して各副側クラスタ構成記憶装置システムに送信される。ユーザにバックアップ用システムとして選択されたクラスタ構成記憶装置システムは、自クラスタ構成記憶装置システム内に副ボリュームとなる候補ボリュームがあるか調べる(ステップ13002)。候補ボリュームは空きボリュームであり、かつコピー元のボリュームの容量以上の容量を有することが必要となる。そして、候補ボリュームとその候補ボリュームがどの副側クラスタ構成記憶装置システムのどのクラスタに存在するかを示した候補ボリュームのリストを、副側クラスタ構成記憶装置システム1がユーザ入出力機器4に送信する。尚、副側クラスタ構成記憶装置システムが1つしか存在しない場合には、ステップ13001が実行されることなく、副側クラスタ構成記憶装置システムが候補ボリュームリストをユーザ入出力機器4に送信するステップ13002から処理が開始されることとしても良い。
【0070】
ステップ13002で候補となるボリュームが無く、その旨が副側クラスタ構成記憶装置システム1からユーザ入出力機器4に送信された場合には、ユーザ入出力機器4はクラスタ構成記憶装置システムから受信した情報を表示画面41に表示することによって、選択された副側クラスタ構成記憶装置システムはリモートコピー先としては使用できない旨をユーザへ知らせ、更にリモートコピー先として他のクラスタ構成記憶装置システムを選択し直すよう表示画面に表示してユーザに指示する(ステップ13003)。
【0071】
ステップ13002で候補ボリュームがある場合、副側クラスタ構成記憶装置システムは、ポート毎に未実行のリモートコピー処理要求の数を調査することにより、副側クラスタ構成記憶装置システム内のリモートコピー用ポートの負荷状況を取得し、これをユーザ入出力機器4に送信する。ユーザ入出力機器4は、受信したリモートコピー用ポートの負荷状況を表示画面41に出力してユーザに提示する(ステップ13004)。
【0072】
ユーザは表示画面41に出力されたリモートコピー用ポートの負荷状況を参照し、負荷状況の低いポートをリモートコピーに使用する副側のポートとして選択する(ステップ13005)。選択結果はユーザによって入出力装置からユーザ入出力機器4に入力される。
【0073】
選択結果を受信したユーザ入出力機器4は、演算部がメモリに格納されているプログラムを実行することにより、ステップ13002において副側クラスタ構成記憶装置システムから受信した候補ボリュームのリストを参照して選択されたポートと同じクラスタに属する候補ボリュームが存在するかどうか判定する(ステップ13006)。候補ボリュームが存在すれば、ユーザ入出力機器4の演算部がメモリ内のプログラムを実行することにより、候補ボリュームを全てユーザに提示するか、または、候補ボリュームを選択して予め決めた個数だけユーザに提示する。選択する方法は、ランダムでもよいし、ボリューム番号の数字の小さいものから選択しても良い(ステップ13007)。ユーザによって選択されたポートと同じクラスタに属する候補ボリュームがなければ、ユーザ入出力機器4が他のクラスタ内の候補ボリュームをユーザに提示する。提示の仕方はステップ13007と同様に、全てでもよいし、あらかじめ決めた個数でもよい(ステップ13008)。
【0074】
尚、本実施形態においては、副側でリモートコピーに使用されるポートと副ボリュームがなるべく同じクラスタに存在することとなるよう、ユーザによる副ボリューム選択を支援したが、副ボリュームとリモートコピー用ポートとが別々のクラスタに存在することとなるよう、ユーザによる副ボリュームの選択を支援することとしても良い。
【0075】
次に、ユーザ入出力機器4が、クラスタ構成記憶装置システム内のリモートコピー用ポートやボリュームに関する情報を取得し、これをユーザに提示する方法について図9を参照しながら説明する。図9はユーザ入出力機器4のメモリに格納されているプログラムの一例を示す図である。
【0076】
ユーザ入出力機器4の演算部は、図9に示すコピー先ボリューム提示プログラム42を実行することで、クラスタ構成記憶装置システム内のポートやボリュームに関する情報を取得し、ユーザにリモートコピー先となるボリュームやリモートコピー処理に用いられるリモートコピー用ポートの情報を提供する。ユーザ入出力機器4は、具体的には例えばPCやノートPCである。
【0077】
ユーザ入出力機器4はネットワーク2を介してクラスタ構成記憶装置システムとの間で各クラスタの負荷状況等、制御情報をやりとりする。尚、ユーザ入出力機器4はクラスタ構成記憶装置システム1が有する各クラスタ11と専用線で直接接続されており、専用線を介して制御情報が送受信されても良い。この場合ユーザとクラスタ構成記憶装置システム1との間の制御情報のやり取りが、ネットワーク2のトラフィック負荷に影響を与えないというメリットがある。
【0078】
図9に示すコピー先ボリューム提示プログラム42は、クラスタ構成記憶装置システム1内のリモートコピー用ポートやボリュームの情報を取得するデータ取得プログラム191、取得された情報と各種条件(例えば、コピー対象のボリュームとリモートコピーに用いられるポートとが同一クラスタ内にあること等)に基づいて、ユーザへ提示するポートを選択する提案管理プログラム192、及び提案したポートを表示画面41表示するための表示プログラム193のサブプログラムを有する。
【0079】
データ取得プログラム191は、対象となるクラスタ構成記憶装置システム1に設置されたポートやボリュームの情報を取得する際に実行される。データ取得プログラム191が実行されると、クラスタ構成記憶システム1内の全てのポート及び空きボリュームの情報がユーザ入出力機器4によって取得される。データ取得プログラム191が実行されることによって取得されるポートの情報とは、ポートが属するクラスタの識別情報である設置クラスタ番号、ポートの使用状況、ポートで実行される予定の未処理のリモートコピー処理要求数、等である。またデータ取得プログラム191が実行されることによって取得されるボリュームの情報とは、空きボリュームの識別情報とその空きボリュームのボリューム容量等のことである。
【0080】
データ取得プログラム191が実行されると、専用のコマンドがユーザ入出力機器4からクラスタ構成記憶装置システムに送信される。このコマンドを受信したCHA13は共有メモリ17内に格納されたリソース負荷情報173をアクセスすることによって、空きボリュームの情報やポートの負荷情報を取得し、取得された情報はCHAがユーザ入出力機器4に送信する。
【0081】
尚、コマンドを受信したCHAは、予めクラスタ構成記憶装置システム1に設定されている条件、例えば「副ボリュームと同じクラスタに存在するポートである」等の条件に従って、ポートやボリュームを絞り込み、絞り込んだポートやボリュームに関する情報のみをユーザ入出力機器4へ送信しても良い。この方法だと,ユーザ入出力機器4の負担が軽減される。また、CHAはクラスタ構成記憶装置システム1内の全てのポートについての情報をユーザ入出力機器4に送信し、ユーザ入出力機器4が提案管理プログラム192を実行し、提案管理プログラムの処理によって、表示画面41に出力してユーザに提示するポートの情報を絞り込んでも良い。
【0082】
表示プログラム193は、表示画面41に候補ボリュームやリモートコピー用ポートに関する情報を出力し、リモートコピー処理に使用されるボリュームやポートをユーザへ視覚的に提案するために実行されるプログラムである。
【0083】
次に図6のステップ6004で実行されるリモートコピー処理について説明する。
【0084】
ユーザ入出力機器4から正ボリュームと副ボリュームのペアが正側クラスタ構成記憶装置システム及び副側クラスタ構成記憶装置システムに設定されると、正ボリュームから副ボリュームへのデータのコピーが実行される。このペア設定後に実行される正ボリュームから副ボリュームへのデータのコピーを、形成コピーと呼ぶ。また、形成コピー完了後にサーバ3から正ボリュームへライト要求が送信された場合、正側クラスタ構成記憶装置システムが副ボリュームに対して即ライト要求を出す。この結果、副ボリュームが正ボリュームのバックアップとして同じ内容のデータを格納するよう、正側クラスタ記憶装置システムから副側クラスタ構成記憶装置システムへライトデータがコピーされる。この様な正ボリュームのデータの更新に伴う副ボリュームへのデータのコピーを更新コピーと呼ぶ。
【0085】
例えば図12に示すように、正側クラスタ構成記憶装置システム110(システム#1)のクラスタ#11(111)の配下にある論理ボリュームA152から副側クラスタ構成記憶装置システム210(システム#2)のクラスタ#21(211)の配下にある論理ボリュームB252へデータをコピーすることを考える。クラスタ#11(111)のポート182、クラスタ#12(112)のポート186、クラスタ#21(211)のポート282、クラスタ#22(212)のポート286がリモートコピー用ポートとして設定されているものとする。尚、ポート181、ポート185、ポート281、ポート285は、クラスタ構成記憶装置システムとサーバとを接続する通常のポートである。リモートコピー用ポートは、記憶システム間でコマンドをやりとりするため、通常のポートとは異なる。
【0086】
ここで、形成コピーの一例として、図12におけるリモートコピー用ポート186とリモートコピー用ポート282がパスで接続されており、これらのリモートコピー用ポートを介して形成コピー処理が実行される手順を図14のフローチャートに従って説明する。
【0087】
サーバ#1(3)が発行した論理ボリュームA152と論理ボリュームB252間のリモートコピー要求は、クラスタ構成記憶装置システム#1(110)のクラスタ#11(111)のCHA13のリモートコピー処理実行部131が受け取る。尚、リモートコピー処理部はCHAが有するプロセッサがCHAが有するメモリ内に格納されているリモートコピー処理プログラムを実行することによって実現される。リモートコピー要求を受信する際リモートコピー処理実行部131は、コピー先の副ボリュームがクラスタ構成記憶装置システム#2(210)のクラスタ#22(212)の配下に存在するという情報も受け取る(ステップ14001)。
【0088】
次にリモートコピー要求処理実行部131は、コピー対象のデータがクラスタ構成記憶装置システム#1のクラスタ#12内のキャッシュメモリ16上に格納されているか否かを判断し、キャッシュメモリ内に格納されていなければ(ステップ14009)、コピー対象のデータを格納しているディスクと接続されている、クラスタ#11内のDKA14へコピーデータのリード要求を出す(ステップ14002)。
【0089】
クラスタ#11のDKA14はリモートコピー要求処理実行部131からリード要求を受け取り、リード処理を実行する。クラスタ#11のDKA14は、リードしたデータをクラスタ#12のキャッシュメモリ16へ格納し、読み出したデータのアドレスをリード要求の発行元であるクラスタ#11のCHA13へ通知する。クラスタ#11のCHA13は、どのデータをクラスタ#12のキャッシュメモリ16に格納したかを差分管理部132を用いて記録する(ステップ14003)。尚、差分管理部132はCHA13が有するプロセッサがCHA13が有するメモリに格納されている差分管理プログラムを実行することにより実現される。差分管理部132は、クラスタ#12のキャッシュメモリ16に格納されたデータのアドレスをCHA13が有する共有メモリに記憶して管理している。
【0090】
クラスタ#11のCHA13のリモートコピー処理実行部131は、ステップ14001でリモートコピー要求を受け取った時、又はステップ14003においてDKA14からクラスタ#12のキャッシュメモリ16にデータを格納した旨の通知を受けた時、又は予め定められているデータ量分のデータがクラスタ#12のキャッシュメモリ16に溜まった時に、クラスタ#12のCHA13bのリモートコピー処理実行部133を起動する。リモートコピー処理実行部133は、クラスタ#11のCHA13aが有するプロセッサとクラスタ#12のCHA13bが有するプロセッサとの間でプロセッサ通信を行うことで起動されることとしてもよいし、クラスタ#11のCHA13aとクラスタ#12のCHA13bとの間でメッセージを送受信するメッセージ通信で起動されることとしても良い。また、クラスタ#11のCHA13aがクラスタ#12のCHA13bへジョブを登録してリモートコピー処理実行部133を起動しても良い。(ステップ14004)。
【0091】
クラスタ#12のCHA13bのリモートコピー処理実行部133が起動されると、リモートコピー処理が開始される(ステップ14005)。具体的には、リモートコピー処理実行部133は、クラスタ#12のキャッシュメモリ16内にクラスタ#11が格納したデータを、リモートコピー用ポート186を経由して,副側クラスタ構成記憶装置システム#2内のクラスタ#21のキャッシュメモリ16へ転送する。このときリモートコピー処理実行部133は、クラスタ#11がクラスタ#12のキャッシュメモリ16にデータを格納した順にデータをクラスタ#21へ送信するとは限らない。そこでクラスタ#11がクラスタ#12のキャッシュメモリ16にデータを格納した際の書込み順序がわかるように、クラスタ#12のCHA13bは副側クラスタ構成記憶装置システム#2へデータを渡すときに、クラスタ#11が当該データをクラスタ#12のキャッシュメモリ16に格納した順番を示す番号、又はクラスタ#12がクラスタ#11から当該データを受信した時刻をつけて、当該データを副側クラスタ構成記憶装置システム#2へ送信する(ステップ14006)。
【0092】
副側クラスタ構成記憶装置システム#2内のクラスタ#21は、CHA13c内のプロセッサがCHAc13内のメモリに格納されているリモートコピー処理実行プログラム(図示せず)を実行することによって、正側クラスタ構成記憶装置システム#1のクラスタ#12からデータを受け取り、クラスタ#21のキャッシュメモリ16cに格納する(ステップ14007)。そして、クラスタ#21のCHA13cのプロセッサは、キャッシュメモリ16cに格納されているコピーデータを論理ボリュームB252へ格納するよう、クラスタ#21のDKAに指示する。CHA13cからの指示を受信したクラスタ#21内のDKA14eは、クラスタ#12によってコピーデータに付与された時刻順にコピーデータを論理ボリュームB252に格納する。若しくは、DKA14eは、クラスタ#12によってコピーデータに付与された番号順にコピーデータが論理ボリュームB252に格納されるよう、連続した番号が付与されているコピーデータが確保できたら、その都度そのコピーデータを論理ボリュームB252に格納することとしても良い(ステップ14008)。
【0093】
尚、以上の処理において、正側クラスタ構成記憶装置システム#1の論理ボリュームA152から読み出したデータを格納するキャッシュメモリ及び、リモートコピー処理を実行するCHA及びDKAは、クラスタ#11または#12内に存在するキャッシュメモリ、CHA、DKAのいずれであっても良く、上述の例に限定されることなく適宜選択することができる。副側クラスタ構成記憶装置システム#2でも同様である。
【0094】
形成コピー実行中又は、形成コピー完了後にホストからのデータ更新要求を受け付けた場合には、更新内容のみを副側クラスタ構成記憶装置システム#2にコピーする。図15のフローチャートに従って、係る更新コピー処理の手順を説明する。
【0095】
サーバ3からのライト要求をクラスタ#11のCHA13aが受信する(ステップ15001)。CHA13aは、クラスタ#11内のキャッシュメモリ16へ、ライト要求に含まれるライトデータを書き込む。非同期処理の場合は更に、クラスタ#11のCHA13はライトデータをキャッシュメモリ16に書き込んだ後上位サーバ3へ処理終了を報告する(ステップ15002)。
【0096】
クラスタ#11ではどのデータが更新されたかを、差分ビットマップを用いて管理している。差分ビットマップ上では、更新されたデータを示す情報はオン(即ち「1」)とされる。そこでCHA13aはライトデータに対応する差分ビットマップ上の情報をオンにする。更に上位サーバ3からライトデータを受信した順序でデータをリモートコピーするため、クラスタ#11のCHA13aの順序管理136は、順序管理テーブルを用いて、ライトデータを受信した順序を管理する。そこで、CHA13aは、ライトデータを順序管理テーブルに登録する。尚、順序管理136は、CHA13a内のメモリに格納されている順序管理プログラムをCHA13aが有するプロセッサが実行することによって実現される。また差分ビットマップ及び順序管理テーブルは共有メモリ17a上に設けられている(ステップ15003)。
【0097】
次にクラスタ#11のCHA13aは、クラスタ#12のCHA13bに、更新コピー処理を実行するよう指示し、CHA13bのリモートコピー処理実行部133が起動される。尚、ステップ14004と同様に、ステップ15004においてクラスタ#11がCHA13bのリモートコピー処理実行部133を起動する方法も複数ある(ステップ15004)。
【0098】
起動を受けたクラスタ#12のリモートコピー処理実行部133は、コピー処理を開始する。クラスタ#12のリモートコピー処理実行部133は、クラスタ#11内にある順序管理テーブルを参照し、順番の一番早いデータを探す(ステップ15005)。そして、リモートコピー処理実行部133は、順番の一番早いデータをクラスタ#11のキャッシュメモリ16aから取得し、副側クラスタ構成記憶装置システム#2へコピー要求を出す。そのとき順序管理136が順序管理テーブル上で管理している、ライトデータを受信した順序を示す番号であるシーケンス番号も、リモートコピー処理実行部133から副側クラスタ構成記憶装置システム#2に送信する。尚、リモートコピー処理実行部133は、データをクラスタ#12のキャッシュメモリ16b内へ一旦コピーしてからクラスタ構成記憶装置システム#2へコピー要求を出す構成としてもよい。同期処理の場合はこの時点で、クラスタ11のCHA13aが上位サーバ3へライト処理の完了を報告する(ステップ15006)。
【0099】
クラスタ#21にコピーデータをコピーし終わると、リモートコピー処理実行部133は、差分ビットマップ中当該コピーデータを示している領域の信号をオフにする。次にクラスタ#11のCHA13aによって、ライトアフタにて、クラスタ#11のキャッシュメモリ16aから論理ボリュームAに対応するディスクへデータが格納される。更にクラスタ#11のCHA13aは、キャッシュメモリ16aからコピーデータが読み出された後、順序管理テーブルを更新して、当該読み出されたデータを順序管理テーブルから削除する(ステップ15007)。そして、次のコピーデータがあればステップ15005へ戻る。なければ処理を終了する(ステップ15008)。
【0100】
図18に差分ビットマップ1901の一例を、図19に順序管理テーブル1902の一例を各々示す。上述の様に、差分ビットマップと順序管理テーブルは共有メモリ17内に格納されている。
【0101】
差分ビットマップ1901は、各データに対応したビットの値によって、当該データに関し、正ボリュームと副ボリューム間で整合性がとれているかどうかを管理するためのテーブルである。ビットの値が「0」の場合はこのビットに対応するデータについては、正ボリュームと副ボリュームが同じ値を格納していることを示す。ビットの値が「1」の場合には、正ボリュームに格納されているこのビットに対応するデータが更新されており、当該データに関しては、正ボリュームと副ボリュームが異なる値を格納していることを示す。クラスタ構成記憶装置システム1は、リモートコピーペア毎に差分ビットマップを一つずつ有する。
【0102】
順序管理テーブル1902には、データごとに、正側クラスタ構成記憶装置システムに当該データがライトされた順序を示すシーケンス番号19021、サーバ計算機によって当該データがライトされた時刻(即ち当該データが更新された時刻)19022、当該データ(ライトデータ)が格納されているキャッシュメモリ上の位置を示すライトデータ格納位置情報19023が登録されている。クラスタ構成記憶装置システム1は、リモートコピーペア毎に順序管理テーブル1902を一つずつ有する。
【0103】
正側クラスタ構成記憶装置システム(システム#1)は、サーバ計算機3からライトデータを受信すると、ライトデータに付与されているシーケンス番号、サーバ計算機からライトデータを受信した時刻を表すライト時刻、及びライトデータが格納されたキャッシュメモリ上の位置情報を順序管理テーブル1092に登録する。そして、データを副ボリュームにコピーするために、当該データを副側クラスタ構成記憶装置に送信する際、正側クラスタ構成記憶装置システム(システム#1)は、当該データに関する登録を順序管理テーブル1902から削除する。
【0104】
副側クラスタ構成記憶装置システム(システム#2)は、正側クラスタ構成記憶装置システム(システム#1)からライトデータを受け取ると、ライトデータとセットになっているシーケンス番号及びライト時刻を順序管理テーブル1092に登録する。そして、連続したシーケンス番号を有するライトデータが順序管理テーブル1092に登録されたのを契機に、この連続したシーケンス番号を有するライトデータをディスクに書き込むよう、副側クラスタ構成記憶装置システムのCHAが制御する。シーケンス番号が連続しておらず、間の番号が抜けている場合には、その抜けているシーケンス番号が付与されているライトデータが正側クラスタ構成記憶装置システムから到着し、シーケンス番号が連続するまで待った後、ライトデータをディスクに書き込むよう、副側クラスタ構成記憶装置システム(システム#2)は制御する。
【0105】
次に、リモートコピー処理が開始されてからリモートコピー用ポートをダイナミックに変更する際に、変更先のポートを選択する方法を図16のフローチャートに従って説明する。
【0106】
正側の制御部10は、予め決めた時間間隔毎に、各ポートの負荷状況を検索する(ステップ16001)。そして負荷がしきい値を超えているポートがあるかどうかを判定する。尚、ステップ16001において検索した負荷状況をユーザ入出力機器4に通知して、ユーザ入出力機器4から負荷状況をユーザに提示し、ユーザが負荷が閾値を超えているポートがあるかどうかを判定して判定結果をユーザ入出力機器4から入力することとしても良い。
【0107】
正側の制御部10は、負荷がしきい値を超えているポートがあれば本処理を続ける(ステップ16002)。負荷がしきい値を超えたポートが特定のクラスタに偏在している場合には、ステップ16005に進む。それ以外の場合は、ステップ16004に進む(ステップ16003)。負荷が閾値を超えたポートが特定のクラスタ内に偏在している場合には、正側の制御部10は、クラスタ間で負荷を分散する(ステップ16005)。それ以外の場合には、正側の制御部10は、同一クラスタ内のリモートコピー用ポート間で負荷を分散する(ステップ16004)。尚、負荷が閾値を超えたポートが特定のクラスタに偏在している場合とは、例えば、クラスタ構成記憶装置システム内のある特定のクラスタ内では、複数のポートの負荷が閾値を超えており、一方同じクラスタ構成記憶装置システム内の他のクラスタ内には負荷が閾値を超えたポートが存在しない場合のことをいう。
【0108】
図16のステップ16004において実行される、同一クラスタに属する複数のポート間の負荷を分散するための処理(クラスタ内負荷分散処理)を、図20のフローチャートに従って説明する。
【0109】
正側の制御部10は、負荷がしきい値を越えているリモートコピー用ポートをひとつ選択する(ステップ20001)。この際、負荷が閾値を超えているリモートコピー用ポートが複数存在する場合には、もっとも負荷の高いポートを選択する。次に、正側の制御部10は、前記選択されたリモートコピーポートと同じクラスタ内のリモートコピー用ポートの負荷状況を検索して取得し、必要であればユーザ入出力機器に検索結果を出力してユーザに検索結果を提示する(ステップ20002)。そして選択されたリモートコピー用ポートと同じクラスタに属するリモートコピー用ポートの中に、負荷がしきい値よりも低いリモートコピー用ポートがある場合には、ステップ20004へすすみ、なければ本処理を終了する(ステップ20003)。正側の制御部10は、選択されたリモートコピー用ポートと同じクラスタ内のリモートコピー用ポートで、負荷状況がしきい値よりも低いリモートコピー用ポートを選択する(ステップ20004)。
【0110】
次に、正側の制御部10は、ステップ20001で選択された負荷が閾値を超えているリモートコピー用ポートに割り当てられているリモートコピー処理要求の内、どのリモートコピー処理要求をステップ20004で選択されたリモートコピー用ポートに割り当てるか、即ちステップ20004で選択されたリモートコピー用ポートにリモートコピー処理をどれだけ委託するかを決定する。このとき、ステップ20001で選択されたリモートコピー用ポートと同一クラスタ内に存在するリモートコピー用ポートであって、ステップ20001で選択されたリモートコピー用ポートの次に負荷の高いリモートコピー用ポートの負荷状況を考慮する。次に負荷の高いリモートコピー用ポートに割り当てられているリモートコピー処理を、今後他のリモートコピー用ポートに再割当する可能性があるからである。また、リモートコピー要求の再割当後にステップ20001及びステップ20004において選択されたリモートコピー用ポート各々に割当てられているリモートコピーペアの数がバランスがとれるよう、即ちリモートコピー用ポートにかかる負荷が分散できるよう、再割当するリモートコピー要求を決定する。尚、ステップ20002でユーザに提示した負荷状況をもとに、ユーザがステップ20004において選択されたポートに再割り当てするリモートコピーペア、若しくはリモートコピーペアの数を指定し、ユーザ入出力機器4に入力することによって、ユーザから指定されたリモートコピーペア、若しくはユーザから指定された数分のリモートコピーペアをステップ200004で選択されたリモートコピー用ポートに再割当することとしても良い(ステップ20005)。
【0111】
しきい値を超えたポートがクラスタ内にまだあれば、再びステップ20001から処理を続ける(ステップ20006)。
【0112】
尚、図20に示す手順では、負荷が閾値を越えているリモートコピー用ポート1つずつについて順次リモートコピー要求の再割り当てを行ったが、ステップ20001において同一クラスタ内に存在する負荷が閾値を超えているリモートコピー用ポートを全て選択し、ステップ20005においてステップ20001で選択されたリモートコピー用ポート全てについてコピー要求をどのように再割当するか決定することとしても良い。
【0113】
次に図16のステップ16005において実行される、複数のクラスタ間でリモートコピー用ポートの負荷を分散するためのクラスタ間負荷分散処理を、図21のフローチャートに従って説明する。
【0114】
正側の制御部10は、負荷状況がしきい値を越えているリモートコピー用ポートのひとつを選択する(ステップ21001)。そして、正側の制御部10は、ステップ21001で選択されたリモートコピー用ポートが属するクラスタとは異なるクラスタを1つ選択する(ステップ21002)。正側の制御部10は、ステップ21002で選択されたクラスタ内のリモートコピー用ポートの負荷状況を検索して取得し、必要であれば取得結果をユーザ入出力機器4に出力してユーザに提示する(ステップ21003)。ステップ21002で選択されたクラスタ内に、負荷がしきい値よりも低いリモートコピー用ポートがある場合はステップ21007へすすみ、なければステップ21005へ進む(ステップ21004)。ステップ21005においては、ステップ21001で選択されたリモートコピー用ポートが属するクラスタとは異なるクラスタであって、未だ選択されていないクラスタがあるかどうか判断し、あればステップ21002へ進む(ステップ21005)。なければ本処理は終了し、図20に示す手順に従って、同一クラスタ内での負荷分散処理を行う。
【0115】
ステップ21004で負荷が閾値よりも低いリモートコピー用ポートがあった場合には、正側の制御部10は、負荷がしきい値よりも低いリモートコピー用ポートの中から1つリモートコピー用ポートを選択する(ステップ21007)。この際、例えば最も負荷が低いリモートコピー用ポートを選択することとしても良い。そして、ステップ21001で選択されたリモートコピー用ポートとステップ21007で選択されたリモートコピー用ポートの負荷状況に応じて、ステップ21001で選択されたリモートコピー用ポートに割り当てられているリモートコピー処理要求のうち、どの要求もしくは幾つの要求をステップ21007で選択されたリモートコピー用ポートに再割当するか決定する。即ち、ステップ21001で選択されたリモートコピー用ポートに現在割り当てられているモートコピー処理ペアの数を、いくつまで減らすかを決定する(ステップ21008)。この決定処理は、図20のステップ20005と同様の手順によって実行される。
【0116】
他にも負荷が閾値を超えているリモートコピー用ポートが存在する場合には、ステップ21001に戻って処理を続ける。負荷が閾値を超えているリモートコピーが他には存在しない場合には処理を終了する(ステップ21010)。
【0117】
以上図20及び図21を用いて説明したリモートコピー用ポートの変更に際する変更後のリモートコピー用ポートの選択方法においては、一例として正側クラスタ構成記憶装置内での負荷分散に着眼した手順を示したが、副側クラスタ構成記憶装置システムにおいても同様の手順によってリモートコピー用ポートの負荷分散処理を実行することができる。またユーザは、ユーザ入出力機器4に出力される、正側及び副側双方のクラスタ構成記憶装置システムのリモートコピー用ポートの負荷を監視して、双方のクラスタ構成記憶装置システムでリモートコピー用ポートの負荷が分散されるよう、使用されるリモートコピー用ポートポートを変更することもできる。
【0118】
次に、図20または図21に示す手順によって選択されたリモートコピー用ポートに、リモートコピー処理を実際に実行させるための方法を、図17のフローチャートに従って説明する。
【0119】
正側の制御部10は、変更前のリモートコピー用ポートと変更後のリモートコピー用ポートが同一クラスタ内にあるか否か判定する(ステップ17001)。両ポートが同一クラスタ内に存在する場合は、変更前のポートに割り付けられたリモートコピー処理のうち図20のステップ20005や図21のステップ21008において選択された未処理分のリモートコピー処理を、変更後のポートに移動、即ち再割り当てする。具体的には、変更前のリモートコピー用ポートを制御するプロセッサ(CHA)と変更後のリモートコピー用ポートを制御するプロセッサ(CHA)の間で、リモートコピー処理要求を受け渡しを実行する(ステップ17002)。尚、リモートコピー処理の受け渡しは、プロセッサ間で、変更前のリモートコピー用ポートに対応するリモートコピー処理要求キュー1101に格納されている未処理のリモートコピー処理を、変更後のリモートコピー用ポートに対応するリモートコピー処理要求キュー1101に移すことによって実行される。
【0120】
次に、変更前のリモートコピー用ポートによってリモートコピー処理が実行中であるリモートコピーペアについてのリモートコピー処理の再割り当てを実行する。リモートコピー処理が変更前のリモートコピー用ポートによって実行中である場合には、実行中の処理が完了するまでそのリモートコピー処理は変更前のリモートコピー用ポートが実行する。そして実行中の処理が終了してから、リモートコピー処理の受け渡しが行われる。具体的には、リモートコピー処理を実行中のペア情報やペアに割り付けられたポート番号の情報を更新する(ステップ17003)。
【0121】
情報の更新処理が終わったら、変更前のリモートコピー用ポートのリモートコピー処理要求キュー1101から、更新された情報に対応するリモートコピーペアに関する未処理分の要求を削除する(ステップ17004)。
【0122】
ステップ17001で変更前のリモートコピー用ポートと変更後のリモートコピー用ポートが異なるクラスタに存在すると判断した場合、クラスタをまたいだプロセッサ(CHA)間でリモートコピー処理の移動を行う。変更前のリモートコピー用ポートに割り付けられた処理のうち、変更後のリモートコピー用ポートに移動するものとして図20のステップ20005や図21のステップ21008において選択された、未処理分のリモートコピー処理要求を、変更後のポートを制御するプロセッサのリモートコピー処理要求キュー1101へコピーする。コピーは、プロセッサ間通信若しくは、メッセージ通信若しくは、ジョブ間通信によって実行される(ステップ17005)。
【0123】
変更前のリモートコピー用ポートが処理実行中であるリモートコピーペアに関しては、実行中の処理が完了するまで変更前のポートでリモートコピー処理を実行する。実行中の処理が終了したら、リモートコピー用ポートに割り当て中のペア情報やペアに割り当てたポート番号の情報を更新し、ステップ17004と同様にコピーする。更に、リモートコピーペア情報、差分ビットマップ、及び順序管理テーブルを、変更前のリモートコピー用ポートが属するクラスタ内の共有メモリから、変更後のリモートコピー用ポートが属するクラスタ内の共有メモリへコピーする。(ステップ17006)。
【0124】
その後、変更前のリモートコピー用ポートを制御するプロセッサのリモートコピー処理要求キュー1101から、変更後のリモートコピー用ポートに再割当したリモートコピー要求を削除する(ステップ17007)。そして、変更前のリモートコピー用ポートを制御していたプロセッサ(CHA)は、変更後のリモートコピー用ポートを制御するプロセッサ(CHA)へ、リモートコピー処理を実行するよう指示し、リモートコピー処理の起動をかける(ステップ17008)。
【0125】
次に、図20のステップ20002や図21のステップ21003でユーザ入出力機器4に提示されるリモートコピー用ポートの負荷状況を示す情報の一例を図10に示す。
【0126】
入力画面1010は、リモートコピー用ポートの負荷状況をユーザ入出力機器4に表示させるためにユーザが入力する情報の一例を示している。ユーザはユーザ入出力機器4にボリュームを指定するための情報を入力する。入力される情報は、具体的には、当該ボリュームがコピー元又はコピー先ボリュームか否か1011、当該ボリュームが属するクラスタ構成記憶装置システムの番号1012、当該ボリュームが属するクラスタの番号1013、当該ボリュームの番号1014である。
【0127】
これらの情報を入力データ1010として受け付けると、ユーザ入出力機器4のデータ取得部191は、取得したデータに基づいて、入力データが示すボリュームに関するリモートコピー処理を行う可能性のあるリモートコピー用ポートの一覧を表示する。
【0128】
ユーザ入出力機器4が出力するリモートコピー用ポートに関する情報は、入力情報が示すボリュームと同じクラスタ構成記憶装置システムに属するリモートコピー用ポートの一覧であり、その一例が出力情報1020である。リモートコピー用ポートの一覧には、当該ポートが属するクラスタ構成記憶装置システムの番号1021、当該ポートが属するクラスタの番号1022、当該ポートと接続されるCHAの番号1023、当該ポートの使用可否状態1024、当該ポートの負荷状態を表す数値1025、当該ポートの負荷と予め定められている閾値とを比べた際の当該ポートの負荷の大小1026、リモートコピー用パスの番号1027が含まれる。
【0129】
尚、ユーザ入出力機器4は、リモートコピー処理を実行可能なリモートコピー用ポートの候補を全てを出力したり、リモートコピー用ポートの候補の中から更に負荷の低いポートを選択して出力することも可能である。さらにユーザ入出力機器4は、リモートコピー用ポートの候補の中から、変更後のリモートコピー用ポートとなるべきポートを1つ選択し、選択されたリモートコピー用ポートに関する情報のみを出力することとしても良い。
<第二の実施形態>
次に本発明の第二の実施形態を説明する。
【0130】
図22は、第二の実施形態における計算機システムの一例を示す図である。計算機システムは、クラスタ分散記憶装置システム5、クラスタ分散記憶装置システム5に格納されたデータを使用するサーバ3、及びリモートコピー先のボリュームを有する記憶装置システムが存在するサイトであるリモートサイト7が、ネットワーク8で相互に接続された構成を有している。
【0131】
クラスタ分散システム5とリモートサイト7の関係は、図12のクラスタ構成記憶装置システム(システム#1)110とクラスタ構成記憶装置システム(システム#2)210と同様である。
【0132】
クラスタ分散システム5は、複数(図22では例として3つの場合を表示)のクラスタ111〜113と、サーバ3からの要求を受け取る複数のプロセッサ120と、複数のプロセッサ120と複数のクラスタ111〜113を接続する内部ネットワーク130と、プロセッサ120の制御管理を行ない内部ネットワーク130に接続された仮想管理140とを有する。複数のプロセッサ120とサーバ3とリモートサイト7は、ネットワーク8により接続されている。
【0133】
プロセッサ120は、クラスタ分散システム5内の論理ボリュームであれば、クラスタ111〜113配下のどの論理ボリュームへのアクセスでも受け付ける。従ってどのポート181〜184からも、クラスタ分散システム5内のどの論理ボリュームへもアクセスできる。
【0134】
本構成では、従来ネットワーク8と接続しネットワークと記憶装置システムとの間の情報の送受信を制御していたチャネル接続部分をプロセッサ120として他の部分から独立化し、プロセッサ120はサーバ3から受け取った要求について、プロトコル変換を実行してクラスタが認識できる形式に変換し、当該要求がどのクラスタの配下に存在する論理ボリュームへの要求かを判断し、該当するクラスタへ変換後の要求を送信する。
【0135】
クラスタ111は制御部と、制御部に接続された一又は複数のディスクドライブ15を有する。制御部は、複数台のプロセッサ139と複数のメモリユニット19を有する。他のクラスタ112やクラスタ113も同様の構成を有する。
【0136】
プロセッサ139は制御部内に搭載されたプロセッサであり、複数のプロセッサ139は各々並列に処理を実行する。ポート181〜184を介してクラスタに入力されるサーバ3からのコマンドの解析や、サーバ3とクラスタ間でのデータ転送を実行するためのプログラムがメモリユニット19内の共有メモリに格納されており、プロセッサは共有メモリに格納されているプログラムを実行する。またプロセッサは、パリティ生成などのディクスアレイの制御を行うためのプログラムや、ディスクドライブ装置15と制御部との間のデータの転送を制御するプログラムも実行する。これらのプログラムもメモリユニット19の共有メモリに格納されている。
【0137】
ディスク装置15は複数のポートを有し、複数のパスで同じクラスタ内の異なるプロセッサ139と接続されている。従ってあるクラスタ内に存在するどのプロセッサ139からでも、同一クラスタ内のどのディスク装置15にもアクセスできる。また、リモートコピー処理を実行するプログラム、リモートサイトに格納されているデータとクラスタ分散システム5に格納されているデータの差分を管理するプログラム、データをクラスタ分散システム5からリモートサイト7に転送する際、データの転送順序を管理するプログラム、データ移行処理を実行するプログラムは、制御部内のハードディスク内に格納されており、共有メモリに読み込まれてからプロセッサ139によって実行される。
【0138】
メモリユニット19は、各プロセッサ139からアクセス可能な共有メモリ17とキャッシュメモリ16を備える。各プロセッサ139はジョブ管理に必要な情報や、キャッシュメモリを管理するための情報等、各プロセッサで共有されるべきデータを共有メモリ17に格納する。メモリユニット19、キャッシュメモリ16、及び共有メモリ17の構成は第一の実施形態で述べた構成と同様である。図2に示すペア情報テーブル、図3に示すボリューム情報テーブル,図18に示すの差分ビットマップ及び図19に示す順序管理テーブルも共有メモリ17に格納されている。尚共有メモリ17とキャッシュメモリ16が同一メモリであってもよい。また、別の方法として、図2、図3、図18及び図19に示す情報を仮想管理140内のメモリ(図示せず)に格納し、管理することもできる。メモリユニット19には複数の共有メモリが備えられており、各々の共有メモリが同じ内容のデータを格納することにより、信頼性を向上させている。
【0139】
クラスタ分散システム5は更に、ユーザ入出力機器4を備えており、ユーザ入出力機器4は内部ネットワーク130またはネットワーク8に接続されている。図22には、ユーザ入出力機器4がネットワーク130と接続されている場合を図示する。
【0140】
論理ボリュームA152に格納されているデータを、論理ボリュームB252にリモートコピーする処理の場合、例えばリモートコピー用ポート186又はリモートコピー用ポート187のうちどれを使うか等のポート選択は、クラスタ側ではできない。リモートコピー要求を受け取るプロセッサ120は、クラスタ外にクラスタとは独立して存在し、いずれかのプロセッサ120内に設置されているリモートコピー用ポートを使用してリモートコピー処理が実行されることになるからである。
【0141】
又、クラスタ分散システム5においては、リモートコピー元となるボリュームAへアクセスできるのはボリュームAと同じクラスタ111内に存在するプロセッサ群だけなので、クラスタ分散システム5に存在する全てのプロセッサの中から、リモートコピー処理を実行するプロセッサを自由に選択することは、本実施形態ではできない。
【0142】
尚、本実施形態におけるリモートコピー処理は、図6のステップ6004と同様にして実行される。但しステップ6004におけるCHA13は、本実施形態ではコマンドを受取ったクラスタ11のプロセッサに相当する。
【0143】
図1に示すクラスタ構成記憶装置システムにおいては、どのポートからも、任意のディスク装置へアクセスできたが、図22に示すクラスタ分散システムにおいては、各プロセッサがアクセスできるディスク装置はクラスタ毎に制限されており、あるプロセッサからアクセス可能なディスク装置は、当該プロセッサと同じクラスタに存在するディスク装置のみである。
【0144】
そこで本実施形態においては、特定のクラスタ内のプロセッサ139に処理が集中した場合は、負荷の低いプロセッサが存在する他のクラスタ内の論理ボリュームへ、リモートコピー元のボリュームに格納されているデータを移動させた後、当該他のクラスタ内の論理ボリュームとリモートサイト7内の論理ボリュームとの間でリモートコピー処理を実施する。係る処理によって、クラスタ分散システム5内でプロセッサ139の負荷を分散することができる。さらにリモートコピー処理が実行中であっても、クラスタ分散システム5内でプロセッサの負荷に偏りが生じていれば、ダイナミックにリモートコピー元ボリュームに格納されているデータを移動させ、クラスタ分散システム5内でプロセッサの負荷を分散させる。
【0145】
次に、リモートコピー元のボリュームに格納されているデータの移動が必要かどうかを判断するための処理を図23のフローチャートに従って説明する。リモートコピーを開始する際にシステム管理者(ユーザ)は、ユーザ入出力機器4を使ってリモートコピー元ボリュームのクラスタ番号を認識する(ステップ23001)。例えばユーザ入出力機器4がユーザの指示に基づいて、クラスタ分散システム5が記憶している図2に示すペア情報テーブルを参照することによって、リモートコピー元ボリュームのクラスタ番号を取得し、これをユーザ入出力機器の出力画面に出力する。
【0146】
次に、リモートコピー元ボリュームが属するクラスタ内のプロセッサの負荷状況を把握するための処理に移る。クラスタ分散システム5内の各クラスタに存在するプロセッサ群の負荷状況は、仮想管理140が各クラスタから取得し管理している。
【0147】
図24に仮想管理140が有するメモリに記憶されているプロセッサ負荷状況テーブル2401の一例を示す。プロセッサ負荷状況テーブル2401には、クラスタ番号2402、プロセッサ番号2403、当該プロセッサ番号が示すプロセッサの使用可否を示す使用状況2404、当該プロセッサにかかっている負荷の程度を示す負荷状況2405、当該プロセッサにかかっている負荷と閾値との比較結果を示す閾値比較2406、及びリモートコピー用パス番号2407が登録される。仮想管理140はプロセッサ負荷状況テーブル2401を用いてクラスタ分散システム内の各プロセッサの負荷状況を管理する。
【0148】
仮想管理140が管理する負荷状況に基づいて、リモートコピー元ボリュームが属するクラスタ内のプロセッサの負荷が閾値より大きいか否かが判断される(ステップ23005)。この判断はユーザが行っても良いし、クラスタ分散システム5内で自動的に行っても良い。
【0149】
ユーザが判断する場合には、仮想管理140がユーザ入出力機器4にプロセッサ負荷状況テーブル2401に登録されているデータの内容を送信することにより、クラスタ分散システム5内の各プロセッサの負荷状況をユーザ入出力機器4に通知し、ユーザ入出力機器4は受信した情報を出力画面に出力して、ユーザに各プロセッサの負荷状況を提示する。そして、ユーザは出力画面に表示された各プロセッサの負荷状況を参照し、リモートコピー元のボリュームが属するクラスタ内のプロセッサ中に負荷が閾値を超えていないプロセッサが存在するか否かを判断し、判断結果をユーザ入出力機器4に入力する。ユーザから入力された判断結果は、ユーザ入出力機器4から仮想管理140に送信される。
【0150】
一方クラスタ分散システム5内で自動的にプロセッサの負荷と閾値との大小が判断される場合には、予めしきい値が仮想管理140に設定されており、仮想管理140はプロセッサ負荷状況テーブル2401の負荷状況2405が示す値と閾値とを比較して、プロセッサの負荷と閾値との大小の比較を行う。
【0151】
尚、単純にプロセッサの負荷と閾値とを比較するのではなく、閾値を2つ設定しておき、第一の閾値に対するプロセッサの負荷の値の比率をユーザ若しくは仮想管理が計算し、計算結果が第二の閾値を超えているか否かで、プロセッサの負荷の高低を判断することとしても良い。
【0152】
ステップ23005において、リモートコピー元のボリュームが属するクラスタに、プロセッサの負荷が閾値を超えていないプロセッサが存在する場合には、プロセッサの負荷が低いと判断され、コピー元ボリュームに格納されているデータを移行することなく、リモートコピー処理が実行される(ステップ23006)。
【0153】
ステップ23005において、リモートコピー元のボリュームが属するクラスタに、プロセッサの負荷が閾値を超えていないプロセッサが存在しない場合には、プロセッサの負荷が高いと判断され、リモートコピー元のボリュームを有するクラスタの制御部は、リモートコピー元ボリュームに格納されているデータをデータ移行により他クラスタに属する論理ボリュームへ移動する(ステップ23007)。このデータ移行処理に関しては、後述する。
【0154】
データ移行処理(ステップ23007)が終わったら、若しくはデータ移行処理が必要でないと判断されたら(ステップ23006)、サーバ3はクラスタ分散システム5に対してリモートコピー要求を発行する(ステップ23008)。
【0155】
次に、リモートコピー元ボリュームに格納されているデータを他のクラスタに属する論理ボリュームへ移動するための、データ移行処理(ステップ23007)の手順について、図25のフローチャートに従って説明する。
【0156】
まずボリュームの移動先クラスタを選択する。ボリュームの移動元の制御部は、リモートコピー元ボリュームが属するクラスタ以外の他のクラスタの中から、データ移行先ボリュームを確保できるクラスタがあるかどうか判断する(ステップ25001)。ボリューム移行元の制御部は、仮想管理140のメモリ内に格納された各クラスタの空きボリューム情報を元に判断する。
【0157】
移行先の論理ボリュームが確保できなければ、データ移行は実行できないので、ユーザ入出力機器4にデータ移行先が確保できない旨を通知するためのメッセージを送信し、ユーザ入出力機器4は受信したメッセージを出力画面に出力する。(ステップ25004)。
【0158】
他のクラスタの中に移行先の論理ボリュームが確保できる場合には、確保可能な論理ボリュームが属するクラスタの中に、新たなリモートコピー処理を実行可能なプロセッサが存在するかどうかを判断する(ステップ25003)。新たなリモートコピー処理が実行可能か否かは、図23のステップ23005と同様、各プロセッサの負荷が閾値を超えているか否かを基準に判断される。
【0159】
新たにリモートコピー処理を実行可能なプロセッサが存在しなければ、ユーザ入出力機器4にその旨通知するためのメッセージを送信し、ユーザ入出力機器4は受信したメッセージを出力画面に出力する(ステップ25004)。
【0160】
確保可能な論理ボリュームが属するクラスタの中に、負荷が閾値を超えておらず、新たなリモートコピー処理が実行可能なプロセッサを有するクラスタが存在する場合には、係るクラスタがデータ移行先の候補となる。候補クラスタが複数ある場合はそのうち1つを選択する(ステップ25005)。ステップ25005においては、負荷が最も低いプロセッサを持つクラスタを選択してもよいし、クラスタ内に存在する複数のプロセッサ各々の負荷を平均した平均値が最も低いクラスタを選択してもよい。
【0161】
データ移行先のクラスタが選択されると、ユーザはリモートコピー元ボリュームに格納されているデータを、選択されたクラスタ内の確保可能な論理ボリュームへ移動させるよう、データ移行指示をユーザ入出力機器4に入力する(ステップ25006)。
【0162】
データ移行指示は、ユーザ入出力機器4から、リモートコピー元ボリュームが属するクラスタの制御部に送信され、当該制御部内のプロセッサが有するデータ移行部137と、データ移行先のクラスタ内のプロセッサが有するデータ移行部137との制御によって、クラスタ間でデータ移行処理が実行される(ステップ25007)。尚、データ移行処理は、例えば米国特許第6108748号に記載されている方法によって実行される。
【0163】
リモートコピー処理開始後は、予め決められた時間間隔でクラスタ毎にクラスタ内に存在するプロセッサの負荷状況がチェックされ、負荷が閾値を超えているプロセッサが存在していないかどうかが調べられる。このプロセッサの負荷状況のチェックは、チェック対象のプロセッサと同じクラスタ内に存在する他のプロセッサが行うこととしても良いし、仮想管理140が行うこととしても良い。仮想管理140がチェックを行えば、仮想管理140は各クラス他内に存在する全てのプロセッサの負荷状況を管理できるので、負荷の高いプロセッサが存在する場合に、リモートコピー元のボリュームに格納されているデータの移行先クラスタを選択しやすい。尚、チェックの結果、負荷の高いプロセッサが存在することが判明した場合には、リモートコピー処理実行中であっても、リモートコピー元のボリュームに格納されているデータをダイナミックに他のクラスタのボリュームに移動することができる。
【0164】
図22の計算機システムにおいて、クラスタ分散システム5内のリモートコピー元ボリュームから、リモートサイト7内の論理ボリュームへのデータのリモートコピー処理実行中に、ダイナミックにリモートコピー元ボリュームを他クラスタへ移動する方法を図28のフローチャートに従って説明する。ここで説明する処理は、前述のように定期的にクラスタ分散システム内のプロセッサの負荷を監視していた結果、あるプロセッサの負荷が閾値を超えていることが発見され、リモートコピー元ボリュームに格納されているデータを他のクラスタ内のボリュームに移動すべきであると判断された後の処理である。
【0165】
クラスタ分散システム内のプロセッサの中に負荷が閾値を超えているプロセッサが存在する場合、定期的にプロセッサの負荷状況をチェックしている仮想管理若しくはユーザから、リモートコピー元のボリュームに格納されているデータを他のクラスタ内のボリュームへ移行するよう指示する移行要求が発行される。尚、ユーザから移行要求が発行される場合とは、ユーザがユーザ入出力機器4に移行要求を入力した場合のことである。移行要求は仮想管理若しくはユーザ入出力機器4からリモートコピー元のボリュームが属するクラスタ内のプロセッサに送信され、これを受信したプロセッサはリモートコピー処理を中断する(ステップ28001)。
【0166】
リモートコピー処理を中断すると、新たなリモートコピージョブは作成されない。しかし、コピー先のリモートサイト7からみて、リモートコピー処理を中断した時点でクラスタ分散システム内のリモートコピー元ボリュームに格納されているデータと同じデータがリモートサイト内のリモートコピー先ボリュームに格納されているよう制御する必要がある。そこで、リモートコピー元ボリュームが属するクラスタ内のプロセッサとリモートサイト内のリモートコピー先ボリュームを制御する制御部は、リモートコピー処理中断時にクラスタ分散システム5内で既に発行され、キューにたまっているリモートコピージョブに関しては、リモートコピー処理を完了させる(ステップ28002)。この結果、正サイト(クラスタ分散システム5)と副サイト(リモートサイト)の同期がとれた状態で、リモートコピー処理を中断することができる。
【0167】
次に、リモートコピー元ボリュームに格納されているデータを、データ移行処理によって、当該ボリュームが属するクラスタ以外の他のクラスタ内の論理ボリュームへ移動する(ステップ28003)。また、データ移動中に、サーバ3から発行されたリモートコピー元ボリュームに対するライト要求をクラスタ分散システムのプロセッサ120が受信した場合には、コピー先クラスタのメモリ19内にデータを記録しておく。コピー先クラスタへデータ移動完了してから、移動先制御部は、前記記録したライトデータを上書きして書き込む(ステップ28004)。
【0168】
更に、図2に示すペア情報テーブル及び図3に示すボリューム情報テーブル中の正ボリュームに関するデータを、データ移行先のボリュームが正ボリュームとなるよう修正して、データ移行元のクラスタからデータ移行先のクラスタへ送信し、データ移行先のクラスタ内の共有メモリに登録(格納)する。そして、データ移行元のクラスタ内の共有メモリに記憶されているペア情報テーブルやボリューム情報テーブルを削除する(ステップ28004)。
【0169】
尚、リモートコピー元ボリュームに格納されているデータをクラスタ分散システム5内で他の論理ボリュームに移行すると、リモートサイト側にとってはリモートコピー元ボリュームが変更されることとなり、リモートサイト側で管理されているボリュームペア情報も修正する必要がある。そこでクラスタ分散システム5では、リモートサイト側にリモートコピー元ボリュームの変更を隠蔽するため、論理ボリュームのマッピングを変更し、データ移行先の論理ボリュームの識別情報としてデータ移行元の論理ボリュームの識別情報を用いる。このようにすることによって、リモートサイトに格納されているボリュームペア情報は修正しなくても済む。
【0170】
ステップ28004でリモートコピー処理再開に必要な制御データをデータ移行元のクラスタからデータ移行先のクラスタへ送信し終わると、データ移行先のボリュームとリモートサイト内の論理ボリュームとの間でリモートコピーが再開される。具体的には制御データの送信終了を契機として、データ移行先のクラスタ内の共有メモリに格納されているリモートコピープログラムが起動される(ステップ28005)。そして、データ移行先のクラスタ内の制御部と、リモートサイトとの間で、ステップ28002で正サイトと副サイトとの間で整合性をとった状態から、リモートコピー処理を再開する。
【0171】
図22に示すクラスタ分散システムでは更に、プロセッサ120を介して他のストレージシステム6がクラスタ分散システム5に接続されている。ストレージシステム6は、クラスタ分散システム5と同じ構成を有するストレージシステムでもよいし、クラスタ分散システム5とは異なる構成を有するストレージシステムであっても良い。
【0172】
ストレージシステム6は、クラスタ分散システム5内の複数のプロセッサ120のうちいずれかのプロセッサと、通信路を介して接続されている。クラスタ分散システム5は、サーバ3から受信したデータ入出力要求がクラスタ分散システム5内のディスク装置に格納されているデータに対する入出力要求ではないと判断した場合に、当該データ入出力要求をストレージシステム6内に格納されているデータに対する第二のデータ入出力要求に変換して、通信路を介して第二のデータ入出力要求をストレージシステム6に送信する。ストレージシステム6はクラスタ分散システム5から第二のデータ入出力要求を受信して、第二のデータ入出力要求内で指定されているデータの入出力処理を実行する。
【0173】
クラスタ分散システム5はストレージシステム6が有する記憶領域である論理ボリュームを、クラスタ分散システム5の論理ボリュームとしてサーバ3に提供する。このためクラスタ分散システム5は、自身が取り扱う論理ボリュームに関する情報として、当該論理ボリュームがクラスタ分散システム5が有する記憶領域に相当するのか、クラスタ分散システム5に接続されている他のストレージシステム6が有する記憶領域に相当するのかを示す構成情報管理テーブル(図27)をもつ。論理ボリュームが他のストレージ装置内のボリュームに相当する場合には、この構成情報管理テーブルに、当該ボリュームにアクセスするために用いられるポートの識別子、及び他ストレージシステム6内で当該論理ボリュームに対して割り当てられている識別子が記述される。
【0174】
図27はクラスタ分散システム5が有する構成情報管理テーブルの一例を示す図である。構成管理テーブルは仮想管理部140内のメモリに格納する。または、プロセッサ120内のメモリに格納してもよい。構成情報管理2701にはクラスタ分散システム5が取り扱う論理ボリュームに関する情報が記述されている。構成情報管理テーブル2701にはクラスタ分散システム5のデータ入出力処理の対象となる、クラスタ分散システム5内に存在する論理ボリューム152だけでなく、クラスタ分散システム5に接続される他のストレージシステム6がデータ入出力処理を行い、当該他のストレージシステム6内に存在する論理ボリューム156についての情報も記述されている(但し,図27には論理ボリューム152の情報のみを示している。)。
【0175】
図27において、ポートID番号2702には論理ボリュームが接続している外部インターフェースのポートID番号が記述される。WWN2703には,ポートIDに対応するWWNが記述される。LUN2704には各論理ボリュームのLUNが記述される。容量2705には,論理ボリューム152が提供する記憶領域の容量が記述される。
【0176】
マッピングLUN2706には、そのポートおよびLUNに対応づけられている他のストレージシステム6の論理ボリューム156の識別子が記述される。つまりマッピングLUN2705に何らかの記述がある場合は、その論理ボリュームはクラスタ分散システム5に接続される他のストレージシステム6内に存在する論理ボリューム156であり、マッピングLUN2705に登録がなければ、その論理ボリュームはクラスタ分散システム5内に存在する論理ボリューム152であるということになる。
【0177】
他のストレージシステム6にリモートコピー元ボリュームが存在する場合、クラスタ分散システム5が当該リモートコピー元ボリュームと対応付けられているLUN2704を、別のクラスタ内に存在するプロセッサが管理している論理ボリュームのLUNへマッピングしなおせば、リモートコピー処理を実行するクラスタが変更されることになる。即ちクラスタ分散システム5は、構成情報管理テーブル2701に登録されているリモートコピー元ボリュームに関する情報のうち、マッピングLUN2704を別のクラスタ内で管理される論理ボリュームの識別情報に変更すれば、リモートコピー処理を実行するクラスタが変更される。他のストレージシステム6にリモートコピー元ボリュームが存在する場合、リモートコピー処理はリモートコピー元ボリュームと対応付けられているLUN2704と対応付けられているクラスタによって実行されるからである。従って係る場合には、リモートコピー元ボリュームと対応付けられているLUNを変更するだけで、他のストレージシステム6内のリモートコピー元ボリュームに格納されている実データを移行することなく、クラスタ間でデータ移行したことと同じ効果が得られる(図26)。
【0178】
上述の実施形態1及び実施形態2によって、リモートコピー処理による負荷をクラスタ構成記憶装置システムやクラスタ分散記憶装置システム内で分散させることができる。
【0179】
また、リモートコピー処理中であっても、リモートコピー処理に使用されるポートを変更することができるので、リモートコピー処理中にも複数のリモートコピーポートや複数のクラスタ間で負荷を分散させることができる。
【0180】
また、リモートコピー専用のポートを用いてリモートコピー処理を実行する場合には、本実施形態によって、リモートコピー対象のデータが格納されているクラスタとは異なる他のクラスタに存在するリモートコピー用ポートをリモートコピー処理に使用することができるので、リモートコピー用ポートが設置できないクラスタに格納されているデータもリモートコピー処理の対象にすることができるようになる。また、クラスタ構成記憶装置システムやクラスタ分散記憶装置システムにおいて、クラスタ間でリモートコピー用ポートを共有することができ、リモートコピー用ポートの設置数を抑え、リモートコピー用ポートを有効に利用することができるようになる。
【0181】
【発明の効果】
本発明によれば、リモートコピー処理による負荷をストレージシステム内で分散することができる。
【図面の簡単な説明】
【図1】本発明が適用される計算機システムの一例を示す図である。
【図2】ペア情報テーブルの一例を示す図である。
【図3】ボリューム情報テーブルの一例を示す図である。
【図4】他クラスタ情報格納位置テーブルの一例を示す図である。
【図5】クラスタの構成例を示すである。
【図6】リモートコピー処理の一例を示すフローチャートである。
【図7】クラスタ構成記憶装置システムが有するのポート管理情報テーブルの一例を示す図である。
【図8】リモートコピー処理に使用されるポートを選択する処理の一例を示すフローチャートである。
【図9】ユーザ入出力機器4のメモリに格納されているプログラムの一例を示す図である。
【図10】リモートコピー用ポートの負荷状況を示す情報の一例を示す図である。
【図11】リモートコピー処理要求キューの一例を示す図である。
【図12】クラスタ構成記憶装置システム間でのリモートコピー処理の一例を示す図である。
【図13】バックアップ先のボリュームを選択する処理の一例を示すフローチャートである。
【図14】形成コピー処理の一例を示すフローチャートである。
【図15】更新コピー処理の一例を示すフローチャートである。
【図16】リモートコピーに使用されるポートを変更する処理の一例を示すフローチャートである。
【図17】変更後のリモートコピー用ポートにリモートコピー処理を実行させるための処理の一例を示すフローチャートである。
【図18】共有メモリに格納されている差分ビットマップの一例を示す図である。
【図19】共有メモリに格納されている順序管理テーブルの一例を示す図である。
【図20】クラスタ内負荷分散処理の一例を示すフローチャートである。
【図21】クラスタ間負荷分散処理の一例を示すフローチャートである。
【図22】本発明が適用される計算機システムの他の一例を示す図である。
【図23】リモートコピー元ボリュームのデータ移行が必要か否かを判定するための処理の一例を示すフローチャートである。
【図24】各プロセッサの負荷状態を登録しているプロセッサ負荷状況テーブルの一例を示す図である。
【図25】リモートコピー元ボリュームに格納されているデータを他のクラスタ内のボリュームに移行するためのデータ移行処理の一例を示すフローチャートである。
【図26】リモートコピー処理を実行するクラスタを変更する処理の一例を示す図である。
【図27】クラスタ分散システムが有する構成情報管理テーブルの一例を示す図である。
【図28】リモートコピーのペア形成後に、コピー元ボリュームをダイナミックに他クラスタへ移動する処理の一例を示すフローチャートである。
【符号の説明】
1…クラスタ構成記憶装置システム
2…ネットワーク
3…サーバ
4…ユーザ入出力機器
11…クラスタ
12…クラスタ間接続機構
13…CHA
14…DKA
15…ディスク装置
17…共有メモリ
16…キャッシュメモリ

Claims (12)

  1. 複数のディスク装置と、該複数のディスク装置を接続する制御部と、ネットワークに接続される複数のポートとを各々が有する、複数の記憶装置サブシステムと、前記複数の記憶装置サブシステムを相互に接続する記憶装置サブシステム間接続部とを有する一又は複数の記憶装置システムと、
    前記ネットワークに接続された管理計算機と
    を備え、
    リモートコピーのコピー元及びコピー先の前記記憶装置システムは、
    それぞれ自システム内の前記複数のポート各々の負荷状況を示す負荷情報を取得して前記管理計算機に送信し、
    前記管理計算機は、
    コピー元の前記記憶装置システムの前記負荷情報に基づいて決定される第一のポートをコピー元の前記記憶装置システムに通知すると共に、コピー先の前記記憶システムの前記負荷情報に基づいて決定される第二のポートをコピー先の前記記憶装置システムに通知する一方、コピー先のディスクとしてコピー先の前記記憶装置システム内の前記第二のポートと同じ記憶装置サブシステム内のディスクが優先的に選択されるように、コピー先とするディスクの選択の支援を行い、
    コピー元の前記記憶装置システムは、
    前記第一のポートを用いて、自システム内の複数のディスク装置のいずれかに格納されているデータを、前記ネットワーク及びコピー先の前記記憶装置システムの前記第二のポートを介して、コピー先の前記記憶装置システムにコピーする
    ことを特徴とする計算機システム。
  2. 請求項1記載の計算機システムにおいて、
    前記負荷情報に基づいて決定される前記第一及び第二のポートは、前記リモートコピーに用いられる、対応するコピー元又はコピー先の前記記憶装置システムが有する複数のポートの内、負荷が最も低いポートである
    ことを特徴とする計算機システム。
  3. 請求項1記載の計算機システムにおいて、
    前記負荷情報に基づいて決定される前記第一のポートは、コピー元の前記記憶装置システムにおけるコピーされるデータを格納しているディスクが属する記憶装置サブシステム内に存在するポートである
    ことを特徴とする計算機システム。
  4. 請求項1記載の計算機システムにおいて、
    前記管理計算機が、前記負荷情報に基づいて、前記第一及び第二のポートの少なくとも一方を選択する
    ことを特徴とする計算機システム。
  5. 請求項1記載の計算機システムにおいて、
    前記管理計算機は、コピー元及びコピー先の前記記憶装置システムの負荷情報を出力画面に出力し、
    該出力画面に出力された負荷情報に基づいて管理者から該管理計算機に入力された情報によって指定される前記第一及び第二のポートを用いて、コピー元の前記記憶装置システムの前記複数のディスク装置のいずれかに格納されているデータを、コピー先の前記記憶装置システムにコピーする
    ことを特徴とする計算機システム。
  6. 請求項1記載の計算機システムにおいて、
    コピー元の前記記憶装置システムの前記制御部は、複数のディスク装置のいずれかに格納されているデータをコピー先の前記記憶装置システムにコピーするために用いられる前記第一のポートを、変更する
    ことを特徴とする計算機システム。
  7. 第一の記憶装置システムに格納されているデータを、ネットワークを介して前記第一の記憶装置システムに接続される第二の記憶装置システムにコピーするデータ複製方法であって、
    前記第一及び第二の記憶装置システムは、それぞれ複数のディスク装置と該複数のディスク装置に対する入出力要求を制御する制御装置と、前記ネットワークに接続される一又は複数のポートとを各々有する、複数の記憶装置サブシステムと、該複数の記憶装置サブシステム間を接続するサブシステム間接続装置とを有しており、前記ネットワークには管理計算機が接続され、
    リモートコピーのコピー元及びコピー先の前記記憶装置システムが、それぞれ自システム内の前記複数のポート各々の負荷状況を示す負荷情報を取得して前記管理計算機に送信し、前記管理計算機が、コピー元の前記記憶装置システムの前記負荷情報に基づいて決定される第一のポートをコピー元の前記記憶装置システムに通知すると共に、コピー先の前記記憶システムの前記負荷情報に基づいて決定される第二のポートをコピー先の前記記憶装置システムに通知する一方、コピー先のディスクとしてコピー先の前記記憶装置システム内の前記第二のポートと同じ記憶装置サブシステム内のディスクが優先的に選択されるように、コピー先とするディスクの選択の支援を行う第一のステップと、
    コピー元の前記記憶装置システムが、前記第一のポートを用いて、自システム内の複数のディスク装置のいずれかに格納されているデータを、前記ネットワーク及びコピー先の前記記憶装置システムの前記第二のポートを介して、コピー先の前記記憶装置システムにコピーする第二のステップと
    を備えることを特徴とするデータ複製方法。
  8. 請求項記載のデータ複製方法において、
    前記第一のステップにおいて、前記負荷情報に基づいて決定される前記第一及び第二のポートは、前記リモートコピーに用いられる、対応するコピー元又はコピー先の前記記憶装置システムが有する複数のポートの内、負荷が最も低いポートである
    ことを特徴とするデータ複製方法。
  9. 請求項7記載のデータ複製方法において、
    前記第一のステップにおいて、前記負荷情報に基づいて決定される前記第一のポートは、コピー元の前記記憶装置システムにおけるコピーされるデータを格納しているディスクが属する記憶装置サブシステム内に存在するポートである
    ことを特徴とするデータ複製方法。
  10. 請求項7記載のデータ複製方法において、
    前記第一のステップにおいて、前記管理計算機は、前記負荷情報に基づいて、前記第一及び第二のポートの少なくとも一方を選択する
    ことを特徴とするデータ複製方法。
  11. 請求項7記載のデータ複製方法において、
    前記第一のステップにおいて、前記管理計算機は、コピー元及びコピー先の前記記憶装置システムの負荷情報を出力画面に出力し、
    前記第二のステップにおいて、該出力画面に出力された負荷情報に基づいて管理者から該管理計算機に入力された情報によって指定される前記第一及び第二のポートを用いて、コピー元の前記記憶装置システムの前記複数のディスク装置のいずれかに格納されているデータを、コピー先の前記記憶装置システムにコピーする
    ことを特徴とするデータ複製方法。
  12. 請求項7記載のデータ複製方法において、
    コピー元の前記記憶装置システムの前記制御部が、複数のディスク装置のいずれかに格納されているデータをコピー先の前記記憶装置システムにコピーするために用いられる前記第一のポートを、変更する第三のステップを備える
    ことを特徴とするデータ複製方法。
JP2003168588A 2002-08-29 2003-06-13 記憶装置システム及びデータ複製方法 Expired - Fee Related JP4341897B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2003168588A JP4341897B2 (ja) 2002-08-29 2003-06-13 記憶装置システム及びデータ複製方法
US10/641,981 US20040103254A1 (en) 2002-08-29 2003-08-15 Storage apparatus system and data reproduction method
EP04004379A EP1486862A3 (en) 2003-06-13 2004-02-26 Storage system and data reproduction method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002249897 2002-08-29
JP2003168588A JP4341897B2 (ja) 2002-08-29 2003-06-13 記憶装置システム及びデータ複製方法

Publications (2)

Publication Number Publication Date
JP2004145855A JP2004145855A (ja) 2004-05-20
JP4341897B2 true JP4341897B2 (ja) 2009-10-14

Family

ID=32328278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003168588A Expired - Fee Related JP4341897B2 (ja) 2002-08-29 2003-06-13 記憶装置システム及びデータ複製方法

Country Status (2)

Country Link
US (1) US20040103254A1 (ja)
JP (1) JP4341897B2 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4387116B2 (ja) 2003-02-28 2009-12-16 株式会社日立製作所 ストレージシステムの制御方法、及びストレージシステム
US7076622B2 (en) * 2003-09-30 2006-07-11 International Business Machines Corporation System and method for detecting and sharing common blocks in an object storage system
US20050152192A1 (en) * 2003-12-22 2005-07-14 Manfred Boldy Reducing occupancy of digital storage devices
JP4516322B2 (ja) * 2004-01-28 2010-08-04 株式会社日立製作所 複数の上位装置で共有される記憶装置システムを持つサイト間での共有排他制御方式を備えたコンピュータシステム
JP4421385B2 (ja) * 2004-06-09 2010-02-24 株式会社日立製作所 計算機システム
JP4643198B2 (ja) * 2004-07-28 2011-03-02 株式会社日立製作所 負荷分散コンピュータシステム、経路設定プログラム及びその方法
JP4441362B2 (ja) * 2004-09-10 2010-03-31 株式会社日立製作所 ポート割当装置及びポート割当方法
JP2006079389A (ja) * 2004-09-10 2006-03-23 Casio Comput Co Ltd データバックアップ制御装置およびプログラム
JP4469252B2 (ja) * 2004-10-19 2010-05-26 株式会社日立製作所 ストレージネットワークシステム及びホスト計算機並びに物理パス割当方法
JP4643590B2 (ja) * 2004-11-29 2011-03-02 富士通株式会社 仮想ボリューム移築プログラム
JP2006277545A (ja) * 2005-03-30 2006-10-12 Hitachi Ltd 計算機システム、記憶装置システムおよびライト処理制御方法
JP2006285808A (ja) * 2005-04-04 2006-10-19 Hitachi Ltd ストレージシステム
JP4609848B2 (ja) * 2005-04-06 2011-01-12 株式会社日立製作所 負荷分散コンピュータシステム、経路設定プログラム及びその方法
JP4728031B2 (ja) * 2005-04-15 2011-07-20 株式会社日立製作所 リモートコピーペアの移行を行うシステム
JP4639112B2 (ja) * 2005-04-28 2011-02-23 株式会社日立製作所 リモートコピートポロジチェック方法
JP4963808B2 (ja) * 2005-08-05 2012-06-27 株式会社日立製作所 記憶制御システム
JP2007079885A (ja) * 2005-09-14 2007-03-29 Hitachi Ltd データ入出力負荷分散方法、データ入出力負荷分散プログラム、計算機システムおよび管理サーバ
JP2007122531A (ja) 2005-10-31 2007-05-17 Hitachi Ltd 負荷分散システム及び方法
US8738821B2 (en) * 2005-11-18 2014-05-27 International Business Machines Corporation Selecting a path comprising ports on primary and secondary clusters to use to transmit data at a primary volume to a secondary volume
JP4571576B2 (ja) * 2005-11-24 2010-10-27 株式会社日立製作所 リモートコピー記憶装置システムおよびリモートコピー方法
JP4800059B2 (ja) 2006-02-13 2011-10-26 株式会社日立製作所 仮想ストレージシステム及びその制御方法
JP4660404B2 (ja) * 2006-03-17 2011-03-30 富士通株式会社 データ転送装置及びデータ転送方法
JP2007280111A (ja) * 2006-04-07 2007-10-25 Hitachi Ltd ストレージシステム及びその性能チューニング方法
JP2007328734A (ja) * 2006-06-09 2007-12-20 Hitachi Ltd ストレージ装置及びストレージ装置の制御方法
JP2008009622A (ja) * 2006-06-28 2008-01-17 Hitachi Ltd 管理サーバ、およびサーバシステム
JP4327831B2 (ja) 2006-09-05 2009-09-09 株式会社日立製作所 ストレージシステム、管理計算機及びコピーペア監視方法
JP4933284B2 (ja) 2007-01-25 2012-05-16 株式会社日立製作所 ストレージ装置及び負荷分散方法
US9042263B1 (en) * 2007-04-06 2015-05-26 Netapp, Inc. Systems and methods for comparative load analysis in storage networks
JP4958641B2 (ja) * 2007-05-29 2012-06-20 株式会社日立製作所 記憶制御装置及びその制御方法
US7970903B2 (en) 2007-08-20 2011-06-28 Hitachi, Ltd. Storage and server provisioning for virtualized and geographically dispersed data centers
JP5298510B2 (ja) * 2007-11-22 2013-09-25 日本電気株式会社 情報処理装置
WO2009085326A1 (en) * 2008-01-03 2009-07-09 Hewlett-Packard Development Company, L.P. Performing mirroring of a logical storage unit
JP2010097376A (ja) 2008-10-16 2010-04-30 Hitachi Ltd ストレージシステムおよびリモートコピー制御方法
TWI526823B (zh) * 2009-01-23 2016-03-21 普安科技股份有限公司 單一架構下進行資料卷複製的方法及其裝置
TWI514249B (zh) * 2009-01-23 2015-12-21 Infortrend Technology Inc 遠端非同步資料卷複製的方法及執行該方法的儲存系統
JP5685454B2 (ja) * 2010-02-18 2015-03-18 富士通株式会社 ストレージ装置およびストレージシステム
JP2012018481A (ja) * 2010-07-06 2012-01-26 Fujitsu Ltd ディスクアレイ装置およびディスクアレイ制御方法
WO2012059971A1 (ja) * 2010-11-01 2012-05-10 株式会社日立製作所 情報処理システム及び情報処理システムのデータ転送方法
WO2012143965A1 (en) * 2011-04-18 2012-10-26 Hitachi, Ltd. Plurality of coupled storage subsystems and method for setting port access limitation in a storage subsystem when migrating a logical volume
JP5880010B2 (ja) * 2011-12-20 2016-03-08 株式会社バッファロー 通信システム、ネットワークストレージ、サーバ装置及びプログラム
JP2013164820A (ja) * 2012-02-13 2013-08-22 Fujitsu Ltd 評価支援方法、評価支援プログラムおよび評価支援装置
WO2014141482A1 (ja) * 2013-03-15 2014-09-18 株式会社日立製作所 垂直統合型システム及びストレージシステムの移行方法
JP6197597B2 (ja) * 2013-11-15 2017-09-20 富士通株式会社 情報処理システム、情報処理装置の制御プログラム及び情報処理システムの制御方法
WO2016208014A1 (ja) * 2015-06-24 2016-12-29 株式会社日立製作所 管理計算機及びシステム構成切り替え方法
US10860427B1 (en) * 2016-12-23 2020-12-08 EMC IP Holding Company LLC Data protection in a large-scale cluster environment
US11016698B2 (en) 2017-07-04 2021-05-25 Hitachi, Ltd. Storage system that copies write data to another storage system
JP6836536B2 (ja) * 2018-03-19 2021-03-03 株式会社日立製作所 ストレージシステム及びio処理の制御方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544347A (en) * 1990-09-24 1996-08-06 Emc Corporation Data storage system controlled remote data mirroring with respectively maintained data indices
JPH06250869A (ja) * 1993-03-01 1994-09-09 Hitachi Ltd 分散制御システム
JP3726484B2 (ja) * 1998-04-10 2005-12-14 株式会社日立製作所 記憶サブシステム
US6195703B1 (en) * 1998-06-24 2001-02-27 Emc Corporation Dynamic routing for performance partitioning in a data processing network
US6553401B1 (en) * 1999-07-09 2003-04-22 Ncr Corporation System for implementing a high volume availability server cluster including both sharing volume of a mass storage on a local site and mirroring a shared volume on a remote site
US6487645B1 (en) * 2000-03-06 2002-11-26 International Business Machines Corporation Data storage subsystem with fairness-driven update blocking
JP4175764B2 (ja) * 2000-05-18 2008-11-05 株式会社日立製作所 計算機システム
JP2002268650A (ja) * 2001-03-07 2002-09-20 Matsushita Electric Ind Co Ltd 音楽データダウンロード機能を備えた携帯無線端末
US20020176363A1 (en) * 2001-05-08 2002-11-28 Sanja Durinovic-Johri Method for load balancing in routers of a network using overflow paths

Also Published As

Publication number Publication date
JP2004145855A (ja) 2004-05-20
US20040103254A1 (en) 2004-05-27

Similar Documents

Publication Publication Date Title
JP4341897B2 (ja) 記憶装置システム及びデータ複製方法
US8271761B2 (en) Storage system and management method thereof
JP4703959B2 (ja) 記憶装置システムおよびそのレプリケーション作成方法
JP4183443B2 (ja) データ再配置方法及び装置
JP5341184B2 (ja) ストレージシステム及びストレージシステムの運用方法
JP4147198B2 (ja) ストレージシステム
US7096336B2 (en) Information processing system and management device
CN100430914C (zh) 拥有虚拟资源的存储系统
US7694073B2 (en) Computer system and a method of replication
JP4790372B2 (ja) ストレージのアクセス負荷を分散する計算機システム及びその制御方法
US7558916B2 (en) Storage system, data processing method and storage apparatus
JP5124551B2 (ja) ボリューム割り当てを管理する計算機システム及びボリューム割り当て管理方法
JP5111754B2 (ja) 記憶制御システム
JP5250869B2 (ja) ストレージシステム、論理記憶領域割り当て方法及び計算機システム
JP4920979B2 (ja) ストレージ装置及びその制御方法
US20110138085A1 (en) Storage system
US10747624B2 (en) Storage system and control method of storage system using asynchronous remote copying to backup volume at specific time points
JP2005242690A (ja) ストレージサブシステムおよび性能チューニング方法
GB2539829A (en) Storage system
JP2010079626A (ja) 計算機システムの負荷分散方法及びシステム
JP2005165852A (ja) ストレージシステム、ストレージ制御装置、ストレージシステムの制御方法
US8275958B2 (en) Storage system with remote copy controllers
JP2006099440A (ja) リモートコピーシステム
US10552342B1 (en) Application level coordination for automated multi-tiering system in a federated environment
JP5597266B2 (ja) ストレージシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060104

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081209

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090209

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090702

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090703

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130717

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees