JP4121255B2 - クラスタ構成記憶システム - Google Patents

クラスタ構成記憶システム Download PDF

Info

Publication number
JP4121255B2
JP4121255B2 JP2001177180A JP2001177180A JP4121255B2 JP 4121255 B2 JP4121255 B2 JP 4121255B2 JP 2001177180 A JP2001177180 A JP 2001177180A JP 2001177180 A JP2001177180 A JP 2001177180A JP 4121255 B2 JP4121255 B2 JP 4121255B2
Authority
JP
Japan
Prior art keywords
storage system
logical
port
node
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001177180A
Other languages
English (en)
Other versions
JP2002366398A (ja
Inventor
裕介 平川
敬史 荒川
高 大枝
弘治 荒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001177180A priority Critical patent/JP4121255B2/ja
Priority to US09/927,571 priority patent/US6832272B2/en
Publication of JP2002366398A publication Critical patent/JP2002366398A/ja
Application granted granted Critical
Publication of JP4121255B2 publication Critical patent/JP4121255B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0635Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、記憶システムに係り、特に、複数の記憶システムを1つの記憶システムとして運用可能とするクラスタ構成の記憶システムに関する。
【0002】
【従来の技術】
記憶システムに関する従来技術として、例えば、特開平11−167521号公報等に記載された技術が知られている。この従来技術は、記憶システムを使用する上位装置(ホストコンピュータ)に対するインタフェース(ホストアダプタ、CHA)、記憶システム内の磁気ディスク装置等の記憶装置に対するインタフェース(ディスクアダプタ、DKA)、キャッシュメモリ(CACHE)、管理メモリ(SM)の相互間をコモンパス方式で接続して構成したものである。
【0003】
図15は従来技術による記憶システムの構成例を示すブロック図であり、以下、図15を参照して従来技術について説明する。図15において、100は記憶システム、110はホストアダプタ(CHA)、120はディスクアダプタ(DKA)、130はキャッシュメモリ(CACHE)、140は管理メモリ(SM)、150は記憶装置(HDD)、160はコモンパス、170は接続線である。
【0004】
従来技術による記憶システム100は、図15に示すように、ホストアダプタ110、ディスクアダプタ120、キャッシュメモリ130、管理メモリ140、記憶装置150、コモンパス160、接続線170より構成される。ホストアダプタ110、ディスクアダプタ120、キャッシュメモリ130、管理メモリ140は、コモンパス160により相互間が接続されている。コモンパス160は、コモンパス160の障害時のために2重化されている。ディスクアダプタ120と記憶装置150との間は、1つのディスクアダプタ120あるいは1つの接続線170の障害時にも記憶装置150を使用できるように、1つの記憶装置150に2つのディスクアダプタ120が異なる接続線170で接続されている。
【0005】
ホストアダプタ110は、図示しないホストコンピュータとキャッシュメモリ130との間のデータ転送を制御する。ディスクアダプタ120は、キャッシュメモリ130と記憶装置150との間のデータ転送を制御する。キャッシュメモリ130は、ホストコンピュータから受信したデータ、あるいは、記憶装置150から読み取ったデータを一時的に蓄えるメモリである。管理メモリ140は、全てのホストアダプタ110とディスクアダプタ120とが共有するメモリである。また、図示していないが、記憶システム100の設定、監視、保守等を行なうために保守端末(SVP)が全てのホストアダプタ110とディスクアダプタ120とに専用線を用いて接続されている。
【0006】
前述したような構成を持つ記憶システム100のシステム構成を拡張する場合、ホストアダプタ110、ディスクアダプタ120、キャッシュメモリ130、管理メモリ140、記憶装置150等の構成要素が新たに追加される。例えば、ホストコンピュータとの接続数を増やす場合、ホストアダプタ110が新たにコモンパス160に接続される。また、記憶システム100の記憶容量を増やす場合、記憶装置150を追加する、あるいは、ディスクアダプタ120を新たにコモンパス160に接続して記憶装置150を追加する。
【0007】
【発明が解決しようとする課題】
前述した従来技術は、記憶システムのシステム拡張に当たり、ホストアダプタ、ディスクアダプタ、キャッシュメモリ、管理メモリ及び記憶装置等の記憶システムの構成要素を増設することにより対応しているため、記憶システムの拡張性が記憶システムの構成要素の最大搭載数に制限されている。この結果、前述の従来技術は、大規模な記憶システムの要求に応じるために、記憶システムの最大搭載数を大きくすると、小規模な記憶システムの要求時にコスト及び設置面積が大きくなってしまうという問題点を有している。
【0008】
前述したような問題点を解決する方法として、クラスタ構成の記憶システムが考えられる。クラスタ構成記憶システムは、複数の前述したような記憶システムを接続した構成で、ホストコンピュータからは1つの記憶システムとして運用可能とした記憶システムである。以下、クラスタ構成の記憶システムを構成する記憶システムを記憶システムノードと呼ぶ。クラスタ構成の記憶システムは、小規模な記憶システムの要求時には、少数の記憶システムノードでクラスタ構成記憶システムを構成し、記憶システムの規模を拡大する場合、クラスタ構成記憶システムに記憶システムノードを増設していくことにより対応することができる。このように、クラスタ構成記憶システムは、小規模なシステムから大規模なシステムまで対応することができ、また、ホストコンピュータからは1つの記憶システムとして運用可能であるため、管理が容易になるという利点を有している。
【0009】
しかし、クラスタ構成の記憶システムは、ホストコンピュータからのアクセス命令を受信する記憶システムノードとアクセス対象のデータを保持する記憶システムノードとが異なる場合、記憶システムノード相互間のデータ転送が必要となり、アクセス性能が低下するという問題点を有している。
【0010】
本発明の目的は、前述したようなクラスタ構成の記憶システムの問題点を解決し、アクセス性能を向上させることができるクラスタ構成の記憶システムを提供することにある。
【0011】
【課題を解決するための手段】
本発明によれば前記目的は、複数の記憶システムノードを1つの記憶システムとして運用可能とするクラスタ構成記憶システムにおいて、前記記憶システムノード内部及び前記記憶システムノード相互間のアクセス情報を採取する手段と、採取したアクセス情報を保守員に提示する手段と、保守員からのポートの設定指示を受け付ける手段と、前記指示に基づいて前記クラスタ構成記憶システム内のポート設定を変更する手段とを有し、前記クラスタ構成記憶システム内のポート設定を変更する手段は、論理ポートと論理ボリュームとの間の仮想的なパスである論理パス毎の単位時間当りのデータ転送量またはデー転送時間を示すアクセス頻度を保持するアクセス情報を参照し、全論理パスの中でデータ転送量が規定値以上の論理パスの1つを選択し、選択した論理パスが記憶システムノード間のデータ転送を必要とするか否かをチェックし、記憶システムノード間のデータ転送を必要とした場合、前記論理パスを経て前記ホストコンピュータがアクセスしている論理ボリュームを格納している記憶装置を有する第1の記憶システムノードに未使用ポートがあり、その未使用ポートが当該ホストコンピュータに接続可能である場合、あるいは、当該ホストコンピュータに接続された未使用ポートがある場合に、前記ホストコンピュータが使用するノードを、それまで使用していた第2の記憶システムノードのポートから前記第1の記憶システムノードの前記未使用ポートとするように、ポート設定を変更することにより達成される。
【0012】
前述において、アクセス情報は、例えば、記憶システムノード内部及び記憶システムノード相互間の単位時間内のデータ転送量またはデータ転送に必要な時間等でであり、アクセス命令を受信した論理ポートとデータの管理単位である論理ボリュームとの組み合わせ単位に採取する。このようにアクセス情報を採取することにより、どの論理ポートからどの論理ボリュームへのアクセスが記憶システムノード間のデータ転送を多く必要としているかが判る。そして、保守員は、保守端末を用いて前記アクセス情報を参照することができ、記憶システムノード相互間のデータ転送の頻度が高い論理ポートと論理ボリュームとの組み合わせを認識でき、その論理ポートの設定変更、その論理ボリュームの再配置の検討が可能となる。さらに、前記クラスタ構成記憶システムは、保守員からの指示により、ポート設定変更、記憶システムノード相互間での論理ボリュームの再配置を行い、前記記憶システムノード相互間のデータ転送の頻度をより小さくすることができ、これにより、クラスタ構成記憶システムのアクセス性能の向上を図ることができる。
【0013】
また、本発明は、前記クラスタ構成記憶システム、あるいは、前記クラスタ構成記憶システム内の保守端末に、前記アクセス情報に基づいてポート設定変更及び論理ボリュームの再配置を検討する機能を持たせることができ、これにより、保守員の負担を減らすようにすることができる。
【0014】
また、本発明は、クラスタ構成記憶システムに、前記クラスタ構成記憶システムを使用するホストコンピュータに対して前記アクセス情報を提供する機能、前記ホストコンピュータからポート設定指示、論理ボリュームの再配置指示を受け付ける機能を持たせることにより、ホストコンピュータあるいはホストコンピュータの管理者が、前記アクセス情報及び運用状態に基づいて、ポート設定変更、論理ボリュームの再配置を検討し、クラスタ構成記憶システムにポート設定指示及び論理ボリュームの再配置指示を行うようにすることができる。これにより、保守員には判断できない、高度な条件下でのポート設定変更、論理ボリュームの再配置を行うことが可能となり、クラスタ構成記憶システムのアクセス性能を向上させることができる。
【0015】
【発明の実施の形態】
以下、本発明による記憶システムの実施形態を図面により詳細に説明する。以下に説明する本発明の実施形態は、複数の記憶システムを有するクラスタ構成記憶システムがアクセス情報を採取し、クラスタ構成の記憶システム内の保守端末を通じて保守員に提示し、このアクセス情報に基づく保守員の再配置指示により、アクセス命令を受信する論理ポートの変更、あるいは、クラスタ構成の記憶システム内でデータの記憶装置への再配置を行うものである。なお、以下の説明において、クラスタ構成の記憶システムを構成する記憶システムを記憶システムノードと呼ぶこととする。また、保守端末は、クラスタ構成の記憶システム内に備えられていても、外部に備えられていてもよく、いずれの場合も、各記憶システムノードに接続可能であればよい。
【0016】
図1は本発明の一実施形態によるクラスタ構成の記憶システムの構成を示すブロック図、図2は記憶システムノードの構成を示すブロック図、図3はポート情報の例を説明する図、図4は物理位置情報の例を説明する図、図5は未使用記憶容量情報の例を説明する図、図6はアクセス情報の例を説明する図である。図1〜図6において、200はクラスタ構成記憶システム、210−1〜210−nは記憶システムノード210、220は接続線、230は論理ボリューム、240はポート、310はデータ転送コントローラ(DTC)、400はポート情報、500は物理位置情報、600は未使用記憶容量情報、700はアクセス情報であり、他の符号は図15の場合と同一である。
【0017】
本発明の実施形態によるクラスタ構成記憶システム200は、接続線220により相互に接続されている複数の記憶システムノード210−1〜210−n(以下の説明では、これらを区別する必要のない場合、あるいは、全体を示す場合、単に210と記す)と図示しない保守端末とから構成される。保守端末は、専用線を用いて全ての記憶システムノード210と接続されている。クラスタ構成記憶システム200は、ポート情報400、物理位置情報500、未使用記憶容量情報600、アクセス情報700を有する。これらの情報は、保守端末から参照することができる。クラスタ構成記憶システム200の記憶領域は、分割して管理されおり、分割した記憶領域を論理ボリューム230と呼ぶ。各論理ボリューム230のフォーマット形式及び記憶容量は、保守端末を用いて指定することができる。論理ボリューム230は、記憶システムノード210内であれば、複数の記憶装置150に分割して保持することができる。論理ボリューム230のクラスタ構成記憶システム200内の物理的な格納位置(物理アドレス)は、後述する物理位置情報500に保存されている。
【0018】
記憶システムノード210は、基本的に図15により説明したものと同様な内部構造を有し、記憶システムノード210と図15により説明した記憶システム100との差異は、記憶システムノード210が他の記憶システムノード210との通信のためのデータ転送制御コントローラ310を備えている点である。そして、記憶システムノード210は、1つ以上のホストアダプタ110、1つ以上のディスクアダプタ120、1つ以上のキャッシュメモリ130、1つ以上の管理メモリ140、1つ以上の記憶装置150、2つ以上のコモンパス160、1つ以上の接続線170、1つ以上のデータ転送制御コントローラ310を備えて構成される。ホストアダプタ110、ディスクアダプタ120、キャッシュメモリ130、管理メモリ140、データ転送制御コントローラ310はコモンパス160により相互間が接続されている。コモンパス160は、コモンパス160の障害時のために2重化されてある。ディスクアダプタ120と記憶装置150とは接続線170によって接続されている。また、図示していないが、クラスタ構成記憶システム200の設定、監視、保守等を行なうために保守端末(SVP)が全てのホストアダプタ110とディスクアダプタ120とに専用線を用いて接続されている。
【0019】
ホストアダプタ110は、図示しないホストコンピュータとキャッシュメモリ130との間のデータ転送を制御する。ホストアダプタ110は、ホストコンピュータとの接続のための複数のポート240を持ち、さらに、1つのポート240は、1つ以上の論理的なポート(以下、論理ポートとよぶ)を持つ。ディスクアダプタ120は、キャッシュメモリ130と記憶装置150との間のデータ転送を制御する。キャッシュメモリ130は、ホストコンピュータから受信したデータあるいは記憶装置150から読み出したデータを一時的に保持するメモリである。管理メモリ140は、クラスタ構成記憶システム200内の全てのホストアダプタ110とディスクアダプタ120とが共有するメモリである。ホストアダプタ110及びディスクアダプタ120は、データ転送制御コントローラ310及び接続線220を用いて、他の記憶システムノード210内のホストアダプタ110、ディスクアダプタ120との通信及び他の記憶システムノード210内のキャッシュメモリ130、管理メモリ140の使用が可能である。
【0020】
ポート情報400は、論理ポートを有する記憶システムノード番号及びポート番号と、その論理ポートを使用してアクセスする論理ボリューム番号とホストコンピュータ番号とを保存する。ポート情報400は、ホストアダプタ110が使用可能なメモリ、例えば、管理メモリ140あるいはホストアダプタ110の内部メモリに保存される。図3に示すポート情報400の例において、ホストコンピュータと接続していないポートの論理ポートの論理ボリューム番号及びホストコンピュータ番号には、その論理ポートが未使用であることを表すために、論理ボリューム番号及びホストコンピュータ番号で使用しない数値が設定される。使用していない論理ポートの論理ボリューム番号には当該論理ポートが未使用であることを表すために、論理ボリューム番号で使用しない数値が設定される。
【0021】
図3に示す例の場合、その論理ポートが使用されていないことを示すため“0”が使用されている。図3に示すポート情報において、論理ポート3の情報は、論理ポート3が記憶システムノード1のポート2内の論理ポートであることを示し、ホストコンピュータ2が論理ボリューム1をアクセスするために使用していることを示している。論理ポート5の情報は、論理ポート5が記憶システムノード2のポート1内の論理ポートであることを示し、記憶システムノード2のポート1はどのホストコンピュータにも接続されていないことを示している。また、論理ポート8の情報は、論理ポート8が記憶システムノード2のポート2内の論理ポートであることを示し、その論理ポートがどの論理ボリュームにも使用されていないことを示している。
【0022】
物理位置情報500は、論理ボリューム230の物理アドレス情報、フォーマット形式、容量、状態情報、再配置先物理アドレス情報、再配置完了位置、その論理ボリュームをアクセスするために使用する論理ポート番号を保持する。物理位置情報500は、ホストアダプタ110から参照可能なメモリ、例えば、管理メモリ140あるいはホストアダプタ110の内部メモリに保存される。図4に示す物理位置情報500において、物理アドレス情報は、クラスタ構成記憶システム200内の論理ボリューム230の物理的な格納位置を示す情報であり、例えば、記憶システムノード番号と記憶システムノード内部での物理位置とからなる。図示例では、これらがカンマによって区切られて示されている。状態情報は、正常、再配置中等の論理ボリューム230の論理的な状態を表す。再配置先物理アドレス情報と再配置完了位置とは、状態情報が再配置中のときのみ有効である。再配置先物理アドレス情報は、後述する論理ボリュームの再配置決定処理により求められた再配置先の論理ボリュームの物理アドレスである。再配置完了位置は、データの再配置処理が終了した論理ボリューム内の位置である。
【0023】
前述において、状態情報が正常の場合、論理ボリュームの物理アドレスは、物理アドレス情報が用いられ、状態情報が再配置中の場合、論理ボリュームの物理アドレスは、アクセス対象のデータの論理ボリューム内での位置(アクセス命令内の論理アドレス)により物理アドレス情報、あるいは、再配置先物理アドレス情報のどちらか一方が使用される。例えば、論理ボリュームの先頭からデータの再配置処理を行う場合、論理アドレスが再配置完了位置より前であれば、アクセス対象のデータが既に再配置されているため、論理ボリュームの物理アドレスは、再配置先物理アドレス情報が用いられる。一方、論理アドレスが再配置完了位置より後の場合、アクセス対象のデータが再配置されていないため、論理ボリュームの物理アドレスは、物理アドレス情報が用いられる。
【0024】
1つの論理ボリュームは、複数のホストコンピュータから同時にアクセスすることが可能であるため、1つの論理ボリュームの項目に対し、論理ポート番号が複数存在する。図4に示す例において、論理ボリューム1の情報は、記憶システムノード1内の先頭から0の位置から格納されており、フォーマット形式がOPEN3、容量が3GB、データの再配置処理を行っておらず、論理ポート2、3を通じてホストコンピュータからアクセスされることを示している。また、論理ボリューム2の情報は、記憶システムノード2内の先頭から0の位置から格納されており、フォーマット形式がOPEN6、容量が6GB、データの再配置処理を行っており、再配置先が記憶システムノード1内の先頭から500の位置から格納されている論理ボリュームで、データの再配置処理が論理ボリュームの先頭から300の位置まで終了しており、論理ポート1を通じてホストコンピュータからアクセスされることを示している。
【0025】
未使用記憶容量情報600は、記憶システムノードの未使用の記憶容量を保持する。未使用記憶容量情報600は、例えば、管理メモリ140に保存される。この情報は、記憶システムノード210に新たに論理ボリュームを作成できる否かを調べるために使用される。図5に示す未使用容量情報600は、例えば、記憶システムノード1に20GBの未使用の記憶容量があることを示している。
【0026】
アクセス情報700は、論理パス毎にアクセス頻度を保存する。論理パスとは、論理ポートと論理ボリュームとの間の仮想的なパスであると定義する。以下、論理パスの論理ポートを有する記憶システムノードを論理パスのフロントノード、論理パスの論理ボリュームを格納する記憶システムノードを論理パスのエンドノードと呼ぶ。アクセス頻度は、例えば、論理パスの論理ポートを使用して、所定の時間を単位時間として、単位時間、例えば、60秒または30秒内に論理パスの論理ボリュームをアクセスしている時間、データ量等であってよい。アクセス頻度は、ホストコンピュータからのアクセス命令の実行時にホストアダプタ110あるいはディスクアダプタ120が更新する。アクセス情報700は、ホストアダプタ110あるいはディスクアダプタ120が使用可能なメモリ、例えば、管理メモリ140、ホストアダプタ110の内部メモリ、ディスクアダプタ120の内部メモリに保存される。さらに、アクセス情報700は、予め指定された時間毎あるいは保守員の指示によって保守端末に転送され、予め指定された期間あるいは保守員の指示で保守端末内に保存される。保守端末に保存されたアクセス情報700は、保守端末から参照することができ、保守員は、アクセス情報700に基づいて、後述する論理ポートの設定変更決定処理及び論理ボリュームの再配置決定処理を実行する。
【0027】
図6に示すアクセス情報700の例において、例えば、アクセス頻度をデータ転送量とした場合、図6の論理パス1のアクセス頻度は、論理ポート1を使用して単位時間内に論理ボリューム2にアクセスするデータ量が20(単位は、任意であるが、例えば、MB等であってよい)であることを示す。ポート情報400が図3、物理位置情報500が図4に示すようなものである場合、論理ポート1は、記憶システムノード1にあり、論理ボリューム2は記憶システムノード2にあるため、記憶システムノード相互間に20のデータ転送が生じていることが判る。図6に示す論理パス2のアクセス頻度は、論理ポート2を使用して論理ボリューム1にアクセスするデータ量が15であることを示す。ポート情報400が図3、物理位置情報500が図4に示すようなものである場合、論理ポート2は、記憶システムノード1にあり、論理ボリューム1は記憶システムノード1にあるため、記憶システムノード内部に15のデータ転送が生じていることが判る。
【0028】
図7はクラスタ構成記憶システム200の動作を説明する図であり、以下、これについて説明する。まず、リード/ライト処理時のクラスタ構成記憶システム200の動作について説明する。
【0029】
ホストアダプタ110は、ホストコンピュータからアクセス命令710を受信する。このホストコンピュータからのアクセス命令710は、リード(またはライト)の命令、リード(またはライト)対象のデータの論理ボリューム230内での位置(論理アドレス)、データ量等を含んでいる。ホストアダプタ110は、アクセス命令710を受信すると、まず、アクセス対象のデータのクラスタ構成記憶システム200内での物理的な格納位置(物理アドレス)を求める(物理位置算出処理720)。アクセス対象の物理アドレスは、アクセス対象を含む論理ボリューム230の物理アドレスとアクセス命令710内の論理アドレスとにより一意に決定される。
【0030】
物理位置算出処理720の後、ホストアダプタ110は、アクセス処理730を行う。一例として、アクセス命令710がリード命令の場合で説明する。ホストアダプタ110は、このホストアダプタ110を有する記憶システムノード内あるいは物理位置算出処理720で求めた物理アドレスに対応するディスクアダプタ120を有する記憶システムノード内のキャッシュメモリ130にアクセス命令710内のデータ量と等しいメモリ領域を確保する。ホストアダプタ110は、物理位置算出処理720で求めた物理アドレスに対応するディスクアダプタ120に対し、そのキャッシュメモリ130へのアクセス対象のデータの読み出しを命令する。ホストアダプタ110から命令を受けたディスクアダプタ120は、記憶装置150からアクセス対象のデータをキャッシュメモリ130に読み出し、ホストアダプタ110に転送完了を報告する(アクセス処理740)。ホストアダプタ110は、キャッシュメモリ130からホストコンピュータにデータを送信し、リード処理が完了する。その後、ホストアダプタ110あるいはディスクアダプタ120は、アクセス対象の論理パスに対応するアクセス情報700のアクセス頻度を変更する。このアクセス頻度の更新は、常時行ってもよいし、保守員が保守端末を用いてアクセス情報700の更新の可否を指示してもよい。
【0031】
保守員は、定期的あるいは必要に応じて、論理ポートの設定変更決定処理770を行い、論理ポートの設定変更による記憶システムノード間のデータ転送量の削減の可能性を検討する。保守員は、この検討の結果、削減が可能と判断すれば、保守端末を通じて、クラスタ構成記憶システム200に再配置指示750を行って、再配置処理760を実行させる。
【0032】
また、保守員は、定期的あるいは必要に応じて、論理ボリュームの再配置決定処理780を行い、論理ボリュームの再配置による記憶システムノード間のデータ転送量の削減の可能性を検討する。保守員は、この検討の結果、削減が可能と判断すれば、保守端末を通じて、クラスタ構成記憶システム200に論理ボリュームの再配置指示750を行って、再配置処理760を実行させる。
【0033】
図8は前述した物理位置算出処理720での処理動作を説明するフローチャートであり、次に、これについて説明する。
【0034】
(1)ホストアダプタ110は、まず、ポート情報400を用いて、アクセス命令710を受信した論理ポート番号から論理ボリューム番号を求める(ステップ900)。
【0035】
(2)次に、論理ボリューム番号と物理位置情報500とから論理ボリューム230の物理アドレスを算出するため、まず、アクセス対象の論理ボリューム230の状態情報を参照して、その論理ボリュームが再配置中か否かを調べる(ステップ910)。
【0036】
(3)ステップ910の調べで、その論理ボリュームが再配置中であった場合、アクセス命令710の論理アドレスとアクセス対象の論理ボリューム230の再配置完了位置とを比較し、アクセス命令710の論理アドレスが再配置完了位置より前、すなわち、アクセス位置が再配置済みか否かを判定する(ステップ920)。
【0037】
(4)ステップ920の判定で、アクセス位置が再配置済みであった場合、論理ボリューム230の物理アドレスとして、再配置先物理アドレス情報を求め、これを用いることを決定する(ステップ930)。
【0038】
(5)ステップ910の調べで、その論理ボリュームが再配置中でなかった場合、または、ステップ920の判定で、アクセス命令710の論理アドレスが再配置完了位置より後、すなわち、アクセス位置が再配置済みでなかった場合、論理ボリューム230の物理アドレスとして、現在の物理アドレス情報を求め、これを用いることを決定する(ステップ940)。
【0039】
(6)次に、ステップ930の処理またはステップ940の処理で求めた論理ボリューム230の物理アドレスにアクセス命令710の論理アドレスを加えてアクセス対象の物理アドレスを求める(ステップ950)。
【0040】
図9は図7における論理ポートの設定変更決定処理770での処理動作を説明するフローチャート、図10は論理ポートの設定変更決定処理770の中で作成される論理パス集合B1〜B3の例を説明する図、図13は論理ポートの設定変更決定処理770、後述する論理ボリュームの再配置決定処理780の中で作成される再配置指示について説明する図であり、以下、アクセス情報700のアクセス頻度をデータ転送量として、これらについて説明する。
【0041】
(1)アクセス情報700を参照し、全論理パスの中でデータ転送量が規定値以上の論理パスがあるか否かをチェックし、なければ変更不要として処理を終了する(ステップ1010、1020)。
【0042】
(2)ステップ1010のチェックで、データ転送量が規定値以上の論理パスがが複数存在する場合、例えば、データ転送量が大きいものから順に選択して以後の処理を行う。いま、選択した論理パスを第1論理パスと呼び、この第1論理パスの論理ポートを論理ポートA、論理ボリュームを論理ボリュームAとし、論理ポートAを有するポートをポートA、論理ポートAを有する記憶システムノードをフロントノードA、論理ボリュームAを格納する記憶システムノードをエンドノードAとする。さらに、論理ポートAを用いて論理ボリュームAをアクセスするホストコンピュータをホストコンピュータAとする。これらの情報は、ポート情報400及び物理位置情報500から得ることができる。そして、第1論理パスが記憶システムノード間のデータ転送を必要とするか否かをチェックし、不要であった場合、変更不要として処理を終了する(ステップ1015、1020)。
【0043】
(3)ステップ1015のチェックで、第1論理パスが記憶システムノード間のデータ転送を必要とした場合、ポート情報400を用いて、エンドノードAに未使用のポートが有り、そのポートとホストコンピュータAとを新たに接続することができるかいなかを判定し、その未使用ポートとホストコンピュータAとを新たに接続することができる場合、図13に示す再配置指示750−Cを作成する(ステップ1025、1035)。
【0044】
再配置指示750−Cは、論理ポート1と論理ポート2との2つのパラメータを持ち、論理ポート1を用いて論理ボリュームAをアクセスすることをやめ、論理ポート2を用いて論理ボリュームAをアクセスすることをクラスタ構成記憶システム200に指示する命令であり、再配置指示750−Cの論理ポート1に論理ポートAを、論理ポート2にそのポートの任意の論理ポートを設定する。
【0045】
(4)ステップ1025の判定で、その未使用ポートとホストコンピュータAとを新たに接続することができなかった場合、ポート情報400を用いて、エンドノードAにホストコンピュータAと接続されている未使用の論理ポートがあるか否かをチェックし、未使用の論理ポートがあった場合、図13に示す再配置指示750−Cを作成する。ここでは、再配置指示750−Cの論理ポート1に論理ポートAを、論理ポート2に当該論理ポートを設定する(ステップ1030、1035)。
【0046】
(5)ステップ1030のチェックで、エンドノードAにホストコンピュータAと接続されている未使用の論理ポートが存在しなかった場合、全論理パスから論理パスのフロントノードがエンドノードAと等しく、論理パスの論理ボリュームをアクセスするホストコンピュータがホストコンピュータAと等しい論理パス集合Bを取得する。さらに、論理パス集合Bを3つの集合B1〜B3に分割する。論理パス集合B1は、論理パス集合Bのうち、論理パスのエンドノードがフロントノードAと等しい論理パスとする。論理パス集合B2は、論理パス集合Bのうち、論理パスのエンドノードがエンドノードAと等しくない論理パスとする。論理パス集合B3は、論理パス集合Bのうち、論理パスのエンドノードがエンドノードAと等しい論理パスとする(ステップ1040)。
【0047】
論理パス集合B1〜B3の例を図10に示しており、この図10において、第1論理パスのフロントノードは2、エンドノードは1、論理ボリュームは1、ホストコンピュータはAとする。論理パス集合B1の例は、フロントノード1、エンドノード2の論理パスである。論理パス集合B2の例は、フロントノード1、エンドノード3の論理パスである。論理パス集合B3の例は、フロントノード1、エンドノード1の論理パスである。前述した論理パス集合B1〜B3は、この順に、論理パスの設定変更を行ったときに、記憶システムノード相互間のデータ転送量の削減効果が大きい。このことは、後述するたの論理パス集合においても同様である。
【0048】
(6)ステップ1040の処理の後、論理パス集合B1が存在するか否かをチェックし、論理パス集合B1が存在する場合、論理パス集合B1の中で、例えば、最もデータ転送量が多い論理パス(以下、この論理パスを第2論理パスと呼ぶ)を選択する。これは、第1論理パスと第2論理パスとの論理ポートを入れ替えることにより、第1論理パスと第2論理パスとに関する記憶システムノード相互間のデータ転送量を削減することができるからである。このような第2論理パスが存在する場合、図13に示す再配置指示750−Dを作成する(ステップ1045、1065)。
【0049】
再配置指示750−Dは、論理ポート1と論理ポート2との2つのパラメータを持ち、それまで論理ポート1を使用してアクセスしていた論理ボリュームを論理ポート2を用いてアクセスし、それまで論理ポート2を使用してアクセスしていた論理ボリュームを論理ポート1を用いてアクセスすることをクラスタ構成記憶システム200に指示する命令である。再配置指示750−Dの論理ポート1と論理ポート2に第2論理パスの論理ポート番号と第1論理パスの論理ポート番号を設定する。
【0050】
(7)ステップ1045のチェックで、論理パス集合B1が存在しなかった場合、論理パス集合B2が存在するか否かをチェックし、論理パス集合B2が存在した場合、論理パス集合B2の中で、任意の論理パス(以下、この論理パスを第3論理パスと呼ぶ)を選択する。これは、第1論理パスと第3論理パスとの論理ポートを入れ替えることにより、第1論理パスに関する記憶システムノード間のデータ転送量を削減できるからである。このような第3論理パスが存在する場合、図13に示す再配置指示750−Dを作成する。ここでは、再配置指示750−Dの論理ポート1と論理ポート2に第3論理パスの論理ポート番号と第1論理パスの論理ポート番号を設定する(ステップ1050、1065)。
【0051】
(8)ステップ1050のチェックで、論理パス集合B2が存在しなかった場合、論理パス集合B3が存在するか否かをチェックし、論理パス集合B3が存在した場合、論理パス集合B3の中で、例えば、最もデータ転送量が少ない論理パス(以下、この論理パスを第4論理パスとよぶ)を選択する。但し、第4論理パスが第1論理パスよりデータ転送量が大きい場合は選択しない。これは、第1論理パスと第4論理パスとの論理ポートを入れ替えることにより、第4論理パスに関する記憶システムノード間のデータ転送量は増えるが、第1論理パスに関する記憶システムノード間のデータ転送量を削減することができるからである。このような第4論理パスが存在する場合は、図13に示す再配置指示750−Dを作成する。ここでは、再配置指示750−Dの論理ポート1と論理ポート2に第4論理パスの論理ポート番号と第1論理パスの論理ポート番号を設定する(ステップ1055、1065)。
【0052】
(9)ステップ1055のチェックで、論理パス集合B3が存在しなかった場合、あるいは、論理パス集合B3が存在したとしても第4論理パスが存在しなかった場合、論理ポートの設定変更による記憶システムノード間のデータ転送量の削減が不可能と判断して処理を終了する(ステップ1060)。
【0053】
図11は図7における論理ボリュームの再配置決定処理780での処理動作を説明するフローチャート、図12は論理ボリュームの再配置決定処理780の中で作成されるノード間パス集合A1〜A3の例を説明する図であり、以下、アクセス情報700のアクセス頻度をデータ転送量であるとして、これらについて説明する。
【0054】
(1)まず、アクセス情報700から全てのノード間パスのデータ量を計算する。ノード間パスとは、命令を受信する論理ポートを有する記憶システムノードと論理ボリュームとの間の仮想的なパスであると定義する。また、ノード間パスからの命令を受信する論理ポートを有する記憶システムノードをフロントノードと呼び、ノード間パスの論理ボリュームを格納する記憶システムノードをエンドノードと呼ぶ。ノード間パスのデータ量は、データの再配置により変化する記憶システムノード間のデータ転送量であり、ノード間パスのフロントノード内の任意の論理ポートを使用してノード間パスの論理ボリュームにアクセスするデータ転送量の総和から、ノード間パスのエンドノード内の任意の論理ポートを使用してノード間パスの論理ボリュームにアクセスするデータ転送量の総和を引くことにより算出することができる。例えば、図3に示すポート情報400、図4に示す物理位置情報500、図6に示すアクセス情報700を用いた場合のフロントノード4、論理ボリューム5との間のノード間パスのデータ転送量は、論理パス9のデータ転送量と論理パス10とのデータ転送量の和から論理パス6のデータ転送量を引いたものである。ノード間パスのデータ量が正の場合、ノード間パスの論理ボリュームに関する記憶システムノード間のデータ転送量が記憶システム内部のデータ転送量より大きく、論理ボリュームの再配置を行うことにより、記憶システムノード間のデータ転送量を削減することができることを意味する。また、ノード間パスのデータ量が負の場合、ノード間パスの論理ボリュームに関する記憶システムノード間のデータ転送量が記憶システム内部のデータ転送量より小さく、論理ボリュームの再配置を行うことにより、記憶システムノード間のデータ転送量が増えることを意味する(ステップ1205)。
【0055】
(2)次に、全てのノード間パスの中でデータ転送量が規定値以上のノード間パスがあるか否かを調べ、該当するノード間パスがなければ、再配置不要として処理を終了する(ステップ1210、1220)。
【0056】
(3)ステップ1210のチェックで、該当するノード間パスが存在し、それが複数存在する場合、例えば、データ転送量が大きいものから順に選択して以後の処理を行う。いま、選択したノード間パスを第1ノード間パスと呼び、この第1ノード間パスのフロントノードをフロントノードA、論理ボリュームを論理ボリュームAとし、論理ボリュームAを格納する記憶システムノードをエンドノードAとする。これらの情報は、ポート情報400及び物理位置情報500から得ることができる。そして、第1ノード間パスが記憶システムノード間のデータ転送を必要とするか否かを判定し、不要であった場合、再配置不要として処理を終了する(ステップ1215、1220)。
【0057】
(4)ステップ1215の判定で、第1ノード間パスが記憶システムノード間のデータ転送を必要とした場合、未使用記憶容量情報600を用いて、フロントノードAの未使用記憶容量が論理ボリュームAの容量以上あるか否かをチェックして、フロントノードAの未使用記憶容量が論理ボリュームAの容量以上であった場合、図13に示す再配置指示750−Aを作成する(ステップ1225、1235)。
【0058】
再配置指示750−Aは、論理ボリューム1と記憶システムノード2との2つのパラメータをもち、記憶システムノード2に論理ボリューム1と同一フォーマット形式及び同一容量の論理ボリューム2を作成し、論理ボリューム1のデータを論理ボリューム2にコピーし、コピー終了後、論理ボリューム1の物理アドレス情報と論理ボリューム2の物理アドレス情報とを入れ替え、論理ボリューム1の記憶領域を開放することをクラスタ構成記憶システム200に指示する命令である。ここでは、再配置指示750−Aの論理ボリューム1に論理ボリュームAを、記憶システムノード2にフロントノードAを設定する。
【0059】
(5)ステップ1225のチェックで、フロントノードAの未使用領域が論理ボリュームAの容量未満であった場合、全ノード間パスからノード間パスの論理ボリュームを格納する記憶システムノード210がフロントノードAと等しく、ノード間パスの論理ボリュームのフォーマット形式及び容量が論理ボリュームAと等しいノード間パス集合Aを取得する。さらに、ノード間パス集合Aを3つの集合A1〜A3に分割する。ノード間パス集合A1は、ノード間パス集合Aのうち、ノード間パスのフロントノードがエンドノードAと等しいノード間パスとする。ノード間パス集合A2は、ノード間パス集合Aのうち、ノード間パスのフロントノードがフロントノードAと等しくないノード間パスとする。ノード間パス集合A3はノード間パス集合Aのうち、ノード間パスのフロントノードがフロントノードAと等しいノード間パスとする(ステップ1240)。
【0060】
ノード間パス集合A1〜A3の例を図12に示しており、この図12において、第1ノード間パスは、フロントノード2、論理ボリューム1であるとする。ノード間パス集合A1の例は、フロントノード1、論理ボリューム10のノード間パスである。ノード間パス集合A2の例は、フロントノード3、論理ボリューム12のノード間パスである。ノード間パス集合A3の例は、フロントノード2、論理ボリューム11のノード間パスである。
【0061】
(6)ステップ1240の処理の後、ノード間パス集合A1が存在するか否かをチェックし、ノード間パス集合A1が存在する場合、ノード間パス集合A1の中で、データ転送量が最も大きいノード間パス(以下、このノード間パスを第2ノード間パスとよぶ)を選択する。これは、第1ノード間パスの論理ボリュームAを第2ノード間パスのエンドノードに格納し、第2ノード間パスの論理ボリュームをエンドノードAに格納することにより、第1ノード間パスと第2ノード間パスに関する記憶システムノード間のデータ転送量を削減することができるからである。そして、このような第2ノード間パスが存在する場合、図13に示す再配置指示750−Bを作成する(ステップ1245、1280)。
【0062】
再配置指示750−Bは、論理ボリューム1と論理ボリューム2との2つのパラメータを持ち、論理ボリューム1のデータと論理ボリューム2のデータとを入れ替え、入れ替え終了後、論理ボリューム1の物理アドレス情報と論理ボリューム2の物理アドレス情報とを入れ替えることをクラスタ構成記憶システム200に指示する命令である。ここでは、再配置指示750−Bの論理ボリューム1と論理ボリューム2に論理ボリュームAと第2ノード間パスの論理ボリュームを設定する。
【0063】
(7)ステップ1245のチェックで、ノード間パス集合A1が存在しなかった場合、ノード間パス集合A2が存在するか否かをチェックし、ノード間パス集合A2が存在した場合、ノード間パス集合A2の中で、任意のノード間パス(以下、このノード間パスを第3ノード間パスと呼ぶ)を選択する。これは、第1ノード間パスの論理ボリュームAを第3ノード間パスのエンドノードに格納し、第三ノード間パスの論理ボリュームをエンドノードAに格納することにより、第1ノード間パスに関する記憶システムノード間のデータ転送量を削減することができるからである。そして、このような第3ノード間パスが存在する場合、再配置指示750−Bを作成する。ここでは、再配置指示750−Bの論理ボリューム1と論理ボリューム2に論理ボリュームAと第3ノード間パスの論理ボリュームを設定する(ステップ1250、1280)。
【0064】
(8)ステップ1250のチェックで、ノード間パス集合A2が存在しなかった場合、ノード間パス集合A3が存在するかチェックし、ノード間パス集合A3が存在した場合、ノード間パス集合A3の中で、第1ノード間パスのデータ転送量より小さく、データ転送量が最も小さいノード間パス(以下、このノード間パスを第4ノード間パスとよぶ)を選択する。これは、第1ノード間パスの論理ボリュームAを第4ノード間パスのエンドノードに格納し、第4ノード間パスの論理ボリュームをエンドノードAに格納することにより、第4ノード間パスに関する記憶システムノード間のデータ転送量は増えるが、第1ノード間パスに関する記憶システムノード間のデータ転送量を削減することができるからである。このような第4ノード間パスが存在する場合、再配置指示750−Bを作成する。ここでは、再配置指示750−Bの論理ボリューム1と論理ボリューム2に論理ボリュームAと第4ノード間パスの論理ボリュームを設定する(ステップ1255、1280)。
【0065】
(9)ステップ1255のチェックで、ノード間パス集合A3が存在しなかった場合、あるいは、存在しても、第4ノード間パスが存在しなかった場合、論理ボリュームの再配置による記憶システムノード間のデータ転送量の削減が不可能であると判断して処理を終了する(ステップ1260)。
【0066】
次に、クラスタ構成記憶システム200が再配置指示750を受信して実行する再配置処理760について説明する。クラスタ構成記憶システム200は、再配置指示750−Aを受信すると、記憶システムノード2に論理ボリューム1と同一フォーマット形式及び容量の論理ボリューム2を作成し、未使用記憶容量情報600の記憶システムノード2の未使用容量から論理ボリューム1の容量を減じる。そして、後述する再配置処理760−Bと同様の方法で論理ボリューム1のデータを論理ボリューム2にコピーする。データのコピー終了後、論理ボリューム1の物理アドレス情報を論理ボリューム2の物理アドレス情報に変更し、論理ボリューム1の領域を開放し、未使用記憶容量情報600の論理ボリューム1を格納する記憶システムノード1の未使用容量に論理ボリューム1の容量を加える。以上の処理は、論理ボリューム1へのアクセスを停止せずに行うことができる。
【0067】
図14はクラスタ構成記憶システム200が再配置指示750−Bの受信時に実行する論理ボリュームの再配置処理760−Bでの処理動作を説明するフローチャートであり、以下、これについて説明する。すでに説明したように、再配置指示750−Bは、論理ボリューム1と論理ボリューム2とからなる。ここでは、論理ボリューム1を格納する記憶システムノード210をノードA、論理ボリューム2を格納する記憶システムノード210をノードBとして説明する。
【0068】
(1)まず、ノードA及びノードBは、再配置処理の1回の処理単位分のメモリをキャッシュメモリ130(キャッシュメモリA、キャッシュメモリBとする)に確保する。キャッシュメモリA及びキャッシュメモリBは、どの記憶システムノード210のキャッシュメモリ130であってもよい(ステップ1500)。
【0069】
(2)次に、論理ボリューム1と論理ボリューム2の状態情報を「再配置中」に設定する。そして、論理ボリューム1と論理ボリューム2との再配置完了位置を先頭位置に初期化し、論理ボリューム1の再配置先物理アドレス情報を論理ボリューム2の物理アドレス情報に設定し、論理ボリューム2の再配置先物理アドレス情報を論理ボリューム1の物理アドレス情報に設定する(ステップ1510、1520)。
【0070】
(3)論理ボリューム1と論理ボリューム2との再配置完了位置を調べ、全領域の再配置が完了しているか否かをチェックし、全領域の再配置が完了してした場合、論理ボリューム1と論理ボリューム2との物理アドレス情報を交換し、状態情報を正常に戻し、ステップ1500で確保したキャッシュメモリ130を開放して処理を終了する(ステップ1530、1570)。
【0071】
(4)ステップ1530のチェックで、全領域の再配置が完了していなかった場合、ノードAのディスクアダプタ120が、論理ボリューム1の再配置完了位置が示しているデータ位置から再配置処理の1回の処理単位分のデータを記憶装置150からキャッシュメモリAへ読み込む。同様に、ノードBのディスクアダプタ120が、論理ボリューム2の再配置完了位置が示しているデータ位置から再配置処理の1回の処理単位分のデータを記憶装置150からキャッシュメモリBへ読み込む(ステップ1540)。
【0072】
(5)次に、ノードAのディスクアダプタ120が、ステップ1540の処理でキャッシュメモリBに格納されたデータを読み取り、そのデータを論理ボリューム1の再配置完了位置が示しているデータ位置に書き込む。同様に、ノードBのディスクアダプタ120が、ステップ1540の処理でキャッシュメモリAに格納されたデータを読み取り、そのデータを論理ボリューム2の再配置完了位置が示しているデータ位置に書き込む(ステップ1550)。
【0073】
(6)ステップ1550の処理の後、1回の処理単位分だけ論理ボリューム1と論理ボリューム2との再配置完了位置を進めて、ステップ1530からの処理に戻って処理を繰り返す(ステップ1560)。
【0074】
前述で説明した再配置処理は、論理ボリューム1及び論理ボリューム2へのアクセスを停止することなく行うことができる。
【0075】
前述では、クラスタ構成記憶システム200が再配置指示750−Bの受信時に実行する再配置処理について説明したが、前述の例において、別の再配置指示を受信した場合、クラスタ構成記憶システム200は、次のように動作する。
【0076】
クラスタ構成記憶システム200は、再配置指示750−Cを受信すると、ポート情報400の論理ポート2の論理ボリューム番号に論理ポート1の論理ボリュームAを設定し、論理ポート1の論理ボリューム番号を未使用に変更する。クラスタ構成記憶システム200は、変更終了後、保守端末を通じて、保守員に変更終了を知らせる。以上の処理中、論理ボリュームAへのアクセスを停止する必要がある。
【0077】
クラスタ構成記憶システム200は、再配置指示750−Dを受信すると、ポート情報400の論理ポート1の論理ボリューム番号を論理ポート2の論理ボリュームAに変更し、論理ポート2の論理ボリューム番号を論理ポート1の論理ボリュームBに変更する。クラスタ構成記憶システム200は、変更終了後、保守端末を通じて、保守員に変更終了を知らせる。以上の処理中、論理ボリュームA及び論理ボリュームBへのアクセスを停止する必要がある。
【0078】
保守員は、新たに論理ポートに論理ボリュームを設定する場合、保守端末を用いて全論理パスのアクセス情報700を参照し、極力記憶システムノード相互間のデータ転送量が増加しないように、論理ポートの設定を行って論理ボリュームを作成する。
【0079】
次に、ホストコンピュータAが未使用の論理ポートを用いて既存の論理ボリュームAを使用する場合について説明する。
【0080】
まず、論理ボリュームAを格納している記憶システムノードAを調べる。次に、記憶システムノードAに未使用のポートが存在するか否かを調べる。記憶システムノードAに未使用のポートが存在し、ホストコンピュータAとそのポートとを新たに接続することができる場合、記憶システムノード相互間のデータ転送が生じないため、ホストコンピュータAとその未使用ポートとを接続し、そのポートの任意の論理ポートに論理ボリュームAを設定する。条件を満たすポートが存在しない場合、記憶システムノードA内のホストコンピュータAと接続されたポートに未使用の論理ポートが存在するか否かを調べる。条件を満たす論理ポートが存在する場合、記憶システムノード相互間のデータ転送が生じないため、その論理ポートに論理ボリュームAを設定する。
【0081】
前述で条件を満たす論理ポートが存在しない場合、必ず記憶システムノード間のデータ転送が生じるため、任意の未使用の論理ポートに論理ボリュームAを設定する。この場合、保守員が前述した検討を行わずに、保守端末から論理ボリュームA及び使用してよいポートを指定してもよく、また、保守端末が前述の検討を行って、処理結果を保守端末上に表示させ、処理結果の論理ポートに論理ボリュームAを設定してもよい。さらに、保守員の代わりに、保守端末が自動的に検討結果の論理ポートに論理ボリュームAを設定してもよい。
【0082】
次に、ホストコンピュータAが新たに作成する論理ボリュームAを使用する場合について説明する。
【0083】
まず、論理ボリュームAの容量以上の未使用記憶容量を有する記憶システムノード集合Aを調べる。次に、記憶システムノード集合A内に未使用のポートを有する記憶システムノードBを調べる。そして、記憶システムノードBが存在し、ホストコンピュータAと記憶システムノードBの有する未使用のポートBとを新たに接続することができる場合、記憶システムノード相互間のデータ転送が生じないため、記憶システムノードBに論理ボリュームAを作成し、ホストコンピュータAとポートBとを接続し、ポートBの任意の論理ポートに論理ボリュームAを設定する。条件を満たす記憶システムノードが存在しない場合、記憶システムノード集合A内に、ホストコンピュータAと接続され、ポート内に未使用の論理ポートを有する記憶システムノードCを調べる。記憶システムノードCが存在する場合、記憶システムノード相互間のデータ転送が生じないため、記憶システムノードCに論理ボリュームAを作成し、記憶システムノードCの未使用の論理ポートに論理ボリュームAを設定する。記憶システムノードCが存在しない場合、必ず記憶システムノード相互間のデータ転送が生じるため、記憶システムノード集合Aの任意の記憶システムノードに論理ボリュームAを作成し、任意の未使用の論理ポートに論理ボリュームAを設定する。この場合、保守員が前記検討を行わずに、保守端末に作成する論理ボリュームのフォーマット形式及び容量と使用してよいポートを指定してもよく、また、保守員が保守端末に前記検討を行わせ、検討結果を保守端末上に表示させて、検討結果の記憶システムノードに論理ボリュームAを作成し、検討結果の論理ポートに論理ボリュームAを設定してもよい。さらに、保守員の代わりに、保守端末が自動的に、検討結果の記憶システムノードに論理ボリュームAを作成し、検討結果の論理ポートに論理ボリュームAを設定してもよい。
【0084】
前述で説明した本発明の実施形態は、複数の記憶システムを1つの記憶システムとして運用可能とするクラスタ構成記憶システム200において、論理パス毎にアクセス情報700を採取し、保守端末を用いて保守員にアクセス情報700を提示し、論理ポートの設定変更決定処理770及び論理ボリュームの再配置決定処理780に基づく保守員の判断により、論理ポートの設定変更処理及び論理ボリュームの再配置処理を行わせることができるので、クラスタ構成記憶システム200を構成する記憶システムノード相互間の通信負荷を抑えることができ、クラスタ構成記憶システム200のアクセス性能の向上を図ることができる。
【0085】
前述した本発明の実施形態は、論理ポートの設定変更及び論理ボリュームの再配置処理の両方を行うものとして説明したが、本発明は、前述した本発明の実施形態に比較してその効果が小さくなるが、いずれか一方の処理を行うだけてあってもよい。そして、この場合、システムの構成を簡易化することができるので、システム全体のコストの低減を図ることができる。
【0086】
次に、前述で説明した本発明の実施形態の変形例について説明する。この変形例は、保守員が論理ポートの設定変更決定処理770を行うのではなく、クラスタ構成記憶システム200の保守端末、クラスタ構成記憶システム200内の1つのホストアダプタ110あるいはディスクアダプタ120がアクセス情報700を参照して論理ポートの設定変更決定処理770を行い、論理ポートの設定変更による記憶システムノード相互間のデータ転送量の削減が可能な場合に、処理結果のポートの設定変更をホストコンピュータの管理者あるいは保守員に提案するようにしたものである。ホストコンピュータの管理者あるいは保守員は、運用上問題であると判断したら、提案されたポート設定を実行する。
【0087】
次に、前述で説明した本発明の実施形態の他の変形例について説明する。この他の変形例は、保守員が論理ボリュームの再配置決定処理780を行うのではなく、クラスタ構成記憶システム200の保守端末、クラスタ構成記憶システム200内の1つのホストアダプタ110あるいはディスクアダプタ120がアクセス情報700を参照して論理ボリュームの再配置決定処理780を行い、論理ボリュームの再配置処理を自動的に行ようにしたものである。
【0088】
前述した本発明の実施形態の2つの変形例によれば、保守員の負担を低減することが可能となる。
【0089】
次に、前述で説明した本発明の実施形態のさらに他の変形例について説明する。このさらに他の変形例は、クラスタ構成記憶システム200がアクセス情報700を採取し、クラスタ構成記憶システム200を使用するホストコンピュータにポート情報400、物理位置情報500、未使用記憶容量情報600、アクセス情報700を提供し、ホストコンピュータからの再配置指示750により、再配置処理760を行うようにしたものである。そして、ホストコンピュータあるいはホストコンピュータの管理者は、前述で説明した実施形態の場合と同様に、論理ポートの設定変更決定処理770と論理ボリュームの再配置決定処理780と運用状況とによりポートの設定変更及び論理ボリュームの再配置を行うか否かを決定する。これにより、保守員には判断することが困難な高度な条件下でのポートの設定変更及びデータの再配置を行うことが可能となる。例えば、負荷が低いときに論理ボリュームの再配置を行う等の状況に応じた運用が可能となる。
【0090】
【発明の効果】
以上説明したように本発明によれば、クラスタ構成記憶システムを構成する記憶システムノード相互間のデータ転送の頻度、データ転送量を削減することができ、クラスタ構成記憶システムのアクセス性能を向上させることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態によるクラスタ構成の記憶システムの構成を示すブロック図である。
【図2】記憶システムノードの構成を示すブロック図である。
【図3】ポート情報の例を説明する図である。
【図4】物理位置情報の例を説明する図である。
【図5】未使用記憶容量情報の例を説明する図である。
【図6】アクセス情報の例を説明する図である。
【図7】クラスタ構成記憶システムの動作を説明する図である。
【図8】物理位置算出処理での処理動作を説明するフローチャートである。
【図9】図7における論理ポートの設定変更決定処理での処理動作を説明するフローチャートである。
【図10】論理ポートの設定変更決定処理の中で作成される論理パス集合B1〜B3の例を説明する図である。
【図11】図7における論理ボリュームの再配置決定処理での処理動作を説明するフローチャートである。
【図12】論理ボリュームの再配置決定処理の中で作成されるノード間パス集合A1〜A3の例を説明する図である。
【図13】論理ポートの設定変更決定処理、論理ボリュームの再配置決定処理の中で作成される再配置指示について説明する図である。
【図14】クラスタ構成記憶システムが再配置指示の受信時に実行する論理ボリュームの再配置処理での処理動作を説明するフローチャートである。
【図15】従来技術による記憶システムの構成例を示すブロック図である。
【符号の説明】
100 記憶システム
110 ホストアダプタ(CHA)
120 ディスクアダプタ(DKA)
130 キャッシュメモリ(CACHE)
140 管理メモリ(SM)
150 記憶装置(HDD)
160 コモンパス
170 接続線
200 クラスタ構成記憶システム
210−1〜210−n 記憶システムノード
220 接続線
230 論理ボリューム
240 ポート
310 データ転送コントローラ(DTC)
400 ポート情報
500 物理位置情報
600 未使用記憶容量情報
700 アクセス情報

Claims (3)

  1. 複数の記憶システムノードを1つの記憶システムとして運用可能とするクラスタ構成記憶システムにおいて、
    前記記憶システムノード内部及び前記記憶システムノード相互間のアクセス情報を採取する手段と、採取したアクセス情報を保守員に提示する手段と、保守員からのポートの設定指示を受け付ける手段と、前記指示に基づいて前記クラスタ構成記憶システム内のポート設定を変更する手段とを有し、
    前記クラスタ構成記憶システム内のポート設定を変更する手段は、論理ポートと論理ボリュームとの間の仮想的なパスである論理パス毎の単位時間当りのデータ転送量またはデー転送時間を示すアクセス頻度を保持するアクセス情報を参照し、全論理パスの中でデータ転送量が規定値以上の論理パスの1つを選択し、選択した論理パスが記憶システムノード間のデータ転送を必要とするか否かをチェックし、記憶システムノード間のデータ転送を必要とした場合、
    前記論理パスを経て前記ホストコンピュータがアクセスしている論理ボリュームを格納している記憶装置を有する第1の記憶システムノードに未使用ポートがあり、その未使用ポートが当該ホストコンピュータに接続可能である場合、あるいは、当該ホストコンピュータに接続された未使用ポートがある場合に、前記ホストコンピュータが使用するノードを、それまで使用していた第2の記憶システムノードのポートから前記第1の記憶システムノードの前記未使用ポートとするように、ポート設定を変更することを特徴とするクラスタ構成記憶システム。
  2. 複数の記憶システムノードを1つの記憶システムとして運用可能とするクラスタ構成記憶システムにおいて、
    前記記憶システムノード内部及び前記記憶システムノード相互間のアクセス情報を採取する手段と、採取したアクセス情報に基づいて、ポートの設定を決定する手段と、前記クラスタ構成記憶システム内のポート設定を変更する手段とを有し、
    前記クラスタ構成記憶システム内のポート設定を変更する手段は、論理ポートと論理ボリュームとの間の仮想的なパスである論理パス毎の単位時間当りのデータ転送量またはデー転送時間を示すアクセス頻度を保持するアクセス情報を参照し、全論理パスの中でデータ転送量が規定値以上の論理パスの1つを選択し、選択した論理パスが記憶システムノード間のデータ転送を必要とするか否かをチェックし、記憶システムノード間のデータ転送を必要とした場合、
    前記論理パスを経て前記ホストコンピュータがアクセスしている論理ボリュームを格納している記憶装置を有する第1の記憶システムノードに未使用ポートがあり、その未使用ポートが当該ホストコンピュータに接続可能である場合、あるいは、当該ホストコンピュータに接続された未使用ポートがある場合に、前記ホストコンピュータが使用するノードを、それまで使用していた第2の記憶システムノードのポートから前記第1の記憶システムノードの前記未使用ポートとするように、ポート設定を変更することを特徴とするクラスタ構成記憶システム。
  3. 複数の記憶システムノードを1つの記憶システムとして運用可能とするクラスタ構成記憶システムにおいて、
    前記記憶システムノード内部及び前記記憶システムノード相互間のアクセス情報を採取する手段と、前記クラスタ構成記憶システムを利用するホストコンピュータにクラスタ構成記憶システム内のポート情報及び前記アクセス情報を提供する手段と、前記ホストコンピュータからのポートの設定指示を受け付ける手段と、前記指示に基づいてクラスタ構成記憶システム内のポート設定を変更する手段とを有し、
    前記クラスタ構成記憶システム内のポート設定を変更する手段は、論理ポートと論理ボリュームとの間の仮想的なパスである論理パス毎の単位時間当りのデータ転送量またはデ ー転送時間を示すアクセス頻度を保持するアクセス情報を参照し、全論理パスの中でデータ転送量が規定値以上の論理パスの1つを選択し、選択した論理パスが記憶システムノード間のデータ転送を必要とするか否かをチェックし、記憶システムノード間のデータ転送を必要とした場合、
    前記論理パスを経て前記ホストコンピュータがアクセスしている論理ボリュームを格納している記憶装置を有する第1の記憶システムノードに未使用ポートがあり、その未使用ポートが当該ホストコンピュータに接続可能である場合、あるいは、当該ホストコンピュータに接続された未使用ポートがある場合に、前記ホストコンピュータが使用するノードを、それまで使用していた第2の記憶システムノードのポートから前記第1の記憶システムノードの前記未使用ポートとするように、ポート設定を変更することを特徴とするクラスタ構成記憶システム。
JP2001177180A 2001-06-12 2001-06-12 クラスタ構成記憶システム Expired - Fee Related JP4121255B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001177180A JP4121255B2 (ja) 2001-06-12 2001-06-12 クラスタ構成記憶システム
US09/927,571 US6832272B2 (en) 2001-06-12 2001-08-10 Clustering storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001177180A JP4121255B2 (ja) 2001-06-12 2001-06-12 クラスタ構成記憶システム

Publications (2)

Publication Number Publication Date
JP2002366398A JP2002366398A (ja) 2002-12-20
JP4121255B2 true JP4121255B2 (ja) 2008-07-23

Family

ID=19018063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001177180A Expired - Fee Related JP4121255B2 (ja) 2001-06-12 2001-06-12 クラスタ構成記憶システム

Country Status (2)

Country Link
US (1) US6832272B2 (ja)
JP (1) JP4121255B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130864B2 (en) * 2001-10-31 2006-10-31 Hewlett-Packard Development Company, L.P. Method and system for accessing a collection of images in a database
US6999999B2 (en) * 2001-12-28 2006-02-14 Hewlett-Packard Development Company, L.P. System and method for securing fiber channel drive access in a partitioned data library
US8788611B2 (en) * 2001-12-28 2014-07-22 Hewlett-Packard Development Company, L.P. Method for using partitioning to provide capacity on demand in data libraries
US9489150B2 (en) 2003-08-14 2016-11-08 Dell International L.L.C. System and method for transferring data between different raid data storage types for current data and replay data
EP1668486A2 (en) * 2003-08-14 2006-06-14 Compellent Technologies Virtual disk drive system and method
JP4451118B2 (ja) * 2003-11-18 2010-04-14 株式会社日立製作所 情報処理システム、管理装置、論理デバイス選択方法及びプログラム
JP2005190036A (ja) * 2003-12-25 2005-07-14 Hitachi Ltd 記憶制御装置及び記憶制御装置の制御方法
JP4516322B2 (ja) * 2004-01-28 2010-08-04 株式会社日立製作所 複数の上位装置で共有される記憶装置システムを持つサイト間での共有排他制御方式を備えたコンピュータシステム
JP4497993B2 (ja) * 2004-04-16 2010-07-07 株式会社日立製作所 電子配付物の配付制御システム及び方法
JP4387261B2 (ja) * 2004-07-15 2009-12-16 株式会社日立製作所 計算機システム、および、記憶装置システムの移行方法
JP2007066259A (ja) * 2005-09-02 2007-03-15 Hitachi Ltd 計算機システムとストレージシステム並びにボリューム容量拡張方法
JP4821448B2 (ja) * 2006-06-14 2011-11-24 富士通株式会社 Raidコントローラおよびraid装置
US7783747B2 (en) 2006-07-24 2010-08-24 International Business Machines Corporation Method and apparatus for improving cluster performance through minimization of method variation
US7849265B2 (en) * 2007-12-18 2010-12-07 Hitachi, Ltd. Avoiding use of an inter-unit network in a storage system having multiple storage control units
JP2010205208A (ja) * 2009-03-06 2010-09-16 Nec Corp ホストコンピュータ、マルチパスシステム、パス割当方法およびプログラム
US8468292B2 (en) 2009-07-13 2013-06-18 Compellent Technologies Solid state drive data storage system and method
US9146851B2 (en) 2012-03-26 2015-09-29 Compellent Technologies Single-level cell and multi-level cell hybrid solid state drive
US9164880B2 (en) * 2012-10-23 2015-10-20 Hitachi, Ltd. Method and apparatus for offloading storage workload
TWI511037B (zh) * 2014-05-09 2015-12-01 Wistron Corp 儲存叢集化系統與提供對叢集式儲存的存取的方法
JP6958440B2 (ja) * 2018-03-08 2021-11-02 富士通株式会社 情報処理装置、情報処理システム及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5155845A (en) * 1990-06-15 1992-10-13 Storage Technology Corporation Data storage system for providing redundant copies of data on different disk drives
JP3264465B2 (ja) * 1993-06-30 2002-03-11 株式会社日立製作所 記憶システム
JP3160149B2 (ja) * 1994-05-13 2001-04-23 株式会社日立製作所 ディスク制御装置の無停止プログラム変更方法およびディスク制御装置
US5682512A (en) * 1995-06-30 1997-10-28 Intel Corporation Use of deferred bus access for address translation in a shared memory clustered computer system
US6073218A (en) * 1996-12-23 2000-06-06 Lsi Logic Corp. Methods and apparatus for coordinating shared multiple raid controller access to common storage devices
US6182166B1 (en) * 1997-08-25 2001-01-30 Emc Corporation Method/apparatus for interfacing two remotely disposed devices coupled via transmission medium with first and second commands transmitted without first checking receiving device for readiness
US6112257A (en) * 1997-09-24 2000-08-29 Emc Corporation Dynamic adjustment of mirror service policy for logical volumes in a disk drive system based on collected statistics
US6421711B1 (en) * 1998-06-29 2002-07-16 Emc Corporation Virtual ports for data transferring of a data storage system

Also Published As

Publication number Publication date
JP2002366398A (ja) 2002-12-20
US20020188768A1 (en) 2002-12-12
US6832272B2 (en) 2004-12-14

Similar Documents

Publication Publication Date Title
JP4121255B2 (ja) クラスタ構成記憶システム
JP3726484B2 (ja) 記憶サブシステム
JP4147198B2 (ja) ストレージシステム
JP4606455B2 (ja) ストレージ管理装置、ストレージ管理プログラムおよびストレージシステム
JP4842593B2 (ja) ストレージ仮想化装置のデバイス制御引継ぎ方法
US7711896B2 (en) Storage system that is connected to external storage
JP4814617B2 (ja) ストレージシステム
JP5124103B2 (ja) 計算機システム
US8762672B2 (en) Storage system and storage migration method
US7761677B2 (en) Clustered storage system and its control method
US6571354B1 (en) Method and apparatus for storage unit replacement according to array priority
US7467241B2 (en) Storage control method and storage control system
US8151080B2 (en) Storage system and management method thereof
US20140025888A1 (en) Storage system and method for efficiently utilizing storage capacity within a storage system
US5504888A (en) File updating system employing the temporary connection and disconnection of buffer storage to extended storage
JP4528551B2 (ja) ストレージシステム
EP1093051A2 (en) Method for the transparent exchange of logical volumes in a disk array storage device
US20040024964A1 (en) Storage system management method, storage system, switch, and storage medium having a program
JP2005508551A (ja) 共有バスを用いたデータのミラー化
US6922762B2 (en) Clustering storage system
JP2005507118A (ja) ネットワーク記憶制御装置のためのモジュラーアーキテクチャ
JP2010271808A (ja) ストレージ装置及びデータコピー方法
US20090248916A1 (en) Storage system and control method of storage system
JPH10198526A (ja) Raid装置及びそのアクセス制御方法
JP4451687B2 (ja) ストレージシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080428

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120509

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130509

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees