JP2008047142A - 情報処理システム、および、情報処理システムのストレージ制御方法 - Google Patents

情報処理システム、および、情報処理システムのストレージ制御方法 Download PDF

Info

Publication number
JP2008047142A
JP2008047142A JP2007240813A JP2007240813A JP2008047142A JP 2008047142 A JP2008047142 A JP 2008047142A JP 2007240813 A JP2007240813 A JP 2007240813A JP 2007240813 A JP2007240813 A JP 2007240813A JP 2008047142 A JP2008047142 A JP 2008047142A
Authority
JP
Japan
Prior art keywords
storage
computer
function
information
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007240813A
Other languages
English (en)
Inventor
Takanari Iwamura
卓成 岩村
Yasutomo Yamamoto
康友 山本
Kentetsu Eguchi
賢哲 江口
Takashi Arakawa
敬史 荒川
Hiroharu Arai
弘治 荒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007240813A priority Critical patent/JP2008047142A/ja
Publication of JP2008047142A publication Critical patent/JP2008047142A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】複数のストレージボックスで構成された大規模なストレージシステムで、ストレージボックス間の負荷の不均衡が発生するのを回避する。
【解決手段】あるストレージボックスに格納されている論理ボリュームを、ストレージボックスの論理ボリュームへ移動するに際して、ストレージボックスと通信しているホストの保持するネットワーク通信プロトコルなどのそのアクセス対象に関する情報を変更することによって、移動した論理ボリュームのアクセスのネットワーク経路を切り替える。ストレージボックスからホストに移動を通知する手段としては、ICMP Redirect Errorメッセージを使う方法、ARPプロトコルを用いる方法がある。
【選択図】図3

Description

本発明は、計算機とネットワークにより接続され、複数のストレージサブシステムにより構成されるストレージシステムに係り、特に、iSCSIなどを使ってストレージの制御をおこなうシステムであって、計算機とストレージサブシステムのネットワーク、また、ストレージサブシステム間ネットワークの負荷をかけることなく、ストレージサブシステムの計算機からのアクセスの負荷分散をおこなうのに好適なストレージシステムに関する。
近年、大規模ストレージシステムに対する信頼性や性能に対する要求が、ますます高まってきている。このようなユーザの要求を満たすための大規模ストレージサブシステムを構築する方法として、複数のストレージサブシステム(以後、「ストレージボックス」ともいう)を内部ネットワークで接続し、各々独立にストレージの制御をおこなえる形態がある。例えば、実際のストレージシステムの実装の一つとしては、ストレージボックス同士を高速専用ネットワークで接続し、ストレージボックス間でのI/Oフォワード機能を付加することで、ホストからは大規模なストレージサブシステムとして見せる方法がある。このI/Oフォワード機能は、ホストからI/O要求を受けたときに、他のストレージボックスへの要求であったときには、他のストレージボックスと交信し、ホストに必要なメッセージを返す機能である。
また、第二の方法としては、ストレージボックス間に専用のネットワークを用意せずに、ホストからのI/Oが通過する非専用ネットワークを用いて、前記のI/Oフォワード機能をおこなう方法もある。
このようなストレージシステムを構築するためのプロトコルとして、現在IETF(Internet Engineering Task Force)にて仕様策定中のiSCSI(Internet Small Computer Interface)が期待されている。
iSCSIは、TCP/IPプロトコルで通信をおこなっているネットワーク上でSCSIコマンド等の送受信によってストレージI/Oをおこなうためのプロトコルである。TCP/IPプロトコルを用いることのできる代表的なネットワーク機器であるEthernet(登録商標)は、現在ストレージネットワークで用いられているFibre Channelよりも低コストで敷設することができることから、このiSCSIの普及によって現在のFibre Channelで接続されたストレージネットワーク以上の数のホストおよびストレージサブシステムを接続することができるようになる。
また、このようなストレージサブシステムに関する従来技術としては、特許文献1の「記憶制御装置」があり、これには、ストレージサブシステム内部の各部の負荷状況を把握すること、負荷が集中するのを回避する方法が開示されている。
特開2000−293317号公報
上記従来の技術は、ストレージサブシステム内部のディスクへのアクセス集中を回避する方法を述べているが、大規模なストレージシステムについては、考慮されていない。大規模なストレージシステムでは、多数のホストから同時にI/O要求が送られて来るため、特定のチャネルプロセッサやパリティグループ等に対する負荷集中が発生し、その結果としてI/O性能が劣化する可能性がある。上記従来技術の方法では、ストレージサブシステム内部のパリティグループの負荷集中については解決できるが、ストレージサブシステムの間の負荷の不均衡については解決できないという問題点があった。
さらに、I/Oフォワード機能にて用いるストレージボックス同士を接続するネットワークは、原則的に全てのストレージボックスを接続して用いるため、常にストレージボックス間のネットワーク上をデータを通過するようにすると、そのネットワーク上の通信が性能上のボトルネックとなり、性能低下を発生させることがありうる。
本発明は、上記問題点を解決するためになされたもので、その目的は、複数のストレージボックスで構成された大規模なストレージシステムで、ストレージボックス間の負荷の不均衡が発生するのを回避する機能を有するストレージシステムを提供することにある。
本発明のストレージシステムでは、一つ以上の計算機とネットワークにより接続され、それらの計算機のアクセス対象を格納する複数のストレージサブシステムから構成されるストレージシステムにおいて、第一のストレージサブシステムに格納されているアクセス対象を、第二のストレージサブシステムへ移動し、計算機の保持するそのアクセス対象に関する情報を変更することによって、移動したアクセス対象へのネットワーク経路を、各計算機毎に独立におこなうようにする第一のストレージサブシステムから第二のストレージサブシステムへ切り替えるようにする。
ストレージサブシステムとホストのネットワーク経路を切り替えるために、ストレージサブシステムとホストのやりとりの方法としては、ICMP Redirect Errorメッセージを使う方法、ARPプロトコルを用いる方法が考えられる。
また、計算機の保持するそのアクセス対象に関する情報は、例えば、iSCSIを使用したシステムの場合には、IPプロトコルに関する情報、SCSIに関する情報などである。
本発明によれば、複数のストレージボックスで構成された大規模なストレージシステムで、ストレージボックス間の負荷の不均衡が発生するのを回避する機能を有するストレージシステムを提供することができる。
以下、本発明に係る各実施形態を、図1ないし図19を用いて説明する。
〔実施形態1〕
以下、本発明に係る第一の実施形態を、図1ないし図10を用いて説明する。
(I)本実施形態のストレージシステムの構成
先ず、図1および図2を用いて本発明の第一の実施形態に係るストレージシステムの構成について説明する。
図1は、本発明の第一の実施形態に係るストレージシステムを使った情報処理システムの全体構成図である。
図2は、本発明の第一の実施形態に係るストレージシステムを構成するストレージボックスの構成である。
図1に示されるように本実施形態のストレージシステムを使った情報処理システムは、一つ以上のホスト110と、ストレージシステム100がストレージネットワークにより接続された形態である。
ここで、ストレージネットワーク140は複数個、複数種類の物理ネットワーク機器から構成されるネットワークや、広域ネットワークであってもよく、どのようなネットワークトポロジーであってもよい。
ストレージシステム100とホスト110は、NIC(Network Interface Card)130を介してストレージネットワーク140により接続されている。また、ホスト110とストレージシステム100の通信プロトコルとしては、TCP/IPプロトコルが代表的なものであり、ストレージI/Oも含んだプロトコルとしてはiSCSIプロトコルを用いることができる。
ストレージシステム100は、複数のストレージボックス150とストレージボックス間調停機能160がストレージ内部ネットワーク170によって接続されたシステムである。
ストレージボックス150は、単体でホスト110からのI/Oリクエストに応じて情報を蓄積したり、返したりする機能を有するストレージサブシステムである。
ストレージ内部ネットワーク170は、ストレージボックス150やストレージボックス間調停機能160同士を接続する内部ネットワークである。ただし、ストレージ内部ネットワーク170は、ホスト110とストレージシステムを接続するストレージネットワーク140と同じネットワークであってもよい。
ストレージボックス間調停機能160は、ルーティング情報発信機能161とストレージボックス間論理ボリューム移動機能162を含んでいる。なお、ストレージボックス間調停機能160は、図1のようにストレージシステム100の内部に設けてもよく、外部に存在してもよい。
ルーティング情報発信機能161は、ホスト110およびストレージボックス150が参考にするTCP/IPの経路情報を発信する機能である。ここで、TCP/IPの経路情報を発信するプロトコルとしては、RIPやOSPFが考えられ、またこの機能を実現するための具体例としてはUnix(登録商標)のrouted,gatedが考えられるが、これ以外のものでもよい。また、ルーティング情報発信機能161は、自身以外が発信した経路情報を受信する能力を有してもよい。
ストレージボックス間論理ボリューム移動機能162は、ストレージボックス間の論理ボリューム移動を実施するためのストレージ全体の制御をおこなう機能である。
ホスト110は、TCP/IPスタック112、I/Oリクエスト発行機能111、ルーティング情報送受信機能114、ルーティングテーブル113を含む計算機である。
TCP/IPスタック112は、TCP/IPプロトコルに沿った通信をおこなうための機能である。
I/Oリクエスト発行機能111は、ストレージシステム100に対してiSCSIプロトコルに準拠したI/Oリクエストを発行する機能である。
ルーティング情報送受信機能114は、ストレージシステム100あるいはルータや他のホスト110等が発信するTCP/IPの経路情報を受信したり、経路情報を発信する機能である。
ルーティングテーブル113は、TCP/IPスタック112が通信をおこなうために必要な経路情報が含まれている。
次に、図2を用いてストレージボックス150の構成を説明する。
ストレージボックス150は、図2に示されるようにNIC130、CHP210(CHannel Processor)、キャッシュ220、DKP230(DisK Processor)と、記憶装置240から構成され、CHP210、DKP230、キャッシュ220は、内部ネットワークスイッチ250に接続されている。そして、複数のストレージボックス150の内部ネットワークスイッチ250を接続することによってストレージ内部ネットワーク170が構成されている。
なお、図中ではCHP210とキャッシュ220、DKP230は、内部ネットワークスイッチ250に接続されているが、CHP210とキャッシュ220、DKP230同士が別途に用意されたバス等で接続されていた場合には、内部ネットワークスイッチ250は、ルーティング機能211およびI/Oリクエスト機能212が存在するプロセッサ(図中ではCHP210)にのみ接続されていてもよい。
また、内部ネットワークスイッチ250とストレージ内部ネットワーク170の機能の代用として、ストレージネットワーク140を用いてもよい。
このストレージボックス150は、通常、一つ以上の記憶装置240を有している。この記憶装置240は、論理ボリュームとしてホストに提供されている記憶領域を実際に蓄積する装置である。記憶装置240は、現在のストレージシステムとしては磁気ディスクが主力であるが、光ディスク、コンパクトディスク、DVD等も考えられ、さらにこれら以外のものでもよい。
CHP210は、NIC130を通じて受信したI/Oリクエストを処理するためのプロセッサであり、ルーティング機能211とI/Oリクエスト処理機能212が含まれる。各ストレージボックスのCHP210は、他のストレージボックスCHP210とネットワークにより接続されており、ストレージ内部にCHP用TCP/IPネットワーク260を形成している。このCHP用TCP/IPネットワーク260は、TCP/IPプロトコルによって、各CHP210のI/Oリクエスト処理機能212とルーティング機能211が接続されたネットワークである。
ルーティング機能211は、ストレージネットワーク140とCHP用TCP/IPネットワーク260を接続するIPルータにより、TCP/IPパケットをルーティングさせる機能である。
I/Oリクエスト処理機能212は、ホストから送信されたI/Oリクエストを処理する機能であり、TCP/IPプロトコルとiSCSIプロトコルによって届けられたSCSIコマンドを解釈して、これを処理するためにキャシュ上のデータを読み書きしたり、DKP230のステージング機能231に対してステージング処理、または、デステージング処理を依頼する。ここで、ステージング処理とは、記憶装置240の上のデータをキャッシュへ移動する機能であり、デステージング処理とは、その逆の処理である。
なお、I/Oリクエスト処理機能212がキャッシュ220やステージング機能231へ処理を依頼する際のデータのアドレッシングは、直接に記憶装置240やそのブロックのアドレスを指定するのではなく、論理的なアドレスを用いておこなう。
CHP用TCP/IPネットワーク260の実現方法としては、ストレージ内部ネットワーク170を利用してもよいしCHP210同士を直接ネットワークで接続してもよい。また、CHP用TCP/IPネットワーク260としてストレージネットワーク140を用いてもよい。
DKP230は、記憶装置240のI/O処理を担当するためのプロセッサであり、ステージング機能231や論理ボリューム移動機能232が含まれる。ステージング機能231は、キャッシュ220へのステージング処理やデステージング処理をおこなう機能である。DKP230は、また複数の記憶装置をまとめてパリティグループとして取り扱うために必要な処理をおこなうが、これ以外にレプリケーション等の処理をおこなってもよい。
論理ボリューム移動機能232は、ホスト110からのアクセス単位である論理ボリュームとして提供されている記憶装置上のデータを他のストレージボックス150を含めた記憶装置240に移動させる機能である。また、論理ボリューム移動機能232は、論理ボリューム移動に伴ってキャッシュ上の情報のストレージボックス150間の移動をおこなうようにしてもよい。
また、実際の移動方法としては、一時的にI/O処理を停止して論理ボリュームの全データを複写し、複写完了後にステージング機能231が有する論理的なアドレスと実際にデータが保存されている記憶装置やブロックを変換するための情報の更新した後に再びI/O処理を再開する方法や、I/O停止時間の短縮が期待できる複写方法として、前処理にI/Oを停止させずに論理ボリュームの全データを複写し、その次にI/O処理を一時停止させてから前処理開始以後の書き込みによって変化したデータを移動先へ反映させる方法が考えられる。さらに、これ以外の方法やタイミングで論理ボリュームの移動やステージング機能231が有する情報を更新してもよい。
ステージング機能231は、I/Oリクエスト処理機能212から要求されたステージング処理やデステージング処理をおこなう機能である。なお、ステージング機能231は内部に論理的なアドレスと実際にデータが保存されている記憶装置やそのブロックを示すアドレスを変換するための情報を有する。
(II)本実施形態のストレージ制御方法
次に、図3ないし図8を用いて本実施形態のストレージ制御方法について説明する。
図3は、本発明の第一の実施形態のストレージ制御方法を説明するための概要図である。
図4は、本発明の第一の実施形態のストレージ制御方法のIPアドレスと論理ボリュームの対応関係を模式的に示した図である。
図5は、本発明の第一の実施形態のストレージ制御方法を説明するためのフローチャートである。
本実施形態のストレージ制御方法は、図3に示したような複数のストレージボックスを有するストレージシステム100とホスト110がネットワークで接続されている情報処理システムで、ストレージボックス150内の論理ボリュームを移動したきに、ネットワークの通信経路も切替える方法に関するものである。
ここで、ストレージボックスB150B内の記憶領域B331にデータが存在する論理ボリュームをストレージボックスA150Aに移動する場合を例に採るものとする。また、その論理ボリュームは、ホストA110Aが、アクセスをおこなっており、そのIPアドレスは、AddressAであるものとする。
本実施形態では、ホスト110とストレージボックス間のプロトコルとしては、TCP/IPプロトコル、または、iSCSIプロトコルを用いるものとして説明する。
なお、この例では、一つのIPアドレスに一つの論理ボリュームが対応した例を説明しているが、一つのIPアドレスに複数の論理ボリュームが対応していてもよいし、逆に、複数のIPアドレスに一つの論理ボリュームが対応していてもよい。
先ず、ここでは、図4を用いてIPアドレスと論理ボリュームの対応関係について説明する。
IPアドレスと論理ボリュームとの対応は、IPアドレスと論理ボリュームをそれぞれ頂点となす無向グラフのチェイン(Chain)を考えて、ストレージアクセス時のデータのトラフィックを計算したり、表示したりする。
図4(a)は、IPアドレスと論理ボリュームが一対一に対応した場合であり、データ量は、IPを経由して論理ボリュームVへのストレージアクセスをおこなうための時間あたりのデータ量は、1[GB/S]である。
図4(b)は、IPアドレスと論理ボリュームが一対多に対応した場合であり、データ量は、IPを経由して論理ボリュームV21、V22、V23ヘのストレージアクセスをおこなうためのアクセス時の時間あたりのデータ量は、それぞれの論理ボリュームに対する時間あたりのデータ量の和をとった2[GB/S]になる。
図4(c)は、IPアドレスと論理ボリュームが多対一に対応した場合であり、データ量は、IP31、IP32、IP33を経由して論理ボリュームVヘのストレージアクセスをおこなうためのアクセス時の時間あたりのデータ量は、それぞれのIPアドレスに対する時間あたりのデータ量の和をとった4.5[GB/S]になる。
また、図4(b)と図4(c)のタイプを組み合わせてIPアドレスと論理ボリュームが多対多に対応するようにしてもよい。
論理ボリュームの移動の際には、各々のストレージボックスに関してこのような時間あたりのデータ量が平準化されることが望ましい。
次に、図5のフローチャートを追いながら、本実施形態で論理ボリュームを移動したときのシステムの処理について説明する。
(1)ここでは、IPアドレスがAddressAである論理ボリュームを他のストレージボックスに移動しようとしている。
先ず、移動する前に先立って、ストレージボックス間調停機能160のストレージボックス間論理ボリューム移動機能162がトリガーをかけることにより、ストレージボックスB150BのI/Oリクエスト処理機能212は、AddressAに関係するTCPコネクションの情報やバッファ、IPアドレス、iSCSIのシーケンス番号や、SCSI処理部の状態等のネットワーク通信およびSCSI処理までに必要な情報をストレージボックスA150AのI/Oリクエスト処理機能212に移動させる(ステップ1001)。
それと同時に、ストレージサブシステム調停機能160のストレージボックス間論理ボリューム移動機能162が指示を与えることにより、ストレージボックスA150AとストレージボックスB150B両方のルーティング機能211について、AddressA宛であるIPデータグラムはストレージボックスA150AのI/Oリクエスト処理機能212へ向けて送信するように設定する(ステップ1002)。
次に、ストレージボックスB150Bのルーティング機能211にAddressA宛のIPデータグラムが来た場合はIPプロトコルで定義されているICMP Redirect ErrorメッセージをホストA110Aに返信するように設定する(ステップ1003)。
ICMP Redirect Errorメッセージは、TCP/IPプロトコルで通常用いられるメッセージであり、このメッセージは、ホストA110Aが、AddressAの論理ボリュームに対して、これ以降ストレージボックスA150Aにアクセスに行かせるようにすることが目的である。
(2)次に、ストレージサブシステム調停機能160のルーティング情報発信機能161はIPアドレスがAddressAに関する経路として、ストレージボックスA150Aのルーティング機能211を経由する設定をストレージネットワーク140上の全てのホストへ発信する(ステップ1004)。
(3)ICMP Redirect Errorメッセージを受け取ったホストA110Aは、自らのルーティングテーブル113を更新し、これ以降のAddressA宛のIPデータグラムをストレージボックスA150Aのルーティング機能211を経由させる(ステップ1005)。
(4)ルーティング情報発信機能161による経路情報を受け取ったホストB110Bは自らのルーティングテーブル113を更新し、これ以降のAddressA宛のIPデータグラムをストレージボックスA150Aのルーティング機能211を経由させるようにする(ステップ1006)。
この段階でAddressAの論理ボリュームへのアクセスリクエストは、ステップ1007が完了するまで一時的に処理を停止した状態となり、TCP/IPプロトコルのメッセージやホストからのSCSIリクエストが受け付けられない状態になる。しかしながら、そのような場合でも、通常、TCP/IPプロトコルのメッセージやホストからのSCSIリクエストは、送信に失敗したときに再送処理されるため、論理ボリューム移動後は、移動以前と同様なアクセスが可能となる。
また、I/Oリクエスト処理機能212が他のストレージボックス150のキャッシュ220のデータにアクセス可能であったり、DKP230との情報のやり取りが可能である場合は、現段階からステップ1007が完了するまでの間にストレージボックスA150AのI/Oリクエスト処理機能に到着したI/OリクエストをストレージボックスB150Bのキャッシュ220やDKPと連携してI/Oリクエストを処理してもよい。この場合には、ストレージボックスA150AにI/Oリクエストが到着したときでも、移動前のストレージボックスBにある論理ボリュームにアクセス可能になる。
(5)最後に、論理ボリューム移動機能232により、記憶領域B331に保存されたデータを記憶領域A332へ移動し、AddressAの論理ボリュームが実際にデータを保存している領域の値を記憶領域B331から記憶領域A332へ変更する(ステップ1007)。
これによって、ホストA110A、ホストB110B共に、ストレージボックスA150Aにストレージネットワーク140を介してアクセスに行くようになり、論理ボリューム移動に伴って、ネットワーク経路が切替えられたことになる。
なお、本実施例でホスト110のルーティングテーブル更新に用いた方法は、ICMP Redirect Errorメッセージおよびルーティング情報発信機能161であったが、これ以外の方法でルーティングテーブル113を更新してもよい。
この場合、上記のようにルーティング機能211の設定変更以後に、ストレージボックスB150Bのルーティング機能211にAddressA宛のIPデータグラムが到着する場合でも、CHP用TCP/IPネットワーク260を経由してストレージボックスA150AのI/Oリクエスト処理機能212へ転送される。したがって、ルーティングテーブル113の更新の要件とされるのは、その方法により、それぞれのホスト110に対して同時または個別に変更されることでありかつ、それが有限時間で完了することのみである。
次に、図6を用いて本発明のストレージ制御方法におけるストレージボックス間論理ボリューム移動機能162の処理について説明する。
図6は、ストレージボックス間論理ボリューム移動機能162の処理のフローチャートである。
DKP230の中のストレージボックス間論理ボリューム移動機能162は、論理ボリューム移動方法のストレージシステム100全体の制御をおこなう機能を有し、以下のような図6のフローチャートに従った処理をおこなう。
(1)移動元のストレージボックス150から移動させるIPアドレスと論理ボリュームと移動先となるストレージボックス150を決定し、配列IPList[]とVOL[]へセットする(ステップ401)。
移動の対象とするIPアドレスと論理ボリュームの対は、上記の図4の所で説明したようなIPアドレスと論理ボリュームのチェインを考えて、論理ボリュームにアクセスされるデータ量の総和が大きくならないように留意する。すなわち、論理ボリュームを移動する前のストレージボックスのIPアドレスと論理ボリュームのチェインによって換算されるデータ量に対して、論理ボリュームを移動した後のIPアドレスと論理ボリュームのチェインによって換算されるデータ量が大きくならないようにすることによって、このストレージシステムを構成する各々のストレージボックスに対する負荷を平準化することができる。
また、IPList[]とVOL[]の決定方法については、管理者が管理画面を通してIPList[]とVOL[]を決定する方法や、IPList[]とVOL[]を設定するAPIを外部ソフトウェアに公開し、外部ソフトウェアが決定する方法が考えられるが、これら以外の方法を用いてもよい。また、IPList[]とVOL[]の決定に際して、上記の図4で説明したIPアドレスと論理ボリュームに対応付けられているもので、一つのチェインを形成しているものの全てを移動のためのIPList[]とVOL[]に設定することを推奨、または、強制し、これによってIPアドレスとそこからアクセス可能な論理ボリュームが移動中を除き常にあるストレージボックス150内に存在するようにしてもよい。
(2)次に、I/Oリクエスト処理機能212に対してIPアドレスのリストIPList[]とこれに関係する全てのTCPコネクション、iSCSIデバイス、SCSIデバイスの状態を移動先CHP210のI/Oリクエスト処理機能212へ移動するように依頼する(ステップ404)。
(3)変数iに0をセットする(ステップ402)。
(4)iが配列IPList[]より小さな値ならばステップ405をおこない、そうでないならばステップ409をおこなう(ステップ403)。
(5)ストレージシステム100内の全てのルーティング機能211に対して、IPアドレスIPList[i]に対する経路設定を移動先となるCHP210のI/Oリクエスト処理機能212へ設定する(ステップ405)。
(6)移動先となるストレージボックス150以外にあるCHP210のルーティング機能211に対して、IPアドレスIPList[i]を宛先とするIPデータグラムが到着した場合は、それを移動先のCHP210のI/Oリクエスト処理機能212へ転送すると共に、送信元のホスト110またはルータ等のネットワーク機器に対してICMP Redirect Errorメッセージを送信するように設定する(ステップ406)。
(7)ホスト110がIPアドレスIPList[i]に対してIPデータグラムを送る場合に、移動先のストレージボックス150が有するCHP210のルーティング機能211をルータとして利用させる新たな経路情報をルーティング情報発信機能161に発信させる(ステップ407)。
(8)iを1インクリメントし、ステップ403へ戻る(ステップ408)。なお、図の「i++」はC言語ライクな記法であり、iを1インクリメントすることを意味する。
(9)変数iに0をセットする(ステップ409)。
(10)iが配列IPList[]より小さな値ならばステップ411をおこない、そうでないならば終了する(ステップ410)。
(11)VOL[i]を移動先のストレージボックス150の利用していない記憶領域へ移動する(ステップ411)。
(12)iを1インクリメントし、ステップ410へ戻る(ステップ412)。
次に、図7を用いて本発明のストレージ制御方法において、ホスト110がICMP Redirect Errorメッセージを受け取った場合の処理について説明する。
図7は、ホスト110がICMP Redirect Errorメッセージを受け取った場合の処理のフローチャートである。
ホスト110がICMP Redirect Errorメッセージを受け取った場合には、ホスト110のTCP/IPスタック112が、以下のようにルーティングテーブル113の内容を変更する(図5のステップ1005)。
(1)ICMP Redirect Errorメッセージを受け取る(ステップ501)。
(2)受け取ったICMP Redirect Errorメッセージから通信先のIPアドレスDestIPとそれに対する新たなルータのIPアドレスRtrIPを抽出する(ステップ502)。
(3)ルーティングテーブル113のDestIPに対するエントリを更新または追加し、RtrIPとなるようにする。(ステップ503)
次に、図8を用いてホスト110がTCP/IPの経路情報を受信した場合の処理について説明する。
図8は、ホスト110がTCP/IPの経路情報を受信した場合の処理のフローチャートである。
ホスト110が、OSPFやRIP等のルーティングプロトコルに代表されるTCP/IPの経路情報を受信したときには、ルーティング情報送受信機能114は、以下のようにルーティングテーブル113の内容を変更する(図5のステップ1006)。
(1)経路情報を受け取る(ステップ601)。
(2)経路情報を元に、ルーティングテーブル113に対して変更または追加を行う(ステップ602)。
次に、図9を用いてI/Oリクエスト処理機能212がIPアドレスに関係する通信情報、I/O情報を移動する処理について説明する。
図9は、I/Oリクエスト処理機能212がIPアドレスに関係する通信情報、I/O情報を移動する処理のフローチャートである。
CKP210のI/Oリクエスト処理機能212は、以下のようにIPアドレスの集合とこれに関係するTCPコネクション、iSCSIデバイス、SCSIデバイスを移動する(図5のステップ1001)。
なお、SCSIデバイスとはSCSIコマンドの処理をおこなう仮想的なデバイスである。また、iSCSIデバイスはiSCSIの規格にしたがった通信をおこなうために必要なログイン処理等の制御やSCSIコマンドの受渡しを行う仮想的なデバイスであり、一つ以上のTCPコネクションを通して送られて来るiSCSIのPDU(Protocol Data Unit)からSCSIコマンドやデータを抽出し、それをSCSIデバイスに渡したり、SCSIデバイスの処理結果をPDUにセットしてTCPコネクションを通じて送信する処理をおこなうものであり、SCSIデバイスと1対1に対応する。
(1)移動元のストレージボックス150が有するCHP210のI/Oリクエスト処理機能212(以後、「移動元CHP210」と省略する)は、IPList[]に含まれるIPアドレスを送信先として到着したIPデータグラムを破棄するようにする。なお、IPList[]は、図6のステップ404で渡された移動すべきIPアドレスの配列である(ステップ701)。
(2)移動元CHP210は、IPList[]に含まれるIPアドレスを用いて確立されている全てのTCPコネクションと、それらのTCPコネクションを用いている全てのiSCSIデバイス、前記iSCSIデバイスに対応するSCSIデバイスの処理を中断し、状態の移動に備える(ステップ702)。
(3)移動先のストレージボックス150が有するCHP210のI/Oリクエスト処理機能212(以後、「移動先CHP210」と省略する)は、IPList[]に含まれる全てのIPアドレスを受け付けるようにする(ステップ703)。
ここで、必要ならばI/Oリクエスト処理機能212のTCPスタックに対して、IPList[]に含まれるIPアドレスに対するIPデータグラムが到着した場合に、送信元へ特別なメッセージを返さずにIPデータグラムを破棄する設定をしてもよい。
(4)移動元CHP210は、IPList[]に含まれるIPアドレスを用いて確立された全てのTCPコネクションの状態を保存し、移動先CHP210へ送る(ステップ704)。なお、TCP/IPプロトコルの規格から、少なくともCHP210側のIPアドレスとport番号、ホスト110側のIPアドレスとport番号、現在のシーケンス番号と緊急ポインタ番号、CHP210側に存在するTCPコネクション毎の送信用バッファと受信用バッファをTCPコネクションの状態として保存する必要がある。
(5)移動先CHP210は、移動元CHP210から送られて来たTCPコネクションの状態を元にTCPコネクションの復旧を行い、TCPコネクションに対する送受信処理を再開する(ステップ705)。
ここで、ステップ703にて必要に応じて行ったIPList[]に含まれるIPアドレスに関するIPデータグラムの破棄設定を解除してもよい。
(6)移動元CHP210は、移動が完了したTCPコネクションの情報を破棄する(ステップ706)。
(7)移動元CHP210は、IPList[]に含まれるIPアドレスを用いて確立されているTCPコネクションを用いているiSCSIデバイスの状態を保存し、移動先CHP210へ送る(ステップ707)。なお、iSCSIプロトコルの規格から、少なくとも利用しているTCPコネクションのホスト側のIPアドレスとport番号、CHP210側のIPアドレスとport番号、iSCSIで定義されている各種シーケンス番号の現在値、iSCSIログインでホスト110と交換した情報をiSCSIデバイスの状態として保存する必要がある。
(8)移動先CHP210は、移動元CHP210から送られて来たiSCSIデバイスの状態を元にiSCSIデバイスの復旧をおこない、iSCSI PDUの受け付けを開始する。ただし、SCSIコマンドを含んだPDUを受け付けた場合は、ホスト110がI/O要求を再送する意味を持つBusyのSCSIレスポンスをPDUにセットし、送り返えしてもよい(ステップ708)。
(9)移動元CHP210は、移動が完了したiSCSIデバイスの状態を廃棄する(ステップ709)。
(10)移動元CHP210は、IPList[]に含まれるIPアドレスを用いて確立されているTCPコネクションを用いているiSCSIデバイスに対応したSCSIデバイスの状態を保存し、移動先CHP210へ送る(ステップ710)。
(11)移動先CHP210は、移動元CHP210から送られて来たSCSIデバイスの状態を元にSCSIデバイスの復旧をおこない、SCSIコマンドの受け付けを開始する。また、ここで、ステップ701にて、BusyのSCSIレスポンスを送り返す設定をおこなった場合は、SCSIコマンドをSCSIデバイスへ受け渡すようにiSCSIデバイスの設定を変更する(ステップ711)。
(12)移動元CHP210は移動が完了したSCSIデバイスの状態を廃棄する(ステップ712)。
(III)本実施形態のストレージ制御方法による負荷分散について
以上の実施形態で示されたように、論理ボリューム移動機能232が、負荷の高い論理ボリュームを選び出し、他のストレージボックスに移動させることにより、ストレージシステム100は、ストレージボックス150同士で生じる負荷の不均衡を解決することができる。
〔実施形態2〕
以下、本発明に係る第二の実施形態を、図10ないし図17を用いて説明する。
第一の実施形態では、ストレージボックス間で論理ボリュームが移動したことを、ホストに知らせるためにICMP Redirect Errorメッセージを用いるものであった。
本実施形態では、そのためにARPプロトコルを利用するものである。ARPは、TCP/IPプロトコルで利用できる汎用のプロトコルであり、通信相手のIPアドレスからMACアドレスを知るためのプロトコルである。
(I)本実施形態のストレージシステムの構成
先ず、図10および図11を用いて本発明の第二の実施形態に係るストレージシステムの構成について説明する。
図10は、本発明の第二の実施形態に係るストレージシステムを使った情報処理システムの全体構成図である。
図11は、本発明の第二の実施形態に係るストレージシステムを構成するストレージボックスの構成である。
本実施形態も第一の実施形態と同様に、ホストとストレージシステムがネットワークで接続された構成であるが、本実施形態のARPによる通信機能を実現するために、ホスト110、ストレージシステム100の各部の構成と、その間のネットワークの構成が異なっている。
ホスト110には、第一の実施形態のおけるホスト110のルーティングテーブル113とルーティング情報受信機能の代わりに、ARPキャッシュ1112、I/Oコネクション復旧機能が追加されている。
ストレージシステム調停機能内のストレージボックス間の論理ボリュームを移動する機能には、第一の実施形態と異なったストレージボックス間論理ボリューム移動機能B1161を有している。
また、ストレージネットワーク140は、ローカルネットワークセグメント1120と、ルータ1140を経由したネットワーク1130より構成されることにしている。
ホスト110のI/Oコネクション復旧機能1111は、ストレージサブシステム100とのI/Oコネクションが切断された場合に、I/Oコネクションの再確立を試みる機能である。
ARPキャッシュ1112は、MACアドレスを問い合わせるARPリクエストが頻発するのを防ぐために、通信相手ネットワーク機器のIPアドレスとMACアドレスの対応情報を保持するためのキャッシャであり、これは、一定時間ごとに更新されることになっている。
ここで、TCP/IPを用いてローカルネットワークセグメント1120に接続されたホスト110およびルータ1140およびストレージサブシステム100同士が通信をおこなう場合、必ずIPアドレスと対応するMACアドレスの情報がARPキャッシュに存在する必要がある。もし存在しない場合は、ARPプロトコルを用いて必要となるIPアドレスと対応するMACアドレスの情報をARPキャッシュに登録する。このARPキャッシュは、また、ホスト110の管理者が直接設定したり、一定時間用いられなかったARPキャッシュ内部の情報を自動的に削除する等、ARP以外の方法を用いてARPキャッシュ内の情報を操作してもよい。
ローカルネットワークセグメント1120は、ストレージサブシステム100とホスト110がIPアドレスからMACアドレスを求め、ルータ1140を介せずに直接通信をおこなうことができるストレージネットワークであり、ルータを経由したネットワーク1130では、間にはさまれるルータ11402を介して互いに通信をおこなうネットワークである。
ルータ1140はローカルネットワークセグメント1120とルータを経由したネットワーク1130間のIPデータグラムの交換をおこなうための通信機器であり、内部にはTCP/IPスタック1142とARPキャッシュ1141を有している。なお、図10では、ローカルネットワークセグメント1120とその他のネットワーク1130間には一つのルータ1140しか記載してないが、複数のルータ1140がローカルネットワークセグメント1120に接続されていてもよい。
本実施形態のストレージボックス150は、図11に示されるように、第一の実施形態のルーティング機能211とI/Oリクエスト処理機能212の代わりに、I/Oコネクション切断機能1212と異なったI/Oリクエスト処理機能B1211が追加されている。
このI/Oリクエスト処理機能B1211は、I/Oリクエスト処理機能212とほぼ同等の機能であるが、IPアドレスの移動方法が異なっている。
I/Oコネクション切断機能1212は、現在用いているI/Oコネクションを強制的に切断し、I/Oリクエスト処理機能B1211にて処理途中の内容を放棄させる機能である。なお、iSCSIの場合、I/Oコネクションの切断はTCPコネクションの切断であることが考えられるが、これ以外の方法でI/Oコネクションの切断をおこなってもよい。
なお、異なるストレージボックス150に存在するCHP210同士の通信はストレージ内部ネットワーク170を用いておこなうことが第一に考えられるが、NIC130とローカルネットワークセグメント1120を用いて通信をおこなってもよい。また、異なるストレージボックス150に存在するDKP230との通信についてもストレージ内部ネットワーク170だけでなく、CHP210、NIC130、ローカルネットワークセグメント1120を用いて通信をおこなってもよい。
(II)本実施形態のストレージ制御方法
次に、図12ないし図17を用いて本実施形態のストレージ制御方法について説明する。
図12は、本発明の第二の実施形態のストレージ制御方法を説明するための概要図である。
図13は、本発明の第二の実施形態のストレージ制御方法を説明するためのフローチャートである。
本実施形態のストレージ制御方法も、図12に示したような複数のストレージボックスを有するストレージボックス150とホスト110がネットワークで接続されている情報処理システムで、ストレージボックス150内の論理ボリュームを移動したきに、ネットワークの通信経路も切替える方法に関するものである。
また、本実施形態でも、第一の実施形態と同様に、ストレージボックスB150B内の記憶領域B331にデータが存在する論理ボリュームをストレージボックスA150Aに移動する場合を例に採るものとし、また、その論理ボリュームは、ホストA110Aが、アクセスをおこなっており、そのIPアドレスは、AddressAであるものとすることも第一の実施形態と同様である。
なお、本実施形態でも、一つのIPアドレスに一つの論理ボリュームが対応した例を説明しているが、一つのIPアドレスに複数の論理ボリュームが対応していてもよいし、逆に、複数のIPアドレスに一つの論理ボリュームが対応していてもよいことも第一の実施形態と同様である。
次に、図13のフローチャートを追いながら、本実施形態で論理ボリュームを移動したときのシステムの処理について説明する。
ここでも、IPアドレスがAddressAである論理ボリュームを他のストレージボックスに移動しようとしている。ここで、ストレージボックスA150AのNIC130のMACアドレスが、HWAddrNewであり、ストレージボックスB150BのNIC130のMACアドレスが、HWAddrOldであるものとする。
(1)先ず、ストレージボックスB150BのI/Oコネクション切断機能1212は、IPアドレスAddressA宛に確立されたI/Oコネクションを切断する。これによって、ホストA110AおよびホストC110Cは、I/Oコネクション復旧機能1111によってI/Oコネクションの復旧を試みる。なお、論理ボリューム移動機能232にI/Oコネクションを切断せずに実施可能な移動のための前処理がある場合は、切断前にこれをおこなってもよい(ステップ1402)。
(2)次に、ストレージボックスB150BのI/Oリクエスト処理機能B1211は、AddressAに関係するIPアドレス、iSCSIデバイス情報、SCSIデバイス情報をストレージボックスA150AのI/Oリクエスト機能B1211へ移動させる(ステップ1403)。
(3)次に、論理ボリュームの移動処理をおこなう(ステップ1404)。
(4)次に、ストレージボックスA150Aは、ARPパケット1310をローカルネットワークセグメント1120へブロードキャストし、IPアドレスAddressAに対応するMACアドレスがHWAddrNewであることをホスト110Aおよびルータ1140へ通知する(ステップ1405)。
(5)I/Oコネクション復旧機能の働きによってホストA110AとホストC110CとストレージボックスA150AとのI/Oコネクションが再確立され、引き続きI/Oが開始される(ステップ1406)。
次に、ストレージボックス間論理ボリューム移動機能B1161がストレージボックス間の論理ボリューム移動を制御する際の処理について図14を用いて説明する。
図14は、ストレージボックス間論理ボリューム移動機能B1161がストレージボックス間の論理ボリューム移動を制御する際の処理を示すフローチャートである。
(1)先ず、第一の実施形態の図6におけるステップ401と同様に、移動するIPアドレスと論理ボリューム、移動先のストレージボックス150を決定する(ステップ1801)。
(2)移動元のストレージボックス150のI/Oコネクション切断機能1212にステップ1801にて移動を決定したIPアドレス宛に確立されたI/Oコネクションを切断し、移動を決定したIPアドレスを用いた通信をおこなわないように依頼する。なお、論理ボリューム移動機能232にI/Oコネクションを切断せずに実施可能な移動のための前処理がある場合は、切断前にこれを依頼してもよい(ステップ1802)。
(3)移動元と移動先のストレージボックス150のI/Oリクエスト処理機能B1211に対して、ステップ1801にて移動を決定したIPアドレスとこれに関係するiSCSIデバイス情報とSCSIデバイス情報の移動を依頼する(ステップ1803)。
(4)次に、ストレージボックス間論理ボリューム移動機能162へ論理ボリュームの移動処理を依頼する。(ステップ1804)
(5)そして、移動先のI/Oリクエスト処理機能B1211に対して、移動先のストレージボックス150が有するNIC130のMACアドレスHWAddrNewとステップ1801にて決定したIPアドレスが対応していることを示すARPパケットのローカルネットワークセグメント1120へのブロードキャストを依頼すると共に、新たなIPアドレスでの通信を許可する(ステップ1805)。
次に、ホスト110のTCP/IPスタック112がARPパケット1310受け取った場合のARPキャッシュの追加または変更処理について、図15を用いて説明する。
図15は、ホスト110のTCP/IPスタック112がARPパケット1310受け取った場合のARPキャッシュの追加または変更処理を示すフローチャートである。この動作は、ルータ1140に関しても同様である。
(1)先ず、ホスト110のTCP/IPスタック112は、ARPリクエストおよびリプライのARPパケット1310を受け取る(ステップ1501)。
(2)受け取ったARPパケット1310からIPアドレスとそれに対応するMACアドレスを抽出する(ステップ1502)。
(3)ステップ1502にて抽出したIPアドレスとMACアドレスの組み合わせをARPキャッシュ1112へ追加したり、既にIPアドレスに対応したMACアドレスが登録されている場合には新たなMACアドレスに更新する(ステップ1503)。
次に、ホスト110のI/Oコネクション復旧機能1111の動作について、図16を用いて説明する。
図16は、ホスト110のI/Oコネクション復旧機能1111のI/Oコネクション復旧の処理を示すフローチャートである。
(1)先ず、ホスト110のI/Oコネクション復旧機能1111は、I/Oコネクションの切断やI/O処理の失敗を検知する。iSCSIの場合はトランスポート層としてTCPを用いているため、TCP/IPスタック112へTCPセッションの状態確認を依頼することによる切断検知をおこなうことが考えられる。また、I/O処理失敗の検知については、I/Oリクエスト発行機能111の状態を確認することによる方法が考えられる(ステップ1601)。
(2)該当するI/Oコネクションが切断状態でない場合、切断処理をおこなう。(ステップ1602、ステップ1603)
(3)ストレージサブシステム100とのI/Oコネクションが確立されるまで、確立処理を繰り返す(ステップ1604、ステップ1605)。
次に、ストレージボックス150のI/Oリクエスト処理機能B1211が、IPアドレスとそれに関係するiSCSIデバイスとSCSIデバイスを移動する処理について、図17のフローチャートを用いて説明する。
図17は、ストレージボックス150のI/Oリクエスト処理機能B1211が、IPアドレスとそれに関係するiSCSIデバイスとSCSIデバイスを移動する処理を示すフローチャートである。
(1)先ず、ストレージボックス150のCHP210にあるI/Oリクエスト処理機能B1211は、移動元のストレージボックス150BのI/Oリクエスト処理機能B1211から移動対象のIPアドレスの利用設定を削除し、移動先のストレージボックス150AのI/Oリクエスト処理機能B1211へ新たにIPアドレスの利用設定を追加する(ステップ1701)。
(2)移動元のI/Oリクエスト処理機能B1211は、移動対象のIPアドレスに関連したiSCSIデバイスの状態を保存し、移動先のI/Oリクエスト処理機能B1211へ送る(ステップ1702)。
(3)そして、移動先のI/Oリクエスト処理機能B1211は、ステップ1702により送られてきた情報を元に、iSCSIデバイスの復旧をおこなう(ステップ1703)。
(4)次に、移動元のI/Oリクエスト処理機能B1211は、移動が完了したiSCSIデバイスを削除する(ステップ1704)。
(5)また、移動元のI/Oリクエスト処理機能B1211は、移動対象のIPアドレスに関連したSCSIデバイスの状態を保存し、移動先のI/Oリクエスト処理機能B1211へ送る(ステップ1705)。
(6)そして、移動先のI/Oリクエスト処理機能B1211は、ステップ1702により送られてきた情報を元に、SCSIデバイスの復旧をおこなう(ステップ1706)。
(7)次に、移動元のI/Oリクエスト処理機能B1211は移動が完了したSCSIデバイスを削除する(ステップ1707)。
なお、iSCSIデバイスとSCSIデバイスの状態を保存するにあたり、移動元ストレージボックス150にて保存せずに移動先のストレージボックス150にて復旧できる状態あるいは情報がある場合には、これを保存しなくてもよい。
〔実施形態3〕
以下、本発明に係る第三の実施形態を、図18および図19を用いて説明する。
図18は、本発明の第三の実施形態に係るストレージシステムを使った情報処理システムの全体構成図である。
図19は、管理計算機165のストレージボックス性能管理画面802のGUI画面の模式図である。
本実施形態は、第一の実施形態と同様に、ホスト110とストレージボックス150が、iSCSIプロトコルを用いて通信する場合であるが、それに付加機能を付け加えたものである。また、本実施形態の機能は、第二の実施形態にも適用することができる。
すなわち、各ストレージボックス150にストレージボックス負荷測定機能801と、管理計算機165のストレージボックス性能管理画面802が追加されている。なお、ストレージボックス150は第一の実施形態と同様に、ネットワーク経路の切り替えを伴った論理ボリュームの移動をおこなうことができる。
ストレージボックス150のストレージボックス負荷測定機能801は、内部のCHP210やキャッシュ220やDKP230の負荷状況を測定するための機能である。ここで、ストレージボックス負荷測定機能801が測定する項目としては、DKPにおける論理ボリューム毎の単位時間あたりのI/O処理数(IOPS)や帯域幅や、論理ボリューム毎のキャッシュヒット率、CHPにおけるIPアドレスとポート番号毎のIOPSや帯域幅が考えられるが、それ以外の項目を測定してもよい。
ストレージボックス性能管理画面802は、ストレージボックス負荷測定機能801が計測した負荷状況を表示したり、管理者が画面を通じておこなった指示をストレージボックス間論理ボリューム移動機能162に送る手段である。
次に、管理計算機165のストレージボックス性能管理画面802について、図19を用いて説明する
このストレージボックス性能管理画面802は、ストレージボックスアイコン910、IP−論理ボリュームチェイン920、ラインA930で構成される。
ストレージボックスアイコン910は、ストレージボックス150を意味するアイコンであり、アイコン内部には名前と対応するストレージボックス150の負荷状況を示す文字列が書かれている。ここで、負荷状況を示す文字列としては、ストレージボックス150にて単位時間あたりに処理したI/O要求数や帯域幅、ストレージボックス150内部のCHP210やDKP230の、記憶装置240の負荷の総和や平均値等が考えられるが、これ以外の方法でストレージボックス150内部の負荷状況を表示してもよい。
ラインA930は、IP−論理ボリュームチェイン920が含むIPアドレスとPort番号の組合せや論理ボリュームが実際に含まれるストレージボックス150に対応するストレージボックスアイコン910とを結ぶ線である。
IP−論理ボリュームチェイン920は、IP−Port番号アイコン921、負荷状況表示領域922、論理ボリュームアイコン923、線B924で構成される。これは、上記の図4で説明したIPアドレスと論理ボリュームの対応のチェインを視覚的にわかりやすく表示するためのものであり、IPアドレスと論理ボリュームの無向グラフの特定のチェインを意味するアイコンと線の集合である。ここで、IP−論理ボリューム無向グラフとは、ストレージシステム100内部のすべてのIPアドレスとPort番号の組合せ、論理ボリュームをグラフの頂点とし、集合に属するあるIPアドレスとPort番号の組合せからアクセス可能な設定がなされている論理ボリュームとの間にグラフの辺を持つ無向グラフである。
IP−Port番号アイコン921は、ストレージシステム100がホスト110に対して提供しているIPアドレスとPort番号の組合せを意味するアイコンである。
負荷状況表示領域922は、IP−論理ボリュームチェイン920に含まれるアイコンが意味する論理ボリュームに代表される各部位の負荷状況を表示するための領域である。ここで、負荷状況を示す文字列としては、IP−論理ボリュームチェイン920に所属する各部位にて処理した単位時間当たりのI/O要求数や帯域幅、IP−論理ボリュームチェイン920に所属するIPアドレスとPort番号の組合せについてCHP210において単位時間あたりに処理したI/O要求数や帯域幅、記憶装置240の負荷の総和や平均値等が考えられるが、これ以外の方法でIP−論理ボリュームチェイン920の負荷状況を表示してもよい。
論理ボリュームアイコン923は、IP−論理ボリュームチェイン920に含まれる論理ボリュームを意味するアイコンである。
ラインB2924は、IPアドレスとPort番号の組合せからアクセス可能な論理ボリュームを示すために対応するアイコン間を結ぶ線である。
以上の画面によって、ストレージシステム100の管理者はCHP用TCP/IPネットワーク260を通過するデータ量を小さくする場合における移動の基本単位である前述のチェイン単位の負荷状況を確認することができる。
例えば、図で左のアイコンのストレージボックスの負荷が大きいと、管理者が見て取ったときには、それにつながれているIP−論理ボリュームチェイン920を右側のストレージボックスのアイコンにドラッグアンドドロップの操作により、移動させることができる。
管理計算機165は、この移動指示をストレージボックス間論理ボリューム移動機能162へ送られて、実際の論理ボリュームの移動が実行される。
また、負荷状況を検知して、自動的に論理ボリュームを移動させるようにしてもよい。
この第三の実施形態による管理画面を用いることで、ストレージシステム100の管理者は原則的には移動の基本単位であるIPアドレスと論理ボリュームの集合に関する負荷状況を把握し、ストレージボックス150の負荷と比較することで、どのIPアドレスと論理ボリュームの集合を負荷の高いストレージボックス150から負荷の低いストレージボックス150へ移動すべきか容易に判断できる。
本発明の第一の実施形態に係るストレージシステムを使った情報処理システムの全体構成図である。 本発明の第一の実施形態に係るストレージシステムを構成するストレージボックスの構成である。 本発明の第一の実施形態のストレージ制御方法を説明するための概要図である。 本発明の第一の実施形態のストレージ制御方法のIPアドレスと論理ボリュームの対応関係を模式的に示した図である。 本発明の第一の実施形態のストレージ制御方法を説明するためのフローチャートである。 ストレージボックス間論理ボリューム移動機能162の処理のフローチャートである。 ホスト110がICMP Redirect Errorメッセージを受け取った場合の処理のフローチャートである。 ホスト110がTCP/IPの経路情報を受信した場合の処理のフローチャートである。 I/Oリクエスト処理機能212がIPアドレスに関係する通信情報、I/O情報を移動する処理のフローチャートである。 本発明の第二の実施形態に係るストレージシステムを使った情報処理システムの全体構成図である。 本発明の第二の実施形態に係るストレージシステムを構成するストレージボックスの構成である。 本発明の第二の実施形態のストレージ制御方法を説明するための概要図である。 本発明の第二の実施形態のストレージ制御方法を説明するためのフローチャートである。 ストレージボックス間論理ボリューム移動機能B1161がストレージボックス間の論理ボリューム移動を制御する際の処理を示すフローチャートである。 ホスト110のTCP/IPスタック112がARPパケット1310受け取った場合のARPキャッシュの追加または変更処理を示すフローチャートである。 ホスト110のI/Oコネクション復旧機能1111のI/Oコネクション復旧の処理を示すフローチャートである。 ストレージボックス150のI/Oリクエスト処理機能B1211が、IPアドレスとそれに関係するiSCSIデバイスとSCSIデバイスを移動する処理を示すフローチャートである。 本発明の第三の実施形態に係るストレージシステムを使った情報処理システムの全体構成図である。 管理計算機165のストレージボックス性能管理画面802のGUI画面の模式図である。
符号の説明
100…ストレージシステム
110…ホスト
110A…ホストA
110B…ホストB
111…I/Oリクエスト発行機能
112…TCP/IPスタック
113…ルーティングテーブル
114…ルーティング情報送受信機能
130…NIC
140…ストレージネットワーク
150…ストレージボックス
150A…ストレージボックスA
150B…ストレージボックスB
160…ストレージボックス間調停機能
161…ルーティング情報発信機能
162…ストレージボックス間論理ボリューム移動機能
165…管理計算機
170…ストレージ内部ネットワーク
210…CHP
211…ルーティング機能
212…I/Oリクエスト処理機能
220…キャッシュ
230…DKP
231…ステージング機能
232…論理ボリューム移動機能
240…記憶装置
250…内部ネットワークスイッチ
260…CHP用TCP/IPネットワーク
332…記憶領域A
331…記憶領域B
341…ICMP Redirect Errorメッセージ
1120…ローカルネットワークセグメント
1130…ルータ1140を経由したネットワーク
1111…I/Oコネクション復旧機能
1112…ARPキャッシュ
1142…TCP/IPスタック(ルータ内)
1141…ARPキャッシュ(ルータ内)
1161…ストレージボックス間論理ボリューム移動機能B
1212…I/Oコネクション切断機能
1211…I/Oリクエスト処理機能B
801…ストレージボックス負荷測定機能
802…ストレージボックス性能管理画面
910…ストレージボックスアイコン
920…IP−論理ボリュームチェイン
930…ラインA
921…IP−Port番号アイコン
922…負荷状況表示領域
923…論理ボリュームアイコン
924…ラインB。

Claims (10)

  1. 一つ以上の計算機と複数のストレージサブシステムから構成されるストレージシステムとを有する情報処理システムにおいて、
    前記計算機は、ボリュームに関する情報を保持し、前記ボリュームに関する情報は、ネットワーク通信プロトコルで用いる情報を含み、
    前記ストレージシステムのストレージサブシステムは、前記計算機とネットワークにより接続され、それらの計算機からアクセスされるボリュームを有するときに、
    第一のストレージサブシステムの有するボリュームを、第二のストレージサブシステムへ移動し、
    前記計算機の保持するそのボリュームに関する情報を変更することによって、
    前記移動したボリュームへのネットワーク経路を、前記第一のストレージサブシステムから前記第二のストレージサブシステムへ切り替えることを特徴とする情報処理システム。
  2. さらに、この情報処理システムは、前記ストレージサブシステムを管理する管理計算機を有し、
    前記ストレージシステムは、各々のストレージサブシステムの有する計算機のボリュームの負荷状況を測定する手段を備え、
    前記管理計算機は、前記負荷状況を測定する手段によって測定された負荷状況を示す値を表示し、
    前記ストレージシステムは、前記負荷状況を測定する手段によって測定された負荷状況を示す値に基づき、各々のストレージサブシステム計算機のボリュームへのアクセスの負荷分散をおこなうことを特徴とする請求項1記載の情報処理システム。
  3. 前記ストレージサブシステムの有する計算機のボリュームにネットワーク識別子を割り当て、
    前記管理計算機の表示画面に、ネットワーク識別子と、対応する計算機のアクセス対象とをそれぞれ頂点とするチェインに対応する前記計算機からのアクセスの負荷状況を表示することを特徴とする請求項1記載の情報処理システム。
  4. 前記ネットワーク通信プロトコルで用いる情報がARPキャッシュであることを特徴とする請求項3記載の情報処理システム。
  5. 前記ARPキャッシュの更新は、前記第二のストレージサブシステムから出されるARPに関するパケットを受信することによっておこなわれることを特徴とする請求項4記載の情報処理システム。
  6. 一つ以上の計算機と複数のストレージサブシステムから構成されるストレージシステムとを有する情報処理システムのストレージ制御方法において、
    前記計算機は、ボリュームに関する情報を保持し、前記ボリュームに関する情報は、ネットワーク通信プロトコルで用いる情報を含み、
    前記ストレージシステムのストレージサブシステムは、前記計算機とネットワークにより接続され、それらの計算機からアクセスされるボリュームを有するときに、
    前記ストレージシステムが、第一のストレージサブシステムに格納されているボリュームを、第二のストレージサブシステムへ移動させる手順と、
    前記ストレージシステムが、前記計算機の保持するそのボリュームに関する情報を変更することによって、
    前記移動したボリュームへのネットワーク経路を、前記第一のストレージサブシステムから前記第二のストレージサブシステムへ切り替える手順とを有することを特徴とする情報処理システムのストレージ制御方法。
  7. さらに、この情報処理システムは、前記ストレージサブシステムを管理する管理計算機を有し、
    前記ストレージシステムは、各々のストレージサブシステムの有する計算機のボリュームの負荷状況を測定する手段を備え、
    前記管理計算機は、前記負荷状況を測定する手段によって測定された負荷状況を示す値を表示し、
    前記ストレージシステムは、前記負荷状況を測定する手段によって測定された負荷状況を示す値に基づき、各々のストレージサブシステム計算機のボリュームへのアクセスの負荷分散をおこなうことを特徴とする請求項6記載の情報処理システムのストレージ制御方法。
  8. 前記ストレージサブシステムの有する計算機のボリュームにネットワーク識別子を割り当て、
    前記管理計算機の表示画面に、ネットワーク識別子と、対応する計算機のアクセス対象とをそれぞれ頂点とするチェインに対応する前記計算機からのアクセスの負荷状況を表示することを特徴とする請求項6記載の情報処理システムのストレージ制御方法。
  9. 前記ネットワーク通信プロトコルで用いる情報がARPキャッシュであることを特徴とする請求項8記載の情報処理システムのストレージ制御方法。
  10. 前記ARPキャッシュの更新は、前記第二のストレージサブシステムから出されるARPに関するパケットを受信することによっておこなわれることを特徴とする請求項9記載の情報処理システムのストレージ制御方法。
JP2007240813A 2007-09-18 2007-09-18 情報処理システム、および、情報処理システムのストレージ制御方法 Pending JP2008047142A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007240813A JP2008047142A (ja) 2007-09-18 2007-09-18 情報処理システム、および、情報処理システムのストレージ制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007240813A JP2008047142A (ja) 2007-09-18 2007-09-18 情報処理システム、および、情報処理システムのストレージ制御方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002161713A Division JP2004013215A (ja) 2002-06-03 2002-06-03 ストレージシステム、ストレージサブシステム、および、それらを含む情報処理システム

Publications (1)

Publication Number Publication Date
JP2008047142A true JP2008047142A (ja) 2008-02-28

Family

ID=39180748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007240813A Pending JP2008047142A (ja) 2007-09-18 2007-09-18 情報処理システム、および、情報処理システムのストレージ制御方法

Country Status (1)

Country Link
JP (1) JP2008047142A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8443160B2 (en) 2010-08-06 2013-05-14 Hitachi, Ltd. Computer system and data migration method
JP2014529774A (ja) * 2011-10-28 2014-11-13 株式会社日立製作所 計算機システム及びその管理システム
US9292211B2 (en) 2011-03-02 2016-03-22 Hitachi, Ltd. Computer system and data migration method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8443160B2 (en) 2010-08-06 2013-05-14 Hitachi, Ltd. Computer system and data migration method
US8892840B2 (en) 2010-08-06 2014-11-18 Hitachi, Ltd. Computer system and data migration method
US9292211B2 (en) 2011-03-02 2016-03-22 Hitachi, Ltd. Computer system and data migration method
JP2014529774A (ja) * 2011-10-28 2014-11-13 株式会社日立製作所 計算機システム及びその管理システム

Similar Documents

Publication Publication Date Title
US8560631B2 (en) Storage system
US8370588B2 (en) Computer system control method and computer system
JP5255858B2 (ja) ストレージシステム上の仮想ポートを管理するための方法および装置
AU2004306913B2 (en) Redundant routing capabilities for a network node cluster
JP5811703B2 (ja) 分散制御プログラム、分散制御方法、および情報処理装置
TWI454088B (zh) 用於偵測一交換器故障及管理一乙太網路光纖通道網路中之交換器故障後移轉之方法、系統及電腦可讀媒體
EP2309680A1 (en) Switching API
CN101286884B (zh) 一种实现非状态多主备份的方法及代理网关
JP2004102374A (ja) データ移行装置を有する情報処理システム
JP2012108869A (ja) 複数のストレージシステムにおけるマルチパススイッチング
JP2010050749A (ja) 経路制御システム
JPWO2006030623A1 (ja) 冗長化プロトコルと擬似冗長構成手段を用いたネットワーク接続機器の切換方法とネットワークシステム
JP2003179626A (ja) 中継コネクション管理プログラムおよび中継コネクション管理方法
JP2011210032A (ja) 仮想マシンのマイグレーション方法およびシステム
JP5034495B2 (ja) ストレージシステムとプログラム並びに方法
JP2002057682A (ja) ネットワークインタフェース切替え方法及びネットワークに接続可能なコンピュータ
WO2014154087A1 (en) A gateway and its method of transfering data
WO2011147312A1 (zh) 一种业务接入路由器的端口备份方法、装置和系统
CN109587286A (zh) 一种设备接入控制方法及装置
JP6299745B2 (ja) 通信システム、制御装置、通信方法及びプログラム
JP5438624B2 (ja) 通信システム、制御サーバ、フロー制御方法およびそのプログラム
JP5217886B2 (ja) ループバック装置及びミラーリング方法
WO2014084198A1 (ja) ストレージエリアネットワークシステム、制御装置、アクセス制御方法及びプログラム
JP2008047142A (ja) 情報処理システム、および、情報処理システムのストレージ制御方法
CN101404594A (zh) 热备份性能的测试方法与装置、通信设备

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080318

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080516

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080610