JP2009259031A - 外部接続ストレージシステムのパス管理及び障害箇所検出方法 - Google Patents

外部接続ストレージシステムのパス管理及び障害箇所検出方法 Download PDF

Info

Publication number
JP2009259031A
JP2009259031A JP2008107852A JP2008107852A JP2009259031A JP 2009259031 A JP2009259031 A JP 2009259031A JP 2008107852 A JP2008107852 A JP 2008107852A JP 2008107852 A JP2008107852 A JP 2008107852A JP 2009259031 A JP2009259031 A JP 2009259031A
Authority
JP
Japan
Prior art keywords
path
storage area
storage system
route
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008107852A
Other languages
English (en)
Other versions
JP2009259031A5 (ja
JP4738438B2 (ja
Inventor
Naoki Haramai
直樹 原間井
Hiroshi Yokouchi
弘 横内
Tatsu Genban
龍 玄蕃
Atsushi Kondo
淳 近藤
Kazuhiro Oyama
一浩 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008107852A priority Critical patent/JP4738438B2/ja
Priority to US12/213,687 priority patent/US7836350B2/en
Publication of JP2009259031A publication Critical patent/JP2009259031A/ja
Publication of JP2009259031A5 publication Critical patent/JP2009259031A5/ja
Application granted granted Critical
Publication of JP4738438B2 publication Critical patent/JP4738438B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0226Mapping or translating multiple network management protocols

Abstract

【課題】外部接続された記憶装置を含む計算機システムにおいて、パス障害による業務の停止を防止する。
【解決手段】計算機、第1経路及び第2経路を介して前記計算機に接続される第1記憶装置、及び、第3経路を介して前記第1記憶装置に外部接続され、第4経路を介して前記計算機に接続される第2記憶装置を備える計算機システムを制御する方法であって、前記第1記憶装置は、第1記憶領域を前記計算機に提供し、前記第2記憶装置は、前記第1記憶領域に対応する第2記憶領域を備え、前記方法は、前記第1経路から前記第4経路の少なくとも一つに障害が発生したか否かを判定する手順と、前記判定の結果に基づいて、前記第1記憶領域又は前記第2記憶領域へのアクセスに使用される経路を選択する手順と、前記選択された経路を用いて、前記第1記憶領域又は前記第2記憶領域へのアクセス要求を送信する手順と、を含む。
【選択図】図1

Description

本願明細書で開示される技術は、ストレージシステムにおけるデータ経路(パス)の管理に関し、特に、外部接続されたストレージシステムにおける障害発生時の障害箇所検出及びパス切り替えに関する。
計算機に接続された第1のストレージシステムにさらに第2のストレージシステムを接続し、第1のストレージシステムが第2のストレージシステムの物理的な記憶領域を第1のストレージシステムの仮想的な記憶領域として計算機に提供する、いわゆるストレージシステムの外部接続が開示されている(例えば、特許文献1参照)。このような外部接続によれば、第1のストレージシステムが備える機能を第2のストレージシステムの記憶領域にも適用することができる。
特開2007−257667号公報
上記のようにストレージシステムが外部接続された環境において、計算機と第1のストレージシステムとの間の全てのデータ経路(パス)に障害(例えば断線)が発生して通信が切断された場合、第1のストレージシステムと第2のストレージシステムとの間のパスが正常であったとしても、計算機は第2のストレージシステムの記憶領域にアクセスできなくなる。計算機と第1のストレージシステムとの間のパスが正常であったとしても、第1のストレージシステムと第2のストレージシステムとの間の全てのパスの通信が切断された場合、同様に計算機は第2のストレージシステムの記憶領域にアクセスできなくなる。上記のいずれの場合であっても、計算機で稼動する従来のパス管理ソフトウェアは、計算機と第1のストレージシステムとの間のパスに障害が発生したと認識する。その結果、上記のいずれの場合であっても、第2のストレージシステムの記憶領域を使用する業務は停止する。
本願で開示する代表的な発明は、計算機、第1ストレージシステム及び第2ストレージシステムを備える計算機システムを制御する方法であって、前記第1ストレージシステムは、第1経路及び第2経路を介して前記計算機に接続され、前記第2ストレージシステムは、第3経路を介して前記第1ストレージシステムに接続され、第4経路を介して前記計算機に接続され、前記計算機は、前記第1経路に接続される第1インターフェース、前記第2経路に接続される第2インターフェース、前記第4経路に接続される第3インターフェース、前記第1インターフェースから前記第3インターフェースに接続される第1プロセッサ、及び、前記第1プロセッサに接続される第1メモリを備え、前記第1ストレージシステムは、前記第1経路、前記第2経路及び前記第3経路に接続される第1コントローラを備え、第1記憶領域を前記計算機に提供し、前記計算機から前記第1記憶領域へのアクセス要求を受信すると、前記受信したアクセス要求を前記第2記憶領域へのアクセス要求に変換し、前記変換されたアクセス要求を、前記第3経路を経由して前記第2ストレージシステムに送信し、前記第2ストレージシステムは、前記第3経路及び前記第4経路に接続される第2コントローラ、及び、第2記憶領域を備え、前記計算機又は前記第1ストレージシステムから前記第2記憶領域へのアクセス要求を受信すると、前記受信したアクセス要求に従って前記第2記憶領域へのアクセス処理を実行し、前記計算機は、前記第1記憶領域と前記第2記憶領域とを対応付ける第1情報を保持し、前記第1経路から前記第4経路の少なくとも一つに障害が発生したか否かの判定結果と、前記第1記憶領域又は前記第2記憶領域へのアクセスに使用される前記第1経路から前記第4経路の少なくとも一つと、を対応付ける第2情報を保持し、前記方法は、前記計算機が、前記第1経路から前記第4経路の少なくとも一つに障害が発生したか否かを判定する第1手順と、前記計算機が、前記判定の結果及び前記第2情報に基づいて、前記第1記憶領域又は前記第2記憶領域へのアクセスに使用される前記第1経路から前記第4経路の少なくとも一つを選択する第2手順と、前記計算機が、前記選択された前記第1経路から前記第4経路の少なくとも一つを用いて、前記第1記憶領域又は前記第2記憶領域へのアクセス要求を送信する第3手順と、を含むことを特徴とする。
本発明の一実施形態によれば、計算機から第2のストレージシステムまでの間のいずれかのパスに障害が発生しても、補助用のパスを使用して業務を継続することができる。
以下、本発明の実施形態を、図面を参照して説明する。
図1は、本発明の実施形態の計算機システムの構成を示すブロック図である。
本実施形態の計算機システムは、業務ホスト100、接続元ストレージシステムA120及び外部接続ストレージシステムB130を備える。
業務ホスト100は、外部接続ストレージシステムB130の記憶領域を使用して種々の業務を実行する計算機である。業務ホスト100は、相互に接続されたCPU102、メモリ103、複数のホストバスアダプタ(HBA)104及び複数のネットワークインターフェースカード(NIC)105を備える。図1に示すHBA1_104A及びHBA2_104Bの各々は、複数のHBA104の一つである。NIC1_105A及びNIC2_105Bの各々は、複数のNIC105の一つである。
CPU102は、メモリ103に格納されたプログラムを実行するプロセッサである。以下の説明においてメモリ103に格納されたプログラムが実行する処理は、実際にはCPU102によって実行される。
メモリ103は、CPU102によって実行されるプログラム及びCPU102によって参照されるデータ等を格納する記憶装置である。本実施形態のメモリ103には、アプリケーション106、LUマッピング管理部107、パス管理部108、パス管理テーブル109、ステータス管理テーブル110、HBAステータステーブル111、スイッチステータステーブル112、ストレージステータステーブル113及びアクセス経路判定テーブル114が格納される。
アプリケーション106は、業務ホスト100が提供する種々の業務を実現するプログラムである。アプリケーション106は、必要に応じて外部接続ストレージシステムB130の記憶領域を使用する。
LUマッピング管理部107は、接続元ストレージシステムA120が業務ホスト100に提供する仮想的な記憶領域と、外部接続ストレージシステムB130が備える物理的な記憶領域と、の対応関係を管理するためのプログラム及びテーブルを含む。
パス管理部108は、業務ホスト100、接続元ストレージシステムA120及び外部接続ストレージシステムB130の間のデータ転送経路を管理するプログラムを含む。
上記のプログラム及びテーブルについては、後で詳細に説明する。
業務ホスト100は、第1ネットワーク140Aを介して接続元ストレージシステムA120に接続される。接続元ストレージシステムA120は、第2ネットワーク140Bを介して外部接続ストレージシステムB130に接続される。以下の説明において、第1ネットワーク140Aを「PA」(パスA)、第2ネットワーク140Bを「PB」(パスB)とも記載する。
本実施形態において、PA140A及びPB140Bは、ファイバーチャネル(FC)プロトコルが適用されるいわゆるストレージエリアネットワーク(SAN)である。PA140A及びPB140Bは、それぞれ、一つ以上のFCスイッチを含んでもよい(図4参照)。以下の説明において、PA140A及びPB140Bを総称して、FCネットワークとも記載する。
HBA1_104A及びHBA2_104Bは、PA140Aに接続されるインターフェースである。PA140AにFCプロトコルが適用される場合、HBA1_104A及びHBA2_104Bは、通信速度の速いFCカードである。業務ホスト100は、PA140Aを介して接続元ストレージシステムA120の仮想的な記憶領域にアクセスすることができる。
PA140Aは、業務ホスト100と接続元ストレージシステムA120とを接続する複数のパスを含んでもよい(後述する図4参照)。図1の例において、PA140Aは、PA1_141A及びPA2_141Bの二つのパスを含む。この例において、HBA1_104A及びHBA2_104Bは、それぞれ、PA1_141A及びPA2_141Bに接続される。
同様に、PB140Bは、接続元ストレージシステムA120と外部接続ストレージシステムB130とを接続する複数のパスを含んでもよい。図1の例において、PB140Bは、PB1_141C及びPB2_141Dの二つのパスを含む。
さらに、業務ホスト100、接続元ストレージシステムA120、外部接続ストレージシステムB130及び各FCスイッチは、第3ネットワーク150を介して相互に接続される。第3ネットワーク150は、例えばIP(インターネットプロトコル)ネットワークである。第3ネットワーク150は、一つ以上のハブ160を含んでもよい。
NIC1_105A及びNIC2_105Bは、第3ネットワーク150に接続されるインターフェースである。第3ネットワーク150がIPネットワークである場合、NIC1_105A及びNIC2_105Bは、FCカードよりは通信速度の遅いネットワークインターフェースカードである。
本実施形態の業務ホスト100は、第3ネットワーク150を介して、外部接続ストレージシステムB130が備える物理的な記憶領域にアクセスすることもできる。例えば、第3ネットワーク150上に、NIC1_105Aからハブ160を経由して接続元ストレージシステムA120に至るパスC(PC)151A、及び、NIC2_105Bからハブ160を経由して外部接続ストレージシステムB130に至るパスD(PD)151Bが設定されてもよい。業務ホスト100は、PC151A又はPD151Bに例えばiSCSIプロトコルを適用することによって、外部接続ストレージシステムB130の記憶領域にアクセスしてもよい。
なお、第1ネットワーク140A、第2ネットワーク140B及び第3ネットワーク150の種類は上記のものに限定されない。ただし、第1ネットワーク140A及び第2ネットワーク140Bは、大量のデータを高速に転送可能なネットワークであることが望ましい。一方、第3ネットワーク150は、第1ネットワーク140A及び第2ネットワーク140Bより低速でもよいが、低コストで汎用性が高いネットワークであることが望ましい。
接続元ストレージシステムA120は、コントローラ121を備える。コントローラ121は、複数のチャネルアダプタ(CHA)122を備える。各CHA122は、FCプロトコル又はiSCSIプロトコルによって業務ホスト100又は外部接続ストレージシステムB130と通信するインターフェースである。図1に示すCHA1−1_122A、CHA1−2_122B、CHA1−3_122C、CHA1−4_122D及びCHA1−5_122Eの各々は、複数のCHA122の一つである。
各CHA122は、CPU(図示省略)、メモリ(図示省略)及び一つ以上のポート(図示省略)を備える。各ポートは、第1ネットワーク140A、第2ネットワーク140B又は第3ネットワーク150に接続される。各ポートには、それが接続されたネットワークにおいてそのポートを識別するためのネットワークアドレス、例えば、WWN(World Wide Name)又はIPアドレスが付与される。
図1の例において、CHA1−1_122A及びCHA1−2_122Bは、それぞれ、PA1_141A及びPA2_141Bに接続される。CHA1−3_122Cは、ハブ160に接続される。CHA1−4_122D及びCHA1−5_122Eは、それぞれ、PB1_141C及びPB2_141Dに接続される。
コントローラ121は、仮想的な記憶領域(仮想論理ボリューム)であるV−VOL123を業務ホスト100に提供する。V−VOL123は、外部接続ストレージシステムB130内の物理的な記憶領域(実論理ボリューム)であるR−VOL133と対応付けられる(図2参照)。
接続元ストレージシステムA120は、さらに、物理的な記憶領域を提供するハードディスクドライブ(HDD)のような記憶デバイス(図示省略)を備えてもよい。その場合、コントローラ121は、その物理的な記憶領域を業務ホスト100に提供するために、業務ホスト100からその物理的な記憶領域へのアクセス(すなわちデータの書き込み及び読み出し)を制御する。
外部接続ストレージシステムB130は、コントローラ131及び物理的な記憶領域(R−VOL)133を備える。
コントローラ131は、複数のCHA132を備える。各CHA132は、FCプロトコル又はiSCSIプロトコルによって業務ホスト100又は接続元ストレージシステムA120と通信するインターフェースである。図1に示すCHA2−1_132A、CHA2−2_132B及びCHA2−3_132Cの各々は、複数のCHA132の一つである。各CHA132は、CHA122と同様に、CPU、メモリ及びポートを備える。
図1の例において、CHA2−1_132A及びCHA2−2_132Bは、それぞれ、PB1_141C及びPB2_141Dに接続される。CHA2−3_132Cは、ハブ160に接続される。
R−VOL133は、一つ又は複数の記憶デバイスによって実現されてもよい。R−VOL133を実現する記憶デバイスは、例えばHDDであってもよいし、フラッシュメモリのような半導体記憶デバイスであってもよい。
コントローラ131は、業務ホスト100及び接続元ストレージシステムA120の少なくとも一方にR−VOL133を提供する。具体的には、コントローラ131は、業務ホスト100又は接続元ストレージシステムA120からR−VOL133へのアクセス要求を受信すると、要求されたアクセスを実行し、その結果を要求元に送信する。
ここで、各ネットワークが正常に動作している場合の、業務ホスト100によるR−VOL133へのアクセスについて説明する。
業務ホスト100は、アプリケーション106を実行し、必要に応じて、V−VOL123へのアクセス要求を、PA140Aを介して送信する。PA140Aが複数のパス(例えばPA1_141A及びPA2_141B)を含む場合、業務ホスト100は、アクセス負荷が分散されるように、複数のアクセス要求をそれらの複数のパスに分散して送信してもよい。
アクセス要求を受信した接続元ストレージシステムA120のコントローラ121は、アクセス先として指定されたV−VOL123に対応する外部接続ストレージシステムB130内の物理的な記憶領域(図1の例では、R−VOL133)を特定する。この特定をするために、コントローラ121は、接続元ストレージシステムA120内の仮想的な記憶領域と外部接続ストレージシステムB130内の物理的な記憶領域とを対応付ける情報を予め保持している。
コントローラ121は、受信したアクセス要求を特定されたR−VOL133へのアクセス要求に変換して、外部接続ストレージシステムB130に送信する。具体的には、コントローラ121は、受信したアクセス要求に基づいて、特定されたR−VOL133へのアクセス要求を生成し、生成したアクセス要求を、PB140Bを介して送信する。
PB140Bが複数のパス(例えばPB1_141C及びPB2_141D)を含む場合、コントローラ121は、アクセス負荷が分散されるように、生成された複数のアクセス要求をそれらの複数のパスに分散して送信してもよい。
このアクセス要求を受信した外部接続ストレージシステムB130のコントローラ131は、受信したアクセス要求に基づいて、R−VOL133へのアクセスを実行し、その結果をアクセス要求の送信元(すなわち接続元ストレージシステムA120)に送信する。接続元ストレージシステムA120のコントローラ121は、受信した結果を業務ホスト100に送信する。
上記の手順によって、例えば業務ホスト100がV−VOL123へのデータの書き込み要求を送信した場合、要求されたデータは接続元ストレージシステムA120を経由して外部接続ストレージシステムB130に転送され、R−VOL133に格納される。業務ホスト100がV−VOL123からのデータの読み出し要求を送信した場合、要求されたデータは、R−VOL133から読み出され、接続元ストレージシステムA120を経由して業務ホスト100に転送される。
上記のようなストレージシステムの接続及びアクセスの形態は、ストレージシステムの外部接続と呼ばれる。
なお、接続元ストレージシステムA120のコントローラ121は、さらに、キャッシュメモリ124を備えてもよい。キャッシュメモリ124には、V−VOL123に書き込まれたデータ、及び、V−VOL123から読み出されたデータの少なくとも一方が一時的に格納される。キャッシュメモリ124を使用することによって、V−VOL123へのアクセスに要する時間(すなわち、実際には、R−VOL133へのアクセスに要する時間)が業務ホスト100から隠蔽される。
続いて、ネットワークに障害が発生した場合について説明する。
例えば、PA140Aに含まれるPA1_141A及びPA2_141Bのうち一方における通信が障害のために停止したとしても、他方が正常であれば、業務ホスト100はV−VOL123にアクセスすることができる。しかし、PA140Aに含まれる全てのパスにおける通信が停止した場合、業務ホスト100はPA140Aを介してV−VOL123にアクセスできなくなる。同様に、PB140Bに含まれる全てのパスにおける通信が停止した場合、接続元ストレージシステムA120はPB140Bを介してR−VOL133にアクセスできなくなる。
従来の外部接続では、PA140A及びPB140Bの少なくとも一方の全てのパスにおいて通信が停止した場合、他方が正常であったとしても、業務ホスト100はR−VOL133にアクセスできなくなる。このため、R−VOL133に格納されたデータを使用する業務が停止する。さらに、業務ホスト100は、実際にはPA140A及びPB140Bのどちらに障害が発生していたとしても、PA140Aに障害が発生したと認識するため、実際に障害が発生したパスを特定することができなかった。
本実施形態では、業務ホスト100は、第3ネットワーク150を介して、iSCSIプロトコルによるV−VOL123及びR−VOL133へのアクセスを実行することができる。このため、PA140A及びPB140Bの少なくとも一方に障害が発生した場合、第3ネットワークを補助的なパスとして使用することによって、業務ホスト100は業務を継続することができる。第3ネットワーク150がPA140A及びPB140Bより低速なネットワークである場合、PA140A又はPB140Bの代わりに第3ネットワーク150を使用することによって業務の性能は低下するが、業務が完全に停止することは防止される。
さらに、本実施形態の業務ホスト100は、障害が発生した箇所を特定し、それを管理者に通知することができる。
上記の本実施形態を実現するために、業務ホスト100のメモリ103には、図1に示すようなプログラム及びテーブルが格納される。以下、これらについて説明する。
図2は、本発明の実施形態のLUマッピング管理部107による記憶領域の割り当ての説明図である。
LUマッピング管理部107は、マッピングテーブル200を含む。マッピングテーブル200は、接続元ストレージシステムA120内の仮想論理ボリュームへの、外部接続ストレージシステムB130内の実論理ボリュームの割り当て(すなわちマッピング)を管理する情報を含む。
具体的には、マッピングテーブル200は、マッピングID201、接続元ストレージシステムのCU202、接続元ストレージシステムのLDEV203、外部接続ストレージシステムのCU204及び外部接続ストレージシステムのLDEV205を含む。
マッピングID201は、仮想論理ボリュームへの実ボリュームのマッピングの識別子である。一つの仮想論理ボリュームへの一つの実ボリュームのマッピングが、一つのマッピングID201によって識別される。
接続元ストレージシステムのCU202及び接続元ストレージシステムのLDEV203は、仮想論理ボリュームを識別する情報である。具体的には、接続元ストレージシステムのCU202は、仮想論理ボリュームを管理する(言い換えるとその仮想論理ボリュームへのアクセスを制御する)コントローラの識別子である。接続元ストレージシステムのLDEV203は、コントローラによって仮想論理ボリュームに付与された識別子である。
外部接続ストレージシステムのCU204及び外部接続ストレージシステムのLDEV205は、実論理ボリュームを識別する情報である。具体的には、外部接続ストレージシステムのCU204は、実論理ボリュームを管理するコントローラの識別子である。外部接続ストレージシステムのLDEV205は、コントローラによって実論理ボリュームに付与された識別子である。
コントローラによって論理ボリュームに付与される識別子は、ストレージシステム内で一意ではないが、そのコントローラが管理する範囲内では一意である。このため、コントローラの識別子と論理ボリュームの識別子とを組み合わせることによって、論理ボリュームをストレージシステム内で一意に識別することができる。
例えば、V−VOL123の識別子が「01」、V−VOL123へのアクセスを制御するコントローラ121の識別子が「01」、R−VOL133の識別子が「01」、R−VOL133へのアクセスを制御するコントローラ131の識別子が「02」であり、V−VOL123にR−VOL133がマッピングされる(すなわち、V−VOL123に書き込まれたデータが実際にはR−VOL133に格納される)場合、一つのマッピングID201(例えば「マッピング1」)に対応する接続元ストレージシステムのCU202、接続元ストレージシステムのLDEV203、外部接続ストレージシステムのCU204及び外部接続ストレージシステムのLDEV205には、それぞれ、「01」、「01」、「02」及び「01」が保持される(図2参照)。
図3は、本発明の実施形態のパス管理テーブル109の説明図である。
パス管理テーブル109は、アクセス要求を送信する業務ホスト100から、そのアクセス要求の対象のデータが格納される実論理ボリュームまでのデータの経路(パス)を管理する情報を保持する。
具体的には、パス管理テーブル109は、パスID301、HBA302、第1ネットワークPA303、接続元ストレージシステムのCHA情報304、接続元ストレージシステムのボリューム情報305、第2ネットワークPB306、外部接続ストレージシステムのCHA情報307、外部接続ストレージシステムのボリューム情報308、ケーブル情報309及びステータス310を含む。
パスID301は、業務ホスト100から実論理ボリュームまでのパスの識別子である。
HBA302は、パスに含まれるHBA104の識別子である。
第1ネットワークPA303は、パスに含まれるPA120A内のFCスイッチのポートの識別子である(図4参照)。
接続元ストレージシステムのCHA情報304は、パスに含まれるCHA122の識別子である。
接続元ストレージシステムのボリューム情報305は、パスを経由してアクセスされる仮想論理ボリューム(言い換えると、業務ホスト100によってアクセス先として指定される仮想論理ボリューム)の識別子である。なお、図3の例では接続元ストレージシステムのボリューム情報305として「V−VOL」が保持されているが、図2と同様、「CU:01、LDEV:01」のような情報が保持されてもよい。
第2ネットワークPB306は、パスに含まれるPB120B内のFCスイッチのポートの識別子である(図4参照)。
外部接続ストレージシステムのCHA情報307は、パスに含まれるCHA132の識別子である。
外部接続ストレージシステムのボリューム情報308は、パスを経由してアクセスされる実論理ボリューム(言い換えると、業務ホスト100によってアクセス先として指定される仮想論理ボリュームにマッピングされた実論理ボリューム)の識別子である。なお、図3の例では外部接続ストレージシステムのボリューム情報308として「R−VOL」が保持されているが、図2と同様、「CU:02、LDEV:01」のような情報が保持されてもよい。
ケーブル情報309は、パスに含まれる各部を接続するために使用されるケーブルを識別する情報である。パスに適用されるプロトコルを識別する情報がケーブル情報309として保持されてもよい。
ステータス310は、パスのステータス(状態)を識別する情報、具体的には、パスが正常である(すなわち「ONLINE」である)か、障害のために通信ができない状態である(すなわち「OFFLINE」である)か、を示す情報である。
パス管理部108は、パスに発生した障害を検出すると、各部のステータスを更新する処理を実行し、その結果に従ってステータス310を更新する。ステータスを更新する処理については後述する(図11参照)。
図4は、本発明の実施形態において設定されたパスの詳細な説明図である。
具体的には、図4は、図1に示すシステムにおいて設定されたパスのうち、FCプロトコルが適用されるパスを詳細に説明するものである。なお、図1に示した各部の構成のうち、パスの説明に必要がないものは図4において省略されている。
図4には、図1では省略されたFCスイッチ401A及び401Bが表示されている。FCスイッチ401Aは、ポートA1_402A〜ポートA4_402Dを備える。ポートA1_402Aは、HBA1_104Aに接続される。ポートA2_402Bは、HBA2_104Bに接続される。ポートA3_402Cは、CHA1−1_122Aに接続される。ポートA4_402Dは、CHA1−2_122Bに接続される。
図4の例では、ポートA1_402A及びポートA3_402Cを含むゾーンA403A、及び、ポートA2_402B及びポートA4_402Dを含むゾーンB403Bが設定されている。この場合、FCスイッチ401Aは、例えば、ポートA1_402Aから入力されたデータをポートA3_402Cから出力することができるが、そのデータをポートA2_402B及びポートA4_402Dのいずれからも出力することができない。
図4において、HBA1_104AからポートA1_402A及びポートA3_402Cを経由してCHA1−1_122Aに至るパスが、図1のPA1_141Aに相当する。HBA2_104BからポートA2_402B及びポートA4_402Dを経由してCHA1−2_122Bに至るパスが、図1のPA2_141Bに相当する。
FCスイッチ401Bは、ポートB1_402E〜ポートB4_402Hを備える。ポートB1_402Eは、CHA1−4_122Dに接続される。ポートB2_402Fは、CHA1−5_122Eに接続される。ポートB3_402Gは、CHA2−1_132Aに接続される。ポートB4_402Hは、CHA2−2_132Bに接続される。
図4の例では、ポートB1_402E及びポートB3_402Gを含むゾーンC403C、及び、ポートB2_402F及びポートB4_402Hを含むゾーンD403Dが設定されている。CHA1−4_122DからポートB1_402E及びポートB3_402Gを経由してCHA2−1_132Aに至るパスが、図1のPB1_141Cに相当する。CHA1−5_122EからポートB2_402F及びポートB4_402Hを経由してCHA2−2_132Bに至るパスが、図1のPB2_141Dに相当する。
図1及び図4に示すようなパスが設定されている場合、パス管理テーブル109は、例えば図3に示すとおりとなる。
パスID「0001」によって識別されるパスは、HBA1_104AからR−VOL133に至るパスである。パスID「0002」によって識別されるパスは、HBA2_104BからR−VOL133に至るパスである。これらのパスにはFCプロトコルが適用されるため、これらに対応するケーブル情報309として「FC」が保持される。
パス管理テーブル109には、さらに、第3ネットワーク150を経由するパスに関する情報も含まれる。
パスID「0003」によって識別されるパスは、NIC2_105BからV−VOL123を経由してR−VOL133に至るパスである。パスID「0004」によって識別されるパスは、NIC1_105Aから、接続元ストレージシステムA120を経由せずにR−VOL133に至るパスである。これらのパスにはiSCSIプロトコルが適用されるため、これらに対応するケーブル情報309として「iSCSI」が保持される。
図3の例において、パスID「0001」及び「0002」に対応するステータス310として「OFFLINE」が、パスID「0003」及び「0004」に対応するステータス310として「ONLINE」が保持されている。これは、パスID「0001」及び「0002」によって識別される二つのパスは、それぞれに含まれるいずれかの部位に発生した障害のために、通信ができない状態であることを示す。
業務ホスト100は、図3に示すパス管理テーブル109を出力してもよい。例えば、業務ホスト100は、表示装置115にパス管理テーブル109を表示してもよい。ユーザは、いずれかのパスの状態が「OFFLINE」である場合、障害が発生している部位を特定するために、そのパスの詳細な状態を表示させる指示を入力してもよい。この指示が入力されると、ステータス管理テーブル110の内容が新たに出力される。
図5は、本発明の実施形態のステータス管理テーブル110の説明図である。
ステータス管理テーブル110は、パスの構成要素の状態を示す情報を保持する。具体的には、ステータス管理テーブル110は、ID501、構成502及びステータス503を含む。
ID501は、ステータス管理テーブル110内の各エントリに付与された番号である。
構成502は、パスの構成要素の分類の名前である。図5の例では、構成502として「HBA」、「ネットワーク」及び「ストレージ」が保持される。
ステータス503は、パスの構成要素の分類ごとの状態を示す情報である。例えば、業務ホスト100内の全てのHBA104(図1の例では、HBA1_104A及びHBA2_104B)が正常な状態である場合、「HBA」に対応するステータス503として「ONLINE」が保持される。一方、業務ホスト100内のHBA104の少なくとも一つに障害が発生している場合、「HBA」に対応するステータス503として「OFFLINE」が保持される。
同様に、業務ホスト100によって要求されたデータアクセスが経由するネットワーク(図1の例では、第1ネットワーク(PB)140A及び第2ネットワーク(PB)140B)の少なくとも一つに障害が発生している場合、「ネットワーク」に対応するステータス503として「OFFLINE」が保持される。業務ホスト100からのアクセス要求を処理するストレージシステム(図1の例では、接続元ストレージシステムA120及び外部接続ストレージシステムB130)の少なくとも一つに障害が発生している場合、「ストレージ」に対応するステータス503として「OFFLINE」が保持される。
ステータス503の値は、後述するHBAステータステーブル111、スイッチステータステーブル112及びストレージステータステーブル113の内容に基づいて設定される。図5の例では、「ストレージ」に対応するステータス503として「OFFLINE」が保持されている。
ユーザは、いずれかの構成要素の分類の状態が「OFFLINE」である場合、障害が発生している部位を特定するために、その構成要素の分類の詳細な状態を表示させる指示を入力してもよい。この指示が入力されると、要求に応じて、HBAステータステーブル111、スイッチステータステーブル112及びストレージステータステーブル113の少なくとも一つの内容が新たに出力される。
図6は、本発明の実施形態のHBAステータステーブル111の説明図である。
HBAステータステーブル111は、業務ホスト100が備える各HBA104の状態を示す情報を保持する。具体的には、HBAステータステーブル111は、ID601、HBA602及びステータス603を含む。
ID601は、HBAステータステーブル111内の各エントリに付与された番号である。
HBA602は、業務ホスト100が備える各HBA104の識別子である。
ステータス603は、各HBA104の状態を示す情報である。「ONLINE」はHBA104が正常に動作していることを、「OFFLINE」はHBA104に障害が発生していることを示す。
図6の例では、業務ホスト100が備えるHBA1_104A及びHBA2_104Bのいずれも正常に動作している。これは、図5において「HBA」に対応するステータス503が「ONLINE」であることに対応する。HBA1_104A及びHBA2_104Bの少なくとも一方に対応するステータス603が「OFFLINE」である場合、図5において「HBA」に対応するステータス503が「OFFLINE」となる。
図7は、本発明の実施形態のスイッチステータステーブル112の説明図である。
図7は、ユーザからの指示に従って表示装置115に表示されたスイッチステータステーブル112の内容を示す。
表示されたスイッチステータステーブル112は、業務ホスト100によって要求されたデータアクセスが経由するネットワークの各構成要素の状態を示す情報を保持する。具体的には、スイッチステータステーブル112は、ドメイン701、ポート702、HBA703、ポートステータス704、ケーブルステータス705、HBAベンダ名706及び選択タブ711を含む。
選択タブ711は、表示されるべきネットワークを選択するために指定されるタブである。本実施形態では、図1に示すように、データアクセスがPA140A及びPB140Bの二つのネットワークを経由する。このため、図7の例では、PA140A及びPB140Bのそれぞれに対応する選択タブ711が表示される。図7は、PA140Aが選択された場合を示す。この場合、表示装置115には、図7に示すように、PA140Aの構成要素の状態を示す情報が表示される。
なお、メモリ103に格納されたスイッチステータステーブル112は、図7に示すPA140Aの構成要素の状態を示す情報に加えて、図7では省略されているPB140Bの構成要素の状態を示す情報も含む。
ドメイン701は、ネットワークに含まれる各FCスイッチの識別子である。図4に示すように、PA140AはFCスイッチ401Aを含む。図7に示す「0001」は、FCスイッチ401Aの識別子である。
ポート702は、ネットワークに含まれるFCスイッチのポートの識別子である。図4に示すように、PA140Aに含まれるFCスイッチ401Aは、ポートA1_402A〜ポートA4_402Dを備える。このため、ポート702として、これらの四つのポートの識別子が保持される。
HBA703は、各ポートに接続されたHBA104又はCHA122(又はCHA132)の識別子である。
ポートステータス704は、各ポートの状態を示す情報である。「ONLINE」はポートが正常に動作していることを、「OFFLINE」はポートに障害が発生していることを示す。
ケーブルステータス705は、各ポートに接続されたケーブルの状態を示す情報である。「ONLINE」はケーブルが正常に接続されていることを、「OFFLINE」はケーブルの接続に障害(例えば断線)が発生していることを示す。
HBAベンダ名706は、各ポートに接続されたHBA104又はCHA122(又はCHA132)のベンダの識別子である。
スイッチステータステーブル112は、さらに、各ポートが属するゾーン(例えば図4に示すゾーンA403A等)を識別する情報を含んでもよい。
図7の例では、各ポート及び各ケーブルの状態が全て正常である。これは、図5において「ネットワーク」に対応するステータス503が「ONLINE」であることに対応する。ポートステータス704又はケーブルステータス705に一つでも「OFFLINE」が保持される場合、図5において「ネットワーク」に対応するステータス503が「OFFLINE」となる。
図8は、本発明の実施形態のストレージステータステーブル113の説明図である。
図8は、ユーザからの指示に従って表示装置115に表示されたストレージステータステーブル113の内容を示す。
表示されたストレージステータステーブル113は、業務ホスト100からのアクセス要求を処理する各ストレージシステムの状態を示す情報を保持する。具体的には、ストレージステータステーブル113は、ポート801、CHA802、CU803、LDEV804、CHAステータス805、ポートステータス806及び選択タブ811を含む。
選択タブ811は、表示されるべきストレージシステムを選択するために指定されるタブである。本実施形態では、図1に示すように、接続元ストレージシステムA120及び外部接続ストレージシステムB130が業務ホスト100からのアクセス要求を処理する。このため、図8の例では、接続元ストレージシステムA120及び外部接続ストレージシステムB130のそれぞれに対応する選択タブ711が表示される。図8は、接続元ストレージシステムA120が選択された場合を示す。この場合、表示装置115には、図8に示すように、接続元ストレージシステムA120の構成要素の状態を示す情報が表示される。
なお、メモリ103に格納されたストレージステータステーブル113は、図8に示す接続元ストレージシステムA120の構成要素の状態を示す情報に加えて、図8では省略されている外部接続ストレージシステムB130の構成要素の状態を示す情報も含む。
ポート801は、接続元ストレージシステムA120が備える各CHA122のポートの識別子である。
CHA802は、接続元ストレージシステムA120が備える各CHA122の識別子である。
CU803及びLDEV804は、接続元ストレージシステムA120に含まれる論理ボリュームを識別する情報である(図2参照)。
CHAステータス805は、各CHA122の状態を示す情報である。「ONLINE」はCHA122が正常に動作していることを、「OFFLINE」はCHA122に障害が発生していることを示す。
ポートステータス806は、各CHA122の各ポートの状態を示す情報である。「ONLINE」はポートが正常に動作していることを、「OFFLINE」はポートに障害が発生していることを示す。
CHAステータス805又はポートステータス806に一つでも「OFFLINE」が保持される場合、図5において「ストレージ」に対応するステータス503が「OFFLINE」となる。図8の例では、CHA1−1_122A及びCHA1−2_122Bの状態が「OFFLINE」であり、その他のCHA122及びポートの状態が全て正常である。これは、図5において「ストレージ」に対応するステータス503が「OFFLINE」であること、及び、図3においてパスID「0001」及び「0002」に対応するステータス310が「OFFLINE」であることに対応する。
図9は、本発明の実施形態の障害通知処理を示すフローチャートである。
障害通知処理は、パス管理部108が障害を検出してから、それを管理者に通知するまでの処理である。
最初に、パス管理部108は、パスに発生した障害を検出する(ステップ901)。例えば、パス管理部108は、実行したI/Oに対する応答としてエラーを受信した場合、障害が発生したと判定する。
次に、パス管理部108は、パス判定処理を実行する(ステップ902)。パス判定処理については、後で詳細に説明する(図10参照)。
次に、パス管理部108は、パス判定処理の結果、代替パス(すなわち、業務ホスト100によるR−VOL133へのアクセスに使用可能なパス)があるか否かを判定する(ステップ903)。
代替パスがあると判定された場合、パス管理部108は、代替パスを使用して業務を継続する(ステップ904)。
次に、パス管理部108は、管理者に障害が発生したことを示す通知を送信する(ステップ905)。
ステップ903において代替パスがないと判定された場合、パス管理部108は、ステップ904を実行せずにステップ905を実行する。
次に、パス管理部108は、障害箇所判定処理を実行する(ステップ906)。障害箇所判定処理については、後で詳細に説明する(図11参照)。
次に、パス管理部108は、障害箇所判定処理の結果に基づいて、障害が発生した箇所を特定する(ステップ907)。
次に、パス管理部108は、特定された障害箇所を示す通知を管理者に送信する(ステップ908)。
以上で障害通知処理が終了する。
図10は、本発明の実施形態のパス判定処理を示すフローチャートである。
図10に示すパス判定処理は、図9に示す障害通知処理のステップ902において実行される。
通常時(すなわち、パスに障害が発生していない場合)、業務ホスト100はPA140Aを経由してV−VOL123にアクセスすることができる。接続元ストレージシステムA120は、PB140Bを経由してR−VOL133にアクセスすることができる。この場合、業務ホスト100によるデータの書き込み及び読み出しは、PA140A、V−VOL123及びPB140Bを経由して、R−VOL133に対して実行される。
さらに、業務ホスト100は、PC151Aを介して接続元ストレージシステムA120の各CHA122及び各ポート等の状態を確認し、PD151Bを介して外部接続ストレージシステムB130の各CHA122及び各ポート等の状態を確認する。そして、パス管理部108は、いずれかの部位に発生した障害を検出すると、パス判定処理を実行して、使用するパスを選択する。
最初に、パス管理部108は、フラグPAの値を「0」にする(ステップ1001)。フラグPAは、PA140Aに障害が発生しているか否かを示すフラグである。図10の例において、フラグPAの値「0」はPA140Aに障害が発生していないことを、値「1」はPA140Aに障害が発生していることを示す。
次に、パス管理部108は、PA140Aを経由するV−VOL123へのアクセスを実行し、そのアクセスが成功したか否かを判定する(ステップ1002)。具体的には、例えば、パス管理部108は、PA140Aを経由してV−VOL123へ所定のI/Oコマンドを送信してもよい。そのコマンドに対する応答を所定の時間内に受信できなかった場合、パス管理部108は、PA140Aを経由するV−VOL123へのアクセスに失敗したと判定してもよい。なお、後述するステップ1003、1008及び1004もこれと同様の方法によって実行することができる。
ステップ1002においてアクセスに失敗したと判定された場合、パス管理部108は、PA140Aに障害が発生していると判定して、フラグPAの値を「1」に変更する(ステップ1007)。
次に、パス管理部108は、PC151Aを経由するV−VOL123へのアクセスを実行し、そのアクセスが成功したか否かを判定する(ステップ1008)。
ステップ1008においてアクセスに成功したと判定された場合、PA140Aには障害が発生しているが、PC151A及び接続元ストレージシステムA120は正常に動作している。ステップ1002においてアクセスに成功したと判定された場合、PA140A及び接続元ストレージシステムA120のいずれも正常に動作している。これらの場合、パス管理部108は、PB140Bを経由するR−VOL133へのアクセスを実行し、そのアクセスに成功したか否かを判定する(ステップ1003)。
ただし、ステップ1008においてアクセスに成功したと判定された後にステップ1003が実行される場合、PC151A及びPB140Bを経由するアクセスが実行される。一方、ステップ1002においてアクセスに成功したと判定された後にステップ1003が実行される場合、PA140A及びPB140Bを経由するアクセスが実行される。
ステップ1003においてアクセスに成功したと判定された場合、少なくともPB140B及び外部接続ストレージシステムB130は正常に動作している。この場合、パス管理部108は、フラグPAの値が「0」であるか否か(すなわち、PA140Aが正常であるか否か)を判定する(ステップ1009)。
ステップ1009においてフラグPAの値が「0」であると判定された場合、結局、パス管理部108は、全パス及び全ストレージシステムが正常であると判定する(ステップ1010)。この場合、パス管理部108は、使用可能なパスとしてPA140A及びPB140Bを選択し(ステップ1011)、パス判定処理を終了する。
ステップ1009においてフラグPAの値が「1」であると判定された場合、全ストレージシステム、PC151A及びPB140Bが正常であるが、PA140Aに障害が発生していると判定される(ステップ1012)。この場合、パス管理部108は、使用可能なパスとしてPC151A及びPB140Bを選択し(ステップ1013)、パス判定処理を終了する。
ステップ1003においてアクセスに失敗したと判定された場合、PB140B及び外部接続ストレージシステムB130の少なくとも一つに障害が発生していると考えられる。ステップ1008においてアクセスに失敗したと判定された場合、PC151A、接続元ストレージシステムA120、PB140B及び外部接続ストレージシステムB130の少なくとも一つに障害が発生していると考えられる。これらの場合、パス管理部108は、PD151Bを経由するR−VOL133へのアクセスを実行し、そのアクセスに成功したか否かを判定する(ステップ1004)。
ステップ1004においてアクセスに失敗したと判定された場合、パス管理部108は、外部接続ストレージシステムB130及びPD151Bの少なくとも一方に障害が発生していると判定する(ステップ1005)。この場合、パス管理部108は、使用可能なパスが存在しないと判定して(ステップ1006)、パス判定処理を終了する。
ステップ1004においてアクセスに成功したと判定された場合、外部接続ストレージシステムB130及びPD151Bが正常に動作している。この場合、パス管理部108は、フラグPAの値が「0」であるか否かを判定する(ステップ1014)。
フラグPAの値が「0」であると判定された場合、パス管理部108は、PB140Bに障害が発生していると判定する(ステップ1015)。この場合、パス管理部108は、使用可能なパスとしてPD151Bを選択し(ステップ1016)、パス判定処理を終了する。
フラグPAの値が「1」であると判定された場合、パス管理部108は、PA140A及びPB140Bに障害が発生していると判定する(ステップ1017)。この場合、パス管理部108は、使用可能なパスとしてPD151Bを選択し(ステップ1018)、パス判定処理を終了する。
図11は、本発明の実施形態の障害箇所判定処理を示すフローチャートである。
図11に示す障害箇所判定処理は、図9に示す障害通知処理のステップ906において実行される。
最初に、パス管理部108は、HBAステータステーブル処理を開始する(ステップ1101)。HBAステータステーブル処理とは、HBAステータステーブル111を更新する処理(具体的には、続くステップ1102及び1103の処理)である。
次に、パス管理部108は、各HBA104のステータスを確認する(ステップ1102)。具体的には、パス管理部108は、例えば所定のコマンドを各HBA104に送信し、そのコマンドに対する応答を所定の時間内に受信しなかった場合、HBA104のステータスが「OFFLINE」であると判定してもよい。あるいは、そのコマンドに対して、HBA104に障害が発生したことを示す応答を受信した場合、パス管理部108は、そのHBA104のステータスが「OFFLINE」であると判定してもよい。
次に、パス管理部108は、ステップ1102において確認されたステータスを反映させるように、HBAステータステーブル111を更新する(ステップ1103)。
さらに、パス管理部108は、スイッチステータステーブル処理を開始する(ステップ1104)。スイッチステータステーブル処理とは、スイッチステータステーブル112を更新する処理(具体的には、続くステップ1105及び1106の処理)である。
次に、パス管理部108は、各FCスイッチ(図4の例ではFCスイッチ401A及び401B)のステータスを確認する(ステップ1105)。例えば、パス管理部108は、第3ネットワーク150を経由して所定のコマンドを各FCスイッチに送信し、そのコマンドに対する応答に基づいて、ステップ1102と同様に判定してもよい。
次に、パス管理部は、ステップ1105において確認されたステータスを反映させるように、スイッチステータステーブル112を更新する(ステップ1106)。
さらに、パス管理部108は、ストレージステータステーブル処理を開始する(ステップ1107)。ストレージステータステーブル処理とは、ストレージステータステーブル113を更新する処理(具体的には、続くステップ1108及び1109の処理)である。
次に、パス管理部108は、各ストレージシステム(図1の例では接続元ストレージシステムA120及び外部接続ストレージシステムB130)のステータスを確認する(ステップ1108)。例えば、パス管理部108は、第3ネットワーク150を経由して所定のコマンドを各ストレージシステムに送信し、そのコマンドに対する応答に基づいて、ステップ1102と同様に判定してもよい。
次に、パス管理部108は、ステップ1108において確認されたステータスを反映させるように、ストレージステータステーブル113を更新する(ステップ1109)。
図11は、上記のHBAステータステーブル処理、スイッチステータステーブル処理及びストレージステータステーブル処理が並列に実行される例を示す。しかし、これらの処理は順次実行されてもよい。例えば、最初にステップ1101から1103が実行され、次にステップ1104から1106が実行され、次にステップ1107から1109が実行されてもよい。
次に、パス管理部108は、全てのステータステーブルの更新が終了したか否かを判定する(ステップ1110)。
ステップ1110において更新が終了していないと判定された場合、パス管理部108は、更新の終了を待つ。
ステップ1110において更新が終了したと判定された場合、パス管理部108は、更新された内容を反映させるようにステータス管理テーブル110を更新する(ステップ1111)。
次に、パス管理部108は、更新されたステータス管理テーブル110に基づいてパス管理テーブル109を更新する(ステップ1112)。
以上で障害箇所判定処理が終了する。
図10に示す処理において、図12に示すテーブルが参照されてもよい。具体的には、図10に示す処理において、障害が発生したパスが特定された後(すなわち、ステップ1010、1012、1017及び1015の後)、図12に示すテーブルが参照され、使用可能なパスが選択されてもよい。
図12は、本発明の実施形態のアクセス経路判定テーブル114の説明図である。
アクセス経路判定テーブル114の各行(行1211〜行1226)は、本実施形態の計算機システムにおいてデータアクセスに使用されるパスと、そのパスに障害が発生した場合に使用されるパス(すなわち代替パス)とを対応付ける情報を保持する。具体的には、アクセス経路判定テーブル114は、障害箇所1201及びアクセス経路1202を含む。
障害箇所1201は、障害が発生したパスを識別する情報である。例えば、障害箇所1201に保持された値「PA」はPA140Aを(行1214参照)、「PA1」はPA1_141Aを識別する情報である(行1212参照)。
アクセス経路1202は、障害箇所1201によって識別されるパスに障害が発生した場合に使用される代替パスを識別する情報である。例えば、「PA→V−VOL→PB→R−VOL」は、業務ホスト100からPA140A、V−VOL123及びPB140Bを経由してR−VOL133に至るパスを識別する情報である(行1211参照)。なお、空の障害箇所1201に対応するアクセス経路1202は、いずれのパスにも障害が発生していない場合に使用されるパスを識別する情報である。
以下、行1211から行1226のうちいくつかを例として説明する。
行1211の障害箇所1201は空であり、行1211のアクセス経路1202は「PA→V−VOL→PB→R−VOL」である。これは、いずれのパスにも障害が発生していない場合、業務ホスト100からPA140A、V−VOL123及びPB140Bを経由してR−VOL133に至るパスが使用されることを示す。これは、図10のステップ1011に相当する。
行1212の障害箇所1201及びアクセス経路1202は、それぞれ、「PA1」及び「PA2→V−VOL→PB→R−VOL」である。これは、PA1_141Aに障害が発生した場合、代替パスとして、業務ホスト100からPA2_141B、V−VOL123及びPB140Bを経由してR−VOL133に至るパスが使用されることを示す。これは、PA140Aの少なくとも一部が使用可能であるため、図10のステップ1011に相当する。
行1214の障害箇所1201及びアクセス経路1202は、それぞれ、「PA」及び「PC→V−VOL→PB→R−VOL」である。これは、PA140A(すなわち、PA1_141A及びPA2_141Bの両方)に障害が発生した場合、代替パスとして、業務ホスト100からPC151A、V−VOL123及びPB140Bを経由してR−VOL133に至るパスが使用されることを示す。これは、図10のステップ1013に相当する。
行1217の障害箇所1201及びアクセス経路1202は、それぞれ、「PB」及び「PD→R−VOL」である。これは、PB140B(すなわち、PB1_141C及びPB2_141Dの両方)に障害が発生した場合、代替パスとして、業務ホスト100からPD151Bを経由してR−VOL133に至るパスが使用されることを示す。これは、図10のステップ1016に相当する。
行1226の障害箇所1201及びアクセス経路1202は、それぞれ、「PB/PB」及び「PD→R−VOL」である。これは、PA140A(すなわち、PA1_141A及びPA2_141Bの両方)及びPB140B(すなわち、PB1_141C及びPB2_141Dの両方)に障害が発生した場合、代替パスとして、業務ホスト100からPD151Bを経由してR−VOL133に至るパスが使用されることを示す。これは、図10のステップ1018に相当する。
結局、パス判定処理(図10)及びアクセス経路判定テーブル114(図12)によれば、使用可能なパスと、それらのパスが使用可能である場合に優先的に使用されるべき経路とが対応付けられる。具体的には、FCネットワーク上のパス及びIPネットワーク上のパスの両方が使用可能である場合、原則として、FCネットワーク上のパスが優先的に使用される。
図10の例では、PA140Aに含まれる複数のパス(図1の例ではPA1_141A及びPA2_141B)のうち少なくとも一つが使用可能である限り、代替パスは使用されない。PB140Bについても同様である。しかし、これらの複数のパスのうち、使用可能なパスの数が所定の値以下となった場合、まだ使用可能なパスと併せて代替パスが使用されてもよい。
例えば、PB140Bに含まれる複数のパス(図1の例ではPB1_141C及びPB2_141D)のうち使用可能なパスの数が1以下となった(言い換えると2より小さくなった)場合、代替パスとしてPD151Bが使用されてもよい。まだPB1_141C及びPB2_141Dのうち一方が使用可能である場合、その使用可能なパスを含む、業務ホスト100からR−VOL133に至るパスと、PD151Bを含むパスとの両方が使用される。
例えば、行1215の障害箇所1201及びアクセス経路1202は、それぞれ、「PB1」及び「PA→V−VOL→PB2/PD→R−VOL」である。これは、PB1_141Cに障害が発生した場合、代替パスとして、業務ホスト100からPA140A、V−VOL123及びPB2_141Dを経由してR−VOL133に至るパス、及び、業務ホスト100からPD151Bを経由してR−VOL133に至るパスが使用されることを示す。
複数のパスのうち一部に障害が発生した場合、残りの使用可能なパスにアクセス負荷が集中することによって、性能が低下する場合がある。しかし、上記のように、FCネットワークの使用可能なパスとIPネットワークの代替パスとを併用し、それらのパスにアクセス負荷を分散させることによって、障害に起因する性能低下の発生を抑制することができる。
ユーザは、上記のようにFCネットワークのパスとIPネットワークのパスとの併用を許可するか否かを、例えば、図13に示す画面を用いて選択することができる。
具体的には、上記のように業務ホスト100からPA140A、V−VOL123及びPB2_141Dを経由してR−VOL133に至るパス、及び、業務ホスト100からPD151Bを経由してR−VOL133に至るパスが使用される場合、業務ホストは、V−VOL123への複数のアクセス要求の一部をR−VOL133へのアクセス要求に変換する。そして、業務ホスト100は、V−VOL123へのアクセス要求を、PA140Aを経由してV−VOL123に送信し、変換されたアクセス要求を、PD151Bを経由してR−VOL133に送信する。
図13は、本発明の実施形態の表示装置115に表示されるパス優先設定画面1300の説明図である。
パス優先設定画面1300は、FCネットワークのパスとIPネットワークのパスとの併用を許可するか否かを指定する入力を受け付けるために表示される。具体的には、パス優先設定画面1300は、選択タブ1301、FC優先ボタン1302、FC/iSCSI併用ボタン1303及びパス数入力フィールド1304を含む。
選択タブ1301は、表示されるべき画面を選択するために指定されるタブである。本実施形態では、PA140A及びPB140Bのそれぞれについて、FCネットワークのパスとIPネットワークのパスとの併用を許可するか否かを指定することができる。例えば、ユーザが選択タブ1301のうち「PA」を選択した場合、PA140Aの使用可能なパスとIPネットワークのパス(例えばPC151A)との併用を許可するか否かを指定するための画面が表示される。図13は、「PA」が選択された場合を示す。
FC優先ボタン1302及びFC/iSCSI併用ボタン1303は、それらのうち一方が選択される、いわゆるラジオボタンである。
FC優先ボタン1302が操作(例えばマウスによってクリック)された場合、FCネットワークのパスとIPネットワークのパスとの併用が禁止される。すなわち、この場合、例えばPA140Aに使用可能なパスが一つでも含まれる限り、PA140AとIPネットワークのパス(例えばPC151A)とを併用することができない。
一方、FC/iSCSI併用ボタン1303が操作された場合、FCネットワークのパスとIPネットワークのパスとの併用が許可される。ユーザは、さらに、パス数入力フィールド1304に任意のパス数を入力することができる。FCネットワークのパス数がパス数入力フィールド1304に入力された数以下となった場合、FCネットワークのパスとIPネットワークのパスとが併用される。
例えば、図13の例では、FC/iSCSI併用ボタン1303が操作され、さらに、パス数入力フィールド1304に「1」が入力されている。この例では、PA140Aに含まれる使用可能なパス数が「1」以下になった場合、PA140Aと、IPネットワークの代替パス(例えばPC151A)とが併用される。
図12は、図13の画面において、PA140AついてはFC優先ボタン1302が操作され、PB140BについてはFC/iSCSI併用ボタン1303が操作され、パス数入力フィールド1304に「1」が入力されている場合の例を示す。
なお、接続元ストレージシステムA120のコントローラ121がキャッシュメモリ124を備え、そのキャッシュメモリ124に格納されたデータがR−VOL133に格納される前にPB140Bに障害が発生した場合、業務ホスト100がそのキャッシュメモリ124に格納されたデータ(すなわち最新のデータ)を利用できなくなる可能性がある。
通常、キャッシュメモリ124が使用される場合、書き込みを要求されたデータのキャッシュメモリ124への格納が終了すると、そのデータがまだV−VOL123(すなわちそれに対応するR−VOL133)に格納されていなくても、接続元ストレージシステムA120は業務ホスト100に書き込み処理の終了報告を送信する。その後、そのデータがR−VOL133に格納される前にPB140Bに障害が発生した場合、業務ホスト100はそのデータがまだR−VOL133に格納されていないことを知ることができないため、キャッシュメモリ124に格納された最新のデータをR−VOL133に反映させることができない。業務ホスト100からR−VOL133に至る代替パスは、接続元ストレージシステムA120を経由しないため、業務ホスト100はキャッシュメモリ124にアクセスすることができない。このため、業務ホストは、キャッシュメモリ124に格納された最新のデータを利用することができない。
本実施形態では、上記のような問題の発生を防ぐため、PB140Bについては必ずFCネットワークとIPネットワークの併用が許可される。具体的には、例えば、図13の画面において、「PB」の選択タブ1301が選択された場合、自動的にFC/iSCSI併用ボタン1303が操作され、FC優先ボタン1302の操作が禁止されてもよい。
図14は、本発明の実施形態のデータの整合性を示すフローチャートである。
例えば、PB140Bに含まれる複数パスの少なくとも一つに障害が発生(ステップ1401)した場合、業務ホスト100は、PB140Bにて生存しているパス(すなわち、障害が発生していない、使用可能なパス)の数SPを検出する(ステップ1402)。
次に、業務ホスト100は、FC/iSCSI併用ボタン1303にてパス数入力フィールド1304に入力されたパス数PNumを確認する(ステップ1403)。ここでは、パス数PNumが「1」である場合を例として説明する。
次に、業務ホスト100は、生存しているパス数SPとパス数入力フィールド1340に入力されたパス数PNumを比較する(ステップ1404)。
生存しているパス数SPがパス数PNumより大きい場合、代替パスへの負荷分散を実行せずに、図14のフローが終了する。この場合、生存しているパスを使用して業務が継続される。
一方、生存しているパス数SPがパス数PNum以下である場合、業務ホスト100は、第3ネットワーク150の代替パス(例えばPD151B)を使用して、PB140Bの使用可能なパスと代替パスとの間でアクセス負荷分散させる(ステップ1405)。
さらに業務ホスト100は、キャッシュ124に格納されたデータのうち、少なくとも、まだV−VOL123(すなわちそれに対応するR−VOL133)に格納されていないデータをV−VOL123に格納することを接続元ストレージシステムA120に指示する。接続元ストレージシステムA120は、その指示に従って、キャッシュメモリ124に格納されたデータをV−VOL123に対応するR−VOL123に格納する(ステップ1406)。
接続元ストレージシステムA120は、ステップ1406におけるR−VOL123への書き込みが成功したか否かを判定する(ステップ1407)。R−VOL123に書き込みが成功した場合、接続元ストレージシステムA120は、業務ホスト100に完了通知を送信する(ステップ1408)。一方、書き込みに失敗した場合、接続元ストレージシステムA120は、PB140Bに含まれる全パスに障害が発生したものと判定し、業務ホスト100にエラーを検知する(ステップ1409)。業務ホスト100は、エラーを検知すると、代替パスを経由してR−VOLへの書き込みを実行する(ステップ1410)。このため、最新のデータをR−VOL133に反映することができ、その後も代替パスを使用して業務を継続することができる。
上記のようにR−VOL133への格納が終了するまで接続元ストレージシステムA120が終了報告を送信しない場合、アクセス性能が低下する。しかし、代替パス(例えばPD151B)に負荷を分散させることによって、アクセス性能の低下を抑制することができる。
以上、本発明の実施形態によれば、業務ホストから、実際にデータが格納されるR−VOL133までの間のFCネットワークのパスに障害が発生しても、補助用のパス(例えばIPネットワークのパス)を使用して業務を継続することができる。その結果、業務の停止が防止される。さらに、FCネットワークのパスと補助用のパスとを併用し、それらのパスにアクセス負荷を分散させることによって、FCネットワークのパスの一部に障害が発生した場合の性能低下が抑制される。さらに、本発明の実施形態によれば、障害が発生した箇所を特定することができる。
本発明の実施形態の計算機システムの構成を示すブロック図である。 本発明の実施形態のLUマッピング管理部による記憶領域の割り当ての説明図である。 本発明の実施形態のパス管理テーブルの説明図である。 本発明の実施形態において設定されたパスの詳細な説明図である。 本発明の実施形態のステータス管理テーブルの説明図である。 本発明の実施形態のHBAステータステーブルの説明図である。 本発明の実施形態のスイッチステータステーブルの説明図である。 本発明の実施形態のストレージステータステーブルの説明図である。 本発明の実施形態の障害通知処理を示すフローチャートである。 本発明の実施形態のパス判定処理を示すフローチャートである。 本発明の実施形態の障害箇所判定処理を示すフローチャートである。 本発明の実施形態のアクセス経路判定テーブルの説明図である。 本発明の実施形態の表示装置に表示されるパス優先設定画面の説明図である。 本発明の実施形態のデータの整合性の説明図である。
符号の説明
100 業務ホスト
102 CPU
103 メモリ
106 アプリケーション
107 LUマッピング管理部
108 パス管理部
109 パス管理テーブル
110 ステータス管理テーブル
111 HBAステータステーブル
112 スイッチステータステーブル
113 ストレージステータステーブル
114 アクセス経路判定テーブル
120 接続元ストレージA
121、131 コントローラ
123 V−VOL
130 外部接続ストレージB
133 R−VOL

Claims (16)

  1. 計算機、第1ストレージシステム及び第2ストレージシステムを備える計算機システムを制御する方法であって、
    前記第1ストレージシステムは、第1経路及び第2経路を介して前記計算機に接続され、
    前記第2ストレージシステムは、第3経路を介して前記第1ストレージシステムに接続され、第4経路を介して前記計算機に接続され、
    前記計算機は、前記第1経路に接続される第1インターフェース、前記第2経路に接続される第2インターフェース、前記第4経路に接続される第3インターフェース、前記第1インターフェースから前記第3インターフェースに接続される第1プロセッサ、及び、前記第1プロセッサに接続される第1メモリを備え、
    前記第1ストレージシステムは、
    前記第1経路、前記第2経路及び前記第3経路に接続される第1コントローラを備え、
    第1記憶領域を前記計算機に提供し、
    前記計算機から前記第1記憶領域へのアクセス要求を受信すると、前記受信したアクセス要求を前記第2記憶領域へのアクセス要求に変換し、前記変換されたアクセス要求を、前記第3経路を経由して前記第2ストレージシステムに送信し、
    前記第2ストレージシステムは、
    前記第3経路及び前記第4経路に接続される第2コントローラ、及び、第2記憶領域を備え、
    前記計算機又は前記第1ストレージシステムから前記第2記憶領域へのアクセス要求を受信すると、前記受信したアクセス要求に従って前記第2記憶領域へのアクセス処理を実行し、
    前記計算機は、
    前記第1記憶領域と前記第2記憶領域とを対応付ける第1情報を保持し、
    前記第1経路から前記第4経路の少なくとも一つに障害が発生したか否かの判定結果と、前記第1記憶領域又は前記第2記憶領域へのアクセスに使用される前記第1経路から前記第4経路の少なくとも一つと、を対応付ける第2情報を保持し、
    前記方法は、
    前記計算機が、前記第1経路から前記第4経路の少なくとも一つに障害が発生したか否かを判定する第1手順と、
    前記計算機が、前記判定の結果及び前記第2情報に基づいて、前記第1記憶領域又は前記第2記憶領域へのアクセスに使用される前記第1経路から前記第4経路の少なくとも一つを選択する第2手順と、
    前記計算機が、前記選択された前記第1経路から前記第4経路の少なくとも一つを用いて、前記第1記憶領域又は前記第2記憶領域へのアクセス要求を送信する第3手順と、を含むことを特徴とする方法。
  2. 前記第2手順は、前記第1手順によって前記第1経路から前記第4経路のいずれにも障害が発生していないと判定された場合、前記第1経路を選択する手順を含み、
    前記第3手順は、前記選択された第1経路を経由して、前記第1記憶領域へのアクセス要求を前記第1ストレージシステムに送信する手順を含み、
    前記第2手順は、前記第1手順によって前記第1経路に障害が発生したと判定され、かつ、前記第2経路に障害が発生していないと判定された場合、前記第2経路を選択する手順を含み、
    前記第3手順は、前記選択された第2経路を経由して、前記第1記憶領域へのアクセス要求を前記第1ストレージシステムに送信する手順を含むことを特徴とする請求項1に記載の方法。
  3. 前記第2手順は、前記第1手順によって前記第3経路に障害が発生したと判定された場合、前記第4経路を選択する手順を含み、
    前記第3手順は、前記第2記憶領域へのアクセス要求を、前記選択された第4経路を介して前記第2ストレージシステムに送信する手順を含むことを特徴とする請求項2に記載の方法。
  4. 前記第1手順は、前記第1経路を経由する前記第1記憶領域へのアクセスに失敗した場合、前記第1経路に障害が発生したと判定する手順と、前記第3経路を経由する前記第2記憶領域へのアクセスに失敗した場合、前記第3経路に障害が発生したと判定する手順と、を含むことを特徴とする請求項1に記載の方法。
  5. 前記第2経路及び前記第4経路は、前記第1経路及び前記第3経路よりデータ転送速度が低いネットワーク上に設定された経路であることを特徴とする請求項1に記載の方法。
  6. 前記第1経路及び前記第3経路は、ファイバーチャネルプロトコルが適用されるネットワーク上に設定され、前記第2経路及び前記第4経路は、インターネットプロトコルが適用されるネットワーク上に設定されることを特徴とする請求項5に記載の方法。
  7. 前記第2ストレージシステムは、さらに、一つ以上の第5経路を介して前記第1ストレージシステムと接続され、
    前記第1ストレージシステムは、複数の前記変換されたアクセス要求を、前記第3経路及び前記一つ以上の第5経路を経由するように分散して送信し、
    前記第3経路及び前記一つ以上の第5経路は、スイッチ装置を経由し、
    前記方法は、さらに、前記第1経路から前記第5経路の少なくとも一つに障害が発生していると判定された場合、前記計算機が、前記スイッチ装置に所定のコマンドを送信することによって、前記第3経路及び前記一つ以上の第5経路の各々に障害が発生しているか否かを判定する第4手順を含み、
    前記第3手順は、前記一つ以上の第5経路のうち、障害が発生していないものの数が所定の閾値より小さいと判定された場合、前記第1記憶領域への複数のアクセス要求の一部を前記第2記憶領域へのアクセス要求に変換し、前記変換されたアクセス要求を、前記第4経路を経由して前記第2ストレージシステムに送信する手順を含むことを特徴とする請求項1に記載の方法。
  8. 前記第1ストレージシステムは、さらに、前記第1記憶領域に書き込まれるデータ及び前記第1記憶領域から読み出されたデータの少なくとも一方が一時的に記憶されるキャッシュメモリを備え、
    前記方法は、さらに、
    前記計算機が、前記一つ以上の第5経路のうち、障害が発生していないものの数が所定の閾値より小さいと判定された場合、前記キャッシュメモリに格納されたデータを前記第1記憶領域に書き込ませるキャッシュデータ書き込み要求を前記第1ストレージシステムに送信する第5手順と、
    前記第1ストレージシステムが、前記キャッシュデータ書き込み要求を受信すると、前記キャッシュメモリに格納されたデータのうち、少なくとも前記第2記憶領域に格納されていないデータを前記第2記憶領域に格納する要求を前記第2ストレージシステムに送信する第6手順と、
    前記キャッシュデータ書き込み要求を受信した後で前記第1記憶領域へのアクセス要求を受信した後、前記変換されたアクセス要求に対する終了報告を前記第2ストレージシステムから受信した場合にのみ、前記受信したアクセス要求に対する終了報告を前記計算機に送信する第7手順と、を含むことを特徴とする請求項7に記載の方法。
  9. 計算機、第1ストレージシステム及び第2ストレージシステムを備える計算機システムであって、
    前記第1ストレージシステムは、第1経路及び第2経路を介して前記計算機に接続され、
    前記第2ストレージシステムは、第3経路を介して前記第1ストレージシステムに接続され、第4経路を介して前記計算機に接続され、
    前記計算機は、前記第1経路に接続される第1インターフェース、前記第2経路に接続される第2インターフェース、前記第4経路に接続される第3インターフェース、前記第1インターフェースから前記第3インターフェースに接続される第1プロセッサ、及び、前記第1プロセッサに接続される第1メモリを備え、
    前記第1ストレージシステムは、
    前記第1経路、前記第2経路及び前記第3経路に接続される第1コントローラを備え、
    第1記憶領域を前記計算機に提供し、
    前記計算機から前記第1記憶領域へのアクセス要求を受信すると、前記受信したアクセス要求を前記第2記憶領域へのアクセス要求に変換し、前記変換されたアクセス要求を、前記第3経路を経由して前記第2ストレージシステムに送信し、
    前記第2ストレージシステムは、
    前記第3経路及び前記第4経路に接続される第2コントローラ、及び、第2記憶領域を備え、
    前記計算機又は前記第1ストレージシステムから前記第2記憶領域へのアクセス要求を受信すると、前記受信したアクセス要求に従って前記第2記憶領域へのアクセス処理を実行し、
    前記計算機は、
    前記第1記憶領域と前記第2記憶領域とを対応付ける第1情報を保持し、
    前記第1経路から前記第4経路の少なくとも一つに障害が発生したか否かの判定結果と、前記第1記憶領域又は前記第2記憶領域へのアクセスに使用される前記第1経路から前記第4経路の少なくとも一つと、を対応付ける第2情報を保持し、
    前記第1経路から前記第4経路の少なくとも一つに障害が発生したか否かを判定し、
    前記判定の結果及び前記第2情報に基づいて、前記第1記憶領域又は前記第2記憶領域へのアクセスに使用される前記第1経路から前記第4経路の少なくとも一つを選択し、
    前記選択された前記第1経路から前記第4経路の少なくとも一つを用いて、前記第1記憶領域又は前記第2記憶領域へのアクセス要求を送信することを特徴とする計算機システム。
  10. 前記計算機は、
    前記第1経路から前記第4経路のいずれにも障害が発生していないと判定された場合、前記第1経路を選択し、
    前記選択された第1経路を経由して、前記第1記憶領域へのアクセス要求を前記第1ストレージシステムに送信し、
    前記第1経路に障害が発生したと判定され、かつ、前記第2経路に障害が発生していないと判定された場合、前記第2経路を選択し、
    前記選択された第2経路を経由して、前記第1記憶領域へのアクセス要求を前記第1ストレージシステムに送信することを特徴とする請求項9に記載の計算機システム。
  11. 前記計算機は、前記第3経路に障害が発生したと判定された場合、前記第4経路を選択し、前記第2記憶領域へのアクセス要求を、前記選択された第4経路を介して前記第2ストレージシステムに送信することを特徴とする請求項10に記載の計算機システム。
  12. 前記計算機は、前記第1経路を経由する前記第1記憶領域へのアクセスに失敗した場合、前記第1経路に障害が発生したと判定し、前記第3経路を経由する前記第2記憶領域へのアクセスに失敗した場合、前記第3経路に障害が発生したと判定することを特徴とする請求項9に記載の計算機システム。
  13. 前記第2経路及び前記第4経路は、前記第1経路及び前記第3経路よりデータ転送速度が低いネットワーク上に設定された経路であることを特徴とする請求項9に記載の計算機システム。
  14. 前記第1経路及び前記第3経路は、ファイバーチャネルプロトコルが適用されるネットワーク上に設定され、前記第2経路及び前記第4経路は、インターネットプロトコルが適用されるネットワーク上に設定されることを特徴とする請求項13に記載の計算機システム。
  15. 前記第2ストレージシステムは、さらに、一つ以上の第5経路を介して前記第1ストレージシステムと接続され、
    前記第1ストレージシステムは、複数の前記変換されたアクセス要求を、前記第3経路及び前記一つ以上の第5経路を経由するように分散して送信し、
    前記第3経路及び前記一つ以上の第5経路は、スイッチ装置を経由し、
    前記計算機は、
    前記第1経路から前記第5経路の少なくとも一つに障害が発生していると判定された場合、前記スイッチ装置に所定のコマンドを送信することによって、前記第3経路及び前記一つ以上の第5経路の各々に障害が発生しているか否かを判定し、
    前記一つ以上の第5経路のうち、障害が発生していないものの数が所定の閾値より小さいと判定された場合、前記第1記憶領域への複数のアクセス要求の一部を前記第2記憶領域へのアクセス要求に変換し、前記変換されたアクセス要求を、前記第4経路を経由して前記第2ストレージシステムに送信することを特徴とする請求項9に記載の計算機システム。
  16. 前記第1ストレージシステムは、さらに、前記第1記憶領域に書き込まれるデータ及び前記第1記憶領域から読み出されたデータの少なくとも一方が一時的に記憶されるキャッシュメモリを備え、
    前記計算機は、前記一つ以上の第5経路のうち、障害が発生していないものの数が所定の閾値より小さいと判定された場合、前記キャッシュメモリに格納されたデータを前記第1記憶領域に書き込ませるキャッシュデータ書き込み要求を前記第1ストレージシステムに送信し、
    前記第1ストレージシステムは、
    前記キャッシュデータ書き込み要求を受信すると、前記キャッシュメモリに格納されたデータのうち、少なくとも前記第2記憶領域に格納されていないデータを前記第2記憶領域に格納する要求を前記第2ストレージシステムに送信し、
    前記キャッシュデータ書き込み要求を受信した後で前記第1記憶領域へのアクセス要求を受信すると、前記変換されたアクセス要求に対する終了報告を前記第2ストレージシステムから受信するまで、前記受信したアクセス要求に対する終了報告を前記計算機に送信しないことを特徴とする請求項15に記載の計算機システム。
JP2008107852A 2008-04-17 2008-04-17 外部接続ストレージシステムのパス管理及び障害箇所検出方法 Expired - Fee Related JP4738438B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008107852A JP4738438B2 (ja) 2008-04-17 2008-04-17 外部接続ストレージシステムのパス管理及び障害箇所検出方法
US12/213,687 US7836350B2 (en) 2008-04-17 2008-06-23 Method of managing paths for an externally-connected storage system and method of detecting a fault site

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008107852A JP4738438B2 (ja) 2008-04-17 2008-04-17 外部接続ストレージシステムのパス管理及び障害箇所検出方法

Publications (3)

Publication Number Publication Date
JP2009259031A true JP2009259031A (ja) 2009-11-05
JP2009259031A5 JP2009259031A5 (ja) 2010-04-08
JP4738438B2 JP4738438B2 (ja) 2011-08-03

Family

ID=41202114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008107852A Expired - Fee Related JP4738438B2 (ja) 2008-04-17 2008-04-17 外部接続ストレージシステムのパス管理及び障害箇所検出方法

Country Status (2)

Country Link
US (1) US7836350B2 (ja)
JP (1) JP4738438B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8443237B2 (en) 2010-05-12 2013-05-14 Hitachi, Ltd. Storage apparatus and method for controlling the same using loopback diagnosis to detect failure
US8850088B2 (en) 2012-04-18 2014-09-30 Hitachi, Ltd. Management system and management method
WO2015107676A1 (ja) * 2014-01-17 2015-07-23 株式会社日立製作所 計算機システムの管理システム及び管理方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7409583B2 (en) * 2002-10-07 2008-08-05 Hitachi, Ltd. Volume and failure management method on a network having a storage device
WO2011121666A1 (ja) * 2010-03-31 2011-10-06 富士通株式会社 マルチクラスタシステム
CN105468484B (zh) * 2014-09-30 2020-07-28 伊姆西Ip控股有限责任公司 用于在存储系统中确定故障位置的方法和装置
US10855791B2 (en) * 2014-11-25 2020-12-01 Netapp, Inc. Clustered storage system path quiescence analysis
CN109428741A (zh) * 2017-08-22 2019-03-05 中兴通讯股份有限公司 一种网络故障的检测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006079355A (ja) * 2004-09-09 2006-03-23 Hitachi Ltd ストレージネットワーク管理サーバ、ストレージネットワーク管理方法、ストレージネットワーク管理用プログラムおよびストレージネットワーク管理システム
JP2006178811A (ja) * 2004-12-24 2006-07-06 Hitachi Ltd ストレージシステム及びストレージシステムのパス制御方法
JP2007140699A (ja) * 2005-11-15 2007-06-07 Hitachi Ltd 計算機システム及びストレージ装置と管理サーバ並びに通信制御方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3198472B2 (ja) 1992-03-31 2001-08-13 株式会社リコー 画像記録方法
US6996741B1 (en) * 2001-11-15 2006-02-07 Xiotech Corporation System and method for redundant communication between redundant controllers
US7181578B1 (en) * 2002-09-12 2007-02-20 Copan Systems, Inc. Method and apparatus for efficient scalable storage management
US7236987B1 (en) * 2003-02-28 2007-06-26 Sun Microsystems Inc. Systems and methods for providing a storage virtualization environment
US7290168B1 (en) * 2003-02-28 2007-10-30 Sun Microsystems, Inc. Systems and methods for providing a multi-path network switch system
JP4646574B2 (ja) 2004-08-30 2011-03-09 株式会社日立製作所 データ処理システム
JP2007148812A (ja) * 2005-11-28 2007-06-14 Hitachi Ltd ストレージシステム及びその負荷分散方法
JP2007257667A (ja) 2007-06-19 2007-10-04 Hitachi Ltd データ処理システム
JP2009110218A (ja) * 2007-10-30 2009-05-21 Fujitsu Ltd 仮想化スイッチおよびそれを用いたコンピュータシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006079355A (ja) * 2004-09-09 2006-03-23 Hitachi Ltd ストレージネットワーク管理サーバ、ストレージネットワーク管理方法、ストレージネットワーク管理用プログラムおよびストレージネットワーク管理システム
JP2006178811A (ja) * 2004-12-24 2006-07-06 Hitachi Ltd ストレージシステム及びストレージシステムのパス制御方法
JP2007140699A (ja) * 2005-11-15 2007-06-07 Hitachi Ltd 計算機システム及びストレージ装置と管理サーバ並びに通信制御方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8443237B2 (en) 2010-05-12 2013-05-14 Hitachi, Ltd. Storage apparatus and method for controlling the same using loopback diagnosis to detect failure
US8850088B2 (en) 2012-04-18 2014-09-30 Hitachi, Ltd. Management system and management method
WO2015107676A1 (ja) * 2014-01-17 2015-07-23 株式会社日立製作所 計算機システムの管理システム及び管理方法

Also Published As

Publication number Publication date
US20090265577A1 (en) 2009-10-22
US7836350B2 (en) 2010-11-16
JP4738438B2 (ja) 2011-08-03

Similar Documents

Publication Publication Date Title
JP4738438B2 (ja) 外部接続ストレージシステムのパス管理及び障害箇所検出方法
US7480780B2 (en) Highly available external storage system
TWI439867B (zh) 動態實體及虛擬多重路徑輸入/輸出
EP1760591B1 (en) System and method of managing access path
US7937617B1 (en) Automatic clusterwide fail-back
US7603507B2 (en) Storage system and method of storage system path control
US8621603B2 (en) Methods and structure for managing visibility of devices in a clustered storage system
US7971089B2 (en) Switching connection of a boot disk to a substitute server and moving the failed server to a server domain pool
US7930511B2 (en) Method and apparatus for management between virtualized machines and virtualized storage systems
US8274881B2 (en) Altering access to a fibre channel fabric
WO2014064756A1 (ja) ストレージプールから実記憶領域を仮想ボリュームへ割り当てる方法及び計算機システム
US20110004708A1 (en) Computer apparatus and path management method
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
US8677067B2 (en) Storage system and method for controlling storage system
US7917672B2 (en) Path maintenance mechanism
US8578073B2 (en) Storage system and control method of storage system
US10560496B2 (en) Automatic registration of devices
US9304875B2 (en) Dynamically tracking logical units moving between input/output ports of a storage area network target
US7975118B2 (en) Storage system and data rearrangement method
JP2010097376A (ja) ストレージシステムおよびリモートコピー制御方法
US8918670B2 (en) Active link verification for failover operations in a storage network
US11755438B2 (en) Automatic failover of a software-defined storage controller to handle input-output operations to and from an assigned namespace on a non-volatile memory device
US8756370B1 (en) Non-disruptive drive firmware upgrades
CN104461951A (zh) 动态管理物理和虚拟多路径i/o的方法及系统
JP5216910B2 (ja) 冗長状態検証装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110426

R150 Certificate of patent or registration of utility model

Ref document number: 4738438

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees