JP3957065B2 - ネットワーク計算機システムおよび管理装置 - Google Patents

ネットワーク計算機システムおよび管理装置 Download PDF

Info

Publication number
JP3957065B2
JP3957065B2 JP2002248595A JP2002248595A JP3957065B2 JP 3957065 B2 JP3957065 B2 JP 3957065B2 JP 2002248595 A JP2002248595 A JP 2002248595A JP 2002248595 A JP2002248595 A JP 2002248595A JP 3957065 B2 JP3957065 B2 JP 3957065B2
Authority
JP
Japan
Prior art keywords
server
transmission path
storage
failure
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002248595A
Other languages
English (en)
Other versions
JP2004088570A (ja
Inventor
信吾 谷野
沢男 岩谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002248595A priority Critical patent/JP3957065B2/ja
Priority to US10/644,000 priority patent/US20040073648A1/en
Publication of JP2004088570A publication Critical patent/JP2004088570A/ja
Application granted granted Critical
Publication of JP3957065B2 publication Critical patent/JP3957065B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer And Data Communications (AREA)
  • Small-Scale Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ネットワークで各装置が接続され、各装置間でアクセスを行うための複数の伝送路を有し、各装置間でデータの授受を行うネットワーク計算機システムおよびネットワークに接続する管理装置に関する。
【0002】
【従来の技術】
サーバが、ストレージにアクセスを行い、前記ストレージとの間でデータを授受し、サーバとネットワークにより接続されたクライアントとの間でデータの授受を行うネットワーク計算機システムにおいては、サービスを停止させないことが要求される。
【0003】
そこで、サービスを停止させない方法の1つとして、サーバがストレージのデータにアクセスするための複数の伝送路を設置する。伝送路は、サーバの周辺装置接続用インタフェース(ホストバスアダプタ:HBA)と、ストレージのインタフェース(接続モジュール:CM)と、ディスク装置またはテープ装置と、これらを接続する接続線から構成される。
【0004】
サーバは、複数の伝送路を使用してストレージのデータにアクセスする。このため、伝送路を構成する装置が故障し、伝送路の1つが使用できない場合でも、別の経路を利用して処理を継続することが可能である。
【0005】
また、サービスを停止させない別の方法として、故障の発生を未然に防止し、また、故障箇所を早期に発見し、故障が発見されたら直ちに必要な処置を取り、その後の解析作業や故障箇所の部品交換などを円滑に行う環境を整える。そのため、ネットワーク計算機システムにおける各装置の装置状態を管理する管理装置を導入する。
【0006】
例えば、SNMP(SimpleNetworkManagementProtocol)を利用した、SNMPマネージャと呼ばれるプログラムを管理装置に、SNMPエージェントと呼ばれるプログラムを管理対象の装置(サーバ、ストレージ、ファイバチャネルスイッチなど)にインストールする。SNMPエージェントの機能が組み込まれたハードウエアにより実現される装置もある。
【0007】
SNMPエージェントにより、装置状態表が各装置で管理され、SNMPマネージャが定期的に、ネットワークを介し、管理対象の装置に装置状態表を要求することで、管理装置にすべての装置状態表が収集され、システム管理者は管理装置に接続された入出力装置において、装置状態を確認できる。また、SNMPエージェントは、自装置における故障の発生を、ネットワークを介し、発生と同時にSNMPマネージャに通知する機能を持つ。
【0008】
この機能により、システム管理者は、管理装置にて常に装置状態を監視し、異常な動作を発見したら、手動で故障箇所を停止することにより、故障の発生を未然に防ぐことができる。また、故障発生が確認された場合、直ちに必要な処置を講ずることができ、たとえサービスの停止時間が発生しても、短くすることができる。
【0009】
以上述べてきたようなネットワーク計算機システムにおける、従来の故障対応処理を図1、図2を用いて説明する。図1は、複数の伝送路により接続されたサーバおよびストレージと管理装置を備えたネットワーク計算機システムの構成例を示す図である。図1のネットワーク計算機システムには、1組のサーバ、ストレージのみ描かれているが、複数のサーバ、ストレージにより構成されることも可能である。
【0010】
図1においては、サーバ1がアプリケーションプログラム4に基づき、ディスク装置10に格納されたデータを処理し、ネットワーク15に接続された図示省略されたクライアントに処理結果を提供する。サーバ1は、アプリケーションプログラム4の実行に際し、ホストバスアダプタ5、接続線16、接続モジュール8、接続線18を経てディスク装置10に至る伝送路11とホストバスアダプタ6、接続線12、CM9、接続線19を経てディスク装置10に至る伝送路12の2つの伝送路を使用する。
【0011】
管理装置13には、SNMPマネージャがインストールされ、サーバ1、ストレージ7には、SNMPエージェントがインストールされる。これにより、サーバ1またはストレージ7で故障が発生した場合、管理装置13に通知される。
【0012】
図2は、図1のネットワーク計算機システムにおける、従来の故障発生時の伝送路制御処理を説明する図である。第1のケースは、アプリケーションプログラム4を実行する際に、故障箇所を含む伝送路からの応答がないことから、サーバ1が故障を検知し、伝送路を使用停止する場合である。
【0013】
いまストレージ7の接続モジュール(CM)8に故障が発生した場合を考える(S21)。サーバ1は、アプリケーションプログラム4に基づき、伝送路11を使用し、書き込み処理または読み出し処理を行うためディスク装置10へアクセスする(S22)。
【0014】
サーバ1は、何度かアクセスを試みた後、ディスク装置10からの応答がないことにより、伝送路11を構成する装置に故障が発生したことを検知する(S23)。ステップS23にて故障を検知したため、サーバ1は、伝送路11の使用を停止する(S24)。サーバ1は、アプリケーションプログラム4の実行に際し、伝送路12も使用するので、ステップS24で伝送路11の使用を停止しても処理を継続することが可能である。
【0015】
第2のケースは、SNMPエージェントの機能により、管理装置13に故障箇所が通知され、システム管理者が故障通知を基に手動で対応する場合を示している。まずストレージ7の接続モジュール(CM)8で故障が発生したとする(S21)。次に、ストレージ7にインストールされたSNMPエージェントの機能により、接続モジュール8にて故障が発生したことが管理装置13に通知される(S25)。
【0016】
管理装置13では、故障が通知されたことを入出力装置14に表示する(S26)。例えば、入出力装置14では、GUI(GraphicalUserInterface)により、故障箇所が赤くなるなどし、システム管理者に警告する。また、警告メッセージをメッセージログに残す、登録されたメールアドレスに対し、メールが送信されるといった方法で注意を喚起する場合もある。
【0017】
システム管理者は、ステップS26で得られた故障通知を確認し、故障箇所によって使用不可となる伝送路が、伝送路11であることをGUIまたはメッセージログから確認できる。そして、システム管理者は、伝送路11を使用するアプリケーションプログラム4の実行の際に、サーバ1が伝送路11を使用することを防ぐために、伝送路11の使用を停止させる(S27)。ステップS27は、例えば、システム管理者が、サーバ1にログインし、アプリケーションプログラム4で使用されるコマンドを入力し、アプリケーションプログラム4が実行される際に使用される伝送路の設定から伝送路11を外す。ステップS27により、サーバ1は、アプリケーションプログラム4の実行に際し、伝送路11の使用を停止する(S28)。
【0018】
また、第1のケースにおけるステップS24、第2のケースにおけるステップS28において伝送路11の使用を停止した後、接続モジュール8の部品交換が完了し、再び伝送路11が使用可能になる(復旧する)場合は、例えば、システム管理者が、サーバ1にログインし、アプリケーションプログラム4に伝送路11の使用開始を命令することにより、サーバ1が伝送路11の使用を再開する。
【0019】
なお、図1において、ストレージ7は、ディスク装置10の代わりにテープ装置で構成することもできる。
【0020】
【発明が解決しようとする課題】
しかしながら、図2における第1のケースでは、ステップS23にて、サーバ1が何度かストレージ7にアクセスを試み、ストレージ7からの応答がないことをもって伝送路11の異常を検知する。このため、伝送路の異常を検知するのに至る間数秒から数分に渡り、データ処理が停止してしまい、サーバの処理性能の低下を招く要因となっていた。
【0021】
また、第2のケースでは、システム管理者が通知された故障情報に気づかない、また故障箇所を把握したとしても、アプリケーションプログラム4が実行される際にどの伝送路が使用されるかについての情報は、サーバ1にアクセスしてみないと把握できない、また直ちにサーバにアクセスする環境にいないなどの理由で、システム管理者が伝送路の使用停止をサーバ1で命令する前に、第1のケースのように故障箇所を含む伝送路に対するアクセスが発生し、応答待ちの状態になり、サーバの性能低下を招くことがあった。
【0022】
また、ステップS24またはステップS28の後、部品の交換が完了し、再び伝送路が使用可能な状態に復旧する場合、システム管理者がその伝送路を使用するサーバに対し、手動で設定の変更を行う必要があり、システム管理者にとって負担の大きいものとなっていた。
【0023】
本発明の目的は、複数の伝送路により接続されたサーバおよびストレージと管理装置を備えたネットワーク計算機システムにおいて、伝送路を構成する装置に故障が発生した場合、故障箇所を含む伝送路を使用するサーバに対し、その伝送路の使用を自動的に停止させ、アプリケーションプログラムを実行する際に、障害箇所を含む伝送路へアクセスすることで発生する、サーバの処理能力低下を避けることにある。また、故障箇所の復旧が完了した場合は、サーバが再びその伝送路を使用するよう自動的に設定し、システム管理者の復旧作業の手間を軽減することにある。
【0024】
【課題を解決するための手段】
上記目的を達成するために、請求項1の発明は、それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、自装置にて発生した故障箇所を、前記管理装置に通知する故障通知機能を備えるネットワーク計算機システムにおいて、管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、前記故障通知機能により故障箇所が通知された場合、通知された故障箇所が前記構成する装置と一致する場合、当該伝送路を使用不可と判定し、前記サーバから前記ストレージにアクセスする際、前記使用不可となる伝送路を使用するサーバに対し、当該伝送路の使用を停止させることを特徴とするネットワーク計算機システムを提供することにある。
【0025】
また、上記目的を達成するために、請求項4の発明は、それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、故障した装置が復旧したことを、前記管理装置に通知する復旧通知機能を備えるネットワーク計算機システムにおいて、前記管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路を構成する装置と対応付けて記録し、前記復旧通知機能により復旧が通知された場合、通知された装置が前記構成する装置と一致する場合、当該伝送路を使用可能と判定し、前記使用可能となる伝送路を使用するアプリケーションプログラムが実行されるサーバに対し、前記アプリケーションプログラムによる当該伝送路の使用を開始させることを特徴とするネットワーク計算機システムを提供することにある。
【0026】
上記請求項1の発明によれば、管理装置に故障が通知されると自動的に故障箇所を含む伝送路が検索され、故障箇所を含む伝送路を使用するアプリケーションプログラムに、その伝送路の使用を停止させ、故障箇所を含む伝送路にアクセスすることで生じるサーバの性能低下を回避することができる。
【0027】
上記請求項4の発明によれば、管理装置に復旧が通知されると自動的に復旧箇所を含む伝送路が検索され、復旧箇所を含む伝送路を使用するアプリケーションプログラムに、その伝送路の使用を開始させることで、システム管理者の手続きの手間を軽減することができる。
【0028】
【発明の実施の形態】
以下、本発明の実施の形態について図面に従って説明する。しかしながら、本発明の技術的範囲はかかる実施の形態によって限定されるものではなく、特許請求の範囲に記載された発明とその均等物に及ぶものである。
【0029】
図3は、本発明にかかる実施の一形態である。ネットワーク15に、複数のクライアント20、サーバ1、21、22、23、ストレージ7、27、28、29、ファイバチャネルスイッチ(FCスイッチ)24、25、26が接続されている。各サーバは、ストレージのデータを処理し、クライアント20に処理結果を提供する。ネットワーク15は、外部からのアクセスを制限するためのファイアウォールが導入された構成にすることも可能である。
【0030】
サーバとストレージを接続する態様として、図3には次の2つが記述されている。領域30には、サーバ1とストレージ7が接続線により直接接続される様子が描かれている。この構成は図1と同じものである。領域31には、3台のサーバ21、22、23と3台のストレージ27、28、29が、3台のファイバチャネルスイッチ24、25、26を介し、接続線により接続される、いわゆるSAN(StorageAreaNetwork)構成が描かれている。
【0031】
SAN構成においては、ファイバチャネルスイッチを介すことによって、サーバとストレージを柔軟な組み合わせで接続することが可能になる。また、SAN構成は、ストレージの効率的な利用、高速な転送速度が得られるメリットがある。
【0032】
管理装置13は、入出力装置14(モニタ、キーボード、マウスなど)と接続され、またネットワーク15に接続される。本実施の形態においては、管理装置13にSNMPマネージャが、サーバ1、21、22、23、ファイバチャネルスイッチ24、25、26、ストレージ27、28、29には、SNMPエージェントがインストールされる。
【0033】
次に図3における管理装置13とサーバ、ストレージ、ファイバチャネルスイッチまたはクライアントなどの装置がどのように機能するのかについて説明する。
【0034】
図4は、管理装置とサーバ、ストレージ、ファイバチャネルスイッチまたはクライアントなどの管理対象の装置におけるの機能を示す関係図である。サーバ、ストレージまたはファイバチャネルスイッチなどの装置には、エージェントプログラム32がインストールされている。
【0035】
エージェントプログラム32の機能には、管理装置13からの要求に対し、ネットワークを介し装置情報を送信する装置情報送信機能と、故障箇所または復旧箇所を、ネットワークを介し管理装置13に通知する故障復旧通知機能と、自装置の装置情報33を管理し、内容に変化があれば、装置情報33を更新する装置情報更新機能がある。
【0036】
装置情報33の具体例は後述するが、例えばサーバであれば、サーバの動作状態、サーバで実行されるアプリケーションプログラム、使用される伝送路などが含まれる。
【0037】
管理装置13のマネージャプログラム34の機能には、装置情報取得機能と故障復旧通知受信機能がある。装置情報取得機能は、エージェントプログラムがインストールされた装置に対し、装置情報33を送信するよう管理装置13が指令し、各装置からの情報を装置情報35として保存するものである。故障復旧通知受信機能は、故障または復旧通知を受信したら、管理装置13が伝送路管理プログラム36を起動し、適切な処理を行わせるものである。
【0038】
伝送路接続情報の具体例については後述するが、サーバで実行されるアプリケーションプログラム、そのアプリケーションプログラムの実行に際し使用される伝送路、その伝送路を構成する装置を情報として含んでいる。
【0039】
伝送路管理プログラム36は、故障または復旧が検知された場合に管理装置13により起動され、装置情報35から伝送路接続情報37を更新する伝送路接続情報更新機能と、故障または復旧を検知した場合に、関係する伝送路を使用するサーバに、伝送路の使用停止または開始を実行させる伝送路開始停止命令機能を備える。
【0040】
サーバで作業を行うには、有効な利用者とそのパスワードを入力し、サーバにログインする必要がある。管理装置13は、伝送路管理プログラム36を実行する際、サーバにログインするのに必要な情報であるログイン情報38を使用し、自動処理を行う。
【0041】
なお、図4において、マネージャプログラムとエージェントプログラムでネットワークを介した通信が行われる際に使用されるプロトコルは、例えば、telnet、HTTP(HyperTextTransferProtocol)、SNMPなどがある。
【0042】
また、マネージャプログラム34と伝送路管理プログラム36を1つのプログラムに統合して実現することも可能である。
【0043】
さらに、マネージャプログラム34と伝送路管理プログラム36をサーバにインストールすることにより、専用の管理装置13を設けない構成にすることも可能である。
【0044】
図4においては、クライアント20が管理対象の装置に含まれないが、クライアント20を管理対象の装置とし、エージェントプログラム32をインストールすることも可能である。
【0045】
図4の機能により、管理装置13に収集された装置情報35を基に、伝送路を構成する装置およびその状態を伝送路接続情報として管理し、管理装置13は、故障または復旧を検知した場合、影響される伝送路を使用するサーバに対する適切な処理を行うことができる。
【0046】
次に図5から図8にて、本発明における故障時または復旧時の伝送路制御処理を説明する。
【0047】
図5は、本発明に従う第1の伝送路制御処理である。サーバとストレージが直接接続された構成例である図1を参照しながら、図5を説明する。第1の伝送路制御処理は、ストレージ7の接続モジュール8に故障が発生した場合、エージェントプログラム32の故障復旧通知機能により、管理装置13にて故障箇所を受信し、サーバ1に伝送路11の使用を停止させる例である。
【0048】
まず管理装置13では、装置情報35を基に伝送路接続情報が作成される(S41)。サーバ1とストレージ7に関する伝送路接続情報は、管理装置13に収集されるサーバ1、およびストレージ7に関する装置情報33から作成することができる。
【0049】
次に、ストレージ7のインタフェースである接続モジュール8にて故障が発生したものとする(S21)。ストレージ7は、エージェントプログラム32の故障通知機能を有しており、故障箇所が管理装置13に通知される(S25)。管理装置13は、通知された故障箇所を含む伝送路がないか、伝送路接続情報37を検索する(S42)。これは、伝送路を構成する装置と通知された故障箇所とを比較し、一致するものがあるか判定すればよい。今回は、伝送路11が該当する。
【0050】
ステップS42で、故障箇所を含む伝送路があれば、管理装置13は、その伝送路を使用するアプリケーションプログラムを実行するサーバに対し、故障箇所を含む伝送路の使用停止を命令する(S43)。管理装置13は、伝送路接続情報37から、伝送路11を使用するアプリケーションプログラムがサーバ1で実行されることがわかる。サーバ1のログイン情報38により、そのサーバに自動ログインし、サーバ1がアプリケーションプログラム4を実行する際に伝送路11を使用しないようにする。
【0051】
続いて、管理装置13は、伝送路接続情報37を更新する(S44)。これは、故障通知を受け、伝送路11の状態を使用不可と変更するものである。サーバ1は、ステップS43の停止命令を受け、伝送路11の使用を停止する(S45)。
【0052】
なお、第1の伝送路制御処理の故障箇所は、管理装置に通知可能な箇所であれば接続モジュール8に限らない。具体的には、サーバのホストバスアダプタ、ディスク装置でも構わない。SAN構成であれば、ファイバチャネルスイッチでも構わない。また、伝送路11において、接続ケーブルが抜けていることをサーバ1もしくはストレージ7が検知でき、管理装置に通知することができるのであれば、故障箇所は接続ケーブルであってもよい。また、ストレージ7は、テープ装置であってもよい。
【0053】
第1の伝送路制御処理により、エージェントプログラム32の故障復旧通知機能により、管理装置にて故障の発生を検知し、サーバがアプリケーションプログラムを実行することで、故障箇所を含む伝送路を使用したアクセスが発生する前に、そのサーバに対し、故障箇所を含む伝送路の使用を自動停止させることができる。これにより、サーバが故障箇所を含む伝送路からの応答が無いことを待つことで生じる、サーバの処理性能低下を防ぐことができる。また、伝送路の停止が自動で行われるため、システム管理者は、故障解析や、故障箇所の部品交換などに最初から注力でき、故障箇所に対する迅速な処置を行うことができる。
【0054】
図6は、本発明に従う第2の伝送路制御処理である。管理装置13に故障箇所を通知することができないストレージの接続モジュールにて故障が発生した場合、管理装置13が定期的に収集する装置情報35から故障箇所を検知し、故障箇所を含む伝送路を使用するサーバに、その伝送路の使用を停止させる例である。図5における説明同様、図1のネットワーク計算機システムを参照しながら、図6を説明する。
【0055】
まず管理装置13では、装置情報35を基に伝送路接続情報37が作成される(S41)。次にストレージ7にて接続モジュール8が故障したとする(S21)。ステップS21を受けて、エージェントプログラム32の装置情報更新機能により、ストレージの装置情報33では、接続モジュール8の状態が異常であることが記録される。管理装置13は、管理対象の装置から、定期的に装置情報を獲得する(S51)。ステップS51の一環として管理装置13からの要求に対し、ストレージ7は、ストレージ装置情報33を応答する(S52)。
【0056】
管理装置13は、受信した装置情報33にて装置状態が異常である箇所を故障箇所と検知する(S53)。受信したストレージ装置情報33から、接続モジュール8の状態が異常であることがわかり、管理装置13は、接続モジュール8の故障を検知する。
【0057】
その後の処理は、第一の故障対応処理の例と同じであり、省略する。なお、第2の伝送路制御処理は、エージェントプログラムがインストールされた装置であれば適用が可能であり、第1の伝送路制御処理と同じく、故障箇所は接続モジュール8に限定されるものではない。
【0058】
第2の伝送路制御は、例えば、ストレージ7とネットワーク15を接続するケーブルが外れており、故障を管理装置13に通知できない場合またはエージェントプログラム32の故障復旧通知機能がうまく稼動しなかった場合などに適用される。そのような場合でも、管理装置13にて故障の発生を検知し、その後自動的に故障箇所を含む伝送路を使用するサーバに対し、故障箇所を含む伝送路の使用を停止させることができる。
【0059】
これにより、サーバでアプリケーションプログラムを実行する際に、故障箇所を含む伝送路を使用し、データにアクセスすることで生じるサーバの処理性能低下を防ぐことができる。また、伝送路の停止が自動で行われるため、システム管理者は、故障解析や、故障箇所の部品交換などに最初から注力でき、故障箇所に対する迅速な処置を行うことができる。
【0060】
図7は、本発明に従う第3の伝送路制御処理である。第1、第2の制御処理と異なり、故障箇所の部品交換が完了し、復旧する際の制御である。第3の伝送路制御処理では、故障していた接続モジュールの交換が完了し、伝送路が再び使用可能な状態に復旧する。エージェントプログラム32により、管理装置13に復旧が通知され、故障前、復旧箇所にかかる伝送路を使用していたサーバに、自動的に、その復旧した伝送路の使用を開始させる例である。図5における説明同様、図1のネットワーク計算機システムを参照し、図7を説明する。
【0061】
まず、ストレージ7にて故障した接続モジュール8の交換が完了したとする(S61)。エージェントプログラム32は、接続モジュール8が復旧したことを管理装置13に通知する(S62)。管理装置13は、復旧通知を受信し、伝送路接続情報37を更新する(S44)。そして、以前の伝送路接続情報37と比較し、伝送路構成が変更されていないか判定する(S63)。ステップS63を行う理由は、接続状態が変更されている場合は、ネットワーク計算機システムの構成が変更されたことを意味し、そのまま伝送路の使用を開始することによって、アプリケーションプログラムが誤ったデータにアクセスすることを防ぐためである。
【0062】
次に、管理装置13は、通知された復旧箇所を含む伝送路がないか、伝送路接続情報37を検索する(S42)。これは、伝送路接続情報37から、伝送路を構成する装置と通知された復旧箇所を比較し、一致するものがあるかを判定すればよい。今回、接続モジュール8が含まれる伝送路11が該当する。
【0063】
ステップS42にて、復旧箇所を含む伝送路があれば、その伝送路を使用するサーバに伝送路の使用を開始させる(S64)。ステップS64は、第1の伝送路制御処理におけるステップS43と同様に行うことが可能である。ステップS43との違いは、伝送路の使用開始を命令する点だけである。そして、サーバ1は、ステップS63でされた開始命令を受け、アプリケーションプログラム4を実行する際、伝送路11を使用して処理を行う(S65)。
【0064】
なお第3の伝送路制御処理は、エージェントプログラム32の故障復旧通知機能を備える装置であれば適用が可能であり、復旧箇所は接続モジュール8に限られない。例えば、サーバのホストバスアダプタや、ディスク装置でもよい。また、SAN構成であれば、ファイバチャネルスイッチでも構わない。
【0065】
第3の伝送路制御処理により、エージェントプログラム32の故障復旧通知機能を備える装置であれば、管理装置13で復旧を検知できる。故障前とネットワーク計算機システムの接続状態に変更がなければ、復旧箇所にかかる伝送路が使用されていたサーバに、自動的に、その復旧した伝送路の使用を開始させることができる。これにより、システム管理者が復旧作業の際にその都度行っていた処理を自動化し、システム管理者の負荷を軽減することが可能である。
【0066】
図8は、本発明における第4の伝送路制御処理である。第3の伝送路制御処理と同じく、故障箇所が復旧する際の制御である。第4の伝送路制御処理では、管理装置13に復旧箇所を通知することができないストレージにて、故障していた接続モジュールの交換が完了した場合、管理装置13が定期的に収集する装置情報35から復旧箇所を検知する。そして、故障前、故障箇所を含む伝送路を使用していたサーバに、その伝送路の使用を開始させる例である。図5における説明同様、図1のネットワーク計算機システムを参照しながら、図8を説明する。
【0067】
まず、ストレージ7にて故障していた接続モジュール8の交換が完了したとする(S61)。ステップS61により、エージェントプログラム32の装置状態更新機能により、ストレージ装置情報33の接続モジュール8の状態が、異常から正常に更新される。管理装置13は、管理対象の装置に対し、定期的に装置情報を獲得する(S51)。ステップS51の一環として管理装置13からの要求に対し、ストレージ7はストレージ装置情報33を応答する(S52)。
【0068】
管理装置13は、得られた装置情報33から装置情報35を更新し、装置情報35を基に伝送路接続情報を更新する(S44)。そして、以前の伝送路接続情報37と比較し、伝送路構成が変更されていないか判定する(S63)。
【0069】
ステップS63で、伝送路構成に変更がなければ、以前の装置情報35と比較し、装置状態が異常から正常に変化した装置を復旧箇所と判定する(S71)。ステップS71では、ステップS61により、接続モジュール8の状態が変化しており、復旧箇所と判定される。その後の処理は、第3の伝送路制御処理と同じであるので省略する。
【0070】
第4の伝送路制御は、例えば、ストレージ7とネットワーク15を接続するケーブルが外れており、故障を管理装置13に通知できない場合またはエージェントプログラム32の故障復旧通知機能がうまく稼動しなかった場合などに適用される。そのような場合でも、管理装置13にて復旧の発生を検知し、その後自動的に復旧箇所を含む伝送路を使用するサーバに対し、復旧箇所を含む伝送路の使用を停止させることができる。
【0071】
第4の伝送路制御処理により、システム管理者が復旧作業の際にその都度行っていた処理を自動化し、システム管理者の負荷を軽減することが可能である。
【0072】
以上で、本発明にかかる実施の形態と、本発明における故障時または復旧時の伝送路制御処理について述べたが、続いて、実施の形態にかかる装置の構成を説明する。
【0073】
図9から図12は、それぞれ管理装置、サーバ、ストレージそしてファイバチャネルスイッチの構成例を示す図である。
【0074】
図9は、管理装置の構成例を示す図である。管理装置13は、演算処理を行うCPU91と、演算データなどを格納するメモリ92と、ネットワーク15へ接続するためのネットワークインタフェース94と外部の入出力装置14へ接続するための入出力部93とデータ、プログラムを記録する記録装置95を備えている。
【0075】
記録装置95には、オペレーティングシステム96と、管理対象の装置から収集される装置情報35と、マネージャプログラム34と、伝送路の構成情報を含む伝送路接続情報37と、伝送路管理プログラム34とその他のデータ97が格納される。伝送路接続情報37と装置情報35の具体例については後述する。
【0076】
図10は、サーバの構成例を示す図である。サーバは、演算処理を行うCPU91と、演算データなどを格納するメモリ92と、ネットワーク15へ接続するためのネットワークインタフェース94とストレージまたはファイバチャネルスイッチに接続するためのホストバスアダプタ98とデータ、プログラムを記録する記録装置95を備えている。
【0077】
記録装置95には、オペレーティングシステム96と、サーバの装置情報33と、エージェントプログラム32とその他のデータ97が格納される。
【0078】
クライアント20は、図10のサーバと同じ構成である。ただし、特に周辺装置と接続する必要がなければ、ホストバスアダプタ98を備えている必要はない。また、システム管理の方針で、クライアントを管理対象にしないのであれば、エージェントプログラム32、装置情報33を備えている必要はない。
【0079】
図11は、ストレージの構成例を示す図である。ストレージは、演算処理を行うCPU91と、演算データなどを格納するメモリ92と、ネットワーク15へ接続するためのネットワークインタフェース94サーバまたはファイバチャネルスイッチに接続するための接続モジュール99とを備えた制御装置100と、制御装置100により制御されるディスク装置101を有している。
【0080】
メモリ92には、ストレージ全体を制御するための制御プログラム102、装置情報管理プログラム32、装置情報33、その他のデータ97が含まれる。図11でメモリ92に格納される機能は、プログラムとしてではなく、ICチップなどの装置として実現される構成にすることもできる。また、ストレージとして、ディスク装置101をテープ装置で構成することも可能である。
【0081】
図12は、ファイバチャネルスイッチの構成例を示す図である。ファイバチャネルスイッチは、演算処理を行うCPU91と、演算データなどを格納するメモリ92と、ネットワーク15へ接続するためのネットワークインタフェース94とを備えた制御装置103と、制御装置103により制御されるポート104を有している。ポート104は、他のファイバチャネルスイッチのポート、サーバ、またはストレージと接続される。
【0082】
メモリ92には、ファイバチャネルスイッチを制御するための制御プログラム105と、エージェントプログラム32と、装置情報33とその他のデータ97が含まれる。図11でメモリ92に格納される機能は、ICチップなどの装置として実現される構成にすることもできる。
【0083】
以上において、本発明における故障時または復旧時の伝送路制御処理、実施の形態における各装置の構成について説明した。以下、装置情報、伝送路接続情報、伝送路接続情報更新処理を、図13に示したSAN構成に、第1の伝送路制御処理を適用しながら、具体的に説明する。
【0084】
図13は、第1の伝送路制御処理を適用するネットワーク計算機システムの別の構成例を示している。図13は、図3のネットワーク計算機システムの領域31の詳細を示した図であり、サーバ21、22、23、ファイバチャネルスイッチ24、25、26、ストレージ27、28、29がそれぞれ、ネットワーク15に接続されている。
【0085】
各サーバでは、ストレージから得たデータを、サーバ上で実行されるアプリケーションプログラムが処理し、図示省略されたクライアントに処理結果を提供する。サーバ21、22、23、ストレージ24、25、26、ファイバチャネルスイッチ27、28、29は、エージェントプログラム32がインストールされ、装置情報送信機能、故障復旧通知機能を備えている。管理装置13には、マネージャプログラム34がインストールされる。
【0086】
サーバ21は、アプリケーションプログラム131を実行する際、2つの伝送路165、166を使用する。伝送路165は、サーバ21のホストバスアダプタ(HBA)134、ファイバチャネルスイッチ(FCスイッチ)24のポート141、ポート143、ストレージ27の接続モジュール(CM)155を経てディスク装置162に至る。伝送路166は、サーバ21のHBA135、FCスイッチ25のポート145、ポート148、ストレージ27のCM156を経てディスク装置162に至る。
【0087】
サーバ22では、アプリケーションプログラム132が、3つの伝送路167、168、169を使用する。伝送路167は、サーバ22のHBA136、FCスイッチ24のポート142、ポート144、ストレージ28のCM157を経てディスク装置163に至る。伝送路168は、サーバ22のHBA137、FCスイッチ25のポート146、ポート149、ストレージ28のCM158を経てディスク装置163に至る。伝送路169は、サーバ22のHBA138、FCスイッチ26のポート151、ポート153、ストレージ28のCM159を経てディスク装置163に至る。
【0088】
サーバ23では、アプリケーションプログラム133が、2つの伝送路170、171を使用する。伝送路170は、サーバ23のホストバスアダプタ139、FCスイッチ25のポート147、ポート150、ストレージ29の接続モジュールCM160を経てディスク装置164に至る。伝送路171は、サーバ23のHBA140、FCスイッチ26のポート152、ポート154、ストレージ29のCM161を経てディスク装置164に至る。
【0089】
図14から図16は、サーバに格納される装置情報33の例を示す図である。
【0090】
図14は、サーバ21に格納される装置情報の例である。サーバの動作状態を示す機器動作状態201、サーバで実行されるアプリケーションプログラムを示す構成アプリケーション202、構成アプリケーションを実行する際、サーバが使用する伝送路である使用伝送路203、使用伝送路が使用可能な状態にあるかを示す伝送路動作状態204、使用伝送路203にて使用されるホストバスアダプタを示す使用HBA205、使用HBA205の状態を示すHBA状態206、使用HBA205が最終的に接続されるターゲットストレージ207、ターゲットストレージ207との接続に使用される接続モジュール208、ターゲットストレージ207におけるアクセス領域を示す論理番号である論理アドレス(LUN)209を有している。
【0091】
論理アドレス(LUN)は、仮想的なディスクに対して振られる番号のことである。例えば物理的に1本のハードディスクしかないストレージ装置であっても、サーバにインストールされたプログラムまたはストレージのコントローラによって、仮想的にハードディスクを分割し、多数のハードディスクを備えたディスク装置であるかのようにサーバに見せることができる。論理アドレスは、この場合の分割された仮想的なハードディスクにアクセスするために使用される番号である。論理アドレスを用いることで、ディスク装置を柔軟に使用することが可能となる。
【0092】
図14では、サーバに故障が発生しておらず、機器動作状態は正常であることがわかる。サーバ21での構成アプリケーションは、図13よりアプリ131である。アプリ131は伝送路165、166を使用し、伝送路165は、HBA134を、伝送路166は、HBA135をそれぞれ使用する。
【0093】
サーバ21は、HBAの接続先であるストレージの情報を獲得し、それをターゲットストレージ207、接続モジュール208、ターゲット論理アドレス209に設定する。図14から、HBA134は、ストレージ27の接続モジュールCM155に接続され、LUN0から7までアクセス可能であることが読み取れる。同様に、HBA135は、ストレージ27の接続モジュールCM156に接続され、LUN0から7までアクセス可能であることがわかる。
【0094】
図15は、サーバ22に格納される装置情報の例である。装置情報の項目は、サーバ21と同じであり、細かい説明は省略する。サーバ21では、アプリ132の実行に際し、3つの伝送路167、168、169が使用されることなどがわかる。
【0095】
図16は、サーバ23に格納される装置情報の例である。装置情報の項目は、サーバ21と同じであり、細かい説明は省略する。サーバ22では、アプリ133の実行に際し、2つの伝送路170、171が使用されることなどがわかる。
【0096】
図17から図19は、ファイバチャネルスイッチに格納される装置情報の例を示す図である。
【0097】
図17は、ファイバチャネルスイッチスイッチ24に格納される装置情報の例を示す図である。ファイバチャネルスイッチ24の装置情報として、ファイバチャネルスイッチの動作状態を示す機器動作状態301、ポートの動作状態を示すポート動作状態302、ポートの接続先を示すポート接続先情報303、ポートのグループ分けを示す構成ゾーニング情報304、ゾーン内のポートの組を示すポートペア305を有している。
【0098】
ゾーニングとは、1つのファイバチャネルスイッチに複数のポートがある場合、複数のポートをまとめてグループ化するものである。ゾーニングのメリットは、異なるゾーンに属するポートへのアクセスを制限できることである。この機能により、サーバが他ゾーンのストレージに誤ってアクセスすることを防止でき、複数台のファイバチャネルスイッチを用意することなく1台のファイバチャネルスイッチで、ゾーンごとの独立した用途に応じ、サーバ、ストレージを使用することが可能となる。
【0099】
また、ファイバチャネルスイッチは、サーバ、ストレージまたは他のファイバチャネルスイッチと接続される場合、接続線を使用し、接続先である相手のインタフェースまたはポート情報を知ることが可能であり、ポート接続先情報はそのようにして得られる。
【0100】
図17では、ファイバチャネルスイッチ21に故障箇所はなく、機器動作状態301は正常である。ポート動作状態302は、各ポートとも正常である。ポート141はサーバ21のHBA134と、ポート142はサーバ22のHBA136と、ポート143はストレージ27のCM155と、ポート144はストレージ28のCM157と接続されることがわかる。構成ゾーニング情報304から、ゾーン1が構成されており、ゾーン1には、ポート141とポート143のペアと、ポート142とポート144のペアが存在する。
【0101】
図18は、ファイバチャネルスイッチ25に格納される装置情報の例を示す図である。装置情報の項目は、ファイバチャネルスイッチ24と同じであり、細かい説明は省略する。ファイバチャネルスイッチ25には、ゾーン2に3つのポートペアが存在し、サーバ22のホストバスアダプタとストレージ28の接続モジュール間の接続を仲介していることがわかる。
【0102】
図19は、ファイバチャネルスイッチ26に格納される装置情報の例を示す図である。装置情報の項目は、ファイバチャネルスイッチ24と同じであり、細かい説明は省略する。ファイバチャネルスイッチ26には、ゾーン3に2つのポートペアが存在し、サーバ23のホストバスアダプタとストレージ29の接続モジュール間の接続を仲介していることがわかる。
【0103】
図20から図22は、ストレージに格納される装置情報の例を示す図である。
【0104】
図20は、ストレージ27に格納される装置情報の例を示す図である。ストレージの動作状態を示す機器動作状態401、ストレージで設定可能な論理アドレスを示す構成論理アドレス402、ストレージに備えられたインタフェースを示す構成接続モジュール403、構成接続モジュール403の動作状態を示す動作状態404、構成接続モジュール403に対する接続を許可するHBAを示すアクセス許可HBA405、構成論理アドレス402のうち構成接続モジュールがどこまでアクセス可能かを示すアクセス許可論理アドレス406を有している。
【0105】
構成論理アドレス402は、制御装置100(図11)が設定可能な最大論理アドレス数であり、アクセス許可論理アドレス406は、接続モジュールごとに構成論理アドレス402を超えない範囲で設定される論理アドレス数である。また、アクセス許可HBA405に指定されたホストバスアダプタ以外をその接続モジュールに接続しても、ストレージのデータにアクセスすることはできない。
【0106】
図20では、ストレージ27に故障箇所はなく、機器動作状態401は正常である。構成論理アドレス402は、LUN0からLUN127となっている。ストレージ27には、接続モジュールCM155とCM156があることがわかる。CM155の動作状態404は正常である。CM155のアクセス許可HBA405はHBA134で、これ以外のHBAと接続してもストレージのデータにアクセスすることはできない。アクセス許可論理アドレス406は、LUN0からLUN63である。
【0107】
CM155の接続先であるサーバ21で設定されているターゲット論理アドレス209とストレージ27で設定されているアクセス許可論理アドレス406の共通部分(論理積)が、実際にアクセスできる論理アドレスとなる。
【0108】
同様に、CM156の動作状態404は正常である。CM156のアクセス許可HBA405はHBA135で、アクセス許可論理アドレス406は、LUN0からLUN31であることがわかる。
【0109】
図21は、ストレージ28に格納される装置情報の例を示す図である。装置情報の項目は、ストレージ27と同じであり、細かい説明は省略する。ストレージ27には、3つの接続モジュールが存在し、それぞれサーバ22と接続されることがわかる。
【0110】
図22は、ストレージ29に格納される装置情報の例を示す図である。装置情報の項目は、ストレージ27と同じであり、細かい説明は省略する。ストレージ27には、2つの接続モジュールが存在し、それぞれサーバ23と接続されることがわかる。
【0111】
管理装置13は、マネージャプログラムの機能により、図14から図22に示される装置情報33を収集し、まとめて装置情報35として保存し、伝送路接続情報37を作成する。そこで、次に、装置情報35から伝送路接続情報37を作成する処理である伝送路接続情報更新処理を説明する。
【0112】
図23は、装置情報35から伝送路接続情報37を作成する伝送路接続情報更新処理を示すフローチャートである。
【0113】
まず、サーバ装置情報から、サーバで実行されるアプリケーションプログラムを特定する(S80)。サーバ装置情報の構成アプリケーション202を抜き出せばよい。次に、ステップS80で得られるアプリケーションプログラムが実行される際、サーバが使用する伝送路を特定する(S81)。サーバ装置情報33の使用伝送路203を抜き出せばよい。
【0114】
次に、ステップS81で得られる伝送路で使用されるホストバスアダプタを特定する(S82)。サーバ装置情報の使用HBA205を抜き出せばよい。ステップS82で得られるHBAが接続されるストレージと、使用されるストレージ接続モジュールを特定する(S83)。サーバ装置情報から、ターゲットストレージ207と接続モジュール208を抜き出せばよい。
【0115】
次にサーバとストレージの接続にファイバチャネルスイッチが使用されているか判定する(S84)。これは、ファイバチャネルスイッチの装置情報から、ステップS82で得られるホストバスアダプタまたはステップS83で得られる接続モジュールに接続先が一致するポートがないかを検索すればよい。
【0116】
ステップS84で、一致するポートが存在すれば、ホストバスアダプタと接続されたFCスイッチのポートを特定する(S85)。ステップS85で、サーバとファイバチャネルスイッチの接続状態がわかる。次に、接続モジュールと接続されたFCスイッチのポートを特定する(S86)。ステップS86で、ストレージとファイバチャネルスイッチの接続状態がわかる。
【0117】
そして、ステップS85とステップS86で得られたポートを結ぶ経路を探す(S87)。もし、2つのポートが同じスイッチ上にあるならば、スイッチ構成情報のポートペア305で一致するものを探す。2つのポートが違うスイッチ上にあるならば、スイッチ同士を接続する経路を探し出す。どちらの場合も、ポートを接続する経路が見つからなければ伝送路としては分断されていることになり、伝送路にはならない。
【0118】
次に、ホストバスアダプタからストレージモジュールまでの接続状況から、伝送路を構成する装置を特定する(S88)。ステップS84にて、サーバとストレージがFCスイッチを仲介せずに接続される場合も、ステップS88を処理する。
【0119】
ストレージ接続モジュールがアクセスできる装置に制限があれば、アクセス可能な装置を特定する(S89)。ステップS89は、サーバの装置情報33のターゲット論理アドレス209とストレージ27の装置情報33のアクセス許可論理アドレス406の共通部分(論理積)を抜き出せばよい。
【0120】
以上の処理をサーバで実行されるアプリケーションが使用するすべての伝送路に対して行えば、伝送路接続情報が完成する。
【0121】
続いて、伝送路接続情報の具体例を説明する。
【0122】
図24は、図14から図22を用いて、図23の伝送路接続情報更新処理により作成された伝送路接続情報の例である。
【0123】
まず、図14のサーバ21の装置情報33から、サーバ21でアプリ131が実行され、その実行に際し、サーバ21は、伝送路165、166の2つを使うことがわかる(図23ステップS80、S81)。ここでは、伝送路165に着目する。伝送路165で使用されるホストバスアダプタは、図14の使用HBA205からHBA134とわかる(ステップS82)。そして、図14のターゲットストレージ207、接続モジュール208から、HBA134が、ストレージ27の接続モジュール155に接続されていることがわかる(ステップS83)。
【0124】
次に、サーバとストレージの接続にファイバチャネルスイッチが使用されているか判定する(ステップS84)。ファイバチャネルスイッチの装置情報を検索すると、図17のファイバチャネルスイッチ情報から、ファイバチャネルスイッチ24のポート141が、ホストバスアダプタ134と、ポート143が接続モジュール155と接続されていることがわかる(ステップS85、S86)。
【0125】
また、図17のファイバチャネルスイッチの装置情報のポートペア情報305からポート141とポート143がペアであることがわかり、ポートを結ぶ経路が見つかった(ステップS87)。
【0126】
以上により、伝送路165が、ホストバスアダプタ134から、ファイバチャネルスイッチ24のポート141、ポート143を経て、ストレージ27の接続モジュール155に至る接続状態であることがわかり、図24において、伝送路構成501に判明した接続状態が設定される(ステップS88)。
【0127】
次に、図14のホストバスアダプタ134に対し設定されたターゲット論理アドレス209と、図20の接続モジュール155に対し設定されたアクセス許可論理アドレス406の共通部分を取り、LUN0から7がアクセス可能論理アドレス502に設定される(ステップS89)。図24の伝送路接続情報には他に、伝送路状態204、使用HBA205が記録されている。
【0128】
伝送路165以外の伝送路に関しても、同様に図23の伝送路接続情報更新処理を行い、図24が完成される。
【0129】
続いて、図25から図28にて、図13に示したSAN構成にて故障が発生した場合の例を、第1の伝送路制御処理を適用しながら、具体的に説明する。
【0130】
図25は、図13のファイバチャネルスイッチ26全体が使用不可となる場合で、伝送路169、171が使用できなくなるため、この伝送路を使用するサーバ22、23に対し、それぞれの伝送路の使用を停止させる例である。図25の説明にあたり、図5のサーバ1をサーバ22、23と、ストレージ7をファイバチャネルスイッチ26と読み替えて参照する。また、図15、16、24も合わせて参照する。
【0131】
まず、ファイバチャネルスイッチ26のエージェントプログラムの故障復旧通知機能により、故障が発生したことが管理装置13に通知される(図5、S25)。管理装置13は故障箇所にかかる伝送路を検索する(S42)。図24の伝送路接続情報の伝送路構成502から、ファイバチャネルスイッチ26が含まれる伝送路は、伝送路169、171の2つであることがわかる。
【0132】
次に、当該伝送路を使用するサーバに停止命令を発行する(S43)。伝送路169を使用するアプリケーションは、図15の使用伝送路203からアプリ132であり、伝送路171を使用するアプリケーションは、図16の使用伝送路203からアプリ133とわかる。管理装置13は、アプリ132、アプリ133が実行されるサーバを装置情報から読み取り、ログイン情報38を利用し、サーバ22にログインし、伝送路169の使用を停止させる。同様に、サーバ23にログインし、伝送路171の使用を停止させる。
【0133】
図25の適用例により、SAN構成において、1箇所の故障が複数の伝送路に影響を与える場合であっても、管理装置13は故障を検知し、その後自動的に故障箇所を含む伝送路を使用するサーバに対し、その伝送路の使用を停止させることができる。これにより、サーバが故障箇所を含む伝送路からの応答が無いことを待つことで生じる、サーバの処理性能低下を防ぐことができる。
【0134】
図26は、サーバ22のHBA137にて故障が発生し、伝送路169が使用できなくなるため、この伝送路を使用するサーバ22に対し、伝送路169の使用を停止させる例である。図26の説明にあたり、図5のサーバ1、ストレージ7を共にサーバ22と読み替えて参照する。また、図15、24も合わせて参照する。
【0135】
まず、サーバ22のエージェントプログラム32の故障復旧通知機能により、HBA137にて故障が発生したことが管理装置13に通知される(図5、S25)。管理装置13は故障箇所にかかる伝送路を検索する(S42)。図24の伝送路接続情報の伝送路構成502から、HBA137が含まれる伝送路は、伝送路168であることがわかる。
【0136】
次に、伝送路168を使用するサーバに停止命令を発行する(S43)。図15から、伝送路168を使用するアプリケーションは、アプリ132で、サーバ22で実行されるとわかる。そこで、管理装置13は、サーバ22のログイン情報38を利用し、サーバ22にログインし、伝送路168の使用を停止させる。
【0137】
図26の適用例により、SAN構成において、サーバのホストバスアダプタが故障した場合でも、管理装置13は故障を検知し、その後自動的に故障箇所を含む伝送路を使用するサーバに対し、その伝送路の使用を停止させることができる。これにより、サーバが故障箇所を含む伝送路からの応答が無いことを待つことで生じる、サーバの処理性能低下を防ぐことができる。
【0138】
図27は、ファイバチャネルスイッチ24のポート143にて故障が発生し、伝送路165が使用できなくなつため、この伝送路を使用するサーバ21に対し、伝送路165の使用を停止させる例である。図27の説明にあたり、図5のサーバ1をサーバ18と、ストレージ7をファイバチャネルスイッチ21と読み替えて参照する。また、図14、24を合わせて説明する。
【0139】
まず、ファイバチャネルスイッチ24のエージェントプログラム32の故障復旧通知機能により、ポート143にて故障が発生したことが管理装置13に通知される(図5、S25)。管理装置13は故障箇所にかかる伝送路を検索する(S42)。図24の伝送路接続情報の伝送路構成502から、ファイバチャネルスイッチ24のポート143が含まれる伝送路は、伝送路165であることがわかる。
【0140】
次に、伝送路165を使用するサーバに停止命令を発行する(S43)。伝送路165を使用するアプリケーションは、図14からアプリ131で、サーバ21で実行されることがわかる。管理装置13は、サーバ21のログイン情報38を利用し、サーバ21にログインし、伝送路165の使用を停止させる。
【0141】
図27の適用例により、SAN構成において、ファイバチャネルスイッチのポートが故障した場合でも、管理装置13は故障を検知し、その後自動的に故障箇所を含む伝送路を使用するサーバに対し、その伝送路の使用を停止させることができる。これにより、サーバが故障箇所を含む伝送路からの応答が無いことを待つことで生じる、サーバの処理性能低下を防ぐことができる。
【0142】
図28は、ストレージ29のCM1160にて故障が発生し、伝送路170が使用できなくなったため、この伝送路を使用する23に対し、伝送路170の使用を停止させる例である。図28の説明にあたり、図5のサーバ1をサーバ20と、ストレージ7をストレージ29と読み替えて参照する。また、図16、24を合わせて参照する。
【0143】
まず、ストレージ29のエージェントプログラム32の故障復旧通知機能により、接続モジュール160にて故障が発生したことが管理装置13に通知される(図5、S25)。管理装置13は故障箇所にかかる伝送路を検索する(S42)。図24の伝送路接続情報の伝送路構成502から、ストレージ29の接続モジュール160が含まれる伝送路は、伝送路170であることがわかる。
【0144】
次に、伝送路170を使用するサーバに停止命令を発行する(S43)。伝送路170を使用するアプリケーションは、図16からアプリ133で、サーバ23で実行されることがわかる。管理装置13は、サーバ23のログイン情報38を利用し、サーバ23にログインし、伝送路170の使用を停止させる。
【0145】
図28の適用例により、SAN構成において、ストレージの接続モジュールが故障した場合でも、管理装置13は故障を検知し、その後自動的に故障箇所を含む伝送路を使用するサーバに対し、その伝送路の使用を停止させることができる。これにより、サーバが故障箇所を含む伝送路からの応答が無いことを待つことで生じる、サーバの処理性能低下を防ぐことができる。
【0146】
なお、以上述べてきた管理装置の機能をプログラムとして実現し、例えば、サーバ21にインストールして実行することも可能である。その場合、管理装置13を新たに設ける必要はない。
【0147】
以上、実施の形態例をまとめると以下の付記の通りである。
【0148】
(付記1)それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、自装置にて発生した故障箇所を、前記管理装置に通知する故障通知機能を備えるネットワーク計算機システムにおいて、
管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、
前記故障通知機能により故障箇所が通知された場合、通知された故障箇所が前記構成する装置と一致する場合、当該伝送路を使用不可と判定し、
前記サーバから前記ストレージにアクセスする際、前記使用不可となる伝送路を使用するサーバに対し、当該伝送路の使用を停止させることを特徴とするネットワーク計算機システム。
【0149】
(付記2)付記1において、
前記ネットワーク計算機システムは、さらに前記ネットワークに接続される少なくとも1台のファイバチャネルスイッチを有し、前記サーバと前記ストレージが、前記ファイバチャネルスイッチを介した複数の伝送路で接続され、前記ファイバチャネルスイッチは、前記故障通知機能を備えるネットワーク計算機システムであって、
前記伝送路を構成する装置に、前記ファイバチャネルスイッチが含まれることを特徴とするネットワーク計算機システム。
【0150】
(付記3)それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、自装置内の装置情報を管理し、前記管理装置からの要求に対し、前記装置情報を応答するネットワーク計算機システムにおいて、
前記管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、
定期的にサーバおよびストレージに前記装置情報を要求し、
応答された装置情報から故障状態の装置があるか判定し、
故障状態の装置が検出された場合、検出された故障箇所が前記構成する装置と一致する場合、当該伝送路を使用不可と判定し、
当該伝送路を使用するアプリケーションプログラムが実行されるサーバに対し、前記アプリケーションプログラムによる当該伝送路の使用を停止させることを特徴とするネットワーク計算機システム。
【0151】
(付記4)付記3において、
前記ネットワーク計算機システムは、さらに前記ネットワークに接続された少なくとも1台のファイバチャネルスイッチを有し、前記ファイバチャネルスイッチは、自装置内の装置情報を管理し、前記管理装置からの要求に対し、前記装置情報を応答し、前記サーバと前記ストレージが、前記ファイバチャネルスイッチを介して接続されるネットワーク計算機システムであって、
前記管理装置は、ファイバチャネルスイッチに対しても、定期的に前記装置情報を要求することを特徴とするネットワーク計算機システム。
【0152】
(付記5)それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、故障した装置が復旧したことを、前記管理装置に通知する復旧通知機能を備えるネットワーク計算機システムにおいて、
前記管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、
前記復旧通知機能により復旧が通知された場合、通知された装置が前記構成する装置と一致する場合、当該伝送路を使用可能と判定し、
前記使用可能となる伝送路を使用するアプリケーションプログラムが実行されるサーバに対し、前記アプリケーションプログラムによる当該伝送路の使用を開始させることを特徴とするネットワーク計算機システム。
【0153】
(付記6)付記5において、
前記ネットワーク計算機システムは、さらに前記ネットワークに接続された少なくとも1台のファイバチャネルスイッチを有し、前記サーバと前記ストレージは、前記ファイバチャネルスイッチを介した複数の伝送路で接続され、前記ファイバチャネルスイッチは、前記復旧通知機能を備えるネットワーク計算機システムにおいて、
前記伝送路を構成する装置に、前記ファイバチャネルスイッチが含まれることを特徴とするネットワーク計算機システム。
【0154】
(付記7)それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、自装置内の装置情報を管理し、前記管理装置からの要求に対し、前記装置情報を応答するネットワーク計算機システムにおいて、
管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、
定期的にサーバおよびストレージに前記装置情報を要求し、
応答された装置情報を保存し、
装置状態が異常から正常に変化した装置がある場合、当該装置が前記構成する装置と一致する場合、当該伝送路を使用可能と判定し、
当該伝送路を使用するアプリケーションプログラムが実行されるサーバに対し、前記アプリケーションプログラムによる当該伝送路の使用を開始させることを特徴とするネットワーク計算機システム。
【0155】
(付記8)付記7において、
前記ネットワーク計算機システムは、さらに前記ネットワークに接続された少なくとも1台のファイバチャネルスイッチを有し、前記サーバと前記ストレージは、前記ファイバチャネルスイッチを介した複数の伝送路で接続されるネットワーク計算機システムにおいて、
前記管理装置は、ファイバチャネルスイッチに対しても、定期的に前記装置情報を要求することを特徴とするネットワーク計算機システム。
【0156】
(付記9)それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージを有し、サーバおよびストレージは、自装置にて発生した故障箇所を通知する故障通知機能を備え、サーバ、ストレージを複数の伝送路で接続するネットワーク計算機システムに設けられ、サーバおよびストレージの装置情報を管理し、サーバおよびストレージの故障通知機能から通知される故障通知を受信する管理装置であって、
前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、
前記故障通知機能により故障箇所が通知された場合、通知された故障箇所が前記構成する装置と一致する場合、当該伝送路を使用不可と判定し、
前記サーバから前記ストレージにアクセスする際、前記使用不可となる伝送路を使用するサーバに対し、当該伝送路の使用を停止させることを特徴とする管理装置。
【0157】
(付記10)それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージを有し、サーバおよびストレージは、自装置にて発生した故障箇所を通知する故障通知機能を備え、サーバ、ストレージを複数の伝送路で接続するネットワーク計算機システムに設けられ、サーバおよびストレージの装置情報を管理し、サーバおよびストレージの故障通知機能から通知される故障通知を受信する管理装置であって、
前記サーバが、前記ストレージのデータにアクセスするために使用する前記伝送路について、前記伝送路を構成する装置と対応付けて記録し、
定期的にサーバおよびストレージに前記装置情報を要求し、
応答された装置情報を保存し、
装置状態が異常から正常に変化した装置がある場合、当該装置が前記構成する装置と一致する場合、当該伝送路を使用可能と判定し、
当該伝送路を使用するアプリケーションプログラムが実行されるサーバに対し、前記アプリケーションプログラムによる当該伝送路の使用を開始させることを特徴とする管理装置。
【0158】
【発明の効果】
サーバとストレージ間が複数の伝送路で接続されており、サーバでアプリケーションプログラムを実行する際、複数の伝送路が使用される環境において、伝送路を使用不可にするような故障が発生した場合、自動的に、故障により使用不可となる伝送路のサーバによる使用を停止させる。
【0159】
これにより、サーバが故障箇所を含む伝送路にアクセスすることで生じる、アプリケーションプログラムの待ち時間を避け、サーバの性能低下を防止することができる。また、システム管理の面からも、故障解析、故障部品の交換などの作業を迅速に行うこともでき、システム管理の効率が向上する。
【0160】
部品の交換が完了し、故障前にアプリケーションプログラムを実行する際、サーバにより使用されていた伝送路が復旧する場合、自動的に、復旧する伝送路がサーバにより使用され、システム管理者が復旧作業を行うのにかかる負担を軽くできる。
【図面の簡単な説明】
【図1】複数の伝送路により接続されたサーバおよびストレージと管理装置を備えたネットワーク計算機システムの例を示す図である。
【図2】従来の故障発生時の伝送路制御処理を示す図である。
【図3】本発明における実施の一形態を示す図である。
【図4】管理装置と管理対象の装置における機能を示す関係図
【図5】本発明に従う第1の伝送路制御処理を示す図である。
【図6】本発明に従う第2の伝送路制御処理を示す図である。
【図7】本発明に従う第3の伝送路制御処理の例を示す図である。
【図8】本発明に従う第4の伝送路制御処理の例を示す図である。
【図9】管理装置の構成例を示す図である。
【図10】サーバの構成例を示す図である。
【図11】ストレージの構成例を示す図である。
【図12】ファイバチャネルスイッチの構成例を示す図である。
【図13】第1の伝送路制御処理を適用するネットワーク計算機システムの別の構成例
【図14】サーバ21の装置情報の例を示す図である。
【図15】サーバ22の装置情報の例を示す図である。
【図16】サーバ23の装置情報の例を示す図である。
【図17】ファイバチャネルスイッチ24の装置情報の例を示す図である。
【図18】ファイバチャネルスイッチ25の装置情報の例を示す図である。
【図19】ファイバチャネルスイッチ26の装置情報の例を示す図である。
【図20】ストレージ27の装置情報の例を示す図である。
【図21】ストレージ28の装置情報の例を示す図である。
【図22】ストレージ29の装置情報の例を示す図である。
【図23】伝送路接続情報更新処理を説明するためのフローチャート
【図24】伝送路接続情報の例を示す図である。
【図25】FCスイッチにて故障が発生する例を示す図である。
【図26】ホストバスアダプタにて故障が発生する例を示す図である。
【図27】FCスイッチのポートにて故障が発生する例を示す図である。
【図28】接続モジュールにて故障が発生する例を示す図である。
【符号の説明】
1 サーバ
2 CPU
3 メモリ
4 アプリケーションプログラム
5、6 ホストバスアダプタ(HBA)
7 ストレージ
8、9 接続モジュール(CM)
10 ディスク装置
11、12 伝送路
13 管理装置
14 入出力装置
15 ネットワーク
16、17、18、19 接続線
20 クライアント
24、25、26 ファイバチャネルスイッチ

Claims (5)

  1. それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、自装置にて発生した故障箇所を、前記管理装置に通知する故障通知機能を備えるネットワーク計算機システムにおいて、
    管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、
    前記故障通知機能により故障箇所が通知された場合、通知された故障箇所が前記構成する装置と一致する場合、当該伝送路を使用不可と判定し、
    前記サーバから前記ストレージにアクセスする際、前記使用不可となる伝送路を使用するサーバに対し、当該伝送路の使用を停止させることを特徴とするネットワーク計算機システム。
  2. 請求項1において、
    前記ネットワーク計算機システムは、さらに前記ネットワークに接続される少なくとも1台のファイバチャネルスイッチを有し、前記サーバと前記ストレージが、前記ファイバチャネルスイッチを介した複数の伝送路で接続され、前記ファイバチャネルスイッチは、前記故障通知機能を備えるネットワーク計算機システムであって、
    前記伝送路を構成する装置に、前記ファイバチャネルスイッチが含まれることを特徴とするネットワーク計算機システム。
  3. それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、自装置内の装置情報を管理し、前記管理装置からの要求に対し、前記装置情報を応答するネットワーク計算機システムにおいて、
    前記管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、
    定期的にサーバおよびストレージに前記装置情報を要求し、
    応答された装置情報から故障状態の装置があるか判定し、
    故障状態の装置が検出された場合、検出された故障箇所が前記構成する装置と一致する場合、当該伝送路を使用不可と判定し、
    当該伝送路を使用するアプリケーションプログラムが実行されるサーバに対し、前記アプリケーションプログラムによる当該伝送路の使用を停止させることを特徴とするネットワーク計算機システム。
  4. それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージと、サーバおよびストレージの装置情報を管理する管理装置とを有し、前記サーバと前記ストレージは、複数の伝送路で接続され、サーバおよびストレージは、故障した装置が復旧したことを、前記管理装置に通知する復旧通知機能を備えるネットワーク計算機システムにおいて、
    前記管理装置は、前記サーバが前記ストレージのデータにアクセスするために使用する伝送路を構成する装置と対応付けて記録し、
    前記復旧通知機能により復旧が通知された場合、通知された装置が前記構成する装置と一致する場合、当該伝送路を使用可能と判定し、
    前記使用可能となる伝送路を使用するアプリケーションプログラムが実行されるサーバに対し、前記アプリケーションプログラムによる当該伝送路の使用を開始させることを特徴とするネットワーク計算機システム。
  5. それぞれネットワークに接続される、少なくとも1台のサーバと、少なくとも1台のストレージを有し、サーバおよびストレージは、自装置にて発生した故障箇所を通知する故障通知機能を備え、サーバ、ストレージを複数の伝送路で接続するネットワーク計算機システムに設けられ、サーバおよびストレージの装置情報を管理し、サーバおよびストレージの故障通知機能から通知される故障通知を受信する管理装置であって、
    前記ストレージのデータにアクセスするために使用する伝送路について、前記伝送路を構成する装置と対応付けて記録し、
    前記故障通知機能により故障箇所が通知された場合、通知された故障箇所が前記構成する装置と一致する場合、当該伝送路を使用不可と判定し、
    前記サーバから前記ストレージにアクセスする際、前記使用不可となる伝送路を使用するサーバに対し、当該伝送路の使用を停止させることを特徴とする管理装置。
JP2002248595A 2002-08-28 2002-08-28 ネットワーク計算機システムおよび管理装置 Expired - Fee Related JP3957065B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002248595A JP3957065B2 (ja) 2002-08-28 2002-08-28 ネットワーク計算機システムおよび管理装置
US10/644,000 US20040073648A1 (en) 2002-08-28 2003-08-20 Network calculator system and management device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002248595A JP3957065B2 (ja) 2002-08-28 2002-08-28 ネットワーク計算機システムおよび管理装置

Publications (2)

Publication Number Publication Date
JP2004088570A JP2004088570A (ja) 2004-03-18
JP3957065B2 true JP3957065B2 (ja) 2007-08-08

Family

ID=32055932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002248595A Expired - Fee Related JP3957065B2 (ja) 2002-08-28 2002-08-28 ネットワーク計算機システムおよび管理装置

Country Status (2)

Country Link
US (1) US20040073648A1 (ja)
JP (1) JP3957065B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070112681A1 (en) * 2004-01-08 2007-05-17 Satoshi Niwano Content distribution system, license distribution method and terminal device
US7809825B2 (en) * 2004-05-05 2010-10-05 International Business Machines Corporation Dissolving network resource monitor
JP2006178720A (ja) * 2004-12-22 2006-07-06 Hitachi Ltd ストレージシステム
JP2006252336A (ja) * 2005-03-11 2006-09-21 Mitsubishi Electric Corp デバイス間データ転送装置及びデバイス間データ転送方法及びプログラム
JP4721875B2 (ja) * 2005-11-04 2011-07-13 株式会社日立製作所 ホストがデータにアクセスするためのアクセス環境を管理する記憶制御方法
JP2009194675A (ja) * 2008-02-15 2009-08-27 Fujitsu Ltd ネットワーク構成管理プログラム、ネットワーク構成管理装置、ネットワーク構成管理方法
US8041987B2 (en) * 2008-11-10 2011-10-18 International Business Machines Corporation Dynamic physical and virtual multipath I/O
JP5477047B2 (ja) * 2010-02-25 2014-04-23 富士通株式会社 情報処理装置、仮想計算機接続方法、プログラム及び記録媒体
JP5606155B2 (ja) 2010-05-25 2014-10-15 キヤノン株式会社 画像処理装置、通信制御方法、及びプログラム
JP6040612B2 (ja) 2012-07-24 2016-12-07 富士通株式会社 ストレージ装置、情報処理装置、情報処理システム、アクセス制御方法、およびアクセス制御プログラム
US10523513B2 (en) * 2018-04-30 2019-12-31 Virtustream Ip Holding Company Llc Automated configuration of switch zones in a switch fabric
JP7035950B2 (ja) 2018-10-16 2022-03-15 富士通株式会社 並列処理装置および光ファイバーケーブルの交換方法
US11750457B2 (en) 2021-07-28 2023-09-05 Dell Products L.P. Automated zoning set selection triggered by switch fabric notifications
US11586356B1 (en) 2021-09-27 2023-02-21 Dell Products L.P. Multi-path layer configured for detection and mitigation of link performance issues in a storage area network
US12001595B2 (en) 2021-12-03 2024-06-04 Dell Products L.P. End-to-end encryption of logical storage devices in a Linux native multi-pathing environment
US12045480B2 (en) 2021-12-14 2024-07-23 Dell Products L.P. Non-disruptive switching of multi-pathing software
US11983429B2 (en) 2022-06-22 2024-05-14 Dell Products L.P. Migration processes utilizing mapping entry timestamps for selection of target logical storage devices
US12105956B2 (en) 2022-09-23 2024-10-01 Dell Products L.P. Multi-path layer configured with enhanced awareness of link performance issue resolution
US12099733B2 (en) 2022-10-18 2024-09-24 Dell Products L.P. Spoofing of device identifiers in non-disruptive data migration

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5914798A (en) * 1995-12-29 1999-06-22 Mci Communications Corporation Restoration systems for an optical telecommunications network
US6683850B1 (en) * 1997-08-29 2004-01-27 Intel Corporation Method and apparatus for controlling the flow of data between servers
US6192027B1 (en) * 1998-09-04 2001-02-20 International Business Machines Corporation Apparatus, system, and method for dual-active fibre channel loop resiliency during controller failure
US6424629B1 (en) * 1998-11-23 2002-07-23 Nortel Networks Limited Expediting reconvergence in a routing device
US6714549B1 (en) * 1998-12-23 2004-03-30 Worldcom, Inc. High resiliency network infrastructure
US7103653B2 (en) * 2000-06-05 2006-09-05 Fujitsu Limited Storage area network management system, method, and computer-readable medium
EP1370950B1 (en) * 2001-02-13 2017-12-27 NetApp, Inc. System and method for policy based storage provisioning and management
US20020176131A1 (en) * 2001-02-28 2002-11-28 Walters David H. Protection switching for an optical network, and methods and apparatus therefor
ITMI20011139A1 (it) * 2001-05-30 2002-11-30 Cit Alcatel Metodo per gestire la protezione del traffico in reti ad anello oms-spring
US7050390B2 (en) * 2001-10-25 2006-05-23 Raytheon Company System and method for real-time fault reporting in switched networks
US7164652B2 (en) * 2001-12-17 2007-01-16 Alcatel Canada Inc. System and method for detecting failures and re-routing connections in a communication network
US7275103B1 (en) * 2002-12-18 2007-09-25 Veritas Operating Corporation Storage path optimization for SANs

Also Published As

Publication number Publication date
JP2004088570A (ja) 2004-03-18
US20040073648A1 (en) 2004-04-15

Similar Documents

Publication Publication Date Title
JP3957065B2 (ja) ネットワーク計算機システムおよび管理装置
JP4794068B2 (ja) ストレージエリア・ネットワーク管理システム
JP4462024B2 (ja) ディスク引き継ぎによるフェイルオーバ方法
US8423816B2 (en) Method and computer system for failover
EP1851632B1 (en) Disaster recovery framework
US8386830B2 (en) Server switching method and server system equipped therewith
USRE42703E1 (en) System and method for fibrechannel fail-over through port spoofing
US8407514B2 (en) Method of achieving high reliability of network boot computer system
US8516294B2 (en) Virtual computer system and control method thereof
US7657786B2 (en) Storage switch system, storage switch method, management server, management method, and management program
EP2088508B1 (en) Storage subsystem and control method thereof
US7921325B2 (en) Node management device and method
JP6056554B2 (ja) クラスタシステム
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
US7650532B2 (en) Storage system
JP2007072571A (ja) 計算機システム及び管理計算機ならびにアクセスパス管理方法
JP5561622B2 (ja) 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
US7937481B1 (en) System and methods for enterprise path management
US20080215767A1 (en) Storage usage exclusive method
US8095820B2 (en) Storage system and control methods for the same
US8918670B2 (en) Active link verification for failover operations in a storage network
US8819481B2 (en) Managing storage providers in a clustered appliance environment
JP2006189963A (ja) ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム
JP2005128781A (ja) 系切り替え方法及び情報処理システム
JP5267544B2 (ja) ディスク引き継ぎによるフェイルオーバ方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070501

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070501

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100518

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110518

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130518

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140518

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees