JP5928581B2 - ネットワークシステム,保守作業管理方法及びプログラム - Google Patents

ネットワークシステム,保守作業管理方法及びプログラム Download PDF

Info

Publication number
JP5928581B2
JP5928581B2 JP2014514279A JP2014514279A JP5928581B2 JP 5928581 B2 JP5928581 B2 JP 5928581B2 JP 2014514279 A JP2014514279 A JP 2014514279A JP 2014514279 A JP2014514279 A JP 2014514279A JP 5928581 B2 JP5928581 B2 JP 5928581B2
Authority
JP
Japan
Prior art keywords
maintenance
path
information
work
maintenance work
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014514279A
Other languages
English (en)
Other versions
JPWO2013168229A1 (ja
Inventor
究 小橋
究 小橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2013168229A1 publication Critical patent/JPWO2013168229A1/ja
Application granted granted Critical
Publication of JP5928581B2 publication Critical patent/JP5928581B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、ネットワークシステム,保守作業管理方法及びプログラムに関する。
近年、例えば、FC(Fibre Channel)を備えるSAN(Storage Area Network)やISCSI(Internet Small Computer System Interface),SAS(Serial Attached SCSI)で接続された複数個のストレージ(記憶装置)と複数個のサーバとを備えるストレージシステムにおいて、しばしば、サーバとストレージ間を複数経路で接続し経路に冗長性を持たせるマルチパスが実現される。マルチパスは、サーバ上のドライバソフトウェアにより実現される。
このようなマルチパスでストレージにサーバが接続されているシステムにおいて、例えばネットワークアダプタ等のシステムを構成する一部の部品(保守対象部品)を交換する保守(ハード保守)は、以下の手順(1)〜(8)の作業を行なうことで実現される。
なお、以下、SE(System Engineer)とは、サーバを管理・操作する作業者であり、主にサーバの使用者(顧客)やシステム会社の担当者である。又、CE(Customer Engineer)は、ハードウェアの部品交換等のストレージの保守作業を行なう作業者であり、主にストレージベンダーの担当者であって、一般にサーバのアクセス権はない。
(1)SEが、ハード保守で影響が出るパスをシステム設計書等から割り出す。
(2)SEは、保守対象部品が含まれるパス(保守対象パス)がマルチパスで多重化されていること、及び、そのマルチパスにおける保守対象パスとは異なる他のパスが正常であることを確認する。かかる確認はパスのステータスを確認することにより行なう。
(3)SEは、手順(2)において正常であることを確認したら、保守対象パスを閉塞させる。
(4)SEは、システム中の全てのサーバにおいて、上記手順(1)〜(3)を繰り返し行なう。
(5)CEは、保守PC(Personal Computer)上の保守画面で保守開始を入力し、保守可能状態にする。
(6)CEが、部品交換などの保守作業を行なう。
(7)CEが、保守PC上の保守画面で保守完了を入力する。
(8)SEが、全サーバにおいて上記手順(3)で閉塞させたパスを復旧させる。
上述の如き手順(1)〜(8)の処理を行なうことにより、マルチパスでストレージにサーバが接続されているストレージシステムにおいて、システムを止めることなく部品交換等の保守作業を行なうことができる。
特開2007−317206号公報
しかしながら、このような従来のマルチパスを備えるシステムにおいては、ハードウェア保守作業において、上記手順(1)〜(8)のうち、少なくとも手順(1)〜(4),(8)でSEによる作業が必要とされる。従って、CEだけでは保守作業を行なうことができず利便性が低いという課題がある。
特に近年においては、ストレージに多数のサーバが接続されるようになり、これに伴い、上記手順(2)における確認作業等に要するSEの作業負荷や時間も増大する傾向にある。
また、システムに備えられたサーバ台数が多い場合に、全サーバについて上記手順(2)等の確認処理を行なうために、多大な時間や労力を要する。更に、システムに備えられたサーバ台数が多い場合には、例えば、上記手順(2)で各サーバにおいて確認作業を行なっている間に、先に調べたサーバの状態が変わる事も考えられ、確認して得た情報が必ずしもシステムの状態を反映するものではなくなっているおそれがある。
例えば、上記手順(2)の確認はパスのステータスを確認することにより行なうが、例えばパスの診断間隔が10分に設定されている場合、確認して得られた情報は約10分前のパスのステータスであり、手順(3)を実行する時点でパスのステータスが変化している場合があり得る。
このように最新ではないパスのステータスに基づいて保守作業を行なうことにより、全パス閉塞が発生する可能性がある。
さらに、上記手順(1)で構成の確認を間違えた場合や、手順(3)で閉塞させるパスを間違えた場合も、保守作業を実行することにより全パス閉塞が発生する可能性がある。
なお、パスの確認手法としてSAN管理ソフトを利用して情報を取得することもできるが、そのためにSAN管理サーバを用意する必要がある。又、SAN管理ソフトは一般に運用上、CEが操作することは出来ない。更に、SAN管理ソフトが情報を取得するためにはストレージ装置が業務LANに接続されている必要があるという制約も生じる。
1つの側面では、本発明は、ネットワークシステムにおける保守作業効率を向上させることを目的とする。
なお、前記目的に限らず、後述する発明を実施するための最良の形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本発明の他の目的の1つとして位置付けることができる。
このネットワークシステムは、保守作業の対象である保守対象部品を有する保守対象装置と、前記保守対象装置と複数のパスを介して接続される複数の処理装置とを備えるネットワークシステムであって、前記保守対象装置は、保守作業がパスに影響を与える保守部品の一覧である参照情報を参照して、保守対象部品が、保守作業を行なうことによりパスに影響を与えるものであるか否かを判断し、保守対象部品が、その保守作業を行なうことによりパスに影響が出るものである場合に、パス毎に、中継装置情報、当該パスが構成するマルチパスを特定する情報および保守可能もしくは保守不可を示す情報を対応付けることにより構成された、前記複数のパスの情報を管理するパス管理情報を参照し、保守対象部品が前記パス管理情報に登録されたパスの構成要素に含まれるかを判断することで、前記ネットワークシステムにおける各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断する影響判断部と、前記影響判断部によって判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力するパス影響情報出力部と、を備え、各処理装置は、自装置と接続しているパスの前記パス影響情報に基づいて、前記保守作業が実行可能であるか否かを診断する保守可否診断部と、前記保守可否診断部による診断結果を保守可否情報として前記保守対象装置に出力する保守可否情報出力部と、を備え、前記保守対象装置は、前記複数の処理装置の前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力する。
また、この保守作業管理方法は、保守作業の対象である保守対象部品を有する保守対象装置と、前記保守対象装置と複数のパスを介して接続される複数の処理装置とを備えるネットワークシステムにおける保守作業管理方法であって、前記保守対象装置において保守作業がパスに影響を与える保守部品の一覧である参照情報を参照して、保守対象部品が、保守作業を行なうことによりパスに影響を与えるものであるか否かを判断し、保守対象部品が、その保守作業を行なうことによりパスに影響が出るものである場合に、パス毎に、中継装置情報、当該パスが構成するマルチパスを特定する情報および保守可能もしくは保守不可を示す情報を対応付けることにより構成された、前記複数のパスの情報を管理するパス管理情報を参照し、保守対象部品が前記パス管理情報に登録されたパスの構成要素に含まれるかを判断することで、前記ネットワークシステムにおける各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断するステップと、判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力するステップと、各処理装置において、自装置と接続しているパスの前記パス影響情報に基づいて、前記保守作業を実行可能であるか否かを診断するステップと、前記診断結果を保守可否情報として前記保守対象装置に出力するステップと、前記保守対象装置において、前記複数の処理装置の前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力するステップとを備える。
さらに、本発明に関連する処理装置は、保守作業の対象である保守対象部品を有する保守対象装置と複数のパスを介して接続される処理装置であって、前記保守対象装置は、前記複数のパスの情報を管理するパス管理情報を参照し、各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断する影響判断部と、前記影響判断部によって判断された判断結果を各パスについてのパス影響情報として出力するパス影響情報出力部と、自装置と接続しているパスの前記パス影響情報に基づいて行われた、前記保守作業を実行可能であるか否かの診断結果を表す保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力する作業許可情報出力部とを備える。
さらに、このプログラムは、保守作業の対象である保守対象部品を有し、複数の処理装置と複数のパスを介して接続されるコンピュータに、保守作業がパスに影響を与える保守部品の一覧である参照情報を参照して、保守対象部品が、保守作業を行なうことによりパスに影響を与えるものであるか否かを判断し、保守対象部品が、その保守作業を行なうことによりパスに影響が出るものである場合に、ス毎に、中継装置情報、当該パスが構成するマルチパスを特定する情報および保守可能もしくは保守不可を示す情報を対応付けることにより構成された、前記複数のパスの情報を管理するパス管理情報を参照し、保守対象部品が前記パス管理情報に登録されたパスの構成要素に含まれるかを判断することで、前記複数のパスのそれぞれについて前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断し、判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力し、自装置と接続しているパスの前記パス影響情報に基づいて行われた、前記保守作業を実行可能であるか否かの断結果を表す保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力する処理を実行させる。
保守作業を効率よく行なうことができる。
実施形態の一例としてのストレージシステムの機能構成を示す図である。 実施形態の一例としてのストレージシステムの接続構成を示す図である。 実施形態の一例としてのストレージシステムにおけるマルチパス構成管理テーブルを例示する図である。 実施形態の一例としてのストレージシステムにおける保守フラグを例示する図である。 実施形態の一例としてのストレージシステムにおけるインクワイアリ通知のデータ構成を例示する図である。 実施形態の一例としてのストレージシステムにおけるパス診断部による保守判断例を示す図である。 実施形態の一例としてのストレージシステムにおける保守作業時のCEによる処理を説明するためのフローチャートである。 実施形態の一例としてのストレージシステムにおける保守作業時のストレージ装置の処理を説明するためのフローチャートである。 実施形態の一例としてのストレージシステムにおける保守作業時のサーバの処理を説明するためのフローチャートである。 実施形態の一例としてのストレージシステムにおけるエラー処理時のCEの処理を説明するためのフローチャートである。 実施形態の一例としてのストレージシステムにおけるエラー処理時のストレージ装置の処理を説明するためのフローチャートである。 実施形態の一例としてのストレージシステムにおけるエラー処理時のサーバの処理を説明するためのフローチャートである。
以下、図面を参照してネットワークシステム,保守作業管理方法及びプログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。
図1は実施形態の一例としてのストレージシステム1の機能構成を示す図、図2はその接続構成を示す図である。
実施形態の一例としてのストレージシステム(ネットワークシステム)1は、図1及び図2に示すように、ネットワーク50を介してストレージ装置10と、複数(図1に示す例では2つ)のサーバ(情報処理装置)40−1,40−2が通信可能に接続されている。
なお、サーバ40−1とサーバ40−2とは同様の構成をそなえる。以下、サーバを示す符号としては、複数のサーバのうち1つを特定する必要があるときには符号40−1,40−2を用いるが、任意のサーバを指すときには符号40を用いる。
ネットワーク50は、例えば、FCを備えるSANやISCSI,SASファイバーチャネル等の規格に基づく通信回線である。図1に示す例においては、ネットワーク50は、通信線51〜58及び2つのスイッチ60−1,60−2をそなえ、ストレージ装置10とサーバ40−1,40−2とを冗長化したパスで接続するマルチパス構成を成す。
スイッチ60−1,60−2は、通信経路間に配置される中継装置であり、ネットワーク50を送信されるデータの経路を切り替える。本実施形態においては、スイッチ60−1,60−2はファイバチャネルスイッチである。なお、図1及び図2中においては、スイッチ60−1をFC−SW1と表し、スイッチ60−2をFC−SW2と表す。これらのスイッチ60−1,60−2は同様の構成をそなえる。以下、スイッチを示す符号としては、複数のスイッチのうち1つを特定する必要があるときには符号60−1,60−2を用いるが、任意のスイッチを指すときには符号60を用いる。
本実施形態においては、サーバ40−1,40−2に備えられたHBA(Host Bus Adapter)46−1〜46−6と、ストレージ装置10に備えられたCA24−1〜24−4との組み合わせをパスという。
図2に示すように、サーバ40−1は、HBA46−1とCA24−1とを通信線51を介して接続するパスと、HBA46−2とCA24−3とを通信線52を介して接続するパスとの2つのパス(マルチパス1)でストレージ装置10と接続されている。以下、マルチパスを成すパスの組み合わせをマルチパス組もしくはパス組という場合があり、このサーバ40−1においてマルチパス1を構成するマルチパス組をサーバ1−1と表す場合がある。
また、サーバ40−2は、HBA46−3とCA24−2とを通信線53,55及びスイッチ60−1を介して接続するパスと、HBA46−4とCA24−4とを通信線54,57及びスイッチ60−2を介して接続するパスとの2つのパス(マルチパス1)でストレージ装置10と接続されている。以下、このサーバ2においてマルチパス1を構成するマルチパス組をサーバ2−1と表す場合がある。
さらに、サーバ40−2は、HBA46−5とCA24−2とを通信線53,56及びスイッチ60−1を介して接続するパスと、HBA46−6とCA24−4とを通信線54,58及びスイッチ60−2を介して接続するパスとの2つのパス(マルチパス2)でストレージ装置10と接続されている。以下、このサーバ2においてマルチパス2を構成するマルチパス組をサーバ2−2と表す場合がある。
保守PC70は、保守作業員(CE) が使用するPCであり、ストレージ装置10と、例えば、保守LAN等の通信回線(図示省略)を介して接続される。
この保守PC70は、キーボードやマウス、タッチパネル等の入力装置や、液晶ディスプレイ等の表示装置、CPU,メモリ,記憶装置等を備えるコンピュータである。なお、保守PC70としては一般的なコンピュータを用いることができ、便宜上、保守PC70のハードウェア構成の図示は省略する。
CEは、この保守PC70の入力装置を介して、交換等の保守作業の対象となる保守対象部品やその作業予定時刻を指定(選択)する入力操作を行なう。保守PC70に入力された保守対象部品や保守作業時刻は、ストレージ装置10に通知される。
また、保守PC70には、後述するストレージ装置10の作業許可情報出力部14によって、保守対象部品に対する保守作業の許可もしくは不許可を示す許可情報が入力される。
保守PC70は、入力されたこの許可情報を、表示装置に保守画面として表示させることによりCEに通知する。CEは、保守PC70の保守画面に表示される各種指示に従って、作業等を行なう。
例えば、作業許可情報出力部14から保守作業が実行可能である旨の許可情報が入力されると、保守PC70は保守画面に作業可能を示すメッセージ等を表示する。又、作業許可情報出力部14から保守作業が実行不可能である旨の許可情報が入力されると、保守PC70は、保守作業は不可である旨を示すエラーメッセージや、保守不可であると判断されたパスを特定する情報を保守画面に表示させる。
また、表示装置には、保守画面として、保守作業の中止を指示する入力画面(例えば、保守中止ボタン)も表示され、CEは、この入力画面において保守作業の中止を指示する入力処理を行なう。この中止指示は、ストレージ装置10やサーバ40に保守中止指示として送信される。
さらに、保守PC70においては、CEが保守作業を完了した場合に、保守作業の完了を入力する機能をそなえる。例えば、表示装置に保守画面として保守作業の完了を入力する入力画面(例えば、保守完了ボタン)が表示され、CEは、この入力画面において保守作業の完了を報告する入力処理を行なう。この完了報告は、ストレージ装置10やサーバ40に保守完了報告として送信される。
ストレージ装置(処理装置)10は、ホスト装置40に対して記憶領域を提供するものであり、例えば、RAID(Redundant Arrays of Inexpensive Disks)装置である。
ストレージ装置10は、図1に示すように、複数(図1及び図2に示す例では2つ)のCM(Controller Module:情報処理装置)111−1,111−2及び1以上の記憶装置31をそなえる。
記憶装置31はデータ等を記憶する記憶装置であって、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)である。ストレージ装置10においては、この記憶装置31の記憶領域が論理ボリュームに対して割り当てられる。サーバ40は、この論理ボリュームに対して、データの書き込みや読み出し等の処理を行なう。
CM111−1,111−2はストレージ装置10における種々の制御を行なう制御装置であり、例えば、上位装置であるサーバ40からのストレージアクセス要求(アクセス制御信号)に従って、記憶装置31へのアクセス制御等、各種制御を行なう。
CM111−1とCM111−2とは同様のハードウェア構成をそなえる。以下、CMを示す符号としては、複数のCMのうち1つを特定する必要があるときには符号111−1,111−2を用いるが、任意のCMを指すときには符号111を用いる。なお、以下、CM111−1をCM0という場合があり、又、CM111−2をCM1という場合がある。
CM111は、図1に示すように、CA(Channel Adapter)24−1,24−2(24−3,24−4),CPU110,バッファメモリ21,ROM22及びRAM23をそなえる。
CA24−1〜24−4は、それぞれサーバ40と通信可能に接続するインタフェースコントローラであり、例えば、ファイバチャネルアダプタである。CA24−1〜CA24−4は互いに同様の構成をそなえる。以下、CAを示す符号としては、複数のCAのうち1つを特定する必要があるときには符号24−1〜24−4を用いるが、任意のCAを指すときには符号24を用いる。又、以下、CM0において、CA24−1をCA0という場合があり、又、CA24−2をCA1という場合がある。同様に、CM1において、CA24−3をCA0という場合があり、又、CA24−4をCA1という場合がある。又、以下、CA24−1〜24−4をポートという場合がある。
ROM22は、CPU110が実行するプログラムや種々のデータを格納する記憶装置である。
バッファメモリ21は、サーバ40から受信したデータや、サーバ40に対して送信するデータを格納する記憶装置である。
RAM23は、種々のデータやプログラムを格納する記憶領域であって、CPU110がプログラムを実行する際に、データやプログラムを格納・展開して用いる。なお、バッファメモリ21とRAM23とで別々のメモリをそなえてもよく、又、共通のメモリをそなえ、このメモリの記憶領域をバッファメモリ21としての領域とRAM23としての領域とで分けて使用することにより、これらの各機能を実現してもよい。
また、RAM23には、マルチパス構成管理テーブル231が格納される。
図3は実施形態の一例としてのストレージシステムにおけるマルチパス構成管理テーブル231を例示する図である。
マルチパス構成管理テーブル231は、本ストレージシステム1における各パスの情報を管理するパス管理情報である。図3に示す例においては、マルチパス構成管理テーブル231は、パス毎に、FCスイッチ情報,マルチパス組情報及びステータスの各情報を対応付けることにより構成されている。
なお、この図3に示すマルチパス構成管理テーブル231においては、パスをCA24とHBA46との組み合わせで特定している。そして、各CA24をそれぞれポートで表している。すなわち、図3に示す例においては、CA24−1をポートCM0CA0として表しており、同様に、CA24−2,24−3,24−4を、それぞれポートCM0CA1,CM1CA0,CM1CA1と表している。
また、この図3に示すマルチパス構成管理テーブル231においては、各HBAをそれぞれWWN(World Wide Name)を用いて特定している。そして、図3中においては、HBA46−1〜46−6の各WWNを、便宜上、HBA1〜HBA6と表している。
FCスイッチ情報は、スイッチ60を特定する情報であり、対応するパス中にスイッチ60が含まれている場合に、そのスイッチ60を特定する情報が登録される。図3に示す例においては、“1”はスイッチ60−1を、又、“2”はスイッチ60−2を示し、又“−”は、当該パス中にスイッチ60が含まれていないことを示す。
マルチパス組情報は、そのパスが構成するマルチパスを特定する情報である。ステータスには、後述するサーバ40から受信するCDB(Command Descriptor Block)応答の値が設定される。具体的には、“保守可能”もしくは“保守不可”を示す情報が格納される。
このように、このマルチパス構成管理テーブル231は、複数のパスの情報を管理するパス管理情報として機能する。
また、このマルチパス構成管理テーブル231は、後述するテーブル管理部15によって作成及び更新が行なわれる。
CPU110は、種々の制御や演算を行なう処理装置であり、ROM22やRAM23等に格納された各種プログラムを実行することにより、種々の機能を実現する。そして、CM111において、CPU110がOS(Operating System)やプログラムを実行することにより、例えば、サーバ40からのストレージアクセス要求に基づく記憶装置31へのアクセス制御等の、CMとしての既知の一般的な機能が実現される。
なお、図1に示す例においては、便宜上、ストレージ装置10において、CM111−2ついての機能構成の図示を省略し、CM111−1についてのみ、その機能構成を示している。又、本実施形態においては、CM111−1,111−2のうち、CM111−1がプライマリとして機能する例を示す。
本ストレージシステム1においては、上述のCMとしての既知の一般的な機能の他に、CM111−1は、図1に示すような、影響判断部11,通知情報出力部12,作業許可判断部13,作業許可情報出力部14及びテーブル管理部15としての機能もそなえる。これらの機能は、CM111−1のCPU110により実現される。
なお、これらの影響判断部11,通知情報出力部12,作業許可判断部13,作業許可情報出力部14及びテーブル管理部15としての機能を実現するためのプログラムは、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
影響判断部11,通知情報出力部12,作業許可判断部13,作業許可情報出力部14及びテーブル管理部15としての機能を実現する際には、内部記憶装置(本実施形態ではRAM23やROM22)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU110)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
なお、本実施形態において、コンピュータとは、ハードウェアとオペレーティングシステムとを含む概念であり、オペレーティングシステムの制御の下で動作するハードウェアを意味している。又、オペレーティングシステムが不要でアプリケーションプログラム単独でハードウェアを動作させるような場合には、そのハードウェア自体がコンピュータに相当する。ハードウェアは、少なくとも、CPU等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とをそなえており、本実施形態においては、CM111がコンピュータとしての機能を有しているのである。
テーブル管理部15は、マルチパス構成管理テーブル231を作成する。具体的には、テーブル管理部15は以下の(i),(ii)の手順でマルチパス構成管理テーブル231を作成する。
(i)マルチパスの情報を取得する
本ストレージシステム1においては、サーバ40がマルチパスの組をストレージ装置に通知する機能(マルチパスドライバ)をそなえる。
マルチパスドライバは、サーバ40の起動時やマルチパス構築時に、マルチパス毎にユニークな値をストレージ装置10に通知する。例えば「サーバ40毎に異なるCPUIDやサーバ名+マルチパスで管理するパス組番号」といったパス組情報を、予め規定したユニークなCDBでストレージ装置10に送信する。
ストレージ装置10において、テーブル管理部15は、このユニークなCDBを受信することでマルチパスの情報を取得する。テーブル管理部15は、受信したCDBから抽出した情報をマルチパス構成管理テーブル231にポートとWWNとをキーにして登録する。
各サーバ40からCDBを用いてマルチパスに関する情報を送信することにより、テーブル管理部15はLANを使用することなくSCSI(Small Computer System Interface)コマンドで情報取得を行なうことができる。
(ii)FCの接続状況を取得する
ストレージ装置10において、FCが直結であるかFCスイッチ60を経由して接続されているか、又、FCプロトコルは直結かFCスイッチ60経由であるか等を既知の手法で判断することができる。又、FCスイッチ60経由で接続されている場合にはドメインIDなどからどのFCスイッチ60に接続されているかについても判断することができる。
テーブル管理部15は、このようなFCスイッチ60の接続情報についても、マルチパス構成管理テーブル231にFCスイッチ情報として記録する。
このように、ストレージ装置10においては、手順(i)によって取得するサーバ40から取得したマルチパスの情報と、手順(ii)によって取得するFCの接続情報とに基づいて、マルチパス構成管理テーブル231を作成する。これにより、ストレージシステム1のネットワーク構成の全体像を把握することができる。
例えば、一般的なSAN管理ソフトにおいては、ストレージ装置10が業務LANに接続されていないと、ネットワークの構成情報を取得することができない。又、一般に、SAN管理ソフトはCEが操作することを許可していないことが多く、CEがSAN管理ソフトを用いてマルチパスの情報を取得することは困難である。
本ストレージシステム1においては、ストレージ装置10が業務LANに接続されていない場合でも、サーバ40からSCSI及びFCで取得可能な情報と、ストレージ装置10が有するストレージ構成の情報を利用して、マルチパス構成管理テーブル231を生成することが可能である。
なお、マルチパス構成管理テーブル231の作成手法は、上記手法に限定されるものではない。例えば、ストレージ装置10がストレージ管理ソフトを実行する管理サーバ等とLANで接続可能な場合には、必要な情報をこの管理サーバ等から取得して作成してもよく、種々変形して実施することができる。
また、テーブル管理部15は、サーバ40から後述するCDB応答を受信すると、そのCDB応答が示す保守可能もしくは保守不可を示す情報を、マルチパス構成管理テーブル231のステータスに登録する。
影響判断部11は、保守PC70によって指定された保守対象部品が、その保守作業を行なうことによりパスに影響を与えるものであるか否かを判断する。
例えば、保守対象部品が記憶装置31やストレージ装置10の電源ユニット(図示省略)の場合には、その保守・交換作業はパスに影響を与えない。このように、指定された保守対象部品が、その保守作業がパスに影響がないものである場合には、影響判断部11は、作業許可情報出力部14に対して、保守作業がパスに影響がないものであることを通知する。
例えば、その保守作業がパスに影響を与える保守部品の一覧を参照情報としてストレージ装置10の記憶装置31等に格納しておき、影響判断部11が指定された保守対象部品に基づいてこの参照情報を参照する。これにより、保守対象部品が、その保守作業を行なうことによりパスに影響を与えるものであるか否かを判断することができる。なお、参照情報は、パスに影響を与える保守部品の一覧に限定されるものではなく、適宜変更して実施することができる。例えば、パスに影響を与える保守部品の一覧の代わりに、パスに影響を与える保守部品にフラグを設定した情報を用いてもよい。
保守対象部品がパスに影響がないものであることを通知された作業許可情報出力部14は、保守PC70に対して、保守対象部品に対する保守作業の許可を通知する。保守PC70は、例えば、その表示装置に保守可能の通知を表示させる。
CEは、保守PC70の表示装置に表示された保守可能の通知を確認し、すぐに保守対象部品の部品交換を行なって保守作業を完了させる。
また、影響判断部11は、例えば、CA24やCM111,ケーブル,FCスイッチ60等、指定された保守対象部品が、その保守・交換作業がパスに影響が出るものである場合は、その保守作業による各パスへの影響を判断する。
すなわち、影響判断部11は、保守対象部品に基づいて、マルチパス構成管理テーブル231を参照し、本ストレージシステム1における各パスについて、それぞれ、保守作業による影響を受ける保守対象パス(被影響パス)であるか、保守作業による影響を受けない保守対象外パス(無影響パス)であるかを判断する。
例えば、影響判断部11は、保守対象部品が、マルチパス構成管理テーブル231に登録されたパスに備えられるCA24やHBA46,スイッチ60であるかを判断したり、又、これらのネットワーク機器を接続する通信線であるかを判断する。保守対象部品がこれらのいずれかに該当する場合、すなわち、保守対象部品がパスの構成要素に含まれる場合には、その該当するパスを保守対象パスと判断する。又、影響判断部11は、保守対象パス以外のパスを保守対象外パスと判断する。
影響判断部11は、これらのパス毎の判断結果(保守対象パスもしくは保守対象外パス)を、例えばRAM23にパス毎に予め用意された所定の記憶領域に設定する。診断結果の情報は、例えばフラグ(保守フラグ)として設定される。
図4は実施形態の一例としてのストレージシステム1における保守フラグを例示する図である。この図4に示す例においては、“保守状態ではない”,“保守対象パス”,“保守対象パスではない(保守対象外パス)”及び“保守完了”の4つの状態が、値“0”,“1”,“2”及び“3”に対応付けられている。ここで、例えば“保守状態ではない”とは、正常に機能しており、保守する必要がない状態を表す。保守フラグのデフォルト値には、この保守状態ではない状態を示す“0”が設定される。
例えば、影響判断部11は、パスが保守対象パスであると判断した場合には、後述するサーバ40のパス診断部42によるパス診断への応答として送信するインクワイアリ(inquiry)通知に、保守対象パスであることを示す保守フラグ“1”を設定する。又、影響判断部11は、パスが保守対象外パスであると判断した場合には、パス診断への応答として送信するインクワイアリ通知に、保守対象パスではないことを示す保守フラグ“2”を設定する。
これらのパス毎に設定された診断結果(保守フラグ)は、通知情報出力部12によるインクワイアリ通知により各サーバ40に送信される。
通知情報出力部(パス影響情報出力部)12は、サーバ40に対して通知する情報をインクワイアリ通知機能を用いて送信する。インクワイアリ通知(通知情報)は、サーバ40から送信されるインクワイアリ要求に対する応答として、インクワイアリ要求の送信元に対して送信される。なお、インクワイアリ要求やインクワイアリ応答は、SCSIの規格に基づいて送受信されるものであり、既知の手法で実現され、その詳細な説明は省略する。
通知情報出力部12は、影響判断部11により設定された保守フラグ(パス影響情報,判断結果情報)を備える特殊インクワイアリを、パス毎に各サーバ40に対して出力する。
図5は実施形態の一例としてのストレージシステム1におけるインクワイアリ通知のデータ構成を例示する図である。
本ストレージシステム1においては、ページコードF0hの特殊インクワイアリがインクワイアリ通知として用いられ、そのリザーブとして備えられているバイトに保守フラグの値が格納される。
従来手法におけるインクワイアリ応答においては、44〜63バイトの領域はリザーブとして備えられている。本ストレージシステム1においては、これらのリザーブ領域のうち、一部の領域を保守フラグの格納に用いる。
図5に示す例においては、インクワイアリ通知の0〜43バイトには既存のインクワイアリデータが格納され、44バイト目に前述した保守フラグの値が設定される。
これらの、パス毎に送信されたインクワイアリ通知は、各サーバ40において、パス診断部42による、保守作業を実行可能であるか否かの診断に用いられる。
また、通知情報出力部(中止通知情報出力部)12は、保守PC70から保守中止指示が入力されると、保守作業の中止を示す中止通知情報もインクワイアリ通知によりサーバ40に対して出力する。この中止通知情報も、特殊インクワイアリ(インクワイアリ通知)の所定の領域に、例えば、フラグとして設定される。この中止通知情報は、前述したインクワイアリ応答のリザーブ領域のうち、保守フラグの格納に用いる領域(44バイト目)とは異なる領域(45〜63バイト)に格納することが望ましい。
作業許可判断部13は、後述の如く各サーバ40のパス診断結果出力部43からそれぞれ送信される保守可能CDBや保守不可CDB(保守可否情報)に基づいて、保守対象部品に対する保守作業の許可もしくは不許可を判断する。なお、保守不可CDBは、サーバ40が、そのサーバ40に接続されたマルチパスに関して、指定された保守対象部品についての保守作業を実行不可であると判断した場合に出力する診断結果を示す情報である。又、保守可能CDBは、サーバ40が、そのサーバ40に接続されたマルチパスに関して、指定された保守対象部品についての保守作業を実行可能であると判断した場合に出力する診断結果を示す情報である。なお、これらの保守可能CDBや保守不可CDBについての詳細は後述する。
作業許可判断部13は、複数のサーバ40のうち、少なくとも一つのサーバ40から保守不可CDBを受信すると、その保守作業は実行不可であると判断する。複数のサーバ40のうち少なくとも1つのサーバ40から保守不可CDBを受信した場合には、その保守対象部品に対する保守作業を行なうことにより、マルチパスが閉塞し業務に影響が出る。
また、作業許可判断部13は、保守作業の作業予定時間までに保守対象パスを含む全てのサーバ40から保守可能CDBを受信した場合には、その保守作業は実行可能であると判断する。
また、上記判断を行なうに際して、作業許可判断部13は、インクワイアリ要求を送信してこないサーバ40については、そのサーバ40はダウンしているもしくは、そのサーバ40との間の全てのパスが閉塞していると判断し、監視対象から除外する。少なくとも、この応答の無いサーバ40に関しては、保守対象部品の保守作業を行なっても影響がないと考えられる。
さらに、作業許可判断部13は、サーバ40から受信した各パスについての保守可否情報において、保守許可CDBと保守不可CDBとの両方が含まれる場合であって、保守対象外パスが有効であり、更に、後述するパス操作部44が、保守対象パスを閉塞させた場合に、その保守作業を実行可能と診断する。
作業許可判断部13による判断結果は、作業許可情報出力部14に通知される。
作業許可情報出力部14は、作業許可判断部13による判断結果を出力する。すなわち、作業許可情報出力部14は、保守対象部品に対する保守作業の許可もしくは不許可を示す許可情報を保守PC70に出力する。
また、作業許可情報出力部14は、影響判断部11により保守対象部品がパスに影響がないものであることを通知されると、保守PC70に対して、保守対象部品に対する保守作業の許可を通知する。
サーバ40は、ストレージ装置10にアクセスして種々の処理を行なう上位装置であり、ストレージ装置10の記憶装置31にデータの書きこみや読み出しを行なう。
なお、図1及び図2に示す例においては、便宜上、サーバ40のハードウェア構成としてHBA46のみを示す。又、図1に示す例においては、便宜上、サーバ40−2についての機能構成の図示を省略し、サーバ40−1についてのみ、その機能構成を示しているが、サーバ40−2もサーバ40−1と同様の機能構成をそなえる。
サーバ40は、図示しないCPUや記憶部およびHBA46をそなえ、CPUによりOSや種々のプログラムを実行することにより、種々の機能を実現する情報処理装置である。
サーバ40は、コンピュータとしての機能を有しており、図1に示すように、パス情報通知部41,パス診断部42,パス診断結果出力部43,パス操作部44及び診断間隔変更部45として機能する。
なお、これらのパス情報通知部41,パス診断部42,パス診断結果出力部43,パス操作部44及び診断間隔変更部45としての機能を実現するためのプログラムは、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
パス情報通知部41,パス診断部42,パス診断結果出力部43,パス操作部44及び診断間隔変更部45としての機能を実現する際には、内部記憶装置(本実施形態では図示しないRAMやROM)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではサーバ40のCPU)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
パス情報通知部41は、ストレージ装置10に対して、マルチパスのパス組情報を通知する。パス情報通知部41は、サーバ40の起動時やマルチパス構築時に、マルチパス毎(パス組毎)にユニークな値をストレージ装置10に通知する。パス情報通知部41は、例えば「サーバ40毎に異なるCPUIDやサーバ名+マルチパスで管理するパス組番号」といったパス組情報を、予め規定したユニークなCDBでストレージ装置10に送信する。
なお、このパス情報通知部41としての機能は、例えば、サーバ40においてマルチパスドライバ(マルチパスソフトウェア)を実行することにより実現される。
パス診断部42は、所定のパス診断間隔が経過する毎にパス診断を行なう。パス診断は、ストレージ装置10に対して、自サーバ40におけるマルチパスを構成する全てのパスに、それぞれインクワイアリ要求を送信し、これらのインクワイアリ要求に対する応答であるインクワイアリ通知をそれぞれ受信することにより行なう。パス診断部42は、インクワイアリ要求を送信でき、且つ、このインクワイアリ要求への応答としてのインクワイアリ通知を受信できたパスを正常と判断する。
インクワイアリ要求の送信もしくはインクワイアリ通知の受信ができなかったパスについては、パス診断部42は、このパス上のスイッチ60やHBA46,CA24等のいずれかのネットワーク機器もしくは通信線51〜58に異常があると判断する。パス診断部42は、このような診断を、自サーバ40におけるマルチパスを構成する全てのパスに対して行なう。
パス診断部42は、ストレージ装置10から送信されるインクワイアリ通知を収集し、各パスについての各保守フラグに基づいて、保守作業を実行可能であるか否かを診断(パス診断)する。
そして、パス診断部42は、パス診断の結果として保守可能もしくは保守不可能との判断結果を示すCDB応答(保守可能CDB,保守不可CDB)をストレージ装置10に対して発行する。
図6は実施形態の一例としてのストレージシステム1におけるパス診断部42による保守判断例を示す図である。
パス診断部42は、各パスについて受信したインクワイアリ通知の保守フラグが全て保守対象外(図4に例示する値“2”)である場合には、その保守対象部品についての保守作業を実行可能(保守可能)であると判断する(保守判断)。これにより、後述するパス診断結果出力部43が保守可能CDBを発行する。この場合、サーバ40が影響するパスを含まない、もしくは、保守対象パスが既に閉塞していると考えられるからである。
また、パス診断部42は、各パスについて受信したインクワイアリ通知の保守フラグが全て保守対象(図4に例示する値“1”)である場合には、その保守対象部品についての保守作業を実行不可能(保守不可)であると判断する。これにより、後述するパス診断結果出力部43が保守不可CDBを発行する。保守対象部品の保守作業を行なうことにより全パスが閉塞すると考えられるからである。
さらに、パス診断部42は、受信したインクワイアリ通知の保守フラグに、保守対象外(図4に例示する値“2”)と保守対象(図4に例示する“1”)との両方が含まれる場合には、次に、保守対象パスと同一のパス組を成す保守対象外パスにおいて、診断が成功したか否かを確認する。すなわち、保守対象外パスについてのインクワイアリ要求の送信とインクワイアリ通知の受信が正常になされたかを確認する。
例えば、図1に示す例において、サーバ40−1はHBA46−1とHBA46−2との2つのパスでマルチパスが組まれている。この例において、パス診断部42は、HBA46−2のパスが保守対象パスである場合に、マルチパスを構成する保守対象外パスであるHBA46−1について、診断が成功したか否かを判断する。
全ての保守対象外パスにおいて診断が失敗した場合には、その保守対象部品についての保守作業を実行不可能(保守不可)であると判断する。これにより、後述するパス診断結果出力部43が保守不可CDBを発行する。
一方、少なくとも1つの保守対象外パスにおいて診断が成功した場合には、パス診断部42は、パス操作部44に通知を行ない、保守対象のパスを閉塞させる。
先の例においては、マルチパスにおける保守対象外パスであるHBA46−1の診断が成功した場合に、パス診断部42は、保守対象パスであるHBA46−2のパスをパス操作部44により閉鎖させる。
このパス操作部44によるパスの閉塞が完了すると、パス診断部42は、その保守対象部品についての保守作業を実行可能(保守可能)であると判断する。これにより、後述するパス診断結果出力部43が保守可能CDBを発行する。
また、このパス診断部42によるパス診断は、基本的には第1の間隔(基本パス診断間隔;例えば、10分)で繰り返し行なわれる。そして、このパス診断の実行間隔(パス診断間隔)は、後述する診断間隔変更部45によるパス診断間隔指示が行なわれると、後述する診断間隔変更部45により基本パス診断間隔よりも短い第2の間隔(例えば5秒)に変更される。
また、パス診断部42は、ストレージ装置10から保守完了を示す保守フラグを備えたインクワイアリ通知を受信すると、上記閉塞させたパスをパス操作部44に復旧させる。そして、パス診断部42は、パス操作部44によるパスの復旧が成功すると、パス診断結果出力部43に復旧完了CDBを発行させ、又、診断間隔変更部45に対して、パス診断の実行間隔を、第2の間隔から基本パス診断間隔に戻させる。
なお、パス操作部44によるパスの復旧が失敗すると、パス診断部42は、パス診断結果出力部43に復旧失敗CDBを発行させる。
パス診断結果出力部43は、パス診断部42による各判断結果を含めたCDB(保守可否情報)をストレージ装置10に送信することにより、診断結果をストレージ装置10に通知する。すなわち、パス診断結果出力部43は、保守可否情報として、保守作業を実行可能であると判断した場合には保守可能CDBを、又、保守作業を実行不可であると判断した場合には保守不可CDBをそれぞれ出力する。
また、パス診断結果出力部43は、保守PC70から保守中止指示もしくは保守完了報告が入力されるまで保守可能CDBを出力し続けることが望ましい。パス診断のタイミングはサーバ40毎に異なる場合がある。例えば、サーバ40間のパス診断のタイミングに10分の差があった場合に、当初はパスが正常であると判断し保守可能CDBを出力したが、何らかの理由により突然故障が発生することがある。このような場合に、パス診断によりパス異常を検出して保守不可となった場合に保守中止の応答を行なうためである。ただし、パス診断結果出力部43は、保守作業を実施不可と判断された時点で保守不可CDBを出力してもよい。
パス操作部44は、パスに対する処理を行なう。具体的にはパス操作部44は、パスを閉塞させたり、又、閉塞されているパスを復旧したりする。パスの閉塞は、例えば、パスの信号伝達を遮断したり電力供給を停止させる等、既知の種々の手法を用いて実現することができ、その詳細な説明は省略する。
診断間隔変更部45は、パス診断部42によるパス診断の間隔を変更する。診断間隔変更部45は、パス診断結果出力部43がパス診断結果をストレージ装置10に対して送信した後に、パス診断部42によるパス診断の実行間隔を、基本パス診断間隔から第2の間隔に変更させる通知を行なう。
パス診断の実行間隔を、基本パス診断間隔よりも短い第2の間隔に変更することにより、ストレージ装置10からインクワイアリ通知を早く受信することができるとともに、保守作業直前までパスの最新の状態を把握することができる。例えば、診断間隔が10分である場合には、サーバ40が把握しているパスの状態は約10分前の状態であり、最新の状態でない場合がある。すなわち、この10分の間に保守対象パスになんらかの異常が発生し、保守作業を行なうことで全パス閉塞が生じるおそれがある。
上述の如く構成された実施形態の一例としてのストレージシステム1における保守作業時のCEによる処理を、図7に示すフローチャート(ステップA10〜A70)に従って説明する。
CEは、保守PC70の保守画面から、その時刻よりも基本パス診断間隔(例えば、10分)以降の保守開始時刻を入力する(ステップA10)。又、CEは、保守PC70の保守画面から、保守作業の対象となる保守対象部品を入力する(ステップA20)。なお、これらのステップA10,A20の処理順序は、これに限定されるものではなく、ステップA20の処理をステップA10より先、もしくは同時に行なってもよい。これらの処理により、後述する図8に示すストレージ装置10の処理が開始される(ステップB10参照)。
CEは保守PC70の表示装置の保守画面に保守可能と表示されたか否かを確認する(ステップA30)。なお、保守画面への保守可能の表示は、後述する図8のステップB20において行なわれる。
保守画面に保守可能と表示された場合には(ステップA30のYESルート参照)、ステップA40において、CEは保守対象部品に対して保守作業を行なう(ステップA40)。保守作業を完了すると、CEは、保守PC70の保守画面において保守完了ボタンを選択することにより、保守作業の完了を報告する入力処理を行ない(ステップA50)、処理を終了する。
また、保守画面に保守可能と表示されない場合には(ステップA30のNOルート参照)、CEは、保守画面に保守可能と表示されるまで待ってから、保守対象部品に対して保守作業を行なう(ステップA60)。ここで、保守画面への保守可能との表示は、後述する図8のステップB120により行なわれる。
保守作業を完了すると、CEは、保守PC70の保守画面において保守完了ボタンを選択することにより、保守作業の完了を報告する入力処理を行なう(ステップA70)。この処理が、後述する図8のステップB130に反映される。その後、処理を終了する。
次に、本実施形態の一例としてのストレージシステム1における保守作業時のストレージ装置10の処理を、図8に示すフローチャート(ステップB10〜B170)に従って説明する。
前述した図7のステップB10,B20において入力された保守開始時刻及び保守対象部品に基づき、ストレージ装置10において、影響判断部11が、指定された保守対象部品について、その保守作業を行なうことによりパスに影響を与えるものであるか否かを判断する(ステップB10)。
保守対象部品が、その保守作業がパスに影響を与えない場合には(ステップB10のNOルート参照)、保守PC70の表示装置の保守画面に、保守可能と表示させ(ステップB20)、処理を終了する。この処理が、図7に示すステップA30のYESルートに反映される。
また、保守対象部品が、その保守作業がパスに影響を与える場合には(ステップB10のYESルート参照)、ストレージ装置10が接続される全てのパスに対してインクワイアリ通知の保守フラグの設定を行なう。
ステップB30では、ストレージ装置10が接続される全てのパスに対して、ステップB70までの制御を繰り返し実施するループ処理を開始する。
ステップB40では、影響判断部11が、保守対象部品に基づいてマルチパス構成管理テーブル231を参照して、各パスが保守対象パスであるか否かを確認する。影響判断部11が、パスが保守対象パスであると判断した場合には(ステップB40のYESルート参照)、パス診断への応答として送信するインクワイアリ通知に、保守対象パスであることを示す保守フラグを設定する(ステップB50)。
一方、影響判断部11が、パスが保守対象外パスであると判断した場合には(ステップB40のNOルート参照)、パス診断への応答として送信するインクワイアリ通知に、保守対象パスではないことを示す保守フラグを設定する(ステップB60)。
その後、制御がステップB70に進む。なお、ステップB70では、ステップB30に対応するループ端処理が実施される。ここで、全パスについての処理が完了すると、制御がステップB80に進む。
ステップB80では、通知情報出力部12が、サーバ40からのパス診断のインクワイアリ要求に応答して、パス毎にインクワイアリ通知を送信する。ここで、サーバ40からのパス診断は、後述する図9のステップC20により行なわれる。又、このインクワイアリ通知が、後述する図9に示すステップC30に反映される。
作業許可判断部13は、サーバ40から保守不可CDBを受信したかを確認する(ステップB90)。なお、保守可能CDBもしくは保守不可CDBの送信は、後述する図9のステップC80,C90により行なわれる。
複数のサーバ40のうち、少なくとも一つのサーバ40から保守不可CDBを受信すると(ステップB90のYESルート参照)、エラー処理へ移行する。なお、このエラー処理についての説明は、図10〜図12を用いて後述する。
複数のサーバ40のいずれからも保守不可CDBを受信していない場合には(ステップB90のNOルート参照)、次に、いずれのパスからもインクワイアリ要求を送信していないサーバ40があれば、そのサーバ40を監視対象から除外する(ステップB100)。
また、作業許可判断部13は、保守開始時刻までに保守対象パスを含む全てのサーバ40から保守可能CDBを受信したかを確認する(ステップB110)。保守開始時刻までに保守対象パスを含む全てのサーバ40から保守可能CDBを受信していない場合には(ステップB110のNOルート参照)、エラー処理へ移行する。
また、保守開始時刻までに保守対象パスを含む全てのサーバ40から保守可能CDBを受信した場合には(ステップB110のYESルート参照)、作業許可判断部13は、その保守作業は実行可能であると判断する。
作業許可情報出力部14が、保守PC70に対して保守対象部品に対する保守作業の許可を示す許可情報を出力し、保守PC70の保守画面に保守可能を表示させる(ステップB120)。この処理が、前述した図7に示すステップA60に反映される。
CEにより保守作業が行なわれ、保守PC70の保守画面において保守完了報告が入力されると(前述した図7のステップA70参照)、作業許可判断部13は、インクワイアリ通知に作業完了を示す保守フラグを設定する(ステップB130)。
通知情報出力部12は、サーバ40からパス診断のインクワイアリ要求を受信すると、パス毎にインクワイアリ通知を応答する(ステップB140)。サーバ40からのインクワイアリ要求は、後述する図9のステップC110において行なわれ、又、インクワイアリ通知は、後述する図9のステップC120に反映される。
その後、全ての保守対象パスから復旧完了CDBを受信したかを確認する(ステップB150)。なお、復旧完了CDBもしくは復旧失敗CDBの送信は、後述する図8のステップB150,B160により行なわれる。
全ての保守対象パスから復旧完了CDBを受信した場合、すなわち、全てのサーバ40から復旧完了CDB(復旧完了メッセージ)を受け取ると(ステップB150のYESルート参照)、作業許可情報出力部14が保守PC70の保守画面に保守完了を出力させ、保守作業を完了し(ステップB160)、処理を終了する。
また、全ての保守対象パスから復旧完了CDBを受信していない場合には(ステップB150のNOルート参照)、作業許可情報出力部14が、保守PC70の保守画面に保守エラーを出力させ(ステップB170)、処理を終了する。一定時間以内に保守完了CDBを受け取らなかったパスがある場合には、サーバ40のパスが復旧しなかった可能性があるので、その旨を保守PC70の保守画面に表示させてCEに通知するのである。かかる保守画面の通知を見たCEはSEにサーバ40の状態を確認するよう依頼する。
次に、実施形態の一例としてのストレージシステム1における保守作業時のサーバ40の処理を、図9に示すフローチャート(ステップC10〜C170)に従って説明する。
サーバ40においては、基本パス診断間隔(例えば、10分間隔)で全てのパスに対して定期的にパス診断を行なう(ステップC10〜C40)。
ステップC10では、サーバ40に接続された全てのパスに対して、ステップC40までの制御を繰り返し実施するループ処理を開始する。
ステップC20では、各パスに対するインクワイアリ要求を送信する。このインクワイアリ要求が、前述した図8に示すステップB80に反映される。又、ステップC30では、送信したインクワイアリ要求に対するインクワイアリ通知を受信する。インクワイアリ通知は、前述した図8のステップB80により行なわれる。
その後、制御がステップC40に進む。なお、ステップC40では、ステップC10に対応するループ端処理が実施される。ここで、全パスについての処理が完了すると、制御がステップC50に進む。
ステップC50では、パス診断部42が、ストレージ装置10から送信されるパス毎のインクワイアリ通知の各保守フラグを判断する。
保守フラグが全て保守対象外である場合には(ステップC50の“保守対象外のみ”ルート参照)、パス診断結果出力部43が保守可能CDBを発行する(ステップC80)。この保守可能CDBが、前述した図8に示すステップB90に反映される。
また、保守フラグが全て保守対象である場合には(ステップC50の“保守対象のみ”ルート参照)、パス診断結果出力部43が保守不可CDBを発行する(ステップC90)。この保守不可CDBが、前述した図8に示すステップB90に反映される。
さらに、受信したインクワイアリ通知の保守フラグに、保守対象外と保守対象との両方が含まれる場合には(ステップC50の“保守対象と保守対象外の両方”ルート参照)、次に、パス診断部42は、保守対象パスと同一のパス組を成す保守対象外パスにおいて、診断が成功したか否かを確認する(ステップC60)。
全ての保守対象外パスにおいて診断が失敗した場合には(ステップC60のNOルート参照)、ステップC90に移行する。
一方、少なくとも1つの保守対象外パスにおいて診断が成功した場合には(ステップC60のYESルート参照)、パス操作部44が保守対象のパスを閉塞させた後(ステップC70)、ステップC80に移行する。
その後、診断間隔変更部45が、パス診断部42によるパス診断の実行間隔を、基本パス診断間隔から第2の間隔(例えば、5秒間隔)に変更させ(ステップC100)、パス診断部42がこの新たに設定された第2の間隔でパス診断を実施する(ステップC110)。この処理が、前述した図8に示すステップB140に反映される。
ここで、CEによる保守作業が完了すると、前述した図8に示すステップB140により、保守完了を示す保守フラグを備えたインクワイアリ通知を受信する(ステップC120)。
診断間隔変更部45は、パス診断間隔を基本パス診断間隔に戻す(ステップC130)。なお、このパス診断間隔を基本パス診断間隔に戻す処理は、例えば、ステップC140によるパスの復旧を行なってから実施してもよく、適宜変更して実施することができる。又、ステップC70においてパスの閉塞を行なった場合には、パス操作部44が、閉塞していたパスを復旧させる(ステップC140)。パスの復旧が成功したかを確認し(ステップC150)、パスの復旧が成功した場合には(ステップC150のYESルート参照)、パス診断結果出力部43が、復旧したパスを介して復旧完了CDBを出力する(ステップC160)。この処理が、前述した図8に示すステップB150に反映される。その後、処理を終了する。
また、パスの復旧が成功しなかった場合には(ステップC150のNOルート参照)、パス診断結果出力部43が、閉塞させたパスとパス組を成すパスを介して復旧失敗CDBを出力する(ステップC170)。この処理が、前述した図8に示すステップB150に反映される。その後、処理を終了する。
次に、実施形態の一例としてのストレージシステム1におけるエラー処理時のCEの処理を、図10に示すフローチャート(ステップD10,D20)に従って説明する。
前述した図8のステップB90のNOルートもしくはステップB110のNOルートにおいて、保守PC70の保守画面には、保守作業の中止を指示する入力画面(例えば、保守中止ボタン)や保守不可のパスが表示されている。
CEは、入力画面において保守中止ボタンを選択して、保守作業の中止を指示する入力処理を行なう(ステップD10)。この中止指示は、ストレージ装置10やサーバ40に保守中止指示として送信される。この処理が、後述する図11に示すステップE20に反映される。又、保守画面への保守中止ボタンや保守不可のパスの表示は、後述する図11に示すステップE10において行なわれる。
また、CEは作業を中断し、SEにサーバ40の状態を確認するよう依頼し(ステップD20)、処理を終了する。
次に、実施形態の一例としてのストレージシステム1におけるエラー処理時のストレージ装置10の処理を、図11に示すフローチャート(ステップE10〜E30)に従って説明する。
ストレージ装置10においては、例えば、作業許可判断部13が保守PC70の保守画面に保守不可を示す情報及び保守不可のパスを表示させる(ステップE10)。この処理が、前述した図10に示すステップD10に反映される。
影響判断部11は、インクワイアリ通知の保守フラグに保守中止を設定する(ステップE20)。インクワイアリ通知の保守フラグへの保守中止の設定は、図10のステップD10に基づいて行なわれる。又、この処理が、後述する図12に示すステップF10に反映される。
その後、作業許可情報出力部14は、保守PC70の保守画面に、保守作業を中止した旨の表示を行なう(ステップE30)。なお、保守作業の中止指示は前述した図10のステップD10において行なわれる。
又、この処理が、後述する図12に示すステップF30に反映される。その後、処理を終了する。
次に、実施形態の一例としてのストレージシステム1におけるエラー処理時のサーバ40の処理を、図12に示すフローチャート(ステップF10〜F30)に従って説明する。
前述した図11のステップE20においてインクワイアリ通知の保守フラグに保守中止を設定すると、このインクワイアリ通知を受信したサーバ40において、パス操作部44が、前述した図9のステップC70において閉塞させたパスを復旧させる(ステップF10)。
また、図9のステップC100において変更した診断間隔を、基本パス診断間隔に戻す(ステップF20)。
その後、パス診断結果出力部43が、復旧完了CDBを出力する(ステップF30)。又、この処理が、前述した図11のステップE30に反映される。その後、処理を終了する。
従って、本ストレージシステム1は、1以上のサーバ40と、前記1以上のサーバ40に複数のパスを介して接続される処理装置10とを備えるネットワークシステム1であって、当該ネットワークシステム1における各パスについて、保守作業の対象である保守対象部品に基づいて、前記複数のパスの情報を管理するマルチパス構成管理テーブル231を参照し、前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断する影響判断部11と、各パスについて、それぞれ前記被影響パスか前記無影響パスかを示す判断結果情報を出力するパス影響情報出力部12と、各パスについての前記判断結果情報に基づいて、前記保守作業を実行可能であるか否かを診断する保守可否診断部42と、前記保守可否診断部による当該判断結果を保守可否情報として出力する保守可否情報出力部43と、前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力する作業許可情報出力部14とをそなえる。
このように、実施形態の一例としてのストレージシステム1によれば、CEがストレージ装置10に接続した保守PC70において保守対象部品を入力するだけで、CEに対して保守作業の許可もしくは不許可の通知が行われる。これにより、SEによるシステム構成の確認等が不要となり、作業性が向上する。
本ストレージシステム1によれば、特に、CEが以下の(a),(b),(c)の処理を実行するだけで保守作業を行なうことができる。
(a)CEが保守PC70の保守画面で保守開始を選択し保守開始時間を入力する。
(b)CEが保守画面において保守可能と表示されたことを確認してから、部品交換等の保守作業を実施する。
(c)CEが保守画面において保守完了を入力し、保守完了とする。
従って、従来手法と比べて、保守作業を少ない労力で実施することができ、利便性が高い。又、人間(CE)が実行する処理を低減することにより、人為的なミスの発生確率を低減することもでき、信頼性を向上させることができる。
また、例えば、CM111において、影響判断部11が、保守対象部品に基づきマルチパス構成管理テーブル231を参照して、保守作業がパスに与える影響を判断する。これにより、SEに対する処理要求を行なう必要がなく、利便性が高い。
また、マルチパス構成管理テーブル231を生成するに際して、サーバ40からCDBによりパス組情報等を送信する。これにより、ストレージ装置10がLANに接続されていない場合でも、パス組情報を取得することができ、利便性が高い。
診断間隔変更部45が、パス診断部42によるパス診断間隔を、基本パス診断間隔(例えば10分)よりも短い第2パス診断間隔に変更する。これにより、サーバ40間でパス診断のタイミングずれを小さくすることができる。特に、第2パス診断間隔を短くすることにより、ストレージシステム1における最新の状態を反映さえることができ、信頼性が向上する。
そして、本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上述した実施形態においては、ストレージシステム1が1つのストレージ装置10と2つのサーバ40を備えているがこれに限定されるものではない。すなわち、2以上のストレージ装置10をそなえてもよく、又、1つもしくは3つ以上のサーバ40をそなえてもよい。
また、上述した実施形態においては、ストレージシステム1における各パスの情報を管理するパス管理情報として、テーブル状に構成されたマルチパス構成管理テーブル231をそなえているが、これに限定されるものではない。すなわち、パス管理情報にそなえられる情報をテーブル以外の形態で管理してもよい。
さらに、上述した実施形態においては、サーバ40とストレージ装置10とをネットワーク50を介して接続したストレージシステム1について示しているが、これに限定されるものではない。すなわち、ストレージ装置に代えて他の処理装置をそなえ、複数のコンピュータがネットワークを介してこの処理装置を共有するネットワークシステムであってもよい。
なお、本発明の各実施形態が開示されていれば、本発明のネットワークシステム,保守作業管理方法,処理装置及びプログラムを当業者によって実施・製造することが可能である。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
保守作業の対象である保守対象部品を有する保守対象装置と、前記保守対象装置と複数のパスを介して接続される複数の処理装置とを備えるネットワークシステムであって、
前記保守対象装置は、前記複数のパスの情報を管理するパス管理情報を参照し、前記ネットワークシステムにおける各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断する影響判断部と、
前記影響判断部によって判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力するパス影響情報出力部と、を備え、
各処理装置は、
自装置と接続しているパスの前記パス影響情報に基づいて、前記保守作業が実行可能であるか否かを診断する保守可否診断部と、
前記保守可否診断部による診断結果を保守可否情報として前記保守対象装置に出力する保守可否情報出力部と、を備え、
前記保守対象装置は、前記複数の処理装置の前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力することを特徴とする、ネットワークシステム。
(付記2)
前記保守可否診断部が、各パスについての前記パス影響情報に基づき、前記ネットワークシステムにおける全てのパスが無影響パスであることを示す場合に、前記保守作業を実行可能と診断することを特徴とする、付記1記載のネットワークシステム。
(付記3)
前記保守可否診断部は、各パスについての前記パス影響情報に基づき、前記ネットワークシステムにおける全てのパスが被影響パスであることを示す場合に、前記保守作業を実行不可能と診断することを特徴とする、付記1又は2記載のネットワークシステム。
(付記4)
パスを閉塞可能な閉塞処理部を備え、
前記保守可否診断部は、各パスについての前記パス影響情報に基づき、当該ネットワークシステムにおいて被影響パスと無影響パスとの両方が含まれる場合であって、前記無影響パスが有効である場合に、前記閉塞処理部が、前記被影響パスを閉塞させた場合に、前記保守作業を実行可能と診断することを特徴とする、付記1〜3のいずれか1項に記載のネットワークシステム。
(付記5)
前記保守作業の中止を指示する保守中止指示が入力されると、前記保守作業の中止を示す中止通知情報を出力する中止通知情報出力部を備え、
前記中止通知情報が出力されると、前記閉塞処理部が、前記パスの閉塞を解除することを特徴とする、付記4記載のネットワークシステム。
(付記6)
前記保守可否診断部が前記保守作業を実行可能であるか否かを診断した後に、前記保守可否診断部による前記パス影響情報の収集間隔を短くする間隔変更部を備えることを特徴とする、付記1〜5のいずれか1項に記載のネットワークシステム。
(付記7)
前記保守作業の中止を指示する保守中止指示が入力されると、前記保守作業の中止を示す中止通知情報を出力する中止通知情報出力部を備え、
前記中止通知情報が出力されると、前記間隔変更部が短縮した前記パス影響情報の収集間隔を戻すことを特徴とする、付記6記載のネットワークシステム。
(付記8)
複数の前記保守可否情報出力部からそれぞれ送信される前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を判断する作業許可判断部を備え、
前記作業許可判断部による判断結果に基づいて前記許可情報を出力することを特徴とする、付記1〜7のいずれか1項に記載のネットワークシステム。
(付記9)
前記パスに関する情報を通知するパス情報通知部と、
前記パス情報通知部から通知された前記パスに関する情報に基づいて前記パス管理情報を作成する、パス管理情報作成部とを備えることを特徴とする、付記1〜8のいずれか1項に記載のネットワークシステム。
(付記10)
保守作業の対象である保守対象部品を有する保守対象装置と、前記保守対象装置と複数のパスを介して接続される複数の処理装置とを備えるネットワークシステムにおける保守作業管理方法であって、
前記保守対象装置は、前記複数のパスの情報を管理するパス管理情報を参照し、前記ネットワークシステムにおける各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断するステップと、
判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力するステップと、
各処理装置において、自装置と接続しているパスの前記パス影響情報に基づいて、前記保守作業を実行可能であるか否かを診断するステップと、
前記診断結果を保守可否情報として前記保守対象装置に出力するステップと、
前記保守対象装置において、前記複数の処理装置の前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力するステップと
を備えることを特徴とする、保守作業管理方法。
(付記11)
各パスについての前記パス影響情報に基づき、当該ネットワークシステムにおける全てのパスが無影響パスであることを示す場合に、前記保守作業を実行可能と診断することを特徴とする、付記10記載の保守作業管理方法。
(付記12)
各パスについての前記パス影響情報に基づき、当該ネットワークシステムにおける全てのパスが被影響パスであることを示す場合に、前記保守作業を実行不可能と診断することを特徴とする、付記10又は11記載の保守作業管理方法。
(付記13)
各パスについての前記パス影響情報に基づき、当該ネットワークシステムにおいて被影響パスと無影響パスとの両方が含まれる場合であって、前記無影響パスが有効である場合に、前記被影響パスが閉塞された場合に、前記保守作業を実行可能と診断することを特徴とする、付記10〜12のいずれか1項に記載の保守作業管理方法。
(付記14)
前記保守作業の中止を指示する保守中止指示が入力されると、前記保守作業の中止を示す中止通知情報を出力するステップをそなえ、
前記中止通知情報が出力されると、前記パスの閉塞を解除することを特徴とする、付記13記載の保守作業管理方法。
(付記15)
前記保守作業を実行可能であるか否かを診断した後に、前記パス影響情報の収集間隔を短くするステップをそなえることを特徴とする、付記10〜14のいずれか1項に記載の保守作業管理方法。
(付記16)
前記保守作業の中止を指示する保守中止指示が入力されると、前記保守作業の中止を示す中止通知情報を出力するステップをそなえ、
前記中止通知情報が出力されると、短縮した前記パス影響情報の収集間隔を戻すことを特徴とする、付記15記載の保守作業管理方法。
(付記17)
複数の処理装置からそれぞれ送信される前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を判断するステップをそなえ、
前記判断結果に基づいて前記許可情報を出力することを特徴とする、付記10〜16のいずれか1項に記載の保守作業管理方法。
(付記18)
前記パスに関する情報を通知するステップと、
通知された前記パスに関する情報に基づいて前記パス管理情報を作成するステップとをそなえることを特徴とする、付記10〜17のいずれか1項に記載の保守作業管理方法。
(付記19)
保守作業の対象である保守対象部品を有する保守対象装置と複数のパスを介して接続される処理装置であって、
前記保守対象装置は、前記複数のパスの情報を管理するパス管理情報を参照し、各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断する影響判断部と、
前記影響判断部によって判断された判断結果を各パスについてのパス影響情報として出力するパス影響情報出力部と、
自装置と接続しているパスの前記パス影響情報に基づいて行われた、前記保守作業を実行可能であるか否かの診断結果を表す保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力する作業許可情報出力部と
を備えることを特徴とする、処理装置。
(付記20)
保守作業の対象である保守対象部品を有する保守対象装置と、前記保守対象装置と複数のパスを介して接続される複数の処理装置とを備えるネットワークシステムにおいて、前記複数のパスの情報を管理するパス管理情報を参照し、前記ネットワークシステムにおける各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断し、
判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力し、
自装置と接続しているパスの前記パス影響情報に基づいて行われた、前記保守作業を実行可能であるか否かの断結果を表す保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力する
処理をコンピュータに実行させることを特徴とする、プログラム。
1 ストレージシステム(ネットワークシステム)
10 ストレージ装置
11 影響判断部
12 通知情報出力部(パス影響情報出力部,中止情報出力部)
13 作業許可判断部
14 作業許可情報出力部
15 テーブル管理部
21 バッファメモリ
22 ROM
23 RAM
24,24−1〜24−4 CA
31 記憶装置
40,40−1,40−2 サーバ
41 パス情報通知部
42 パス診断部(保守可否判断部)
43 パス診断結果出力部(保守可否情報出力部)
44 パス操作部(閉塞処理部)
45 診断間隔変更部(間隔変更部)
46,46−1〜46−6 HBA
50 ネットワーク
51〜58 通信線
60,60−1,60−2 スイッチ
70 保守PC
110 CPU
111,111−1,111−2 CM
231 マルチパス構成管理テーブル

Claims (11)

  1. 保守作業の対象である保守対象部品を有する保守対象装置と、前記保守対象装置と複数のパスを介して接続される複数の処理装置とを備えるネットワークシステムであって、
    前記保守対象装置は、
    保守作業がパスに影響を与える保守部品の一覧である参照情報を参照して、保守対象部品が、保守作業を行なうことによりパスに影響を与えるものであるか否かを判断し、保守対象部品が、その保守作業を行なうことによりパスに影響が出るものである場合に、パス毎に、中継装置情報、当該パスが構成するマルチパスを特定する情報および保守可能もしくは保守不可を示す情報を対応付けることにより構成された、前記複数のパスの情報を管理するパス管理情報を参照し、保守対象部品が前記パス管理情報に登録されたパスの構成要素に含まれるかを判断することで、前記ネットワークシステムにおける各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断する影響判断部と、
    前記影響判断部によって判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力するパス影響情報出力部と、を備え、
    各処理装置は、
    自装置と接続しているパスの前記パス影響情報に基づいて、前記保守作業が実行可能であるか否かを診断する保守可否診断部と、
    前記保守可否診断部による診断結果を保守可否情報として前記保守対象装置に出力する保守可否情報出力部と、を備え、
    前記保守対象装置は、前記複数の処理装置の前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力することを特徴とする、ネットワークシステム。
  2. 前記保守可否診断部が、各パスについての前記パス影響情報に基づき、前記ネットワークシステムにおける全てのパスが無影響パスであることを示す場合に、前記保守作業を実行可能と診断することを特徴とする、請求項1記載のネットワークシステム。
  3. 前記保守可否診断部は、各パスについての前記パス影響情報に基づき、前記ネットワークシステムにおける全てのパスが被影響パスであることを示す場合に、前記保守作業を実行不可能と診断することを特徴とする、請求項1又は2記載のネットワークシステム。
  4. パスを閉塞可能な閉塞処理部を備え、
    前記保守可否診断部は、各パスについての前記パス影響情報に基づき、当該ネットワークシステムにおいて被影響パスと無影響パスとの両方が含まれる場合であって、前記無影響パスが有効である場合に、前記閉塞処理部が、前記被影響パスを閉塞させた場合に、前記保守作業を実行可能と診断することを特徴とする、請求項1〜3のいずれか1項に記載のネットワークシステム。
  5. 前記保守作業の中止を指示する保守中止指示が入力されると、前記保守作業の中止を示す中止通知情報を出力する中止通知情報出力部を備え、
    前記中止通知情報が出力されると、前記閉塞処理部が、前記パスの閉塞を解除することを特徴とする、請求項4記載のネットワークシステム。
  6. 前記保守可否診断部が前記保守作業を実行可能であるか否かを診断した後に、前記保守可否診断部による前記パス影響情報の収集間隔を短くする間隔変更部を備えることを特徴とする、請求項1〜5のいずれか1項に記載のネットワークシステム。
  7. 前記保守作業の中止を指示する保守中止指示が入力されると、前記保守作業の中止を示す中止通知情報を出力する中止通知情報出力部を備え、
    前記中止通知情報が出力されると、前記間隔変更部が短縮した前記パス影響情報の収集間隔を戻すことを特徴とする、請求項6記載のネットワークシステム。
  8. 複数の前記保守可否情報出力部からそれぞれ送信される前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を判断する作業許可判断部を備え、
    前記作業許可判断部による判断結果に基づいて前記許可情報を出力することを特徴とする、請求項1〜7のいずれか1項に記載のネットワークシステム。
  9. 前記パスに関する情報を通知するパス情報通知部と、
    前記パス情報通知部から通知された前記パスに関する情報に基づいて前記パス管理情報を作成する、パス管理情報作成部とを備えることを特徴とする、請求項1〜8のいずれか1項に記載のネットワークシステム。
  10. 保守作業の対象である保守対象部品を有する保守対象装置と、前記保守対象装置と複数のパスを介して接続される複数の処理装置とを備えるネットワークシステムにおける保守作業管理方法であって、
    前記保守対象装置において保守作業がパスに影響を与える保守部品の一覧である参照情報を参照して、保守対象部品が、保守作業を行なうことによりパスに影響を与えるものであるか否かを判断し、保守対象部品が、その保守作業を行なうことによりパスに影響が出るものである場合に、パス毎に、中継装置情報、当該パスが構成するマルチパスを特定する情報および保守可能もしくは保守不可を示す情報を対応付けることにより構成された、前記複数のパスの情報を管理するパス管理情報を参照し、保守対象部品が前記パス管理情報に登録されたパスの構成要素に含まれるかを判断することで、前記ネットワークシステムにおける各パスが前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断するステップと、
    判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力するステップと、
    各処理装置において、自装置と接続しているパスの前記パス影響情報に基づいて、前記保守作業を実行可能であるか否かを診断するステップと、
    前記診断結果を保守可否情報として前記保守対象装置に出力するステップと、
    前記保守対象装置において、前記複数の処理装置の前記保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力するステップと
    を備えることを特徴とする、保守作業管理方法
  11. 保守作業の対象である保守対象部品を有し、複数の処理装置と複数のパスを介して接続されるコンピュータに、
    保守作業がパスに影響を与える保守部品の一覧である参照情報を参照して、保守対象部品が、保守作業を行なうことによりパスに影響を与えるものであるか否かを判断し、保守対象部品が、その保守作業を行なうことによりパスに影響が出るものである場合に、ス毎に、中継装置情報、当該パスが構成するマルチパスを特定する情報および保守可能もしくは保守不可を示す情報を対応付けることにより構成された、前記複数のパスの情報を管理するパス管理情報を参照し、保守対象部品が前記パス管理情報に登録されたパスの構成要素に含まれるかを判断することで、前記複数のパスのそれぞれについて前記保守作業による影響を受ける被影響パスであるか前記保守作業による影響を受けない無影響パスであるかを判断し、
    判断された判断結果を各パスについてのパス影響情報として前記複数の処理装置に出力し、
    自装置と接続しているパスの前記パス影響情報に基づいて行われた、前記保守作業を実行可能であるか否かの断結果を表す保守可否情報に基づいて、前記保守対象部品に対する前記保守作業の許可もしくは不許可を示す許可情報を出力する
    処理を実行させることを特徴とする、プログラム。
JP2014514279A 2012-05-08 2012-05-08 ネットワークシステム,保守作業管理方法及びプログラム Expired - Fee Related JP5928581B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/061746 WO2013168229A1 (ja) 2012-05-08 2012-05-08 ネットワークシステム,保守作業管理方法,処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2013168229A1 JPWO2013168229A1 (ja) 2015-12-24
JP5928581B2 true JP5928581B2 (ja) 2016-06-01

Family

ID=49550314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014514279A Expired - Fee Related JP5928581B2 (ja) 2012-05-08 2012-05-08 ネットワークシステム,保守作業管理方法及びプログラム

Country Status (6)

Country Link
US (1) US20150046601A1 (ja)
EP (1) EP2849074A4 (ja)
JP (1) JP5928581B2 (ja)
KR (1) KR101532189B1 (ja)
CN (1) CN104285217A (ja)
WO (1) WO2013168229A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015107676A1 (ja) * 2014-01-17 2015-07-23 株式会社日立製作所 計算機システムの管理システム及び管理方法
US10855791B2 (en) * 2014-11-25 2020-12-01 Netapp, Inc. Clustered storage system path quiescence analysis
JP6869869B2 (ja) * 2017-10-26 2021-05-12 株式会社日立製作所 制御システムのための対策立案システムおよび監視装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683563A (en) * 1984-10-11 1987-07-28 American Telephone And Telegraph Company, At&T Bell Laboratories Data communication network
JP3809915B2 (ja) * 1995-12-28 2006-08-16 富士通株式会社 入出力構成変更装置
US6654803B1 (en) * 1999-06-30 2003-11-25 Nortel Networks Limited Multi-panel route monitoring graphical user interface, system and method
JP4039794B2 (ja) * 2000-08-18 2008-01-30 富士通株式会社 マルチパス計算機システム
US20030189929A1 (en) 2002-04-04 2003-10-09 Fujitsu Limited Electronic apparatus for assisting realization of storage area network system
JP2004173136A (ja) * 2002-11-22 2004-06-17 Fujitsu Ltd ネットワーク管理装置
JP2005301442A (ja) * 2004-04-07 2005-10-27 Hitachi Ltd ストレージ装置
CA2513804C (en) * 2004-07-27 2014-07-29 Fabric Embedded Tools Corporation Fabric network management and diagnostic tool
US20060223569A1 (en) * 2005-04-04 2006-10-05 Mithril, Llc Handheld medium probe for managing wireless networks
JP4892919B2 (ja) * 2005-10-13 2012-03-07 富士通株式会社 リモート保守システム、メール接続確認方法、メール接続確認プログラム及びメール送信環境診断プログラム
US7937481B1 (en) * 2006-06-27 2011-05-03 Emc Corporation System and methods for enterprise path management
FR2908575B1 (fr) * 2006-11-09 2009-03-20 At & T Corp Methode et appareil pour fournir un equilibrage de charge base sur le flux
WO2008114360A1 (ja) * 2007-03-16 2008-09-25 Fujitsu Limited ストレージシステム、ストレージ装置、ファームウェアの活性交換方法
JP2009009335A (ja) * 2007-06-27 2009-01-15 Hitachi Ltd ストレージシステム及びパス管理方法
US8204980B1 (en) * 2007-06-28 2012-06-19 Emc Corporation Storage array network path impact analysis server for path selection in a host-based I/O multi-path system
JP4973734B2 (ja) * 2007-09-26 2012-07-11 富士通株式会社 ネットワーク監視システム、経路抽出方法、プログラム、及びプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5112523B2 (ja) * 2009-02-09 2013-01-09 株式会社日立製作所 ストレージシステムにおける通信経路の設定方法、及び管理装置
US8824274B1 (en) * 2011-12-29 2014-09-02 Juniper Networks, Inc. Scheduled network layer programming within a multi-topology computer network
US8787154B1 (en) * 2011-12-29 2014-07-22 Juniper Networks, Inc. Multi-topology resource scheduling within a computer network

Also Published As

Publication number Publication date
WO2013168229A1 (ja) 2013-11-14
JPWO2013168229A1 (ja) 2015-12-24
KR20150009974A (ko) 2015-01-27
KR101532189B1 (ko) 2015-06-26
EP2849074A1 (en) 2015-03-18
EP2849074A4 (en) 2015-12-09
US20150046601A1 (en) 2015-02-12
CN104285217A (zh) 2015-01-14

Similar Documents

Publication Publication Date Title
CN104679602B (zh) 用于在存储区域网络中处置事件的方法和系统
US8301854B2 (en) Storage system and virtualization method
US7302506B2 (en) Storage system
US7475131B2 (en) Network topology display method, management server, and computer program product
JP5463267B2 (ja) 仮想計算機システムおよび仮想計算機の移行方法
JP4698316B2 (ja) アクセスパス管理方法及びプログラム
US7020089B2 (en) Information processing apparatus and method of controlling the information processing apparatus
US7865767B2 (en) Storage system and method for copying data to plurality of sites
TWI409624B (zh) 自磁碟陣列隔離一驅動器以進行診斷操作
US8271492B2 (en) Computer for identifying cause of occurrence of event in computer system having a plurality of node apparatuses
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
JP2007042008A (ja) 記憶制御方法及び記憶制御システム
JP2016057795A (ja) ストレージ制御装置,ストレージシステム及びストレージ制御プログラム
JP2008077325A (ja) ストレージ装置及びストレージ装置に対する設定方法
JP2006065709A (ja) データ処理システム
JP4486921B2 (ja) ストレージ仮想化装置およびそれを用いたコンピュータシステム
JP5928581B2 (ja) ネットワークシステム,保守作業管理方法及びプログラム
US20110185226A1 (en) Storage system and control methods for the same
JP2006331458A (ja) ストレージサブシステムおよび性能チューニング方法
JP2004341994A (ja) プログラム、情報処理装置、及び情報処理装置の制御方法
JP2015069352A (ja) ストレージ制御装置,ストレージ制御方法及びストレージ制御プログラム
JP6810341B2 (ja) 管理装置、情報処理システムおよび管理プログラム
JP5760585B2 (ja) ストレージシステムおよび異常発生箇所判定方法
JP5736875B2 (ja) ストレージ装置およびストレージ装置の制御方法
JP2000284982A (ja) アクセス制御装置及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151208

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160411

R150 Certificate of patent or registration of utility model

Ref document number: 5928581

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees