JP4489128B2 - コンピュータシステムを監視する装置及び方法 - Google Patents

コンピュータシステムを監視する装置及び方法 Download PDF

Info

Publication number
JP4489128B2
JP4489128B2 JP2008112103A JP2008112103A JP4489128B2 JP 4489128 B2 JP4489128 B2 JP 4489128B2 JP 2008112103 A JP2008112103 A JP 2008112103A JP 2008112103 A JP2008112103 A JP 2008112103A JP 4489128 B2 JP4489128 B2 JP 4489128B2
Authority
JP
Japan
Prior art keywords
monitoring
monitoring target
target
information
system component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008112103A
Other languages
English (en)
Other versions
JP2009265785A (ja
Inventor
安彦 鬼塚
沢希 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008112103A priority Critical patent/JP4489128B2/ja
Priority to US12/136,803 priority patent/US8140913B2/en
Publication of JP2009265785A publication Critical patent/JP2009265785A/ja
Application granted granted Critical
Publication of JP4489128B2 publication Critical patent/JP4489128B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、コンピュータシステムの監視に関する。
例えば図1に示すコンピュータシステムが知られている。このコンピュータシステムの構成要素装置(以下、「システム構成要素」と言う)としては、一以上のホスト(Host1〜Host4)、一以上のストレージ装置(Storage1〜Storage2)、及び、一以上のFC-SW(FC-SW1〜FC-SW3)がある。FC-SWは、Fibre Channel Switchの略であり、ホスト、ストレージ装置及び他のFC-SWのうちの少なくとも一つが接続される。
これらのシステム構成要素を監視する装置として、システム監視装置50がある。システム監視装置50は、例えばLAN(Local Area Network)経由で、各システム構成要素を監視する。
図1のコンピュータシステムによれば、例えばStorage1が計画的に停止されると、システム構成要素内の下記監視対象(1)〜(6)について、下記理由によりエラーが検出される。
(1)Host1内のDドライブ:(理由)停止したStorage1内のLU1にマッピングされている論理ボリュームであるため。(ちなみに、「LU」とはLogcial Unitの略であり、ここでは、HDD等の物理的な記憶装置を基に形成された論理的な記憶装置である。)
(2)Host3内のDドライブ:(理由)停止したStorage1内のLU3にマッピングされている論理ボリュームであるため。
(3)Host4内のDドライブ:(理由)停止したStorage1内のLU2にマッピングされている論理ボリュームであるため。
(4)FC-SW2のPort4(P4):(理由)停止したStorage1のFC-PortAに接続されているPortであるため。
(5)FC-SW3のPort2(P2):(理由)停止したStorage1のFC-PortBに接続されているPortであるため。
(6)Storage1内の全装置要素(FC-PortA、FC-PortB、LU1、LU2及びLU3):(理由)停止したStorage1内の要素であるため。
このため、システム監視装置50は、図2に示す通り、上記(1)〜(6)の監視対象についてのエラーをコンソール画面(例えば、ディスプレイスクリーンに描画されるウィンドウ)経由でアラートする。エラーがアラートされている監視対象及び/又はその監視対象を有するシステム構成要素について、管理者などの人間が、エラーの原因を調べることになる。
なお、特許文献1には、計画停止や工事中といった属性情報を通知する技術が開示されている。このため、特許文献1の技術を、図1及び図2を参照して説明した監視技術に適用すれば、Storage1にエラーが生じている理由が計画停止であることを表示することが期待できる。
特開2006−190138号公報
図1及び図2に示したように、複数のシステム構成要素の各々がそれら複数のシステム構成要素の他のシステム構成要素と依存関係を有する場合には、一つの監視対象についてエラーが検出されると、コンピュータシステム全体として多数のエラーが検出されてしまう。特許文献1によれば、計画停止されたStorage1については、エラーの原因が計画停止であることが表示され得るものの、Storage1と依存関係を有する他のシステム構成要素内の他の監視対象がどれであるか、及び、他の監視対象についてエラーが検出された原因は、分からない。
また、そもそも、計画停止などの意図的な停止に起因して検出されたエラーは、生じた原因を調べる必要の無いと考えられる。なぜなら、意図的な停止は、メンテナンスや再起動などの目的があって行われる停止であるため、エラーが検出された原因が自明だからである。同様の理由から、或る監視対象に対する意図的な停止に起因して生じた、その或る監視対象に依存している別の監視対象について検出されたエラーも、原因を調べる必要が無いと考えられる。
しかし、上記のように、意図的に停止された監視対象に依存している他の監視対象がどれであるか、及び、他の監視対象についてエラーが検出された原因はわからないため、何らかの監視対象についてエラーが検出された場合には、そのエラーが本来原因を調べる必要の無いエラーであっても、管理者などの人間が、エラーの原因を調べることになる。具体例として、図2によれば、意図的な停止に起因したエラーが検出された監視対象(1)〜(6)の他に、意図的な停止とは別の原因によるエラーが検出された監視対象(X)がある。この場合、どのエラーが原因を調べる必要が無くどのエラーが原因を調べる必要が有るかの選別ができず、管理者の負担が大きい。
従って、本発明の目的は、コンピュータシステムの監視において、原因を調べる必要性の低いエラーについてまでアラートしないよう制御することにある。
本発明の他の目的は、後述の説明から明らかになるであろう。
システム監視装置が、意図的に停止されたシステム構成要素又は監視対象とそれに依存する別の監視対象(依存対象)とを特定し、意図的に停止されたシステム構成要素内の監視対象又は意図的に停止された監視対象と、そのシステム構成要素又は監視対象の依存対象については、エラー状態が検出されてもアラートを非実行とする。
具体的には、システム監視装置が、記憶部と、停止特定部と、依存特定部と、監視部とを備える。記憶部が、依存関係情報を記憶する。依存関係情報は、システム構成要素又はシステム構成要素内の監視対象と、それに依存する、他のシステム構成要素内の監視対象である依存対象との関係を表した情報である。停止特定部が、前記複数のシステム構成要素のうちの意図的に停止されたシステム構成要素又は監視対象を特定する。依存特定部が、前記意図的に停止されたシステム構成要素又は監視対象に依存する依存対象を前記依存関係情報から特定する。前記監視部は、各監視対象の状態を監視し、エラー状態が検出された監視対象についてエラーのアラートを画面に表示するが、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象とについては、エラー状態が検出されてもアラートを非表示とする。
「意図的な停止」は、計画停止に限らず、ユーザからの指示(例えば、電源オフ或いは再起動の指示)に従う停止であっても良い。コンピュータシステムは、オープン系のシステムであっても良いし、メインフレーム系のシステムであっても良い。記憶部は、メモリなどの記憶資源である。停止特定部、依存特定部及び監視部のうちの少なくとも一つは、例えば、ハードウェア、コンピュータプログラム又はそれらの組み合わせ(例えば一部をコンピュータプログラムにより実現し残りをハードウェアで実現すること)により構築することができる。コンピュータプログラムは、所定のプロセッサに読み込まれて実行される。また、コンピュータプログラムがプロセッサに読み込まれて行われる情報処理の際、適宜に、メモリ等のハードウェア資源上に存在する記憶域が使用されてもよい。また、コンピュータプログラムは、CD−ROM等の記録媒体から計算機にインストールされてもよいし、通信ネットワークを介して計算機にダウンロードされてもよい。また、ストレージデバイスは、物理的であっても論理的であっても良い。物理的なストレージデバイスとしては、例えば、ハードディスク、磁気ディスク、光ディスク、磁気テープ、或いは半導体メモリであっても良い。論理的なストレージデバイスとしては、論理ボリュームとすることができる。停止特定部、依存特定部及び監視部は、例えば、後述のシステム監視部1014で実現することが可能である。
以下、図面を参照して、本発明の一実施形態を説明する。
図3は、本発明の一実施形態に係るコンピュータシステムとそれを監視するシステム監視装置を示す。
システム監視装置101が監視するコンピュータシステムのシステム構成要素として、一以上のホスト(Host1〜Host4)、一以上のストレージ装置(Storage1〜Storage2)、及び、一以上のFC-SW(FC-SW1〜FC-SW3)がある。FC-SWには、ホスト、ストレージ装置及び他のFC-SWのうちの少なくとも一つが接続される。各システム構成要素が、SAN(Storage Area Network)を構成する。
ストレージ装置について、Storage1を例に採り説明する。Storage1は、図示しないが、コントローラと記憶部とに大別することができる。記憶部は、例えば、一以上の物理的な記憶媒体(例えばハードディスク或いはフラッシュメモリなどの不揮発性の記憶媒体)で構成されている。その一以上の物理的な記憶媒体(例えばハードディスク或いはフラッシュメモリなどの不揮発性の記憶媒体)を基に、論理ユニット(LU1〜LU3)が形成される。コントローラは、FC-SWに接続される複数のFC-Port(FC-PortA、FC-PortB)や、メモリや、プロセッサを有している。コントローラは、ホストからFC-SW経由でFC-PortA又はFC-PortBでI/O要求を受信し、そのI/O要求に応答して、そのI/O要求から特定されるLUにアクセスする。FC-Portは、ファイバチャネルプロトコルで情報或いはコマンドが授受される通信ポートである。
ホストについて、Host1を例に採り説明する。Host1は、プロセッサやメモリやHBA1(HBAはHost Bus Adapterの略)などを備えた計算機である。プロセッサに実行されるコンピュータプログラムとして、図示しないが、アプリケーションプログラム、ボリューム管理プログラムなどがある。ボリューム管理プログラムは、例えば、Storage1及び/又はStorage2にあるLUにマッピングされている論理ボリューム(例えばDドライブ)を管理する。アプリケーションプログラムが、論理ボリュームを指定してI/Oを命令することで、HBA1から、指定された論理ボリュームにマッピングされているLUがI/O先として指定されたI/O要求が発行される。発行されたI/O要求は、FC-SW経由でStorage1又はStorage2に届く。
FC-SWについて、FC-SW1を例に採り説明する。FC-SW1は、複数の通信ポート(P1〜P6)を有している。各通信ポートには、ホスト、ストレージ装置又は他のFC-SWが接続される。FC-SW1には、ホスト、ストレージ装置及び他のFC-SWのうちの少なくとも二種類が接続される。
前述した各システム構成要素(ホスト、ストレージ装置及びFC-SW)には、標準装置管理部が搭載されている。標準装置管理部は、その管理部を備えているシステム構成要素に関する標準的な情報(以下、「構成要素情報」と言う)を取得する装置であり、例えば、WMI、SMI-S或いはSNMPサーバである。標準装置管理部は、例えばLAN(Local Area Network)経由で、構成要素情報をシステム監視装置101に送信する。ちなみに、本実施形態における、システム監視装置101の監視対象は、Host1のDドライブ及びEドライブ、Host2のDドライブ、Host3のDドライブ及びEドライブ、Host4のDドライブ、FC-SW1のP1〜P6、FC-SW2のP1〜P6、FC-SW3のP1〜P6、Storage1のFC-PortA及びFC-PortB、及び、Storage2のFC-PortA及びFC-PortBである。
システム監視装置101は、例えばプロセッサ(典型的にはCPU)やメモリを備えた計算機である。システム監視装置101は、定期的に(又は不定期的に)各監視対象の稼動状態をシステム構成要素(具体的には、システム監視要素が有する標準装置管理部)に問い合わせることで、各監視対象の稼動状態を検出する(つまり、いわゆるポーリングで、各監視対象の稼動状態を検出する)。これにより、監視対象についてエラーが検出されていれば、その監視対象についてエラーが検出されていることを知ることができる。
システム監視装置101には、デバイス情報検出部1011、依存関係検出部1012、データ設定部1013及びシステム監視部1014が備えられる。デバイス情報検出部1011、依存関係検出部1012、データ設定部1013及びシステム監視部1014は、メモリから読み出された所定のコンピュータプログラムをプロセッサが実行することで実現される(及び/又はハードウェア回路で実現される)機能である。システム構成装置101に接続されたデータベース装置(外部記憶装置)103には、例えば、システム構成要素のリストであるシステム構成テーブル1031、各システム構成要素と監視対象の依存関係が記録された依存関係テーブル1032、各システム構成要素の計画停止に関するスケジュールが記録されたスケジュールテーブル1033、及び、各監視対象の監視状態が記録された監視状態テーブル1034が格納される。以下、システム監視装置101の各機能1011〜1014と、各テーブル1031〜1034について、詳細に説明する。
<デバイス情報検出部1011及びシステム構成テーブル1031>。
デバイス情報検出部1011は、管理者が指定したIPアドレスの範囲内に存在するシステム構成要素(ホスト、ストレージ装置、FC-SW)を検出する。そして、デバイス情報検出部1011は、検出されたシステム構成要素から、そのシステム構成要素を表す情報(ここでは「システム構成要素名」とする)を取得し、取得したシステム構成要素名の一覧であるシステム構成テーブル1031(図4参照)を作成する。デバイス情報検出部1011は、例えば、IPアドレスとシステム構成要素名とを1対1で対応付けて管理することができ、以後、所望のシステム構成要素に対応付けられているIPアドレスを用いて、その所望のシステム構成要素から情報を取得することができる。
なお、IPアドレスの範囲は、例えば、図22に示すように、コンソール画面801における監視設定サブ画面803を介して、管理者から受け付けられる。監視設定サブ画面803経由で、管理者から入力されたIPアドレス範囲が、システム監視装置101内のメモリに設定される。コンソール画面801は、システム監視装置101が表示する一種のGUI(Graphical User Interface)である。監視設定サブ画面803は、コンソール画面801で監視設定802がポインティングデバイス等で指定されたことに応答して表示される。監視設定サブ画面803は、監視に関する設定を管理者から受け付ける画面である。監視設定サブ画面803には、IPアドレス範囲の他に、監視間隔及び終了判定定義値を入力することができる。「監視間隔」とは、同一のシステム構成要素に監視対象の稼動状態を問い合わせる時間間隔である。例えば、システム監視装置101は、設定された監視間隔毎に(例えば15分毎に)、Host1にDドライブ及びEドライブの稼動状態を問い合わせる。「終了判定定義値」は、計画停止が終了したか否かの判定のために後述の終了判定カウント値と比較される閾値である。
<依存関係検出部1012及び依存関係テーブル1032>。
依存関係検出部1012は、デバイス情報検出部1011を通じて、各システム構成要素から情報を取得し、取得した情報を基に、依存関係テーブル1032を作成或いは更新する。この処理は、例えば、定期的に、或いは、システム構成テーブルが作成されたタイミング又は管理者が指定したタイミングで、実行される。
以下、依存関係検出部1012が行う処理を、図16を参照して詳細に説明する。
S11121:ホストからの情報の取得
依存関係検出部1012は、各ホストから、ホストが管理する論理ボリューム(ファイルシステム)に関する情報を取得し、メモリに書き込む。取得される情報としては、例えば図5に示すように、ホスト名、論理ボリューム(ファイルシステム)に関する情報(ドライブ名、ディスク情報、LUN(Logical Unit Number))、使用するHBAの名称、使用するHBAのポート番号、及びターゲットIDがある。本実施形態では、ディスク情報が“外部ディスク”であるドライブ、言い換えれば、Storage1又はStorage2といった外部のストレージ装置内のLUがマッピングされているドライブが、監視対象である。以下、一つのホストから取得された情報(ホスト名、論理ボリュームに関する情報、HBAの名称、HBAのポート番号及びターゲットIDで構成される情報)を、「ホスト情報」と言い、複数のホストについてのホスト情報を、「ホスト情報群」と言う。なお、ホスト情報には、そのホスト情報内のLUNに対応したLUがどのストレージ装置内のLUであるかを表す情報(例えばストレージ装置のシリアル番号)が含まれていない。このため、このS11121の段階では、そのLUNがどのストレージ装置のLUNかを判別することはできない。
S11122:HBAからの情報の取得
依存関係検出部1012は、ホスト情報内のポート番号に対応するHBAのWWN(World Wide Name)と、そのHBAの接続先ストレージポート(ストレージ装置が有するFC-Port)のWWNとを、各ホストのHBAから取得し、取得した情報をメモリに書き込む。この結果、図6に示すような情報群が、メモリに書き込まれる。以下、一つのHBAから取得された情報(HBA名、ポート番号、WWN、ターゲットID及び接続先ストレージポートのWWNで構成される情報)を、「HBA情報」と言い、複数のHBAのHBA情報を、「HBA情報群」と言う。
S11123:ストレージ装置からの情報の取得
依存関係検出部1012は、FC-PortのWWNと、そのFC-PortのLUNセキュリティ情報(例えば、そのFC-Portに関連付けられているLU毎にアクセスが許可されているホストの名称が書かれたリスト)とを、各ストレージ装置から取得し、取得した情報をメモリに書き込む。この結果、図7に示すような情報群が、メモリに書き込まれる。以下、一つのストレージ装置から取得された情報(ストレージ装置名、FC-PortのWWN、LUNセキュリティ情報で構成される情報)を、「ストレージ情報」と言い、複数のストレージ装置のストレージ情報を、「ストレージ情報群」と言う。
S11124:FC-SWからの情報の取得
依存関係検出部1012は、FC-SWの各ポートのWWNと、その接続先ポート(HBA、ストレージポート又は他のFC-SWのポート)のWWNとを、各FC-SWから取得し、取得した情報をメモリに書き込む。この結果、図8に示すような情報群が、メモリに書き込まれる。以下、一つのFC-SWから取得された情報(スイッチ名、各ポートのWWN、接続先ポートのWWNで構成される情報)を、「FC-SW情報」と言い、複数のFC-SWのFC-SW情報を、「FC-SW情報群」と言う。FC-SW情報において、#1〜#6は、P1〜P6に対応している。
S11125:論理ボリューム(ファイルシステム)にマッピングされているLUがあるストレージ装置の特定
依存関係検出部1012は、図5に示したホスト情報群、図6に示したHBA情報群、及び、図7に示したストレージ情報群を用いて、ホスト上の論理ボリューム(例えばDドライブ)にマッピングされているLUがあるストレージ装置を特定する。具体的には、例えば、Host1内のDドライブには、図5から、HBA1に対応していてLU1がマッピングされていることが分かり、HBA1のポートが、図6及び図7から、Storage1のFC-Portに接続されていることが分かり、そのFC-Portに関連付けられている、Host1がアクセス可能なLUが、図7からLU1であることが分かる。従って、このS11125では、Host1のDドライブにマッピングされているLU1は、Storage1内のLU1であることが特定される。
S11126:依存関係テーブルの作成
依存関係検出部1012は、S11125で特定した対応関係と、図8のFC-SW情報群とを基に、どのホスト(ファイルシステム)のHBAからどのFC-SWのどのポートを経由してどのストレージ装置のどのLUに論理的に繋がっているかという接続関係を特定し、特定した接続関係を基に、図9に例示する依存関係テーブル1032を作成する。具体的には、例えば、図6及び図8から、Host1のHBA1のポートのWWNが、FC-SW1のP1の接続先ポートのWWNであることが分かるため、システム構成要素Host1と依存関係にある監視対象(以下、「依存対象」と言う)が、FC-SW1のP1(SW1/P1)であることがわかる。言い換えれば、Host1が計画停止となると、SW1/P1についてエラーが検出される関係であることがわかる。また、例えば、システム構成要素FC-SW1について言えば、図6及び図8から、P1に、Host1のHBA1が接続されており、P2に、Host2のHBA2が接続されており、P6に、SW2/P6が接続されていることがわかる。従って、FC-SW1の依存対象が、Host1内のDドライブ及びEドライブと、Host2内のDドライブと、SW2/P6であることがわかる。このようにして特定された依存関係が、依存関係テーブル1032に書き込まれる。依存関係テーブル1032には、システム構成要素毎に、依存対象を表す情報が書き込まれる。
<データ設定部1013及びスケジュールテーブル1033>。
データ設定部1013は、管理者から定義された情報に従って、スケジュールテーブル1033を作成又は更新する。スケジュールテーブル1033の一例を、図10に示している。図10によれば、スケジュールテーブル1033には、システム構成要素毎に、計画停止のスケジュールを表す情報が記述されている。その情報は、前述したコンソール画面801に入力することができる。例えば、図23に示すように、コンソール画面801で環境設定812をポインティングデバイス等で指定すると、データ設定部1013により、コンソール画面801にスケジュールサブ画面811が表示される。スケジュールサブ画面811には、現在のスケジュールテーブル1033される。このサブ画面811上で、例えばHost1について変更600が指定されると、図24に示すように、Host1について計画停止スケジュールを変更するためのスケジュール変更サブ画面813が表示される。データ設定部1013は、このサブ画面813経由で、Host1についての変更後の計画停止スケジュールを管理者から受け付ける。データ設定部1013は、計画停止スケジュールが入力された場合には、入力された計画停止スケジュールを、スケジュールテーブル1033における、Host1に対応した欄に書き込む。
<システム監視部1014及び監視状態テーブル1034>。
システム監視部1014は、各システム監視装置の標準装置管理部から、各監視対象の稼動状態を、定期的に(図22を参照して説明した監視間隔で)取得し、取得された状態がエラーであれば、監視状態テーブル1034を基に、そのエラーを必要に応じて管理者にアラートする。
Storage1が計画停止されている場合の監視状態テーブル1034を図11に示し、SW2が計画停止されている場合の監視状態テーブル1034を図12に示す。
監視状態テーブル1034には、監視対象毎に、監視状態及び終了判定カウント値が記録される。「監視状態」とは、監視対象についての監視に関する状態であり、各監視対象について検出される稼動状態(例えば正常或いはエラー)とは異なる。監視状態を表す値として、例えば、“通常監視”、“監視停止”、及び“監視制限”がある。“通常監視”とは、監視間隔で監視対象の稼動状態を問い合わせるという通常通りの監視を行うことを意味する。“監視停止”とは、計画停止されたシステム構成要素内の監視対象であることを意味する。“監視制限”とは、計画停止されたシステム構成要素に依存する監視対象(つまり依存対象)であることを意味する。「終了判定カウント値」は、計画停止スケジュールから特定される期間中に稼動状態“正常”が検出されたカウント値である。終了判定カウント値は、計画停止が終了したか否かの判定に使用される。このため、監視状態“監視停止”の監視対象について、終了判定カウント値が更新されていく。
本実施形態では、計画停止されたシステム構成要素内の監視対象については、監視状態が“監視停止”に自動で更新され、そのシステム構成要素についての依存対象については、監視状態が“監視制限”に自動で更新される。システム監視部1014は、或る監視対象について、稼動状態“エラー”を検出した場合、その監視対象の監視状態が“通常監視”であれば、その稼動状態についてのエラーをアラートするが、その監視対象の監視状態が“監視停止”又は“監視制限”であれば、エラーをアラートしないか、或いは、エラーを情報として表示する。具体的には、例えば、図11によれば、Storage1が計画停止されると、Storage1内の監視対象であるStorage1/PortA、Storage1/PortB、Storage1/LU1、Storage1/LU2及びStorage1/LU3が、監視状態“監視停止”に更新され、Storage1についての依存対象であるHost1/Dドライブ、Host3/Dドライブ、Host4/Dドライブ、SW2/P4及びSW3/P2が、監視対象“監視制限”に更新される。この場合、Storage1内の監視対象及びStorage1の依存対象について稼動状態“エラー”が検出され、且つ、それ以外の監視対象(つまり監視状態“通常監視”の監視対象、例えばHost2/Dドライブ)について稼動状態“エラー”が検出された場合、システム監視部1014は、図20に示すように、Host2/Dドライブについてのみエラーをアラートし、Storage1内の監視対象及びStorage1の依存対象についてはエラーをアラートしない。或いは、図21に示すように、Storage1内の監視対象及びStorage1の依存対象については、エラーのアラートではなく情報の表示が行われる。つまり、本実施形態によれば、原因を調べる必要の無いエラーについてはアラートされず、原因を調べる必要のあるエラー(つまり重要なエラー)についてのみアラートされる。これにより、管理者は、どの監視対象についてのエラーの原因を調べれば良いかがすぐにわかる。なお、図20及び図21によれば、エラーのアラートは、コンソール画面801のアラートサブ画面851経由で行われる。アラートサブ画面851は、コンソール画面801でアラート表示853が指定された場合に表示される。
計画停止の開始判定及び終了判定の概略を、図13に示す。図13の点線枠は、その監視対象についての計画停止スケジュール(図10参照)から特定される期間(以下、「計画停止定義期間」と言う)を表す。
計画停止の開始は、その監視対象の計画停止定義期間の開始時刻以降(計画停止開始予定時刻以降)にその監視対象について稼働状態“エラー”が取得された時点である。すなわち、図13によれば、計画停止されたシステム構成要素内の監視対象の稼働状態が“エラー”になった後、システム監視部1014の問合せによりその監視対象について稼働状態“エラー”が取得された時点が、アラート通知制限の開始となる(すなわち、その監視対象の監視状態が“監視停止”に更新され、且つ、計画停止されたシステム構成要素の依存対象の監視状態が“監視制限”に更新される)。
アラート通知制限の開始以降に、参照番号501に示すように、監視状態“監視停止”の監視対象について稼働状態“正常”が取得される場合がある(この場合、その監視対象についての終了判定カウント値(図11、図12参照)が1インクリメントされる)。しかし、その稼働状態は一時的な状態であるため、所定回数(又は一定時間)連続してその稼働状態が取得されず、再び稼働状態“エラー”が取得される(この場合、その監視対象についての終了判定カウント値が0にリセットされる)。このため、その監視対象の監視状態として“監視停止”が継続される。
計画停止の終了は、計画停止定義期間の終了ではなく、計画停止定義期間中に所定回数(又は一定時間)連続して稼働状態“正常”が取得された時点である。例えば、参照番号503に示すように、稼働状態“正常”が3回連続して取得された場合に、アラート通知制限の解除(計画停止の終了)となる。なお、その「3回」(つまり上記所定回数)というのは、図22を用いて説明した終了判定定義値である。
以上のように、計画停止定義期間と実際の計画停止期間は必ずしも一致しない。計画停止定義期間内でも、実際に作業(例えばメンテナンス作業)が終了し、計画停止の終了と判定されたならば、監視状態が“監視停止”或いは“監視制限”から“通常監視”に更新される。なお、本実施形態では、計画停止定義期間の終了時刻(計画停止終了予定時刻)までに計画停止が終了したと判定されなかった場合(つまり所定回数連続して稼働状態“正常”が取得されなかった場合)は、計画停止定義期間の終了時刻で計画停止が終了したと判定される。また、所定回数連続して稼働状態“正常”が取得された時点に代えて、管理者が明示した時点が、計画停止の終了時刻であっても良い。
以下、本実施形態で行われる処理を、図14〜図19のフローチャートを参照して詳細に説明する。
図14は、本実施形態で行われる処理全体の流れを示す。
システム監視部1014が、初期化処理を実行する(S111)。S111の詳細は、図15を参照して後に説明する。
初期化処理の終了後、システム監視部1014は、それぞれの監視対象について、定期的に、S112〜S121を実行する。以下、S112〜S121について、監視対象としてStorage1/LU1を例に採り説明する。
システム監視部1014は、FC-SW2の標準装置管理部からStorage1内の各監視対象の稼働状態を取得する(S112)。
システム監視部1014は、Storage1/LU1の稼働状態が“正常”であり監視状態が“監視停止”でなければ(S113でYes及びS114でNo)、Storage1/LU1について今回の処理を終了する。
システム監視部1014は、Storage1/LU1の稼働状態が“正常”であり監視状態が“監視停止”であれば(S113でYes及びS114でYes)、計画停止の終了判定処理を実行する(S115)。S115の詳細は、図18を参照して後に説明する。
システム監視部1014は、Storage1/LU1の稼働状態が“エラー”であり監視状態が“監視停止”でなければ(S113でNo及びS116でNo)、計画停止の開始判定処理を実行する(S117)。S117の詳細は、図17を参照して後に説明する。S117の後、Storage1/LU1の監視状態が“監視停止”又は“監視制限”であれば(S118でYes、S118でNo及びS119でYes)、システム監視部1014は、Storage1/LU1について今回の処理を終了する。一方、S117の後、Storage1/LU1の監視状態が“通常監視”であれば(S118でNo及びS119でNo)、システム監視部1014は、Storage1/LU1の稼働状態“エラー”をコンソール画面801経由でアラートする(S120)。つまり、Storage1/LU1についてのエラーがアラート表示される。
システム監視部1014は、Storage1/LU1の稼働状態が“エラー”であり監視状態が“監視停止”であれば(S113でNo及びS116でYes)、Storage1/LU1についての終了判定カウント値を0にリセットする(S121)。
図15は、図14のS111の流れを示す。
システム監視部1014は、システム構成テーブルが作成されていない場合(S1111でNo)、システム構成テーブルの作成をデバイス情報検出部1011に実行させる(S1112)。具体的には、例えば、デバイス情報検出部1011が、コンソール画面801経由でIPアドレス範囲の指定を管理者から受け付ける。その後、デバイス情報検出部1011は、指定されたIPアドレス範囲にあるシステム構成要素から情報を取得して、システム構成テーブル1031(図4参照)を作成する。システム監視部1014は、作成されたシステム構成テーブル1031を例えばメモリに取得する(S1113)。
次に、システム監視部1014は、依存関係テーブル1032が作成されていない場合(S1114でNo)、依存関係テーブル1032の作成を依存関係検出部1012に実行させる(S1115)。具体的には、例えば、依存関係検出部1011が、図16を参照して既に説明した処理を実行することで、依存関係テーブル1032(図9参照)を作成する。システム監視部1014は、作成された依存関係テーブル1032を例えばメモリに取得する(S1116)。
次に、システム監視部1014は、スケジュールテーブル1033が作成されていない場合(S1117でNo)、スケジュールテーブル1033の作成をデータ設定部1013に実行させる(S1118)。具体的には、例えば、データ設定部1013が、コンソール画面801経由で、各監視対象についての計画停止スケジュールに関する情報を受け付け(図23及び図24参照)、入力された情報を、スケジュールテーブル1033に書き込む。システム監視部1014は、作成されたスケジュールテーブル1033を例えばメモリに取得する(S1119)。
次に、システム監視部1014は、監視状態テーブル1034が作成されていない場合(S1120でNo)、監視状態テーブル1034の作成をデータ設定部1013に実行させる(S1121)。具体的には、例えば、データ設定部1013が、ホスト情報群(図5)、HBA情報群(図6)、ストレージ情報群(図7)及びFC-SW情報群(図9)を基に監視状態テーブル1034を作成する(この時点では、例えば、全ての監視対象の監視状態が“通常監視”である)。システム監視部1014は、作成された監視状態テーブル1034を例えばメモリに取得する(S1122)。
最後に、システム監視部1014は、終了判定定義値が設定されているか否かを判断する(S1123)。それが設定されていなければ(S1123でYes)、データ設定部1013が、コンソール画面801経由で終了判定定義値を受け付け(図22参照)、入力された終了判定定義値を例えばメモリに書き込む(S1124)。
S1123でYes又はS1124の終了により、図14のS111(初期化処理)が終了する。
図17は、図14のS117の流れを示す。
システム監視部1014は、Storage1/LU1を有するStorage1についての計画停止定義期間を、Storage1に対応した計画停止スケジュール(スケジュールテーブル1033に記録されているスケジュール)から特定し、現在の時刻がその特定された計画停止定義期間中か否かを判断する(S1171)。
現在時刻が計画停止定義期間中であると判断された場合(S1171でYes)、システム監視部1014は、Storage1内の全ての監視対象(Storage1/LU1を含む)の監視状態(監視状態テーブル1034に記録されている監視状態)を、“監視停止”に更新する(S1172)。
次に、依存関係テーブル1032から特定される、Storage1についての各依存対象について、システム監視部1014が、S1173及びS1174を実行する。例えば、システム監視部1014は、一つの依存対象であるHost1/Dドライブの監視状態が“監視制限”でなければ(S1173でNo)、その監視状態を“監視制限”に更新する(S1174)。
このように、計画停止の開始判定処理(図14のS117)が行われることにより、計画停止定義期間中に稼働状態“エラー”が取得されたシステム構成要素(Storage1)内の全ての監視対象の監視状態が“監視停止”に更新され、そのシステム構成要素(Storage1)についての全ての依存対象の監視状態が“監視制限”に更新される。言い換えれば、計画停止されたシステム構成要素内の監視対象と、そのシステム構成要素についての依存対象が、自動で、アラートの非表示の対象とされる。
図18は、図14のS115の流れを示す。
システム監視部1014は、Storage1/LU1を有するStorage1についての計画停止定義期間を、Storage1に対応した計画停止スケジュールから特定し、現在の時刻がその特定された計画停止定義期間中か否かを判断する(S1151)。
現在時刻が計画停止定義期間中であると判断された場合(S1151でYes)、システム監視部1014は、Storage1内の全ての監視対象(Storage1/LU1を含む)の終了判定カウント値を1インクリメントする(S1152)。そして、システム監視部1014は、それら全ての監視対象について、更新後の終了判定カウント値が終了判定定義値に達していれば(S1153でYes)、それら全ての監視対象について監視停止の解除処理を実行する(S1154)。S1151でNo(つまり、現在時刻が計画停止定義期間中ではないと判断された)場合にも、Storage1内の全ての監視対象(Storage1/LU1を含む)について監視停止の解除処理が実行される(S1155)。
図19は、図18のS1154(及びS1155)の流れを示す。
システム監視部1014は、依存関係テーブル1032を参照し、Storage1内の各監視対象について、他の計画停止中のシステム構成要素の依存対象であるか否かを判断する(S11541)。S11541の判断結果が肯定的な判断結果である監視対象について(S11541でYes)、システム監視部1014は、監視状態を“監視停止”から“監視制限”に更新する(S11542)。一方、S11541の判断結果が否定的な判断結果である監視対象について(S11541でNo)、システム監視部1014は、監視状態を“監視停止”から“通常監視”に更新する(S11543)。
また、システム監視部1014は、Storage1についての全ての依存対象について、S11544〜S11546を行う。例えば、Storage1の依存対象であるHost1/Dドライブの監視状態が“監視停止”か否かが判断される(S11544)。その判断の結果が否定的な結果の場合(S11544でNo)、依存関係テーブル1032を基に、Host1/Dドライブが他の計画停止中のシステム構成要素の依存対象であるか否かが判断される(S11545)。この判断の結果も否定的な結果である場合(S11545でNo)、Host1/Dドライブの監視状態が“通常監視”に更新される(S11546)。
つまり、図18及び図19によれば、計画停止されていたシステム構成要素の計画停止が終了したか否かが自動で判断され、終了したと判断された場合には、そのシステム構成要素内の監視対象やそのシステム構成要素の依存対象が他の計画停止中のシステム構成要素の依存対象で無ければ、自動で、アラート表示の対象とされる。
以上、本発明の好適な実施形態を説明したが、これは本発明の説明のための例示であって、本発明の範囲をこの実施形態にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。
例えば、コンピュータシステムのシステム構成要素は、ホスト、FC-SW及びストレージ装置に限らず、他種の装置が採用されても良い。監視対象も、上記の例に限らず他の対象が採用されても良い。
また、例えば、システム監視装置101がシステム構成要素に稼動状態をポーリングすることに代えて、システム構成要素が、そのシステム構成要素内の監視対象についてエラーを検出したら、システム監視装置101からの問い合わせを受けること無しに、そのエラーをシステム監視装置101に報告しても良い。
また、例えば、図9の依存関係テーブルでは、システム構成要素毎ではなく、監視対象毎に、依存対象が記録されても良い。この場合、例えば、Storage1/PortAのみが計画停止された場合(例えばStorage1のFC-PortAを有するインタフェース装置が交換される場合)、Storage1/PortAの監視状態が“監視停止”とされ、Storage1/PortAの依存対象の監視状態が“監視制限”とされる。
コンピュータシステムの構成の一例を示す。 本発明の課題の一例の説明図である。 本発明の一実施形態に係るコンピュータシステムと、そのコンピュータシステムの各システム構成要素を監視するシステム監視装置を示す。 システム構成テーブルの一例を示す。 ホスト情報群の一例を示す。 HBA情報群の一例を示す。 ストレージ情報群の一例を示す。 FC-SW情報群の一例を示す。 依存関係テーブルの一例を示す。 スケジュールテーブルの一例を示す。 監視状態テーブルの一例を示す。 監視状態テーブルの別の一例を示す。 計画停止の開始判定及び終了判定の概略説明図である。 本発明の一実施形態で行われる処理全体の流れを示す。 図14のS111の詳細を示す。 図15のS1112の詳細を示す。 図14のS117の詳細を示す。 図14のS115の詳細を示す。 図18のS1154(及びS1155)の詳細を示す。 監視状態テーブルが図11に示すテーブルであって、Storage1内の監視対象及びStorage1の依存対象について稼動状態“エラー”が検出され、且つ、それ以外の監視対象(Host2/Dドライブ)について稼動状態“エラー”が検出された場合の表示の一例を示す。 図20と同じ場合での表示の別の一例を示す。 監視設定サブ画面が表示されたコンソール画面示す。 スケジュールサブ画面が表示されたコンソール画面を示す。 スケジュール変更サブ画面が表示されたコンソール画面を示す。
符号の説明
101…システム監視装置 103…データベース装置

Claims (10)

  1. コンピュータシステムを構成する複数の装置である複数のシステム構成要素における複数の監視対象を監視する装置であって、
    システム構成要素又はシステム構成要素内の監視対象と、それに依存する、他のシステム構成要素内の監視対象である依存対象との関係を表した依存関係情報を記憶する記憶部と、
    前記複数のシステム構成要素のうちの意図的に停止されたシステム構成要素又は監視対象を特定する停止特定部と、
    前記意図的に停止されたシステム構成要素又は監視対象に依存する依存対象を前記依存関係情報から特定する依存特定部と、
    各監視対象の状態を監視し、エラー状態が検出された監視対象についてエラーのアラートを画面に表示するが、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象とについては、エラー状態が検出されてもアラートを非表示とする監視部と
    を備えるシステム監視装置。
  2. 前記停止特定部は、予め設定された停止予定期間に対応するシステム構成要素又は監視対象について、その停止予定期間の開始時刻以降にエラー状態を検出した場合に、そのシステム構成要素又は監視対象を、意図的に停止されたシステム構成要素又は監視対象として特定し、
    前記監視部は、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象について、前記予め設定された停止予定期間内に、所定回数連続して正常状態が検出された後、以下の(1)及び(2)を実行する、
    (1)前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象が、意図的に停止された他のシステム構成要素又は他の監視対象の依存対象でなければ、その監視対象についてエラー状態が検出された場合には、エラーのアラートを表示する、
    (2)前記特定されたシステム構成要素又は前記特定された監視対象に依存する依存対象が、意図的に停止された他のシステム構成要素又は他の監視対象、及びそれの依存対象でなければ、その依存対象についてエラー状態が検出された場合には、エラーのアラートを表示する、
    請求項1記載のシステム監視装置。
  3. 前記監視部は、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象について、前記予め設定された停止予定期間内に、所定回数連続して正常状態が検出されなければ、前記予め設定された停止予定期間の終了時刻以降に、前記(1)及び(2)を実行する、
    請求項2記載のシステム監視装置。
  4. 前記複数のシステム構成要素は、ホスト装置、スイッチ装置及びストレージ装置であり、
    前記システム監視装置が、
    前記ホスト装置に関するホスト情報、前記ホスト装置が有するホストバスアダプタ(HBA)に関するHBA情報、前記スイッチ装置に関するスイッチ情報、及び、前記ストレージ装置に関するストレージ情報を取得する情報取得部と、
    前記取得されたホスト情報、HBA情報、スイッチ情報及びストレージ情報を基に前記依存関係テーブルを作成する依存関係検出部と
    を更に備え、
    前記ホスト情報には、前記ホスト装置で管理されている論理ボリュームを表すボリュームIDと、その論理ボリュームにマッピングされている論理記憶装置を表すマッピング装置IDと、その論理記憶装置にアクセスするときに使用されるHBAを表すHBA
    IDが含まれており、
    前記HBA情報には、HBA
    IDと、前記HBAが有するHBAポートのIDと、そのポートの接続先ストレージポートのIDとが含まれており、前記接続先ストレージポートは、前記HBAポートの接続先であるストレージポートであり、前記ストレージポートは、前記ストレージ装置が有するポートであり、
    前記ストレージ情報には、前記ストレージ装置のIDと、ストレージポートのIDと、そのストレージポートに割り当てられている論理記憶装置のIDと、その論理記憶装置にアクセスすることが許可されているホスト装置のIDとが含まれており、
    前記スイッチ情報には、スイッチが有する各ポートのIDと、そのポートの接続先ポートのIDとが含まれており、
    前記監視対象が、前記論理ボリューム、前記スイッチポート、前記ストレージポート、及び前記論理記憶装置であり、
    前記依存関係検出部は、
    前記ホスト情報内の前記マッピング装置IDと一致し前記ホスト装置のIDが関連付けられている論理記憶装置IDを含んだ前記ストレージ情報を特定し、特定されたストレージ情報と、前記マッピング装置IDに対応したHBA
    IDを含んだ前記HBA情報と、前記マッピング装置IDを含んだホスト情報と、前記スイッチ情報とに基づいて、システム構成要素又は監視対象とそれの依存対象との関係を検出する、
    請求項2又は3記載のシステム監視装置。
  5. 前記停止特定部は、予め設定された停止予定期間に対応するシステム構成要素又は監視対象について、その停止予定期間の開始時刻以降にエラー状態を検出した場合に、そのシステム構成要素又は監視対象を、意図的に停止されたシステム構成要素又は監視対象として特定する、
    請求項1記載のシステム監視装置。
  6. 前記監視部は、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象について、予め設定された停止予定期間内に、所定回数連続して正常状態が検出された後、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象について、エラー状態が検出された場合には、エラーのアラートを表示する、
    請求項1又は5記載のシステム監視装置。
  7. 前記監視部は、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象について、予め設定された停止予定期間内に、所定回数連続して正常状態が検出されなければ、前記予め設定された停止予定期間の終了時刻以降に、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象について、エラー状態が検出された場合には、エラーのアラートを表示する、
    請求項1、5及び6のうちのいずれか1項に記載のシステム監視装置。
  8. 前記監視部が、アラートの非表示として、エラーをエラーとしてではなく情報として表示する、
    請求項1乃至7のうちのいずれか1項に記載のシステム監視装置。
  9. コンピュータシステムを構成する複数の装置である複数のシステム構成要素における複数の監視対象を監視する方法であって、
    前記複数のシステム構成要素のうちの意図的に停止されたシステム構成要素又は監視対象を特定し、
    前記意図的に停止されたシステム構成要素又は監視対象に依存する依存対象を依存関係情報から特定し、前記依存関係情報は、システム構成要素又はシステム構成要素内の監視対象と、それに依存する、他のシステム構成要素内の監視対象である依存対象との関係を表した情報であり、
    各監視対象の状態を監視結果として、エラー状態が検出された場合、そのエラー状態が検出された監視対象についてエラーのアラートを画面に表示するが、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象とについては、エラー状態が検出されてもアラートを非表示とする、
    システム監視方法。
  10. コンピュータシステムを構成する複数の装置である複数のシステム構成要素における複数の監視対象を監視するコンピュータで実行されるコンピュータプログラムであって、
    前記複数のシステム構成要素のうちの意図的に停止されたシステム構成要素又は監視対象を特定し、
    前記意図的に停止されたシステム構成要素又は監視対象に依存する依存対象を依存関係情報から特定し、前記依存関係情報は、システム構成要素又はシステム構成要素内の監視対象と、それに依存する、他のシステム構成要素内の監視対象である依存対象との関係を表した情報であり、
    各監視対象の状態を監視結果として、エラー状態が検出された場合、そのエラー状態が検出された監視対象についてエラーのアラートを画面に表示するが、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象とについては、エラー状態が検出されてもアラートを非表示とする、
    ことをコンピュータに実行させるためのコンピュータプログラム。
JP2008112103A 2008-04-23 2008-04-23 コンピュータシステムを監視する装置及び方法 Expired - Fee Related JP4489128B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008112103A JP4489128B2 (ja) 2008-04-23 2008-04-23 コンピュータシステムを監視する装置及び方法
US12/136,803 US8140913B2 (en) 2008-04-23 2008-06-11 Apparatus and method for monitoring computer system, taking dependencies into consideration

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008112103A JP4489128B2 (ja) 2008-04-23 2008-04-23 コンピュータシステムを監視する装置及び方法

Publications (2)

Publication Number Publication Date
JP2009265785A JP2009265785A (ja) 2009-11-12
JP4489128B2 true JP4489128B2 (ja) 2010-06-23

Family

ID=41216177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008112103A Expired - Fee Related JP4489128B2 (ja) 2008-04-23 2008-04-23 コンピュータシステムを監視する装置及び方法

Country Status (2)

Country Link
US (1) US8140913B2 (ja)
JP (1) JP4489128B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4489128B2 (ja) * 2008-04-23 2010-06-23 株式会社日立製作所 コンピュータシステムを監視する装置及び方法
US8266101B1 (en) * 2009-07-16 2012-09-11 Binpeng Shuai Share nothing database cluster and real time synchronization by signaling
WO2011101887A1 (ja) * 2010-02-16 2011-08-25 株式会社日立製作所 管理システム及び管理システムの制御方法
WO2012120634A1 (ja) * 2011-03-08 2012-09-13 株式会社日立製作所 管理計算機、ストレージシステム管理方法、及び、ストレージシステム
WO2013171865A1 (ja) * 2012-05-16 2013-11-21 株式会社日立製作所 管理方法及び管理システム
KR20140062288A (ko) * 2012-11-14 2014-05-23 한국전자통신연구원 로봇 컴포넌트 오류 처리 장치 및 그 방법
WO2015020648A1 (en) * 2013-08-07 2015-02-12 Hitachi, Ltd. Method and apparatus for dynamic monitoring condition control
JP5870126B2 (ja) * 2014-01-29 2016-02-24 株式会社Sji アプリケーションテストシステム、方法及びプログラム
JP6586844B2 (ja) * 2015-09-28 2019-10-09 沖電気工業株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005538459A (ja) * 2002-09-11 2005-12-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 分散システム内の根本原因識別および問題判定のための方法および装置
JP2006190138A (ja) * 2005-01-07 2006-07-20 Mitsubishi Electric Corp アラーム管理装置及びアラーム管理方法及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581242A (en) * 1991-08-22 1996-12-03 Hitachi, Ltd. Automatic alarm display processing system in plant
US5293323A (en) * 1991-10-24 1994-03-08 General Electric Company Method for fault diagnosis by assessment of confidence measure
JPH10207746A (ja) * 1997-01-17 1998-08-07 Nec Eng Ltd 障害情報収集システム
US7043661B2 (en) 2000-10-19 2006-05-09 Tti-Team Telecom International Ltd. Topology-based reasoning apparatus for root-cause analysis of network faults
US7685465B1 (en) * 2006-09-19 2010-03-23 United Services Automobile Association (Usaa) High-availability data center
EP1950639B1 (de) * 2007-01-23 2013-05-29 Siemens Aktiengesellschaft Verfahren zum Betreiben einer Prozessanlage, Prozessanlage und Computerprogrammprodukt
JP4489128B2 (ja) * 2008-04-23 2010-06-23 株式会社日立製作所 コンピュータシステムを監視する装置及び方法
US7898939B2 (en) * 2008-12-16 2011-03-01 At&T Intellectual Property I, L.P. Scalable and robust mechanism for remote IP device monitoring with changing IP address assignment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005538459A (ja) * 2002-09-11 2005-12-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 分散システム内の根本原因識別および問題判定のための方法および装置
JP2006190138A (ja) * 2005-01-07 2006-07-20 Mitsubishi Electric Corp アラーム管理装置及びアラーム管理方法及びプログラム

Also Published As

Publication number Publication date
US8140913B2 (en) 2012-03-20
US20090271667A1 (en) 2009-10-29
JP2009265785A (ja) 2009-11-12

Similar Documents

Publication Publication Date Title
JP4489128B2 (ja) コンピュータシステムを監視する装置及び方法
US7953909B2 (en) Storage system comprising power saving function
US7921325B2 (en) Node management device and method
JP4813385B2 (ja) ストレージシステムの複数の論理リソースを制御する制御装置
US8219748B2 (en) Storage system comprising both power saving and diagnostic functions
US20060271677A1 (en) Policy based data path management, asset management, and monitoring
US10359958B2 (en) Method and system for managing a storage network to reduce power consumption
JP4845982B2 (ja) 情報処理装置、及びストレージシステムから取得した構成情報の管理方法
JP2001337863A (ja) 記憶制御装置及び記憶システム並びに記憶システムのセキュリティ設定方法
JP2010026946A (ja) ストレージサブシステム及びコントローラによるコマンド実行方法
JP2007058346A (ja) ストレージシステム
US20070192553A1 (en) Backup apparatus and backup method
JP5385459B2 (ja) 管理システム及び計算機システムの管理方法
JP5022773B2 (ja) ジャーナルを利用したリモートコピーのコピー先となるストレージシステムの消費電力を節約する方法及びシステム
US8095938B1 (en) Managing alert generation
JP2012043304A (ja) ディスクアレイ装置およびディスクアレイ装置の制御方法
JP4824638B2 (ja) ストレージシステムにおけるマルチホスト管理サーバ及びそのプログラム並びにパス情報管理方法
JP2011159243A (ja) Raid装置、異常デバイス検出装置および異常デバイス検出方法
US20100042793A1 (en) Storage system and data protection method of the same
JP2009151511A (ja) 情報処理装置および情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100330

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100330

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4489128

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140409

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees