JP4489128B2 - コンピュータシステムを監視する装置及び方法 - Google Patents
コンピュータシステムを監視する装置及び方法 Download PDFInfo
- Publication number
- JP4489128B2 JP4489128B2 JP2008112103A JP2008112103A JP4489128B2 JP 4489128 B2 JP4489128 B2 JP 4489128B2 JP 2008112103 A JP2008112103 A JP 2008112103A JP 2008112103 A JP2008112103 A JP 2008112103A JP 4489128 B2 JP4489128 B2 JP 4489128B2
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- monitoring target
- target
- information
- system component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012544 monitoring process Methods 0.000 title claims description 323
- 238000000034 method Methods 0.000 title claims description 12
- 238000001514 detection method Methods 0.000 claims description 26
- 230000001419 dependent effect Effects 0.000 claims description 16
- 238000012806 monitoring device Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims 4
- 101150071666 HBA gene Proteins 0.000 description 20
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 4
- 239000000835 fiber Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
(1)Host1内のDドライブ:(理由)停止したStorage1内のLU1にマッピングされている論理ボリュームであるため。(ちなみに、「LU」とはLogcial Unitの略であり、ここでは、HDD等の物理的な記憶装置を基に形成された論理的な記憶装置である。)
(2)Host3内のDドライブ:(理由)停止したStorage1内のLU3にマッピングされている論理ボリュームであるため。
(3)Host4内のDドライブ:(理由)停止したStorage1内のLU2にマッピングされている論理ボリュームであるため。
(4)FC-SW2のPort4(P4):(理由)停止したStorage1のFC-PortAに接続されているPortであるため。
(5)FC-SW3のPort2(P2):(理由)停止したStorage1のFC-PortBに接続されているPortであるため。
(6)Storage1内の全装置要素(FC-PortA、FC-PortB、LU1、LU2及びLU3):(理由)停止したStorage1内の要素であるため。
依存関係検出部1012は、各ホストから、ホストが管理する論理ボリューム(ファイルシステム)に関する情報を取得し、メモリに書き込む。取得される情報としては、例えば図5に示すように、ホスト名、論理ボリューム(ファイルシステム)に関する情報(ドライブ名、ディスク情報、LUN(Logical Unit Number))、使用するHBAの名称、使用するHBAのポート番号、及びターゲットIDがある。本実施形態では、ディスク情報が“外部ディスク”であるドライブ、言い換えれば、Storage1又はStorage2といった外部のストレージ装置内のLUがマッピングされているドライブが、監視対象である。以下、一つのホストから取得された情報(ホスト名、論理ボリュームに関する情報、HBAの名称、HBAのポート番号及びターゲットIDで構成される情報)を、「ホスト情報」と言い、複数のホストについてのホスト情報を、「ホスト情報群」と言う。なお、ホスト情報には、そのホスト情報内のLUNに対応したLUがどのストレージ装置内のLUであるかを表す情報(例えばストレージ装置のシリアル番号)が含まれていない。このため、このS11121の段階では、そのLUNがどのストレージ装置のLUNかを判別することはできない。
依存関係検出部1012は、ホスト情報内のポート番号に対応するHBAのWWN(World Wide Name)と、そのHBAの接続先ストレージポート(ストレージ装置が有するFC-Port)のWWNとを、各ホストのHBAから取得し、取得した情報をメモリに書き込む。この結果、図6に示すような情報群が、メモリに書き込まれる。以下、一つのHBAから取得された情報(HBA名、ポート番号、WWN、ターゲットID及び接続先ストレージポートのWWNで構成される情報)を、「HBA情報」と言い、複数のHBAのHBA情報を、「HBA情報群」と言う。
依存関係検出部1012は、FC-PortのWWNと、そのFC-PortのLUNセキュリティ情報(例えば、そのFC-Portに関連付けられているLU毎にアクセスが許可されているホストの名称が書かれたリスト)とを、各ストレージ装置から取得し、取得した情報をメモリに書き込む。この結果、図7に示すような情報群が、メモリに書き込まれる。以下、一つのストレージ装置から取得された情報(ストレージ装置名、FC-PortのWWN、LUNセキュリティ情報で構成される情報)を、「ストレージ情報」と言い、複数のストレージ装置のストレージ情報を、「ストレージ情報群」と言う。
依存関係検出部1012は、FC-SWの各ポートのWWNと、その接続先ポート(HBA、ストレージポート又は他のFC-SWのポート)のWWNとを、各FC-SWから取得し、取得した情報をメモリに書き込む。この結果、図8に示すような情報群が、メモリに書き込まれる。以下、一つのFC-SWから取得された情報(スイッチ名、各ポートのWWN、接続先ポートのWWNで構成される情報)を、「FC-SW情報」と言い、複数のFC-SWのFC-SW情報を、「FC-SW情報群」と言う。FC-SW情報において、#1〜#6は、P1〜P6に対応している。
依存関係検出部1012は、図5に示したホスト情報群、図6に示したHBA情報群、及び、図7に示したストレージ情報群を用いて、ホスト上の論理ボリューム(例えばDドライブ)にマッピングされているLUがあるストレージ装置を特定する。具体的には、例えば、Host1内のDドライブには、図5から、HBA1に対応していてLU1がマッピングされていることが分かり、HBA1のポートが、図6及び図7から、Storage1のFC-Portに接続されていることが分かり、そのFC-Portに関連付けられている、Host1がアクセス可能なLUが、図7からLU1であることが分かる。従って、このS11125では、Host1のDドライブにマッピングされているLU1は、Storage1内のLU1であることが特定される。
依存関係検出部1012は、S11125で特定した対応関係と、図8のFC-SW情報群とを基に、どのホスト(ファイルシステム)のHBAからどのFC-SWのどのポートを経由してどのストレージ装置のどのLUに論理的に繋がっているかという接続関係を特定し、特定した接続関係を基に、図9に例示する依存関係テーブル1032を作成する。具体的には、例えば、図6及び図8から、Host1のHBA1のポートのWWNが、FC-SW1のP1の接続先ポートのWWNであることが分かるため、システム構成要素Host1と依存関係にある監視対象(以下、「依存対象」と言う)が、FC-SW1のP1(SW1/P1)であることがわかる。言い換えれば、Host1が計画停止となると、SW1/P1についてエラーが検出される関係であることがわかる。また、例えば、システム構成要素FC-SW1について言えば、図6及び図8から、P1に、Host1のHBA1が接続されており、P2に、Host2のHBA2が接続されており、P6に、SW2/P6が接続されていることがわかる。従って、FC-SW1の依存対象が、Host1内のDドライブ及びEドライブと、Host2内のDドライブと、SW2/P6であることがわかる。このようにして特定された依存関係が、依存関係テーブル1032に書き込まれる。依存関係テーブル1032には、システム構成要素毎に、依存対象を表す情報が書き込まれる。
Claims (10)
- コンピュータシステムを構成する複数の装置である複数のシステム構成要素における複数の監視対象を監視する装置であって、
システム構成要素又はシステム構成要素内の監視対象と、それに依存する、他のシステム構成要素内の監視対象である依存対象との関係を表した依存関係情報を記憶する記憶部と、
前記複数のシステム構成要素のうちの意図的に停止されたシステム構成要素又は監視対象を特定する停止特定部と、
前記意図的に停止されたシステム構成要素又は監視対象に依存する依存対象を前記依存関係情報から特定する依存特定部と、
各監視対象の状態を監視し、エラー状態が検出された監視対象についてエラーのアラートを画面に表示するが、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象とについては、エラー状態が検出されてもアラートを非表示とする監視部と
を備えるシステム監視装置。 - 前記停止特定部は、予め設定された停止予定期間に対応するシステム構成要素又は監視対象について、その停止予定期間の開始時刻以降にエラー状態を検出した場合に、そのシステム構成要素又は監視対象を、意図的に停止されたシステム構成要素又は監視対象として特定し、
前記監視部は、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象について、前記予め設定された停止予定期間内に、所定回数連続して正常状態が検出された後、以下の(1)及び(2)を実行する、
(1)前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象が、意図的に停止された他のシステム構成要素又は他の監視対象の依存対象でなければ、その監視対象についてエラー状態が検出された場合には、エラーのアラートを表示する、
(2)前記特定されたシステム構成要素又は前記特定された監視対象に依存する依存対象が、意図的に停止された他のシステム構成要素又は他の監視対象、及びそれの依存対象でなければ、その依存対象についてエラー状態が検出された場合には、エラーのアラートを表示する、
請求項1記載のシステム監視装置。 - 前記監視部は、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象について、前記予め設定された停止予定期間内に、所定回数連続して正常状態が検出されなければ、前記予め設定された停止予定期間の終了時刻以降に、前記(1)及び(2)を実行する、
請求項2記載のシステム監視装置。 - 前記複数のシステム構成要素は、ホスト装置、スイッチ装置及びストレージ装置であり、
前記システム監視装置が、
前記ホスト装置に関するホスト情報、前記ホスト装置が有するホストバスアダプタ(HBA)に関するHBA情報、前記スイッチ装置に関するスイッチ情報、及び、前記ストレージ装置に関するストレージ情報を取得する情報取得部と、
前記取得されたホスト情報、HBA情報、スイッチ情報及びストレージ情報を基に前記依存関係テーブルを作成する依存関係検出部と
を更に備え、
前記ホスト情報には、前記ホスト装置で管理されている論理ボリュームを表すボリュームIDと、その論理ボリュームにマッピングされている論理記憶装置を表すマッピング装置IDと、その論理記憶装置にアクセスするときに使用されるHBAを表すHBA
IDが含まれており、
前記HBA情報には、HBA
IDと、前記HBAが有するHBAポートのIDと、そのポートの接続先ストレージポートのIDとが含まれており、前記接続先ストレージポートは、前記HBAポートの接続先であるストレージポートであり、前記ストレージポートは、前記ストレージ装置が有するポートであり、
前記ストレージ情報には、前記ストレージ装置のIDと、ストレージポートのIDと、そのストレージポートに割り当てられている論理記憶装置のIDと、その論理記憶装置にアクセスすることが許可されているホスト装置のIDとが含まれており、
前記スイッチ情報には、スイッチが有する各ポートのIDと、そのポートの接続先ポートのIDとが含まれており、
前記監視対象が、前記論理ボリューム、前記スイッチポート、前記ストレージポート、及び前記論理記憶装置であり、
前記依存関係検出部は、
前記ホスト情報内の前記マッピング装置IDと一致し前記ホスト装置のIDが関連付けられている論理記憶装置IDを含んだ前記ストレージ情報を特定し、特定されたストレージ情報と、前記マッピング装置IDに対応したHBA
IDを含んだ前記HBA情報と、前記マッピング装置IDを含んだホスト情報と、前記スイッチ情報とに基づいて、システム構成要素又は監視対象とそれの依存対象との関係を検出する、
請求項2又は3記載のシステム監視装置。 - 前記停止特定部は、予め設定された停止予定期間に対応するシステム構成要素又は監視対象について、その停止予定期間の開始時刻以降にエラー状態を検出した場合に、そのシステム構成要素又は監視対象を、意図的に停止されたシステム構成要素又は監視対象として特定する、
請求項1記載のシステム監視装置。 - 前記監視部は、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象について、予め設定された停止予定期間内に、所定回数連続して正常状態が検出された後、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象について、エラー状態が検出された場合には、エラーのアラートを表示する、
請求項1又は5記載のシステム監視装置。 - 前記監視部は、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象について、予め設定された停止予定期間内に、所定回数連続して正常状態が検出されなければ、前記予め設定された停止予定期間の終了時刻以降に、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象について、エラー状態が検出された場合には、エラーのアラートを表示する、
請求項1、5及び6のうちのいずれか1項に記載のシステム監視装置。 - 前記監視部が、アラートの非表示として、エラーをエラーとしてではなく情報として表示する、
請求項1乃至7のうちのいずれか1項に記載のシステム監視装置。 - コンピュータシステムを構成する複数の装置である複数のシステム構成要素における複数の監視対象を監視する方法であって、
前記複数のシステム構成要素のうちの意図的に停止されたシステム構成要素又は監視対象を特定し、
前記意図的に停止されたシステム構成要素又は監視対象に依存する依存対象を依存関係情報から特定し、前記依存関係情報は、システム構成要素又はシステム構成要素内の監視対象と、それに依存する、他のシステム構成要素内の監視対象である依存対象との関係を表した情報であり、
各監視対象の状態を監視結果として、エラー状態が検出された場合、そのエラー状態が検出された監視対象についてエラーのアラートを画面に表示するが、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象とについては、エラー状態が検出されてもアラートを非表示とする、
システム監視方法。 - コンピュータシステムを構成する複数の装置である複数のシステム構成要素における複数の監視対象を監視するコンピュータで実行されるコンピュータプログラムであって、
前記複数のシステム構成要素のうちの意図的に停止されたシステム構成要素又は監視対象を特定し、
前記意図的に停止されたシステム構成要素又は監視対象に依存する依存対象を依存関係情報から特定し、前記依存関係情報は、システム構成要素又はシステム構成要素内の監視対象と、それに依存する、他のシステム構成要素内の監視対象である依存対象との関係を表した情報であり、
各監視対象の状態を監視結果として、エラー状態が検出された場合、そのエラー状態が検出された監視対象についてエラーのアラートを画面に表示するが、前記特定されたシステム構成要素内の監視対象又は前記特定された監視対象と、前記特定された依存対象とについては、エラー状態が検出されてもアラートを非表示とする、
ことをコンピュータに実行させるためのコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008112103A JP4489128B2 (ja) | 2008-04-23 | 2008-04-23 | コンピュータシステムを監視する装置及び方法 |
US12/136,803 US8140913B2 (en) | 2008-04-23 | 2008-06-11 | Apparatus and method for monitoring computer system, taking dependencies into consideration |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008112103A JP4489128B2 (ja) | 2008-04-23 | 2008-04-23 | コンピュータシステムを監視する装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009265785A JP2009265785A (ja) | 2009-11-12 |
JP4489128B2 true JP4489128B2 (ja) | 2010-06-23 |
Family
ID=41216177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008112103A Expired - Fee Related JP4489128B2 (ja) | 2008-04-23 | 2008-04-23 | コンピュータシステムを監視する装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8140913B2 (ja) |
JP (1) | JP4489128B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4489128B2 (ja) * | 2008-04-23 | 2010-06-23 | 株式会社日立製作所 | コンピュータシステムを監視する装置及び方法 |
US8266101B1 (en) * | 2009-07-16 | 2012-09-11 | Binpeng Shuai | Share nothing database cluster and real time synchronization by signaling |
WO2011101887A1 (ja) * | 2010-02-16 | 2011-08-25 | 株式会社日立製作所 | 管理システム及び管理システムの制御方法 |
WO2012120634A1 (ja) * | 2011-03-08 | 2012-09-13 | 株式会社日立製作所 | 管理計算機、ストレージシステム管理方法、及び、ストレージシステム |
WO2013171865A1 (ja) * | 2012-05-16 | 2013-11-21 | 株式会社日立製作所 | 管理方法及び管理システム |
KR20140062288A (ko) * | 2012-11-14 | 2014-05-23 | 한국전자통신연구원 | 로봇 컴포넌트 오류 처리 장치 및 그 방법 |
WO2015020648A1 (en) * | 2013-08-07 | 2015-02-12 | Hitachi, Ltd. | Method and apparatus for dynamic monitoring condition control |
JP5870126B2 (ja) * | 2014-01-29 | 2016-02-24 | 株式会社Sji | アプリケーションテストシステム、方法及びプログラム |
JP6586844B2 (ja) * | 2015-09-28 | 2019-10-09 | 沖電気工業株式会社 | 情報処理装置、情報処理システム、情報処理方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005538459A (ja) * | 2002-09-11 | 2005-12-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 分散システム内の根本原因識別および問題判定のための方法および装置 |
JP2006190138A (ja) * | 2005-01-07 | 2006-07-20 | Mitsubishi Electric Corp | アラーム管理装置及びアラーム管理方法及びプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581242A (en) * | 1991-08-22 | 1996-12-03 | Hitachi, Ltd. | Automatic alarm display processing system in plant |
US5293323A (en) * | 1991-10-24 | 1994-03-08 | General Electric Company | Method for fault diagnosis by assessment of confidence measure |
JPH10207746A (ja) * | 1997-01-17 | 1998-08-07 | Nec Eng Ltd | 障害情報収集システム |
US7043661B2 (en) | 2000-10-19 | 2006-05-09 | Tti-Team Telecom International Ltd. | Topology-based reasoning apparatus for root-cause analysis of network faults |
US7685465B1 (en) * | 2006-09-19 | 2010-03-23 | United Services Automobile Association (Usaa) | High-availability data center |
EP1950639B1 (de) * | 2007-01-23 | 2013-05-29 | Siemens Aktiengesellschaft | Verfahren zum Betreiben einer Prozessanlage, Prozessanlage und Computerprogrammprodukt |
JP4489128B2 (ja) * | 2008-04-23 | 2010-06-23 | 株式会社日立製作所 | コンピュータシステムを監視する装置及び方法 |
US7898939B2 (en) * | 2008-12-16 | 2011-03-01 | At&T Intellectual Property I, L.P. | Scalable and robust mechanism for remote IP device monitoring with changing IP address assignment |
-
2008
- 2008-04-23 JP JP2008112103A patent/JP4489128B2/ja not_active Expired - Fee Related
- 2008-06-11 US US12/136,803 patent/US8140913B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005538459A (ja) * | 2002-09-11 | 2005-12-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 分散システム内の根本原因識別および問題判定のための方法および装置 |
JP2006190138A (ja) * | 2005-01-07 | 2006-07-20 | Mitsubishi Electric Corp | アラーム管理装置及びアラーム管理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US8140913B2 (en) | 2012-03-20 |
US20090271667A1 (en) | 2009-10-29 |
JP2009265785A (ja) | 2009-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4489128B2 (ja) | コンピュータシステムを監視する装置及び方法 | |
US7953909B2 (en) | Storage system comprising power saving function | |
US7921325B2 (en) | Node management device and method | |
JP4813385B2 (ja) | ストレージシステムの複数の論理リソースを制御する制御装置 | |
US8219748B2 (en) | Storage system comprising both power saving and diagnostic functions | |
US20060271677A1 (en) | Policy based data path management, asset management, and monitoring | |
US10359958B2 (en) | Method and system for managing a storage network to reduce power consumption | |
JP4845982B2 (ja) | 情報処理装置、及びストレージシステムから取得した構成情報の管理方法 | |
JP2001337863A (ja) | 記憶制御装置及び記憶システム並びに記憶システムのセキュリティ設定方法 | |
JP2010026946A (ja) | ストレージサブシステム及びコントローラによるコマンド実行方法 | |
JP2007058346A (ja) | ストレージシステム | |
US20070192553A1 (en) | Backup apparatus and backup method | |
JP5385459B2 (ja) | 管理システム及び計算機システムの管理方法 | |
JP5022773B2 (ja) | ジャーナルを利用したリモートコピーのコピー先となるストレージシステムの消費電力を節約する方法及びシステム | |
US8095938B1 (en) | Managing alert generation | |
JP2012043304A (ja) | ディスクアレイ装置およびディスクアレイ装置の制御方法 | |
JP4824638B2 (ja) | ストレージシステムにおけるマルチホスト管理サーバ及びそのプログラム並びにパス情報管理方法 | |
JP2011159243A (ja) | Raid装置、異常デバイス検出装置および異常デバイス検出方法 | |
US20100042793A1 (en) | Storage system and data protection method of the same | |
JP2009151511A (ja) | 情報処理装置および情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100330 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100330 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4489128 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140409 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |