JP2007115093A - 性能情報収集方法及び計算機システム - Google Patents

性能情報収集方法及び計算機システム Download PDF

Info

Publication number
JP2007115093A
JP2007115093A JP2005306943A JP2005306943A JP2007115093A JP 2007115093 A JP2007115093 A JP 2007115093A JP 2005306943 A JP2005306943 A JP 2005306943A JP 2005306943 A JP2005306943 A JP 2005306943A JP 2007115093 A JP2007115093 A JP 2007115093A
Authority
JP
Japan
Prior art keywords
program
logical area
performance information
information
host computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005306943A
Other languages
English (en)
Other versions
JP4585423B2 (ja
Inventor
Hirosuke Fukuda
裕亮 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005306943A priority Critical patent/JP4585423B2/ja
Priority to US11/299,750 priority patent/US20070130564A1/en
Publication of JP2007115093A publication Critical patent/JP2007115093A/ja
Application granted granted Critical
Publication of JP4585423B2 publication Critical patent/JP4585423B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3485Performance evaluation by tracing or monitoring for I/O devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】計算機システムに関し、特に、ストレージシステムの性能情報を取得するプログラムの稼働による性能負荷を軽減する計算機システムを提供する。
【解決手段】ホスト計算機と当該ホスト計算機が用いる論理領域との対応関係が設定されており、制御部が、ストレージシステムの性能情報を取得する第1のステップと、制御部が、取得した性能情報を、所定の閾値よりも負荷が低い対応関係に含まれるホスト計算機に送信する第2のステップと、ホスト計算機が、制御部から送信された性能情報を、管理計算機に送信する第3のステップと、管理計算機が、送信された性能情報を収集する第4のステップと、を備える
【選択図】図1

Description

本発明は、計算機システムに関し、特に、ストレージシステムの性能情報を取得するプログラムの稼働による性能負荷を軽減する計算機システムに関する。
ホスト計算機からの要求に従ってディスク装置のデータを入出力する制御装置を含むストレージシステムを備えた計算機システムにおいて、計算機システムの運用に際し、ストレージシステムの性能情報を収集したいという要求がある。
ストレージシステムの性能情報とは、例えば、ホスト計算機からのI/O数、ホスト計算機からのI/Oのデータ量、制御装置のプロセッサの負荷、制御装置のI/O数、ディスク装置の使用量等である。
これらの性能情報は、一般的に、ホスト計算機又は管理計算機において稼働するプログラムによって、ストレージシステムの性能情報を取得する(例えば特許文献1参照。)。
特開2003−316522号公報
しかしながら、ストレージ等の性能情報を収集するためのプログラムは、そのプログラム自体のリソースの負荷が発生する。そのため、特定のユーザプログラムとリソースの競合が発生したり、プログラムによるI/O等の負荷の発生によって、性能情報のI/O数が性格に測定できない場合があった。
本発明はこのような問題点に鑑みてなされたものであり、ストレージシステムの性能情報を取得するプログラムをどのように稼働させるかを判断することによって、より精度の高い性能情報を取得可能な計算機システムを提供することを目的とする。
本発明による実施の形態の一例は、データを格納する一以上の論理領域が設定されたディスク装置と、ディスク装置へのデータの読み書きを制御する制御部と、ホスト計算機に接続するインターフェースとを備えたストレージシステムと、ネットワークを介してインターフェースに接続され、ディスク装置の論理領域へのデータの読み書きを要求するホスト計算機と、ストレージシステム、ネットワーク及びホスト計算機の性能情報を収集する管理計算機と、を備えた計算機システムで実行される性能情報収集方法において、ホスト計算機と当該ホスト計算機が用いる論理領域との対応関係が設定されており、制御部が、ストレージシステムの性能情報を取得する第1のステップと、制御部が、取得した性能情報を、所定の閾値よりも負荷が低い対応関係に含まれるホスト計算機に送信する第2のステップと、ホスト計算機が、制御部から送信された性能情報を、管理計算機に送信する第3のステップと、管理計算機が、送信された性能情報を収集する第4のステップと、を備えることを特徴とする。
本発明によると、計算機システムにおいて、ストレージシステムの制御部が取得した性能情報を、負荷が低いホスト計算機を介して管理計算機に送信するので、計算機システムで実行されている業務に対する影響を最小限に抑えると共に、より正確な性能情報を取得することができる。
以下に本発明の実施の形態を図面に基づいて説明する。
本発明の実施の形態は、計算機システムにおいて、ストレージシステム30の性能情報を、ストレージシステム30に格納された性能情報を取得するためのプログラム(エージェント1プログラム3000)によって取得する。そして、取得した性能情報を、ホスト20に格納されたプログラム(エージェント2プログラム2000)を介して、性能情報を収集する統合管理サーバ10に送信するよう構成した。
まず、この計算機システムの構成を説明する。
図1は、本発明の第1の実施の形態の計算機システムの構成のブロック図である。
本実施の形態の計算機システムは、統合管理サーバ10、ホスト20A及び20B、ストレージシステム30A及び30B、スイッチ(SW)40A及び40Bを含む。
ホスト20A及び20Bは、ストレージシステム30A及び30Bに格納されているデータの読み書きを要求する。ストレージシステム30A及び30Bは、ディスク装置330を備え、ホスト20A及び20Bからのディスク装置330に格納されているデータへの読み書きの要求を処理する。統合管理サーバ10は、ホスト20A、20B及びストレージシステム30A及び30B等の性能情報を取得し、取得した性能情報に関する統計情報やアラート(エラー)を報知する。
ホスト20Aは、SW40Aを介してストレージシステム30A及び30Bに接続している。また、ホスト20Bは、SW40Bを介してストレージシステム30A及び30Bに接続している。これらホスト20とSW40との間、及びSW40ストレージシステム30との間の接続は、FC(Fibre Channel)やSCSI等の、データ転送に適したネットワークによって構成される。
統合管理サーバ10は、ネットワーク11を介してホスト20A、20B及びストレージシステム30A、30Bに接続している。ネットワーク11は、Ethernet(登録商標、以下同じ)等のネットワークによって構成される。
統合管理サーバ10は、CPU101、メモリ102及びインターフェース103を含む。
CPU101は、メモリ102に格納されているプログラムを読み込んで、そのプログラムに規定された処理を実行する。メモリ102は、各種プログラムやプログラムが使用するデータ等を格納する。インターフェース103は、ネットワーク11を介してホスト20A、20B及びストレージシステム30A及び30B等とでデータを送受信する。
ホスト20Aは、CPU201、メモリ202、インターフェース203及びインターフェース204を含む。
CPU201は、メモリ202に格納されているプログラムを読み込んで、そのプログラムに規定された処理を実行する。メモリ202は、各種プログラムやプログラムが使用するデータ等を格納する。インターフェース203は、ネットワーク11を介して統合管理サーバ11とでデータを送受信する。インターフェース203は、SW40Aを介して、ストレージシステム30A及び30Bとデータを送受信する。
なお、ホスト20Bの構成は、ホスト20Aの構成と略同一である。
ストレージシステム30Aは、複数のチャネルインターフェース310(310A、310B及び301C)、コントローラ320及びディスク装置330を含む。
チャネルインターフェース310A、310B及び310Cは、SW40A及び40Bを介して、ホスト20A及び20Bとでデータを送受信する。
チャネルインターフェース310Aは、CPU311、メモリ312、インターフェース313及びインターフェース314を含む。
CPU311は、メモリ312に格納されているプログラムを読み込んで、そのプログラムに規定された処理を実行する。メモリ312は、各種プログラムやプログラムが使用するデータ等を格納する。インターフェース313は、SW40A及び40Bを介して、ホスト20A及び20Bとデータを送受信する。インターフェース314は、コントローラ320と接続して、コントローラ320とデータを送受信する。
なお、チャネルインターフェース310A、310B及び310Cのいずれのインターフェース313が、いずれのSW40A及び40Bを介していずれのホスト20A及び20Bとでデータを送受信するかは、自由である。図1の例では、チャネルインターフェース310Aのインターフェース313のうち二つがSW40Aに接続している。また、チャネルインターフェース310Bのインターフェース313(図示せず)がSW40Aに接続している。また、チャネルインターフェース310Cのインターフェース313(図示せず)がSW40Bに接続している。また、これらの接続は、論理的なインターフェースであるポートを単位として処理される。
コントローラ320は、CPU321、メモリ322、インターフェース323及びディスクインターフェース324を含む。
CPU321は、メモリ322に格納されているプログラムを読み込んで、そのプログラムに規定された処理を実行する。メモリ322は、各種プログラムやプログラムが使用するデータ等を格納する。インターフェース323は、チャネルインターフェース310と接続して、チャネルインターフェース310とデータを送受信する。ディスクインターフェース324は、ディスク装置330と接続して、ディスク装置330とデータを送受信する。
ディスク装置330は、一つ以上のハードディスクドライブ331を含む。ディスク装置330は、RAID構成によってハードディスクドライブ331をアレイグループとして構成する。このアレイグループによって、論理的な記憶領域である論理デバイスが構成されている。
ストレージシステム30Bの構成は、ストレージシステム30Aの構成と略同一である。図1の例では、ストレージシステム30Bのチャネルインターフェース310の一方がSW40Aに接続している。そして他方のチャネルインターフェース310がSW40Aに接続している。
なお、以降では、特に区別する場合を除き、ホスト20A及びホスト20Bは、ホスト20とのみ表記する。同様に、ストレージシステム30A及び30Bは、ストレージシステム30Bとのみ表記する。同様に、SW40A及びSW40Bは、SW40とのみ表記する。同様に、チャネルインターフェース310A、310B及び310Cは、チャネルインターフェース310とのみ表記する。
次に、エージェントプログラムについて説明する。
本発明の実施の形態では、ホスト20及びストレージシステム30に、それぞれの性能情報を取得するためのプログラムを備える。そして、そのプログラムの処理によって取得された性能情報を、統合管理サーバ10に備えたマネージャプログラムによって収集する。
図2は、ストレージシステム30に備えられるエージェント1プログラム3000の機能ブロック図である。
エージェント1プログラム3000は、統合管理サーバ10の処理によってストレージシステム30のディスク装置330のいずれかの論理デバイスに格納される。ストレージシステム30は、格納されたエージェント1プログラム3000を読み込んで、プログラムの処理を実行可能に設定(以降、インストールと呼ぶ)して、エージェント1プログラム3000の処理を実行する。この処理によって、ストレージシステム30の性能情報が取得される。
エージェント1プログラム3000は、通信制御処理サブプログラム3100、データ収集管理モジュール3200、データ蓄積処理サブプログラム3300、アラーム管理処理モジュール3400及びマイクロプログラム処理サブプログラム3500を含む。
また、データ収集管理モジュール3200は、データ収集処理サブプログラム3201、データ収集対象管理処理サブプログラム3202及びデータ収集間隔管理処理サブプログラム3203を含む。
また、アラーム管理処理モジュール3400は、アラーム評価処理サブプログラム3401、アラームバインド情報管理サブプログラム3402及びイベント管理サブプログラム3403を含む。
通信制御処理サブプログラム3100は、エージェント1プログラム3000の通信に関する処理をする。より具体的には、エージェント1プログラム3000が取得した性能情報を統合管理サーバ10に送付したり、統合管理サーバ10から送信されたアラームを受信したりする。
データ収集管理モジュール3200は、ストレージシステム30の性能情報の取得に関する処理を実行する。より具体的には、データ収集処理サブプログラム3201は、データ収集対象管理処理サブプログラム3202によって設定されたデータ収集対象、すなわち、ポートや論理デバイスの性能情報を、データ収集間隔管理処理サブプログラム3203によって設定されたデータ収集間隔で取得する。
データ蓄積処理サブプログラム3300は、データ収集管理モジュール3200によって取得された性能情報を、ディスク装置330の論理デバイスに格納する。
アラーム管理処理モジュール3400は、アラームに関する処理を実行する。より具体的には、アラーム評価処理サブプログラム3401は、アラームバインド情報管理サブプログラム3402によって管理されているアラーム情報と取得した性能情報とを比較して、アラームをイベントとして報知するか否かを決定する。アラームをイベントとして報知することを決定した場合は、イベント管理サブプログラム3403によって、その内容がイベントとして統合管理サーバ10に報知される。
マイクロプログラム処理サブプログラム3500は、ストレージシステム30のコントローラ320に備えられ、ディスク装置330へのデータの入出力に関する処理をするプログラム、すなわち、マイクロプログラムから、性能情報に関わるデータを取得する。
図3は、ホスト20に備えられるエージェント2プログラム2000の機能ブロック図である。
エージェント2プログラム2000は、統合管理サーバ10の処理によってホスト20に格納される。ホスト20は、格納されたエージェント2プログラム2000を読み込んで、そのプログラムをインストールし、エージェント2プログラム2000の処理を実行する。この処理によって、ホスト20(又はSW40)の性能情報が取得される。
エージェント2プログラム2000は、通信制御処理サブプログラム2100、データ収集管理モジュール2200、データ蓄積処理サブプログラム2300、アラーム管理処理モジュール2400、マイクロプログラム処理サブプログラム2500及びプログラム配布管理モジュール2600を含む。
また、データ収集管理モジュール2200は、データ収集処理サブプログラム2201、データ収集対象管理処理サブプログラム2202及びデータ収集間隔管理処理サブプログラム2203を含む。
また、アラーム管理処理モジュール2400は、アラーム評価処理サブプログラム2401、アラームバインド情報管理サブプログラム2402及びイベント管理サブプログラム2403を含む。
また、プログラム配布管理モジュール2600は、イベント管理サブプログラム2601及びプログラム配布処理サブプログラム2602を含む。
これら、通信制御処理サブプログラム2100、データ収集管理モジュール2200、データ蓄積処理サブプログラム2300、アラーム管理処理モジュール2400及びマイクロプログラム処理サブプログラム2500の処理は、前述したエージェント1プログラム3000と略同一であるため説明を省略する。なお、マイクロプログラム処理サブプログラム2500は、ホスト20とストレージシステム30とのデータの入出力に関する処理をするプログラム、すなわち、マイクロプログラムから、性能情報に関わるデータを取得する。
プログラム配布管理モジュール2600は、プログラム、すなわちエージェント1プログラム3000の配布を管理する。より具体的には、イベント管理プログラム2601は、統合管理サーバ10から送信されたエージェント1プログラム3000の配布のための要求に従って、プログラム配布処理サブプログラム2602を介して、受信したエージェント1プログラム3000を配布先であるストレージシステム30に送信する。
このとき、統合管理サーバ10はホスト20に、要求コマンドとしてプログラムの配布要求を送信する。そして、ホスト20のエージェント2プログラム2000のプログラム配布管理モジュールは、要求に係るエージェント1プログラム3000とその設定情報を、ライトデータとして、ストレージシステム30の論理デバイスに書き込む。その後、統合管理サーバ10は、ストレージシステム30に、書き込まれたエージェント1プログラム3000のインストールを、ネットワーク11を介して、指示する。
図4は、統合管理サーバ10に備えられるクライアントプログラム2800の機能ブロック図である。
クライアントプログラム2800は、統合管理サーバ10において、管理者とのユーザインターフェースとして機能する。すなわち、管理者に対して情報を通知したり、管理者からの情報の入力を受け付ける。
クライアントプログラム2800は、通信制御処理サブプログラム2801、データ収集処理サブプログラム2802、データ表示処理サブプログラム2803、アラーム定期処理サブプログラム2804、アラーム表示処理サブプログラム2805、メッセージ表示処理サブプログラム2806を含む。
通信制御処理サブプログラム2801は、統合管理サーバ10の他のプログラム又はホスト20及びストレージシステム30とでデータを送受信する。
データ収集処理サブプログラム2802は、通信制御処理サブプログラム2801を介してデータを収集する。データ表示処理サブプログラム2803は、データ収集処理サブプログラム2802によって収集された性能情報を、統合管理サーバ10に備えられた表示装置等に表示する。
アラーム定義処理サブプログラム2804は、エージェント1プログラム3000又はエージェント2プログラム2000に送信する条件を定義する。アラーム表示処理サブプログラム2805は、発生したアラームを統合管理サーバ10に備えられた表示装置等に表示する。メッセージ表示処理サブプログラム2806は、管理者に対するメッセージを統合管理サーバ10に備えられた表示装置等に表示する。
図5は、統合管理サーバ10に備えられるマネージャプログラム1000の構成ブロック図である。
マネージャプログラム1000は、ホスト20にエージェント2プログラム2000を配布し、ストレージシステム30にエージェント1プログラム3000を配布する。また、これらエージェント1プログラム3000及びエージェント2プログラム2000によって取得された性能情報を受信し、受信した性能情報を集計し、集計したデータを格納する。
マネージャプログラム1000は、通信制御処理サブプログラム1100、データ収集モジュール1200、データ蓄積処理サブプログラム1300、プログラム配布管理処理モジュール1400、ノード管理情報モジュール1500、インストール先情報作成処理モジュール1600、データ統合処理サブプログラム1700及びアラーム管理処理モジュール1800を含む。
また、データ収集管理モジュール1200は、データ収集処理サブプログラム1201、データ収集対象管理処理サブプログラム1202、データ収集間隔管理処理サブプログラム1203及び収集データ時間間隔処理サブプログラム1204を含む。
また、プログラム配布管理処理モジュール1400は、イベント管理サブプログラム1401及びプログラム配布処理サブプログラム1402を含む。
また、ノード管理情報モジュール1500は、ノード情報管理処理サブプログラム1501、設定情報管理堀サブプログラム1502及びイベント管理サブプログラム1503を含む。
また、インストール先情報作成処理プログラム1600は、イベント管理サブプログラム1601及びインストール先情報作成処理サブプログラム1602を含む。
また、アラーム管理処理モジュール1800は、アラーム定義管理処理サブプログラム1801、アラーム状態管理処理サブプログラム1802及びイベント管理サブプログラム1803を含む。
通信制御処理サブプログラム1100は、マネージャプログラム1000の通信に関する処理をする。より具体的には、ネットワーク11を介して、ホスト20及びストレージシステム30とでデータを送受信する。
データ収集管理モジュール3200は、ホスト20及びストレージシステム30において、エージェント2プログラム2000及びエージェント1プログラム3000によって取得された性能情報を収集する。より具体的には、データ収集処理サブプログラム1201は、データ収集対象管理処理サブプログラム1202によって設定されたデータ収集対象、すなわち、ホスト20に格納されているエージェント2プログラム2000及びストレージシステム30に格納されているエージェント1プログラム3000が取得した性能情報を、データ収集間隔管理処理サブプログラム1203によって設定されたデータ収集間隔によってポーリングを行う。データ収集処理プログラム1201は、ポーリングの結果、エージェント1プログラム3000及びエージェント2プログラム2000から送信された性能情報を収集する。取得データ時間間隔処理サブプログラム1204は、最後にポーリングされた時刻と、エージェント1プログラム3000及びエージェント2プログラム2000から取得した性能情報の最新のエントリの時刻とを含む取得データ時間情報管理テーブル12041(図10)を管理する。
データ蓄積処理サブプログラム1300は、データ収集管理モジュール1200によって収集された性能情報を、メモリ122に格納する。なお、統合管理サーバ10にディスク装置を備え、このディスク装置に性能情報を格納してもよい。また、ストレージシステム30のディスク装置330の論理デバイスに性能情報を格納するように設定してもよい。
プログラム配布管理モジュール1400は、プログラム、すなわちエージェント1プログラム3000及びエージェント2プログラム2000の配布を管理する。より具体的には、プログラム配布処理サブプログラム1402は、ノード情報管理モジュール1500に設定された情報を参照して、エージェント1プログラム3000及びエージェント2プログラム2000の配布を要求する。イベント管理サブプログラム1401は、この配布要求を、イベントとしてホスト20及びストレージシステム30に送信する。
ノード管理情報モジュール1500は、ノード、すなわち、計算機システムを構成するホスト20、ストレージシステム30及びSW40の情報を管理する。
ノード情報管理処理サブプログラム1501は、ノード情報テーブル15010(図11)を管理する。設定情報管理サブプログラム1502は、設定情報管理テーブル15020(図8)を管理する。イベント管理サブプログラム1503は、ノード情報又は設定情報の変更を示すイベントを受信して、その情報をノード情報管理処理サブプログラム1501又は設定情報管理処理サブプログラム1502に渡す。
インストール先情報作成処理モジュール1600は、プログラム配布管理モジュール1500によって配布されるプログラムのインストールを管理する。より具体的には、インストール先情報作成処理サブプログラム1602は、ノード情報管理モジュール1500に設定された情報を参照して、インストール先情報(図9)を生成する。イベント管理サブプログラム1601は、生成されたインストール先情報を、イベントとして、ホスト20又はストレージシステム30に送信する。
データ統合処理サブプログラム1700は、エージェント1プログラム3000及びエージェント2プログラム2000によって取得された性能情報を受信し、受信した各データを、取得元のホスト20又はストレージシステム30毎に統合する。
アラーム管理処理モジュール1800は、アラームをイベントとしてホスト20及びストレージシステム30に送信し、ホスト20又はストレージシステム30からのアラームの報知を受信する。より具体的には、アラーム定義管理処理サブプログラム1801は、クライアントプログラム2800によって作成されたアラーム定義を、ホスト20及びストレージシステム30に送信する。その後、アラーム状態管理処理サブプログラム1802は、ホスト20又はストレージシステム30から報知されたアラームを受信して、現在のアラーム上垰を更新する。イベント管理サブプログラム1803は、アラームの報知を受信する。
図6は、ストレージシステム30に格納されるエージェント1プログラム3000の説明図である。
前述したように、エージェント1プログラム3000は、マネージャプログラム1000の処理によって、ストレージシステム30の論理デバイスのいずれかのアレイグループの領域に格納される。そして、統合管理サーバ10からの指示によって、格納したエージェント1プログラム3000がインストーされる。より具体的には、アレイグループの領域に格納されているエージェント1プログラム3000を、コントローラ3200のメモリ322に読み込む、又は領域をスワップすることによって、CPU321によってエージェント1プログラム3000の処理を実行可能に設定する。
ストレージシステム30では、ディスク装置330の記憶領域である論理デバイスを、ホスト20に対する記憶領域としてホスト20の業務を運用している。そのため、ホスト20からのアクセス頻度が高い、すなわち負荷の高い論理デバイスにエージェント1プログラム3000が格納されている場合は、その負荷によってエージェント1プログラム3000による性能情報の取得に影響がある。
そのため、できるだけ負荷の低い論理デバイスにエージェント1プログラム3000を格納して、性能情報の取得の処理をする方が望ましい。そこで、本発明の実施の形態では、エージェント1プログラム3000の格納場所を、エージェント1プログラム3000によって取得した性能情報、すなわち、ディスク装置330の論理デバイスの性能情報に基づいて、変更可能な仕組みを設ける。
図7は、ストレージシステム30のエージェント1プログラム3000が、ホスト20を介して統合管理サーバ10に送信する性能情報のデータ形式の一例の説明図である。
エージェント1プログラム3000は、所定の間隔又は所定の時刻にストレージシステムの性能情報を取得する。性能情報は、例えば、IOPS(I/O Per Second)やTransfer(I/Oのバイト数)である。
エージェント1プログラム3000は、図7に示すデータ形式で、ホスト20のエージェント2プログラム2000を介して、統合管理サーバ10に送信する。このとき、エージェント1プログラム3000は、送信するデータのそれぞれに「Key」を設定する。このKeyは、計算機システムにおいて、ストレージシステム30に対する一意な識別子である。このKeyを設定することによって、統合管理サーバ10は、ストレージシステム30毎に非同期で送信された性能情報データを、同一のストレージシステム30のデータとして収集できる。
図8は、設定情報テーブル15020の一例の説明図である。
設定情報管理テーブル15020は、設定情報管理サブプログラム1502によって管理されている、計算機システムに含まれる各構成(ホスト20、ストレージシステム30、SW40等)の論理的な設定情報である。
設定情報管理テーブル15020は、ホスト20で稼働しているユーザプログラムに関するユーザプログラム情報15021、ホスト20の構成に関するホスト構成情報15022、ストレージシステム30の構成に関するストレージシステム構成情報15023及びSW4に関するSW構成情報15024を含む。
なお、図8は、これらの相関関係を、GUIによって表示した例である。すなわち、クライアントプログラム2800のデータ表示処理サブプログラム2803は、ノード情報管理処理サブプログラム1501が管理しているノード情報を取得して、統合管理サーバ10の表示装置等に表示させる。このとき、互いの相関関係を示すことによって、どの構成は後の構成と相関関係にあるかを、管理者にわかりやすく表示することもできる。
図8の例では、ユーザプログラムが使用しているデバイスファイル名は、どのストレージシステム30のどの論理デバイス名であるかが示される。また、ホスト20が使用している論理デバイス名は、どのストレージシステム30の、どのアレイグループを含むか、が示される。また、ホスト20が使用しているHBAのポートのWWNは、どのSW40のどのポートであるかが示される。
図9は、統合管理サーバ10のインストール先情報16020の一例の説明図である。
マネージャプログラム1000は、ストレージシステム30に、エージェント1プログラム3000を配布するときに、プログラムの格納先情報であるインストール先情報16020を送信する。ストレージシステム30は、このインストール先情報16020を参照して、エージェント1プログラム3000を格納する。
インストール先情報16020は、格納元情報16021、格納先情報16022、データ収集対象情報16023及びデータ収集間隔情報16024を含む。
格納元情報16021及び格納先情報16022は、論理デバイス番号、アレイグループ名、ストレージシステム名、シリアル番号、コントローラのIPアドレスを含む。なお、格納元情報16021は、後述するように、既にストレージシステム30に格納されているエージェント1プログラム3000を他の格納先にコピーするときに用いる情報である。そのため、マネージャプログラム1000が、ストレージシステム30に最初にエージェント1プログラム3000を格納するときは、格納元情報16021は空欄とする。
図10は、統合管理サーバ10の取得データ時間情報管理テーブル12040の一例の説明図である。
取得データ時間情報管理テーブル12040は、エージェントプログラム1000の取得データ時間情報管理処理サブプログラム1204によって管理され、エージェント1プログラム3000及びエージェント2プログラム2000から性能情報をポーリングによって収集するために用いられる。より具体的には、エージェントプログラム1000は、この取得データ時間情報管理テーブル12040の内容を参照することによって、どのノードのどのエージェントプルグラムから、いつデータを収集し、既に収集されたデータはいつまでのデータであるか、という情報を知ることができる。
図11は、マネージャプログラム1000が管理しているノード情報テーブル15010の一例の説明図である。
統合管理サーバ10において、マネージャプログラム1000のノード情報管理モジュール1500のノード情報管理処理サブプログラム1501が、ノード情報テーブル15010を管理している。
このノード情報テーブル15010は、エージェントプログラム(エージェント1プログラム3000及びエージェント2プログラム2000)がどのノード(ホスト20、ストレージシステム30及びSW40)で、どのような状態であるかを管理する。
ノード情報テーブル15010は、エージェント名15011、エージェントタイプ15012、ノード情報15013、起動/停止状態15014及び制御指示15015を含むエントリによって構成される。
エージェント名15011はエージェントプログラムの識別子を格納する。エージェントタイプ15012は、エージェントプログラムのノードの種別を格納する。ノード情報15013は、エージェントプログラムの格納されたノードの情報を格納する。起動/停止状態15014は、そのエージェントプログラムの現在の状態を格納する。制御指示15015は、そのエージェントプログラムへの制御指示の状態を格納する。
例えば、エージェント名15011が「エージェントA」であるエントリは、エージェントタイプ15012が「ストレージ」と示され、そのノード情報15013は、「ストレージA(シリアル#1001)の論理デバイス#10:00」に格納されている。このエージェントプログラムに対する制御指示15015は「停止」であり、この制御指示に従って、起動/停止状態15014は「停止」が示される。
次に、以上のように構成された本発明の実施の形態の計算機システムの動作を説明する。
まず、エージェントプログラムの配布を説明する。
図12は、統合管理サーバ10のマネージャプログラム1000によってエージェント1プログラム3000及びエージェント2プログラム2000を配布する処理のシーケンス図である。
統合管理サーバ10において、マネージャプログラム1000のプログラム配布管理処理モジュール1400は、管理者によって指定されたホスト20に対して、まず、エージェント2プログラム2000を送信する。このとき同時に、エージェント2プログラム2000の実行する処理に必要な設定情報を送信する。又ホスト20は、受信したエージェント2プログラム2000をインストールして、実行しておく。
エージェント2プログラム2000及び設定情報を受信したホスト20は、メモリ202に、受信したエージェント2プログラム2000及び設定情報を格納する。格納が完了すると、送信元の統合管理サーバ10に、エージェント2プログラム2000及び設定情報の格納が完了した旨の通知を送信する。
この通知を受けたマネージャプログラム1000は、ホスト20に、エージェント1プログラム3000を送信する。このとき同時に、エージェント1プログラム3000の実行する処理に必要な設定情報、特に格納先のストレージシステム30に関する情報を送信する。
このエージェント1プログラム3000及び設定情報は、ホスト20のエージェント2プログラム2000が受信する。エージェント2プログラム2000のプログラム配布管理処理モジュール2600は、受信した設定情報を元に、どのストレージシステム30のどの論理デバイスにエージェント1プログラム3000及び設定情報を格納するかを決定する。そして、決定した格納場所にエージェント1プログラム3000及び設定情報を格納する。
プログラム配布管理処理モジュール2600は、ストレージシステム30から、エージェント1プログラム3000及び設定情報の格納のI/Oの完了を受信すると、統合管理サーバ10に、エージェント1プログラム3000及び設定情報を格納した旨の通知を送信する。このとき同時に、決定した格納先の情報を送信する。
この通知を受けたマネージャプログラム1000は、ネットワーク11を介して、格納先のストレージシステム30に、受信した格納先情報に含まれる論理デバイスの情報を指示して、エージェント1プログラム3000のインストールを指示する。
その後、マネージャプログラム1000は、ストレージシステム30から、エージェント1プログラム3000のインストール完了の通知を受信すると、本シーケンスの処理を終了する。
この図9の処理によって格納されたエージェント1プログラム3000の処理によって、ストレージシステム30の性能情報が取得される。また、エージェント2プログラム2000の処理によって、ホスト20の性能情報が取得される。エージェント1プログラム3000が取得した性能情報は、定期的、所定の時刻、又は、ホスト20のエージェント2プログラム2000の要求によって、ホスト20のエージェント2プログラム2000に送信される。ホスト20のエージェント2プログラム2000は、送信された性能情報を、自信が取得した性能情報とあわせて、統合管理サーバ10に送信する。統合管理サーバ10のマネージャプログラム1000は、送信された性能情報を収集する。
次に、収集した性能情報を元に、エージェント1プログラム3000の格納場所を変更する処理を説明する。
図13A乃至図13Cは、クライアントプログラム2800によって、エージェント1プログラム3000の格納場所を変更する処理のフローチャート及びシーケンス図である。
図13Aにおいて、クライアントプログラム2800のデータ収集サブプログラム2802は、マネージャプログラム1000によって収集された性能情報を参照する。そして、予め設定した下限値よりも大きく、かつ、予め設定した上限値よりも小さい性能情報のデータの論理デバイス名に対応するアレイグループ名を抽出する。なお、この性能情報のデータは、当該アレイグループに対するIOPSでもよいし、転送データ量でもよい(ステップS1001)。
次に、データ収集サブプログラム2802は、収集された性能情報を参照して、エージェント1プログラム3000からエージェント2プログラム2000に性能情報データを送信する時刻に、あらかじめ設定した負荷よりも負荷が低いホスト20の名前を抽出する(ステップS1002)。
なお、ステップS1001およびS1002では、閾値(上限値、下限値、負荷値)を予め設定し、この閾値を超えたアレイグループ及びホストがあった場合に、それを抽出した。これに対して、統合管理サーバ10が、管理者によって設定した閾値をアラーム情報として通知し、そのアラーム条件を満たした場合に返送されるアラームの通知の有無によって、アレイグループ及びホストを抽出してもよい。このアラームの通知は、後述する。
次に、データ収集サブプログラム2802は、マネージャプログラム1000のノード情報管理モジュール1500から、ノード情報(図11)を参照する。そして、参照したノード情報から、ステップS1001で抽出したアレイグループ名とステップS1002で抽出したホスト名とが対応するものがあるか否かを判定する(ステップS1003)。すなわち、ステップS1002で抽出したホスト20が使用する論理デバイス名に対応するアレイグループ名が、ステップS1001で抽出したアレイグループを含んでいるか否かを判定する。
対応するものがあると判定した場合は、ステップS1004に移行し、対応するものがないと判定した場合は、ステップS1008に移行する。
ステップS1004では、収集した性能情報のうち、アレイグループとホスト20との対応関係がある性能情報を、性能情報対応テーブル(図14)として、管理者に通知する。具体的には、統合管理サーバ10の表示装置等に、性能情報対応テーブルを表示する。のとき、さらに、対応関係のある性能情報を色付けすることによって、管理者にわかりやすく通知する。
管理者は、この通知を受けて、エージェント1プログラム3000をどのアレイグループに移動するかを選択する。
すなわち、通知されたアレイグループのうち最も性能が低いアレイグループでよいか否かを選択する(ステップS1005)。アレイグループの性能が最も低い場合とは、当該アレイグループがストレージシステム30において費用頻度が低いものである。従って、当該アレイグループにエージェント1プログラム3000を格納すれば、性能情報を取得するときに、アレイグループへのI/Oによる性能情報の影響が最も低い。
なお、通知された性能情報を参照して、管理者が、どのアレイグループにエージェント1プログラム3000を格納するかを選択してもよい(ステップs1006)。
一方、ステップS1003において、対応するものがないと判定した場合は、ステップS1008に移行し、ステップS1001で抽出したアレイグループ及びステップS1002で抽出したホストとを含む性能情報を、管理者に通知する。
管理者は、この性能情報から、エージェント1プログラム3000を格納するアレイグループ及び当該アレイグループを使用するホスト20を決定する(ステップS1009)。このとき、アレイグループにホスト20からのパスが設定されていない場合は、当該アレイグループとホスト20とのパスをアサインして、ホスト20によってアレイグループを使用可能に設定する(ステップS1010)。
次に、クライアントプログラム2800は、ステップS1005、ステップS1006又はステップS1009によって選択されたアレイグループに、既にエージェント1プログラム3000が格納されているか否かを判定する(ステップS1007)。
既にエージェント1プログラム3000が格納されている場合とは、例えば、アレイグループ及びホスト20を変更しない場合、又は、過去に一度当該アレイグループにエージェント1プログラム3000が格納されていた場合である。
エージェント1プログラム3000が格納済みでない場合は、図13Bに移行する。
図13Bにおいて、統合管理サーバ10のクライアントプログラム2800は、処理をマネージャプログラム1000に渡す。マネージャプログラム1000は、まず、エージェント1プログラム3000及びエージェント1プログラム3000によって取得された性能情報が格納されているアレイグループの情報(以降、格納元情報と呼ぶ)と、ステップS1005、ステップS1006又はステップS1009によって選択されたアレイグループの情報(以降、格納先情報と呼ぶ)を、ストレージシステム30に送信する。
ストレージシステム30において、コントローラ320は、受信した格納元情報及び格納先情報を参照して、格納元のアレイグループに格納されているエージェント1プログラム3000及び性能情報を、格納先のアレイグループにコピーする。このコピーが完了すると、統合管理サーバ10に、コピー完了の通知を送信する。
統合管理サーバ10において、マネージャプログラム1000は、次に、ホスト20に、エージェント2プログラム2000が格納済みであるか否かを判定する。エージェント2プログラム2000が格納されていない場合は、ホスト20にエージェント2プログラム2000及び設定情報を送信する。
エージェント2プログラム2000及び設定情報を受信したホスト20は、メモリ202に受信したエージェント2プログラム2000及び設定情報を格納する。格納が完了すると、送信元の統合管理サーバ10に、エージェント2プログラム2000及び設定情報の格納が完了した旨の通知を送信する。
エージェント2プログラム2000がホスト20に格納済みである場合、及び、ホスト20から格納が完了した旨の通知を受信した場合は、マネージャプログラム1000は、まず、ホスト20に、エージェント2プログラム2000のインストールを指示する。次に、ストレージシステム30にエージェント1プログラム3000のインストールを指示する。
エージェント1プログラム3000及びエージェント2プログラム2000のインストールが完了すると、これらのプログラムの処理によって性能情報が取得され、統合管理サーバによって性能情報が収集される。
一方、ステップS1007(図13A)において、エージェント1プログラム3000が格納済みである場合は、図13Cに移行する。
図13Cにおいて、統合管理サーバ10のクライアントプログラム2800は、処理をマネージャプログラム1000に渡す。マネージャプログラム1000は、エージェント1プログラム3000によって取得された性能情報が格納されているアレイグループの情報である格納元情報と、格納先情報とを、ストレージシステム30に送信する。
ストレージシステム30において、コントローラ320は、受信した格納元情報及び格納先情報を参照して、格納元のアレイグループに格納されている性能情報を、格納先のアレイグループにコピーする。このコピーが完了すると、統合管理サーバ10に、コピー完了の通知を送信する。
ストレージシステム30からコピー完了の通知を受信した場合は、マネージャプログラム1000は、ストレージシステム30にエージェント1プログラム3000のインストールを指示する。
エージェント1プログラム3000のインストールが完了すると、これらのプログラムの処理によって性能情報が取得され、統合管理サーバ10によって性能情報が収集される。
図14は、図13AのステップS1004において表示される性能情報対応テーブル4000の一例の説明図である。
性能情報対応テーブル4000は、論理デバイス名4001と、その論理デバイスを使用可能に設定されているホスト名4005との対応関係を示すエントリを含む。そして、論理デバイスの性能が下限値より大きく上限値より小さいものであり、かつ、負荷の低いホストであるエントリが、網掛けによって示される。
各エントリは、論理デバイス名4001、論理デバイスを含むストレージ名4002、ストレージのシリアル番号4003、当該論理デバイスの論理デバイス性能4004、ホスト名4004、ホストに対応するデバイスファイル名4006、デバイスファイルのデバイスファイル性能4007及びCPUの負荷4008を含む。
管理者は、統合管理サーバ10によって通知されたこの性能情報対応テーブル4000を参照して、エージェント1プログラム3000を、どの論理領域に格納するかを決定する。
図15は、アラーム通知のフローチャートである。
エージェント1プログラム3000及びエージェント2プログラム2000において、アラーム管理モジュール(3400及び2400)は、マネージャプログラム1000からイベントとして送信されたアラーム情報を元に、収集された性能情報が、アラーム情報の条件を満たす場合は、アラームとしてマネージャプログラム1000に通知する。
なお、ここでは、エージェント1プログラム300のアラーム管理モジュール3400の処理として説明するが、エージェント2プログラム2000のアラーム管理モジュール2400の処理も同一である。
まず、アラーム管理モジュール3400において、アラームバインド情報管理サブプログラム3402は、マネージャプログラム1000から通知されたイベントにアラーム情報が含まれている場合は、そのアラーム情報を取得する(ステップS1401)。
次に、アラーム評価処理サブプログラム3401は、データ収集管理モジュール3200によって取得された性能情報と、取得されたアラーム情報に含まれるアラーム条件とを比較し、性能情報がアラーム条件を満たすか否かを判定する(ステップS1402)。
性能情報がアラーム条件を満たさない場合は、処理を終了する。
性能情報がアラーム条件を満たす場合は、イベント処理モジュール3403は、アラーム条件に対応するアラームが発生したことを示すイベントを生成する(ステップS1403)。そして、生成されたイベントをマネージャプログラム1000に送信する。
以上の処理によって、アラームの発生がマネージャプログラム1000に通知される。
図16は、マネージャプログラム1000のアラーム管理処理モジュール1800によって管理されるアラーム状態管理テーブル18020の一例の説明図である。
アラーム状態管理テーブル18020は、マネージャプログラム1000のアラーム管理処理モジュール1800によって管理される。
エージェント1プログラム3000及びエージェント2プログラム2000によって送信されたアラーム発生イベントは、マネージャプログラム1000のアラーム管理処理モジュール1800のイベント管理サブプログラム1803が受け取り、アラーム状態管理処理サブプログラム1802によって、その内容がアラーム状態管理テーブルに格納される。
アラーム状態管理テーブル18020は、アラーム名18021、アラーム発生時刻18022、アラーム発生条件18023、アラーム発生時のデータ18024及びステータス18025を含む。
アラーム名18021は、受信したアラーム毎に付される識別子を格納する。アラーム発生時刻18022はアラームが発生した時刻の情報を格納する。アラーム発生条件18023は、管理者によって設定され他アラーム発生条件を格納する。アラーム発生時のデータ18024は、アラームが発生したとき、エージェントプログラムによって取得された性能情報の情報を格納する。ステータス18025は、そのアラームの内容を格納する。
例えばアラーム名18021が「アラーム001」であるエントリには、アラームの発生時刻18022が「2005/7/30 13:00」で示される時刻に、アラームが発生したことを示す。このアラームの発生条件18023は、論理デバイス#001のIOPSが、3000を超えた場合は警告とし、4000を超えた場合は障害とする。これに対してアラーム発生時のデータ18024はIOPSが5500であり、従って、ステータス18025に「障害」が設定されている。
図17は、統合管理サーバ10がデータを収集する処理のシーケンス図である。
本実施の形態の計算機システムでは、ストレージシステム30のエージェント1プログラム3000が取得した性能情報は、一旦ホスト20のエージェント2プログラム2000に送信される。エージェント2プログラム2000は、受信した性能情報を、統合管理サーバ10に送信する。このとき、エージェント1プログラム3000は、性能情報を、複数のホスト20、すなわち、ホスト20A及びホスト20Bに、分散して送信する。
まず、統合管理サーバ10において、マネージャプログラム1000のデータ収集管理モジュール1200は、ホスト20Aのエージェント2プログラム2000に対して、データ収集先情報及びデータ収集範囲情報を送信する。
ホスト20Aにおいて、エージェント2プログラム2000のデータ収集管理モジュール2200は、受信したデータ収集先情報及びデータ収集範囲情報に従って、データ収集先であるストレージシステム30に、取得した性能情報の送信を要求する。そして、受信した性能情報を、統合管理サーバ10に送信する。
同様に、マネージャプログラム1000のデータ収集管理モジュール1200は、ホスト20Bのエージェント2プログラム2000に対して、データ収集先情報及びデータ収集範囲情報を送信する。
ホスト20Bにおいて、エージェント2プログラム2000のデータ収集管理モジュール2200は、受信したデータ収集先情報及びデータ収集範囲情報に従って、データ収集先であるストレージシステム30に、取得した性能情報の送信を要求する。そして、受信した性能情報を、統合管理サーバ10に送信する。
マネージャプログラム1000は、ホスト20Aのエージェント2プログラム及びホスト20Bのエージェント2プログラム2000からそれぞれ受信した性能情報を、性能情報に付されたKeyを参照して、時刻順に並べて格納する。
なお、データ収集範囲情報は、時刻毎に異なるホスト20によって性能情報を受信するための指示が含まれる。より具体的には、例えば、0:00から7:59までに取得された性能情報はホスト20Aが受信し、8:00から12:59までに取得された性能情報はホスト20Bが受信する。このよう、複数のホスト20によって分散して性能情報を収集することによって、特定のホスト20の負荷が増大することを防ぐことができる。
なお、データ収集範囲情報は、時刻によって受信するホスト20を切り替えるのではなく、ストレージシステム30のポート毎、すなわちストレージシステム30とホスト20とで設定されたパスによって振り分けてもよい。また、ストレージシステム30に設定されている論理デバイス毎にホスト20を振り分けてもよい。
図18は、ストレージシステム30が取得した性能情報の振り分けの説明図である。
ストレージシステム30のエージェント1プログラム3000は、図18(C)に示すように、取得した性能情報を、取得時間順にデータベースとして格納している。
このとき、0:00から7:59までに取得された性能情報をホスト20Aのエージェント2プログラム2000が収集し、8:00から12:59までに取得された性能情報はホスト20Bのエージェント2プログラム2000が収集するように、データ収集範囲情報が設定されている場合を考える。ホスト20Aのエージェント2プログラム2000は、0:00から7:59までに取得された性能情報の送信をストレージシステム30のエージェント1プログラム3000に要求する。これを受けて、エージェント1プログラム3000は要求された時間に取得された性能情報、すなわち図18(A)を、ホスト20Aに送信する。このとき、送信するデータのヘッダ情報に、当該ストレージシステム30を示す識別情報であるKeyを付加して、性能情報を送信する。
同様に、ホスト20Bのエージェント2プログラム2000は、8:00から12:59までに取得された性能情報の送信をストレージシステム30のエージェント1プログラム3000に要求する。これを受けて、エージェント1プログラム3000は要求された時間に取得された性能情報、すなわち図18(B)を、ホスト20Bに送信する。このとき、送信するデータのヘッダ情報に、当該ストレージシステム30を示す識別情報であるKeyを付加して、性能情報を送信する。
ホスト20Aのエージェント2プログラム2000及びホスト20Bのエージェント2プログラム2000は、それぞれ収集した性能情報を、統合管理サーバ10に送信する。
統合管理サーバ10において、マネージャプログラム1000のデータ統合処理サブプログラム1700が、性能情報を受信する。
データ統合処理サブプログラム1700は、各ホスト20から送信された性能情報のヘッダ情報を参照して、Keyが同一の性能情報を、時系列順に一つの性能情報としてまとめる。この性能情報は、ストレージシステム30が取得した形式、すなわち図18(C)と同様になる。データ統合処理サブプログラム1700は、この性能情報を、メモリ102に格納する。
以上のように構成された本発明の実施の形態の計算機システムでは、ストレージシステム30の性能情報を取得するためのエージェント1プログラム3000を、ストレージシステム30に格納するので、ネットワーク上のデータの送受信による性能情報への影響を最小限に抑えることができる。
また、エージェント1プログラム3000が取得した性能情報は、複数のホスト20が分散して収集して、統合管理サーバ10に送信するので、特定のホスト20やホスト20とストレージシステム30とで設定されている特定のパスの負荷を軽減することができる。
また、ストレージシステム30が格納するエージェント1プログラム300は、ストレージシステム30の負荷が低い論理デバイスのうち負荷が低いホストにパスが設定されている論理デバイスに格納するので、他の処理の影響を受けることが少なく、より正確な性能情報を収集できると共に、ホスト20及びストレージシステム30によって稼働される業務への影響を最小限に抑えることができる。
本発明の実施の形態の、計算機システムの構成のブロック図である。 本発明の実施の形態の、エージェント1プログラムの機能ブロック図である。 本発明の実施の形態の、エージェント2プログラムの機能ブロック図である。 本発明の実施の形態の、クライアントプログラムの機能ブロック図である。 本発明の実施の形態の、マネージャプログラムの構成ブロック図である。 本発明の実施の形態の、エージェント1プログラムの説明図である。 本発明の実施の形態の、性能情報のデータ形式の一例の説明図である。 本発明の実施の形態の、設定情報テーブルの一例の説明図である。 本発明の実施の形態の、インストール先情報の一例の説明図である。 本発明の実施の形態の、取得データ時間情報管理テーブルの一例の説明図である。 本発明の実施の形態の、ノード情報テーブルの一例の説明図である。 本発明の実施の形態の、エージェントプログラムを配布する処理のシーケンス図である。 本発明の実施の形態の、エージェント1プログラムの格納場所を変更する処理のフローチャートである。 本発明の実施の形態の、エージェント1プログラムの格納場所を変更する処理のシーケンス図である。 本発明の実施の形態の、エージェント1プログラムの格納場所を変更する処理のシーケンス図である。 本発明の実施の形態の、性能情報対応テーブルの一例の説明図である。 本発明の実施の形態の、アラーム通知のフローチャートである。 本発明の実施の形態の、アラーム状態管理テーブルの一例の説明図である。 本発明の実施の形態の、データを収集する処理のシーケンス図である。 本発明の実施の形態の、性能情報の振り分けの説明図である。
符号の説明
10 統合管理サーバ
20A、20B ホスト
30A、30B ストレージシステム
40A、40B スイッチ(SW)
1000 マネージャプログラム
2000 エージェント2プログラム
2800 クライアントプログラム
3000 エージェント1プログラム

Claims (13)

  1. データを格納する一以上の論理領域が設定されたディスク装置と、前記ディスク装置へのデータの読み書きを制御する制御部と、ホスト計算機に接続するインターフェースとを備えたストレージシステムと、ネットワークを介して前記インターフェースに接続され、前記ディスク装置の論理領域へのデータの読み書きを要求するホスト計算機と、前記ストレージシステム、前記ネットワーク及び前記ホスト計算機の性能情報を収集する管理計算機と、を備えた計算機システムで実行される性能情報収集方法において、
    前記ホスト計算機と当該ホスト計算機が用いる前記論理領域との対応関係が設定されており、
    前記制御部が、前記ストレージシステムの性能情報を取得する第1のステップと、
    前記制御部が、前記取得した性能情報を、所定の閾値よりも負荷が低い前記ホスト計算機に送信する第2のステップと、
    前記ホスト計算機が、前記制御部から送信された性能情報を、前記管理計算機に送信する第3のステップと、
    前記管理計算機が、送信された性能情報を収集する第4のステップと、
    を備えることを特徴とする性能情報収集方法。
  2. 前記制御部は、前記性能情報を取得するプログラムを格納し、
    前記前記第1のステップは、
    前記制御部が、前記プログラムを、所定の閾値よりも負荷が低い論理領域に格納し、前記格納されたプログラムの処理によって、前記性能情報を取得することを特徴とする請求項1に記載の性能情報収集方法。
  3. 複数のホスト計算機を備え、
    前記第2のステップは、
    前記制御部が、前記プログラムによって取得された性能情報を二以上のデータに分割するステップと、
    前記制御部が、前記分割されたデータに前記ストレージシステムを識別する情報を付加するステップと、
    前記制御部が、前記識別子を付加したデータを、二以上の前記ホスト計算機に分散して送信するステップとを含み、
    前記第3のステップは、前記ホスト計算機それぞれが、前記制御部によって送信されたデータを前記管理計算機に送信し、
    前記第4のステップは、前記管理計算機が、前記ホスト計算機によって送信されたデータを結合することによって、前記ストレージシステムの性能情報を収集することを特徴とする請求項2に記載の性能情報収集方法。
  4. 前記管理計算機が、収集した性能情報を参照して、所定の閾値よりも負荷が低い前記ホスト計算機及び所定の閾値よりも負荷が低い前記論理領域を抽出し、前記抽出したホスト計算機と論理領域との対応を特定する第5のステップと、
    前記管理計算機が、前記特定された対応関係を通知する第6のステップと、
    前記管理計算機が、通知された対応関係に含まれる前記管理計算機で選択された前記論理領域に前記プログラムが格納されていない場合は、前記プログラムが格納されている第1の論理領域の情報と、前記選択された第2の論理領域の情報とを前記制御部に送信する第7のステップと、
    前記制御部が、前記第1の論理領域に格納されている前記プログラムを、前記第2の論理領域に移動する第8のステップと、を備えることを特徴とする請求項2に記載の性能情報収集方法。
  5. 前記管理計算機が、収集した性能情報を参照して、所定の閾値よりも負荷が低い前記ホスト計算機及び所定の閾値よりも負荷が低い前記論理領域を抽出し、前記抽出したホスト計算機と論理領域との対応を特定する第5のステップと、
    前記管理計算機が、前記特定された対応関係を通知する第6のステップと、
    前記管理計算機が、通知された対応関係に含まれる前記管理計算機で選択された前記論理領域に前記プログラムが格納されている場合は、前記プログラムによって取得された性能情報を格納する第3の論理領域の情報と、前記管理計算機で選択された第4の論理領域の情報とを前記制御部に送信する第9のステップと、
    前記制御部が、前記第3の論理領域に格納されている前記性能情報を、前記第4の論理領域に移動する第10のステップと、を備えることを特徴とする請求項2に記載の性能情報収集方法。
  6. 前記管理計算機が、収集した性能情報を参照して、所定の閾値よりも負荷が低い前記ホスト計算機及び所定の閾値よりも負荷が低い前記論理領域を抽出し、前記抽出したホスト計算機と論理領域との対応を特定する第5のステップと、
    前記管理計算機が、前記抽出されたホスト計算機と前記抽出された論理領域との対応関係が設定されていない場合は、前記抽出されたホスト計算機と前記抽出された論理領域とを通知する第11のステップと、
    前記管理計算機が、前記通知されたホスト計算機と対応関係が設定された論理領域に、前記プログラムが格納されていない場合は、前記プログラムが格納されている第5の論理領域の情報と、前記対応関係が設定された第6の論理領域の情報とを前記制御部に送信する第12のステップと、
    前記制御部が、前記第5の論理領域に格納されている前記プログラムを、前記第6の論理領域に移動する第13のステップと、を備えることを特徴とする請求項2に記載の性能情報収集方法。
  7. データを格納する一以上の論理領域が設定されたディスク装置と、前記ディスク装置へのデータの読み書きを制御する制御部と、ホスト計算機に接続するインターフェースとを備えたストレージシステムと、
    ネットワークを介して前記インターフェースに接続され、前記ディスク装置の論理領域へのデータの読み書きを要求するホスト計算機と、
    前記ストレージシステム、前記ネットワーク及び前記ホスト計算機の性能情報を収集する管理計算機と、を備えた計算機システムにおいて、
    前記ホスト計算機と当該ホスト計算機が用いる前記論理領域との対応関係が設定されており、
    前記制御部は、
    前記ストレージシステムの性能情報を取得し、
    前記取得した性能情報を、所定の閾値よりも負荷が低い前記ホスト計算機に送信し、
    前記ホスト計算機は、前記制御部から送信された性能情報を、前記管理計算機に送信し、
    前記管理計算機は、送信された性能情報を収集することを特徴とする計算機システム。
  8. 前記ストレージシステムは、前記性能情報を取得するプログラムを格納し、
    前記制御部は、前記プログラムを、所定の閾値よりも負荷が低い論理領域に格納し、前記格納されたプログラムの処理によって、前記性能情報を取得することを特徴とする請求項7に記載の計算機システム。
  9. 複数のホスト計算機を備え、
    前記制御部は、
    前記プログラムによって取得された性能情報を二以上のデータに分割し、
    前記分割されたデータに前記ストレージシステムを識別する情報を付加し、
    前記識別子を付加したデータを、二以上の前記ホスト計算機に分散して送信し、
    前記ホスト計算機は、それぞれが、前記制御部によって送信されたデータを前記管理計算機に送信し、
    前記管理計算機は、前記ホスト計算機によって送信されたデータを結合することによって、前記ストレージシステムの性能情報を収集することを特徴とする請求項8に記載の計算機システム。
  10. 前記管理計算機は、
    収集した性能情報を参照して、所定の閾値よりも負荷が低い前記ホスト計算機及び所定の閾値よりも負荷が低い前記論理領域を抽出し、前記抽出したホスト計算機と論理領域との対応を特定し、
    前記特定された対応関係を通知し、
    通知された対応関係に含まれる前記管理計算機で選択された前記論理領域に前記プログラムが格納されていない場合は、前記プログラムが格納されている第1の論理領域の情報と、前記選択された第2の論理領域の情報とを前記制御部に送信し、
    前記制御部は、前記第1の論理領域に格納されている前記プログラムを、前記第2の論理領域に移動することを特徴とする請求項8に記載の計算機システム。
  11. 前記管理計算機は、
    収集した性能情報を参照して、所定の閾値よりも負荷が低い前記ホスト計算機及び所定の閾値よりも負荷が低い前記論理領域を抽出し、前記抽出したホスト計算機と論理領域との対応を特定し、
    前記特定された対応関係を通知し、
    通知された対応関係に含まれる前記管理計算機で選択された前記論理領域に前記プログラムが格納されている場合は、前記プログラムによって取得された性能情報を格納する第3の論理領域の情報と、前記管理計算機で選択された第4の論理領域の情報とを前記制御部に送信し、
    前記制御部は、前記第3の論理領域に格納されている前記性能情報を、前記第4の論理領域に移動することを特徴とする請求項8に記載の計算機システム。
  12. 前記管理計算機は、
    収集した性能情報を参照して、所定の閾値よりも負荷が低い前記ホスト計算機及び所定の閾値よりも負荷が低い前記論理領域を抽出し、前記抽出したホスト計算機と論理領域との対応を特定し、
    前記抽出されたホスト計算機と前記抽出された論理領域との対応関係が設定されていない場合は、前記抽出されたホスト計算機と前記抽出された論理領域とを通知し、
    前記通知されたホスト計算機と対応関係が設定された論理領域に、前記プログラムが格納されていない場合は、前記プログラムが格納されている第5の論理領域の情報と、前記対応関係が設定された第6の論理領域の情報とを前記制御部に送信し、
    前記制御部は、前記第5の論理領域に格納されている前記プログラムを、前記第6の論理領域に移動することを特徴とする請求項8に記載の計算機システム。
  13. データを格納する一以上の論理領域が設定されたディスク装置と、プロセッサとメモリとを備え、前記ディスク装置へのデータの読み書きを制御する制御部と、プロセッサとメモリとを備え、ホスト計算機に接続するインターフェースとを備えたストレージシステムと、
    プロセッサとメモリとを備え、ネットワークを介して前記インターフェースに接続され、前記ディスク装置の論理領域へのデータの読み書きを要求するホスト計算機と、
    プロセッサとメモリとを備え、前記ストレージシステム、前記ネットワーク及び前記ホスト計算機の性能情報を収集する管理計算機と、を備えた計算機システムにおいて、
    前記ホスト計算機と当該ホスト計算機が用いる前記論理領域との対応関係が設定されており、
    前記ストレージシステムは、前記性能情報を取得するプログラムを備え、
    前記制御部は;
    前記性能情報を取得するプログラムを、前記論理領域に格納し、
    前記格納されたプログラムを前記メモリに読み込んで、前記プロセッサの処理によって前記性能情報を取得し、
    前記プログラムによって取得された性能情報を二以上のデータに分割し、
    前記分割されたデータに前記ストレージシステムを識別する情報を付加し、
    前記識別子を付加したデータを、所定の閾値よりも負荷が低い二以上の前記ホスト計算機に分散して送信し、
    前記ホスト計算機は、それぞれ、前記制御部によって送信されたデータを前記管理計算機に送信し、
    前記管理計算機は、前記計算機によって送信されたデータを結合することによって、前記ストレージシステムの性能情報を収集し、
    前記管理計算機は;
    収集した性能情報を参照して、所定の閾値よりも負荷が低い前記ホスト計算機及び所定の閾値よりも負荷が低い前記論理領域を抽出し、前記抽出したホスト計算機と論理領域との対応を特定し、
    前記特定された対応関係を通知し、
    通知された対応関係に含まれる前記管理計算機で選択された前記論理領域に前記プログラムが格納されていない場合は、前記プログラムが格納されている第1の論理領域の情報と、前記選択された第2の論理領域の情報とを前記制御部に送信し、
    前記制御部は、前記第1の論理領域に格納されている前記プログラムを、前記第2の論理領域に移動することを計算機システム。
JP2005306943A 2005-10-21 2005-10-21 性能情報収集方法及び計算機システム Expired - Fee Related JP4585423B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005306943A JP4585423B2 (ja) 2005-10-21 2005-10-21 性能情報収集方法及び計算機システム
US11/299,750 US20070130564A1 (en) 2005-10-21 2005-12-13 Storage performance monitoring apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005306943A JP4585423B2 (ja) 2005-10-21 2005-10-21 性能情報収集方法及び計算機システム

Publications (2)

Publication Number Publication Date
JP2007115093A true JP2007115093A (ja) 2007-05-10
JP4585423B2 JP4585423B2 (ja) 2010-11-24

Family

ID=38097196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005306943A Expired - Fee Related JP4585423B2 (ja) 2005-10-21 2005-10-21 性能情報収集方法及び計算機システム

Country Status (2)

Country Link
US (1) US20070130564A1 (ja)
JP (1) JP4585423B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021174208A (ja) * 2020-04-23 2021-11-01 株式会社日立製作所 ストレージシステム及びストレージシステムによる情報処理方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2014054274A1 (ja) * 2012-10-02 2016-08-25 パナソニックIpマネジメント株式会社 監視装置及び監視方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002061584A1 (fr) * 2001-01-31 2002-08-08 Mitsubishi Denki Kabushiki Kaisha Systeme d'exploitation, systeme d'exploitation de niveau plus eleve, et systeme de transmission
JP2003345522A (ja) * 2002-05-27 2003-12-05 Hitachi Ltd データ再配置方法及び装置
JP2005157933A (ja) * 2003-11-28 2005-06-16 Hitachi Ltd ストレージネットワークの性能情報を収集する方法およびプログラム
JP2006018701A (ja) * 2004-07-05 2006-01-19 Ricoh Co Ltd ログ出力システム、方法、プログラム、及び記録媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5623598A (en) * 1994-11-22 1997-04-22 Hewlett-Packard Company Method for identifying ways to improve performance in computer data storage systems
US6032224A (en) * 1996-12-03 2000-02-29 Emc Corporation Hierarchical performance system for managing a plurality of storage units with different access speeds
US6154853A (en) * 1997-03-26 2000-11-28 Emc Corporation Method and apparatus for dynamic sparing in a RAID storage system
US7171338B1 (en) * 2000-08-18 2007-01-30 Emc Corporation Output performance trends of a mass storage system
US6799147B1 (en) * 2001-05-31 2004-09-28 Sprint Communications Company L.P. Enterprise integrated testing and performance monitoring software
US7133915B2 (en) * 2002-10-10 2006-11-07 International Business Machines Corporation Apparatus and method for offloading and sharing CPU and RAM utilization in a network of machines

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002061584A1 (fr) * 2001-01-31 2002-08-08 Mitsubishi Denki Kabushiki Kaisha Systeme d'exploitation, systeme d'exploitation de niveau plus eleve, et systeme de transmission
JP2003345522A (ja) * 2002-05-27 2003-12-05 Hitachi Ltd データ再配置方法及び装置
JP2005157933A (ja) * 2003-11-28 2005-06-16 Hitachi Ltd ストレージネットワークの性能情報を収集する方法およびプログラム
JP2006018701A (ja) * 2004-07-05 2006-01-19 Ricoh Co Ltd ログ出力システム、方法、プログラム、及び記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021174208A (ja) * 2020-04-23 2021-11-01 株式会社日立製作所 ストレージシステム及びストレージシステムによる情報処理方法
JP7015865B2 (ja) 2020-04-23 2022-02-03 株式会社日立製作所 ストレージシステム及びストレージシステムによる情報処理方法
US11429278B2 (en) 2020-04-23 2022-08-30 Hitachi, Ltd. Storage system and information processing method by storage system

Also Published As

Publication number Publication date
US20070130564A1 (en) 2007-06-07
JP4585423B2 (ja) 2010-11-24

Similar Documents

Publication Publication Date Title
EP1837751B1 (en) Storage system, storage extent release method and storage apparatus
US7711908B2 (en) Virtual storage system for virtualizing a plurality of storage systems logically into a single storage resource provided to a host computer
EP2854021B1 (en) Control device for a storage system capable of acting as a constitutent element of a virtual storage system
US7428584B2 (en) Method for managing a network including a storage system
JP4566874B2 (ja) Ipネットワークにおけるストレージアクセス管理機能及びシステム
JP4434235B2 (ja) 計算機システムまたは計算機システムの性能管理方法
US10073705B1 (en) Techniques for automated data storage system port initialization
US20140215482A1 (en) Unified storage system with a block micro controller and a hypervisor
JP2007328611A (ja) ストレージ仮想化システム及び方法
JPWO2008114441A1 (ja) ストレージ管理プログラム、ストレージ管理方法およびストレージ管理装置
US7895395B2 (en) Managing logical volumes in a storage system with remote copy
US8615586B2 (en) Discovery of logical images at storage area network endpoints
JP4285058B2 (ja) ネットワーク管理プログラム、管理計算機及び管理方法
JP2005338985A (ja) 記憶領域管理方法及びシステム
US7886186B2 (en) Storage system and management method for the same
US10019182B2 (en) Management system and management method of computer system
WO2013171865A1 (ja) 管理方法及び管理システム
JP4585423B2 (ja) 性能情報収集方法及び計算機システム
JP2006031350A (ja) 計算機システム、管理装置及びそのプログラム
JP6516875B2 (ja) 統合プラットフォーム、サーバ、及び、フェイルオーバ方法
JP6244496B2 (ja) サーバストレージシステムの管理システム及び管理方法
US9158474B2 (en) Dynamic storage device libraries
Beichter et al. IBM System z I/O discovery and autoconfiguration

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100810

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100903

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130910

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees