JP4881761B2 - システムリソース監視方法、監視装置、及びプログラム - Google Patents

システムリソース監視方法、監視装置、及びプログラム Download PDF

Info

Publication number
JP4881761B2
JP4881761B2 JP2007043659A JP2007043659A JP4881761B2 JP 4881761 B2 JP4881761 B2 JP 4881761B2 JP 2007043659 A JP2007043659 A JP 2007043659A JP 2007043659 A JP2007043659 A JP 2007043659A JP 4881761 B2 JP4881761 B2 JP 4881761B2
Authority
JP
Japan
Prior art keywords
value
system resource
utilization
calculating
variation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007043659A
Other languages
English (en)
Other versions
JP2008209994A (ja
Inventor
聡 屋代
千昭 加藤
真理 平本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007043659A priority Critical patent/JP4881761B2/ja
Publication of JP2008209994A publication Critical patent/JP2008209994A/ja
Application granted granted Critical
Publication of JP4881761B2 publication Critical patent/JP4881761B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、プロセッサやメモリといったシステムリソースの利用率を収集・分析し、システムリソース群の利用効率を計算し、監視する技術に関する。
近年、XMLやHTTPといったインターネット親和性の高い技術を利用し、ネットワーク上にサービスを構築するWebサービス、Webサービスをはじめとするサービスを組み合わせることでシステムを構築する手法であるSOA、個々の計算機資源をネットワーク越しに融通しあうグリッドコンピューティング、といった技術が実用化されつつある。これらの技術は、サービスと、サービスを実行するリソースの関連づけを緩やかにしてくれる特徴を持つことから、システムの柔軟性向上や信頼性向上といった効果をもたらしてくれる。しかし一方で、個々のリソースに生じた変化が何を表しているのかわかりにくいことから、障害検知が難しいというデメリットもある。通常、監視のために収集可能なデータは個々のリソースの利用率といった情報だが、個々のリソース利用率から障害を検知することは難しい。このような課題を解決するための従来技術としては、観測されたあるノード間のトランザクションパターンの発生確率から通常時パターンとの外れ度を算出することで異常検知を自動化する技術である、特許文献1に記載の技術などがある。さらに、SOA環境でシステムリソースの情報を収集する方法としては、非特許文献1の方法などがある。
特開2005−216066号公報 「地域情報プラットフォームにおけるリソース管理に関する一考察」、(財)電子通信情報学会2006年総合大会講演論文集CD−ROM D−17−2、2006年
ところで、システムの望ましさという観点からは、障害の発生期間を短くすること(障害の発生を防止し、発生した場合には早期に回復すること)とともに、リソースの利用における無駄が少ないことが重要である。しかしながら、サービスと、サービスを実行するリソースの関連づけが緩やかなシステムでは、従来、システムリソースの利用効率を定量的に評価する手法が確立されていない。そのため、従来の技術では、個々のリソース利用率を観測した際、リソース利用率からシステムの使われ方が効率的か否かを判断することができず、利用効率を向上させる対策をとることが難しい。
本発明は上記事情を鑑みたものであり、本発明の目的は、サービスと、サービスを実行するシステムリソースの関連づけが緩やかなシステムにおいて、観測されたリソース利用率値に特別な演算を施すことで、システムにおけるリソース群の利用効率を定量化し評価を容易にする技術を提供することにある。
本発明のさらなる目的は、利用効率を定量化する際、監視対象の様々な特性に適した定量化技術を提供することにある。
上記課題を解決すべく本発明では、システムリソースの利用率値に基づいて、利用率に関するばらつきと、不稼動率値を求め、かかる2つの値に基づき指標値を求める。
本発明は例えば、複数のシステムリソースを持つシステムのシステムリソース監視装置のシステムリソース監視方法であって、前記システムリソース監視装置は、利用率値取得手段と、ばらつき値算出手段と、不稼動率値算出手段と、利用効率値算出手段と、を有し、利用率値取得手段が、各システムリソースの利用率値を取得する利用率値取得ステップ、ばらつき値算出手段が、前記利用率値取得ステップで取得した各システムリソースの利用率値を用いて、システムリソース全体に関する利用率値のばらつき値を算出するばらつき値算出ステップ、不稼動率値算出手段が、前記利用率値取得ステップで取得した各システムリソースの利用率値を用いて、システム全体に関する不稼動率値を算出する不稼動率値算出ステップ、利用効率値算出手段が、前記ばらつき値と前記不稼働率値とを用いて、前記システムリソース全体に関する利用効率値を求める利用効率値算出ステップ、から構成される
また、本発明は、複数のシステムリソースを持つシステムのシステムリソース監視装置のシステムリソース監視方法であって、前記システムリソース監視装置は、利用率値取得手段と、スコア変換手段と、ばらつき値算出手段と、不稼動率値算出手段と、利用効率値算出手段と、を有し、利用率値取得手段が、各システムリソースの利用率値を取得する利用率値取得ステップ、スコア変換手段が、前記利用効率値取得ステップで取得した各システムリソースの利用率値を、予め定められた変換ルールに従い、0.0以上1.0以下の利用率スコアに変換するスコア変換ステップ、ばらつき値算出手段が、前記スコア変換ステップで変換した各システムリソースの利用率スコアを用いて、システムリソース全体に関する利用率スコアのばらつき値を算出するばらつき値算出ステップ、不稼動率値算出手段が、前記スコア変換ステップで変換した各システムリソースの利用率スコアを用いて、システム全体に関する不稼動率値を算出する不稼動率値算出ステップ、利用効率値算出手段が、前記ばらつき値と前記不稼働率値とを用いて、システムリソース全体に関する利用効率値を求める利用効率値算出ステップ、から構成される
以下に本発明が適用された一実施形態として、LAN(Local Area Network)等で接続された複数台のサーバやネットワーク機器から構成される企業情報システムにおけるシステムリソース監視システムについて説明する。
図1は、システムリソース監視システムの概要構成図である。システムリソース監視システムは、監視対象となるサーバ(「監視対象装置」という)102と、監視対象装置102が有するシステムリソースを監視するためシステムリソース監視装置110とが、ネットワーク101に接続されて構成されている。なお、ネットワーク101は、LANでもWAN(Wide Area Network)でも構わない。
監視対象装置102は、ネットワーク101を介して通信を行うネットワークインタフェース部103と、SNMP(Simple Network Management Protocol)エージェントに代表されるリソースデータ提供エージェント104とを備えている。リソースデータ提供エージェント104は、システムリソース監視装置110からのリソースデータ送信要求に応じて、監視対象装置102のCPU(Central Processing Unit)、メモリ、ディスク等のリソースの利用率値を収集し、システムリソース監視装置110に送信する処理を行う。
なお、利用率値は、システムリソースが許容する最高性能又は最大容量に対し収集時に実際に使用していた性能又は容量の比を表す数値であり、0.0から1.0の間の値を取りうる数値である。
ネットワーク101には、複数の監視対象装置102が配置され、それらのうち何台かは財務会計システムグループといったグループ108を形成する。また、財務会計システムグループと資産管理システムグループを合わせて経理システムグループを構成するといった、複数グループの集合によって構成される上位のグループ109が存在する場合もあり、グループの階層数に特段の制限はない。
システムリソース監視装置110は、ネットワーク101を介して通信を行うネットワークインタフェース部111と、システムリソースデータ収集部112と、システムリソース利用効率を計算するシステムリソース利用効率計算部113と、システムリソース利用効率を液晶ディスプレイ等の表示装置に表示するシステム利用効率値表示部120と、を備える。
システムリソースデータ収集部112は、定期的に、あるいは操作者からの要求に応じて、監視対象装置102に対して、システムリソースデータの送信要求を送る。あるいは、監視対象装置102のリソースデータ提供エージェント104が定期的に、もしくは特定のタイミングでシステムリソースデータをシステムリソースデータ収集部112に送信する。そして、システムリソースデータ収集部112は、受信したシステムリソースデータを、システム利用効率計算部113に送る。または、システムリソースデータ蓄積データベース119に格納する。
図2は、システムリソースデータ蓄積データベース119に蓄積されるシステムリソースデータ1200の構成を示す図である。システムリソースデータ1200には、個々のリソースを識別するリソースID1201と、リソース名1202と、リソースが属する監視対象装置を識別する装置ID1203と、観測時刻における利用率値1204と、観測時刻1205とを列とするレコード1206が蓄積される。
図1に戻って説明する。システムリソース利用効率計算部113は、システムリソースデータを用いて、システムリソース利用効率を計算する。そのため、システムリソース監視装置110は、自身の記憶装置に、システムリソース利用効率計算部113が利用効率を計算する際にパラメータとして参照する種々のデータが格納されたファイルを保持している。
これらのファイルには、効率係数定義ファイル114、利用率値スコア定義ファイル115、対象種別スコア定義ファイル116、構成別スコア定義ファイル117、スケジュール別スコア定義ファイル118などがある。これらのファイルの内容については後述する。
上記のように構成されるシステムリソース監視装置110、及び監視対象装置102は、図3で示すような、CPU151、メモリ(RAM(Random Access Memory)等)152、ディスク(HDD:Hard Disk Drive)153、入力装置(キーボード、マウス等)154、表示装置(液晶ディスプレイ等)155、通信装置156、などからなるコンピュータシステムにより達成される。図1に示した機能及び構成要素は、CPU151がメモリ152にロードしたプログラムを実行することで達成される。そのため、ディスク153には、各処理のためのプログラムが記憶されている。
次に、システムリソース監視装置110の特徴的な動作について説明する。
図4は、利用効率計算処理のフローを示す図である。
かかるフローは、システムリソース利用効率計算部113によって、定期的に、若しくはシステム監視者からの指示にしたがって、開始される。
なお、システムリソースデータ蓄積データベース119には、図2で示したような、システムリソースデータ1200が蓄積されているものとする。
まず、システムリソース利用効率計算部113は、リソース群の利用率値を入力するため、システムリソースデータ1200の中から、計算対象となる利用率値が格納されたレコード1206を取得する(S101)。具体的には、観測時刻1205が、直近の所定時間内(例えば、過去5秒以内)であるレコード1206を取得する。その後、システムリソース利用効率計算部113は、2つの独立した処理を行う。
すなわち一方では、システムリソース利用効率計算部113は、まず、取得したレコード1206に格納されている各利用率値を取得し、取得した利用率値の分散値を計算する(S102)。そして、取りうる分散値の最小値が0.0で最大値が1.0となるよう正規化処理を行うことでばらつき値を計算する(S103)。さらに、ばらつき値の二乗値を計算し(S104)、効率係数定義ファイル114にあらかじめ記録されている効率係数(例えば、0.5)を読み込み、二乗値と効率係数の積を計算することでばらつき成分値を計算する(S105)。
なお、システムリソース利用効率計算部113は、入力装置154を介してシステム管理者から、効率係数の指定を受け付けることができる。システムリソース利用効率計算部113は、効率係数の指定を受け付けた場合、受け付けた効率係数を効率係数定義ファイル114に格納し、ばらつき成分値の算出に用いる。
これら一連の処理(S102〜S105)を数式で表現すると、以下のようになる。
Figure 0004881761
ここで、vは、ばらつき成分値である。riは、i番目のリソースの利用率値である。Mは、全riの平均値である。Nは、全リソースの個数である。αは、効率係数である。利用率値は、0.0から1.0の間の数であることから、半数の利用率値が0.0、残り半数の利用率値が1.0の場合に分散値は最大となり0.25を取ることから、正規化のために4を乗じている。
もう一方の処理では、システムリソース利用効率計算部113は、まず、リソース群の(1−利用率値)の総和を計算する(S106)。そして、取りうる(1−利用率値)の総和の最小値が0.0で最大値が1.0となるよう正規化処理を行うことで不稼動率値を計算し(S107)、不稼動率値の二乗値を計算する(S108)。さらに、効率定義ファイル114にあらかじめ記録されている効率係数を読み込み、二乗値と(1−効率係数)の積を計算することで、不稼働率成分値を計算する(S109)。
これら一連の処理(S106〜S109)を数式で表現すると、以下のようになる。
Figure 0004881761
ここで、uは不稼働率成分値を表しており、他の記号は数式(1−1)と同じである。
これら二つの成分値が求められた後、システムリソース利用効率計算部113は、二つの成分値の和の平方根を計算することで、システムリソース群の利用効率値を計算する(S110)。これを、数式で表現すると以下のようになる。
Figure 0004881761
ここで、eは利用効率値を表しており、vおよびuはそれぞれ数式(1−1)、数式(1−2)におけるものを表している。
なお、数式(1−3)で求められる利用効率値は、S101で取得した利用率値の観測時刻(あるいはほとんど同時刻であるとみなすことが可能な直近の所定時間内)における値である。
通常、利用効率値の変化を観察することで監視を行うため、システムリソース利用効率計算部113は、図4のフローで示した処理を、一定時刻ごとに継続的に実施し利用効率値の列を求める。
システムリソース利用効率表示部120は、こうして求められた時系列の利用効率値を、表示装置にグラフ表示するなどする。
以上、図4のフローについて説明した。
こうして求められる利用効率値は、個々のシステムリソースの使われ具合にばらつきが大きい場合には大きな値が、また遊んでいる(利用されていない)システムリソースが多い場合にも大きな値が得られる。反対に、システムリソースの利用率が高くばらつきも少ない場合には小さな値が得られ、利用率とばらつきのどちらをより重視するかは効率係数αによって調整される。
従って、システム監視者は、システムリソース利用率の高さとばらつき具合のどちらにより関心があるかにより、効率係数αを設定することができる。そして、効率係数αに応じて、利用効率値がより小さな値を示している場合には、システムリソース群の利用効率が高く、反対に大きな値を示している場合には利用効率が低いと判断することが可能となる。
なお、数式(1−1)〜(1−3)で示した数式を満たした結果が求められるならば、演算の方法に制限はない。また、各ステップの順番にも制限はない。
上記実施形態は、様々な変形が可能である。以下に、いくつかの変形例について説明する。
<変形例1>
図5は、システムリソース利用効率計算部113によって実行される利用効率計算処理のフローを示す図である。図4で示した利用効率計算処理の他の方法を示している。
図4のフローによると、システムリソースの稼働率成分という観点からは利用率が高ければ高いほど利用効率値として望ましい値が得られる。しかしながら、CPUやメモリの利用率が常に100%で動作し続けるよりも、80%程度の利用率を維持しているときの方がシステムとして望ましい場合がある。
そこで、システムリソース利用効率計算部113は、リソース群の利用率値を入力した後(S201)、利用率値スコア定義ファイル115から読み込んだ演算ルールに従い個々のリソース利用率値を利用率スコアに変換する(S201')。
例えば、システムリソース利用効率計算部113は、利用率値が0の場合はスコアも0とする。一方、利用率値が0.5(=50%)から0.8(=80%)程度の場合は、最も望ましい状態であるので、スコアを1.0とする。利用率値が1.0(=100%)の場合、無駄が無い一方で処理能力を超えていることからスコアを0.5にする。これら境界値の間では、利用率値の変化に対し、スコアを線形に変化させる。かかる利用率スコアの演算ルールは、次式のように表現できる。
Figure 0004881761
上記の演算ルールを図示すると、図6のようになる。演算ルール401は数式(1−4)をグラフ表現したものである。
図5で示した処理フローは、基本的に図4で示した処理フローと同じである。ただし、上述のように、システムリソース利用効率計算部113は、演算ルール401を用いて、リソース群の個々の利用率値を個々の利用率スコアに換算する。そして、図4のS102〜S110に対応するS202〜S210の処理では、利用率値の代わりに、利用率スコアを用いて、利用効率値を求める。
<変形例2>
さらに、利用率スコアを計算する演算ルールは、CPUやメモリといったリソース種別ごとに設定されていてもよい。例えば、CPU利用率とメモリ利用率を考えた場合、CPU利用率値は比較的変動が激しく一瞬のうちに100%に近い利用率になったかと思うと、次の瞬間には10%、20%と低くなることがあり、利用率値の大きさが利用効率そのものに与える影響は小さい。同様の傾向はネットワーク利用率(ネットワークポートの流量)に対しても言える。一方メモリに関しては、CPUのように利用率値が瞬間的に大きく変動するということはなく、一度上昇したメモリ利用率値はプログラムの終了やデータの開放が行われない限り減少せず、利用率値の大きさが利用効率に与える影響は大きい。同様の傾向はディスク利用率に対しても言える。
従って、図7に示すように、リソース種別ごとに利用率スコアを計算する演算ルールを設定してもよい。図7では、CPU151の利用率スコア演算ルール501と、メモリ152の利用率演算ルール502と、ネットワーク(通信装置156)の利用率演算ルール503と、ディスク153の利用率演算ルール504と、示している。
図5に示す演算ルール501〜504は、対象種別スコア定義ファイル116に記録されている。
利用効率値を求める処理フローは、図5で示した処理フローと基本的に同じである。ただし、S201'において、システムリソース利用効率計算部113は、利用率スコアを求めようとする利用率値について、リソース名1202を参照して、リソースの種類を特定し、演算ルール501〜504の中から、リソースの種類に応じた演算ルールを選択する。そして、選択した演算ルールを用いて、利用率値を利用率スコアに換算する。
<変形例3>
さらに、利用率スコアを計算するのに用いる演算ルールは、リソースが取り付けられたサーバ等の機器同士の関係(クラスタ構成や、ホットスタンバイ構成など)に応じて異ならせてもよい。
例えば、図8に示すように、クライアントコンピュータからの接続要求を本番サーバ102Aと本番サーバ102Bに自動的に振り分けるとともに、本番サーバのいずれか一台以上に問題が発生した場合はバックアップサーバ102Cにリクエストを振り分ける、接続先切替え装置130を配置した構成があるとする。かかる構成では、本番サーバ102A、102Bが順調に利用され、システムリソース利用率が上昇している場合でも、バックアップサーバ102Cのリソース利用率は低い状態を維持しているのが望ましい。一方、本番サーバ102A,102Bのいずれか一台以上に障害が発生しバックアップサーバ102Cがその処理を引き継いだ際は、バックアップサーバ102Cのリソース利用率は本番サーバと同様になる。
図9は、通常時とバックアップ時とで変化する演算ルールを示す図である。構成別スコア定義ファイル117には、通常時の本番サーバ102A、102Bの演算ルール601と、通常時のバックアップサーバ102Cの演算ルール602とが格納されている。さらに、障害発生時の本番サーバ102A,102Bの演算ルール603と、障害発生時のバックアップサーバ102Cの演算ルール604とが格納されている。
なお、システムリソースデータ1200の各レコード1206には、そのリソースが通常状態であるかバックアップ状態であるかの情報が含まれているものとする。
利用効率値を求める処理フローは、図5で示した処理フローと基本的に同じである。ただし、S201'において、システムリソース利用効率計算部113は、利用率スコアを求めようとする利用率値について、リソースの属する機器の種類(本番サーバかバックアップサーバか)及び状態(通常時かバックアップ時か)を特定し、演算ルール601〜604の中から、その機器の種類及び状態に応じた演算ルールを選択する。そして、選択した演算ルールを用いて、利用率値を利用率スコアに換算する。
<変形例4>
さらに、利用率スコアを計算する演算ルールは、監視対象装置102が利用されるスケジュールに応じて異ならせてもよい。図10は、監視対象サーバ102の一つである加入者記録業務サーバの構成の概要を示す図であり、加入者の登録内容を変更する登録内容変更プログラム1021、登録されている加入者情報を利用する他のシステムと連携するためにデータを吸い出すバッチ処理連携プログラム1022、日次でデータのバックアップを取るデータバックアッププログラム1023がインストールされている。
これらのプログラムは、利用される時間帯がある程度決まっており、例えば、図11に示すような使われ方をする。すなわち、登録内容変更プログラム1021は、スケジュール701に示すように9時から12時にかけてと、13時から17時にかけて変動幅を持って利用される。バッチ処理連携プログラム1022は、スケジュール702に示すように、17時から19時にかけてリソースをほぼフルに使用して実行される。同じように、データバックアッププログラム1023は、スケジュール703に示すように、19時から21時にかけてリソースをほぼフルに使用して実行される。
そこで、スケジュール別スコア定義ファイル118に、図12に示すように、このような利用スケジュールを反映した、利用率スコアを計算するための演算ルール801〜803を記憶しておく。
例えば、21時から9時および12時から13時の利用率スコア演算ルール801は、本来プログラムが稼動していない時間帯であるため利用率値が低い方が望ましいスコアとなるよう設定されている。
9時から12時および13時から17時の利用率スコア演算ルール802は、ある程度変動幅を持った使われ方をすることから利用率値が0でも利用率スコアは0とならず、また利用率スコアが1となる利用率値の幅も比較的広く設定されている。
17時から21の利用率スコア演算ルール803は、バッチ処理がメインの時間帯であることから、リソースの利用率が高くなった場合に利用率スコアが良くなるよう設定されている。
利用効率値を求める処理フローは、図5で示した処理フローと基本的に同じである。ただし、S201'において、システムリソース利用効率計算部113は、利用率スコアを求めようとする利用率値について、その観測時刻1205を特定し、演算ルール801〜803の中から、特定した観測時刻1205に対応する演算ルールを選択する。そして、選択した演算ルールを用いることにより、利用率値を利用率スコアに換算する。
<変形例5>
図13は、システムリソース利用効率計算部113によって実行される利用効率計算処理のフローを示す図である。図4で示したフローの他の方法を示している。なお、S107'以外の処理ステップは、図4で示した処理ステップと同じである。
図4のフローでは、システム監視者が設定した効率係数を使用した。これに対して、図13のフローでは、システムリソース利用効率計算部113が効率係数を求める。
あまり利用されていないシステム(不稼働率値が大きいシステム)とよく利用されているシステム(不稼働率値が小さいシステム)では、システムリソース利用率のばらつき具合に対する感度が異なる場合が多い。具体的には、システムリソース利用率のばらつき具合が大きい際に非効率だと感じるのは、ある程度以上システムリソースが利用されている(不稼働率値がある程度小さい)場合であり、あまりシステムリソースが利用されていない(不稼動率値が大きい)場合には利用率のばらつきがさほど問題視されない。
そこで、不稼働率値を計算する処理(S107)の後、システムリソース利用効率計算部113は、不稼働率値から効率係数を計算する処理を行う(S1107')。そして、S105及びS109では、S107'で求めた効率係数を用いて、ばらつき成分値及び不稼動成分値を求める。
ここで、システムリソース利用効率計算部113は、例えば以下の数式(1−5)により、効率係数を求める。
Figure 0004881761
かかる数式(1−5)では、効率係数を稼働値そのものとしている。この計算方法だと、不稼働率値が大きいときには効率係数は小さくなるため、ばらつき成分値vの値は小さくなり、反対に稼働率成分uの値は大きくなる。そのためシステムリソースがあまり使われていないことの方が、ばらつきを持って使われていることよりも重視された結果が、利用効率値に現れる。不稼働率が小さいときには効率係数は大きくなるため、ばらつき成分vの値も大きくなり、反対に稼働率成分uの値は小さくなる。そのためシステムリソースがあまり使われていないことよりも、ばらつきを持って使われていることの方が重視された結果が、利用効率値に現れる。
以上、本発明の一実施形態及びその変形例として、LAN等で接続された複数台のサーバやネットワーク機器から構成される企業情報システムにおけるシステムリソース監視システムを例として説明したが、本発明は上記の実施形態に限定されるものではなく、その趣旨の範囲内で数々の変形が可能である。
例えば、リソース群の利用率値を入力するステップ(S101)において、全てのリソースを対象とするのではなく、特定の監視対象装置から構成されるグループ108、あるいはさらにそのグループの集合である上位のグループ109といった範囲に属するリソースの利用率値のみを入力とすることで、限定した範囲での利用効率値を算出してもよい。例えば、システムリソース利用効率計算部113は、システム全体を4つのグループに分けてそれぞれについて、利用効率値を計算する。そして、計算結果を、システムリソース利用効率表示部120を介して、表示装置155に並べて表示する。
図14は、表示装置155に表示した場合の画面例を示す。システムリソース利用効率表示部120は、表示画面1301に、4つのグループについて、表示領域1302を表示する。そして、各表示領域に、利用効率値の時間遷移1303を表示する。このとき、グループごとに、効率的な利用がなされているか判断する目安となる閾値(例えば、0.5)1304を表示してもよい。
また、システムリソース利用効率計算部113は、システムリソースデータ蓄積データベース119からリソース利用率値を読み込むのではなく、システムリソースデータ収集部112がリアルタイム収集している利用率値を入力としてもよい。さらに、監視対象装置102のリソースデータ提供エージェント104が動作していない場合等に、システムリソース利用効率計算部113は、監視対象装置102が出力するログファイルを集め、ログファイルからリソース利用率値を抽出し、リソースの利用効率の算出に用いてもよい。さらに、ばらつき成分値を計算するS105(またはS205)および不稼働率成分値を計算するS109(またはS209)において、効率係数を効率係数定義ファイル114に記録しておくのではなく、システムリソース利用効率部113の処理を規定するプログラム中に記述しておいてもよい。
以上の実施形態によれば、個々のリソース利用率のばらつき具合と利用され具合を直交する2成分と考え、両成分の重みを考慮した上で距離を計算したものを利用効率とし、リソース群の利用効率を定量化することが可能となる。さらに、リソース種別や機器構成・機器の利用スケジュールといった条件を考慮してリソース利用率を計算することで、監視対象の特性に合わせたリソース群の利用効率を定量化することが可能となる。さらに、ばらつき具合と利用され具合のどちらにより重みを置くのかを規定する効率係数をパラメータとして設定することで、監視対象装置の利用状況に即した利用効率の定量化が可能となる。
本発明の一実施形態であるシステムリソース監視システムの概略構成図である。 システムリソースデータの構成を示す図である。 ハードウエア構成を示す図である。 システムリソース利用効率計算処理のフロー図である。 変形例にかかるシステムリソース利用効率計算処理のフロー図である。 利用率スコアを計算するための演算ルールを示す図である。 利用率スコアを計算するための演算ルールを示す図である。 複数の監視対象装置からなる構成を説明する図である。 利用率スコアを計算するための演算ルールを示す図である。 監視対象装置の構成を説明する図である。 プログラム動作スケジュールを説明する図である。 利用率スコアを計算するための演算ルールを示す図である。 変形例にかかるシステムリソース利用効率計算処理のフロー図である。 画面表示例を示す図である。
符号の説明
101・・・ネットワーク
102・・・監視対象装置(サーバ)
103・・・ネットワークインタフェース部
104・・・リソースデータ提供エージェント
108・・・監視対象装置グループ
109・・・監視対象装置グループ(上位)
110・・・システムリソース監視装置
111・・・ネットワークインタフェース部
112・・・システムリソースデータ収集部
113・・・システムリソース利用効率計算部
114・・・効率係数定義ファイル
115・・・利用率値スコア定義ファイル
116・・・対象種別スコア定義ファイル
117・・・構成別スコア定義ファイル
118・・・スケジュール別定義ファイル
119・・・システムリソースデータ蓄積データベース
120・・・システムリソース利用効率値表示部
151・・・CPU
152・・・メモリ
153・・・ディスク
154・・・入力装置
155・・・表示装置
156・・・通信装置

Claims (11)

  1. 複数のシステムリソースを持つシステムのシステムリソース監視装置のシステムリソース監視方法であって、
    前記システムリソース監視装置は、利用率値取得手段と、ばらつき値算出手段と、不稼動率値算出手段と、利用効率値算出手段と、を有し、
    利用率値取得手段が、各システムリソースの利用率値を取得する利用率値取得ステップ、
    ばらつき値算出手段が、前記利用率値取得ステップで取得した各システムリソースの利用率値を用いて、システムリソース全体に関する利用率値のばらつき値を算出するばらつき値算出ステップ、
    不稼動率値算出手段が、前記利用率値取得ステップで取得した各システムリソースの利用率値を用いて、システム全体に関する不稼動率値を算出する不稼動率値算出ステップ、
    利用効率値算出手段が、前記ばらつき値と前記不稼働率値とを用いて、前記システムリソース全体に関する利用効率値を求める利用効率値算出ステップ、
    から構成されることを特徴とするシステムリソース監視方法。
  2. 請求項1に記載のシステムリソース監視方法であって、
    前記システムリソースの利用率値は、
    システムリソースが許容する最高性能又は最大容量に対し収集時に実際に使用していた性能又は容量の比を表す数値であり、0.0から1.0の間の値を取りうる数値であり、
    前記ばらつき値算出ステップは、
    前記利用率値の分散値を、取りうる最小値が0.0で、取りうる最大値が1.0となるよう正規化処理して求めることにより、前記ばらつき値を算出し、
    前記不稼動率値算出ステップは、
    前記利用率値を1.0から減じ、総和を計算し、取りうる最小値が0.0で、取りうる最大値が1.0となるよう正規化処理することにより、前記不稼働率値を算出し、
    前記利用効率値算出ステップは、
    前記ばらつき値の二乗値と、予め定められた0.0以上1.0以下の定数である効率係数の積を計算することでばらつき成分値を算出し、
    前記不稼働率値の二乗値と、1.0から前記効率係数を減じた値の積を計算することで不稼働率成分値を算出し、前記ばらつき成分値と不稼働率成分値の和の平方根を計算することで距離を計算し、計算された距離を利用効率値とする、
    ことを特徴とするシステムリソース監視方法。
  3. 複数のシステムリソースを持つシステムのシステムリソース監視装置のシステムリソース監視方法であって、
    前記システムリソース監視装置は、利用率値取得手段と、スコア変換手段と、ばらつき値算出手段と、不稼動率値算出手段と、利用効率値算出手段と、を有し、
    利用率値取得手段が、各システムリソースの利用率値を取得する利用率値取得ステップ、
    スコア変換手段が、前記利用効率値取得ステップで取得した各システムリソースの利用率値を、予め定められた変換ルールに従い、0.0以上1.0以下の利用率スコアに変換するスコア変換ステップ、
    ばらつき値算出手段が、前記スコア変換ステップで変換した各システムリソースの利用率スコアを用いて、システムリソース全体に関する利用率スコアのばらつき値を算出するばらつき値算出ステップ、
    不稼動率値算出手段が、前記スコア変換ステップで変換した各システムリソースの利用率スコアを用いて、システム全体に関する不稼動率値を算出する不稼動率値算出ステップ、
    利用効率値算出手段が、前記ばらつき値と前記不稼働率値とを用いて、システムリソース全体に関する利用効率値を求める利用効率値算出ステップ、
    から構成されることを特徴とするシステムリソース監視方法。
  4. 請求項3に記載のシステムリソース監視方法であって、
    前記システムリソースの利用率値は、
    システムリソースが許容する最高性能又は最大容量に対し収集時に実際に使用していた性能又は容量の比を表す数値であり、0.0から1.0の間の値を取りうる数値であり、
    前記スコア変換ステップは、
    前記利用効率値取得ステップで取得した各システムリソースの利用率値を、システムリソースの種別に応じて予め定められた変換ルールに従い、0.0以上1.0以下の利用率スコアに変換し、
    前記ばらつき値算出ステップは、
    前記利用率スコアの分散値を、取りうる最小値が0.0で、取りうる最大値が1.0となるよう正規化処理して求めることにより、前記システムリソース全体に関するばらつき値を算出し、
    前記不稼動率値算出ステップは、
    各システムリソースの利用率スコアを1.0から減じ、総和を計算し、取りうる最小値が0.0で、取りうる最大値が1.0となるよう正規化処理することにより、前記システムリソース全体に関する不稼働率値を算出し、
    前記利用効率値算出ステップは、
    前記ばらつき値の二乗値と、予め定められた0.0以上1.0以下の定数である効率係数の積を計算することでばらつき成分値を算出し、前記不稼働率値の二乗値と、1.0から前記効率係数を減じた値の積を計算することで不稼働率成分値を算出し、前記ばらつき成分値と不稼働率成分値の和の平方根を計算することで距離を計算し、計算された距離を利用効率値とする、
    ことを特徴とするシステムリソース監視方法。
  5. 請求項3に記載のシステムリソース監視方法であって、
    前記システムリソースの利用率値は、
    システムリソースが許容する最高性能又は最大容量に対し収集時に実際に使用していた性能又は容量の比を表す数値であり、0.0から1.0の間の値を取りうる数値であり、
    前記スコア変換ステップは、
    前記利用効率値取得ステップで取得した各システムリソースの利用率値を、クラスタ構成又はホットスタンバイ構成に由来する関係に応じて予め定めされた変換ルールに従い、0.0以上1.0以下の利用率スコアに変換し、
    前記ばらつき値算出ステップは、
    前記利用率スコアの分散値を、取りうる最小値が0.0で、取りうる最大値が1.0となるよう正規化処理して求めることにより、前記システムリソース全体に関するばらつき値を算出し、
    前記不稼動率値算出ステップは、
    各システムリソースの利用率スコアを1.0から減じ、総和を計算し、利用率値取りうる最小値が0.0で、取りうる最大値が1.0となるよう正規化処理することにより、前記システムリソース全体に関する不稼働率値を算出し、
    前記利用効率値算出ステップは、
    前記ばらつき値の二乗値と、予め定められた0.0以上1.0以下の定数である効率係数の積を計算することでばらつき成分値を算出し、前記不稼働率値の二乗値と、1.0から前記効率係数を減じた値の積を計算することで不稼働率成分値を算出し、前記ばらつき成分値と不稼働率成分値の和の平方根を計算することで距離を計算し、計算された距離を利用効率値とする、
    ことを特徴とするシステムリソース監視方法。
  6. 請求項3に記載のシステムリソース監視方法であって、
    前記システムリソースの利用率値は、
    システムリソースが許容する最高性能又は最大容量に対し収集時に実際に使用していた性能又は容量の比を表す数値であり、0.0から1.0の間の値を取りうる数値であり、
    前記スコア変換ステップは、
    前記利用効率値取得ステップで取得した各システムリソースの利用率値を、監視対象装置の利用スケジュールに応じて予め定めされた変換ルールに従い、0.0以上1.0以下の利用率スコアに変換し、
    前記ばらつき値算出ステップは、
    前記利用率スコアの分散値を、取りうる最小値が0.0で、取りうる最大値が1.0となるよう正規化処理して求めることにより、前記システムリソース全体に関するばらつき値を算出し、
    前記不稼動率値算出ステップは、
    各システムリソースの利用率スコアの総和を1.0から減じ、総和を計算し、取りうる最小値が0.0で、取りうる最大値が1.0となるよう正規化処理することにより、前記システムリソース全体に関する不稼働率値を算出し、
    前記利用効率値算出ステップは、
    前記ばらつき値の二乗値と、予め定められた0.0以上1.0以下の定数である効率係数の積を計算することでばらつき成分値を算出し、前記不稼働率値の二乗値と、1.0から前記効率係数を減じた値の積を計算することで不稼働率成分値を算出し、前記ばらつき成分値と不稼働率成分値の和の平方根を計算することで距離を計算し、計算された距離を利用効率値とする、
    ことを特徴とするシステムリソース監視方法。
  7. 請求項2、4、5、及び6のいずれか一項に記載のシステムリソース監視方法であって、
    前記利用効率値算出手段が、さらに、前記不稼動率値算出ステップにより算出された不稼働率値を用いて、前記効率係数を算出するステップから構成される
    ことを特徴とするシステムリソース監視方法。
  8. 複数のシステムリソースを持つシステムのシステムリソース監視装置であって、
    各システムリソースの利用率値を取得する利用率値取得手段と、
    前記利用率値取得手段で取得した各システムリソースの利用率値を用いて、システムリソース全体に関する利用率値のばらつき値を算出するばらつき値算出手段と、
    前記利用率値取得手段で取得した各システムリソースの利用率値を用いて、システム全体に関する不稼動率値を算出する不稼動率値算出手段と、
    前記ばらつき値と前記不稼働率値とを用いて、前記システムリソース全体に関する利用効率値を求める利用効率値算出手段と
    を有することを特徴とするシステムリソース監視装置。
  9. 複数のシステムリソースを持つシステムのシステムリソース監視装置であって、
    各システムリソースの利用率値を取得する利用率値取得手段と、
    前記利用効率値取得手段で取得した各システムリソースの利用率値を、予め定められた変換ルールに従い、0.0以上1.0以下の利用率スコアに変換するスコア変換手段と、
    前記スコア変換手段で変換した各システムリソースの利用率スコアを用いて、システムリソース全体に関する利用率スコアのばらつき値を算出するばらつき値算出手段と、
    前記スコア変換手段で変換した各システムリソースの利用率スコアを用いて、システム全体に関する不稼動率値を算出する不稼動率値算出手段と、
    前記ばらつき値と前記不稼働率値とを用いて、システムリソース全体に関する利用効率値を求める利用効率値算出手段と
    を有することを特徴とするシステムリソース監視装置。
  10. 複数のシステムリソースを持つシステムのシステムリソース監視装置としてコンピュータを機能させるプログラムであって、
    各システムリソースの利用率値を取得する利用率値取得手段と、
    前記利用率値取得手段で取得した各システムリソースの利用率値を用いて、システムリソース全体に関する利用率値のばらつき値を算出するばらつき値算出手段と、
    前記利用率値取得手段で取得した各システムリソースの利用率値を用いて、システム全体に関する不稼動率値を算出する不稼動率値算出手段と、
    前記ばらつき値と前記不稼働率値とを用いて、前記システムリソース全体に関する利用効率値を求める利用効率値算出手段として、
    前記コンピュータを機能させることを特徴とするプログラム。
  11. 複数のシステムリソースを持つシステムのシステムリソース監視装置としてコンピュータを機能させるためのプログラムであって、
    各システムリソースの利用率値を取得する利用率値取得手段と、
    前記利用効率値取得手段で取得した各システムリソースの利用率値を、予め定められた変換ルールに従い、0.0以上1.0以下の利用率スコアに変換するスコア変換手段と、
    前記スコア変換手段で変換した各システムリソースの利用率スコアを用いて、システムリソース全体に関する利用率スコアのばらつき値を算出するばらつき値算出手段と、
    前記スコア変換手段で変換した各システムリソースの利用率スコアを用いて、システム全体に関する不稼動率値を算出する不稼動率値算出手段と、
    前記ばらつき値と前記不稼働率値とを用いて、システムリソース全体に関する利用効率値を求める利用効率値算出手段として、
    前記コンピュータを機能させることを特徴とするプログラム。
JP2007043659A 2007-02-23 2007-02-23 システムリソース監視方法、監視装置、及びプログラム Expired - Fee Related JP4881761B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007043659A JP4881761B2 (ja) 2007-02-23 2007-02-23 システムリソース監視方法、監視装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007043659A JP4881761B2 (ja) 2007-02-23 2007-02-23 システムリソース監視方法、監視装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2008209994A JP2008209994A (ja) 2008-09-11
JP4881761B2 true JP4881761B2 (ja) 2012-02-22

Family

ID=39786268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007043659A Expired - Fee Related JP4881761B2 (ja) 2007-02-23 2007-02-23 システムリソース監視方法、監視装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP4881761B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104811346A (zh) * 2014-01-26 2015-07-29 中国移动通信集团内蒙古有限公司 集成系统运行性能的检测方法及系统
US11182713B2 (en) 2015-01-24 2021-11-23 Vmware, Inc. Methods and systems to optimize operating system license costs in a virtual data center

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4526774B2 (ja) * 2003-03-28 2010-08-18 株式会社野村総合研究所 コンピューターシステムの構成装置の性能バランス評価とサイジングを行う装置と方法
JP3922375B2 (ja) * 2004-01-30 2007-05-30 インターナショナル・ビジネス・マシーンズ・コーポレーション 異常検出システム及びその方法
JP4980581B2 (ja) * 2004-04-16 2012-07-18 新日鉄ソリューションズ株式会社 性能監視装置、性能監視方法及びプログラム
JP2006092053A (ja) * 2004-09-22 2006-04-06 Nec Corp システム使用率管理装置及びそれに用いるシステム使用率管理方法並びにそのプログラム
JP4058038B2 (ja) * 2004-12-22 2008-03-05 株式会社日立製作所 負荷監視装置および負荷監視方法

Also Published As

Publication number Publication date
JP2008209994A (ja) 2008-09-11

Similar Documents

Publication Publication Date Title
JP5948257B2 (ja) 情報処理システム監視装置、監視方法、及び監視プログラム
US9600394B2 (en) Stateful detection of anomalous events in virtual machines
US7546222B2 (en) System for performance and scalability analysis and methods thereof
JP4980581B2 (ja) 性能監視装置、性能監視方法及びプログラム
US9167028B1 (en) Monitoring distributed web application transactions
Kavulya et al. An analysis of traces from a production mapreduce cluster
JP4374378B2 (ja) 運用実績評価装置、運用実績評価方法、およびプログラム
EP1812863B1 (en) Reporting of abnormal computer resource utilization data
US8234229B2 (en) Method and apparatus for prediction of computer system performance based on types and numbers of active devices
US9720823B2 (en) Free memory trending for detecting out-of-memory events in virtual machines
US8725844B2 (en) Method and system for adjusting the relative value of system configuration recommendations
CN101505243B (zh) 一种Web应用性能异常侦测方法
US7184935B1 (en) Determining and annotating a signature of a computer resource
JP4705484B2 (ja) 性能監視装置、性能監視方法及びプログラム
US9201752B2 (en) System and method for correlating empirical data with user experience
Khan et al. Modeling the autoscaling operations in cloud with time series data
JP2005099973A (ja) 運用管理システム
JP4881761B2 (ja) システムリソース監視方法、監視装置、及びプログラム
KR102188987B1 (ko) 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템의 운영 방법
Xue et al. Fill-in the gaps: Spatial-temporal models for missing data
JP2007265245A (ja) 証券システムのトラフィック監視装置
JP2011081513A (ja) 進捗状況管理装置及び進捗状況管理方法
JP2004348640A (ja) ネットワーク管理システム及びネットワーク管理方法
JP4934660B2 (ja) 通信帯域算出方法、装置、およびトラヒック管理方法
CN115168042A (zh) 监控集群的管理方法及装置、计算机存储介质、电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090414

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110920

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees