JP2009265707A - プロセスの自動グループ化とその性能監視方法 - Google Patents

プロセスの自動グループ化とその性能監視方法 Download PDF

Info

Publication number
JP2009265707A
JP2009265707A JP2008110833A JP2008110833A JP2009265707A JP 2009265707 A JP2009265707 A JP 2009265707A JP 2008110833 A JP2008110833 A JP 2008110833A JP 2008110833 A JP2008110833 A JP 2008110833A JP 2009265707 A JP2009265707 A JP 2009265707A
Authority
JP
Japan
Prior art keywords
processes
information
group
file
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008110833A
Other languages
English (en)
Inventor
Yuichiro Hirata
祐一郎 平田
Kaichiro Ozeki
嘉一郎 尾関
Goro Kazama
悟朗 風間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008110833A priority Critical patent/JP2009265707A/ja
Publication of JP2009265707A publication Critical patent/JP2009265707A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】実業務に関連のあるプロセスのグループ化により、グループ単位で監視を行う性
能監視システムにおいて、プロセスをグループ化する場合、手動やテンプレートの利用な
ど、管理者の負担がかかると共に、高度な知識が必要であった。
【解決手段】予め与えられた期間内における、監視対象装置上で動作するプロセスの稼働
情報、アクセス情報、プロセス間通信の情報を元に、プロセスとファイルの関連度、及び
プロセス間の関連性を数値化して、関連度として算出する。その関連度に基づき、関連度
の低いプロセスを除いて、監視対象装置内のプロセスを自動的にグループ化する。さらに
、監視対象装置をまたがって通信を行っているプロセスについても、関連度に基づき、プ
ロセスをグループ化する。また、監視項目に対する閾値について、稼働情報から自動的に
閾値を作成し、監視項目ごとに自動的に設定を行う。
【選択図】図3

Description

本発明は、情報処理装置などの監視対象装置に性能的問題が発生しているか否かを判定
する性能監視技術に関し、特に、監視対象装置上で動作する関連性のあるプロセス同士を
自動的にグループ化し、グループ単位で収集したプロセスの性能値と閾値を比較すること
により、監視対象装置に性能的問題が発生しているか否かを判定する性能監視技術に関す
る。
情報処理装置などの監視対象装置に性能的な問題が発生しているか否かを判定する従来
の一般的な性能監視装置は、予め定められている複数の監視項目(CPU使用率、メモリ使
用量、ディスクI/Oなど)の性能値を監視対象装置から収集し、この収集した各性能値と
、各監視項目の能力の限界を示す閾値とを比較することにより、性能的問題が発生してい
るか否かを判定するようにしている。
また、実業務で考える場合、業務は複数のプロセスから成り立っていることが多いため
、個々の監視対象のプロセスに対して、関連性のあるプロセスをグループ化して監視する
ことが望ましい。
このような監視対象の個々のプロセスをグループ化して稼働監視するような技術として
、従来、次のような性能監視装置が提案された(例えば、特許文献1)。
特開2004−199258号公報
上述した特許文献1に記載されている従来の性能監視装置によれば、管理者が監視対象
の関連があるプロセス同士を1つのグループとして指定することで、プロセスのグループ
単位での稼働監視を実現している。しかし、既知の技術では、プロセスのグループ化を手
動やテンプレートなどを利用する必要があるため、この場合、管理者に設定の負担がかか
ると共に、高度な知識が必要となってくる。
そこで、本発明の目的は、プロセスとファイルの関連性のあるものを自動的にグルーピ
ングすることで、プロセスのグループ化における管理者の設定する負担を軽減できるよう
にすることにある。
本発明にかかる第1の性能監視システムは、監視対象装置から収集したプロセスの稼働
情報と、プロセスのファイルに対するアクセス情報の時系列データから、プロセスとファ
イルの関連性を数値化して、関連度として算出し、保存する手段を備えたことを特徴とす
る。
本発明にかかる第2の性能監視システムは、監視対象装置から収集したプロセス間通信
情報から、プロセス間の関連性を数値化して、関連度として算出し、保存する手段を備え
たことを特徴とする。
本発明にかかる第3の性能監視システムは、第1、第2の性能監視システムにおいて、
関連性のあるプロセスを同じグループと見なして稼働監視を行うため、算出したプロセス
のファイルに対する関連度と、プロセス間の関連度を元に、プロセスを自動的にグループ
化して、プロセスのグループ単位で稼働監視を行う手段を備えたことを特徴とする。
本発明にかかる第4の性能監視システムは、第3の性能監視システムにおいて、プロセ
スのグループ化の場合に、プロセスの関連性の重要度を考慮するため、プロセスのファイ
ルに対する関連度と、プロセス間の関連度にそれぞれ重みをつけて、その重みによってフ
ィルタリングを行うことで、プロセスのグループの再編成を行う手段を備えたことを特徴
とする。
本発明にかかる第5の性能監視システムは、第4の性能監視システムにおいて、プロセ
ス間通信が、監視対象装置にまたがって行われている場合でも、プロセス間の関連度を加
味し、監視対象装置内のプロセスのグループに対して、監視対象装置をまたがったプロセ
スのグループに再編成する手段を備えたことを特徴とする。
本発明にかかる第6の性能監視システムは、第5の性能監視システムにおいて、任意の
期間におけるプロセスグループの稼働性能値を加味し、プロセスのグループ単位で監視項
目ごとの閾値を自動的に設定する手段を備えたことを特徴とする。
本発明にかかる第1、第2の性能監視システムによれば、複数存在する監視対象装置の
運用環境がすべて異なる場合で、予め動作しているプロセスや存在するファイルを把握し
ていない場合でも、監視対象装置の運用環境に依らず、プロセスとファイルの関連度から
、任意の期間内にどのプロセスが重要であるか把握することが可能となる。
本発明にかかる第3の性能監視システムによれば、関連度のあるプロセスを自動的にグ
ルーピングすることによって、運用環境に依らず、管理者の手動などによる設定を行うこ
となく、プロセスをグループ単位で稼働監視することができる。
本発明にかかる第4の性能監視システムによれば、プロセスとファイルの関連度や、プ
ロセス間通信によるプロセス間の関連度の重みを使ってフィルタリングを行うことで、関
連度の低いプロセスをグループから除外できる。これにより、より実業務に近いプロセス
のグループ単位で稼働監視を行うことが可能となる。
本発明にかかる第5の性能監視システムによれば、監視対象装置をまたがって関連度を
もつプロセスを1つのプロセスのグループと見なして、稼動性能監視を行うことができる
。これにより、例えば監視対象装置内で関連度のない複数のプロセスが、監視対象装置を
またがって、共通のプロセスと通信を行っている場合に、監視対象装置内では関連度のな
いプロセス同士を、同じグループと見なして稼働監視を行うことが可能となる。
本発明にかかる第6の性能監視システムによれば、作成したプロセスのグループに対し
、閾値を設定して稼働監視を行う場合に、自動的に閾値を設定することができる。これに
よって、管理者がプロセスのグループの閾値を監視項目ごとに設定する必要がなくなり、
管理者の負担を軽減することができる。
次に本発明の実施の形態について図面を参照して詳細に説明する。
図1は本発明にかかる性能監視システムの実施形態の構成例を示すシステム構成図であ
る。本実施例に係わる性能監視サーバー100は、ネットワーク103を介して、複数の
監視対象装置102から、CPU使用率や、メモリ使用量や、ディスクI/Oなどの監視項目に
対する性能値を収集して保持する。監視端末101は、ネットワーク103を介して、性
能監視サーバー100と接続することにより、性能監視サーバー100に収集された性能
値の情報を参照することができる。また、性能監視サーバー100が、収集した性能値に
対して何らかの異常を検知した場合に、監視端末に異常を通知することができる。
図2に監視対象装置102の構成を示す。監視対象装置102は、メモリと、CPUと
、ディスクインタフェースを経由して接続された記憶装置と、ネットワーク103に接続
する通信インタフェースから構成される。
メモリ上で動作する監視情報収集プログラムは、稼働性能値収集部200と、アクセス
情報収集部201と、プロセス間通信情報収集部202と、収集情報管理部203を備え
ている。
記憶装置は、稼働性能値記憶部204と、アクセス情報記憶部205と、プロセス間通
信情報記憶部206と、収集情報例外一覧記憶部207を備えている。
稼働性能値収集部200は、監視対象装置102上で動作するプロセスの稼働情報を収
集する。例えば、収集間隔が2分である場合、稼働性能値収集部200が、2分おきに監
視対象装置102上で動作するすべてのプロセスに対するCPU利用時間などの稼働情報を
収集し、稼働性能値記憶部204に格納する。
アクセス情報収集部201は、監視対象装置102上で動作するプロセスのファイルに
対するアクセス情報を収集する。例えば、あるプロセスがファイルに書込みなどのアクセ
スを行うと、アクセス情報収集部201が、アクセス対象のファイル名やアクセス内容な
どのアクセス情報を収集し、アクセス情報記憶部205に格納する。
プロセス間通信情報収集部202は、監視対象装置102上で動作するすべてのプロセ
スが行っているプロセス間通信の情報を収集する。例えば、プロセスが別ホストのプロセ
スと通信を行っている場合、プロセス間通信情報収集部202が、通信をしているホスト
名やプロセスが通信で利用しているポート番号などのプロセス間通信情報を収集して、プ
ロセス間通信情報記憶部206に格納する。
収集情報管理部203は、稼働性能値記憶部204と、アクセス情報記憶部205と、
プロセス間通信情報記憶部206に格納された情報のうち、収集情報例外一覧記憶部20
7に格納された情報を除き、指定期間内に存在する情報を、性能監視サーバー100の性
能監視プログラムに送信する。例えば、ある期間内の稼働性能値を送信するように性能監
視プログラムから要求があった場合、収集情報管理部203は、指定された期間内の稼働
性能値を稼働性能値記憶部204から取得して、収集情報例外一覧記憶部207に格納さ
れたファイル名やプロセス名に当てはまらない稼動性能情報の行を、性能監視プログラム
に送信する。
図3に性能監視サーバー100の構成を示す。性能監視サーバー100は、メモリと、
CPUと、ディスクインタフェースを経由して接続された記憶装置と、ネットワーク10
3に接続する通信インタフェースから構成される。
メモリ上で動作する性能監視プログラムは、プロセス稼働率情報一覧作成部300と、
プロセス−ファイル間アクセス内容一覧作成部301と、プロセス間通信一覧作成部30
2と、プロセスグループ作成部303と、グループ稼働性能値作成部304と、限界閾値
判定部305を備えている。
メモリ上の記憶部には、プロセス別稼働情報一覧記憶部311を備えている。
記憶装置は、プロセス稼働率情報一覧記憶部306と、プロセス‐ファイル間アクセス
内容一覧記憶部307と、プロセス間通信一覧報記憶部308と、プロセスグループ記憶
部309と、限界閾値記憶部310を備えている。
プロセス稼働率情報一覧作成部300は、監視対象装置102毎に、ある期間内のプロ
セスの稼働率情報を作成する。例えば、ある期間内のプロセス稼働率情報を作成する場合
、監視対象装置102上の収集情報管理部203に、ある期間内のプロセスの稼働性能値
を送信するように要求する。プロセス稼働率情報一覧作成部300は、取得した稼働性能
値から、監視対象装置102のプロセス名単位で、プロセス別に稼働情報一覧を作成して
、プロセス別稼働情報一覧記憶部311に格納する。そして、作成したプロセス別稼働情
報一覧記憶部311に格納した情報を取得して、プロセスの稼働率情報を作成し、プロセ
ス稼働率情報一覧記憶部306に格納する。
プロセス‐ファイル間アクセス内容一覧作成部301は、監視対象装置102毎に、あ
る期間内のプロセス‐ファイル間アクセス内容を作成する。例えば、ある期間内のプロセ
ス‐ファイル間アクセス内容を作成する場合、監視対象装置102上の収集情報管理部2
03に、ある期間内のプロセスのアクセス情報を送信するように要求する。プロセス‐フ
ァイル間アクセス内容一覧作成部301は、取得したアクセス情報から、監視対象装置1
02のプロセスとファイルのアクセス単位で、プロセス‐ファイル間アクセス内容を作成
して、プロセス‐ファイル間アクセス内容一覧記憶部307に格納する。
プロセス間通信一覧作成部302は、ある期間内のプロセス間通信の一覧を作成する。
例えば、ある期間内のプロセス間通信一覧を作成する場合、監視対象装置102上の収集
情報管理部203に、ある期間内のプロセス間通信情報を送信するように要求する。プロ
セス間通信一覧作成部302は、取得したプロセス間通信情報から、監視対象装置102
内のプロセスがどの監視対象装置102のプロセスと通信を行っているのかという組合わ
せをプロセス間通信一覧として作成し、プロセス間通信一覧記憶部308に格納する。
プロセスグループ一覧生成部303は、ある期間内で関連性のあるプロセス同士をグル
ーピングして、プロセスグループを作成する。例えば、ある期間内で動作するプロセスに
対してグループ作成を行う場合、まず、プロセス稼働率情報一覧記憶部306と、プロセ
ス−ファイル間アクセス内容一覧記憶部307に格納した情報を取得して、プロセスとフ
ァイルの関連性を関連度として算出する。そして、算出した関連度が低いものをフィルタ
リングによって除いて、各ファイルにアクセスしているプロセスに対してグループを作成
する。次に、プロセス間通信一覧記憶部308に格納した情報を取得して、同一監視対象
装置102内のプロセス間通信を考慮して、作成したグループを更新する。さらに、監視
対象装置102をまたがったプロセス間通信を考慮したグループを作成する。プロセスグ
ループ一覧作成部303は、作成したグループをプロセスグループ記憶部309に格納す
る。
グループ稼働性能値作成部304は、プロセスグループ毎の稼働性能値を作成し、限界
閾値判定部305に渡す。例えば、あるプロセスグループの稼働性能値を作成する場合、
グループに登録されているプロセスの稼働性能値を、監視対象装置102の稼働性能値記
憶部204から取得して、それぞれの稼働性能値の総和を算出して作成する。作成したプ
ロセスグループ毎の稼働性能値を限界閾値判定部305に渡す。
また、グループ単位に監視項目ごとの限界閾値の自動作成と、限界閾値の自動設定を行
う。自動作成した限界閾値は、限界閾値記憶部310に格納する。
限界閾値判定部305は、定期的に、グループ稼働性能値作成部304から、プロセス
グループ毎の稼動性能値を取得し、プロセスグループ毎の稼働性能値が、グループ毎に設
定した限界閾値を越えていないか判定する。例えば、グループ稼働性能値の監視を行う場
合、限界閾値記憶部310に格納したグループの稼働性能値の限界閾値を取得し、作成し
たグループ稼働性能値が限界閾値を超えていないか判定を行う。
図4に稼働性能値記憶部204の内容例を示す。稼働性能値記憶部204には、監視対
象装置102上で動作するすべてのプロセスに対して、ある間隔で収集した稼働性能値が
格納され、収集情報管理部203から参照される。稼働情報を格納する場合、収集した時
刻400と、プロセスID401と、プロセス名402と、CPU利用時間403と、CPU使用
率404と、メモリ使用量405と、I/Oサイズ406を収集間隔毎に格納する。
図5にアクセス情報記憶部205の内容例を示す。アクセス情報記憶部205には、監
視対象装置102上で動作するすべてのプロセスが行うファイルのアクセスの内容が格納
され、収集情報管理部203から参照される。アクセス情報を格納する場合、アクセス情
報の取得時間500と、プロセス名501と、ファイル名502と、アクセス内容503
を格納する。アクセス内容503に格納する情報としては、プロセスがファイルに対して
読込みを行った場合、“READ”を格納する。プロセスがファイルに対して書込みを行った
場合、“WRITE”を格納する。プロセスがファイルを生成した場合、“CREATE”を格納す
る。プロセスがファイルの削除を行った場合、“DELETE”を格納する。アクセス内容の格
納は、プロセスのファイルに対するアクセス毎に格納する。
図6にプロセス間通信情報記憶部206の内容例を示す。プロセス間通信情報記憶部2
06には、監視対象装置102上で動作するすべてのプロセス間通信の情報が格納され、
収集情報管理部203から参照される。プロセス間通信情報を格納する場合、プロセス間
通信情報の取得時間600と、プロセス名601と、ポート番号602と、通信対象ホス
ト603と、通信対象ポート番号604を格納する。
図7にプロセス別稼働情報一覧記憶部311の内容例を示す。プロセス別稼働情報一覧
記憶部311には、監視対象装置102の稼働性能値記憶部204から取得したある期間
内の稼働性能情報が、プロセス名別に格納され、プロセス稼働率情報一覧作成部300か
ら参照される。プロセス別稼働情報一覧を格納する場合、監視対象ホスト700と、プロ
セス名701と、CPU利用時間702と、I/Oサイズ703と、メモリ使用量704を格納
する。CPU利用時間702と、I/Oサイズ703については、時系列でプロセス別に値が累
積していくため、プロセス別に期間内の最大値をプロセス別稼働情報一覧記憶部311に
格納する。メモリ使用量704については、プロセス別に期間内の平均値を算出して、プ
ロセス別稼働情報一覧記憶部311に格納する。
図8にプロセス稼働率情報記憶部306の内容例を示す。プロセス稼働率情報記憶部3
06には、監視対象装置102毎に、各プロセスが持つ稼働性能値の全プロセスの稼働性
能値に対する割合が格納され、プロセスグループ生成部303から参照される。プロセス
稼働率情報を格納する場合、監視対象ホスト800と、プロセス名801と、全体に対す
る各プロセスのCPU利用時間の割合802と、全体に対する各プロセスのメモリ使用量の
割合803と、全体に対する各プロセスのI/Oサイズの割合804を格納する。
図9にプロセス−ファイル間アクセス内容一覧記憶部307の内容例を示す。プロセス−
ファイル間アクセス内容一覧記憶部307には、ある期間内のファイルとプロセスのアク
セス毎にアクセス内容が格納され、プロセスグループ生成部303から参照される。アク
セス内容を格納する場合、監視対象ホスト900と、ファイル名901と、プロセス名9
02と、ファイルへの読込み実行回数903と、ファイルへの書込み実行回数904と、
ファイルの生成実行回数905と、ファイルの削除実行回数906を格納する。
図10にプロセス間通信一覧記憶部308の内容例を示す。プロセス間通信一覧記憶部
308には、監視対象装置102のプロセス間通信情報記憶部206から取得したある期
間内のプロセスの通信情報を元に作成した、プロセス間通信を行っていたプロセスの組合
わせの一覧が格納され、プロセスグループ生成部303から参照される。プロセスの組合
わせの一覧を格納する場合、ホスト1(通信元ホスト)1000と、プロセス1(通信元
プロセス)1001と、ホスト2(通信先ホスト)1002と、プロセス2(通信先プロ
セス)1003を格納する。
図11にプロセスグループ一覧記憶部309の内容例を示す。プロセスグループ一覧記
憶部309には、監視対象装置102内のファイルとプロセスのアクセス毎に、ファイル
とプロセスの関連度やプロセスのグループ名などが格納され、プロセスグループ生成部3
03と、グループ稼働性能値作成部304から参照される。プロセスグループ一覧情報を
格納する場合、監視対象ホスト1100と、ファイル名1101と、プロセス名1102
と、ファイルとプロセスの関連性を数値で表した関連度1103と、同一監視対象装置内
のプロセスグループ名1104と、監視対象装置をまたがったグループ名1105を格納
する。
図12に限界閾値記憶部310の内容例を示す。限界閾値記憶部310には、作成した
グループの稼働性能値に対して、監視項目毎に閾値が格納され、限界閾値判定部に参照さ
れる。閾値を格納する場合、監視対象ホスト1200と、グループ名1201と、監視項
目1202と、上限か下限かを格納する閾値種別1203と、閾値1204を格納する。
次に、本実施の形態の動作について説明する。
プロセス稼働率情報一覧作成部300は、予め設定された収集期間に従って、監視対象
装置102から稼働性能情報を取得して、プロセス別稼働情報一覧を作成する。プロセス
稼働率情報一覧作成部300の処理フローを、図13に示す。プロセス稼働率情報一覧作
成部は、監視対象装置単位でループを実行する(ステップ1301、1309)。監視対
象装置から稼働性能情報を取得する(ステップ1302)と、稼働情報の表からプロセス
名の抽出をループで実行する(ステップ1303、1308)。そして、抽出したプロセ
ス名を持つプロセスID単位で、CPU利用時間とI/Oサイズの最大値を算出する(ステップ1
304)。次にプロセスID単位で算出した最大値を元に、プロセス名単位でCPU利用時間
と、I/Oサイズの最大値の合計を算出する(ステップ1305)。次にプロセス名単位で
、メモリ使用量の平均を算出する(ステップ1306)。最後に、プロセス別稼働情報一
覧記憶部306に、現在ループ中のホスト名とプロセス名、算出したCPU利用時間、I/Oサ
イズの最大値の合計、メモリ使用量の平均をエントリとして追加する(1307)。
プロセス稼働率情報一覧作成部300は、図13の処理フローによって作成されたプロ
セス別稼働情報一覧記憶部306の情報を取得して、プロセス稼働率情報一覧を作成する
。プロセス稼働率情報一覧作成部300の処理フローを、図14に示す。プロセス稼働率
情報一覧作成部は、監視対象ホスト名単位で、ループを実行する(ステップ1401、1
408)。CPU利用時間と、メモリ使用量と、I/Oサイズについて、すべての行の合計値を
それぞれ算出する(ステップ1402)。次に、プロセス別稼働情報一覧の検索をプロセ
ス名単位でループを実行する(ステップ1403、1407)。プロセス別稼働情報一覧
から、監視対象ホスト名とプロセス名が一致する行を検索する(ステップ1404)。次
に、全体のCPU利用時間に対するプロセス毎のCPU利用時間の割合と、全体のメモリ使用量
に対するプロセス毎のメモリ使用量の割合と、全体のI/Oサイズに対するプロセス毎のI/O
サイズの割合をそれぞれ算出する(ステップ1405)。最後に、算出した値をプロセス
稼働率情報記憶部306のエントリとして追加する(ステップ1406)。
プロセス−ファイル間アクセス内容一覧作成部301は、予め設定された収集期間に従
って、監視対象装置102からアクセス情報を収集して、プロセス−ファイル間アクセス
内容一覧を作成する。プロセス−ファイル間アクセス内容一覧作成部301の処理フロー
を、図15に示す。プロセス−ファイル間アクセス内容一覧作成部は、監視対象装置単位
で処理のループを実行する(ステップ1501、1516)。まず、監視対象装置からア
クセス情報を取得する(ステップ1502)。次に、アクセス情報の行ごとにループを実
行する(ステップ1503、1515)。監視対象ホスト名と、ファイル名が一致する行
が、アクセス内容一覧のテーブルに存在するか判定する(ステップ1504)。存在する
場合は、プロセス名がプロセス−ファイル間アクセス内容一覧記憶部307のテーブルに
存在するか判定する(ステップ1505)。存在する場合は、アクセス内容の判定処理を
行う。監視対象ホスト名とファイル名が一致する行が存在しない場合や、プロセス名が存
在しない場合は、プロセス−ファイル間アクセス内容一覧記憶部のテーブルに1行追加し
て、現在の監視対象ホスト名と、ファイル名と、プロセス名を格納する(ステップ151
0)。
次に、アクセス内容の判定処理として、読込み(READ)であるか判定する(ステップ1
506)。読込みである場合は、プロセス−ファイル間アクセス内容一覧のREAD回数90
3に1をカウントアップする(ステップ1511)。アクセス内容が読込みではない場合
、アクセス内容が書込み(WRITE)であるか判定する(ステップ1507)。書込みであ
る場合は、プロセス−ファイル間アクセス内容一覧のWRITE回数904に1をカウントアッ
プする(ステップ1512)。アクセス内容が書込みではない場合、アクセス内容がファ
イル生成(CREATE)であるか判定する(ステップ1508)。ファイル生成である場合は
、プロセス−ファイル間アクセス内容一覧のCREATE回数905に1をカウントアップする
(ステップ1513)。アクセス内容がファイル生成ではない場合、アクセス内容がファ
イル削除(DELETE)であるか判定する(ステップ1509)。ファイル削除である場合は
、プロセス−ファイル間アクセス内容一覧のDELETE回数906に1をカウントアップする
(ステップ1514)。
プロセス間通信一覧作成部302は、予め設定された収集期間に従って、監視対象装置
102からプロセス間通信情報を収集し、プロセス間通信一覧を作成する。プロセス間通
信一覧作成部302の処理フローを、図16に示す。プロセス間通信一覧作成部は、すべ
ての監視対象装置からプロセス間通信情報を取得する(ステップ1601)。次に、監視
対象装置分、ループを実行する(ステップ1602、1610)。さらに、プロセス間通
信情報の行ごとにループを実行する(ステップ1603)。次に、通信対象ホストのプロ
セス間通信情報が存在するか判定する(ステップ1604)。存在する場合は、通信対象
ホストのプロセス間通信情報に同一時間帯で通信を行っているプロセスが存在するか判定
する(ステップ1605)。存在する場合は、通信対象のホスト名と、プロセス名を取得
する(ステップ1606)。次に、登録データを作成する(ステップ1607)。最後に
、プロセス間通信一覧記憶部308に1行追加して、登録データを格納する(ステップ1
08)。
プロセスグループ生成部303は、プロセス稼働率情報一覧記憶部306の内容と、プ
ロセス−ファイル間アクセス内容一覧記憶部307の内容を取得して、プロセスグループ
を生成する。プロセスグループ生成部303の処理フローを、図17に示す。プロセスグ
ループ生成部は、プロセス−ファイル間アクセス内容一覧の行ごとにループを実行する(
ステップ1701、1706)。プロセス稼働率情報から、監視対象ホスト名と、プロセ
ス名が一致するエントリを検索する(ステップ1702)。次に、検索したプロセス稼働
率情報と、ループ対象のアクセス内容情報から、関連度を算出する(ステップ1703)
。そして、登録データを作成し(ステップ1704)、プロセスグループ一覧記憶部30
9に1行追加して、登録データを格納する(ステップ1705)。
ループの実行の終了後、算出した関連度から監視対象装置内のグループを作成する(ス
テップ1800)。次に、プロセス間通信一覧を元に、監視対象装置内のグループを更新
する(ステップ2100)。最後に、プロセス間通信一覧を元に、監視対象装置をまたが
ったグループ(メタグループ)を作成する(ステップ2200)。
関連度からプロセスグループを作成する処理(ステップ1800)の詳細について、処
理フローを、図18に示す。まず、関連度を使用して、フィルタリングを行う(ステップ
1801)。フィルタリングは、関連度の統計情報からあらかじめ算出した境界値を使用
する。例えば、関連度を昇順にソートしてから四分位点を求め、第1四分位点を境界値と
し、この境界値を下回る関連度の行を除外することで、全体に対する下位25%の関連度
の行をフィルタリングすることができる。
次に、フィルタリング後のプロセスグループ一覧の監視対象ホスト単位でループを実行
する(ステップ1802、1806)。グループ名を採番し(ステップ1803)、プロ
セスグループ一覧の1行ごとにループを実行する(ステップ1804、1805)。次に
、ファイル名と、グループ名を引数として、ファイルグルーピング処理を呼び出す(ステ
ップ1900)。グルーピング処理の結果を判定し(ステップ1905)、結果が真の場
合は、グループ名を採番する(ステップ1906)。
関連度でフィルタリングした後の、ファイルグルーピング処理(ステップ1900)の
詳細について、処理フローを、図19に示す。まず、引数として、ファイル名とグループ
名を受け取る(ステップ1901)。次に、フラグを偽で初期化する(ステップ1902
)。次に、フィルタリング後のプロセスグループ一覧の1行ごとにループを実行する(ス
テップ1903、1908)。ファイル名が引数と一致し、且つグループ名が未確定であ
るか判定する(ステップ1904)。判定結果が真の場合、対象行のグループ名を、引数
のグループ名で更新する(ステップ1905)。次に、フラグを真に更新する(ステップ
1906)。そして、プロセス名と、グループ名を引数として、プロセスグルーピング処
理を呼び出す(ステップ2000)。
ループの実行が終了後、ファイルグルーピング処理の戻り値として、フラグの値を設定
する(ステップ1907)。
ファイルグルーピング処理(ステップ1900)で呼び出されるプロセスグルーピング
処理(ステップ2000)の詳細について、処理フローを、図20に示す。まず、引数と
してプロセス名と、グループ名を受け取る(ステップ2001)。次に、フィルタリング
後のプロセスグループ一覧の1行ごとにループを実行する(ステップ2002、2005
)。プロセス名が引数と一致し、且つグループが未確定か判定する(ステップ2003)
。判定結果が真の場合、対象行のグループ名を、引数のグループ名で更新する(ステップ
2004)。そして、ファイル名と、グループ名を引数として、ファイルグルーピング処
理を呼び出す(ステップ1900)。
図19のファイルグルーピング処理1900と、図20のプロセスグルーピング処理2
000は、プロセスグループ一覧のグループ名1104が確定するまで、お互いに再帰的
に呼び出しあう。
プロセスグループ生成部303は、プロセス間通信一覧記憶部308の内容を取得して
、監視対象装置内のプロセスグループを更新する。プロセスグループ生成部303の処理
フローを、図21に示す。プロセスグループ生成部303は、プロセス間通信一覧の行単
位でループを実行する(ステップ2101、2105)。まず、ホスト1(通信元のホス
ト名)1000と、ホスト2(通信先ホスト名)1002が一致するか判定する(ステッ
プ2102)。一致する場合は、プロセス1(通信元のプロセス名)1001と、プロセ
ス2(通信先のプロセス名)1003が異なるグループか判定する(ステップ2103)
。異なるグループである場合は、プロセスグループ一覧記憶部309でホスト名がホスト
1と一致するすべてのプロセス2のグループ名を、プロセス1のグループ名に更新する(
ステップ2104)。
プロセスグループ生成部303は、プロセス間通信一覧記憶部308の内容を取得して
、監視対象装置にまたがったプロセスグループ(メタグループ)を作成する。プロセスグ
ループ生成部303の処理フローを、図22に示す。プロセスグループ生成部303は、
プロセスグループ一覧のすべての行で、グループ名1104をメタグループ名1105に
コピーする(ステップ2201)。次に、プロセス間通信一覧の行単位で、ループを実行
する(ステップ2202、2206)。そして、ホスト1(通信元のホスト名)1000
と、ホスト2(通信先ホスト名)1002が一致するか判定する(ステップ2203)。
一致する場合は、プロセス1(通信元のプロセス名)1001と、プロセス2(通信先の
プロセス名)1003が異なるメタグループか判定する(ステップ2204)。異なるメ
タグループである場合は、プロセスグループ一覧記憶部309でホスト名がホスト1と一
致するすべてのプロセス2のメタグループ名を、プロセス1のメタグループ名に更新する
(ステップ2205)。
グループ稼働性能値作成部304は、グループ単位で監視項目ごとに限界閾値を作成し
、自動的に設定を行う。グループ稼働性能値作成部304の処理フローを、図23に示す
。グループ稼働性能値作成部は、プロセス間通信一覧のグループ単位でループを実行する
(ステップ2301、2309)。次に、グループに属する監視対象ホストから、稼働情
報を取得する(ステップ2302)。時系列ごとにすべてのCPU利用率と、メモリ使用量
を積み上げる(ステップ2303)。積み上げた結果の最大値を閾値として、限界閾値記
憶部310に追加する(ステップ2304)。
ループの実行が終了後、プロセス間通信一覧のメタグループ単位でループを実行する(
ステップ2305、2310)。メタグループに属する監視対象ホストから、稼働情報を
取得する(ステップ2306)。時系列ごとにすべてのメモリ使用量を積み上げる(23
07)。最後に、積み上げた結果の最大値を閾値として、限界閾値記憶部310に追加す
る(ステップ2308)。
プロセスのフィルタリングとグルーピングで使用する関連度の算出処理(ステップ17
03)の詳細について、処理フローを、図24に示す。まず、検索したプロセス稼働率情
報(CPU利用時間全体に対するプロセスのCPU利用時間の割合、メモリ使用量全体に対する
プロセスのメモリ使用量の割合、I/Oサイズ全体に対するプロセスのI/Oサイズの割合)を
取得する(ステップ2400)。次に、アクセス内容情報(READ回数、WRITE回数、CREAT
E回数、DELETE回数)を取得する(ステップ2401)。最後に、取得した情報を元に、
図中の評価式を使って関連度を算出する(ステップ2402)。評価式中のA、B、Cは、
稼働率情報の重み係数、D、E、F、Gは、アクセス内容の重み係数を表す。
図25に収集情報例外一覧記憶部207の内容例を示す。収集情報例外一覧記憶部20
7には、稼働性能値記憶部204と、アクセス情報記憶部205と、プロセス間通信情報
記憶部206に格納された情報のうち、性能監視サーバーへの送信の対象外となるファイ
ル名とプロセス名が格納され、収集情報管理部203から参照される。収集情報例外一覧
を格納する場合、対象種別2500と、例外対象名2501を格納する。格納される情報
の例としては、OSのシステムログのファイル名や、常に動作しているOSのプロセス名など
であり、初期状態から情報が格納されているテンプレートとして存在する。
本発明の実施の形態の構成例を示すシステム構成図である。 本発明の実施の形態の構成例を示す監視対象装置の構成図である。 本発明の実施の形態の構成例を示す性能監視サーバーの構成図である。 稼働性能値記憶部の内容例を示す図である。 アクセス情報記憶部の内容例を示す図である。 プロセス間通信情報記憶部の内容例を示す図である。 プロセス別稼働情報一覧記憶部の内容例を示す図である。 プロセス稼働率情報記憶部の内容例を示す図である。 プロセス−ファイル間アクセス内容一覧記憶部の内容例を示す図である。 プロセス間通信一覧記憶部の内容例を示す図である。 プロセスグループ一覧記憶部の内容例を示す図である。 限界閾値記憶部の内容例を示す図である。 プロセス稼働率情報一覧作成部のプロセス別稼働情報一覧を作成する処理例を示すフローチャートである。 プロセス稼働率情報一覧作成部のプロセス稼働率情報一覧を作成する処理例を示すフローチャートである。 プロセス−ファイル間アクセス内容一覧作成部の処理例を示すフローチャートである。 プロセス間通信一覧作成部の処理例を示すフローチャートである。 プロセスグループ生成部の処理例を示すフローチャートである。 プロセスグループ生成部の関連度からグループを作成する処理例を示すフローチャートである。 プロセスグループ生成部のファイル名からグルーピングを行う処理例を示すフローチャートである。 プロセスグループ生成部のプロセス名からグルーピングを行う処理例を示すフローチャートである。 プロセス間通信一覧からグループを更新する処理例を示すフローチャートである。 プロセス間通信一覧からメタグループを作成する処理例を示すフローチャートである。 グループ稼働性能値作成部の処理例を示すフローチャートである。 プロセスグループ生成部の関連度を算出する処理例を示すフローチャートである。 収集情報例外一覧記憶部の内容例を示す図である。
符号の説明
100…性能監視サーバー、101…監視端末、102…監視対象装置、103…ネットワーク、200…稼働性能値収集部、201…アクセス情報収集部、202…プロセス間通信情報収集部203…収集情報管理部、204…稼働性能値記憶部、205…アクセス情報記憶部、206…プロセス間通信情報記憶部、207…収集情報例外一覧記憶部、300…プロセス稼働率情報一覧作成部、301…プロセス−ファイル間アクセス内容一覧作成部、302…プロセス間通信一覧作成部、303…プロセスグループ生成部、304…グループ稼働性能値作成部、305…限界閾値判定部、311…プロセス別稼働情報一覧記憶部、306…プロセス稼働率情報一覧記憶部、307…プロセス−ファイル間アクセス内容一覧記憶部、308…プロセス間通信一覧記憶部、309…プロセスグループ記憶部、310…限界閾値記憶部、400…時刻、401…プロセスID、402…プロセス名、403…CPU利用時間、404…CPU使用率、405…メモリ使用量、406…I/Oサイズ、500…取得時間、501…プロセス名、502…ファイル名、503…アクセス内容、600…取得時間、601…プロセス名、602…ポート番号、603…通信対象ホスト、604…通信対象ポート番号、700…監視対象ホスト、701…プロセス名、702…CPU利用時間、703…I/Oサイズ、704…メモリ使用量、800…監視対象ホスト、801…プロセス名、802…全体に対する各プロセスのCPU利用時間の割合、803…全体に対する各プロセスのメモリ使用量の割合、804…全体に対する各プロセスのI/Oサイズの割合、900…監視対象ホスト、901…ファイル名、902…プロセス名、903…ファイルへの読込み(READ)回数、904…ファイルへの書込み(WRITE)回数、905…ファイルの生成(CREATE)回数、906…ファイルの削除(DELETE)回数、1000…プロセス通信元ホスト、1001…プロセス通信元プロセス、1002…プロセス通信先ホスト、1003…プロセス通信先プロセス、1100…監視対象ホスト、1101…ファイル名、1102…プロセス名、1103…関連度、1104…監視対象装置内のグループ名、1105…監視対象装置にまたがったグループ名、1200…監視対象ホスト、1201…グループ名、1202…監視項目、1203…閾値種別、1204…閾値、2500…対象種別、2501…例外対象名。

Claims (6)

  1. 監視対象装置上で動作するプロセスの稼働情報と、各プロセスの、監視対象装置内の各
    ファイルに対するアクセス情報から、プロセスとファイルの関連性を数値化して、関連度
    として算出する性能監視システム。
  2. 監視対象装置上で動作するプロセスのプロセス間通信の情報から、プロセス間の関連性
    を数値化して、関連度として算出する性能監視システム。
  3. 請求項1、2記載のシステムにおいて、監視対象装置内のプロセスとファイルの関連度
    と、プロセス間の関連度を算出する場合だけではなく、同一のファイルと関連度のあるプ
    ロセス同士や、プロセス間通信の情報から、関連度のあるプロセス同士を自動的にグルー
    ピングして、プロセスのグループ単位で稼働監視を行う手段を持つ性能監視システム。
  4. 請求項3記載の性能監視システムにおいて、監視対象装置内のプロセスとファイルの関
    連度の有無と、プロセス同士の関連度の有無により、関連度のあるプロセスを自動的にグ
    ルーピングする場合だけではなく、プロセスとファイルの関連度と、プロセス同士の関連
    度にそれぞれ重みをつけ、その重みによって関連度のフィルタリングを行うことで、グル
    ープの再編成を行い、プロセスのグループ単位で稼働監視を行う手段を持つ性能監視シス
    テム。
  5. 請求項4記載の性能監視システムにおいて、プロセス間通信の関連度から、監視対象装
    置内のプロセスをグループ化する場合だけではなく、監視対象装置をまたがってプロセス
    間通信を行っているプロセスも関連性があると見なした上で、監視対象装置をまたがって
    グループの再編成を行い、プロセスのグループ単位で稼働監視を行う手段を持つ性能監視
    システム。
  6. 請求項5記載の性能監視システムにおいて、自動的にグルーピングしたプロセスを、グ
    ループ単位で稼働性能情報を監視する場合だけではなく、プロセスグループの監視項目の
    閾値を自動的に設定して監視を行う手段を持つ性能監視システム。
JP2008110833A 2008-04-22 2008-04-22 プロセスの自動グループ化とその性能監視方法 Pending JP2009265707A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008110833A JP2009265707A (ja) 2008-04-22 2008-04-22 プロセスの自動グループ化とその性能監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008110833A JP2009265707A (ja) 2008-04-22 2008-04-22 プロセスの自動グループ化とその性能監視方法

Publications (1)

Publication Number Publication Date
JP2009265707A true JP2009265707A (ja) 2009-11-12

Family

ID=41391526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008110833A Pending JP2009265707A (ja) 2008-04-22 2008-04-22 プロセスの自動グループ化とその性能監視方法

Country Status (1)

Country Link
JP (1) JP2009265707A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013061912A (ja) * 2011-09-15 2013-04-04 Fujitsu Ltd プロセス関係解析プログラム,プロセス関係解析装置およびプロセス関係解析方法
JP2015133013A (ja) * 2014-01-14 2015-07-23 日本電信電話株式会社 情報抽出装置、情報抽出方法、および、情報抽出プログラム
US11378944B2 (en) 2017-10-10 2022-07-05 Nec Corporation System analysis method, system analysis apparatus, and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013061912A (ja) * 2011-09-15 2013-04-04 Fujitsu Ltd プロセス関係解析プログラム,プロセス関係解析装置およびプロセス関係解析方法
JP2015133013A (ja) * 2014-01-14 2015-07-23 日本電信電話株式会社 情報抽出装置、情報抽出方法、および、情報抽出プログラム
US11378944B2 (en) 2017-10-10 2022-07-05 Nec Corporation System analysis method, system analysis apparatus, and program

Similar Documents

Publication Publication Date Title
US7483918B2 (en) Dynamic physical database design
US8965941B2 (en) File list generation method, system, and program, and file list generation device
US8171060B2 (en) Storage system and method for operating storage system
CN107544832B (zh) 一种虚拟机进程的监控方法、装置和系统
CN112346829A (zh) 一种用于任务调度的方法及设备
CN107608860B (zh) 一种错误日志分类存储的方法、装置、设备
US20120317112A1 (en) Operation log management system and operation log management method
WO2020168756A1 (zh) 集群日志特征提取方法、装置、设备及存储介质
CN111708755A (zh) 数据迁移方法、装置、系统、电子设备以及可读存储介质
JP2020057416A (ja) 分散データベースにおけるデータブロックを処理する方法およびデバイス
CN113485999A (zh) 数据清理方法、装置和服务器
CN111221890B (zh) 通用指标类自动监控预警方法及装置
JP2009265707A (ja) プロセスの自動グループ化とその性能監視方法
CN109947730A (zh) 元数据恢复方法、装置、分布式文件系统及可读存储介质
CN112433888B (zh) 数据处理方法及装置、存储介质和电子设备
US9778854B2 (en) Computer system and method for controlling hierarchical storage therefor
JP4871213B2 (ja) ストリームデータ処理方法、ストリームデータ処理プログラムおよびストリームデータ処理システム
WO2012081165A1 (ja) データベース管理装置及びデータベース管理方法
CN112579552A (zh) 日志存储及调用方法、装置及系统
CN115543918A (zh) 一种文件快照方法、系统、电子设备及存储介质
CN110765081A (zh) 一种数据删除方法和装置
CN110837428A (zh) 存储设备管理方法及装置
CN115269519A (zh) 一种日志检测方法、装置及电子设备
TW201439916A (zh) 虛擬系統之系統資源管理方法
CN113835613B (zh) 一种文件读取方法、装置、电子设备和存储介质