JP5126229B2 - システム監視プログラム、システム監視方法およびシステム監視装置 - Google Patents

システム監視プログラム、システム監視方法およびシステム監視装置 Download PDF

Info

Publication number
JP5126229B2
JP5126229B2 JP2009523496A JP2009523496A JP5126229B2 JP 5126229 B2 JP5126229 B2 JP 5126229B2 JP 2009523496 A JP2009523496 A JP 2009523496A JP 2009523496 A JP2009523496 A JP 2009523496A JP 5126229 B2 JP5126229 B2 JP 5126229B2
Authority
JP
Japan
Prior art keywords
model
transaction
unit
processing
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009523496A
Other languages
English (en)
Other versions
JPWO2009011058A1 (ja
Inventor
由起子 関
基行 河場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2009011058A1 publication Critical patent/JPWO2009011058A1/ja
Application granted granted Critical
Publication of JP5126229B2 publication Critical patent/JP5126229B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/87Monitoring of transactions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

本発明は、複数種類の単位処理を実行するシステムを監視するシステム監視プログラム、システム監視方法およびシステム監視装置に関し、特に、複数種類の単位処理のそれぞれをモデル化した複数の単位処理モデルおよび処理時間に基づいてシステムを監視することによって、システムの異常を精度良く検出することができるシステム監視プログラム、システム監視方法およびシステム監視装置に関するものである。
近年、様々な分野でコンピュータシステムが必要不可欠なインフラシステムとしての役割を担ってきており、コンピュータシステムを停止させることなく正常に稼動させることが増々重要となっている。このため、コンピュータシステムの動作状況を監視し、システムの異常を早期に発見するための様々な技術が開発されている。
例えば、業務システムにおいては、単位処理であるトランザクション(サービス処理の流れ)を分析することが処理状況を監視するために有用であることから、ネットワーク上でサービス処理のためにやりとりされるメッセージのログを収集し、そのログ内のメッセージ間の呼び出し関係に基づいて、トランザクションを推定する技術が開発されている(特許文献1参照)。かかる技術を用いることによって、業務システム内に存在する多数のトランザクションの種類を低頻度のものまで人手を用いないで抽出することができ、システムの分析を支援することができる。
特開2006−11683号公報
しかしながら、特許文献1に記載された技術では、高頻度のものから非常に低頻度のものまで、膨大な種類のトランザクションが生成されるために、システム全体の状況の把握が困難であるという問題がある。
本発明は、上記に鑑みてなされたものであって、複数種類の単位処理のそれぞれをモデル化した複数の単位処理モデルおよび処理時間に基づいてシステムを監視することによって、システムの異常を精度良く検出することができるシステム監視プログラム、システム監視方法およびシステム監視装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、請求項1に係る発明は、複数種類の単位処理を実行するシステムを監視するシステム監視プログラムであって、システムによって実行された単位処理が前記複数種類の単位処理のそれぞれをモデル化した複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出するモデル・マッチ率算出手順と、前記モデル・マッチ率算出手順により算出されたモデル・マッチ率に基づいてシステムが正常であるか否かを判定するシステム状態判定手順とをコンピュータに実行させることを特徴とする。
この請求項1の発明によれば、システムによって実行された単位処理が複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出し、算出したモデル・マッチ率に基づいてシステムが正常であるか否かを判定するよう構成したので、単位処理モデルと一致はしても処理時間に異常がある単位処理を検出することができる。
また、請求項2に係る発明は、上記発明において、前記システム状態判定手順によりシステムが正常でないと判定された場合に、前記モデル・マッチ率算出手順により処理時間が正常でないと判定された単位処理に対して単位処理を構成する複数の要素処理の中で異常な要素処理を各要素処理の処理時間に基づいて特定する異常要素処理特定手順をさらにコンピュータに実行させることを特徴とする。
この請求項2の発明によれば、システムが正常でないと判定した場合に、処理時間が正常でないと判定した単位処理に対して単位処理を構成する複数の要素処理の中で異常な要素処理を各要素処理の処理時間に基づいて特定するよう構成したので、異常原因の特定を容易にすることができる。
また、請求項3に係る発明は、上記発明において、前記異常要素処理特定手順により特定された要素処理の異常の原因として注意を要する要注意箇所を各要素箇所の処理時間に基づいて特定する要注意箇所特定手順をさらにコンピュータに実行させることを特徴とする。
この請求項3の発明によれば、特定した要素処理の異常の原因として注意を要する要注意箇所を各要素箇所の処理時間に基づいて特定するよう構成したので、より詳細なレベルでの異常原因の特定を支援することができる。
また、請求項4に係る発明は、上記発明において、前記要注意箇所特定手順により複数の要注意箇所が特定された場合に、要注意箇所を有するモデルである要注意モデルと一致するトランザクションの所定期間における出現回数と、要注意箇所を構成要素として有するモデルあるいは要注意モデルと一致するトランザクションの該所定期間における出現回数に基づいて各要注意箇所の問題性を評価して出力する問題性評価手順をさらにコンピュータに実行させることを特徴とする。
この請求項4の発明によれば、複数の要注意箇所を特定した場合に、要注意箇所を有するモデルである要注意モデルと一致するトランザクションの所定期間における出現回数と、要注意箇所を構成要素として有するモデルあるいは要注意モデルと一致するトランザクションの該所定期間における出現回数に基づいて各要注意箇所の問題性を評価して出力するよう構成したので、定量的なデータに基づいて異常分析を支援することができる。
また、請求項5に係る発明は、上記発明において、前記単位処理は業務システムのトランザクション処理であり、前記複数の要素処理はウェブ処理、アプリケーション処理およびデータベース処理であり、データベース処理の要注意箇所にはデータベースを構成するテーブルが含まれることを特徴とする。
この請求項5の発明によれば、単位処理は業務システムのトランザクション処理であり、複数の要素処理はウェブ処理、アプリケーション処理およびデータベース処理であり、データベース処理の要注意箇所にはデータベースを構成するテーブルが含まれるよう構成したので、業務システムの異常を精度良く検出することができる。
また、請求項6に係る発明は、複数種類の単位処理を実行するシステムを監視するシステム監視装置によるシステム監視方法であって、システムによって実行された単位処理が前記複数種類の単位処理のそれぞれをモデル化した複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出するモデル・マッチ率算出ステップと、前記モデル・マッチ率算出ステップにより算出されたモデル・マッチ率に基づいてシステムが正常であるか否かを判定するシステム状態判定ステップとを含んだことを特徴とする。
この請求項6の発明によれば、システムによって実行された単位処理が複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出し、算出したモデル・マッチ率に基づいてシステムが正常であるか否かを判定するよう構成したので、単位処理モデルと一致はしても処理時間に異常がある単位処理を検出することができる。
また、請求項7に係る発明は、複数種類の単位処理を実行するシステムを監視するシステム監視装置であって、システムによって実行された単位処理が前記複数種類の単位処理のそれぞれをモデル化した複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出するモデル・マッチ率算出手段と、前記モデル・マッチ率算出手段により算出されたモデル・マッチ率に基づいてシステムが正常であるか否かを判定するシステム状態判定手段とを備えたことを特徴とする。
この請求項7の発明によれば、システムによって実行された単位処理が複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出し、算出したモデル・マッチ率に基づいてシステムが正常であるか否かを判定するよう構成したので、単位処理モデルと一致はしても処理時間に異常がある単位処理を検出することができる。
本発明によれば、単位処理モデルと一致はしても処理時間に異常がある単位処理を検出するので、処理時間をシステムの異常検出に用いない場合と比較してより精度良くシステムの異常を検出することができるという効果を奏する。
また、本発明によれば、異常原因の特定を容易にするので、システム運用者は効率良くシステムの異常に対応することができるという効果を奏する。
また、本発明によれば、より詳細なレベルでの異常原因の特定を支援するので、システム運用者は効率良くシステムの異常に対応することができるという効果を奏する。
また、本発明によれば、定量的なデータに基づいて異常分析を支援するので、精度良くシステムの異常を分析することができるという効果を奏する。
また、本発明によれば、業務システムの異常を精度良く検出するので、業務システムの運用を支援することができるという効果を奏する。
図1は、本実施例に係るトランザクション監視装置によるトランザクションの監視とトランザクション詳細分析装置による異常個所の特定を説明するための説明図である。 図2−1は、本実施例に係るトランザクション監視装置およびトランザクション詳細分析装置によるシステム監視・分析手順を説明するための説明図(1)である。 図2−2は、本実施例に係るトランザクション監視装置およびトランザクション詳細分析装置によるシステム監視・分析手順を説明するための説明図(2)である。 図2−3は、本実施例に係るトランザクション監視装置およびトランザクション詳細分析装置によるシステム監視・分析手順を説明するための説明図(3)である。 図2−4は、本実施例に係るトランザクション監視装置およびトランザクション詳細分析装置によるシステム監視・分析手順を説明するための説明図(4)である。 図3は、本実施例に係るトランザクション監視装置の構成を示す機能ブロック図である。 図4は、新規トラン情報格納部131が格納する新規トラン情報の一例を示す図である。 図5は、モニタリング設定情報格納部132が格納するモニタリング設定情報の一例を示す図である。 図6−1は、モデル情報格納部133が格納するモデル情報の一例を示す図(1)である。 図6−2は、モデル情報格納部133が格納するモデル情報の一例を示す図(2)である。 図6−3は、モデル情報格納部133が格納するモデル情報の一例を示す図(3)である。 図7−1は、分析結果トラン情報格納部134が格納する分析結果トラン情報の一例を示す図(1)である。 図7−2は、分析結果トラン情報格納部134が格納する分析結果トラン情報の一例を示す図(2)である。 図8は、モニタリング情報格納部135が格納するモニタリング情報の一例を示す図である。 図9は、本実施例に係るトランザクション監視装置100によるトランザクション監視処理の処理手順を示すフローチャートである。 図10は、トランザクション詳細分析装置の構成を示す機能ブロック図である。 図11は、詳細分析用設定情報格納部231が格納する詳細分析用設定情報の一例を示す図である。 図12−1は、トラン構成要素間非類似度格納部134が格納するトラン構成要素間非類似度の一例を示す図(1)である。 図12−2は、トラン構成要素間非類似度格納部134が格納するトラン構成要素間非類似度の一例を示す図(2)である。 図13は、トランザクションtiとモデルMjとの間の非類似度を説明するための説明図である。 図14は、分析結果トラン情報格納部234が格納する分析結果トラン情報の一例を示す図である。 図15は、処理時間が正常範囲からはずれている箇所を問題箇所として抽出する処理を説明するための説明図である。 図16は、問題箇所評価部248による問題性の評価を説明するための説明図である。 図17は、詳細分析結果表示部250が表示する詳細分析結果の一例を示す図である。 図18は、本実施例に係るトランザクション詳細分析装置200によるトランザクション詳細分析処理の処理手順を示すフローチャートである。 図19は、本実施例に係るトランザクション監視プログラムを実行するコンピュータの構成を示す機能ブロック図である。
符号の説明
100 トランザクション監視装置
110 入力部
120 出力部
131 新規トラン情報格納部
132 モニタリング設定情報格納部
133 モデル情報格納部
134 分析結果トラン情報格納部
135 モニタリング情報格納部
141 トラン抽出部
142 モニタリング設定情報読込部
143 モデル情報読込部
144 新規トラン情報読込部
145 トラン−モデルマッチング処理部
146 モデル・マッチ率評価部
147 モニタリング情報表示部
150 参照情報記憶部
160 制御部
200 トランザクション詳細分析装置
210 入力部
220 出力部
231 詳細分析用設定情報格納部
232 トラン構成要素間非類似度格納部
233 モデル情報格納部
234 分析結果トラン情報格納部
235 詳細分析結果格納部
241 詳細分析用設定処理部
242 トラン構成要素間非類似度読込部
243 モデル情報読込部
244 トラン情報読込部
245 類似モデル検索部
246 要注意モデル抽出部
247 要注意モデル内要注意箇所抽出部
248 問題箇所評価部
249 トラン情報更新処理部
250 詳細分析結果表示部
260 参照情報記憶部
270 制御部
300 コンピュータ
310 RAM
311 トランザクション監視プログラム
320 CPU
330 HDD
340 LANインタフェース
350 入出力インタフェース
360 DVDドライブ
以下に、本発明に係るシステム監視プログラム、システム監視方法およびシステム監視装置の実施例を図面に基づいて詳細に説明する。なお、以下では、トランザクション監視装置が業務システムを監視し、業務システムに異常が検出されるとトランザクション詳細分析装置がトランザクションの詳細分析を行う場合について説明するが、一つの装置が業務システムの監視とトランザクションの詳細分析を行うようにすることもできる。
まず、本実施例に係るトランザクション監視装置によるトランザクションの監視とトランザクション詳細分析装置による異常個所の特定について説明する。図1は、本実施例に係るトランザクション監視装置によるトランザクションの監視とトランザクション詳細分析装置による異常個所の特定を説明するための説明図である。本実施例に係るトランザクション監視装置およびトランザクション詳細分析装置は、トランザクションの種類ごとにトランザクションのモデルと処理時間を記憶する。
そして、本実施例に係るトランザクション監視装置は、実際のトランザクションをモデルと比較し、一致するモデルがない場合には、トランザクションを異常であると判定する。また、一致するモデルがある場合にも、業務システムのWeb階層(ウェブ階層)、App階層(アプリケーション階層)、DB階層(データベース階層)の各処理時間のいずれかがモデルの各階層の処理時間と比べて非常に長い場合には、トランザクションを異常であると判定する。図1では、モデル「M1」および「M3」にそれぞれ一致したトランザクションのDB階層の処理がモデルに比べて非常に遅いため、それらのトランザクションが異常であると判定される。
このように、本実施例に係るトランザクション監視装置は、実際のトランザクションがモデルと一致するか否かだけでなく、Web階層、App階層、DB階層の各処理時間をモデルの処理時間と比較してトランザクションの異常判定を行うことによって、モデルには一致するにもかかわらず異常なトランザクションを検出することができ、モデルと一致するか否かだけによってシステムを監視する場合と比較して、より正確にシステムの異常を検出することができる。なお、処理時間を用いることなくモデルだけを用いてシステムを監視するトランザクション監視装置については、特願2006−099351に記載されている。
また、本実施例に係るトランザクション詳細分析装置は、DBメッセージごとの処理時間をDB階層の処理時間とともに記憶し、DB階層の処理に異常がある場合には、DBメッセージごとの処理時間をモデルと比較して、データベースを構成するテーブルのうちどのテーブルに問題があるかを特定する。図1では、「M1」に一致したトランザクションと「M3」に一致したトランザクションのデータベース処理の共通部分はテーブル「TBL_A」および「TBL_B」の処理であり、「TBL_A」の処理がモデルと比較して特に遅いことから、「TBL_A」が問題箇所として特定される。
このように、本実施例に係るトランザクション詳細分析装置は、DB階層の処理に異常がある場合には、DBメッセージごとの処理時間をモデルの処理時間と比較して、データベースを構成するテーブルのうちどのテーブルに問題があるかを特定することによって、異常原因の詳細な分析を支援することができる。
次に、本実施例に係るトランザクション監視装置およびトランザクション詳細分析装置によるシステム監視・分析手順の概要について説明する。図2−1〜図2−4は、本実施例に係るトランザクション監視装置およびトランザクション詳細分析装置によるシステム監視・分析手順を説明するための説明図(1)〜(4)である。
図2−1に示すように、本実施例に係るトランザクション監視装置は、モデル・マッチ率を計算し、モデル・マッチ率が所定の閾値を下回ると、警告を出力するとともにトランザクション詳細分析装置に詳細分析を指示し、トランザクション詳細分析装置が、異常原因特定を支援する詳細分析を開始する。
ここで、モデル・マッチ率とは、単位時間当たりに観測されたトランザクション数に対して、いずれかのモデルと一致し、かつ、トランザクション内の各階層の処理時間が全て正常範囲内にあるトランザクションの数の割合である。なお、トランザクション内の各階層の処理時間の正常範囲は、モデルの処理時間の平均±係数×標準偏差などの統計量に基づいて決めることができる。あるいは、システム運用者が決めることもできる。
詳細分析では、トランザクション詳細分析装置は、図2−2に示すように、単位時間当たりの各モデルにマッチしたトランザクションの処理時間の内訳(Web階層、App階層、DB階層の平均値)を計算し、正常範囲からはずれている箇所を要注意箇所として抽出する。
図2−2では、モデル「M1」および「M3」のDB階層の処理時間が正常範囲からはずれているため、モデル「M1」および「M3」が要注意モデルとして抽出される。また、モデルM1で処理が行われるテーブル「TANTOSYA」、「KOKYAKU」および「SAIBAN」ならびに処理を行ったサーバのID「10.23.45.67」と、モデルM3で処理が行われるテーブル「JYUTYU」、「KOKYAKU」、「TANTOSYA」、「MEISAI」、「ZAIKO」および「SHOHIN」ならびに処理を行ったサーバのID「10.23.45.67」が要注意箇所として抽出される。
そして、トランザクション詳細分析装置は、図2−3に示すように、モデル「M1」および「M3」の要注意箇所であるDB階層のDB処理メッセージ群に対してDB処理メッセージごとに処理時間の平均値を求めてモデルの平均値と比較し、正常範囲からはずれているDB処理メッセージに共通のテーブル「KOKYAKU」を「問題性大」であると判定する。
図2−3では、モデルM1のDB階層が6個のDB処理メッセージから構成され、モデルM2のDB階層が7個のDB処理メッセージから構成され、モデル「M1」の2番目のDB処理メッセージとモデル「M3」の2番目のDB処理メッセージが正常範囲からはずれており、テーブル「KOKYAKU」が両方のDB処理メッセージに共通しているため、トランザクション詳細分析装置は、テーブル「KOKYAKU」を「問題性大」であると判定する。
これに対して、サーバのID「10.23.45.67」は、図2−4に示すように、要注意モデル「M1」および「M3」に共通に出現するが、要注意モデル以外の正常モデル「M2」、「M4」および「M5」にも出現する。したがって、トランザクション詳細分析装置は、サーバ「10.23.45.67」を「問題性小」であると判定する。また、モデル「M3」の2番目のDB処理メッセージだけに出現するテーブル「TANTOSYA]および「JYUTYU」は、「問題性大」と「問題性小」の間に位置付けられる。
このように、本実施例に係るトランザクション詳細分析装置は、モデル・マッチ率が所定の閾値を下回ると、トランザクションの処理時間に基づいて要注意箇所を抽出し、要注意箇所が要注意モデルと正常モデルにどのように出現しているかに基づいて各要注意箇所の問題性を評価することによって、システムの異常原因の特定を支援することができる。
次に、本実施例に係るトランザクション監視装置の構成について説明する。図3は、本実施例に係るトランザクション監視装置の構成を示す機能ブロック図である。同図に示すように、このトランザクション監視装置100は、入力部110と、出力部120と、新規トラン情報格納部131と、モニタリング設定情報格納部132と、モデル情報格納部133と、分析結果トラン情報格納部134と、モニタリング情報格納部135と、トラン抽出部141と、モニタリング設定情報読込部142と、モデル情報読込部143と、新規トラン情報読込部144と、トラン−モデルマッチング処理部145と、モデル・マッチ率評価部146と、モニタリング情報表示部147と、参照情報記憶部150と、制御部160とを有する。
入力部110は、トランザクションの監視に関する各種の指示をシステム運用者から受け付ける処理部であり、具体的には、システム運用者によるマウスやキーボードを用いた指示を受け付ける。出力部120は、トランザクション監視装置100の監視結果を出力する処理部であり、具体的には、表示装置に監視結果を表示する。
新規トラン情報格納部131は、監視対象である新規のトランザクションに関する情報を新規トラン情報として格納する格納部である。図4は、新規トラン情報格納部131が格納する新規トラン情報の一例を示す図である。同図に示すように、新規トラン情報格納部131は、トランザクションを構成する個々の処理ごとに、トランザクションを識別するトランID、各処理の開始時刻および終了時刻、プロトコル種別、処理内容、トランザクションのクライアントIDならびに処理を実行したサーバIDを新規トラン情報として格納する。
モニタリング設定情報格納部132は、システム監視に関する設定情報をモニタリング設定情報として格納する格納部である。図5は、モニタリング設定情報格納部132が格納するモニタリング設定情報の一例を示す図である。同図に示すように、このモニタリング設定情報格納部132は、モデル・マッチ率評価条件およびモデル・マッチ率判定基準をモニタリング設定情報として格納する。
ここで、モデル・マッチ率評価条件は、モデル・マッチ率すなわち新規のトランザクションがモデルとマッチする率を評価する時間間隔である。また、モデル・マッチ率判定基準は、モデル・マッチ率に基づいてシステムの処理状況を判定する基準であり、この例では、トランザクション監視装置100は、モデル・マッチ率が「0.90以上1.00以下」の場合にはシステムの処理状況を「正常」と判定し、「0.80以上0.90未満」の場合にはシステムの処理状況を「注意」と判定し、「0.00以上0.80未満」の場合にはシステムの処理状況を「警告」と判定する。
モデル情報格納部133は、トランザクションのモデルの情報をモデル情報として格納する格納部である。図6−1〜図6−3は、モデル情報格納部133が格納するモデル情報の一例を示す図(1)〜(3)である。これらの図に示すように、このモデル情報格納部133は、「M1」、「M2」などトランザクションのモデルを識別するモデルIDとモデルを定義する情報を対応させて記憶する。モデルを定義する情報は、モデルを構成する処理ごとにノード、プロトコル種別、処理内容および正常範囲から構成される。
ここで、ノードは、処理が行われる階層(Web階層−App階層−DB階層)と階層内での一連番号を表す。例えばノード「0」はWeb階層の最初の処理を表し、ノード「0−0」はWeb階層の最初の処理におけるApp階層の最初の処理を表し、ノード「0−0−n」はWeb階層の最初の処理でのApp階層の最初の処理におけるDB階層のn+1番目の処理を表す。なお、ノード「0−0−*」は、Web階層の最初の処理でのApp階層の最初の処理におけるDB階層の一連の処理をまとめたものであり、処理内容は、DB階層の処理で処理されるテーブルを示す。また、正常範囲は、各処理が正常に行われる場合の処理時間の下限値と上限値を示す。
例えば、モデル「M1」のノード「0−0−*」のDB階層の処理で処理されるテーブルは「TANTOSYA]、「KOKYAKU」および「SEIBAN」であり、処理時間が0.0058秒と0.0368秒の範囲内であればDB階層の処理は正常であることを示す。
分析結果トラン情報格納部134は、新規のトランザクションがモデルとマッチしたか否かの分析結果を分析結果トラン情報として格納する格納部である。ここで、マッチするとは、処理内容が一致し、かつ処理時間が正常範囲内である場合である。
図7−1および図7−2は、分析結果トラン情報格納部134が格納する分析結果トラン情報の一例を示す図(1)および(2)である。これらの図に示すように、この分析結果トラン情報格納部134は、新規トラン情報にモデルID、ノード、処理時間および状態が分析結果として追加された情報を分析結果トラン情報として格納する。ここで、モデルIDは、新規のトランザクションに処理内容が一致したモデルのモデルIDであり、ノードは、対応するモデルのノードであり、処理時間は、処理に要した時間である。
また、状態は、一致したモデルがない場合には「非マッチ」であり、一致したモデルがあり処理時間が正常範囲内である場合には「正常」であり、一致したモデルはあるが処理時間が正常範囲からはずれている場合には「問題」がある。なお、ここでは、DB階層の各DBメッセージに対して処理時間が正常範囲内であるか否かが判定されているが、DBメッセージの処理時間が正常範囲内であるか否かの判定は後述する詳細分析で行われる。
モニタリング情報格納部135は、業務システムの処理状況のモニタリング結果をモニタリング情報として格納する格納部である。図8は、モニタリング情報格納部135が格納するモニタリング情報の一例を示す図である。同図に示すように、このモニタリング情報格納部135は、60秒ごとに業務システムのモニタリング結果として、時刻、処理したトランザクションの数であるトラン観測数、正常と判定されたトランザクションの数である正常モデル数、モデル・マッチ率、業務システムの状態をモニタリング情報として格納する。
ここで、60秒はモデル・マッチ率評価条件として設定された値であり、業務システムの状態はモデル・マッチ率判定基準に基づいて判定された業務システムの状態である。また、モデル・マッチ率評価条件およびモデル・マッチ率判定基準はモニタリング設定情報としてシステム運用者により設定された値である。
トラン抽出部141は、ネットワーク上でトランザクション処理のためにやりとりされるメッセージのログを収集し、そのログ内のメッセージ間の呼び出し関係に基づいて、トランザクションを抽出する処理部であり、抽出したトランザクションに関する情報を新規トラン情報格納部131に格納する。なお、ここでは、トラン抽出部141をトランザクション監視装置100内に設けることとしたが、トラン抽出部141を別の装置に設けることもできる。
モニタリング設定情報読込部142は、モニタリング設定情報格納部132からモニタリング設定情報を読み出して参照情報記憶部150に書き込む処理部であり、モデル情報読込部143は、モデル情報格納部133からモデル情報を読み出して参照情報記憶部150に書き込む処理部である。
新規トラン情報読込部144は、新規トラン情報格納部131から新規のトランザクションの情報を読み出してトラン−モデルマッチング処理部145に一つずつ渡す処理部である。
トラン−モデルマッチング処理部145は、新規トラン情報読込部144から新規のトランザクションの情報を一つずつ受け取り、参照情報記憶部150に記憶されたモデル情報を参照して新規のトランザクションがモデルのいずれかに一致するか否かを判定し、一致するモデルがある場合には、各階層の処理ごとに処理時間が正常範囲内であるか否かを判定する処理部である。
そして、トラン−モデルマッチング処理部145は、新規のトランザクションがモデルのいずれかにも一致しない場合には、その処理の状態を「非マッチ」とし、一致したモデルがあり処理時間が正常範囲内である場合には、その処理の状態を「正常」とし、一致したモデルはあるが処理時間が正常範囲内でない場合には、その処理の状態を「問題」とする。そして、各処理の情報に処理時間などと一緒に処理の状態を付加して分析結果トラン情報格納部134に書き込む。なお、DB階層の一連の処理をまとめた処理以外の個別の処理についての「正常」か「問題」かの判定は、後述する詳細分析時に行われる。
このように、トラン−モデルマッチング処理部145が、新規のトランザクションがモデルのいずれかに一致した場合でも、各階層の処理ごとの処理時間が正常範囲内であるか否かを判定することによって、処理内容だけでなく各階層の処理時間に基づいてシステムの異常をより正確に検出することができる。
モデル・マッチ率評価部146は、モデル・マッチ率評価条件の時間間隔でモデル・マッチ率を計算し、業務システムの処理状態をモデル・マッチ率判定基準に基づいて特定する処理部であり、特定した状態をモニタリング情報としてモニタリング情報格納部135に格納する。このモデル・マッチ率評価部146は、単位時間当たりに観測されたトランザクション数に対して、いずれかのモデルと一致し、かつ、トランザクション内の各階層の処理時間が全て正常範囲内にあるトランザクションの数の割合をモデル・マッチ率として計算する。
モニタリング情報表示部147は、モニタリング情報格納部135に格納されたモニタリング情報を出力部120を介して表示する処理部である。参照情報記憶部150は、モニタリング設定情報読込部142およびモデル情報読込部143によってそれぞれ読み込まれたモニタリング設定情報およびモデル情報を記憶する記憶部である。この参照情報記憶部150が記憶する情報は、トラン−モデルマッチング処理部145およびモデル・マッチ率評価部146によって参照される。
制御部160は、上述した入力部110、出力部120、トラン抽出部141、モニタリング設定情報読込部142、モデル情報読込部143、新規トラン情報読込部144、トラン−モデルマッチング処理部145、モデル・マッチ率評価部146、モニタリング情報表示部147を制御してトランザクション監視装置100を一つの装置として機能させる。なお、図3において格納部は磁気ディスク装置内に設けられ、格納部と処理部間の矢印は、処理部から格納部へのアクセスを表す。
次に、本実施例に係るトランザクション監視装置100によるトランザクション監視処理の処理手順について説明する。図9は、本実施例に係るトランザクション監視装置100によるトランザクション監視処理の処理手順を示すフローチャートである。
同図に示すように、このトランザクション監視処理では、モニタリング設定情報読込部142がモニタリング設定情報を読み込んで参照情報記憶部150に書き込み(ステップS101)、モデル情報読込部143がモデル情報を読み込んで参照情報記憶部150に書き込む(ステップS102)。
そして、新規トラン情報読込部144が新規トランザクションtを読み込んでトラン−モデルマッチング処理部145に渡し(ステップS103)、トラン−モデルマッチング処理部145がトランザクションの観測数に「1」を加える(ステップS104)。なお、トランザクションの観測数は「0」に初期化されているものとする。
そして、トラン−モデルマッチング処理部145は、参照情報記憶部150からモデルを検索し(ステップS105)、トラザクションtと一致するモデルがあるか否かを判定する(ステップS106)。その結果、トラザクションtに一致するモデルがある場合には、各階層での処理時間が正常範囲内であるか否かを判定し(ステップS107)、全階層での処理時間が正常範囲内である場合には、モデル・マッチ数に「1」を加える(ステップS108)。一方、処理時間が正常範囲内でない階層が一つでもある場合あるいは一致するモデルがない場合には、モデル・マッチ数はそのままとする。なお、モデル・マッチ数は「0」に初期化されているものとする。
そして、トラン−モデルマッチング処理部145は、トランザクションtの情報、判定結果などを分析結果トラン情報格納部134に書き入れる(ステップS109)。そして、モデル・マッチ率評価部146が、参照情報記憶部150のモデル・マッチ率評価条件を参照し、モデル・マッチ率評価条件を満たすか否か、すなわち、モデル・マッチ率を評価する時間になったか否かを判定し(ステップS110)、モデル・マッチ率評価条件を満たさない場合には、ステップS117に進む。
一方、モデル・マッチ率評価条件を満たす場合には、モデル・マッチ率評価部146は、トランザクションの観測数およびモデル・マッチ数を用いてモデル・マッチ率を計算する。そして、モデル・マッチ率評価部146は、計算したモデル・マッチ率から業務システムの状態をモデル・マッチ率判定基準に基づいて特定し、特定した状態をモニタリング情報格納部135に書き入れる(ステップS111)。
そして、モニタリング情報表示部147が、モニタリング情報格納部135に書き入れられたモデル・マッチ率が正常範囲内か否かを判定し(ステップS112)、正常範囲内である場合には、モデル・マッチ率のグラフ表示を更新し(ステップS113)、正常範囲内でない場合には、アラート情報を付けてモデル・マッチ率のグラフ表示を更新する(ステップS114)。また、制御部160が、トランザクション詳細分析装置に詳細分析を指示する(ステップS115)。
そして、制御部160は、トランザクションの観測数およびモデル・マッチ数を「0」に初期化し(ステップS116)、所定のモニター終了条件を満たすか否かを判定し(ステップS117)、所定のモニター終了条件を満たさない場合には、ステップS103に戻って次のトランザクションを処理し、所定のモニター終了条件を満たす場合には、トランザクション監視処理を終了する。
このように、モデル・マッチ率が正常範囲内でない場合に、制御部160がトランザクション詳細分析装置に詳細分析を指示することによって、詳細分析を開始することができる。
次に、トランザクション詳細分析装置の構成について説明する。図10は、トランザクション詳細分析装置の構成を示す機能ブロック図である。同図に示すように、このトランザクション詳細分析装置200は、入力部210と、出力部220と、詳細分析用設定情報格納部231と、トラン構成要素間非類似度格納部232と、モデル情報格納部233と、分析結果トラン情報格納部234と、詳細分析結果格納部235と、詳細分析用設定処理部241と、トラン構成要素間非類似度読込部242と、モデル情報読込部243と、トラン情報読込部244と、類似モデル検索部245と、要注意モデル抽出部246と、要注意モデル内要注意箇所抽出部247と、問題箇所評価部248と、トラン情報更新処理部249と、詳細分析結果表示部250と、参照情報記憶部260と、制御部270とを有する。
入力部210は、詳細分析に関する指示などをシステム運用者から受け付ける処理部であり、具体的には、システム運用者によるマウスやキーボードを用いた指示を受け付ける。出力部220は、トランザクション詳細分析装置200の分析結果を出力する処理部であり、具体的には、表示装置に要注意箇所やその評価結果などを表示する。
詳細分析用設定情報格納部231は、詳細分析に関する設定情報を詳細分析用設定情報として格納する格納部である。図11は、詳細分析用設定情報格納部231が格納する詳細分析用設定情報の一例を示す図である。同図に示すように、詳細分析用設定情報格納部231は、トラン−モデル間の非類似度計算のための編集距離のコスト係数を格納する。
ここで、トラン−モデル間の非類似度計算のための編集距離のコスト係数とは、トランザクションtを編集(構成要素を追加・削除・置換)して、モデルmに一致させるためのコストであり、「追加用」はトランザクションtに1文字(1構成要素)を追加するためのコストであり、「削除用」はトランザクションtから1文字(1構成要素)を削除するためのコストである。なお、トランザクションtの1文字(1構成要素)pを別の1文字(1構成要素)qに置換するためのコストは、以下のトラン構成要素間非類似度格納部232が格納するトラン構成要素間非類似度によって与えられる。
トラン構成要素間非類似度格納部232は、トラン構成要素間すなわちトランザクションを構成する要素間の非類似度をトラン構成要素間非類似度として格納する格納部である。図12−1および図12−2は、トラン構成要素間非類似度格納部232が格納するトラン構成要素間非類似度の一例を示す図(1)および(2)である。このトラン構成要素間非類似度格納部232は、図12−1に示すように、構成要素を識別する記号に、「HTTP」、「IIOP」などのトラン構成要素のプロトコル種別、プロトコル種別以外のトラン構成要素を構成する"文字列"、文字列長を対応させて格納するとともに、図12−2に示すように、トラン構成要素間の編集距離および非類似度を格納する。
ここで、トラン構成要素p、q間の編集距離とは、トラン構成要素pからトラン構成要素qを得るまでに文字を挿入・削除・置換する回数であり、トラン構成要素p、q間の非類似度ed(p,q)は、p、qが同一種別のプロトコルである場合は、
ed(p,q)=(p、q間の編集距離)/(pとqの文字列長の和)
で定義され、p,qが異種別のプロトコルである場合は、
ed(p,q)=1 (規定値)
で定義される。
例えば、図12−2において、トラン構成要素Aとトラン構成要素Mとは同一種別のプロトコルであり、トラン構成要素間の編集距離が3、すなわちトラン構成要素Aの文字列「/dir/program1.cgi?」に対して文字の挿入・削除・置換を1回行うことでトラン構成要素Mの文字列「/dir/program3.cgi?」が得られ、さらに、トラン構成要素Aの文字列長は「18」であり、トラン構成要素Mの文字列長は「18」であることから、これらのトラン構成要素A、M間の非類似度ed(A,M)は、
ed(A,M)=1/(18+18)=0.0277
となる。
また、トラン構成要素Aとトラン構成要素Bとは、プロトコル種別が異なることから、これらのトラン構成要素A、B間の非類似度ed(A,B)は規定値をとり、
ed(A,B)=1
となる。
モデル情報格納部233は、モデル情報格納部133と同様に、トランザクションのモデルの情報をモデル情報として格納する格納部である。
分析結果トラン情報格納部234は、分析結果トラン情報格納部134と同様に、トランザクションの分析結果を分析結果トラン情報として格納する格納部であるが、類似モデルに関する情報も格納する。ここで、類似モデルとは、モデルと完全には一致しないが最もトランザクションに類似するモデルであり、トラン−モデル間非類似度すなわちトランザクションとモデルとの間の非類似度に基づいて特定される。
トランザクションとモデルとの間の非類似度は、トランザクションとモデルの各構成要素を1記号とみなした記号列間の編集距離である。ただし、構成要素p、q間の編集距離は一定値「1」ではなく、トラン構成要素間の非類似度ed(p,q)である。図13は、トランザクションtiとモデルMjとの間の非類似度を説明するための説明図である。同図は、トランザクション「t342」とモデル「M2」および「M5」との間のトラン−モデル間非類似度を示している。
例えば、図12−1に示した記号を用いて、「t342」を記号列「WXR」と表わし、「M2」を記号列「JKLI」と表わすと、トランザクション「t342」とモデル「M2」との間の非類似度L(t342,M2)は、図13に示すように、W→Jの編集距離(0.0789)、X→Kの編集距離(0.0714)、R→Lの編集距離(0.2758)および1文字追加コスト(0.020)の和であり、0.4461となる。同様に、図12−1に示した記号を用いて、「M5」を記号列「WXRYabcdefagbhiI」と表わすと、トランザクション「t342」とモデル「M5」との間の非類似度L(t342,M5)は、図13に示すように、14文字追加コストであり、14×0.020=0.280となる。したがって、他のモデルとのトラン−モデル間非類似度の中に0.280より小さいものがなければ「M5」が「t342」の類似モデルとなる。
図14は、分析結果トラン情報格納部234が格納する分析結果トラン情報の一例を示す図である。ただし、この例では、いずれのモデルとも一致しなかったトランザクションだけを示している。同図に示すように、いずれのモデルとも一致しなかったトランザクションの場合には、モデルIDがカッコ「()」で囲われ、状態が「非マッチ」となる。なお、モデルに一致したトランザクションに関する分析結果トラン情報の一例は図7−1に示したとおりである。すなわち、分析結果トラン情報格納部134の説明で記載したように、図7−1は、詳細分析後の分析結果トラン情報を示している。
詳細分析結果格納部235は、トランザクションの詳細分析結果を格納する格納部であり、具体的には、要注意箇所や各要注意箇所の問題性の評価結果などの情報を格納する。
詳細分析用設定処理部241は、詳細分析用設設定情報格納部231から詳細分析用設情報を読み出して参照情報記憶部260に書き込む処理部であり、トラン構成要素間非類似度読込部242は、トラン構成要素間非類似度格納部232からトラン構成要素間非類似度を読み出して参照情報記憶部260に書き込む処理部である。
モデル情報読込部243は、モデル情報格納部233からモデル情報を読み出して参照情報記憶部260に書き込む処理部であり、トラン情報読込部244は、分析結果トラン情報格納部234からいずれのモデルとも一致しなかったトランザクションおよび処理時間が正常範囲からはずれたトランザクションの情報を読み出して参照情報記憶部260に書き込む処理部である。
類似モデル検索部245は、モデルとマッチしなかったトランザクションに類似するモデルを参照情報記憶部260から検索する処理部であり、検索した類似モデルの情報を要注意モデルの情報として詳細分析結果格納部235に書き入れる。
要注意モデル抽出部246は、処理時間が正常範囲からはずれたトランザクションと一致したモデルを要注意モデルとして抽出する処理部であり、抽出した要注意モデルの情報を詳細分析結果格納部235に書き入れる。
要注意モデル内要注意箇所抽出部247は、トランザクションと類似モデルとの相違箇所または処理時間が正常範囲からはずれている箇所を要注意箇所として抽出する処理部である。図15は、処理時間が正常範囲からはずれている箇所を要注意箇所として抽出する処理を説明するための説明図である。同図(a)は、処理時間の階層別内訳を各モデルおよび各モデルと一致したトランザクションについて示している。また、ここでは、「M1」と「M3」のDB処理のトランザクションの平均値がモデルの処理時間の平均値±係数×標準偏差で計算される正常範囲からはずれている場合を示している。
要注意モデル内要注意箇所抽出部247は、同図(b)に示すように、モデル「M1」および「M3」のDB処理時間を要素別処理時間に分解することによって、モデル「M1」の2番目の要素処理およびモデル「M3」の2番目の要素処理を要注意箇所として抽出する。
問題箇所評価部248は、要注意箇所を有する要注意モデルの一定期間での出現回数と、要注意箇所を有するモデルあるいは要注意モデルの一定期間での出現回数とに基づいて、各要注意箇所の問題箇所としての問題性を評価する処理部であり、評価結果を詳細分析結果格納部235に書き入れる。ここで、モデルの一定期間での出現回数とは、モデルに一致したトランザクションの一定期間での数である。
図16は、問題箇所評価部248による問題性の評価を説明するための説明図である。同図に示すように、問題箇所評価部248は、問題箇所xの期間sにおける問題性を(問題箇所xが要注意箇所となっている要注意モデルの期間sにおける出現回数)/(問題箇所xを構成要素として有するモデルあるいは要注意モデルの期間sにおける出現回数)によって評価する。
例えば、問題箇所をテーブル「KOKYAKU」とすると、「KOKYAKU」は要注意モデル「M1」および「M3」の要注意箇所であるので、問題性を評価する式の分子の対象となるモデルは「M1」と「M3」であり、分子の値は「M1」の出現回数と「M3」の出現回数の和で11+9=20である。また、図6−1〜図6−3に示したように、「KOKYAKU」を構成要素とするモデルは「M1」および「M3」であり、要注意モデルは「M1」および「M3」であるので、問題性を評価する式の分母の対象となるモデルは「M1」と「M3」であり、分母の値も「M1」の出現回数と「M3」の出現回数の和で11+9=20である。したがって、問題性を評価する式の値は20/20=1.00となる。
また、問題箇所をテーブル「TANTOSYA」とすると、「TANTOSYA」は要注意モデル「M3」の要注意箇所であるので、問題性を評価する式の分子の対象となるモデルは「M3」であり、分子の値は「M3」の出現回数=9である。また、図6−1〜図6−3に示したように、「TANTOSYA」を構成要素とするモデルは「M1」および「M3」であり、要注意モデルは「M1」および「M3」であるので、問題性を評価する式の分母の対象となるモデルは「M1」と「M3」であり、分母の値は「M1」の出現回数と「M3」の出現回数の和で11+9=20である。したがって、問題性を評価する式の値は9/20=0.45となる。
このように、問題箇所評価部248が、問題箇所xの期間sにおける問題性を定量的に評価することによって、定量的な評価に基づいて異常原因を特定することができる。
トラン情報更新処理部249は、詳細分析結果に基づいて分析結果トラン情報格納部234の分析結果トラン情報を更新する処理部である。
詳細分析結果表示部250は、詳細分析結果格納部235に格納された詳細分析結果を出力部220を介して表示する処理部である。図17は、詳細分析結果表示部250が表示する詳細分析結果の一例を示す図である。同図に示すように、詳細分析結果表示部250は、問題箇所を問題性の大きい順に要注意箇所とともに詳細分析結果として表示する。システム運用者は、この詳細分析結果に基づいてシステムの異常原因を効率良く特定することができる。
参照情報記憶部260は、詳細分析用設定処理部241、トラン構成要素間非類似度読込部242、モデル情報読込部243およびトラン情報読込部244によってそれぞれ読み込まれた詳細分析用設定情報、トラン構成要素間非類似度、モデル情報およびトラン情報を記憶する記憶部である。この参照情報記憶部260が記憶する情報は、類似モデル検索部245、要注意モデル抽出部246、要注意モデル内要注意箇所抽出部247によって参照される。
制御部270は、上述した入力部210、出力部220、詳細分析用設定処理部241、トラン構成要素間非類似度読込部242、モデル情報読込部243、トラン情報読込部244、類似モデル検索部245、要注意モデル抽出部246、要注意モデル内要注意箇所抽出部247、問題箇所評価部248、トラン情報更新処理部249、詳細分析結果表示部250を制御してトランザクション詳細分析装置200を一つの装置として機能させる。なお、図10において格納部は磁気ディスク装置内に設けられ、格納部と処理部間の矢印は、処理部から格納部へのアクセスを表す。
次に、本実施例に係るトランザクション詳細分析装置200によるトランザクション詳細分析処理の処理手順について説明する。図18は、本実施例に係るトランザクション詳細分析装置200によるトランザクション詳細分析処理の処理手順を示すフローチャートである。
同図に示すように、このトランザクション詳細分析処理では、詳細分析用設定処理部241が詳細分析用設定情報を読み込んで参照情報記憶部260に書き込み(ステップS201)、モデル情報読込部243がモデル情報を読み込んで参照情報記憶部260に書き込む(ステップS202)。また、トラン構成要素間非類似度読込部242がトラン構成要素間非類似度を読み込んで参照情報記憶部260に書き込む(ステップS203)。
そして、トラン情報読込部244が分析結果トラン情報格納部234から所定期間内でモデルのいずれにも一致しなかったトランザクションt1,・・・,tnの情報を読み込んで参照情報記憶部260に書き込む(ステップS204)。そして、制御部270は、各トランザクションの情報tiに対してステップS205〜ステップS206を行うように制御する。
すなわち、類似モデル検索部245が参照情報記憶部260からtiを読み出し、tiに最も類似するモデルMkを検索して要注意モデルとして詳細分析結果格納部235に書き込む(ステップS205)。そして、要注意モデル内要注意箇所抽出部247がtiとMkとの相違箇所を要注意箇所Pとして抽出し、詳細分析結果格納部235に書き込む(ステップS206)。そして、要注意モデル内要注意箇所抽出部247は、要注意モデルMkで問題が生じている階層・プロトコル・サーバIDなどを要注意箇所Qとして抽出し、詳細分析結果格納部235に書き込む(ステップS207)。
そして、トラン情報読込部244が分析結果トラン情報格納部234から所定期間内で処理時間が正常範囲からはずれたトランザクションt1,・・・,tnの情報を読み込んで参照情報記憶部260に書き込む(ステップS208)。そして、制御部270は、各トランザクションの情報tiに対してステップS209〜ステップS211を行うように制御する。
すなわち、要注意モデル抽出部246がtiが属するモデルすなわちtiと一致したモデルMjを要注意モデルとして詳細分析結果格納部235に書き込む(ステップS209)。そして、要注意モデル内要注意箇所抽出部247がtiの処理時間情報をMjの階層・プロトコル別に集計し(ステップS210)、tiの構成要素の中で処理時間がMjの正常範囲からはずれているものを要注意箇所Rとして抽出し、詳細分析結果格納部235に書き込む(ステップS211)。そして、要注意モデル内要注意箇所抽出部247は、要注意モデルMjで問題が生じている階層・プロトコル・サーバIDなどを要注意箇所Sとして抽出し、詳細分析結果格納部235に書き込む(ステップS212)。
そして、問題箇所評価部248が、要注意箇所P、Q、R、Sのそれぞれを問題箇所として問題性を評価し(ステップS213)、問題性を評価した値の大きい順に問題箇所をソートして問題箇所リストを生成し(ステップS214)、詳細分析結果格納部235に格納する(ステップS215)。そして、詳細分析結果表示部250が要注意箇所および問題箇所リストを表示し(ステップS216)、トラン情報更新処理部249が分析結果トラン情報格納部234を更新する(ステップS217)。
上述してきたように、本実施例では、トランザクション監視装置100のモデル・マッチ率評価部146が、単位時間当たりに観測されたトランザクション数に対して、いずれかのモデルに一致し、かつトランザクション内の各階層での処理時間が正常範囲内であるトランザクションの割合をモデル・マッチ率として評価することとしたので、モデルには一致しても処理に時間がかかる場合を異常として検出することができる。したがって、モデルとのマッチとしてモデルと一致するかだけを判定して処理時間を用いない場合と比較して、より精度良く異常を検出することができる。
また、本実施例では、トランザクション詳細分析装置200の要注意モデル内要注意箇所抽出部247が処理時間が正常範囲からはずれている箇所を要注意箇所として抽出し、問題箇所評価部248が、各要注意箇所に対して問題箇所としての問題性を評価し、詳細分析結果表示部250が問題箇所の評価結果および要注意箇所を表示することとしたので、システムの異常原因の特定を支援することができる。したがって、システム運用者は効率良くシステムの異常原因を特定することができる。
また、本実施例では、要注意モデル内要注意箇所抽出部247が、処理時間が正常範囲からはずれている箇所がDB階層である場合に、データベースを構成するテーブルレベルで要注意箇所を抽出することとしたので、データベースシステムの異常原因分析にとって重要なテーブルレベルでの分析を支援することができる。
なお、本実施例では、トランザクション監視装置およびトランザクション詳細分析装置について説明したが、トランザクション監視装置またはトランザクション詳細分析装置が有する構成をソフトウェアによって実現することで、同様の機能を有するトランザクション監視プログラムまたはトランザクション詳細分析プログラムを得ることができる。そこで、これらのプログラムを実行するコンピュータについて説明する。
図19は、本実施例に係るトランザクション監視プログラムを実行するコンピュータの構成を示す機能ブロック図である。なお、トランザクション詳細分析プログラムも同様の構成を有するコンピュータで実行することができる。同図に示すように、このコンピュータ300は、RAM310と、CPU320と、HDD330と、LANインタフェース340と、入出力インタフェース350と、DVDドライブ360とを有する。
RAM310は、プログラムやプログラムの実行途中結果などを記憶するメモリであり、CPU320は、RAM310からプログラムを読み出して実行する中央処理装置である。HDD330は、プログラムやデータを格納するディスク装置であり、LANインタフェース340は、コンピュータ300をLAN経由で他のコンピュータに接続するためのインタフェースである。入出力インタフェース350は、マウスやキーボードなどの入力装置および表示装置を接続するためのインタフェースであり、DVDドライブ360は、DVDの読み書きを行う装置である。
そして、このコンピュータ300において実行されるトランザクション監視プログラム311は、DVDに記憶され、DVDドライブ360によってDVDから読み出されてコンピュータ300にインストールされる。あるいは、このトランザクション監視プログラム311は、LANインタフェース340を介して接続された他のコンピュータシステムのデータベースなどに記憶され、これらのデータベースから読み出されてコンピュータ300にインストールされる。そして、インストールされたトランザクション監視プログラム311は、HDD330に記憶され、RAM310に読み出されてCPU320によって実行される。
また、本実施例では、トランザクションを監視、分析する場合について説明したが、本発明はこれに限定されるものではなく、トランザクションのような単位処理を処理するコンピュータシステムに同様に適用することができる。
以上のように、本発明に係るシステム監視装置、システム監視方法およびシステム監視プログラムは、コンピュータシステムの監視や障害分析に有用であり、特に、データベースを使用するシステムの監視や障害分析に適している。

Claims (7)

  1. 複数種類の単位処理を実行するシステムを監視するシステム監視プログラムであって、
    システムによって実行された単位処理が前記複数種類の単位処理のそれぞれをモデル化した複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出するモデル・マッチ率算出手順と、
    前記モデル・マッチ率算出手順により算出されたモデル・マッチ率に基づいてシステムが正常であるか否かを判定するシステム状態判定手順と
    をコンピュータに実行させることを特徴とするシステム監視プログラム。
  2. 前記システム状態判定手順によりシステムが正常でないと判定された場合に、前記モデル・マッチ率算出手順により処理時間が正常でないと判定された単位処理に対して単位処理を構成する複数の要素処理の中で異常な要素処理を各要素処理の処理時間に基づいて特定する異常要素処理特定手順
    をさらにコンピュータに実行させることを特徴とする請求項1に記載のシステム監視プログラム。
  3. 前記異常要素処理特定手順により特定された要素処理の異常の原因として注意を要する要注意箇所を各要素箇所の処理時間に基づいて特定する要注意箇所特定手順
    をさらにコンピュータに実行させることを特徴とする請求項2に記載のシステム監視プログラム。
  4. 前記要注意箇所特定手順により複数の要注意箇所が特定された場合に、要注意箇所を有するモデルである要注意モデルと一致するトランザクションの所定期間における出現回数と、要注意箇所を構成要素として有するモデルあるいは要注意モデルと一致するトランザクションの該所定期間における出現回数に基づいて各要注意箇所の問題性を評価して出力する問題性評価手順
    をさらにコンピュータに実行させることを特徴とする請求項3に記載のシステム監視プログラム。
  5. 前記単位処理は業務システムのトランザクション処理であり、前記複数の要素処理はウェブ処理、アプリケーション処理およびデータベース処理であり、データベース処理の要注意箇所にはデータベースを構成するテーブルが含まれることを特徴とする請求項4に記載のシステム監視プログラム。
  6. 複数種類の単位処理を実行するシステムを監視するシステム監視装置によるシステム監視方法であって、
    システムによって実行された単位処理が前記複数種類の単位処理のそれぞれをモデル化した複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出するモデル・マッチ率算出ステップと、
    前記モデル・マッチ率算出ステップにより算出されたモデル・マッチ率に基づいてシステムが正常であるか否かを判定するシステム状態判定ステップと
    を含んだことを特徴とするシステム監視方法。
  7. 複数種類の単位処理を実行するシステムを監視するシステム監視装置であって、
    システムによって実行された単位処理が前記複数種類の単位処理のそれぞれをモデル化した複数の単位処理モデルのいずれかに一致し、かつ、処理時間が正常である割合をモデル・マッチ率として算出するモデル・マッチ率算出手段と、
    前記モデル・マッチ率算出手段により算出されたモデル・マッチ率に基づいてシステムが正常であるか否かを判定するシステム状態判定手段と
    を備えたことを特徴とするシステム監視装置。
JP2009523496A 2007-07-19 2007-07-19 システム監視プログラム、システム監視方法およびシステム監視装置 Expired - Fee Related JP5126229B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2007/064254 WO2009011058A1 (ja) 2007-07-19 2007-07-19 システム監視プログラム、システム監視方法およびシステム監視装置

Publications (2)

Publication Number Publication Date
JPWO2009011058A1 JPWO2009011058A1 (ja) 2010-09-16
JP5126229B2 true JP5126229B2 (ja) 2013-01-23

Family

ID=40259407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009523496A Expired - Fee Related JP5126229B2 (ja) 2007-07-19 2007-07-19 システム監視プログラム、システム監視方法およびシステム監視装置

Country Status (4)

Country Link
US (1) US8448028B2 (ja)
JP (1) JP5126229B2 (ja)
GB (1) GB2465100B (ja)
WO (1) WO2009011058A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048511A (ja) * 2010-08-27 2012-03-08 Toyota Home Kk 省エネアドバイス装置
CN107211300A (zh) * 2015-01-26 2017-09-26 诺基亚通信公司 分析和分类信令集合或呼叫
CN112997200B (zh) * 2018-09-28 2024-02-02 陶氏环球技术有限责任公司 用于编码分类的混合机器学习模型

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082926A (ja) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 分散アプリケーション試験・運用管理システム
JP2006011683A (ja) * 2004-06-24 2006-01-12 Fujitsu Ltd システム分析プログラム、システム分析方法及びシステム分析装置
JP2006092358A (ja) * 2004-09-24 2006-04-06 Fujitsu Ltd トレースデータの採取方法、採取プログラム、およびその採取装置
JP2006146600A (ja) * 2004-11-19 2006-06-08 Ntt Docomo Inc 動作監視サーバ、端末装置及び動作監視システム
JP2006227999A (ja) * 2005-02-18 2006-08-31 Nec Corp ボトルネック検出システム、測定対象サーバ、ボトルネック検出方法およびプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2390447A (en) * 2002-07-02 2004-01-07 Hewlett Packard Co Fault prediction in logical networks
JP2004086435A (ja) * 2002-08-26 2004-03-18 Yaskawa Electric Corp 処理時間異常検出方法
US7743150B1 (en) * 2004-05-19 2010-06-22 Oracle International Corporation Apparatus and method for web service message correlation
JP2006099351A (ja) 2004-09-29 2006-04-13 Arle Homes Akarui Kk 住宅購入費用を10年後に月々2万円にできる住宅購入システム
US7437611B2 (en) * 2004-10-21 2008-10-14 International Business Machines Corporation System and method for problem determination using dependency graphs and run-time behavior models
JP4549231B2 (ja) 2005-05-17 2010-09-22 富士通株式会社 サービス処理状況分析プログラム、サービス処理状況分析方法、およびサービス処理状況分析装置
JP4934998B2 (ja) 2005-06-15 2012-05-23 株式会社豊田自動織機 摺動部材、圧縮機の摺動部材および摺動部材の製造方法
US7673189B2 (en) * 2006-02-06 2010-03-02 International Business Machines Corporation Technique for mapping goal violations to anamolies within a system
JP4585534B2 (ja) * 2007-03-01 2010-11-24 富士通株式会社 システム監視プログラム、システム監視方法およびシステム監視装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082926A (ja) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 分散アプリケーション試験・運用管理システム
JP2006011683A (ja) * 2004-06-24 2006-01-12 Fujitsu Ltd システム分析プログラム、システム分析方法及びシステム分析装置
JP2006092358A (ja) * 2004-09-24 2006-04-06 Fujitsu Ltd トレースデータの採取方法、採取プログラム、およびその採取装置
JP2006146600A (ja) * 2004-11-19 2006-06-08 Ntt Docomo Inc 動作監視サーバ、端末装置及び動作監視システム
JP2006227999A (ja) * 2005-02-18 2006-08-31 Nec Corp ボトルネック検出システム、測定対象サーバ、ボトルネック検出方法およびプログラム

Also Published As

Publication number Publication date
WO2009011058A1 (ja) 2009-01-22
GB201000823D0 (en) 2010-03-03
US20100192022A1 (en) 2010-07-29
GB2465100B (en) 2012-01-04
US8448028B2 (en) 2013-05-21
JPWO2009011058A1 (ja) 2010-09-16
GB2465100A (en) 2010-05-12

Similar Documents

Publication Publication Date Title
JP6669156B2 (ja) アプリケーション自動制御システム、アプリケーション自動制御方法およびプログラム
JP6327234B2 (ja) イベント解析装置、イベント解析システム、イベント解析方法、およびイベント解析プログラム
US9298538B2 (en) Methods and systems for abnormality analysis of streamed log data
JP6319271B2 (ja) イベント解析装置、イベント解析システム、イベント解析方法、およびイベント解析プログラム
JP5715261B2 (ja) 時系列データ管理システム,および方法
JP4585534B2 (ja) システム監視プログラム、システム監視方法およびシステム監視装置
US20150121136A1 (en) System and method for automatically managing fault events of data center
JP6420524B2 (ja) 分析用サーバ装置、データ解析システム、及びデータ解析方法
US20160253229A1 (en) Event log analysis
JP5126229B2 (ja) システム監視プログラム、システム監視方法およびシステム監視装置
US8954468B2 (en) Extracting a meaningful frequent itemset
CN115905990A (zh) 一种基于密度聚集算法的变压器油温异常监测方法
WO2020062186A1 (en) Industrial device matching method and apparatus
JP5668425B2 (ja) 障害検知装置、情報処理方法、およびプログラム
CN112256830B (zh) 一种设备排查信息获取方法、装置和设备故障排查系统
JP7359601B2 (ja) データ抽出装置、データ抽出方法、およびデータ抽出プログラム
WO2016163008A1 (ja) 異常診断装置および異常診断方法
JP5444071B2 (ja) 障害情報収集システムと方法およびプログラム
JP7239519B2 (ja) 機械学習モデル運用管理システムおよび運用管理方法
Ravi et al. Unsupervised time series data analysis for error pattern extraction for predictive maintenance
JP4908237B2 (ja) 開発プログラム部品決定システム、クライアント装置、開発プログラム部品決定装置、開発プログラム部品決定方法および開発プログラム部品決定プログラム
JP2001312419A (ja) ソフトウェア重複度評価装置およびソフトウェア重複度評価プログラムを記録した記録媒体
CN115641068A (zh) 基于产品研发的全生命周期管理系统及跟踪方法
JP2023141268A (ja) プロセスモデル作成システムおよび方法
CN115934706A (zh) 数据库语句的处理方法及装置、存储介质、电子设备

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121002

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121015

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151109

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees