JP2005284357A - ログ解析プログラム及びログ解析装置 - Google Patents

ログ解析プログラム及びログ解析装置 Download PDF

Info

Publication number
JP2005284357A
JP2005284357A JP2004093080A JP2004093080A JP2005284357A JP 2005284357 A JP2005284357 A JP 2005284357A JP 2004093080 A JP2004093080 A JP 2004093080A JP 2004093080 A JP2004093080 A JP 2004093080A JP 2005284357 A JP2005284357 A JP 2005284357A
Authority
JP
Japan
Prior art keywords
failure
history information
log analysis
procedure
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004093080A
Other languages
English (en)
Inventor
Hiroshi Wakao
浩 若尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004093080A priority Critical patent/JP2005284357A/ja
Publication of JP2005284357A publication Critical patent/JP2005284357A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】 障害の修復に係る適切な情報を速やかにシステムの管理者等に提供することを目的とする。
【解決手段】 汎用コンピュータがコンソールに表示するメッセージのログを解析するログ解析プログラムであって、メッセージに応じて、障害に係る履歴情報を抽出する抽出手順S12と、抽出された障害履歴情報の数と、該抽出された障害履歴情報の内、障害の原因別のカテゴリ毎に分類された障害履歴情報の数と、の割合を算出する算出手順S15と、割合及び障害の重要度に応じて、障害に係る情報の優先度を決定する決定手順S16と、決定手順によって優先度が決定された障害に係る情報を出力する出力手順S17と、をコンピュータに実行させることによって上記課題を解決する。
【選択図】 図11

Description

本発明は、ログ解析プログラム及びログ解析装置に関する。
現在でも企業のシステム等において汎用機が使われている。このような汎用機では、重度の障害が発生する前に多くの軽度のエラーメッセージをコンソール等に出力していることが多い。
しかしながら、コンソール等に表示されるエラーメッセージは、コマンドラインインターフェースでの最低限の情報であって、該エラーメッセージから障害の原因を推測し、障害に対処するにはシステムの管理者等の長年の経験と勘とが必要であった。
一方、システムの管理者は、コンソール等に表示されたエラーメッセージから障害を推測し、障害に対処すると、障害が発生したときのエラーメッセージや、実際の障害の内容、原因、それに対する対処などの情報を、履歴情報として記録していた。
このような履歴情報を元に、エラーメッセージを受け取った際に、障害の場所や原因等を推測し、管理者に通知するシステムが考えられる。
特開2001−331350号公報
しかしながら、軽微なエラーメッセージの場合、多くの種類の重度の障害の際に検出された履歴を持つことが多く、多数の障害の場所や原因の可能性をシステムより通知されても、管理者等は対処しきれない問題があった。
本発明は、上記の点に鑑みなされたもので、障害の修復に係る適切な情報を速やかにシステムの管理者等に提供することを目的とする。
そこで、上記問題を解決するため、本発明は、汎用コンピュータがコンソールに表示するメッセージのログを解析するログ解析プログラムであって、メッセージに応じて、障害に係る履歴情報を抽出する抽出手順と、前記抽出された障害履歴情報の数と、該抽出された障害履歴情報の内、障害の原因別のカテゴリ毎に分類された障害履歴情報の数と、の割合を算出する算出手順と、前記割合及び障害の重要度に応じて、障害に係る情報の優先度を決定する決定手順と、前記決定手順によって優先度が決定された障害に係る情報を出力する出力手順と、をコンピュータに実行させることを特徴とする。
本発明によれば、障害の修復に係る適切な情報を速やかにシステムの管理者等に提供することができる。
また、上記課題を解決するための手段として、ログ解析装置としてもよい。
本発明によれば、障害の修復に係る適切な情報を速やかにシステムの管理者等に提供することができる。
以下、本発明の実施の形態について図面に基づいて説明する。図1は、システム構成の一例を示す図である。図1に示されるように本システムは、汎用コンピュータ3と、少なくとも1つ以上のコンソール2と、ログ解析サーバ1と、管理端末4と、がネットワークを介して接続されている。
汎用コンピュータ3は、一般にメインフレーム等と呼ばれるものであり、例えば銀行のオンラインシステム等、企業の基幹業務システム等に用いられる大型コンピュータである。コンソール2は、汎用コンピュータ3の制御や管理に用いられる端末である。ログ解析サーバ1は、汎用コンピュータ3がコンソール2に表示するメッセージのログ等を解析する解析サーバである。
ログ解析サーバ1は、例えばログを解析した結果、エラーメッセージが含まれていた場合は、障害の履歴情報等を参照し、対応するエラーメッセージを出していた障害履歴情報を抽出し、抽出した障害履歴情報の数と、障害の原因別のカテゴリ毎に分類された障害履歴情報の数と、の割合を求め、該割合及び障害の重要度等に応じて出力する障害に係る情報の優先度を決定し、管理端末4に送信する。
管理端末4は、システムの管理者用の端末であって、ログ解析サーバ1が送信してきた障害に係る情報を優先度に応じて表示して、システムの管理者等に障害の修復に係る適切な情報を提供する。
以下、ログ解析サーバ1の一例のハードウェア構成を図2に示す。図2は、ログ解析サーバの一例のハードウェア構成図である。
図2に示されるログ解析サーバ1のハードウェア構成は、それぞれバスで相互に接続されているドライブ装置13と、ROM(Read Only Memory)15と、RAM(Random Access Memory)16と、CPU(Central Processing Unit)17と、インターフェース装置18と、HDD(Hard Disk Drive)19と、から構成されている。
インターフェース装置18は、ログ解析サーバ1をネットワーク等に接続するインターフェースである。
ログ解析サーバ1のプログラムは、例えば、CD−ROM等の記録媒体14によってログ解析サーバ1に提供されるか、ネットワークを通じてダウンロードされる。記録媒体14は、ドライブ装置13にセットされ、プログラムが記録媒体14からドライブ装置13を介してHDD19にインストールされる。
ROM15は、データ等を格納する。RAM16は、ログ解析サーバ1の起動時にHDD19からプログラム等を読み出して格納する。CPU17は、RAM16に読み出され格納されたプログラム等に従って処理を実行する。
以下、管理端末4の一例のハードウェア構成を図3に示す。図3は、管理端末の一例のハードウェア構成図である。
図3に示される管理端末4のハードウェア構成は、それぞれバスで相互に接続されている入力装置21と、表示装置22と、ドライブ装置23と、ROM25と、RAM26と、CPU27と、インターフェース装置28と、HDD29と、から構成されている。
入力装置21は、管理端末4の利用者が操作するキーボード及びマウス等で構成され、管理端末4に各種操作信号を入力するのに用いられる。表示装置22は、管理端末4の利用者が利用するディスプレイ等で構成され、各種情報を表示する。インターフェース装置28は、管理端末4をネットワーク等に接続するインターフェースである。
管理端末4のプログラムは、例えば、CD−ROM等の記録媒体24によって管理端末4に提供されるか、ネットワークを通じてダウンロードされる。記録媒体24は、ドライブ装置23にセットされ、プログラムが記録媒体24からドライブ装置23を介してHDD29にインストールされる。
ROM25は、データ等を格納する。RAM26は、管理端末4の起動時にHDD29からプログラム等を読み出して格納する。CPU27は、RAM26に読み出され格納されたプログラム等に従って処理を実行する。
以下、ログ解析サーバ1の一例の機能構成を図4に示す。図4は、ログ解析サーバの一例の機能構成図である。
図4に示されるように、ログ解析サーバ1は、ログ監視部31と、メッセージ集検索・抽出部32と、障害履歴情報検索・抽出部33と、原因別カテゴリ集計部34と、発生確率算出部35と、優先度決定部36と、通知部37と、メッセージ集格納部38と、障害履歴情報格納部39と、原因別カテゴリ集計データ格納部40と、発生確率格納部41と、を含む。
ログ監視部31は、汎用コンピュータがコンソールに表示するメッセージのログを監視する監視部である。
メッセージ集検索・抽出部32は、エラーを識別するエラーコードをキーに、メッセージ集格納部38に格納されているメッセージ(又はメッセージ集)を検索し、対応するメッセージ(又はメッセージ集)を抽出する、検索、抽出部である。
障害履歴情報検索・抽出部33は、エラーコードをキーに、障害履歴情報格納部39に格納されている障害履歴情報を検索し、対応する障害履歴情報を抽出する、検索、抽出部である。
原因別カテゴリ集計部34は、障害履歴情報検索・抽出部33において抽出された障害履歴情報を、原因別のカテゴリ毎に分類し、集計(和)する集計部である。また、原因別カテゴリ集計部34は、集計したデータを原因別カテゴリ集計データ格納部40に格納する。
発生確率算出部35は、障害履歴情報検索・抽出部33において抽出された障害履歴情報の数と、該抽出された障害履歴情報の内、原因別カテゴリ集計部34において障害の原因別のカテゴリ毎に分類された障害履歴情報の数と、の割合(発生確率)を算出する算出部である。また、発生確率算出部35は、算出した発生確率を、発生確率格納部41に格納する。
優先度決定部36は、発生確率算出部35において算出された発生確率と、障害の重要度(影響度)と、に応じて、出力する障害に係る情報の優先度を決定する決定部である。
通知部37は、優先度決定部36において決定された優先度に応じて、障害に係る情報を管理端末4に通知する通知部である。
メッセージ集格納部38は、メッセージ等を格納する格納部である。なお、メッセージ集格納部38に格納されているメッセージ等の一例を、後述する図5に示す。
障害履歴情報格納部39は、障害履歴情報等を格納する格納部である。なお、障害履歴情報格納部39に格納されている障害履歴情報等の一例を、後述する図6に示す。
原因別カテゴリ集計データ格納部40は、原因別カテゴリに集計されたデータ等を格納する格納部である。なお、原因別カテゴリ集計データ格納部40に格納されている原因別カテゴリに集計されたデータ等の一例を、後述する図7に示す。
発生確率格納部41は、発生確率等を格納する格納部である。なお、発生確率格納部41に格納された発生確率等の一例を、後述する図8に示す。
以下、メッセージ集格納部38のメッセージ集テーブル60の一例を図5に示す。図5は、メッセージ集テーブルの一例を示す図である。
図5に示されるように、メッセージ集テーブル60は、エラーコードと、エラー内容と、原因と、処置と、備考と、を項目として含む。
エラーコードには、エラーを識別する識別子が格納される。エラー内容には、エラー内容が格納される。原因には、エラーの原因が格納される。処置には、エラーに対応する処置が格納される。備考には、エラーに対応する備考が格納される。
以下、障害履歴情報格納部39の障害履歴テーブル61の一例を、図6に示す。図6は、障害履歴テーブルの一例を示す図である。
図6に示されるように、障害履歴テーブル61は、エラーコードと、原因別カテゴリと、影響度と、障害発生日と、障害箇所と、障害内容と、原因と、対処と、対応者と、完了日と、を項目として含む。
エラーコードには、エラーを識別する識別子が格納される。原因別カテゴリには、障害の原因別のカテゴリが格納される。影響度には、障害の影響度が格納される。障害発生日には、障害の発生日が格納される。障害箇所には、障害が発生した箇所が格納される。障害内容には、障害の内容が格納される。原因には、障害の原因が格納される。対処には、障害に対処した記録が格納される。対応者には、障害に対応した対応者が格納される。完了日には、障害を復旧した日付が格納される。
以下、原因別カテゴリ集計データ格納部40の原因別カテゴリ集計テーブル62の一例を、図7に示す。図7は、原因別カテゴリ集計テーブルの一例を示す図である。
図7に示されるように、原因別カテゴリ集計テーブル62は、エラーコードと、原因別カテゴリと、影響度と、カテゴリ別集計と、総件数と、を項目として含む。
エラーコードには、エラーを識別する識別子が格納される。原因別カテゴリには、障害の原因別のカテゴリが格納される。影響度には、障害の影響度が格納される。カテゴリ別集計には、原因別カテゴリ集計部34において障害の原因別のカテゴリ毎に分類された障害履歴情報の数が格納される。総件数には、障害履歴情報検索・抽出部33において抽出された障害履歴情報の総件数が格納される。
以下、発生確率格納部41の発生確率テーブル63の一例を、図8に示す。図8は、発生確率テーブルの一例を示す図である。
図8に示されるように、発生確率テーブル63は、エラーコードと、原因別カテゴリと、影響度と、発生確率と、を項目として含む。
エラーコードには、エラーを識別する識別子が格納される。原因別カテゴリには、障害の原因別のカテゴリが格納される。影響度には、障害の影響度が格納される。発生確率には、発生確率算出部35において算出された発生確率が格納される。
以下、管理端末4の一例の機能構成を図9に示す。図9は、管理端末の一例の機能構成図である。
図9に示されるように、管理端末4は、受信部50と、データ格納部51と、画面表示部53と、表示制御部54と、を含む。受信部50は、ログ解析サーバ1から送信された障害に係る情報等を受信する受信部である。データ格納部51は、受信部50において受信した障害に係る情報等を格納する格納部である。画面表示部53は、受信部50において受信し、データ格納部51等において格納されている障害に係る情報を、優先度に応じてディスプレイ等に表示する表示部である。表示制御部54は、表示に係る制御を行う制御部である。
以下、コンソール2に表示されるメッセージの一例を、図10に示す。図10は、コンソールに表示されるメッセージの一例を示す図である。
図10に示されるメッセージ(XFA0001E*CONSOLE(nnnn,dddd,cccc,ssss) IS DOWN)は、コンソール2に入出力エラーが発生したことを表している。なお、コンソール2で入出力エラーが発生すると、対応するコンソールに出力されるべき図10に示されるメッセージは、システムに接続されている他のコンソール2に表示される。
ここで、パラメータのnnnnには、入出力エラーが発生したコンソールの番号が表示され、パラメータのddddには、入出力エラーが発生したコンソールの装置名が表示され、パラメータのccccには、入出力エラーが発生したコンソールのCSWが16進数で表示され、パラメータのssssには、入出力エラーが発生したコンソールのセンス情報が16進数で表示される。
以下、図10に示されるようなコンソール2に表示されるメッセージのログの解析処理の一例を、図11に示す。図11は、ログ解析処理の一例のフローチャートである。
ステップS10においてログ解析サーバ1のログ監視部31は、汎用コンピュータがコンソールに表示するメッセージのログを監視し、エラーメッセージを含む異常ログがあるか否かを判定する。
ログ解析サーバ1のログ監視部31は、エラーメッセージを含む異常ログがあると判定すると(ステップS10においてYES)、ステップS11に進み、エラーメッセージを含む異常ログが存在しないと判定すると(ステップS10においてNO)、ステップS10の処理を繰り返す。
ステップS11では、ログ解析サーバ1のメッセージ集検索・抽出部32が、エラーコードをキーに、メッセージ集の検索を行い、エラーコードに対応するメッセージの抽出を行う。
ステップS11に続いてステップS12に進み、ログ解析サーバ1の障害履歴情報検索・抽出部33は、エラーコードをキーに、障害履歴情報の検索を行い、エラーコードに対応する障害履歴情報が存在する場合、該障害履歴情報の抽出を行う。
ステップS12に続いてステップS13に進み、ログ解析サーバ1の障害履歴情報検索・抽出部33は、ステップS12において、エラーコードに対応する障害履歴情報を検索した結果、エラーコードに対応する障害履歴情報が存在したか否かを判定する。
ログ解析サーバ1の障害履歴情報検索・抽出部33は、エラーコードに対応する障害履歴情報が存在したと判定すると(ステップS13においてYES)、ステップS14に進み、エラーコードに対応する障害履歴情報が存在しなかったと判定すると(ステップS13においてNO)、ステップS17に進む。
ステップS14では、ログ解析サーバ1の原因別カテゴリ集計部35が、抽出した障害履歴情報を、原因別のカテゴリに分類し、原因別のカテゴリ毎に和をとって集計し、該集計結果を原因別カテゴリ集計テーブル62に格納する。
ステップS14に続いてステップS15に進み、ログ解析サーバ1の発生確率算出部35は、ステップS12において抽出した障害履歴情報の総数と、該障害履歴情報の総数の内、ステップS14において集計した原因別のカテゴリ毎の障害履歴情報の和と、の割合(発生確率)を算出し、該発生確率を発生確率テーブル63に格納する。
ステップS15に続いてステップS16に進み、ログ解析サーバ1の優先度決定部36は、ステップS15において算出された発生確率と、障害の重要度と、に応じて、出力する障害に係る情報の優先度を決定する。なお、ここで、障害に係る情報とは、具体的には例えば、ステップS11において抽出したメッセージや、ステップS12において抽出した障害履歴情報、ステップS14において集計した原因別のカテゴリ毎の障害履歴情報の和、ステップS15において算出した発生確率等の情報である。
ステップS16に続いてステップS17に進み、ログ解析サーバ1の通知部37は、ステップS16において決定した優先度に応じて、障害に係る情報を管理端末4に通知する。なお、管理端末4への通知は、障害に係る情報と、該障害に係る情報の優先度と、を含むデータを管理端末4に送信してもよいし、障害に係る情報の優先度に応じて、例えば障害に係る情報の順番を決めて、該順番に基づいて並べられた障害に係る情報を管理端末4に送信してもよい。なお、以下では説明の簡略化のため、ログ解析サーバ1から管理端末4へは、障害に係る情報と、該障害に係る情報の優先度と、を含むデータが送信されるものとして説明を行う。
また、ログ解析サーバ1から、管理端末4への障害に係る情報と、該障害に係る情報の優先度と、を含むデータの送信は、ログ解析サーバ1と、管理端末4と、の間で直接行うようにしてもよいし、メール等を用いてログ解析サーバ1から、管理端末4へ送信するようにしてもよい。なお、以下では説明の簡略化のため、ログ解析サーバ1から、管理端末4への障害に係る情報と、該障害に係る情報の優先度と、を含むデータの送信は、ログ解析サーバ1と、管理端末4と、の間で直接行うものとして説明する。
図11に示されるような処理を行うことによって、ログ解析サーバ1は、優先度に応じて、障害に係る情報を、管理端末4に送信することができる。
以下、ログ解析サーバ1より送信されてきた障害に係る情報を、管理端末4において表示する表示処理の一例を、図12を用いて説明する。図12は、障害情報表示処理の一例のフローチャートである。
ステップS20において、管理端末4の受信部50は、ログ解析サーバ1より、障害に係る情報と、該障害に係る情報の優先度と、を含むデータを受信する。
ステップS20に続いてステップS21に進み、例えば管理端末4は、ステップS20において受信したデータを、管理端末4のデータ格納部51に格納する。
ステップS21に続いてステップS22に進み、管理端末4の画面作成部52は、データ格納部51に格納されている障害に係る情報及び障害に係る情報の優先度に基づいて、後述する図13(A)に示されるような画面を作成する。
ステップS22に続いてステップS23に進み、管理端末4の画面表示部53は、ステップS22において作成した画面を表示する。
ステップS23に続いてステップS24に進み、管理端末4の表示制御部54は、管理端末4のユーザ(システムの管理者)等によって、障害に係る情報の詳細情報の表示を要求されているか否かを判定する。
管理端末4の表示制御部54は、管理端末4のユーザ等によって、障害に係る情報の詳細情報の表示を要求されていると判定すると(ステップS24においてYES)、ステップS25に進み、障害に係る情報の詳細情報の表示を要求されていないと判定すると(ステップS24においてNO)、処理を終了する。
例えば管理端末4の表示制御部54は、管理端末4のユーザ(システムの管理者)等によって、後述する図13(A)の画面のカテゴリ別表示エリア73のカテゴリの一つがクリックされた旨の情報を受け取ると、障害に係る情報の詳細情報の表示を要求されていると判定する。
ステップS25では、管理端末4の画面作成部52が、管理端末4の表示制御部54からの要求に応じて、データ格納部51に格納されている障害に係る情報を用いて、後述する図13(B)に示されるような画面を作成する。
ステップS25に続いてステップS26に進み、管理端末4の画面表示部53は、ステップS25において作成した画面を表示する。
図12に示されるような処理を行うことによって、管理端末4は、後述する図13に示されるように、コンソール2に表示されているエラーメッセージによって、過去どのような障害が発生していたか等の情報を、優先度の高い順に画面に表示してユーザに提供することができる。
一方、システムの管理者は、後述する図13に示されるような画面を参照することによって、コンソール2に表示されているエラーメッセージによって、過去にどのような障害が発生していたか等の情報を、優先度の高い順に取得して、例えば、重大な障害を未然に防いだり、既に障害が発生した場合であっても適切な復旧処理を行ったりすることができる。
以下、管理端末4に表示される画面の一例を、図13に示す。図13は、管理端末に表示される画面の一例を示す図である。
図13(A)に示される画面は、エラーコード表示エリア70と、障害発生日表示エリア71と、過去の事例ヒット件数表示エリア72と、カテゴリ別表示エリア73と、メッセージ表示エリア74と、を含む。
エラーコード表示エリア70には、エラーを識別するエラーコードが表示される。障害発生日表示エリア71には、障害が発生した発生日が表示される。過去の事例ヒット総件数には、図11のステップS12において抽出された障害履歴情報の総件数が表示される。カテゴリ別表示エリア73には、図11のステップS14において分類されたカテゴリと、影響度と、図11のステップS15において算出された発生確率とが、優先度の高い順に、表示されている。メッセージ表示エリア74には、エラーに対するメッセージが表示されている。
また、図13(B)に示される画面は、エラーコード表示エリア80と、障害発生日表示エリア81と、カテゴリ名表示エリア82と、過去の事例件数表示エリア83と、詳細情報表示エリア84と、を含む。
エラーコード表示エリア80には、エラーを識別するエラーコードが表示される。障害発生日表示エリア81には、障害が発生した発生日が表示される。カテゴリ名表示エリア82には、図13(A)において管理端末4のユーザ等において選択されたカテゴリの名前が表示される。また、過去の事例件数表示エリア83には、図11のステップS14において集計された各カテゴリ毎の障害履歴情報の件数が表示される。詳細情報表示エリア84には、図13(A)において管理端末4のユーザ等において選択されたカテゴリに含まれる障害の詳細情報が表示される。なお、障害の詳細情報としては、例えば障害発生日、障害箇所、内容、原因、対処、影響度等、障害履歴情報に含まれる情報が表示される。
なお、本発明は、以下に記載する付記のような構成が考えられる。
(付記1)
汎用コンピュータがコンソールに表示するメッセージのログを解析するログ解析プログラムであって、
メッセージに応じて、障害に係る履歴情報を抽出する抽出手順と、
前記抽出された障害履歴情報の数と、該抽出された障害履歴情報の内、障害の原因別のカテゴリ毎に分類された障害履歴情報の数と、の割合を算出する算出手順と、
前記割合及び障害の重要度に応じて、障害に係る情報の優先度を決定する決定手順と、
前記決定手順によって優先度が決定された障害に係る情報を出力する出力手順と、
をコンピュータに実行させることを特徴とするログ解析プログラム。
(付記2)
前記抽出手順は、メッセージに応じて、障害に係る履歴情報を格納する障害履歴情報格納手段より、障害に係る履歴情報を抽出することを特徴とする付記1記載のログ解析プログラム。
(付記3)
前記抽出手順において抽出された障害履歴情報を障害の原因別に分類し、集計する分類・集計手順を更に有することを特徴とする付記1又は2記載のログ解析プログラム。
(付記4)
前記出力手順は、前記決定手順によって優先度が決定された障害に係る情報を、前記コンピュータとネットワークを介して接続された管理端末に送信することを特徴とする付記1乃至3何れか一項記載のログ解析プログラム。
(付記5)
付記1乃至4何れか一項記載のログ解析プログラムを記録したコンピュータ読み取り可能な記録媒体。
(付記6)
汎用コンピュータがコンソールに表示するメッセージのログを解析するログ解析装置であって、
メッセージに応じて、障害に係る履歴情報を抽出する抽出手段と、
前記抽出された障害履歴情報の数と、該抽出された障害履歴情報の内、障害の原因別のカテゴリ毎に分類された障害履歴情報の数と、の割合を算出する算出手段と、
前記割合及び障害の重要度に応じて、障害に係る情報の優先度を決定する決定手段と、
前記決定手段によって優先度が決定された障害に係る情報を出力する出力手段と、
を有することを特徴とするログ解析装置。
(付記7)
障害に係る履歴情報を格納する障害履歴情報格納手段を更に有することを特徴とする付記6記載のログ解析装置。
(付記8)
前記抽出手段は、メッセージに応じて、前記障害履歴情報格納手段より、障害に係る履歴情報を抽出することを特徴とする付記7記載のログ解析装置。
(付記9)
前記抽出手段において抽出された障害履歴情報を障害の原因別に分類し、集計する分類・集計手段を更に有することを特徴とする付記6乃至8何れか一項記載のログ解析装置。
(付記10)
汎用コンピュータがコンソールに表示するメッセージのログを解析するログ解析装置より送信された、優先度が決定された障害に係る情報を受信する受信手順と、
前記優先度に基づいて、障害に係る情報を含む画面を作成する画面作成手順と、
前記画面作成手順において作成された画面を表示する画面表示手順と、
をコンピュータに実行させることを特徴とする管理端末プログラム。
(付記11)
付記10記載の管理端末プログラムを記録したコンピュータ読み取り可能な記録媒体。
(付記12)
汎用コンピュータがコンソールに表示するメッセージのログを解析するログ解析装置とネットワークを介して接続された管理端末であって、
前記ログ解析装置より送信された、優先度が決定された障害に係る情報を受信する受信手段と、
前記優先度に基づいて、障害に係る情報を含む画面を作成する画面作成手段と、
前記画面作成手段において作成された画面を表示する画面表示手段と、
を有することを特徴とする管理端末。
以上、本発明の好ましい実施例について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲又は付記に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
システム構成の一例を示す図である。 ログ解析サーバの一例のハードウェア構成図である。 管理端末の一例のハードウェア構成図である。 ログ解析サーバの一例の機能構成図である。 メッセージ集テーブルの一例を示す図である。 障害履歴テーブルの一例を示す図である。 原因別カテゴリ集計テーブルの一例を示す図である。 発生確率テーブルの一例を示す図である。 管理端末の一例の機能構成図である。 コンソールに表示されるメッセージの一例を示す図である。 ログ解析処理の一例のフローチャートである。 障害情報表示処理の一例のフローチャートである。 管理端末に表示される画面の一例を示す図である。
符号の説明
1 ログ解析サーバ
2 コンソール
3 汎用コンピュータ
4 管理端末
13 ドライブ装置
14 記録媒体
15 ROM
16 RAM
17 CPU
18 インターフェース装置
19 HDD
21 入力装置
22 表示装置
23 ドライブ装置
24 記録媒体
25 ROM
26 RAM
27 CPU
28 インターフェース装置
29 HDD

Claims (5)

  1. 汎用コンピュータがコンソールに表示するメッセージのログを解析するログ解析プログラムであって、
    メッセージに応じて、障害に係る履歴情報を抽出する抽出手順と、
    前記抽出された障害履歴情報の数と、該抽出された障害履歴情報の内、障害の原因別のカテゴリ毎に分類された障害履歴情報の数と、の割合を算出する算出手順と、
    前記割合及び障害の重要度に応じて、障害に係る情報の優先度を決定する決定手順と、
    前記決定手順によって優先度が決定された障害に係る情報を出力する出力手順と、
    をコンピュータに実行させることを特徴とするログ解析プログラム。
  2. 前記抽出手順は、メッセージに応じて、障害に係る履歴情報を格納する障害履歴情報格納手段より、障害に係る履歴情報を抽出することを特徴とする請求項1記載のログ解析プログラム。
  3. 前記抽出手順において抽出された障害履歴情報を障害の原因別に分類し、集計する分類・集計手順を更に有することを特徴とする請求項1又は2記載のログ解析プログラム。
  4. 前記出力手順は、前記決定手順によって優先度が決定された障害に係る情報を、前記コンピュータとネットワークを介して接続された管理端末に送信することを特徴とする請求項1乃至3何れか一項記載のログ解析プログラム。
  5. 汎用コンピュータがコンソールに表示するメッセージのログを解析するログ解析装置であって、
    メッセージに応じて、障害に係る履歴情報を抽出する抽出手段と、
    前記抽出された障害履歴情報の数と、該抽出された障害履歴情報の内、障害の原因別のカテゴリ毎に分類された障害履歴情報の数と、の割合を算出する算出手段と、
    前記割合及び障害の重要度に応じて、障害に係る情報の優先度を決定する決定手段と、
    前記決定手段によって優先度が決定された障害に係る情報を出力する出力手段と、
    を有することを特徴とするログ解析装置。
JP2004093080A 2004-03-26 2004-03-26 ログ解析プログラム及びログ解析装置 Pending JP2005284357A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004093080A JP2005284357A (ja) 2004-03-26 2004-03-26 ログ解析プログラム及びログ解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004093080A JP2005284357A (ja) 2004-03-26 2004-03-26 ログ解析プログラム及びログ解析装置

Publications (1)

Publication Number Publication Date
JP2005284357A true JP2005284357A (ja) 2005-10-13

Family

ID=35182713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004093080A Pending JP2005284357A (ja) 2004-03-26 2004-03-26 ログ解析プログラム及びログ解析装置

Country Status (1)

Country Link
JP (1) JP2005284357A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007099578A1 (ja) * 2006-02-27 2007-09-07 Fujitsu Limited 故障解析装置
JP2007293393A (ja) * 2006-04-20 2007-11-08 Toshiba Corp 障害監視システムと方法、およびプログラム
JP2008090504A (ja) * 2006-09-29 2008-04-17 Oki Electric Ind Co Ltd コンピュータ保守支援システム及び解析サーバ
WO2017094263A1 (ja) * 2015-12-04 2017-06-08 日本電気株式会社 ログ分析システム、方法およびプログラム
JP2017142549A (ja) * 2016-02-08 2017-08-17 ブレインズコンサルティング株式会社 障害対応支援装置、障害対応支援プログラム及び記憶媒体
US20220365841A1 (en) * 2020-03-19 2022-11-17 Hitachi, Ltd. Repair support system and repair support method

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007099578A1 (ja) * 2006-02-27 2007-09-07 Fujitsu Limited 故障解析装置
JPWO2007099578A1 (ja) * 2006-02-27 2009-07-16 富士通株式会社 故障解析装置
JP4523659B2 (ja) * 2006-02-27 2010-08-11 富士通株式会社 故障解析装置
US8166337B2 (en) 2006-02-27 2012-04-24 Fujitsu Limited Failure analysis apparatus
JP2007293393A (ja) * 2006-04-20 2007-11-08 Toshiba Corp 障害監視システムと方法、およびプログラム
JP2008090504A (ja) * 2006-09-29 2008-04-17 Oki Electric Ind Co Ltd コンピュータ保守支援システム及び解析サーバ
WO2017094263A1 (ja) * 2015-12-04 2017-06-08 日本電気株式会社 ログ分析システム、方法およびプログラム
JPWO2017094263A1 (ja) * 2015-12-04 2018-09-20 日本電気株式会社 ログ分析システム、方法およびプログラム
JP2017142549A (ja) * 2016-02-08 2017-08-17 ブレインズコンサルティング株式会社 障害対応支援装置、障害対応支援プログラム及び記憶媒体
US20220365841A1 (en) * 2020-03-19 2022-11-17 Hitachi, Ltd. Repair support system and repair support method

Similar Documents

Publication Publication Date Title
US11657309B2 (en) Behavior analysis and visualization for a computer infrastructure
US10489711B1 (en) Method and apparatus for predictive behavioral analytics for IT operations
US11010223B2 (en) Method and system of automatic event and error correlation from log data
US7509539B1 (en) Method for determining correlation of synchronized event logs corresponding to abnormal program termination
US7912947B2 (en) Monitoring asynchronous transactions within service oriented architecture
US9917741B2 (en) Method and system for processing network activity data
Zheng et al. Co-analysis of RAS log and job log on Blue Gene/P
US6418469B1 (en) Managing conditions in a network
US20110314138A1 (en) Method and apparatus for cause analysis configuration change
US20140082423A1 (en) Method and apparatus for cause analysis involving configuration changes
US20100064179A1 (en) Call-stack pattern matching for problem resolution within software
US9130850B2 (en) Monitoring system and monitoring program with detection probability judgment for condition event
CN113328872A (zh) 故障修复方法、装置和存储介质
US20070143338A1 (en) Method and system for automatically building intelligent reasoning models based on Bayesian networks using relational databases
CA2453127A1 (en) Method and system for correlating and determining root causes of system and enterprise events
CN100549975C (zh) 计算机维护帮助系统及分析服务器
CN112380089A (zh) 一种数据中心监控预警方法及系统
US10896073B1 (en) Actionability metric generation for events
JP2007148728A (ja) ポリシ制御方法、装置及びプログラム
US20080215601A1 (en) System monitoring program, system monitoring method, and system monitoring apparatus
US9811437B1 (en) Systems and methods for monitoring and acting on logged system messages
US9448998B1 (en) Systems and methods for monitoring multiple heterogeneous software applications
JP2011113122A (ja) 障害影響分析装置及び業務システム及び障害影響分析方法
US7752303B2 (en) Data reporting using distribution estimation
CN102857387A (zh) 在线网站监控系统及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090804

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091002

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091104