JP4271612B2 - 障害検出システム及び方法 - Google Patents
障害検出システム及び方法 Download PDFInfo
- Publication number
- JP4271612B2 JP4271612B2 JP2004106237A JP2004106237A JP4271612B2 JP 4271612 B2 JP4271612 B2 JP 4271612B2 JP 2004106237 A JP2004106237 A JP 2004106237A JP 2004106237 A JP2004106237 A JP 2004106237A JP 4271612 B2 JP4271612 B2 JP 4271612B2
- Authority
- JP
- Japan
- Prior art keywords
- ticket
- application
- user terminal
- failure
- log
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
・前記ユーザ端末と前記コンピュータ端末とに接続され、前記ユーザ端末からいずれかのアプリケーションへのリクエストに応じて前記ユーザ端末を識別するユーザ識別子が記述されたチケットを発行するチケット発行手段、
・前記チケット発行手段が発行したチケットを記憶するチケット記憶手段。
・前記アプリケーションの正常応答を前記コンピュータ端末から受信すると前記チケット記憶手段に記憶されているチケットを削除するチケット管理手段、
・少なくとも前記アプリケーションがエラー発生時に出力するエラーログを検出し、前記チケット記憶手段に記憶されている全てのチケットを回収する回収手段、
・前記エラーログの識別子と前記回収したチケットの識別子とを対応付けて記憶する障害記憶手段。
・前記ユーザ端末と前記コンピュータ端末とに接続し、前記ユーザ端末からいずれかのアプリケーションへのリクエストに応じて前記ユーザ端末を識別するユーザ識別子が記述されたチケットを発行するチケット発行ステップ、
・前記チケット発行ステップで発行したチケットを記憶するチケット記憶ステップ、
・前記アプリケーションの正常応答を前記コンピュータ端末から受信すると前記チケット記憶ステップで記憶されたチケットを記憶手段から削除するチケット管理ステップ、
・少なくとも前記アプリケーションがエラー発生時に出力するエラーログを検出し、前記チケット記憶ステップで記憶された全てのチケットを回収する回収ステップ、
・前記エラーログの識別子と前記回収したチケットの識別子とを対応付けて記憶する障害記憶ステップ。
[概要]
図1は、本発明の第1実施形態に係る障害検出システムの構成図である。障害検出システム100は、ネットワーク200を介し、ユーザ端末300、第1〜第Nアプリケーションがそれぞれ動作するコンピュータ400、各アプリケーションの実行状態を示すログを保存する実行状態ログDB500と接続されている。第1〜第Nアプリケーションは、企業内の業務処理や企業間での取引を実行するために必要となるアプリケーションである。ユーザ端末300は、企業内の業務処理や企業間取引のリクエストを出し、その応答を受け取る端末であり、通常は企業内に設置されている。
次に、障害検出システム100の構成について、さらに詳細に説明する。
図4は、Wrapper101の機能構成を示すブロック図である。Wrapper101は、ユーザ端末300からのリクエストに応じてユーザID付チケットを発行し、アプリケーションからの正常応答に応じて発行したチケットを削除する。図1ではWrapper101を1つしか示していないが、実際は各業務毎にWrapper101が起動する。例えば発注業務処理用Wrapper101、受注業務処理用Wrapper101、在庫引当業務処理用Wrapper101はそれぞれ独立に起動し、独立に動作する。Wrapper101により発行されたチケットは正常に業務処理が行われた後は削除されるので、削除されずに残ったチケットは異常事態の発生を示していることになる。Wrapper101は、下記の機能を有している。
図8は、リソースマネージャ102の機能構成を示すブロック図である。リソースマネージャ102は、実行状態ログDB500へのエラーログの書き込み発生を監視し、エラーログが書き込まれると、発生したエラーログとチケット管理テーブル1011内の全チケットとを対応付けて障害ログDB104に書き込む。各チケットにはユーザIDが記述されているので、エラーログとチケットとを対応付けることにより、発生したエラーにより影響を受けるユーザとエラーとを関連づけることができる。Wrapper101が複数起動しているとき、リソースマネージャ102は起動しているWrapper101全てからチケットを回収する。また、リソースマネージャ102は、エラーログだけでなく、エラーが発生する前に出力される警告ログや、アプリケーションの応答が悪化した状態を示すログなどを、チケットと対応付けることもできる。リソースマネージャ102は以下の機能を有している。
図12は、障害通知装置103の機能構成を示すブロック図である。障害通知装置103は、障害ログDB104への書き込み発生を検出し、書き込まれたチケットとログとからどのユーザが使用中のアプリケーションがどのようなエラーを発生させたのかを、障害検出システム100の管理者に通知する。管理者は、この通知に基づいて、エラーの影響を受けるまたは受けそうなユーザに対し、迅速な対応を取ることができる。障害通知装置103は、下記の機能を有している。
図14は、本実施形態例に係る障害通知システムが実行する処理の流れの一例を示す説明図である。この処理は、大別して(1)チケットの発行と、(2)障害ログDB104への保存と、(3)エラーの通知出力とに分けられる。
まず、ユーザ端末300がWrapper101に対し、業務処理の実行を要求するリクエストを送信する(#1)。このリクエストには、ユーザ端末300のアドレスなどのユーザIDが含まれている。
リソースマネージャ102は、起動すると、監視レベル情報DB106から監視レベル情報を読み込んでおく(#20)。リソースマネージャ102は、実行状態ログDB500への書き込みを監視し、新たなログが書き込まれると監視レベル情報に基づいて障害ログDB104への書き込みを行うか否かを判断する(#21,#22)。例えば、発生したログが警告ログであり、監視レベル情報に「エラーログ、警告ログまたはレスポンスの悪化時」と定義されていれば、書き込むと判断する。書き込む場合は、発生したログと、起動しているWrapper101にあるチケットキューとを回収し、障害ログDB104に保存する(#23,#24)。
障害通知装置103は、例えば起動時に、アプリ構成DB105及びビジネスプロセス構成DB107から、それぞれアプリケーション構成とビジネスプロセス構成とを読み込んでおく(#25,#26)。その後、障害通知装置103は、障害ログDB104への書き込みを監視し(#27)、障害ログDB104への書き込みが発生すると、新たに障害ログDB104に書き込まれたチケットに基づいてユーザIDを特定する(#28)。また、障害通知装置103は、構成ID及びフローIDを特定しても良い。エラーを起こしたアプリケーションが構成IDで特定されるアプリケーション構成に含まれていない場合、障害通知装置103は障害通知を行わなわず、回収したチケットを元に戻すと良い。
図15は、前述の処理により、障害通知装置103が出力する障害通知画面例である。この例では、ユーザID、エラーが生じた処理のアプリケーション構成及びビジネスプロセスが示されている。すなわち、在庫引き当てアプリケーションがデータベース(DB)に書き込みを行おうとしたときにエラーが発生したこと、その日時が示されている。
以上のように、本発明の障害検出システムを用いれば、企業内の業務処理システムやビジネスプロセスシステムにおいて障害が発生したときに、その障害により影響を受ける企業を自動的に特定する。また、どの企業がどのような障害の影響を受けたかを、自動的に特定する。さらに、どのような業務処理システムまたはビジネスプロセスシステムにおいて障害が発生したのか、また発生した障害はそのシステムを構築するどの部分またはどの段階なのかを、自動的に特定する。エラーの発生前に、エラーに直結しそうな事態を検知して障害検出システムの管理者に通知することもできる。その結果、障害の原因の追及の手間や時間を軽減することができる。また、発生した障害が企業活動に及ぼす影響を容易に把握し、障害の発生に迅速に対応することができる。
上記の方法を実行するためのプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体は、本発明の範囲に含まれる。ここで記録媒体としては、コンピュータが読み書き可能なフレキシブルディスク、ハードディスク、半導体メモリ、CD−ROM、DVD、光磁気ディスク(MO)、その他のものが挙げられる。またプログラムには、記録媒体に記憶されているものもダウンロード可能なものが含まれる。
図16は、本発明の実施例1の説明図である。本実施例では、ASP事業者が、受注や在庫引当などの業務アプリケーション4001,4002を、複数の顧客企業にネットワーク200経由で提供する場合を想定する。ASP事業者側では、受注アプリケーション4001と在庫引当アプリケーション4002とがデータベースシステムを共有している。ユーザ端末3001は受注アプリケーション4001を使用し、ユーザ端末3002は在庫引当アプリケーション4002を使用している。
図17は、本発明の実施例2の説明図である。本実施例では、実施例1と同様、ASP事業者が、受注や在庫引当などの業務アプリケーションを、複数の顧客企業にネットワーク経由で提供する場合を想定する。ユーザ端末3001は受注アプリケーションを使用し、ユーザ端末3002は在庫引当アプリケーションを使用している。チケットキューには、ユーザ端末3001及びユーザ端末3002のリクエストが蓄積されている。
図18は、本発明の実施例3の説明図である。本実施例では、チケットの回収のタイミングを決定するにあたって、監視レベル情報を使用する。
(付記1)
アプリケーションが動作している1以上のコンピュータ端末と前記アプリケーションのユーザの端末とにネットワークを介して接続される障害検出システムであって、
中継装置とリソース管理装置とを備え、
前記中継装置は、
前記ユーザ端末と前記コンピュータ端末とに接続され、前記ユーザ端末からいずれかのアプリケーションへのリクエストに応じて前記ユーザ端末を識別するユーザ識別子が記述されたチケットを発行するチケット発行手段と、
前記チケット発行手段が発行したチケットを記憶するチケット記憶手段と、を有し、
前記リソース管理装置は、
少なくとも前記アプリケーションがエラー発生時に出力するエラーログを検出し、前記チケット記憶手段に記憶されているチケットを回収する回収手段と、
前記エラーログの識別子と前記チケットの識別子とを対応付けて記憶する障害記憶手段と、を有している障害検出システム。
前記中継装置は、前記チケット記憶手段に記憶されているチケットを削除するチケット管理手段をさらに備える、付記1に記載の障害検出システム。
前記アプリケーションの実行状態ログのうち前記回収手段が検出すべきレベルを定義する監視レベル情報を記憶する監視レベル情報記憶手段をさらに備え、
前記リソース管理装置は、前記監視レベル情報を参照して前記チケットを回収するか否かを判断し、前記判断結果に基づいて前記チケットを回収する、
付記1に記載の障害検出システム。
前記リソース管理装置が回収したチケットに記述されたユーザ識別子に基づいて、前記エラーに関連するユーザ端末を特定し、特定したユーザ端末の識別子を出力する障害通知手段を更に備える、付記1に記載の障害検出システム。
複数のアプリケーションの接続状態を示したアプリケーション構成情報を記憶しているアプリケーション構成記憶手段をさらに備え、
前記障害通知手段は、前記アプリケーション構成記憶手段に記憶されたアプリケーション構成情報と前記リソース管理装置が回収したチケットの記述とに基づいて、前記ユーザ端末が使用しているアプリケーションを特定し、特定したアプリケーションの識別子をさらに出力し、
前記チケット発行手段は、前記アプリケーション構成情報への参照情報を前記チケットに書き込む、
付記4に記載の障害検出装置。
複数のアプリケーションからなる処理の各ステップを定義するビジネスプロセス構成情報を記憶しているビジネスプロセス構成記憶手段をさらに備え、
前記障害通知手段は、前記ビジネスプロセス構成記憶手段に記憶されたビジネスプロセス構成情報と前記リソース管理装置が回収したチケットの記述とに基づいて、前記エラーが発生した時点を特定し、特定した時点をさらに出力し、
前記チケット発行手段は、前記ビジネスプロセス構成情報への参照情報をチケットに書き込む、
付記4に記載の障害検出装置。
前記障害通知装置は、電子メールクライアントが動作するコンピュータ端末と前記ネットワークを介して接続されており、
前記障害通知装置は、電子メールクライアントをさらに有し、前記エラーに関連するユーザ端末の識別子を前記電子メールクライアントにより前記コンピュータ端末に送信する、
付記4に記載の障害検出システム。
アプリケーションが動作している1以上のコンピュータ端末と前記アプリケーションのユーザの端末とにネットワークを介して接続される障害検出システムが実行する障害検出方法であって、
前記ユーザ端末と前記コンピュータ端末とに接続し、前記ユーザ端末からいずれかのアプリケーションへのリクエストに応じて前記ユーザ端末を識別するユーザ識別子が記述されたチケットを発行するチケット発行ステップと、
前記チケット発行ステップで発行したチケットを記憶するチケット記憶ステップと、
少なくとも前記アプリケーションがエラー発生時に出力するエラーログを検出し、前記チケット記憶ステップで記憶されたチケットを回収する回収ステップと、
前記エラーログの識別子と前記チケットの識別子とを対応付けて記憶する障害記憶ステップと、
を含む障害検出方法。
200:ネットワーク
300:ユーザ端末
400:アプリケーションが動作するコンピュータ
500:実行状態ログDB
101:Wrapper
102:リソースマネージャ
103:障害通知装置
104:障害ログDB104
105:アプリ構成DB
106:監視レベル情報DB
107:ビジネスプロセス構成DB
Claims (4)
- アプリケーションが動作している1以上のコンピュータ端末と前記アプリケーションのユーザの端末とにネットワークを介して接続される障害検出システムであって、
中継装置とリソース管理装置とを備え、
前記中継装置は、
前記ユーザ端末と前記コンピュータ端末とに接続され、前記ユーザ端末からいずれかのアプリケーションへのリクエストに応じて前記ユーザ端末を識別するユーザ識別子が記述されたチケットを発行するチケット発行手段と、
前記チケット発行手段が発行したチケットを記憶するチケット記憶手段と、を有し、
前記リソース管理装置は、
前記アプリケーションの正常応答を前記コンピュータ端末から受信すると前記チケット記憶手段に記憶されているチケットを削除するチケット管理手段と、
少なくとも前記アプリケーションがエラー発生時に出力するエラーログを検出し、前記チケット記憶手段に記憶されている全てのチケットを回収する回収手段と、
前記エラーログの識別子と前記回収したチケットの識別子とを対応付けて記憶する障害記憶手段と、を有している障害検出システム。 - 前記アプリケーションの実行状態ログのうち前記回収手段が検出すべきレベルを定義する監視レベル情報を記憶する監視レベル情報記憶手段をさらに備え、
前記リソース管理装置は、前記監視レベル情報を参照して前記チケットを回収するか否かを判断し、前記判断結果に基づいて前記チケットを回収する、
請求項1に記載の障害検出システム。 - 前記リソース管理装置が回収したチケットに記述されたユーザ識別子に基づいて、前記エラーに関連するユーザ端末を特定し、特定したユーザ端末の識別子を出力する障害通知手段を更に備える、請求項1に記載の障害検出システム。
- アプリケーションが動作している1以上のコンピュータ端末と前記アプリケーションのユーザの端末とにネットワークを介して接続される障害検出システムが実行する障害検出方法であって、
前記ユーザ端末と前記コンピュータ端末とに接続し、前記ユーザ端末からいずれかのアプリケーションへのリクエストに応じて前記ユーザ端末を識別するユーザ識別子が記述されたチケットを発行するチケット発行ステップと、
前記チケット発行ステップで発行したチケットを記憶するチケット記憶ステップと、
前記アプリケーションの正常応答を前記コンピュータ端末から受信すると前記チケット記憶ステップで記憶されたチケットを記憶手段から削除するチケット管理ステップと、
少なくとも前記アプリケーションがエラー発生時に出力するエラーログを検出し、前記チケット記憶ステップで記憶された全てのチケットを回収する回収ステップと、
前記エラーログの識別子と前記回収したチケットの識別子とを対応付けて記憶する障害記憶ステップと、
を含む障害検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004106237A JP4271612B2 (ja) | 2004-03-31 | 2004-03-31 | 障害検出システム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004106237A JP4271612B2 (ja) | 2004-03-31 | 2004-03-31 | 障害検出システム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005293140A JP2005293140A (ja) | 2005-10-20 |
JP4271612B2 true JP4271612B2 (ja) | 2009-06-03 |
Family
ID=35326012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004106237A Expired - Fee Related JP4271612B2 (ja) | 2004-03-31 | 2004-03-31 | 障害検出システム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4271612B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7647202B2 (en) * | 2006-07-05 | 2010-01-12 | Arizona Public Service Company | Method for exception-based notification of the condition of an apparatus |
CN109977284B (zh) * | 2019-03-18 | 2023-07-14 | 深圳市活力天汇科技股份有限公司 | 一种机票购买失败原因的诊断方法 |
-
2004
- 2004-03-31 JP JP2004106237A patent/JP4271612B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005293140A (ja) | 2005-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105357038B (zh) | 监控虚拟机集群的方法和系统 | |
US8799709B2 (en) | Snapshot management method, snapshot management apparatus, and computer-readable, non-transitory medium | |
US8135995B2 (en) | Diagnostic data repository | |
JP5075736B2 (ja) | 仮想サーバのシステム障害回復方法及びそのシステム | |
US9262260B2 (en) | Information processing apparatus, information processing method, and recording medium | |
US8424095B2 (en) | Method and equipment for verifying propriety of system management policies to be used in a computer system | |
US8326971B2 (en) | Method for using dynamically scheduled synthetic transactions to monitor performance and availability of E-business systems | |
JP4722944B2 (ja) | データベースの分散ロードのためのシステム、方法およびソフトウェア | |
EP2674865A1 (en) | MANAGEMENT COMPUTER AND METHOD FOR ROOT CAUSE ANALYSiS | |
JP4494330B2 (ja) | ポリシ制御方法、装置及びプログラム | |
EP1955235A2 (en) | System and method of managing data protection resources | |
JP2012053903A (ja) | 分散型検索方法、アーキテクチャ、システム、およびソフトウェア | |
JP2009536403A (ja) | ワーク・アイテム・イベント処理 | |
JP2011197785A (ja) | ログ収集システムおよびログ収集プログラム | |
JP4881760B2 (ja) | ログ管理装置、ログ管理方法、プログラム、及び記録媒体 | |
JP4271612B2 (ja) | 障害検出システム及び方法 | |
JP2003345628A (ja) | 障害調査資料採取方法及びその実施システム並びにその処理プログラム | |
US7065539B2 (en) | Data transfer method | |
JP3202721B2 (ja) | 故障予測システム、故障予測方法および故障予測プログラムを記録した記録媒体 | |
JP4445750B2 (ja) | 因果関係推定プログラム及び因果関係推定方法 | |
CN113485872A (zh) | 故障处理方法、装置及分布式存储系统 | |
JP3992029B2 (ja) | オブジェクト管理方法 | |
JP2007164494A (ja) | 情報出力方法、システム及びプログラム | |
JP6290810B2 (ja) | 管理装置及び管理方法 | |
JP7167749B2 (ja) | 情報処理装置、情報処理システム、及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051020 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20080929 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081021 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090224 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090225 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120306 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130306 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140306 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |