JP5578487B2 - 障害解析装置、障害解析方法、及びプログラム - Google Patents
障害解析装置、障害解析方法、及びプログラム Download PDFInfo
- Publication number
- JP5578487B2 JP5578487B2 JP2010237623A JP2010237623A JP5578487B2 JP 5578487 B2 JP5578487 B2 JP 5578487B2 JP 2010237623 A JP2010237623 A JP 2010237623A JP 2010237623 A JP2010237623 A JP 2010237623A JP 5578487 B2 JP5578487 B2 JP 5578487B2
- Authority
- JP
- Japan
- Prior art keywords
- error
- server
- log
- occurred
- cause
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Description
図1は、本発明の実施の形態による障害解析装置101の構成を示すブロック図である。図に示すように、障害解析装置101は、エラー検知手段102、エラー解析手段103、関連エラーリスト104、関連ソフトウェアリスト105、関連ソフトウェア調査手段106、サーバ環境調査手段111、異常停止解析手段114、ユーザ通知手段117、およびデータ更新手段118を備えている。
(2)発生したエラーの原因が他のエラーである場合。
(3)発生したエラーの原因が関連ソフトウェア(業務アプリケーション)にある場合。
(4)発生したエラーの原因が関連ソフトウェア(業務アプリケーション以外)にある場合。
(5)Webアプリケーションサーバが異常停止し、異常停止した原因がJava(登録商標)VM プロセスの異常終了である場合。
図5に示すエラーメッセージが出力された場合を例に図9を用いて説明する。まず、エラー検知部102がエラーを検知し(ステップA1)、エラー解析手段103がエラーを取得する(ステップA2)。次に、エラー解析手段103が関連エラーリスト104を取得し(ステップA3)、関連エラーの有無、および関連エラーの発生の有無を判断する(ステップA4)。図5に示すメッセージは、エラーIDが「0001」であり、図2に示すように関連エラーは無いので(ステップA4:No)、ステップA5に進む。
図6に示すエラーメッセージが出力された場合を例に図9を用いて説明する。
まず、エラー検知部102がエラーを検知し(ステップA1)、エラー解析手段103がエラーを取得する(ステップA2)。次に、エラー解析手段103が関連エラーリスト104を取得して(ステップA3)、関連エラーの有無、および関連エラーの発生の有無を判断する(ステップA4)。図6に示すメッセージには、IDが「0002」のエラーが含まれており、図2を参照すると関連エラーとしてID「0020」が取得される。このように関連エラーが存在するため、関連ソフトウェア状態確認手段107においてその関連エラーが一定時間内に発生しているかどうかを判断する(ステップA4)。図6に示すように、5分前にエラーID「0020」のエラーが発生していることが分かる(ステップA4:Yes)。このため、エラーID「0020」のエラーが根本原因である旨をユーザに通知する(ステップA10)。
図7に示すエラーメッセージが出力された場合を例に図9を用いて説明する。
まず、エラー検知部102がエラーを検知し(ステップA1)、エラー解析手段103がエラーを取得する(ステップA2)。次に、エラー解析手段103が関連エラーリスト104を取得して(ステップA3)、関連エラーの有無、および関連エラーの発生の有無を判断する(ステップA4)。図7に示すメッセージはエラーIDが「0003」であり、図2から関連エラーはないことがわかる。
図8に示すエラーメッセージが出力された場合を例に図9を用いて説明する。なお、ここではWebサーバが停止しているとする。
まず、エラー検知部102がエラーを検知し(ステップA1)、エラー解析手段103がエラーを取得する(ステップA2)。次に、エラー解析手段103が関連エラーリスト104を取得して(ステップA3)、関連エラーの有無、および関連エラーの発生の有無を判断する(ステップA4)。図8に示すメッセージはエラーIDが「0004」であり、図2から関連エラーとして「0040」が取得される。関連エラーが存在したため、関連エラーが一定時間内に発生していないか否かを判断する(ステップA4)。図8から、エラーID「0040」は発生していないことがわかる。
パターン5について、図12を用いて詳細に説明する。ユーザは、Webアプリケーションサーバの異常停止に気付いたら、異常停止解析手段114を実行する(ステップD1)。異常停止解析手段114が実行されると、まずWebアプリケーションサーバログ解析手段115がWebアプリケーションサーバのログを解析し(ステップD2)、起動完了後にエラーログが出力されていないかを判断する(ステップD3)。エラーログが出力されていれば(Yes)、エラー解析手段103を実行してエラーを解析する(ステップD4)。エラー解析手段103の動作は、パターン(1)〜(4)と同様である。
(付記1)サーバにおけるエラーの発生を検知するエラー検知手段と、
前記エラーが発生した際のログへの出力内容と、発生したエラーの原因となり得る関連エラーを対応付ける関連エラーリスト、および前記エラーが発生した際のログへの出力内容と、発生したエラーに関係する可能性のある前記サーバ以外の関連ソフトウェアを対応付ける関連ソフトウェアリスト、を記憶する記憶部と、
前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連エラーが発生していないか否かを解析し、前記関連エラーが発生していればその関連エラーが前記エラーの原因であることをユーザに通知するエラー解析手段と、
前記関連エラーが発生していない場合に、前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連ソフトウェアに異常が発生していないか否かを解析し、異常が発生していればその関連ソフトウェアが前記エラーの原因であることをユーザに通知する関連ソフトウェア調査手段と、を備える障害解析装置。
前記関連ソフトウェアに業務アプリケーションが含まれるか否かを判断し、前記業務アプリケーションが含まれる場合には、スタックトレースを解析し、前記スタックトレースに前記サーバで利用しているパッケージ以外のパッケージ名が含まれている場合には、その業務アプリケーションが前記エラーの原因であることをユーザに通知する業務アプリケーション調査手段、を備える付記1に記載の障害解析装置。
前記関連ソフトウェアに業務アプリケーションが含まれていない場合には、その関連ソフトウェアのログおよび状態を解析し、解析の結果その関連ソフトウェアに異常がある場合には、その関連ソフトウェアが前記エラーの原因であることをユーザに通知する、付記1または2に記載の障害解析装置。
前記サーバマシンが出力するログを解析し、前記エラーの発生時間帯に異常が発生している場合、または前記サーバマシンの負荷状況を調査して、高負荷であると判断された場合に、前記サーバマシンの状態が前記エラーの原因であることをユーザに通知するサーバ環境調査手段を備える、付記1から3のいずれかに記載の障害解析装置。
前記サーバマシンの異常停止が発生した原因を解析し、解析結果を通知する異常停止解析手段を備える、付記1から4のいずれかに記載の障害解析装置。
前記Webアプリケーションサーバのログを解析し、起動完了後にエラーが発生している場合には前記エラー解析手段においてエラー解析を実行し、
起動完了後にエラーが発生していない場合には、Java(登録商標)VMのクラッシュログが出力されているか否かを判断し、出力されている場合には前記クラッシュログの解析を行い、
前記クラッシュログが出力されていない場合には、前記サーバマシンの状態を調査する、付記6に記載の障害解析装置。
前記エラーが発生した際のログへの出力内容と、発生したエラーの原因となり得る関連エラーを対応付ける関連エラーリストを取得し、
前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連エラーが発生していないか否かを解析し、前記関連エラーが発生していればその関連エラーが前記エラーの原因であることをユーザに通知し、
前記エラーが発生した際のログへの出力内容と、発生したエラーに関係する可能性のある前記サーバ以外の関連ソフトウェアを対応付ける関連ソフトウェアリストを取得し、
前記関連エラーが発生していない場合に、前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連ソフトウェアに異常が発生していないか否かを解析し、異常が発生していればその関連ソフトウェアが前記エラーの原因であることをユーザに通知する、障害解析方法。
サーバにおけるエラーの発生を検知するエラー検知手段と、
前記エラーが発生した際のログへの出力内容と、発生したエラーの原因となり得る関連エラーを対応付ける関連エラーリスト、および前記エラーが発生した際のログへの出力内容と、発生したエラーに関係する可能性のある前記サーバ以外の関連ソフトウェアを対応付ける関連ソフトウェアリスト、を記憶する記憶部と、
前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連エラーが発生していないか否かを解析し、前記関連エラーが発生していればその関連エラーが前記エラーの原因であることをユーザに通知するエラー解析手段と、
前記関連エラーが発生していない場合に、前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連ソフトウェアに異常が発生していないか否かを解析し、異常が発生していればその関連ソフトウェアが前記エラーの原因であることをユーザに通知する関連ソフトウェア調査手段と、して機能させるプログラム。
Claims (9)
- サーバにおけるエラーの発生を検知するエラー検知手段と、
前記エラーが発生した際のログへの出力内容と、発生したエラーの原因となり得る関連エラーを対応付ける関連エラーリスト、および前記エラーが発生した際のログへの出力内容と、発生したエラーに関係する可能性のある前記サーバ以外の関連ソフトウェアを対応付ける関連ソフトウェアリスト、を記憶する記憶部と、
前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連エラーが発生していないか否かを解析し、前記関連エラーが発生していればその関連エラーが前記エラーの原因であることをユーザに通知するエラー解析手段と、
前記関連エラーが発生していない場合に、前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連ソフトウェアに異常が発生していないか否かを解析し、異常が発生していればその関連ソフトウェアが前記エラーの原因であることをユーザに通知する関連ソフトウェア調査手段と、を備える障害解析装置。 - 前記関連ソフトウェア調査手段は、
前記関連ソフトウェアに業務アプリケーションが含まれるか否かを判断し、前記業務アプリケーションが含まれる場合には、スタックトレースを解析し、前記スタックトレースに前記サーバで利用しているパッケージ以外のパッケージ名が含まれている場合には、その業務アプリケーションが前記エラーの原因であることをユーザに通知する業務アプリケーション調査手段、を備える請求項1に記載の障害解析装置。 - 前記業務アプリケーション調査手段は、
前記関連ソフトウェアに業務アプリケーションが含まれていない場合には、その関連ソフトウェアのログおよび状態を解析し、解析の結果その関連ソフトウェアに異常がある場合には、その関連ソフトウェアが前記エラーの原因であることをユーザに通知する、請求項2に記載の障害解析装置。 - 前記関連エラーおよび前記関連ソフトウェアが前記エラーの原因ではない場合に、
サーバマシンが出力するログを解析し、前記エラーの発生時間帯に異常が発生している場合、または前記サーバマシンの負荷状況を調査して、高負荷であると判断された場合に、前記サーバマシンの状態が前記エラーの原因であることをユーザに通知するサーバ環境調査手段を備える、請求項1から3のいずれかに記載の障害解析装置。 - ユーザが入力した異常停止解析の命令を受信した場合に、
サーバマシンの異常停止が発生した原因を解析し、解析結果を通知する異常停止解析手段を備える、請求項1から4のいずれかに記載の障害解析装置。 - 前記サーバはWebアプリケーションサーバである、請求項1から5のいずれかに記載の障害解析装置。
- 前記異常停止解析手段は、
前記サーバのログを解析し、起動完了後にエラーが発生している場合には前記エラー解析手段においてエラー解析を実行し、
起動完了後にエラーが発生していない場合には、Java(登録商標)VMのクラッシュログが出力されているか否かを判断し、出力されている場合には前記クラッシュログの解析を行い、
前記クラッシュログが出力されていない場合には、サーバマシンの状態を調査する、請求項5に記載の障害解析装置。 - サーバにおけるエラーの発生を検知し、
前記エラーが発生した際のログへの出力内容と、発生したエラーの原因となり得る関連エラーを対応付ける関連エラーリストを取得し、
前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連エラーが発生していないか否かを解析し、前記関連エラーが発生していればその関連エラーが前記エラーの原因であることをユーザに通知し、
前記エラーが発生した際のログへの出力内容と、発生したエラーに関係する可能性のある前記サーバ以外の関連ソフトウェアを対応付ける関連ソフトウェアリストを取得し、
前記関連エラーが発生していない場合に、前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連ソフトウェアに異常が発生していないか否かを解析し、異常が発生していればその関連ソフトウェアが前記エラーの原因であることをユーザに通知する、障害解析方法。 - コンピュータを、
サーバにおけるエラーの発生を検知するエラー検知手段と、
前記エラーが発生した際のログへの出力内容と、発生したエラーの原因となり得る関連エラーを対応付ける関連エラーリスト、および前記エラーが発生した際のログへの出力内容と、発生したエラーに関係する可能性のある前記サーバ以外の関連ソフトウェアを対応付ける関連ソフトウェアリスト、を記憶する記憶部と、
前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連エラーが発生していないか否かを解析し、前記関連エラーが発生していればその関連エラーが前記エラーの原因であることをユーザに通知するエラー解析手段と、
前記関連エラーが発生していない場合に、前記サーバの起動開始後から前記エラーの発生までの間のログを解析して、出力内容に対応する前記関連ソフトウェアに異常が発生していないか否かを解析し、異常が発生していればその関連ソフトウェアが前記エラーの原因であることをユーザに通知する関連ソフトウェア調査手段と、して機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010237623A JP5578487B2 (ja) | 2010-10-22 | 2010-10-22 | 障害解析装置、障害解析方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010237623A JP5578487B2 (ja) | 2010-10-22 | 2010-10-22 | 障害解析装置、障害解析方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012089080A JP2012089080A (ja) | 2012-05-10 |
JP5578487B2 true JP5578487B2 (ja) | 2014-08-27 |
Family
ID=46260608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010237623A Expired - Fee Related JP5578487B2 (ja) | 2010-10-22 | 2010-10-22 | 障害解析装置、障害解析方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5578487B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020181437A (ja) * | 2019-04-26 | 2020-11-05 | 三菱電機株式会社 | 監視制御装置 |
KR102618998B1 (ko) * | 2022-12-21 | 2024-01-02 | 쿠팡 주식회사 | 애플리케이션의 에러의 발생을 알리는 정보를 제공하는 사용자 단말 및 그 방법 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3902564B2 (ja) * | 2003-04-15 | 2007-04-11 | 中部日本電気ソフトウェア株式会社 | 障害通報装置および障害通報方法 |
JP4606273B2 (ja) * | 2004-08-30 | 2011-01-05 | 株式会社リコー | ログ収集装置,ログ収集プログラム |
WO2007096959A1 (ja) * | 2006-02-22 | 2007-08-30 | Fujitsu Limited | イベントログ管理プログラム、イベントログ管理装置、およびイベントログ管理方法 |
JP2009098706A (ja) * | 2007-10-12 | 2009-05-07 | Fuji Xerox Co Ltd | 処理履歴分析支援装置及び処理履歴分析支援システム及び処理履歴分析支援プログラム |
JP4911074B2 (ja) * | 2008-02-28 | 2012-04-04 | 日本電気株式会社 | 障害原因解析支援装置、方法 |
-
2010
- 2010-10-22 JP JP2010237623A patent/JP5578487B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012089080A (ja) | 2012-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3036633B1 (en) | Cloud deployment infrastructure validation engine | |
US9189317B1 (en) | Software sustaining system | |
US7191364B2 (en) | Automatic root cause analysis and diagnostics engine | |
US10268563B2 (en) | Monitoring of an automated end-to-end crash analysis system | |
US10191837B2 (en) | Automated end-to-end analysis of customer service requests | |
KR20150033711A (ko) | 런타임 오류 복원 방법, 디바이스 및 시스템 | |
US10338990B2 (en) | Culprit module detection and signature back trace generation | |
WO2019169761A1 (zh) | 自动化测试方法、装置及存储介质 | |
WO2012104488A1 (en) | Arrangement and method for model-based testing | |
EP3591485B1 (en) | Method and device for monitoring for equipment failure | |
US10365959B2 (en) | Graphical user interface for software crash analysis data | |
CN103248625A (zh) | 一种网络爬虫运行异常监控方法和系统 | |
JP5198154B2 (ja) | 障害監視システム及びデバイスと監視装置並びに障害監視方法 | |
CN111506470B (zh) | 浏览器错误检测和告警方法、装置、设备及存储介质 | |
JP5425720B2 (ja) | 仮想化環境監視装置とその監視方法およびプログラム | |
US10331508B2 (en) | Computer crash risk assessment | |
US10740166B2 (en) | Thread based dynamic data collection | |
CN112988503A (zh) | 分析方法、分析装置、电子装置和存储介质 | |
CN113971031A (zh) | 软件包依赖关系检查方法及装置 | |
JP5578487B2 (ja) | 障害解析装置、障害解析方法、及びプログラム | |
Bhardwaj et al. | A Comprehensive Study of Bugs in Software Defined Networks | |
JP2012234381A (ja) | ネットワーク運用管理システム、ネットワーク監視サーバ、ネットワーク監視方法およびプログラム | |
JP2007304837A (ja) | 情報処理装置及び監視方法並びにプログラム | |
US9372746B2 (en) | Methods for identifying silent failures in an application and devices thereof | |
CN113626288A (zh) | 故障处理方法、系统、装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140402 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140523 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140616 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5578487 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |