JPWO2012127588A1 - 対処支援プログラム、対処支援装置および対処支援方法 - Google Patents
対処支援プログラム、対処支援装置および対処支援方法 Download PDFInfo
- Publication number
- JPWO2012127588A1 JPWO2012127588A1 JP2013505648A JP2013505648A JPWO2012127588A1 JP WO2012127588 A1 JPWO2012127588 A1 JP WO2012127588A1 JP 2013505648 A JP2013505648 A JP 2013505648A JP 2013505648 A JP2013505648 A JP 2013505648A JP WO2012127588 A1 JPWO2012127588 A1 JP WO2012127588A1
- Authority
- JP
- Japan
- Prior art keywords
- failure
- message
- occurrence
- time
- countermeasure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0715—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
図1は、実施の形態1にかかる対処支援方法の一実施例を示す説明図である。図1において、対処支援装置100は、監視対象となるシステム内で発生する障害への対処を支援するコンピュータである。
つぎに、実施の形態2にかかる対処支援システム200について説明する。なお、実施の形態1で説明した箇所と同一箇所については説明を省略する。
図2は、実施の形態2にかかる対処支援システムのシステム構成例を示す説明図である。図2において、対処支援システム200は、対処支援装置100と、複数のサーバ201(図面では3台)と、複数のクライアント端末202(図面では4台)と、を含む。対処支援システム200において、対処支援装置100、複数のサーバ201、および複数のクライアント端末202は、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)などのネットワーク210を介して接続されている。
図3は、実施の形態2にかかる対処支援装置のハードウェア構成例を示すブロック図である。図3において、対処支援装置100は、CPU(Central Processing Unit)301と、ROM(Read‐Only Memory)302と、RAM(Random Access Memory)303と、磁気ディスクドライブ304と、磁気ディスク305と、光ディスクドライブ306と、光ディスク307と、ディスプレイ308と、I/F(Interface)309と、キーボード310と、マウス311と、スキャナ312と、プリンタ313と、を備えている。また、各構成部はバス300によってそれぞれ接続されている。
つぎに、対処支援装置100が備える各種DB110,220,230の記憶内容について説明する。各種DB110,220,230は、例えば、図3に示したRAM303、磁気ディスク305、光ディスク307などの記憶装置により実現される。
図4は、障害事例DBの記憶内容の一例を示す説明図である。図4において、障害事例DB110は、障害ID、障害タイプおよび事例データのフィールドを有する。各フィールドに情報を設定することで、障害D1〜Dmの障害事例情報400−1〜400−mがレコードとして記憶されている。
図5は、メッセージパターンDBの記憶内容の一例を示す説明図である。図5において、メッセージパターンDB220は、メッセージパターンID、障害タイプ、メッセージID、発生確率およびリードタイムのフィールドを有する。各フィールドに情報を設定することで、メッセージパターンMP1〜MPnのメッセージパターン情報500−1〜500−nがレコードとして記憶されている。
図6は、対処案DBの記憶内容の一例を示す説明図である。図6において、対処案DB230は、障害タイプごとに、障害タイプの障害の対処案と、障害の対処案の実施にかかる所要時間とを関連付けて示す対処案情報600−1〜600−mを記憶している。
つぎに、実施の形態2にかかる対処支援装置100の機能的構成例について説明する。図7は、実施の形態2にかかる対処支援装置の機能的構成を示すブロック図である。図7において、対処支援装置100は、取得部701と、分類部702と、第1の選択部703と、検索部704と、特定部705と、算出部706と、出力部707と、検出部708と、第2の選択部709と、を含む構成である。この制御部となる機能(取得部701〜第2の選択部709)は、具体的には、例えば、図3に示したROM302、RAM303、磁気ディスク305、光ディスク307などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、I/F309により、その機能を実現する。各機能部の処理結果は、例えば、RAM303、磁気ディスク305、光ディスク307などの記憶装置に記憶される。
つぎに、サーバ201から取得されたログを分類する分類部702の具体的な処理内容の一例について説明する。まず、ログを分類する際に用いられるメッセージ辞書DB1400について説明する。メッセージ辞書DB1400は、例えば、RAM303、磁気ディスク305、光ディスク307などの記憶装置に記憶されている。
つぎに、メッセージパターンMPiの障害タイプTの障害の発生時点を特定する特定部705の具体的な処理内容について説明する。ここでは、図16を用いて、メッセージパターンMP1の障害タイプT1の障害の発生時刻を特定する場合を例に挙げて説明する。
つぎに、実施の形態2にかかる対処支援装置100の各種対処支援処理手順について説明する。まず、メッセージパターンMPiのリードタイムLTiを算出するリードタイム算出処理手順について説明する。
図17および図18は、実施の形態2にかかる対処支援装置のリードタイム算出処理手順の一例を示すフローチャートである。
つぎに、予兆が検出された障害の対処案を選択する対処案選択処理手順について説明する。図19は、実施の形態2にかかる対処支援装置の対処案選択処理手順の一例を示すフローチャートである。
110 障害事例DB
200 対処支援システム
201 サーバ
202 クライアント端末
220 メッセージパターンDB
230 対処案DB
701 取得部
702 分類部
703 第1の選択部
704 検索部
705 特定部
706 算出部
707 出力部
708 検出部
709 第2の選択部
800 メッセージDB
Claims (10)
- 監視対象となるシステム内の対象機器の動作に関連する所定の種別のメッセージの発生タイミングから障害発生タイミングまでの経過時間を算出し、
算出した該経過時間を出力する、
処理をコンピュータに実行させることを特徴とする対処支援プログラム。 - 前記システム内で発生したメッセージの中から、特定の障害の発生前に発生して前記特定の障害の予兆となる所定の種別のメッセージを検索し、
前記システム内で発生した障害の発生時点を記憶するデータベースを参照して、前記特定の障害の発生時点を特定し、
検索した前記所定の種別のメッセージの発生時点と、特定した前記特定の障害の発生時点とに基づいて、前記特定の障害の予兆が発生してから前記特定の障害が発生するまでの時間を算出し、
算出した算出結果を出力する、
処理を前記コンピュータに実行させることを特徴とする請求項1に記載の対処支援プログラム。 - 前記システム内で発生した前記所定の種別のメッセージを検出し、
前記所定の種別のメッセージが検出された場合、算出した前記特定の障害の予兆が発生してから前記特定の障害が発生するまでの時間を出力する、
処理を前記コンピュータに実行させることを特徴とする請求項2に記載の対処支援プログラム。 - 前記所定の種別のメッセージが検出された場合、前記特定の障害の予兆が発生してから前記特定の障害が発生するまでの時間に基づいて、前記特定の障害の対処案と前記対処案の実施にかかる所要時間とを関連付けて記憶する対処案データベースの中から、前記特定の障害の対処案を選択し、
選択した前記特定の障害の対処案を出力する、
処理を前記コンピュータに実行させることを特徴とする請求項3に記載の対処支援プログラム。 - 前記特定の障害の対処案を選択する処理は、
前記対処案データベースの中から、前記特定の障害の予兆が発生してから前記特定の障害が発生するまでの時間より所要時間が短い対処案を選択することを特徴とする請求項4に記載の対処支援プログラム。 - 前記所定の種別は一つ以上の種別の組合せであり、
前記所定の種別のメッセージを検索する処理は、
前記システム内で発生したメッセージの中から、前記組合せに含まれる各々の種別のメッセージを検索し、
前記特定の障害が発生するまでの時間を算出する処理は、
検索した前記各々の種別のメッセージの発生時点のうち最新の発生時点から、特定した前記特定の障害の発生時点までの時間間隔を算出することを特徴とする請求項2〜5のいずれか一つに記載の対処支援プログラム。 - 前記特定の障害の発生時点を特定する処理は、
前記データベースを参照して、検索した前記所定の種別のメッセージの発生時点から所定期間内に発生した前記特定の障害の発生時点を特定することを特徴とする請求項6に記載の対処支援プログラム。 - 前記特定の障害の予兆が発生してから前記特定の障害が発生するまでの第1の時間が算出された後、前記特定の障害の予兆が発生してから前記特定の障害が発生するまでの第2の時間が算出された場合、前記第1および第2の時間に基づいて、前記特定の障害の予兆が発生してから前記特定の障害が発生するまでの時間を算出する、
処理を前記コンピュータに実行させることを特徴とする請求項7に記載の対処支援プログラム。 - 監視対象となるシステム内の対象機器の動作に関連する所定の種別のメッセージの発生タイミングから障害発生タイミングまでの経過時間を算出する算出部と、
前記算出部によって算出された前記経過時間を出力する出力部と、
を備えることを特徴とする対処支援装置。 - 監視対象となるシステム内の対象機器の動作に関連する所定の種別のメッセージの発生タイミングから障害発生タイミングまでの経過時間を算出し、
算出した該経過時間を出力する、
処理をコンピュータが実行することを特徴とする対処支援方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/056657 WO2012127588A1 (ja) | 2011-03-18 | 2011-03-18 | 対処支援プログラム、対処支援装置および対処支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012127588A1 true JPWO2012127588A1 (ja) | 2014-07-24 |
JP5708789B2 JP5708789B2 (ja) | 2015-04-30 |
Family
ID=46878785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013505648A Expired - Fee Related JP5708789B2 (ja) | 2011-03-18 | 2011-03-18 | 対処支援プログラム、対処支援装置および対処支援方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140019795A1 (ja) |
JP (1) | JP5708789B2 (ja) |
WO (1) | WO2012127588A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016071696A (ja) * | 2014-09-30 | 2016-05-09 | 富士通株式会社 | 予兆検知支援プログラム、方法、装置、及び予兆検知プログラム、 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8914678B2 (en) * | 2012-12-20 | 2014-12-16 | Intel Mobile Communications GmbH | Systems and methods for debugging model based message sequences |
JP6126891B2 (ja) * | 2013-03-29 | 2017-05-10 | 富士通株式会社 | 検出方法、検出プログラム、および検出装置 |
US9251029B2 (en) * | 2013-09-30 | 2016-02-02 | At&T Intellectual Property I, L.P. | Locational prediction of failures |
JP6311329B2 (ja) * | 2014-01-29 | 2018-04-18 | 日本電気株式会社 | 情報処理装置、監視方法、及び、プログラム |
JP6387777B2 (ja) * | 2014-06-13 | 2018-09-12 | 富士通株式会社 | 評価プログラム、評価方法、および評価装置 |
US10963826B2 (en) | 2015-03-31 | 2021-03-30 | Mitsubishi Heavy Industries, Ltd. | Work planning system, work planning method, decision-making support system, computer program, and storage medium |
US20160342453A1 (en) * | 2015-05-20 | 2016-11-24 | Wanclouds, Inc. | System and methods for anomaly detection |
JP6589470B2 (ja) * | 2015-09-04 | 2019-10-16 | 富士ゼロックス株式会社 | スケジュール更新装置及びスケジュール更新プログラム |
WO2017109821A1 (ja) * | 2015-12-21 | 2017-06-29 | 株式会社日立製作所 | 計算機システムの管理システム及び管理方法 |
US10176034B2 (en) * | 2016-02-16 | 2019-01-08 | International Business Machines Corporation | Event relationship analysis in fault management |
JP6787045B2 (ja) * | 2016-10-31 | 2020-11-18 | 富士通株式会社 | 検証支援プログラム、検証支援方法、および情報処理装置 |
US10467083B2 (en) * | 2017-06-08 | 2019-11-05 | International Business Machines Corporation | Event relationship analysis in fault management |
JP6512646B1 (ja) * | 2018-02-13 | 2019-05-15 | Necプラットフォームズ株式会社 | 保守管理装置、システム及びプログラム |
US20220245045A1 (en) * | 2019-07-04 | 2022-08-04 | Nec Corporation | Prediction method, prediction apparatus, and recording medium |
US11586983B2 (en) * | 2020-03-02 | 2023-02-21 | Nxp B.V. | Data processing system and method for acquiring data for training a machine learning model for use in monitoring the data processing system for anomalies |
JP7332668B2 (ja) * | 2021-10-29 | 2023-08-23 | 株式会社日立製作所 | システム管理装置及びシステム管理方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001092688A (ja) * | 1999-09-24 | 2001-04-06 | Toshiba Corp | 故障管理装置 |
US6738811B1 (en) * | 2000-03-31 | 2004-05-18 | Supermicro Computer, Inc. | Method and architecture for monitoring the health of servers across data networks |
US6996500B2 (en) * | 2002-10-30 | 2006-02-07 | Hewlett-Packard Development Company, L.P. | Method for communicating diagnostic data |
US7310742B2 (en) * | 2004-06-30 | 2007-12-18 | Intel Corporation | Method and apparatus for performing disk diagnostics and repairs on remote clients |
US7454316B2 (en) * | 2004-10-08 | 2008-11-18 | International Business Machines Corporation | Method and apparatus for monitoring and enhancing on-chip microprocessor reliability |
JP2007172131A (ja) * | 2005-12-20 | 2007-07-05 | Nec Fielding Ltd | 障害予測システム、障害予測方法、障害予測プログラム |
US7472038B2 (en) * | 2007-04-16 | 2008-12-30 | International Business Machines Corporation | Method of predicting microprocessor lifetime reliability using architecture-level structure-aware techniques |
JP2011002906A (ja) * | 2009-06-16 | 2011-01-06 | Fujitsu Ltd | 監視プログラム、監視装置、および監視方法 |
JP5459472B2 (ja) * | 2009-08-07 | 2014-04-02 | 日本電気株式会社 | 障害復旧装置、障害復旧方法、及びプログラム |
CN104272266B (zh) * | 2012-09-03 | 2016-11-09 | 株式会社日立制作所 | 对具有多个监视对象器件的计算机系统进行管理的管理系统 |
-
2011
- 2011-03-18 JP JP2013505648A patent/JP5708789B2/ja not_active Expired - Fee Related
- 2011-03-18 WO PCT/JP2011/056657 patent/WO2012127588A1/ja active Application Filing
-
2013
- 2013-09-17 US US14/029,446 patent/US20140019795A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016071696A (ja) * | 2014-09-30 | 2016-05-09 | 富士通株式会社 | 予兆検知支援プログラム、方法、装置、及び予兆検知プログラム、 |
Also Published As
Publication number | Publication date |
---|---|
WO2012127588A1 (ja) | 2012-09-27 |
JP5708789B2 (ja) | 2015-04-30 |
US20140019795A1 (en) | 2014-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5708789B2 (ja) | 対処支援プログラム、対処支援装置および対処支援方法 | |
US20200293946A1 (en) | Machine learning based incident classification and resolution | |
JP5444673B2 (ja) | ログ管理方法、ログ管理装置、ログ管理装置を備えた情報処理装置、及びプログラム | |
JP2019501448A (ja) | 異種混成ログストリームにおける自動化された異常検出サービス | |
JP2018045403A (ja) | 異常検知システム及び異常検知方法 | |
US20090282481A1 (en) | Methods, hardware products, and computer program products for implementing introspection data comparison utilizing hypervisor guest introspection data | |
Zhao et al. | Automatically and adaptively identifying severe alerts for online service systems | |
CN111539493B (zh) | 一种告警预测方法、装置、电子设备及存储介质 | |
JPWO2009122525A1 (ja) | トラブル対処システム、方法およびそのためのプログラム | |
KR20180068002A (ko) | 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법 | |
US9270749B2 (en) | Leveraging social media to assist in troubleshooting | |
JP2011002906A (ja) | 監視プログラム、監視装置、および監視方法 | |
JP2007073024A (ja) | マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム | |
US11301355B2 (en) | Method, electronic device, and computer program product for analyzing log file | |
EP3699708B1 (en) | Production facility monitoring device, production facility monitoring method, and production facility monitoring program | |
US11777982B1 (en) | Multidimensional security situation real-time representation method and system and applicable to network security | |
CN110879771A (zh) | 一种基于关键词序列挖掘的用户异常检测的日志分析系统 | |
Zhang et al. | Halo: Hierarchy-aware fault localization for cloud systems | |
CN110704390B (zh) | 获取服务器维护脚本的方法、装置、电子设备及介质 | |
CN115913710A (zh) | 异常检测方法、装置、设备及存储介质 | |
CN110417751B (zh) | 一种网络安全预警方法、装置和存储介质 | |
US20080151773A1 (en) | Trouble-factor detecting device, trouble-factor detecting method, and computer product | |
US11822578B2 (en) | Matching machine generated data entries to pattern clusters | |
CN117873839A (zh) | 复杂算力系统的故障检测方法、装置、设备和存储介质 | |
US8307405B2 (en) | Methods, hardware products, and computer program products for implementing zero-trust policy in storage reports |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5708789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |