JP2012003406A - 障害原因判定ルール検証装置及びプログラム - Google Patents
障害原因判定ルール検証装置及びプログラム Download PDFInfo
- Publication number
- JP2012003406A JP2012003406A JP2010136300A JP2010136300A JP2012003406A JP 2012003406 A JP2012003406 A JP 2012003406A JP 2010136300 A JP2010136300 A JP 2010136300A JP 2010136300 A JP2010136300 A JP 2010136300A JP 2012003406 A JP2012003406 A JP 2012003406A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- determination rule
- cause determination
- classification tree
- failure cause
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】障害原因判定ルールを見直すための時間間隔を与える時間窓を自動的に設定する。直近の時間窓内に発生したイベントに基づいて一時障害分類木を作成する。この後、作成された一時障害分類木と障害原因判定ルールの障害分類木(登録障害分類木)を比較し、比較結果に基づいて運用に使用する障害原因判定ルールを更新する。
【選択図】図7−2
Description
(1)新規ITサービスの追加/既存ITサービスの廃止
新規のITサービスの運用が開始されると、当該サービスに関係するシステム障害が新たに発生するようになる。この場合、新規なシステム障害に対応する障害原因判定ルールを作成し、既存の障害原因判定ルールに追加する必要がある。反対に、既存のITサービスが廃止された場合、当該サービスに関係するシステム障害はそれ以降発生しなくなる。この場合、今後発生しなくなる障害に対応する障害原因判定ルールを、既存の障害原因判定ルールから削除する必要がある。
(2)IT基盤構成の変更
システムの運用過程では、提供されるITサービス自体に変更が存在しなくとも、IT基盤が変更されることがある。例えばハードウェアの交換やネットワーク構成の変更などが生じることがある。このようにシステム構成に変更が生じると、同じ原因に起因するシステム障害であったとしても、発生するイベントの属性値やイベントの出現の仕方が影響を受けることになる。すなわち、障害原因判定ルールへの変更が必要となる。
(3)システム障害に対する認識の変化
当然ながら、障害原因判定ルールの作成時には、その時点で利用可能な情報に基づいて障害原因判定ルールが作成される。しかし、システム障害に関する情報量の不足から誤った障害原因判定ルールが生成される可能性がある。例えば同じ原因に起因すると判定されていたシステム障害Aとシステム障害Bが、その後、異なる原因に起因するものであると判明することがある。反対に、当初は異なる原因に起因する障害として判定されていたものが、その後、同じ原因に起因する障害であると判明することがある。
図1に、障害原因判定ルール検証コンピュータ107を実装する障害原因解析システムの構成例を示す。図1に示す障害原因解析システムは、監視対象サーバ群101と、監視サーバ102と、ログデータベース(DB)103と、障害原因判定ルール生成コンピュータ104と、障害原因解析コンピュータ105と、障害原因判定ルールDB106と、障害原因判定ルール検証コンピュータ107と、復旧手順書データベース(DB)108と、復旧手順書閲覧コンピュータ109とを有している。
図2に、ログDB103に格納されるイベントテーブル200の具体例を示す。イベントテーブル200は、イベントを一意に特定する識別子(ID)201、イベントが発生した日時を特定する発生日時202、個々のイベントの属性値の集合であるイベント203から構成される。この形態例の場合、イベント203の属性は、<種類>、<ソース>、<イベント番号>、<ユーザ>、<コンピュータ>で定義される。このうち、<種類>はイベントの重要度を示している。<ソース>はイベントを発生させたプロセスやアプリケーション等の発生源を示している。<イベント番号>はイベントの内容を特定する番号を示している。<ユーザ>はイベントの発生源となったプロセスやアプリケーションを実行していたユーザを示している。<コンピュータ>はイベントの発生源となった監視対象サーバ群101内のサーバを示している。
図3−1及び図3−2に、障害原因判定ルールDB106の構成例を示す。障害原因判定ルールDB106は、障害原因解析コンピュータ105に登録されている障害原因判定ルールとそれに関連する情報を格納しているDBである。障害原因判定ルールDB106は、登録障害分類木300と、障害原因判定ルールテーブル310と、障害ノードテーブル320とから構成される。
図4に、障害原因判定ルール検証コンピュータ107の構成例を示す。障害原因判定ルール検証コンピュータ107は、コンピュータ本体400と、入力装置430と、表示装置431と、通信装置432とから構成される。なお、通信装置432は、監視サーバ102、ログDB103及び障害原因判定ルールDB106と通信する。
図5に、障害原因解析システム全体の障害原因解析プロセスの概略を示す。
(ステップ501)
障害原因判定ルール生成コンピュータ104は、ログDB103からイベントログを取得して障害原因判定ルールを生成し、障害原因判定ルールDB106に保存する。ここで、障害原因判定ルールの作成は、(1)障害分類木の作成、(2)頻出イベントパターンの発見、(3)復旧手順書検索の順番に行う。
障害原因判定ルール生成コンピュータ104は、ログDB103から取得したイベントを障害別に分類する。障害別に分類された状態のイベントをイベントブロックという。次に、障害原因判定ルール生成コンピュータ104は、各イベントブロックから特徴を抽出し、抽出された特徴に基づいて教師なしのクラスタリングを行い、分類木を構築する。この分類木が、障害原因判定ルールDB106の登録障害分類木300に相当する。この場合のクラスタリング手法としては、非特許文献1に記載されている概念クラスタリングCOBWEBなどがある。
障害原因判定ルール生成コンピュータ104は、指定された分類木の障害ノードに分類される複数のイベントブロックに単数又は複数の頻出するイベントを発見する。さらに、頻出イベントが複数ある場合には、頻出イベントが出現する順番と時間間隔を求める。これらが、障害原因判定ルールDB106の障害原因判定ルールテーブル310の障害原因判定ルール312における判定イベント313及び判定時間314に相当する。
障害原因判定ルール生成コンピュータ104は、(2)で求めた頻出イベントの属性値に基づいて検索キーを生成する。例えば5つの属性、すなわち「種類」、「ソース」、「イベント」、「ユーザ」、「コンピュータ」のそれぞれについて最も頻出する属性値の組み合わせを検索キーに設定する。次に、障害原因判定ルール生成コンピュータ104は、生成された検索キーを用いて復旧手順書DB108を検索し、適切な復旧手順書を取得する。ここでの復旧手順書が、障害原因判定ルールテーブル310(図3−1)の障害原因判定ルール312における復旧手順書315に相当する。
障害原因解析コンピュータ105は、障害原因判定ルール生成コンピュータ104により障害原因判定ルールDB106が更新されたのを検知すると、障害原因判定ルールDB106から障害原因判定ルールテーブル310の障害原因判定ルール312(図3−1)を取得し、登録する。
監視サーバ102は、監視対象サーバ群101を監視している。監視サーバ102は、監視対象サーバ群101内のサーバに障害に起因する異常を発見すると、該当するサーバの状態に応じたイベントを生成する。監視サーバ102は、生成したイベントをログDB103に保存すると共に、障害原因解析コンピュータ105及び障害原因判定ルール検証コンピュータ107にそのイベントを送信する。
障害原因解析コンピュータ105は、受信したイベントと、障害原因判定ルール312とのマッチング処理を実行する。障害原因判定ルール312に登録されたいずれかの障害ノードと受信したイベントが一致した場合、障害原因解析コンピュータ105は、一致が確認された傷害ノードについて登録されている復旧手順書315を復旧手順書DB108から取得し、復旧手順書閲覧コンピュータ109に送信する。
復旧手順書閲覧コンピュータ109は、障害原因解析コンピュータ105から受信した復旧手順書315を表示装置上に表示する。
障害原因判定ルール検証コンピュータ107は、監視サーバ102からイベントを受信すると、設定された時間窓内のイベント集合から障害原因判定ルールを作成し、障害原因判定ルールDB106を更新する。この処理内容の詳細は後述する。
障害原因解析コンピュータ105は、障害原因判定ルール検証コンピュータ107により障害原因判定ルールDB106が更新されたことを検知した場合、障害原因判定ルールDB107から障害原因判定ルール312を取得し、現在利用している障害原因判定ルールと置き換える。
図7−1及び図7−2に、障害原因判定ルール検証プログラム411を通じて実行される障害原因判定ルールの検証・更新プロセスの概要を示す。まず、図7−1に、検証プロセスのスケジューリング処理の内容を示す。
(ステップ700)
障害原因判定ルール検証プログラム411の実行は、障害原因判定ルール生成コンピュータ104が、障害原因判定ルールDB106の更新を通信装置432経由で検知することにより開始される。
障害原因判定ルール検証コンピュータ107は、障害の発生時間間隔の境界時間tbを計算する。境界時間tbとは、最後に障害が発生してから、時間間隔の境界時間tb以内に、同じ障害原因による障害が発生しなければ、以降も発生しないと考えられる時間間隔である。障害の発生時刻は、対応するイベントブロックの最初のイベントの発生日時とする。この境界時間tbは、次の(1)から(3)の手順で決める。
障害原因判定ルール検証コンピュータ107は、通信装置432を介して障害原因判定ルールDB106から登録障害分類木300、障害原因判定ルールテーブル310、障害ノードテーブル320を取得する。これらの情報に基づいて、障害原因判定ルール検証コンピュータ107は、登録障害分類木300を構築する際に訓練データとして使用した最初のイベントの発生日時t0と最後のイベントの発生日時との時間差を算出する。この時間差を、障害原因判定ルール検証コンピュータ107は、障害分類木を作成する際におけるイベントの時間範囲を与える分類木構築時間Δとする。
障害原因判定ルール検証コンピュータ107は、障害原因判定ルールテーブル310のうち障害原因判定ルール312が設定されている障害ノード311を検証対象に設定する。この検証対象としての障害ノードを、以下、「検証障害ノード」という。この後、障害原因判定ルール検証コンピュータ107は障害ノードテーブル320にアクセスし、検証障害ノードに対応するイベントブロック321に関する障害の発生時間間隔を計算する。
障害原因判定ルール検証コンピュータ107は、(2)で求めた発生時間間隔の分布から、仮説「ある障害ノードに分類される障害が発生してからtb後に発生した障害がその障害ノードに分類される」が有意水準1%の確率で棄却されるような境界値である境界時間tbを、仮説検定を用いて求める。
障害原因判定ルール検証コンピュータ107は、通信装置432を介してログDB103から、日時(t0+tb)から日時(t0+Δ)までのイベントを取得する。
障害原因判定ルール検証コンピュータ107は、ステップ702で取得したイベントを訓練データとして一時障害分類木を作成する。ここで、一時障害分類木は、障害原因判定ルール検証コンピュータ107で一時的に作成される障害分類木であり、登録障害分類木300と同様の方法で作成される。この一時障害分類木の場合も、障害原因判定ルールDB106と同様に、障害原因判定ルールテーブル、障害ノードテーブルが同時に作成される。作成された一時障害分類木、対応する障害原因判定ルールテーブル、障害ノードテーブルは、作業領域410に格納される。
障害原因判定ルール検証コンピュータ107は、検証開始日時tvsを計算する。検証開始日時tvsは、t0+Δ+tbとする。
障害原因判定ルール検証コンピュータ107は、監視対象サーバ群101内に障害を検知した監視サーバ102が送信したイベントを、通信装置432を介して受信する。
障害原因判定ルール検証コンピュータ107は、受信したイベントの発生日時teと検証開始日時tvsとを比較する。イベントの発生日時teが検証開始日時tvs以下の場合、障害原因判定ルール検証コンピュータ107は、ステップ710を実行する。イベント発生日時teが検証開始日時tvsより大きい場合、障害原因判定ルール検証コンピュータ107は、ステップ707を実行する。
障害原因判定ルール検証コンピュータ107は、障害原因判定ルールDB106の障害原因判定ルールテーブル310内の検証対象である障害ノードに設定されている障害原因判定ルール312の有効性を検証し、必要があれば障害原因判定ルールDB106の内容を更新する。この処理内容の詳細は後述する。
障害原因判定ルール検証コンピュータ107は、新しい検証開始日時tvsを設定する。新しい検証開始日時tvsは、次のように求める。まず、ステップ709で作成した一時障害分類木の検証障害ノードに対し、障害原因判定ルール検証コンピュータ107は、ステップ701の(2)及び(3)と同じ方法により、障害の発生時間間隔の境界時間tb’を計算する。次に、障害原因判定ルール検証コンピュータ107は、tvs+tb’を計算し、これを新しい検証開始日時tvsとする。
障害原因判定ルール検証コンピュータ107は、作業領域412に格納されている現在の一時障害分類木の障害ノードテーブルから時間範囲(tvs−Δ〜te)に発生したイベントを取得する。次に、障害原因判定ルール検証コンピュータ107は、取得したイベントを訓練データとして新規の一時障害分類木、障害原因判定ルールテーブル及び障害ノードテーブルを作成し、作業領域412に格納する。その後、障害原因判定ルール検証コンピュータ107は、現在の一時障害分類木及び対応する障害原因判定ルールテーブル、障害ノードテーブルは削除する。
障害原因判定ルール検証コンピュータ107は、受信したイベントからイベントブロックを作成し又は更新し、一時障害分類木を更新する。同時に、障害原因判定ルール検証コンピュータ107は、この一時障害分類木に対応する障害原因判定ルールテーブル及び障害ノードテーブルも更新する。
次に、図7−2に示す検証・更新プロセスの詳細動作を説明する。
(ステップ750)
障害原因判定ルール検証コンピュータ107は、一時障害分類木と障害原因判定ルールDB106の登録障害分類木300とを比較する。すなわち、一時的に生成した分類木と運用中の分類木を比較する。両分類木の構成が一致している場合、障害原因判定ルール検証コンピュータ107はステップ760を実行する。一方、不一致の場合、障害原因判定ルール検証コンピュータ107はステップ770を実行する。登録障害分類木と一時障害分類木との対応づけは、次のように行う。登録障害分類木作成時に訓練データとして使用した障害のイベントブロックを、登録分類木と一時障害分類木の両方で分類する。同じイベントブロックが分類された登録分類木の障害ノードと一時障害分類木の障害ノードとを対応する障害ノードとする。これにより、登録障害分類木の障害ノードが、一時障害分類木のどの障害ノードに対応しているかを判断できる。
障害原因判定ルール検証コンピュータ107は、一時障害分類木の検証障害ノードに、登録障害分類木の対応する障害ノードにない新しい障害が分類されているか否か判定する。一時障害分類木のみに存在する障害が存在しない場合、障害原因判定ルール検証コンピュータ107はステップ761を実行する。一方、一時障害分類木にのみ存在する障害が存在する場合、障害原因判定ルール検証コンピュータ107はステップ762を実行する。
障害原因判定ルール検証コンピュータ107は、障害原因判定ルールDB106を更新する。すなわち、障害原因判定ルール検証コンピュータ107は、障害原因判定ルールテーブル310から検証障害ノードに対応する障害原因判定ルールを削除する。なお、ここでの一時障害分類木は、登録障害分類木が作成されてから時間間隔の境界時間tb以降に作成されたものである。従って、同じ障害ノードに分類される障害が発生しなければ、今後この障害ノードに分類される障害は発生しないと判断できる。このため、検証障害ノードに設定された障害原因判定ルールを削除しても問題ない。
障害原因判定ルール検証コンピュータ107は、一時障害分類木の検証障害ノードに対する障害原因判定ルールをステップ501の(2)及び(3)で記述した方法で生成する。障害原因判定ルール検証コンピュータ107は、生成した一時障害分類木の検証障害ノードの障害原因判定ルールと、障害原因判定ルールテーブル310の障害原因判定ルールを比較し、一致していない場合はステップ763を実行する。
障害原因判定ルール検証コンピュータ107は、障害原因判定ルールDB106を更新する。すなわち、障害原因判定ルール検証コンピュータ107は、検証障害ノードに設定された障害原因判定ルールを、ステップ762で作成された障害原因判定ルールに置き換える。
障害原因判定ルール検証コンピュータ107は、一時障害分類木と登録障害分類木との差分を求める。一時障害分類木に登録障害分類木300にない障害ノードが存在する場合、障害原因判定ルール検証コンピュータ107は、ステップ771を実行する。登録障害分類木300に存在していた障害ノードが一時障害分類木には存在しない場合、障害原因判定ルール検証コンピュータ107は、ステップ772を実行する。登録障害分類木300に存在していた複数の障害ノードが一時障害分類木では一つの障害ノードにまとめられている場合、障害原因判定ルール検証コンピュータ107は、ステップ773を実行する。登録障害分類木300では一つの障害ノードが一時障害分類木では複数の障害ノードに分割された場合、障害原因判定ルール検証コンピュータ107は、ステップ774を実行する。
障害原因判定ルール検証コンピュータ107は、障害原因判定ルールDB106を更新する。すなわち、障害原因判定ルール検証コンピュータ107は、一時障害分類木に追加された新規の障害ノードに対してステップ501の(2)及び(3)の手順で障害原因判定ルールを作成し、作成された障害原因判定ルールを障害原因判定ルールテーブル310に追加する。
障害原因判定ルール検証コンピュータ107は、障害原因判定ルールDB106を更新する。すなわち、障害原因判定ルール検証コンピュータ107は、一時障害分類木には存在しないが、登録障害分類木300の検証障害ノード311には設定されている障害原因判定ルールテーブル310の障害原因判定ルール312を削除する。
障害原因判定ルール検証コンピュータ107は、障害原因判定ルールDB106を更新する。すなわち、障害原因判定ルール検証コンピュータ107は、統合される登録障害分類木300の複数の障害ノードに設定されていた障害原因判定ルール312を、障害原因判定ルールテーブル310から削除する。さらに、障害原因判定ルール検証コンピュータ107は、一時障害分類木の統合された障害ノードに対してステップ501の(2)及び(3)の手順で障害原因判定ルールを作成し、障害原因判定ルールテーブル310に追加する。ただし、作成した一時障害分類木の障害ノードの障害原因判定ルールの復旧手順書は、実績のある登録障害分類木300の障害ノード311に設定されていた障害原因判定ルール312の復旧手順315を活用する。
障害原因判定ルール検証コンピュータ107は、障害原因判定ルールDB106を更新する。すなわち、障害原因判定ルール検証コンピュータ107は、分割される登録障害分類木300の障害ノードに設定されていた障害原因判定ルール312を、障害原因判定ルールテーブル310から削除する。さらに、障害原因判定ルール検証コンピュータ107は、一時障害原因分類木の分割された複数の障害ノードに対してステップ501の(2)及び(3)の手順で障害原因判定ルールを作成し、障害原因判定ルールテーブル310に追加する。ただし、作成した一時障害分類木の障害ノードの障害原因判定ルールの復旧手順書は、実績のある登録分類木300の障害ノード311について設定されていた障害原因判定ルール312の復旧手順書315を活用する。
102…監視サーバ
103…ログデータベース(DB)
104…障害原因判定ルール生成コンピュータ
105…障害原因解析コンピュータ
106…障害原因判定ルールDB
107…障害原因判定ルール検証コンピュータ
108…復旧手順書データベース(DB)
109…復旧手順書閲覧コンピュータ
Claims (10)
- システム障害の発生時、監視対象であるサーバ群の状態に基づいて監視サーバが生成したイベントを取得する第一の処理部と、
予め設定しておいた時間窓内に発生したイベントを障害別に分類し、一時障害分類木を生成する第二の処理部と、
運用中の障害原因判定ルールに対応する登録障害分類木と一時障害分類木とを比較する第三の処理部と、
前記登録障害分類木と前記一時障害分類木の間の差分及び前記一時障害分類木の障害ノードから生成される障害判定ルールと運用中の前記障害判定ルールの間の差分に基づいて、運用中の前記障害原因判定ルールを更新する第四の処理部と
を有する障害原因判定ルール検証装置。 - 前記第二の処理部は、
一時障害分類木を作成する時間窓を、
登録障害分類木内の検証対象の障害ノードに分類されている障害の出現間隔時間の統計量に基づき、当該時間内に同じ障害ノードに分類される障害が発生しないならば、今後同様の障害が発生しないと判断できる時間間隔の境界時間として計算する
ことを特徴とする請求項1記載の障害原因判定ルール検証装置。 - 前記第三の処理部は、
登録障害分類木の訓練データとして使用したイベントブロックを、登録障害分類木と一時障害分類木のそれぞれについて分類した場合における同一イベントブロックの各分類先に該当する登録障害分類木の障害ノードと一時障害分類木の障害ノードとの比較により、登録分類木と一時障害分類木との間の前記比較を実行する
ことを特徴とする請求項1に記載の障害原因判定ルール検証装置。 - 前記第四の処理部は、
運用中の障害原因判定ルールを設定するのに用いた登録分類木の障害ノードに対応する一時障害分類木の障害ノードに対して障害原因判定ルールを作成した場合にあって、両ルール間に違いが検出されたとき、
運用中の前記障害原因判定ルールを、一時障害分類木の障害ノードに対して作成した障害原因判定ルールによって置換する
ことを特徴とする請求項1に記載の障害原因判定ルール検証装置。 - 前記第四の処理部は、
運用中の障害原因判定ルールに対応する登録障害分類木に存在しない障害ノードが一時障害分類木には存在する場合、
当該一時障害分類木にのみ存在する障害ノードに対する障害原因判定ルールを作成し、運用中の障害原因判定ルールに追加登録する
ことを特徴とする請求項1に記載の障害原因判定ルール検証装置。 - 前記第四の処理部は、
登録障害分類木内の検証対象の障害ノードに分類されている障害の出現間隔時間の統計量に基づき、当該時間内に同じ障害ノードに分類される障害が発生しないならば、今後同様の障害が発生しないと判断できる時間間隔の境界時間を経過しても、検証対象の障害ノードに分類される障害が発生しない場合、
当該障害ノードに対して設定されている障害原因判定ルールを、運用中の障害原因判定ルールから削除する
ことを特徴とする請求項1に記載の障害原因判定ルール検証装置。 - 前記第四の処理部は、
運用中の障害原因判定ルールに対応する登録障害分類木に存在した障害ノードが一時障害分類木には存在しない場合、
当該登録障害分類木にのみ存在する障害ノードに対して設定されている障害原因判定ルールを、運用中の障害原因判定ルールから削除する
ことを特徴とする請求項1に記載の障害原因判定ルール検証装置。 - 前記第四の処理部は、
運用中の障害原因判定ルールに対応する登録障害分類木では複数の障害ノードに分類されていたものが、一時障害分類木では1つの障害ノードに分類されている場合、
登録障害分類木の複数の障害ノードに設定されていた障害原因判定ルールを運用中の障害原因判定ルールから削除すると共に、一時障害分類木の障害ノードに対して作成した障害原因判定ルールを運用中の障害原因判定ルールに追加登録する
ことを特徴とする請求項1に記載の障害原因判定ルール検証装置。 - 前記第四の処理部は、
運用中の障害原因判定ルールに対応する登録障害分類木では一つの障害ノードに分類されていたものが、一時障害分類木では複数の障害ノードに分割されていた場合、
登録障害分類木の障害ノードに設定されていた障害原因判定ルールを運用中の障害原因判定ルールから削除すると共に、一時障害分類木で対応する複数の障害ノードのそれぞれについて作成さした各障害原因判定ルールを障害原因判定ルールに追加登録する
ことを特徴とする請求項1に記載の障害原因判定ルール検証装置。 - 障害原因判定ルール検証装置として機能するコンピュータに、
システム障害の発生時、監視対象であるサーバ群の状態に基づいて監視サーバが生成したイベントを取得する第一の処理と、
予め設定しておいた時間窓内に発生したイベントを障害別に分類し、一時障害分類木を生成する第二の処理と、
運用中の障害原因判定ルールに対応する登録障害分類木と一時障害分類木とを比較する第三の処理と、
前記登録障害分類木と前記一時障害分類木の間の差分及び前記一時障害分類木の障害ノードから生成される障害判定ルールと運用中の前記障害判定ルールの間の差分に基づいて、運用中の前記障害原因判定ルールを更新する第四の処理と
を実行させるコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010136300A JP5651381B2 (ja) | 2010-06-15 | 2010-06-15 | 障害原因判定ルール検証装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010136300A JP5651381B2 (ja) | 2010-06-15 | 2010-06-15 | 障害原因判定ルール検証装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012003406A true JP2012003406A (ja) | 2012-01-05 |
JP5651381B2 JP5651381B2 (ja) | 2015-01-14 |
Family
ID=45535332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010136300A Expired - Fee Related JP5651381B2 (ja) | 2010-06-15 | 2010-06-15 | 障害原因判定ルール検証装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5651381B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013121529A1 (ja) * | 2012-02-14 | 2013-08-22 | 株式会社日立製作所 | コンピュータプログラムおよび監視装置 |
WO2014141460A1 (ja) * | 2013-03-15 | 2014-09-18 | 株式会社日立製作所 | 管理システム |
WO2016120989A1 (ja) * | 2015-01-27 | 2016-08-04 | 株式会社日立製作所 | 管理計算機及びルールの試験方法 |
JP2017146810A (ja) * | 2016-02-18 | 2017-08-24 | 株式会社日立製作所 | 行動特定システムおよび行動特定方法 |
JPWO2021250873A1 (ja) * | 2020-06-12 | 2021-12-16 | ||
CN115619292A (zh) * | 2022-12-19 | 2023-01-17 | 云账户技术(天津)有限公司 | 一种问题管理的方法及装置 |
JP2023114001A (ja) * | 2022-02-04 | 2023-08-17 | 株式会社日立製作所 | 運用管理装置及び方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0276034A (ja) * | 1988-08-19 | 1990-03-15 | Internatl Business Mach Corp <Ibm> | 知識ベースと推論を手続型ソース・プログラム・コードに変換する方法 |
JPH03145846A (ja) * | 1989-11-01 | 1991-06-21 | Hitachi Ltd | 障害診断方法 |
JPH03269629A (ja) * | 1990-03-19 | 1991-12-02 | Nippon Telegr & Teleph Corp <Ntt> | 事例を用いた知識洗練処理方式 |
JPH06187158A (ja) * | 1992-12-21 | 1994-07-08 | Mitsubishi Electric Corp | 知識反映型異常診断装置 |
JPH0973315A (ja) * | 1995-09-07 | 1997-03-18 | Mitsubishi Electric Corp | 設備故障診断装置 |
JP2000209203A (ja) * | 1999-01-14 | 2000-07-28 | Nec Corp | ネットワ―ク障害情報管理システム及び記憶媒体 |
JP2003228485A (ja) * | 2002-02-06 | 2003-08-15 | Kawasaki Heavy Ind Ltd | 故障モード解析に基づく診断ルール構築方法及び診断ルール作成プログラム並びに故障診断装置 |
JP2006004346A (ja) * | 2004-06-21 | 2006-01-05 | Fujitsu Ltd | パターン検出プログラム |
-
2010
- 2010-06-15 JP JP2010136300A patent/JP5651381B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0276034A (ja) * | 1988-08-19 | 1990-03-15 | Internatl Business Mach Corp <Ibm> | 知識ベースと推論を手続型ソース・プログラム・コードに変換する方法 |
JPH03145846A (ja) * | 1989-11-01 | 1991-06-21 | Hitachi Ltd | 障害診断方法 |
JPH03269629A (ja) * | 1990-03-19 | 1991-12-02 | Nippon Telegr & Teleph Corp <Ntt> | 事例を用いた知識洗練処理方式 |
JPH06187158A (ja) * | 1992-12-21 | 1994-07-08 | Mitsubishi Electric Corp | 知識反映型異常診断装置 |
JPH0973315A (ja) * | 1995-09-07 | 1997-03-18 | Mitsubishi Electric Corp | 設備故障診断装置 |
JP2000209203A (ja) * | 1999-01-14 | 2000-07-28 | Nec Corp | ネットワ―ク障害情報管理システム及び記憶媒体 |
JP2003228485A (ja) * | 2002-02-06 | 2003-08-15 | Kawasaki Heavy Ind Ltd | 故障モード解析に基づく診断ルール構築方法及び診断ルール作成プログラム並びに故障診断装置 |
JP2006004346A (ja) * | 2004-06-21 | 2006-01-05 | Fujitsu Ltd | パターン検出プログラム |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013121529A1 (ja) * | 2012-02-14 | 2013-08-22 | 株式会社日立製作所 | コンピュータプログラムおよび監視装置 |
US9246777B2 (en) | 2012-02-14 | 2016-01-26 | Hitachi, Ltd. | Computer program and monitoring apparatus |
WO2014141460A1 (ja) * | 2013-03-15 | 2014-09-18 | 株式会社日立製作所 | 管理システム |
JP5946583B2 (ja) * | 2013-03-15 | 2016-07-06 | 株式会社日立製作所 | 管理システム |
US9628360B2 (en) | 2013-03-15 | 2017-04-18 | Hitachi, Ltd. | Computer management system based on meta-rules |
WO2016120989A1 (ja) * | 2015-01-27 | 2016-08-04 | 株式会社日立製作所 | 管理計算機及びルールの試験方法 |
JP2017146810A (ja) * | 2016-02-18 | 2017-08-24 | 株式会社日立製作所 | 行動特定システムおよび行動特定方法 |
JPWO2021250873A1 (ja) * | 2020-06-12 | 2021-12-16 | ||
WO2021250873A1 (ja) * | 2020-06-12 | 2021-12-16 | 日本電信電話株式会社 | ルール生成装置、ルール生成方法およびプログラム |
JP7392852B2 (ja) | 2020-06-12 | 2023-12-06 | 日本電信電話株式会社 | ルール生成装置、ルール生成方法およびプログラム |
JP2023114001A (ja) * | 2022-02-04 | 2023-08-17 | 株式会社日立製作所 | 運用管理装置及び方法 |
JP7369219B2 (ja) | 2022-02-04 | 2023-10-25 | 株式会社日立製作所 | 運用管理装置及び方法 |
CN115619292A (zh) * | 2022-12-19 | 2023-01-17 | 云账户技术(天津)有限公司 | 一种问题管理的方法及装置 |
CN115619292B (zh) * | 2022-12-19 | 2023-03-21 | 云账户技术(天津)有限公司 | 一种问题管理的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5651381B2 (ja) | 2015-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5651381B2 (ja) | 障害原因判定ルール検証装置及びプログラム | |
US20200097466A1 (en) | Method and system for implementing target model configuration metadata for a log analytics system | |
US9612898B2 (en) | Fault analysis apparatus, fault analysis method, and recording medium | |
US9411673B2 (en) | Management server, management system, and management method | |
JP6919569B2 (ja) | ログ分析システム、方法、及び記録媒体 | |
CN106209405B (zh) | 故障诊断方法及装置 | |
US11727025B2 (en) | Method and system for implementing a log parser in a log analytics system | |
WO2016161381A1 (en) | Method and system for implementing a log parser in a log analytics system | |
JP2011076292A (ja) | 取得可能な機器情報に応じた障害原因解析ルールの設計方法及び計算機 | |
JP5532053B2 (ja) | 運用管理装置及び運用管理方法 | |
JP5514643B2 (ja) | 障害原因判定ルール変化検知装置及びプログラム | |
JP2014048673A (ja) | ワークフロー生成サーバ、及び方法 | |
US20200241947A1 (en) | Management system of storage system | |
JP5798095B2 (ja) | ログ生成則作成装置及び方法 | |
JP5395719B2 (ja) | 障害原因解析システムにおけるルール生成装置及びそのプログラム | |
JP4928848B2 (ja) | 計算機システム統合管理環境におけるメッセージ変換装置 | |
US20180196708A1 (en) | System management apparatus and system management method | |
JP2003216457A (ja) | エラーログ収集解析エージェントシステム | |
WO2011161835A1 (ja) | 原因分析構成変更のための方法および装置 | |
JP5295062B2 (ja) | 複合イベント処理向けクエリ自動生成装置 | |
JP2018081403A (ja) | インシデント管理システム、インシデント管理方法およびコンピュータプログラム | |
US20230113860A1 (en) | Proactive network application problem log analyzer | |
JP2011107742A (ja) | 運用管理装置、運用管理方法、及びプログラム | |
JP5735326B2 (ja) | It障害検知・検索装置及びプログラム | |
JP2011118575A (ja) | 障害対策情報取得方法および管理サーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141028 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5651381 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |