JP5836316B2 - Fault monitoring system, fault monitoring method, and fault monitoring program - Google Patents
Fault monitoring system, fault monitoring method, and fault monitoring program Download PDFInfo
- Publication number
- JP5836316B2 JP5836316B2 JP2013103976A JP2013103976A JP5836316B2 JP 5836316 B2 JP5836316 B2 JP 5836316B2 JP 2013103976 A JP2013103976 A JP 2013103976A JP 2013103976 A JP2013103976 A JP 2013103976A JP 5836316 B2 JP5836316 B2 JP 5836316B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- event
- correlation
- fault
- events
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明はネットワークノードに生じた障害を監視するためのシステム、方法、及びプログラムに関する。 The present invention relates to a system, a method, and a program for monitoring a failure occurring in a network node.
計算機ネットワークに接続する何れかのネットワークノードに障害が生じると、一つの障害事象に対して多くのネットワークノードが相互に影響し合う結果、複数の副次的な障害イベントが発生することがある。障害の箇所と原因を特定する障害解析技術の一つとして、例えば、特開09−064971号公報にて詳述されているように、障害イベント相互間のコリレーション(関連性)を利用するイベント・コリレーション技術が知られている。 When a failure occurs in any one of the network nodes connected to the computer network, a plurality of secondary failure events may occur as a result of a number of network nodes affecting one failure event. As one of failure analysis techniques for identifying the location and cause of a failure, for example, as described in detail in Japanese Patent Application Laid-Open No. 09-064971, an event that uses correlation (relationship) between failure events -Correlation technology is known.
しかし、計算機ネットワーク構成の変化の影響を受けて複数の障害イベント相互間のコリレーションが変動するにも関わらず、従来のイベント・コリレーション技術では、複数の障害イベント相互間のコリレーションが固定されていたため、計算機ネットワーク構成を忠実に反映した障害解析がなされていなかった。 However, despite the fact that the correlation between multiple failure events fluctuates due to changes in the computer network configuration, the conventional event correlation technology fixes the correlation between multiple failure events. Therefore, failure analysis that accurately reflects the computer network configuration has not been performed.
そこで、本発明は、計算機ネットワーク構成を忠実に反映した障害解析を行うことを課題とする。 Therefore, an object of the present invention is to perform failure analysis that faithfully reflects the computer network configuration.
上記の課題を解決するため、本発明に係る障害監視システムは、ネットワークノードに生じた複数の障害イベント間の動的コリレーションを障害イベントの回復履歴に基づいて計算し直す計算手段と、複数の障害イベント間の動的コリレーションを計算の結果に基づいて更新する更新手段と、複数の障害イベント間に初期設定された静的コリレーションを一定周期間隔で減算する減算手段と、複数の障害イベントのうち所定の障害イベントに対する動的コリレーション又は静的コリレーションのうち高い方が閾値以上である何れかの障害イベントが存在することを条件として、所定の障害イベントの発生の通知を制限する制限手段とを備える。所定の障害イベント(例えば、障害イベントB)に対する動的コリレーション又は静的コリレーションのうち高い方が閾値以上である何れかの障害イベント(例えば、障害イベントA)が存在する場合は、当該何れかの障害イベント(例えば、障害イベントA)の解消に起因して所定の障害イベント(例えば、障害イベントB)が解消する確率が統計的に高いため、そのような障害イベント(例えば、障害イベントB)の発生の通知を制限することでオペレータの監視負担を軽減できる。 In order to solve the above-described problem, a failure monitoring system according to the present invention includes a calculation unit that recalculates dynamic correlation between a plurality of failure events occurring in a network node based on a recovery history of the failure event, Update means for updating dynamic correlation between failure events based on the calculation result, subtraction means for subtracting static correlation that is initially set between multiple failure events at regular intervals, and multiple failure events A restriction that restricts notification of occurrence of a predetermined failure event on condition that there is a failure event whose higher one of the dynamic correlation or static correlation for the predetermined failure event is greater than or equal to a threshold value Means . If there is any failure event (for example, failure event A) in which the higher one of the dynamic correlation or static correlation for a predetermined failure event (for example, failure event B) is greater than or equal to the threshold, Since there is a statistically high probability that a predetermined failure event (for example, failure event B) is resolved due to the cancellation of the failure event (for example, failure event A), such a failure event (for example, failure event B) ) Can be reduced to reduce the monitoring burden on the operator.
本発明によれば、計算機ネットワーク構成を忠実に反映した障害解析を行うことができる。 According to the present invention, failure analysis that faithfully reflects the computer network configuration can be performed.
以下、各図を参照しながら本発明の実施形態について説明する。
図1は、本実施形態に関わるイベント・コリレーションの一例を示す説明図である。イベントとは、広義には、コンピュータに状態遷移をもたらす事象を意味し、とりわけ障害イベントと呼ばれるイベントは、コンピュータに障害をもたらす事象を意味する。本明細書では、ネットワークノードに生じた複数の障害イベント相互間のコリレーションを定量的に評価する指標として、一方の障害イベントの解消に起因して他方の障害イベントが解消する統計的な確率を用いる。例えば、図1に示す例では、障害イベントAの障害イベントBに対するコリレーションは、障害イベントAの解消に起因して障害イベントBが解消する確率95%であり、障害イベントBの障害イベントAに対するコリレーションは、障害イベントBの解消に起因して障害イベントAが解消する確率20%である。同様に、障害イベントBの障害イベントCに対するコリレーションは、障害イベントBの解消に起因して障害イベントCが解消する確率80%であり、障害イベントCの障害イベントBに対するコリレーションは、障害イベントCの解消に起因して障害イベントBが解消する確率10%である。また、障害イベントCの障害イベントAに対するコリレーションは、障害イベントCの解消に起因して障害イベントAが解消する確率20%であり、障害イベントAの障害イベントCに対するコリレーションは、障害イベントAの解消に起因して障害イベントCが解消する確率85%である。本明細書では、第一の障害イベントの第二の障害イベントに対するコリレーションが閾値(例えば、確率80%)以上であるときに、第一の障害イベントは第二の障害イベントの「原因」であり、第二の障害イベントは第一の障害イベントの「影響下にある」と定義する。図1に示す例では、障害イベントAの障害イベントBに対するコリレーションは、確率95%であるから、障害イベントAは障害イベントBの原因であり、障害イベントBは障害イベントAの影響下にある。なお、図1では、説明の便宜上、三つの障害イベント相互間のコリレーションについて説明したが、障害イベントの数が二つ或いは四つ以上の場合でも同様に障害イベント相互間のコリレーションを定義することができる。
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 is an explanatory diagram illustrating an example of event correlation associated with the present embodiment. The event broadly means an event that causes a state transition in the computer, and an event called a failure event particularly means an event that causes a failure in the computer. In this specification, as an index for quantitatively evaluating the correlation between a plurality of failure events occurring in a network node, a statistical probability that the other failure event is eliminated due to the elimination of one failure event is used. Use. For example, in the example illustrated in FIG. 1, the correlation of the failure event A to the failure event B has a probability of 95% that the failure event B is resolved due to the resolution of the failure event A. Correlation has a 20% probability that the failure event A is resolved due to the resolution of the failure event B. Similarly, the correlation of the failure event B to the failure event C has a probability of 80% that the failure event C is resolved due to the cancellation of the failure event B, and the correlation of the failure event C to the failure event B is The probability that the failure event B is resolved due to the resolution of C is 10%. Further, the correlation of the failure event C to the failure event A has a probability of 20% that the failure event A is resolved due to the cancellation of the failure event C. The correlation of the failure event A to the failure event C is the failure event A. There is a probability of 85% that the failure event C is resolved due to the resolution of the above. As used herein, the first failure event is the “cause” of the second failure event when the correlation of the first failure event to the second failure event is greater than or equal to a threshold (eg,
図2は本実施形態に係る障害監視システム10によるアラーム通知の概要を示す説明図である。計算機ネットワークに接続するネットワークノード20に複数の障害イベントA,B,Cが発生すると、障害監視システム10は、複数の障害イベントA,B,C相互間のコリレーションをチェックし、どの障害イベントの影響下にもない障害イベントの発生をオペレータ30に通知する。何れかの障害イベントの影響下にある障害イベントは、原因となる障害イベントの解消に起因して同時に解消する確率が統計的に高いため、どの障害イベントの影響下にもない障害イベントを選択し、これをオペレータ30に通知することにより、監視負担を軽減できる。図2に示す例では、複数の障害イベントA,B,Cのうち障害イベントAのみが他の障害イベントの影響下にないため、監視システム10は、複数の障害イベントA,B,Cの中から障害イベントAを選択し、これをオペレータ30に通知する。
FIG. 2 is an explanatory diagram showing an overview of alarm notification by the
図3は本実施形態に関わる障害監視システム10の構成を示すブロック図である。障害イベントA,B,C相互間のコリレーションは、計算機ネットワーク構成の変化の影響を受けて随時変動し得るため、障害監視システム10は、障害イベントA,B,Cの回復履歴に基づいて障害イベントA,B,C相互間のコリレーションを定期的に計算し直すことにより計算機ネットワーク構成を忠実に反映した障害解析を可能にしている。障害監視システム10は、通信インタフェース11、プロセッサ12、表示装置13、入力装置14、記憶資源15、及びバス16を備える。通信インタフェース11は、計算機ネットワークを介してネットワークノード20に接続しており、ネットワークノード20からの障害イベントA,B,Cの発生通知を受信する。ネットワークノード20は、例えば、ルータ、スイッチ、ハブ、及び小型基地局等である。プロセッサ12は、記憶資源15に格納されている障害監視プログラム40を解釈及び実行することにより、障害監視処理(例えば、図4乃至図7に示す処理)を行う。入力装置14は、例えば、オペレータ30からの入力操作を受け付けるキーボードやマウス等である。記憶資源15の一部は、障害管理プログラム40のワークエリアとして使用され、障害中リスト51、復旧中リスト52、及び通知対象リスト53を一時的に格納する。障害中リスト51は、ネットワークノード20から障害発生が通知された障害イベントをリスト化したものである。復旧中リスト52は、障害回復処理がなされている最中の障害イベントをリスト化したものである。通知対象リスト53は、表示装置13にアラーム表示する障害イベントをリスト化したものである。アラーム表示とは、障害の発生を警報するメッセージを表示装置13に表示することをいい、アラーム通知と同義である。
FIG. 3 is a block diagram illustrating a configuration of the
記憶資源15には、障害イベントA,B,C相互間のコリレーションの計算結果を格納するコリレーションファイル61と、障害イベントA,B,Cの回復履歴を格納するログファイル62とが保存されている。記憶資源15は、例えば、コンピュータ読み取り可能な記録媒体(物理デバイス)が提供する記憶領域(論理デバイス)である。コンピュータ読み取り可能な記録媒体は、例えば、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶資源を含む。コンピュータ読み取り可能な記録媒体は、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、プログラムを一時的に保持しているものも含むものとする。また、障害監視プログラム40は、伝送媒体を介して、或いは伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、障害監視プログラム40を伝送する伝送媒体は、インターネット等のネットワークや電話回線等の通信回線のように情報を伝送する機能を有する媒体のことをいう。汎用のコンピュータに障害監視プログラム40をインストールすることにより、汎用のコンピュータを障害監視システム10として機能させることができる。バス16は、通信インタフェース11、プロセッサ12、表示装置13、入力装置14、及び記憶資源15を相互に接続し、データの読み書きができるように構成されている。
The
障害監視プログラム40は、複数の障害イベント相互間のコリレーションを2種類の変数を用いて計算する。一つは、静的コリレーションと呼ばれる変数であり、もう一つは、動的コリレーションと呼ばれる変数である。静的コリレーションは、ある値に初期設定され、その後、ある一定の周期間隔で初期値から所定確率の分だけ減算されていくようにプログラム上宣言された変数である。動的コリレーションは、障害イベントの回復履歴に基づいて定期的に計算し直された上で更新されていくようにプログラム上宣言された確率変数である。
The
図4は本実施形態に関わる障害発生時のアラーム表示の流れを示すフローチャートである。
ステップ401では、プロセッサ12は、ネットワークノード20から障害イベントの発生の通知を受信したか否かを判定する。
ステップ402では、プロセッサ12は、障害中リスト51にリストされている障害イベントを参照する。障害中リスト51には、ネットワークノード20から障害発生が通知された障害イベントがリストされている。
ステップ403では、プロセッサ12は、障害中リスト51に複数の障害イベントがリストされているか否かを判定する。
ステップ404では、プロセッサ12は、障害中リスト51にリストされている障害イベントを通知対象リスト53に追加し、通知対象リスト53に追加された障害イベントの発生を表示装置13にアラーム表示する。
ステップ405では、プロセッサ12は、障害中リスト51にリストされている複数の障害イベントの中から二つの障害イベントを選択する。
ステップ406では、プロセッサ12は、ステップ405で選択された二つの障害イベント(例えば、障害イベントA,B)のうち一方の障害イベント(例えば、障害イベントA)の他方の障害イベント(例えば、障害イベントB)に対する静的コリレーションと動的コリレーションのうち高い方が閾値(例えば、80%)以上であるか否かを判定する。但し、静的コリレーションは、無効化される場合もあるので(図7のステップ705参照)、静的コリレーションが無効化されている場合は、ステップ406では、動的コリレーションが閾値を超えているか否かが判定される。
ステップ407では、プロセッサ12は、ステップ405で選択された二つの障害イベント(例えば、障害イベントA,B)のうち一方の障害イベント(例えば、障害イベントA)を他方の障害イベント(例えば、障害イベントB)の「原因」であると判定する。
ステップ408では、プロセッサ12は、障害中リスト51にリストされている複数の障害イベントの中から二つの障害イベントの全ての組み合わせについて、ステップ405〜407の処理を実行したか否かを判定する。
ステップ409では、プロセッサ12は、障害中リスト51にリストされている複数の障害イベントのうちどの障害イベントの影響下にもない障害イベントを通知対象リスト53に追加し、通知対象リスト53に追加された障害イベントの発生を表示装置13にアラーム表示する。これにより、何れかの障害イベントの影響下にある障害イベントの通知を制限することができるため、オペレータの監視負担を軽減できる。但し、障害中リスト51にリストされている複数の障害イベントが互いに影響し合う場合には、どの障害イベントの影響下にもない障害イベントが存在しない。このような場合には、影響を受ける障害イベントの数が最も少ない障害イベントを通知対象リスト53に追加し、通知対象リスト53に追加された障害イベントの発生を表示装置13にアラーム表示すればよい。
FIG. 4 is a flowchart showing the flow of alarm display when a failure occurs according to this embodiment.
In
In
In
In
In
In
In
In
In
図5は本実施形態に関わるログファイル62の管理の流れを示すフローチャートである。
ステップ501では、プロセッサ12は、ネットワークノード20から障害イベントの復旧通知を受信したか否かを判定する。
ステップ502では、プロセッサ12は、ステップ501で受信した復旧通知により復旧対象となる障害イベントを復旧中リスト52に追加する。
ステップ503では、プロセッサ12は、復旧中リスト52に追加された障害イベントの処理済みフラグをオフに設定する。
ステップ504では、プロセッサ12は、復旧中リスト52に追加されている障害イベントの中から処理済みフラグがオフに設定されている障害イベントを一つ選択し、選択した障害イベントに関する回復履歴をログファイル62に記録する。回復履歴は、例えば、ステップ504で選択した障害イベントの種別と、ステップ504で選択した障害イベントの解消に起因して解消する全ての障害イベントの種別と、ステップ504で選択した障害イベントが解消しても解消しない全ての障害イベントの種別と、ステップ504の処理を行った日時を含む。
ステップ505では、プロセッサ12は、ステップ504の処理が完了した障害イベントの処理済みフラグをオンに設定する。
ステップ506では、プロセッサ12は、復旧中リスト52にリストされている全ての障害イベントについてステップ504,505の処理を完了したか否かを判定する。
ステップ507では、プロセッサ12は、復旧中リスト52にリストされている全ての障害イベントを削除する。
FIG. 5 is a flowchart showing the flow of management of the
In
In
In
In
In
In
In
図6は本実施形態に関わる動的コリレーションの管理の流れを示すフローチャートである。
ステップ601では、プロセッサ12は、過去一定期間内(例えば、過去数ヶ月以内)にログファイル62に記録されている回復履歴をリストアップする。
ステップ602では、プロセッサ12は、ステップ601でリストアップされた回復履歴の中から任意の二つの障害イベント(例えば、障害イベントA,B)を選択し、選択された二つの障害イベントのうち一方の障害イベント(例えば、障害イベントA)の解消に起因して他方の障害イベント(例えば、障害イベントB)が解消した回数N1と、一方の障害イベント(例えば、障害イベントA)の解消に起因して他方の障害イベント(例えば、障害イベントB)が解消しない回数N2とを計算する。
ステップ603では、プロセッサ12は、ステップ602で選択された二つの障害イベントのうち一方の障害イベント(例えば、障害イベントA)の他方の障害イベント(例えば、障害イベントB)に対する動的コリレーションをN1/(N1+N2)に基づいて計算し直す。
ステップ604では、プロセッサ12は、ステップ602で選択された二つの障害イベントのうち一方の障害イベント(例えば、障害イベントA)の他方の障害イベント(例えば、障害イベントB)に対する動的コリレーションの値が、ステップ603で計算し直された値に一致するように、コリレーションファイル61を更新する。
ステップ605では、プロセッサ12は、任意の二つの障害イベントの全ての組み合わせについて、ステップ602〜604の処理を実行したか否かを判定する。
なお、ステップ601〜605を実行するためのソフトウェアモジュールは、障害管理プログラム40の中で定期的に呼び出されて実行されるようにプログラムされており、これにより、動的コリレーションの値を定期的に最新の値に更新することができる。
FIG. 6 is a flowchart showing the flow of dynamic correlation management according to the present embodiment.
In
In
In
In
In
Note that the software module for executing
図7は本実施形態に関わる静的コリレーションの管理の流れを示すフローチャートである。
ステップ701では、プロセッサ12は、任意の二つの障害イベント(例えば、障害イベントA,B)を選択し、選択した二つの障害イベントのうち一方の障害イベント(例えば、障害イベントA)の他方の障害イベント(例えば、障害イベントB)に対する静的コリレーションの初期値と、一定の周期間隔で初期値から減算される静的コリレーションの減算値とを設定する。静的コリレーションの初期値とその減算値は、オペレータ30が事前に指定することができる。減算値はゼロでもよい。
ステップ702では、プロセッサ12は、後述するステップ706の処理が完了してから一定の周期期間が経過したか否かを判定する。
ステップ703では、プロセッサ12は、ステップ701で選択された二つの障害イベントのうち一方の障害イベント(例えば、障害イベントA)の他方の障害イベント(例えば、障害イベントB)に対する静的コリレーションの値を、ステップ701で設定された減算値の分だけ減算する。
ステップ704では、プロセッサ12は、ステップ701で選択された二つの障害イベントのうち一方の障害イベント(例えば、障害イベントA)の他方の障害イベント(例えば、障害イベントB)に対する静的コリレーションの値が閾値(例えば、80%)を下回るか否かを判定する。
ステップ705では、プロセッサ12は、ステップ701で選択された二つの障害イベントのうち一方の障害イベント(例えば、障害イベントA)の他方の障害イベント(例えば、障害イベントB)に対する静的コリレーションを無効化し、その旨をオペレータ30に通知する。
ステップ706では、プロセッサ12は、任意の二つの障害イベントの全ての組み合わせについて、ステップ701〜705の処理を実行したか否かを判定する。
FIG. 7 is a flowchart showing a flow of management of static correlation related to the present embodiment.
In
In
In
In
In
In
本実施形態によれば、複数の障害イベントA,B,C間のコリレーションを障害イベントA,B,Cの回復履歴に基づいて計算し直して更新することにより、計算機ネットワーク構成を忠実に反映した障害解析が可能になる。また、計算機ネットワークが構築された初期段階では、動的コリレーションよりも静的コリレーションの方が実態に即している場合もあるため、動的コリレーション加えて静的コリレーションを加味することで、計算機ネットワーク構成を忠実に反映した障害解析を可能にできる。 According to the present embodiment, the correlation between a plurality of failure events A, B, and C is recalculated and updated based on the recovery history of the failure events A, B, and C, thereby faithfully reflecting the computer network configuration. Failure analysis is possible. In addition, in the initial stage when the computer network is constructed, static correlation may be more realistic than dynamic correlation. Therefore, it is possible to perform failure analysis that accurately reflects the computer network configuration.
10…障害監視システム 11…通信インタフェース 12…プロセッサ 13…表示装置 14…入力装置 15…記憶資源 20…ネットワークノード 30…オペレータ 40…障害監視プログラム 51…障害中リスト 52…復旧中リスト 53…通知対象リスト 61…コリレーションファイル 62…ログファイル
DESCRIPTION OF
Claims (4)
前記複数の障害イベント間の動的コリレーションを前記計算の結果に基づいて更新する更新手段と、
前記複数の障害イベント間に初期設定された静的コリレーションを一定周期間隔で減算する減算手段と、
前記複数の障害イベントのうち所定の障害イベントに対する動的コリレーション又は静的コリレーションのうち高い方が閾値以上である何れかの障害イベントが存在することを条件として、前記所定の障害イベントの発生の通知を制限する制限手段と、
を備える障害監視システム。 A calculation means for recalculating the dynamic correlation between a plurality of failure events occurring in the network node based on the recovery history of the failure event;
Updating means for updating dynamic correlation between the plurality of failure events based on the result of the calculation;
Subtracting means for subtracting the static correlation that is initially set between the plurality of failure events at regular intervals;
Occurrence of the predetermined fault event on condition that any one of the plurality of fault events has a fault correlation event where the higher one of the dynamic correlation or static correlation for the predetermined fault event is greater than or equal to a threshold value Limiting means to limit notifications for
A fault monitoring system comprising:
前記複数の障害イベントは、第一の障害イベント及び第二の障害イベントを含み、
前記第一の障害イベントの前記第二の障害イベントに対する動的コリレーションは、前記第一の障害イベントの解消に起因して前記第二の障害イベントが解消する確率である、障害監視システム。 The fault monitoring system according to claim 1,
The plurality of failure events includes a first failure event and a second failure event;
The fault monitoring system, wherein the dynamic correlation of the first fault event with respect to the second fault event is a probability that the second fault event is resolved due to the resolution of the first fault event.
前記複数の障害イベント間の動的コリレーションを前記計算の結果に基づいて更新するステップと、
前記複数の障害イベント間に初期設定された静的コリレーションを一定周期間隔で減算するステップと、
前記複数の障害イベントのうち所定の障害イベントに対する動的コリレーション又は静的コリレーションのうち高い方が閾値以上である何れかの障害イベントが存在することを条件として、前記所定の障害イベントの発生の通知を制限するステップと、
を備える障害監視方法。 Recalculating the dynamic correlation between multiple failure events occurring in the network node based on the failure event recovery history;
Updating a dynamic correlation between the plurality of failure events based on a result of the calculation;
Subtracting static correlations initialized between the plurality of failure events at regular intervals;
Occurrence of the predetermined fault event on condition that any one of the plurality of fault events has a fault correlation event where the higher one of the dynamic correlation or static correlation for the predetermined fault event is greater than or equal to a threshold value Steps to limit notifications for
A fault monitoring method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013103976A JP5836316B2 (en) | 2013-05-16 | 2013-05-16 | Fault monitoring system, fault monitoring method, and fault monitoring program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013103976A JP5836316B2 (en) | 2013-05-16 | 2013-05-16 | Fault monitoring system, fault monitoring method, and fault monitoring program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014225124A JP2014225124A (en) | 2014-12-04 |
JP5836316B2 true JP5836316B2 (en) | 2015-12-24 |
Family
ID=52123763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013103976A Active JP5836316B2 (en) | 2013-05-16 | 2013-05-16 | Fault monitoring system, fault monitoring method, and fault monitoring program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5836316B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111381969A (en) * | 2020-03-16 | 2020-07-07 | 北京隆普智能科技有限公司 | Management method and system of distributed software |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109218129A (en) * | 2018-08-29 | 2019-01-15 | 郑州云海信息技术有限公司 | A kind of upgrade detection method based on log, device, memory and equipment |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4746850B2 (en) * | 2004-06-21 | 2011-08-10 | 富士通株式会社 | Pattern generation program |
JP4527642B2 (en) * | 2005-09-29 | 2010-08-18 | 富士通株式会社 | Network failure diagnosis apparatus, network failure diagnosis method, and network failure diagnosis program |
JP5489085B2 (en) * | 2009-05-15 | 2014-05-14 | 日本電気株式会社 | Failure cause estimation system, failure cause estimation method, and failure cause estimation program |
JP5297987B2 (en) * | 2009-11-19 | 2013-09-25 | 富士通テレコムネットワークス株式会社 | Alert management device and alert management method |
-
2013
- 2013-05-16 JP JP2013103976A patent/JP5836316B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111381969A (en) * | 2020-03-16 | 2020-07-07 | 北京隆普智能科技有限公司 | Management method and system of distributed software |
CN111381969B (en) * | 2020-03-16 | 2021-10-26 | 北京康吉森技术有限公司 | Management method and system of distributed software |
Also Published As
Publication number | Publication date |
---|---|
JP2014225124A (en) | 2014-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110516971B (en) | Anomaly detection method, device, medium and computing equipment | |
JP6307453B2 (en) | Risk assessment system and risk assessment method | |
US9917741B2 (en) | Method and system for processing network activity data | |
US20160085452A1 (en) | Systems and methods for highly scalable system log analysis, deduplication and management | |
US20170124502A1 (en) | Selecting key performance indicators for anomaly detection analytics | |
US9355005B2 (en) | Detection apparatus and detection method | |
WO2015140843A1 (en) | Information processing device, influence-process extraction method, and recording medium | |
JP2020520499A (en) | Method for managing snapshot in blockchain, computer program, snapshot node, auditor node and system | |
US10769641B2 (en) | Service request management in cloud computing systems | |
JP6259522B2 (en) | Software fault location method, apparatus and equipment | |
JPWO2012101933A1 (en) | Operation management apparatus, operation management method, and program | |
JP2016091402A (en) | Risk evaluation system and risk evaluation method | |
US10361905B2 (en) | Alert remediation automation | |
US20140033178A1 (en) | Method and apparatus for reverse debugging source code using causal analysis | |
US20210103487A1 (en) | Systems, methods, and devices for reducing systemic risks | |
JPWO2020136859A1 (en) | Estimator, estimation method, and program | |
JP6649294B2 (en) | State determination device, state determination method, and program | |
JP5836316B2 (en) | Fault monitoring system, fault monitoring method, and fault monitoring program | |
US20190129781A1 (en) | Event investigation assist method and event investigation assist device | |
US20150067139A1 (en) | Agentless monitoring of computer systems | |
US20160050101A1 (en) | Real-Time Network Monitoring and Alerting | |
CN114756401B (en) | Abnormal node detection method, device, equipment and medium based on log | |
CN114679295B (en) | Firewall security configuration method and device | |
US20200202230A1 (en) | Cognitive device support for potentially affected devices | |
US9674060B2 (en) | Dynamic and selective management of integration points using performance metrics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150408 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151028 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5836316 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |