JP2020038525A - 異常検知装置 - Google Patents

異常検知装置 Download PDF

Info

Publication number
JP2020038525A
JP2020038525A JP2018165682A JP2018165682A JP2020038525A JP 2020038525 A JP2020038525 A JP 2020038525A JP 2018165682 A JP2018165682 A JP 2018165682A JP 2018165682 A JP2018165682 A JP 2018165682A JP 2020038525 A JP2020038525 A JP 2020038525A
Authority
JP
Japan
Prior art keywords
abnormal state
abnormality
parameter
abnormal
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018165682A
Other languages
English (en)
Inventor
比良木 貴志
Takashi Hiraki
貴志 比良木
益成 宮本
Masunari Miyamoto
益成 宮本
弘樹 桑原
Hiroki Kuwabara
弘樹 桑原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone East Corp
Original Assignee
Nippon Telegraph and Telephone East Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone East Corp filed Critical Nippon Telegraph and Telephone East Corp
Priority to JP2018165682A priority Critical patent/JP2020038525A/ja
Publication of JP2020038525A publication Critical patent/JP2020038525A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】障害発生の前兆を検知し、サービス品質の向上を図る事のできる異常検知装置を提供する。【解決手段】異常検知装置1が、検知対象の異常状態のそれぞれに、異常状態の検知に用いるパラメータと判定方式とを関連付けた異常状態判定テーブルを保持する。収集部11が、監視対象のサーバ2A〜2Cから当該サーバの状態およびソフトウェアの状態に関するパラメータを収集する。検知部12が、異常状態判定テーブルを参照し、異常状態のそれぞれについて、異常状態判定テーブルにおいて関連付けられたパラメータを入力値として、異常状態判定テーブルにおいて関連付けられた判定方式を適用して異常状態を検知する。【選択図】図1

Description

本発明は、サーバの異常を検知する技術に関する。
パーソナルコンピュータや携帯端末などのネットワークにアクセス可能な機器は1人1台を上回る台数が保有されている。ネットワークを介して提供されるサービスは不可欠なものとなっている。サービスを提供するサーバに障害が発生するとサービスが利用できなくなる。そのため、サーバを監視し、サーバの障害に可能な限り素早く対応することで、障害発生時のサービス停止時間および影響範囲拡大を最小限に抑えることがより重要である。近年、クラウド上の仮想サーバを利用してサービスを提供することも多く、監視対象として仮想サーバやサーバ機能を有する携帯端末などの各種機器も含まれる。
一方、IoT(Internet of Things)機器の異常検知においては、ディープラーニングを用いた技術が開示されている(特許文献1)。特許文献1では、正常な状態のデータを学習し、正常な状態とは異なる特徴が抽出された場合に、異常な状態と判定することにより、IoT機器の異常を検知している。
特開2018−73258号公報
従来の監視システムは、障害発生後の対策に重点が置かれているため、対応が遅れがちであった。例えば、従来の監視システムは、障害を検知したサーバから障害発生通知の信号を受信することで障害の発生を検知し、管理者に障害発生を通知する。管理者は、障害発生後に対応することになり、顧客への影響は不可避であった。
障害の発生を防ぐためには、障害の発生よりも前の段階で対応ができるとよい。障害発生の前には、前兆となる異常な状態が続くことが多く、この異常な状態を検知し、対応することで、障害発生前の早い段階で障害の発生を未然に防ぐことができると考えられる。サーバ系の障害の発生に至る異常な状態は多種多様であり、網羅的に異常な状態を検知する必要がある。
本発明は、上記に鑑みてなされたものであり、障害発生の前兆を検知し、サービス品質の向上を図ることを目的とする。
本発明に係る異常検知装置は、監視対象のサーバから当該サーバの状態および当該サーバが実行するソフトウェアの状態に関するパラメータを収集する収集手段と、検知対象の複数の異常状態のそれぞれに、当該異常状態の検知に用いるパラメータと判定方式とを関連付けた異常状態判定テーブルを格納する記憶手段と、前記異常状態のそれぞれについて、前記異常状態判定テーブルにおいて関連付けられた前記パラメータを入力値として、前記異常状態判定テーブルにおいて関連付けられた前記判定方式を適用して前記異常状態を検知する検知手段を備えることを特徴とする。
上記異常検知装置において、前記異常状態判定テーブルにおいて、2つ以上のパラメータが関連付けられた前記異常状態の判定方式は、各パラメータの時間変化の相関に基づいて前記異常状態を検知する判定方式であることを特徴とする。
上記異常検知装置において、前記異常状態判定テーブルにおいて、単独のパラメータが関連付けられた前記異常状態の判定方式は、前記パラメータの値が正常な範囲内であるか否かに基づいて前記異常状態を検知する判定方式であることを特徴とする。
本発明によれば、障害発生の前兆を検知し、サービス品質の向上を図ることができる。
本実施の形態における異常検知装置の構成を示す機能ブロック図である。 異常状態判定テーブルの例を示す図である。 外れ値検知を説明するための図である。 変化点検知を説明するための図である。 ディープラーニングを説明するための図である。 検知、誤検知、検知漏れを説明するための図である。 変化が緩やかなデータを用いて、外れ値検知により異常を検知したときの様子を示す図である。 変化が緩やかなデータを用いて、ディープラーニングにより異常を検知したときの様子を示す図である。 変化が急なデータを用いて、外れ値検知により異常を検知したときの様子を示す図である。 変化が急なデータを用いて、ディープラーニングにより異常を検知したときの様子を示す図である。
以下、本発明の実施の形態について図面を用いて説明する。
図1は、本実施の形態における異常検知装置1の構成を示す機能ブロック図である。異常検知装置1は、監視対象のサーバ2A〜2Cから収集したサーバの状態やサーバが実行するソフトウェアの状態に関する運用データ(以下「パラメータ」と称する)を解析し、障害発生前の早い段階で各サーバ2A〜2Cの異常状態を検知する装置である。サーバ2A〜2Cのそれぞれは、Webサーバ、アプリケーションサーバ、及びデータベースサーバとして機能し、サーバ2A〜2Cが協調してサービスを提供する。サーバ2A〜2Cは、物理サーバであってもよいし、クラウド上の仮想サーバやサーバ機能を有する携帯端末などの各種機器であってもよい。異常検知装置1が、サーバ2A〜2Cから異常状態を検知するためのパラメータを取得できればよい。
図1の異常検知装置1は、収集部11、検知部12、通知部13、及び記憶部14を備える。異常検知装置1が備える各部は、演算処理装置、記憶装置等を備えたコンピュータにより構成して、各部の処理がプログラムによって実行されるものとしてもよい。このプログラムは異常検知装置1が備える記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。
収集部11は、監視対象のサーバ2A〜2Cからパラメータを受信する。本実施形態では、主に、単一プロセスの状態、プロセスグループの状態、及びノード(サーバ)の状態に関するパラメータを利用する。単一プロセスの状態を示すパラメータとしては、例えば、プロセスの生存時間、プロセスのユーザCPU使用率などが挙げられる。プロセスグループの状態を示すパラメータとしては、例えば、アプリケーションでのコネクション数、アプリケーションの応答速度などが挙げられる。ノードの状態を示すパラメータとしては、例えば、システムCPU使用率、メモリ使用率などが挙げられる。
検知部12は、受信した各パラメータを入力値として、検知対象の異常状態に応じた判定方式を適用し、サーバ2A〜2Cのそれぞれの異常状態を検知する。検知対象の異常状態に、その異常状態と相関のあるパラメータと、そのパラメータを用いた判定方式を関連付けた異常状態判定テーブルを記憶部14に格納しておく。検知部12は、異常状態判定テーブルに従って異常状態を検知する。異常状態判定テーブルでは、1種類のパラメータが関連付けられた異常状態の判定方式としては、正常範囲を設定し、入力したパラメータの値に基づいて判定する方法を関連付ける。2種類以上のパラメータが関連付けられた異常状態の判定方式としては、各パラメータの時間変化の相関に基づいて判定する方法を関連付ける。異常状態判定テーブルの詳細については後述する。
通知部13は、検知部12が異常状態を検知したときに、検知した異常状態を管理者へ通知する。例えば、通知部13は、検知した異常状態に関する情報を表示してもよいし、検知した異常状態に関する情報を管理者の端末などの別の装置へ送信してもよい。管理者は、通知された異常状態に応じた対処を行う。あるいは、サーバ2A〜2C自身が自動で対処可能な異常状態であれば、通知部13はサーバ2A〜2Cに対処方法を通知してもよい。サーバ2A〜2Cは、通知された対処方法に従って対処する。
記憶部14は、異常状態判定テーブルを格納する。記憶部14は、サーバ2A〜2Cから受信したパラメータを蓄積してもよい。
次に、異常状態判定テーブルについて説明する。
図2は、異常状態判定テーブルの例を示す図である。同図に示す異常状態判定テーブルでは、検知対象の異常状態の種別(以下「異常種別」と称する)のそれぞれにパラメータと判定方式を関連付けている。
本実施の形態では、発生し得る異常状態を複数の観点から検討し、23種類の異常種別を選定した。具体的には、過去に発生した障害を解析して異常状態を特定したり、OS起因の異常状態を推定したりすることで、41種類程度の異常種別を洗い出した。この41種類の異常種別について、既存の監視システムで異常が検知できるもの、及びハードウェア故障を除外し、さらに重複する異常を1つにまとめることで、障害発生につながる異常状態を網羅的に検知できる23種類の異常種別を選定した。
本実施の形態では、23種類の異常種別を一次対処手法に基づいて3つの異常グループに分類した。具体的には、23種類の異常種別を、単一プロセスの再起動で対処する単一プロセスの異常(6種類)、サービスの再起動で対処するプロセスグループの異常(11種類)、及びロードバランサにてサーバ閉塞、サーバの系切替、あるいはサーバの再起動で対処するノードの異常(6種類)の3つの異常グループに分類した。
異常状態判定テーブルにおいて異常種別に関連付けられたパラメータは、その異常種別と相関するパラメータである。異常種別と相関するパラメータを仮定し、実際に異常状態を発生させて変動が見られるパラメータを特定した。異常状態判定テーブルでは、異常種別のそれぞれに対して、その異常種別の検知に利用する1つまたは2つ以上のパラメータが関連付けられる。
異常状態判定テーブルにおいて異常種別に関連付けられた判定方式は、その異常種別の検知に用いる方法を示す。判定方式については、異常の検知に有効とされる各々のアルゴリズムの特長に基づき、異常種別のそれぞれに対して適切な判定方式を選定した。特に、複数のパラメータと相関のある異常種別については、複数のパラメータ間の相関を見ることができるアルゴリズムを選択した。
正常な状態の運用データの蓄積が多分にある状況下では、教師なし学習による異常の検知が有効とされる。教師なし学習で有効とされるアルゴリズムの代表的なものとしては、外れ値検知、変化点検知、ディープラーニングが知られている。
外れ値検知は、平均データから著しく離れた値を検出する場合に有効な手法である。図3に示すように、値が上下に変動するパラメータであって、異常時に大きく変動するものに適している。例えば、あるパラメータに閾値を設定しておき、閾値を基準として上下に正常状態を示す正常判定範囲を設定する。パラメータの値が正常判定範囲から外れた場合、そのパラメータが関連付けられた異常種別の異常状態であると判定する。
変化点検知は、状態が急激に変化したポイントを検出する場合に用いる手法である。図4に示すように、以前の状態からの大きな変化を検知する。例えば、あるパラメータの前回の値との差分をとり、その差分が所定の閾値よりも大きい場合に、そのパラメータが関連付けられた異常種別の異常状態であると判定する。変化点検知は、パラメータの値が上下に大きく動き、断続的に発生するような異常状態の検知には向かない。
ディープラーニングは、複数のパラメータの関係性を学習し、相関崩れなどを検知する手法である。図5に示すように、各パラメータの時間変化の相関が崩れたことを検知する。例えば、複数のパラメータ間の相関が崩れた場合に、複数のパラメータが関連付けられた異常種別の異常状態であると判定する。
上記のアルゴリズムのうち、外れ値検知と変化点検知は単独のパラメータの扱いが得意であり、ディープラーニングは単独のパラメータの検知には不向きである。本実施の形態では、単独のパラメータが関連付けられた異常種別の判定方式には、単独のパラメータの異常検知を得意とする外れ値検知を選定した。
外れ値検知の正常判定範囲は、もっとも誤検知が少なくなるように設定する。例えば、図6に示すように、正常データ(正常状態時のパラメータ)と異常データ(異常状態時のパラメータ)をパラメータの値ごとに並べ、誤検知が少なく閾値を自動的に設定して正常判定範囲を定める。異常データを正しく異常と検知することを検知という。誤検知とは、正常データを異常と検知することである。検知漏れとは、異常データを正常と検知することである。
外れ値検知と変化点検知は、複数のパラメータの各パラメータを独立して検知することで、複数のパラメータが関連付けられた異常種別を検知することもできるが、複数のパラメータ間の相関崩れの検知には不向きである。ディープラーニングは、相関関係を含め、複数のパラメータの異常の検知が可能である。本実施の形態では、複数のパラメータが関連付けられた異常種別の判定方式には、複数のパラメータ間の相関を見ることができるディープラーニングを選定した。正常な状態の運用データは膨大な量が蓄積されているので、正常な状態の運用データを学習させた学習モデルを用意する。
複数のパラメータが関連付けられた異常種別であっても、各パラメータを独立に見て異常検知できるものは判定方式として外れ値検知を選定してもよい。例えば、パラメータAまたはパラメータBのいずれかが正常判定範囲を超えた場合、あるいはパラメータAおよびパラメータBのどちらもが正常判定範囲を超えた場合に異常状態となるような異常種別の判定方式には、外れ値検知を選定してもよい。判定方式は、上記に限るものではなく、異常検知に適したものであればよい。
なお、異常状態判定テーブルでは、異常種別のそれぞれに、判定方式に加えて、選定された判定方式で用いる学習モデルや正常の範囲を定める閾値などの必要な情報を関連付けておく。
また、監視対象のサーバ2A〜2Cによって発生する異常状態が異なる場合もあるので、異常状態判定テーブルの異常種別のそれぞれに、監視対象のサーバ2A〜2Cを関連付けてもよい。異常検知装置1は、異常状態判定テーブルの異常種別のそれぞれについて、関連付けられたサーバ2A〜2Cの異常状態を検知する。
次に、本実施の形態の異常検知装置1の動作について説明する。
異常検知装置1は、サーバ2A〜2Cからパラメータを受信すると、記憶部14に記憶しておく。
異常検知装置1は、サーバ2A〜2Cのそれぞれについて、定期的に異常検知処理を開始する。異常検知装置1は、例えば、異常状態判定テーブルの項番1の異常種別から順番に異常状態の検知を行う。異常検知装置1は、異常状態判定テーブルを参照し、異常種別の判定に必要なパラメータを取得し、取得したパラメータを指定の判定方式に用いて異常種別を判定する。
異常状態を検知した場合、異常検知装置1は検知した異常状態を管理者へ通知する。
指定の項番の異常種別の判定が終わると、異常検知装置1は、異常状態判定テーブルの次の項番の異常種別の判定を行う。
異常状態判定テーブルの異常グループごとに検知処理の周期を変えてもよい。例えば、単一プロセスの異常のグループは短い周期で検知処理を行い、プロセスグループの異常のグループはより長い周期で検知処理を行い、ノードの異常のグループはさらに長い周期で検知処理を行う。
次に、パラメータ/異常度の変化の緩急の違い、アルゴリズムによる検知の差について説明する。
図7Aは、パラメータ/異常度の変化が緩やかなデータを用いて、外れ値検知により異常を検知したときの様子を示す図であり、図7Bは、ディープラーニングにより異常を検知したときの様子を示す図である。発生する障害は、SQL処理(PostgreSQLプロセス)滞留であり、データベースサーバを監視対象とした。異常検知の閾値の設定は3シグマとした。
図7Aの外れ値検知による異常の検知では、パラメータとしてCPUの割り込み実行時間割合を用いた。外れ値検知では、障害発生の1時間50分前に、異常を検知できた。
図7Bのディープラーニングによる異常の検知では、CPUの割り込み実行時間割合、I/O街のCPU時間の割合を用いて異常度を求めた。ディープラーニングでは、障害発生の5時間50分前に、異常を検知できた。
図8Aは、パラメータ/異常度の変化が急なデータを用いて、外れ値検知により異常を検知したときの様子を示す図であり、図8Bは、ディープラーニングにより異常を検知したときの様子を示す図である。発生する障害は、SQL処理(PostgreSQLプロセス)滞留であり、データベースサーバを監視対象とした。異常検知の閾値の設定は3シグマとした。
図8Aの外れ値検知による異常の検知では、パラメータとしてロードアベレージを用いた。外れ値検知では、障害発生の1時間前に、異常を検知できた。
図8Bのディープラーニングによる異常の検知では、ロードアベレージ、CPU(システム領域)使用率を用いて異常度を求めた。ディープラーニングでは、障害発生の1時間前に、異常を検知できた。
このように、パラメータ/異常度の変化の緩急の違いで、異常を検知できる時間に差が生じた。また、同じ障害においても判定方式のアルゴリズムにより差が有り、ディープラーニングの方が早く異常を検知できる場合があった。
以上説明したように、本実施の形態によれば、異常検知装置1が、検知対象の異常状態のそれぞれに、異常状態の検知に用いるパラメータと判定方式とを関連付けた異常状態判定テーブルを保持し、収集部11が、監視対象のサーバ2A〜2Cから当該サーバの状態およびソフトウェアの状態に関するパラメータを収集し、検知部12が、異常状態判定テーブルを参照し、異常状態のそれぞれについて、異常状態判定テーブルにおいて関連付けられたパラメータを入力値として、異常状態判定テーブルにおいて関連付けられた判定方式を適用して異常状態を検知することにより、障害発生につながる異常状態の検知を異常状態のそれぞれに適した方法で網羅的に検知することができ、より早い段階での対処が可能となる。
1…異常検知装置
11…収集部
12…検知部
13…通知部
14…記憶部
2A〜2C…サーバ
本発明に係る異常検知装置は、監視対象のサーバから当該サーバの状態および当該サーバが実行するソフトウェアの状態に関するパラメータを収集する収集手段と、検知対象の複数の異常状態のそれぞれに、当該異常状態の検知に用いるパラメータと判定方式とを関連付けた異常状態判定テーブルを格納する記憶手段と、前記異常状態のそれぞれについて、前記異常状態判定テーブルにおいて関連付けられた前記パラメータを入力値として、前記異常状態判定テーブルにおいて関連付けられた前記判定方式を適用して前記異常状態を検知する検知手段と、を備え、前記異常状態判定テーブルにおいて、2つ以上のパラメータが関連付けられた前記異常状態の判定方式は、各パラメータの時間変化の相関に基づいて前記異常状態を検知する判定方式であり、単独のパラメータが関連付けられた前記異常状態の判定方式は、前記パラメータの値が正常な範囲内であるか否かに基づいて前記異常状態を検知する判定方式であることを特徴とする。

Claims (3)

  1. 監視対象のサーバから当該サーバの状態および当該サーバが実行するソフトウェアの状態に関するパラメータを収集する収集手段と、
    検知対象の複数の異常状態のそれぞれに、当該異常状態の検知に用いるパラメータと判定方式とを関連付けた異常状態判定テーブルを格納する記憶手段と、
    前記異常状態のそれぞれについて、前記異常状態判定テーブルにおいて関連付けられた前記パラメータを入力値として、前記異常状態判定テーブルにおいて関連付けられた前記判定方式を適用して前記異常状態を検知する検知手段と、
    を備えることを特徴とする異常検知装置。
  2. 前記異常状態判定テーブルにおいて、2つ以上のパラメータが関連付けられた前記異常状態の判定方式は、各パラメータの時間変化の相関に基づいて前記異常状態を検知する判定方式であることを特徴とする請求項1に記載の異常検知装置。
  3. 前記異常状態判定テーブルにおいて、単独のパラメータが関連付けられた前記異常状態の判定方式は、前記パラメータの値が正常な範囲内であるか否かに基づいて前記異常状態を検知する判定方式であることを特徴とする請求項1又は2に記載の異常検知装置。
JP2018165682A 2018-09-05 2018-09-05 異常検知装置 Pending JP2020038525A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018165682A JP2020038525A (ja) 2018-09-05 2018-09-05 異常検知装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018165682A JP2020038525A (ja) 2018-09-05 2018-09-05 異常検知装置

Publications (1)

Publication Number Publication Date
JP2020038525A true JP2020038525A (ja) 2020-03-12

Family

ID=69738044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018165682A Pending JP2020038525A (ja) 2018-09-05 2018-09-05 異常検知装置

Country Status (1)

Country Link
JP (1) JP2020038525A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101634A (zh) * 2020-08-21 2020-12-18 河南中烟工业有限责任公司 一种导致缺陷产品的故障设备预测方法
JP2021099888A (ja) * 2020-09-29 2021-07-01 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド サービス情報処理方法、装置、設備、コンピュータ記憶媒体、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011902A (ja) * 2004-06-28 2006-01-12 Hitachi Ltd 運用管理支援システムおよび性能情報表示方法
JP2010257227A (ja) * 2009-04-24 2010-11-11 Toshiba Corp 監視装置およびサーバー
JP2013161305A (ja) * 2012-02-06 2013-08-19 Nippon Telegr & Teleph Corp <Ntt> リソース監視装置、リソース監視システム、リソース監視方法及びリソース監視プログラム
WO2014020908A1 (ja) * 2012-08-03 2014-02-06 日本電気株式会社 システム状態判別支援装置、及び、システム状態判別支援方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011902A (ja) * 2004-06-28 2006-01-12 Hitachi Ltd 運用管理支援システムおよび性能情報表示方法
JP2010257227A (ja) * 2009-04-24 2010-11-11 Toshiba Corp 監視装置およびサーバー
JP2013161305A (ja) * 2012-02-06 2013-08-19 Nippon Telegr & Teleph Corp <Ntt> リソース監視装置、リソース監視システム、リソース監視方法及びリソース監視プログラム
WO2014020908A1 (ja) * 2012-08-03 2014-02-06 日本電気株式会社 システム状態判別支援装置、及び、システム状態判別支援方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101634A (zh) * 2020-08-21 2020-12-18 河南中烟工业有限责任公司 一种导致缺陷产品的故障设备预测方法
JP2021099888A (ja) * 2020-09-29 2021-07-01 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド サービス情報処理方法、装置、設備、コンピュータ記憶媒体、及びプログラム
JP7256217B2 (ja) 2020-09-29 2023-04-11 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド サービス情報処理方法、装置、設備、コンピュータ記憶媒体、及びプログラム
US11663037B2 (en) 2020-09-29 2023-05-30 Beijing Baidu Netcom Science And Technology Co., Ltd. Service information processing method, apparatus, device and computer storage medium

Similar Documents

Publication Publication Date Title
EP3745272B1 (en) An application performance analyzer and corresponding method
US8645769B2 (en) Operation management apparatus, operation management method, and program storage medium
Tan et al. Adaptive system anomaly prediction for large-scale hosting infrastructures
JP5428372B2 (ja) 運用管理装置および運用管理方法ならびにそのプログラム
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
CN110888783A (zh) 微服务系统的监测方法、装置以及电子设备
JP5267749B2 (ja) 運用管理装置、運用管理方法、及びプログラム
US20160020965A1 (en) Method and apparatus for dynamic monitoring condition control
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
JPWO2012101933A1 (ja) 運用管理装置、運用管理方法、及びプログラム
US8448025B2 (en) Fault analysis apparatus, fault analysis method, and recording medium
JP2015028700A (ja) 障害検知装置、障害検知方法、障害検知プログラム及び記録媒体
CN112579327B (zh) 一种故障检测方法、装置及设备
US20150113337A1 (en) Failure symptom report device and method for detecting failure symptom
JP2018028783A (ja) システム状態可視化プログラム、システム状態可視化方法及びシステム状態可視化装置
CN112738099B (zh) 一种检测慢速攻击的方法、装置、存储介质和电子设备
JP2020038525A (ja) 異常検知装置
JP2016535365A (ja) コンピュータネットワークにおけるルートキット検出
US8719626B2 (en) Proactively removing channel paths in error from a variable scope of I/O devices
JP4559974B2 (ja) 管理装置及び管理方法及びプログラム
JP2017211806A (ja) 通信の監視方法、セキュリティ管理システム及びプログラム
JP7082285B2 (ja) 監視システム、監視方法および監視プログラム
JP5459431B2 (ja) 運用管理装置および運用管理方法
CN114610560B (zh) 系统异常监控方法、装置和存储介质
US11314573B2 (en) Detection of event storms

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200310

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200929