JP2013201695A - 障害重要度処理サーバ装置、ネットワーク管理システム、障害重要度推定方法およびプログラム - Google Patents
障害重要度処理サーバ装置、ネットワーク管理システム、障害重要度推定方法およびプログラム Download PDFInfo
- Publication number
- JP2013201695A JP2013201695A JP2012069900A JP2012069900A JP2013201695A JP 2013201695 A JP2013201695 A JP 2013201695A JP 2012069900 A JP2012069900 A JP 2012069900A JP 2012069900 A JP2012069900 A JP 2012069900A JP 2013201695 A JP2013201695 A JP 2013201695A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- importance
- occurrence
- processing unit
- interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
Abstract
【解決手段】重要度処理部22は、重要度の登録されていない障害について、当該障害の発生頻度と発生間隔のばらつきとに基づいて障害発生履歴データベース21(障害発生履歴テーブル)を参照して、当該障害の重要度を推定する。これにより、重要度処理部22は、重要度の定義されていない障害について、当該障害の重要度(問題のレベル)を、障害の重要度と、障害の発生頻度、および、発生間隔のばらつきとの相関関係に基づいて、より適切に推定し得る。
【選択図】図1
Description
これにより、パケット交換網、及びそれを構成するパケット交換機の監視において、重要な障害情報の把握と大局的な障害状況の把握を容易にし、障害の原因切分け、分析を効率的に行う、とされている。
重要度の定義されていない障害については、運用段階において当該障害の問題のレベルを把握できず、管理しない障害として見過ごしてしまうおそれがある。
図1は、本発明の一実施形態におけるネットワーク管理システムの構成を示す概略ブロック図である。
この図において、ネットワーク管理システム100は、障害管理サーバ装置1、障害重要度処理サーバ装置2およびオペレータ端末4を備えている。そして、障害管理サーバ装置1は監視網3と通信ネットワークで接続されている。また、障害管理サーバ装置1は障害重要度処理サーバ装置2およびオペレータ端末4と接続されている。
また、障害発生履歴データベース21は、本発明における重要度記憶部(第2重要度記憶部)の一例である。障害発生履歴データベース21は、重要度を未登録の障害について重要度処理部22が重要度を推定するために、障害毎の重要度を、障害発生頻度と、障害発生間隔のばらつきと対応付けて記憶する。
障害種別は、障害の種別を示す。この障害種別としては、様々なレベルのものを用いることができる。例えば、サーバ装置32における「CPU故障」など、同種の装置に共通のものであってもよいし、装置毎に規定されるものであってもよい。
障害発生時刻は、最新の障害発生時刻、すなわち、最後に障害が発生した時刻を示す。
重要度は障害の重要度であり、障害の影響の重大性や障害に対する対応の必要性などに基づいて、例えばネットワーク管理システム100の運用管理者が定義(設定)し、障害管理データベース11に登録する。
障害解消時刻は、発生した障害が解決された時刻を示す。障害が未解消の状態では、障害解消時刻として空白など未解消を示す値が格納されている。
また、初期設定者が障害を登録する際、監視網3の各装置を運用前であり障害の重要度を判断できないこともあり得る。この場合、初期設定者は、重要度を空白とするなど重要度の値を未登録であることを示す値とする。
このように、障害の重要度が登録されていない場合があり得る。
例えば、障害処理部12は、監視網3から送信された障害通知から障害発生時刻を読み出して障害管理データベース11に記憶させる。また、障害処理部12は、監視網3から送信された障害解消通知から障害解消時刻を読み出して障害管理データベース11に記憶させる。
同図に示す障害発生履歴テーブルは、監視網3内のネットワーク機器31またはサーバ装置32にて発生した障害の履歴を格納しており、1行が1つの障害履歴に対応している。そして、同図の例では、障害発生履歴テーブルの各行は、障害識別子、障害種別、障害発生箇所、重要度、障害発生初回時刻、障害発生最終時刻、発生回数、前回発生時との間隔および平均発生間隔を保持している。例えば、行L21には、障害識別子がZZZalm4AA、障害種別がalm4、障害発生箇所がルータB、重要度が1、障害発生初回時刻が2011/12/0212:00:00、障害発生最終時刻が2011/12/0213:00:00、発生回数が121回、前回発生時刻との間隔が30秒、平均発生間隔が30秒との障害情報を保存している。
発生回数は、該当する障害の発生回数を示す。例えば、重要度処理部22は、障害通知を受ける毎に、該当する障害の発生回数をカウントアップすることで、障害発生回数を計数する。
平均発生間隔は、障害発生初回時刻から障害発生最終時刻までの時間を、発生回数から1引いた数で除算した値である。
同図に示す障害分類スコアテーブルは、図3を参照して説明した障害発生履歴テーブルにおける、「平均発生間隔」と「前回発生時刻との間隔」との差の絶対値として定義される間隔差(以下、単に「間隔差」と称する)、および、発生回数(単位時間当たりの発生回数、すなわち発生頻度)の組み合わせに対応付けて、障害分類スコアを格納している。障害分類スコアは、後述するように、障害発生履歴データベース21が記憶する障害の重要度を更新するための係数として用いられる。重要度処理部22は、障害の重要度および障害分類スコアを繰り返し計算することで、障害の重要度のクラスタリングを行う。
ある時刻n(障害の発生回数がn回のとき)において、障害発生履歴データベース21が記憶している障害almの重要度をsv(n)almとする。また、障害almにおける間隔差iおよび発生回数jに対応付けて障害分類スコアデータベース23が記憶している障害分類スコアをc(n)i,jとする。n+1回目の障害発生において障害almが発生した場合、重要度処理部22は、式(1)に基づいて、時刻n+1における障害almの重要度sv(n+1)almを計算する。
なお、事前に1分ごとなど定期的に発生するが問題のない障害が発生するなどの事象が分かっている場合には、運用管理者の設計方針によりスコアを固定して保持できるようにしてもよい。また、設計方針により指定されたスコアは、計算には含まれないように設定できるようにしてもよい。
同図の処理において、まず、ネットワーク通信部14は、受信した障害通知を障害処理部12に出力する(ステップS101)。
障害重要度処理サーバ装置2では、重要度処理部22が障害通知を取得し、取得した場外通知に基づいて障害発生履歴テーブルを更新する(ステップS112)。
なお、障害通知に障害種別や障害発生箇所の情報が含まれている場合は、重要度処理部22は、これらの情報も追加した行に書き込む。
また、重要度処理部22は、該当行の発生回数の項目の値を1増やす。そして、重要度処理部22は、障害発生初回時刻から障害発生最終時刻までの時間を発生回数で除算して平均発生間隔を算出し、該当行の平均発生間隔の項目に書き込む。また、重要度処理部22は、前回の障害発生時刻から障害発生最終時刻までの時間を算出して、該当行の前回発生との間隔の項目に書き込む。
具体的には、重要度処理部22は、障害通知の示す障害の発生頻度として、発生回数を障害発生履歴テーブルから読み出す。また、重要度処理部22は、障害通知の示す障害の発生間隔のばらつきとして、間隔差(前回発生との間隔(前回の障害発生から今回の障害発生までの時間)と、平均発生間隔との差の絶対値)を算出する。
また、重要度処理部22は、障害発生履歴において重要度の登録されている障害の各々について、間隔差を算出する。
そして、重要度処理部22は、障害発生履歴において重要度の登録されている障害のうち、障害通知の示す障害と、発生回数および間隔差の組み合わせにおいて最も類似するものを選択する。例えば、重要度処理部22は、障害発生履歴において重要度の登録されている障害の各々について、当該障害の発生回数および間隔差と、障害通知の示す障害の発生回数および間隔差とのユークリッド距離(√(発生回数の差の二乗+間隔差の差の二乗))を求める。そして、重要度処理部22は、ユークリッド距離の最も近い障害を選択する。
そして、重要度処理部22は、選択した障害の重要度を、障害通知の示す障害の重要度の推定値として障害発生履歴テーブルから読み出す。
その後、同図の処理を終了する。
また、障害処理部12は、重要度を登録済みであることを示す情報と共に障害通知を障害重要度処理サーバ装置2に出力する(ステップS122)。
障害重要度処理サーバ装置2では、重要度処理部22が障害通知を取得し、取得した場外通知に基づいて、次に説明するテーブル更新処理を行う(ステップS123)。
その後、同図の処理を終了する。
図6の処理において、重要度処理部22は、まず、障害分類スコアデータベース23が記憶している障害分類スコアを利用して、障害通知が示す障害の障害発生履歴テーブルにおける重要度を、上述した式(1)に従って更新する(ステップS201)。
その後、同図の処理を終了して図5の処理に戻る。
これにより、重要度処理部22は、障害の平均発生間隔と当該障害が前回発生してから今回発生するまで間隔との差の絶対値を求めるという簡単な計算で障害発生間隔のばらつきを求めることができる。従って、重要度処理部22の負荷を抑制することができ、また、重要度処理部22が重要度を推定する処理時間の増大を抑制することができる。また、障害発生履歴データベース21は、障害の平均発生間隔、および、障害が前回発生してから今回発生するまで間隔を記憶しておけばよく、障害発生時刻を全回分記憶しておく必要が無い。従って、障害発生履歴データベース21の記憶容量を抑制することができる。
これにより、重要度処理部22は、同様の障害発生頻度と障害発生間隔のばらつきとを有する障害に対して同様の更新を行うことになり、重要度の値が類似してくる(差が小さくなる)ことが考えられる。すなわち、重要度処理部22は、重要度の更新によって障害の重要度のクラスタリングを行っている。
従って、重要度処理部22は、より安定的に(同様の障害発生頻度と障害発生間隔のばらつきとを有する障害に対して同様の重要度を推定するように)重要度の推定を行い得る。
これにより、重要度処理部22が上記のクラスタリングを行っても、障害処理部12は、重要度が定義され登録されている障害について、当該定義されている重要度(従って、固定の重要度)をオペレータ端末に通知できる。
図7は、障害重要度処理サーバ装置における本発明の最小構成を示す概略ブロック図である。同図において、障害重要度処理サーバ装置102は、重要度記憶部121と、重要度処理部122とを具備する。
これにより、重要度処理部122は、重要度処理部22(図1)と同様、重要度の定義されていない障害について、当該障害の重要度(問題のレベル)を、障害の重要度と、障害の発生頻度、および、発生間隔のばらつきとの相関関係に基づいて、より適切に推定し得る。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
1 障害管理サーバ装置
11 障害管理データベース
12 障害処理部
13 端末制御部
14 ネットワーク通信部
2 障害重要度処理サーバ装置
21 障害発生履歴データベース
22 重要度処理部
23 障害分類スコアデータベース
3 監視網
31 ネットワーク機器
32 サーバ装置
4 オペレータ端末
Claims (6)
- 障害毎の重要度を、障害発生頻度と、障害発生間隔のばらつきと対応付けて記憶する重要度記憶部と、
重要度の登録されていない障害の障害通知を取得すると、当該障害の発生頻度と発生間隔のばらつきとに基づいて前記重要度記憶部を参照して、当該障害の重要度を推定する重要度処理部と、
を具備することを特徴とする障害重要度処理サーバ装置。 - 前記障害発生間隔のばらつきとして、当該障害の平均発生間隔と当該障害が前回発生してから今回発生するまで間隔との差の絶対値を用いることを特徴とする請求項1に記載の障害重要度処理サーバ装置。
- 前記重要度処理部は、重要度と障害発生頻度と障害発生間隔のばらつきとが既知の障害の障害通知を取得すると、当該障害通知に基づいて前記重要度記憶部が記憶する前記重要度を更新することを特徴とする請求項1または請求項2に記載の障害重要度処理サーバ装置。
- 通知用の重要度として、障害毎の重要度を記憶する第1重要度記憶部と、
推定用の重要度として、障害毎の重要度を、障害発生頻度と、障害発生間隔のばらつきと対応付けて記憶する第2重要度記憶部と、
前記第1重要度記憶部に重要度の登録されていない障害の障害通知を取得すると、当該障害の発生頻度と発生間隔のばらつきとに基づいて前記第2重要度記憶部を参照して、当該障害の重要度を推定する重要度処理部と、
前記第1重要度記憶部に重要度の登録されている障害の障害通知を取得すると、当該第1重要度記憶部に登録されている当該重要度を出力し、前記第1重要度記憶部に重要度の登録されていない障害の障害通知を取得すると、前記重要度処理部が推定した前記重要度を出力する障害処理部と、
を具備することを特徴とするネットワーク管理システム。 - 障害毎の重要度を、障害発生頻度と、障害発生間隔のばらつきと対応付けて記憶する重要度記憶部を具備する障害重要度処理サーバ装置の重要度推定方法であって、
重要度の登録されていない障害の障害通知を取得すると、当該障害の発生頻度と発生間隔のばらつきとに基づいて前記重要度記憶部を参照して、当該障害の重要度を推定する重要度推定ステップを具備することを特徴とする障害重要度推定方法。 - 障害毎の重要度を、障害発生頻度と、障害発生間隔のばらつきと対応付けて記憶する重要度記憶部を具備する障害重要度処理サーバ装置に、
重要度の登録されていない障害の障害通知を取得すると、当該障害の発生頻度と発生間隔のばらつきとに基づいて前記重要度記憶部を参照して、当該障害の重要度を推定する重要度推定ステップを実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012069900A JP5862403B2 (ja) | 2012-03-26 | 2012-03-26 | 障害重要度処理サーバ装置、ネットワーク管理システム、障害重要度推定方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012069900A JP5862403B2 (ja) | 2012-03-26 | 2012-03-26 | 障害重要度処理サーバ装置、ネットワーク管理システム、障害重要度推定方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013201695A true JP2013201695A (ja) | 2013-10-03 |
JP5862403B2 JP5862403B2 (ja) | 2016-02-16 |
Family
ID=49521558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012069900A Active JP5862403B2 (ja) | 2012-03-26 | 2012-03-26 | 障害重要度処理サーバ装置、ネットワーク管理システム、障害重要度推定方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5862403B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016127485A (ja) * | 2015-01-06 | 2016-07-11 | 富士通株式会社 | 無線装置 |
CN106998263A (zh) * | 2015-10-09 | 2017-08-01 | 谷歌公司 | 用于保持网络服务级别的系统和方法 |
JP2020086666A (ja) * | 2018-11-19 | 2020-06-04 | ブラザー工業株式会社 | 通信装置及び通信装置のためのコンピュータプログラム |
US10873515B2 (en) | 2017-01-10 | 2020-12-22 | Fujitsu Limited | Recording medium recording packet analysis program, packet analysis method, and information processing device |
JPWO2021079521A1 (ja) * | 2019-10-25 | 2021-04-29 | ||
JP2021128664A (ja) * | 2020-02-17 | 2021-09-02 | 富士通フロンテック株式会社 | メッセージ監視サーバ、メッセージ監視方法及びメッセージ監視プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004320267A (ja) * | 2003-04-15 | 2004-11-11 | Nec Software Chubu Ltd | 障害通報装置および障害通報方法 |
-
2012
- 2012-03-26 JP JP2012069900A patent/JP5862403B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004320267A (ja) * | 2003-04-15 | 2004-11-11 | Nec Software Chubu Ltd | 障害通報装置および障害通報方法 |
Non-Patent Citations (1)
Title |
---|
JPN6015048032; 竹原 元康 他: 'ビジネス向けサービスを拡充するM1000およびMAPSの開発' NTT DoCoMoテクニカル・ジャーナル Vol.13 No.2, 20050701, 第55〜61頁, 社団法人電気通信協会 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016127485A (ja) * | 2015-01-06 | 2016-07-11 | 富士通株式会社 | 無線装置 |
CN106998263A (zh) * | 2015-10-09 | 2017-08-01 | 谷歌公司 | 用于保持网络服务级别的系统和方法 |
CN106998263B (zh) * | 2015-10-09 | 2021-05-25 | 谷歌有限责任公司 | 用于保持网络服务级别的系统和方法 |
US10873515B2 (en) | 2017-01-10 | 2020-12-22 | Fujitsu Limited | Recording medium recording packet analysis program, packet analysis method, and information processing device |
JP2020086666A (ja) * | 2018-11-19 | 2020-06-04 | ブラザー工業株式会社 | 通信装置及び通信装置のためのコンピュータプログラム |
JP7172492B2 (ja) | 2018-11-19 | 2022-11-16 | ブラザー工業株式会社 | 通信装置及び通信装置のためのコンピュータプログラム |
JPWO2021079521A1 (ja) * | 2019-10-25 | 2021-04-29 | ||
JP7334792B2 (ja) | 2019-10-25 | 2023-08-29 | 日本電信電話株式会社 | ルール生成装置、方法及びプログラム |
JP2021128664A (ja) * | 2020-02-17 | 2021-09-02 | 富士通フロンテック株式会社 | メッセージ監視サーバ、メッセージ監視方法及びメッセージ監視プログラム |
JP7208939B2 (ja) | 2020-02-17 | 2023-01-19 | 富士通フロンテック株式会社 | メッセージ監視サーバ、メッセージ監視方法及びメッセージ監視プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5862403B2 (ja) | 2016-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5862403B2 (ja) | 障害重要度処理サーバ装置、ネットワーク管理システム、障害重要度推定方法およびプログラム | |
US9246777B2 (en) | Computer program and monitoring apparatus | |
JP5428934B2 (ja) | 障害パターン生成プログラムおよび障害パターン生成装置 | |
JP6126891B2 (ja) | 検出方法、検出プログラム、および検出装置 | |
US9584617B2 (en) | Allocating cache request in distributed cache system based upon cache object and marker identifying mission critical data | |
US9917741B2 (en) | Method and system for processing network activity data | |
US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
JP4667412B2 (ja) | 電子機器集中管理プログラム、電子機器集中管理装置および電子機器集中管理方法 | |
US11706079B2 (en) | Fault recovery method and apparatus, and storage medium | |
JP4826831B2 (ja) | 障害検知装置、障害検知方法及びそのプログラム | |
CN106230997B (zh) | 一种资源调度方法和装置 | |
US11625315B2 (en) | Software regression recovery via automated detection of problem change lists | |
US9658908B2 (en) | Failure symptom report device and method for detecting failure symptom | |
WO2014013603A1 (ja) | 監視システム及び監視プログラム | |
JP2016143299A (ja) | リスク評価システムおよびリスク評価方法 | |
GB2476578A (en) | Identifying a failed component in a network system | |
JP5521456B2 (ja) | 監視システム及びプログラム | |
JP2016122337A (ja) | 障害情報提供サーバ、障害情報提供方法 | |
JP6068296B2 (ja) | 制御装置、計算資源管理方法及び計算資源管理プログラム | |
JP2016181022A (ja) | 情報処理装置、情報処理プログラム、情報処理方法、及びデータセンタシステム | |
WO2018201864A1 (zh) | 一种数据库性能诊断方法、装置、设备以及存储介质 | |
WO2020261621A1 (ja) | 監視システム、監視方法及びプログラム | |
JP6060123B2 (ja) | 影響範囲特定装置、影響範囲特定方法、及びプログラム | |
JP6513001B2 (ja) | 故障検知装置、故障検知方法、及びプログラム | |
US8719633B2 (en) | Search device, search method, and search program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5862403 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |