JP2011205276A - 故障検出装置 - Google Patents

故障検出装置 Download PDF

Info

Publication number
JP2011205276A
JP2011205276A JP2010069216A JP2010069216A JP2011205276A JP 2011205276 A JP2011205276 A JP 2011205276A JP 2010069216 A JP2010069216 A JP 2010069216A JP 2010069216 A JP2010069216 A JP 2010069216A JP 2011205276 A JP2011205276 A JP 2011205276A
Authority
JP
Japan
Prior art keywords
failure
determination value
traffic information
failure determination
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010069216A
Other languages
English (en)
Other versions
JP5421831B2 (ja
Inventor
Anass Benjebbour
アナス ベンジャブール
Yuta Sakae
佑太 寒河江
Junichiro Hagiwara
淳一郎 萩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2010069216A priority Critical patent/JP5421831B2/ja
Publication of JP2011205276A publication Critical patent/JP2011205276A/ja
Application granted granted Critical
Publication of JP5421831B2 publication Critical patent/JP5421831B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Small-Scale Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】故障検出に係る演算量の増加を抑制し、故障検出速度を低下させることなく、ネットワーク装置の故障を精度よく検出すること。
【解決手段】故障検出装置8は、ネットワーク装置に対する複数の異なるトラヒック情報を取得する複数のトラヒック情報取得部16a,16bと、取得した各トラヒック情報から故障判断値をそれぞれ算出する複数の故障判断値算出部18a,18bと、前記故障判断値算出部18a,18bで算出した各故障判断値に対してそれぞれ重みづけをし、重みづけされた各故障判断値を統合して総合故障判断値を生成する故障判断値統合部12と、前記故障統合判断値統合部12で生成された前記総合故障判断値に基づいて前記ネットワーク装置の故障を検出する故障検出部13と、を備えたものである。
【選択図】図2

Description

本発明は、ネットワーク装置の故障を検出する故障検出装置に関する。
有線ネットワークや無線ネットワーク等の様々な通信ネットワークに属するネットワーク装置においては、自装置内部やネットワーク内の他のネットワーク装置の故障をアラームとして上げる監視機能を有するものが知られている。このネットワーク装置は、ポーリング等の監視機能によって自装置や他のネットワーク装置の故障を早期に検出し、サービス品質の低下を早期に回復している。
ところで、ネットワーク装置の故障には、ハードウェアの不具合以外にもソフトウェアやファームウェア上のバグにより一部の処理に不具合を及ぼすものも含まれる。この場合、上記したような監視機能では、ハードウェアの故障を検出できるものの、ソフトウェア等による故障の検出が困難な場合があった。例えば、検出対象のネットワーク装置において、ソフトウェア上のバグによりトラヒック処理だけに不具合が生じる場合には、ポーリング等の監視機能に対して正常に反応するために、故障を検出することが困難となっていた。
従来、このような故障を含め、様々な方法で故障を検出することが検討されている。例えば、トラヒックの自己類似性に基づいて故障を検出するものや(非特許文献1)、複数のトラヒック情報の予測誤差を算出して、算出した誤差を利用して対象とするネットワーク装置の故障を検出するもの(非特許文献2)等が検討されている。
M.F.Rohani, M.A.Maarof, A.Selamat and H.Kettani, "Uncovering Anomaly Traffic Based on Loss of Self-Similarity Behavior Using Second Order Statistical Model, "IJCSNS International Journal of Computer Science and Network Security, VOL.7, No.9, Sep. 2007. J.D.Brutlag, "Abberant behavior detection in time series for network monitoring," Proceedings of the 14th USENIX conference on System administration 2000.
しかしながら、上記従来の故障検出方法では、以下に示すような問題点があった。例えば、トラヒックの自己類似性に基づく故障検出法の場合には、粒度の細かいデータが必要になると共に、新たなトラヒック情報が観測される度に故障検出を実施するため演算量が膨大となる。この故障検出に係る演算量を抑制するために、故障検出タイミングを粗くした場合には故障検出の速度が遅くなり、故障検出に用いるトラヒック情報の粒度を粗くした場合には故障検出精度が低下してしまう問題があった。
また、無線環境に応じてトラヒック情報は時間的に大きく変動するため、単一のトラヒック情報や故障検出用の閾値を用いて故障検出を行う場合には、検出可能な故障事象が限定され、故障の未検出又は誤検出が生じる恐れがある。
本発明は、かかる点に鑑みてなされたものであり、故障検出に係る演算量の増加を抑制し、故障検出速度を低下させることなく、ネットワーク装置の故障を精度よく検出することができる故障検出装置を提供することを目的とする。
本発明の故障検出装置は、ネットワーク装置に対する複数の異なるトラヒック情報を取得する複数のトラヒック情報取得部と、取得した各トラヒック情報から故障判断値をそれぞれ算出する複数の故障判断値算出部と、前記故障判断値算出部で算出した各故障判断値に対してそれぞれ重みづけをし、重みづけされた各故障判断値を統合して総合故障判断値を生成する故障判断値統合部と、前記故障統合判断値統合部で生成された前記総合故障判断値に基づいて前記ネットワーク装置の故障を検出する故障検出部と、を備えたことを特徴とする。
この構成によれば、複数の異なるトラヒック情報から算出した各故障判断値を統合した総合故障判断値に基づいて故障を検出するので、従来の故障検出方法と比べて故障検出に係る演算量の増加を抑制し、故障検出速度を低下させることなく、ネットワーク装置の故障を精度よく検出することができる。また、2つの故障判断値を統合した総合故障判断値から総合的に故障有無を検出するので、従来のように単一のトラヒック情報や故障検出用の閾値を用いて故障検出を行う場合と比べて、検出可能な故障事象が拡大し、故障の未検出又は誤検出を防止することができる。
本発明によれば、故障検出に係る演算量の増加を抑制し、故障検出速度を低下させることなく、ネットワーク装置の故障を精度よく検出することができる。
本発明に係る故障検出装置の実施の形態を示す図であり、故障検出装置が属する無線通信システムの概要の説明図である。 本発明の実施の形態に係る故障検出装置の機能ブロック図である。 本実施の形態に係る故障検出装置の動作概要の一例を示すフロー図である。
以下、本発明の実施の形態について添付図面を参照して詳細に説明する。なお、以下の実施の形態においては、本発明に係る故障検出装置を、無線端末装置と無線基地局装置との間の無線区間を含む無線通信システムに配置した例について説明するが、この構成に限定されるものではない。故障検出装置を配置可能な通信システムであればよく、例えば、パーソナルコンピュータや固定電話などの固定端末装置が接続されるインターネットや公衆交換電話網(PSTN:Public Switched Telephone Networks)等の無線区間を含まない有線通信システムに故障検出装置を配置する構成としてもよい。
まず故障検出装置の詳細を説明する前に、故障検出装置が属する通信システムの概要の一例について説明する。図1は、本発明の実施の形態に係る故障検出装置が属する通信システムの概要図である。
図1に示すように、無線通信システム1においては、無線基地局装置3に無線接続された携帯電話等の無線端末装置2により、スイッチ装置4やルータ装置5等の中継装置6を介して通信が行われている。ルータ装置5には、無線端末装置2に対して各種サービスを提供する外部サーバ装置7や、無線通信システム1内の装置故障を検出する故障検出装置8が接続されている。
故障検出装置8は、無線基地局装置3、中継装置6、外部サーバ装置7を監視しており、無線基地局装置3、中継装置6、外部サーバ装置7を利用する際に発生するトラヒック情報を定期的に取得している。そして、故障検出装置8は、無線基地局装置3、中継装置6、外部サーバ装置7から取得した異なる複数のトラヒック情報を利用して、無線基地局装置3、中継装置6、外部サーバ装置7の故障を検出する。
なお、本実施の形態に係る故障検出装置8は、検出対象の無線基地局装置3、中継装置6、外部サーバ装置7に対して外部装置として接続される構成としたが、検出対象の無線基地局装置3、中継装置6、外部サーバ装置7の一部として内部に設けられていてもよい。また、故障検出装置8は、検出対象のネットワーク装置として、無線基地局装置3、中継装置6、外部サーバ装置7の全ての故障を検出する構成としてもよいし、いずれかを検出する構成としてもよい。さらに、故障検出装置8は、中継装置6の上位に位置付けられる図示しない無線ネットワーク制御装置(RNC:Radio Network Controller)の一部に設けられる構成としてもよい。コアネットワークの一部に設けられる構成としてもよい。このように、故障検出装置8は、無線通信システム1を構成するネットワーク装置のいずれを検出対象とすることが可能である。
次に、図2を参照して故障検出装置8について説明する。図2は、本実施の形態に係る故障検出装置8の機能ブロック図である。なお、以下の説明では、検出対象となる無線基地局装置3、中継装置6、外部サーバ装置7を、被検出装置として称して説明する。
故障検出装置8は、複数の個別故障検出部11(11a,11b)と、故障判断値統合部12と、故障検出部13と、検出条件記憶部14と、報知部15とを備えている。この故障検出装置8は、複数の異なるトラヒック情報に対して統計的性質を利用してそれぞれ個別故障判断を行い、個別故障判断結果を示す各個別故障判断値を統合した総合故障判断値により、被検出装置の故障を総合的に判断するものである。なお、以下では、故障検出装置8が2つの個別故障検出部11a,11bを備える場合を例に挙げて説明するが、異なるトラヒック情報に対して並列的に個別故障判断処理を行うのであれば、個別故障検出部11は任意の数で構成可能である。
各個別故障検出部11a,11bは、複数の異なるトラヒック情報を取得し、取得した各トラヒック情報の統計的性質を利用して並列的に故障判断動作を実行するものであり、トラヒック情報取得部16(16a,16b)と、トラヒック情報記憶部17(17a,17b)と、故障判断値算出部18(18a,18b)と、統計情報更新部19(19a,19b)と、を有している。
トラヒック情報取得部16a,16bは、被検出装置からそれぞれ異なるトラヒック情報を取得する。ここで、トラヒック情報は、例えば、無線端末装置2の通信の際に発生するトラヒックの受付呼数、および、受け付けたトラヒックのうち正常に処理できた呼数(成功呼数)である。なお、トラヒック情報として、トラヒックの受付呼数および成功呼数だけでなく、受付呼数に対する成功呼数を成功率として利用してもよいし、受付呼数から成功呼数を減算した失敗呼数を利用してもよい。この場合において、受付呼数および成功呼数は、単位時間あたりの呼数としてもよい。単位時間は、特に限定されるものではなく、例えば、1秒単位、1分単位、1時間単位としてもよい。トラヒック情報は、上記した内容以外にも、被検出装置に対する監視可能な通信処理量を示す情報であれば、どのようなものであってもよい。
この場合、故障検出装置8が、被検出装置から直にトラヒック情報を取得する構成としてもよいし、無線通信システム1にトラヒック情報の収集用のサーバ装置を設けて、このサーバ装置からトラヒック情報を取得するようにしてもよい。また、故障検出装置8が被検出装置に対して定期的にトラヒック情報を要求する構成としてもよいし、被検出装置から定期的に故障検出装置8にトラヒック情報が送信される構成としてもよい。また、トラヒック情報取得部16は、被検出装置の装置単位のトラヒック情報を取得してもよいし、被検出装置を構成する構成部分単位でトラヒック情報を取得してもよい。被検出装置を構成する構成部分単位とは、ポート等のインターフェース単位、モジュール単位やインタフェースカード単位のような被検出装置を構成する部分単位である。
上述したように各トラヒック情報取得部16a,16bで取得されるトラヒック情報はそれぞれ異なる種類(種別)のトラヒック情報であり、所定の時間tに取得されたトラヒック情報a(t),b(t),c(t),d(t)があるものとする。トラヒック情報a(t),b(t),c(t),d(t)は、式(1)及び式(2)のような関係にあるものとする。
a(t)=b(t)+e(t)…(1)
c(t)=d(t)+e(t)…(2)
ここで、e(t)及びe(t)は、正規分布に従う誤差と仮定する。なお、以下では、トラヒック情報取得部16aがトラヒック情報a(t),b(t)を取得し、トラヒック情報取得部16bがトラヒック情報c(t),d(t)を取得するものとして説明する。
トラヒック情報記憶部17は、トラヒック情報取得部16で取得された被検出装置のトラヒック情報を記憶する。本実施の形態では、トラヒック情報記憶部17は、トラヒック情報取得部16が取得したトラヒック情報a(t),b(t)を記憶し、トラヒック情報記憶部17は、トラヒック情報取得部16が取得したトラヒック情報c(t), d(t)を記憶する。
故障判断値算出部18a,18bは、トラヒック情報記憶部17a,17bに記憶されたトラヒック情報を、個別故障判断部毎における故障判断用の個別故障判断値に変換し、この個別故障判断値を所定の閾値と比較して故障判断を行い、故障判断結果として個別故障判断値を故障判断値統合部12に出力する。ここで、個別故障判断値は、上記トラヒック情報a(t),b(t)及びc(t),d(t)の各誤差e及びeから算出される誤差分散値(分散値)σ及びσを用いる。この場合、期待値は0とするが期待値が0ではない場合において0となるように期待値の減算を前もって実施する。具体的には、式(3)に示すように、分散値σはトラヒック情報a(t),b(t)の誤差eの2乗平均により算出され、式(4)に示すように、分散値σはトラヒック情報c(t),d(t)の誤差eの2乗平均により算出される。
σ=E[|e(t)|]…(3)
σ=E[|e(t)|]…(4)
そして、故障判断値算出部18a,18bは、個別の故障判断結果として個別故障判断値(分散値σ及びσ)を故障判断値統合部12にそれぞれ出力する。
故障判断値統合部12は、各故障判断値算出部18a,18bから受けた個別故障判断値(分散値σ及びσ)に対してそれぞれ重みづけをして個別故障判断値を統合し、総合的に故障の有無を判断するための総合故障判断値σを生成する。総合故障判断値σは、式(5)及び式(6)により定義し、wとwが正の重みづけとなる。
σ=wσ+ wσ…(5)
σ=wσ+wσ=w*E[|a(t)−b(t)|]+w*E[|c(t)−d(t)|]
…(6)
ここで、E[ ]はアンサンブル平均を示すが、アンサンブル平均の代わりに時間平均を用いてもよい。
統計情報更新部19a,19bは、故障判断値算出部18a,18bの算出した個別故障判断値(分散値σ及びσ)がトラヒックの時間変動に追従するように、定期的に収集されるトラヒック情報a(t),b(t)及びc(t),d(t)の統計情報を学習し、このトラヒック情報の統計情報(統計的性質)を利用して個別故障判断値を逐次的に更新する。ここでは、例えば、式(7)及び(8)により、指数平滑法を利用して統計情報を算出する。
更新処理:
σ(t)=ησ(t−1)+(1−η)|a(t)−b(t)|
σ(t)=0 for t=0 …(7)
σ(t)=ζσ(t−1)+(1−ζ)|c(t)−d(t)|
σ(t)=0 for t=0 …(8)
統計情報更新部19a,19bによる更新処理がされた場合、故障判断値統合部12は、式(9)により、更新後の個別故障判断値(分散値σ(t)及びσ(t))にそれぞれ重みづけをして統合し、総合故障判断値σ(t)を生成する。
統合処理:
σ(t)=wσ(t)+wσ(t) …(9)
これにより、無線環境に応じてトラヒック情報は時間的に大きく変動した場合でも、この変動に追従した個別故障判断値を算出することができる。なお、式(9)に示す故障判断値統合部12での各個別故障判断値の統合(重みづけ)処理前に式(7)及び式(8)よりトラヒック情報の統計情報を更新したが、式(10)で示すように各(瞬時)分散値|a(t)−b(t)|及び|c(t)−d(t)|をw1,により重みづけして統合後の故障判断値σに対して、式(11)に示すトラヒック情報の統計情報を更新することも可能である。
統合処理:
σ’(t)=w*|a(t)−b(t)|+w*|c(t)−d(t)|…(10)
σ’(t)は時間tにおける瞬時誤差の統合結果を示す。
更新処理:
σ(t)=λσ(t−1)+(1−λ)σ’(t) …(11)
ここで、トラヒック量及び時間帯に応じてトラヒック情報及びそのトラヒック情報に基づく故障発生の検出確率が変動するため、個別故障検出部11a,11bによる検出精度が時間とともに変化する。この場合、故障判断値統合部12は、トラヒック量及び/又は時間帯に応じて重みづけを変えることにより、個別故障判断値を適切に統合でき検出精度を改善することが可能となる。特に、時間帯又はトラヒック量に応じて一方の個別故障検出部11の個別故障検出精度が改善し、他方の個別故障検出部11の個別故障検出精度が劣化した場合には、これら各検出精度に応じて重みづけの値を大きくしたり小さくしたりする。すなわち、重みづけw及びwの値の調整を、トラヒック量及び時間変動に応じて準静的に可変させることが好ましい。
故障検出部13は、故障判断値統合部12で統合された総合故障判断値σに基づいて、被検出装置の故障を検出し、故障検出結果を報知部15に出力する。具体的には、故障検出部13は、検出条件記憶部14に検出条件として記憶された閾値THと総合故障判断値σとを比較し、総合故障判断値σが閾値THより小さい場合には正常であると判断し、総合故障判断値σが閾値THより大きい場合には故障があると判断する。また、故障検出部13は、故障を検出した場合にはトラヒック情報記憶部17a,17bに記憶されたトラヒック情報をリセット(消去)し、故障を検出しない場合にはトラヒック情報記憶部17a,17bに記憶されたトラヒック情報の学習(更新)が継続される。
報知部15は、故障検出部13によって故障が検出された場合に、その旨をシステム管理者に報知する。この場合、報知部15は、装置の故障をシステム管理者に対して報知可能な構成であればよく、アラーム等の音声によって報知してもよいし、画像表示によって報知してもよい。また、システム管理者に対して電子メール等で報知するようにしてもよい。なお、無線通信システム1は、報知部15からの報知に基づいて冗長構成への切替を行うようにしてもよい。
なお、上記した故障検出装置8の各部は、装置内に組み込まれたCPU(Central Processing Unit)がROM(Read Only Memory)内の各種プログラムに従ってRAM(Random Access Memory)内のデータを演算し、さらに無線通信システム1を構成する無線基地局装置3、中継装置6、外部サーバ装置7等の各部と協働して処理が実行される。
次に、図3を参照して故障検出装置8の動作概要の一例について簡単に説明する。図3は、本実施の形態に係る故障検出装置8の動作概要の一例を示すフロー図である。なお、図3では、総合故障判断値の生成前に各トラヒック情報の統計情報を更新する場合を例に挙げて説明する。
最初に、個別故障検出部11a,11b内の被検出装置のトラヒック情報、故障判断値及び統計情報を初期化する(ステップS01)。次に、トラヒック情報取得部16aによってトラヒック情報a(t),b(t)が取得されると共に(ステップS02)、トラヒック情報取得部16bによってトラヒック情報c(t),d(t)が取得される(ステップS03)。取得されたトラヒック情報a(t),b(t)はトラヒック情報記憶部17aに記憶され、取得されたトラヒック情報c(t),d(t)はトラヒック情報記憶部17bに記憶される。
次に、故障判断値算出部18aでは、上記式(3)により、トラヒック情報記憶部17aに記憶されたトラヒック情報a(t),b(t)から分散値σを算出し(ステップS04)、故障判断値算出部18aでは、上記式(4)により、トラヒック情報記憶部17bに記憶されたトラヒック情報c(t),d(t)から分散値σを算出する(ステップS05)。統計情報更新部19aでは、上記式(5)により、故障判断値算出部18aで算出した個別故障判断値(分散値σ)がトラヒックの時間変動に追従するように逐次的に更新される(ステップS06)。同様に、統計情報更新部19aでは、上記式(6)により、故障判断値算出部18aで算出した個別故障判断値(分散値σ)がトラヒックの時間変動に追従するように逐次的に更新される(ステップS07)。これら更新された各分散値σ及びσは故障判断値統合部12に送られる。ここで、個別故障検出部11aでのステップS02,S04及びS06までの処理と、個別故障検出部11bでのステップS03、S05及びS07までの処理とは、並列的に実行される。
次に、故障判断値統合部12では、上記式(9)により、各故障判断値算出部18a,18bで算出された個別故障判断値(分散値σ(t)及びσ(t))がそれぞれ重みづけされ、総合故障判断値σ(t)が生成される(ステップS08)。故障検出部13では、故障判断値統合部12で生成された総合故障判断値σ(t)と検出条件記憶部14に記憶された閾値THとが比較され、被検出装置の故障の有無が判断される(ステップS09)。総合故障判断値σ(t)が正常範囲外にある(閾値THより大きい)場合には(ステップS09:Yes)、被検出装置に故障があると判断され、報知部15で故障が報知される(ステップS10)。一方、総合故障判断値σ(t)が正常範囲内にある(閾値THより小さい)場合には(ステップS09:No)、ステップS02及びS03の動作に戻る。そして、個別故障検出部11a,11b内のトラヒック情報、故障判断値及び統計情報がリセット(消去)される(ステップS11)。
以上のように、本実施の形態によれば、複数の異なるトラヒック情報から算出した各故障判断値を統合した総合故障判断値から故障を検出するので、従来の故障検出方法と比べて故障検出に係る演算量の増加を抑制し、故障検出速度を低下させることなく、ネットワーク装置の故障を精度よく検出することができる。また、一方の故障判断値算出部18aで算出された故障判断値と、他方の故障判断値算出部18bで算出された故障判断値とを統合した総合故障判断値から総合的に故障有無を検出するので、従来のように単一のトラヒック情報や故障検出用の閾値を用いて故障検出を行う場合と比べて、検出可能な故障事象が拡大し、故障の未検出又は誤検出を防止することができる。
なお、上記実施の形態では、総合故障判断値σ(t)と閾値THとを比較して故障の有無を検出したが、上記式(3)及び式(4)により算出した各分散値σ及びσに対して、それぞれ個別故障判断用の閾値TH及びTHと比較して故障の有無を検出し、個別故障検出を行ってもよい。この場合において、一方の故障判断値算出部18aで算出された故障判断値が正常を示し、他方の故障判断値算出部18bで算出された故障判断値が異常を示すような場合でも、各故障判断値を統合した総合故障判断値から総合的に故障検出を行うので、ネットワーク装置の故障検出精度を向上させることが可能である。
また、故障検出装置8での被検出装置の故障検出では、式(12)及び式(13)に示すように、誤差e及びeの分散が最小となるトラヒック情報a(t),b(t)及びc(t),d(t)を用いることも可能である。
a(t)=αb(t)+e(t) …(12)
c(t)=βd(t)+e(t) …(13)
ここで、e(t)及びe(t)が正規分布に従う誤差と仮定する。なお、それぞれの期待値,分散値がμ及びμである。αとβは未知の値であるとする。
上記同様に、分散値σはトラヒック情報a(t),αb(t)の誤差eの2乗平均により算出され、分散値σはトラヒック情報c(t),βd(t)の誤差eの2乗平均により算出される。そして、分散値σであるE[|a(t)−αb(t)|]を最小化するαの値と、分散値σであるE[|c(t)−βd(t)|]を最小化するβの値とを求める。α及びβの値は、式(14)及び式(15)により与えられる。
α=σc1/σ …(14)
β=σc2/σ …(15)
ここで、σc1=E[a(t)*b(t)],σc2=E[c(t)*d(t)]で定義される。
そして、式(16)により、最小化された分散値σ及びσにそれぞれ重みづけをして総合故障判断値σが算出される。この場合には、最初に分散値を最小化する値α及びβを逐次更新した後、個別故障判断値の逐次更新を行い、個別故障判断値の更新処理後に下記の通り、統合処理(重みづけ)を行う。
統合処理:
σ=wσ+wσ
=w*E[|a(t)−α(t)b(t)|]+w*E[|c(t)−β(t)d(t)|]
…(16)
また、上記実施の形態と同様に、トラヒックの時間変動に追従するために個別故障判断値を逐次更新することが可能である。すなわち、σ1,σ2,σc1,σc2の計算を逐次更新する必要がある。尚、個別故障判断値の更新処理前に統合(重みづけ)を行う場合には、σ1,σ2,σc1,σc2の他にσの計算も下記式(17)(18)の通り逐次更新する必要がある。
統合処理:
σ’(t)=w*|a(t)−α(t)b(t)|+w*|c(t)−β(t)d(t)|
…(17)
σ’(t)は時間tにおける瞬時誤差の統合結果を示す。
更新処理:
σ(t)=λσ(t−1)+(1−λ)σ’(t) …(18)
また、上記した実施の形態においては、故障検出装置が特定の通信システムに適用される構成に限定されず、如何なる通信システムに適用されてもよい。例えば、ISDN、ADSLの固定通信システムの他、NGN等の通信システムに適用されてもよい。また、W−CDMA方式、HSDPA/HSUPA方式、LTE方式、LTE−Advanced方式、IMT−Advanced方式、WiMAX方式、Wi−Fi方式等の移動体通信システムに適用されてもよい。
以上、本発明は特定の実施形態を参照しながら説明されたが、単なる例示に過ぎず、当業者が考えうる程度の変形例、修正例、代替例、置換例等で実現されてもよい。また、本実施の形態においては、発明の理解を促すため具体的な数値例を用いて説明がなされたが、特に断りがない限り、それらの数値は単なる一例に過ぎず、同様な作用を奏する如何なる数値が使用されてもよい。また、実施例または項目の区分けは、本発明に本質的ではなく、2以上の実施例または項目に記載された事項が必要に応じて組み合わされて使用されてもよい。説明の便宜上、本実施例に係る装置は機能的なブロック図を用いて説明されたが、装置はハードウェア、ソフトウェアまたはこれらの組み合わせで実現されてもよい。本発明は、上記実施例に限定されず、本発明の技術的思想から逸脱することなく、様々な変形例、修正例、代替例、置換例等が包含される。
また、今回開示された実施の形態は、全ての点で例示であってこの実施の形態に制限されるものではない。本発明の範囲は、上記した実施の形態のみの説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。
以上説明したように、本発明は、ネットワーク装置の故障を精度よく検出することができるという効果を有し、特に無線通信システムにおけるネットワーク装置の故障を検出する故障検出装置に有用である。
1 無線通信システム
2 無線端末装置
3 無線基地局装置(ネットワーク装置)
4 スイッチ装置(ネットワーク装置)
5 ルータ装置(ネットワーク装置)
6 中継装置(ネットワーク装置)
7 外部サーバ装置(ネットワーク装置)
8 故障検出装置
11(11a,11b) 個別故障検出部
12 故障判断値統合部
13 故障検出部
14 検出条件記憶部
15 報知部
16(16a,16b) トラヒック情報取得部
17(17a,17b) トラヒック情報記憶部
18(18a,18b) 故障判断値算出部
19(19a,19b) 統計情報更新部

Claims (5)

  1. ネットワーク装置に対する複数の異なるトラヒック情報を取得する複数のトラヒック情報取得部と、
    取得した各トラヒック情報から故障判断値をそれぞれ算出する複数の故障判断値算出部と、
    前記故障判断値算出部で算出した各故障判断値に対してそれぞれ重みづけをし、重みづけされた各故障判断値を統合して総合故障判断値を生成する故障判断値統合部と、
    前記故障統合判断値統合部で生成された前記総合故障判断値に基づいて前記ネットワーク装置の故障を検出する故障検出部と、を備えたことを特徴とする故障検出装置。
  2. 前記故障判断値統合部は、前記故障判断値算出部が算出した前記トラヒック情報の誤差分散値に対して重みづけをして前記総合故障判断値を生成することを特徴とする請求項1に記載の故障検出装置。
  3. 前記トラヒック情報取得部で取得された新たなトラヒック情報に基づいて、前記トラヒック情報の時間的変動に追従するように前記故障判断値を逐次更新する故障判断値更新部を有し、
    前記故障判断値統合部は、前記故障判断値更新部による更新後の故障判断値に対して重みづけをして前記総合故障判断値を生成することを特徴とする請求項1又は請求項2に記載の故障検出装置。
  4. 前記トラヒック情報取得部で取得された新たなトラヒック情報に基づいて、前記トラヒック情報の時間的変動に追従するように前記故障判断値を逐次更新する故障判断値更新部を有し、
    前記故障判断値統合部は、前記故障判断値更新部による更新前に前記故障判断値に対して重みづけをし、前記故障判断値更新部による重みづけされた故障判断値から前記総合故障判断値を生成することを特徴とする請求項1又は請求項2に記載の故障検出装置。
  5. 前記故障判断値に重みづけする重みづけの値が可変であることを特徴とする請求項1から請求項4のいずれかに記載の故障検出装置。
JP2010069216A 2010-03-25 2010-03-25 故障検出装置 Active JP5421831B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010069216A JP5421831B2 (ja) 2010-03-25 2010-03-25 故障検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010069216A JP5421831B2 (ja) 2010-03-25 2010-03-25 故障検出装置

Publications (2)

Publication Number Publication Date
JP2011205276A true JP2011205276A (ja) 2011-10-13
JP5421831B2 JP5421831B2 (ja) 2014-02-19

Family

ID=44881478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010069216A Active JP5421831B2 (ja) 2010-03-25 2010-03-25 故障検出装置

Country Status (1)

Country Link
JP (1) JP5421831B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014241519A (ja) * 2013-06-11 2014-12-25 日本電気株式会社 通信ネットワークシステム、通信ネットワークの切替方法、通信処理装置およびその制御方法と制御プログラム
CN105243180A (zh) * 2015-09-01 2016-01-13 珠海格力电器股份有限公司 机电设备故障预警方法及系统
CN113946913A (zh) * 2021-12-20 2022-01-18 中国铁道科学研究院集团有限公司电子计算技术研究所 铁路行车故障检测方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08107415A (ja) * 1994-10-04 1996-04-23 Fujitsu Ltd 同期型lanシステム及び同期型lanにおけるマスタクロックノードの自動変更方法
JP2005223847A (ja) * 2004-02-09 2005-08-18 Intelligent Cosmos Research Institute ネットワーク異常検出装置、ネットワーク異常検出方法およびネットワーク異常検出プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08107415A (ja) * 1994-10-04 1996-04-23 Fujitsu Ltd 同期型lanシステム及び同期型lanにおけるマスタクロックノードの自動変更方法
JP2005223847A (ja) * 2004-02-09 2005-08-18 Intelligent Cosmos Research Institute ネットワーク異常検出装置、ネットワーク異常検出方法およびネットワーク異常検出プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014241519A (ja) * 2013-06-11 2014-12-25 日本電気株式会社 通信ネットワークシステム、通信ネットワークの切替方法、通信処理装置およびその制御方法と制御プログラム
CN105243180A (zh) * 2015-09-01 2016-01-13 珠海格力电器股份有限公司 机电设备故障预警方法及系统
CN113946913A (zh) * 2021-12-20 2022-01-18 中国铁道科学研究院集团有限公司电子计算技术研究所 铁路行车故障检测方法、装置、电子设备及存储介质
CN113946913B (zh) * 2021-12-20 2022-04-15 中国铁道科学研究院集团有限公司电子计算技术研究所 铁路行车故障检测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JP5421831B2 (ja) 2014-02-19

Similar Documents

Publication Publication Date Title
US8560894B2 (en) Apparatus and method for status decision
US11714700B2 (en) Intelligent network operation platform for network fault mitigation
US11204824B1 (en) Intelligent network operation platform for network fault mitigation
US8862119B2 (en) Method and apparatus for telecommunications network performance anomaly events detection and notification
US20160088502A1 (en) Method and network device for cell anomaly detection
US20160283307A1 (en) Monitoring system, monitoring device, and test device
JP2006094497A (ja) 無線ネットワーク・パフォーマンスを監視する方法
US11678201B2 (en) Femtocell provisioning and service issue optimization
US20110122761A1 (en) KPI Driven High Availability Method and apparatus for UMTS radio access networks
US12061517B2 (en) Using user equipment data clusters and spatial temporal graphs of abnormalities for root cause analysis
JP5421831B2 (ja) 故障検出装置
JP5239749B2 (ja) 通信品質管理システム、通信検知装置、網管理装置、通信品質管理方法、及び通信検知プログラム
US20140056126A1 (en) Method and system for providing fault isolation for a service path in an ethernet-based network
US9426665B2 (en) Method and apparatus for quantifying the customer impact of cell tower outages
KR102333866B1 (ko) 이동 통신 네트워크 이상 진단 장치 및 방법
Gurbani et al. Detecting and predicting outages in mobile networks with log data
CN113381884B (zh) 用于监控告警系统的全链路监控方法及装置
CN112867051B (zh) 用于基于对等统计的故障检测的系统和方法
US9585041B2 (en) Method and apparatus for detecting a sleeping cell
JP5511305B2 (ja) 故障検出装置
KR20000019242A (ko) 지식 기반 기지국 감시 방법
JP5350975B2 (ja) 故障検出装置
KR20210030761A (ko) 무선망 품질 모니터링 방법 및 이를 위한 장치
US9311210B1 (en) Methods and apparatus for fault detection
JP5485740B2 (ja) 故障検出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131122

R150 Certificate of patent or registration of utility model

Ref document number: 5421831

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250