JP5511305B2 - Failure detection device - Google Patents
Failure detection device Download PDFInfo
- Publication number
- JP5511305B2 JP5511305B2 JP2009244412A JP2009244412A JP5511305B2 JP 5511305 B2 JP5511305 B2 JP 5511305B2 JP 2009244412 A JP2009244412 A JP 2009244412A JP 2009244412 A JP2009244412 A JP 2009244412A JP 5511305 B2 JP5511305 B2 JP 5511305B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- traffic information
- statistical
- failure detection
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、ネットワーク装置の故障を検出する故障検出装置に関する。 The present invention relates to a failure detection device that detects a failure of a network device.
有線ネットワークや無線ネットワーク等の様々な通信ネットワークに属するネットワーク装置においては、自装置内部やネットワーク内の他のネットワーク装置の故障をアラームとして上げる監視機能を有するものが知られている。このネットワーク装置は、ポーリング等の監視機能によって自装置や他のネットワーク装置の故障を早期に検出し、サービス品質の低下を早期に回復している。 Among network devices belonging to various communication networks such as a wired network and a wireless network, those having a monitoring function for raising a failure of another network device in its own device or in the network as an alarm are known. This network device detects a failure of its own device or another network device at an early stage by a monitoring function such as polling, and recovers a deterioration in service quality at an early stage.
ところで、ネットワーク装置の故障には、ハードウェアの不具合以外にもソフトウェアやファームウェア上のバグにより一部の処理に不具合を及ぼすものも含まれる。この場合、上記したような監視機能では、ハードウェアの故障を検出できるものの、ソフトウェア等による故障の検出が困難な場合があった。例えば、検出対象のネットワーク装置において、ソフトウェア上のバグによりトラヒック処理だけに不具合が生じる場合には、ポーリング等の監視機能に対して正常に反応するために、故障を検出することが困難となっていた。 By the way, the failure of the network device includes not only a hardware failure but also a failure in a part of processing due to a bug in software or firmware. In this case, although the monitoring function as described above can detect a hardware failure, it may be difficult to detect the failure by software or the like. For example, in a network device to be detected, when a failure occurs only in traffic processing due to a software bug, it is difficult to detect a failure because it responds normally to a monitoring function such as polling. It was.
従来、このような故障を含め、様々な方法で故障を検出する故障検出装置が検討されている。例えば、発着呼数、呼接続処理の成功呼数や成功率等のトラヒック情報に対して閾値を定めて故障を検出するもの(特許文献1および特許文献2)、フレーム誤り率を利用して故障を検出するもの(特許文献3)、一定期間だけトラヒックの受付量がない装置を故障とするもの(特許文献4)等が検討されている。また、無線通信システムにおいては、端末装置が受信する電界強度を利用して故障を検出する故障検出装置が検討されている。例えば、送信電力制御に利用する情報を元に故障を検出するもの(特許文献5)、エリア内の電界強度の状況変化に基づいて故障を検出するもの(特許文献6)、複数エリアからの電界強度をデータベース化して故障を検出するもの(特許文献7)等が検討されている。さらに、ネットワーク装置内に端末装置を配備して定期的に検出処理を行う方法も検討されている(特許文献8)。 Conventionally, failure detection apparatuses that detect failures by various methods including such failures have been studied. For example, a failure is detected by setting a threshold for traffic information such as the number of incoming and outgoing calls, the number of successful calls in call connection processing, and the success rate (Patent Documents 1 and 2), and a failure using the frame error rate. Are detected (Patent Document 3), and a device that does not receive traffic for a certain period of time (Patent Document 4). Further, in a wireless communication system, a failure detection device that detects a failure by using electric field strength received by a terminal device has been studied. For example, a device that detects a failure based on information used for transmission power control (Patent Document 5), a device that detects a failure based on a change in electric field strength in an area (Patent Document 6), and an electric field from a plurality of areas A technique for detecting a failure by creating a database of strength (Patent Document 7) and the like has been studied. Further, a method of performing a detection process periodically by arranging a terminal device in a network device has been studied (Patent Document 8).
ところで、故障検出に利用されるトラヒック量は、検出対象のネットワーク装置が属するネットワーク環境や時間帯に応じて変化する。加えて、正常に処理可能なトラヒック量は、検出対象のネットワーク装置の内部構成や冗長度に応じて変化する。このため、トラヒック量を利用して故障を検出する故障検出装置では、ネットワーク装置の故障を正確に検出することが困難となっていた。例えば、特許文献1に記載の故障検出装置では、閾値が固定されているため、トラヒック自体の時間的変動によりネットワーク装置の故障を誤検出してしまうおそれがあった。特に、無線通信システムにおいては、無線環境に応じてトラヒック量や呼接続処理の成功率が変動しやすく、閾値が固定されている場合には、故障の検出が難しいものとなっていた。 By the way, the traffic volume used for failure detection changes according to the network environment and time zone to which the network device to be detected belongs. In addition, the amount of traffic that can be processed normally varies depending on the internal configuration and redundancy of the network device to be detected. For this reason, it has been difficult for a failure detection device that detects a failure using the traffic volume to accurately detect a failure of a network device. For example, in the failure detection device described in Patent Document 1, since the threshold value is fixed, there is a possibility that a failure of the network device may be erroneously detected due to temporal variation of traffic itself. In particular, in a wireless communication system, the amount of traffic and the success rate of call connection processing are likely to vary depending on the wireless environment, and it is difficult to detect a failure when the threshold value is fixed.
また、電界強度を利用して故障を検出する故障検出装置においては、電解強度に影響しない故障の検出が困難である。さらに、ネットワーク装置内に故障検出用の端末装置を配置するものにおいては、配置スペース等の配置条件等によりネットワーク装置に端末装置の配置が困難であることが多い。 Moreover, in a failure detection device that detects a failure using electric field strength, it is difficult to detect a failure that does not affect the electrolytic strength. Further, in a case where a failure detection terminal device is arranged in a network device, it is often difficult to arrange the terminal device in the network device due to an arrangement condition such as an arrangement space.
本発明は、かかる点に鑑みてなされたものであり、トラヒック自体の時間的変動の影響を軽減して、ネットワーク装置の故障を精度よく検出することができる故障検出装置を提供することを目的とする。 The present invention has been made in view of such points, and an object of the present invention is to provide a failure detection device capable of accurately detecting a failure of a network device by reducing the influence of temporal fluctuations of the traffic itself. To do.
本発明の故障検出装置は、ネットワーク装置に対するトラヒック情報を取得するトラヒック情報取得部と、前記トラヒック情報取得部によって取得された前記トラヒック情報の統計的性質を算出する統計処理部と、前記統計処理部によって算出された前記統計的性質を利用して、前記ネットワーク装置の故障を検出する故障検出部とを備え、前記統計処理部は、前記ネットワーク装置の周辺の他のネットワーク装置に対するトラヒック情報の統計的性質を初期値とし、前記トラヒック情報取得部によって取得された新たなトラヒック情報に基づいて、前記トラヒック情報の時間的変動に追従するように統計的性質を逐次更新し、前記故障検出部は、前記統計処理部によって更新された統計的性質を利用して、前記ネットワーク装置の故障を検出することを特徴とする。 The failure detection apparatus of the present invention includes a traffic information acquisition unit that acquires traffic information for a network device, a statistical processing unit that calculates a statistical property of the traffic information acquired by the traffic information acquisition unit, and the statistical processing unit A failure detection unit for detecting a failure of the network device using the statistical property calculated by the statistical processing unit, wherein the statistical processing unit statistically analyzes traffic information for other network devices around the network device. Based on the new traffic information acquired by the traffic information acquisition unit with the property as an initial value, the statistical property is sequentially updated so as to follow the temporal variation of the traffic information, and the failure detection unit Using the statistical properties updated by the statistical processing unit, the failure of the network device is detected. Characterized in that it.
この構成によれば、故障の検出にネットワーク装置に対するトラヒック情報の統計的性質が利用されるため、所定の時間帯におけるトラヒック情報の傾向を考慮して、ネットワーク装置の故障が検出される。したがって、トラヒックの時間的変動の影響を軽減して、ネットワーク装置の故障を精度よく検出することができる。また、電解強度や配置条件等によって、ネットワーク装置の故障検出が制限されることがない。 According to this configuration, since the statistical property of the traffic information for the network device is used for detecting the failure, the failure of the network device is detected in consideration of the tendency of the traffic information in a predetermined time zone. Therefore, it is possible to reduce the influence of the temporal fluctuation of traffic and detect a failure of the network device with high accuracy. Moreover, the failure detection of the network device is not limited by the electrolytic strength, the arrangement conditions, and the like.
本発明によれば、トラヒックの時間的変動の影響を軽減して、ネットワーク装置の故障を精度よく検出することができる。 According to the present invention, it is possible to detect the failure of the network device with high accuracy by reducing the influence of the temporal fluctuation of traffic.
以下、本発明の実施の形態について添付図面を参照して詳細に説明する。なお、以下の実施の形態においては、本発明に係る故障検出装置を無線通信システムに配置した例について説明するが、この構成に限定されるものではない。故障検出装置を配置可能な通信システムであればよく、例えば、公衆交換電話網(PSTN: Public Switched Telephone Networks)等の有線通信システムに故障検出装置を配置する構成としてもよい。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following embodiments, an example in which the failure detection apparatus according to the present invention is arranged in a wireless communication system will be described, but the present invention is not limited to this configuration. Any communication system can be used as long as the failure detection device can be arranged. For example, the failure detection device may be arranged in a wired communication system such as a public switched telephone network (PSTN).
最初に、故障検出装置の詳細を説明する前に、故障検出装置が属する通信システムの概要の一例について説明する。図1は、本発明の実施の形態に係る故障検出装置が属する通信システムの概要の説明図である。 First, before explaining details of the failure detection device, an example of an outline of a communication system to which the failure detection device belongs will be described. FIG. 1 is an explanatory diagram of an outline of a communication system to which a failure detection apparatus according to an embodiment of the present invention belongs.
図1に示すように、無線通信システム1においては、無線基地局装置3に無線接続された携帯電話等の無線端末装置2により、スイッチ装置7a、7bやルータ装置8a、8b等の中継装置4を介して通信が行われている。ルータ装置8bには、無線通信システム1内の装置故障を検出する故障検出装置6や、無線端末装置2に対して各種サービスを提供する外部サーバ装置5a、5bが接続されている。
As shown in FIG. 1, in the wireless communication system 1, a
故障検出装置6は、無線基地局装置3、中継装置4、外部サーバ装置5を監視しており、無線基地局装置3、中継装置4、外部サーバ装置5を利用する際に発生するトラヒック情報を定期的に取得している。そして、故障検出装置6は、各装置3、4、5から取得したトラヒック情報の統計的性質を利用して、各装置3、4、5の故障を検出する。このトラヒック情報の統計的性質とは、トラヒック情報の統計情報のみを示すものではなく、統計情報から導かれる各装置3、4、5の故障傾向を示すものも含まれる。
The
なお、本実施の形態に係る故障検出装置6は、検出対象の各装置3、4、5に対して外部装置として接続される構成としたが、検出対象の各装置3、4、5の一部として内部に設けられていてもよい。また、故障検出装置6は、検出対象のネットワーク装置として、無線基地局装置3、中継装置4、外部サーバ装置5の全ての故障を検出する構成としてもよいし、いずれかを検出する構成としてもよい。さらに、故障検出装置6は、中継装置4の上位に位置付けられる図示しない無線ネットワーク制御装置(RNC: Radio Network Controller)の一部に設けられる構成としてもよい。コアネットワークの一部に設けられる構成としてもよい。このように、故障検出装置6は、無線通信システム1を構成するネットワーク装置のいずれを検出対象とすることも可能である。
The
図2を参照して、故障検出装置の機能構成について説明する。図2は、本発明の実施の形態に係る故障検出装置の機能ブロック図である。なお、以下の説明では、検出対象となる無線基地局装置、中継装置、外部サーバ装置を、被検出装置として称して説明する。 With reference to FIG. 2, the functional configuration of the failure detection apparatus will be described. FIG. 2 is a functional block diagram of the failure detection apparatus according to the embodiment of the present invention. In the following description, a radio base station device, a relay device, and an external server device to be detected will be referred to as detected devices.
故障検出装置6は、トラヒック情報取得部11と、トラヒック情報記憶部12と、統計処理部13と、故障検出部14と、検出条件記憶部15と、報知部16とを備えている。また、統計処理部13は、統計情報算出部17と、統計情報記憶部18と、故障判定値算出部19とを有している。
The
トラヒック情報取得部11は、被検出装置の固有の情報に基づいて、被検出装置からトラヒック情報を取得する。ここで、被検出装置の固有情報として、アドレス情報を利用しても良い。この場合、故障検出装置6が、被検出装置から直にトラヒック情報を取得する構成としてもよいし、無線通信システム1にトラヒック情報の収集用のサーバ装置を設けて、このサーバ装置からトラヒック情報を取得するようにしてもよい。また、故障検出装置6が被検出装置に対して定期的にトラヒック情報を要求する構成としてもよいし、被検出装置から定期的に故障検出装置6にトラヒック情報が送信される構成としてもよい。
The traffic
また、本実施の形態におけるトラヒック情報は、無線端末装置2の通信の際に、被検出装置において発生するトラヒックの受付呼数、および、受け付けたトラヒックのうち正常に処理できた呼数(成功呼数)である。なお、トラヒック情報として、トラヒックの受付呼数および成功呼数だけでなく、受付呼数に対する成功呼数を成功率として利用してもよいし、受付呼数から成功呼数を減算した失敗呼数を利用してもよい。また、受付呼数および成功呼数は、単位時間あたりの呼数としてもよい。単位時間は、特に限定されるものではなく、例えば、1秒単位、1分単位、1時間単位としてもよい。トラヒック情報は、上記した内容以外にも、被検出装置に対する通信処理量を示す情報であれば、どのようなものであってもよい。
In addition, the traffic information in the present embodiment includes the number of received calls of traffic generated in the detected device during the communication of the
また、トラヒック情報取得部11は、被検出装置の装置単位のトラヒック情報を取得してもよいし、被検出装置を構成する構成部分単位でトラヒック情報を取得してもよい。被検出装置を構成する構成部分単位とは、ポート等のインターフェース単位、モジュール単位やインタフェースカード単位のような被検出装置を構成する部分単位である。
Further, the traffic
トラヒック情報記憶部12は、トラヒック情報取得部11によって取得された被検出装置のトラヒック情報を記憶する。この場合、トラヒック情報記憶部12は、被検出装置を識別するための識別情報とトラヒック情報を関連付けて記憶する。被検出装置の識別情報とは、装置ID、アドレス情報等である。
The traffic
統計情報算出部17は、トラヒック情報記憶部12に記憶されたトラヒック情報に基づいて統計情報を算出する。統計情報記憶部18は、統計情報算出部17によって算出された統計情報を記憶する。この場合、統計情報記憶部18は、被検出装置の識別情報とトラヒック情報の統計情報を関連付けて記憶する。被検出装置の識別情報とは、装置ID、アドレス情報等である。統計情報記憶部18に記憶された統計情報は、統計情報算出部17によって一定期間毎に更新される。なお、統計情報算出部17による統計情報の算出処理および更新処理の詳細については、後述する。
The statistical
故障判定値算出部19は、統計情報記憶部18に記憶された統計情報を故障判定用の故障判定値に変換する。故障判定値算出部19は、複数のトラヒック情報の関係性を示す関数を用いて、統計情報を故障判定値に変換する。なお、故障判定値算出部19による故障判定値の算出処理の詳細については、後述する。
The failure determination
故障検出部14は、故障判定値算出部19によって算出された故障判定値に基づいて、被検出装置の故障を検出する。具体的には、故障検出部14は、検出条件記憶部15に検出条件として記憶された閾値と故障判定値とを比較することにより、被検出装置の故障を検出する。また、故障検出部14は、故障を検出した場合には統計情報記憶部18に記憶された統計情報をリセット(消去)し、故障を検出しない場合には統計情報記憶部18に記憶された統計情報の学習(更新)が継続される。
The
報知部16は、故障検出部14によって故障が検出された場合に、その旨をシステム管理者に報知する。この場合、報知部16は、装置の故障をシステム管理者に対して報知可能な構成であればよく、アラーム等の音声によって報知してもよいし、画像表示によって報知してもよい。また、システム管理者に対して電子メール等で報知するようにしてもよい。なお、無線通信システム1は、報知部16からの報知に基づいて冗長構成への切替を行うようにしてもよい。
When the
なお、上記した故障検出装置6の各部は、装置内に組み込まれたCPU(Central Processing Unit)がROM(Read Only Memory)内の各種プログラムに従ってRAM(Random Access Memory)内のデータを演算し、さらに無線通信システム1を構成する無線基地局装置3、中継装置4、外部サーバ装置5等の各部と協働して処理が実行される。
Note that each unit of the
図3を参照して、故障検出装置の動作概要の一例について簡単に説明する。図3は、本発明の実施の形態に係る故障検出装置の動作概要の一例を示すフローチャートである。 With reference to FIG. 3, an example of the operation | movement outline | summary of a failure detection apparatus is demonstrated easily. FIG. 3 is a flowchart showing an example of an operation outline of the failure detection apparatus according to the embodiment of the present invention.
図3に示すように、最初に、被検出装置のトラヒック情報の統計情報を初期化し、統計情報記憶部18に統計情報の初期値を記憶する(ステップS01)。この場合、被検出装置の統計情報の最適な初期値は装置ごとに異なりトラヒックの時間的変動等に関連するため、事前に把握することが困難である。そこで、あらかじめ定められた定数としてもよい。また、周辺のネットワーク装置の統計情報を初期値としてもよい。周辺のネットワーク装置とは、被検出装置の上位のネットワーク装置を介して接続されるネットワーク装置や、同一の無線基地局装置3の隣接セクタに属する無線端末装置2のトラヒックを処理するネットワーク装置のことである。
As shown in FIG. 3, first, the statistical information of the traffic information of the detected apparatus is initialized, and the initial value of the statistical information is stored in the statistical information storage unit 18 (step S01). In this case, since the optimum initial value of the statistical information of the detected device differs from device to device and is related to temporal fluctuations in traffic, it is difficult to grasp in advance. Therefore, a predetermined constant may be used. In addition, statistical information of peripheral network devices may be used as an initial value. The peripheral network device is a network device connected via a higher-level network device of the detected device or a network device that processes traffic of the
次に、トラヒック情報取得部11によって取得されたトラヒック情報がトラヒック情報記憶部12に記憶される(ステップS02)。次に、統計情報算出部17によって、統計情報記憶部18に記憶された統計情報とトラヒック情報記憶部12に記憶されたトラヒック情報とに基づいて統計情報が更新(学習)される(ステップS03)。次に、故障を判定する時間が経過した場合には(ステップS04:Yes)、故障判定値算出部19によって統計情報が故障判定値に変換される(ステップS05)。一方、故障を判定する時間が経過してない場合には(ステップS04:No)、ステップS02からステップS03が繰り返される。
Next, the traffic information acquired by the traffic
次に、故障検出部14によって、故障判定値と検出条件記憶部15に記憶された閾値とが比較されて、被検出装置の故障の有無が判定される(ステップS06)。次に、故障検出部14によって被検出装置の故障が検出された場合には(ステップS06:Yes)、報知部16によって被検出装置の故障が報知され(ステップS07)、統計情報記憶部18に記憶された統計情報がリセット(消去)される(ステップS08)。一方、故障検出部14によって被検出装置の故障が検出されない場合には(ステップS06:No)、ステップS02からステップS05が繰り返される。
Next, the
ここで、故障検出装置6による故障検出処理について詳細に説明する。最初に、統計情報算出部による統計情報の算出処理および故障判定値算出部による故障判定値の算出処理について詳細に説明する。
Here, the failure detection processing by the
本実施の形態における故障検出装置6では、式(1)に示される関数を用いて取得したトラヒック情報から故障判定値に変換する。式(1)に示される関数は、トラヒック情報間の関係性を示す関数である。
以下に、一例として、トラヒックの受付呼数および成功呼数の2種類のトラヒック情報を利用して、統計情報および故障判定値を算出する算出処理について具体的に説明する。この場合、故障判定値として2種類のトラヒック情報の関係性を示す相関係数を算出する場合について説明する。 Hereinafter, as an example, a calculation process for calculating statistical information and a failure determination value using two types of traffic information, that is, the number of received calls and the number of successful calls, will be specifically described. In this case, a case where a correlation coefficient indicating the relationship between two types of traffic information is calculated as a failure determination value will be described.
被検出装置の故障検出には、時刻tにおける被検出装置の2種類のトラヒック情報u(t)およびv(t)の相関係数corr(t)が利用される。この場合、離散時間間隔Δtで標本化された検出処理時刻Tにおける相関係数corr(T)は、式(2)を用いて算出される。
また、統計情報としての相互相関値Cov(u,v,T)および標準偏差σu(T)、σv(T)は、式(3)から式(5)を用いて算出される。
このトラヒック情報の平均値は、式(6)および式(7)を用いて算出される。
このようにして、上記の式によりトラヒック情報としてのトラヒックの受付呼数および成功呼数の統計情報から故障判定値としての相関係数が算出される。通常、被検出装置に故障がなく正常にトラヒック処理が行われている状態であれば、受付呼数と成功呼数とが略一致する。このため、被検出装置の正常動作時には、受付呼数と成功呼数との相関性が高く、相関係数が1に近い数値となる。一方、被検出装置の故障時には、受付呼数と成功呼数との差が大きくなって相関係数が小さくなり、1から離れた数値となる。 In this way, the correlation coefficient as the failure determination value is calculated from the statistical information of the number of accepted calls and the number of successful calls as the traffic information by the above formula. Normally, if the detected device is in a state where there is no failure and the traffic processing is normally performed, the number of accepted calls and the number of successful calls substantially match. For this reason, during normal operation of the detected apparatus, the correlation between the number of accepted calls and the number of successful calls is high, and the correlation coefficient is a value close to 1. On the other hand, when the detected device fails, the difference between the number of accepted calls and the number of successful calls becomes large, the correlation coefficient becomes small, and the value is away from 1.
故障検出部14は、検出条件記憶部15から閾値を読み出し、相関係数が閾値以下の場合に、被検出装置内部で潜在的な故障が発生してトラヒック処理ができない状態と判断して故障を検出する。なお、被検出装置は正常な状態においても、トラヒック処理が正常に行えない呼が存在するために、相関計数は検出対象の正常動作時であっても1にならない。そのため、予め標準偏差や平均値を算出して利用する場合には、トラヒック情報の利用条件に応じて予め閾値を調整することで対応が可能となる。
The
次に、統計情報算出部17による統計情報の更新処理(学習処理)について詳細に説明する。トラヒック情報は、無線端末装置2のユーザの利用状況に応じて変動するため、時間的に変動する。このため、故障検出装置6は、時間的な変動に追従するように、トラヒック情報を学習する。このトラヒック情報の時間的な変動に追従させる一例として、本実施の形態では、指数重み付けを利用している。統計情報算出部17は、指数重み付けを利用することにより、トラヒック情報の時間的な変動に追従させながら統計情報を少ない算出量で算出する。
Next, statistical information update processing (learning processing) by the statistical
指数重み付けによる統計情報の算出では、新たに収集されたトラヒック情報により、それまでに算出されたトラヒック情報の統計情報が逐次的に更新される。統計情報の更新値は、式(8)を用いて算出される。
故障検出装置6においては、この指数重み付けを利用して統計情報としての相互相関値、トラヒック情報の標準偏差および平均値が逐次更新される。指数重み付けを利用した相互相関値、トラヒック情報の標準偏差および平均値の更新値は、を式(9)から式(13)を用いて算出される。
このように、統計情報が逐次更新されることにより、所定の時間帯におけるトラヒック情報の傾向を考慮して統計情報が算出される。したがって、逐次更新された統計情報によって、式(2)により相関係数が算出されることにより、トラヒックの時間的変動の影響を軽減して、被検出装置の故障を精度よく検出することが可能となる。 Thus, statistical information is calculated in consideration of the tendency of traffic information in a predetermined time zone by sequentially updating the statistical information. Therefore, by calculating the correlation coefficient using the formula (2) based on the statistical information updated sequentially, it is possible to reduce the influence of temporal fluctuations in traffic and accurately detect the failure of the detected device. It becomes.
図4を参照して、トラヒックの受付呼数および成功呼数を統計情報とした故障検出装置の検出動作について説明する。図4は、トラヒックの受付呼数および成功呼数を統計情報とした故障検出装置の検出動作を示すフローチャートである。 With reference to FIG. 4, the detection operation of the failure detection apparatus using the number of accepted calls and the number of successful calls as statistical information will be described. FIG. 4 is a flowchart showing the detection operation of the failure detection apparatus using the number of accepted calls and the number of successful calls as statistical information.
図4に示すように、最初に、被検出装置におけるトラヒックの受付呼数および成功呼数の統計情報を初期化し、統計情報記憶部18に各統計情報、すなわちトラヒックの受付呼数および成功呼数の相互相関値、標準偏差、平均値の初期値を記憶する(ステップS11)。次に、トラヒック情報取得部11によって取得された新たなトラヒックの受付呼数および成功呼数がトラヒック情報記憶部12に記憶される(ステップS12)。次に、統計情報算出部17によって、統計情報記憶部18に記憶された相互相関値、標準偏差、平均値が、新たに取得されたトラヒックの受付呼数および成功呼数に基づいて指数重み付けを利用して更新される(ステップS13)。
As shown in FIG. 4, first, statistical information on the number of accepted calls and the number of successful calls in the detected apparatus is initialized, and each statistical information, ie, the number of accepted calls and the number of successful calls, is stored in the statistical
次に、故障を判定する時間が経過した場合には(ステップS14:Yes)、故障判定値算出部19によってトラヒックの受付呼数および成功呼数の相互相関値、標準偏差、平均値から相関係数が算出される(ステップS15)。一方、故障を判定する時間が経過してない場合には(ステップS14:No)、ステップS12からステップS13が繰り返される。
Next, when the time for determining a failure has elapsed (step S14: Yes), the failure determination
次に、故障検出部14によって、相関係数が検出条件記憶部15に記憶された閾値以下か否かが判定される(ステップS16)。相関係数が閾値以下と判定された場合には(ステップS16:Yes)、故障検出部14によって被検出装置の故障が検出される。次に、被検出装置の故障が検出されると、報知部16によって被検出装置の故障がシステム管理者に報知され(ステップS17)、統計情報記憶部18に記憶されたトラヒックの受付呼数および成功呼数の相互相関値、標準偏差、平均値がリセット(消去)される(ステップS18)。一方、相関係数が閾値より大きいと判定された場合には(ステップS16:No)、被検出装置が正常であると判断して、ステップS12からステップS15が繰り返される。
Next, the
以上のように、本実施の形態に係る故障検出装置6によれば、故障の検出に被検出装置に対するトラヒック情報の統計的性質が利用されるため、所定の時間帯におけるトラヒック情報の傾向を考慮して、被検出装置の故障が検出される。したがって、トラヒックの時間的変動の影響を軽減して、被検出装置の故障を精度よく検出することが可能となる。また、電界強度や配置条件等によって、被検出装置の故障検出が制限されることがない。
As described above, according to the
なお、上記した実施の形態においては、故障検出装置が故障判定値として相関係数を利用して、ネットワーク装置の故障を検出する構成としたが、この構成に限定されるものではない。故障検出装置は、トラヒック情報の統計的性質を利用してネットワーク装置の故障を検出すればよく、例えば、統計情報として指数重み付けにより算出されたトラヒック情報の平均値u(t)と標準偏差σ(t)を利用して、時刻tにおけるトラヒック情報がu(t)±ασ(t)の範囲から外れていれば、ネットワーク装置が故障していると検出しても良い。ここで、αは離れている度合いを示している。 In the above-described embodiment, the failure detection device detects the failure of the network device using the correlation coefficient as the failure determination value. However, the configuration is not limited to this configuration. The failure detection device only needs to detect a failure of the network device using the statistical properties of the traffic information.For example, the average value u (t) of the traffic information calculated by exponential weighting as the statistical information and the standard deviation σ ( Using t), if the traffic information at time t is out of the range of u (t) ± ασ (t), it may be detected that the network device is out of order. Here, α indicates the degree of separation.
また、上記した実施の形態においては、故障検出装置が2種類のトラヒック情報の相関性を利用して、ネットワーク装置の故障を検出する構成としたが、この構成に限定されるものではない。故障検出装置は、1種類のトラヒック情報および3種類以上のトラヒック情報の統計的性質を利用して、ネットワーク装置の故障を検出することも可能である。1種類のトラヒック情報の統計的性質を利用する場合には、上記のように平均値と標準偏差を利用することにより、ネットワーク装置の故障を検出する。また、3種類以上のトラヒック情報の統計的性質を利用する場合には、数式(1)を拡張し、以下のようにすることで相関係数と同様に処理を行うことが可能である。
また、上記した実施の形態においては、故障検出装置が新たなトラヒック情報に基づいて、算出済みの統計的性質を逐次更新して、ネットワーク装置の故障を検出する構成としたが、この構成に限定されるものではない。故障検出装置は、ネットワーク装置の故障検出の度に、統計的性質を最初から算出し直す構成としてもよい。 In the above-described embodiment, the failure detection device is configured to detect the failure of the network device by sequentially updating the calculated statistical properties based on the new traffic information. However, the present invention is not limited to this configuration. Is not to be done. The failure detection device may be configured to recalculate the statistical properties from the beginning each time a failure of the network device is detected.
また、上記した実施の形態においては、故障検出装置が特定の通信システムに適用される構成に限定されず、如何なる通信システムに適用されてもよい。例えば、ISDN、ADSLの固定通信システムの他、NGN等の通信システムに適用されてもよい。また、W−CDMA方式、HSDPA/HSUPA方式、LTE方式、LTE−Advanced方式、IMT−Advanced方式、WiMAX方式、Wi−Fi方式等の移動体通信システムに適用されてもよい。 Further, in the above-described embodiment, the failure detection apparatus is not limited to the configuration applied to a specific communication system, and may be applied to any communication system. For example, the present invention may be applied to communication systems such as NGN in addition to ISDN and ADSL fixed communication systems. The present invention may also be applied to mobile communication systems such as W-CDMA, HSDPA / HSUPA, LTE, LTE-Advanced, IMT-Advanced, WiMAX, and Wi-Fi.
以上、本発明は特定の実施形態を参照しながら説明されたが、単なる例示に過ぎず、当業者が考えうる程度の変形例、修正例、代替例、置換例等で実現されてもよい。また、本実施の形態においては、発明の理解を促すため具体的な数値例を用いて説明がなされたが、特に断りがない限り、それらの数値は単なる一例に過ぎず、同様な作用を奏する如何なる数値が使用されてもよい。また、実施例または項目の区分けは、本発明に本質的ではなく、2以上の実施例または項目に記載された事項が必要に応じて組み合わされて使用されてもよい。説明の便宜上、本実施例に係る装置は機能的なブロック図を用いて説明されたが、装置はハードウェア、ソフトウェアまたはこれらの組み合わせで実現されてもよい。本発明は、上記実施例に限定されず、本発明の技術的思想から逸脱することなく、様々な変形例、修正例、代替例、置換例等が包含される。 Although the present invention has been described above with reference to specific embodiments, the present invention is merely illustrative, and may be implemented with variations, modifications, alternatives, replacements, and the like that can be considered by those skilled in the art. Further, in the present embodiment, explanations have been made using specific numerical examples in order to promote understanding of the invention. However, unless otherwise specified, these numerical values are merely examples and have the same effect. Any numerical value may be used. Further, the division of the examples or items is not essential to the present invention, and the matters described in two or more examples or items may be used in combination as necessary. For convenience of explanation, the apparatus according to the present embodiment has been described using a functional block diagram, but the apparatus may be realized by hardware, software, or a combination thereof. The present invention is not limited to the above-described embodiments, and various modifications, corrections, alternatives, substitutions, and the like are included without departing from the technical idea of the present invention.
また、今回開示された実施の形態は、全ての点で例示であってこの実施の形態に制限されるものではない。本発明の範囲は、上記した実施の形態のみの説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。 The embodiment disclosed this time is illustrative in all respects and is not limited to this embodiment. The scope of the present invention is shown not by the above description of the embodiments but by the scope of the claims, and is intended to include all modifications within the meaning and scope equivalent to the scope of the claims.
以上説明したように、本発明は、トラヒックの時間的変動の影響を軽減して、ネットワーク装置の故障を精度よく検出することができるという効果を有し、特に無線環境に応じてトラヒック量が変動し易い無線通信システムに配置される故障検出装置に有用である。 As described above, the present invention has the effect of reducing the influence of time fluctuation of traffic and detecting a failure of a network device with high accuracy, and the amount of traffic varies according to the radio environment. This is useful for a failure detection apparatus arranged in a wireless communication system that is easy to perform.
1 無線通信システム
2 無線端末装置
3 無線基地局装置(ネットワーク装置)
4 中継装置(ネットワーク装置)
5a、5b 外部サーバ装置(ネットワーク装置)
6 故障検出装置
7a、7b スイッチ装置(ネットワーク装置)
8a、8b ルータ装置(ネットワーク装置)
11 トラヒック情報取得部
12 トラヒック情報記憶部
13 統計処理部
14 故障検出部
15 検出条件記憶部
16 報知部
17 統計情報算出部(統計処理部)
18 統計情報記憶部(統計処理部)
19 故障判定値算出部(統計処理部)
1
4 Relay device (network device)
5a, 5b External server device (network device)
6
8a, 8b Router device (network device)
DESCRIPTION OF
18 Statistical information storage unit (statistical processing unit)
19 Failure judgment value calculation part (statistical processing part)
Claims (5)
前記トラヒック情報取得部によって取得された前記トラヒック情報の統計的性質を算出する統計処理部と、
前記統計処理部によって算出された前記統計的性質を利用して、前記ネットワーク装置の故障を検出する故障検出部とを備え、
前記統計処理部は、前記ネットワーク装置の周辺の他のネットワーク装置に対するトラヒック情報の統計的性質を初期値とし、前記トラヒック情報取得部によって取得された新たなトラヒック情報に基づいて、前記トラヒック情報の時間的変動に追従するように統計的性質を逐次更新し、
前記故障検出部は、前記統計処理部によって更新された統計的性質を利用して、前記ネットワーク装置の故障を検出することを特徴とする故障検出装置。 A traffic information acquisition unit for acquiring traffic information for the network device;
A statistical processing unit that calculates a statistical property of the traffic information acquired by the traffic information acquisition unit;
A failure detection unit that detects a failure of the network device using the statistical property calculated by the statistical processing unit ;
The statistical processing unit sets a statistical property of traffic information for other network devices in the vicinity of the network device as an initial value, and based on the new traffic information acquired by the traffic information acquisition unit, the time of the traffic information The statistical properties are sequentially updated to follow global fluctuations,
The failure detection unit detects a failure of the network device using a statistical property updated by the statistical processing unit .
前記故障検出部は、前記統計処理部によって算出された前記2種類以上のトラヒック情報の統計的性質を利用して、前記ネットワーク装置の故障を検出することを特徴とする請求項1に記載の故障検出装置。 The statistical processing unit calculates a statistical property of the two or more types of traffic information,
The failure according to claim 1, wherein the failure detection unit detects a failure of the network device using a statistical property of the two or more types of traffic information calculated by the statistical processing unit. Detection device.
前記故障検出部は、前記統計処理部によって算出された前記2種類以上のトラヒック情報間の相関性を利用して、前記ネットワーク装置の故障を検出することを特徴とする請求項2に記載の故障検出装置。 The statistical processing unit calculates a correlation between the two or more types of traffic information as the statistical property,
The failure according to claim 2, wherein the failure detection unit detects a failure of the network device using a correlation between the two or more types of traffic information calculated by the statistical processing unit. Detection device.
前記故障検出部は、前記統計処理部によって算出された2種類のトラヒック情報の相関係数を利用して、前記ネットワーク装置の故障を検出することを特徴とする請求項3に記載の故障検出装置。 The statistical processing unit calculates a correlation coefficient of the two types of traffic information as the correlation,
The failure detection device according to claim 3, wherein the failure detection unit detects a failure of the network device by using a correlation coefficient between two types of traffic information calculated by the statistical processing unit. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009244412A JP5511305B2 (en) | 2009-10-23 | 2009-10-23 | Failure detection device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009244412A JP5511305B2 (en) | 2009-10-23 | 2009-10-23 | Failure detection device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011091678A JP2011091678A (en) | 2011-05-06 |
JP5511305B2 true JP5511305B2 (en) | 2014-06-04 |
Family
ID=44109496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009244412A Active JP5511305B2 (en) | 2009-10-23 | 2009-10-23 | Failure detection device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5511305B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5535176B2 (en) * | 2011-11-04 | 2014-07-02 | 株式会社小松製作所 | Mining machinery dynamics management system |
ES2951477T3 (en) * | 2018-06-08 | 2023-10-23 | Ericsson Telefon Ab L M | Methods, apparatus and computer readable media related to the detection of cell conditions in a wireless cellular network |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008219525A (en) * | 2007-03-05 | 2008-09-18 | Tohoku Univ | Method and system for detecting network abnormality |
JP4857226B2 (en) * | 2007-09-11 | 2012-01-18 | 株式会社日立製作所 | Failure monitoring apparatus and failure monitoring method for radio base station |
-
2009
- 2009-10-23 JP JP2009244412A patent/JP5511305B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011091678A (en) | 2011-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11388099B2 (en) | Methods and apparatus for facilitating real-time and/or predictive fault detection | |
JP5727194B2 (en) | Wireless communication system and wireless communication method | |
US20200310898A1 (en) | Information processing method and information processing apparatus | |
CN106034039B (en) | Fault notification method and system | |
EP3158806B1 (en) | Method and arrangement for triggering paging profiling | |
US9560191B2 (en) | Method and arrangement for determining a charging of a battery of a user device | |
JP5511305B2 (en) | Failure detection device | |
CN106604316B (en) | Method, device and system for positioning fault of wireless access equipment | |
KR102333866B1 (en) | Method and Apparatus for Checking Problem in Mobile Communication Network | |
US10397065B2 (en) | Systems and methods for characterization of transient network conditions in wireless local area networks | |
JP5421831B2 (en) | Failure detection device | |
JP5350975B2 (en) | Failure detection device | |
US11153769B2 (en) | Network fault discovery | |
JP6454133B2 (en) | Quality analysis method, quality analysis apparatus, and network system | |
JP6474714B2 (en) | Elevator monitoring device and remote monitoring system | |
KR20210030761A (en) | Method for monitoring wireless network quality and apparatus therefor | |
JP2011030094A (en) | Radio communication system for traveling body and failure processing method of the same | |
US10652139B1 (en) | Automatic communication network failure detection and remediation | |
JP5485740B2 (en) | Failure detection device | |
JP6517729B2 (en) | Monitoring device, monitoring method, and monitoring program | |
JP7187771B2 (en) | Wireless communication device, wireless communication system, control device, wireless communication method and control method | |
JP3892836B2 (en) | Failure estimation apparatus and failure estimation method | |
JP2013026794A (en) | Radio communication system, and method for detecting silent fault in radio communication system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5511305 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |