JP5261510B2 - Network monitoring apparatus, method and program - Google Patents

Network monitoring apparatus, method and program Download PDF

Info

Publication number
JP5261510B2
JP5261510B2 JP2011012108A JP2011012108A JP5261510B2 JP 5261510 B2 JP5261510 B2 JP 5261510B2 JP 2011012108 A JP2011012108 A JP 2011012108A JP 2011012108 A JP2011012108 A JP 2011012108A JP 5261510 B2 JP5261510 B2 JP 5261510B2
Authority
JP
Japan
Prior art keywords
module
information
modules
users
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011012108A
Other languages
Japanese (ja)
Other versions
JP2012156641A (en
Inventor
靖人 中西
達哉 松川
裕介 船越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011012108A priority Critical patent/JP5261510B2/en
Publication of JP2012156641A publication Critical patent/JP2012156641A/en
Application granted granted Critical
Publication of JP5261510B2 publication Critical patent/JP5261510B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、通信ネットワークにおける信頼性評価技術に係り、特に、装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種類の装置が利用されている階梯構造ネットワークにおいて、故障発生時に故障被疑箇所特定に利用するためのネットワーク監視装置及び方法及びプログラムに関する。   The present invention relates to a reliability evaluation technique in a communication network, and in particular, a floor structure network in which the number of devices and the number of component modules in one device change with time, and a plurality of types of devices are used on the same floor. The present invention relates to a network monitoring apparatus, method, and program for use in identifying a suspected failure location when a failure occurs.

一般的に、ネットワークの監視では、SNMP(Simple Network Management Protocol)(例えば、非特許文献1,2参照)を利用し、監視装置のSNMPマネージャへ監視対象装置のSNMPエージェントが異常検知(TRAP)を送信することによって故障を検知している。また、監視対象装置へ定期的にICMP(Internet Control Message Protocol)(PING)による死活監視と組み合わせて監視を行っている。   Generally, in network monitoring, SNMP (Simple Network Management Protocol) (see Non-Patent Documents 1 and 2, for example) is used, and the SNMP agent of the monitoring target device detects abnormality (TRAP) to the SNMP manager of the monitoring device. Failure is detected by sending. In addition, the monitoring target device is periodically monitored in combination with alive monitoring by ICMP (Internet Control Message Protocol) (PING).

しかし、図1のようなネットワークの構成の場合、監視対象ネットワークにおける装置Aの故障をSNMPエージェントがデータコネクションネットワーク(DCN)におけるSNMPマネージャである監視装置に異常値検知(TRAP)を送信することによって検知すると、ログ確認やステータス確認コマンド等によって保守者が確認のうえ、交換が必要であると判断した場合、故障被疑箇所として装置Aのインタフェースと装置Cのインタフェースの2箇所あるため、故障被疑箇所をさらに絞り込むことが難しい場合が多い。このような場合、この故障がサービスに影響している場合は、サービス中断時間をできる限り短くするため、装置A,Cの両方の同時手配が行われる。このとき、故障被疑箇所が特定できないために、現地駆けつけ人員、物品手配のコストが2倍発生してしまい、OPEX(運用コスト)の増加を招く。   However, in the case of the network configuration as shown in FIG. 1, the SNMP agent sends an abnormal value detection (TRAP) to the monitoring device which is the SNMP manager in the data connection network (DCN) when the device A fails in the monitored network. If it is detected, it is confirmed by the maintenance person by log confirmation or status confirmation command, and if it is determined that replacement is necessary, there are two possible locations for failure, the interface of device A and the interface of device C. It is often difficult to further narrow down. In such a case, if this failure affects the service, both the devices A and C are arranged simultaneously in order to shorten the service interruption time as much as possible. At this time, since the suspicious failure location cannot be specified, the cost of rushing to the field and arranging the goods is doubled, resulting in an increase in OPEX (operation cost).

この問題に対して、故障率などの評価尺度を利用して、被疑箇所を特定する技術が提案されている(例えば、非特許文献参照)。   To solve this problem, a technique for identifying a suspected place using an evaluation measure such as a failure rate has been proposed (see, for example, non-patent literature).

また、MIB(Management Information Base)情報により取得した装置データを元に最尤推定法を用いて、寿命分布のパラメータを推定し、信頼区間を求め、故障率を評価する方法がある(例えば、特許文献1参照)。   In addition, there is a method for estimating lifetime parameters by using a maximum likelihood estimation method based on device data acquired by MIB (Management Information Base) information, obtaining a confidence interval, and evaluating a failure rate (for example, patents) Reference 1).

また、事前に記録した装置故障率の信頼区間とネットワーク装置の累積故障数による故障率を比較し、ネットワーク装置の信頼性の良し悪しを判断する監視システムを提案している(例えば、特許文献2参照)。   Also, a monitoring system has been proposed that compares the pre-recorded device failure rate confidence interval with the failure rate based on the cumulative failure number of the network device to determine whether the network device is reliable or not (for example, Patent Document 2). reference).

特開2004-191359号公報JP 2004-191359 A 特開2007-68090号公報JP 2007-68090 A

RFC1157 A Simple Network Management Protocol (SNMP)RFC1157 A Simple Network Management Protocol (SNMP) RFC1213 Management Information Base of Network Management of TCP/IP-based Internets: MIB-II.RFC1213 Management Information Base of Network Management of TCP / IP-based Internets: MIB-II. 塩見弘著「信頼性の基礎」"2.2 故障率の算出"、pp20-23,株式会社コロナ社、1975.Hiroshi Shiomi, “Basics of Reliability”, “2.2 Calculation of Failure Rate”, pp20-23, Corona Inc., 1975.

故障被疑箇所の特定のために故障率を利用する場合、交換の最小単位は装置全体ではなくモジュールである。ここで、モジュールとは単体で交換できる部品の最小単位と定義する。そのため、被疑箇所の特定にはモジュール単位の故障率の比較を行うべきである。   When the failure rate is used to identify the suspected failure location, the minimum unit for replacement is a module, not the entire device. Here, a module is defined as the smallest unit of parts that can be replaced independently. For this reason, the failure rate should be compared on a module-by-module basis to identify the suspected location.

モジュール毎の故障率は、非特許文献3より、故障件数を総稼動時間(=測定時間×総モジュール数)で除算することから求められるため、モジュール数の情報が正確に得られない場合、故障率の算出・比較に大きな影響を及ぼす。例えば、モジュール数を過剰に計上した場合、故障率は小さく見積もられてしまい、問題の大きい故障原因を見逃してしまう。逆の場合は、問題の小さい故障原因を過大評価する可能性がある。   The failure rate for each module is obtained from Non-Patent Document 3 by dividing the number of failures by the total operating time (= measurement time x total number of modules), so if the information on the number of modules cannot be obtained accurately, Significantly affects the calculation and comparison of rates. For example, when the number of modules is excessively counted, the failure rate is estimated to be small, and the cause of the failure having a large problem is overlooked. In the opposite case, there is a possibility of overestimating the cause of the failure with a small problem.

上記内容は、故障率の逆数であるMTBF(Mean Time Between Failure)でも同様のことが言える。   The same can be said for MTBF (Mean Time Between Failure), which is the reciprocal of the failure rate.

通信ネットワークでは、時間経過によるユーザ数の変化に伴って、ネットワーク装置が増設される。このとき、通信キャリアはCAPEX(=設備投資コスト)を考慮して装置の増設時に全てのモジュールを搭載するのではなく、需要を予測する形での増設が行われるモジュールも存在する。このため、モジュールの数も時間と共に変化しているといえる。   In a communication network, network devices are added as the number of users changes over time. At this time, the communication carrier does not mount all the modules at the time of expansion of the device in consideration of CAPEX (= capital investment cost), but there is also a module in which expansion is performed in a form that predicts demand. For this reason, it can be said that the number of modules is changing with time.

また、近年ネットワークもマルチベンダ化が進み、階梯構造のネットワークにおける同一階梯の装置でも複数ベンダの装置が利用されることが多い。つまり、全装置における総モジュール数の算出が現実的な稼動では難しくなっている。   In recent years, networks have become multi-vendored, and devices of the same vendor in a network with a hierarchical structure are often used. In other words, it is difficult to calculate the total number of modules in all devices in a practical operation.

SNMPエージェントが保持している装置の管理情報(MIB情報)を用いてモジュール数を取得する場合、頻度の高い情報収集は装置の負荷を高める危険性が存在し、さらに監視トラヒックの増加という懸念も考えられる。また、近年ネットワーク装置のマルチベンダ化に伴い、さらにインタフェース物品も多様化しているため、MIB情報だけでは、モジュール情報の区別ができない場合も存在する。以上のことから、一般的なMIB情報を用いてモジュール情報を収集することが望ましいとはいえない。   When acquiring the number of modules using the management information (MIB information) of the device held by the SNMP agent, frequent information collection has the risk of increasing the load on the device, and there is also a concern that the monitoring traffic will increase. Conceivable. In recent years, as network devices have become multi-vendors, interface products have become more diversified, so there are cases where module information cannot be distinguished only by MIB information. From the above, it is not desirable to collect module information using general MIB information.

前述の特許文献1,2の技術とも装置を単位とした情報であり、モジュール単位の故障率を求めておらず、被疑装置は特定できても、被疑モジュールまでの特定はできない。モジュール単位の故障率計算を行う場合、総モジュール数の情報が必要となる。しかし、装置台数やモジュール数は時間の経過と共に変化していく値であり、かつ、現在の通信ネットワークにおける装置数のオーダは数万以上とされているため、全てのモジュール数の変化についての情報を収集することが困難であり、全てのモジュール情報を収集できない場合の推定方法が必要である。   Both of the technologies of the above-mentioned Patent Documents 1 and 2 are information in units of devices, and the failure rate in units of modules is not calculated. Even if the suspected device can be identified, the suspected module cannot be identified. When calculating the failure rate for each module, information on the total number of modules is required. However, since the number of devices and the number of modules change over time, and the order of the number of devices in the current communication network is more than tens of thousands, information on changes in the number of all modules It is difficult to collect data, and an estimation method is required when all module information cannot be collected.

本発明は、上記の点に鑑みなされたもので、特に装置台数や1台の装置における構成モジュール数が時間的に変化する、同一階梯に複数種類の装置が利用されている運用中の階梯構造ネットワークにおいて、構成モジュール数を推定することでモジュール故障率を算出し、その結果を用いて、故障発生時の被疑箇所特定を行うことが可能なネットワーク監視装置及び方法及びプログラムを提供することを目的とする。   The present invention has been made in view of the above-described points, and in particular, a floor structure in operation in which a plurality of types of devices are used on the same floor, in which the number of devices and the number of component modules in one device change over time. An object of the present invention is to provide a network monitoring apparatus, method, and program capable of calculating a module failure rate by estimating the number of constituent modules in a network and using the result to identify a suspected location when a failure occurs. And

上記の課題を解決するため、本発明は、同一階梯に複数の装置種別が存在する階梯構造ネットワークに対する装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種類の装置が利用されている階梯構造ネットワークにおいて、故障発生時に故障被疑箇所の特定を行う監視装置であって、
故障被疑モジュール情報を含むネットワーク故障情報と、
ユーザ数時系列情報と、
装置1台当りの搭載可能な最大モジュール数や装置を構成するモジュール数が変化するフラグ、モジュール毎の収容可能上限ユーザ数、装置階梯種別を含む装置モジュール構成情報と、
装置台数時系列情報と、
インタフェースの対向装置、モジュールを含むネットワーク構成情報と、
ユーザ数予測に用いるユーザ数予測パラメータと収容率パラメータと、
を格納した記憶手段と、
前記ネットワーク故障情報を装置別・モジュール別に分類し、モジュール毎の故障件数を算出する分類手段と、
前記装置モジュール構成情報を、評価対象となるモジュールの数が装置内で変化するかしないかを前記フラグに基づいて分類する変化判断手段と、
前記変化判断手段で「変化しない」と判断された場合に、前記装置モジュール構成情報における装置1台当りのモジュール最大搭載数と前記装置台数時系列情報の装置台数からモジュール数を算出するモジュール数算出手段と、
前記装置モジュール構成情報における前記装置階梯種別を用いて、同一階梯装置の情報と前記装置台数時系列情報の装置台数の情報から、同一階梯の装置台数比率より、ユーザ数を分配し、前記ユーザ数予測パラメータと分類したユーザ数から未来のユーザ数を求めるユーザ数予測手段と、
前記収容率パラメータと前記装置モジュール構成情報における前記モジュール毎の収容可能上限ユーザ数から、モジュール数を求めるモジュール数予測手段と、
前記変化判断手段で「変化する」と判断された場合は、前記モジュール数予測手段で求められた前記モジュール数を、「変化しない」と判断された場合は、前記モジュール数算出手段で求められた前記モジュール数を、それぞれ用いて、モジュール毎のモジュール故障率を算出し、故障率記憶手段に格納するモジュール故障率算出手段と、
前記ネットワーク構成情報と任意の手段で検知した故障検知情報から故障被疑箇所候補を抽出する故障被疑箇所抽出手段と、
前記故障被疑箇所候補に基づいて、前記故障率記憶手段を参照して、対応する故障被疑箇所のモジュール故障率を抽出し、表示する出力手段と、を有する。
In order to solve the above-mentioned problems, the present invention changes the number of devices for a hierarchical structure network in which a plurality of device types exist on the same floor or the number of component modules in one device over time, so that there are a plurality of types on the same floor. In a hierarchical structure network where the device is used, a monitoring device that identifies a suspected failure location when a failure occurs,
Network failure information including the suspected failure module information,
Number of users time series information,
Device module configuration information including a flag that changes the maximum number of modules that can be mounted per device and the number of modules that constitute the device, the maximum number of users that can be accommodated for each module, and the device floor type,
Number of devices time series information,
Network configuration information, including interface counterparts and modules;
User number prediction parameter and capacity factor parameter used for user number prediction,
Storage means storing
Classifying means for classifying the network failure information by device / module, and calculating the number of failures for each module;
Change determination means for classifying the device module configuration information based on the flag as to whether or not the number of modules to be evaluated changes in the device;
Module number calculation for calculating the number of modules from the maximum number of modules installed per device in the device module configuration information and the number of devices in the device number time-series information when the change determining means determines that “no change” Means,
Using the device layer type in the device module configuration information, the number of users is distributed from the device number ratio of the same floor from the device information of the same floor device and the device number information of the device number time series information, and the number of users. A user number prediction means for obtaining the number of future users from the number of users classified as a prediction parameter;
From the accommodation rate parameter and the maximum number of users that can be accommodated for each module in the device module configuration information, module number prediction means for obtaining the number of modules;
When it is determined that the change determination means is “changed”, the number of modules obtained by the module number prediction means is obtained, and when it is determined that “no change”, it is obtained by the module number calculation means. Module failure rate calculating means for calculating the module failure rate for each module and storing the module failure rate for each module using the number of modules, and
A suspected failure point extraction means for extracting a suspected failure location candidate from the network configuration information and failure detection information detected by any means;
Output means for extracting and displaying a module failure rate of a corresponding suspected failure location with reference to the failure rate storage means based on the suspected failure location candidate.

上記のように、本発明によれば、特に装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種別の装置が利用されるネットワークにおいて、総モジュール数を推定することで、モジュール毎の故障率を算出することができる。それによって、故障発生時の原因箇所の優先順位をつけることが可能となる。結果として冗長となっていた無駄な保守稼動を減らすことが可能となり、運用コストの削減を可能とする。   As described above, according to the present invention, the total number of modules is estimated particularly in a network in which the number of devices and the number of component modules in one device change with time, and multiple types of devices are used in the same level. By doing so, the failure rate for each module can be calculated. This makes it possible to prioritize the cause location when a failure occurs. As a result, it is possible to reduce useless maintenance operations that have become redundant, thereby reducing operational costs.

本発明の一実施の形態におけるネットワーク装置と監視装置の関係の一例を示す図である。It is a figure which shows an example of the relationship between the network apparatus and monitoring apparatus in one embodiment of this invention. 本発明の一実施の形態における監視装置の構成図である。It is a block diagram of the monitoring apparatus in one embodiment of this invention. 本発明の一実施の形態における故障管理DBのネットワーク故障情報の一例である。It is an example of the network failure information of failure management DB in one embodiment of this invention. 本発明の一実施の形態におけるユーザ管理DBのユーザ数時系列情報の一例である。It is an example of the user number time series information of the user management DB in an embodiment of the present invention. 本発明の一実施の形態における設備管理DBの装置モジュール構成情報の一例である。It is an example of the apparatus module structure information of equipment management DB in one embodiment of this invention. 本発明の一実施の形態における設備管理DBの装置台数時系列情報の一例である。It is an example of the apparatus number time series information of equipment management DB in one embodiment of the present invention. 本発明の一実施の形態における設備管理DBのネットワーク構成情報の一例である。It is an example of the network configuration information of equipment management DB in one embodiment of the present invention. 本発明の一実施の形態におけるモジュール故障率算出処理のフローチャートである。It is a flowchart of the module failure rate calculation process in one embodiment of the present invention. 本発明の一実施の形態におけるパラメータ記憶部に格納されるユーザ数予測パラメータ、収容率パラメータの一例である。It is an example of the user number prediction parameter and the accommodation rate parameter stored in the parameter memory | storage part in one embodiment of this invention. 本発明の一実施の形態における故障被疑箇所特定処理のフローチャートである。It is a flowchart of failure suspected place identification processing in an embodiment of the present invention. 本発明の一実施例におけるモジュール毎に月間故障件数を分類した一例である。It is an example which classified the number of monthly failures for each module in one embodiment of the present invention. 本発明の一実施例におけるモジュール数が変化しない場合のモジュール数算出の一例である。It is an example of module number calculation in case the number of modules does not change in one Example of this invention. 本発明の一実施例における同一階梯の装置毎に装置台数比率から分配ユーザ数を算出した一例である。It is an example which calculated the number of distribution users from the apparatus number ratio for every apparatus of the same floor in one Example of this invention. 本発明の一実施例における最小二乗法の1次関数近似で分配ユーザ数を推定した一例である。It is an example which estimated the number of distribution users by the linear function approximation of the least squares method in one Example of this invention. 本発明の一実施例における装置を構成するモジュール数が変化する場合のモジュール数算出の一例である。It is an example of module number calculation in case the number of modules which comprise the apparatus in one Example of this invention changes. 本発明の一実施例におけるモジュール故障率算出の一例である。It is an example of module failure rate calculation in one Example of this invention. 本発明の一実施例における接続構成例である。It is a connection structural example in one Example of this invention.

以下図面と共に、本発明の実施の形態を説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、本発明の一実施の形態におけるネットワーク構成と監視装置との関係の一例を示す。   FIG. 1 shows an example of the relationship between a network configuration and a monitoring device according to an embodiment of the present invention.

ネットワーク全体としては、コアネットワーク20、アクセスネットワーク30、ホームネットワーク40、データコネクションネットワーク(DCN)10の4種類存在し、監視対象ネットワークはそのうちのコアネットワーク20、アクセスネットワーク30であり、監視装置100はデータコネクションネットワーク10に存在する。   As the entire network, there are four types, that is, a core network 20, an access network 30, a home network 40, and a data connection network (DCN) 10, and the monitoring target networks are the core network 20 and the access network 30, and the monitoring device 100 is It exists in the data connection network 10.

また、監視対象のネットワークはそれぞれ、ネットワーク装置によって構成されており、それぞれ階梯構造を持っている。同一階梯の装置は複数の装置種別が存在するネットワークを仮定する。   Each network to be monitored is composed of network devices, each having a hierarchical structure. Assuming that the devices on the same floor have a plurality of device types.

監視装置100と監視対象装置は、SNMPプロトコル等を利用し、故障の検知を行っている。具体的には、監視装置100は、SNMPマネージャ機能200が、監視対象装置21にはSNMPエージェント機能22が備わっている。   The monitoring device 100 and the monitoring target device use the SNMP protocol or the like to detect a failure. Specifically, the monitoring device 100 has an SNMP manager function 200, and the monitoring target device 21 has an SNMP agent function 22.

上記のネットワーク構成を前提とし、実施の形態について説明する。   The embodiment will be described on the premise of the above network configuration.

図2は、本発明の一実施の形態における監視装置の構成とその処理の流れを示す図である。同図に示す監視装置100は、外部の入力部101からの情報を受信する装置情報受信部111、ユーザ時系列情報受信部112、故障情報受信部113、パラメータ受信部114、設備管理DB(データベース)110、ユーザ管理DB120、故障管理DB130、故障率管理DB140、モジュール故障率算出部150、故障被疑候補抽出部160、パラメータ記憶部171、故障率記憶部172、抽出結果記憶部173、監視システム201、ネットワークインタフェース202、SNMPマネージャ200を有する。   FIG. 2 is a diagram showing a configuration of a monitoring device and a flow of processing thereof according to an embodiment of the present invention. The monitoring apparatus 100 shown in the figure includes an apparatus information receiving unit 111 that receives information from an external input unit 101, a user time series information receiving unit 112, a failure information receiving unit 113, a parameter receiving unit 114, an equipment management DB (database). 110, user management DB 120, failure management DB 130, failure rate management DB 140, module failure rate calculation unit 150, failure suspect candidate extraction unit 160, parameter storage unit 171, failure rate storage unit 172, extraction result storage unit 173, monitoring system 201 A network interface 202 and an SNMP manager 200.

故障管理DB140は、図3に示すように、故障情報受信部113で受信されたネットワーク故障情報として、故障装置、故障発生日時、故障被疑モジュールを格納する。   As shown in FIG. 3, the failure management DB 140 stores the failure device, the failure occurrence date and time, and the failure suspect module as the network failure information received by the failure information receiving unit 113.

ユーザ管理DB120は、図4に示すように、ユーザ時系列情報受信部112で受信された、ユーザ数時系列情報として、情報取得年月日、総ユーザ数を格納する。   As shown in FIG. 4, the user management DB 120 stores the information acquisition date and the total number of users as the user number time-series information received by the user time-series information receiving unit 112.

設備管理DB110は、装置情報受信部111で受信された装置モジュール構成情報と装置台数時系列情報、ネットワーク構成情報を格納する。装置モジュール構成情報としては、図5に示すように、装置種別、装置階梯種別、モジュール種別、装置一台当りに搭載可能な最大モジュール数、装置を構成するモジュール数が変化し得るかのフラグ、モジュール毎の収容可能上限ユーザ数を含む。また、装置台数時系列情報としては、図6に示すように、装置種別、装置台数、情報取得年月日を含む。ネットワーク構成情報としては、図7に示すように、装置種別、インタフェース、対応モジュール、対向装置、対向インタフェース、対向モジュールを含む。   The equipment management DB 110 stores device module configuration information, device number time series information, and network configuration information received by the device information receiving unit 111. As the device module configuration information, as shown in FIG. 5, a device type, a device floor type, a module type, a maximum number of modules that can be mounted per device, a flag indicating whether the number of modules constituting the device can change, Includes the maximum number of users that can be accommodated for each module. Further, as shown in FIG. 6, the device number time series information includes the device type, the number of devices, and the information acquisition date. As shown in FIG. 7, the network configuration information includes a device type, an interface, a corresponding module, a counter device, a counter interface, and a counter module.

ここで、「装置階梯種別」とは、同一階梯の装置群を判断できる情報とする。以下で対象とするネットワークは図1に示すようなネットワーク構造をしており、全体として、階梯構造を持つネットワーク構成を持つ。ネットワーク構成情報は、同一階梯の装置に対して、マルチベンダの装置が収容されていることを想定しているため、同一階梯、異機種を区分するための情報である。   Here, the “device floor type” is information that can determine a device group of the same floor. The target network below has a network structure as shown in FIG. 1, and has a network structure having a hierarchical structure as a whole. The network configuration information is information for distinguishing the same floor and different models because it is assumed that multi-vendor devices are accommodated for the same floor devices.

パラメータ受信部114は、以下のような処理を行う。   The parameter receiving unit 114 performs the following process.

図8は、本発明の一実施の形態におけるモジュール故障率算出処理のフローチャートである。   FIG. 8 is a flowchart of module failure rate calculation processing according to an embodiment of the present invention.

ステップ110) パラメータ受信部114において、入力部101からユーザ数予測パラメータ、収容率パラメータを取得し、図9に示すように、パラメータ記憶部171に格納されているものとする。モジュール故障率算出部150は、故障管理DB130からネットワーク故障情報、ユーザDB120からユーザ数時系列情報、設備管理DB110から装置モジュール構成情報、装置時系列情報を、パラメータ記憶部171から図9に示すユーザ数予測パラメータ、収容率パラメータを抽出する。   Step 110) It is assumed that the parameter receiving unit 114 acquires the user number prediction parameter and the accommodation rate parameter from the input unit 101 and stores them in the parameter storage unit 171 as shown in FIG. The module failure rate calculation unit 150 receives the network failure information from the failure management DB 130, the user number time series information from the user DB 120, the device module configuration information and the device time series information from the facility management DB 110, and the user shown in FIG. 9 from the parameter storage unit 171. The number prediction parameter and the accommodation rate parameter are extracted.

ステップ120) モジュール故障率算出部150は、故障管理DB130から抽出したネットワーク故障情報を装置別、故障被疑モジュール別に分類し、特定期間毎のモジュール毎の故障件数を算出する。   Step 120) The module failure rate calculation unit 150 classifies the network failure information extracted from the failure management DB 130 by device and by failure suspect module, and calculates the number of failures for each module for a specific period.

ステップ130) モジュール故障率算出部150は、装置を構成するモジュール数が変化するか否かのフラグを参照し、変化する(フラグ="1")場合には、ステップ150に移行し、変化しない(フラグ"0")場合はステップ140に移行する。   Step 130) The module failure rate calculation unit 150 refers to a flag indicating whether or not the number of modules constituting the device changes, and when it changes (flag = “1”), the module failure rate calculation unit 150 proceeds to Step 150 and does not change. If the flag is “0”, the process proceeds to step 140.

ステップ140) 装置を構成するモジュール数が変化しない場合、装置台数の時系列変化とモジュール数変化が追随することから、モジュール枚数は装置1台当りのモジュール最大搭載数の情報を利用して算出が可能になる。つまり、モジュール故障率算出部150は、装置モジュール構成情報における装置1台当りのモジュール最大数搭載数と装置台数時系列情報の装置台数からモジュール数を算出し、故障率記憶部172に格納してステップ170に移行する。   Step 140) When the number of modules constituting the device does not change, the time series change of the number of devices and the change in the number of modules follow, so the number of modules can be calculated using information on the maximum number of modules mounted per device. It becomes possible. That is, the module failure rate calculation unit 150 calculates the number of modules from the maximum number of modules mounted per device in the device module configuration information and the number of devices in the device number time-series information, and stores them in the failure rate storage unit 172. Control goes to step 170.

ステップ150) モジュール故障率算出部150は、装置を構成するモジュール数が変化し得る場合、モジュール数の予測にあたって、ユーザ数の予測を行う。これは設計段階でのモジュール・装置増設判断はユーザ数の増加見合いで行われているという仮定を用いている。装置階梯種別情報を用いて同一の装置における装置台数の比率を求め、装置毎の収容ユーザ情報を算出する。以降装置台数比率によって配分されたユーザ数を分配ユーザ数と定義する。入力されたユーザ数予測パラメータを用いた最小二乗法により未来の配分ユーザ数を予測する。   Step 150) When the number of modules constituting the apparatus can change, the module failure rate calculation unit 150 predicts the number of users when predicting the number of modules. This is based on the assumption that module / equipment addition determination at the design stage is made in proportion to the increase in the number of users. The ratio of the number of devices in the same device is obtained using the device floor type information, and the accommodation user information for each device is calculated. Hereinafter, the number of users distributed according to the ratio of the number of devices is defined as the number of distributed users. The number of allocated users in the future is predicted by the least square method using the input user number prediction parameter.

ステップ160) さらに、モジュール故障率算出部150は、入力された収容率パラメータとモジュール毎の収容可能上限ユーザ数とステップ150で予測した分配ユーザ数からモジュール数を推定し、その値を故障率記憶部172に格納する。   Step 160) Further, the module failure rate calculation unit 150 estimates the number of modules from the input accommodation rate parameter, the maximum number of users that can be accommodated for each module, and the number of distributed users predicted in Step 150, and stores the value as the failure rate storage. Stored in the unit 172.

ステップ170) モジュール故障率算出部150は、上記のステップ140とステップ160で算出・推定され、故障率記憶部172に格納されているモジュール数とある期間のモジュール毎の故障件数と、その期間情報から前述の非特許文献3に示す手法により故障率を算出する。   Step 170) The module failure rate calculation unit 150 calculates and estimates at the above-described Step 140 and Step 160, and stores the number of modules stored in the failure rate storage unit 172, the number of failures for each module in a certain period, and the period information. From the above, the failure rate is calculated by the method shown in Non-Patent Document 3 described above.

ステップ180) 算出したモジュール故障率を故障率DB140に保存する。   Step 180) The calculated module failure rate is stored in the failure rate DB 140.

上記の処理を、全装置、全モジュールに対して行う。   The above processing is performed for all devices and all modules.

図10は、本発明の一実施の形態における故障被疑箇所特定処理のフローチャートである。   FIG. 10 is a flowchart of the suspected fault location specifying process according to the embodiment of the present invention.

ステップ210) 故障被疑候補抽出部160は、SNMP TRAP機能等による故障を監視システム201が検知したTRAP情報を取得する。   Step 210) The suspected failure candidate extraction unit 160 acquires TRAP information that the monitoring system 201 has detected a failure due to the SNMP TRAP function or the like.

ステップ220) 故障被疑候補抽出部160は、これにより受信したTRAP.情報に基づいて故障被疑箇所候補を抽出する。このとき、インタフェース等の故障であればそのインタフェースの接続先のモジュールも被疑対象として考えられる。そのため、設備管理DB110からネットワーク構成情報(装置種別、インタフェース、モジュール種別、接続対向装置、接続対向インタフェース、モジュール種別)(図7)を抽出し、隣接装置のモジュールも被疑対象とする。   Step 220) The suspected failure candidate extraction unit 160 extracts suspected failure location candidates based on the received TRAP. Information. At this time, if a failure occurs in an interface or the like, the module to which the interface is connected is also considered as a suspicious object. Therefore, network configuration information (apparatus type, interface, module type, connection counter device, connection counter interface, module type) (FIG. 7) (FIG. 7) is extracted from the facility management DB 110, and modules of adjacent devices are also subject to suspicion.

ステップ230) 故障率管理DB140から故障被疑箇所候補のモジュール故障率を抽出し、表示部102に表示する。   Step 230) The module failure rate of the suspected failure location candidate is extracted from the failure rate management DB 140 and displayed on the display unit 102.

以下、上記の実施の形態を具体的に説明する。   The above embodiment will be specifically described below.

以下に、モジュール故障率算出部150と故障被疑候補抽出部160の処理について説明する。本実施例での時系列データの扱いとして、特定期間における情報投入精度について説明を行う際、この期間については任意に決めることが可能であるとする。また、それぞれの一例を示す図では、1ヶ月毎のデータ、かつ、月末の情報が投入されている前提において説明を行うこととする。   Hereinafter, processing of the module failure rate calculation unit 150 and the failure suspected candidate extraction unit 160 will be described. As the handling of time-series data in the present embodiment, when the information input accuracy in a specific period is described, it is assumed that this period can be arbitrarily determined. In each of the diagrams showing examples, the description is made on the assumption that data for each month and information at the end of the month are input.

最初に、入力部101からネットワーク故障情報、ユーザ数時系列情報、装置モジュール構成情報、装置台数時系列情報、ネットワーク構成情報、ユーザ数予測パラメータ、収容率パラメータの入力を行う。   First, network failure information, number-of-users time-series information, device module configuration information, number-of-devices time-series information, network configuration information, number-of-users prediction parameters, and capacity ratio parameters are input from the input unit 101.

本実施例では、上記の情報を、受信部111〜113を介して、管理者によってネットワーク故障情報を故障管理DB130に、ユーザ数時系列情報をユーザ管理DB120に、装置モジュール構成情報、装置台数時系列情報、ネットワーク構成情報を設備管理DB110に格納される。また、ユーザ数予測パラメータと収容率パラメータも同様にパラメータ受信部114を介してパラメータ記憶部171に格納される。   In the present embodiment, the above information is received by the administrator via the receiving units 111 to 113, the network failure information is stored in the failure management DB 130, the user number time series information is stored in the user management DB 120, the device module configuration information, the number of devices. Series information and network configuration information are stored in the facility management DB 110. Similarly, the user number prediction parameter and the accommodation rate parameter are also stored in the parameter storage unit 171 via the parameter reception unit 114.

故障管理DB140のネットワーク故障情報には、図3に示すように、故障装置、故障発生日時、故障被疑モジュールの情報が含まれている。   As shown in FIG. 3, the network failure information of the failure management DB 140 includes information on the failure device, the failure occurrence date and time, and the suspected failure module.

ユーザ管理DB120のユーザ時系列情報は、特定期間毎に集計された、監視対象ネットワークに収容されている全ユーザ数情報が含まれている。図4は、月間ユーザ数時系列情報の一例である。   The user time series information in the user management DB 120 includes information on the total number of users accommodated in the monitoring target network, which is aggregated every specific period. FIG. 4 is an example of the monthly user count time series information.

設備管理DB130の装置モジュール個性情報には、図5に示すように、装置種別、装置階梯種別、モジュール種別、装置一台当りに搭載可能な最大モジュール数、装置を構成するモジュール数が変化し得るかのフラグ、モジュール毎の収容可能上限ユーザ数が含まれる。   In the device module personality information of the facility management DB 130, as shown in FIG. 5, the device type, the device floor type, the module type, the maximum number of modules that can be mounted per device, and the number of modules constituting the device can change. Flag and the maximum number of users that can be accommodated for each module.

設備管理DB130の装置台数時系列情報には、図6に示すように、装置種別、装置台数、情報取得年月日の情報が含まれる。   The number-of-devices time series information in the facility management DB 130 includes information on the device type, the number of devices, and information acquisition date as shown in FIG.

設備管理DB130のネットワーク構成情報には、図7に示すように、装置種別、インタフェース、モジュール種別、接続対向装置、接続対向インタフェース、モジュール種別が含まれる。   As shown in FIG. 7, the network configuration information of the facility management DB 130 includes a device type, an interface, a module type, a connected device, a connected device, and a module type.

パラメータ記憶部171に格納されるユーザ数予測パラメータには、図9に示すように、予測に利用する過去のデータの期間と予測する未来の期間を含み、収容率パラメータには、終了率の情報が管理者によって入力される。   As shown in FIG. 9, the user number prediction parameter stored in the parameter storage unit 171 includes a past data period used for prediction and a future period to be predicted, and the accommodation rate parameter includes end rate information. Is entered by the administrator.

以下に、本実施例の動作を図8に沿って説明する。   The operation of the present embodiment will be described below with reference to FIG.

ネットワーク故障情報、ユーザ数時系列情報、装置モジュール構成情報、装置台数時系列情報、ネットワーク構成情報、ユーザ数予測パラメータ、収容率パラメータが入力される。当該手順は、事前に管理者が行う手順であり、以下の処理とは別に行われるものである。   Network failure information, number-of-users time-series information, device module configuration information, number-of-devices time-series information, network configuration information, number-of-users prediction parameter, and capacity factor parameter are input. This procedure is a procedure performed by the administrator in advance, and is performed separately from the following processing.

ステップ110)モジュール故障率算出部150は、事前に格納されている情報を各DBより抽出する。   Step 110) The module failure rate calculation unit 150 extracts information stored in advance from each DB.

ステップ120) モジュール故障率算出部150は、装置モジュール構成情報から装置種別とモジュール種別を取得し、ネットワーク故障情報における故障被疑モジュール情報毎に故障を分類する。特定期間毎に故障発生件数を集計し、故障率記憶部172に格納する。図11に、月別に求めた装置Aと装置Cにおける各モジュールの故障件数を集計した結果を示す。   Step 120) The module failure rate calculation unit 150 acquires the device type and the module type from the device module configuration information, and classifies the failure for each of the suspected module information in the network failure information. The number of failure occurrences is totaled for each specific period and stored in the failure rate storage unit 172. FIG. 11 shows the result of totaling the number of failures of each module in the devices A and C obtained by month.

ステップ140)<装置内のモジュール数が変化しない場合のモジュール数算出>
モジュール故障率算出部150は、装置モジュール構成情報における装置を構成するモジュール数が変化しうるかのフラグ情報を用いて"変化しない"(=0)というフラグが付けられているモジュールについて、モジュール数の算出を行う。この場合、装置台数がモジュール数に追随する形、つまり常に最大数搭載されていることになるため、装置モジュール情報の装置一台当りに搭載可能な最大モジュール数と装置台数時系列情報の装置台数を乗じることによりモジュール数を算出し、故障率記憶部172に格納する。図12は、図5と図6の上述の情報から、「2010年7月」における装置を構成するモジュール数が変化しないモジュール数を算出した一例である。
Step 140) <Calculating the number of modules when the number of modules in the apparatus does not change>
The module failure rate calculation unit 150 uses the flag information as to whether the number of modules constituting the device in the device module configuration information can change or not. Perform the calculation. In this case, since the number of devices follows the number of modules, that is, the maximum number is always installed, the maximum number of modules that can be mounted per device in the device module information and the number of devices in the time series information The number of modules is calculated by multiplying by and stored in the failure rate storage unit 172. FIG. 12 is an example in which the number of modules in which the number of modules constituting the apparatus in “July 2010” does not change is calculated from the above-described information in FIGS. 5 and 6.

ステップ150)<装置内のモジュール数が変化する場合のモジュール数予測>
モジュール故障率算出部150は、装置モジュール構成情報における装置を構成するモジュール数が変化しうるかのフラグ情報を用いて"変化する"(=1)というフラグが付けられているモジュールについて、ユーザ数予測パラメータにおける予測する未来の期間に対するユーザ数を予測し、そのユーザを収容するために必要なモジュール数を求める。また、対象とするネットワークは同一階梯に対して複数種別の装置によって構成されると仮定している。つまり、全体のユーザ数を同一階梯の装置台数比率によって収容分配が行われていると仮定する。
Step 150) <Prediction of the number of modules when the number of modules in the apparatus changes>
The module failure rate calculation unit 150 predicts the number of users for a module that is flagged as “change” (= 1) using flag information indicating whether the number of modules constituting the device in the device module configuration information can change. The number of users for the predicted future period in the parameter is predicted, and the number of modules necessary to accommodate the user is obtained. Further, it is assumed that the target network is composed of a plurality of types of devices for the same floor. That is, it is assumed that the total number of users is distributed according to the ratio of the number of devices on the same floor.

ユーザ数の予測方法は、まず、上述の通り、装置モジュール構成情報の装置階梯種別が同一の装置に対して、装置台数時系列情報から装置台数の比率を求める。この比率が、各装置間のユーザ比率になっていると判断し、分配ユーザ数を算出する。図13に分配ユーザ数の一例を示す。図5に示す装置モジュール構成情報における装置階梯種別情報により、装置Aと装置Bは同一階梯の装置であることがわかる。図4のユーザ系列のユーザ数を図6の装置台数時系列情報における装置A,Bの装置台数の比率を用いて、分配ユーザ数を算出する。   In the method for predicting the number of users, first, as described above, the ratio of the number of devices is obtained from the number-of-devices time-series information for devices having the same device floor type in the device module configuration information. It is determined that this ratio is the user ratio between the devices, and the number of distributed users is calculated. FIG. 13 shows an example of the number of distributed users. From the device floor type information in the device module configuration information shown in FIG. 5, it can be seen that device A and device B are devices of the same floor. The number of distributed users is calculated from the number of users in the user series in FIG. 4 using the ratio of the number of apparatuses A and B in the apparatus number time-series information in FIG.

ユーザ数の予測については、パラメータ記憶部171に格納されているユーザ数予測パラメータにおける2つのパラメータと収容率パラメータにおける1つのパラメータの計3パラメータを用いる。予測に利用する過去のデータの期間をA、予測する未来の期間をBとし、モジュール数は時系列Nの時点のものを求める。そして、時系列N-A+1〜Nまでの分配ユーザ数の情報から時系列N+B(未来)の分配ユーザ数を最小二乗法の1次関数近似を用いて算出する。   For the prediction of the number of users, a total of three parameters are used: two parameters in the user number prediction parameter stored in the parameter storage unit 171 and one parameter in the accommodation rate parameter. The past data period used for the prediction is A, the future period to be predicted is B, and the number of modules is obtained at the time series N. Then, the number of distributed users in time series N + B (future) is calculated from the information on the number of distributed users in time series N-A + 1 to N using a least-squares linear function approximation.

時系列t月の分配ユーザ数をUtとする。Nのモジュール数を求めるとき、時系列tにおける時系列Nまでの差分をMtとする。つまりMN=0である。(MN-A+1,U N-A+1)…(0,UN)という時系列N-A+1〜Nまで時系列差分と分配ユーザ数データを用いてユーザ数の変化を最小二乗法による1次関数近似(y=ax+b)を行ない、パラメータ(傾きaと切片b)を計算する。ここでxは上述のとおり、時系列Nまでの時系列差分Mtであり、yは分類ユーザ数Utである。 Let U t be the number of distributed users in time series t month. When obtaining the number of N modules, the difference up to time series N in time series t is defined as M t . That is, M N = 0. (M N-A + 1 , U N-A + 1 ) ... (0, U N ) Time series N-A + 1 to N to minimize the change in the number of users using time series difference and distributed user number data A linear function approximation (y = ax + b) is performed by the square method, and parameters (slope a and intercept b) are calculated. Here, as described above, x is the time series difference M t up to the time series N, and y is the number of classified users U t .

Figure 0005261510
上記で求めたaとbの情報を元に、時系列N+B(未来)の分配ユーザ数を計算する。
Figure 0005261510
Based on the information of a and b obtained above, the number of distributed users in time series N + B (future) is calculated.

図14は、上述の方法でN=2010年7月として、図13の分類ユーザ数のデータからA=3ヶ月分の情報を元に、B=6ヶ月(2011年1月)の分類ユーザ数を予測した一例である。   FIG. 14 shows the number of classified users for B = 6 months (January 2011) based on the information for A = 3 months from the data of the number of classified users in FIG. Is an example of predicting.

ステップ160) <装置内のモジュール数が変化する場合のモジュール数推定>
モジュール故障率算出部150は、装置モジュール構成情報において、モジュール毎の収容可能上限ユーザ数と収容率パラメータC%を用いて、ステップ150で求めた時系列N+B(未来)の分配ユーザに対する時系列Nでのモジュール数を推定する。つまり、時系列N+B(未来)時点での分配ユーザ数を見越して、収容可能上限ユーザ数のC%が収容できるように、時系列Nのモジュール数を決定していると考える。
Step 160) <Estimating the number of modules when the number of modules in the apparatus changes>
The module failure rate calculation unit 150 uses the upper limit number of users that can be accommodated for each module and the accommodation rate parameter C% in the device module configuration information to determine the time for the time-series N + B (future) distribution users obtained in step 150. Estimate the number of modules in series N. That is, it is considered that the number of modules in time series N is determined so that C% of the maximum number of users that can be accommodated can be accommodated in anticipation of the number of distributed users at time series N + B (future).

具体的には、ステップ150で求めた時系列N+B(未来)の分配ユーザ数を各モジュールの収容可能上限ユーザ数と収容率パラメータを乗じたもので割るという形で算出し、故障率記憶部172に格納する。図15は、上述の方法で求めたモジュールの数の一例である。   Specifically, the time-series N + B (future) number of distributed users obtained in step 150 is calculated by dividing the number of users that can be accommodated by each module by the capacity limit parameter, and the failure rate storage. Stored in the unit 172. FIG. 15 is an example of the number of modules obtained by the above method.

ステップ170) <モジュール故障率算出>
モジュール故障率算出部150は、非特許文献3にあるように、ステップ120で分類したモジュール毎の故障件数をステップ140、ステップ160でそれぞれ求められ、故障率記憶部172に格納されているモジュール数と時系列差分で割ることにより、モジュール故障率を算出する。図16は、N=2010年7月としたときの装置A,Cにおける1ヶ月の各モジュール故障率を示した一例である。
Step 170) <Calculation of module failure rate>
As described in Non-Patent Document 3, the module failure rate calculation unit 150 obtains the number of failures for each module classified in step 120 in steps 140 and 160, and stores the number of modules stored in the failure rate storage unit 172. The module failure rate is calculated by dividing by the time series difference. FIG. 16 is an example showing the module failure rate for each month in the apparatuses A and C when N = July 2010.

ステップ180) モジュール故障率算出部150は、ステップ170で算出したモジュール故障率を故障率管理DB140に記録する。   Step 180) The module failure rate calculation unit 150 records the module failure rate calculated in Step 170 in the failure rate management DB 140.

以上の処理を全装置におけるモジュール種類分繰り返す。   The above processing is repeated for the module types in all devices.

ステップ210) 故障被疑候補抽出部160における故障被疑箇所特定処理は、上記のステップ180までの処理とは異なり、リアルタイムの監視業務で行われる。   Step 210) Unlike the processing up to step 180 described above, the failure suspected place identifying process in the failure suspect candidate extraction unit 160 is performed in a real-time monitoring operation.

監視対象ネットワーク20,30に対して、SNMP等を用いて障害をTRAPとして検知する。この場合、ICMP(Ping)による検知でもよい。   A failure is detected as TRAP for the monitored networks 20 and 30 using SNMP or the like. In this case, detection by ICMP (Ping) may be used.

ステップ220) <故障被疑箇所候補抽出>
故障被疑候補抽出部160は、受信したTRAP情報を元に、故障被疑箇所候補を判断する。故障被疑箇所候補は、基本的にTRAP発出装置の全モジュールが候補となる。この他、インタフェースの状態変化アラームであれば、ネットワーク構成情報を用いて該当インタフェースの対向装置のモジュールも被疑箇所候補とする。その他のアラームの場合は、TRAPを発出した装置の全てのモジュールを被疑箇所候補とする。
Step 220) <Extracting a suspected fault candidate>
The suspected failure candidate extraction unit 160 determines a suspected failure location candidate based on the received TRAP information. The suspected failure location candidates are basically all modules of the TRAP issuing device. In addition, in the case of an interface state change alarm, the module of the opposite device of the corresponding interface is also set as a suspected place candidate using the network configuration information. In the case of other alarms, all modules of the device that issued the TRAP are set as suspected place candidates.

以上の処理は自動で行われるが、ネットワーク構成情報による隣接装置のインタフェースも手動で被疑箇所候補とすることは可能である。   The above processing is performed automatically, but the interface of the adjacent device based on the network configuration information can also be manually set as a suspected place candidate.

図17に、装置Aと装置Cの接続構成例を示す。装置AのモジュールCと装置Cのモジュールaが接続されている。モジュールbはモジュールaを包含したモジュールである。この場合、装置Cのモジュールaに関する状態変化のTRAPを検出した場合、故障被疑箇所候補は装置Cの全モジュールa,b,c,d及び装置AにおけるモジュールCの5種類である。   FIG. 17 shows a connection configuration example of the device A and the device C. Module C of device A and module a of device C are connected. Module b is a module including module a. In this case, when a state change TRAP related to the module a of the device C is detected, there are five types of failure suspected place candidates: all the modules a, b, c, d of the device C and the module C of the device A.

ステップ230) <故障被疑箇所候補のモジュール故障率を表示>
故障被疑箇所候補のモジュールに対して、故障率管理DB140より該当モジュールの故障率を取得して、抽出結果記憶部173に読み込み、表示する。この結果を元に、運用者は優先度をつけた対応を行うことができる。図16,17の例では、故障被疑箇所候補の中での対応優先順位は装置AにおけるモジュールCが最も高いということが判断できる。
Step 230) <Display module failure rate of suspected failure point candidate>
The failure rate of the corresponding module is obtained from the failure rate management DB 140 for the suspected failure location candidate module, read into the extraction result storage unit 173, and displayed. Based on this result, the operator can take a priority action. In the examples of FIGS. 16 and 17, it can be determined that the module C in the device A has the highest priority for handling among the suspected failure point candidates.

なお、図2に示す監視装置の各構成要素で行われる処理や機能は、監視装置として利用されるコンピュータに内蔵されるCPUやメモリなどのハードウェア資源を用いて、各部で実施される処理に対応するプログラムを実行することによって実現される。また、当該プログラムはフレキシブルディスク、CD−ROM,DVD等の記録媒体や、インターネットなどのネットワークを介して市場に流通させることが可能である。   Note that the processing and functions performed by each component of the monitoring device shown in FIG. 2 are the same as the processing performed by each unit using hardware resources such as a CPU and memory built in a computer used as the monitoring device. This is realized by executing the corresponding program. The program can be distributed to the market via a recording medium such as a flexible disk, a CD-ROM, a DVD, or a network such as the Internet.

本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。   The present invention is not limited to the above-described embodiments and examples, and various modifications and applications are possible within the scope of the claims.

10 データコネクションネットワーク(DCN)
20 コアネットワーク
21 装置
22 SNMPエージェント
30 アクセスネットワーク
40 ホームネットワーク
100 監視装置
101 入力部
102 表示部
111 装置情報受信部
112 ユーザ時系列情報受信部
113 故障情報受信部
110 設備管理DB
120 ユーザ管理DB
130 故障管理DB
140 故障率管理DB
150 モジュール故障率算出部
160 故障被疑候補抽出部
171 パラメータ記憶部
172 故障率記憶部
200 SNMPマネージャ
201 監視システム
202 ネットワークインタフェース
10 Data connection network (DCN)
20 Core Network 21 Device 22 SNMP Agent 30 Access Network 40 Home Network 100 Monitoring Device 101 Input Unit 102 Display Unit 111 Device Information Receiving Unit 112 User Time Series Information Receiving Unit 113 Fault Information Receiving Unit 110 Facility Management DB
120 User management DB
130 Failure management DB
140 Failure rate management DB
150 module failure rate calculation unit 160 failure suspected candidate extraction unit 171 parameter storage unit 172 failure rate storage unit 200 SNMP manager 201 monitoring system 202 network interface

Claims (7)

同一階梯に複数の装置種別が存在する階梯構造ネットワークに対する装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種類の装置が利用されている階梯構造ネットワークにおいて、故障発生時に故障被疑箇所の特定を行う監視装置であって、
故障被疑モジュール情報を含むネットワーク故障情報と、
ユーザ数時系列情報と、
装置1台当りの搭載可能な最大モジュール数や装置を構成するモジュール数が変化するフラグ、モジュール毎の収容可能上限ユーザ数、装置階梯種別を含む装置モジュール構成情報と、
装置台数時系列情報と、
インタフェースの対向装置、モジュールを含むネットワーク構成情報と、
ユーザ数予測に用いるユーザ数予測パラメータと収容率パラメータと、
を格納した記憶手段と、
前記ネットワーク故障情報を装置別・モジュール別に分類し、モジュール毎の故障件数を算出する分類手段と、
前記装置モジュール構成情報を、評価対象となるモジュールの数が装置内で変化するかしないかを前記フラグに基づいて分類する変化判断手段と、
前記変化判断手段で「変化しない」と判断された場合に、前記装置モジュール構成情報における装置1台当りのモジュール最大搭載数と前記装置台数時系列情報の装置台数からモジュール数を算出するモジュール数算出手段と、
前記装置モジュール構成情報における前記装置階梯種別を用いて、同一階梯装置の情報と前記装置台数時系列情報の装置台数の情報から、同一階梯の装置台数比率より、ユーザ数を分配し、前記ユーザ数予測パラメータと分類したユーザ数から未来のユーザ数を求めるユーザ数予測手段と、
前記収容率パラメータと前記装置モジュール構成情報における前記モジュール毎の収容可能上限ユーザ数から、モジュール数を求めるモジュール数予測手段と、
前記変化判断手段で「変化する」と判断された場合は、前記モジュール数予測手段で求められた前記モジュール数を、「変化しない」と判断された場合は、前記モジュール数算出手段で求められた前記モジュール数を、それぞれ用いて、モジュール毎のモジュール故障率を算出し、故障率記憶手段に格納するモジュール故障率算出手段と、
前記ネットワーク構成情報と任意の手段で検知した故障検知情報から故障被疑箇所候補を抽出する故障被疑箇所抽出手段と、
前記故障被疑箇所候補に基づいて、前記故障率記憶手段を参照して、対応する故障被疑箇所のモジュール故障率を抽出し、表示する出力手段と、
を有することを特徴とするネットワーク監視装置。
In a floor structure network in which the number of devices for a floor structure network in which a plurality of device types exist on the same floor and the number of component modules in one device change over time, and a plurality of types of devices are used on the same floor, A monitoring device that identifies a suspected failure location when a failure occurs,
Network failure information including the suspected failure module information,
Number of users time series information,
Device module configuration information including a flag that changes the maximum number of modules that can be mounted per device and the number of modules that constitute the device, the maximum number of users that can be accommodated for each module, and the device floor type,
Number of devices time series information,
Network configuration information, including interface counterparts and modules;
User number prediction parameter and capacity factor parameter used for user number prediction,
Storage means storing
Classifying means for classifying the network failure information by device / module, and calculating the number of failures for each module;
Change determination means for classifying the device module configuration information based on the flag as to whether or not the number of modules to be evaluated changes in the device;
Module number calculation for calculating the number of modules from the maximum number of modules installed per device in the device module configuration information and the number of devices in the device number time-series information when the change determining means determines that “no change” Means,
Using the device layer type in the device module configuration information, the number of users is distributed from the device number ratio of the same floor from the device information of the same floor device and the device number information of the device number time series information, and the number of users. A user number prediction means for obtaining the number of future users from the number of users classified as a prediction parameter;
From the accommodation rate parameter and the maximum number of users that can be accommodated for each module in the device module configuration information, module number prediction means for obtaining the number of modules;
When it is determined that the change determination means is “changed”, the number of modules obtained by the module number prediction means is obtained, and when it is determined that “no change”, it is obtained by the module number calculation means. Module failure rate calculating means for calculating the module failure rate for each module and storing the module failure rate for each module using the number of modules, and
A suspected failure point extraction means for extracting a suspected failure location candidate from the network configuration information and failure detection information detected by any means;
Based on the suspected failure location candidate, referring to the failure rate storage means, the module failure rate of the corresponding suspected failure location is extracted and displayed, and
A network monitoring apparatus comprising:
前記分類手段は、
前記ネットワーク故障情報を、装置別・モジュール別に分類し、特定期間毎のモジュール毎の故障件数を算出する手段を含む
請求項1記載のネットワーク監視装置。
The classification means includes
The network fault information, classified by device-specific modules, network monitoring device of claim 1 further comprising a means for calculating the fault count for each module for each specified period.
前記変化判断手段において、前記評価対象となるモジュール数が装置内で「変化する」と判定された場合に、
記ユーザ数予測手段は
記装置モジュール構成情報における装置階梯種別を用いて、同一階梯装置の情報と装置台数時系列情報の装置台数の情報から求められた同一階梯の装置台数比率より、ユーザ数を分配し、ユーザ予測パラメータと分類したユーザ数から未来のユーザ数を予測する手段を含み、
前記モジュール数予測手段は、
前記収容率パラメータと前記装置モジュール構成情報におけるモジュール毎の収容可能上限ユーザ数情報から、モジュール数を予測する手段を含む
請求項1記載のネットワーク監視装置。
When the change determination means determines that the number of modules to be evaluated is “changes” in the apparatus,
Before Symbol number of users predicting means,
Using the apparatus revised classification before Symbol module configuration information, from the device number ratio of the same revised determined from the information of the device number information and the device number time series information of the same revised apparatus distributes the number of users, the user predicted Including means for predicting the number of future users from the number of users classified as a parameter,
The module number predicting means includes:
The network monitoring device according to claim 1, further comprising means for predicting the number of modules from the accommodation rate parameter and the maximum number of users that can be accommodated for each module in the device module configuration information.
同一階梯に複数の装置種別が存在する階梯構造ネットワークに対する装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種類の装置が利用されている階梯構造ネットワークにおいて、故障発生時に故障被疑箇所の特定を行うネットワーク監視方法であって、
入力手段が、
故障被疑モジュール情報を含むネットワーク故障情報と、
ユーザ数時系列情報と、
装置1台当りの搭載可能な最大モジュール数や装置を構成するモジュール数が変化するフラグ、モジュール毎の収容可能上限ユーザ数、装置階梯種別を含む装置モジュール構成情報と、
装置台数時系列情報と、
インタフェースの対向装置、モジュールを含むネットワーク構成情報と、
ユーザ数予測に用いるユーザ数予測パラメータと収容率パラメータと、
を入力し、記憶手段に格納する情報取得ステップと、
分類手段が、前記ネットワーク故障情報を装置別・モジュール別に分類し、モジュール毎の故障件数を算出する分類ステップと、
変化判断手段が、前記装置モジュール構成情報を、評価対象となるモジュールの数が装置内で変化するかしないかを前記フラグに基づいて分類する変化判断ステップと、
モジュール数算出手段が、前記変化判断ステップで「変化しない」と判断された場合に、
前記装置モジュール構成情報における装置1台当りのモジュール最大搭載数と前記装置台数時系列情報の装置台数からモジュール数を算出するモジュール数算出ステップと、
ユーザ数予測手段が、前記装置モジュール構成情報における前記装置階梯種別を用いて、同一階梯装置の情報と前記装置台数時系列情報の装置台数の情報から、同一階梯の装置台数比率より、ユーザ数を分配し、前記ユーザ数予測パラメータと分類したユーザ数から未来のユーザ数を求めるユーザ数予測ステップと、
モジュール数予測手段が、前記収容率パラメータと前記装置モジュール構成情報における前記モジュール毎の収容可能上限ユーザ数から、モジュール数を求めるモジュール数予測ステップと、
モジュール故障率算出手段が、前記変化判断ステップにおいて、「変化する」と判断された場合は、前記モジュール数予測ステップで求められた前記モジュール数を、「変化しない」と判断された場合は、前記モジュール数算出ステップで求められた前記モジュール数を、それぞれ用いて、モジュール毎のモジュール故障率を算出し、故障率記憶手段に格納するモジュール故障率算出ステップと、
故障被疑箇所抽出手段が、前記ネットワーク構成情報と任意の手段で検知した故障検知情報から故障被疑箇所候補を抽出する故障被疑箇所抽出ステップと、
出力手段が、前記故障被疑箇所候補に基づいて、前記故障率記憶手段を参照して、対応する故障被疑箇所のモジュール故障率を抽出し、表示する出力ステップと、
を行うことを特徴とするネットワーク監視方法。
In a floor structure network in which the number of devices for a floor structure network in which a plurality of device types exist on the same floor and the number of component modules in one device change over time, and a plurality of types of devices are used on the same floor, A network monitoring method for identifying a suspected failure location when a failure occurs,
Input means
Network failure information including the suspected failure module information,
Number of users time series information,
Device module configuration information including a flag that changes the maximum number of modules that can be mounted per device and the number of modules that constitute the device, the maximum number of users that can be accommodated for each module, and the device floor type,
Number of devices time series information,
Network configuration information, including interface counterparts and modules;
User number prediction parameter and capacity factor parameter used for user number prediction,
And an information acquisition step of storing in the storage means;
A classifying step for classifying the network failure information by device / module, and calculating the number of failures for each module;
A change determining unit that classifies the device module configuration information based on the flag as to whether or not the number of modules to be evaluated changes in the device;
When the module number calculation means determines that “no change” in the change determination step,
A module number calculating step of calculating a module number from the maximum number of modules mounted per device in the device module configuration information and the number of devices in the device number time-series information;
The number-of-users predicting means uses the number of devices in the device module configuration information to determine the number of users based on the device number ratio of the same floor from the information on the same floor device and the information on the number of devices in the device number time series information. A number-of-users prediction step of determining the number of future users from the number of users classified and classified as the number-of-users prediction parameter;
A module number predicting unit calculates a module number from the accommodation capacity parameter and the maximum number of users that can be accommodated for each module in the device module configuration information;
When the module failure rate calculation means is determined to be “changed” in the change determination step, the module number obtained in the module number prediction step is determined to be “not changed”. A module failure rate calculating step of calculating a module failure rate for each module using each of the modules obtained in the module number calculating step and storing the module failure rate in a failure rate storage unit;
The suspected failure point extraction means extracts the suspected failure location candidate from the network configuration information and failure detection information detected by any means, suspected failure location extraction step;
An output means for extracting and displaying a module failure rate of a corresponding suspected failure location with reference to the failure rate storage means based on the suspected failure location candidate; and
A network monitoring method characterized by:
前記分類ステップにおいて、
前記ネットワーク故障情報を、装置別・モジュール別に分類し、特定期間毎のモジュール毎の故障件数を算出する
請求項4記載のネットワーク監視方法。
In the classification step,
Wherein the network fault information, classified by device-specific modules, network monitoring process according to claim 4, wherein for calculating the fault count for each module for each specified period.
前記変化判断ステップにおいて、前記評価対象となるモジュール数が装置内で「変化する」と判定された場合に、
記ユーザ数予測ステップにおいて
記装置モジュール構成情報における装置階梯種別を用いて、同一階梯装置の情報と装置台数時系列情報の装置台数の情報から求められた同一階梯の装置台数比率より、ユーザ数を分配し、ユーザ予測パラメータと分類したユーザ数から未来のユーザ数を予測し、
前記モジュール数予測ステップにおいて、
前記収容率パラメータと前記装置モジュール構成情報におけるモジュール毎の収容可能上限ユーザ数情報から、モジュール数を予測する
請求項5記載のネットワーク監視方法。
In the change determining step, when it is determined that the number of modules to be evaluated is “changed” in the apparatus,
In the previous Symbol number of users prediction step,
Using the apparatus revised classification before Symbol module configuration information, from the device number ratio of the same revised determined from the information of the device number information and the device number time series information of the same revised apparatus distributes the number of users, the user predicted Estimate the number of future users from the number of users classified as parameters,
In the module number prediction step,
The network monitoring method according to claim 5, wherein the number of modules is predicted from the accommodation rate parameter and the maximum number of users that can be accommodated for each module in the device module configuration information.
請求項1乃至3のいずれか1項に記載のネットワーク監視装置を構成する各手段としてコンピュータを機能させるためのネットワーク監視プログラム。   The network monitoring program for functioning a computer as each means which comprises the network monitoring apparatus of any one of Claim 1 thru | or 3.
JP2011012108A 2011-01-24 2011-01-24 Network monitoring apparatus, method and program Active JP5261510B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011012108A JP5261510B2 (en) 2011-01-24 2011-01-24 Network monitoring apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011012108A JP5261510B2 (en) 2011-01-24 2011-01-24 Network monitoring apparatus, method and program

Publications (2)

Publication Number Publication Date
JP2012156641A JP2012156641A (en) 2012-08-16
JP5261510B2 true JP5261510B2 (en) 2013-08-14

Family

ID=46837954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011012108A Active JP5261510B2 (en) 2011-01-24 2011-01-24 Network monitoring apparatus, method and program

Country Status (1)

Country Link
JP (1) JP5261510B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7287219B2 (en) * 2019-09-26 2023-06-06 富士通株式会社 FAILURE EVALUATION DEVICE AND FAILURE EVALUATION METHOD

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4445300B2 (en) * 2004-03-18 2010-04-07 富士通株式会社 Network failure estimation method and network failure estimation device
JP4612525B2 (en) * 2005-10-25 2011-01-12 エヌ・ティ・ティ・コミュニケーションズ株式会社 Network fault site identification apparatus and method

Also Published As

Publication number Publication date
JP2012156641A (en) 2012-08-16

Similar Documents

Publication Publication Date Title
US10860939B2 (en) Application performance analyzer and corresponding method
JP6394726B2 (en) Operation management apparatus, operation management method, and program
EP2759938B1 (en) Operations management device, operations management method, and program
EP2311145B1 (en) Automatic discovery of physical connectivity between power outlets and it equipment
US8655623B2 (en) Diagnostic system and method
US8352789B2 (en) Operation management apparatus and method thereof
US10438124B2 (en) Machine discovery of aberrant operating states
WO2014109112A1 (en) Information processing system monitoring device, monitoring method, and monitoring program
US20060188011A1 (en) Automated diagnosis and forecasting of service level objective states
US8874642B2 (en) System and method for managing the performance of an enterprise application
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
KR101476081B1 (en) Network event management
CA2983306C (en) System and method for handling events involving computing systems and networks using fabric monitoring system
CN103023028A (en) Rapid grid failure positioning method based on dependency graph of entities
JP2015095060A (en) Log analysis device and method
US20080071807A1 (en) Methods and systems for enterprise performance management
CN101345656B (en) global fault rate measuring method
Raj et al. Cloud infrastructure fault monitoring and prediction system using LSTM based predictive maintenance
US9201752B2 (en) System and method for correlating empirical data with user experience
JP5261510B2 (en) Network monitoring apparatus, method and program
KR101520103B1 (en) System and method for inference and surveillance of application fault of it service using functional partitioning
JP4962371B2 (en) Failure estimation device
US20090161657A1 (en) Method and apparatus for assuring voice over internet protocol service
CN116094905A (en) Full-link monitoring system
Majumder et al. Fault Detection Engine in Intelligent Predictive Analytics Platform for DCIM

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130426

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160502

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5261510

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350