JP2010268275A - Network management system, network management method, and program therefor - Google Patents

Network management system, network management method, and program therefor Download PDF

Info

Publication number
JP2010268275A
JP2010268275A JP2009118554A JP2009118554A JP2010268275A JP 2010268275 A JP2010268275 A JP 2010268275A JP 2009118554 A JP2009118554 A JP 2009118554A JP 2009118554 A JP2009118554 A JP 2009118554A JP 2010268275 A JP2010268275 A JP 2010268275A
Authority
JP
Japan
Prior art keywords
failure
network
determination
reliability
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009118554A
Other languages
Japanese (ja)
Other versions
JP5133941B2 (en
Inventor
Tatsuya Matsukawa
達哉 松川
Yusuke Funakoshi
裕介 船越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009118554A priority Critical patent/JP5133941B2/en
Publication of JP2010268275A publication Critical patent/JP2010268275A/en
Application granted granted Critical
Publication of JP5133941B2 publication Critical patent/JP5133941B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a network management technology that can be applied to a network with an uneven configuration and capacity and can evaluate the reliability of the network based on the variation in defective rate caused by sequential installation of multiple types of equipment and the influence of prolonged interruption of service on users when a trouble occurs. <P>SOLUTION: In a step 0, failure information, information on an object to be determined, a reference value for determining the execution, and a reference value for determining the reliability are input. In a step 1, the total number of failures of the network is calculated from the failure information. In a step 2, it is determined based on the total number of failures whether or not subsequent steps need be executed. In a step 3, the impact of failure is calculated based on the down time of each failure and the number of influenced users when each failure occurs. In a step 4, a probability distribution for the impact of failure is estimated as a degree of confidence from the total number of failures and the impact of failure. In a step 5, it is determined whether or not the reliability of the network is acceptable based on the estimation result for the degree of confidence. In a step 6, the determination result is displayed on a display unit. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、IP(インターネットプロトコル)に代表されるネットワークプロトコルによって実現される通信ネットワーク技術に関し、特に、ネットワークを構成する構成要素(IPパケット等のパケットを転送する装置、装置間を接続するリンクを構成するための伝送路や伝送路装置等のネットワーク設備に関する設備)の故障情報をもとに、ネットワークの物理的信頼度と故障に伴う故障時間(故障の継続時間)および影響規模(影響ユーザ数)の情報から故障の影響度を算出し、ネットワーク信頼度の良否を判定し、信頼度の低下に影響の大きい故障事例やネットワーク設備を選定することによって、信頼度の高い、あるいは所望する信頼度を有するネットワークの運用管理を自動的かつ精度よく実現することが可能なネットワーク管理システムおよびネットワーク管理方法、ならびにそのためのプログラムに関するものである。   The present invention relates to a communication network technology realized by a network protocol typified by IP (Internet Protocol), and in particular, a component constituting a network (a device for transferring a packet such as an IP packet, a link for connecting devices). Based on the failure information of the network equipment such as transmission lines and transmission line devices to configure), the physical reliability of the network, the failure time (failure duration) associated with the failure, and the impact scale (number of affected users) ) To calculate the degree of failure impact, determine whether the network reliability is good or bad, and select failure cases and network equipment that have a large impact on reliability degradation. Network management that can automatically and accurately realize operation management of networks System and network management method, and to a program therefor.

通信ネットワークの社会インフラ化が進むに伴って、ネットワークの故障や障害がユーザのサービス利用に与える影響を軽減することが必要不可欠となっている。一方、IPネットワーク技術が進展するにつれて、市販技術や汎用製品を積極的に導入することを前提としてネットワークを構築するため、関連装置の開発期間やネットワークの構築期間は短縮化する傾向にある。   As the social infrastructure of communication networks advances, it is indispensable to reduce the impact of network failures and failures on user service usage. On the other hand, as the IP network technology progresses, the network is constructed on the premise of aggressively introducing commercial technology and general-purpose products, and therefore the development period of related devices and the network construction period tend to be shortened.

また、新規に開発され運用実績の少ない装置や多種の機能を有する装置など、各種ネットワーク装置が導入される機会が増加しており、経年劣化のみならず、構成部品の不良や設定条件の不適合など、装置停止の各種要因が混在し故障要因が混在化する危険性がある。   In addition, there are increasing opportunities to introduce various types of network devices, such as newly developed devices with little operational track record and devices with various functions. Not only deterioration over time, but also component defects and non-compliance with setting conditions, etc. There is a risk that various causes of the device stop coexist and the cause of failure coexists.

従来、通信ネットワークの信頼性は、対象ネットワークを構成する設備(例えばネットワーク装置やリンク等のネットワーク構成要素)と設備の構成(設備の接続構成や冗長構成)によって、当該の通信ネットワークに対する信頼性評価モデルを作成し、個々のネットワーク設備が有する故障確率(例えば、故障率や不稼動率)の積や和を用いて算出される。   Conventionally, the reliability of a communication network depends on the equipment (for example, network components such as network devices and links) constituting the target network and the equipment configuration (facility connection configuration or redundant configuration). A model is created and calculated using the product or sum of failure probabilities (for example, failure rate and unavailability) of individual network equipment.

そして、当該の通信ネットワークに対して求められている故障確率をもとに、個々のネットワーク設備に対して求められている故障確率を配分し、配分された故障確率と信頼性評価モデルをもとに算出された故障確率とを比較することよって評価されてきた。   Then, based on the failure probability required for the relevant communication network, the failure probability required for each network equipment is allocated, and based on the allocated failure probability and the reliability evaluation model. It has been evaluated by comparing the calculated failure probability.

従来のネットワーク信頼性の算出方法については、「NTT通信網を理解していただくために」(NTT通信網研究会、1994)“第8章 安定品質“、pp.314−329(非特許文献1)に記述されている。この文献に開示されている信頼性評価技術は、ネットワークの計画・設計・構築を実施する上で的確な判断を支援するための技術である。   For the conventional calculation method of network reliability, see “To understand the NTT communication network” (NTT Communication Network Study Group, 1994), “Chapter 8 Stable Quality”, pp. 314-329 (Non-Patent Document 1). The reliability evaluation technique disclosed in this document is a technique for supporting accurate judgment in implementing network planning, design, and construction.

また、信頼性を考慮した従来のネットワークの設計方法は、ネットワークの設計者が、ネットワーク設計の対象となっているネットワーク区間において、ネットワークを構成する個々のネットワーク設備(構成要素)の故障確率を算出し、算出した故障確率を足し合わせ、その合計値が所定の目標値を満たすように、故障確率の低いネットワーク設備を選定する、あるいは故障確率の低いネットワーク設備構成を選定する、あるいはネットワーク設備に収容する加入者数に制限を設けるといったことが実施されている。   In addition, in the conventional network design method considering reliability, the network designer calculates the failure probability of individual network equipment (components) constituting the network in the network section that is the target of the network design. Select the network equipment with a low failure probability, select a network equipment configuration with a low failure probability, or accommodate in the network equipment so that the calculated failure probabilities are added and the total value satisfies the predetermined target value. The number of subscribers to be set is being limited.

ネットワーク信頼性の設計方法については、「信頼性ハンドブック」(日本信頼性学会、1997)“1.5.3 信頼性を考慮したネットワークの改善計画−故障時の迷惑度に着目した通信網の信頼性規定・設計法−”、pp.79−84(非特許文献2)に記述されている。   For the network reliability design method, refer to “Reliability Handbook” (Reliability Society of Japan, 1997) “1.5.3 Network Improvement Plan Considering Reliability-Reliability of Communication Network Focusing on Trouble Level at Failure Sex prescription and design method- ", pp. 79-84 (Non-Patent Document 2).

なお、IPネットワークにおける課題については、後述するように、「ネットワークのIP化に対応した安全・信頼性基準(案)」, 総務省情報通信審議会、情報通信技術分科会、IPネットワーク設備委員会、安全・信頼性作業班、2007年12月20日(非特許文献3)に開示されている。   In addition, as will be described later, issues related to IP networks include "Safety and reliability standards for IP network (draft)", Ministry of Internal Affairs and Communications Information and Communication Council, Information and Communication Technology Subcommittee, IP Network Equipment Committee , Safety and Reliability Work Group, December 20, 2007 (Non-Patent Document 3).

「NTT通信網を理解していただくために」(NTT通信網研究会、1994)“第8章 安定品質”、pp.314−329“To understand the NTT communication network” (NTT Communication Network Study Group, 1994) “Chapter 8 Stable Quality”, pp. 314-329 「信頼性ハンドブック」(日本信頼性学会、1997) “1.5.3 信頼性を考慮したネットワークの改善計画−故障時の迷惑度に着目した通信網の信頼性規定・設計法−”、pp.79−84"Reliability Handbook" (Japan Reliability Association, 1997) "1.5.3 Network Improvement Plan Considering Reliability-Communication Network Reliability Specification / Design Method Focusing on Troubles at Failure-", pp . 79-84 「ネットワークのIP化に対応した安全・信頼性基準(案)」, 総務省情報通信審議会、情報通信技術分科会、IPネットワーク設備委員会、安全・信頼性作業班、2007年12月20日)“Safety / Reliability Standards for Network IP (Draft)”, Ministry of Internal Affairs and Communications Information and Communication Council, Information and Communication Technology Subcommittee, IP Network Equipment Committee, Safety and Reliability Working Group, December 20, 2007 )

(課題1)
上述した従来の技術(非特許文献1)および(非特許文献2)は、評価対象のネットワーク区間(例えば、ある特定キャリアに契約する複数のエンドユーザについて、エンドユーザに一番近いネットワーク設備から冗長構成を有さない複数のネットワーク設備を経由する通信区間)におけるネットワーク設備の配備構成(配備される設備の種別や配備される段数)が全て同一であり、ネットワークの特定装置(特定の機能や機種に属する装置)に対する加入者の収容数が同程度であることを前提としている。この前提においては、ネットワークの特定装置別に故障事例を集計し、各故障確率の平均値の和や積によって、故障がユーザに与える影響をネットワークの故障確率として算出することが可能である。
(Problem 1)
The conventional techniques (Non-patent Document 1) and (Non-Patent Document 2) described above are redundant from the network equipment closest to the end user for a plurality of end users who contract with a specific carrier (for example, a specific carrier). Network equipment deployment configuration (type of equipment deployed and number of stages deployed) in the communication section that goes through multiple network equipment that does not have a configuration are all the same, and the network specific device (specific function or model) It is assumed that the number of subscribers accommodated in devices belonging to the same level is the same. Under this assumption, it is possible to aggregate failure cases for each specific device of the network and calculate the influence of the failure on the user as the network failure probability by the sum or product of the average values of the failure probabilities.

一方、IPネットワークに代表される通信ネットワークにおいては、加入者数の推移やサービス提供の計画に応じてネットワーク設備の配備構成が逐次変更されるため、ネットワーク設備の配備数は時間とともに変化している。また、特定装置においても加入者の収容数は装置によって大きく異なる。   On the other hand, in a communication network represented by an IP network, the deployment configuration of network equipment is sequentially changed according to the change in the number of subscribers and the plan for service provision, so the number of network equipment deployment changes with time. . In addition, the number of subscribers that can be accommodated in a specific device varies greatly depending on the device.

よって、この場合、ネットワーク設備の配備構成や収容構成について、各種変化がある度に全ての構成についての故障確率を算出する必要があるため、計算量がその状況に応じて指数的に増加する。また、ネットワークの故障確率をネットワークの特定装置別に故障事例を集計し算出した故障確率の単純な和や積によって算出することができないため、従来の技術では、IPネットワークに代表される通信ネットワークにおいては、ネットワークの故障確率を適切に評価することができないという問題がある。   Therefore, in this case, since it is necessary to calculate failure probabilities for all the configurations every time there are various changes in the deployment configuration and the accommodation configuration of the network equipment, the calculation amount increases exponentially according to the situation. In addition, since the failure probability of the network cannot be calculated by a simple sum or product of failure probabilities calculated by summing up failure cases for each specific device of the network, in the conventional technology, in a communication network represented by an IP network, There is a problem that the failure probability of the network cannot be properly evaluated.

(課題2)
上述した従来の技術(非特許文献1)および(非特許文献2)は、評価対象のネットワーク区間におけるネットワーク設備について、故障率や故障に伴うサービスの中断時間の平均値を用いてネットワークの故障確率を算出し、ネットワークに求められる信頼性をもとに、個々のネットワーク設備に対して事前に評価の基準となる値を設定し、基準値との比較によって個々のネットワーク設備の故障確率を評価する方法である。
(Problem 2)
The conventional techniques (Non-Patent Document 1) and (Non-Patent Document 2) described above are based on the failure probability of the network using the average value of the failure rate and the service interruption time associated with the failure for the network equipment in the network section to be evaluated. Based on the reliability required for the network, set the reference value for each network facility in advance, and evaluate the failure probability of each network facility by comparing with the reference value. Is the method.

一方、IPネットワークに代表される通信ネットワークにおいては、市販品として提供されている複数の機種装置を組み合わせてネットワークを構成しているため、特定の機能に対しても複数機種のネットワーク設備(機種装置)を用い、ネットワークの運用開始以降においても逐次新規の機種装置が導入されている。   On the other hand, in a communication network represented by an IP network, since a network is configured by combining a plurality of model devices provided as commercially available products, a plurality of types of network equipment (model devices) are also provided for specific functions. ), New model devices have been introduced successively after the start of network operation.

また、運用期間の異なる複数の機種装置が配備されるため、故障の発生件数(頻度)や発生率(時間当たりの発生頻度)の統計的特性は、大きなばらつきを有する。   In addition, since a plurality of model apparatuses having different operation periods are deployed, the statistical characteristics of the number of occurrences (frequency) and the rate of occurrence (occurrence frequency per hour) vary greatly.

同様に、ネットワーク設備の設備機種の多様化によって、設備の故障や停止事象の種別が増加し、故障要因の迅速な切り分けや故障箇所の特定が困難化しているため、故障に伴うサービスの中断時間が長引く可能性がある。   Similarly, the diversification of equipment types of network equipment has increased the types of equipment failures and shutdown events, making it difficult to quickly isolate the cause of failure and identify the location of the failure. May be prolonged.

これらの課題については、上述した非特許文献3(ネットワークのIP化に対応した安全・信頼性基準(案), 総務省情報通信審議会、情報通信技術分科会、IPネットワーク設備委員会、安全・信頼性作業班、2007年12月20日)に記述されている。   Regarding these issues, Non-Patent Document 3 mentioned above (Safety / Reliability Standards (draft) corresponding to IP of network), Ministry of Internal Affairs and Communications Information and Communication Council, Information and Communication Technology Subcommittee, IP Network Equipment Committee, Safety and Reliability Described in the Reliability Work Group, December 20, 2007).

よって、故障率や故障に伴うサービスの中断時間の平均値を用いてネットワークの故障確率を算出する場合には、影響度が大きく発生頻度の低い故障事例や影響度が小さく発生頻度の大きい故障事例がネットワークおよびネットワークを利用するユーザに及ぼす影響を適切に評価することができず、それらの影響を過小に、あるいは過大に評価してしまう危険性がある。   Therefore, when calculating the failure probability of the network using the average value of failure rate and service interruption time due to failure, failure cases with high impact and low occurrence frequency, or failure cases with low impact and high occurrence frequency Cannot properly evaluate the influence of the network on the network and the user who uses the network, and there is a risk that the influence will be underestimated or overestimated.

同時に、個々のネットワーク設備に対して、事前に基準値を設定することができないため、算出した故障確率を比較評価することができない。よって、従来の技術ではネットワークの故障確率を十分に適切に評価することができないという問題がある。   At the same time, since the reference value cannot be set in advance for each network facility, the calculated failure probabilities cannot be compared and evaluated. Therefore, the conventional technique has a problem that the failure probability of the network cannot be sufficiently adequately evaluated.

以上述べたように、ネットワークの信頼性を的確に評価できないことによって、信頼性の低下に影響の大きい故障事例や設備(装置機種等)が明らかにならない、あるいは信頼性向上に効果の高い故障事例や設備が明らかにならない。結果としてネットワークの信頼性向上を確実に実施することができないという問題がある。   As described above, failure cases and facilities (equipment models, etc.) that have a large impact on reliability degradation are not clarified due to inability to accurately evaluate network reliability, or failure cases that are highly effective in improving reliability. And the equipment is not clear. As a result, there is a problem that the reliability of the network cannot be reliably implemented.

そして、高い信頼性を有する、あるいはネットワーク運用管理者が所望する信頼性を有するネットワークを構成するための施策の選定や決定、設備、取替えや修理を要する設備、予備品を要する設備、回復措置手順の変更を要する設備や故障事例、故障要因を解析すべき設備や故障事例等の選定や決定が確実に実施できないことが、従来技術の大きな課題であった。   And selection and determination of measures for constructing a network with high reliability or reliability desired by the network operation manager, equipment, equipment that requires replacement or repair, equipment that requires spare parts, recovery procedure It has been a big problem of the prior art that it is impossible to reliably select and determine equipment and failure cases that require modification, equipment that should be analyzed for failure causes, and failure cases.

本発明の目的は、以上の課題を解決するために、評価対象のネットワーク区間におけるネットワーク設備の配備構成や収容構成が均一でないネットワークに適用可能であり、複数の機種装置が逐次配備されることに起因するネットワークの故障率のばらつきや故障発生時のサービス中断の長時間化によるユーザへの影響を考慮してネットワークの信頼性を評価することが可能なネットワーク管理システムおよびネットワーク管理方法、ならびにそのためのプログラムを提供することである。   In order to solve the above problems, the object of the present invention is applicable to a network in which the deployment configuration and the accommodation configuration of network equipment in the network section to be evaluated are not uniform, and a plurality of model devices are sequentially deployed. Network management system and network management method capable of evaluating the reliability of the network in consideration of the influence on the user due to the variation in the failure rate of the network caused by it and the prolonged service interruption at the time of the failure, and for the same Is to provide a program.

本発明は、上記目的を達成するために、次のような構成を採用する。
(1)本発明は、上記課題(1)を解決するために、当該ネットワークから収集される故障履歴に関する情報において、故障した設備の機種や機能に関する情報に加えて、故障確率の算出に適した他の情報を用いることによって、ネットワークの故障確率を算出する。
In order to achieve the above object, the present invention adopts the following configuration.
(1) In order to solve the above problem (1), the present invention is suitable for calculating the failure probability in addition to information on the type and function of the failed equipment in the information on the failure history collected from the network. The network failure probability is calculated by using other information.

ここで、故障確率の算出に適した情報として、本発明では、当該ネットワークにおいて発生した故障件数と、個々の故障事例における故障による影響規模、および故障発生時のサービス中断時間の情報を用いる。   Here, as information suitable for calculating the failure probability, the present invention uses information on the number of failures that have occurred in the network, the scale of influence due to failure in each failure case, and the service interruption time when the failure occurs.

これらの情報を用いることによって、評価対象のネットワーク区間におけるネットワーク設備の配備構成や収容構成が均一でないネットワークにおいてもネットワークの故障確率を算出することが可能となり、ネットワークの信頼性を評価する。   By using these pieces of information, it becomes possible to calculate the failure probability of the network even in a network where the arrangement configuration and the accommodation configuration of the network equipment in the network section to be evaluated are not uniform, and the reliability of the network is evaluated.

また、本発明は、上記課題(2)を解決するために、故障確率の平均的特性のみならず、故障の影響度に関する確率分布を推定し、ネットワークの信頼性を評価する。そこで、当該ネットワークから収集される故障履歴情報から、当該ネットワークにおいて発生した故障の総故障件数と個々の故障事例による故障の影響度をもとに、故障の影響度に関する確率(故障の発生確率)の分布を推定する。   In addition, in order to solve the above problem (2), the present invention estimates not only the average characteristic of the failure probability but also the probability distribution regarding the degree of influence of the failure, and evaluates the reliability of the network. Therefore, based on the failure history information collected from the network, the probability of failure impact (probability of failure) based on the total number of failures that occurred in the network and the failure impact of each failure case Estimate the distribution of.

故障の影響度は、故障による影響規模(例えば、故障発生時の影響ユーザ数)と故障発生時のサービス中断時間の積によって算出される。ここで、故障の影響度に関する確率分布をネットワーク信頼度と定義し推定することによって、故障がユーザに与える影響の確率分布として広がりを考慮して、ネットワークの信頼度の良否を判定することが可能となる。   The degree of influence of a failure is calculated by the product of the scale of influence due to the failure (for example, the number of affected users when a failure occurs) and the service interruption time when the failure occurs. Here, it is possible to determine whether the reliability of the network is good or not by considering the spread as the probability distribution of the influence of the failure on the user by defining and estimating the probability distribution regarding the influence degree of the failure as the network reliability It becomes.

また、当該ネットワークの故障履歴情報からネットワークの信頼度を推定する手順において、故障の影響度に対する故障確率を簡易に推定するために累積確率分布を算出する。そして、故障の影響度が極端に大きい事例の発生を考慮するために、上側累積確率分布を算出する。さらに、故障の影響度と対応する確率についての対数変換値を用いることによって確率分布を特徴付けるパラメータを簡易に算出し 、ネットワーク信頼度を推定する。   Further, in the procedure for estimating the reliability of the network from the failure history information of the network, a cumulative probability distribution is calculated in order to easily estimate the failure probability with respect to the influence degree of the failure. Then, an upper cumulative probability distribution is calculated in order to consider the occurrence of cases where the degree of influence of the fault is extremely large. Furthermore, by using the logarithm conversion value for the probability corresponding to the failure influence degree, a parameter that characterizes the probability distribution is simply calculated to estimate the network reliability.

そして、ネットワーク信頼度の推定結果を用いることによって、個々のネットワーク設備に対する基準値を設定できない、あるいは、個々のネットワーク設備の故障確率を個別に評価できない場合においても、ネットワーク信頼度を判定可能とする。   And by using the estimation result of network reliability, it is possible to determine the network reliability even when the reference value for each network facility cannot be set or the failure probability of each network facility cannot be evaluated individually. .

よって、上記手段を実現するために以下の機能を有することを特徴とする。
(a)ネットワーク故障情報、判定対象情報、実行判定基準値、信頼度判定基準値の入力する機能(手順0)
(b)故障情報から当該ネットワークの総故障件数を算出する機能(手順1)
(c)算出した総故障件数をもとに以降の手順の実行の要否を判定する機能(手順2)
(d)各故障事例の故障時間、故障発生時の影響ユーザ数をもとに故障の影響度を算出する機能(手順3)
(e)算出した総故障件数と故障の影響度から故障の影響度に対する確率分布をネットワーク信頼度として推定する機能(手順4)
(f)ネットワーク信頼度の推定結果をもとにネットワーク信頼度の良否を判定する機能(手順5)
(g)判定結果を表示する機能(手順6)
Therefore, in order to realize the above means, the following functions are provided.
(A) Function for inputting network failure information, determination target information, execution determination reference value, reliability determination reference value (procedure 0)
(B) Function for calculating the total number of failures in the network from failure information (Procedure 1)
(C) A function for determining the necessity of executing the subsequent procedure based on the calculated total number of failures (procedure 2)
(D) Function for calculating the degree of influence of a failure based on the failure time of each failure case and the number of affected users at the time of the failure (Procedure 3)
(E) A function for estimating a probability distribution with respect to the failure influence degree as a network reliability from the calculated total number of failures and the failure influence degree (procedure 4)
(F) Function for determining whether the network reliability is good or not based on the estimation result of the network reliability (Procedure 5)
(G) Function for displaying determination result (procedure 6)

以下、本発明のより具体的な構成を記す
(イ)本発明に係るネットワーク管理システムは、構成要素として複数の設備を有するネットワークを管理するネットワーク管理システムであって、前記設備毎の故障時間と影響ユーザ数を含むネットワーク故障情報を入力する第1の入力手段と、信頼度判定の実行の対象となる設備に関する判定対象情報を入力する第2の入力手段と、前記第1の入力手段により入力された前記ネットワーク故障情報を記憶する第1の記憶手段と、前記第2の入力手段により入力された前記判定対象情報を記憶する第2の記憶手段と、前記第1の記憶手段に記憶されたネットワーク故障情報のうち前記判定対象情報により信頼度判定の実行の対象とされる設備に対する故障情報を判定対象として設定する手段と、前記ネットワーク故障情報の故障時間と影響ユーザ数、あるいは、前記ネットワーク故障情報の正規化された故障時間と正規化された影響ユーザ数から判定対象とされる設備毎の故障の影響度を算出する第1の算出手段と、前記第1の算出手段により算出された故障の影響度に対する故障確率を算出し、該故障確率によりネットワーク信頼度を推定する推定手段と、前記推定手段により推定されたネットワーク信頼度を事前に入力されている判定基準値により判定する判定手段と、前記判定手段により判定された判定結果を表示する表示手段と、を具備することを特徴とする。
Hereinafter, a more specific configuration of the present invention will be described. (A) A network management system according to the present invention is a network management system that manages a network having a plurality of facilities as components, and includes a failure time for each facility. A first input means for inputting network failure information including the number of affected users, a second input means for inputting determination target information relating to equipment to be subjected to reliability determination, and input by the first input means Stored in the first storage means, the second storage means for storing the determination target information input by the second input means, and the first storage means Means for setting failure information as a determination target for equipment whose reliability is determined by the determination target information among the network failure information; and The failure time of the network failure information and the number of affected users, or the failure influence level of each equipment to be determined is calculated from the normalized failure time of the network failure information and the normalized number of affected users. Calculating means, calculating a failure probability with respect to the degree of influence of the failure calculated by the first calculating means, estimating network reliability based on the failure probability, and network reliability estimated by the estimating means And a display means for displaying the determination result determined by the determination means.

(ロ)また、上記ネットワーク管理システムにおいて、前記ネットワーク故障情報から判定対象とされた総故障件数を算出する第2の算出手段と、該第2の算出手段により算出された総故障件数と予め与えられた信頼度判定実行の要否の基準となる実行判定基準値とを比較する比較手段とを具備し、前記比較手段による比較の結果、前記総故障件数が前記実行判定基準値以上の場合に、前記推定手段の処理を実行し、前記総故障件数が前記実行判定基準値未満の場合に、前記推定手段の処理を実行しないようにしたことを特徴とする。 (B) In the network management system, a second calculation unit that calculates the total number of failures determined as a determination target from the network failure information, and the total number of failures calculated by the second calculation unit are given in advance. And a comparison unit that compares the execution determination reference value that is a criterion for determining whether or not the reliability determination execution is required, and as a result of comparison by the comparison unit, when the total number of failures is equal to or greater than the execution determination reference value The processing of the estimation means is executed, and the processing of the estimation means is not executed when the total number of failures is less than the execution determination reference value.

(ハ)また、上記ネットワーク管理システムにおいて、前記推定手段は、前記故障の影響度に対する故障確率として上側累積確率を用いることを特徴とする。 (C) In the network management system, the estimation unit uses an upper cumulative probability as a failure probability with respect to the influence degree of the failure.

(ニ)また、上記ネットワーク管理システムにおいて、前記推定手段は、前記故障の影響度に対する上側累積確率を、前記故障の影響度と上側累積確率の対数値をもとに算出すること、あるいは、基準化した故障の影響度と上側累積確率の対数値をもとに算出することを特徴とする。 (D) In the network management system, the estimating means may calculate an upper cumulative probability with respect to the failure influence degree based on a logarithmic value of the failure influence degree and the upper cumulative probability, or a reference It is calculated based on the logarithmic value of the influence degree of the failure and the upper cumulative probability.

(ホ)また、上記ネットワーク管理システムにおいて、前記推定手段は、基準化した故障の影響度と上側累積確率の対数値に対して、線形回帰を実施した結果を用いること、あるいは、基準化パラメータの候補値において、線形回帰の相関係数が最も大きくなる基準化パラメータによって基準化した故障の影響度と上側累積確率の対数値を用いること、あるいは、線形回帰の回帰直線と故障の影響度に対する確率点との差分を用いること、あるいは、線形回帰直線と故障の影響度に対する確率点との差分が一定値以上となる点を判定の基準となる点に設定することを特徴とする。

(E) In the network management system, the estimation means uses a result obtained by performing linear regression on the logarithmic value of the normalized failure influence level and the upper cumulative probability, or the standardization parameter In the candidate value, use the logarithmic value of the failure impact and upper cumulative probability normalized by the standardization parameter with the largest linear regression correlation coefficient, or the probability for the regression line of linear regression and the failure impact It is characterized by using a difference from a point, or by setting a point at which a difference between a linear regression line and a probability point with respect to a failure influence degree is a certain value or more as a reference point.

本発明に係るプログラムは、コンピュータを、上記ネットワーク管理システムにおける各手段として機能させるためのプログラムである。   The program according to the present invention is a program for causing a computer to function as each means in the network management system.

本発明に係るネットワーク管理方法は、構成要素として複数の設備を有するネットワークを管理するネットワーク管理方法であって、前記設備毎の故障時間と影響ユーザ数を含むネットワーク故障情報を入力する第1の入力手順と、信頼度判定の実行の対象となる設備に関する判定対象情報を入力する第2の入力手順と、前記第1の入力手順により入力されたネットワーク故障情報を記憶する第1の記憶手順と、前記第2の入力手段により入力された前記判定対象情報を記憶する第2の記憶手順と、前記第1の記憶手順に記憶されたネットワーク故障情報のうち前記判定対象情報により信頼度判定の実行の対象とされる設備に対する故障情報を判定対象として設定する手順と、前記ネットワーク故障情報の故障時間と影響ユーザ数、あるいは、前記ネットワーク故障情報の正規化された故障時間と正規化された影響ユーザ数から判定対象とされる設備毎の故障の影響度を算出する第1の算出手順と、前記第1の算出手順により算出された故障の影響度に対する故障確率を算出し、該故障確率によりネットワーク信頼度を推定する推定手順と、前記推定手順により推定されたネットワーク信頼度を事前に入力されている判定基準値により判定する判定手順と、前記判定手順により判定された判定結果を表示する表示手順と、を具備することを特徴とする。   The network management method according to the present invention is a network management method for managing a network having a plurality of facilities as a component, and is a first input for inputting network failure information including a failure time and the number of affected users for each facility. A procedure, a second input procedure for inputting determination target information relating to equipment to be subjected to reliability determination, a first storage procedure for storing network failure information input by the first input procedure, A second storage procedure for storing the determination target information input by the second input means; and execution of reliability determination by the determination target information among the network failure information stored in the first storage procedure. A procedure for setting failure information for a target facility as a determination target, a failure time of the network failure information and the number of affected users, or A first calculation procedure for calculating the degree of influence of failure for each facility to be determined from the normalized failure time of the network failure information and the normalized number of affected users, and calculation by the first calculation procedure A failure probability with respect to the degree of influence of the determined failure is calculated, a network reliability is estimated based on the failure probability, and a network reliability estimated by the estimation procedure is determined based on a criterion value input in advance. A determination procedure; and a display procedure for displaying a determination result determined by the determination procedure.

本発明によれば、上記構成を採用することにより、評価ネットワーク設備の配備構成や収容構成、また、配備される装置機種に起因する故障率のばらつきや故障発生時のサービス中断時間の長時間化によるユーザへの影響を考慮することによって、ネットワークの信頼性を精度よく評価することが可能なネットワーク管理技術を実現することが可能になる。   According to the present invention, by adopting the above configuration, the deployment configuration and the accommodation configuration of the evaluation network equipment, the variation in the failure rate due to the deployed device model, and the length of service interruption time when the failure occurs By taking into account the influence on the user, it becomes possible to realize a network management technique capable of accurately evaluating the reliability of the network.

また、実行判定基準値を設定しておき、実行判定基準値以上の場合にのみネットワーク信頼度の推定・判定を実行するようにしたことにより、精度の高い信頼度判定を行うことが可能になり、統計的に信頼性のない無駄な処理を省略することができる。   In addition, it is possible to perform highly reliable reliability determination by setting an execution determination reference value and executing network reliability estimation / determination only when the execution determination reference value is greater than or equal to the execution determination reference value. Therefore, useless processing that is not statistically reliable can be omitted.

そして、ネットワークの信頼性の低下に影響の大きい故障事例やネットワーク設備を判定し、ネットワークの信頼性向上施策に影響の大きい事例や装置を選定することによって、信頼性の高い、あるいはネットワークの運用管理者が所望する信頼性を有するネットワークの管理を実施することが可能になる。   Then, by determining failure cases and network equipment that have a large impact on network reliability degradation, and selecting cases and devices that have a large impact on network reliability improvement measures, the operation management of the network is highly reliable. It becomes possible to manage a network having the reliability desired by a person.

ここで、本発明では、ネットワーク設備の故障情報からネットワークの信頼度を推定する機能を有しているため、定量的な信頼性評価に基づき、ネットワークの信頼度の低下に影響の大きい装置や原因を明らかにすることが可能である。   Here, in the present invention, since it has a function of estimating the reliability of the network from the failure information of the network equipment, based on the quantitative reliability evaluation, the device and the cause that have a large influence on the decrease in the reliability of the network It is possible to clarify.

また、ネットワークの信頼度を故障の影響度と故障確率として表すことによって、優先的に実施すべき対策や予防的に実施すべき対策を選定する、あるいは誤った判断を回避することが可能であり、ネットワークの信頼度の向上を確実に実施することが可能である。   Also, by expressing the reliability of the network as the degree of failure impact and failure probability, it is possible to select measures that should be preferentially implemented and measures that should be taken preventively, or to avoid erroneous decisions. It is possible to reliably improve the reliability of the network.

さらに、ネットワークの信頼度の良否を定量的に判定することによって、ネットワークの運用管理に際して、故障発生時における迅速な復旧措置の決定や、ユーザへの影響を軽減する故障対策を事前に決定するための指標を与えることができる。   In addition, by determining the reliability of the network quantitatively, in network operation management, in order to quickly determine recovery measures in the event of a failure, and to determine failure countermeasures that reduce the impact on the user Indicators can be given.

本発明に係るネットワーク管理システムの処理フロー(処理手順)の一例を示す図である。It is a figure which shows an example of the processing flow (processing procedure) of the network management system which concerns on this invention. 本発明に係るネットワーク管理システムの構成とその処理の流れの一実施形態を示す図である。It is a figure which shows one Embodiment of the structure of the network management system which concerns on this invention, and the flow of its processing. 本発明の実施形態において信頼度の判定を実施するフローチャートの一例および計算のステップの一例を示す図である。It is a figure which shows an example of the flowchart which implements determination of reliability in an embodiment of this invention, and an example of the step of calculation. 本発明の実施形態における処理を説明するために用いるネットワーク故障情報の一例を示す図である。It is a figure which shows an example of the network failure information used in order to demonstrate the process in embodiment of this invention. 本発明の実施形態における処理を説明するために用いるネットワーク故障データベース(DB)内の故障情報の一例を示す図である。It is a figure which shows an example of the failure information in the network failure database (DB) used in order to demonstrate the process in embodiment of this invention. 本発明の実施形態における処理を説明するために用いる故障の影響度の算出例を示す図である(故障時間と影響ユーザ数の積を故障の影響度と定義した場合)。It is a figure which shows the example of calculation of the influence degree of a failure used in order to demonstrate the process in embodiment of this invention (when the product of failure time and the number of affected users is defined as a failure impact degree). 本発明の実施形態における処理を説明するために用いる昇順に並べた故障の影響度の例を示す図である(故障時間と影響ユーザ数の積を故障の影響度と定義した場合)。It is a figure which shows the example of the influence degree of the failure arranged in the ascending order used in order to demonstrate the process in embodiment of this invention (when the product of failure time and the number of affected users is defined as failure influence degree). 本発明の実施形態における処理を説明するために用いる確率点の算出例を示す図である。It is a figure which shows the example of calculation of the probability point used in order to demonstrate the process in embodiment of this invention. 両対数グラフ上の確率点および回帰直線を示す図である。It is a figure which shows the probability point and regression line on a log-log graph. 本発明の実施形態における処理を説明するために用いるパラメータaおよび相関係数の算出例を示す図である。It is a figure which shows the example of calculation of the parameter a and correlation coefficient used in order to demonstrate the process in embodiment of this invention. 本発明の実施対象となるネットワークの一例を示す図である。It is a figure which shows an example of the network used as the implementation object of this invention.

(本発明の概要)
まず、本発明が対象とするネットワーク構成について説明する。
図11は、本発明が対象とするネットワーク構成を示す図であり、制御網100、コアネットワーク200、アクセスネットワーク300、エンドユーザ400から構成される。
(Outline of the present invention)
First, a network configuration targeted by the present invention will be described.
FIG. 11 is a diagram illustrating a network configuration targeted by the present invention, and includes a control network 100, a core network 200, an access network 300, and an end user 400.

エンドユーザ400がインターネットアクセスや各種IP(インターネット プロトコル)サービスを利用する状況を想定している。ネットワーク要素が冗長化されていない構成箇所における故障はサービス中断につながるため、ユーザのサービス利用に影響を及ぼす可能性が高く、単純な例として、例えばアクセスネットワーク300は、図に示すように、同様の機能を持つ設備あるいは設備内部のコンポーネント(装置A301、装置B302〜装置B303、装置C304〜装置C307)がツリー状に構成されるモデルとして記述できる。   It is assumed that the end user 400 uses the Internet access and various IP (Internet protocol) services. A failure in a configuration where the network element is not made redundant leads to service interruption, so it is highly likely that the service usage of the user will be affected. As a simple example, for example, the access network 300 is similar as shown in the figure. Or a component inside the facility (device A301, device B302 to device B303, device C304 to device C307) can be described as a model configured in a tree shape.

コアネットワーク200など、冗長構成箇所における故障はサービスの中断につながる可能性は低いものの、切り替えに伴うサービスの瞬断や切り替え機能の不具合によるサービス中断が発生する場合がある。   Although a failure in a redundant configuration location such as the core network 200 is unlikely to lead to service interruption, service interruption due to switching or service interruption due to switching function failure may occur.

よって、ネットワークとしての信頼性を評価するためには、サービスの中断となった全ての故障事例を検討対象とする必要があるが、時間とともに変化する大規模なネットワークから収集された膨大な故障履歴データを対象とする場合には、ここの故障箇所・要因の分類や比較評価は必ずしも容易でない。   Therefore, in order to evaluate the reliability of the network, it is necessary to consider all the failure cases that caused service interruption, but a huge failure history collected from a large-scale network that changes over time In the case of data, it is not always easy to classify and evaluate comparative points and factors.

そこで、本発明は、上記点を考慮し、全故障事例を横並びにした上で故障特性を把握し定量的な評価を実施するために、ネットワーク管理システムに入力および記録される故障件数,故障発生日時,故障復旧日時,故障時間(故障継続時間=故障復旧日時−故障発生日時),影響ユーザ数(故障が影響した範囲(人))などに基づいて、故障の影響度(=故障時間×影響ユーザ数)、故障の影響度に対する確率を推定することによってネットワークにおける故障特性を特徴付ける影響度に対する故障の起こりやすさや起こりにくさをネットワーク信頼度と定義することによってネットワークの信頼性を総合的に評価するようにしたものである。   In view of the above, the present invention considers the above points, arranges all failure cases side by side, grasps the failure characteristics, and performs a quantitative evaluation. Failure impact level (= failure time x impact) based on date, failure recovery date, failure time (failure duration = failure recovery date-failure occurrence date), number of affected users (range affected by failure (people)), etc. The number of users), and the probability of the failure impact is estimated, and the reliability of the network is comprehensively evaluated by defining the probability of failure and the difficulty of the failure as the network reliability. It is what you do.

(実施形態)
以下、図面を用いて、本発明に係るネットワーク管理システムの実施形態を詳細に説明する。
(Embodiment)
Hereinafter, embodiments of a network management system according to the present invention will be described in detail with reference to the drawings.

図1は、本発明に係るネットワーク管理システムの処理フロー(処理手順)の一例を示す図である。   FIG. 1 is a diagram showing an example of a processing flow (processing procedure) of a network management system according to the present invention.

同図に示すように、本発明における処理手順は、ネットワーク故障情報と判定対象情報を入力する手順(手順0)、総故障件数を算出する手順(手順1)、信頼度判定を実行するか否かを判定する手順(手順2)、故障の影響度を算出する手順(手順3)、ネットワーク信頼度を推定する手順(手順4)、ネットワーク信頼度を判定する手順(手順5)、および判定結果を表示する手順(手順6)からなる。   As shown in the figure, the processing procedure in the present invention includes a procedure for inputting network failure information and determination target information (procedure 0), a procedure for calculating the total number of failures (procedure 1), and whether or not to perform reliability determination. (Procedure 2), a procedure for calculating the degree of influence of a failure (Procedure 3), a procedure for estimating network reliability (Procedure 4), a procedure for determining network reliability (Procedure 5), and a determination result It consists of the procedure (procedure 6) which displays.

図2は、本発明に係るネットワーク管理システムの構成とその処理の流れの一実施形態を示す図であり、対応する図1における(手順0)〜(手順6)についても記載してある。   FIG. 2 is a diagram showing an embodiment of the configuration of the network management system according to the present invention and the processing flow thereof, and also describes (procedure 0) to (procedure 6) in FIG.

同図において、1は(手順0)においてネットワーク管理システムに入力されるネットワーク故障情報、10は本発明に係るネットワーク管理システム、11は受信部、12はネットワーク故障情報を格納するネットワーク故障情報DB(データベース)、13は手順1を実行する総故障件数算出部、14は(手順2)を実行する実行判定部、15は(手順3)を実行する影響度算出部、16は(手順4)を実行するネットワーク信頼度推定部、17はネットワーク信頼度推定値を記憶する記憶部、18は(手順5)を実行するネットワーク信頼度判定部、19は判定対象情報を記憶する記憶部、3は判定対象情報を入力する入力部(入力手段)、4は(手順6)を実行するための表示部(表示手段)であり、(手順5)で判定されたネットワーク信頼度判定結果を表示する。   In the figure, 1 is network failure information input to the network management system in (procedure 0), 10 is a network management system according to the present invention, 11 is a receiver, and 12 is a network failure information DB for storing network failure information ( (Database), 13 is a total failure number calculation unit that executes procedure 1, 14 is an execution determination unit that executes (procedure 2), 15 is an influence calculation unit that executes (procedure 3), and 16 is (procedure 4). Network reliability estimation unit to be executed, 17 is a storage unit that stores the network reliability estimation value, 18 is a network reliability determination unit that executes (Procedure 5), 19 is a storage unit that stores determination target information, and 3 is a determination An input unit (input unit) for inputting target information, 4 is a display unit (display unit) for executing (Procedure 6), and the network determined in (Procedure 5). To display the over-click reliability determination result.

本発明におけるネットワーク管理システム10の処理の実施のタイミングは事前に固定の期間を事前に設定する場合と、任意の期間を入力し実施する場合とがあり、いずれの場合においても、実施形態は同様になるため、以下において、本発明を固定期間ごとに繰り返して実施されるものとし、実施のタイミングが事前に設定されている場合を例として説明する。   The timing of execution of the processing of the network management system 10 in the present invention may be set in advance when a fixed period is set in advance, or may be executed by inputting an arbitrary period. In any case, the embodiment is the same. Therefore, in the following, the present invention is assumed to be repeatedly executed every fixed period, and a case where the execution timing is set in advance will be described as an example.

以下、各手順における処理を、図3に示した本発明に係るネットワーク管理システムにおける処理のフローチャートの各ステップ(ステップS10)〜(ステップS50))に対応付けるとともに、図4に示すネットワーク故障情報の一例、図5に示すネットワーク故障データベース(DB)内の故障情報の一例、図6に示す故障の影響度の算出例、図7に示す昇順に並べた故障の影響度の例、図8に示す確率点の算出例、図9に示す両対数グラフ上の確率点および回帰直線の説明図、図10に示すパラメータaおよび相関係数の算出例を参照しながら詳細に説明する。   Hereinafter, the processing in each procedure is associated with each step (step S10) to (step S50) in the flowchart of processing in the network management system according to the present invention shown in FIG. 3, and an example of the network failure information shown in FIG. 5, an example of the failure information in the network failure database (DB) shown in FIG. 5, an example of the calculation of the degree of influence of the failure shown in FIG. 6, an example of the degree of influence of the failure arranged in ascending order shown in FIG. 7, and the probability shown in FIG. This will be described in detail with reference to a calculation example of points, an explanatory diagram of probability points and regression lines on the log-log graph shown in FIG. 9, and a calculation example of the parameter a and the correlation coefficient shown in FIG.

(手順0)<ネットワーク故障情報、判定対象情報の入力>
本手順は本ネットワーク管理システム10において自動的に実行される、あるいは事前にネットワークの運用管理者が実施するものであり、以降の手順(手順1〜手順6)とは別に記述する。
(Procedure 0) <Input of network failure information and judgment target information>
This procedure is automatically executed in the present network management system 10 or is executed in advance by a network operation manager, and is described separately from the following procedures (procedure 1 to procedure 6).

本ネットワーク管理システム10に対して外部からネットワーク故障情報1と判定対象情報を入力する。ネットワーク故障情報1は、該当システムの外部のデータベース(DB)(図示せず)に格納されており、ネットワーク管理システム10の受信部11に入力する。   The network failure information 1 and the determination target information are input to the network management system 10 from the outside. The network failure information 1 is stored in a database (DB) (not shown) outside the corresponding system and is input to the receiving unit 11 of the network management system 10.

ネットワーク故障情報1には、図4に示すように、故障設備すなわち故障装置(故障した装置機種)、故障発生日時、故障復旧日時、故障時間(分)、影響ユーザ数(人)、故障箇所/原因に関する情報が含まれる。   As shown in FIG. 4, the network failure information 1 includes failure equipment, that is, a failure device (failed device model), failure occurrence date / time, failure recovery date / time, failure time (minutes), number of affected users (people), failure location / Contains information about the cause.

ここで、故障時間(分)は故障によって通信断となっている時間であり、故障発生日時から故障復旧日時までの差分(本実施例では分単位)で定義され、ネットワーク運用管理者が投入する。また、影響ユーザ数(人)は、故障装置の収容数によって定義され投入される。   Here, the failure time (minutes) is the time during which communication is interrupted due to a failure, and is defined by the difference (in minutes in this example) from the failure occurrence date and time to the failure recovery date and time, and is input by the network operation manager. . The number of affected users (persons) is defined by the number of failed devices accommodated.

受信部11に入力されたネットワーク故障情報1はネットワーク故障DB12に格納される。   The network failure information 1 input to the receiving unit 11 is stored in the network failure DB 12.

また、信頼度判定の実行の対象となる設備(設備・装置を含めた総称)に関する情報を判定対象情報として、本ネットワーク管理システム10に入力手段3を介して入力する。入力手段3から入力された判定対象情報は記憶部19に一旦記憶される。   In addition, information related to equipment (generic name including equipment / device) that is a target of execution of reliability determination is input to the network management system 10 via the input unit 3 as determination target information. The determination target information input from the input unit 3 is temporarily stored in the storage unit 19.

記憶部19に記憶された判定対象情報を参照し、ネットワーク故障情報DB12にて入力された故障情報に対して、判定対象となる設備の故障情報を判定対象情報として設定する。それ以外の故障情報については、以降の手続きの対象外の情報として除外する。   With reference to the determination target information stored in the storage unit 19, the failure information of the facility to be determined is set as the determination target information for the failure information input in the network failure information DB 12. Other failure information is excluded as information that is not subject to subsequent procedures.

図5は、ネットワーク故障情報DB12に記憶されたネットワーク故障情報の一例を示す図である。同図に示すように、ネットワーク故障情報DB12内の故障情報は、故障設備すなわち故障装置(装置機種)毎の故障発生日時、故障復旧日時、故障時間(分)、影響ユーザ数(人)、故障箇所/原因の各項目からなる。故障時間(分)は(故障復旧日時)−(故障発生日時)によって算出される(単位は分)。   FIG. 5 is a diagram illustrating an example of network failure information stored in the network failure information DB 12. As shown in the figure, failure information in the network failure information DB 12 includes failure occurrence date / time, failure recovery date / time, failure time (minutes), number of affected users (people), failure for each failure facility, that is, failure device (device model). It consists of each item of location / cause. The failure time (minutes) is calculated by (failure recovery date / time) − (failure occurrence date / time) (unit: minutes).

(手順1)<総故障件数算出部13の処理>
手順1では、総故障件数算出部13にて、判定対象として設定されている故障情報について、ネットワーク故障情報DB12内の事例数(レコード数)を総故障件数として算出する(図3のステップS10に対応)。ここで、総故障件数をN(総故障件数算出値)とする。
(Procedure 1) <Processing by Total Failure Number Calculation Unit 13>
In the procedure 1, the total failure number calculation unit 13 calculates the number of cases (record number) in the network failure information DB 12 as the total failure number for the failure information set as the determination target (in step S10 of FIG. 3). Correspondence). Here, the total number of failures is N (total failure count calculation value).

(手順2)<実行判定部14の処理(信頼度判定(以降の手順)の実行要否の判定)>
(手順2)では、総故障件数の算出結果をもとに、実行判定部14において、該総故障件数と所定の実行判定基準値を比較手段で比較することによって以降の処理の実行の要否を判定する(図3のステップS20に対応)。所定の実行判定基準値は、入力手段3からネットワーク運用管理者が事前に任意の値を入力するようにすればよい。統計的な優位さの観点から数十件程度の事例が必要であり、実行判定基準値の設定として、例えば50程度の値を設定すればよい。
(Procedure 2) <Processing of Execution Determination Unit 14 (Determining Necessity of Execution of Reliability Determination (Subsequent Procedure))>
In (Procedure 2), on the basis of the calculation result of the total number of faults, the execution determination unit 14 compares the total number of faults with a predetermined execution determination reference value by using a comparison unit. (Corresponding to step S20 in FIG. 3). For the predetermined execution determination reference value, the network operation manager may input an arbitrary value in advance from the input unit 3. From the standpoint of statistical advantage, about several tens of cases are necessary, and for example, a value of about 50 may be set as the execution determination reference value.

上記(手順1)で算出された総故障件数と前記実行判定基準値を比較手段で比較し、(総故障件数)≧(実行判定基準値)であれば、統計的な観点からみて総故障件数は多いと判定され(図3のステップS20:Y)、以降の手順に進む。なお、(総故障件数)<(実行判定基準値)であれば(図3のステップS20:N)、統計的な観点からみて総故障件数は少ないと判定され、以降の(手順4)は実行せずにステップS10に戻る。   The total number of failures calculated in (Procedure 1) and the execution determination reference value are compared by a comparison means. If (total number of failures) ≧ (execution determination reference value), the total number of failures from a statistical viewpoint Is determined to be large (step S20: Y in FIG. 3), and the process proceeds to the subsequent steps. If (total number of failures) <(execution determination reference value) (step S20: N in FIG. 3), it is determined that the total number of failures is small from a statistical point of view, and the subsequent (procedure 4) is executed. Without returning to step S10.

(手順3)<故障の影響度算出部15の処理>
実行判定部14(手順2)において、(総故障件数)≧(実行判定基準値)で信頼度判定の実行が必要と判定した場合(図3のステップS20:Y)、本(手順3)では、影響度算出部15において、故障の影響度を算出する(図3のステップS30)。
(Procedure 3) <Processing of Failure Influence Level Calculation Unit 15>
In the execution determination unit 14 (procedure 2), when it is determined that it is necessary to execute reliability determination with (total number of failures) ≧ (execution determination reference value) (step S20 in FIG. 3: Y), in this (procedure 3), Then, the influence degree calculation unit 15 calculates the influence degree of the failure (step S30 in FIG. 3).

故障の影響度の算出方法として、以下の2つの方法がある。
(方法1)「故障時間と影響ユーザ数の積を故障の影響度と定義する場合」
故障発生日時の時系列の順に、故障事例に番号iを付与する。各故障事例の故障時間(分)をdi、故障による影響ユーザ数(人)をriとし、i番目の故障事例に関する故障の影響度(分×人)hiを故障時間(分)diと影響ユーザ数(人)riの積di×riとして算出する(hi=di×ri)。図6は、故障時間と影響ユーザ数の積を故障の影響度と定義した場合の故障の影響度の算出結果の一例を示す図である。
There are the following two methods for calculating the degree of influence of a failure.
(Method 1) “When the product of the failure time and the number of affected users is defined as the failure impact level”
Numbers i are assigned to failure cases in order of the time and date of failure occurrence. The failure time (minutes) of each failure case is di, the number of users affected by the failure (people) is ri, and the failure influence degree (minutes × people) hi for the i-th failure case is the failure time (minutes) di and the affected users. It is calculated as the product di × ri of the number (person) ri (hi = di × ri). FIG. 6 is a diagram illustrating an example of a calculation result of the failure influence degree when the product of the failure time and the number of affected users is defined as the failure influence degree.

(方法2)「正規化された故障時間と正規化された影響ユーザ数の積を故障の影響度と定義する場合」
故障時間と影響ユーザ数について、それぞれの統計値にて正規化した値(正規化故障時間、および正規化影響ユーザ数)を用いて、上記と同様に、その積を故障の影響度として定義し算出する。
(Method 2) “When the product of the normalized failure time and the normalized number of affected users is defined as the failure impact level”
For the failure time and the number of affected users, use the values normalized by the respective statistical values (normalized failure time and normalized number of affected users), and define the product as the impact level of the failure in the same way as above. calculate.

故障の影響度hi'は、正規化故障時間di'と正規化影響ユーザ数ri'を用いて、di'ri'として定義し算出する。このとき、正規化に用いる統計値としては、それぞれの平均値、中央値、最大値、最小値、分位値(四分位値等)等の候補がある。   The failure influence degree hi ′ is defined and calculated as di′ri ′ using the normalized failure time di ′ and the normalized influence user number ri ′. At this time, as statistical values used for normalization, there are candidates such as respective average values, median values, maximum values, minimum values, quantile values (quartile values, etc.).

通常、ネットワークの運用管理システムにおいては、故障時間の情報を分単位で収集し、影響ユーザ数の情報を人単位で収集するため、故障の影響度は〔分・人〕の単位で算出する。   Usually, in a network operation management system, failure time information is collected in units of minutes, and information on the number of affected users is collected in units of people. Therefore, the degree of influence of failure is calculated in units of [minutes / people].

以降の手順は、方法1および方法2のどちらの場合も共通であるため、方法1の記述・記号に従って記述する。   Since the subsequent procedures are common to both the method 1 and the method 2, they are described according to the description and symbols of the method 1.

(手順4)<ネットワーク信頼度推定部16の処理(ネットワーク信頼度の推定)>
手順4では、ネットワーク信頼度推定部16において、手順2にて算出された総故障件数および手順3にて算出された故障の影響度をもとに、ネットワーク信頼度を推定する(図3のステップS40)。ネットワークの信頼度は、ネットワーク利用時において、設備故障によって影響を受ける度合いであり、故障の影響度に対する故障確率として定義する。
(Procedure 4) <Processing of Network Reliability Estimation Unit 16 (Estimation of Network Reliability)>
In step 4, the network reliability estimation unit 16 estimates the network reliability based on the total number of failures calculated in step 2 and the degree of failure influence calculated in step 3 (step in FIG. 3). S40). The reliability of the network is a degree affected by equipment failure when using the network, and is defined as a failure probability with respect to the influence degree of the failure.

故障の影響度に関する故障確率の分布特性を推定する方法として、ここでは、上側累積分布(影響度が大きく確率の小さい領域を考慮するために、故障の影響度hとした場合、任意のhに対してhを超える確率を累積した確率分布)に関する推定を実施する。   As a method for estimating the distribution characteristic of failure probability related to the failure influence level, here, the upper cumulative distribution (in order to consider a region having a large influence degree and a small probability, if the failure influence degree h is set to an arbitrary h, On the other hand, estimation is performed on a probability distribution in which probabilities exceeding h are accumulated.

(4−0)
ネットワーク信頼度を推定するために、故障の影響度を基準化するためのパラメータbjを導入する。故障の影響度を基準化することによって、妥当な推定結果を得ることができる。基準化パラメータbjとして適切な値を選定する必要があるため、候補値を設定し、その妥当性を評価する必要がある。
基準化パラメータbjの候補値を設定する手順を以下に示す。
(4-0)
In order to estimate the network reliability, a parameter bj for standardizing the influence degree of the failure is introduced. A reasonable estimation result can be obtained by normalizing the degree of influence of the failure. Since it is necessary to select an appropriate value as the standardization parameter bj, it is necessary to set a candidate value and evaluate its validity.
The procedure for setting candidate values for the standardization parameter bj is shown below.

設定方法として、以下の(a)および(b)の2つの方法がある。
(a)基準化パラメータbjの候補値の最大値をhkの平均値とし、基準化パラメータbjの候補値の最小値を1とし、最小値から最大値までの数列を基準化パラメータbjの候補値として設定する。
このとき、hkの平均値が整数とならない場合には、四捨五入し整数値を設定する。
There are the following two methods (a) and (b) as setting methods.
(A) The maximum value of the candidate values of the standardization parameter bj is the average value of hk, the minimum value of the candidate values of the standardization parameter bj is 1, and the sequence from the minimum value to the maximum value is the candidate value of the standardization parameter bj Set as.
At this time, if the average value of hk does not become an integer, the integer value is set by rounding off.

最小値から最大値までの数列の設定方法としては、例えば、以下の(イ)〜(ハ)の3つの方法が考えられる。
(イ)最小値から最大値まで1ずつ数値を変化させる。
(ロ)最小値から最大値まで、最大値と最小値の差分の1/10を変化の幅として変化させる(この場合に基準化パラメータbjは10個となる)。
(ハ)最小値から最大値まで、最大値と最小値の差分の1/50を変化の幅として変化させる(この場合に基準化パラメータbjは50個となる)。
As a method for setting the number sequence from the minimum value to the maximum value, for example, the following three methods (A) to (C) are conceivable.
(B) Change the numerical value by 1 from the minimum value to the maximum value.
(B) From the minimum value to the maximum value, 1/10 of the difference between the maximum value and the minimum value is changed as the range of change (in this case, the standardization parameter bj is 10).
(C) From the minimum value to the maximum value, 1/50 of the difference between the maximum value and the minimum value is changed as the range of change (in this case, the standardization parameter bj is 50).

(b)bjの候補値の最大値をhkの分位値とし、 基準化パラメータbjの候補値の最小値を1とし、最小値から最大値までの数列を基準化パラメータbjの候補値として設定する。このとき、hkの分位値が整数とならない場合には、四捨五入し整数値を設定する。 (B) The maximum value of the candidate values of bj is the quantile value of hk, the minimum value of the candidate values of the standardization parameter bj is 1, and the sequence from the minimum value to the maximum value is set as the candidate value of the standardization parameter bj To do. At this time, if the quantile value of hk is not an integer, the integer value is set by rounding off.

また、分位値の候補としては、第3四分位値(75%値)や90%値を用いる。また、最小値から最大値までの数列の設定方法としては、上記(a)と同様である。   The third quartile value (75% value) or 90% value is used as a candidate for the quartile value. The method for setting the number sequence from the minimum value to the maximum value is the same as (a) above.

(4−1)
基準化パラメータbjの初期値bj=b0を設定する。
(4-1)
The initial value bj = b0 of the standardization parameter bj is set.

(4−2)
次に、故障の影響度を昇順に並べ、昇順に番号kを付与し、hk(k=1・・・N)とする。図7は、このようにして得られた故障の影響度の算出例を示す図である(故障の影響度(分×人)hk=故障時間(分)dk×影響ユーザ数(人)rk)。
(4-2)
Next, the influence levels of failures are arranged in ascending order, number k is assigned in ascending order, and hk (k = 1... N) is set. FIG. 7 is a diagram showing a calculation example of the failure influence degree obtained in this way (failure influence degree (minute × person) hk = failure time (minute) dk × number of affected users (person) rk). .

(4−3)
上記hk、N、bj、kから、故障の影響度に対応する確率点K(1+hk/bj,(N−k+1)/N)をN個(k=1・・・N)算出する。図8は、このようにして得られた確率点K(1+hk/bj,(N−k+1)/N)の具体的な算出例を示す図であり、故障の影響度(分×人)hk、基準化した故障の影響度1+hk/bj、確率(N−k+1)/Nの具体例を示している(N=100、bj=100の場合)。
(4-3)
From the above hk, N, bj, k, N (k = 1... N) probability points K (1 + hk / bj, (N−k + 1) / N) corresponding to the degree of influence of the failure are calculated. FIG. 8 is a diagram showing a specific calculation example of the probability point K (1 + hk / bj, (N−k + 1) / N) obtained in this way, and the influence degree (minute × person) hk of the failure. A specific example of normalized failure influence degree 1 + hk / bj and probability (N−k + 1) / N is shown (when N = 100 and bj = 100).

(4−4)
故障の影響度は、故障時間の長期化や影響ユーザ数の大規模化によって幅広く分布する可能性が高い。また、影響度の小さい故障が多く、影響度の大きい故障の発生は少ないため、故障の影響度に関する確率分布特性は対数分布の性質を持つ。
(4-4)
There is a high possibility that the degree of influence of a failure is widely distributed due to a longer failure time and a larger number of affected users. In addition, since there are many faults with a low degree of influence and few faults with a high degree of influence, the probability distribution characteristic regarding the degree of influence of the fault has a logarithmic distribution.

そこで、故障の影響度と対応する確率について対数変換を実施する。確率点K(1+hk/bj,(N−k+1)/N)を、図9に示すように、両対数グラフ上にプロットし、回帰直線を引く。ここで、対数の設定として、常用対数を用いる。   Therefore, logarithmic conversion is performed on the probability of the failure and the corresponding probability. The probability point K (1 + hk / bj, (N−k + 1) / N) is plotted on a log-log graph as shown in FIG. 9, and a regression line is drawn. Here, the common logarithm is used as the logarithm setting.

(4−5)
回帰直線の傾きの絶対値ajと直線の確率点に対する相関係数Rjを算出する。(回帰直線や相関係数については周知であるので詳細は省略する(図9参照))。
(4-5)
An absolute value aj of the slope of the regression line and a correlation coefficient Rj for the probability point of the line are calculated. (Regression lines and correlation coefficients are well known and will not be described in detail (see FIG. 9)).

(4−6)
上記の手続きについて、jをj=1・・・Jまで変化させ、図10に示すように、基準化パラメータbjに対応する回帰直線の傾きの絶対値ajおよび直線の確率点に対する相関係数Rjを算出する。
(4-6)
In the above procedure, j is changed to j = 1... J, and as shown in FIG. 10, the absolute value aj of the slope of the regression line corresponding to the standardization parameter bj and the correlation coefficient Rj for the probability point of the line. Is calculated.

(4−7)
回帰直線に対する相関係数の2乗値が1に近いほど、回帰直線の傾きの絶対値ajおよび基準化パラメータbjは推定値として妥当な値であることを示している。よって、相関係数の2乗値Rjが最大となるjおよび回帰直線の傾きの絶対値aj、基準化パラメータbjを選定する。図10の例の場合、相関係数Rjが最大となるjは3であり、そのときの基準化パラメータbjは101、回帰直線の傾きの絶対値ajは1.0、相関係数Rjは0.99であることがわかる。
(4-7)
As the square value of the correlation coefficient with respect to the regression line is closer to 1, the absolute value aj of the slope of the regression line and the standardization parameter bj are more appropriate values as estimated values. Therefore, j, which maximizes the square value Rj 2 of the correlation coefficient, the absolute value aj of the slope of the regression line, and the standardization parameter bj are selected. In the case of the example of FIG. 10, j where the correlation coefficient Rj is maximum is 3, the standardization parameter bj at that time is 101, the absolute value aj of the slope of the regression line is 1.0, and the correlation coefficient Rj is 0. .99.

このようにして得られた回帰直線の傾きの絶対値ajおよび基準化パラメータbjによって決定される直線が、故障の影響度に関する上側累積確率の推定結果であり、ネットワーク信頼度の推定結果である。   The straight line determined by the absolute value aj of the slope of the regression line obtained in this way and the standardization parameter bj is the estimation result of the upper cumulative probability related to the influence degree of the failure, and is the estimation result of the network reliability.

しかしながら、影響度の大きい領域においては、推定結果が(プロットした確率点)と乖離する場合があり、両対数グラフの横軸方向に進むにつれて、確率点列と直線とが乖離する可能性がある。   However, in the region where the degree of influence is large, the estimation result may deviate from (plotted probability points), and as the logarithmic graph proceeds in the horizontal axis direction, the probability point sequence may deviate from the straight line. .

乖離度合いが大きい場合には、ネットワーク信頼度の推定結果として妥当ではなく、信頼度の判定において精度を低下させる可能性がある。そこで、ネットワーク信頼度の補正について、以降の手順に示す。(以降の(4−8)から(4−10)の手順は、実施を推奨する手順であるが、実施しない場合にも本発明に係るネットワーク管理システムを提供することは可能である。)   When the degree of divergence is large, the estimation result of the network reliability is not valid, and there is a possibility that the accuracy is lowered in the determination of the reliability. Therefore, correction of network reliability is shown in the following procedure. (The following procedures (4-8) to (4-10) are recommended procedures, but it is possible to provide the network management system according to the present invention even when not implemented.)

(4−8)
相関係数Rjが最大となる回帰直線の傾きの絶対値ajの値をaxとし、該axの値を用いて、k=1・・・Nに対して、|log(1−ax・hk’)-log{(N−k+1)/N}|を算出し、N個の数列とする。ここで、「|a|」はaの絶対値である。また、hk’=1+hk/bjである。
(4-8)
The absolute value aj of the slope of the regression line that maximizes the correlation coefficient Rj is set to ax, and using the value of ax, for k = 1... N, | log (1-ax · hk ′ ) −log {(N−k + 1) / N} | is calculated as N number sequences. Here, “| a |” is an absolute value of a. Further, hk ′ = 1 + hk / bj.

(4−9)
|log(1−ax・hk')-log{(N−k+1)/N)}|
について、kをk=1から順に更新し、以下の関係
|log(1−ax・hk)-log{(N−k+1)/N)}|>c
が最初に成り立つk(最も小さいk)を選定する。
(4-9)
| log (1-ax · hk ′) − log {(N−k + 1) / N)} |
For k, update k sequentially from k = 1 and
| log (1-ax · hk) −log {(N−k + 1) / N)} |> c
Is selected first (k is the smallest k).

ここで、cは事前に設定される固定値である。常用対数値の差分を評価しているため、cの値として、1あるいは0.5を設定すればよい。   Here, c is a fixed value set in advance. Since the difference between the common logarithmic values is evaluated, the value of c may be set to 1 or 0.5.

上記の大小関係を満たすkが存在しない場合には、k=Nとして設定する(ネットワーク信頼度の推定結果を補正しないことを意味する)。   When k satisfying the above magnitude relationship does not exist, k = N is set (meaning that the network reliability estimation result is not corrected).

(4−10)
(4−9)のkに対応する確率点K(1+hk/bj,(N−k+1)/N )をxとし、x(1+hx/bj,px)とする。ここで、hk=hx,(N−k+1)/N=pxである。
このようにして算出したhx、pxの値を、補正済みのネットワーク信頼度の推定結果とする。
(4-10)
Let the probability point K (1 + hk / bj, (N−k + 1) / N) corresponding to k in (4-9) be x and x (1 + hx / bj, px). Here, hk = hx, (N−k + 1) / N = px.
The values of hx and px calculated in this way are used as the corrected network reliability estimation results.

(手順5)<ネットワーク信頼度判定部18の処理(ネットワーク信頼度の判定)>
手順5では、ネットワーク信頼度推定部16から送信された信頼度の推定結果をもとに、ネットワーク信頼度判定部18においてネットワークの信頼度の判定を実施する(図3のステップS50)。
(Procedure 5) <Processing of Network Reliability Determination Unit 18 (Determination of Network Reliability)>
In procedure 5, based on the reliability estimation result transmitted from the network reliability estimation unit 16, the network reliability determination unit 18 performs network reliability determination (step S50 in FIG. 3).

信頼度の判定方法としては、故障の影響度と対応する確率の組に対して判定を実施する方法(判定方法1)と、故障の影響度と確率の積によって算出された期待値に対して判定を実施する方法(判定方法2)の2つの方法がある。   As a method for determining reliability, a method (determination method 1) for performing determination on a pair of probabilities and corresponding probabilities of failure, and an expected value calculated by the product of the probabilities of failure and probabilities There are two methods: a method for performing the determination (determination method 2).

(判定方法1)
故障の影響度と確率の組に対して判定を実施する場合、以下の4つの判定結果(a)〜(d)がある。
(Judgment method 1)
When the determination is performed on the combination of the failure influence degree and the probability, there are the following four determination results (a) to (d).

(a)
(hx)<(影響度の判定基準値)かつ
(px)<(確率の判定基準値)
(b)
(hx)≧(影響度の判定基準値)かつ
(px)≧(確率の判定基準値)
(c)
(hx)≧(影響度の判定基準値)かつ
(px)<(確率の判定基準値)
(d)
(hx)<(影響度の判定基準値)かつ
(px)≧(確率の判定基準値)
(A)
(Hx) <(determination criterion value of influence degree) and (px) <(determination criterion value of probability)
(B)
(Hx) ≧ (determination criterion value of influence degree) and (px) ≧ (determination criterion value of probability)
(C)
(Hx) ≧ (determination criterion value of influence degree) and (px) <(determination criterion value of probability)
(D)
(Hx) <(determination criterion value of influence degree) and (px) ≧ (determination criterion value of probability)

(判定方法2)
故障の影響度と確率の積によって算出された期待値:hx・(1−px)をもとに信頼度判定を実施するとき、以下の2つの判定結果(a)〜(b)がある。
(a)hx・(1−px)<(信頼度判定基準値)
(b)hx・(1−px)≧(信頼度判定基準値)
(Judgment method 2)
When the reliability determination is performed based on the expected value: hx · (1−px) calculated by the product of the influence level and the probability of failure, there are the following two determination results (a) to (b).
(A) hx · (1-px) <(reliability determination reference value)
(B) hx · (1-px) ≧ (reliability determination reference value)

ここで、判定基準値は、ネットワークの運用管理者が、事前に任意の値を入力する。影響度の判定基準値の設定の例としては、例えば故障時間を分単位で測定する場合には、100000程度の値を設定する。また、確率の判定基準値の設定の例としては、0.01程度の値を設定する。同様に、信頼度の判定基準値の例としては、1000程度の値を設定する。   Here, the network operation manager inputs an arbitrary value in advance as the determination reference value. As an example of setting the influence criterion value, for example, when measuring the failure time in minutes, a value of about 100,000 is set. In addition, as an example of setting the probability criterion value, a value of about 0.01 is set. Similarly, a value of about 1000 is set as an example of the reliability criterion value.

また、判定方法1において結果(b)(c)(d)が得られた場合、また判定方法2の結果(b)が得られた場合には、確率点xに該当する故障事例が信頼度低下に最も影響の大きい故障事例として判定する。   Further, when the results (b), (c), and (d) are obtained in the determination method 1 or when the result (b) of the determination method 2 is obtained, the failure case corresponding to the probability point x is determined as the reliability. Judge as the failure case that has the greatest impact on the decline.

同様に、確率点xに対して左側に位置する確率点、すなわち hk<hxとなるkに該当する故障事例において、kが大きい順に影響度が大きい故障事例として判定する。   Similarly, in a failure case corresponding to a probability point located on the left side with respect to the probability point x, that is, k satisfying hk <hx, it is determined as a failure case having a greater influence degree in descending order of k.

同様に、確率点xの右側に位置する確率点、すなわち hk>hxとなるkに対応する故障事例を特異な事例として判定する。   Similarly, a probability point located on the right side of the probability point x, that is, a failure case corresponding to k satisfying hk> hx is determined as a unique case.

(手順6)<表示部4への判定結果の表示>
手順6では、上記(手順5)でネットワーク信頼度判定部18にて出力された判定結果を、表示部4に表示する。
(Procedure 6) <Display of determination result on display unit 4>
In step 6, the determination result output by the network reliability determination unit 18 in the above (procedure 5) is displayed on the display unit 4.

表示部4に表示する評価結果としては、以下の(a)〜(e)に示す項目があり、これら全ての項目、あるいはいくつかの項目を組み合わせたもののいずれであってもよい。   The evaluation results displayed on the display unit 4 include the items shown in the following (a) to (e), and any of these items or a combination of some items may be used.

(a)ネットワーク信頼度の組が基準値内か否かを表示する。
例えば、判定方法(1)の(a)の場合に○、判定方法(1)の(b)の場合に×、それ以外の場合に△と表示する。
(A) Display whether the set of network reliability is within the reference value.
For example, in the case of (a) of the determination method (1), “◯” is displayed, in the case of (b) of the determination method (1), “Δ” is displayed.

(b)ネットワーク信頼度の期待値が基準値内か否かに関する情報を表示部4に表示する。
例えば、判定方法(2)の(a)の場合に○、判定方法(2)の(b)の場合に×と表示する。
(B) Information on whether the expected value of the network reliability is within the reference value is displayed on the display unit 4.
For example, “◯” is displayed in the case of (a) of the determination method (2), and “X” is displayed in the case of (b) of the determination method (2).

(c)確率点x(hx, px)の値と該当する故障事例に関する情報(故障設備名、箇所名、故障発生日時、等の情報)を表示部4に表示する。 (C) Information on the value of the probability point x (hx, px) and the corresponding failure example (information such as the name of the failure facility, the location name, the date and time of failure occurrence) is displayed on the display unit 4.

(d)確率点x (hx, px)の左側に位置するM個(例えば5個)の確率点(hk, pk)の値と該当する故障事例に関する情報(故障設備名、箇所名、故障発生日時、等の情報)を表示部4に表示する。 (D) Information on M (for example, 5) probability points (hk, pk) located on the left side of the probability point x (hx, px) and information on the corresponding failure case (failure equipment name, location name, failure occurrence) Information such as date and time) is displayed on the display unit 4.

(e)確率点x(hx, px)の右側に位置する確率点(hk, pk)の値と該当する故障事例に関する情報(故障設備名、箇所名、故障発生日時、等の情報)を表示部4に表示する。 (E) Displays the value of the probability point (hk, pk) located on the right side of the probability point x (hx, px) and information about the corresponding failure case (information such as the name of the failure equipment, location name, failure occurrence date and time) Part 4 is displayed.

なお、図2に示したネットワーク管理システム10の各部(各手段)で行われる処理(図1における各手順、図3に示す各ステップの処理)や機能は、ネットワーク管理システム10を構成するコンピュータに内蔵されるCPUやメモリなどのハードウェア資源を用いて、各部(各手段)で実施される処理に対応するプログラムを実行することによって実現される。また、該プログラムは、FD,CD−ROM、DVDなどの記録媒体や、インターネットなどのネットワークを介して市場に流通させることができる。   Note that the processes (each procedure in FIG. 1, each step in FIG. 3) and functions performed by each unit (each unit) of the network management system 10 shown in FIG. This is realized by executing a program corresponding to processing executed by each unit (each unit) using hardware resources such as a built-in CPU and memory. Further, the program can be distributed to the market via a recording medium such as FD, CD-ROM, DVD, or a network such as the Internet.

1:ネットワーク故障情報
3:入力部(入力手段)
4:判定結果を表示する表示部(表示手段)
10:ネットワーク管理システム
11:受信部(受信手段)
12:ネットワーク故障情報DB(データベース)
13:総故障件数算出部(総故障件数算出手段)
14:実行判定部(実行判定手段)
15:影響度算出部(影響度算出手段)
16:ネットワーク信頼度推定部(ネットワーク信頼度推定手段)
17:ネットワーク信頼度推定値を記憶する記憶部
18:ネットワーク信頼度判定部(ネットワーク信頼度判定手段)
19:判定対象情報を記憶する記憶部
100:制御網
200:コアネットワーク
300:アクセスネットワーク
301:装置A
302〜303:装置B
304〜307:装置C
1: Network failure information 3: Input unit (input means)
4: Display unit for displaying the determination result (display means)
10: Network management system 11: Receiving unit (receiving means)
12: Network failure information DB (database)
13: Total failure number calculation unit (total failure number calculation means)
14: Execution determination unit (execution determination means)
15: Influence calculation unit (impact calculation means)
16: Network reliability estimation unit (network reliability estimation means)
17: Storage unit for storing estimated network reliability value 18: Network reliability determination unit (network reliability determination means)
19: Storage unit for storing determination target information 100: Control network 200: Core network 300: Access network 301: Apparatus A
302 to 303: Device B
304 to 307: Device C

Claims (10)

構成要素として複数の設備を有するネットワークを管理するネットワーク管理システムであって、
前記設備毎の故障時間と影響ユーザ数を含むネットワーク故障情報を入力する第1の入力手段と、
信頼度判定の実行の対象となる設備に関する判定対象情報を入力する第2の入力手段と、
前記第1の入力手段により入力された前記ネットワーク故障情報を記憶する第1の記憶手段と、
前記第2の入力手段により入力された前記判定対象情報を記憶する第2の記憶手段と、
前記第1の記憶手段に記憶されたネットワーク故障情報のうち前記判定対象情報により信頼度判定の実行の対象とされる設備に対する故障情報を判定対象として設定する手段と、
前記ネットワーク故障情報の故障時間と影響ユーザ数、あるいは、前記ネットワーク故障情報の正規化された故障時間と正規化された影響ユーザ数から判定対象とされる設備毎の故障の影響度を算出する第1の算出手段と、
前記第1の算出手段により算出された故障の影響度に対する故障確率を算出し、該故障確率によりネットワーク信頼度を推定する推定手段と、
前記推定手段により推定されたネットワーク信頼度を事前に入力されている判定基準値により判定する判定手段と、
前記判定手段により判定された判定結果を表示する表示手段と、
を具備することを特徴とするネットワーク管理システム。
A network management system for managing a network having a plurality of facilities as a component,
First input means for inputting network failure information including the failure time and the number of affected users for each facility;
A second input means for inputting determination target information relating to equipment to be subjected to reliability determination;
First storage means for storing the network failure information input by the first input means;
Second storage means for storing the determination target information input by the second input means;
Means for setting, as a determination target, failure information for a facility that is subjected to reliability determination by the determination target information among the network failure information stored in the first storage unit;
The failure time and the number of affected users in the network failure information or the normalized failure time and the normalized number of affected users in the network failure information are used to calculate the failure impact level for each facility to be determined. 1 calculating means;
Estimating means for calculating a failure probability with respect to the degree of influence of the failure calculated by the first calculating means, and estimating network reliability based on the failure probability;
A determination unit that determines the network reliability estimated by the estimation unit based on a determination criterion value that is input in advance;
Display means for displaying the determination result determined by the determination means;
A network management system comprising:
請求項1記載のネットワーク管理システムであって、
前記ネットワーク故障情報から判定対象とされた総故障件数を算出する第2の算出手段と、
該第2の算出手段により算出された総故障件数と予め与えられた信頼度判定実行の要否の基準となる実行判定基準値とを比較する比較手段と
を具備し、
前記比較手段による比較の結果、前記総故障件数が前記実行判定基準値以上の場合に、前記推定手段の処理を実行し、前記総故障件数が前記実行判定基準値未満の場合に、前記推定手段の処理を実行しないようにした
ことを特徴とするネットワーク管理システム。
The network management system according to claim 1,
A second calculating means for calculating the total number of failures determined from the network failure information;
Comparing means for comparing the total number of failures calculated by the second calculating means with an execution determination reference value serving as a reference for necessity of reliability determination execution given in advance,
As a result of the comparison by the comparison means, when the total number of failures is equal to or greater than the execution determination reference value, the processing of the estimation means is executed, and when the total number of failures is less than the execution determination reference value, the estimation means A network management system characterized in that the above processing is not executed.
請求項1または2記載のネットワーク管理システムであって、
前記推定手段は、前記故障の影響度に対する故障確率として上側累積確率を用いる
ことを特徴とするネットワーク管理システム。
The network management system according to claim 1 or 2,
The network management system according to claim 1, wherein the estimation means uses an upper cumulative probability as a failure probability with respect to the degree of influence of the failure.
請求項3記載のネットワーク管理システムであって、
前記推定手段は、前記故障の影響度に対する上側累積確率を、前記故障の影響度と上側累積確率の対数値をもとに算出する、あるいは、基準化した故障の影響度と上側累積確率の対数値をもとに算出する
ことを特徴とするネットワーク管理システム。
The network management system according to claim 3,
The estimation means calculates the upper cumulative probability for the failure influence level based on a logarithmic value of the failure influence degree and the upper cumulative probability, or a standardized failure influence level and upper cumulative probability pair. A network management system characterized by calculation based on numerical values.
請求項4記載のネットワーク管理システムであって、
前記推定手段は、基準化した故障の影響度と上側累積確率の対数値に対して、線形回帰を実施した結果を用いる
ことを特徴とするネットワーク管理システム。
The network management system according to claim 4, wherein
The network management system according to claim 1, wherein the estimation means uses a result obtained by performing linear regression on a logarithmic value of the normalized failure influence level and upper cumulative probability.
請求項5記載のネットワーク管理システムであって、
前記推定手段は、基準化パラメータの候補値において、線形回帰の相関係数が最も大きくなる基準化パラメータによって基準化した故障の影響度と上側累積確率の対数値を用いる
ことを特徴とするネットワーク管理システム。
The network management system according to claim 5,
The estimation unit uses a logarithmic value of an influence degree of failure and an upper cumulative probability normalized by a standardization parameter having a largest correlation coefficient of linear regression among candidate values of the standardization parameter. system.
請求項5記載のネットワーク管理システムであって、
前記推定手段は、線形回帰の回帰直線と故障の影響度に対する確率点との差分を用いる
ことを特徴とするネットワーク管理システム。
The network management system according to claim 5,
The estimation unit uses a difference between a regression line of linear regression and a probability point with respect to the degree of influence of a failure.
請求項7記載のネットワーク管理システムであって、
前記推定手段は、線形回帰直線と故障の影響度に対する確率点との差分が一定値以上となる点を判定の基準となる点に設定すること
を特徴とするネットワーク管理システム。
The network management system according to claim 7,
The network management system characterized in that the estimation means sets a point at which a difference between a linear regression line and a probability point with respect to a failure influence degree is a certain value or more as a reference point.
コンピュータを、請求項1から8のいずれかに記載のネットワーク管理システムにおける各手段として機能させるためのプログラム。   The program for functioning a computer as each means in the network management system in any one of Claim 1 to 8. 構成要素として複数の設備を有するネットワークを管理するネットワーク管理方法であって、
前記設備毎の故障時間と影響ユーザ数を含むネットワーク故障情報を入力する第1の入力手順と、
信頼度判定の実行の対象となる設備に関する判定対象情報を入力する第2の入力手順と、
前記第1の入力手順により入力されたネットワーク故障情報を記憶する第1の記憶手順と、
前記第2の入力手段により入力された前記判定対象情報を記憶する第2の記憶手順と、
前記第1の記憶手順に記憶されたネットワーク故障情報のうち前記判定対象情報により信頼度判定の実行の対象とされる設備に対する故障情報を判定対象として設定する手順と、
前記ネットワーク故障情報の故障時間と影響ユーザ数、あるいは、前記ネットワーク故障情報の正規化された故障時間と正規化された影響ユーザ数から判定対象とされる設備毎の故障の影響度を算出する第1の算出手順と、
前記第1の算出手順により算出された故障の影響度に対する故障確率を算出し、該故障確率によりネットワーク信頼度を推定する推定手順と、
前記推定手順により推定されたネットワーク信頼度を事前に入力されている判定基準値により判定する判定手順と、
前記判定手順により判定された判定結果を表示する表示手順と、
を具備することを特徴とするネットワーク管理方法。
A network management method for managing a network having a plurality of facilities as a component,
A first input procedure for inputting network failure information including a failure time for each facility and the number of affected users;
A second input procedure for inputting determination target information related to equipment to be subjected to reliability determination;
A first storage procedure for storing the network failure information input by the first input procedure;
A second storage procedure for storing the determination target information input by the second input means;
A procedure for setting, as a determination target, failure information for a facility to be subjected to reliability determination by the determination target information among the network failure information stored in the first storage procedure;
The failure time and the number of affected users in the network failure information or the normalized failure time and the normalized number of affected users in the network failure information are used to calculate the failure impact level for each facility to be determined. 1 calculation procedure;
An estimation procedure for calculating a failure probability with respect to an influence degree of the failure calculated by the first calculation procedure, and estimating a network reliability based on the failure probability;
A determination procedure for determining the network reliability estimated by the estimation procedure based on a determination criterion value input in advance,
A display procedure for displaying the determination result determined by the determination procedure;
A network management method comprising:
JP2009118554A 2009-05-15 2009-05-15 Network management system, network management method, and program therefor Expired - Fee Related JP5133941B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009118554A JP5133941B2 (en) 2009-05-15 2009-05-15 Network management system, network management method, and program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009118554A JP5133941B2 (en) 2009-05-15 2009-05-15 Network management system, network management method, and program therefor

Publications (2)

Publication Number Publication Date
JP2010268275A true JP2010268275A (en) 2010-11-25
JP5133941B2 JP5133941B2 (en) 2013-01-30

Family

ID=43364883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009118554A Expired - Fee Related JP5133941B2 (en) 2009-05-15 2009-05-15 Network management system, network management method, and program therefor

Country Status (1)

Country Link
JP (1) JP5133941B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101288535B1 (en) * 2010-12-21 2013-07-22 주식회사 케이티 Method for monitoring communication system and apparatus therefor
JP2015156578A (en) * 2014-02-20 2015-08-27 日本電信電話株式会社 Network evaluation apparatus, method, and program
WO2018179939A1 (en) * 2017-03-30 2018-10-04 株式会社テイエルブイ Risk assessment device, risk assessment method, and risk assessment program
CN112233420A (en) * 2020-10-14 2021-01-15 腾讯科技(深圳)有限公司 Fault diagnosis method and device for intelligent traffic control system
CN114337792A (en) * 2022-01-17 2022-04-12 中国人民解放军61096部队 Satellite communication signal fault diagnosis method and device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005341050A (en) * 2004-05-25 2005-12-08 Ntt Communications Kk Network reliability evaluating method, apparatus, and program
JP2008211725A (en) * 2007-02-28 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> Network evaluation system, network evaluation method, and its program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005341050A (en) * 2004-05-25 2005-12-08 Ntt Communications Kk Network reliability evaluating method, apparatus, and program
JP2008211725A (en) * 2007-02-28 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> Network evaluation system, network evaluation method, and its program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200501253001; 船越 裕介 他: '故障規模を考慮したネットワーク不稼働率実態値の簡易推定法 その計算時間と推定精度の検討' 電子情報通信学会技術研究報告 第104巻,第187号, 20040708, p.1〜5 *
JPN6012056987; 船越 裕介 他: '故障規模を考慮したネットワーク不稼働率実態値の簡易推定法 その計算時間と推定精度の検討' 電子情報通信学会技術研究報告 第104巻,第187号, 20040708, p.1〜5 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101288535B1 (en) * 2010-12-21 2013-07-22 주식회사 케이티 Method for monitoring communication system and apparatus therefor
JP2015156578A (en) * 2014-02-20 2015-08-27 日本電信電話株式会社 Network evaluation apparatus, method, and program
WO2018179939A1 (en) * 2017-03-30 2018-10-04 株式会社テイエルブイ Risk assessment device, risk assessment method, and risk assessment program
US10816954B2 (en) 2017-03-30 2020-10-27 Tlv Co., Ltd. Risk assessment device, risk assessment method, and risk assessment program
CN112233420A (en) * 2020-10-14 2021-01-15 腾讯科技(深圳)有限公司 Fault diagnosis method and device for intelligent traffic control system
CN112233420B (en) * 2020-10-14 2023-12-15 腾讯科技(深圳)有限公司 Fault diagnosis method and device for intelligent traffic control system
CN114337792A (en) * 2022-01-17 2022-04-12 中国人民解放军61096部队 Satellite communication signal fault diagnosis method and device

Also Published As

Publication number Publication date
JP5133941B2 (en) 2013-01-30

Similar Documents

Publication Publication Date Title
US10069684B2 (en) Core network analytics system
US7243049B1 (en) Method for modeling system performance
US8352867B2 (en) Predictive monitoring dashboard
JP5133941B2 (en) Network management system, network management method, and program therefor
CN107992410B (en) Software quality monitoring method and device, computer equipment and storage medium
US20070010983A1 (en) Method and apparatus for predicting scheduled system downtime
US8015276B2 (en) Method to identify performance and capacity bottlenecks of complex systems
US8478629B2 (en) System and method for collaborative management of enterprise risk
AU2019201687A1 (en) Network device vulnerability prediction
US7197428B1 (en) Method for performance monitoring and modeling
US7369967B1 (en) System and method for monitoring and modeling system performance
CN113657715A (en) Root cause positioning method and system based on kernel density estimation calling chain
US7617313B1 (en) Metric transport and database load
Anand et al. Modeling software fault removal and vulnerability detection and related patch release policy
JP6085576B2 (en) Network evaluation apparatus, method, and program
CN112380759B (en) Smart electric meter service life prediction method based on deep learning and CoxPH model
CN112162528B (en) Fault diagnosis method, device, equipment and storage medium of numerical control machine tool
US9123020B2 (en) Modeling, monitoring, and managing system dimensions for a service assurance system
JP6778032B2 (en) Business process evaluation method and equipment
Okumoto Software defect prediction based on stability test data
Okumoto Experience report: Practical software availability prediction in telecommunication industry
CN114444933A (en) Danger source analysis method, equipment and medium based on constructional engineering
Anders et al. Risk assessment tool for maintenance selection
JP6326383B2 (en) Network evaluation system, network evaluation method, and network evaluation program
Kimber et al. Modeling planned downtime

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110608

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110608

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110616

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110704

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110719

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111031

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120605

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120629

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5133941

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees