JP2009201043A - ネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラム - Google Patents

ネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラム Download PDF

Info

Publication number
JP2009201043A
JP2009201043A JP2008043166A JP2008043166A JP2009201043A JP 2009201043 A JP2009201043 A JP 2009201043A JP 2008043166 A JP2008043166 A JP 2008043166A JP 2008043166 A JP2008043166 A JP 2008043166A JP 2009201043 A JP2009201043 A JP 2009201043A
Authority
JP
Japan
Prior art keywords
failure
time
network
cumulative
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008043166A
Other languages
English (en)
Inventor
Tatsuya Matsukawa
達哉 松川
Yusuke Funakoshi
裕介 船越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008043166A priority Critical patent/JP2009201043A/ja
Publication of JP2009201043A publication Critical patent/JP2009201043A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】ネットワーク設備の故障情報と該ネットワーク設備の配備数に関する設備情報から、ネットワークの信頼性を総合的に評価できるネットワーク管理システム、ネットワーク管理方法、そのためのプログラムを提供すること。
【解決手段】ネットワーク設備毎の配備数を含むネットワーク設備情報(1)とネットワーク設備毎の故障発生時刻および復旧時刻を含むネットワーク故障情報(2)をネットワーク故障情報DB(13)に記憶し、その記憶を参照して累積故障時間算出手段(15)で累積故障時間を、累積故障量算出手段(14)で累積故障量を算出し、算出した累積故障時間と累積故障量に基づいて故障時間の変化の割合を示す故障時間変化率を故障時間変化率算出手段(17)で算出し、信頼性評価手段(19)で故障時間変化率と別途入力された評価基準値を比較することにより信頼性を評価し、評価結果を表示装置4に表示する。
【選択図】図1

Description

本発明は、IP(インターネットプロトコル)に代表されるネットワークプロトコルによって実現されるネットワーク管理技術に係り、特に、ネットワーク設備(ネットワークを構成するIPパケット等のパケットを伝送するための伝送装置、転送する装置、装置間を接続するリンクを構成するための伝送路や装置インターフェイス部など)や設備の構成部品についての配備数(設備数)に関する設備情報と、該ネットワーク設備および該ネットワーク設備を構成する構成部品の故障に関する故障情報をもとに、前記ネットワーク設備の物理的信頼度と設備の故障およびネットワークに停止に伴う故障時間(故障の継続時間)の特性を推定し、ネットワークの信頼性を評価することによって、信頼性の高い、あるいは所望する信頼性を有するネットワークの運用管理を自動的かつ迅速に可能にするネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラムに関するものである。
従来、通信ネットワークシステムの信頼性は、そのネットワーク設備が有する故障確率と通信網に求められている故障確率(例えば不稼動率)をもとに、ネットワークの構成要素(例えば、上述したネットワーク装置やリンクなどの構成成要素)に配分した確率の比較により評価されてきた。従来のネットワーク信頼性の導出方法については、「NTT通信網を理解していただくために」(1994.NTT通信網研究会発行)第314頁〜第329頁の“第8章 安定品質“(非特許文献1)に記述されている。これの信頼性評価技術は、ネットワークの計画・設計・構築を実施する上で的確な判断を支援するための技術である。
そして、従来の信頼性を考慮したネットワークの設計方法は、ネットワークの設計者が、ネットワークを構成する個々のネットワーク装置やリンク等に関する不稼働率を算出し、ネットワーク設計の対象となるネットワーク区間(あるネットワーク構成要素からあるネットワーク構成要素までの区間)について不稼働率を足し合わせ、その合計値が所定の目標値を満たすようなネットワーク装置やネットワーク装置の構成を選定する、あるいは、装置に収容する加入者数に制限を設けるといったことが実施されている。ネットワーク信頼性の設計方法については、「信頼性ハンドブック」(1997.日本信頼性学会発行)第79頁〜第84頁の“1.5.3信頼性を考慮したネットワークの改善計画−故障時の迷惑度に着目した通信網の信頼性規定・設計法−”(非特許文献2)に記述されている。
「NTT通信網を理解していただくために」(NTT通信網研究会、1994)"第8章 安定品質"、pp.314-329 「信頼性ハンドブック」(日本信頼性学会、1997) "1.5.3 信頼性を考慮したネットワークの改善計画−故障時の迷惑度に着目した通信網の信頼性規定・設計法−"、pp.79-84
IPネットワークに代表される通信ネットワークにおいては、複数機種のネットワーク装置、該ネットワーク装置間を接続する伝送装置、伝送路、および各装置の構成要素等のネットワーク設備(以下、これらを総称して単に“ネットワーク設備”という)が混在する状況にあり、故障の発生要因、故障の発生箇所が多種・多様化している。設備の経年的な劣化に伴うハードウェア的な故障の発生要因に加えて、ネットワーク機能のソフトウェア化による機能のソフトウェア不具合に伴う動作不良等の故障要因、設備の故障要因が複合的に組み合わさることに伴う機能の停止事象が増加している。
そのため、電話網等の従来のネットワークに比べ、ネットワークを構成する設備の停止頻度や停止の発生率、および発生率の時間的な変動(時間率)が大きく、ネットワークの運用前にそれらの数値を推定することは容易ではない。
従来のネットワーク評価システムにおいては、運用中のネットワーク設備の故障情報を用いてネットワークにおける故障特性を十分に推定する機能を有していないため、運用中のネットワークの信頼性を迅速に推定することができず、そのため、ネットワークの信頼性を精度よく評価することができなかった。
また、ネットワーク装置およびネットワーク装置の構成要素が多種にわたるに伴い、装置の各種故障事象や停止事象が増加することによって、故障要因の迅速な切り分けや故障個所の特定が困難化する状況にあり、故障発生時に最も効率的な対策を講じることは困難になりつつあるため、装置や構成要素の停止時間や装置停止に起因するネットワークの停止時間、ネットワーク上にて提供されるサービスの中断が長時間化する可能性がある。
しかしながら、従来のネットワーク評価システムにおいては、運用中のネットワークにおける装置の故障事象やネットワークの停止事象について、故障が継続する時間の特性を推定し評価する機能を有しておらず、装置の停止時間やネットワークの停止時間の特性を精度よく推定し評価することができないため、運用中のネットワークの信頼性を的確に評価することができない。
さらに、IPネットワーク等のネットワークにおいては、サービスの提供開始以降においても、ネットワークの拡大や設備の増強等が進められるため、装置の配備数や装置内部の構成要素数(例えば、インターフェイス数等)が変化し、それらの変化に伴って装置や構成要素の故障事象、ネットワークの停止事象が増加する可能性がある。
しかしながら、運用中のネットワークにおける故障の増加特性を推定し評価するためには、故障発生時において、該当する故障と同様あるいは同種の故障が発生しうる装置の数や構成要素数の情報から故障の増加特性を推定し、ネットワークの信頼性を評価する必要があるが、従来の技術においては、故障の増加特性を推定しネットワークの信頼性を評価する機能を有していないため、故障の増加特性、および故障の増加に伴う故障時間の増加特性を評価することができなかった。
また、従来の技術においては、運用中のネットワークにおけるネットワーク装置、装置の構成要素の増加に伴う故障の増加と故障の増加に伴う故障時間、ネットワークの停止時間の増加特性とを推定し、ネットワークの信頼性を総合的に評価する機能を有していないため、ネットワークおよびネットワーク上で提供されるサービスの運用管理の観点で、信頼性評価を実施することが困難であった。
よって、ネットワークおよびネットワーク上で提供されるサービスの運用管理の観点において信頼性評価を実施することができないことによって、ネットワークおよびサービスの運用管理における対処効果や効率化の観点において、優先的に実施すべき設備、あるいは特定のネットワーク設備・機能、単体のネットワーク設備が明らかにならない可能性があった。
また、これらの設備が明らかにならないことによって、ネットワークの信頼性の維持・向上に効果の高い施策の選定や決定を適切に実施できない可能性があった。
よって、高い信頼性を有するあるいはネットワーク運用管理者が所望する信頼性を有するネットワークを構成するための設備の選定や決定、あるいは、高い信頼性を有するあるいはネットワーク運用管理者が所望する信頼性を有するネットワークを構成する上で、取替えや修理を要する設備の選定や決定、あるいは、高い信頼性を有するあるいはネットワーク運用管理者が所望する信頼性を有するネットワークを構成するための設備の予備品の選定や決定、予備品の配備数の選定や決定、あるいは、高い信頼性を有するあるいはネットワーク運用管理者が所望する信頼性を有するネットワークを構成する上で、設備の故障およびネットワークの停止発生において、設備およびネットワークの回復措置の選定や決定、回復措置手順の決定、が実施できない可能性があった。
また、設備故障の発生において、故障発生の要因や条件、故障箇所の解析の実施要否の決定や優先的に実施すべき故障事象の選定を実施することが困難であるために、高い信頼性を有するあるいはネットワーク運用管理者が所望する信頼性を有するネットワークを構成する上で効果の高い対策が実施されず、ネットワークの信頼性が迅速かつ確実には向上しない可能性があった。
また、ネットワークを構成する装置、伝送路、構成要素の設備情報とこれらの故障情報を統合的に収集した上で、これらの情報をもとにして自動的にネットワークの故障時間の特性とネットワークの信頼度の特性を評価することによって、ネットワークの運用管理にフィードバックできるシステムは従来存在しなかった。
本発明の目的は、上記事情に鑑み、ネットワーク設備(ネットワークの装置および伝送路,それらを構成する要素など)の故障や機能停止に関する故障情報と、該ネットワーク設備の配備数に関するネットワーク設備情報とを収集し、該ネットワーク設備からなるネットワークの信頼性について運用中のネットワークの累積故障時間と運用中のネットワークの累積故障量からネットワークの故障時間変化率を算出し、ネットワークの故障時間変化率を判定することによってネットワークの信頼性を総合的に評価できるネットワーク管理システム、ネットワーク管理方法、そのためのプログラムを提供することである。
上記目的を達成するために、本発明は、次のような構成を採用する。
a)本発明に係るネットワーク管理システム(10)は、構成要素である複数のネットワーク設備からなるネットワークの信頼性を評価するネットワーク管理システムであって、ネットワーク設備毎の配備数を含むネットワーク設備情報(1)を入力する手段と、ネットワーク設備毎の故障発生時刻および復旧時刻を含むネットワーク故障情報(2)を入力する手段と、該入力されたネットワーク設備情報(1)およびネットワーク故障情報(2)を記憶するネットワーク故障情報DB(13)と、ネットワークの信頼性評価における評価対象情報と信頼性を評価するために必要な各種評価基準値を入力する手段(3)と、ネットワーク故障情報DB(13)の内容を参照して累積故障時間を算出する累積故障時間算出手段(15)と、ネットワーク故障情報DB(13)の内容を参照して累積故障量を算出する累積故障量算出手段(14)と、累積故障時間と累積故障量に基づいて故障時間の変化の割合を示す故障時間変化率を算出する故障時間変化率算出手段(17)と、該故障時間変化率算出手段(17)で算出した故障時間変化率と前記評価基準値を比較することにより信頼性を評価する信頼性評価手段(19)と、を具備することを特徴としている。
b)さらに、累積故障時間算出手段(15)で算出した累積故障時間と前記評価基準値を比較して評価を実行するか否かを判定する実行判定手段(16)を有し、実行判定手段(16)で評価を実行すると判定された場合に、累積故障量算出手段(14)により累積故障量を算出し、故障時間変化率算出手段(17)により故障時間変化率を算出することを特徴としている。
c)また、前記累積故障時間は、評価実行時点までの故障についての故障時間の累積値、または、評価実行時点までの故障についての故障発生時の影響ユーザ数と故障時間の積の累積値のいずれかであることを特徴としている。
d)また、前記累積故障量は、評価実行時点までの故障発生件数の総和、故障設備数の総和、または、対象となる故障事例について、故障発生時の影響規模と故障発生時の加入者数の比率(故障発生時の加入者数/故障発生時の影響規模数)の総和のいずれかであることを特徴としている。
また、前記故障時間変化率は、前記累積故障時間と前記累積故障量の比、または、累積故障時間と累積故障量からなる数列に対して、累積故障量の変数をxとし、累積故障時間の変数をyとし、該累積故障量と累積故障時間の関係を示す回帰直線:y=ax+bを当てはめ、最小二乗法を用いて求めた回帰直線の傾き係数aのいずれかであることを特徴としている。
e)また、前記信頼性評価は、前記故障時間変化率の算出結果と前記評価基準値を比較することによって行われるか、あるいは、評価実行時点の故障時間変化率の算出結果と前回の評価実行時の故障時間変化率の算出結果を前記評価基準値と比較することによって行われること、前記信頼性評価の結果を表示装置に表示させることを特徴としている。
f)本発明に係るプログラムは、コンピュータを、上記ネットワーク管理システムにおける各手段として機能させるためのプログラムである。
g)本発明に係るネットワーク管理方法は、構成要素である複数のネットワーク設備からなるネットワークの信頼性を評価するネットワーク管理方法であって、前記ネットワーク設備毎の配備数を含むネットワーク設備情報を入力するステップと、前記ネットワーク設備毎の故障発生時刻および復旧時刻を含むネットワーク故障情報を入力するステップと、該入力されたネットワーク設備情報およびネットワーク故障情報をネットワーク故障情報DBに記憶するステップと、前記ネットワークの信頼性評価における評価対象情報と信頼性を評価するために必要な各種評価基準値を入力するステップと、前記ネットワーク故障情報DBの内容を参照して累積故障時間を算出する累積故障時間算出ステップと、該累積故障時間算出ステップで算出した累積故障時間と前記評価基準値を比較して評価を実行するか否かを判定する実行判定ステップと、前記ネットワーク故障情報DBの内容を参照して累積故障量を算出する累積故障量算出ステップと、前記実行判定ステップで評価を実行すると判定された場合に、故障時間の変化の割合を示す故障時間変化率を算出する故障時間変化率算出ステップと、該故障時間変化率算出ステップで算出した故障時間変化率と前記評価基準値を比較することにより信頼性を評価する信頼性評価ステップとを有することを特徴としている。
h)また、前記累積故障時間は、評価実行時点までの故障についての故障時間の累積値、または、評価実行時点までの故障についての故障発生時の影響ユーザ数と故障時間の積の累積値のいずれかであることを特徴としている。
i)また、前記累積故障量は、評価実行時点までの故障発生件数の総和、故障設備数の総和、または、対象となる故障事例について、故障発生時の影響規模と故障発生時の加入者数の比率(故障発生時の加入者数/故障発生時の影響規模数)の総和のいずれかであることを特徴としている。
j)前記故障時間変化率は、前記累積故障時間と前記累積故障量の比、または、累積故障時間と累積故障量からなる数列に対して、累積故障量の変数をxとし、累積故障時間の変数をyとし、該累積故障量と累積故障時間の関係を示す回帰直線:y=ax+bを当てはめ、最小二乗法を用いて求めた回帰直線の傾き係数aのいずれかであることを特徴としている。
k)前記信頼性評価は、前記故障時間変化率の算出結果と前記評価基準値を比較することによって行われるか、あるいは、評価実行時点の故障時間変化率の算出結果と前回の評価実行時の故障時間変化率の算出結果を前記評価基準値と比較することによって行われること、前記信頼性評価の結果を表示装置に表示させるステップを有することを特徴としている。
(効果)
本発明によれば、複数のネットワーク設備(ネットワーク装置、伝送路、およびそれらの構成要素)に発生する故障、および停止事象に起因するネットワークの信頼性の低下度合いを評価し、運用中のネットワークの故障情報とネットワーク設備情報をもとにネットワークが所定の信頼性条件を満たすか否かを判定することによって、信頼性の高いあるいはネットワークの運用管理者が所望する信頼性を有するネットワークの管理を実施するために、ネットワークを構成する装置や伝送路、構成要素の故障情報と設備情報を収集し、ネットワークの累積故障時間を評価することを特徴とし、また、ネットワーク運用管理者が所望する時点を起点とし、評価実行時間間隔が経過した時点にて、評価を実行に移す機能と、ネットワークの信頼性評価対象を設定する機能と、ネットワークの故障情報から評価対象の累積故障時間を算出する機能と、算出した累積故障時間から評価の実行有無を判定する機能と、ネットワークの故障情報から評価対象の累積故障量を算出する機能と、累積故障時間と累積故障量から、故障時間変化率を算出する機能と、故障時間変化率の算出結果からネットワークの信頼性を判定する機能を有しているため、上記ネットワークの信頼性の評価において、ネットワークの信頼度の変化に対する故障時間の変化の評価に基づく、ネットワークの信頼性の総合的な評価を実施することができることから、ネットワーク管理を実施するに際して、定量的な信頼性評価に基づいたネットワーク管理を行うことができる。
このとき、信頼性が低下傾向にあるネットワーク設備を迅速に特定することが可能であるため、故障の増加によるネットワークの信頼性低下の回避を確実に実施することができる。
また、本発明により、ネットワークにおける信頼性低下を回避する仕組みをネットワーク運用管理者に提供できる。
さらに、本発明により、ネットワークの故障特性と故障時間特性を定量的に評価することができるため、ネットワークの運用管理に際して、故障発生時に迅速な復旧を実現することによって、ユーザへの影響の少ない故障対策を事前に決定するための指標を与えたり、故障発生時のユーザへの影響を軽減するための予防措置を検討する際の指標を与えたりすることができる。
という利点・効果がある。
(作用)
本発明は、複数種のネットワーク設備(ネットワーク装置、伝送路、それらの構成要素など)から構成されるネットワークにおいて、該ネットワーク設備の故障や停止事象を対象として、該ネットワーク設備の故障や停止の発生件数と、故障や停止が継続する時間、および該当するネットワーク設備の配備数から、ネットワークの信頼性を評価する機能を有しているため、複数種のネットワーク設備によって構成されるネットワークの信頼性を定量的に評価し、最も高信頼なあるいはネットワーク運用管理者が所望する信頼性を有するネットワークを構成するためのネットワーク設備(ネットワーク装置、伝送路、構成要素など)の選定や決定、取替えや修理を要する設備の選定や決定、設備の予備品の選定や決定、予備品の配備数の選定や決定、設備の故障およびネットワークの停止発生において、設備およびネットワークの回復措置の選定や決定、回復措置手順の決定が可能となる。
また、設備故障の発生において、故障発生の要因や条件、故障箇所や要因の解析の実施要否の決定や優先的に実施すべき故障事象の選定を実施することができるため、高い信頼性を有する、あるいはネットワーク運用管理者が所望する信頼性を有するネットワークを構成する上で効果の高い対策を実施することが可能となる。
また、ネットワークを構成するネットワーク設備(ネットワーク装置、伝送路、構成要素など)の設備情報と、これらの故障情報を統合的に収集した上で、これらの情報をもとにして自動的にネットワークの故障時間の特性とネットワークの信頼度の特性を評価することによって、ネットワークの運用管理にフィードバックするシステムを提供することができる。
次に、図面を用いて本発明の実施例を説明する。
図1は本発明の原理を説明するためのフロー図、図2は本発明の実施例における故障時間変化率の算出の概念を示す図(算出方法1の場合)、図3は本発明の実施例における故障時間変化率の算出の概念を示す図(算出方法2の場合)である。
また、図4は本発明に係る信頼性管理システムの一形態を示す図、図5は本発明の実施例におけるネットワーク設備情報の一例を示す図、図6は本発明の実施例における故障情報の一例を示す図、図7は本発明の実施例におけるネットワーク故障情報DBの一例を示す図である。
また、図8は本発明の実施例における累積故障時間算出値の一例(評価実行時点までの故障時間の累積値を累積故障時間とする場合)を示す図、図9は本発明の実施例における累積故障数算出値の一例(評価実行時点までの故障設備の配備数の累積値を累積故障量とする場合)を示す図である。
また、図10は本発明の実施例において信頼性の評価を実施するフローチャートおよび計算ステップを示す図(信頼性評価の実施タイミングがシステム内に事前に設定されており、一定間隔で繰り返し評価を実施する場合。評価実施期間が設定されており、実施期間外になれば手順が終了する)である。
図1および図4において、(手順0)〜(手順7)は、本発明を実施する場合の処理手順を示している。図4において、10は本発明に係るネットワーク管理システム、1はネットワーク設備情報、2はネットワーク故障情報、3は入出力手段、4は表示装置である。
本発明に係るネットワーク評価システム10は、図4に詳細を示すように、ネットワーク設備情報1を受信する受信部11、ネットワーク故障情報2を受信する受信部12、受信されたネットワーク設備情報1とネットワーク故障情報2を格納するネットワーク故障情報DB13、累積故障量を算出する累積故障量算出部14、累積故障時間を算出する累積故障時間算出部15、累積故障時間算出部15からの累積故障時間と評価基準値とを比較して評価を実行するか否かを判定する実行判定部16、故障時間変化率を算出する故障時間変化率算出部17、入出力手段3から入力された評価基準値を記憶する記憶部20、記憶部18からの故障時間変化率算出値と記憶部20からの評価基準値に基づいて信頼性を評価し、評価結果を表示装置4に送出する信頼性評価部19から構成されている。
図4における各部は、本発明に係るネットワーク管理システムを構成するコンピュータのハードウェアとソフトウェアによって実現される。具体的には、ネットワーク管理システム10は、コンピュータのCPU、内部メモリ、外部メモリ、入出力装置などのハードウェア、および各部の機能に対応するプログラムからなるソフトウェアからなり、各部(受信部、累積故障量算出部、累積故障時間算出部、実行判定部、信頼性評価部)が行う処理はこれらのハードウェアとソフトウェアが連携して実現される。また、これらのソフトウェアはFD,CD−ROM、DVDなどのコンピュータ読み取り可能な記録媒体やインターネットなどのネットワークを介して市場に流通させることができる。
(手順0)は「ネットワーク設備情報およびネットワーク故障情報の入力」の処理手順であり、(手順1)は「評価対象(機種)設定」の処理手順であり、(手順2)は「累積故障時間算出」の処理手順であり、(手順3)は「実行判定」の処理手順であり、(手順4)は「累積故障量算出」の処理手順であり、(手順5)は「故障時間変化率算出」の処理手順であり、(手順6)は「信頼性評価」の処理手順であり、(手順7)は「評価結果表示」の処理手順である。以下、各手順について、図4の構成図、および図10のフローチャートを参照しながら詳しく説明する。
(手順0)『ネットワーク設備情報およびネットワーク故障情報の入力』
この(手順0)では、ネットワークの信頼性評価に基づくネットワーク運用管理を実施するために、ネットワーク管理システム10に対して、外部からネットワーク設備情報1およびネットワーク故障情報2を入力する。これらネットワーク設備情報1およびネットワーク故障情報2の入力は、他のネットワーク運用管理DB(データベース)等から自動的に実行される。
図5および図6の各々は、ネットワーク設備情報1およびネットワーク故障情報2の例を示す図である。
ネットワーク設備情報1は、図5に示すように、日時、装置毎の筐体数、インターフェイス数、電源数などから構成される。また、ネットワーク故障情報2は、図6に示すように、装置毎のホスト名、故障を発生したビル名、サービス中断の有無、故障発生日時、故障復旧日時、影響ユーザ数、加入者数、故障箇所や原因などの情報から構成される。
入力されたネットワーク設備情報1、ネットワーク故障情報2から、必要情報が抽出され、ネットワーク故障DB13に格納される。
図7は、ネットワーク故障DB13に格納されるデータの例を示す図である。
ネットワーク故障DB13には、図7に示すように、装置毎に、故障発生日時、故障復旧日時、影響ユーザ数、加入者数、故障箇所や原因、故障設備数などが格納される。
(手順1)『評価対象設定』
この(手順1)では、ネットワークを構成する装置、伝送路、構成要素に対して、評価対象を設定する。ネットワーク故障DB13内に格納されている故障情報に対して、入出力装置3から入力された評価対象情報で指定される信頼性評価の対象となる装置、伝送路、構成要素を設定する(図10のフローチャートのステップS1)。
(手順2)『累積故障時間算出』
この(手順2)では、上記(手順1)で評価対象が設定された場合、累積故障時間算出部15において、評価実行タイミングであるか否かの判定を実施する。このとき、事前に設定されている評価実行間隔と評価実行時点の日時の情報を照合することによって、評価実行タイミングであるか否かの判定を実施する(図10のフローチャートのステップS2)。
次に、ネットワーク故障情報DB13に格納された故障情報を参照し、評価対象となる故障事例の有無を判別する。評価対象となる故障事例があれば、評価を実行する。
次に、評価対象となる故障事例をもとに、事例毎に故障時間が算出される。
このとき故障時間は、
(故障回復日時あるいは復旧日時)−(故障発生日時)
によって定義される。
ここで、故障発生日時は、
・故障発生時に故障該当装置から故障発生のアラームが発せられた日時、
・故障検出システムによって故障が検出された日時、
・故障発生によるネットワークの停止について、ネットワークの利用ユーザから申告があった日時、
のいずれかが該当する。
また、復旧日時は、
・故障該当設備が機能を回復し再始動を開始した日時、
・ネットワークが機能を回復し、通信を開始した日時、
が該当する。
ここで、以降の説明に必要な記号を示す。
i:故障事例の番号(故障が発生した順)
ti:i番目に発生した故障の発生時点
T:評価実行の間隔(ある評価実行時点から次の評価実行時点までの間隔)
di:i番目に発生した故障の故障時間
ri:i番目に発生した故障設備(と同一設備)の配備数
ni:i番目の故障によって故障の影響を受けた影響規模(影響ユーザ数)
Ni:i番目の故障発生時点における加入者数
各事例の故障時間が算出されると、評価実行時において、評価対象となる複数の故障事例について、故障事例の累積故障時間を算出する。
以降、評価を実行する時間間隔をTとして、時間Tが経過するごとに評価を実行するものとする。
ここで、累積故障時間の算出方法として、2つの方法がある。
(累積故障時間の算出方法1):評価実行時点までの故障について故障時間の累積値を累積故障時間として算出する方法
故障事例の番号iに対する累積故障時間は、下記数式1となる。
Figure 2009201043
従って、評価実行時点までの任意の故障番号をsとすると、s番目に発生した故障までの累積故障時間は、下記数式2で表される。
Figure 2009201043
図8は、この算出方法で算出した累積故障時間の一例であり、故障番号毎の「故障発生日時」、「故障時間」、および算出した「累積故障時間」を示している(評価実行時点までの故障時間の累積値を累積故障時間とした場合)。
(累積故障時間の算出方法2):評価実行時点までの故障について故障発生時の影響ユーザ数と故障時間の積の値(延べ故障時間)の累積値を累積故障時間として算出する方法
故障事例の番号iに対する累積故障時間は、下記数式3となる。
Figure 2009201043
従って、s番目に発生した故障までの累積故障時間は、下記数式4で表される。
Figure 2009201043
累積故障時間算出部15において、評価実行時までの累積故障時間が算出されると、算出結果を実行判定部16に送信する。
以降においては、累積故障時間として、(算出方法1)を用いて算出した場合を想定して説明する。ただし、(算出方法2)を用いて算出した場合でも、同様の手順にて実施可能である。
(手順3)『実行判定』
累積故障時間の算出結果が実行判定部16に送信されると、実行判定部16において、累積故障時間算出部15から送信された累積故障時間と入出力手段3から入力され記憶部20に記憶されている評価基準値をもとに、評価実行の有無が判定される。
「(累積故障時間)>評価基準値」であれば、“評価を実行する”と判定され、「(累積故障時間)<評価基準値」であれば、“評価を実行しない”と判定される。このとき、評価基準値は時間であり、分、あるいは時間単位として与えられる。この判定で“評価を実行する”と判定されると、次の手順に進む。
(手順4)『累積故障量算出』
上記(手順3)で実行判定部16において、“評価を実行する”と判定されると、累積故障量算出部14において、累積故障量が算出される。
このとき、累積故障量の算出方法として、以下の3つがある。
(累積故障量の算出方法1)
累積故障量として、評価実行時点までの故障発生件数の総和を設定する。累積故障量の算出式は、下記数式5で表される。(数式5は、評価実行時点までの故障件数をカウントすることを意味する。)
Figure 2009201043
尚、この算出方法を採用する場合、ネットワークの信頼性評価は、故障件数の増加に対する故障時間の増加傾向を評価することを示している。
(累積故障量の算出方法2)
累積故障量として、故障設備の配備数の総和を設定する。累積故障量の算出式は、下記数式6で表される。
Figure 2009201043
尚、この算出方法を採用する場合、ネットワークの信頼性評価は、故障件数の増加に対する故障時間の増加に関して、故障発生特性を考慮した評価を実施することを示している。
図9は、この算出方法で算出された累積故障量の算出値の一例であり、故障番号毎の「故障発生日時」、「故障時間(分)」、「累積故障時間」、「故障設備数」、および算出結果の「累積故障量」を示している(評価実行時点までの故障設備の配備数の累積値を累積故障量とした場合)。
(累積故障量の算出方法3)
累積故障量として、対象となる故障事例について、故障発生時の影響規模と故障発生時の加入者数の比率(故障発生時の加入者数/故障発生時の影響規模数)の総和を数式7で設定する。
Figure 2009201043
尚、この算出方法における累積故障量は、加入者数と影響ユーザ数との比率によって、各故障設備の配備数に関する相対的な順序関係を示しており、設備数情報に関して正確な情報が得られない場合に、補完的に利用することもできる。
尚、以降において、累積故障量として、(累積故障量2)を用いた場合を想定して記述する。ただし、(累積故障量1)あるいは(累積故障量3)を用いた場合でも、以降の手順は、同様に実施することが可能である。
(手順5)『故障時間変化率算出』
この(手順5)は、故障時間変化率を算出する手順であり、故障時間変化率の算出方法として、以下の2つがある。
(算出方法1)
累積故障時間と累積故障量の2つ数値の比率として下記数式8を用いる。
Figure 2009201043
算出方法1による故障時間変化率の算出の概念を図2示す。
(算出方法2)
累積故障時間と累積故障量からなる数列に対して、回帰直線を当てはめ、
回帰直線の傾きの値を故障時間変化率とする。回帰直線は、累積故障時間と累積故障量を1組とし、故障発生順に構成した累積故障時間と累積故障量の組の数列に対して最小二乗法を用いて算出する。例えば,累積故障量の変数をxとし,累積故障時間の変数をyとした場合に、累積故障量と累積故障時間の関係を示す回帰直線を算出する。このとき、回帰直線:y=ax+bにおける傾き係数aの値が故障時間変化率に対応している。
算出方法2による故障時間変化率の算出の概念を図3に示す。
(手順6)『信頼性評価』
この(手順6)は、故障時間変化率算出部から送信された故障時間変化率の算出結果をもとに信頼性評価を実施する手順である。
(判定方法1)
故障時間変化率の算出結果が、基準値内に収まれば、故障時間の変化が小さいと判定される。
(評価基準下限値)<(故障時間変化率)<(評価基準上限値)
故障時間変化率の算出結果が、基準値内に収まらなければ、故障時間の変化が大きいと判定される。
(評価基準下限値)>(故障時間変化率)
あるいは
(評価基準上限値)<(故障時間変化率)
(判定方法2)
評価実行時点の故障時間変化率の算出結果と、記憶部に記憶されている前評価実行時の故障時間変化率の算出結果および評価基準値との比較によって、判定する。
|故障時間変化率)-(前評価における故障時間変化率)|<(評価基準値)
(ここで、|A|は、値Aの絶対値を表す)
信頼性評価部にて出力された評価結果は、次の手順7で表示装置4に表示される。
(手順7)『評価結果表示』
この(手順7)は、上記(手順6)にて評価された結果を表示装置4に表示する手順である。
表示する評価結果としては、以下のものであり、以下のすべての項目、あるいはいくつかの項目を組み合わせたものである。
・評価対象の故障時間変化率が許容範囲内か否か(例えば、○・×)
・評価対象の故障時間変化率が、評価基準値と比較して大きいか否か(例えば、大・小)
・評価対象の故障時間変化率が前評価実行時の故障時間変化率と比較して大きいか否か(例えば、大・小)
本発明の原理を説明するためのフロー図である。 本発明の実施例における故障時間変化率の算出の概念を示す図(算出方法1の場合)である。 本発明の実施例における故障時間変化率の算出の概念を示す図(算出方法2の場合)である。 本発明に係る信頼性管理システムの一形態を示す図である。 本発明の実施例におけるネットワーク設備情報の一例を示す図である。 本発明の実施例における故障情報の一例を示す図である。 本発明の実施例におけるネットワーク故障情報DBの一例を示す図である。 本発明の実施例における累積故障時間算出値の一例(評価実行時点までの故障時間の累積値を累積故障時間とする場合)を示す図である。 本発明の実施例における累積故障数算出値の一例(評価実行時点までの故障設備の配備数の累積値を累積故障量とする場合)を示す図である。 本発明の実施例において信頼性の評価を実施するフローチャートである。
符号の説明
1:ネットワーク設備情報
2:ネットワーク故障情報
3:入出力手段
4:表示装置
10:ネットワーク管理システム
11,12:受信部
13:ネットワーク故障情報DB
14:累積故障量算出部
15:累積故障時間算出部
16:実行判定部
17:故障時間変化率算出部
18,20:記憶部
19:信頼性評価部

Claims (14)

  1. 構成要素である複数のネットワーク設備からなるネットワークの信頼性を評価するネットワーク管理システムであって、
    前記ネットワーク設備毎の配備数を含むネットワーク設備情報を入力する手段と、
    前記ネットワーク設備毎の故障発生時刻および復旧時刻を含むネットワーク故障情報を入力する手段と、
    該入力されたネットワーク設備情報およびネットワーク故障情報を記憶するネットワーク故障情報DBと、
    前記ネットワークの信頼性評価における評価対象情報と信頼性を評価するために必要な各種評価基準値を入力する手段と、
    前記ネットワーク故障情報DBの内容を参照して累積故障時間を算出する累積故障時間算出手段と、
    前記ネットワーク故障情報DBの内容を参照して累積故障量を算出する累積故障量算出手段と、
    前記累積故障時間と前記累積故障量に基づいて故障時間の変化の割合を示す故障時間変化率を算出する故障時間変化率算出手段と、
    該故障時間変化率算出手段で算出した故障時間変化率と前記評価基準値を比較することにより信頼性を評価する信頼性評価手段と、
    を具備することを特徴とするネットワーク管理システム。
  2. さらに、前記累積故障時間算出手段で算出した累積故障時間と前記評価基準値を比較して評価を実行するか否かを判定する実行判定手段を有し、
    前記実行判定手段で評価を実行すると判定された場合に、前記累積故障量算出手段により累積故障量を算出し、前記故障時間変化率算出手段により故障時間変化率を算出することを特徴とする請求項1記載のネットワーク管理システム。
  3. 前記累積故障時間は、評価実行時点までの故障についての故障時間の累積値、または、評価実行時点までの故障についての故障発生時の影響ユーザ数と故障時間の積の累積値のいずれかであることを特徴とする請求項1または2記載のネットワーク管理システム。
  4. 前記累積故障量は、評価実行時点までの故障発生件数の総和、故障設備数の総和、または、対象となる故障事例について、故障発生時の影響規模と故障発生時の加入者数の比率(故障発生時の加入者数/故障発生時の影響規模数)の総和のいずれかであることを特徴とする請求項1から3のいずれかに記載のネットワーク管理システム。
  5. 前記故障時間変化率は、前記累積故障時間と前記累積故障量の比、または、累積故障時間と累積故障量からなる数列に対して、累積故障量の変数をxとし、累積故障時間の変数をyとし、該累積故障量と累積故障時間の関係を示す回帰直線:y=ax+bを当てはめ、最小二乗法を用いて求めた回帰直線の傾き係数aのいずれかであることを特徴とする請求項1から4のいずれかに記載のネットワーク管理システム。
  6. 前記信頼性評価は、前記故障時間変化率の算出結果と前記評価基準値を比較することによって行われるか、あるいは、評価実行時点の故障時間変化率の算出結果と前回の評価実行時の故障時間変化率の算出結果を前記評価基準値と比較することによって行われることを特徴とする請求項1から5のいずれかに記載のネットワーク管理システム。
  7. 前記信頼性評価の結果を表示装置に表示させることを特徴とする請求項1から6のいずれかに記載のネットワーク管理システム。
  8. コンピュータを、請求項1から7のいずれかに記載のネットワーク管理システムにおける各手段として機能させるためのプログラム。
  9. 構成要素である複数のネットワーク設備からなるネットワークの信頼性を評価するネットワーク管理方法であって、
    前記ネットワーク設備毎の配備数を含むネットワーク設備情報を入力するステップと、
    前記ネットワーク設備毎の故障発生時刻および復旧時刻を含むネットワーク故障情報を入力するステップと、
    該入力されたネットワーク設備情報およびネットワーク故障情報をネットワーク故障情報DBに記憶するステップと、
    前記ネットワークの信頼性評価における評価対象情報と信頼性を評価するために必要な各種評価基準値を入力するステップと、
    前記ネットワーク故障情報DBの内容を参照して累積故障時間を算出する累積故障時間算出ステップと、
    該累積故障時間算出ステップで算出した累積故障時間と前記評価基準値を比較して評価を実行するか否かを判定する実行判定ステップと、
    前記ネットワーク故障情報DBの内容を参照して累積故障量を算出する累積故障量算出ステップと、
    前記実行判定ステップで評価を実行すると判定された場合に、故障時間の変化の割合を示す故障時間変化率を算出する故障時間変化率算出ステップと、
    該故障時間変化率算出ステップで算出した故障時間変化率と前記評価基準値を比較することにより信頼性を評価する信頼性評価ステップと、
    を有することを特徴とするネットワーク管理方法。
  10. 前記累積故障時間は、評価実行時点までの故障についての故障時間の累積値、または、評価実行時点までの故障についての故障発生時の影響ユーザ数と故障時間の積の累積値のいずれかであることを特徴とする請求項9記載のネットワーク管理方法。
  11. 前記累積故障量は、評価実行時点までの故障発生件数の総和、故障設備数の総和、または、対象となる故障事例について、故障発生時の影響規模と故障発生時の加入者数の比率(故障発生時の加入者数/故障発生時の影響規模数)の総和のいずれかであることを特徴とする請求項9または10に記載のネットワーク管理方法。
  12. 前記故障時間変化率は、前記累積故障時間と前記累積故障量の比、または、累積故障時間と累積故障量からなる数列に対して、累積故障量の変数をxとし、累積故障時間の変数をyとし、該累積故障量と累積故障時間の関係を示す回帰直線:y=ax+bを当てはめ、最小二乗法を用いて求めた回帰直線の傾き係数aのいずれかであることを特徴とする請求項9から11のいずれかに記載のネットワーク管理方法。
  13. 前記信頼性評価は、前記故障時間変化率の算出結果と前記評価基準値を比較することによって行われるか、あるいは、評価実行時点の故障時間変化率の算出結果と前回の評価実行時の故障時間変化率の算出結果を前記評価基準値と比較することによって行われることを特徴とする請求項9から12のいずれかに記載のネットワーク管理方法。
  14. 前記信頼性評価の結果を表示装置に表示させるステップを有することを特徴とする請求項9から13のいずれかに記載のネットワーク管理方法。
JP2008043166A 2008-02-25 2008-02-25 ネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラム Pending JP2009201043A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008043166A JP2009201043A (ja) 2008-02-25 2008-02-25 ネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008043166A JP2009201043A (ja) 2008-02-25 2008-02-25 ネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラム

Publications (1)

Publication Number Publication Date
JP2009201043A true JP2009201043A (ja) 2009-09-03

Family

ID=41144024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008043166A Pending JP2009201043A (ja) 2008-02-25 2008-02-25 ネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラム

Country Status (1)

Country Link
JP (1) JP2009201043A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016144189A (ja) * 2015-02-05 2016-08-08 日本電信電話株式会社 ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016144189A (ja) * 2015-02-05 2016-08-08 日本電信電話株式会社 ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム

Similar Documents

Publication Publication Date Title
US11614943B2 (en) Determining problem dependencies in application dependency discovery, reporting, and management tool
US10642719B1 (en) Intelligent services for application dependency discovery, reporting, and management tool
US11221854B2 (en) Dependency analyzer in application dependency discovery, reporting, and management tool
US10083073B2 (en) Method and system for real-time causality and root cause determination of transaction and infrastructure related events provided by multiple, heterogeneous agents
US20220300398A1 (en) Discovery crawler for application dependency discovery, reporting, and management tool
US20200409780A1 (en) Baseline modeling for application dependency discovery, reporting, and management tool
US10915428B2 (en) Intelligent services and training agent for application dependency discovery, reporting, and management tool
US6973415B1 (en) System and method for monitoring and modeling system performance
US8352789B2 (en) Operation management apparatus and method thereof
JP4859558B2 (ja) コンピュータシステムの制御方法及びコンピュータシステム
US7082381B1 (en) Method for performance monitoring and modeling
US11675692B2 (en) Testing agent for application dependency discovery, reporting, and management tool
JP2010526352A (ja) 統計的な分析を利用した性能障害管理システム及びその方法
CN107992410B (zh) 软件质量监测方法、装置、计算机设备和存储介质
JP6085576B2 (ja) ネットワーク評価装置及び方法及びプログラム
Anand et al. Modeling software fault removal and vulnerability detection and related patch release policy
JP5133941B2 (ja) ネットワーク管理システムおよびネットワーク管理方法、ならびにそのためのプログラム
EP4242850A2 (en) Determining problem dependencies in application dependency discovery, reporting, and management tool
JP4637867B2 (ja) ネットワーク評価システムおよびネットワーク評価方法ならびにそのためのプログラム
JP2009201043A (ja) ネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラム
JP6126316B2 (ja) 保守支援システム及び保守支援方法
JP2008053913A (ja) ネットワーク装置管理システムおよび管理方法、ならびにそのためのプログラム
KR20100003597A (ko) 통합 성능 모니터링 방법 및 모니터링 시스템
JP2011040954A (ja) ネットワーク評価システムおよびネットワーク評価方法、ならびにそのためのプログラム
JP5068351B2 (ja) ネットワーク評価システム、ネットワーク評価方法、及びプログラム