JP6326383B2 - ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム - Google Patents

ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム Download PDF

Info

Publication number
JP6326383B2
JP6326383B2 JP2015021373A JP2015021373A JP6326383B2 JP 6326383 B2 JP6326383 B2 JP 6326383B2 JP 2015021373 A JP2015021373 A JP 2015021373A JP 2015021373 A JP2015021373 A JP 2015021373A JP 6326383 B2 JP6326383 B2 JP 6326383B2
Authority
JP
Japan
Prior art keywords
failure
network
evaluation
time
unavailability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015021373A
Other languages
English (en)
Other versions
JP2016144189A (ja
Inventor
達哉 松川
達哉 松川
拓磨 鍔木
拓磨 鍔木
裕介 船越
裕介 船越
正夫 相原
正夫 相原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015021373A priority Critical patent/JP6326383B2/ja
Publication of JP2016144189A publication Critical patent/JP2016144189A/ja
Application granted granted Critical
Publication of JP6326383B2 publication Critical patent/JP6326383B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

故障確率等に基づきネットワークの信頼性を評価するネットワーク評価システムに関するものである。
通信ネットワークの信頼性は、対象の通信ネットワークを構成する設備(例えばネットワーク装置やリンク等のネットワーク構成要素)と設備の構成(設備の接続構成や冗長構成)によって、当該通信ネットワークに対する評価モデルを作成し、個々のネットワーク設備が有する故障確率(例えば、故障率や不稼動率)の積や和を用いて算出される。
そして、その信頼性は、当該通信ネットワークに対して求められている故障確率をもとに、個々のネットワーク設備に対して求められている故障確率を配分し、配分された故障確率と、評価モデルをもとに算出された故障確率とを比較することよって評価されてきた。ネットワーク信頼性の算出方法に関する従来の技術としては、非特許文献1に記述されている例がある。この文献に開示されている信頼性評価技術は、ネットワークの計画・設計・構築を実施する上で的確な判断を支援するための技術である。
運用中のネットワークの信頼性を評価し、ネットワークの信頼性向上施策を選定・決定する方法としては、ネットワーク設備に故障が発生した際のサービスの中断時間や故障した設備の停止時間に関する情報を収集し、サービスの中断や設備の停止が長引く原因や故障事例を明らかにすることによって、重点的に、あるいは優先的に実施すべき対策を決定する方法がある。非特許文献2においては、一般的な故障を対象としてネットワーク設備の故障発生から回復までの措置や措置の流れの例、MTTR(Mean Time To Repair)等の故障発生から回復までの時間に関する評価指標が示されており、サービスの中断時間や故障の修復時間に関する統計値を算出することによってネットワークの信頼性を評価する方法が示されている。
IPネットワークにおいては、市販技術や汎用製品を積極的に導入してネットワークを構築しており、複数のベンダ、及び複数の機種の装置を組み合わせることによってネットワークを構成している。ルータ等に代表されるIPネットワーク装置を用い、故障が発生した場合にも、故障していない装置への切り替え等を実施することによって、通信サービスを利用しているユーザへは影響が発生しないような仕組みを採用している。
現在、欧州の電気通信産業に関する標準化組織であるETSI(European Telecommunications Standards Institute)においては、通信ネットワークにおけるネットワーク機能を仮想化技術を用いて提供するためのアーキテクチャが議論されており、ネットワーク機能の仮想化(NFV: Network Functions Virtualization)に関する標準化が進められている。NFVの標準化においては、ネットワーク機能を仮想化する際に、仮想化技術を適用したネットワークにおいてサービスを実現するために求められる信頼性を確保するために必要なネットワークの信頼性の評価指標や信頼性を評価するためのモデルについての概要、冗長化構成箇所において故障が発生した際の切り替わりの動作等について、標準となるモデルが検討されている。例えば、非特許文献3が知られている。
通信ネットワークに仮想化技術を適用する場合には、汎用サーバ上において、各種ネットワーク機能を提供することを前提としており、各種ネットワーク機能をソフトウェアを用いて汎用サーバ上において実現することを前提としている。各種ネットワーク機能を、キャリアグレードのネットワークシステムに集約することによって、設備の構築コストや運用コストの削減が見込まれる。一方で、各種機能を集約することによって、故障の影響が大規模化する可能性があり、故障の大規模化によるネットワークの信頼性の低下が懸念されている。ネットワークが仮想化された環境においても一定の信頼性を確保するためには、汎用サーバを冗長化する、あるいは装置に収容するユーザの数を制限することによって、万が一、汎用サーバにおいて故障が発生した場合にも、故障による通信サービスの停止時間や通信サービスを利用するユーザへの影響を極力小さくすることが重要となる。
また、ネットワーク機能の仮想化においては、各種冗長化構成の高度化が期待されている。現用系(冗長化構成箇所において通信サービスを提供している装置や部品等の物理的なリソース)において故障が発生した際に、予備系(冗長化構成箇所において通信サービスを提供していない、現用系とは別の予備装置・予備部品等の物理的なリソース)への瞬時的な切り替えや、要求するタイミングで、簡易に、必要な量の物理的なリソースを追加することが可能であるため、ネットワークの運用段階においても、ネットワークの運用者が所望する信頼性を確保することが可能となる。(N+m)冗長化構成のように、現用系の数がN個に対して予備系の数がm個の構成を、1つの冗長化構成の候補として採用することが見込まれており、1対1の冗長化構成に比べて、設備コストを抑制可能な冗長化構成が実現する可能性がある。
一方で、市販装置及び汎用サーバを用いて構成されるネットワークにおいては、ハードウェアの物理的・偶発的な故障に加え、装置の製造工程における不良部品の混入やソフトウェア開発工程における不具合の混入等、装置の故障につながる要因・要素が多数存在するため、ネットワーク全体の信頼性は、ネットワークを構成する個々の要素の信頼性に大きく依存する可能性がある。ネットワークのおける各種故障や不具合については、例えば、非特許文献4が知られている。
「NTT通信網を理解していただくために」(NTT通信網研究会,1994)"第8章 安定品質",pp. 314−329 Chris Oggerino「High Availability Network Fundamentals」, Cisco Press, pp. 86-91 ISBN 1587130173. Draft ETSI GS NFV-REL 001 V0.1.3 (2014-06) Network Functions Virtualisation (NFV); Resiliency Requirements) Julien Maisonneuve, 「Nonstop Routing in Highly Available Networks」,Design of Reliable Communication Networks (DRCN) 2003)
ネットワーク全体の信頼性を事前に正確に見積もるためには、ネットワークを構成する個々の要素の信頼性の値を元に、ネットワーク全体としての信頼性を計算し、ネットワークを構成する個々の要素の故障によるネットワーク全体の信頼性低下への影響を適切に見積もる必要がある。
また、ネットワークを構成する個々の要素において故障が頻発する、あるいは故障につながる可能性のある事象が頻発する場合には、装置や部品等の物理的なリソースを迅速に追加的に配備する必要がある。しかしながら、予備リソースの追加配備はネットワークのコスト増加につながる可能性があり、ネットワークコストの増加を最小限にとどめるために、予備リソースの追加を最小限に抑える必要がある。
非特許文献1においては、評価対象となるネットワークについてネットワーク構成要素ごとの故障率や故障時間(故障に伴うサービス中断時間)の数値を用いて不稼働率を算出し、各要素の不稼働率を足し合わせることによってネットワークとしての信頼性を評価する方法を示している。この方法は、各要素ごとの信頼性対策を決定するための技術であり、ネットワークの設計段階において冗長構成や収容構成等の効果を見積もることを目的としている。よって、ネットワークの運用中において、装置の故障や故障につながる事象の発生の増加等、故障の発生状況に応じて、ネットワーク装置増設等の構成変更を実施する状況は考慮されていない。故障の発生率や故障の継続時間について、過去の経験に基づいて想定される値や長期間の測定結果に基づく平均的な特性のみしか考慮されていない。短期間に故障の発生率が大きく増加する状況や、回復に長時間を要する故障の発生を考慮していないため、安全側の評価が実施できない可能性がある。
例えば、通常、冗長化構成箇所においては、複数の故障が重複的に発生するような状況は極めて稀な事象と想定されるため、冗長化構成箇所における故障が通信サービスに影響する可能性は極めて低いと評価される場合が多い。
しかしながら、故障発生から回復までの時間が極めて長くなる場合や短期間に故障が頻発する状況においては、冗長化構成箇所においても、通信サービスに影響する可能性を無視することはできない。ネットワーク全体の信頼性の評価が十分でないことによって、結果的に通信サービスが利用できない状況が発生する危険性がある。また、ネットワーク全体の信頼性を過剰に低く見積もった場合には、装置や部品等の物理的なリソースを余分に配備することにつながり、ネットワークのコストの増加を引き起こす可能性がある。
非特許文献2においては、IPネットワーク装置における故障、及び故障に伴う回復措置について記載されており、故障発生から回復までの平均値(MTTR: Mean Time To Repair)や稼働率(availability)を評価する方法が記載されている。
しかしながら、特定の装置や部品において、故障の回復に要する時間が大きく異なる複数の種別の故障が混在する状況においては、MTTR等の平均的な値のみを用いて評価するだけでは十分ではない。故障の種別に応じて故障の回復に要する時間は大きく異なる可能性があるため、故障種別、及び故障の種別に応じた故障回復時間のばらつき(統計的な特性)を考慮して評価することが必要である。
例えば、2重化構成が採用されている箇所においては、両構成要素にて2重に故障が発生した場合に、通信サービスの停止が発生する。このとき、両構成要素にて2重に故障が発生する確率は、両構成要素の故障率の積となるため、両者の値が同程度であれば、個々の構成要素の故障率の2乗として算出される。
ハードウェア故障等の事前に想定している種別の故障が発生した場合には、交換措置等の対処方法が事前に明らかになっているため、故障の回復は長時間化する可能性は低い。よって、一方が故障している状況において、他方がさらに故障する可能性は極めて低いと評価することが可能である。
しかしながら、ソフトウェアの不具合に起因する故障等、事前に想定することが難しく、短期間に高頻度で発生する可能性がある種別の故障が発生した場合には、故障の回復が長時間化する可能性があるため、一方の構成要素が故障している状況において、他方の構成要素においてさらに故障が発生する可能性が生じる。つまり、故障の回復に要する時間を考慮して信頼性を評価する必要があり、故障の種別等、故障による回復時間の違いを特徴付ける要素を考慮して信頼性を評価する必要がある。
この発明は上記事情に着目してなされたもので、その目的とするところは、複数のネットワーク構成要素によって構成される冗長化構成の信頼性の評価に優れたネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラムを提供することにある。
上記目的を達成するために、実施形態に係るネットワーク評価システムは、ネットワーク装置及びサーバ装置から構成されるネットワークの構成要素数に関する情報、故障発生日時に関する情報、及び故障回復日時に関する情報を入力する手段と、前記ネットワークの構成要素数に関する情報、故障発生日時に関する情報、及び故障回復日時に関する情報を記憶する手段と、これらの入力および記憶された情報をもとにして、前記ネットワークにおける故障による通信サービスへの影響を評価する手段と、を具備する。
すなわちこの発明によれば、複数のネットワーク構成要素によって構成される冗長化構成の信頼性評価に優れたネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラムを提供することができる。
本発明の実施形態に係るネットワーク評価システムによる不稼働率評価(全体)の一例を示すフローチャートである。 (n+1)冗長化構成の信頼性ブロック図の一例を示す図である。 (n+2)冗長化構成の信頼性ブロック図の一例を示す図である。 本発明の実施形態に係るネットワーク評価システムによる評価の実施結果の一例を示す図である。 評価パターン2の実施結果の一例を示す図である。 評価パターン3の実施結果の一例を示す図である。 評価パターン4の実施結果の一例を示す図である。 本発明の実施形態に係るネットワーク評価システムの一例を示すブロック図である。 本発明の実施形態に係るネットワーク評価システムのネットワーク故障DBにおける故障情報の一例を示す図である。 本発明の実施形態に係るネットワーク評価システムによる不稼働率評価(詳細)の一例を示すフローチャートである。
以下、図面を参照してこの発明に係わる実施形態を説明する。
図1は、本発明の実施形態に係る不稼働率評価(全体)の一例を示すフローチャートである。(本発明の実施形態に係る原理を説明するための図である。)フローチャートの各ステップについては後に詳しく説明する。
ここで、以降に続く記載内容に用いる記号を定義し、説明する。
下記は、故障の発生時間間隔や回復時間等、ネットワークの信頼性を評価する上で重要な指標である。
MTBF: 故障の発生間隔(ある故障が発生してから次の故障が発生するまでの時間)の平均値
MTTR: 故障の修理時間(故障が発生してから回復するまでの時間)の平均値
MTBFA: 故障種別Aの故障の発生時間間隔の平均値
MTBFB: 故障種別Bの故障の発生時間間隔の平均値
MTTRA: 故障種別Aの故障の回復時間の平均値
MTTRB: 故障種別Bの故障の回復時間の平均値
TBFB: 故障種別Bの故障の発生時間間隔(複数の故障が発生した場合には複数の数値となる)
TTRB: 故障種別Bの故障の回復時間(複数の故障が発生した場合には複数の数値となる)
S(TBFB): 故障種別Bの故障の発生時間間隔の統計値
S(TTRB): 故障種別Bの故障の回復時間の統計値
本発明においては、複数の故障が発生している状況を前提としているため、故障の発生間隔や回復時間等の時間についての統計値が存在することとする。なお、本発明は、複数の故障に限らず、単一の故障にも適用可能である。また、複数の故障とは、同一種別の複数回の故障、及び複数種別の故障の何れのケースも含む。
故障の発生日時を以下の数列とする。
t1, t2, t3, ・・・, tk, ・・・, (1, 2, 3, ・・・ は、故障の発生順序を示す番号)
また、各故障の回復日時を以下の数列とする。
r1, r2, r3, ・・・, tk, ・・・, (1, 2, 3, ・・・ は、上記と同様に故障の発生順序を示す番号)
各故障の回復時間は、r1とt1の差分の時間、rkとtkの差分の時間として算出できる。よって、これらの時間の値の数列に対する平均値を求めれば、MTTRが算出できる。
同様に、故障種別Bについて、平均値以外の統計値を算出する場合には、 統計値をS(TTRB)と定義し、算出する。
また、故障の発生時間間隔は、t2とt1の差分の時間、tkとtk-1の差分の時間として算出できる。よって、これらの時間の値の数列に対する平均値を求めれば、MTBFが算出できる。
同様に、故障種別Bについて、平均値以外の統計値を算出する場合には、 S(TBFB)と定義し、算出する。
非冗長化構成箇所における不稼働率は、一般的に前述の記号を用いて以下のように表される。
よって、2重化構成箇所における不稼働率は、以下のように表される。
さらに、(n+1)冗長化構成(2箇所において故障が発生すると通信サービスの停止に影響する冗長化構成)箇所における不稼働率は、以下のように表される。ここで、(n+1)の、nは正常に動作するために必要な物理リソースの数、1は予備系として必要な物理リソースの数を示している。図2は、(n+1)冗長化構成の信頼性ブロック図の一例を示す。並列冗長システムの信頼性ブロック図と同様であるが、(n+1)冗長化構成においては、n個の構成要素が正常に動作していれば正常に動作し、2個以上の構成要素に故障が発生すると正常に動作しなくなるという性質を持つシステムである。
ここで、2種類の故障種別(A, B)の故障が発生している状況を想定すると、2種類の故障による、非冗長化構成箇所における不稼働率は、以下のように表される。
上式より、2種類の故障種別(A, B)の故障が発生している状況において、2種類の故障による(n+1)冗長化構成箇所における不稼働率は、以下のように表される。
ここで、故障種別Bの故障が増加している、あるいは故障種別Bの故障の回復に長時間を要する状況を考慮するために、前述の不稼働率の算出式を以下のように補正する。
S(TBFB)は、故障種別Bの故障の故障発生時間間隔の統計値であり、例えば、故障が急増している状況を想定し、故障発生時間間隔の値を危険側(短時間)に設定するためには、第1四分位数等の小さい代表値を設定することが有効である。
また、S(TTRB)は、故障種別Bの故障の回復時間の統計値であり、例えば、故障の回復の難易度が高く、故障の回復が長時間化するような最悪ケースを想定する場合には、第3四分位数等の大きい代表値を設定することが有効である。
同様にして、(n+2)冗長化(3箇所において故障が発生すると通信サービスの停止に影響する冗長化構成)構成箇所における不稼働率は、以下のように表される。図3は、(n+2)冗長化構成の信頼性ブロック図の一例を示す。並列冗長システムの信頼性ブロック図と同様であるが、n+2冗長化構成においては、n個の構成要素が正常に動作していれば正常に動作し、3個以上の構成要素に故障が発生すると正常に動作しなくなるという性質を持つシステムである。
また、(n+3)冗長化構成箇所(n個の構成要素が正常に動作していれば正常に動作し、4個以上の構成要素に故障が発生すると正常に動作しなくなるという性質を持つシステムである。)における不稼働率は、以下のように表される。
ここには記載しないが、(n+m)重化構成箇所(m+1箇所において故障が発生すると通信サービスの停止に影響する冗長化構成)における不稼働率についても算出式を定義することができる。
図8は、本発明の実施形態に係るネットワーク評価システムの一例を示すブロック図である。尚、本発明の実施のタイミングは事前に固定の期間を事前に設定する場合と、任意の期間を入力し実施する場合とがある、いずれの場合においても、実施形態は同様になるため、本実施形態では固定期間ごとに実施するものとし、実施のタイミングが事前に設定されている場合を例として記載する。
ここで、手順0(ST0)、手順1(ST1)、手順2(ST2)、手順3(ST3)を実行する動作主体としてのネットワーク評価システムについて説明する。図8に示すように、ネットワーク評価システムは、受信及び処理部11、受信及び処理部21、ネットワーク故障情報DB(データベース)12、ネットワーク構成情報DB(データベース)22、不稼働率算出部31、及び不稼働率評価部32等を備える。
受信及び処理部11は、有線又は無線により情報を受信する通信部、及び情報を処理するプロセッサー等で構成され、ネットワーク故障情報1等を受信し(入力し)、受信した情報を処理する。図9は、ネットワーク故障情報の一例を示す図である。同様に、受信及び処理部21は、有線又は無線により情報を受信する通信部及び情報を処理するプロセッサー等で構成され、ネットワーク構成情報2等を受信し(入力し)、受信した情報を処理する。
ネットワーク故障情報DB12は、ハードディスク等の情報記憶装置であり、受信及び処理部11により受信されたネットワーク故障情報1等を記憶する。同様に、ネットワーク構成情報DB22は、ハードディスク等の情報記憶装置であり、受信及び処理部21により受信されたネットワーク構成情報2等を記憶する。
なお、本実施形態では、受信及び処理部11と受信及び処理部21で、ネットワーク故障情報1及びネットワーク構成情報2等を受信し、受信した情報を処理するケースについて説明するが、一つの通信部でネットワーク故障情報1及びネットワーク構成情報2等を受信し、一つの処理部で受信した情報を処理するようにしてもよい。
不稼働率算出部31は、プロセッサー及びメモリ等により構成可能であり、ネットワーク故障情報DB12に記憶されたネットワーク故障情報1、及びネットワーク構成情報DB22に記憶されたネットワーク構成情報2等に基づき、不稼働率を算出する。不稼働率評価部32は、プロセッサー及びメモリ等により構成可能であり、不稼働率算出部31により算出された不稼働率の算出結果3に基づき、不稼働率(故障による通信サービスへの影響)を評価し、評価結果4を出力する。
ネットワーク評価システムの不稼働率評価部32から出力される評価結果4は、表示装置40等へ出力される。表示装置40は、不稼働率評価部32から出力される評価結果4を表示する。
なお、本実施形態では、ネットワーク評価システムが、ネットワーク故障情報DB12及びネットワーク構成情報DB22を備えるケース、つまり、ネットワーク故障情報及びネットワーク構成情報を有するケースについて説明するが、ネットワーク故障情報DB12及びネットワーク構成情報DB22の一方又は両方をネットワーク評価システムの外部に設置し、必要に応じて、ネットワーク評価システムが、外部のDBから、ネットワーク故障情報1及びネットワーク構成情報2の一方又は両方を取得(ダウンロード)するようにしてもよい。
(手順0(ST0)) ネットワーク故障情報、ネットワーク構成情報の入力
ネットワークの信頼性の算出結果に基づくネットワーク構成の評価を実施するために、ネットワーク評価システムに対して、外部からネットワーク故障情報1を入力する。受信及び処理部11は、入力されるネットワーク故障情報1を受信する。(図10のST11)
ここで、入力は他のネットワーク運用管理DB(データベース)等から自動的に実行する。受信及び処理部11は、入力されたネットワーク故障情報1から、故障種別毎の故障発生日時、故障回復日時等の必要情報を抽出し、ネットワーク故障DBに格納する。(ネットワーク故障DBに格納されている故障情報の例としては、図9を参照)
また、ネットワーク評価システムに対して、外部からネットワーク構成情報2を入力する。受信及び処理部21は、入力されるネットワーク構成情報2を受信する。(図10のST11)
ここで、これらの入力は他のネットワーク構成情報管理DB(データベース)等から自動的に実行する。受信及び処理部21は、入力されたネットワーク構成情報から、構成要素数等の必要情報を抽出し、ネットワーク構成情報DBに格納する。ネットワークの構成としては、1重化構成や多重化構成等、複数の構成パターンがあるが、ここでは(n+m)冗長化構成((n+m)個の構成要素のうちm+1個以上の構成要素において故障が発生すると正常に動作しなくなるという性質を持つシステム)を例として以降の手順を説明する。
ここでは、最も単純な例として、構成要素の種別(装置の機種や機能の種別)は1種類とし、構成要素数は1種類の構成要素に対する数量を表すものとする。また、故障の種別は2種類に分類されるとする。
商用のネットワークにおいて実際に運用されている状況においては、構成要素の種別や故障の種別は複数存在するが、以降の手順の実施形態は同じ形態にて実現可能であるため、上記の単純な例を用いて説明することとする。
尚、本発明では、故障時間の統計的な評価を実施するため、手順0において設定した故障情報の数(故障事例数)が一定以上である必要がある。(図10のST12)本実施形態では、以降の手順を実行する基準として、故障情報の数が20件以上必要であることとする。尚、故障件数の数の基準として20以上としているのは、有意差の検定等、統計的な評価や判断を実施する上で必要となるサンプル数が凡そ20程度と言われていることを理由としているが、故障情報の数が複数あれば20未満であってもよい。
(手順1(ST1))不稼働率の算出
2種類の故障種別(A, B)の故障が発生している状況において、2種類の故障による(n+1)冗長化構成箇所における不稼働率は、不稼働率算出部31により算出され(図10のST13)、以下のように表される。
前述の通り、MTTRは、故障の修理時間の平均値であって、各故障の故障時間(回復日時と発生日時の差分の時間)の構成要素数nに対する平均値として、不稼働率算出部31により算出される。同様にMTBFは、各故障の発生時間間隔について、構成要素数nに対する平均値として、不稼働率算出部31により算出される。
故障種別Bの故障が増加している、あるいは故障種別Bの故障の回復に長時間を要する状況を考慮するため、同様に、故障種別Bについて、平均値以外の統計値をS(TTRB)と定義し、不稼働率算出部31によりS(TTRB)が算出される。なお、不稼働率算出部31が、故障種別毎の故障発生日時、故障回復日時等の必要情報に基づき、故障種別Bの故障が増加している、あるいは故障種別Bの故障の回復に長時間を要する状況を判定する。
同様に、故障の発生時間間隔について、平均値以外の統計値をS(TBFB)と定義し、不稼働率算出部31によりS(TBFB)が算出される。
これらの統計値を用いて、不稼働率算出部31は、不稼働率の算出式を以下のように補正し、不稼働率を算出する。
ここで、S(TTRB)の値として、第3四分位数等の統計値として大きい値を採用すると、TTRの値に対する不稼働率の値が大きく評価されるため、安全側の評価が可能となる。
また、同様に、S(TBFB)の値として、第1四分位数等の統計値として小さい値を採用すると、TBFの値に対する不稼働率の値が大きく評価されるため、安全側の評価が可能となる。
これらの統計値の設定方法については、事前にネットワークの運用者によって決定されており、ネットワーク評価システムに設定されており、不稼働率算出部31は設定に従い統計値及び不稼働率を算出する。
手順0において入力された故障情報、及び構成要素数の情報を用いて、上記不稼働率によって、不稼働率算出部31は、冗長化構成の不稼働率を算出する。
ここで、上記、(n+1)冗長化構成に対する不稼働率の算出結果3をUn+1と定義する。
(手順2(ST2)) 不稼働率の評価
不稼働率評価部32は、手順1において算出した不稼働率の算出結果3を評価する。(図10のST14)
算出した不稼働率の値:Un+1が、基準値cを超過する場合、すなわち
Un+1 > c
となれば、不稼働率評価部32は、不稼働率は高い、すなわち信頼性が低いと評価し、評価結果4を出力する。
ここで、基準値は、本手順を実施するシステムに、事前に設定されているものとする。基準値としては、通常10-7〜10-5程度の値を想定している。また、特定の種別の故障についての不稼働率を評価する場合には、他の種別の故障についての不稼働率の算出結果を基準として設定し、上記と同様の比較を実施することも可能である。
このとき、不稼働率評価部32は、予備系となる構成要素数を1つ追加し、冗長化構成を(n+2)冗長化構成に設定する。手順1に戻り、不稼働率算出部31は、(n+2)冗長化構成に対する不稼働率:Un+2を再度算出する。
再度算出した不稼働率の算出結果3について、手順2の上記の手順に戻り、不稼働率評価部32は、再度基準値: cとの比較を実施する。
上記と同様に基準値との比較を実施した結果、
Un+2 ≦ c
となり、Un+2の値が基準値を下回れば、手順2を終えて手順3に進む。
再度、基準値を上回り
Un+2 > c
となれば、再度手順2に戻り、上記の記載と同様に手順を繰り返す。
不稼働率評価部32は、不稼働率の値が基準値を下回るまで予備系となる構成要素数を追加し、本手順を繰り返す。
尚、これまでの手順については、(n+1)冗長化構成を最初に評価することを想定して実施例を記載しているが、予備系の構成要素数を一般化した、(n+m)冗長化構成を最初に評価する場合にも同様に手順を実行できる。
(手順3(ST3)) 評価結果表示
表示装置33は、手順2にて評価された結果を表示する。
表示する評価結果としては、以下のものであり、以下のすべての項目、あるいはいくつかの項目を組み合わせたものである。(実施結果の一例としては、図4参照)
不稼働率の評価結果 (予備系となる構成要素の追加配備の要否)
予備系となる構成要素の追加配備数
手順2において算出された不稼働率の値
尚、本発明の実施例としては、これまでに記載した評価手順以外の実施例として、複数のパターンがある。下記の複数の評価パターン1、2、3についても、これまでに記載した評価手順と同様の手順を用いて評価を実施することが可能である。
故障件数の削減対策の実施による効果を評価することを目的として、故障の発生時間間隔の大きさに対する不稼働率の低減効果を評価する場合、図5に示す評価パターン2を用いて不稼働率評価部32により評価を実施することが可能である。
故障時間の短縮化対策の実施による効果を評価することを目的として、故障時間の大きさに対する不稼働率の低減効果を評価する場合、図6に示す評価パターン3を用いて不稼働率評価部32により評価を実施することが可能である。
冗長化構成において、予備系の数は一定であることを条件として、運用系の数に対する不稼働率を評価することを目的として、不稼働率が一定以下となるような冗長化構成を決定するために評価する場合、図7に示す評価パターン4を用いて不稼働率評価部32により評価を実施することが可能である。この場合には、nの値を初期値から1ずつ増加させた場合に、不稼働率が基準値よりも小さくなるかどうかの比較を実施し、基準値よりも小さい場合にはnの値を1増加させ、基準値を超えた場合に、基準値よりも小さくなるようなnの値の最大値を出力する。手順については、これまでに記載している手順と同様に実行することが可能である。
以上、本実施形態は以下の点において効果がある。
一定以上の不稼働率を実現するために必要な冗長化構成における予備系の数を決定することができる。
一定以上の不稼働率を実現するために必要な冗長化構成における現用系の数を決定することができる。
一定以上の不稼働率を実現するために必要な冗長化構成における予備系や現用の数を決定する上で、最小限の予備系の数や最大限の運用系の数を決定することによって、コストの観点で最も望ましい冗長化構成を決定することができる。
一定以上の不稼働率を実現するために必要な冗長化構成における予備系や現用の数を決定する上で、故障の発生時間間隔の状況に応じて、適切な冗長化構成を決定することができる。
一定以上の不稼働率を実現するために必要な冗長化構成における予備系や現用の数を決定する上で、故障の回復に要する時間に応じて、適切な冗長化構成を決定することができる。
故障の発生時間間隔に対する不稼働率を評価することによって、冗長化構成において、一定以上の不稼働率を実現するために必要な故障件数削減の対策を検討する際の指標を与えることができる。
故障の回復に要する時間に対する不稼働率を評価することによって、冗長化構成において、一定以上の不稼働率を実現するために必要な故障時間の短縮化の対策を検討する際の指標を与えることができる。
また、ネットワークの運用管理に際して、ネットワークの運用者が所望するタイミングにおいて、所望する不稼働率を有するネットワークの提供に必要な対策や対策の要否を決定することができる。
また、ネットワークの運用前の構築や設計に際して、ネットワークの設計者が所望する不稼働率を有するネットワークを提供するために必要なネットワーク構成を決定することができる。
以下、本発明の実施形態についてまとめる。
ネットワーク評価システムは、ネットワーク装置及びサーバ装置によって構成されるネットワークの冗長化構成に関するネットワーク構成情報と、ネットワーク装置及びサーバ装置によって構成されるネットワークの構成要素における故障に関する故障情報と、をもとに、冗長化構成における故障の発生、及び故障の継続による不稼働率を算出し、不稼働率の算出結果と基準となる値との比較によって評価し、不稼働率が一定以下となるような冗長化構成を決定することによって、信頼性の高い、あるいは所望する信頼性を有するネットワーク構成の決定を自動的かつ迅速に可能にする故障確率等に基づきネットワークの信頼性を評価する。
また、ネットワーク評価システムは、複数のネットワーク構成要素によって構成される冗長化構成の信頼性を評価するネットワーク評価システムであって、ネットワークの故障データ、及びネットワークの構成情報を入力として、故障種別ごとの故障発生時間間隔の統計値と故障回復時間の統計値を算出し、これらの算出結果及び冗長化構成の構成要素数を元に冗長化構成ごとの不稼働率を算出し、算出した冗長化構成ごとの不稼働率と基準値との比較を元に不稼働率を評価し、評価結果を表示する。
なお、上記したネットワーク評価システムの算出、評価等の各処理の手順はソフトウェアによって実行することが可能である。このため、上記処理の手順を実行するプログラムをダウンロードしこのプログラムを汎用のコンピュータにインストールして実行するだけで、上記処理を容易に実現することができる。或いは、上記処理の手順を実行するプログラムを格納したコンピュータ読み取り可能な記憶媒体、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等を通じてこのプログラムを汎用のコンピュータにインストールして実行するだけで、上記処理を容易に実現することができる。
例えば、ネットワーク評価システムは、上記プログラムをダウンロードし、ダウンロードしたプログラムを記憶し、プログラムのインストールを完了することができる。また、ネットワーク評価システムは、コンピュータ読み取り可能な記憶媒体から上記プログラムを読み取り、読み取ったプログラムを記憶し、プログラムのインストールを完了することができる。これにより、ネットワーク評価システムは、インストールされた上記プログラムに基づき、上記処理を容易に実現することができる。
その他にも、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
1…ネットワーク故障情報、2…ネットワーク構成情報、3…不稼働率の算出結果、4…評価結果、11…受信及び処理部、12…ネットワーク故障情報DB、21…受信及び処理部、22…ネットワーク故障情報DB、31…不稼働率算出部、32…不稼働率評価部、33…表示装置

Claims (6)

  1. ネットワーク装置及びサーバ装置から構成されるネットワークの構成要素数に関する情報、故障発生日時に関する情報、及び故障回復日時に関する情報を入力する手段と、
    前記ネットワークの構成要素数に関する情報、故障発生日時に関する情報、及び故障回復日時に関する情報を記憶する手段と、
    これらの入力および記憶された情報をもとにして、前記ネットワークにおける故障による通信サービスへの影響を評価する手段と、を具備し、
    さらに、
    前記ネットワークにおける冗長化構成箇所の不稼働率、(N+m)冗長化構成の不稼働率、冗長化構成箇所において重複的に発生した故障による不稼働率、又は冗長化構成の予備系の数を追加した構成の不稼働率を算出する手段を具備し、
    前記評価する手段は、前記ネットワークにおける特定種別の故障による前記不稼働率と他の種別の故障による前記不稼働率の算出結果の比較によってネットワークの信頼性を評価することを特徴とするネットワーク評価システム。
  2. 前記算出する手段は、前記ネットワークにおいて発生した故障種別ごとの故障発生日時に関する情報、及び故障種別ごとの故障回復日時に関する情報を用いて通信サービスに影響する確率を算出し、
    前記評価する手段は、前記確率に基づき、前記ネットワークにおける故障による通信サービスへの影響を評価することを特徴とする請求項1に記載のネットワーク評価システム。
  3. 前記評価する手段は、前記ネットワークにおける特定種別の故障の発生時間間隔の算出結果に関する情報、特定種別の故障の発生時間間隔の統計値の算出結果に関する情報、特定種別の故障の回復に要する時間の算出結果に関する情報、又は特定種別の故障の回復に要する時間の統計値に関する情報を用いてネットワークの信頼性を評価することを特徴とする請求項2のネットワーク評価システム。
  4. 評価結果を表示する手段を具備することを特徴とする請求項1乃至の何れか一つに記載のネットワーク評価システム。
  5. 請求項1乃至の何れか一つに記載の評価を実行するネットワーク評価方法。
  6. 請求項1乃至の何れか一つに記載の評価をコンピュータに実行させるためのネットワーク評価プログラム。
JP2015021373A 2015-02-05 2015-02-05 ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム Active JP6326383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015021373A JP6326383B2 (ja) 2015-02-05 2015-02-05 ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015021373A JP6326383B2 (ja) 2015-02-05 2015-02-05 ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム

Publications (2)

Publication Number Publication Date
JP2016144189A JP2016144189A (ja) 2016-08-08
JP6326383B2 true JP6326383B2 (ja) 2018-05-16

Family

ID=56570954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015021373A Active JP6326383B2 (ja) 2015-02-05 2015-02-05 ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム

Country Status (1)

Country Link
JP (1) JP6326383B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111309582B (zh) * 2020-03-27 2023-04-07 上海海事大学 一种复杂冗余系统可靠性评估的优化方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005316636A (ja) * 2004-04-28 2005-11-10 Nippon Telegr & Teleph Corp <Ntt> 故障頻度計算式導出方法、故障頻度計算式導出装置及び故障頻度計算式導出プログラム
JP4637867B2 (ja) * 2007-02-28 2011-02-23 日本電信電話株式会社 ネットワーク評価システムおよびネットワーク評価方法ならびにそのためのプログラム
JP2009201043A (ja) * 2008-02-25 2009-09-03 Nippon Telegr & Teleph Corp <Ntt> ネットワーク管理システムおよびネットワーク管理方法ならびにそのためのプログラム
WO2014119724A1 (ja) * 2013-02-01 2014-08-07 日本電信電話株式会社 高信頼パス収容設計装置及び方法
JP2015014981A (ja) * 2013-07-08 2015-01-22 株式会社リコー 情報処理システム、機器管理装置、資産管理装置、及び情報処理方法

Also Published As

Publication number Publication date
JP2016144189A (ja) 2016-08-08

Similar Documents

Publication Publication Date Title
US11159450B2 (en) Nonintrusive dynamically-scalable network load generation
US11868237B2 (en) Intelligent services for application dependency discovery, reporting, and management tool
US11379292B2 (en) Baseline modeling for application dependency discovery, reporting, and management tool
US11966324B2 (en) Discovery crawler for application dependency discovery, reporting, and management tool
US20230401114A1 (en) Dependency analyzer in application dependency discovery, reporting, and management tool
EP3340535B1 (en) Failure recovery method and device
JP2020027615A (ja) サーバハードウェア障害の分析及びリカバリ
US7669087B1 (en) Method and apparatus for managing workload across multiple resources
JP4792047B2 (ja) システム可用性の計算方法
US11093378B2 (en) Testing agent for application dependency discovery, reporting, and management tool
JP2006079602A (ja) プロアクティブメンテナンスを有する高可用性クラスタ
CN107003926B (zh) 故障信息提供服务器、故障信息提供方法
US20110122761A1 (en) KPI Driven High Availability Method and apparatus for UMTS radio access networks
JP2014241536A (ja) 監視装置、及び監視方法
WO2016107425A1 (zh) 基于数据中心的故障分析方法和装置
GB2463343A (en) Fault diagnosis using device interdependencies and fault history for networked systems
JP5949785B2 (ja) 情報処理方法、装置及びプログラム
JP6326383B2 (ja) ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
JP2010268275A (ja) ネットワーク管理システムおよびネットワーク管理方法、ならびにそのためのプログラム
CN112703485A (zh) 使用机器学习方法支持对分布式系统内的计算环境的修改的实验评估
US20120072160A1 (en) Measure presentation device, measure presentation method, and non-transitory computer readable storage medium
Zhu Reliability and availability analysis for large networking system
JP5653322B2 (ja) 障害検出装置、ネットワーク構成推定装置および障害検出方法
JP2012150699A (ja) 故障検出装置、故障検出方法、及び、故障検出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180410

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180416

R150 Certificate of patent or registration of utility model

Ref document number: 6326383

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150