以下、添付図面を参照して本発明の実施例を説明する。以下に説明する実施例は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。各図において共通の構成については同一の参照符号が付されている。
実施例1では、ネットワーク全体を複数のエリアに分割し、現用系パス及びプロテクションパスの疎通監視、通信装置のポート障害やリンク障害の監視、及びエリア規模での通信装置障害を監視し、障害発生時に設定した伝送パスの迅速な復旧を行う例について説明する。また、通信システムがパケットトランスポートネットワークを構成する例について説明する。
図1は、実施例1におけるネットワークシステム構成の例である。実施例1のネットワークシステムは、ネットワーク管理サーバ1、通信装置n11〜n14、n21〜n24、n31〜n34、n41〜n44、及び端末TA1、TB1、を有する。端末ではなく、サーバや他の通信装置やネットワークでもよい。ネットワーク管理サーバ1が管理するネットワーク内の、通信装置、端末及びサーバを総称して、「伝送装置」又は「ノード」と称す。図1では、ネットワーク管理サーバ1は、便宜上、通信装置n32にのみ接続されているが、他の伝送装置にも接続される。
図2A及び2Bは、実施例1におけるエリア分割の例を示す。図2Aは、ネットワーク全体をエリアに分割した後の構成を示している。図2Bは、エリアの分割方式を示している。図2Bが示すように、エリア分割は、ネットワーク全体に対する外周線201をはじめに構成する。その後、外周線201を1箇所、或いは0箇所のみ含むエリアを構成し、ネットワーク全体を複数のエリアに分割する。外周線201を2箇所以上含むエリアは構成しない。
図2Bにおいて、エリアDA1は外周線201を1箇所のみ含むエリアであり、エリアDA2は外周線201を0箇所のみ含むエリアである。エリアDA3は、外周線201を2箇所以上含むエリアである。外周線201を2箇所以上含むエリア構成しないことで、一つのエリアが外周線201で画定されるネットワーク全体を分断することを避け、当該ネットワーク内で復旧パスが設定できないことを確実に避ける。
エリア分割の一例は、図2Aに示した通信装置全体に対する外周線201を構成する。より具体的には、通信装置n11、n14、n21、n24、n23、n44、n43、n42、n33、n32、n31、n12を結んだ伝送路を外周線201とする。この外周線に対して、外周線上の任意の通信装置、例えば通信装置n11を選択し、通信装置n11から所定の距離以内にある通信装置をまとめてエリアを構成する。図2Aの例では、通信装置n11、n12、n13、n14がエリアA1として構成されている。
エリアA1構成後、エリアA1に属さない外周線201上の隣の通信装置n21を選択し、エリアA1を構成した方法と同様にエリアA2、3、4を構成する。外周線201上の通信装置全てをエリア分割した後、外周線201内においてエリアに分割されていない通信装置が存在する場合は、任意の通信装置を選択し、その選択した通信装置から所定の距離にある通信装置をまとめてエリアを構成し、全ての通信装置を何れかのエリアに属するように分割管理する。
図2Aの例では、通信装置n11、n12、n13、n14はエリアA1を構成し、通信装置n21、n22、n23、n24はエリアA2を構成し、通信装置n31、n32、n33、n34はエリアA3を構成し、通信装置n41、n42、n43、n44はエリアA4を構成する。
本実施例では、外周線201上において任意に選択した通信装置を起点にエリア分割するが、例えば、外周線201を2箇所以上含まない様にクラスタ分割する方法がある。また、その他の方法として、ネットワーク構成以外の構成情報、例えば電力供給源の構成を考慮し、特定の電源から構成されるエリアがネットワーク全体を分断しないようエリアを構成する分割方法もある。
図3は、実施例1における単体通信装置の障害に対する障害復旧後のネットワークシステム構成図の例である。運用開始段階において、ネットワーク管理サーバ1は、現用系の伝送パス301(端末TA1、通信装置n11、n12、n31、n32を経由して端末TB1へ接続するリンク301a〜301e)を設定する。
ネットワーク管理サーバ1は、現用系の伝送パス301に対してプロテクションパス302(端末TA1、通信装置n24、n23、n44、n43を経由して端末TB1へ接続するリンク302a〜302e)を設定する。
端末TA1は、実線で示された現用系の伝送パス301に対して、疎通があるか否かを検査用のデータを端末TB1と間で送受信することにより、常に監視する。端末TA1は、現用系の伝送パス301において、端末TB1と間での疎通がないと判断した場合は、プロテクションパス302を用いて、端末TB1への通信を継続する。すなわち、端末TA1は、障害発生前は、データを通信装置n11に送信していたが、障害を検知した後は、データを通信装置n24に対して送信するように瞬時に切り替える。
図4は、実施例1における複数通信装置の障害に対する障害復旧後のネットワークシステム構成図の例である。運用開始段階において、ネットワーク管理サーバ1は、通信装置に発生する障害の組合せを想定し、想定した組合せに対する現用系パスの復旧設定を予め算出し、各復旧設定に対して識別子(復旧面ID)を付与して、各伝送装置(通信装置及び端末)に送付する。
各伝送装置は、ネットワーク管理サーバ1から受信した復旧面IDと復旧設定の組を保持する。各伝送装置は、障害が発生している伝送パス及び発生していない伝送パスを含め、ネットワーク管理サーバ1から受信した復旧面IDが示す復旧設定を実行する。なお、本開示における面とは、伝送パスの集合体である。具体的には、現用面は、現用系として運用している伝送パスの集合であり、復旧面は、復旧用として運用する予定の伝送パスの集合である。
図4の例では、ネットワーク管理サーバ1において、復旧用の伝送パスを準備する通信装置の障害発生通信装置数(K)として3台(K=3)が設定されている。単一の装置に対する障害は、プロテクションパスにより救済されるため、単一の装置障害に対する復旧設定パスは事前算出しない。その結果、ネットワーク管理サーバ1は、2台及び3台の通信装置に障害が発生した場合について、復旧用の伝送パスを事前に算出する。
具体的には、ネットワーク管理サーバ1は、16台の通信装置に対して、何れかの2台の通信装置に障害が発生した場合の現用系パスに対する復旧パス集合の設定(復旧面)を事前に算出し、復旧面毎にIDを付与して管理する。
また、ネットワーク管理サーバ1は、16台の通信装置に対して、何れかの3台の通信装置に障害が発生した場合の現用系パスに対する復旧パスの設定(復旧面)を事前に算出し、復旧面毎に復旧面IDを付与して管理する。その後、ネットワーク管理サーバ1は、各障害発生パターンに対する復旧パスの設定(復旧面)と復旧面IDとを、各伝送装置(通信装置及び端末)へ事前に送付しておく。
複数の通信装置に同時に障害が発生する確率は、同時に障害が発生する通信装置が多いほど低いと想定される。一方、単一の通信装置に対する障害は、プロテクションパスにより救済される。したがって、ネットワーク管理サーバ1は、同時での障害発生頻度の高い、K個までの通信装置障害に対する復旧設定を事前に算出、及び各伝送装置へ送付しておく。
図4の例では、運用開始段階において、ネットワーク管理サーバ1は、現用系の伝送パス301(端末TA1、通信装置n11、n12、n31、n32を経由して端末TB1へ接続するリンク301a〜301e)を設定する。また、ネットワーク管理サーバ1は、現用系の伝送パス301に対してプロテクションパス302(端末TA1、通信装置n24、n23、n44、n43を経由して端末TB1へ接続するリンク302a〜302e)を設定する。
さらに、ネットワーク管理サーバ1は、3台の通信装置に同時に障害が発生した場合の一つのパス(通信装置単位単位面切替パス)として、通信装置n12、n23、n31に障害が同時に発生した場合の復旧パス401(端末TA1、通信装置n11、n14、n13、n34、n33、n32を経由して端末TB1へ接続するリンク401a〜401g)を算出する。
さらに、ネットワーク管理サーバ1は、復旧パス401に復旧面ID(例えば図12における復旧面2340)を付与し、各伝送装置(端末TA1、通信装置n11、n14、n13、n34、n33、n32、端末TB1)へ送付しておく。
ネットワーク管理サーバ1は、通信装置n12、n23、n31における障害発生を、他の正常な通信装置から受信し検出すると、復旧に関係する伝送装置、つまり、端末TA1、通信装置n11、n14、n13、n34、n33、n32、及び端末TB1に対して、復旧面2340の設定により伝送パスの復旧を実行するよう指示する。
ネットワーク管理サーバ1からの復旧面2340の設定利用を受信した伝送装置、つまり、端末TA1、通信装置n11、n14、n13、n34、n33、n32、及び端末TB1は、復旧面2340の設定を利用して伝送パスの復旧を実行する。
以上説明したように、ネットワーク管理サーバ1は通信装置単位に障害監視を行い、想定数以内において通信装置に障害が発生した場合は、通信装置単位の障害に対する復旧面を選択し、その識別IDを復旧に必要な伝送装置へ通知する。これにより、迅速に障害から復旧することが可能となる。
図5は、実施例1におけるエリア単位の障害に対する復旧後のネットワークシステム構成図の例である。図4では、通信装置単位の障害に対する復旧方式について説明したが、図5では、エリア規模での障害に対する復旧方式について説明する。例えば、大地震等の災害では、同時に複数の通信装置に障害が発生するケースが想定される。そのような場合は、比較的通信装置間の距離が近い、或いは利用している電源の供給源が同じといったような何らかの相関の強い複数の装置に同時に障害が発生する可能性が高い。
そのような場合は、ネットワーク管理サーバ1は、ネットワーク全体に対して相関の強い通信装置をグループ化して管理したエリア単位で障害発生の有無を監視する。また、ネットワーク管理サーバ1は、エリア単位で発生する障害発生パターンに対する復旧設定を事前に算出し、復旧面IDとともに事前に各伝送装置へ送付しておく。復旧設定に含まれる伝送装置は、障害発生エリア以外のエリアから選択される。
図5の例では、ネットワーク管理サーバ1において、エリア単位障害に対する復旧用の伝送パスを準備する通信装置の障害発生通信装置数(K+1)として、4台以上(K=3)が設定されている。
具体的には、ネットワーク管理サーバ1は、検出した障害が属するエリアを特定し、現用系パスを復旧するための設定である復旧面を選定し、障害復旧に関係する伝送装置に選択した復旧面IDを通知する。復旧面IDの通知を受信した各伝送装置は、復旧面IDにて指定された復旧設定により、現用系パスの復旧を実行する。
具体的には、ネットワーク管理サーバ1は、現用系パス及びプロテクションパスの設定のほか、2個のエリアに障害が発生した場合の一つとして、エリアA2、A3に障害が発生した場合の復旧パス501(端末TA1、通信装置n11、n14、n13、n41、n42、n43を経由して端末TB1へ接続するリンク501a〜501g)を算出する。復旧パス501の通信装置は、エリアA2、A3以外のエリアA1、A4から選択されている。
さらに、ネットワーク管理サーバ1は、復旧パス501に対して復旧面ID(例えば図13における復旧面8)を付与して、各伝送装置(端末TA1、通信装置n11、n14、n13、n41、n42、n43、及び端末TB1)に、復旧面IDへ送付しておく。
ネットワーク管理サーバ1は、通信装置n22、n23、n31、n34に対する障害発生を、他の正常な通信装置から受信し検出すると、障害の発生している通信装置が属するエリアA2、A3に障害が発生したと判定する。ネットワーク管理サーバ1は、復旧に関係する伝送装置(端末TA1、通信装置n11、n14、n13、n41、n42、n43、TB1)に対して、復旧面8の設定により伝送パスの復旧を実行するよう指示する。
ネットワーク管理サーバ1からの復旧面8の設定利用を受信した伝送装置(端末TA1、通信装置n11、n14、n13、n41、n42、n43、及び端末TB1)は、復旧面8の設定を利用して伝送パスの復旧を実行する。
以上説明したように、ネットワーク管理サーバ1において通信装置単位及びエリア単位で障害監視を行い、想定数より多くの通信装置に障害が発生した場合は、エリア単位の障害に対する復旧面を選択し、その識別IDを復旧に必要な伝送装置へ通知することにより、迅速に障害から復旧することが可能となる。さらに、障害をエリア単位で管理することで、予め用意しておくべき復旧面の数を低減し、復旧面を用意するための処理及びそれらを保持する記録リソースを低減できる。
なお、本実施例では、全てのネットワークが同一種類のネットワークでることを仮定しているが、端末と通信装置を接続するネットワークの種別が、通信装置間を接続するネットワークの種別と異なっていてもよい。例えば、通信装置間を接続するネットワークがMPLS−TP(Multi―Protocol Label Switching−Transport Profile)ネットワークであり、端末と通信装置を接続するネットワークがIP(Internet Protocol)ネットワークであるネットワーク構成でもよい。
図6は、実施例1における障害復旧設定の流れを示すシーケンス図の例である。ネットワーク管理サーバ1は、ネットワーク管理者からのエリア分割に関する入力を受け付ける(ステップS601)。エリア分割に関する入力は、例えば本実施例では、4分割を指定する。エリア数は任意であって、例えば、8分割が指定されてもよい。ネットワーク管理サーバ1は、指定された分割数に応じて、ネットワ―ク全体を分割して管理する。
ネットワーク管理サーバ1は、ネットワーク管理者から、通信装置単位における復旧面を準備する障害発生通信装置数Kに関する入力を、受け付ける(ステップS602)。本実施例では、K=3を指定しているが、その他の値でもよい。
ネットワーク管理サーバ1は、全体を構成する通信装置数に応じて閾値を決定してもよい。これにより、ネットワーク規模及び計算能力に応じて適切な数の復旧面を用意することができる。例えば、ネットワーク全体を構成する通信装置数に応じて、異なるKの設定値を予め保持してもよい。例えば、全体の通信装置数が100までであればK=4であり、100より多い場合はK=3であってもよい。
ネットワーク管理サーバ1は、ネットワーク管理者からのパス設定入力を受け付け、現用系の伝送パスを算出し、関係する伝送装置への設定を実行する(ステップS603−1〜S603−4)。さらに、ネットワーク管理サーバ1は、設定した現用系の伝送パスに対するプロテクションパスを算出し、関係する伝送装置への設定を実行する(ステップS604−1〜S604−4)。伝送パス算出は広く知られた技術であり説明を省略する。プロテクションパスが設定されると、端末TA1は、端末TB1と間の疎通確認を開始する(ステップS605)。
ネットワーク管理サーバ1は、通信装置全体に対して、2装置、及び3装置に対する障害発生を想定し、復旧用の伝送パスを事前に算出する(ステップS606)。また、ネットワーク管理サーバ1は、関係する伝送装置へ算出した復旧用のパス設定と復旧面IDを通知する。復旧面IDと復旧用の伝送パス設定を受信した各伝送装置は、蓄積保持する。(ステップS607−1〜S607−6)。
ネットワーク管理サーバ1は、エリア単位に障害発生を想定した復旧用の伝送パスを事前に算出する(ステップS608)。ネットワーク管理サーバ1は、関係する伝送装置へ算出した復旧用のパス設定と復旧面IDを通知する。復旧面IDと復旧用の伝送パス設定を受信した各伝送装置は、蓄積保持する。(ステップS609−1〜S609−6)。その後、端末TA1は、エリアA1及び3内の通信装置を経由して、端末TB1までデータを伝送する(ステップS610−1〜610−3)。
図7は、実施例1における、単体通信装置で発生した障害の復旧処理の流れを示すシーケンス図の例である。端末TA1は、エリアA1及びA3内の通信装置を経由して、端末TB1までデータを伝送する(ステップS701−1〜701−3)。通信装置n12に障害が発生する(ステップS702)。エリアA1内の通信装置n12に障害が発生すると現用系のパスが疎通しなくなり、端末TA1は疎通断を検出する(ステップS703)。端末TA1は、現用系パスの疎通断を検出すると、瞬時(50ミリ秒以内)にプロテクションパスの利用に切り替える(ステップS704)。
通信装置n12に障害が発生した場合、隣接装置であるエリアA1内の通信装置n11が、通信装置n12の障害を検出して、障害の発生通知をネットワーク管理サーバ1へ送信する(ステップS705)。ネットワーク管理サーバ1は、障害の発生通知を受信すると、所定時間、例えば3秒間、連続して受信する障害通知の蓄積を開始する(ステップS706)。
端末TA1は、プロテクションパスにより現用系パスの復旧を完了すると、障害復旧したことをネットワーク管理サーバ1に通知する(ステップS707)。さらに、端末TA1は、プロテクションパスを用いてデータを端末TB1へ送信する(ステップS708−1〜S708−3)。
ネットワーク管理サーバ1は、障害の復旧通知を受信すると、障害の復旧を確認し、復旧通知を蓄積保持する(ステップS709)。また、ネットワーク管理サーバ1は、障害発生の通知を受信してから所定の時間が経過すると、同時に発生したと想定される障害の発生通知の蓄積を終了する(ステップS710)。ネットワーク管理サーバ1は、現用系パスの不通をプロテクションパスにて復旧した履歴を蓄積保持する(ステップS711)。
図8は、実施例1における、複数通信装置で発生した障害の復旧処理の流れを示すシーケンス図の例である。端末TA1は、エリアA1及びA3内の通信装置を経由して、端末TB1までデータを伝送する(ステップS801−1〜801−3)。エリアA1、A2及びA3において、通信装置n12、n23、n31に障害が発生する(ステップS802−1〜S802−3)。通信装置n12、n23、n31に障害が発生すると現用系のパスが疎通しなくなり、端末TA1は疎通断を検出する(ステップS803)。
本実施例では、プロテクションパスの通信装置にも障害が発生しており、プロテクションパスによる復旧は実行されない。通信装置n12に障害が発生した場合、隣接装置であるエリアA1内の通信装置n11が、通信装置n12の障害を検出して、障害の発生通知をネットワーク管理サーバ1へ送信する(ステップS804−1)。
同様に、通信装置n23、n31に障害が発生した場合、エリアA2、A3の隣接装置が通信装置n23、n31の障害を検出して、障害の発生通知をネットワーク管理サーバ1へ送信する(ステップS804−2〜ステップS804−3)。ネットワーク管理サーバ1は、障害の発生通知(ステップS804−1)を受信すると、所定時間、例えば3秒間、連続して発生する障害通知の蓄積を開始する(ステップS805)。
端末TA1は、プロテクションパスによる復旧が不可であることを確認し、当該情報を蓄積保持する(ステップS806)。また、端末TA1は、プロテクションパスによる復旧が不可であることをネットワーク管理サーバ1へ通知する(ステップS807)。
ネットワーク管理サーバ1は、障害発生の通知を受信してから所定の時間が経過すると、同時に発生したと想定される障害の発生通知の蓄積を終了する(ステップS808)。ネットワーク管理サーバ1は、蓄積保持した通信装置障害の個数とエリア内の位置を確認する(ステップS809)。本実施例では、障害の発生した通信装置数は3であり、通信装置単位の復旧面切り替えを起動する(ステップS810)。
ネットワーク管理サーバ1は、当該障害発生伝送パスと障害が発生した通信装置n12、n23、n31の組とのペアに対して予め設定されている復旧面の情報(例えば図12における復旧面2340)を取得する。ネットワーク管理サーバ1は、復旧に関係する伝送装置(通信装置n11、n14、n13、n34、n33、n32、端末TB1、TA1)に対して、復旧面2340の復旧パスを利用して障害復旧することを通知する(ステップS811−1〜S811−6)。
端末TA1は、復旧面2340の復旧パスを用いてデータを端末TB1へ送信する(ステップS812−1〜S812−4)。端末TA1は、端末TB1と間の疎通があることを確認する(ステップS813)。さらに、端末TA1は、端末TB1との障害伝送パスが復旧したことをネットワーク管理サーバ1に通知する(ステップS814)。
ネットワーク管理サーバ1は、端末TA1及び他の端末からの通知を参照して、復旧していない伝送パスの有無を確認する。復旧していない伝送パスが存在する場合、ネットワーク管理サーバ1は、復旧してない伝送パスのために、伝送経路の再計算により復旧を試みる(ステップS815)。また、ネットワーク管理サーバ1は、障害復旧した後の伝送パスが、現在の現用系パスであることを示す情報を管理、蓄積保持する(ステップS816)。
図9は、実施例1におけるエリア単位の障害の復旧処理の流れを示すシーケンス図の例である。端末TA1は、エリアA1及び3内の通信装置を経由して、端末TB1までデータを伝送する(ステップS901−1〜901−3)。通信装置n22、n23、n31、n34に障害が発生する(ステップS902−1〜S902−2)。
通信装置n22、n23、n31、n34に障害が発生すると、現用系のパスが疎通しなくなり、端末TA1は疎通断を検出する(ステップS903)。本実施例では、プロテクションパスの通信装置にも障害が発生しており、プロテクションパスによる復旧は実行されない。
通信装置n22に障害が発生した場合、隣接装置であるエリアA2内の通信装置n21が通信装置n22の障害を検出して、障害の発生通知をネットワーク管理サーバ1へ送信する(ステップS904−1)。同様に、通信装置n23、n31、n34に障害が発生した場合、エリアA2、A3における隣接装置が、通信装置n23、n31、n34の障害を検出して、障害の発生通知をネットワーク管理サーバ1へ送信する(ステップS904−2〜ステップS904−4)。
ネットワーク管理サーバ1は、障害の発生通知(ステップS904−1)を受信すると、所定時間、例えば3秒間、連続して発生する障害の発生通知の蓄積を開始する(ステップS905)。端末TA1は、プロテクションパスによる復旧が不可であることを確認し、当該情報を蓄積保持する(ステップS906)。
また、端末TA1は、プロテクションパスによる復旧が不可であることをネットワーク管理サーバ1へ通知する(ステップS907)。ネットワーク管理サーバ1は、障害発生通知を受信してから所定の時間が経過すると、同時に発生したと想定される障害の発生通知の蓄積を終了する(ステップS908)。ネットワーク管理サーバ1は、蓄積保持した通信装置障害の個数とエリア内の位置を確認する(ステップS909)。
本実施例では、障害の発生した通信装置数は4(K=3より大きい)であり、ネットワーク管理サーバ1は、エリア単位の復旧面切り替えを起動する(ステップS910)。ネットワーク管理サーバ1は、当該障害発生伝送パスと障害が発生したエリアA2、A3の組とのペアに対して予め設定されている復旧面の情報(例えば図13における復旧面8)を取得する。
ネットワーク管理サーバ1は、復旧に関係する伝送装置(通信装置n11、n14、n13、n41、n42、n43、端末TB1、TA1)に対して復旧面8の復旧パスを利用して障害復旧することを通知する(ステップS911−1〜S911−6)。
端末TA1は、復旧面8の復旧パスを用いてデータを端末TB1へ送信する(ステップS912−1〜S912−4)。端末TA1は、端末TB1と間の疎通があることを確認する(ステップS913)。さらに、端末TA1は、端末TB1と間の通信障害が復旧したことをネットワーク管理サーバ1に通知する(ステップS914)。
ネットワーク管理サーバ1は、端末TA1及び他の端末からの通知を参照して、復旧していない伝送パスの有無を確認する。復旧していない伝送パスが存在する場合、ネットワーク管理サーバ1は、復旧してない伝送パスのために、伝送経路の再計算により復旧を試みる(ステップS915)。また、ネットワーク管理サーバ1は、障害復旧した後の伝送パスが、現在の現用系パスであることを示す情報を管理、蓄積保持する(ステップS916)。
図10は、ネットワーク管理サーバ1が保持する、現用系のパス設定及びプロテクションパスの設定を示すテーブルの例である。図10に示されるように、プロテクションパスの設定は、障害パターン1001、復旧面ID1002、パスID1003、及び復旧設定(経由する装置リスト)1004とから構成され、管理される。障害パターン1001において、障害が発生していない状況1010は、現用系のパス設定を意味している。
現用系の普及面IDは、0である。図10の例では、復旧面0には、伝送パスP1のみが登録されている。伝送パスP1は、端末TA1から通信装置n11、n12、n31、n32を経由して端末TB1に到達する経路である。
一方、現用系の伝送パスP1に障害が発生した場合1011のプロテクションパスでは、復旧面IDが伝送パス毎に管理され、伝送パスP1に対するプロテクションパス(復旧面ID)がP1Pで管理されている。伝送パスP1Pは、端末TA1から通信装置n24、n23、n44、n43を経由して端末TB1に到達する経路である。なお、伝送パスP1を参照して片方向の伝送パス設定について説明したが、端末TA1、TB1間の逆方向の伝送パス設定についても同様に管理される。
図11は、ネットワーク管理サーバ1が保持する、2台の通信装置障害に対する現用系のパスを復旧するパス設定を示すテーブルの例である。2台の通信装置障害に対する復旧パス設定は、図10同様に障害パターン1001、復旧面ID1002、パスID1003、及び復旧設定(経由する装置リスト)1004から構成され、管理される。障害パターン1010は、現用系の伝送パス設定を示しており、図10と同一の内容である。
図11に示されるように、通信装置n11とn12に障害が発生している場合1101の復旧設定は、復旧面ID=1001で管理され、現在のところ伝送パスP1が、プロテクションにより復旧されることを示している。同様に、通信装置n11とn13に障害が発生している場合1102の復旧設定は、復旧面ID=1002で管理され、現在のところ伝送パスP1が、プロテクションパスにより復旧されることを示している。
通信装置n12とn23に障害が発生している場合1103の復旧設定は、復旧面ID=1050で管理され、現在のところ、伝送パスP1が、端末TA1から通信装置n11、n14、n13、n34、n31、n32を経由して端末TB1に到達する経路により復旧されることを示している。最後に、全通信装置に障害が発生している場合1104の復旧設定は、復旧面ID=1119で管理され、現在のところ伝送パスP1の復旧が不可でることを示している。
図12は、ネットワーク管理サーバ1が保持する、3台の通信装置障害に対する現用系パスを復旧するパス設定を示すテーブルの例である。3台の通信装置障害に対する復旧パス設定は、図10同様に障害パターン1001、復旧面ID1002、パスID1003、及び復旧設定(経由する装置リスト)1004から構成され、管理される。障害パターン1010は、現用系の伝送パス設定を示しており、図10と同一の内容である。
図12に示されるように、通信装置n11、n12、及びn13に障害が発生している場合1201の復旧設定は、復旧面ID=2001で管理され、現在のところ伝送パスP1が、プロテクションパスにより復旧されることを示している。同様に、通信装置n11、n12、及びとn14に障害が発生している場合1202の復旧設定は、復旧面ID=2002で管理され、現在のところ伝送パスP1が、プロテクションパスにより復旧されることを示している。
通信装置n12、n23、及びn31に障害が発生している場合1203の復旧設定は、復旧面ID=2340で管理され、現在のところ伝送パスP1が、端末TA1から通信装置n11、n14、n13、n34、n33、n32を経由して端末TB1に到達する経路により復旧されることを示している。最後に、全通信装置に障害が発生している場合1204の復旧設定は、復旧面ID=2559で管理され、現在のところ伝送パスP1が、復旧が不可でることを示している。
図13は、ネットワーク管理サーバ1が保持する、エリア規模障害に対する現用系のパスを復旧するパス設定を示すテーブルの例である。エリア単位障害に対する復旧パス設定は、図10同様に障害パターン1001、復旧面ID1002、パスID1003、及び復旧設定(経由する装置リスト)1004から構成され、管理される。障害パターン1010は、現用系の伝送パス設定を示しており、図10と同一の内容である。
図13に示されるように、エリアA1に障害が発生している場合1301の復旧設定は、復旧面ID=1で管理され、現在のところ伝送パスP1が、プロテクションパスにより復旧されることを示している。エリアA2に障害が発生している場合1302の復旧設定は、復旧面ID=2で管理され、現在のところ伝送パスP1に対しては影響がないため、現用系の設定で良いことを示している。
一方、エリアA2と3に障害が発生している場合1303の復旧設定は、復旧面ID=8で管理され、現在のところ伝送パスP1が、端末TA1から通信装置n11、n14、n13、n41、n42、n43を経由して端末TB1に到達する経路により復旧されることを示している。最後に、全エリアに障害が発生している場合1304の復旧設定は、は、復旧面ID=15で管理され、現在のところ伝送パスP1の復旧が不可でることを示している。
図14は、ネットワーク管理サーバ1が保持する、通信装置及び端末に対する現用系パスの設定を示すテーブルの例である。現用系伝送パス設定は、復旧面ID1401、伝送装置1402、パスID1403、第1の接続先1404、及び第2の接続先1405とから構成され、管理される。
例えば、端末TA1(1411)は、現用系パスP1において、通信装置n11へデータを送信する。端末TB1(1412)は、現用系パスP1において、通信装置32からデータを受信する。通信装置n11(1413)は、現用系パスP1において、端末TA1からデータを受信し、通信装置n12へデータを送信する。通信装置n12(1414)、n31(1415)、及びn32(1416)に対しても、データの受信先と送信先が管理される。
図15は、ネットワーク管理サーバ1が保持する、通信装置及び端末に対するプロテクションパス用の伝送パス設定を示すテーブルの例である。プロテクションパス設定は、図14と同様に、復旧面ID1401、伝送装置1402、パスID1403、第1の接続先1404、及び第2の接続先1405から構成され、管理される。
例えば、端末TA1(1511)は、伝送パスP1において、通信装置n24へデータを送信する。端末TB1(1512)は、伝送パスP1において、通信装置43からデータを受信する。通信装置n23(1513)は、伝送パスP1において、通信装置n24からデータを受信し、通信装置n44へデータを送信する。同様に、通信装置n24(1514)、n43(1515)、及びn44(1516)に対しても、データの受信先と送信先が管理される。
図16は、ネットワーク管理サーバ1が保持する、通信装置n12、n23、n31の障害に対する、通信装置及び端末における復旧用のパス設定を示すテーブルの例である。複数の通信装置に障害が発生した場合の復旧用パス設定は、図14と同様に、復旧面ID1401、伝送装置1402、パスID1403、第1の接続先1404、及び第2の接続先1405から構成され、管理される。
例えば、復旧面2340において、端末TA1(1611)は、伝送パスP1において通信装置n11へデータを送信する。端末TB1(1612)は、伝送パスP1において通信装置32からデータを受信する。通信装置n11(1613)は、伝送パスP1において、端末TA1からデータを受信し、通信装置n14へデータを送信する。同様に、通信装置n13(1614)、n14(1615)、n32(1616)、n33(1617)、及びn34(1618)についても、データの受信先と送信先が管理される。
図17は、ネットワーク管理サーバ1が保持する、エリアA2、A3の障害に対する通信装置及び端末における復旧用のパス設定を示すテーブルの例である。エリア単位に障害が発生した場合の復旧用パス設定は、図14と同様に、復旧面ID1401、伝送装置1402、パスID1403、第1の接続先1404、及び第2の接続先1405から構成され、管理される。
例えば、復旧面8において、端末TA1(1711)は、伝送パスP1において通信装置n11へデータを送信する。端末TB1(1712)は、伝送パスP1において通信装置43からデータを受信する。通信装置n11(1713)は、伝送パスP1において端末TA1からデータを受信し、通信装置n14へデータを送信する。同様に、通信装置n13(1714)、n14(1715)、n41(1716)、n42(1717)、及びn43(1718)についても、データの受信先と送信先が管理される。
図11、12、16を参照して説明した通信装置単位の復旧面に関する情報は、ネットワーク管理サーバ1が保持するノード障害復旧設定管理情報に含まれる。図13及び17を参照して説明したエリア単位の復旧面に関する情報は、ネットワーク管理サーバ1が保持するエリア障害復旧設定管理情報に含まれる。
図18A、18Bは、それぞれ、実施例1における端末TA1、TB1に設定される、現用系パス設定及び障害発生時に現用系パスを復旧する復旧パス設定を示すテーブルの例である。各伝送装置1402について、復旧用パス設定は、復旧面ID1401、パスID1403、第1の接続先1404、及び第2の接続先1405から構成され、管理される。
例えば、図18Aに示すように、端末TA1は、現用系パス設定(1811)において、伝送パスP1において通信装置n11へデータを送信する。同様に、プロテクションパス設定(1812)、復旧面2340(1813)、及び復旧面8(1814)における伝送パスP1についても、データの受信先と送信先が管理される。
また、図18Bに示すように、例えば、端末TB1は、現用系パス設定(1816)において、伝送パスP1において通信装置n32からデータを受信する。同様に、プロテクションパス設定(1817)、復旧面2340(1818)、及び復旧面8(1819)における伝送パスP1についても、データの受信先と送信先が管理される。
図19A〜19Cは、それぞれ、通信装置n11、n24、n32に設定される、現用系パス設定及び障害発生時における現用系パスを復旧する復旧パス設定を示すテーブルの例である。各伝送装置1402に対して、復旧パス設定は、図18と同様に、復旧面ID1401、パスID1403、第1の接続先1404、及び第2の接続先1405から構成され、管理される。第1の接続先1404及び第2の接続先1405は、復旧パスの経路を示す。
例えば、図19Aに示すように、通信装置n11は、現用系の伝送パス設定1911において、伝送パスP1に対しては、端末TA1からデータを受信し、通信装置n12へデータを送信する構成であることを示している。同様に、プロテクションパス設定1912、復旧面2340(1913)、及び復旧面8(1914)における伝送パスP1に対してもデータの受信先と送信先が管理される。
また、通信装置n24(図19B)では、現用系の伝送パス設定1916において、伝送パスP1に対しては、データの送受信先伝送装置が無いことを示している。プロテクションパス設定1917において、伝送パスP1に対しては、端末TA1からデータを受信し、通信装置n23へデータを送信する構成であることを示している。
同様に、復旧面2340(1918)、及び復旧面8(1919)における伝送パスP1に対してもデータの受信先と送信先が管理される。また例えば、通信装置n32(図19C)では、現用系の伝送パス設定1921において、伝送パスP1に対しては、通信装置n31からデータを受信し、端末TB1へデータを送信する構成であることを示している。
同様に、プロテクションパス設定1922、復旧面2340(1923)、及び復旧面8(1924)における伝送パスP1についても、データの受信先と送信先が管理される。
図20は、通信装置のハードウェア構成の一例を示すブロック図である。通信装置は、ネットワークインタフェース2010−1〜2010−n、スイッチ2011、テーブル管理部2012、データ転送テーブル2013、利用テーブル制御部2017、及びプロテクション管理部2018を含む。
また、データ転送テーブル2013は、現用系のパス設定を示すテーブル2014、通信装置単位の障害を復旧するための設定を示すテーブル2015、及びエリア単位の障害を復旧するための設定を示すテーブル2016とから構成される。
通信装置は、ネットワークインタフェース2010を介してパス設定のためのデータ及び復旧面の識別子(復旧面ID)を受信、及び設定した伝送パスの稼働状況を確認するデータを送受信する。
スイッチ2011は、転送用のデータを受信した場合、データ転送用のテーブル2013に従い、出力先のネットワークインタフェースへデータをスイッチする。受信したデータが、パス設定のためのデータ及び復旧のためのパス設定識別子(復旧面ID)の場合は、スイッチ2011は、テーブル管理部2012へ受信データをスイッチする。
伝送パスの稼働状況確認用のデータを受信した場合は、スイッチ2011は、プロテクション管理部2018へデータを転送する。稼働状況確認用のデータをプロテクション管理部2018から受信した場合は、スイッチ2011は、送信先識別子に従い、他の通信装置へ向けて適切なインタフェースへ稼働状況確認用のデータを転送する。
テーブル管理部2012は、受信したデータが現用系のパス設定の場合、現用系のテーブル2014の更新を行う。受信したデータが通信装置単位の障害を復旧するためのパス設定の場合、通信装置単位復旧面テーブル2015を更新し、或いは、受信したデータがエリア単位の障害を復旧するためのパス設定の場合、エリア単位復旧面テーブル2016を更新する。
受信したデータが復旧用のパス設定を示す識別子(復旧面ID)の場合、テーブル管理部2012は、利用テーブル制御部2017へ受信した復旧面IDを通知する。利用テーブル制御部2017は、テーブル管理部2012から受信した復旧面IDに従い、スイッチ2011が受信データ転送用に利用する設定情報を、復旧面IDが示す復旧面テーブル(通信装置単位復旧面テーブル2015又はエリア単位復旧面テーブル2016)から選択して、現用系テーブル2014のデータを更新する。
図21は、実施例1におけるネットワーク管理サーバ1のハードウェア構成の一例を示すブロック図である。ネットワーク管理サーバ1は、プロセッサであるCPU2191、メモリ2192、ストレージ2193、ネットワークインタフェース2194(2194−1〜2194−n)を備え、各構成はバス2190を介して互いに接続される。CPU2191は、ストレージ2193に格納された各種のプログラムをメモリ2192にロードし、プログラムを実行することで、各種機能部として動作する。
CPU2191がプログラムを実行することによってネットワーク管理サーバ1が備える機能を実現できる。メモリ2192は、CPU2191によって実行されるプログラム及び当該プログラム実行に必要なデータを格納する。ネットワークインタフェース2194−1〜2194nは、1乃至複数の外部ネットワークと接続するためのインタフェースである。
図22は、実施例1における障害復旧の全体の流れを示すシーケンス図の例である。ネットワーク管理サーバ1(CPU2191)は、ストレージ2193に格納されたプログラムをメモリ2192にロード後に実行することで、障害から復旧するための障害復旧管理プログラムの実行を開始する(ステップS2200)。ストレージ2193は、不揮発性記憶媒体を含み、プログラム及びそれらが使用するデータを非一時的に格納できる。
ネットワーク管理サーバ1は、ネットワーク管理者からの入力に従い、管理するネットワークシステム全体において複数の通信装置毎にエリアを定義し、管理するための設定を行う。
ネットワーク管理サーバ1は、エリア障害パターンを列挙し、それぞれに対して復旧面IDを付与する(ステップS2201)。本実施例は、ネットワークシステムを4個のエリアに分割して管理し、全部で16通りのエリア障害パターンのそれぞれに識別子を付与する。なお、本実施例は、ネットワーク管理者からの入力にしたがって、通信装置の区分けであるエリアを自動的に定義するが、エリアの区分けが予めデータベースに格納されていてもよい。
次に、ネットワーク管理サーバ1は、通信装置単位での障害に対して事前に算出準備した復旧用のパス設定を利用するための、通信装置障害数(値K)を、ネットワーク管理者からの入力に従い設定する(ステップS2202)。本実施例では、Kの値が3に設定されるが、その他の値でも良い。例えば、ネットワークを構成する通信装置の全数が100台以内であればKの値として3を設定し、100台より多い場合はKの値として2を設定するような制御でもよい。
ネットワーク管理サーバ1は、図3及び図10において説明した、現用系の伝送パスを算出して、関係する通信装置に対して設定する(ステップS2203)。次に、ネットワーク管理サーバ1は、図3及び図10において説明した、プロテクションパスを算出して、関係する通信装置に対して設定する(ステップS2204)。なお、ネットワーク管理サーバ1は、極力現用系の伝送パスと異なる経路のプロテクションパスを算出、設定する。
ネットワーク管理サーバ1は、図11及び図12において説明した、通信装置として任意の2台及び3台に障害が発生した場合を想定した伝送パスの復旧設定を算出し、関係する通信装置に設定する(ステップS2205)。
ネットワーク管理サーバ1は、図13において説明した、発生可能性のあるエリア単位の障害パターンに対する伝送パスの復旧設定を算出し、関係する通信装置に設定する(ステップS2206)。
ネットワーク管理サーバ1は、管理しているネットワークに障害が発生しているか否かを監視し、通信装置の障害通知を受信すると、所定時間、例えば3秒間、発生している通信装置障害について障害通知を蓄積したか否か判定する(ステップS2207)。ステップS2207の判定結果がNoである場合、ステップS2207を継続する。
ステップS2207の判定結果がYesである場合、ネットワーク管理サーバ1は、プロテクション機能により現用系の伝送パスが復旧しているか否かを判定する(ステップS2208)。
ステップS2208において、現用系の伝送パスがプロテクション機能により復旧していると判定された場合は、ネットワーク管理サーバ1は、その変更後の経路を現在運用中の伝送パスとして管理する(ステップS2209)。プロテクションパスを優先して使用することでリソース利用効率を高める。
ステップS2208において、現用系の伝送パスがプロテクション機能により復旧していないと判定した場合、ネットワーク管理サーバ1は、設定されている所定数(K=3)以内の通信装置対する障害発生かを判定する(ステップS2210)。
ステップS2210の判定結果がYesである場合、ネットワーク管理サーバ1は、ステップS2205にて準備した通信装置単位での復旧設定から適切な復旧設定を選択し、その復旧面IDを復旧に関係する伝送装置(通信装置及び端末)に対して通知する(ステップS2211)。復旧面IDの通知を受信した伝送装置は、その復旧面IDにて指定された復旧設定に従い、伝送パスの復旧を実行する。
ステップS2211の後、ネットワーク管理サーバ1は、端末からの通知を参照して、ステップS2211の処理により救済されていない伝送パスがあるか否かを判定する(ステップS2212)。救済されていない伝送パスが存在しない場合(S2212:No)、ネットワーク管理サーバ1は、ステップS2207に戻る。
ステップS2212の判定において、救済されていない伝送パスが有ると判定した場合(ステップS2212:Yes)、ネットワーク管理サーバ1は、復旧用の伝送経路を新たに算出して復旧の設定を実行し、復旧設定された伝送パスを現用系として管理する(ステップS2213)。
ステップS2210の判定において、設定した数(K=3)より多くの通信装置で障害が発生していると判定した場合は、発生している通信装置障害の件数と障害が発生しているエリアを特定する(ステップS2214)。
次に、ネットワーク管理サーバ1は、ステップS2206にて準備したエリア単位での復旧設定から適切な復旧設定を選択し、その復旧面IDを復旧に関係する伝送装置(通信装置及び端末)に対して通知する(ステップS2215)。
ステップS2211及びS2215において、予め設定されている復旧IDにより、復旧に必要な伝送装置(通信装置及び端末)へ復旧設定を指示することにより、迅速に障害から復旧することが可能となる。
図23は、通信装置単位の障害に対して、現用系パスを復旧するパス算出を説明するフローチャートの例である。図23は、図22にて説明したステップS2205をより詳細に説明する図である。ステップS2205は、具体的には、図23に示したステップS2300からステップS2311を実行する。
ネットワーク管理サーバ1は、通信装置障害パターン毎の復旧面の算出を開始する(ステップS2300)。ネットワーク管理サーバ1は、図22のステップS2202にて設定した通信装置単位での障害に対応する台数(2〜K=3の数)それぞれの通信装置組み合わせ対応する復旧面(パス未設定)のIDを設定する(ステップS2301)。本実施例は、障害発生が想定される、2台の通信装置の組み合わせそれぞれ及び3台の通信装置の組み合わせそれぞれに対して、現用系パスの復旧設定(復旧面)を事前に算出する。
ネットワーク管理サーバ1は、通信装置障害パターンに対応する復旧面において、復旧パスが未設定である復旧面を一つ選択する(ステップS2302)。ネットワーク管理サーバ1は、選択した復旧面において、復旧パスが未設定である現用系の伝送パスを一つ選択する(ステップS2303)。例えば、ネットワーク管理サーバ1は、パスが必要とする帯域幅の大きい順で伝送パスを選択する。その他の方法は、例えばサービス契約に基づいた優先度等を利用する。
ネットワーク管理サーバ1は、選択した現用系の伝送パスに対する復旧パスを算出する(ステップS2304)。復旧パスの算出は、障害発生を想定している通信装置を通過せず、必要とする帯域を確保可能であり、かつ最短ホップ数の伝送パスを算出する。
ネットワーク管理サーバ1は、ステップS2304において復旧用の伝送パスが算出できたか否かを判定する(ステップS2305)。ステップS2305の判定結果がNoである場合、ネットワーク管理サーバ1は、復旧パスの算出不可を表示し(ステップS2306)、ステップS2308に戻る。
ステップS2305の判定結果がYesである場合、ネットワーク管理サーバ1は、算出した伝送パスを復旧用の伝送パスとしてデータベースに保持する(ステップS2307)。ネットワーク管理サーバ1は、現用系の全ての伝送パスに対する復旧パスを探索したか否かを判定する(ステップS2308)。
ステップS2308の判定結果がNoである場合、ネットワーク管理サーバ1は、ステップS2303に戻る。ステップS2308の判定結果がYesである場合、ネットワーク管理サーバ1は、想定した通信装置障害に対する全ての復旧面に対して復旧パス探索を完了したか否かを判定する(ステップS2309)。
ステップS2309の判定結果がNoである場合、ネットワーク管理サーバ1は、ステップS2302に戻る。ステップS2309の判定結果がYesである場合、ネットワーク管理サーバ1は、算出した復旧面の設定情報を各伝送装置(通信装置及び端末)に対して通知する(ステップS2310)。
ステップS2310の後、ネットワーク管理サーバ1は、通信装置障害に対する復旧面の伝送経路算出と各伝送装置への設定処理を終了する(ステップS2311)。
図24は、エリア単位の障害に対して、現用系パスを復旧するパス算出を説明するフローチャートの例である。図24は、図22にて説明したステップS2206をより詳細に説明する図である。ステップS2206は、具体的には、図24に示したステップS2400からステップS2410を実行する。
ネットワーク管理サーバ1は、エリア障害パターン毎の復旧面の算出を開始する(ステップS2400)。ネットワーク管理サーバ1は、図22のステップS2201にて設定したエリア分割数に従い、エリア単位障害パターンそれぞれに対応すべき復旧面のIDを設定する(ステップS2401)。本実施例は、分割して4エリアに対して想定される障害発生パターン全てに対して、現用系パスの復旧設定(復旧面)を事前に算出する。
ステップ2401に続いて、ネットワーク管理サーバ1は、エリア単位障害パターンに対応する復旧面おいて、復旧パスが未設定である復旧面を一つ選択する(ステップS2402)。
ネットワーク管理サーバ1は、選択した復旧面において、復旧パスが未設定である現用系の伝送パスを一つ選択する(ステップS2403)復旧パスの算出は、障害発生を想定している通信装置を通過せず、必要とする帯域を確保可能であり、かつ最短ホップ数の伝送パスを算出する。
ネットワーク管理サーバ1は、選択した現用系の伝送パスに対する復旧パスを算出する(ステップS2404)。復旧パスの算出は、障害発生を想定しているエリアを通過せず、必要とする帯域を確保可能であり、かつ最短ホップ数の伝送パスを算出する。
ネットワーク管理サーバ1は、ステップS2404において復旧用の伝送パスが算出できたか否かを判定する(ステップS2405)。ステップS2405の判定結果がNoである場合、ネットワーク管理サーバ1は、復旧パスの算出不可を表示し(ステップS2406)、ステップS2408に戻る。
ステップS2405の判定結果がYesである場合、ネットワーク管理サーバ1は、算出した伝送パスを復旧用の伝送パスとしてデータベースに保持する(ステップS2407)。ネットワーク管理サーバ1は、現用系の全ての伝送パスに対する復旧パスを探索したか否かを判定する(ステップS2408)。
ステップS2408の判定結果がNoである場合、ネットワーク管理サーバ1は、ステップS2403に戻る。ステップS2408の判定結果がYesである場合、ネットワーク管理サーバ1は、想定したエリア障害に対する全ての復旧面に対して復旧パス探索を完了したか否かを判定する(ステップS2409)。
ステップS2409の判定結果がNoである場合、ネットワーク管理サーバ1は、ステップS2402に戻る。ステップS2409の判定結果がYesである場合、ネットワーク管理サーバ1は、算出した復旧面の設定情報を各伝送装置(通信装置及び端末)に対して通知する(ステップS2410)。ステップS2410の後、ネットワーク管理サーバ1は、エリア障害に対する復旧面の伝送経路算出と各伝送装置への設定処理を終了する(ステップS2411)。
以上説明したように、ネットワーク管理サーバ1は、通信装置単位で発生する障害のパターンに対する復旧設定と、エリア単位で発生する障害のパターンに対する復旧設定を事前に算出し、各通信装置及び各エリアの障害監視を行う。
予め設定した台数までの通信装置に対する障害発生の場合は、ネットワーク管理サーバ1は、通信装置単位の障害に対する復旧面を選択する。予め設定した台数より多くの通信装置に対する障害発生の場合は、ネットワーク管理サーバ1は、エリア単位の障害に対する復旧面を選択する。ネットワーク管理サーバ1は、選択された復旧面のIDを復旧に必要な伝送装置へ通知する。
以上により、ネットワークシステムで発生する異なる規模の障害に対して復旧までの時間を短縮できると共に、リソースの利用効率を高めつつ、復旧設定の準備のための処理及び記憶リソースを低減できる。
具体的には、障害の発生している通信装置の台数が少ない場合は、通信装置単位の障害に対して事前準備した復旧面を利用して障害復旧するため、リソース利用効率の良い障害復旧が可能である。また、障害の発生している通信装置の台数が多数の場合は、複数の通信装置をまとめたエリア単位に対する障害発生に対する復旧面準備することで、準備すべき復旧面数を削減できる。
なお、本実施例は、通信装置に対する障害発生について説明したが、ポート単位又はリンク単位で障害パターンに対する復旧面を設定してもよい。複数のプロテクションパスが用意されていてもよい。