JP4491167B2

JP4491167B2 - 通信システムにおける管理装置のバックアップシステム

Info

Publication number: JP4491167B2
Application number: JP2001132510A
Authority: JP
Inventors: 健一桑子; 光伸吉田; 秀樹嶽; 英一 ▲高▼田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-04-27
Filing date: 2001-04-27
Publication date: 2010-06-30
Anticipated expiration: 2021-04-27
Also published as: US20020162044A1; US6792558B2; JP2002330132A

Description

【０００１】
【発明の属する技術分野】
本発明は、通信装置(network element：ＮＥ)を管理する複数の管理装置(Operation System：ＯｐＳ)がネットワークを通じて相互に接続された通信システムにおける管理装置のバックアップシステムに関する。
【０００２】
【従来の技術】
従来、少なくとも１つの通信装置(ＮＥ)と、ＮＥを管理する複数の管理装置(ＯｐＳ)とがネットワークを通じて相互に接続された通信システムがある。この通信システムでは、ＯｐＳ自体の正常性を監視するために、以下の方法が採用されている。
(１)ＯｐＳを監視する上位ＯｐＳ(ホストＯｐＳ)を通信システムに設置
(２)ＯｐＳ間で相互に監視
上記した方法(１)又は(２)が採用されることによって、通信システム中の或るＯｐＳが故障した場合には、ホストＯｐＳ又は他のＯｐＳが故障したＯｐＳに代わってＮＥを管理する。これによって、通信システムが安定的に運用される。
【０００３】
【発明が解決しようとする課題】
しかしながら、従来技術では以下の問題があった。方法(１)が採用される場合には、ホストＯｐＳ及び他の装置を通信システムに設置しなければならないので、通信システムの運用コストが増大する。また、方法(２)が採用される場合には、ＯｐＳの負荷が上昇することによってＯｐＳのパフォーマンスが低下する。
【０００４】
本発明の目的は、通信装置と複数の管理装置とを含む通信システムにおいて、管理装置を監視する装置をさらに設ける必要がなく、且つ管理装置の負荷上昇を抑えることができる通信システムにおける管理装置のバックアップシステムを提供することである。
【０００５】
【発明を解決するための手段】
本発明は、上述した目的を達成するため以下の構成を採用する。
【０００６】
即ち、本発明による通信システムにおける管理装置のバックアップシステムは、少なくとも１つの通信装置を夫々管理する複数の管理装置がネットワークを通じて相互に接続され、
前記各通信装置は、自身を管理する管理装置を監視し、この管理装置の異常を検出したときに、この管理装置が自身を含む複数の通信装置を管理している場合には、これらの複数の通信装置を代表する代表通信装置を決定し、
前記代表通信装置は、前記異常が検出された管理装置に代わって前記複数の通信装置を管理する代替管理装置を複数の他の管理装置の中から選択し、選択した代替管理装置に前記複数の通信装置の管理要求を送信し、
前記複数の通信装置は、前記管理要求が送信された後、前記代替管理装置の管理下に参入し、
前記各管理装置は、前記管理要求を受信した場合に、前記代替管理装置として、前記複数の通信装置を管理する。
【０００７】
本発明は、各管理装置が、
前記複数の管理装置に夫々対応する複数のデータベースを有し、
自身の管理対象の通信装置を管理することによって得た情報を用いて自身に対応するデータベースを更新するとともにこの更新によって発生した差分情報を全ての他の管理装置に転送し、
他の管理装置から差分情報を受信した場合にこの他の管理装置に対応するデータベースを受信した差分情報を用いて更新し、
前記異常が検出された管理装置の管理対象としての前記複数の通信装置を代替管理装置として管理する場合に、これらの管理によって得た情報を用いて前記異常が検出された管理装置に対応するデータベースを更新するとともにこの更新によって生じた差分情報を全ての他の管理装置，又は前記異常が検出された管理装置を除く他の管理装置に転送するように構成するのが好ましい。
【０００８】
また、本発明は、複数の通信装置が、前記代替管理装置によって管理されている間、前記異常が検出された管理装置を監視し、前記複数の通信装置の何れかがこの管理装置の回復を検出した場合に、前記代替管理装置の管理下から離脱し、前記回復が検出された管理装置の管理下に戻るように構成するのが好ましい。
【０００９】
また、本発明は、複数の通信装置が、前記代替管理装置によって管理されている間、前記異常が検出された管理装置を夫々監視し、前記複数の通信装置の何れかがこの管理装置の回復を検出した場合に、これらの複数の通信装置を代表する第２代表通信装置を決定し、
前記第２代表通信装置は、前記回復が検出された管理装置が有する複数のデータベースの復旧処理を担当する復旧担当管理装置を前記複数の他の管理装置の中から選択し、選択した復旧担当管理装置に前記複数のデータベースの復旧要求を送信し、
前記復旧担当管理装置は、前記復旧要求を受信した場合に、自身が有する複数のデータベースの蓄積内容を前記回復が検出された管理装置に転送し、
前記回復が検出された管理装置は、前記復旧担当管理装置から前記蓄積内容を受信した場合に、この蓄積内容を用いて前記複数のデータベースを夫々更新するように構成するのが好ましい。
【００１０】
さらに、本発明は、各通信装置が、自身を管理する管理装置に監視フレームを送信し、この管理装置から監視フレームの応答フレームを受信することによってこの管理装置を監視し、前記監視フレームを送信してから所定期間が経過する前に前記応答フレームを受信せず且つ応答フレームを送信するための準備の完了を示す通知を前記管理装置から既に受信している場合にのみ、前記管理装置の異常を検出する構成とするのが好ましい。
【００１１】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態を説明する。実施形態における構成は例示であり、本発明は実施形態の構成の範囲に限定されない。
【００１２】
図１は、本発明の実施形態における通信システム１００の構成図である。通信システム１００は、複数の通信装置(ＮＥ)と、複数の管理装置(ＯｐＳ)とが通信回線Ｌ(ネットワーク)を通じて物理的に接続されることによってなり、且つ複数のブロック１,２,３,４に論理的に区切られている。
【００１３】
各ブロック１,２,３,４は、ＯｐＳと、このＯｐＳの管理下に属する少なくとも１つのＮＥとからなる論理的なグループである。例えば、ブロック１は、複数(例えば３)のＮＥ１−１,１−２,１−３及びＯｐＳ１０を備えている。ＯｐＳ１０は、複数のデータベース(ＤＢ)１１,２１,３１,４１を収容している。ブロック２,３,４はブロック１と同様の構成を夫々有し、各ブロック１,２,３,４に属するＯｐＳ及びＮＥは、同じ構成を有している。
【００１４】
各ＮＥ１−１,１−２,１−３は、通信に関する様々な処理を実行する伝送装置又は交換機である。様々な処理は、例えば、回線設定(回線制御，交換制御)，装置設定，並びにＮＥ自身及び／又は回線の障害検出である。これらの処理は、例えば、ＮＥに搭載されたプロセッサ(ＣＰＵ，ＭＰＵ等)がプログラムを実行することによって実現される。
【００１５】
ＯｐＳ１０は、ＮＥ１−１,１−２,１−３を管理(制御及び監視)する通信機能を備えた管理装置である。ＯｐＳ１０は、プロセッサ(ＣＰＵ)及びメモリを備えており、ＣＰＵがプログラムを実行することによってＮＥの管理(制御及び監視)に係る機能を実現する。ＤＢ１１は、ＮＥ１−１,１−２,１−３を制御するための情報(制御情報)を保持(格納)している。
【００１６】
図２は、ＯｐＳ１０が或るＮＥを制御するときの動作を示すシーケンス図である。図２において、ＯｐＳ１０は、或るＮＥを制御する場合には、ＤＢ１１からこのＮＥを制御するための制御情報を読み出し、読み出した制御情報を含むフレーム(制御フレーム)を生成し、生成したフレームを当該ＮＥへ送信する(ステップＳ１)。
【００１７】
当該ＮＥは、制御フレームを受信した場合には、その制御フレームに含まれた情報に従って所定の処理を実行する(ステップＳ２)。所定の処理は、例えば、回線設定である。
【００１８】
その後、当該ＮＥは、処理／制御の結果を示す結果情報を含むフレーム(応答フレーム)を生成し、この応答フレームをＯｐＳ１０に送信する(ステップＳ３)。
【００１９】
ＯｐＳ１０は、当該ＮＥから応答フレームを受信した場合には、応答フレームに含まれた結果情報に基づいてＤＢ１１を更新する(ステップＳ４)。これによって、ＤＢ１１は、ＮＥ１−１,１−２,１−３の処理／制御結果に関するレコードを蓄積する。
【００２０】
さらに、ＯｐＳ１０は、ＮＥ１−１,１−２,１−３から警報情報を収集する。図３は、或るＮＥが回線又はＮＥ自身の障害を検出したときの動作を示すシーケンス図である。
【００２１】
図３において、或るＮＥは、障害を検出すると、警報を発生させる(ステップＳ５)。次に、当該ＮＥは、警報情報を含む警報フレームを生成し、警報フレームをＯｐＳ１０へ送信する(ステップＳ６)。
【００２２】
ＯｐＳ１０は、ＮＥから警報フレームを受信すると、警報フレームに含まれた警報情報に従ってＤＢ１１を更新する(ステップＳ７)。これによって、ＤＢ１１は、ＮＥ１−１,１−２,１−３で発生した警報(障害)に関するレコードを蓄積する。
【００２３】
このように、ＤＢ１１は、ＮＥ１−１,１−２,１−３の制御情報，及びＮＥ１−１,１−２,１−３から送信された結果情報及び警報情報に基づく情報(「管理装置が自身の管理対象の通信装置を管理することによって得た情報」に相当)を、ブロック１の通信装置の管理に関する情報(第１ブロック情報)として蓄積する。
【００２４】
また、ＯｐＳ１０は、ＯｐＳ２０から通信回線Ｌを通じてブロック２に属する通信装置の管理に関する情報(第２ブロック情報)を受け取り、ＤＢ２１に格納する。ＤＢ２１は、第２ブロック情報を蓄積する。
【００２５】
第２ブロック情報は、ＯｐＳ２０がブロック２内のＮＥ２−１,２−２,２−３を制御するための制御情報，及びＯｐＳ２０がＮＥ２−１,２−２,２−３から受け取った結果情報及び警報情報に基づいてＤＢ２２に格納する情報(「管理装置が自身の管理対象の通信装置を管理することによって得た情報」に相当)を含む。
【００２６】
また、ＯｐＳ１０は、ＯｐＳ３０から通信回線Ｌを通じてブロック３に属するＮＥの管理に関する情報(第３ブロック情報)を受け取り、ＤＢ３１に格納する。ＤＢ３１は、第３ブロック情報を蓄積する。
【００２７】
第３ブロック情報は、ＯｐＳ３０がブロック３内のＮＥ３−１,３−２,３−３を制御するための制御情報，及びＯｐＳ３０がＮＥ３−１,３−２,３−３から受け取った結果情報及び警報情報に基づいてＤＢ３３に格納する情報(「管理装置が自身の管理対象の通信装置を管理することによって得た情報」に相当)を含む。
【００２８】
また、ＯｐＳ１０は、ＯｐＳ４０から通信回線Ｌを通じて第４ブロック情報を受け取り、ＤＢ４１に格納する。ＤＢ４１は、第４ブロック情報を蓄積する。第４ブロック情報は、ＯｐＳ４０がブロック４内のＮＥ４−１,４−２,４−３を制御するための制御情報，ＯｐＳ４０がＮＥ４−１,４−２,４−３から受け取った結果情報及び警報情報に基づいてＤＢ４４に格納する情報(「管理装置が自身の管理対象の通信装置を管理することによって得た情報」に相当)である。
【００２９】
従って、ＤＢ１１,１２,１３,１４は、第１ブロック情報を夫々蓄積する。ＤＢ２１,２２,２３,２４は、第２ブロック情報を夫々蓄積する。ＤＢ３１,３２,３３,３４は、第３ブロック情報を夫々蓄積する。ＤＢ４１,４２,４３,４４は、第４ブロック情報を夫々蓄積する。このように、各ＯｐＳ１０,２０,３０,４０は、複数のＯｐＳの夫々に対応する複数のデータベースを有し(収容し)、複数のデータベースは、各ＯｐＳ１０,２０,３０,４０に対応する第１〜第４ブロック情報を蓄積する。
【００３０】
ＯｐＳ１０,２０,３０,４０は、自身に対応するＤＢを更新した場合には、その更新によって生じた差分(差分情報)を他のＯｐＳに転送する。例えば、ＯｐＳ１０は、自身に対応するＤＢとしてのＤＢ１１が更新された場合には、この更新によって発生したＤＢの蓄積内容の差分を他のＯｐＳ２０,３０,４０に転送する。
【００３１】
他のＯｐＳ２０,３０,４０は、ＯｐＳ１０から受け取った差分を用いて対応するＤＢを更新する。これによって、各ブロック１,２,３,４の複数のＤＢの蓄積内容は、同期化される。
【００３２】
また、各ブロック１,２,３,４において、複数のＮＥは、監視フレーム(監視メッセージ)を同じブロック内に設置されたＯｐＳに定期的に送出し、監視フレームの応答フレーム(応答メッセージ)をＯｐＳから受信する。これによって、各ＮＥは、当該ＯｐＳが正常に動作しているか否かを監視する(図４参照)。
【００３３】
例えば、図４において、ブロック１におけるＮＥ１−１,１−２,１−３は、対応するＯｐＳとしてのＯｐＳ１０に監視フレームを送信する(ステップＳ０１)。
【００３４】
ＯｐＳ１０は、正常に動作している場合には、監視フレームに対応する応答フレームを、監視フレームの送信元に相当するＮＥに送信する(ステップＳ０２)。
【００３５】
一方、送信元のＮＥは、監視フレームを送信すると、応答フレームの受信を許容するためのタイマを設定する。送信元のＮＥは、タイマがタイムアウトになる前にＯｐＳ１０から応答フレームを受信した場合には、ＯｐＳ１０が正常であると認識する。これに対し、送信元のＮＥは、タイマがタイムアウトになる前に応答フレームを受信しなかった場合には、ＯｐＳ１０に異常が発生していると認識する。
【００３６】
次に、図１に示したシステム１００における動作例について説明する。図５は、システム１００の通常動作の説明図である。図５において、ＤＢ１１に保存された第１ブロック情報は、ＯｐＳ１０からＯｐＳ２０,３０,４０へ転送され、ＯｐＳ２０,３０,４０は、ＤＢ１１,１２,１３,１４を同期化するために、第１ブロック情報を対応するＤＢ１２,１３,１４に格納する。これによって、システム１００は、ＤＢ１１のバックアップデータを３箇所に持つ。
【００３７】
同様に、ＤＢ２２に保持された第２ブロック情報は、ＯｐＳ２０からＯｐＳ１０,３０,４０へ転送され、ＯｐＳ１０,３０,４０は、ＤＢ２１,２２,２３,２４を同期化するために、第２ブロック情報を対応するＤＢ２１,２３,２４に格納する。これによって、システム１００は、ＤＢ２２のバックアップデータを３箇所に持つ。
【００３８】
同様に、ＤＢ３３に保持された第３ブロック情報は、ＯｐＳ３０からＯｐＳ１０,２０,４０へ転送され、ＯｐＳ１０,２０,４０は、ＤＢ３１,３２,３３,３４を同期化するために、第３ブロック情報を対応するＤＢ３１,３２,３４に格納する。これによって、システム１００は、ＤＢ３３のバックアップデータを３箇所に持つ。
【００３９】
同様に、ＤＢ４４に保持された第３ブロック情報は、ＯｐＳ４０からＯｐＳ１０,２０,３０へ転送され、ＯｐＳ１０,２０,３０は、ＤＢ４１,４２,４３,４４を同期化するために、第４ブロック情報を対応するＤＢ４１,４２,４３に格納する。これによって、システム１００は、ＤＢ４４のバックアップデータを３箇所に持つ。
【００４０】
図６は、システム１００においてＤＢを同期化する動作の例を示すシーケンス図である。図６は、ＯｐＳ１０がＤＢ１１,１２,１３,１４を同期化する時のシステム１００の動作を示している。ＯｐＳ１０は、制御対象のＮＥ(ここでは、ＮＥ１−１)から結果情報を受け取った場合には、この結果情報に基づいてＤＢ１１を書き換える(ステップＳ１〜Ｓ４：図２参照)。
【００４１】
ＤＢ１１の内容が書き換えられることによって、差分がＤＢ１１に発生する。ＯｐＳ１０は、差分をＤＢ１１から取り出し、ＯｐＳ２０,３０,４０に転送する(ステップＳ４−１)。各ＯｐＳ２０,３０,４０は、差分をＯｐＳ１０から受け取ると、差分を用いてＤＢ１２,１３,１４を書き換える(ステップＳ４−２)。これによって、ＤＢ１１,１２,１３,１４が同期化する。
【００４２】
一方、ＯｐＳ１０は、障害が発生したＮＥ(ここでは、ＮＥ１−１)から警報情報を受け取った場合には、この警報情報に基づいてＤＢ１１を書き換える(ステップＳ５〜Ｓ７：図３参照)。
【００４３】
ＤＢ１１の内容が書き換えられることによって、差分がＤＢ１１に発生する。ＯｐＳ１０は、差分をＤＢ１１から取り出し、ＯｐＳ２０,３０,４０に転送する(ステップＳ７−１)。
【００４４】
各ＯｐＳ２０,３０,４０は、差分をＯｐＳ１０から受け取ると、差分を用いてＤＢ１２,１３,１４を書き換える(ステップＳ７−２)。これによって、ＤＢ１１,１２,１３,１４が同期化する。他のブロック２〜４のＯｐＳ２０,３０,４０も、図６に示した動作と同様の動作を行う。
【００４５】
図７は、異常がシステム１００の或るＯｐＳに異常が発生した場合の例を示す説明図であり、図８は、異常がＯｐＳに発生した場合のシステム１００の動作例を示すシーケンス図である。図７及び図８は、異常がブロック１のＯｐＳ１０に発生した場合の動作例を示している。
【００４６】
図８において、ブロック１の各ＮＥ１−１,１−２,１−３は、監視フレームをＯｐＳ１０に定期的に送信し、この監視フレームに対応する応答メッセージを受信することによって、ＯｐＳ１０の動作を監視(ＯｐＳ１０の生存状態を確認)している(図４のステップＳ０１,Ｓ０２参照)。
【００４７】
異常(例えば、故障)がＯｐＳ１０に発生すると(図７参照)、ＯｐＳ１０は、ＮＥからの監視フレームに対する応答メッセージを、監視フレームの送信元に相当するＮＥに送信することができなくなる。従って、送信元のＮＥは、図８に示すように、タイマがタイムアウトになる前に応答メッセージを受信することができない。これによって、送信元のＮＥは、ＯｐＳ１０が異常であると判定する。
【００４８】
ＮＥは、ＯｐＳ１０の異常を検出すると、同じブロック１内の他のＮＥとの間で第１代表ＮＥを決定するための処理(第１代表ＮＥ決定処理)を同じブロック１内の他のＮＥとの間で実行する(ステップＳ０３)。
【００４９】
即ち、ＯｐＳ１０の異常を検出したＮＥ(例えば、ＮＥ１−２)が、第１代表ＮＥ決定処理として、第１調停フレームを当該ＮＥが属するブロック内の他のＮＥへ通知する。
【００５０】
図９は、図８に示した第１代表ＮＥ決定処理(ステップＳ０３：ステップＳ０３−１及びＳ０３−２)の例を示すシーケンス図である。図９において、ＮＥ１−１,１−２,１−３は、監視フレームをＯｐＳ１０へ定期的に送信することによって、ＯｐＳ１０を監視する(ステップＳ０１,Ｓ０２)。ＮＥ間の監視フレームの送出タイミングは、所定の間隔を有している。
【００５１】
監視フレームの送信元のＮＥ(例えば、ＮＥ１−２)は、ＯｐＳ１０の異常を検出すると(ステップＳ０３−０)、第１調停フレーム(第１調停メッセージ)を生成し、ブロック１内の他のＮＥ(ここでは、ＮＥ１−１,１−３)に送信する(ステップＳ０３−１)。第１調停フレームは、何れのＮＥが第１代表ＮＥとなるかをＮＥ間でネゴシエーションするための情報(ネゴシエーション情報)を含む。
【００５２】
第１調停フレームを受信したＮＥ１−１,１−３は、第１調停フレームに対応する第１調停応答フレームを生成し、第１調停フレームの送信元のＮＥとしてのＮＥ１−２に第１調停応答フレームを送信する(ステップＳ０３−２)。
【００５３】
この例では、第１調停フレームは、ネゴシエーション情報として、第１調停フレームの送信元のＮＥ１−２が第１代表ＮＥとしてブロードキャストフレームＢＦ１(図１０(Ａ)参照)の送信を開始することを示す情報を含み、第１調停応答フレームは、第１調停フレームを受信したＮＥ１−１,１−３がＮＥ１−２がブロードキャストフレームＢＦ１の送信を許可することを示す情報を含んでいる。
【００５４】
従って、ＮＥ１−２は、第１調停応答フレームを受信すると、第１代表ＮＥとして、代替ＯｐＳを検索するためのブロードキャストを実行する(ステップＳ０４)。代替ＯｐＳは、他のブロック２,３,４に属し、異常が発生したＯｐＳ１０に代わってブロック１内のＮＥ１−１,１−２,１−３を管理(制御及び監視)するＯｐＳである。
【００５５】
なお、各ＮＥは、第１調停フレームを他のＮＥから受信した後にＯｐＳの異常を検出しても、他のＮＥに第１調停フレームを送信しない。従って、この例では、ブロック内で最初にＯｐＳの異常を検出したＮＥが第１代表ＮＥとなる。これに対し、他のＮＥ(第１調停フレームの送信元のＮＥを除くＮＥ)がネゴシエーションによって第１代表ＮＥになるようにしても良い。例えば、その時点で最も負荷が少ないＮＥが第１代表ＮＥになるようにしても良い。
【００５６】
或いは、各ＮＥが、第１代表ＮＥの情報が予め登録されたテーブルを有し、ＯｐＳの異常を検出したときに、テーブルが参照され、登録された第１代表ＮＥの情報に対応するＮＥが第１代表ＮＥとなるようにしても良い。
【００５７】
図８に戻って、第１代表ＮＥ(ここでは、ＮＥ１−２)は、代替ＯｐＳを検索するためのブロードキャストフレーム(又はマルチキャストフレーム)ＢＦ１を生成し、他のブロック２,３,４にブロードキャスト(マルチキャスト)する。
【００５８】
図１０(Ａ)は、ブロードキャストフレームＢＦ１の説明図である。ブロードキャストフレームＢＦ１は、異常発生ＯｐＳ番号を含んでいる。異常発生ＯｐＳ番号は、異常が発生したＯｐＳ(異常発生ＯｐＳ：ここではＯｐＳ１０)の特定情報である。ＯｐＳの特定情報は、ＯｐＳのアドレスであっても良い。
【００５９】
各ＯｐＳ２０,３０,４０は、ブロードキャストフレームＢＦ１を受信すると、このブロードキャストフレームＢＦ１の応答フレームＢＲＦ１を生成し、ブロードキャストフレームＢＦ１の送信元アドレスを用いて、生成した応答フレームＢＦ１を第１代表ＮＥ(ＮＥ１−２)に送信する(ステップＳ０５)。
【００６０】
図１０(Ｂ)は、応答フレームＢＲＦ１の説明図である。応答フレームＢＲＦ１は、パラメータとして、応答ＯｐＳ番号，代替可／不可情報，ＣＰＵ負荷情報，ＣＰＵ能力情報，自ブロック接続ＮＥ数，自ブロック収容回線数，異常発生ブロック接続ＮＥ数，異常発生ブロック回線収容数を含んでいる。これらのパラメータの内容は以下の通りである。
(ａ)応答ＯｐＳ番号：ブロードキャストフレームＢＦ１に応答するＯｐＳ(応答ＯｐＳ)の番号(応答フレームの送信元のＯｐＳの特定情報)
(ｂ)代替可／不可情報：代替ＯｐＳになることが可能か否かを示すフラグ
(ｃ)ＣＰＵ負荷情報：ＣＰＵ稼働率(負荷情報)
(ｄ)ＣＰＵ能力：ＣＰＵの性能(パフォーマンス情報)
(ｅ)自ブロック接続ＮＥ数：応答ＯｐＳに接続されているＮＥの数
(ｆ)自ブロック収容回線数：応答ＯｐＳに接続されている複数のＮＥに収容されている回線の数
(ｇ)異常発生ブロック接続ＮＥ数：異常発生ＯｐＳに接続されているＮＥの数
(ｈ)異常発生ブロック収容回線数：異常発生ＯｐＳに接続されている複数のＮＥに収容されている回線数
図８に戻って、第１代表ＮＥ(ＮＥ１−２)は、各ＯｐＳ２０,３０,４０から応答フレームＢＲＦ１を受信すると、この応答フレームＢＲＦ１に含まれたパラメータを用いて代替ＯｐＳ選択処理を実行する(ステップＳ０６)。
【００６１】
図１１は、代替ＯｐＳ選択処理(ステップＳ０６)を示すフローチャートである。第１代表ＮＥは、各ＯｐＳ２０,３０,４０から応答フレームＢＲＦ１を通じて得たパラメータを比較・照合することによって、代替可／不可情報による絞り込み(ステップＳ０６−１)，ＣＰＵ負荷情報による絞り込み(ステップＳ０６−２)，応答時間による絞り込み(ステップＳ０６−３)，ＣＰＵ能力／自ブロック接続ＮＥ数／自ブロック収容回線数／異常発生ブロック接続ＮＥ数／異常発生ブロック回線収容数による絞り込み(ステップＳ０６−４)を実行し、最適な条件を備えるＯｐＳを代替ＯｐＳとして選択する。ステップＳ０６−１〜Ｓ０６−４の順序は任意に設定することができる。
【００６２】
ここで、応答時間は、第１代表ＮＥがブロードキャストフレームＢＦ１を送信してから各ＯｐＳ２０,３０,４０からの応答フレームＢＲＦ１を受信するまでの夫々の時間(ブロードキャストフレームＢＦ１に対する応答時間)である。このため、代表ＮＥは、ブロードキャストフレームＢＦ１を送信すると、自身に搭載された時計を用いて、各ＯｐＳ２０,３０,４０に対応する応答時間を計時及び記録する。
【００６３】
また、最適な条件を備えるＯｐＳは、例えば、最も又は比較的負荷が少ないＯｐＳである。なお、本実施形態は、第１代表ＮＥが各ＯｐＳ２０,３０,４０との通信路の輻輳情報を取得し、この輻輳情報に基づいてＯｐＳが選択されるようにしても良い。
【００６４】
なお、第１代表ＮＥが上記したパラメータ(ａ)〜(ｈ)の少なくとも１つを用いて代替ＯｐＳを選択するようにしても良い。例えば、第１代表ＮＥが応答フレームＢＲＦ１が最も早く代替ＯｐＳに到着したＯｐＳ(応答時間が最も短いＯｐＳ)を代替ＯｐＳとして選択するようにしても良い。この場合には、通信状態が最も良い代替ＯｐＳが選択される。
【００６５】
さらに、各ブロックの少なくとも１つのＮＥが代替ＯｐＳの情報が予め登録されたテーブルを有し、第１代表ＮＥが決定されたときに、第１代表ＮＥが代替ＯｐＳの情報をテーブルから取得し、この情報に対応するＯｐＳを代替ＯｐＳとして選択するようにしても良い。
【００６６】
図８に戻って、第１代表ＮＥは、代替ＯｐＳを選択すると、代替要求フレームを生成し、代替ＯｐＳに相当するＯｐＳに送信する(ステップＳ０７)。この例では、ＯｐＳ３０が代替ＯｐＳとして選択され、代替要求フレームがＯｐＳ３０に送信される。
【００６７】
ＯｐＳ３０は、代替要求フレームを受信すると、代替ＯｐＳとしての処理を開始し(ステップＳ０８)、代替要求フレームに対応する代替要求応答フレームを返送する(ステップＳ０９)。代替要求応答フレームは、代替要求フレームを受信したＯｐＳ(ＯｐＳ３０)が代替要求を承認し代替ＯｐＳとして機能することを示す情報を含む。
【００６８】
第１代表ＮＥ(ＮＥ１−２)が代替要求応答フレームを受信すると、第１代表ＮＥが属するブロック１において、各ＮＥ１−１,１−２,１−３がＯｐＳ接続変更処理を実行する(ステップＳ０１０)。
【００６９】
図１２は、ＯｐＳ接続変更処理(ステップＳ０１０)を示すシーケンス図である。第１代表ＮＥとしてのＮＥ１−２は、代替ＯｐＳとしてのＯｐＳ３０から代替要求応答フレームを受信すると、ブロック１の他のＮＥ１−１,１−３に対し、接続変更要求を送信する(ステップＳ０１０−１)。接続変更要求は、各ＮＥ１−１,１−３とＯｐＳとの論理接続を異常発生ＯｐＳ(ＯｐＳ１０)から代替ＯｐＳ(ＯｐＳ３０)に変更することを要求するための通知であり、代替ＯｐＳの特定情報(ＯｐＳ番号，又はＯｐＳのアドレス)を含んでいる。
【００７０】
第１代表ＮＥ(ＮＥ１−２)は、接続変更要求を送信した後、ＮＥ１−２とＯｐＳ１０との論理接続の切断処理を実行する(ステップＳ０１０−２)。また、各ＮＥ１−１,１−３は、接続変更要求を受信すると、各ＮＥ１−１,１−３とＯｐＳ１０との論理接続を夫々切断する(ステップＳ０１０−２)。
【００７１】
論理接続が切断されることによって、ＯｐＳ１０が各ＮＥ１−１,１−２,１−３を管理(制御及び監視)するという関係(管理関係)が抹消される。但し、各ＮＥ１−１,１−２,１−３は、上記した切断処理後も、ＯｐＳ１０の回復を監視するため、監視フレームをＯｐＳ１０へ定期的に送信する。
【００７２】
その後、図８及び図１２に示すように、各ＮＥ１−１,１−２,１−３は、応答フレームＢＲＦ１又は接続変更要求に含まれた代替ＯｐＳの特定情報を用い、自身と代替ＯｐＳとしてのＯｐＳ３０との接続処理を実行する(ステップＳ０１１)。これによって、新たな論理接続(管理関係)が各ＮＥ１−１,１−２,１−３とＯｐＳ３０との間に形成され、複数のＮＥ１−１,１−２,１−３が代替ＯｐＳの管理下に参入する。
【００７３】
代替ＯｐＳとしてのＯｐＳ３０は、代替処理として、ＯｐＳ１０による複数のＮＥ１−１,１−２,１−３の管理を引き継ぐ。即ち、ＯｐＳ３０は、ＯｐＳ１０と同様に、各ＮＥ１−１,１−２,１−３に対する管理を行い、自身に対応するＤＢ３１,３３を更新する。
【００７４】
これによって、ＯｐＳ３０がＯｐＳ１０の代わりに第１ブロック情報をＤＢ３１に蓄積する。また、ＯｐＳ３０は、ＤＢ３１を更新する毎に、この更新によって生じた差分を他のＯｐＳ２０,４０に転送する。これによって、第１ブロック情報を蓄積するＤＢ２１,３１,４１が同期化される。
【００７５】
次に、異常発生ＯｐＳが復旧したときのシステム１００の動作例を説明する。図１３は、図７及び図８に示した動作例において、ＯｐＳ１０が復旧した場合におけるシステム１００の動作を示すシーケンス図である。図１４は、第２代表ＮＥ決定処理(ステップＳ０２２)を示すシーケンス図である。
【００７６】
ブロック１の各ＮＥ１−１,１−２,１−３は、切断処理(ステップＳ０１０−２)後も、監視フレームをＯｐＳ１０に定期的に送信し、この監視フレームに対応する応答メッセージを受け付ける(ステップＳ０１)。これによって、各ＮＥ１−１,１−２,１−３は、ＯｐＳ１０の回復を監視する。一方、ＯｐＳ１０は、異常な状態から回復した場合には(ステップＳ０２１)、監視フレームに対応する応答フレームを送信することができる。
【００７７】
各ＮＥ１−１,１−２,１−３は、ＯｐＳ１０から応答フレームを受信すると、ＯｐＳ１０が異常状態から回復したと認識し、第２代表ＮＥ決定処理を実行する(ステップＳ０２２)。即ち、各ＮＥ１−１,１−２,１−３は、ＯｐＳ１０の回復を検出すると(ステップＳ０２２−０)、第２調停フレーム(第２調停メッセージ)をブロック１内の他のＮＥへ送信する(ステップＳ０２２−１)。
【００７８】
図１４の例では、ＮＥ１−２がＯｐＳ１０の回復を検出し、他のＮＥ１−１,１−３に第２調停フレームを送信している。第２調停フレームは、何れのＮＥが第２代表ＮＥとなるかをＮＥ間でネゴシエーションするための情報(ネゴシエーション情報)を含む。
【００７９】
第２調停フレームを受信したＮＥ１−１,１−３は、第２調停フレームに対応する第２調停応答フレームを生成し、ＮＥ１−２に送信する(ステップＳ０２２−２)。この例では、第２調停フレームは、ネゴシエーション情報として、第２調停フレームの送信元としてのＮＥ１−２が第２代表ＮＥになることを示す情報を含み、第２調停応答フレームは、第２調停フレームを受信したＮＥ１−１,１−３がＮＥ１−２が第１代表ＮＥになることを確認したことを示す情報を含んでいる。
【００８０】
従って、ＮＥ１−２は、第２調停応答フレームを受信すると、第２代表ＮＥとして、復旧担当ＯｐＳを検索するためのブロードキャストを実行する(ステップＳ０２３)。復旧担当ＯｐＳは、他のブロック２,３,４に属し、ブロック１のＤＢ１１,２１,３１,４１(ＯｐＳ１０)の復旧処理を担当するＯｐＳである。
【００８１】
なお、各ＮＥは、第２調停フレームを他のＮＥから受信した場合には、その受信後にＯｐＳの回復を検出しても、他のＮＥに第２調停フレームを送信しない。従って、この例では、ブロック内で最初にＯｐＳの回復を検出したＮＥが第２代表ＮＥとなる。
【００８２】
これに対し、他のＮＥ(第２調停フレームの送信元のＮＥを除くＮＥ)がネゴシエーションによって第２代表ＮＥになるようにしても良い。或いは、各ブロックにおいて、第２代表ＮＥの情報が予め各ＮＥに登録され、ＯｐＳの回復が検出されたときに、登録された第２代表ＮＥの情報に対応するＮＥが第２代表ＮＥとなるようにしても良い。
【００８３】
第２代表ＮＥ(ここでは、ＮＥ１−２)は、復旧対象ＯｐＳを検索するためのブロードキャストフレーム(又はマルチキャストフレーム)ＢＦ２を生成し、他のブロック２,３,４にブロードキャスト(マルチキャスト)する(ステップＳ０２３)。
【００８４】
図１５(Ａ)は、ブロードキャストフレームＢＦ２の説明図である。ブロードキャストフレームＢＦは、復旧対象ＯｐＳ番号を含んでいる。復旧対象ＯｐＳ番号は、異常状態から回復したＯｐＳ(復旧対象ＯｐＳ：ここではＯｐＳ１０)の特定情報である。ＯｐＳの特定情報は、ＯｐＳのアドレスであっても良い。
【００８５】
図１３に戻って、各ＯｐＳ２０,３０,４０は、ブロードキャストフレームＢＦ２を受信すると、このブロードキャストフレームＢＦ２の応答フレームＢＲＦ２を生成し、ブロードキャストフレームＢＦ２の送信元アドレスを用いて、生成した応答フレームＢＦ２を第２代表ＮＥ(ＮＥ１−２)に送信する(ステップＳ０２４)。
【００８６】
図１５(Ｂ)は、応答フレームＢＲＦ２の説明図である。応答フレームＢＲＦ２は、代替可／不可情報が復旧担当可／不可情報に代わっている点を除き、応答フレームＢＲＦ１と同じパラメータを有している。復旧担当可／不可情報は、復旧担当ＯｐＳになることが可能か否かを示すフラグである。
【００８７】
図１３に戻って、第２代表ＮＥ(ＮＥ１−２)は、各ＯｐＳ２０,３０,４０から応答フレームＢＲＦ２を受信すると、応答フレームＢＲＦ２に含まれたパラメータを用いて復旧担当ＯｐＳ選択処理を実行する(ステップＳ０２５)。
【００８８】
図１６は、復旧担当ＯｐＳ選択処理(ステップＳ０２５)を示すフローチャートである。第２代表ＮＥは、各ＯｐＳ２０,３０,４０から応答フレームＢＲＦ２を通じて得たパラメータを用い、代替ＯｐＳ選択処理(ステップＳ０６)とほぼ同様の処理を行うことによって、復旧担当ＯｐＳを選択又は決定する。
【００８９】
即ち、第２代表ＮＥは、復旧担当可／不可情報による絞り込み(ステップＳ０２５−１)，ＣＰＵ負荷情報による絞り込み(ステップＳ０２５−２)，応答時間による絞り込み(Ｓ０２５−３)，ＣＰＵ能力／自ブロック接続ＮＥ数／自ブロック収容回線数／異常発生ブロック接続ＮＥ数／異常発生ブロック回線収容数による絞り込み(Ｓ０２５−４)を実行し、最適な条件を備えるＯｐＳを復旧担当ＯｐＳとして選択又は決定する。なお、代替ＯｐＳの選択方法として説明した様々な方法は、復旧担当ＯｐＳの選択方法に適用することができる。また、第２代表ＮＥは、代替ＯｐＳと異なるＯｐＳを復旧担当ＯｐＳとして選択する構成とするのが好ましい。これによって、１つのＯｐＳに負荷が集中ことを防止でき、ＯｐＳの性能が低下することを防ぐことができる。
【００９０】
図１３に戻って、第２代表ＮＥは、復旧担当ＯｐＳを選択すると、ＤＢ復旧要求フレームを生成し、復旧担当ＯｐＳに相当するＯｐＳに送信する(ステップＳ０２６)。この例では、ＯｐＳ２０が復旧担当ＯｐＳとして選択され、ＤＢ復旧要求フレームがＯｐＳ２０に送信される。
【００９１】
ＯｐＳ２０は、ＤＢ復旧要求フレームを受信すると、復旧担当ＯｐＳとして、ＤＢ復旧処理を実行する(ステップＳ０２８)。即ち、ＯｐＳ２０は、ＤＢ２１,２２,２３,２４に蓄積された第１〜第４ブロック情報を読み出し、ＯｐＳ１０に転送する。ＯｐＳ１０は、ＯｐＳ２０から受信した第１〜第４ブロック情報を各ＤＢ１１,２１,３１,４１に格納する。これによって、ブロック１のＤＢ１１,１２,１３,１４の蓄積内容が、他のブロック２,３,４における複数のＤＢと同期化される。このようにして、ブロック１のＤＢ１１,１２,１３,１４が復旧する。
【００９２】
ＯｐＳ２０は、ＤＢ復旧処理が終了すると、ＤＢ復旧処理終了通知を第２代表ＮＥとしてのＮＥ１−２に送信する(ステップＳ０２９)。第２代表ＮＥは、ＤＢ復旧処理終了通知を受信すると、代替ＯｐＳとしてのＯｐＳ３０に対し、代替終了通知を送信する(ステップＳ０３０)。
【００９３】
ＯｐＳ３０は、代替終了通知を受信すると、代替終了処理を実行する(ステップＳ０３１)。即ち、ＯｐＳ３０は、各ＮＥ１−１,１−２,１−３を管理するための処理を終了する。その後、ＯｐＳ３０は、代替終了通知に対する応答通知を代表ＮＥとしてのＮＥ１−２に送信する(ステップＳ０３２)。
【００９４】
第２代表ＮＥとしてのＮＥ１−２は、応答通知を受信すると、ＯｐＳ接続変更処理を実行する(ステップＳ０３３)。図１７は、ＯｐＳ接続変更処理(ステップＳ０３３)を示すシーケンス図である。ＮＥ１−２は、ＯｐＳ３０から応答通知を受信すると、接続変更要求をＮＥ１−１,１−３に送信することによって、ＮＥ１−１,１−３とＯｐＳとの接続関係を代替ＯｐＳ(ＯｐＳ３０)から元のＯｐＳ(ＯｐＳ１０)に変更することをＮＥ１−１,１−３に要求する(ステップＳ０３３−１)。
【００９５】
ＮＥ１−２は、接続変更要求を送信した後、ＮＥ１−２とＯｐＳ３０との接続関係の切断処理を実行する(ステップＳ０３３−２)。また、各ＮＥ１−１,１−３は、接続変更要求を受信すると、各ＮＥ１−１,１−３とＯｐＳ３０との接続関係を夫々切断する(ステップＳ０３３−２)。このようにして、各ＮＥ１−１,１−２,１−３は、代替ＯｐＳの管理下から離脱する。
【００９６】
その後、各ＮＥ１−１,１−２,１−３は、自身とＯｐＳ１０との接続処理を実行する(ステップＳ０３４)。これによって、ブロック１の状態が、ＯｐＳ１０の異常が発生する前の状態に戻る。
【００９７】
本発明の実施形態によるシステム１００によると、各ブロック(ＯｐＳと、このＯｐＳによって管理されるＮＥとからなるグループ)において、各ＮＥがＯｐＳを監視してＯｐＳの異常を検出した場合には、このブロック中の複数のＮＥの中から第１代表ＮＥが決定される。第１代表ＮＥは、代替ＯｐＳを選択し、選択された代替ＯｐＳに代替要求(「管理要求」に相当)を送信する。そして、異常が検出されたＯｐＳの管理下に属する複数のＮＥ(ＯｐＳの異常が検出されたブロック中の全てのＮＥ)が、代替ＯｐＳの管理下に参入する。
【００９８】
このように、通信システム１００は、あるＯｐＳ(管理装置)が異常によって動作できなくなった場合には、他のＯｐＳが代替ＯｐＳとしてＮＥの管理を引き継ぐことによって、ＯｐＳのバックアップを図る。
【００９９】
このバックアップに係る処理は、ＮＥがＯｐＳを監視し、ＮＥが第１代表ＮＥ決定処理，代替ＯｐＳ選択処理，代替要求送信，代替ＯｐＳへの接続処理を実行することによって実現される。このように、バックアップに係る処理がＮＥの主導によって実現される。
【０１００】
従って、従来のように、ホストＯｐＳを通信システム１００に設ける必要がないので、通信システム１００の運用コストの上昇を抑えることができる。また、ＯｐＳ間の相互監視によって、ＯｐＳの負荷が上昇し、ＯｐＳのパフォーマンスが低下することもない。
【０１０１】
また、第１代表ＮＥが、応答フレームＢＲＦ１及びこれに含まれた情報(パラメータ(ａ)〜(ｈ))を用いて代替ＯｐＳを動的に選択する。例えば、ＣＰＵ負荷情報を基準として代替ＯｐＳが選択されることによって、その時点で最も負荷が少ないＯｐＳが選択される。或いは、応答時間を基準として代替ＯｐＳが選択されることによって、通信状態(トラフィック状態)が最良の(スループットが最も高い)ＯｐＳが選択される。このように、最適なＯｐＳが代替ＯｐＳとして選択され、代替ＯｐＳが代替処理を実行する。これによって、通信システム１００の運用が良好に図られる。
【０１０２】
また、代替ＯｐＳは、代替処理において、自身の管理下に新たに参入した各ＮＥについての管理情報(図示した例では、第１ブロック情報)を、自身が有するデータベースに蓄積し、他のＯｐＳに転送することで、異常が検出されたＯｐＳに対応するデータベースを除くデータベース間で、第１ブロック情報の同期化が実現される。
【０１０３】
このように、代替ＯｐＳが決定された後、ＯｐＳ故障発生ブロック内の通信装置の論理接続が代替ＯｐＳへ変更されるため、各ＯｐＳの管理ブロックのデータベースを他のブロックのＯｐＳでも保持しておき、変更差分を他のブロックのＯｐＳへ転送することで常にいくつかのＯｐＳでデータベースを保持し、お互いにバックアップとしての機能を実現することができる。
【０１０４】
その後、異常が検出されたＯｐＳが回復した場合には、第２代表ＮＥが決定され、第２代表ＮＥが復旧担当ＯｐＳを選択し、復旧担当ＯｐＳと回復が検出されたＯｐＳとの間で復旧処理が実行され、回復が検出されたＯｐＳが収容する複数のデータベースの復旧が図られる。そして、代替処理が終了し、代替処理によって管理されていた複数のＮＥが代替ＯｐＳの管理下から離脱し、回復が検出されたＯｐＳの管理下に参入する(戻る)。これによって、通信システム１００の状態が、異常がＯｐＳに発生する前の状態(最適な状態と想定されている状態)に戻る。
【０１０５】
これによって、以下の効果を発揮することができる。
１．ＯｐＳの異常が発生したときに、各ＯｐＳの負荷や監視制御ネットワーク状態に応じて最適な代替ＯｐＳが動的に選択され、異常が発生したＯｐＳの配下の通信装置の論理接続が代替ＯｐＳへ変更される。これによって、的確な監視制御ネットワーク(通信システム)の修復が、最小限の監視制御システム(通信システム)への影響のもとで実現される。
２．代替ＯｐＳ決定処理が被監視制御側である通信装置(ＮＥ)で実現されるので、各ＯｐＳの負荷削減が実現される。
３．各ＯｐＳ装置の正常性確認のために別途上位ＯｐＳを設置・運用する必要がなく、運用コストの低減化が実現される。
４．ＯｐＳの異常が回復したときに、各ＯｐＳの負荷や監視制御ネットワーク状態に応じて最適なＤＢの復旧を担当するＯｐＳが動的に選択され、異常から回復したＯｐＳのＤＢの復旧処理が、最小限の監視制御システム(通信システム)への影響のもとで実現される。
【０１０６】
さらに、本実施形態では、以下の構成を付加することできる。即ち、実施形態における通信システム１００の構築時等において、ＯｐＳとＮＥとを同時に起動する場合、ＮＥの立ち上がり時間に比べてＯｐＳの立ち上がり時間が長くなる可能性がある。
【０１０７】
このとき、ＮＥがＯｐＳに監視フレームを送信しても、ＯｐＳは、応答フレームを送信する準備が完了していないので、応答フレームをＮＥに送信することができない。この場合には、ＮＥがＯｐＳの異常を誤って検出してしまう。この問題を解決するため、ＯｐＳからの立ち上げ通知を受信するまではＯｐＳ異常を検出しても、第１調停フレーム(調停メッセージ)を他のＮＥに送信したり、ブロードキャストフレームＢＦ１を他のＯｐＳへ送信したりしない機能(フレーム送信抑止機能)をＮＥに実装する。この機能は、ＮＥに搭載されたプロセッサが所定のプログラムを実行することによって実現することができる。
【０１０８】
図１８は、フレーム送信抑止機能を説明するシーケンス図である。例えば、通信システム１００の構築時において、ＮＥとＯｐＳとを同時に立ち上げた(起動した)とする(Ｓ１０１,Ｓ２０１)。ＮＥは、起動によって監視フレームをＯｐＳに送信するための準備を行い、ＯｐＳは、起動によって応答フレームをＮＥに返信するための準備を行う。
【０１０９】
このとき、ＮＥがＯｐＳよりも早く準備を完了すると、ＮＥはＯｐＳに対する監視フレームの定期的な送信を開始する。但し、ＮＥの準備が完了した時点では、ＮＥに設定されたＯｐＳの異常の検出を抑止(禁止)するための異常検出禁止フラグ(調停メッセージ抑止フラグ)がオンの状態(異常の検出(第１調停フレームの送信)を禁止する状態)となっている。
【０１１０】
このため、ＮＥは、監視フレームをＯｐＳに送信し(Ｓ０１)、所定期間内に応答フレームを受信できなくても、ＯｐＳの異常を検出しない。その後、ＯｐＳの準備が完了すると(Ｓ２０２)、ＯｐＳは、準備完了通知(立ち上げ完了通知)をＮＥに送信する(Ｓ２０３)。
【０１１１】
ＮＥは、準備完了通知をＯｐＳから受信すると、これに対する応答通知をＯｐＳに送信し(Ｓ１０３)、異常検出禁止フラグをオフ(異常の検出を許可する状態)に設定する(Ｓ１０４)。これによって、ＮＥは、監視フレームを送信してから所定期間内に応答フレームを受信できなかった場合には、ＯｐＳの異常を検出し、第１調停フレームを送信する。一方、ＯｐＳは、準備完了通知を送信した後は、ＮＥからの監視フレームに対し、応答フレームを返信する。これによって、ＮＥがＯｐＳの異常を誤って検出することが防止される。
【０１１２】
〔その他〕
本発明は、以下のように特定することができる。
（付記１）少なくとも１つの通信装置を夫々管理する複数の管理装置がネットワークを通じて相互に接続され、前記各通信装置は、自身を管理する管理装置を監視し、この管理装置の異常を検出したときに、この管理装置が自身を含む複数の通信装置を管理している場合には、これらの複数の通信装置を代表する代表通信装置を決定し、前記代表通信装置は、前記異常が検出された管理装置に代わって前記複数の通信装置を管理する代替管理装置を複数の他の管理装置の中から選択し、選択した代替管理装置に前記複数の通信装置の管理要求を送信し、前記複数の通信装置は、前記管理要求が送信された後、前記代替管理装置の管理下に参入し、前記各管理装置は、前記管理要求を受信した場合に、前記代替管理装置として、前記複数の通信装置を管理する通信システムにおける管理装置のバックアップシステム。
（付記２）前記代表通信装置は、前記管理要求を送信する前に、代替管理装置を選択するためのフレームを前記複数の他の管理装置へ送信し、前記複数の他の管理装置は、前記フレームを受信した場合に、このフレームに対応する応答フレームを前記代表通信装置に送信し、前記代表通信装置は、前記複数の他の管理装置から応答フレームを夫々受信し、最初に受信した応答フレームの送信元の他の管理装置を代替管理装置として選択する付記１記載の通信システムにおける管理装置のバックアップシステム。
（付記３）前記代表通信装置は、前記管理要求を送信する前に、代替管理装置を選択するためのフレームを前記複数の他の管理装置へ送信し、前記複数の他の管理装置は、前記フレームを受信した場合に、このフレームに対応する応答フレームを前記代表通信装置に送信し、前記代表通信装置は、前記他の複数の管理装置からの応答フレームを夫々受信し、これらの応答フレームに含まれた情報を用いて代替管理装置を選択する付記１記載の通信システムにおける管理装置のバックアップシステム。
（付記４）前記各管理装置は、前記複数の管理装置に夫々対応する複数のデータベースを有し、自身の管理対象の通信装置を管理することによって得た情報を用いて自身に対応するデータベースを更新するとともにこの更新によって発生した差分情報を全ての他の管理装置に転送し、他の管理装置から差分情報を受信した場合にこの他の管理装置に対応するデータベースを受信した差分情報を用いて更新し、前記異常が検出された管理装置の管理対象としての前記複数の通信装置を代替管理装置として管理する場合に、これらの管理によって得た情報を用いて前記異常が検出された管理装置に対応するデータベースを更新するとともにこの更新によって生じた差分情報を全ての他の管理装置，又は前記異常が検出された管理装置を除く他の管理装置に転送する付記１記載の通信システムにおける管理装置のバックアップシステム。
（付記５）前記複数の通信装置のうち、最初に管理装置の異常を検出した通信装置が代表通信装置になる付記１記載の通信システムにおける管理装置のバックアップシステム。
（付記６）前記各通信装置は、前記異常が検出された管理装置が自身のみを管理している場合には、前記複数の他の管理装置の中から選択した代替管理装置に前記複数の通信装置の管理要求を送信し、前記管理要求が送信された後、前記代替管理装置の管理下に参入し、前記各管理装置は、前記管理要求を受信した場合に、前記代替管理装置として、前記管理要求の送信元の通信装置を管理する付記１記載の通信システムにおける管理装置のバックアップシステム。
（付記７）前記複数の通信装置は、前記代替管理装置によって管理されている間、前記異常が検出された管理装置を監視し、前記複数の通信装置の何れかがこの管理装置の回復を検出した場合に、前記代替管理装置の管理下から離脱し、前記回復が検出された管理装置の管理下に戻る付記１記載の通信システムにおける管理装置のバックアップシステム。
（付記８）前記複数の通信装置は、前記代替管理装置によって管理されている間、前記異常が検出された管理装置を夫々監視し、前記複数の通信装置の何れかがこの管理装置の回復を検出した場合に、これらの複数の通信装置を代表する第２代表通信装置を決定し、前記第２代表通信装置は、前記回復が検出された管理装置が有する複数のデータベースの復旧処理を担当する復旧担当管理装置を前記複数の他の管理装置の中から選択し、選択した復旧担当管理装置に前記複数のデータベースの復旧要求を送信し、前記復旧担当管理装置は、前記復旧要求を受信した場合に、自身が有する複数のデータベースの蓄積内容を前記回復が検出された管理装置に転送し、前記回復が検出された管理装置は、前記復旧担当管理装置から前記蓄積内容を受信した場合に、この蓄積内容を用いて前記複数のデータベースを夫々更新する付記４記載の通信システムにおける管理装置のバックアップシステム。
（付記９）前記第２代表通信装置は、前記復旧要求を送信する前に、復旧担当管理装置を選択するためのフレームを前記複数の他の管理装置へ送信し、前記複数の他の管理装置は、前記フレームを受信した場合に、このフレームに対応する応答フレームを前記第２代表通信装置に送信し、前記第２代表通信装置は、前記他の複数の管理装置から応答フレームを夫々受信し、最初に受信した応答フレームの送信元の他の管理装置を復旧担当管理装置として選択する付記８記載の通信システムにおける管理装置のバックアップシステム。
（付記１０）前記第２代表通信装置は、前記復旧要求を送信する前に、復旧担当管理装置を選択するためのフレームを前記複数の他の管理装置へ送信し、前記複数の他の管理装置は、前記フレームを受信した場合に、このフレームに対応する応答フレームを前記第２代表通信装置に送信し、前記第２代表通信装置は、前記複数の他の管理装置からの応答フレームを夫々受信し、これらの応答フレームに含まれた情報を用いて復旧担当管理装置を選択する付記８記載の通信システムにおける管理装置のバックアップシステム。
（付記１１）前記第２代表通信装置は、前記複数の他の管理装置の中から、代替管理装置として選択されていない管理装置を復旧担当管理装置として選択する付記８記載の管理装置のバックアップシステム。
（付記１２）前記複数の通信装置のうち、最初に管理装置の回復を検出した通信装置が第２代表通信装置になる付記８記載の通信システムにおける管理装置のバックアップシステム。
（付記１３）前記各通信装置は、自身を管理する管理装置に監視フレームを送信し、この管理装置から監視フレームの応答フレームを受信することによってこの管理装置を監視し、前記監視フレームを送信してから所定期間が経過する前に前記応答フレームを受信せず且つ応答フレームを送信するための準備の完了を示す通知を前記管理装置から既に受信している場合にのみ、前記管理装置の異常を検出する付記１記載の通信システムの管理装置のバックアップシステム。
（付記１４）少なくとも１つの通信装置を夫々管理する複数の管理装置がネットワークを通じて相互に接続され、前記各通信装置は、自身を管理する管理装置を監視し、この管理装置の異常を検出したときに、この管理装置が自身を含む複数の通信装置を管理している場合には、これらの複数の通信装置を代表する代表通信装置を決定し、前記代表通信装置は、前記異常が検出された管理装置に代わって前記複数の通信装置を管理する代替管理装置を複数の他の管理装置の中から選択し、選択した代替管理装置に前記複数の通信装置の管理要求を送信し、前記複数の通信装置は、前記管理要求が送信された後、前記代替管理装置の管理下に参入し、前記各管理装置は、前記管理要求を受信した場合に、前記代替管理装置として、前記複数の通信装置を管理する通信システムにおける管理装置のバックアップ方法。
（付記１５）前記代表通信装置は、前記管理要求を送信する前に、代替管理装置を選択するためのフレームを前記複数の他の管理装置へ送信し、前記複数の他の管理装置は、前記フレームを受信した場合に、このフレームに対応する応答フレームを前記代表通信装置に送信し、前記代表通信装置は、前記複数の他の管理装置から応答フレームを夫々受信し、最初に受信した応答フレームの送信元の他の管理装置を代替管理装置として選択する付記１４記載の通信システムにおける管理装置のバックアップ方法。
（付記１６）前記代表通信装置は、前記管理要求を送信する前に、代替管理装置を選択するためのフレームを前記複数の他の管理装置へ送信し、前記複数の他の管理装置は、前記フレームを受信した場合に、このフレームに対応する応答フレームを前記代表通信装置に送信し、前記代表通信装置は、前記他の複数の管理装置からの応答フレームを夫々受信し、これらの応答フレームに含まれた情報を用いて代替管理装置を選択する付記１４記載の通信システムにおける管理装置のバックアップ方法。
（付記１７）前記各管理装置は、前記複数の管理装置に夫々対応する複数のデータベースを有し、自身の管理対象の通信装置を管理することによって得た情報を用いて自身に対応するデータベースを更新するとともにこの更新によって発生した差分情報を全ての他の管理装置に転送し、他の管理装置から差分情報を受信した場合にこの他の管理装置に対応するデータベースを受信した差分情報を用いて更新し、前記異常が検出された管理装置の管理対象としての前記複数の通信装置を代替管理装置として管理する場合に、これらの管理によって得た情報を用いて前記異常が検出された管理装置に対応するデータベースを更新するとともにこの更新によって生じた差分情報を全ての他の管理装置，又は前記異常が検出された管理装置を除く他の管理装置に転送する付記１４記載の通信システムにおける管理装置のバックアップ方法。
（付記１８）前記複数の通信装置のうち、最初に管理装置の異常を検出した通信装置が代表通信装置になる付記１４記載の通信システムにおける管理装置のバックアップ方法。
（付記１９）前記各通信装置は、前記異常が検出された管理装置が自身のみを管理している場合には、前記複数の他の管理装置の中から選択した代替管理装置に前記複数の通信装置の管理要求を送信し、前記管理要求が送信された後、前記代替管理装置の管理下に参入し、前記各管理装置は、前記管理要求を受信した場合に、前記代替管理装置として、前記管理要求の送信元の通信装置を管理する付記１４記載の通信システムにおける管理装置のバックアップ方法。
（付記２０）前記複数の通信装置は、前記代替管理装置によって管理されている間、前記異常が検出された管理装置を監視し、前記複数の通信装置の何れかがこの管理装置の回復を検出した場合に、前記代替管理装置の管理下から離脱し、前記回復が検出された管理装置の管理下に戻る付記１４記載の通信システムにおける管理装置のバックアップ方法。
（付記２１）前記複数の通信装置は、前記代替管理装置によって管理されている間、前記異常が検出された管理装置を夫々監視し、前記複数の通信装置の何れかがこの管理装置の回復を検出した場合に、これらの複数の通信装置を代表する第２代表通信装置を決定し、前記第２代表通信装置は、前記回復が検出された管理装置が有する複数のデータベースの復旧処理を担当する復旧担当管理装置を前記複数の他の管理装置の中から選択し、選択した復旧担当管理装置に前記複数のデータベースの復旧要求を送信し、前記復旧担当管理装置は、前記復旧要求を受信した場合に、自身が有する複数のデータベースの蓄積内容を前記回復が検出された管理装置に転送し、前記回復が検出された管理装置は、前記復旧担当管理装置から前記蓄積内容を受信した場合に、この蓄積内容を用いて前記複数のデータベースを夫々更新する付記１７記載の通信システムにおける管理装置のバックアップ方法。
（付記２２）前記第２代表通信装置は、前記復旧要求を送信する前に、復旧担当管理装置を選択するためのフレームを前記複数の他の管理装置へ送信し、前記複数の他の管理装置は、前記フレームを受信した場合に、このフレームに対応する応答フレームを前記第２代表通信装置に送信し、前記第２代表通信装置は、前記他の複数の管理装置から応答フレームを夫々受信し、最初に受信した応答フレームの送信元の他の管理装置を復旧担当管理装置として選択する付記２１記載の通信システムにおける管理装置のバックアップ方法。
（付記２３）前記第２代表通信装置は、前記復旧要求を送信する前に、復旧担当管理装置を選択するためのフレームを前記複数の他の管理装置へ送信し、前記複数の他の管理装置は、前記フレームを受信した場合に、このフレームに対応する応答フレームを前記第２代表通信装置に送信し、前記第２代表通信装置は、前記複数の他の管理装置からの応答フレームを夫々受信し、これらの応答フレームに含まれた情報を用いて復旧担当管理装置を選択する付記２１記載の通信システムにおける管理装置のバックアップ方法。
（付記２４）前記第２代表通信装置は、前記複数の他の管理装置の中から、代替管理装置として選択されていない管理装置を復旧担当管理装置として選択する付記２１記載の管理装置のバックアップ方法。
（付記２５）前記複数の通信装置のうち、最初に管理装置の回復を検出した通信装置が第２代表通信装置になる付記２１記載の通信システムにおける管理装置のバックアップ方法。
（付記２６）前記各通信装置は、自身を管理する管理装置に監視フレームを送信し、この管理装置から監視フレームの応答フレームを受信することによってこの管理装置を監視し、前記監視フレームを送信してから所定期間が経過する前に前記応答フレームを受信せず且つ応答フレームを送信するための準備の完了を示す通知を前記管理装置から既に受信している場合にのみ、前記管理装置の異常を検出する付記１４記載の通信システムの管理装置のバックアップ方法。
【０１１３】
【発明の効果】
本発明によれば、通信装置と複数の管理装置とを含む通信システムにおいて、管理装置を監視する装置をさらに設ける必要がなく、且つ管理装置の負荷上昇を抑えることができる。
【図面の簡単な説明】
【図１】本発明の実施形態による通信システムの構成例を示す図
【図２】ＯｐＳによるＮＥの制御を示すシーケンス図
【図３】ＯｐＳによるＮＥの監視を示すシーケンス図
【図４】ＮＥによるＯｐＳの監視を示すシーケンス図
【図５】図１に示した通信システムの動作例(ＤＢの同期化)の説明図
【図６】図１に示した通信システムにおけるＤＢの同期化を説明するシーケンス図
【図７】図１に示した通信システムにおけるＯｐＳの異常の発生の説明図
【図８】図１に示した通信システムにおけるＯｐＳに異常が発生したときの処理(バックアップ処理)の動作例を示すシーケンス図
【図９】図８に示した第１代表ＮＥ決定処理の例を示すシーケンス図
【図１０】ブロードキャストフレーム及びブロードキャスト応答フレームの例を示す説明図
【図１１】図８に示した代替ＯｐＳ選択処理の例を示すフローチャート
【図１２】図８に示したＯｐＳ接続変更処理の例を示すシーケンス図
【図１３】図１に示した通信システムにおけるＯｐＳの異常が回復したときの処理(ＤＢの復旧)の動作例を示すシーケンス図
【図１４】図１３に示した第２代表ＮＥ決定処理の例を示すシーケンス図
【図１５】ブロードキャストフレーム及びブロードキャスト応答フレームの例を示す説明図
【図１６】図１３に示した復旧担当ＯｐＳ選択処理の例を示すフローチャート
【図１７】図１３に示したＯｐＳ接続変更処理の例を示すシーケンス図
【図１８】他の実施形態を説明するシーケンス図
【符号の説明】
Ｌ通信回線
１,２,３,４ブロック
１−１,１−２,１−３ＮＥ(通信装置)
１０,２０,３０,４０ＯｐＳ(管理装置)
１１,１２,１３,１４データベース(ＤＢ)
１００通信システム

Claims

少なくとも１つの通信装置を夫々管理する複数の管理装置がネットワークを通じて相互に接続され、
前記各通信装置は、自身を管理する管理装置を監視し、この管理装置の異常を検出したときに、この管理装置が自身を含む複数の通信装置を管理している場合には、これらの複数の通信装置を代表する代表通信装置を決定し、
前記代表通信装置は、前記異常が検出された管理装置に代わって前記複数の通信装置を管理する代替管理装置を複数の他の管理装置の中から選択し、選択した代替管理装置に前記複数の通信装置の管理要求を送信し、
前記複数の通信装置は、前記管理要求が送信された後、前記代替管理装置の管理下に参入し、
前記各管理装置は、前記管理要求を受信した場合に、前記代替管理装置として、前記複数の通信装置を管理する、通信システムにおける管理装置のバックアップシステム。
前記各管理装置は、
前記複数の管理装置に夫々対応する複数のデータベースを有し、
自身の管理対象の通信装置を管理することによって得た情報を用いて自身に対応するデータベースを更新するとともにこの更新によって発生した差分情報を全ての他の管理装置に転送し、
他の管理装置から差分情報を受信した場合にこの他の管理装置に対応するデータベースを受信した差分情報を用いて更新し、
前記異常が検出された管理装置の管理対象としての前記複数の通信装置を代替管理装置として管理する場合に、これらの管理によって得た情報を用いて前記異常が検出された管理装置に対応するデータベースを更新するとともにこの更新によって生じた差分情報を全ての他の管理装置，又は前記異常が検出された管理装置を除く他の管理装置に転送する請求項１記載の通信システムにおける管理装置のバックアップシステム。
前記複数の通信装置は、前記代替管理装置によって管理されている間、前記異常が検出された管理装置を監視し、前記複数の通信装置の何れかがこの管理装置の回復を検出した場合に、前記代替管理装置の管理下から離脱し、前記回復が検出された管理装置の管理下に戻る請求項１記載の通信システムにおける管理装置のバックアップシステム。
前記複数の通信装置は、前記代替管理装置によって管理されている間、前記異常が検出された管理装置を夫々監視し、前記複数の通信装置の何れかがこの管理装置の回復を検出した場合に、これらの複数の通信装置を代表する第２代表通信装置を決定し、
前記第２代表通信装置は、前記回復が検出された管理装置が有する複数のデータベースの復旧処理を担当する復旧担当管理装置を前記複数の他の管理装置の中から選択し、選択した復旧担当管理装置に前記複数のデータベースの復旧要求を送信し、
前記復旧担当管理装置は、前記復旧要求を受信した場合に、自身が有する複数のデータベースの蓄積内容を前記回復が検出された管理装置に転送し、
前記回復が検出された管理装置は、前記復旧担当管理装置から前記蓄積内容を受信した場合に、この蓄積内容を用いて前記複数のデータベースを夫々更新する請求項２記載の通信システムにおける管理装置のバックアップシステム。
前記各通信装置は、自身を管理する管理装置に監視フレームを送信し、この管理装置から監視フレームの応答フレームを受信することによってこの管理装置を監視し、前記監視フレームを送信してから所定期間が経過する前に前記応答フレームを受信せず且つ応答フレームを送信するための準備の完了を示す通知を前記管理装置から既に受信している場合にのみ、前記管理装置の異常を検出する請求項１記載の通信システムの管理装置のバックアップシステム。