JP5123955B2 - 分散型ネットワーク管理システムおよび方法 - Google Patents

分散型ネットワーク管理システムおよび方法 Download PDF

Info

Publication number
JP5123955B2
JP5123955B2 JP2009550152A JP2009550152A JP5123955B2 JP 5123955 B2 JP5123955 B2 JP 5123955B2 JP 2009550152 A JP2009550152 A JP 2009550152A JP 2009550152 A JP2009550152 A JP 2009550152A JP 5123955 B2 JP5123955 B2 JP 5123955B2
Authority
JP
Japan
Prior art keywords
servers
server
network
nms
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009550152A
Other languages
English (en)
Other versions
JP2010519819A (ja
Inventor
イー アルベス,リカルド
エフ ボドネル,レナタ
セレハ,ネブトン
エム リス,ジョナサン
エイ サベット,サメー
Original Assignee
タイコ エレクトロニクス サブシー コミュニケーションズ エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by タイコ エレクトロニクス サブシー コミュニケーションズ エルエルシー filed Critical タイコ エレクトロニクス サブシー コミュニケーションズ エルエルシー
Publication of JP2010519819A publication Critical patent/JP2010519819A/ja
Application granted granted Critical
Publication of JP5123955B2 publication Critical patent/JP5123955B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1051Group master selection mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Description

関連出願の説明
本願は2007年2月15日出願の米国仮特許出願第60/890,155号明細書の利益を主張するものであって、その仮出願の内容はすべて参照により本明細書に援用する。
本開示はネットワーク管理に関し、特に分散型ネットワーク管理システムに関する。
ネットワーク管理は、ネットワークの故障を回避すると共にネットワークの性能を確保するために、異なるレベルで様々な種類のネットワークにおいて行われ得る。通信ネットワークでは、ネットワーク内のネットワーク要素を監視し管理するために要素管理システム(EMS)が使用され得る。また、通信ネットワークは、いくつかのEMSと通信することによってネットワーク全体を管理するネットワーク管理システム(NMS)を含み得る。
波調分割多重化(WDM)システム等の光通信システムでは、例えば、終端やケーブル局がケーブルセグメントによって相互接続されてネットワークが形成され得る。光通信システムのネットワーク要素は、ケーブル局に接続された装置(例えば、中継器及び等価器)と同様にケーブル局に配置される装置(例えば、終端装置及び電力供給装置)も含み得る。そのようなシステムでは、EMSはケーブル局に(又は別の場所に)配置され、このケーブル局に関連するネットワーク要素を管理するために使用され得る。EMSは要素管理機能を実行するための1つ又は複数のサーバー及びユーザーインターフェイスを提供するための1つ又は複数のワークステーションを含み得る(例えば、EMSによって管理されるネットワーク要素に関連する情報を表示する)。NMSは光通信システム全体、即ちネットワークを管理するためにケーブル局のいずれか又は別の場所に配置され得る。
ネットワークの管理には、構成管理、故障管理、性能管理等が含まれ得る。EMSでは、EMSが管理するネットワーク要素から転送されるアラーム、イベント、及びシステムメッセージを取得、記憶、及び/又は表示することによって故障管理を行うことができる。EMSでは、伝送品質データを取得、記憶、表示、及び/又は測定することによって性能管理を行うことができる。NMSでは、各EMSから転送されるアラーム、イベント、及びシステムメッセージの全てと伝送品質データとを管理することによってネットワーク全体を対象とした故障管理及び性能管理を行うことができる。NMSは、各EMSから受信した故障情報や性能情報を例えばネットワークの構成配置マップ上に表示することができる。
図1の例に示すように、NMSによって表示され得る情報の1つのタイプは、内在するEMSによって管理されるネットワークアラームステータスである。ユーザー(例えば、ネットワーク管理者又はオペレーター)は表示された情報を監視して、ネットワークアラームがネットワーク停止の原因となり得るネットワーク内の故障を示しているか判別することができる。アラーム概要情報は、アラームのレベル(例えば、重大、軽微、なし、使用不可/報告なし)と、重大アラーム及び軽微アラームの発生数とを示すことが可能である。
図2に示すように、アラームステータス情報は各EMSサーバー20とNMS 22との間で階層的手法を用いて通信され得る。一実施形態によると、NMSにある1つ又は複数のコンピュータがEMSサーバー20から情報を受信する1つ又は複数のサーバー(例えば、単一のサーバー又は冗長なサーバー)として構成され得る。そして(例えば、図1に示すように)NMSはアラーム概要情報をネットワーク内のEMSごとに表示することが可能である。
別の可能な実施形態によると、NMS機能をEMSサーバーに分散すること(即ち、各EMSに設置されたミニNMS機能)によって、NMSは物理的NMSサーバー又は層なくして形成できる。しかし、NMS層を持たない分散されたNMSを用いて、完全なネットワークのステータスの概要画面を提供することがなお望ましい。これを実現するため、各EMSは、最も高いレベルのアラームステータスを「マスター」サーバーに提示することによって単一の「マスター」サーバーと通信することができる。それに対して、「マスター」サーバーは各EMSサーバーに、ネットワーク中の全EMSサーバーに対するアラームステータスの統合された画面を提供することができる。そして、(例えば図1に示すように)ネットワーク内のEMS毎のアラーム概要情報はEMSのワークステーション上に表示され得る。したがって、この分散されたNMS手法はまた、階層的手法を使用、即ちNMSサーバーではなくマスターEMSサーバーを使用することもできる。
階層的手法のシステム動作はNMSサーバー又はマスターサーバーに大きく依存し、処理の負荷集中を招き、故障ポイントとなり得る。NMSサーバー又はマスターサーバーが故障すると、或いはネットワークファイバが切断されると、アラーム及びステータス共有機能も故障する恐れがある。また、分散されたNMSシステムで利用可能な単純なTCP/IPクライアントサーバーに基づく通信モデルでは不十分である可能性があり、処理および伝送のリソースを必要とすると考えられる。
本開示によるこれら及び他の特徴や利点は、図面を参照しながら以下の詳細な説明を読めば理解を深めることができよう。
ネットワーク管理システム(NMS)のグラフィカルユーザーインターフェイス(GUI)レポートを示す図である。 要素管理システム(EMS)とNMSとの間のデータ共有化のための階層的手法を示す概略図である。 本開示によるEMS−NMSを使用した分散型ネットワーク管理手法を示す概略図である。 ネットワークで故障が発生した場合の、本開示によるEMS−NMS(上記にコメント)を使用した分散型ネットワーク管理手法を示す概略図である。 本開示による分散型ネットワーク管理システムの一部分の論理的な上位レベルのアーキテクチャの実施形態である。 本開示によるネットワーク管理システム機能の実施形態である。 本開示によるNMSサーバーアプリケーションの状態遷移図の実施形態である。 本開示による別のNMSサーバーのランタイムステータスのチェック方法を示すフローチャートである。 DCNの故障が発生し修理される場合の本開示によるNMSサーバーのアクティブ化と非アクティブ化を示すタイミング/状態図である。 本開示による2つのアクティブなNMSサーバーの間でランタイム優先度を決定する方法を示すフローチャートである。 本開示による光トランスポート層ネットワークを示す。 本開示による例示的な一ワークステーション機能のGUIを表す図である。 本開示によるワークステーション機能のGUIを表す図であり、ネットワーク要素のユニット画面の例を示す。
一般に、本開示による分散型ネットワーク管理システムはネットワーク内の各ハードウェアサーバーにNMS機能を含むことができる。各ハードウェアサーバーはまた、EMS機能を含むこともできる。本明細書中で用いられるように、NMS機能及びEMS機能を含むハードウェアサーバーはEMS−NMSサーバーと称される場合がある。全体的なネットワークドメインが機能している場合、ホストとしてドメインにNMS機能を提供する役割をサーバーの1つに割り当てて、そのサーバーと他のサーバーとでEMSタイプの機能を実行するようにしてもよい。ホストサーバーが利用不可となった場合は、ネットワーク内の他のサーバーのいずれかをホストとしての役割を果たすよう割り当てることができる。また、例えばネットワークファイバの断線等のネットワーク故障の場合は、個々に作成されたネットワーク「アイランド」即ちドメインでNMS機能を果たすよう個々のホストサーバーを自動的に、つまりオペレーターの介在なく、割り当てることができる。一例では、元々のホストNMSを第1のアイランドのホストとして割り当てて、新しいNMSホストを第2のアイランドのホストとして割り当てることが可能である。ネットワーク故障が復旧されると、ドメイン即ち「アイランド」は自動的に、つまりオペレーターの介在なく、崩壊し、サーバーの1つ(例えば、元々のホストサーバー)にNMS機能が自動的に割り当てられ得る。
本明細書に説明する例示的な実施形態によれば、各EMS−NMSサーバーはデータ通信ネットワーク(DCN)を用いて、他の各EMS−NMSサーバーとネットワーク情報を共有し得る。本明細書で使用するように、サーバーという用語は、ネットワークリソースを管理するソフトウェア及び/又はハードウェアのことをいい、単一のコンピュータ又は装置に限定されるものではない。一例では、ネットワークステータスデータは、EMS−NMSによって管理されているネットワーク要素によってEMS−NMSに転送されたアラームを表すEMSアラームステータスデータを含む。アラームステータスに加えて、ネットワークステータスデータは、回線監視装置の状態又は他のステータスデータ等、EMS−NMS間で共有される他のタイプの情報を含んでもよい。しかし、本開示は、アラームステータスデータ又はEMS−NMSステータスデータに限定されるものではない。本明細書で用いられるように、ネットワークステータスデータは、ネットワーク全体のステータス及び/又はそのネットワーク内の1つ又は複数の特定のネットワーク要素のステータスに関係する任意のタイプのデータを含んでいてもよい。共有化されたネットワークステータスデータの一部(例えば、アラーム概要情報)が、ユーザーインターフェイスを用いて、例えばホストEMS−NMSサーバーにログインしたクライアントワークステーション上のグラフィカルユーザーインターフェイス(GUI)を用いて表示されるようにしてもよい。
図3を参照すると、EMS−NMSサーバー30−1〜30−nが、ネットワークステータスデータをEMS−NMSサーバー30−1〜30−n間で共有する。ネットワーク内のEMS−NMSサーバー30−1〜30−nのそれぞれは、EMS−NMSサーバーの全てに関連するネットワークステータスデータを示すメッセージ又は通知を送信及び受信することができる。EMS−NMSサーバーは、他の登録されたEMS−NMSサーバーにメッセージを、例えばEMS−NMSサーバーがメッセージを他のサーバーにブロードキャストするスター型/ブロードキャスト方法を用いて、又はEMS−NMSサーバー30−1〜30−nがメッセージを隣接するサーバーに送信する環状メッセージキュー(CMQ)方法を用いて送信することができる。EMS−NMSサーバー30−1〜30−nの1つ又は複数が、例えば、サーバーの故障又はDCNリンクの故障により、報告不可となっていないか又は利用不可となっていないかを判定するために、追加的なメッセージ及び/又は通知を送信するようにしてもよい。
ENS−NMSサーバーのいずれか、例えばサーバー30−1を、NMS機能を実行するためのホストサーバーとして割り当てることができる。この割り当ては、個別に行うことも、クライアントサーバーでルックアップテーブルを使用する等して自動的に行うこともできる。ホストENS−NMSサーバーが故障した場合、他のサーバー(例えば30−2〜30−n)のいずれかが自動的にホストサーバーとして割り当てられることが可能である。
ネットワークが個々のドメイン即ちアイランドに分割された場合、個々のドメインのそれぞれに対してEMS−NMSサーバーをホストサーバーとして割り当てることができる。即ち、ドメインごとにホストサーバーを1つずつ割り当てられた複数のホストサーバーができる。図4に示すように、DCNファイバの断線等のネットワーク故障により、ネットワークが別々のドメイン402、404に分断される場合がある。別々のドメイン402、404に分離され、即ち、互いに通信できなくなると考えられる。例えば、例示した実施形態では、サーバー20−1と20−8〜20−nが第1のドメイン402に分割され、サーバー20−2〜20−7が第2のドメイン404に分割され得る。ネットワーク故障の結果として、ドメイン、例えば第1のドメイン402内のEMS−NMSサーバーはもう一方のドメイン、例えば第2のドメイン404内のサーバーと通信できなくなると考えられるが、各ドメイン内のサーバー間の通信は存続可能である。
本開示によるシステムでは、個々のドメインが作成されると、例えばクライアントサーバーでルックアップテーブルを使用するか、又はローカルホストサーバーのルールに従い、各ドメインに対してホストサーバーを自動的に割り当てることが可能である。例えば、サーバー20−2がドメイン404のホストEMS−NMSサーバーとして割り当てられ、サーバー20−1がドメイン402のホストサーバーとして割り当てられ得る。ネットワーク故障が復旧され、ネットワークドメイン即ち「アイランド」が崩壊すると、個々のアイランドのホストサーバーは、修復されたネットワークに対し、自動的に割り当てられるホストサーバー、例えばサーバー20−1にホストサーバーステータスを与えることができる。
図5は、本開示による分散型ネットワーク管理システムの一部分における論理的な上位レベルのアーキテクチャ500の実施形態を示す。論理アーキテクチャ500は1つ又は複数の要素管理システム機能(EMS)、例えばEMS 50−1、EMS 50−2を備えることができる。各EMS機能はEMS−NMSハードウェアサーバーに常駐することができる。EMSの機能にはトランスポートネットワーク58のコンポーネントの管理を含めることができる。トランスポートネットワークのコンポーネントには、回線終端装置、電力供給装置、ケーブル(例えば、海底ケーブル)及び/又はその他の装置が含まれ得る。
EMSの機能は、更に、ネットワーク管理システム(NMS)機能、例えばNMS 54との通信も含むことができる。NMS機能はEMS−NMSハードウェアサーバーに常駐することができる。NMS 54はノースバウンドインターフェイス(例えばNBI 52−1、NBI 52−2)を介して、内在するEMS(例えばEMS 50−1、EMS 50−2)と通信することができる。一実施形態では、ノースバウンドインターフェイスはCORBA(共通オブジェクト・リクエスト・ブローカー・アーキテクチャ)ノースバウンドインターフェイスとすることができる。CORBAノースバウンドインターフェイスは、分散型アプリケーションの間で、即ち様々なコンピュータ上で動作し同一のオペレーティングシステムを共有できないアプリケーションの間で通信を提供することができる。更に、様々なプログラム言語を使用して、アプリケーションを実装することができる。別の実施形態では、ノースバウンドインターフェイスをSNMP(簡易ネットワーク管理プロトコル)インターフェイスとすることができる。別の実施形態では、ノースバウンドインターフェイスをTL1(Transaction Language 1)インターフェイスとすることができる。
NMS 54は更にクライアントワークステーション機能(WSF)、例えばWSF 56−1、WSF 56−2と通信することができる。WSFはワークステーションに常駐することができる。ワークステーションは、EMS−NMSハードウェアサーバーと一緒に、例えばケーブル局に配置されてもよい。更に/或いは、ワークステーションは、例えばNOC(Network Operations Center)等の顧客施設でのスタンドアローンであってもよい。WSFはグラフィカルユーザーインターフェイス(GUI)を含んでもよい。WSF GUIを介してユーザーに分散型ネットワークのステータスを表示することができる。WSF GUIを介してユーザーにネットワーク管理情報を表示することができる。ユーザーはWSF GUIを使用して、例えばステータスを要求すること及び/又はネットワークの再検出を促すことができる。
上記で述べたように、NMS機能(例えば、NMS 54)、EMS機能(例えば、EMS 50−1)、及びNBI(例えば、NBI 52−1)は、1つのハードウェアサーバー(EMS−NMSサーバー)に共存してもよい。WSF(例えば、WSF 56−1)は、EMS−NMSサーバーと一緒に配置されるワークステーションに常駐してもよい。一部の実施形態では、ネットワークドメインごとにたった1つのNMS機能が、特定の時点においてそのドメインをアクティブに管理することができる。このため、NMS機能は、たった1つのNMS機能で、確実にドメインをアクティブに管理できる機能を含んでもよい。NMS機能は、更に、アイランドの原因となるネットワーク故障、及び/又はハードウェアサーバー故障、及び/又はネットワークをアクティブに管理しているNMS機能の障害が発生した場合には、別のNMS機能をアクティブにする機能を含んでもよい。NMS機能は、アイランドの原因となるネットワーク故障が修復した時には追加のNMS機能の非アクティブ化をサポートする機能を含んでもよい。
図6は、本開示によるNMS機能600の実施形態を示す。NMS機能600は1つまたは複数のモジュールを含むことができる。各モジュールは、独立したランタイムプロセスにすることができ、1つ又は複数のアプリケーションコンポーネントを含むことが可能である。各アプリケーションコンポーネントは、特定の管理機能(例えば、特化したCORBAサーバントを実現する等)を実行するように特化することができる。本明細書で用いるように、CORBAサーバントは、CORBAオブジェクトの機能を実現するために使用するプログラム言語内のデータ構造又はオブジェクトを含んでもよい。
NMS機能600は、OSF(運用サポート機能)モジュール610と、NBI(ノースバウンドインターフェイス)モジュール620と、関係マネージャモジュール630と、CORBAネームサービス640と、CORBAイベントサービス650とを含むことができる。各モジュール610、620、630はそれぞれ、関連するアプリケーションマネージャコンポーネント612、622、632を備えることが可能である。OSFモジュール610は更に、トポロジーマネージャコンポーネント614、パフォーマンスマネージャコンポーネント616、及び故障マネージャコンポーネント618を含むことができる。NBIモジュール620は、更にプロトコルコンポーネント624を含むことができる。関係マネージャモジュール630は、更に関係マネージャコンポーネント634を含むことができる。各モジュール610、620、630は、CORBAサーバントのオブジェクトリファレンスをCORBAネームサービス640に発行し、CORBAイベントサービス650を介して自律通知メッセージを送信及び/又は受信することができる。モジュールのライフサイクルは、そのモジュールの関連するアプリケーションマネージャコンポーネントによって制御し、それ以外のコンポーネントは、それに応じてアクティブ化及び/又は非アクティブ化することができる。
OSFモジュール610はNMS機能600の他のどのモジュールからも独立して実行することができる。OSFモジュールのアプリケーションマネージャコンポーネント612で、NMS機能600のランタイム動作を制御することができる。例えば、OSFモジュールのアプリケーションマネージャコンポーネント612では、クライアントがアクティブにサポートされるかどうかを判別することができる。
図7は、本開示によるOSFモジュールのアプリケーションマネージャコンポーネント(「サーバーアプリケーション」)の状態遷移図700の実施形態を示す。状態遷移図700は、状態及び状態の遷移を含む。状態には、サーバーアプリケーションが実行する1つ又は複数のタスクが含まれる。状態は、更にサーバーアプリケーションがその状態においてサポートできるサービスを特定することができる。例えば、サービスは、ユーザーにより(例えば、WSF GUIを介して)要求されたときのランタイムのステータスチェックを含むことができる。状態遷移は、アプリケーションマネージャコンポーネントの実行、セルフ健全性チェックの動作、及び/又はユーザーが発行した要求で到達するマイルストーンによって支配することができる。状態遷移は状態間及び/又は状態内であってよく、自律メッセージを介してクライアントアプリケーションに通知することができる。
起動710時、サーバーアプリケーションはまず初期化に必要とするローカルリソースの利用可能性をチェックすることができる。サーバーアプリケーションはまた、提供する機能に対するランタイムサポートの利用可能性もチェックすることができる。言い換えれば、サーバーアプリケーションは、ランタイム環境が適切に構成されていること、及びサーバーセッションを初期化するためのリソースが利用可能であることを検証することができる。例えば、サーバーアプリケーションはアプリケーション構成ファイル、サーバー構成、及び/又はシステムリソースの利用可能性を検証することができる。ローカルリソース及び/又はランタイムサポートが利用可能であれば、サーバーアプリケーションは初期化状態720に遷移することができる。或いは、サーバーアプリケーションは該当するメッセージ(例えば、初期化故障)を記録し、シャットダウン状態780に遷移するようにしてもよい。
初期化状態720では、サーバーアプリケーションは、ランタイムでのサーバーアプリケーションの動作を定義し、サーバーアプリケーションが従うステップを支配するランタイム構成ファイルを処理する。一実施形態では、サーバーアプリケーションがケーブルシステムのトポロジーの検出を実行するのか、それとも予め作成されたネットワークのトポロジー構成ファイルを処理するのかを、ランタイム構成ファイルによって決定する。サーバーアプリケーションでは更に、トポロジー検出を実行した後、トポロジー構成ファイル(存在する場合)を自動的に上書きするかどうかも決定する。別の実施形態では、ランタイム構成ファイルは、サーバーアプリケーションが他のサーバーアプリケーションのインスタンスと共存するかどうか、及びサーバーアプリケーションのインスタンスをアクティブ化する優先順位の状態を決定してもよい。別の実施形態では、ランタイム構成ファイルは、サーバーアプリケーションの競合を検出する間隔を含むと共に、他のサーバーホスト(即ち、EMS−NMSハードウェアサーバー又はEMS若しくはNMSソフトウェアサーバー)が利用可能であるかどうかを示すようにしてもよい。
初期化状態720で、サーバーアプリケーションは、クライアントユーザーからのそのランタイムステータスに関する要求に応えることができる。サーバーアプリケーションはスタンバイ状態770から初期化状態720へ、例えばユーザーの要求(ユーザーが発行したアクティブ化要求等)に応答して遷移する。サーバーアプリケーションはまた、起動状態710から初期化状態720に遷移することもできる(即ち、初期化及び/又はランタイムサポートにリソースが利用可能となる)。
サーバーアプリケーションは初期化状態720で1つ又は複数のタスクを実行する。このタスクには、例えばCORBAネームサービス(CORBAネームサービス640等)を使用して、サーバーアプリケーションサーバントを作成して登録することを含めることができる。このタスクには更に、例えばCORBAイベントサービス(CORBAイベントサービス650等)を使用して、自律メッセージ用のチャネルを作成することを含めることができる。一実施形態では、当該タスクには、アクティブである可能性がある他のサーバーアプリケーション(即ち、他のNMS機能)との競合を検出して防止することを含めることができる。タスクには更に、ユーザーによって定義されたアプリケーション構成の同期化を保証することを含めることができる。タスクには更に、適切なトポロジーアップロードオプションを検出及びトリガすることを含めることができる。
例えば、サーバー競合の検出では、サーバー競合が検出されない場合もあれば、サーバー競合が検出される場合もある。サーバー競合が検出されない場合、サーバーアプリケーションは次の適切な状態に遷移する。次の適切な状態は、サーバーアプリケーションのランタイム構成ファイルに従って決定することが可能である。例えば、サーバーアプリケーションは構成ファイルのアップロード状態730又はトポロジーの検出状態740に遷移する。
サーバー競合が検出され、競合しているサーバーと接続できない場合、サーバーアプリケーションは次の適切な状態に遷移できる。次の適切な状態は、サーバーアプリケーションのランタイム構成ファイルに従って決定することが可能である。例えば、サーバーアプリケーションは構成ファイルのアップロード状態730又はトポロジー検出状態740に遷移する。例えば、サーバーアプリケーションのローカルでDCN故障が発生した場合は、サーバーアプリケーションを切り離すことが可能である。この場合、サーバーアプリケーションは、競合の可能性がある別のNMSインスタンスと接続できなくしてよい。DCN故障を修復すると、この状況が復旧する。
競合が検出されたが、競合しているサーバーと接続できる場合は、以下のシナリオを発生させることができる。競合しているサーバーをアクティブ化する優先度が、初期化しているサーバーアプリケーションインスタンスの場合よりも高いならば、サーバーアプリケーションは対応するメッセージを記録してスタンバイ状態770に遷移する。競合しているサーバーをアクティブ化する優先度が、初期化しているサーバーアプリケーションインスタンスの場合よりも低いならば、サーバーアプリケーションはそのランタイム構成ファイルに従って次の適切な状態に遷移する。競合しているサーバーをアクティブ化する優先度が初期化しているサーバーアプリケーションインスタントと同じである場合、初期化しているサーバーアプリケーションをアクティブ化する優先度が競合しているサーバーのアクティブ化優先度より高ければ、サーバーアプリケーションはそのランタイム構成ファイルに従って次の適切な状態に遷移する。それ以外であれば、サーバーアプリケーションは該当するメッセージを記録し、スタンバイ状態770に遷移する。アクティブ化の優先度は、以下に詳細に説明するランタイムステータスチェック及び競合検出プロトコルに基づくものとすることができる。
サーバーアプリケーションは次のように初期化状態720から遷移する。サーバーアプリケーションは、初期化が完了すると、そのランタイム構成ファイルに応じて、構成ファイルのアップロード状態730及び/又はトポロジー検出状態740に遷移する。サーバーアプリケーションは、サーバーの競合検出の結果として、及び/又はクライアントが発行したスタンバイ要求に応答して、スタンバイ状態770に遷移する。サーバーアプリケーションは、シャットダウン要求に応答してシャットダウン780に遷移する。この状態中に処理され得るユーザー要求には、ランタイムステータスチェック、サーバースタンバイ、及び/又はサーバーシャットダウンが含まれる。
スタンバイ状態770において、サーバーアプリケーションはネットワークをアクティブに監視しなくてもよい。アクティブ化要求が受信されると、サーバーアプリケーションは初期化状態720に遷移し、そのランタイム構成に応じて処理を続行することができる。サーバーアプリケーションは、クライアントが開始した要求に応答してスタンバイ状態770に遷移する。例えば、システムの保守が実行される場合、ユーザーはWSF GUIを使用してスタンバイ要求を発行することができる。
サーバーアプリケーションは、サーバーの競合を検出した結果としてスタンバイ状態770に遷移する場合がある。例えば、単一のサーバー環境ではサーバー競合は初期化状態720の期間、及び/又はネットワーク管理がアクティブな期間(即ち、実行状態760)に検出され得る。更に、サーバーアプリケーションはNMSインスタンス統合プロトコル(以下に詳細を説明)に従ってスタンバイ状態770へ自主的に遷移する。
サーバーアプリケーションは、クライアントが発行したアクティブ化要求に呼応してスタンバイ状態770から初期化状態720へ、及び/又は、シャットダウン要求に呼応してスタンバイ状態770からシャットダウン状態780に遷移する。スタンバイ状態770中に処理され得るユーザー要求には、ランタイムステータスチェック、サーバーのアクティブ化、サーバースタンバイ、及びサーバーのシャットダウンが含まれる。
構成ファイルのアップロード状態730で、サーバーアプリケーションは既存のトポロジーの構成ファイルの処理を試み、その内容に基づいてネットワークで管理されるエンティティを作成する。内在するEMSシステムと接続するだけで、ネットワーク構成エンティティのランタイムステータスを更新することができる。サーバーアプリケーションは、構成ファイルのアップロード状態730中に1つ又は複数のタスクを実行する。これらのタスクとしては、管理対象要素の作成、トポロジー関連のイベントチャネルの作成、及び/又は、管理対象情報の更新などがある。これらのタスクの実行中に発生し得る異常及び/又は例外を、記録することが可能である。
サーバーアプリケーションは、トポロジーのアップロードが正常に完了すると、構成ファイルのアップロード状態730からアラームの同期化状態750に遷移する。トポロジー構成をアップロードできない場合、サーバーアプリケーションはトポロジーを検出する状態740に遷移する。
サーバーアプリケーションは、構成ファイルのアップロード状態730から、クライアントが発行したスタンバイ要求に呼応してスタンバイ状態770に、及び/又は、シャットダウン要求に呼応してシャットダウン状態780に遷移する。構成ファイルのアップロード状態730になっている間に処理されるユーザー要求には、ランタイムステータスチェック、サーバースタンバイ、及びサーバーのシャットダウンが含まれる。
トポロジー検出状態740で、サーバーアプリケーションはネットワークトポロジーの検出及び/又はネットワークで管理されるエンティティの作成を実行する。サーバーアプリケーションは、トポロジー及び最新の構成情報を提供するのに、内在するNBIシステムに依存する。サーバーアプリケーションは、トポロジーの検出状態740の間に、1つ又は複数のタスクを実行する。このタスクとしては、NBIケーブルシステムのネーミングサービス(例えば、CORBAネーミングサービス640)との接続、システムトポロジーの検出、管理される要素の作成、管理される情報の更新、トポロジー関連のイベントチャネルの作成、ランタイム構成ファイルに従ったトポロジー構成ファイルの生成、及びランタイム構成ファイルに従った、サーバーアプリケーション用のトレールトレースの生成を挙げることができる。異常及び例外が発生した場合はクライアントに通知し、専用のファイルに記録する。正常に作成されたネットワークエンティティだけを管理するようにしてもよい。
サーバーアプリケーションは、クライアントが開始した要求(例えば、WSFクライアントが発行したトポロジーの検出要求)に応答してトポロジーの検出状態740に遷移する。サーバーアプリケーションは、サーバーの起動時にサーバーの競合が検出されない場合は、トポロジーの検出状態740に遷移する。トポロジー情報のアップロードが不成功の場合は、サーバーアプリケーションは構成ファイルのアップロード状態730からトポロジーの検出状態740に遷移する。
サーバーアプリケーションは、トポロジーの検出が正常に完了すると、トポロジーの検出状態740からアラームの同期化状態750に遷移する。サーバーアプリケーションはトポロジーの検出状態740から、クライアントが発行したスタンバイ要求に呼応してスタンバイ状態770に、及び/又はシャットダウン要求に呼応してシャットダウン状態780に遷移する。トポロジーの検出状態740の間に処理され得るユーザー要求には、ランタイムステータスチェック、サーバースタンバイ、及びサーバーのシャットダウンが含まれる。
アラームの同期化状態750では、サーバーアプリケーションは、ネットワークトポロジーを検出及びアップロードする。次に、サーバーアプリケーションは、アクティブアラームリストの内容をクリアする。サーバーアプリケーションは、NBIインターフェイス(例えば、NBI 52−1、52−2)を介して内在するEMSシステムと故障情報を再度同期化する。サーバーアプリケーションは、アラームの同期化状態750の間に1つ又は複数のタスクを実行する。これらのタスクとしては、現行のアラームリストのクリーンアップ、EMSが作成したイベントチャネルへの接続、アラームと内在するEMSとの同期化、及びクライアント(例えばWSF 56−1、56−2)への非応答性のEMS NBI及びイベントチャネルの通知を挙げることができる。
サーバーアプリケーションは、アラームの同期化が正常に完了すると、アラームの同期化状態750から実行状態760に遷移する。サーバーアプリケーションは、アラームの同期化状態750から、クライアントが発行したスタンバイ要求に呼応してスタンバイ状態770へ、及び/又は、シャットダウン要求に呼応してシャットダウン状態780に遷移する。アラームの同期化状態750の間に処理され得るユーザー要求には、ランタイムステータスチェック、サーバースタンバイ、及びサーバーのシャットダウンが含まれ得る。
実行状態760では、サービスアプリケーションは、クライアント要求の処理を有効にし、内在するEMSシステムから受信した着信通知を処理する。着信通知として、アラームセット及びアラームクリアを挙げることができる。サーバーアプリケーションは、実行状態760の間に1つ又は複数のタスクを実行する。これらのタスクとしては、自律メッセージの待機及び/又は処理、イベントチャネル接続の管理、クライアント要求の処理、及びクライアントへのハートビート通知の送信を挙げることができる。
ハートビート通知は、サーバー(例えば、サーバーアプリケーション)とクライアント(例えば、WSF)との間の周期的な信号であり、サーバーが実行していることを示す。サーバーアプリケーションは、ハートビート通知を送信する前にランタイム進捗ステータスをリセットする。クライアントはハートビート通知を受信すると、サーバーアプリケーションのランタイムステータスに対する要求を発行する。サーバーアプリケーションはランタイムステータス要求を受信するたびにアクティブなクライアント番号をインクリメントしてランタイム進捗ステータスを更新する。
サーバーアプリケーションはクライアントが発行した要求に応答して、実行状態760からトポロジーの検出状態740に遷移する。サーバーアプリケーションはクライアントが発行した要求に応答して、実行状態760からアラーム同期化状態750に遷移する。サーバーアプリケーションはクライアントが発行したスタンバイ要求に応答して、及び/又はサーバーの競合検出の結果として、実行状態760からスタンバイ状態770に遷移する。サーバーアプリケーションはシャットダウン要求に応答して、及び/又はサーバーの競合検出の結果として、実行状態760からシャットダウン状態780に遷移する。実行状態760の間に処理され得るユーザー要求にはランタイムステータスチェック、サーバースタンバイ、及びサーバーシャットダウンが含まれる。
サーバーアプリケーションは実行状態760から遷移する場合、スケジュールされている周期的な実行状態関連タスクをいずれも停止し、許可済みの未処理リソースのロックをいずれも無条件で解除する。
シャットダウン状態780では、サーバーアプリケーションはランタイムステータス以外のクライアント要求を処理できなくなる。サーバーシャットダウン手順は一旦開始されると中断することができず、着信通知は破棄される。サーバーアプリケーションはシャットダウンされると、EMSイベントチャンネルから切断し、ネーミングサービスから登録を解除し、クライアントに通知を送信し、ログファイルを閉じ、及び/又は使用していたサーバーホストシステムのリソースを解放する。
動作中、分散型ネットワーク管理システムは以下のように機能する。起動時にクライアントユーザー(例えば、WSF 56−1)は既存のアクティブなNMSインスタンスに接続を試みることができる。既存のアクティブなNMSインスタンスが見つからなかった場合、クライアントは起動要求を送信して、NMSインスタンスをアクティブにすることができる。
前述したように、ケーブルシステム内のどのケーブル局でもEMS−NMSハードウェアサーバーにNMS機能をインストールして構成することが可能である。ケーブル局の特定のEMS−NMSハードウェアサーバーを選択して、NMSサーバーのホストとして動作しないようにしてもよい。通常の条件下では、ユーザーが全てのNMSインスタンスを手動でシャットダウン又はスタンバイに設定しない限り、ネットワークでは少なくとも1つのNMSインスタンスがアクティブになる。
所定のネットワークのサーバースイートは、単一又は複数のNMSインスタンスをサポートするように構成することができる。サーバーアプリケーションについては、複数のインスタンスに対して構成された場合、競合を検出するプロトコルの実行を無効にする。単一のインスタンスモードを構成する場合は、競合を検出するプロトコルを実行してネットワーク内でアクティブなNMSインスタンスを1つだけ設定する。このプロトコルは、サーバーのランタイムステータスチェック動作を基礎とすることができる。
ランタイムステータスチェックにより、NMS及びWSFインスタンスは、別のNMSインスタンスのランタイムステータスを要求する。NMS及びWSFインスタンスは、受信した結果に基づいて、そのNMSインスタンスとの関係を決定する。WSFクライアントは、例えば、異なるNMSインスタンスを検索するかどうかを決定することができる。NMSインスタンスは応答を使用して、起動時及びDCN通信破壊復旧時におけるインスタンスアクティブ化競合を解決するようにしてもよい。
ランタイムステータスには、サーバーアプリケーションのランタイム状態、進捗ステータス、及びアクティブ化の優先度という3つのコンポーネントを含む。サーバーアプリケーションのランタイム状態は、インスタンスが現在実行しているライフサイクル(例えば、図7に示すような)の状態に応答する。ライフサイクル状態は、優先度を含むことができる。例えば、優先度(最高位から最低位へ)は、実行、アラームの同期化、トポロジーの検出、構成ファイルのアップロード、初期化、スタンバイ、及びシャットダウンとすることができる。WSFはサーバーアプリケーションのランタイム状態を使用することにより、NMSインスタンスが要求を処理する準備ができているかどうか確認することができる。WSFはまた、アプリケーションランタイム状態を使用してサーバーアプリケーションのランタイム動作を制御する方法を決定することができる。これにより、WSFは該当するNMSインスタンス又は別のNMSインスタンスからサービスを確実に提供される。
サーバーアプリケーションの進捗ステータスは、初期化状態又は実行状態のいずれかで実行されている間のサーバーアプリケーションの相対的な進捗であってもよい。競合の解決は、初期化状態及び実行状態で解決してもよい。例えば、初期化の間に、進捗ステータスでは、どれだけの数の潜在的なNMSサーバーとの接続が行われたかを示す。ドメイン当たりアクティブなサーバーを1つだけにするようにシステムが構成されている場合、この情報を使用してサーバーの複数のインスタンスを検出して阻止することができる。実行状態の間、進捗ステータスは、NMSインスタンスによってサポートされるように登録されているWSFインスタンスの数を示す。初期化状態及び実行状態中に競合解決のプロトコルを実行することができるので、進捗ステータスが他のランタイム状態と一緒にレポートされた場合には、進捗ステータスは意味がないかもしれない。
サーバーアプリケーションのアクティブ化の優先度は、システム構成に基づいて決定可能な優先度を表す指標とすることができる。複数のNMSインスタンスが許可されていない場合、アクティブ化の優先度を使用して優先されるEMS−NMSハードウェアサーバーを特定して、ネットワークを監視するアクティブなNMSのホストとすることができる。アクティブ化優先度の定義は、ネットワークトポロジーとリソースの利用可能性とに依存する。
サーバーアプリケーションのランタイム進捗ステータス及びアクティブ化の優先度は、競合検出のプロトコルをサポートすることができる。サーバーアプリケーションのランタイム進捗ステータス及びアクティブ化の優先度によって、一つのNMSインスタンスがそのランタイム状態を他のNMSインスタンスのランタイム状態と比較できるようにする。一実施形態では、ランタイム競合のチェック時に適用されるこれらの属性の相対的な優先度は構成可能とすることができる。例えば、ランタイム進捗度がアクティブ化の優先度より優先されるように設定された場合、初期化プロセスでより先に進められているNMSインスタンス、及び/又はより多くのクライアントにサービスを提供するNMSインスタンスが優先的にアクティブのままとされる。この構成では、NMSインスタンスの非アクティブ化(即ち、NMSインスタンスのシャットダウン又はスタンバイモードへの移行)に影響され得るクライアントに関連するオーバーヘッドを最小限に抑えることができる。アクティブ化の優先度がランタイム進捗度より優先されるように設定された場合、より高いアクティブ化の優先度を持つNMSインスタンスが優先的にアクティブのままとされるか、又はアクティブになる。優先度が低いNMSインスタンスは、自主的な非アクティブ化に移行することができる。
他の要求と同様、ランタイムステータスチェックはサーバーに要求者の識別情報を提供することができる。要求者の識別情報はインスタンスのタイプ(NMSか、又はWSFか)及びホストを含むため、サーバーは要求者を識別できる。この情報は、DCN破壊後に競合を検出した際に有用になる。
サーバーランタイム構成ファイルでは、ネットワーク内で複数のNMSインスタンスが同時にアクティブになるかどうかを決定する。複数のNMSインスタンスを強制的に設定するのでなく、そのように構成されれば、このメカニズムを使用して1つのNMSインスタンスだけが確実にアクティブになるようにする。複数のNMSインスタンスを許容するかどうかは、システム構成で決定することができる。複数のNMSインスタンスを許容すると、NMSの可用性は高まるもののランタイムオーバーヘッドが大きくなる可能性がある。相対的な費用対効果は、システムに依存すると考えられる。
サーバーが起動すると、NMSインスタンスはネットワークの管理を試み、初期化状態への移行を試みる。複数のインスタンスが許容されると、NMSインスタンスはアプリケーションライフサイクル(例えば、図7に示すような)の中を、実行状態に到達するまで競合をチェックすることなしに進む。アクティブなNMSインスタンスが1つだけ選択されている場合は、以下のセクションで説明するように、サーバー競合検出プロトコルを実行する。
初期化状態及び/又は実行状態の間で競合の検出が発生することがある。競合している可能性があるNMSインスタンスは、サーバーのランタイム構成ファイルで指示される。初期化状態では、アクティブなNMSインスタンスを検出するために、各NMSがローカルサーバーを初めとして、ランタイム構成ファイル内で識別されている潜在的な各サーバーホストと接続する。ローカルネーミングサービスで、NMSインスタンスは自身を公開し、クライアントから(例えば、WSFインスタンスによって)アクセスできるようにする。
例えば、図8を参照すると、単一のNMSインスタンスモードが選択されている場合、初期化しているサーバーはリモートサーバーと接続してそのランタイムステータスの問い合わせ(810)を行う。リモートサーバーは応答する(820)。初期化しているサーバーは応答と自身のランタイムステータスとを比較して(830)、初期化プロセスを継続する(850)か、スタンバイ状態へ遷移する(860)かを、決定する。リモートNMSインスタンスのランタイムステータスがローカルサーバーのランタイムステータスより優先度が高い場合、ローカルサーバーは初期化を中止してスタンバイ状態へ遷移する(860)。それ以外の場合、ローカルサーバーは初期化を継続してアクティブなNMSインスタンスになる(850)。サーバーランタイム構成ファイル内にNMSサーバーのリストと一緒に定義されたサーバー競合検出メカニズムは、サーバーの導入に柔軟性を持たせることができる。例えば、一連の好適なサーバーホストを定義することができる。好適なサーバーホストは、ネットワークトポロジーと、リソースの利用可能性と、ランタイムワークロードの解析及び推定に基づいて選択することができる。
運用中に、例えばケーブル障害が原因で、DCN(データ通信ネットワーク)が破壊される場合がある。DCNが破壊されると、EMS及び/又はWSFクライアントの1つ又は複数の別個のドメインが形成される。ドメイン内の通信は存在するが、ドメイン間の通信は失われると考えられる。破壊される前に、アイランド形成の原因となる故障が存在せず、且つ、単一サーバー構成であると仮定すると、1つのサーバーでネットワークをアクティブに管理することができる。DCNが破壊されると、ネットワークは分割され、アクティブサーバーから分離されたWSFインスタンスは1つ又は複数のNMSインスタンスを追加的にアクティブ化できるようになる。それに応じて、複数のNMSインスタンスが同時にアクティブになることができる。ドメイン当たり1つのサーバーしかアクティブになっていない場合、複数のNMSインスタンスが競合することはない。DCNが復旧すると、複数のNMSインスタンスが競合する可能性がある(即ち、1つのドメイン内に複数のアクティブサーバーが存在する状態になる)。一実施形態では、アクティブNMSインスタンスは、このような競合を解決して、ドメイン当たり1つのアクティブサーバーへの統合を行うことができる。
競合の解決と統合は以下のように達成することができる。各アクティブサーバーのランタイム構成ファイルは、潜在的なNMSサーバーのリストを含むようにしてもよい。アクティブな(即ち、実行状態にある)各NMSサーバーは、他の潜在的なNMSサーバーのそれぞれについてランタイムステータスを定期的にチェックし、それに応じて、スタンバイ状態に移行するかどうかを決定する。各NMSインスタンスはネットワーク内の全てのNMSサーバーのランタイムステータスをキャッシュする。この情報はNMSサーバーが最初に起動されたときに、初期化プロセスの一環として初めに取得可能である。
図9は2つのNMSサーバー(サーバーAとサーバーB)の状態と、他方のサーバー(サーバーBとサーバーAのそれぞれの)のキャッシュ状態を表す例示的なタイミング図900を示すものである。2つのNMSサーバーの状態及びこの2つのサーバーのキャッシュの内容は時間の経過に伴って及び特定のイベント(例えば、DCNアイランドの形成をもたらす故障の発生及び/又は解決)に応答して変化する。タイミング図900に示した時間間隔は、任意であり例示するためのものである。図900は、わかりやすくするために、NMSサーバーを2つだけしか含まない。記載した機能は、いくつのNMSサーバーにでも適用可能にすることができる。
例えば、ケーブルシステムの起動時に、アクティブなサーバーは最終的に他の全てのNMSインスタンスにランタイムステータスを要求する。すでに実行されており正常に接続されたNMSインスタンスは、初期化、スタンバイ、又はシャットダウン状態になる。アクティブサーバーでは、接続に失敗したNMSインスタンスのランタイム状態を不明状態に設定する。受信したランタイムステータス要求ごとに、要求を受信するサーバーは要求側サーバーのキャッシュされたランタイムステータスを更新し、不明に設定する。
図9を参照すると、時間t=0−では、サーバーAは実行状態910になり、サーバーBはスタンバイ状態915になる。サーバーAとBは同じドメイン内に存在する(即ち、サーバーAとサーバーBとの間にアイランドの形成をもたらす故障は発生していない)。時間t=0−より前のある時点では、サーバーAはサーバーBのランタイム状態を正常に要求することができた。サーバーBのキャッシュは、サーバーAがサーバーBのランタイム状態を要求した結果として、サーバーAのランタイム状態が不明915であることを示している。サーバーBはスタンバイ状態にある間、サーバーAのランタイムステータスを要求することができない。サーバーAのキャッシュは、サーバーBのランタイムステータスがスタンバイ910であることを示すことができる。
安定したシステムでは、非アクティブなNMSインスタンスはすべて最終的にスタンバイ状態になる。スタンバイ状態のNMSインスタンスは、アクティブサーバーのランタイムステータスを要求することができない。アクティブサーバーのキャッシュメモリは、他のサーバーのランタイムステータスを示すデータを含み得る。スタンバイ状態にあるサーバーはアクティブサーバーのランタイムステータスを要求することができないので、アクティブサーバーのキャッシュ内のランタイム状態は変化することがない。したがって、アクティブサーバーは他のサーバーのランタイムステータスを更に要求することはないので追加の通信オーバーヘッドは削除される。
例えば、DCN破壊が発生した場合、1つ又は複数のNMSインスタンスをアクティブ化して実行状態に到達してもよい。アクティブなNMSインスタンス(例えば、サーバーA)に、新たにアクティブ化されたサーバー(例えば、サーバーB)が正常に接続できない場合がある。サーバーBがサーバーAに正常に接続できなかった場合、サーバーBはアクティブになることができない(即ち、同じドメイン内にサーバーAとサーバーBが存在する場合)。サーバーBはサーバーAに正常に接続できないので、サーバーBのキャッシュ情報に含まれるサーバーAのランタイムステータスは不明に設定される。
図9を再度参照すると、時間t=0で、DCN故障が発生している。この故障により、サーバーAとサーバーBは通信できなくなっている可能性がある。サーバーAとサーバーBは、別々のドメイン及び/又はアイランドに存在する。時間t=0+で、例えば、サーバーBはWSFからアクティブ化のための要求を受信した可能性がある。したがって、サーバーBは初期化状態925にあると考えられる。サーバーBは、サーバーAのステータスを正常に要求することができず、従ってサーバーBのキャッシュ内のサーバーAのランタイムステータスを不明925に設定し、初期化機能を継続している可能性がある。サーバーAは実行状態920のままであると考えられる。時間t=0から時間t=0+までの間に、サーバーAはサーバーBのランタイムステータスを要求することができる。DCN故障の結果、サーバーBはサーバーAに応答できなくなり、このため、サーバーAのキャッシュ内にあるサーバーBのランタイムステータスも不明920に設定される。時間t=T−で、サーバーBは実行状態935に移行する。サーバーAは、実行状態930を継続する。サーバーAとサーバーBとの間で通信が行われなくても、サーバーAのキャッシュとサーバーBのキャッシュはそれぞれ、他方のサーバーの状態が不明930、935であることを示している。
周期的にサーバーBはサーバーAのランタイムステータスを要求する。例えば、時間t=Tでは、DCN接続が再び確立される。サーバーAとサーバーBは再び正常に通信できるようになる。DCN接続が再び確立されると、次のランタイムチェック時間(例えば、時間t=T+1)では、サーバーBはサーバーAに正常に接続することができる。サーバーAとサーバーBはどちらも実行状態940、945で、サーバーBのキャッシュ内のサーバーAの状態は実行945に設定される。その後、サーバーBは、サーバーAの応答に基づいて、アクティブのままでいるのか、それともスタンバイモードに入るのかを決定する。このランタイムステータス要求により、サーバーAのキャッシュされた情報に含まれるサーバーBのランタイムステータスは不明940へ更新され、サーバーAは次のチェック時間(例えば、時間t=T+2)でサーバーBのランタイムステータスをチェックすることができる。サーバーAがサーバーBのランタイムステータスを要求した結果、サーバーBのキャッシュ内のサーバーAのランタイムステータスは不明955に設定される。サーバーAとサーバーBのランタイムステータスは両方とも、実行950、955のままとなり得る。その後、サーバーAは、サーバーBの応答に応じて、アクティブのままでいるのか、それともスタンバイモードに入るのかを決定することができる。
サーバーBがアクティブのままである場合、サーバーAはスタンバイ状態になり、サーバーBがネットワークで唯一のアクティブサーバーになる。例えば、時間t=T+3では、サーバーAはスタンバイ状態960に遷移し、サーバーBは実行状態965のままとなる。両方のサーバーのキャッシュはいずれも不明960、965に設定されたまま変化なしになる。サーバーBは次のクエリー時間(例えば時間t=T+4)でサーバーAのランタイムステータスを要求する。この要求の結果として、サーバーAのキャッシュ内のサーバーBのランタイム状態は不明970に設定され(即ち、変化なし)、サーバーBのキャッシュ内のサーバーAのランタイム状態はスタンバイ975に設定される。スタンバイ状態では、サーバーAはサーバーBのランタイムステータスを要求しないので、サーバーAのキャッシュ内のサーバーBのランタイム状態は不明970に設定されたままとなる。
図10を参照すると、サーバーAとサーバーBは両方とも実行状態になっている(1010)ので、サーバーの相対的なランタイム優先度に基づいてスタンバイモードに移行するかどうかの決定が行われる(1020)。ランタイム優先度がランタイム進捗度に依存する場合、各NMSインスタンスの相対的な進捗に従って、即ち、各NMSインスタンスがサービスを提供するWSFクライアント数、最終的には各サーバーのアクティブ化優先度に従って、アクティブのままとなるNMSインスタンスが決定される(1050)。ランタイム優先度がアクティブ化優先度に依存する場合(1030)、優先度の高いサーバーがアクティブのままになる(1040)。サーバーが両方ともアクティブ化の優先度が同じである場合、ランタイム進捗度の高いサーバーがアクティブのままになる(1060)。サーバーが両方ともランタイム進捗度が同じである場合、両方ともスタンバイ状態に遷移し(1070)、そのうちの1つがWSFクライアントによって再度アクティブ化される。
EMSによって個別に検出された終端点を、EMS−NMSサーバーが適切なネットワークトレイルに「ソーイング(sew)」した場合に構成管理が実現可能となる。このソーイングは、新しいNMSサーバーがアクティブになったとき、又はユーザーが(例えば、GUIパネルを使用して)ネットワークの再検出を強制実行したときにはいつも発生し得る。
図11は分散型ネットワーク(例えば、海底光ファイバネットワーク)の概略図を示したものである。分散型ネットワークは3つの層を含むことができる。第1の層は光伝送セクション(OTS)層1110とする。OTS層1110は光ファイバと光ファイバの相互接続とを含む。第2の層は光多重セクション(OMS)層1120とすることができる。OMS層1120は光信号の多重化チャネルを含む。第3の層は光チャネル(OCH)層1130とする。
層は1つ又は複数のトレイルを含んでもよい。トレイルは1つ又は複数の接続と少なくとも1つの終端点とを含むようにしてもよい。例えば、OCHトレイル1135は、2つの終端とそれらをつなぐチャネルとを含むようにする。OMSトレイル1125を形成するには1つ又は複数のOMS接続を順番にリンクする。OMS接続は、物理リンク(例えば、ファイバ)に対応するOTSトレイル1115によってサポート可能である。
NMS機能(例えば、NMS 54)は、終端点及びその接続ポインタを検出し、該当する終端点及びその接続ポインタを適切なネットワークトレイルに結合/ソーイングすることにより、動的なトレイル生成を実現することができる。検出及びソーイングはリアルタイムで実行することができ、比較的大きなシステムの場合でも数分しかかからない。トレイル生成及びトレイルインベントリ情報は、故障管理機能(例えば、故障マネージャコンポーネント618)と性能管理機能(例えば、性能マネージャコンポーネント616)の両方で使用することができる。
WSF構成管理機能は、OCHトレイル(例えば、OCHトレイル1135)と関連するユーザー指定の顧客名やメモ等をサポートすることができる。EMS−NMSハードウェアサーバー上に常駐するEMS機能は、装置インベントリのデータベースを維持することができる。NMS機能(例えば、NMS 54)では、EMS(例えば、EMS 50−1)機能からの情報をノースバウンドインターフェイス(例えば、NBI 52−1)を介して取得して格納する。オペレーターは、トランスポートシステムに従って顧客名を割り当てることにより、EMS−NMSアラームレポートとトランスポートシステムNMSによって生成されたものとを比較的に迅速且つ視覚的に関連付けることができ、潜在的なトランスポート障害と海底障害を手動で関連付けるのに役立つ。
管理対象ネットワークの故障又はアラーム管理は、EMS機能のそれぞれからNBI(例えば、NBI 52−1)を介して送られる自動イベント通知(アラーム同期化を含む)によって実現可能である。このアーキテクチャでは、レポートされるアラームとしてNMSシステムアラーム(例えば、不良ハードディスクドライブ、CPUアラーム、DCNアラーム等)を挙げることができる。したがって、故障管理は管理システム自体の故障管理を含むことができる。NMS機能は、ネットワークのアクティブアラームリストのリアルタイムコピーを維持し、登録された各クライアント(例えば、WSF)の自動更新を行う。トラフィックに影響を及ぼすアラームは、1つ又は複数のトレイルと関連付けることができる。WSFクライアントは、NMS機能のクエリーを発行することなしに、アラームをローカルに調査及びフィルタリングすることができるので、DCNトラフィックの増大を抑えることができる。アクティブアラームは、表形式で一覧することも、ネットワークトポロジー図(例えば、図12に示すような)上の発生場所(例えば、監視されているケーブル局又はセグメント)に示すこともできる。図13はユーザーWSFに提供される表示例を示したものである。この表示には、装置ごとの情報へのユーザーアクセスを可能にする「カットスルー」が含まれている。ラインモニタリングシステム(LMS)によって識別される海底セグメントに関するアラームも含めることができる。色を使用して、指定の場所にレポートされているアラームの重大度が最大であることを示すことができる。
ユーザーが選択したトポロジー範囲に基づく追加のトレイルの図もまた、場所ごとにアラームの発生を示すことができる。これにより、ユーザーは装置の故障が及ぼす影響や潜在的な共通の原因を、おそらく調査を長時間しなくても迅速に特定することができる。アクティブアラームリストは、根本原因解析(RCA)機能でも使用され得る。
RCA機能は、ユーザーからの要求があると、特定の範囲内で現在の任意のアラームを解析して親原因又は根本原因を明らかにすることができる。RCA機能は更に、トポロジーベースの正確な故障解析に基づいた、考えられる修正措置を提供することもできる。RCA機能は、海底ケーブルネットワークアーキテクチャ向けに設計することが可能であり、この場合、ルール等のユーザー構成は考慮しなくてもよい。しかし、異常なネットワーク管理ポリシー又は挙動に基づいて、新たに考えられる根本原因を明らかにすること又は自動的なRCAアルゴリズムを無効にすることをユーザーが希望する場合には、ルールを定義する手段を提供してもよい。RCA機能では、管理されるネットワーク要素(NE)挙動モデルと海底ネットワークのトポロジーモデルとを組み合わせて利用することにより、可能性のある根本原因に確実に到達することができる。RCA機能では、アラームが発生したNEの時間的関係と空間的関係の両方を検討することにより、関係のないアラームを効率的にフィルタリングして除外し、複雑なネットワーク故障の場合にユーザーに提供されると考えられる過多なアラームイベントを最小限に抑えることができる。これらの機能により装置ごとにルールを定義することの必要性を効率的になくすことが可能である。RCA機能では、他のトレイル表示メカニズムを補完して海底アラームの根本原因を迅速に特定することができる。トレイル階層内のどこでRCAが開始され得るかに応じて、RCA機能に提供するアラーム情報の適切なスコーピングを自動的に行い、目的のネットワーク範囲での根本原因を特定することができる。
性能管理機能は、前述の構成管理機能によって作成されたトレイルに依存し、クライアントWSFから要求があった場合にのみアクティブにすることができる。EMS−NMSサーバー上のEMS機能は、管理されるネットワーク要素に関連する履歴データのデータベースを維持することができる。したがって、NMS機能と関連付けられた持続的なデータベースにおいてデータを二重化する必要はない。その代り、クライアント(EMS−NMS自動PMレポートジェネレータ機能を含んでもよい)がオプションのフィルタ及びスコーピングを使用してトレイルベースのレポートを要求した場合、ホストの役割を果たすNMSサーバーは該当するEMS機能だけとのNBIを介して、最適化されたデータベースクエリーを開始することができる。これらのサーバーは、トレイルと関連する装置の履歴データを維持することができる。性能管理及びクエリー応答は、NMS DCNトラフィックを最低限に抑えるために最適化することができる。このパラダイムでは、数秒以内にWSF応答を返すことができる。
分散型ネットワーク管理システム及び方法の実施形態、例えばEMS−NMSサーバーのNMS及びEMS機能は、コンピュータシステムで用いるためのコンピュータプログラム製品として実施できる。そのような実装例としては、システム及び方法の観点で本明細書に説明された機能の全部又は一部を具現化する一連のコンピュータ命令が挙げられるがこれに限定されない。一連のコンピュータ命令は、半導体、磁気、光学又は他のメモリ装置等のどのような機械可読媒体に記憶されていてもよく、光学、赤外、マイクロ波又は他の伝送技術等のどのような通信技術を用いて伝送されてもよい。そのようなコンピュータプログラム製品は、取り外し可能機械可読媒体(例えば、ディスケット、CD−ROM等)として分散されていてもよく、コンピュータシステム(例えば、システムROM又は固定ディスク)に予め読み込まれていてもよく、又はネットワーク上でサーバー若しくは電子掲示板(例えば、インターネット又はワールドワイドウェブ)から分配されるようにしてもよいことが予想される。
当業者であれば、そのようなコンピュータ命令は、多くのコンピュータアーキテクチャ又はオペレーティングシステムで使用される多数のプログラム言語で書かれ得ることを理解するはずである。例えば、好適な実施形態は手続きプログラム言語(例えば、「C」)又はオブジェクト指向プログラム言語(例えば、「C++」又はJava(登録商標))で実施してもよい。本開示の代替の実施形態は、予めプログラムされたハードウェア要素若しくはファームウェアとして、又はハードウェア、ソフトウェア及びファームウェアの組み合わせとして実施してもよい。
したがって、分散型ネットワーク管理システム及び方法を用いることによって、1つのサーバーへの依存を最小にしてネットワーク内のサーバー間でデータを共有できる。また、分散型メッセージングはトラフィックフローを軽減し、システムのボトルネックをなくすことができる。
本開示の一態様では、複数のサーバーを備える分散型ネットワーク管理システムが提供されており、当該複数のサーバーのそれぞれは、ネットワーク内のネットワーク要素を管理するための要素管理システム(EMS)機能と、EMS機能を実行する複数のサーバーのうちの複数を管理するためのネットワーク管理システム(NMS)機能とを含んでいる。複数のサーバーが1つのネットワークドメインを共有している場合に、確実に、NMS機能が複数のサーバーのうちの1つでアクティブとなり、複数のサーバーのうちの他の全てで非アクティブとなるように複数のサーバーは構成される。ネットワークドメインが複数のドメインに分割されている場合に、複数のサーバーは複数のドメインのそれぞれと関連付けられた複数のサーバーのうちの1つでNMS機能を自動的にアクティブ化し、複数のネットワークドメインのそれぞれを含むサーバーのうちの他の全てのサーバーでNMS機能が確実に非アクティブとなるように構成される。
本開示の別の態様によれば、ネットワークを管理するための方法であって、複数のサーバーのそれぞれで、ネットワーク内のネットワーク要素を管理するための要素管理システム(EMS)機能と、EMS機能を実行する複数のサーバーのうちの複数を管理するためのネットワーク管理システム(NMS)機能とを提供するステップと、複数のサーバーが1つのネットワークドメインを共有している場合に複数のサーバーのうちの1つでNMS機能をアクティブにするステップと、1つのネットワークドメインが複数のネットワークドメインに分割されている場合に複数のサーバーのうちの少なくとも1つの他のサーバーでNMS機能を自動的にアクティブ化するステップと、を含む方法が提供される。それによって、複数のネットワークドメインのそれぞれは、関連付けされた少なくとも1つのアクティブなNMS機能を有する。
本開示の別の態様によれば、複数のサーバーを備え、当該複数のサーバーのそれぞれがネットワーク内のネットワーク要素を管理するための要素管理システム(EMS)機能と、EMS機能を実行する複数のサーバーのうちの複数を管理するためのNMS機能とを備える分散型ネットワーク管理システムにおいてホストサーバーを割り当てるための方法が提供される。この方法は、複数のサーバーのうちの第1のサーバーを操作して複数のサーバーのうちのリモートサーバーのNMS機能のランタイムステータスを要求するステップと、サーバーのうちのリモートサーバーからの応答を受信するステップと、複数のサーバーのうちの第1のサーバーのランタイムステータスと、複数のサーバーのうちのリモートサーバーのランタイムステータスとを比較するステップと、ランタイムステータスの比較に応答して第1のサーバーをホストサーバーとして初期化するステップとを含む。
本開示の更に別の態様によれば、機械可読な媒体が提供され、この媒体の内容によりコンピュータシステムは、複数のサーバーを備え、当該複数のサーバーのそれぞれが、ネットワーク内のネットワーク要素を管理するための要素管理システム(EMS)機能と、EMS機能を実行する複数のサーバーのうちの複数を管理するためのNMS機能とを備える分散型ネットワーク管理システムにおいて、ホストサーバーを割り当てる方法を実行する。この方法は、複数のサーバーのうちの第1のサーバーを操作して複数のサーバーのうちのリモートサーバーのNMS機能のランタイムステータスを要求するステップと、サーバーのうちのリモートサーバーからの応答を受信するステップと、複数のサーバーのうちの第1のサーバーのランタイムステータスと、複数のサーバーのうちのリモートサーバーのランタイムステータスとを比較するステップと、ランタイムステータスの比較に応答して第1のサーバーをホストサーバーとして初期化するステップとを含む。
本開示の原理が本明細書に説明されてきたが、当業者には分かるように、この説明はあくまでも例示としてなされたものであり、本開示の範囲を限定するものではない。本明細書に示され説明された例示的実施形態に加えて他の実施形態も本開示の範囲において考えられる。当業者による変更及び置換は本開示の範囲のものとしてみなされ、その本開示の範囲は特許請求の範囲以外のものによって限定されるものではない。

Claims (23)

  1. 分散型ネットワーク管理システムであって、
    複数のサーバーを備え、前記複数のサーバーのそれぞれが、ネットワーク内のネットワーク要素を管理するための要素管理システム(EMS)機能と、前記EMS機能を実行する前記複数のサーバーのうちの複数を管理するためのネットワーク管理システム(NMS)機能とを備える分散型ネットワーク管理システムにおいて、
    前記複数のサーバーは1つのネットワークドメインを共有している場合に、確実に、前記NMS機能が前記複数のサーバーのうちの1つでアクティブとなり、前記複数のサーバーのうちの他の全てで非アクティブとなるように構成され、
    前記1つのネットワークドメインが複数のドメインに分割されている場合に、前記複数のサーバーは前記複数のドメインのそれぞれと関連付けられた前記複数のサーバーのうちの1つで前記NMS機能を自動的にアクティブ化し、前記複数のネットワークドメインのそれぞれを含む前記複数のサーバーのうちの他の全てで前記NMS機能が確実に非アクティブとなるように構成されることを特徴とする分散型ネットワーク管理システム。
  2. 前記複数のドメインが前記1つのネットワークドメインに結合された場合に複数の前記複数のドメインのそれぞれと関連付けられたNMS機能を非アクティブ化し、前記NMS機能が前記複数のサーバーのうちのホストサーバー上で確実にアクティブとなるように、前記複数のサーバーが構成されることを特徴とする請求項1に記載の分散型ネットワーク管理システム。
  3. 前記NMS機能が非アクティブとなっている前記複数のサーバーのうちの複数で前記EMS機能が確実にアクティブになるように、前記複数のサーバーが構成されることを特徴とする請求項1に記載の分散型ネットワーク管理システム。
  4. 前記NMS機能がアクティブになっているドメインのネットワークトポロジーを自動的に検出するように、前記NMS機能が構成されることを特徴とする請求項1に記載の分散型ネットワーク管理システム。
  5. 前記複数のサーバーが、前記NMS機能用にネットワーク情報の持続データベースを維持しないことを特徴とする請求項1に記載の分散型ネットワーク管理システム。
  6. 前記NMS機能がアクティブになっている前記ドメイン内で終端点を自動的に検出し、前記終端点を接続して、前記NMS機能がアクティブになっている前記ドメイン用にネットワークトレイルを確立するように、前記NMS機能が構成されることを特徴とする請求項1に記載の分散型ネットワーク管理システム。
  7. 前記NMS機能が、前記ネットワークトレイルを使用する前記ネットワークに対して故障管理を実行するよう構成されることを特徴とする請求項6に記載の分散型ネットワーク管理システム。
  8. 前記複数のサーバーのそれぞれが、前記ネットワークのステータスをユーザーに表示するためのクライアントワークステーション機能(WSF)を更に有することを特徴とする請求項1に記載の分散型ネットワーク管理システム。
  9. ネットワークを管理するための方法であって、
    複数のサーバーのそれぞれで、ネットワーク内のネットワーク要素を管理するための要素管理システム(EMS)機能と、前記EMS機能を実行する前記複数のサーバーのうちの複数を管理するためのネットワーク管理システム(NMS)機能とを提供するステップと、
    前記複数のサーバーが1つのネットワークドメインを共有している場合に前記サーバーのうちの1つで前記NMS機能をアクティブにするステップと、
    前記1つのネットワークドメインが複数のネットワークドメインに分割されている場合に前記複数のサーバーのうちの少なくとも1つの他のサーバーで前記NMS機能を自動的にアクティブ化するステップと、を備え、前記複数のネットワークドメインのそれぞれが少なくとも1つの関連付けされたアクティブなNMS機能を有するものであることを特徴とする方法。
  10. 前記複数のドメインが前記1つのネットワークドメインに結合された場合に複数の前記複数のドメインのそれぞれと関連付けられたNMS機能を自動的に非アクティブにするステップを更に備えることを特徴とする請求項9に記載の方法。
  11. 前記NMS機能が非アクティブになっている前記複数のサーバーのうちの複数で前記EMS機能をアクティブにするステップを更に備えることを特徴とする請求項9に記載の方法。
  12. 前記NMS機能がアクティブになっている前記サーバーのうちの複数でネットワークトポロジーを自動的に検出するステップを更に備えることを特徴とする請求項9に記載の方法。
  13. 前記NMS機能がアクティブになっている前記サーバーのうちの複数で終端点を自動的に検出し、前記終端点を接続してネットワークトレイルを確立するステップを更に備えることを特徴とする請求項9に記載の方法。
  14. 前記ネットワークトレイルを使用する前記ネットワークに対する故障管理を実行するステップを更に備えることを特徴とする請求項13に記載の方法。
  15. 前記ネットワークのステータスをユーザーに表示するためのクライアントワークステーション機能(WSF)を前記複数のサーバーのそれぞれに提供するステップを更に備えることを特徴とする請求項9に記載の方法。
  16. 複数のサーバーを備え、前記複数のサーバーのそれぞれが、ネットワーク内のネットワーク要素を管理するための要素管理システム(EMS)機能と、前記EMS機能を実行する前記複数のサーバーのうちの複数を管理するためのNMS機能とを備える分散型ネットワーク管理システムにおいて、ホストサーバーを割り当てるための方法であって、
    前記複数のサーバーのうちの第1のサーバーを操作して前記複数のサーバーのうちのリモートサーバーのNMS機能のランタイムステータスを要求するステップと、
    前記サーバーのうちの前記リモートサーバーからの応答を受信するステップと、
    前記複数のサーバーのうちの前記第1のサーバーのランタイムステータスと、前記サーバーのうちの前記リモートサーバーの前記ランタイムステータスとを比較するステップと、
    前記ランタイムステータスの比較に応答して前記第1のサーバーをホストサーバーとして初期化するステップとを備えることを特徴とする方法。
  17. 前記複数のサーバーと関連付けられたネットワークトポロジーを自動的に検出するステップを更に備えることを特徴とする請求項16に記載の方法。
  18. 前記複数のサーバーと関連付けられた終端点を自動的に検出し、前記終端点を接続してネットワークトレイルを確立するステップを更に備えることを特徴とする請求項16に記載の方法。
  19. 前記ネットワークトレイルを使用する前記ネットワークに対する故障管理を実行するステップを更に備えることを特徴とする請求項18に記載の方法。
  20. 複数のサーバーを備え、前記複数のサーバーのそれぞれが、ネットワーク内のネットワーク要素を管理するための要素管理システム(EMS)機能と前記EMS機能を実行する前記複数のサーバーのうちの複数を管理するためのNMS機能とを備える分散型ネットワーク管理システムにおいて、ホストサーバーを割り当てる方法を、コンピュータシステムに実行させるための内容を記録した機械により読取可能な記録媒体であって、
    前記方法が、
    前記複数のサーバーのうちの第1のサーバーを操作して前記複数のサーバーのうちのリモートサーバーのNMS機能のランタイムステータスを要求するステップと、
    前記サーバーのうちの前記リモートサーバーからの応答を受信するステップと、
    前記複数のサーバーのうちの前記第1のサーバーのランタイムステータスと、前記サーバーのうちの前記リモートサーバーの前記ランタイムステータスとを比較するステップと、
    前記ランタイムステータスの比較に応答して前記第1のサーバーをホストサーバーとして初期化するステップとを備えたものであることを特徴とする記録媒体。
  21. 前記方法が、前記複数のサーバーと関連付けられたネットワークトポロジーを自動的に検出するステップを更に備えることを特徴とする請求項20に記載の記録媒体。
  22. 前記方法が、前記複数のサーバーと関連付けられた終端点を自動的に検出し、前記終端点を接続してネットワークトレイルを確立するステップを更に備えることを特徴とする請求項20に記載の記録媒体。
  23. 前記方法が、前記ネットワークトレイルを使用する前記ネットワークに対する故障管理を実行するステップを更に備えることを特徴とする請求項22に記載の記録媒体。
JP2009550152A 2007-02-15 2008-02-15 分散型ネットワーク管理システムおよび方法 Active JP5123955B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US89015507P 2007-02-15 2007-02-15
US60/890,155 2007-02-15
PCT/US2008/054100 WO2008101169A2 (en) 2007-02-15 2008-02-15 Distributed network management system and method

Publications (2)

Publication Number Publication Date
JP2010519819A JP2010519819A (ja) 2010-06-03
JP5123955B2 true JP5123955B2 (ja) 2013-01-23

Family

ID=39690817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009550152A Active JP5123955B2 (ja) 2007-02-15 2008-02-15 分散型ネットワーク管理システムおよび方法

Country Status (7)

Country Link
US (1) US8775589B2 (ja)
EP (1) EP2109827B1 (ja)
JP (1) JP5123955B2 (ja)
CN (1) CN101627379B (ja)
CA (1) CA2676925C (ja)
ES (1) ES2545776T3 (ja)
WO (1) WO2008101169A2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8495157B2 (en) * 2007-03-07 2013-07-23 International Business Machines Corporation Method and apparatus for distributed policy-based management and computed relevance messaging with remote attributes
US7962610B2 (en) 2007-03-07 2011-06-14 International Business Machines Corporation Statistical data inspector
WO2008109848A2 (en) 2007-03-07 2008-09-12 Bigfix, Inc. Pseudo-agent
US20080307036A1 (en) * 2007-06-07 2008-12-11 Microsoft Corporation Central service allocation system
US7958386B2 (en) * 2007-12-12 2011-06-07 At&T Intellectual Property I, L.P. Method and apparatus for providing a reliable fault management for a network
US7870251B2 (en) * 2008-01-10 2011-01-11 At&T Intellectual Property I, L.P. Devices, methods, and computer program products for real-time resource capacity management
CN101753610B (zh) * 2008-12-19 2012-11-21 华为技术有限公司 分布式网络构造方法、装置和系统以及任务处理方法
CN101616024B (zh) * 2009-07-16 2012-07-04 中兴通讯股份有限公司 一种业务开通/阻断的方法和系统
US8305877B2 (en) * 2009-09-10 2012-11-06 Tyco Electronics Subsea Communications Llc System and method for distributed fault sensing and recovery
US8966110B2 (en) 2009-09-14 2015-02-24 International Business Machines Corporation Dynamic bandwidth throttling
CN102263651A (zh) * 2010-05-28 2011-11-30 烽火通信科技股份有限公司 Snmp网络管理系统中局端设备连接状态的检测方法
US9130967B2 (en) * 2010-11-17 2015-09-08 Alcatel Lucent Method and system for network element service recovery
CN102685784A (zh) * 2011-03-17 2012-09-19 中兴通讯股份有限公司 一种实现故障告警的方法及装置
CN102761426B (zh) * 2011-04-25 2015-11-18 腾讯科技(深圳)有限公司 一种sns平台唤醒道具的方法及系统
CN103581107B (zh) * 2012-07-19 2017-05-10 国基电子(上海)有限公司 服务器及其设定工作模式的方法
US9639452B2 (en) * 2013-03-15 2017-05-02 Red Hat, Inc. Automated update testing and deployment
CN105282765A (zh) * 2014-06-30 2016-01-27 中兴通讯股份有限公司 一种管理配置信息的方法、设备及网元管理系统
CA2952360C (en) * 2014-07-22 2022-09-06 Nestec S.A. Reclosable packaging with a handle, and methods and devices for making such packaging
JP6378057B2 (ja) 2014-11-13 2018-08-22 株式会社東芝 接続制御装置、接続制御方法、接続制御システムおよびコンピュータプログラム
CN105743673B (zh) * 2014-12-10 2020-04-03 中兴通讯股份有限公司 北向接口及其处理通知消息的方法
US10120552B2 (en) 2015-09-25 2018-11-06 International Business Machines Corporation Annotating collaborative content to facilitate mining key content as a runbook
US10320797B2 (en) 2015-09-25 2019-06-11 International Business Machines Corporation Enabling a multi-dimensional collaborative effort system
US10425452B2 (en) * 2015-09-25 2019-09-24 International Business Machines Corporation Identifying changes in multiple resources related to a problem
US10110466B2 (en) * 2015-11-23 2018-10-23 Tyco Electronics Subsea Communications Llc Optical communication system with distributed wet plant manager
US10230472B2 (en) 2016-06-08 2019-03-12 Subcom, Llc Polarization modulation of supervisory signals for reducing interference with data signals
US10056978B2 (en) * 2016-06-10 2018-08-21 Tyco Electronics Subsea Communications Llc Techniques for provisioning network elements of a data communications network (DCN) and an optical communication system using the same
CN106254540B (zh) * 2016-09-26 2019-11-15 国云科技股份有限公司 一种适用于分布式系统的节点服务监控系统及实现方法
US10466984B2 (en) 2017-05-01 2019-11-05 At&T Intellectual Property I, L.P. Identifying and associating computer assets impacted by potential change to a particular computer asset
US11894969B2 (en) * 2021-07-12 2024-02-06 Ciena Corporation Identifying root causes of network service degradation
US11838172B2 (en) * 2021-08-31 2023-12-05 Juniper Networks, Inc. Identifying root cause of failures through detection of network scope failures
US11871165B2 (en) * 2022-01-21 2024-01-09 Subcom, Llc Enhanced line monitoring and parameter reporting for high fiber count undersea fiber optic transmission systems with multiple switchable branches
CN114760015B (zh) * 2022-03-21 2023-10-13 傲普(上海)新能源有限公司 基于冗余设计和策略控制的ems遥调遥控成功率提升方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000010949A (ja) 1998-06-19 2000-01-14 Nec Corp リレー型分散ヘルスチェック制御システム及び方法
JP3887130B2 (ja) 1999-07-30 2007-02-28 株式会社東芝 高可用性計算機システム及び同システムにおけるデータバックアップ方法
US6732189B1 (en) * 2000-03-20 2004-05-04 International Business Machines Corporation Method and apparatus for fault tolerant tunneling of multicast datagrams
WO2001082678A2 (en) * 2000-05-02 2001-11-08 Sun Microsystems, Inc. Cluster membership monitor
US6785726B1 (en) * 2000-05-08 2004-08-31 Citrix Systems, Inc. Method and apparatus for delivering local and remote server events in a similar fashion
US20030202645A1 (en) * 2000-05-25 2003-10-30 Fujitsu Network Communications, Inc., A California Corporation Element management system with adaptive interface based on autodiscovery from element identifier
US7693976B2 (en) * 2000-07-11 2010-04-06 Ciena Corporation Granular management of network resources
US7769847B2 (en) * 2000-07-13 2010-08-03 Computer Associates Think, Inc. Method and apparatus for a comprehensive network management system
US7409432B1 (en) * 2000-10-19 2008-08-05 International Business Machines Corporation Efficient process for handover between subnet managers
US7403980B2 (en) * 2000-11-08 2008-07-22 Sri International Methods and apparatus for scalable, distributed management of virtual private networks
US20020165962A1 (en) * 2001-02-28 2002-11-07 Alvarez Mario F. Embedded controller architecture for a modular optical network, and methods and apparatus therefor
US20030069953A1 (en) * 2001-09-28 2003-04-10 Bottom David A. Modular server architecture with high-availability management capability
JP3577025B2 (ja) 2001-10-22 2004-10-13 株式会社東芝 サービス提供装置の動作方法
US6993686B1 (en) * 2002-04-30 2006-01-31 Cisco Technology, Inc. System health monitoring and recovery
US20040010538A1 (en) * 2002-07-11 2004-01-15 International Business Machines Corporation Apparatus and method for determining valid data during a merge in a computer cluster
JP4134916B2 (ja) 2003-02-14 2008-08-20 松下電器産業株式会社 ネットワーク接続装置、およびネットワーク接続切替方法
CA2425442A1 (en) 2003-04-15 2004-10-15 Felix Katz Connectivity verification for internet protocol/multi-protocol label switching data communications networks
US7197632B2 (en) * 2003-04-29 2007-03-27 International Business Machines Corporation Storage system and cluster maintenance
CA2467939A1 (en) * 2004-05-20 2005-11-20 Fernando Cuervo Architecture for configuration and management of cross-domain network services
US8180882B2 (en) * 2004-07-22 2012-05-15 Tyco Electronics Subsea Communications Llc Distributed messaging system and method for sharing network status data
CN1305280C (zh) * 2004-09-17 2007-03-14 清华大学 层次光网络中的并行层次光标记交换通道的建立方法
US7787763B2 (en) * 2005-04-04 2010-08-31 Fujitsu Limited System and method for protecting optical light-trails
US20060280117A1 (en) 2005-06-14 2006-12-14 Alcatel Redundancy group status management apparatus and methods
US7742425B2 (en) * 2006-06-26 2010-06-22 The Boeing Company Neural network-based mobility management for mobile ad hoc radio networks

Also Published As

Publication number Publication date
CN101627379B (zh) 2012-08-15
EP2109827A2 (en) 2009-10-21
US8775589B2 (en) 2014-07-08
CN101627379A (zh) 2010-01-13
CA2676925C (en) 2016-01-05
EP2109827A4 (en) 2013-04-03
ES2545776T3 (es) 2015-09-15
WO2008101169A2 (en) 2008-08-21
WO2008101169A3 (en) 2008-10-23
US20080201462A1 (en) 2008-08-21
JP2010519819A (ja) 2010-06-03
EP2109827B1 (en) 2015-06-24
CA2676925A1 (en) 2008-08-21

Similar Documents

Publication Publication Date Title
JP5123955B2 (ja) 分散型ネットワーク管理システムおよび方法
US7076691B1 (en) Robust indication processing failure mode handling
US6832341B1 (en) Fault event management using fault monitoring points
US8086721B2 (en) Network resource management in a network device
US8370466B2 (en) Method and system for providing operator guidance in network and systems management
JP4421817B2 (ja) 向上されたコラボレーション、スケーラビリティ、およびリライアビリティを提供するために接続され得るネットワーク装置のセットのための方法およびシステム
CA2680702C (en) Remotely monitoring a data processing system via a communications network
US9450700B1 (en) Efficient network fleet monitoring
US8266272B2 (en) Methods for IT network representation and associated computer program products
JP3206644B2 (ja) ネットワーク管理方式
CA2434858C (en) Remotely managing a data processing system via a communications network
US20020143942A1 (en) Storage area network resource management
US20030158933A1 (en) Failover clustering based on input/output processors
US8676958B1 (en) System and method for monitoring the status of multiple servers on a network
US20070260721A1 (en) Physical server discovery and correlation
JP2008517358A (ja) ストレージ管理を容易にするための装置、システム、および方法
US11356318B2 (en) Self-healing telco network function virtualization cloud
CN114116912A (zh) 一种基于Keepalived实现数据库高可用的方法
JPH09247144A (ja) 階層型ネットワーク管理方式
US7334038B1 (en) Broadband service control network
US9032014B2 (en) Diagnostics agents for managed computing solutions hosted in adaptive environments
US20060072707A1 (en) Method and apparatus for determining impact of faults on network service
US20050259572A1 (en) Distributed high availability system and method
JP2011035753A (ja) ネットワーク管理システム
CN116112500B (zh) 一种基于故障探测和路由策略的nfs高可用系统及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121002

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121026

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5123955

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250