JP3256506B2 - フォールトトレラントネットワーク管理システム - Google Patents

フォールトトレラントネットワーク管理システム

Info

Publication number
JP3256506B2
JP3256506B2 JP35360398A JP35360398A JP3256506B2 JP 3256506 B2 JP3256506 B2 JP 3256506B2 JP 35360398 A JP35360398 A JP 35360398A JP 35360398 A JP35360398 A JP 35360398A JP 3256506 B2 JP3256506 B2 JP 3256506B2
Authority
JP
Japan
Prior art keywords
sub
manager
managers
main
network management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP35360398A
Other languages
English (en)
Other versions
JP2000181823A (ja
Inventor
康博 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Communication Systems Ltd
Original Assignee
NEC Communication Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Communication Systems Ltd filed Critical NEC Communication Systems Ltd
Priority to JP35360398A priority Critical patent/JP3256506B2/ja
Publication of JP2000181823A publication Critical patent/JP2000181823A/ja
Application granted granted Critical
Publication of JP3256506B2 publication Critical patent/JP3256506B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、エージェント,
サブマネージャ,統合マネージャにより階層的に管理さ
れるフォールトトレラントネットワーク管理システムに
関する。
【0002】
【従来の技術】従来、フォールトトレラントネットワー
ク管理システムでは、システムに壊滅的な障害が発生し
た時にサービスを中断することなく自動復旧を行うため
に、例えば、特開平9−116538号公報に示される
ように、主ネットワーク管理システムの一つに対し、必
ず一つの副ネットワーク管理システムを配置することに
より、フォールトトレラント性を確保していた。また、
大規模なネットワークやローカルエリアネットワーク
(以下、LANという)の様な分散したネットワークを
管理する場合、管理パケットの削減やネットワーク管理
システムの簡略化を計るため、階層構造でエージェン
ト,サブマネージャ,統合マネージャを配置することに
より、ネットワークを管理した方が効果的な場合がある
が、このとき、前記公報に示されるような、主ネットワ
ーク管理システム一つに対し、必ず副ネットワーク管理
システムを一つ取る構成とすると、主サブマネージャm
個を配置して、ネットワーク管理を行う階層構造管理の
構成を取ったとき、副サブマネージャもm個配置する必
要がある。
【0003】
【発明が解決しようとする課題】しかしながら、かかる
従来のフォールトトレラントネットワーク管理システム
では、主ネットワーク管理システムと副ネットワーク管
理システムが固定的に一対一に対応したシステム構成で
あることにより、主ネットワーク管理システムがm個存
在するとき、副ネットワーク管理システムも必ずm個必
要となり、この結果、構成が複雑になるばかりか、シス
テムが高価になるという課題があった。また、ネットワ
ーク管理システムにフォールトトレラント性を確保する
ため、主ネットワーク管理システムm個に対し、副ネッ
トワーク管理システムがm個存在しても、一対の主・副
ネットワーク管理システムが二重障害に陥ると、フォー
ルトトレラント性が確保できないという課題があった。
【0004】この発明は前記課題を解決するものであ
り、複数の主サブマネージャに対しこれよりも少ない副
サブマネージャに、主サブマネージャの障害時の代行管
理を簡単な構成にて、かつ経済的に実現しながら、主サ
ブマネージャの障害に対するフォールトトレラント性を
確保することができるフォールトトレラントネットワー
ク管理システムを得ることを目的とする。
【0005】
【課題を解決するための手段】前記目的達成のために、
請求項1の発明にかかるフォールトトレラントネットワ
ーク管理システムは、ワイドエリアネットワークにルー
タを介して接続された複数のローカルエリアネットワー
クと、これらのローカルエリアネットワークのいくつか
に接続され、これらの各ローカルエリアネットワーク内
の管理オブジェクトを管理,制御する冗長構成を持たな
い主サブマネージャとを設け、前記ローカルエリアネッ
トワークの残りに接続した冗長構成を持つ統合マネージ
ャに、前記各主サブマネージャおよび前記ワイドエリア
ネットワークを介してこれらの管理オブジェクトを管
理,制御させるようにし、該統合マネージャを接続した
ローカルエリアネットワークに接続した前記主サブマネ
ージャの総数より少ない複数の副サブマネージャに、障
害発生したいずれかの前記主サブマネージャの機能を代
行させる構成としている。そして、前記統合マネージャ
が主サブマネージャの障害を認識した場合、前記統合マ
ネージャは、空きの状態の副サブマネージャに対し、障
害のある主サブマネージャの代行を要求するメッセージ
をSNMPを用いて送信すると共に、該要求メッセージ
には、代行すべき主サブマネージャのIPアドレス,そ
の属するLANのネットワークアドレス,該LANを接
続するルータアドレスを合わせて送信するようにしたも
のである。
【0006】また、請求項2の発明にかかるフォールト
トレラントネットワーク管理システムは、前記副サブマ
ネージャの数を、主サブマネージャがどの程度の確率で
同時に障害となる可能性があるかにもとづいて設定した
ものである。
【0007】また、請求項3の発明にかかるフォールト
トレラントネットワーク管理システムは、前記ローカル
エリアネットワークのそれぞれに、これらの資源単位に
構成情報,状態情報等の管理オブジェクトを管理,制御
するエージェントを接続したものである。
【0008】また、請求項4の発明にかかるフォールト
トレラントネットワーク管理システムは、前記各主サブ
マネージャとこれに対応するエージェントとの間、前記
統合マネージャと各主サブマネージャとの間、前記各副
サブマネージャと前記各エージェントとの間、および統
合マネージャと各副サブマネージャとの間で、それぞれ
シンプルネットワークマネージメントプロトコルを使用
して前記管理オブジェクトを管理するようにしたもので
ある。
【0009】
【発明の実施の形態】以下、この発明の実施の一形態を
図について説明する。図1は、この発明のフォールトト
レラントネットワーク管理システムの構成を示すブロッ
ク図である。同図において、1,2,3は複数のLAN
で、これらがワイドエリアネットワーク(以下、WAN
という)5によって、ルータ6,7,8を経由して接続
されている。また、LAN2には、ネットワーク資源単
位に、これの構成情報,状態情報等の管理オブジェクト
を管理,制御する複数のエージェント20,21が接続
され、更に、これらエージェント20,21を介して、
LAN2内の管理オブジェクトを管理、制御する冗長構
成を持たない主サブマネージャ11が接続されている。
【0010】前記同様にして、LAN3には、ネットワ
ーク構成単位に、この構成情報,状態情報等の管理オブ
ジェクトを管理,制御する複数のエージェント30,3
1が接続され、更に、これらエージェント30,31を
介して、LAN3内の管理オブジェクトを管理,制御す
る冗長構成を持たない主サブマネージャ12が接続され
ている。一方、LAN1には、複数のエージェント5
0,51が接続され、更に、これらエージェント50,
51の管理下の管理オブジェクトを管理、制御するとと
もに、WAN5および主サブマネージャ11,12を通
じて、これら管理下の管理オブジェクトを管理,制御す
る統合マネージャ10が接続されている。すなわち、L
AN1にはネットワーク全体の資源を管理する統合マネ
ージャ10が接続されている。
【0011】なお、前記LAN2,3は統合マネージャ
10が管理対象とする拠点であるが、その総数はm個で
ある。つまり、統合マネージャ10は主サブマネージャ
11から12の総数m個を通じて、これら管理下の各管
理オブジェクトを管理,制御する。ここで、統合マネー
ジャ10のみ、それ自身、一対一の冗長構成を持つシス
テムである。また、LAN1には、LAN2,3の総数
m個の主サブマネージャ11,12のバックアップとな
るべき、副サブマネージャ14,15が接続されてい
る。この副サブマネージャ14,15は、主サブマネー
ジャ11,12のうち、任意の主サブマネージャが壊滅
的障害となった場合、その主サブマネージャ機能を代行
するバックアップ用のサブマネージャである。なお、副
サブマネージャ14,15は総数n個存在する。このと
き、m>nであり、nの値は主サブマネージャ11,1
2がどの程度の確率で同時に障害となる可能性があるか
で決定する。
【0012】図2は、エージェント20,21,30,
31,主サブマネージャ11,12,副サブマネージャ
14,15および統合マネージャ10の論理的関係を示
す説明図である。ここで、主サブマネージャ11とエー
ジェント20,21との間は、通信ネットワーク管理に
関する国際的な標準規格IAB(InternetAc
tivities Board)のSNMP(Simp
le Network Management Pro
tocol)を使用して管理オブジェクトを管理する。
そして、主サブマネージャ11は、管理範囲のエージェ
ント20,21を通じて収集した、複数の管理オブジェ
クトの集合を木構造で表現したMIB(Managem
entInformation Base)という形式
で保持する。
【0013】同様にして、主サブマネージャ12とエー
ジェント30,31との間も、SNMPを使用して管理
オブジェクトを管理し、また、主サブマネージャ11,
12のバックアップとなる副サブマネージャ14,15
と各エージェント20,21,30,31との間も、S
NMPを使用して管理オブジェクトを管理する。なお、
主サブマネージャ11,12と統合マネージャ10との
間、副サブマネージャ14,15と統合マネージャ10
との間もSNMPを使用し管理オブジェクトを管理す
る。
【0014】図3および図4は、エージェント30,3
1,主サブマネージャ11,12,副サブマネージャ1
4,15,統合マネージャ10により階層的にネットワ
ーク資源を管理するとき、主サブマネージャ11,12
が障害に陥り、バックアップとなるべき副サブマネージ
ャ14,15が起動され、ネットワーク管理システムと
してフォールトトレラント性を確保するための各システ
ムの動作シーケンスを示すものである。統合マネージャ
10は主サブマネージャ11,12のm個の主サブマネ
ージャに対しICMP(Internet Contr
ol Message Protocol)を使用して
ICMPエコー要求を定期的に発行し(ヘルスチェッ
ク)、その結果であるICMPエコー応答を取得するこ
とにより、各々の主サブマネージャ11,12の生死を
確認する。
【0015】上記のごとく、統合マネージャ10が各々
の主サブマネージャ11,12にICMPエコー要求を
発行してから一定時間経過しても、例えば主サブマネー
ジャ12からの応答がなき場合(応答待ちタイムアウ
ト)、その主サブマネージャ12の障害と認識する。そ
して統合マネージャ10が主サブマネージャ11,12
のうちの主サブマネージャ12の障害を認識した場合、
この統合マネージャ10は、空きの状態の例えば副サブ
マネージャ14に対し、障害のある主サブマネージャ1
2の代行を要求するメッセージをSNMPを用いて送信
する。この要求メッセージには、代行すべき主サブマネ
ージャ12のIPアドレス,その属するLAN3のネッ
トワークアドレス,LAN3を接続するルータアドレス
を合わせて送信する。統合マネージャ10は、副サブマ
ネージャ14,15の使用中状態を管理するが、その情
報としては、使用中/未使用の状態、使用中の場合、ど
の主サブマネージャの代行であるかを示す、IPアドレ
ス情報を管理する。
【0016】主サブマネージャ12の代行要求を受け付
けた副サブマネージャ14は、代行要求メッセージに含
まれる、代行すべき主サブマネージャ12の属するLA
N3を接続するルータ8のIPアドレスをもとに、SN
MPによりそのルータが持つ、アール・エフ・シー・1
213、マネージメント・インフォメーション・ベース
・フォー・ネットワーク・マネージメント・オブ・ティ
シーピー/アイピー・ベースド・インターネット、ミブ
−ツー(RFC1213、Management In
formation Base for Networ
k Management of TCP/IP Ba
sed Internet、MIB−II)で規定される
ドット表記、iso(1).ord(3).dod
(6).internet(1).mgmt(2).m
ib−2(1).at(3).atTable(1)に
存 在するatTableの値を全て取得する。
【0017】前記のatTableの値は、そのルータ
8とARP(address Resolution
Protocol)により、IPアドレスから物理アド
レスを解決した、全てのIPアドレスと物理アドレスの
対応関係が保持されているため、結果として、そのルー
タ8が収容するLAN3に接続されている装置、つまり
LAN3に接続されているエージェント30,31の全
てのIPアドレスと物理アドレスの組み合わせを取得す
る事が可能となる。
【0018】次のステップとして、副サブマネージャ1
4は、上記で取得したIPアドレスを基に、LAN3に
接続されている全てのエージェント30,31に対し、
自副サブマネージャ14のIPアドレス変更のメッセー
ジをSNMPにより送信し、各エージェント30,31
に対してマネージャが主サブマネージャ12から副サブ
マネージャ14に変更になったことを通知する。以上に
より、副サブマネージャ14は、構成情報,状態情報等
を管理,制御すべき全てのエージェント30,31のI
Pアドレスを取得し、主サブマネージャ12が障害に陥
った各エージェント30,31は、新しい代行マネージ
ャ、つまり副サブマネージャ14のIPアドレスを取得
することが可能となる。
【0019】以降、統合マネージャ10は、これまで障
害中の主サブマネージャ12に対し送信していた各種メ
ッセージを副サブマネージャ14に送信する。副サブマ
ネージャ14は対応するLAN3配下の各エージェント
30,31にそのメッセージを送信し、副サブマネージ
ャ14宛のトラップも必要に応じ、統合マネージャ10
に送信することで、ネットワーク管理システム全体とし
てのフォールトトレラント性を確保する。統合マネージ
ャ10は、管理すべきアクティブとなった副サブマネー
ジャ14が増加したことを認識しているため、新規にア
クティブとなった副サブマネージャ14についても、定
期的にICMPエコー要求を送信し、主サブマネージャ
12の場合と同様に、生死を監視する。
【0020】従って、監視対象の副サブマネージャ14
が統合マネージャ10のICMPエコー要求に、一定時
間経過しても応答しない場合は、上記と同様の手順に
て、統合マネージャ10は、次なる空きの副サブマネー
ジャ15に代行要求を送信し、副サブマネージャ14の
代行を実施させる。以上により、複数の主サブマネージ
ャ11,12が同時に障害に陥らない限り、副サブマネ
ージャ14,15がn台存在すれば、ある一つの主サブ
マネージャに着目したとき、n重障害までのフォールト
トレラント性を確保することが可能となる。一方、統合
マネージャ10は、障害に陥った主サブマネージャ12
にも定期的にICMPエコー要求を送信し続け、この主
サブマネージャ12の復旧を監視する。あるタイミング
で、障害と認識していた主サブマネージャ12からIC
MPエコー要求に対する応答が送信されたとき、統合マ
ネージャ10はこれまで障害とされた主サブマネージャ
12が復旧したと判断する。
【0021】この時、統合マネージャ10は、復旧した
主サブマネージャ12に、復旧メッセージをSNMPに
より送信し、副サブマネージャ15からエージェント3
0,31に対して、副サブマネージャ15から主サブマ
ネージャ12にマネージャIPアドレスが変更となった
ことを伝えるメッセージを送信することを指示する。こ
のメッセージにより該当LAN配下の各エージェント
は、主サブマネージャが復旧したことを認識し、各シス
テムとも元の状態に復旧する。合わせて統合マネージャ
10は、主サブマネージャ12の代行を行っていた副サ
ブマネージャ15に代行解除のメッセージを送信し、統
合マネージャ10の管理する副サブマネージャの状態を
空きに管理し、次の主サブマネージャ11,12のいず
れかの障害に備える。
【0022】
【発明の効果】以上のように、この発明によれば、主ネ
ットワーク管理システムと副ネットワーク管理システム
が固定的に一対一に対応していないシステム構成とした
ので、m個のネットワーク管理システムのフォールトト
レラント性を確保するために、mより小さい値の、n個
の副サブマネージャでネットワーク管理システムのフォ
ールトトレラント性を確保できるとともに、これを簡単
かつローコストの構成にて実現できるという効果が得ら
れる。また、同時に複数の主サブマネージャが障害に陥
らない限り、一つの主サブマネージャの最大n重障害ま
でフォールトトレラント性を確保できるという効果が得
られる。
【図面の簡単な説明】
【図1】 この発明の実施の一形態によるフォールトト
レラントネットワーク管理システムを示すブロック図で
ある。
【図2】 図1におけるエージェント,サブマネージャ
および統合マネージャの論理的関係を示す説明図であ
る。
【図3】 図1におけるエージェント,サブマネージャ
および統合マネージャの動作を示すシーケンス図であ
る。
【図4】 図3にひき続き、図1におけるエージェン
ト,サブマネージャおよび統合マネージャの動作を示す
シーケンス図である。
【符号の説明】
1,2,3 LAN(ローカルエリアネットワーク) 5 WAN(ワイドエリアネットワーク) 6,7,8 ルータ 10 統合マネージャ 11,12 主サブマネージャ 14,15 副サブマネージャ 20,21,30,31,50,51 エージェント
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 13/00 H04L 12/00

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 ワイドエリアネットワークにルータを介
    して接続された複数のローカルエリアネットワークと、 これらのローカルエリアネットワークのいくつかに接続
    され、これらの各ローカルエリアネットワーク内の管理
    オブジェクトを管理,制御する冗長構成を持たない主サ
    ブマネージャと、 前記ローカルエリアネットワークの残りに接続され、前
    記各主サブマネージャおよび前記ワイドエリアネットワ
    ークを介してこれらの管理オブジェクトを管理,制御す
    る冗長構成を持つ統合マネージャと、 該統合マネージャを接続したローカルエリアネットワー
    クに接続され、障害発生したいずれかの前記主サブマネ
    ージャの機能を代行する、前記主サブマネージャの総数
    より少ない複数の副サブマネージャとを備え、前記統合マネージャが主サブマネージャの障害を認識し
    た場合、前記統合マネージャは、空きの状態の副サブマ
    ネージャに対し、障害のある主サブマネージャの代行を
    要求するメッセージをSNMPを用いて送信すると共
    に、該要求メッセージには、代行すべき主サブマネージ
    ャのIPアドレス,その属するLANのネットワークア
    ドレス,該LANを接続するルータアドレスを合わせて
    送信する ことを特徴とするフォールトトレラントネット
    ワーク管理システム。
  2. 【請求項2】 前記副サブマネージャの数が、主サブマ
    ネージャがどの程度の確率で同時に障害となる可能性が
    あるかにもとづいて設定されていることを特徴とする請
    求項1に記載のフォールトトレラントネットワーク管理
    システム。
  3. 【請求項3】 前記ローカルエリアネットワークのそれ
    ぞれには、これらの資源単位に構成情報,状態情報等の
    管理オブジェクトを管理,制御するエージェントが接続
    されていることを特徴とする請求項1に記載のフォール
    トトレラントネットワーク管理システム。
  4. 【請求項4】 前記各主サブマネージャとこれに対応す
    るエージェントとの間、前記統合マネージャと各主サブ
    マネージャとの間、前記各副サブマネージャと前記各エ
    ージェントとの間、および統合マネージャと各副サブマ
    ネージャとの間では、それぞれシンプルネットワークマ
    ネージメントプロトコルを使用して前記管理オブジェク
    トが管理されていることを特徴とする請求項1に記載の
    フォールトトレラントネットワーク管理システム。
JP35360398A 1998-12-11 1998-12-11 フォールトトレラントネットワーク管理システム Expired - Fee Related JP3256506B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35360398A JP3256506B2 (ja) 1998-12-11 1998-12-11 フォールトトレラントネットワーク管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35360398A JP3256506B2 (ja) 1998-12-11 1998-12-11 フォールトトレラントネットワーク管理システム

Publications (2)

Publication Number Publication Date
JP2000181823A JP2000181823A (ja) 2000-06-30
JP3256506B2 true JP3256506B2 (ja) 2002-02-12

Family

ID=18431964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35360398A Expired - Fee Related JP3256506B2 (ja) 1998-12-11 1998-12-11 フォールトトレラントネットワーク管理システム

Country Status (1)

Country Link
JP (1) JP3256506B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000332768A (ja) * 1999-05-14 2000-11-30 Nec Corp Atm用サーバのmib統合管理方法
WO2002005489A1 (fr) * 2000-07-10 2002-01-17 Fujitsu Limited Systeme de gestion de reseau integre
US20020184368A1 (en) * 2001-04-06 2002-12-05 Yunsen Wang Network system, method and protocols for hierarchical service and content distribution via directory enabled network
JP5971168B2 (ja) * 2013-03-26 2016-08-17 富士ゼロックス株式会社 情報処理システム、情報処理装置及び情報処理プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250948A (ja) * 1987-04-07 1988-10-18 Nec Corp 通信制御部切替方式
JPH04299743A (ja) * 1991-03-28 1992-10-22 Omron Corp コンピュータネットワークシステム
JPH0668002A (ja) * 1992-08-18 1994-03-11 Oki Electric Ind Co Ltd ネットワーク管理システム
JP3521955B2 (ja) * 1994-06-14 2004-04-26 株式会社日立製作所 階層型ネットワーク管理システム

Also Published As

Publication number Publication date
JP2000181823A (ja) 2000-06-30

Similar Documents

Publication Publication Date Title
JP3206644B2 (ja) ネットワーク管理方式
US7484222B1 (en) Method and system for setting expressions in network management notifications
US6760859B1 (en) Fault tolerant local area network connectivity
US6295558B1 (en) Automatic status polling failover or devices in a distributed network management hierarchy
US7587633B2 (en) Fault tolerant routing in a network routing system based on a passive replication approach
US7760622B2 (en) Redundant router set up
US20030037165A1 (en) Dynamic load sharing system using a virtual router
JPH0721135A (ja) 二重化監視機能を持つデータ処理システム
EP1829268A2 (en) Systems and methods providing high availability for distributed systems
US7516202B2 (en) Method and apparatus for defining failover events in a network device
JP2004032758A (ja) VRRP(VirtualRouterRedundancyProtocol)によるルータ・インターフェース・バックアップ実行方法
CN111371625A (zh) 一种双机热备的实现方法
JPH09259096A (ja) ネットワーク高信頼化方式及びシステム
JPH1185644A (ja) 冗長構成システムの系切替制御方法
JP2003524334A (ja) 冗長ネットワーク制御による複数ネットワークの耐故障性
JP3256506B2 (ja) フォールトトレラントネットワーク管理システム
US10033569B1 (en) Automated simple network management protocol variable reset
CN115801642A (zh) 基于状态控制的rdma通讯管理模块、方法、设备及介质
JP2011035753A (ja) ネットワーク管理システム
JP2998789B2 (ja) フォールトトレラント広帯域ネットワーク管理システム
CN113301086A (zh) Dns数据管理系统和管理方法
US20200137561A1 (en) Troubleshooting and Resolving Access Point Failures on Computer Networks
Fujisaki et al. A scalable fault-tolerant network management system built using distributed object technology
KR100480650B1 (ko) 티엠엔 에이전트의 재초기화 방법
JPH10271143A (ja) スイッチングhub対応フロー制御方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20011106

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees