JP5895564B2 - ネットワーク運用管理システムおよびネットワーク運用管理方法 - Google Patents

ネットワーク運用管理システムおよびネットワーク運用管理方法 Download PDF

Info

Publication number
JP5895564B2
JP5895564B2 JP2012019883A JP2012019883A JP5895564B2 JP 5895564 B2 JP5895564 B2 JP 5895564B2 JP 2012019883 A JP2012019883 A JP 2012019883A JP 2012019883 A JP2012019883 A JP 2012019883A JP 5895564 B2 JP5895564 B2 JP 5895564B2
Authority
JP
Japan
Prior art keywords
management
management server
monitoring
server
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012019883A
Other languages
English (en)
Other versions
JP2013161115A (ja
Inventor
聡一郎 佐原
聡一郎 佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012019883A priority Critical patent/JP5895564B2/ja
Publication of JP2013161115A publication Critical patent/JP2013161115A/ja
Application granted granted Critical
Publication of JP5895564B2 publication Critical patent/JP5895564B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワーク管理システムに関し、特に分散型ネットワーク管理システムおよびネットワーク管理方法に関する。
ネットワーク管理システム(NMS)は、構成情報管理、障害監視、性能管理など多様な機能を有する。障害監視の例としては、SNMP(Simple Network Management Protocol)トラップの受信などの受動的なアラート監視や、ICMP(Internet Control Message Protocol)エコーによる生存確認、SNMP MIB(Management Information Base:管理情報ベース)のしきい値監視などの能動的なポーリング監視などがある。性能管理の例としては、SNMP MIB値をノードから一定間隔で取得して蓄積し、分析したりグラフ化したりする機能がある。
しかしながら、ネットワーク規模の拡大や、ネットワークの品質に対する要求の高まりに伴い、監視対象や監視項目は増大している。したがって、NMSが稼働するサーバーの負荷が増大しており、NMS自体に対する処理性能や耐故障性の向上の要求が高まっている。この課題に対し、複数のサーバーを導入し、監視負荷を分散させる手法が提案されている。
例えば、特開2001−144761号公報では、監視処理を複数の監視サーバーに分散させ、ネットワークの構成情報などの全ての管理情報を全ての監視サーバーで共有する技術が公開されている。これによって、監視処理の負荷分散および耐故障性を図る。しかしながら、この技術では、全ての監視サーバーそれぞれが全ての管理情報を保持するため、各監視サーバーが保持する情報量は、ネットワークの規模拡大に伴って線形的に増え、拡張性に欠ける。特に、アラートログやMIBのログ情報を保持することまで考えると、大規模ネットワークの管理には向かないと言える。
この問題を改善する技術として、特開2010−198434号公報に、収集したログ情報を全体で共有せず、指定のサーバーに保持する技術が開示されている。しかしながら、この技術では、収集されるログ情報が単一のサーバーに保存されるため、耐故障性に難点があり、ログ喪失のリスクがある。
一方、一般的な技術として、コンテンツ管理の負荷分散に分散ハッシュテーブル(Distributed Hash Table:DHT)を用いる技術が知られている。この技術をネットワーク管理に応用した技術が、特開2010−282450号公報に公開されており、ネットワーク規模拡大に対する拡張性や耐故障性を確保できるとされている。しかしながら、この技術では、監視対象の割り振りは、ハッシュ空間上の論理的な距離の近さによって行なわれるため、監視側であるサーバーと、被監視側であるノードとの実際のネットワークの物理的距離が近いことを保証できない。ネットワーク監視にはSNMPが重要であるが、このプロトコルはUDP(User Datagram Protocol)上に実装されることが前提になっているため、物理的距離が遠ければ遠いほど、パケットロスによるアラート検出漏れなどのリスクが高くなる。また、監視設定が多くなると、ネットワークの通信帯域を圧迫し、監視パケットが遅延すること等により正常な監視が行えないおそれもある。
特開2001−144761号公報 特開2010−198434号公報 特開2010−282450号公報
本発明は、上述した課題を解決するためになされたものであり、ネットワーク監視の耐故障性および拡張性の向上を実現することを目的とする。
本発明の観点では、ネットワーク運用管理システムは、複数の管理サーバーと、複数の管理サーバーの管理対象である複数の管理対象ノードとを具備する。複数の管理サーバーは、ネットワークの構成を示す構成情報およびネットワーク全体の管理情報を含む更新する頻度の低い低更新頻度情報を分散して保持するDHT(Distributed Hash Table)のデータ保有ノードである。複数の管理サーバーは、各々に物理的に近い位置の管理対象ノードを監視した結果を示すアラートログおよびMIB(Management Information Base)のログを含む高更新頻度情報を保持する。
本発明の他の観点では、ネットワークの分散運用管理方法は、ネットワークの構成を示す構成情報およびネットワーク全体の管理情報を含む更新する頻度の低い低更新頻度情報を複数の管理サーバー上に形成されるDHT(Distributed Hash Table)上に保持するステップと、ネットワークの物理的配置に基づいて、物理的に近い位置の管理対象ノードの管理を複数の管理サーバーのそれぞれに割当てるステップと、管理対象ノードを監視した結果を示すアラートログおよびMIB(Management Information Base)のログを含む更新頻度の高い高更新頻度情報を前記管理対象ノードに物理的に近い位置の管理サーバーに保存して複数の管理サーバーのそれぞれの負荷を分散するステップとを備える。
ネットワーク規模の拡大に合わせて、耐故障性を保ちつつ柔軟に拡張可能な分散型ネットワーク運用管理システムを提供することができる。
図1は、本発明の実施の形態に係るネットワーク運用管理システムの構成を示す図であり、管理サーバーの監視範囲を示す。 図2は、本発明の実施の形態に係るネットワークの拡大を説明する図である。 図3は、本発明の実施の形態に係る拡大したネットワークの監視範囲の分割を説明する図である。 図4は、本発明の実施の形態に係る管理サーバー間のデータの同期を説明する図である。 図5は、本発明の実施の形態に係る管理サーバーの物理的接続構成と論理的接続構成を説明する図である。 図6は、本発明の実施の形態に係るDHT上の情報の例を示す図である。 図7は、本発明の実施の形態に係る管理サーバーの追加手順を示す図である。 図8は、本発明の実施の形態に係る管理サーバーの離脱手順を示す図である。 図9は、本発明の実施の形態に係る管理対象ノードの追加手順を示す図である。 図10は、本発明の実施の形態に係る管理対象ノードの削除手順を示す図である。 図11は、本発明の実施の形態に係る監視範囲の見直し手順を示す図である。 図12は、本発明の実施の形態に係るポーリング監視の手順を示す図である。
図面を参照して、本発明を実施するための形態を説明する。
本発明の実施の形態に係るネットワーク運用管理システムでは、図1に示されるように、ネットワークの管理対象ノードを複数の管理サーバーが分割して管理する。ここでは、ネットワークは、管理対象ノード31〜35と、管理対象ノード31〜35を監視する管理サーバー11、12および管理端末19を備える。管理サーバー11は、監視範囲21に含まれる管理対象ノード31、32を監視する。管理サーバー12は、監視範囲20に含まれる管理対象ノード33、34、35を監視する。管理端末19は、管理対象ノード31に接続される。ネットワーク管理者は、管理端末19から各管理サーバー11、12に処理を指示し、管理情報を取得して、ネットワーク状態の閲覧や管理を行なうことができる。管理端末19は、ネットワークの任意の場所に接続できる。各管理サーバー11、12が管理する管理対象ノード31〜35すなわち監視範囲は、ネットワークの物理的構成に基づいて決定される。管理サーバー11、12は、物理的に近い位置の管理対象ノード31〜35を分担して監視する。
図2に示されるように、管理サーバー12の監視範囲20に管理対象ノード36が追加され、ネットワークの規模が増大して管理サーバーの負荷が高くなると、負荷の高い管理サーバー12の近傍に新しい管理サーバー13が追加される。管理サーバー13が追加されると、負荷を分散するように自動で管理範囲の再設定が行われる。すなわち、図3に示されるように、監視範囲20は、監視範囲22、23に分割され、管理サーバー12は監視範囲22に含まれる管理対象ノードを監視し、管理サーバー13は監視範囲23に含まれる管理対象ノードを監視するように再設定される。すなわち、管理サーバー12の負荷が管理サーバー13の追加により分散される。
なお、この自動負荷分散は、管理サーバーの追加のときだけでなく、定期的に行われるように構成することも可能である。したがって、監視負荷が設定変更等によって変化した場合でも、時間経過とともに、管理サーバーの負荷を平準化することができる。
また、図4に示されるように、管理情報やログ情報は、複数の管理サーバーで同期化される。したがって、これらのデータは冗長性を有することになり、耐故障性を確保することができる。データを同期させる管理サーバーは、それぞれの管理サーバーのネットワーク上の物理的近傍に位置する複数台とする。同期する管理サーバーの範囲を限定することによって、各管理サーバーが保持するデータ量が、ネットワーク全体に存在する管理サーバーの数に影響されないようになり、ネットワークの負荷が広範囲に波及することを防止できる。このように、データが冗長性を有することにより、管理サーバーが故障したときには、近傍サーバーとしてデータを同期している管理サーバーが、故障した管理サーバーの監視範囲を引き継ぐことが容易になり、耐故障性が確保される。
ネットワーク運用管理システムにおいて、ユーザーはネットワーク上の任意の地点から所望の情報を有する管理対象ノードをアクセスして情報を閲覧することができる。すなわち、管理サーバー11〜14は、図5(a)に示されるように、伝送路を介して互いにデータを授受できるように物理的に接続されていることになる。そして、全ての管理サーバー11〜14は、ネットワーク構成等の情報を分散して有し、分散ハッシュテーブル(DHT)を形成する。
このDHTには、管理対象ノード31〜38を示す情報をキーとして、その管理対象ノード31〜38を監視する管理サーバー11〜14に関する情報等をデータ値とする組情報が保持される。DHTのアルゴリズムは、Chord、CAN、Pastry等が知られるが、例えば、Chordアルゴリズムを用いると、図5(b)に示されるように、各管理サーバー11〜14はハッシュID空間に位置付けされる。したがって、各管理サーバー間のハッシュID空間における論路的距離と、ネットワーク上の物理的距離とは異なる。
ネットワーク管理者が、本ネットワーク運用管理システムに接続される管理端末19によって所望の管理対象ノード(例えば管理対象ノード33)に関する情報を取得するためには、まず任意の管理サーバー(例えば管理サーバー11)に問い合わせてDHT上の情報探索を行なう。管理サーバー11は、DHT上で管理サーバー13、12を順に探索し、所望の管理対象ノード33を管理している管理サーバー12を特定する。ネットワーク管理者は、特定された管理サーバーに管理端末19を用いて問い合わせ、所望の管理対象ノード33に関する情報を取得する。管理対象ノード33に関する情報は、管理端末19に表示される。新たな監視設定の投入の手続きも上記の情報の取得の手続きと同様の手続きで行われる。
例えば、図4に示されるようなネットワーク構成の場合、DHTには、図6に示されるような情報が格納される。図4に示されるネットワークには監視対象となる管理対象ノード31〜38が接続されている。また、管理サーバー11〜14が接続されている。管理対象ノード31〜38は、管理サーバー11〜14のいずれかに管理される。図4に示されるネットワーク構成では、管理対象ノード31〜32は管理サーバー11に、管理対象ノード33〜34は管理サーバー12に、管理対象ノード35〜36は管理サーバー13に、管理対象ノード37〜38は管理サーバー14によって管理されている。ネットワーク状態の閲覧や管理のために、管理端末(T)19が接続されている。管理端末19は、ネットワークの任意の場所に接続できる。
DHT上に保持される情報は、図6のような形態となる。図6には、図4に示されるネットワーク構成を例としたデータ一覧である。管理対象ノードまたは管理サーバーを示す情報をキーとして各種情報を引き出すことができる。キーとする情報は、例えばIPアドレスのような、管理対象ノードおよび管理サーバーを一意に識別可能な情報が使用される。
キーによって検索できるデータ値は、複数の情報を組み合わせたものとなる。キーが管理対象ノードを示す場合、その管理対象ノードを管理する管理サーバー(管理サーバー列)、他の管理対象ノードや管理サーバーとの接続状態を示す接続情報リスト(隣接ノード列)等が得られる。キーが管理サーバーを示す場合、管理サーバーが管理する管理対象ノードのリスト(管理ノード列)、管理情報を同期する近傍サーバーのリスト(近傍サーバー列)、他の管理対象ノードや管理サーバーとの接続状態を示す接続情報リスト(隣接ノード列)等が得られる。
本発明における各種動作について説明する。
(管理サーバーの追加)
ネットワーク管理サーバーを新規に追加する場合、図7に示されるように処理される。ここでは、図1から図3に示されるように、管理対象ノード36が増設され、管理サーバー12の負荷が増加したため、管理サーバー13を追加して監視範囲を分割する場合を例示する。
(ステップS11)ネットワーク管理者は、管理端末19を用いて新しい管理サーバー13をDHTシステムの構成ノードとして登録する。DHTへの登録処理の手続き(プロトコル)の詳細は、使用されるDHTの仕様に規定されるものとし、ここでは詳細について言及しない。
(ステップS12)ネットワーク管理者は、管理端末19を用いて新しい管理サーバー13を示す情報をキーとしたデータ行を生成してDHTに入力する。新しく生成したデータ行の隣接ノード列には、新しい管理サーバー13に直接接続される各ノードの接続情報が入力される。新しい管理サーバー13は、図2に示されるように、管理対象ノード35に直接接続される。したがって、管理サーバー13の隣接ノード列には管理対象ノード35を示す情報が格納される。
(ステップS13)新しい管理サーバー13は、ネットワーク上の物理的距離が近い別の管理サーバー(以後、近傍サーバーと称する)を最大N台探す。近傍サーバーの探索は、DHT上に保持されている隣接ノード情報に基づいて、ダイクストラ法などのアルゴリズムで行う。近傍サーバーが発見されると、発見された近傍サーバーの情報は、DHT上の新しい管理サーバー13の近傍サーバー列に保存される。
(ステップS14)新しい管理サーバー13の近傍サーバーとなった管理サーバー12は、ステップS13の要領でその近傍サーバーを再探索する。管理サーバー12の近傍に更新があると、DHT上の近傍サーバー列の情報を更新し、管理サーバー12および新しい近傍サーバーの間で管理対象ノードに関するデータの同期を行う。ここでは、管理サーバー13が追加されているので、管理サーバー12の近傍サーバー列に管理サーバー13を示す情報が追加される。
(ステップS15)ステップS14において、近傍サーバーの情報が変更された管理サーバー(例えば管理サーバー12)は、近傍サーバーの情報に追加または削除された管理サーバー(例えば管理サーバー13)に対して、ステップS14、S15を実行するように通知する。例えば、次は管理サーバー13がステップS14、S15を実行する。
(ステップS16)近傍サーバーの情報の更新がネットワークを管理する管理サーバー全体で収束すると、管理サーバーの追加処理は終了する。
(管理サーバーの離脱)
管理サーバーがシステムから離脱する契機は、計画された離脱と、障害等による予期せぬ離脱の二通りがある。本発明では、DHT上で各管理サーバー同士が定期的に生存確認を行うことによって、予期せぬ離脱を検知する。障害発生が検知できれば、予期せぬ離脱も計画された離脱と同じ手順で処理できる。管理サーバーの離脱は、図8に示されるように、処理される。
(ステップS21)離脱する管理サーバーは、監視する管理対象ノードの管理を離脱する管理サーバーの近傍サーバーのいずれか一つに委譲する。登録されている近傍サーバーから、管理を委譲する管理サーバーを選択する方法は、単純にリストの先頭に登録されている近隣サーバーを選択してもよいし、委譲後の監視負荷が最小になるように監視負荷に基づいて選択してもよい。
(ステップS22)離脱する管理サーバーの近傍サーバーとして登録されている管理サーバーは、前述の管理サーバーの追加の場合と同じように、近傍サーバー情報を更新する。すなわち、近傍サーバーとして登録されている管理サーバーは、ネットワーク上の物理的距離が近い別の管理サーバー(近傍サーバー)を最大N台探す。近傍サーバーとして別の管理サーバーが発見されると、発見された近傍サーバーの情報は、DHT上の近傍サーバー列に保存される(ステップS13に対応)。
(ステップS23)近傍サーバーとして追加または削除された管理サーバーは、ステップS22の要領でさらにその近傍サーバーを再探索する。近傍に更新があると、その管理サーバーは、DHT上の近傍サーバー列の情報を更新し、管理対象ノードに関するデータのコピーを行う(ステップS14に対応。前述と同様、どのデータをどこにコピーするのか不明)。
(ステップS24)ステップS23において、近傍サーバーの情報が変更された管理サーバーは、その近傍サーバー情報に追加または削除された管理サーバーに対して、ステップS23、S24を実行するように通知する。
(ステップS25)離脱対象である管理サーバーをDHTから離脱させる。なお、DHTからの離脱処理の詳細は、各DHTによるものとし、本発明では言及しない。
(管理対象ノードの追加)
管理対象ノードを追加する場合、図9に示されるように処理する。
(ステップS31)ネットワーク管理者は、管理端末を用いて追加される管理対象ノードを示す情報をキーとしたデータ行を生成しDHTに入力する。新しく生成された行の隣接ノード列には、追加される管理対象ノードに直接接続される管理対象ノードの接続情報が入力される。
(ステップS32)追加される管理対象ノードに直接接続される各管理対象ノードは、各管理対象ノードを管理する管理サーバーと管理対象ノードとのネットワーク上の距離を計算する。なお、各管理対象ノードを管理する管理サーバーに関する情報は、ノード情報をキーとしてDHTに問い合わせることにより取得できる。また、ネットワーク上の物理的距離は、DHTに保持されているネットワーク接続関係の情報に基づいて、ダイクストラ法などのアルゴリズムを用いて計算することができる。
(ステップS33)追加される管理対象ノードとの距離が最も近い管理サーバーを、追加される管理対象ノードを管理する管理サーバーとしてDHTの情報が更新される。すなわち、管理対象ノードの情報を検索キーとする行を新規に追加し、管理サーバー列、隣接ノード列にそれぞれ情報が登録される。また、管理対象ノードに隣接する隣接ノードを示す情報をキーとする行にある隣接ノード列の情報を更新する。また、管理対象ノードを管理する管理サーバーの情報を検索キーとする行にある管理ノード列の情報を更新する。
なお、この追加方法では、追加する管理対象ノードと管理サーバーとが、必ずしも最近傍の関係ではない可能性があるが、距離が近ければ最近傍でなくてもよい。また、管理対象ノードの追加により、管理サーバー間に負荷の偏りが発生しても、後述する管理範囲の定期な見直し処理により、負荷が平準化される。
(管理対象ノードの削除)
管理中のノードを管理対象から外す(削除する)場合、図10に示されるように処理する。
(ステップS41)ネットワーク管理者は、管理端末19から削除する管理対象ノードを示す情報を検索キーにしてDHTに問い合わせ、管理対象ノードを管理する管理サーバーに関する情報を取得する。
(ステップS42)ネットワーク管理者は、検索によって取得した管理サーバーに所望の管理対象ノードの削除を要求する削除要求を送る。
(ステップS43)要求を受けた管理サーバーは、管理対象ノードを管理する管理情報を削除する。
(ステップS44)さらに管理サーバーは、更新後の情報を近傍サーバーとして登録されている管理サーバー全てに通知して同期する。
(ステップS45)管理サーバーは、管理対象ノードを示す情報をキーとしてDHT上の情報を削除する。また、管理対象ノードに隣接する隣接ノードを示す情報をキーとするデータの隣接ノード列を更新する。また、管理対象ノードの管理サーバーを示す情報をキーとするデータの管理ノード列を更新する。管理対象ノードを削除することにより、管理サーバー間に負荷に偏りが出ても、後述する管理範囲の定期な見直しにより負荷が平準化される。そのため、ここでは負荷見直しをしない。
(監視範囲の見直し)
本発明では、管理サーバー間で管理負荷に大きな偏差がないように、定期的に管理対象ノードを監視する範囲を見直す。管理対象ノードの監視範囲の見直しは、図11に示されるように、定期的に実行される。
(ステップS51)各管理サーバーは、それぞれその時点における監視負荷を計算する。
(ステップS52)各管理サーバーは、それぞれの近傍サーバーの監視負荷を取得する。
(ステップS53)各管理サーバーは、自身と各近傍サーバーとの監視負荷の平均を算出し、それぞれの監視負荷が、算出された平均に近づくように、それぞれが監視する管理対象ノードを分担し合う。
(ポーリング監視)
上述のように構成されるシステム上では、ある管理対象ノードに対するポーリング監視は、図12に示されるように行われる。
(ステップS61)管理サーバーは、監視範囲内の管理対象ノードに対して監視パケットを送出する。
(ステップS62)管理対象ノードから結果が返送されると、管理サーバーはその結果を保存する。
(ステップS63)管理サーバーは、その近傍サーバーに管理対象ノードから返送された結果を転送し、データを同期する。管理サーバーは、SNMPトラップの受信等のパッシブ監視も同様に、受信するとその受信結果を近傍サーバーに転送し、データを同期する。
上述のように、本実施の形態に係るネットワーク運用管理システムでは、各ノードの情報はある特定の複数台のサーバーにのみ配置されているため、管理端末から情報を閲覧するためには、まず管理サーバーを特定する。DHT上には、管理対象ノードを示す情報をキーとする、その管理対象ノードの情報を管理している管理サーバーのリストが保持されている。したがって、管理対象ノードを示す情報をキーとしてDHTに問い合わせることにより、その管理対象ノードを管理する管理サーバーの情報が得られる。管理サーバーが判明すれば、その管理サーバーに問い合わせ、情報が得られる。
管理対象ノードを示す情報をキーとしてDHTに問い合わせると、管理サーバーの情報が得られるが、さらに、その管理サーバーを示す情報をキーとしてDHTに問い合わせることにより、近傍サーバー、つまり所望の管理対象ノードの情報を保持している全ての管理サーバーのリストが得られる。管理端末は、情報取得の際、このリストから任意のサーバーを選んでよい。例えば、ネットワーク上の近い管理サーバーを選択すると、情報取得の際の通信コストを抑えることもできる。
上述のように、本発明では、ネットワーク構成情報およびシステム全体の管理情報などの更新頻度の低い低更新頻度情報を、複数の管理サーバーに形成されるDHT上に保持する。また、ネットワークの物理的配置に基づいて、各管理サーバーに管理対象ノードの管理を割り当て、監視の結果であるアラートログやMIBのログなどの更新頻度の高い高更新頻度情報をネットワーク上の物理的に近い位置の管理サーバーに保存する。したがって、ネットワーク規模が増大した場合でも、管理サーバーを増設するだけで各サーバーの負荷を分散することができる。さらに、ネットワーク上の物理的に近い位置の管理サーバー同士で監視の結果情報を同期して保持し、管理サーバーが故障した場合に、物理的に近い位置の管理サーバーが代りに監視を継続することができ、耐障害性を確保することができる。上述の実施の形態では、DHTのアルゴリズムとしてChordを例に挙げたが、他のDHTアルゴリズムを使用して構成してもよい。
すなわち、本発明によれば、管理するネットワークの規模に合わせて管理サーバーを設置することにより自動的に監視負荷の分散を行うことができ、拡張性の高いネットワーク管理が実現できる。また、ネットワーク上の近いサーバー間で同期して保持することによって監視情報の冗長化を行ない、管理サーバーの障害時にも監視を継続することができ、障害に強いネットワーク管理が実現できる。
以上、実施の形態を参照して本願発明を説明したが、上記実施の形態は、矛盾のない限り組み合わせて実施可能である。また、本願発明は上記実施の形態に限定されるものではなく、本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
11〜14 管理サーバー
19 管理端末
20〜24 監視範囲
31〜38 管理対象ノード

Claims (10)

  1. 更新頻度情報を分散して保持するDHT(Distributed Hash Table)のデータ保有ノードである複数の管理サーバーと、ここで、前記低更新頻度情報は、ネットワークの構成を示す構成情報および前記ネットワーク全体の管理情報を含んでおり、
    前記複数の管理サーバーの管理対象である複数の管理対象ノードと
    を具備し、
    前記複数の管理対象ノードの各々は、前記ネットワークの物理的配置に基づいて、複数の監視グループのいずれかに割当てられており、
    前記複数の管理サーバーの各々は、前記複数の監視グループのうちで自身が属する監視グループに含まれる管理対象ノードを監視し、前記複数の監視グループのうちで自身に隣接する監視グループの管理サーバーによる視結果を示すアラートログおよびMIB(Management Information Base)のログを含む高更新頻度情報を保持する
    ネットワーク運用管理システム。
  2. 前記複数の管理サーバーの各々は、自身に隣接する監視グループの管理サーバーによる視結果を当該隣接する監視グループの管理サーバーと同期して保持し、
    前記複数の管理サーバーのうち、第1監視グループの第1管理サーバーが故障した場合、前記第1管理サーバーの代わりに、前記第1監視グループに隣接する第2監視グループの第2管理サーバーが監視を継続する
    請求項1に記載のネットワーク運用管理システム。
  3. 前記DHTは、データ行およびデータ列で構成されており、
    前記データ列は、近傍サーバー列および隣接ノード列を含み、
    前記ネットワークに第管理サーバーが追加されるとき、
    前記第管理サーバーを示す情報をキーとする第1データ行が前記DHTに生成され、
    前記第管理サーバーに直接接続される隣接ノードを示す情報が前記第1データ行の前記隣接ノード列に格納され、
    前記複数の管理サーバーのうち、記第管理サーバーが属する監視グループに隣接する所定数の監視グループの管理サーバーを示す情報が前記第1データ行の前記近傍サーバー列に格納される
    請求項2に記載のネットワーク運用管理システム。
  4. 前記複数の管理サーバーのうちの第管理サーバーが前記ネットワークから離脱するとき、
    前記第管理サーバーは、前記第管理サーバーが監視する管理対象ノードの管理を、前記DHTの前記第管理サーバーを示す情報をキーとする第2データ行の前記近傍サーバー列に格納される第管理サーバーに委譲し、
    前記複数の管理サーバーのうち、記第管理サーバーを近傍サーバーとしている管理サーバーは、前記第2データ行における前記近傍サーバー列の情報を更新する
    請求項3に記載のネットワーク運用管理システム。
  5. 前記複数の管理サーバーの各々は、定期的に自身の監視負荷を計算して、前記複数の管理サーバーのうち、自身に隣接する監視グループの管理サーバーの監視負荷を取得し、前記自身の監視負荷と前記自身に隣接する監視グループの管理サーバーの監視負荷との平均に近づくように監視する前記複数の管理対象ノードを分担する
    請求項1から請求項4のいずれかに記載のネットワーク運用管理システム。
  6. 複数の管理サーバーと、前記複数の管理サーバーの管理対象である複数の管理対象ノードとを用いるネットワーク運用管理方法であって、
    新する頻度の低い低更新頻度情報を前記複数の管理サーバー上に形成されるDHT(Distributed Hash Table)上に保持するステップと、ここで、前記低更新頻度情報は、ネットワークの構成を示す構成情報および前記ネットワーク全体の管理情報を含んでおり、
    前記ネットワークの物理的配置に基づいて、前記複数の管理対象ノードの各々を複数の監視グループのいずれかに割当てるステップと、
    前記複数の監視グループのうちで自身が属する監視グループの管理対象ノードを監視するステップと、
    前記複数の監視グループのうちで自身に隣接する監視グループの管理サーバーによる視結果を示すアラートログおよびMIB(Management Information Base)のログを含む高更新頻度情報を保持するステップと
    を備える
    ネットワーク運用管理方法。
  7. 前記DHTは、データ行およびデータ列で構成されており、
    前記データ列は、近傍サーバー列および隣接ノード列を含み、
    前記ネットワーク運用管理方法は、前記ネットワークに第1管理サーバーを追加するステップを更に備え、
    前記追加するステップは、
    前記第1管理サーバーを示す情報をキーとする第1データ行を前記DHTに生成するステップと、
    前記第1管理サーバーに直接接続される隣接ノードを示す情報を前記第1データ行の前記隣接ノード列に格納するステップと、
    前記複数の管理サーバーのうち前記第1管理サーバーが属する監視グループに隣接する所定数の監視グループの管理サーバーを示す情報を前記第1データ行の前記近傍サーバー列に格納するステップと
    を含む
    請求項6に記載のネットワーク運用管理方法。
  8. 前記複数の管理サーバーのうちの第2管理サーバーを前記ネットワークから削除するステップをさらに備え、
    前記削除するステップは、
    前記第2管理サーバーが監視する管理対象ノードの管理を、前記DHTの前記第2管理サーバーを示す情報をキーとする第2データ行の前記近傍サーバー列に格納される第3管理サーバーに委譲するステップと、
    前記複数の管理サーバーのうち、記第2管理サーバーを近傍サーバーとしている管理サーバーを示す情報をキーとする前記第2データ列における前記近傍サーバー列の情報を更新するステップと
    を含む
    請求項7に記載のネットワーク運用管理方法。
  9. 定期的に前記管理対象ノードを監視する範囲を見直すステップを更に備え、
    前記見直すステップは、
    定期的に前記複数の管理サーバーの各々の監視負荷を計算するステップと、
    前記複数の監視グループのうち、自身に隣接する監視グループの管理サーバーの監視負荷を取得するステップと、
    前記複数の管理サーバーの各々の監視負荷と前記自身に隣接する監視グループの管理サーバーの監視負荷との平均に近づくように監視する前記複数の管理対象ノードを分担するステップと
    を含む
    請求項7または請求項8に記載のネットワーク運用管理方法。
  10. 請求項6から請求項9のいずれかに記載のネットワーク運用管理方法をコンピュータに実行させるためのプログラム。
JP2012019883A 2012-02-01 2012-02-01 ネットワーク運用管理システムおよびネットワーク運用管理方法 Expired - Fee Related JP5895564B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012019883A JP5895564B2 (ja) 2012-02-01 2012-02-01 ネットワーク運用管理システムおよびネットワーク運用管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012019883A JP5895564B2 (ja) 2012-02-01 2012-02-01 ネットワーク運用管理システムおよびネットワーク運用管理方法

Publications (2)

Publication Number Publication Date
JP2013161115A JP2013161115A (ja) 2013-08-19
JP5895564B2 true JP5895564B2 (ja) 2016-03-30

Family

ID=49173346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012019883A Expired - Fee Related JP5895564B2 (ja) 2012-02-01 2012-02-01 ネットワーク運用管理システムおよびネットワーク運用管理方法

Country Status (1)

Country Link
JP (1) JP5895564B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3813776B2 (ja) * 1999-11-17 2006-08-23 富士通株式会社 ネットワーク分散管理システム
JP4491167B2 (ja) * 2001-04-27 2010-06-30 富士通株式会社 通信システムにおける管理装置のバックアップシステム
JP2010282450A (ja) * 2009-06-05 2010-12-16 Yokogawa Electric Corp ネットワーク管理システム及びネットワーク管理方法

Also Published As

Publication number Publication date
JP2013161115A (ja) 2013-08-19

Similar Documents

Publication Publication Date Title
CN101465877B (zh) 分布式数据库系统中的负载分布方法及其服务器和数据库系统
US9633100B2 (en) System and method for data structure synchronization
US20110047272A1 (en) Dissemination of Network Management Tasks in a Distributed Communication Network
EP2230802A1 (en) A method and apparatus for maintaining route information
Chen et al. When software defined networks meet fault tolerance: a survey
Hauswirth et al. An overlay network for resource discovery in grids
EP2856355B1 (en) Service-aware distributed hash table routing
JP2013090072A (ja) サービス提供システム
US11336579B2 (en) Predictive Anycast traffic shaping
JP2011204192A (ja) スイッチング装置、情報処理装置および障害通知制御プログラム
CN110290163B (zh) 一种数据处理方法及装置
JP5895564B2 (ja) ネットワーク運用管理システムおよびネットワーク運用管理方法
Centelles et al. Redemon: Resilient decentralized monitoring system for edge infrastructures
JP5408359B2 (ja) 管理装置、管理プログラムおよび管理方法
EP2669808A1 (en) Management device, management method, and management program
US20240176762A1 (en) Geographically dispersed hybrid cloud cluster
JP5653322B2 (ja) 障害検出装置、ネットワーク構成推定装置および障害検出方法
JP6015056B2 (ja) ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム
Leitao et al. Large-scale peer-to-peer autonomic monitoring
JP2007041873A (ja) 分配情報生成システム、及び、分配情報生成方法
US9571348B1 (en) System and method for inferring and adapting a network topology
JP6058576B2 (ja) スロット群生成装置、スロット群生成方法、および、負荷分散システム
Dwyer et al. An analysis of convergence delay caused by link failures in autonomous systems
JP2008259047A (ja) ネットワーク監視システムおよび集中監視装置
Onut Fault Tolerant P2P RIA Crawling

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160215

R150 Certificate of patent or registration of utility model

Ref document number: 5895564

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees