JP6111791B2 - ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム - Google Patents

ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム Download PDF

Info

Publication number
JP6111791B2
JP6111791B2 JP2013069463A JP2013069463A JP6111791B2 JP 6111791 B2 JP6111791 B2 JP 6111791B2 JP 2013069463 A JP2013069463 A JP 2013069463A JP 2013069463 A JP2013069463 A JP 2013069463A JP 6111791 B2 JP6111791 B2 JP 6111791B2
Authority
JP
Japan
Prior art keywords
node
server
network management
nodes
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013069463A
Other languages
English (en)
Other versions
JP2014192872A (ja
Inventor
重宏 津村
重宏 津村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013069463A priority Critical patent/JP6111791B2/ja
Publication of JP2014192872A publication Critical patent/JP2014192872A/ja
Application granted granted Critical
Publication of JP6111791B2 publication Critical patent/JP6111791B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、ネットワークシステムを安全に運用するための、ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びこれらを実現するためのプログラムに関する。
一般に、様々な分野において、ネットワークシステムが導入されており、ネットワークシステムを安全に連続して運用することが重要となっている。このため、ネットワークシステムにおいては、ネットワークを常時監視するため、ネットワーク管理システム(以下「NMS: Network Management System」と表記する。)が導入されている。
ところで、NMSは、常時監視によって、ネットワークに接続されたサーバ及びルータ等の死活検出、トラフィックの障害検出等を行なうため、監視対象となるネットワークシステムの規模が大きくなると、その負荷は大きくなってしまう。このため、従来から、NMSにおいては、負荷の軽減を図ることが求められている。
例えば、NMSにおいては、一般に、ネットワーク監視の負荷を分散するため、MOM(Message Oriented Middleware)構成の採用、プローブ装置の設置によって、監視情報を分散して収集することが行なわれている。また、特許文献1は、ネットワークに接続された複数のノードを幾つかのグループに分け、グループ毎にネットワーク監視を設置する、NMSを開示している。特許文献1に開示されたNMSでは、監視処理は、複数のネットワーク監視サーバに分散させて行なわれるため、NMSにおける負荷が軽減される。
但し、これらの技術を採用するために、監視処理専用のサーバを設置したり、プローブ装置等を用意したり、といった必要があるため、設備コストが増大してしまう。従って、ユーザにおいて導入が難しい場合がある。
このため、安い導入コストで、ネットワークの常時監視を可能にするため、ネットワーク上に存在する機器、例えば、サーバ、及びPC(Personal Computer)にエージェントプログラムを導入し、これらを監視エージェントとして機能させることが提案されている。この場合は、監視専用の機器を別途設置しなくても良いため、導入コストを大きく低減することができる。
特開2001−144761号公報
しかしながら、ネットワーク上の既存の機器を監視エージェントとして機能させる場合は、ネットワークの構築時において、監視エージェントを設置する機器の数を最適化しないと、監視を適切に行なえない事態が発生する可能性がある。例えば、必要以上に多数の監視エージェントが設置されてしまうと、NMSの管理装置に処理能力以上の監視情報が送信され、監視が困難な事態が発生してしまう。
また、ネットワーク上の既存の機器を監視エージェントとして機能させる場合においては、監視エージェントとして機能させる機器の選択が重要となる。即ち、選択の仕方によっては、障害の発生で監視情報を取得できなくなったノードから、再度、監視情報を取得することが難しく、可用性が低いという問題が発生する。
本発明の目的の一例は、上記問題を解消し、ネットワーク上の機器によってネットワーク監視を行う場合において、監視エージェントを適切に設置でき、且つ、高可用性を実現し得る、ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラムを提供することにある。
上記目的を達成するため、本発明の一側面におけるネットワーク管理システムは、複数のノードと、複数のサーバと、これらを有するネットワークを管理するネットワーク管理装置とを備え、
前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定し、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択し、
そして、前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知し、
前記複数のサーバのうち前記候補となったサーバそれぞれは、他の監視エージェントとして機能しているサーバとの間で通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先とする、
ことを特徴とする。
上記目的を達成するため、本発明の一側面におけるネットワーク管理装置は、複数のノードと複数のサーバとを有するネットワークを管理するためのネットワーク管理装置であって、
前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、経路特定部と、
前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、候補選択部と、
前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知する、通信部と、
を備えていることを特徴とする。
上記目的を達成するため、本発明の一側面におけるサーバは、 複数のノードと共にネットワークを構成し、且つ、ネットワーク管理装置の管理対象となる、サーバであって、
前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから当該サーバまでの経路数を特定し、特定された経路数に基づいて、当該サーバを、当該ノードの監視エージェントとして機能する候補に選択し、当該サーバに、監視先のノードとそのノードにおける当該サーバの優先度とを通知してきた場合に、
他の監視エージェントとして機能しているサーバとの間で通信を行い、通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、
ことを特徴とする。
また、上記目的を達成するため、本発明の一側面におけるネットワーク管理方法は、複数のノードと、複数のサーバと、これらを有するネットワークを管理するネットワーク管理装置とを用いた、ネットワーク管理方法であって、
(a)前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、ステップと、
(b)前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、ステップと、
(c)前記ネットワーク管理装置が、前記(b)のステップで前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知する、ステップと、
(d)前記複数のサーバのうち前記候補となったサーバそれぞれが、他の監視エージェントとして機能しているサーバとの間で通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先とする、ステップと、
を有することを特徴とする。
更に、上記目的を達成するため、本発明の一側面における第1のプログラムは、複数のノードと複数のサーバとを有するネットワークを、コンピュータによって管理するためのプログラムであって、
前記コンピュータに、
(a)前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、ステップと、
(b)前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、ステップと、
(c)前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知する、ステップと、
を実行させることを特徴とする。
更に、上記目的を達成するため、本発明の一側面における第2のプログラムは、複数のノードと共にネットワークを構成し、且つ、ネットワーク管理装置の管理対象となる、コンピュータに、
前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから当該コンピュータまでの経路数を特定し、特定された経路数に基づいて、当該コンピュータを、当該ノードの監視エージェントとして機能する候補に選択し、当該コンピュータに、監視先のノードとそのノードにおける当該コンピュータの優先度とを通知してきた場合に、
他の監視エージェントとして機能しているサーバとの間で通信を行い、通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該コンピュータの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、ステップを実行させることを特徴とする。
以上のように本発明によれば、ネットワーク上の機器によってネットワーク監視を行う場合において、監視エージェントを適切に設置でき、且つ、高可用性を実現することができる。
図1は、本発明の実施の形態におけるネットワーク管理システムの全体を概略的に示す図である。 図2は、図1に示すネットワーク管理システムにおいて障害が発生した場合を示す図である。 図3は、従来からのネットワーク管理システムの全体を概略的に示す図である。 図4は、本発明の実施の形態におけるネットワーク管理システムの構成を示すブロック図である。 図5は、本発明の実施の形態におけるネットワーク管理装置の動作を示すフロー図である。 図6は、本実施の形態で作成される経路情報の一例を示す図である。 図7は、本実施の形態において選択された監視エージェントの候補の一例を示す図である。 図8は、本発明の実施の形態におけるサーバの監視エージェントとしての動作を示すフロー図である。 図9は、図1に示すネットワーク管理システムにおいて障害が発生した直後の状態を示す図である。 図10は、図9に示す状態から監視エージェントが切り替わった状態を示す図である。 図11は、本発明の実施の形態におけるネットワーク管理装置またはサーバを実現するコンピュータの一例を示すブロック図である。
(発明の概要)
本発明では、ネットワークを構成するサーバが監視エージェントとして機能する。そして、ネットワークから取得される経路情報、即ち、ノード毎の、各ノードから各サーバまでの経路数に基づいて、監視エージェントと、その監視先のノードとが選択される。このため、監視エージェントを適切に設置できる。
また、監視エージェントとして機能するサーバの候補は、ノード毎に、優先度が付与された状態で2つ以上選択されている。従って、ネットワークに障害が発生し、あるノードを監視していたサーバが監視を継続できなくなっても、優先度に従って、別のサーバが直ぐにこのノードの監視を開始する。このため、ネットワークに障害発生している場合に、監視情報を復旧できなくなるノードの数が低減されるので、高可用性が実現される。
(実施の形態)
次に、本発明の実施の形態における、ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラムについて、図1〜図11を参照しながら説明する。
[システム構成]
最初に、本実施の形態におけるネットワーク管理システムの全体構成について図1及び図2を用いて説明する。図1は、本発明の実施の形態におけるネットワーク管理システムの全体を概略的に示す図である。図2は、図1に示すネットワーク管理システムにおいて障害が発生した場合を示す図である。図3は、従来からのネットワーク管理システムの全体を概略的に示す図である。
図1に示すように、本実施の形態におけるネットワーク管理システム40は、複数のノード10と、複数のサーバ20と、ノード10及びサーバ20を有するネットワークを管理するネットワーク管理装置30とを備えている。
本実施の形態では、ノード10は、通信機器であり、具体的にはルータである。図1の例では、ノード10として、ルータa〜ルータmの13個のルータが図示されている。また、図1の例では、サーバ20として、サーバA〜サーバGの7つのサーバが図示されている。
ネットワーク管理装置30は、ノード10毎に、各ノード10からサーバ20それぞれまでの経路数を特定する。そして、ネットワーク管理装置30は、ノード10毎に、特定された経路数に基づいて、全サーバ20の中から、各ノード10の監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する。更に、ネットワーク管理装置30は、候補として選択されたサーバ20に、監視先のノード10とそのノード10における優先度とを通知する。
また、候補となったサーバ20それぞれは、他のサーバ20との間で通信を行う。そして、候補となったサーバ20(既に監視エージェントとして機能しているサーバを含む。)は、監視エージェントとして機能している他のサーバ20との間で通信ができなくなった場合に、通信ができなくなったサーバ20の監視先のノード10における、自身の優先度を確認する。次いで、候補となったサーバ20は、自身の優先度が、通信ができなくなったサーバ20の次である場合は、そのノード10を監視先として監視を行う。
このように、本実施の形態では、ノード10から各サーバ20までの経路数に基づいて、各ノード10の監視エージェントとなるサーバが選択されるため、監視エージェントの数を適切な数とすることができる。なお、図1においては、各監視エージェントの監視先は、破線で囲まれている。
また、ツリー状に構成されているネットワークにおいて、監視エージェント(サーバ20)と監視先のノード10との間で、ネットワークが切断された場合、監視が不可能になる。しかし、本実施の形態では、このような場合は、監視対象となるノード10の監視が、優先度に基づいて、別の監視エージェントに切り替えて行なわれるので、ノードの監視が不可能になるという事態は回避される。
例えば、図3の例では、ネットワーク管理装置100は、従来からの装置であり、図1に示したネットワーク管理装置30のような機能を有していない。そして、図3の例では、サーバAが、ルータa〜c、サーバBの監視エージェントとして機能し、サーバGが、ルータd〜m、サーバC〜Fの監視エージェントとして機能しているとする。なお、図2においては、各監視エージェントの監視先は、破線で囲まれている。
そして、図3の例において、ルータeとルータfとの間で、断線等で障害が発生したとする。この場合、監視エージェントであるサーバGは、監視対象である、ルータf、ルータg、サーバC、及びサーバDと通信ができず、これらの監視を継続することができない事態が発生する。
また、図2の例において、このような事態の発生をできる限り回避しようとすると、できるだけ多くのサーバを監視エージェントとする必要があるが、この場合は、ネットワーク管理装置100に、処理能力以上の監視情報が送信されてしまう。
これに対して、本実施の形態では、図2に示すように、例えば、ルータeとルータfとの間で障害が発生した場合は、ルータeの監視エージェントはサーバBに変更されるので、障害の発生後も、ルータeの監視は継続される。また、障害からの復旧後に、ネットワーク管理装置30は、サーバC及びサーバDから、障害発生中の情報を得ることができるので、結果、全てのノード10の監視情報が復旧されることになる。
続いて、図4を用いて、本実施の形態におけるネットワーク管理装置及びサーバの構成について説明する。図4は、本発明の実施の形態におけるネットワーク管理システムの構成を示すブロック図である。図1に示すように、本実施の形態においては、ネットワーク管理装置30は、経路特定部31と、候補選択部32と、通信部33と、記憶部34とを備えている。
経路特定部31は、まず、tracerouteコマンドをネットワークに送信して、ネットワークに関する情報を取得する。そして、経路特定部32は、取得した情報を基に、ノード10毎に、各ノード10から各サーバ20までの経路数を特定する。具体的には、経路特定部31は、各ノードから各サーバまでに存在している他のノードの数を、経路数として特定する。
また、経路特定部31は、特定したノード10毎の経路数から経路情報を作成し、作成した経路情報を記憶部34に格納する。なお、経路情報の具体例については、図5を用いて後述する。
候補選択部32は、ノード10毎に、特定された経路数に基づいて、複数のサーバ20の中から、各ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する。
本実施の形態では、候補選択部32は、ノード10毎に、特定された経路数の少ないサーバから順に、設定された数、例えば2つを候補として選択する。また、このとき、候補選択部32は、各ノード10から各候補までの経路において、そのノード10が最初に接続される他のノード10が候補間で異なるように、候補を選択する。
通信部33は、いずれかのノード10の監視エージェントの候補となったサーバ20に、監視先のノード10とそのノード10における優先度とを通知する。本実施の形態では、通信部33は、いずれかのノード10の候補として優先度が最も高いサーバ20に対しては、更に、監視エージェントに指定し、そのことを通知する。
また、本実施の形態では、通信部33は、サーバ20に構築されたエージェント部21に対して通知及び指示を行う。その後、ネットワーク管理装置30は、監視エージェントとして機能しているサーバ20から、監視情報を受信し、ネットワークの監視を実行する。
また、図4に示すように、各サーバ20は、エージェント部21を備えている。エージェント部21は、実際には、エージェントプログラムによって構築されている。エージェント部21は、それが導入されているサーバ20が候補となっている場合は、監視エージェントとして機能している他のサーバ20のエージェント部21との間で通信を行って、他の監視エージェントを監視する。
そして、エージェント部21は、監視エージェントとして機能しているサーバ20との間で通信ができなくなった場合は、通信ができなくなったサーバ20の監視先のノード、特には、監視不可の状態にあるノードの候補とその優先度とを確認する。エージェント部21は、確認の結果、自身のサーバ20が次候補となっている場合は、そのノード10を自身の監視先とする。
[システム動作]
次に、本発明の実施の形態におけるネットワーク管理システム40の動作について図5〜図10を用いて説明する。また、本実施の形態では、ネットワーク管理システム40を動作させることによって、ネットワーク管理方法が実施される。よって、本実施の形態におけるネットワーク管理方法の説明は、以下のネットワーク管理方法の動作説明に代える。
[システム動作:ネットワーク管理装置]
まず、図5〜図7を用いて、ネットワーク管理装置30の動作について説明する。図5は、本発明の実施の形態におけるネットワーク管理装置の動作を示すフロー図である。図6は、本実施の形態で作成される経路情報の一例を示す図である。図7は、本実施の形態において選択された監視エージェントの候補の一例を示す図である。
図5に示すように、最初に、経路特定部31が、tracerouteコマンドをネットワークに送信して、ネットワークに関する情報を取得する(ステップA1)。次に、経路特定部32は、取得した情報を基に、ノード10毎に、各ノードから各サーバまでに存在している他のノードの数を、経路数として特定する(ステップA2)。
ステップA2の実行後、経路特定部31は、特定したノード10毎の経路数から、図6に示す経路情報を作成し、作成した経路情報を記憶部34に格納する。なお、図6は、図1に示したネットワークにおいてノードdを起点にして作成された経路情報を示している。
次に、候補選択部32は、ノード10毎に、特定された経路数に基づいて、複数のサーバ20の中から、各ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する(ステップA3)。
本実施の形態では、候補選択部32は、ステップA3において、まず、ノード10毎に、各ノード10から候補までの経路において、そのノード10が最初に接続されるノード10が異なようにグループ分けする。具体的には、候補選択部22は、例えば、ルータdであれば、図6に示すように、1つ目のノードが、ルータc、ルータe、ルータhのいずれであるかで、各経路をグループ分けする。そして、候補選択部32は、各グループの中からそれぞれ経路数の少ないサーバ20、即ち、図6の例であれば、サーバB、C、Eを選択する。
そして、候補選択部23は、経路数の少ないサーバ20の中から、最大2つのサーバ20を選択し、これらを監視エージェント候補とする。例えば、ルータdであれば、候補選択部23は、上述したサーバB、C、Eのうちの、2つを監視エージェントの候補とする。また、候補選択部23は、他のルータについても同様にして、監視エージェントの候補を選択する。結果は、図7に示す通りとなる。
また、候補選択部23は、候補となり得るサーバが複数存在する場合(図6の例)は、例えば、先に特定したサーバを候補として選択することができる。更に、候補選択部23は、1つ目のノードが全ての経路で同じとなる、グループが1つしか存在しないノードについては、そのノードに隣接しているノードの監視エージェント候補を選択する。
なお、ネットワーク管理装置30は、ノード10を直接監視するわけではなく、監視エージェントから監視情報を収集するだけである。このため、候補選択部23における候補の選択処理において、各ノードからネットワーク管理装置30までの経路を意識する必要はない。
その後、通信部33は、いずれかのノード10の監視エージェントの候補となったサーバ20に、監視先のノード10とそのノード10における優先度とを通知する(ステップA4)。また、ステップA4では、通信部33は、いずれかのノード10の候補として優先度が最も高いサーバ20に対しては、更に、監視エージェントとして指定されていることを通知する。
ステップA4が実行されると、優先度が最も高いサーバ20において、エージェント部21は、監視エージェントとして機能し、監視先のノード10の監視を開始する。
[システム動作:サーバ]
次に、図8〜図10を用いて、監視エージェントとして機能しているサーバ20の動作について説明する。図8は、本発明の実施の形態におけるサーバの監視エージェントとしての動作を示すフロー図である。図9は、図1に示すネットワーク管理システムにおいて障害が発生した直後の状態を示す図である。図10は、図9に示す状態から監視エージェントが切り替わった状態を示す図である。
図8に示すように、候補となっているサーバ20において、エージェント部21は、監視エージェントとして機能している他のサーバ20のエージェント部21との間で、疎通確認のため定期的に通信を行い、監視エージェントを監視する(ステップB1)。なお、この場合の候補となっているサーバ20には、既に監視エージェントとして機能しているサーバと、監視エージェントとしては機能していないが、候補となっているサーバと、の両方が含まれている。
次に、エージェント部21は、通信不可となった監視エージェントが存在しているかどうかを判定する(ステップB2)。ステップB2の判定の結果、通信不可となった監視エージェントが存在していない場合は、エージェント部21は、再度ステップB1を実行する。
一方、ステップB2の判定の結果、通信不可となった監視エージェントが存在している場合は、エージェント部21は、通信不可となった監視エージェントが監視していたノード10の候補とその優先度とを確認する(ステップB3)。
そして、エージェント部22は、ステップB3の確認結果に基づいて、自身のサーバが次候補(即ち、優先度が通信不可となったサーバ20の次に設定された候補)であるかどうかを判定する(ステップB4)。
ステップB4の判定の結果、次候補でない場合は、エージェント部21は処理を終了する。一方、ステップB4の判定の結果、次候補である場合は、エージェント部21は、通信不可となった監視エージェントが監視していたノード10を自身の監視先とする(ステップB5)。
例えば、図9に示すように、ルータcとルータdとの間に障害が発生して、サーバBととルータdとが通信できなくなったとする。この場合、サーバC、D、E、F、及びGは、疎通確認のための定期的通信において、サーバBとの間で通信できなくなったと判定する。そして、これらサーバD〜Gは、サーバBの監視先の監視不可の状態にあるルータdの候補と優先度とを確認する。
確認の結果、サーバCのエージェント部21は、自身のサーバがルータdの次候補であると判定するので、図10に示すように、ルータdを監視先として監視を開始する。
[実施の形態における効果]
実際のネットワーク環境においては、あるノードを起点とした、それに隣接している複数の他のノードへの経路において、同時に障害が発生する可能性は低くいと考えられる。このため、本実施の形態では、あるノードからサーバまでの経路において、このノードが最初に接続されるノードが異なるように、複数のサーバ20が監視エージェントの候補として選択される。
この結果、あるノードと監視エージェントとの間に通信障害が発生しても、別の監視エージェントに切り替えて監視を継続することができる。また、監視エージェントの候補は、予め決められているので、障害発生時には、すぐに監視エージェントが切り替えられることになる。
また、本実施の形態では、ネットワーク管理装置30における負荷が低減されるので、追加コストをかけることなく、大規模な環境に対応することも可能となる。更に、ネットワーク構成に変更があった場合でも、動的に最適なエージェントを配置することも可能となる。
更に、どこかの経路で障害が発生し、それによって、一部の監視エージェントから、ネットワーク管理装置30に監視情報が送信されてこない状態が発生したとする。しかし、図2において説明したように、本実施の形態では、適切に監視エージェントが設置されているため、復旧後に、経路が遮断されていたノードを監視する監視エージェントから、復旧までの間の監視情報が送信されてくる。また、ネットワークが冗長化されている場合でも、ルーティングは一意に決まっているため、本実施の形態を適用することは可能である。
[変形例]
上述した例では、ネットワーク管理装置30は、1つのネットワークのみを管理しているが、本実施の形態はこれに限定されない。本実施の形態では、1つのネットワーク管理装置30が、複数のネットワークに接続され、各ネットワークに対して、監視エージェントの監視を行うこともできる。
[プログラム]
本実施の形態における第1のプログラムは、コンピュータに、図5に示すステップA1〜A4を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態におけるネットワーク管理装置30を実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、経路特定部31、候補選択部32、及び通信部33として機能し、処理を行なう。
本実施の形態における第2のプログラムは、コンピュータに、図8に示すステップB1〜B5を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態におけるサーバ20を実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、エージェント部21として機能し、処理を行なう。
ここで、実施の形態におけるプログラムを実行することによって、ネットワーク管理装置及びサーバを実現するコンピュータについて図11を用いて説明する。図11は、本発明の実施の形態におけるネットワーク管理装置またはサーバを実現するコンピュータの一例を示すブロック図である。
図11に示すように、コンピュータ110は、CPU111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。
CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。
また、記憶装置113の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。
データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
また、記録媒体120の具体例としては、CF(Compact Flash(登録商標))及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記憶媒体、又はCD−ROM(Compact Disk Read Only Memory)などの光学記憶媒体が挙げられる。
上述した実施の形態の一部又は全部は、以下に記載する(付記1)〜(付記20)によって表現することができるが、以下の記載に限定されるものではない。
(付記1)
複数のノードと、複数のサーバと、これらを有するネットワークを管理するネットワーク管理装置とを備え、
前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定し、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択し、
そして、前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知し、
前記複数のサーバのうち前記候補となったサーバそれぞれは、他の監視エージェントとして機能しているサーバとの間で通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、
ことを特徴とする、ネットワーク管理システム。
(付記2)
前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、特定された経路数の少ないサーバから順に、設定された数だけ候補として選択する、付記1に記載のネットワーク管理システム。
(付記3)
前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、前記複数のサーバそれぞれについて、当該ノードから当該サーバまでに存在している他のノードの数を、前記経路数として特定する、付記1または2に記載のネットワーク管理システム。
(付記4)
前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、当該ノードから各候補までの経路において当該ノードが最初に接続される他のノードが前記候補間で異なるように、前記候補を選択する、付記3に記載のネットワーク管理システム。
(付記5)
前記複数のノードが、ネットワークを構成する通信機器である、付記1〜4のいずれかに記載のネットワーク管理システム。
(付記6)
複数のノードと複数のサーバとを有するネットワークを管理するためのネットワーク管理装置であって、
前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、経路特定部と、
前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、候補選択部と、
前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知する、通信部と、
を備えていることを特徴とする、ネットワーク管理装置。
(付記7)
前記候補選択部が、前記複数のノードそれぞれ毎に、特定された経路数の少ないサーバから順に、設定された数だけ候補として選択する、付記6に記載のネットワーク管理装置。
(付記8)
前記経路特定部が、前記複数のノードそれぞれ毎に、前記複数のサーバそれぞれについて、当該ノードから当該サーバまでに存在している他のノードの数を、前記経路数として特定する、付記6または7に記載のネットワーク管理装置。
(付記9)
前記候補選択部が、前記複数のノードそれぞれ毎に、当該ノードから各候補までの経路において当該ノードが最初に接続される他のノードが前記候補間で異なるように、前記候補を選択する、付記8に記載のネットワーク管理装置。
(付記10)
複数のノードと共にネットワークを構成し、且つ、ネットワーク管理装置の管理対象となる、サーバであって、
前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから当該サーバまでの経路数を特定し、特定された経路数に基づいて、当該サーバを、当該ノードの監視エージェントとして機能する候補に選択し、当該サーバに、監視先のノードとそのノードにおける当該サーバの優先度とを通知してきた場合に、
他の監視エージェントとして機能しているサーバとの間で通信を行い、通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、
ことを特徴とする、サーバ。
(付記11)
複数のノードと、複数のサーバと、これらを有するネットワークを管理するネットワーク管理装置とを用いた、ネットワーク管理方法であって、
(a)前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、ステップと、
(b)前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、ステップと、
(c)前記ネットワーク管理装置が、前記(b)のステップで前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知する、ステップと、
(d)前記複数のサーバのうち前記候補となったサーバそれぞれが、他の監視エージェントとして機能しているサーバとの間で通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、ステップと、
を有することを特徴とする、ネットワーク管理方法。
(付記12)
前記(b)のステップにおいて、前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、特定された経路数の少ないサーバから順に、設定された数だけ候補として選択する、付記11に記載のネットワーク管理方法。
(付記13)
前記(a)のステップにおいて、前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、前記複数のサーバそれぞれについて、当該ノードから当該サーバまでに存在している他のノードの数を、前記経路数として特定する、付記11または12に記載のネットワーク管理方法。
(付記14)
前記(b)のステップにおいて、前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、当該ノードから各候補までの経路において当該ノードが最初に接続される他のノードが前記候補間で異なるように、前記候補を選択する、付記13に記載のネットワーク管理方法。
(付記15)
前記複数のノードが、ネットワークを構成する通信機器である、付記11〜14のいずれかに記載のネットワーク管理方法。
(付記16)
複数のノードと複数のサーバとを有するネットワークを、コンピュータによって管理するためのプログラムであって、
前記コンピュータに、
(a)前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、ステップと、
(b)前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、ステップと、
(c)前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知する、ステップと、
を実行させるプログラム。
(付記17)
前記(b)のステップにおいて、前記複数のノードそれぞれ毎に、特定された経路数の少ないサーバから順に、設定された数だけ候補として選択する、付記16に記載のプログラム。
(付記18)
前記(a)のステップにおいて、前記複数のノードそれぞれ毎に、前記複数のサーバそれぞれについて、当該ノードから当該サーバまでに存在している他のノードの数を、前記経路数として特定する、付記16または17に記載のプログラム。
(付記19)
前記(b)のステップにおいて、前記複数のノードそれぞれ毎に、当該ノードから各候補までの経路において当該ノードが最初に接続される他のノードが前記候補間で異なるように、前記候補を選択する、付記18に記載のプログラム。
(付記20)
複数のノードと共にネットワークを構成し、且つ、ネットワーク管理装置の管理対象となる、コンピュータに、
前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから当該コンピュータまでの経路数を特定し、特定された経路数に基づいて、当該コンピュータを、当該ノードの監視エージェントとして機能する候補に選択し、当該コンピュータに、監視先のノードとそのノードにおける当該コンピュータの優先度とを通知してきた場合に、
他の監視エージェントとして機能しているサーバとの間で通信を行い、通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該コンピュータの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、ステップを実行させるプログラム。
以上のように本発明によれば、ネットワーク上の機器によってネットワーク監視を行う場合において、監視エージェントを適切に設置でき、且つ、高可用性を実現することができる。本発明は、種々のコンピュータネットワークに有効である。
10 ノード(ルータ)
20 サーバ
21 エージェント部
30 ネットワーク管理装置
31 経路特定部
32 候補選択部
33 通信部
34 記憶部
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス

Claims (10)

  1. 複数のノードと、複数のサーバと、これらを有するネットワークを管理するネットワーク管理装置とを備え、
    前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定し、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択し、
    そして、前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知し、前記候補として選択されたサーバの中で優先度が最も高いサーバを監視エージェントとして指定し、
    前記複数のサーバのうち前記候補となったサーバそれぞれは、監視エージェントとして指定されている他のサーバとの間で通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、
    ことを特徴とする、ネットワーク管理システム。
  2. 前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、特定された経路数の少ないサーバから順に、設定された数だけ候補として選択する、請求項1に記載のネットワーク管理システム。
  3. 前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、前記複数のサーバそれぞれについて、当該ノードから当該サーバまでに存在している他のノードの数を、前記経路数として特定する、請求項1または2に記載のネットワーク管理システム。
  4. 前記ネットワーク管理装置は、前記複数のノードそれぞれ毎に、当該ノードから各候補までの経路において当該ノードが最初に接続される他のノードが前記候補間で異なるように、前記候補を選択する、請求項3に記載のネットワーク管理システム。
  5. 前記複数のノードが、ネットワークを構成する通信機器である、請求項1〜4のいずれかに記載のネットワーク管理システム。
  6. 複数のノードと複数のサーバとを有するネットワークを管理するためのネットワーク管理装置であって、
    前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、経路特定部と、
    前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、候補選択部と、
    前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知する、通信部と、
    を備えていることを特徴とする、ネットワーク管理装置。
  7. 複数のノードと共にネットワークを構成し、且つ、ネットワーク管理装置の管理対象となる、サーバであって、
    前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから当該サーバまでの経路数を特定し、特定された経路数に基づいて、当該サーバを、当該ノードの監視エージェントとして機能する候補に選択し、当該サーバに、監視先のノードとそのノードにおける当該サーバの優先度とを通知し、前記候補として選択されたサーバの中で優先度が最も高い、他のサーバを監視エージェントとして指定してきた場合に、
    当該サーバは、監視エージェントとして指定されている他のサーバとの間で通信を行い、通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、
    ことを特徴とする、サーバ。
  8. 複数のノードと、複数のサーバと、これらを有するネットワークを管理するネットワーク管理装置とを用いた、ネットワーク管理方法であって、
    (a)前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、ステップと、
    (b)前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、ステップと、
    (c)前記ネットワーク管理装置が、前記(b)のステップで前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知し、前記候補として選択されたサーバの中で優先度が最も高いサーバを監視エージェントとして指定する、ステップと、
    (d)前記複数のサーバのうち前記候補となったサーバそれぞれが、監視エージェントとして指定されている他のサーバとの間で通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該サーバの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、ステップと、
    を有することを特徴とする、ネットワーク管理方法。
  9. 複数のノードと複数のサーバとを有するネットワークを、コンピュータによって管理するためのプログラムであって、
    前記コンピュータに、
    (a)前記複数のノードそれぞれ毎に、当該ノードから前記複数のサーバそれぞれまでの経路数を特定する、ステップと、
    (b)前記複数のノードそれぞれ毎に、特定された経路数に基づいて、前記複数のサーバの中から、当該ノードの監視エージェントとして機能させる2以上の候補を、それぞれに優先度を付与して選択する、ステップと、
    (c)前記候補として選択されたサーバに、監視先のノードとそのノードにおける優先度とを通知する、ステップと、
    を実行させるプログラム。
  10. 複数のノードと共にネットワークを構成し、且つ、ネットワーク管理装置の管理対象となる、コンピュータに、
    前記ネットワーク管理装置が、前記複数のノードそれぞれ毎に、当該ノードから当該コンピュータまでの経路数を特定し、特定された経路数に基づいて、当該コンピュータを、
    当該ノードの監視エージェントとして機能する候補に選択し、当該コンピュータに、監視先のノードとそのノードにおける当該コンピュータの優先度とを通知し、前記候補として選択されたサーバの中で優先度が最も高い、他のサーバを監視エージェントとして指定してきた場合に、
    当該サーバは、監視エージェントとして指定されている他のサーバとの間で通信を行い、通信ができなくなった場合に、通信ができなくなったサーバの監視先のノードにおける、当該コンピュータの優先度を確認し、その優先度が、通信ができなくなったサーバの次である場合に、当該ノードを監視先として監視を行う、ステップを実行させるプログラム。
JP2013069463A 2013-03-28 2013-03-28 ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム Expired - Fee Related JP6111791B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013069463A JP6111791B2 (ja) 2013-03-28 2013-03-28 ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013069463A JP6111791B2 (ja) 2013-03-28 2013-03-28 ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014192872A JP2014192872A (ja) 2014-10-06
JP6111791B2 true JP6111791B2 (ja) 2017-04-12

Family

ID=51838730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013069463A Expired - Fee Related JP6111791B2 (ja) 2013-03-28 2013-03-28 ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6111791B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009088676A (ja) * 2007-09-27 2009-04-23 Fujitsu Ltd 運用管理エージェント、統合運用管理サーバ、運用管理サーバ、運用管理対象装置および運用管理対象認識方法
JP5069168B2 (ja) * 2008-04-18 2012-11-07 日本電信電話株式会社 ネットワーク運用監視システム、マネージャ装置、及びネットワーク運用監視方法
JP6015056B2 (ja) * 2012-03-28 2016-10-26 日本電気株式会社 ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム
JP5998577B2 (ja) * 2012-03-29 2016-09-28 日本電気株式会社 クラスタ監視装置、クラスタ監視方法、及びプログラム

Also Published As

Publication number Publication date
JP2014192872A (ja) 2014-10-06

Similar Documents

Publication Publication Date Title
JP6089884B2 (ja) 情報処理システム,情報処理装置,情報処理装置の制御プログラム,及び情報処理システムの制御方法
US8065560B1 (en) Method and apparatus for achieving high availability for applications and optimizing power consumption within a datacenter
US8112518B2 (en) Redundant systems management frameworks for network environments
US20140372601A1 (en) Monitoring apparatus and monitoring method
EP2645635B1 (en) Cluster monitor, method for monitoring a cluster, and computer-readable recording medium
JP2007164264A (ja) 負荷分散プログラム、負荷分散装置、サービスシステム
EP3267635A1 (en) Network control device, network control method, and recording medium for program
JP6179119B2 (ja) 管理装置、管理方法、及び管理プログラム
JP5754504B2 (ja) 管理装置、情報処理装置、情報処理システム及びデータ転送方法
JP5632820B2 (ja) 広域分散構成変更システム
JP2008060971A (ja) 情報処理システム、情報処理装置、情報処理方法およびプログラム
JP6838334B2 (ja) クラスタシステム、サーバ、サーバの動作方法、及びプログラム
JP2016177324A (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP6111791B2 (ja) ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム
JP6790667B2 (ja) クラスタシステム、サーバ、動作方法、及びプログラム
JP6561766B2 (ja) 情報処理装置、クラスタシステム、クラスタリング方法、及びプログラム
JP2007334764A (ja) Nasシステムおよびnasシステムの情報処理方法
JP5483784B1 (ja) 制御装置、計算資源管理方法及び計算資源管理プログラム
US9860125B2 (en) Network system, node, network management method, and computer-readable recording medium
JP2009032052A (ja) 情報処理装置、情報処理方法及びプログラム
JP7332249B2 (ja) 移行先決定プログラム、装置、及び方法
JP6224985B2 (ja) 通知装置及び通知方法
JP6476718B2 (ja) 情報処理システム、プログラム、及び情報処理方法
JP2010212807A (ja) フェイルオーバー方法、そのシステム、ノード及びプログラム
JP2022130200A (ja) コンテナ管理方法およびコンテナ管理プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20150123

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170227

R150 Certificate of patent or registration of utility model

Ref document number: 6111791

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees