JP3813776B2 - ネットワーク分散管理システム - Google Patents

ネットワーク分散管理システム Download PDF

Info

Publication number
JP3813776B2
JP3813776B2 JP32698899A JP32698899A JP3813776B2 JP 3813776 B2 JP3813776 B2 JP 3813776B2 JP 32698899 A JP32698899 A JP 32698899A JP 32698899 A JP32698899 A JP 32698899A JP 3813776 B2 JP3813776 B2 JP 3813776B2
Authority
JP
Japan
Prior art keywords
network
server
monitoring server
group
network monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32698899A
Other languages
English (en)
Other versions
JP2001144761A (ja
Inventor
智弘 石山
英雄 安達
真吾 田口
博 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP32698899A priority Critical patent/JP3813776B2/ja
Publication of JP2001144761A publication Critical patent/JP2001144761A/ja
Application granted granted Critical
Publication of JP3813776B2 publication Critical patent/JP3813776B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はネットワーク分散管理システムに係り、特に大規模化、複雑化したネットワークを複数の監視サーバにより効率的に監視したものに関する。
【0002】
【従来の技術】
近年、通信回線等のネットワーク技術の発達、メディアの普及に伴い、通信ネットワークシステムは急速に拡大、進歩を遂げており、これに伴って大規模化、複雑化していくネットワークを支障なく運用するために、ネットワーク上の通信機器の通信状態を監視、管理するシステムが必要となっている。
【0003】
ネットワーク管理は、SNMP(Simple Network Management Protocol)というネットワーク管理プロトコルを使用して、ネットワーク上の監視側装置(マネージャ)と、マネージャに対する応答機能(エージェント機能)を持つ被監視側装置が通信して、マネージャが管理に必要な情報、例えば装置構成情報や状態情報をノードに要求し、ノードがそれに応答することで監視側が情報収集を行い、ネットワーク上の全ノードからの情報を集中管理することで実現される。
【0004】
従来のネットワーク分散管理システムを図16により説明する。図16は、ネットワーク1、ネットワーク2、ネットワーク3を回線で接続し、一台のネットワーク監視サーバ101により各ネットワーク1、2、3の状態を監視するものである。なお、ネットワーク監視クライアント102は、ネットワーク監視サーバ101の内容を遠隔操作により認識するものである。
【0005】
ネットワーク1は複数のノードと、一台のルータにより構成されている。ネットワーク2、3もネットワーク1と同様に構成されている。そしてネットワーク1、2、3、ネットワーク監視サーバ101、ネットワーク監視のクライアント102等により1つのネットワーク100を構成している。
【0006】
図16に示す如く、ネットワーク100が小規模な場合は一台のネットワーク監視サーバで各ネットワーク1、2、3の状態を監視することができる。しかし大規模なネットワークでは、全体を一台のネットワーク監視サーバで監視するときはネットワーク監視サーバ(マネージャ)の性能が高性能のものを使用しなければならないため非常に高価なものとなる。
【0007】
そのため、大規模なネットワークでは1箇所へのネットワーク負荷の集中を避けるため、一台のマネージャで全てのノードを監視するのではなく、複数のマネージャを分割したサブネットワーク毎に分散して配置し、それらを統合するマスターサーバが各部門に分散したマネージャからの情報を一括して管理することで、ネットワークを統合して管理する。
【0008】
【発明が解決しようとする課題】
ネットワーク管理は、そのネットワークに新たな通信機器やサブネットワークの追加等、ネットワークの構成が変更される度にその管理構成についても変更する必要がある。
【0009】
しかし近年のネットワーク技術の発達やメディアの普及の急速な発達に伴い、ネットワークシステムの大規模化、複雑化のスピードもますます増しており、ネットワーク上に新たにノードを追加して管理する場合、その度にネットワーク管理の構成も見直しの必要を迫られる回数が増え、またその構成も複雑さを増す一方で最適なネットワーク管理を行うための構成の設計も複雑なものになっている。
【0010】
従来の技術ではネットワーク構成が複雑になるのに合わせてその管理構成の見直しにかかる作業も増加していった。
【0011】
またネットワーク上の監視対象とするノードの増加に比例して管理情報の収集にかかる時間が増大し、ネットワーク上の異常検出にも時間がかかる様になっている。これに対応するために監視サーバを追加することがさらに管理構成の再構成の再構築を複雑にしていくことになる。
【0012】
またネットワークシステムの規模が大きくなり、監視機器を増加する必要が増えるにつれて、本来監視する通信機器だけでなくネットワーク監視側にもトラブルが発生する機会が増え、トラブルによって監視サーバ自身に問題が発生したとき、監視自体に支障が発生した場合にも円滑に監視を続けるためにそのバックアップ手段が必要とされる様になってきたが、そのバックアップのためにネットワーク負荷の増加や、あるいは一時的な監視抜けを招いたり、完全な対応がとれないでいた。
【0013】
またネットワーク全体の管理状態を認識するために、遠隔地にあるメインサーバにアクセスする場合もあり、全体状況を把握する上での制限があった。
【0014】
本発明は、ネットワークをグループに分割する際に、各ネットワーク内に設置した監視サーバにはグループ内の各ノードに対してのみSNMP通信による状態情報の取得を行うことで、監視サーバ一台あたりに係る負荷の分散、軽減及び通信経路に集中する負荷を分散させながら、且つ分散した周辺の他の監視サーバ間で各々の管理情報を共有することで、通信コスト抑えながら各監視サーバからのネットワークシステム全体の監視、ネットワーク異常の早期検出、サーバ間の代替機能による監視サーバ自体のトラブルによる監視不可となることの回避を可能とし、ネットワーク監視の信頼性を向上させることを目的とする。
【0015】
【課題を解決するための手段】
本発明の原理を図1に示す。図1において、Aは第1のネットワークグループ、Bは第2のネットワークグループ、1は第1ネットワーク、2は第2ネットワーク、3は第3ネットワーク、4はネットワーク監視サーバ、5はネットワーク監視クライアント、6は回線、7はネットワーク監視サーバ、10は第1のネットワークグループAと第2のネットワークグループBにより構成される全ネットワークである。
【0016】
本発明の前記目的は下記(1)の構成により達成することができる。
【0017】
(1)ネットワーク分散管理システムにおいて、ネットワークに接続されたノードを複数のグループに分けてネットワークグループを構成し、前記各ネットワークグループ毎にネットワーク監視サーバを設置し、前記ネットワーク監視サーバが、他の前記ネットワーク監視サーバの持っている管理情報を取得し、共有することにより、ネットワーク監視を行うと共に、新規に前記ネットワークグループが追加された時に、当該追加されたネットワークグループ内においてノードが重複している場合には、管理しているノード数の少ない他のネットワーク監視サーバが当該重複したノードを監視することを特徴とする。
【0032】
これにより下記の作用効果を奏することができる。
【0033】
(1)ノードの構成情報、状態情報を共有することにより、SNMP通信によるノード管理を行っていないノードに対しても管理が可能となる。
【0034】
また、監視するネットワークグループ外のノードに対しては、そのネットワークグループを監視しているネットワーク監視サーバより一括してノード監視情報を提供してもらうことにより、SNMP通信を行わずにノード管理情報を取得することが可能となり、ネットワークトラフィックの負荷を軽減することが可能となる。
【0036】
(2)ノード管理の重複を無くすことにより、ネットワーク管理の最適化を行うと共にサーバの負担を軽減させることが可能となる。
【0054】
【発明の実施の形態】
本発明の関連技術及び一実施の形態を図2にもとづき説明する。図2において、aは第1のネットワークグループ、bは第2のネットワークグループ、cは第3のネットワークグループ、11−0、11−1はノード、11−2はルータ、12はネットワーク監視サーバ、14は回線、15はISDN網、16は新規管理ノード、17はルータ、21−0〜21−2はノード、21−3、21−4はルータ、22はネットワーク監視サーバ、31−0はノード、31−1はルータ、32はネットワーク監視サーバである。なお各ノードと各ルータは管理ノードである。
【0055】
本発明の関連技術では、ノード11−0、11−1、ルータ11−2を有するネットワークグループaをネットワーク監視サーバ12で監視し、ノード21−0、21−1、21−2、ルータ21−3、ルータ21−4を有するネットワークグループbをネットワーク監視サーバ22で監視し、ノード31−0、ルータ31−1を有するネットワークグループcをネットワーク監視サーバ32で監視する。
【0056】
ネットワーク監視サーバ12はノード11−0、11−1、ルータ11−2の動作状態やネットワークグループaの構成状態を監視するとともに、この監視情報を回線14やISDN網15を経由する通信により他のネットワーク監視サーバ22、32に通知する。
【0057】
ネットワーク監視サーバ22はノード21−0、21−1、21−2、ルータ21−3、21−4の動作状態やネットワークグループbの構成状態を監視するとともに、その監視情報を回線14やISDN網15を経由する通信により、他のネットワーク監視サーバ12、32に通知する。
【0058】
そしてネットワーク監視サーバ32はノード31−0、ルータ31−1の動作状態やネットワークグループcの構成状態を監視するとともに、その監視情報をISDN網15や回線14を経由する通信により他のネットワーク監視サーバ12、22に通知する。
【0059】
このようにしてネットワーク監視サーバ12は自分のネットワークグループaのノードとルータとで定義される管理ノードを監視するだけで、他のネットワークグループb、cの監視情報をも保持する、すなわち全ネットワーク情報を保持することができる。同様にネットワーク監視サーバ22、32もそれぞれ自分のネットワークグループのノードとルータである管理ノードを監視するだけで他のネットワークグループの監視情報をも保持でき、全ネットワークの情報を保持することができる。
【0060】
図3は、前記の構成をブロック図でわかり易く説明したものである。図3において、ネットワーク監視サーバ12、22は図2のネットワーク監視サーバ12、22に相当し、図3のネットワークグループa、bは、図2のネットワークグループa、bに相当する。
【0061】
図3において、ノード35はネットワークグループaに属しており、ネットワーク監視サーバ12が、▲1▼に示す如く、ノード35を監視しており、その監視情報が、▲2▼に示す如く、ネットワーク監視サーバ12からネットワーク監視サーバ22に通知されること、またノード36はネットワークグループbに属しており、ネットワーク監視サーバ22が、▲1▼に示す如く、ノード36を監視しており、その監視情報が、▲2▼に示す如く、ネットワーク監視サーバ22からネットワーク監視サーバ12に通知されることを示している。
【0062】
またネットワーク監視クライアント37は、遠隔操作により、▲3▼に示す如く、ネットワーク監視サーバ32、ネットワーク監視サーバ12の情報を認識できることを示す。このようにして、ネットワーク監視サーバ12、22は、それぞれ自分の監視対象であるネットワークグループaまたはbを監視するのみで、他のネットワークグループの監視情報を入手することができ、これにより全ネットワークの監視情報が保持されることになる。
【0063】
ところで本発明の一実施の形態を説明する。図2において、例えばルータ21−4がネットワークグループbにおけるネットワーク監視サーバ22により監視されている場合において、このルータ21−4がグループaのネットワーク監視サーバ12によっても監視されていることが、ネットワーク監視サーバ12、22間の管理情報の通信等によりわかったとき、自動的にノード管理数の少ないネットワーク監視サーバ12がこれを監視することになる。なお図2ではルータ21−4は前記の如く重複監視されていないので、図2ではルータ21−4はネットワーク監視サーバ22により監視されたままである。
【0064】
図2において、新規管理ノードであるノード16をルータ17を経由して回線14に接続され、これをネットワークグループaに接続してそのIPアドレス(インターネット・プロトコル・アドレス、図2では172.22.13.0)をネットワーク監視サーバ12に記入したとき、ネットワーク監視サーバ12はこれをネットワーク監視サーバ22、32に通知する。これによりネットワーク監視サーバ22、23は、ノード16、ルータ17を直接監視することなく、ネットワーク監視サーバ12からの通知により、これらの接続状態、動作状態を管理することができる。ノード16を追加するときのみならず、管理ノードを削除したり、変更するときも同様である。
【0065】
図4は新規ノード38がネットワークグループbに接続された状態を示す。即ち新しくノード38が▲1▼に示す如く、ネットワークグループbに接続されたとき、そのネットワーク監視サーバ22がこれを認識する。そしてこのノード38が新しく接続されたことをネットワーク監視サーバ12、▲2▼に示す如く、通知する。これによりネットワーク監視サーバ12はノード38が新しくネットワークグループbに接続されたことを認識する。
【0066】
このように、ノードの追加、削除変更を他のネットワーク監視サーバにおいても即時に認識することが可能になる。なおネットワーク監視クライアント37は、▲3▼に示す如く、ネットワーク監視サーバ12の情報をリモートでみることにより、これを認識することができる。
【0067】
次にノードを新規に管理する場合、どのネットワークグループに属するのが最適であるのかを示す最適化管理の手法について説明する。この最適化の手法として(1)管理ノード数にもとづく、(2)ネットワークコストにもとづく、(3)トータル管理コストにもとづく手法がある。
【0068】
(1)管理ノード数にもとづく管理
管理ノード数にもとづく管理とは、各ネットワークグループの管理ノード数の最も小さいものに新しいノードを管理させるものである。図2の場合、ネットワークグループaの管理ノード数は、ルータが1、ノードが2の合計3であり、ネットワークグループbの管理ノード数はルータが2、ノードが3の合計5であり、ネットワークグループcの管理ノード数はルータとノードが各1の合計2である。この手法によればネットワークグループcのネットワーク監視サーバ32に新規ノードを管理させることになる。
【0069】
(2)ネットワークコストにもとづくもの
ネットワークコストにもとづく管理とは、ルータとWAN(この例ではISDN網)のネットワークコストを各ネットワークグループ毎に求め、その最小のものに新規ノードを管理させるものである。いまルータのネットワークコストを+10、WANのネットワークコストを+100とすると、ネットワークグループaはネットワーク監視サーバ12が新規のノード16と通信を行うためのルータが2つとなるのでネットワークグループaにおけるネットワークコストは2×10=20となる。
【0070】
ネットワークグループbはネットワーク監視サーバ22が新規のノード16と通信を行うためのルータの数が2つとなるので、ネットワークグループbにおけるネットワークコストは2×10=20となる。そしてネットワークグループcではネットワーク監視サーバ32が新規のノード16と通信を行うためのルータの数が3であり、またISDN網からなるWANを経由するためネットワークグループcにおけるネットワークコストは3×10+100=130となる。したがってこれにもとづけばネットワークグループaかbに管理することになる。
【0071】
(3)トータル管理コストにもとづくもの
トータル管理コストにもとづく管理とは前記(2)のネットワークコストに、ノードのコストを加算したものである。いまノードのコストを1とするとき、ネットワークグループaにおけるトータル管理コストはノード数が合計3になるので3+20=23となる。ネットワークグループbにおけるトータル管理コストはノード数が合計5になるので5+20=25となる。そしてネットワークグループcにおけるトータル管理コストはノード数が合計2になるので2+130=132となる。
【0072】
従って前記(3)のトータル管理コストがもっとも安いものという観点で選択されたとき、新規のノード16はネットワークグループaに属し、ネットワーク監視サーバ12により監視されることになる。このときルータ17のIPアドレス172.22.13.0がネットワーク監視サーバ12に登録される。そしてこのIPアドレスを含めたノード16の管理情報は、他のネットワーク監視サーバ22、32に通知されることにより、ノードはグループ管理される。
【0073】
なお前記(1)〜(3)の演算はネットワーク監視サーバの1つで行われるものである。そして前記(2)に示す如く、値が同一の場合は、ネットワークのIPアドレスグループで近い方(この場合はルータ21−3)のIPアドレスがルータ11−2のIPアドレスよりルータ17のIPアドレスに近いので、ネットワーク監視サーバ22に管理させることになる。なおIPアドレスが近いということは、ネットワークの位置が近いことを示している。
【0074】
また、ネットワーク監視サーバが他のものよりも負担に不均衡があるとき、バランスさせることができる。例えば図5に示す如く、ネットワーク監視サーバ39がノードn1〜n6を監視し、ネットワーク監視サーバ40がノードn7、n8を監視しているような場合、サーバ39では監視規定時間内に各ノードn1〜n6からの監視開始、終了信号が来なければ、サーバ39が過負荷状態であることになる。
【0075】
このようなとき、ネットワーク監視サーバ39は、ネットワーク監視サーバ40に対しノードn1、n2の監視を依頼することを行うことにより、ネットワーク監視サーバ40が過負荷状態でなければ、点線に示す如く、ネットワーク監視サーバ40がこれらのノードの監視を行うことができる。そしてこの監視状態変更の情報は、図示省略した他のネットワークグループのネットワーク監視サーバに通知されることになる。
【0076】
本発明の関連技術を図6〜図8により説明する。本発明の関連技術は、図6(A)に示す如く、ネットワークAとネットワークBを1つのネットワーク監視サーバAにより監視しているとき、例えばネットワーク監視サーバAの過負荷状態を防止するため、ネットワーク監視サーバAの監視動作を継続させたまま同(B)に示す如く、ネットワークBに新しくネットワーク監視サーバBを追加する場合のものである。
【0077】
図6(A)に示す如く、最初はネットワーク監視サーバAは、ネットワークAとネットワークBを監視グループに含んでいるので、最初は、ネットワーク監視サーバAの登録リストは、図7(A)に示す如く、設定されている。
【0078】
すなわち、ネットワーク監視サーバAの管理対象である管理ネットワーク情報としてはネットワークAとネットワークBが登録される。そしてネットワークA、Bのそれぞれの管理ノード情報を保持している。この管理ノード情報にはそれぞれのIPアドレス情報も含まれている。
【0079】
ここで、ネットワーク監視サーバAのネットワーク管理に負荷がかかり始めたので、ネットワークBをネットワーク監視グループから切り離し、新規ネットワーク監視サーバBにより管理を行うことになる。
【0080】
新規ネットワーク監視サーバBはネットワークBをグループ登録することになるので、登録リストは、図7(B)に示す如く設定される。
【0081】
それからネットワーク監視サーバAと新規ネットワーク監視サーバBをサーバのグループ化を行い、お互いの管理情報を伝達することにより、管理情報が共有されることになるため、登録リストは、ネットワーク監視サーバAにおいては図7(C)に示す如く設定され、またネットワーク監視サーバBにおいては図8(A)に示す如く設定される。
【0082】
すなわち図7(C)に示す如く、ネットワーク監視サーバAにおいては、新しくネットワーク監視サーバBよりその管理ネットワーク情報が伝達されてくるため、それまで自己が監視していた管理ネットワーク情報のネットワークBに相当するものが重複されて保持される。
【0083】
また、図8(A)に示す如く、新しいネットワーク監視サーバBにおいては、ネットワーク監視サーバAから管理サーバ情報が伝達されるが、これにはネットワークBの管理ネットワーク情報が含まれているので、これが重複されて保持されることになる。
【0084】
しかし新しいネットワーク監視サーバBの追加により、ネットワーク監視サーバAのネットワークBの監視が不用になったことにより、ネットワーク監視サーバAの監視グループからネットワークBを削除する。このように情報更新後のそれぞれのネットワーク管理データは図8(B)、(C)に示す如きものとなる。
【0085】
このような処理により、ネットワーク監視サーバAの監視を継続したまま、図6(B)に示す如く、ネットワーク管理構成の変更に対応することが可能となる。また同時に、ネットワーク監視サーバAのノード管理の負荷を軽減することが可能となる。
【0086】
すなわち、図6(A)に示す如く、ネットワークAとネットワークBを1つのネットワーク監視サーバAにより監視する状態を継続しつつ、図6(B)の▲1▼に示す如く、ネットワークBを新規ネットワーク監視サーバBにより監視させ、前記の如く、この情報を、及びネットワーク監視サーバAからの情報を▲2▼に示す如く、ネットワーク監視サーバに通知あるいは受信することによりネットワーク監視サーバAを動作継続させたままネットワーク監視サーバBを設定することができる。
【0087】
本発明の関連技術を図9〜図10により説明する。本発明の関連技術では、ネットワーク監視サーバに異常が発生したとき、他のネットワーク監視サーバにより異常が発生したネットワーク監視サーバの代行を行うものである。
【0088】
図9では、ネットワークグループAの状態をネットワーク監視サーバAで監視するとともにネットワーク監視バックアップサーバCでも監視するものである。ネットワークグループAが非常に重要なものである場合、ネットワーク監視サーバAの外に更にネットワーク監視バックアップサーバCにより二重監視をする。ネットワークグループBの状態はネットワーク監視サーバBにより行う。
【0089】
ネットワーク監視サーバAは、ネットワークグループAの監視の外にネットワーク監視バックアップサーバCからの監視情報を通信しており、ネットワーク監視バックアップサーバCからの監視情報も▲2▼に示す通信ルートにより保持している。勿論ネットワーク監視サーバAはネットワーク監視サーバBからの通信によりネットワークグループBの監視情報も保持している。
【0090】
いまネットワーク監視サーバAに異常が発生し、▲1▼に示すルートによりネットワークグループAに対する監視情報が伝達されなくなった場合には、ネットワーク監視サーバBは、▲3▼に示す如く、ネットワーク監視バックアップサーバCに対してIPアドレスによる通信を行ってネットワーク監視バックアップサーバCのネットワークグループAに対する監視情報を入手することができる。なおネットワーク監視バックアップサーバCのアドレス情報は、ネットワーク監視サーバAから▲1▼の通信ルートによりネットワーク監視サーバBに伝達される管理ノード情報の中に含まれている。
【0091】
図10ではネットワーク監視サーバBに障害が発生した場合を示す。図10において、ネットワーク監視サーバA、ネットワーク監視サーバBがいずれも正常の場合、ネットワーク監視サーバAはネットワークグループAのみを監視し、またネットワーク監視サーバBはネットワークグループBのみを監視し、それぞれの監視情報を▲1▼の通信ルートによりお互に伝達する。またネットワーク監視クライアントDは、リモートコントロール操作により、▲2▼の通信ルートによりネットワーク監視サーバAをみることができる。
【0092】
いまネットワーク監視サーバBに障害が発生して▲1▼の通信ルートによりネットワーク監視サーバAからの応答がなくなったとき、ネットワーク監視サーバAは▲3▼のルートによりネットワークグループBの状態を監視する。ネットワークグループBのアドレスは、ネットワーク監視サーバBが正常のときに伝達された管理ノード情報の中に含まれているので、これを使用してネットワークグループBの状態を監視することができる。
【0093】
そしてネットワーク監視サーバBがネットワーク監視サーバAからの問合せに正常に応答したことによりネットワーク監視サーバBが正常に復旧したことをネットワーク監視サーバAが認識したとき、ネットワークグループBに対する監視を止めて、ネットワークグループBの監視情報を、ネットワーク監視サーバBより自動的に受取ることになる。これによりネットワーク監視を自動的に継続することができる。
【0094】
図11では、ネットワーク監視サーバbに障害が発生した場合、ネットワークグループbの監視をネットワーク監視サーバaとネットワーク監視サーバcのいずれが行うのが最適かを判別するものである。
【0095】
図11においては、ネットワーク監視サーバaがネットワークグループaを監視し、ネットワーク監視サーバbがネットワークグループbを監視し、ネットワーク監視サーバcがネットワークグループcを監視している。そして各ネットワーク監視サーバで得られた監視情報は、それぞれ他のネットワーク監視サーバに伝達され、各ネットワーク監視サーバは全ネットワークの監視情報を保持することができる。
【0096】
いま図11において例えばネットワーク監視サーバbに障害が発生したとき、他のネットワーク監視サーバでネットワークグループbの監視情報を得ることが必要である。このとき、ネットワーク監視サーバaが行う方が適当か、ネットワーク監視サーバcで行う方が適当か判別することが必要になる。
【0097】
ところで各ネットワーク監視サーバには管理情報により各ネットワーク監視サーバが監視しているネットワークグループの構成情報が伝達されているので、例えばネットワーク監視サーバaで前記(3)で説明したトータル管理コストを算出し、そのもっとも小さい方にこれを行わせる。いまこの算出の結果、ネットワーク監視サーバaで監視した方がこのコストが最小のとき、ネットワーク監視サーバaで監視することになる。すなわち、図11の▲1▼のルートで監視が行われることになる。
【0098】
なおこの演算は、前記(1)または(2)のいずれにより求めることもできる。
【0099】
本発明の他の実施の形態を図12にもとづき説明する。第4の実施の形態では、全ネットワークを2つのサーバグループに分け、各サーバグループの代表管理サーバ間で監視情報を通信して各ノード管理情報を得、これを共有するものである。
【0100】
図12に示す如く、ノードna1〜na5と、ルータa1、a2と、ネットワーク監視サーバAで構成されたノードグループAと、ノードnb1〜nb3と、ルータb1、b2と、ネットワーク監視サーバBで構成されたノードグループBとによりサーバグループ1を構成する。なお、ネットワーク監視サーバA、BはそれぞれノードグループA、Bを管理している。
【0101】
またノードnc1、nc2と、ルータc1、c2と、ネットワーク監視サーバCで構成されたノードグループCと、ノードnd1〜nd5と、ルータd1と、ネットワーク監視サーバDで構成されたノードグループDと、ノードne1〜ne3と、ルータe1、e2と、ネットワーク監視サーバEで構成されたノードグループEとによりサーバグループ2を構成する。なお、ネットワーク監視サーバC、D、EはそれぞれノードグループC、D、Eを管理している。
【0102】
そしてこのサーバグループ1とサーバグループ2をWANであるISDN網を経由して管理ノード情報を通信するとき、サーバグループ1、2のどのネットワーク監視サーバ間で交信を行うのが最適であるのか選択することが必要である。
【0103】
このため先ずサーバグループ1、2にそれぞれ仮代表サーバを適宜決める。そしてサーバグループ1の仮代表サーバをネットワーク監視サーバAとし、サーバグループ2の仮代表サーバをネットワーク監視サーバCとする。
【0104】
仮代表サーバAと仮代表サーバCとが通信を行い、それぞれのサーバグループの管理サーバ情報を通知し、システム構成を知らせる。それから仮代表サーバAはネットワーク監視サーバBに対してサーバグループ2の管理サーバ情報を通知してシステム構成を知らせる。また仮代表サーバCは、ネットワーク監視サーバD、Eに対してサーバグループ1の管理サーバ情報を通知してシステム構成を知らせる。
【0105】
これにより各ネットワーク監視サーバでは、通知された相手方のネットワーク監視サーバと自ネットワーク監視サーバ間の通信コストを算出する。前記(1)、(2)、(3)のいずれかにより算出する。例えば前記(3)のトータル管理コストで計算する。
【0106】
イ.サーバグループ1から相手方のサーバグループ2をみたとき、相手方のネットワーク監視サーバC、D、Eのノード管理数(ノードとルータの数の和)は下記の通りである。
【0107】
C:4
D:6
E:5
ロ.ネットワーク監視サーバAと相手方のネットワーク監視サーバC、D、Eのネットワークコストは下記の通りである。
【0108】
A−C間=10+10+10+100+10+10=150
A−D間=10+10+10+100+10+10=150
A−E間=10+10+10+100+10+10+10=160
したがってトータル管理コストは下記の通りである。
【0109】
A−C間=150+4=154
A−D間=150+6=156
A−E間=160+5=165
ハ.またネットワーク監視サーバBと相手方のネットワーク監視サーバC、D、Eのネットワークコストは下記の通りである。
【0110】
B−C間=10+10+100+10+10=140
B−D間=10+10+100+10+10=140
B−E間=10+10+100+10+10+10=150
したがってトータル管理コストは下記の通りである。
【0111】
B−C間=140+4=144
B−D間=140+6=146
B−E間=150+5=155
ニ.ネットワーク監視サーバAは、前記ロで計算した結果と、ネットワーク監視サーバBから送られてきた前記ハの計算結果にもとづき、これらトータル管理コストの安いものより通信の優先順位を決定する。その結果下記1〜6の順位が決定される。
【0112】
1:B−C間
2:B−D間
3:A−C間
4:B−E間
5:A−D間
6:A−E間
もしトータル管理コスト情報に同一値が存在する場合、自方ネットワーク監視サーバなら仮代表サーバAが優先され、相手方管理サーバならネットワークのIPアドレスグループの小さい管理サーバ(ここではC)が登録される。
【0113】
この結果によりネットワーク監視サーバBをサーバグループ1の代表サーバと設定し、相手方のサーバグループ2のネットワーク監視サーバCから情報を取得するように設定する。サーバグループ2も同様にネットワーク監視サーバCを代表サーバと設定し、相手方のネットワーク監視サーバBから情報を取得するように設定する。
【0114】
サーバグループ1の代表であるネットワーク監視サーバBからサーバグループ2の代表であるネットワーク監視サーバCへの通信に対し、応答がない場合は障害発生として動作し、前記計算順位により、次にコストの安いネットワーク監視サーバD、Eの順で通信を行うことにより通信を確立する。
【0115】
このように代表サーバをきめて通信を行うことにより、代表サーバが受信した相手方の管理情報をそのグループの他のネットワーク監視サーバが共有することになる。このようにして代表サーバを決めることによりサーバグループ1、2間の通信が短時間ですみ、コストが安くなる。
【0116】
本発明の関連技術を図13により説明する。この本発明の関連技術ではノードna1〜na4で構成されるグループAをネットワーク監視サーバAで監視し、ノードnb1〜nb3で構成されるグループBをネットワーク監視サーバBで監視し、ノードnc1〜nc4で構成されるグループCをネットワーク監視サーバCで監視し、ノードnd1〜nd3で構成されるグループDをネットワーク監視サーバDで監視し、ノードnb4、nd4をネットワーク監視サーバEで監視する。
【0117】
そしてネットワーク監視サーバA、Bをグループ化してその一方、例えばネットワーク監視サーバAをマスタとしてこれがグループAとBを統合管理する。またネットワーク監視サーバCとDをグループ化してその一方例えばネットワーク監視サーバCをマスタとしてこれがグループCとDを統合管理する。
【0118】
そしてこのマスタのネットワーク監視サーバでそのグループ全体の管理情報を持つ。そしてネットワーク監視サーバA、B、C、D、Eもネットワーク監視グループとしてグループ化する。
【0119】
従って重複したネットワークグループ内の監視状態の変化が、ネットワーク監視サーバにおけるトラブルに対しても各監視グループに瞬時に検出されることが可能となり、ネットワーク管理を強化することができる。
【0120】
なお、一点鎖線で示す如く、グループ化することにより、ノードnb4、nd4をネットワーク監視サーバEのみでなく、ネットワーク監視サーバBまたはDにより二重に監視することもできるので、重要な機能のノードに対しては監視を強化することもできる。
【0121】
本発明の関連技術を図14、図15により説明する。この関連技術ではネットワーク監視サーバを集中監視するものである。
【0122】
図14に示す如く、ネットワークグループA、Bはそれぞれネットワーク監視サーバA、Bにより監視されている。そしてこれらネットワーク監視サーバA、Bはネットワーク監視サーバCにより集中監視され、これらネットワーク監視サーバA、Bの監視情報は▲1▼のルートにより直ちにネットワーク監視サーバCに通知される。従ってネットワーク監視クライアントAは、▲2▼のルートによりネットワーク監視サーバCをリモートでみることにより、直ちにネットワーク監視サーバA及びBの状態をみることができる。
【0123】
なお、ネットワーク監視サーバAは図15に示す如く、ネットワークグループBの情報を、ネットワーク監視サーバCを経由して得ることができる。
【0124】
本発明によればネットワークの全体監視を行う際に、ネットワークに接続された各ノードを物理的、論理的に管理し易い単位にグループ分けして各グループ毎にネットワーク監視サーバを設置し、グループ内のノードのみを管理対象にし、分割した各グループを統合管理するマスタを設置することで監視によるトラフィックの集中を分散し軽減し、またサーバの資源状態、監視ノードグループ、監視対象ノード数、ネットワークコスト等を考慮して監視対象ノードと監視サーバを決定することで最適なネットワーク監視を構築する。
【0125】
またノードの追加、変更によるネットワーク構成認識の変更をグループ内で検出することで、構成認識の変更を容易にし柔軟な対応を可能にする。
【0126】
グループ分けした監視サーバ間で管理情報を相互に交換し共有することで、自身が直接監視していないノードについても管理し、各グループのネットワーク監視サーバでネットワーク全体を監視することができる。
【0127】
グループ内に監視サーバをバックアップする手段を置き、監視サーバに異常が発生した場合、ノードの監視と他グループとの情報交換機能を引き継ぐことにより、グループ内のノード監視、ネットワーク全体でのノード監視が支障なく行えるようにする。またグループ内にバックアップを持たない場合は、分散した監視サーバ間で障害発生等により他の監視サーバで発生した異常状態を早期に検出し、その監視サーバが管理していたノードの監視を代理で引き継ぐことにより、ネットワーク全体でのノード監視が支障なく行えるようにすることができる。
【0128】
ところで特開平5−14368号公報にはネットワーク監視装置間で相互に情報を交換し、ネットワーク全体を監視することが記載されているが、これは同一同軸ケーブル毎に1つのネットワーク監視装置を設置している。これに対して本発明は同一同軸ケーブルといった物理構成にとらわれず、ネットワークの通信回線(LAN)、公衆回線(WAN)に対しても適用でき、論理構成のネットワーク監視グループ毎に設置すればよく、さらなる監視効率の向上が見込まれるものである。
【0129】
特開平8−288945号公報にはサブネットワークの監視装置間で運用情報を通知したり、監視装置異常により他の監視装置が代行して監視の継続化をはかることが記載されている。しかしこれは、本発明におけるように、ネットワークグループ内で新規にネットワーク監視サーバをグループ化した時に、ノード管理の重複を無くしてネットワーク管理の最適化を行うと共にサーバの負担を軽減することを可能としたものについての記載はない。
【0130】
特開平7−250068号公報には、過負荷なネットワーク要素の割り当てを変更し、負荷のかかっているシステム要素の移動を行うことが記載されている。しかしこれはネットワークを構成する通信装置の負荷集中を避けてネットワークシステムの平滑化を行うことを目的とするものであり、本発明の通信装置を監視するための分散管理とは目的、構成が異なる。
【0131】
特開平9−172435号公報にはエージエントの異常をマネジャに通知することが記載されているが、本発明ではマネージャ、エージエントの概念はなく、監視装置間は対等な関係で分散管理を行うものである。
【0132】
【発明の効果】
本発明によれば下記の効果を奏する。
【0133】
(1)ノードの構成情報、状態情報を共有することにより、SNMP通信によるノード管理を行っていないノードに対しても管理が可能となる。
【0134】
また、監視するネットワークグループ外のノードに対しては、そのネットワークグループを監視しているネットワーク監視サーバより一括してノード監視情報を提供してもらうことにより、SNMP通信を行わずにノード管理情報を取得することが可能となり、ネットワークトラフィックの負荷を軽減することが可能となる。
【0136】
(2)ノード管理の重複を無くすことにより、ネットワーク管理の最適化を行うと共にサーバの負担を軽減させることが可能となる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の関連技術及び一実施の形態説明図である。
【図3】ノード情報の提供状態説明図である。
【図4】新規ノードの検出状態説明図である。
【図5】負荷分散状態説明図である。
【図6】本発明の関連技術説明図である。
【図7】ネットワーク管理データ説明図(その1)である。
【図8】ネットワーク管理データ説明図(その2)である。
【図9】本発明の関連技術説明図である。
【図10】ネットワーク管理システムの障害および復旧検出説明図である。
【図11】ネットワーク監視代行状態説明図である。
【図12】本発明の他の実施の形態である。
【図13】本発明の関連技術説明図である。
【図14】本発明の関連技術説明図である。
【図15】ネットワーク監視サーバのノード管理データである。
【図16】従来例である。

Claims (1)

  1. ネットワーク分散管理システムにおいて、
    ネットワークに接続されたノードを複数のグループに分けてネットワークグループを構成し、
    前記各ネットワークグループ毎にネットワーク監視サーバを設置し、
    前記ネットワーク監視サーバが、他の前記ネットワーク監視サーバの持っている管理情報を取得し、共有することにより、ネットワーク監視を行うと共に、
    新規に前記ネットワークグループが追加された時に、
    当該追加されたネットワークグループ内においてノードが重複している場合には、管理しているノード数の少ない他のネットワーク監視サーバが当該重複したノードを監視することを特徴とするネットワーク分散管理システム。
JP32698899A 1999-11-17 1999-11-17 ネットワーク分散管理システム Expired - Fee Related JP3813776B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32698899A JP3813776B2 (ja) 1999-11-17 1999-11-17 ネットワーク分散管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32698899A JP3813776B2 (ja) 1999-11-17 1999-11-17 ネットワーク分散管理システム

Publications (2)

Publication Number Publication Date
JP2001144761A JP2001144761A (ja) 2001-05-25
JP3813776B2 true JP3813776B2 (ja) 2006-08-23

Family

ID=18194059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32698899A Expired - Fee Related JP3813776B2 (ja) 1999-11-17 1999-11-17 ネットワーク分散管理システム

Country Status (1)

Country Link
JP (1) JP3813776B2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7571239B2 (en) 2002-01-08 2009-08-04 Avaya Inc. Credential management and network querying
JP4313978B2 (ja) 2002-03-19 2009-08-12 日本電気株式会社 計算機監視方式、計算機監視方法および計算機監視用プログラム
JP4151322B2 (ja) 2002-06-26 2008-09-17 コニカミノルタビジネステクノロジーズ株式会社 ネットワーク管理プログラム及びネットワーク管理方法
JP4167876B2 (ja) 2002-10-03 2008-10-22 株式会社日立製作所 ネットワーク計測設定装置
US7426577B2 (en) 2003-06-19 2008-09-16 Avaya Technology Corp. Detection of load balanced links in internet protocol netwoks
US20050108387A1 (en) * 2003-10-31 2005-05-19 Bingjun Li System and apparatus for a network management system using presence and instant message techniques
JP4315850B2 (ja) 2004-03-30 2009-08-19 富士通株式会社 マルチキャストデータ通信システム、データ通信装置、マルチキャストデータ通信方法及びプログラム
JP4881610B2 (ja) 2005-11-30 2012-02-22 株式会社日立製作所 測定システム及び管理装置及びその処理分散方法
JP2008250403A (ja) * 2007-03-29 2008-10-16 Brother Ind Ltd ネットワークシステムとそれを構成する情報処理装置
US20090265450A1 (en) * 2008-04-17 2009-10-22 Darren Helmer Method and apparatus for managing computing resources of management systems
JP5105085B2 (ja) * 2008-06-16 2012-12-19 Necシステムテクノロジー株式会社 資産管理システム及びその方法
JP5035170B2 (ja) * 2008-08-06 2012-09-26 日本電気株式会社 ネットワーク監視システム、監視装置、ネットワーク監視方法及びプログラム
JP5115437B2 (ja) * 2008-09-30 2013-01-09 ブラザー工業株式会社 ネットワークシステム、情報処理装置、情報処理方法及び情報処理装置用プログラム
JP2010118766A (ja) * 2008-11-11 2010-05-27 Nissan Motor Co Ltd 通信システムおよびその故障診断方法
JP2010198434A (ja) * 2009-02-26 2010-09-09 Nec Corp データ収集システム、データ収集方法およびデータ収集装置
JP5253353B2 (ja) 2009-10-26 2013-07-31 株式会社日立製作所 情報処理システム、及びストレージ監視サーバの管理方法
JP2011250033A (ja) * 2010-05-25 2011-12-08 Toshiba Corp 監視システム及びサーバ切替方法
JP5625998B2 (ja) * 2011-02-23 2014-11-19 日本電気株式会社 情報処理システム
JP5906581B2 (ja) * 2011-05-12 2016-04-20 日本電気株式会社 障害情報表示装置、障害情報表示方法、および障害情報表示プログラム
JP2013037544A (ja) * 2011-08-08 2013-02-21 Ricoh Co Ltd 通信装置と通信システムとプログラム
JP5895564B2 (ja) * 2012-02-01 2016-03-30 日本電気株式会社 ネットワーク運用管理システムおよびネットワーク運用管理方法
JP5839694B2 (ja) * 2012-03-26 2016-01-06 Kddi株式会社 仮想運用管理情報生成通知方法およびシステム、ネットワーク運用管理方法およびシステム
JP5949385B2 (ja) 2012-09-24 2016-07-06 富士通株式会社 管理プログラム、管理方法、管理装置及び情報処理システム
WO2014068977A1 (ja) * 2012-11-01 2014-05-08 日本電気株式会社 ネットワーク管理装置、システム、および方法
JP6024604B2 (ja) * 2013-06-19 2016-11-16 株式会社デンソー 通信装置
JP6273927B2 (ja) * 2014-03-12 2018-02-07 富士通株式会社 情報処理システム,監視装置,監視プログラム,監視方法
WO2019187600A1 (ja) * 2018-03-29 2019-10-03 富士フイルム株式会社 内視鏡用プロセッサ装置、内視鏡管理システム、及び内視鏡データ収集サーバ
WO2020195162A1 (ja) * 2019-03-22 2020-10-01 日本電気株式会社 通信装置、通信システム、通信方法及びプログラムが格納された非一時的なコンピュータ可読媒体
KR102353739B1 (ko) * 2020-06-01 2022-01-20 한국과학기술정보연구원 네트워크 운용장치 및 그 동작 방법

Also Published As

Publication number Publication date
JP2001144761A (ja) 2001-05-25

Similar Documents

Publication Publication Date Title
JP3813776B2 (ja) ネットワーク分散管理システム
US6295558B1 (en) Automatic status polling failover or devices in a distributed network management hierarchy
JP4433967B2 (ja) マルチサイト上の遠隔二重化リンクを経由するハートビート装置、及びその使用方法
US6892316B2 (en) Switchable resource management in clustered computer system
US20030158933A1 (en) Failover clustering based on input/output processors
JP5033856B2 (ja) ネットワーク構成の想定のための装置、システム
US20070183313A1 (en) System and method for detecting and recovering from virtual switch link failures
JP3206644B2 (ja) ネットワーク管理方式
JP2004519024A (ja) 多数のノードを含むクラスタを管理するためのシステム及び方法
WO2012072344A1 (en) Endpoint-to-endpoint communications status monitoring
JP2012085339A (ja) 通信システム
AU2001241700B2 (en) Multiple network fault tolerance via redundant network control
JP4733769B2 (ja) 強連結しているネットワークのノード群におけるノード関係情報の整合性を検査するためのシステム、方法、およびネットワークノード
AU2001241700A1 (en) Multiple network fault tolerance via redundant network control
CN110290163A (zh) 一种数据处理方法及装置
JPH09293059A (ja) 分散システム及びその運用管理方法
JP3293719B2 (ja) ネットワーク管理システム
JP3884609B2 (ja) 多重化システム
JP2005294966A (ja) データ通信制御システム及びデータ通信制御方法
US11528204B2 (en) Monitoring device, network fault monitoring system, and monitoring method
US7484124B2 (en) Method and system for fault protection in communication networks, related network and computer program product
CN116112500B (zh) 一种基于故障探测和路由策略的nfs高可用系统及方法
JP2000059385A (ja) Ipアドレス重複時の複数システム管理方法
JP2829040B2 (ja) 情報集配信システム
JP3436284B2 (ja) ネットワーク監視方式及びその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060307

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060601

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100609

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110609

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120609

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120609

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130609

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140609

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees