JP3693184B2

JP3693184B2 - コンピュータネットワーク管理システム

Info

Publication number: JP3693184B2
Application number: JP27881294A
Authority: JP
Inventors: 隆影井; 聡宮崎
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1994-11-14
Filing date: 1994-11-14
Publication date: 2005-09-07
Anticipated expiration: 2020-09-07
Also published as: JPH08137810A

Description

【０００１】
【産業上の利用分野】
本発明は、クライアント・サーバ・モデルに代表される分散コンピューティング環境のように、複数のコンピュータを相互に接続して利用するコンピュータネットワークに係り、特に、コンピュータネットワークの維持管理を効率良く行なうのに好敵なコンピュータネットワーク管理システムに関するものである。
【０００２】
【従来の技術】
分散コンピューティング環境等、大規模なコンピュータネットワークにおいては、例えば、「日経エレクトロニクス１９９０６−１１（ｎｏ．５０２）」（１９９０年、日経ＢＰ社発行）の第１３２頁〜第１３３頁、あるいは、「日経エレクトロニクス１９９０８−２０（ｎｏ．５０７）」（１９９０年、日経ＢＰ社発行）の第１１６頁〜第１３７頁に記載のように、ネットワークの運用を高信頼に維持することを目的として、ＳＮＭＰ（ＳｉｍｐｌｅＮｅｔｗｏｒｋＭａｎａｇｅｍｅｎｔＰｒｏｔｏｃｏｌ）等を用いた、一つの場所での集中的なネットワーク管理が行なわれている。
【０００３】
一方、分散コンピューティングの代表であるクライアント・サーバ・モデル等においては、例えば、上記「日経エレクトロニクス１９９０６−１１（ｎｏ．５０２）」（１９９０年、日経ＢＰ社発行）の第１３０頁〜第１３２頁に記載のように、ネットワーク内のユーザやプログラムの「名前」を集中管理するネームサーバ等を用いたシステム管理が行なわれている。この「ネームサーバ」により、サーバは、ネットワーク内で「分散コンピューティング環境」を形成することができる。この「ネームサーバ」がないと、システム管理者がマシンごとに管理作業をしなければならず、例えば、新たにユーザが加わった場合や、マシンを追加した場合には、ネットワーク内の全マシンの管理ファイルの更新作業を、マシンの数分行なう必要があるが、ネームサーバを使うと１回の作業ですむ。
また、このシステム管理には、各コンピュータに格納されているファイルやディレクトリを集中管理するものや、各コンピュータで個別に、各コンピュータで発生した障害の履歴情報を格納管理するものがある。
【０００４】
従来、これらのシステム管理を行なう機能は、ネットワーク管理を行なう機能とは異なり、サーバやクライアント等の各コンピュータ内に設けられている。
そのために、システム管理手段からは、ネットワークの構成や、当該ネットワークを各システムがどのように利用しているかを知ることができなかった。
システム管理手段がネットワーク構成を知らないと、例えば、トータル・システムとしての性能が上がらない理由が、サーバの性能（ＣＰＵや、ディスク・アクセスの性能）にあるのか、途中に通信速度の遅い通信回線が存在しており、サーバの配置やネットワークの構成に問題があるのか、区別をつけることができない。また、第一種通信事業者によって課金される通信回線を頻繁に使用していることが分からない。
【０００５】
一方、ネットワーク管理手段としては、ネットワークに関する情報だけでは、ネットワークの特定の部分がボトルネックとなっている理由を得ることができない。
その結果、分散コンピュータ・システムのどこかに障害が発生しても、その主因がネットワークを構成する要素にあるのか、システムにあるのかがわからない。例えば、ルータなどのネットワーク構成機器に障害が発生し、クライアントとサーバ間の通信ができない場合、従来は、システム管理手段を利用しても、ルータの障害を検出することはできない。逆に、サーバの構成情報に不具合があって、クライアントとサーバ間の通信ができない場合、ネットワーク管理手段だけを利用しても、サーバの構成情報の不具合を検出することはできない。
【０００６】
【発明が解決しようとする課題】
解決しようとする問題点は、従来の技術では、システム管理を一つの場所で集中的に行なうことができない点である。
本発明の目的は、これら従来技術の課題を解決し、システム管理をネットワーク管理と共に行なうことができ、システム管理とネットワーク管理を統合した管理を可能とし、コンピュータネットワークの維持管理を高効率に行なうことを可能とするコンピュータネットワーク管理システムを提供することである。
【０００７】
【課題を解決するための手段】
上記目的を達成するため、本発明のコンピュータネットワーク管理システムは、（１）少なくとも障害情報を含む通信ネットワーク３に関する情報を収集してネットワーク管理を行なうネットワーク管理部５と、各コンピュータ（ＷＳ２ａ〜２ｃ）が保持するシステムに関するシステム管理情報を収集してシステム管理を行なうシステム管理部４と、ネットワーク管理部５およびシステム管理部４で収集した各々の情報を関連付けた統合情報を生成してネットワーク管理とシステム管理を統合した管理を行なう統合管理部６とを有し、システム管理を含むネットワークの集中管理を行なうことを特徴とする。
また、（２）上記（１）に記載のコンピュータネットワーク管理システムにおいて、システム管理部４と各ＷＳ２ａ〜２ｃ間でのシステム管理情報のやりとりを行なう機能を、システム管理部４と各ＷＳ２ａ〜２ｃのそれぞれに設け、システム管理部４は、定期的なポーリングにより各ＷＳ２ａ〜２ｃからシステム管理情報を収集することを特徴とする。
また、（３）上記（１）に記載のコンピュータネットワーク管理システムにおいて、システム管理部４と各ＷＳ２ａ〜２ｃ間でのシステム管理情報のやりとりを行なう機能を、システム管理部４と各ＷＳ２ａ〜２ｃのそれぞれに設け、システム管理部４は、各ＷＳ２ａ〜２ｃが発行するイベント報告によりシステム管理情報を収集することを特徴とする。
また、（４）上記（１）から（３）のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース１０と、ネットワーク上のトラフィックをモニタするトラフィック・モニタ９と、クライアント・サーバシステムのサーバを構築するリモート・インストーラ８とを設け、統合管理部６ａは、トラフィック・モニタ９によるサーバに関するモニタ結果に基づき、ネットワーク構成データベース１０を検索して、トラフィックのボトルネックを検出し、この検出したボトルネックを解消するようにリモート・インストーラ８によって新たなサーバを構築することを特徴とする。
また、（５）上記（１）から（３）のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース１０と、クライアント・サーバシステムのサーバを構築するリモート・インスト−ラ８と、サーバを削除するリモート・デインストーラ１１と、各サーバをモニタして各サーバの利用度を検出するサーバ・モニタ１２とを設け、統合管理部６ｂは、サーバ・モニタ１２が検出した利用度の低いサーバ群の統合の可否を、ネットワーク構成データベース１０中のネットワーク構成に基づいて判断し、リモート・インストーラ８とリモート・デインストーラ１１を介して、利用度の低いサーバ群を一つのサーバに統合することを特徴とする。また、（６）上記（４）に記載のコンピュータネットワーク管理システムにおいて、クライアント・サーバシステムのサーバを削除するリモート・デインストーラ１１と、各サーバをモニタして、各サーバの利用度を検出するサーバ・モニタ１２とを設け、統合管理部６ｂは、サーバ・モニタ１２が検出した利用度の低いサーバ群の統合の可否を、ネットワーク構成データベース１０中のネットワーク構成に基づいて判断し、リモート・インストーラ８とリモート・デインストーラ１１を介して、利用度の低いサーバ群を一つのサーバに統合することを特徴とする。
また、（７）上記（１）から（３）のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース１０と、ネットワークで発生した障害の履歴をネットワーク障害ログに蓄積する手段（ネットワークイベントログ１４）と、システム障害の履歴をシステム障害ログに蓄積する手段（システムイベントログ１３）とを設け、統合管理部ｃは、ネットワーク構成データベース１０中のネットワーク構成に基づいて、ネットワークイベントログ１４中の障害情報レコードとシステムイベントログ１３中の障害情報レコ−ドを関連付け、障害の主因である障害情報レコードを生成することを特徴とする。
また、（８）上記（４）から（６）のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワークで発生した障害の履歴をネットワーク障害ログに蓄積する手段（ネットワークイベントログ１４）と、システム障害の履歴をシステム障害ログに蓄積する手段（システムイベントログ１３）とを設け、統合管理部ｃは、ネットワーク構成データベース１０中のネットワーク構成に基づいて、ネットワークイベントログ１４中の障害情報レコードとシステムイベントログ１３中の障害情報レコ−ドを関連付け、障害の主因である障害情報レコードを生成することを特徴とする。
また、（９）上記（４）から（８）のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク内の複数のシステムの各々を識別し、ネットワーク構成データベース１０に格納するネットワーク構成を表現する情報を生成するシステム発見部１５と、各システムのファイル／ディレクトリ、リソース、構成情報を少なくとも含むシステム情報を、ネットワーク構成データベース１０から検索するシステム情報検索部１６とを設け、統合管理部６ａ〜６ｄは、システム情報検索部１６がネットワーク構成データベース１０から検索した、各システムのファイル／ディレクトリやリソースや構成情報を少なくとも含むシステム情報に基づき、ネットワークに接続されている全システムの構成を判別することを特徴とする。
【０００８】
【作用】
本発明においては、ネットワーク管理部により、ネットワークを構成するネットワーク機器に対しての制御を行ない、また、ネットワーク機器から情報を収集し、システム管理部により、各コンピュータに対しての制御を行ない、各コンピュータから情報を収集する。そして、統合管理部により、ネットワーク管理部とシステム管理部に対してインストラクションを発行し、ネットワーク管理部およびシステム管理部のそれぞれが持つ情報を関連付けて統合する。
すなわち、ネットワーク管理部は、ネットワーク機器に定期的にポーリングするか、ネットワーク機器が発行するイベント報告により、このネットワークに関する情報を収集し、蓄積する。
システム管理部は、各コンピュータに定期的にポーリングするか、各コンピュータが発行するイベント報告により、システムに関する情報を収集する。
そして、統合管理部は、ネットワークに関する情報をネットワーク管理部から取得し、システムに関する情報をシステム管理部から取得する。あるいは、ネットワーク管理部やシステム管理部が、統合管理部に対して、それぞれ、ネットワークに関する情報やシステムに関する情報を報告する。
統合管理部は、これらの情報に基づき、グラフィカル・ユーザ・インタフェースによる管理者への通知や、システム管理部またはネットワーク管理部への詳細情報の問い合せ等を行なう。
【０００９】
【実施例】
以下、本発明の実施例を、図面により詳細に説明する。
図１は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第１の実施例を示すブロック図であり、図２は、図１におけるコンピュータネットワーク管理システムによって管理されるコンピュータネットワークの一構成例を示すブロック図である。
図２に示すように、本実施例のコンピュータネットワーク管理システム１で集中管理する対象のネットワークは、それぞれ複数のワークステーション（図中、ＷＳと記載）からなるラン（ＬＡＮ：ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）が、ブリッジやルータ、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、専用線網、ＴＤＭ（ＴｉｍｅＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅｘｅｒ、時分割多重化装置）等で接続された分散コンピューティング環境を構築している。
【００１０】
そして、図１に示すように、本発明のコンピュータネットワーク管理システム１は、各ワークステーション（以下、ＷＳと記載）２ａ〜２ｃから分散システムに関する情報を収集するシステム管理部４と、通信ネットワーク３を集中管理するネットワーク管理部５と、システム管理部４とネットワーク管理部５で収集したそれぞれの情報に基づきシステム管理とネットワーク管理を統合して行なう統合管理部６により構成されている。
【００１１】
ネットワーク管理部５は、通信ネットワーク３を構成するネットワーク機器に対して制御を行ない、これらのネットワーク機器からネットワーク管理情報を収集する。ネットワーク管理部４で行なうネットワーク管理には、構成管理、障害管理、性能管理、セキュリティ管理、アカウント管理が主なものとしてあり、構成管理は、ネットワーク構成の表示や各ノードに関する情報の収集、また障害管理は、障害情報の収集、障害箇所の特定、障害原因の診断、また性能管理は、トラヒック量の監視、各ノードのＣＰＵにかかる負荷の監視、各ノードのメモリ利用率の監視、さらにセキュリティ管理は、ネットワークにおけるアクセス制御、認証サービスの適用、暗号キーの管理、そしてアカウント管理は、ネットワークのリソースを使用した場合のアカウント情報の管理を行なう。例えば、構成管理と障害管理により、障害箇所を特定することができ、ネットワーク迅速な回復が可能となる。
【００１２】
システム管理部４は、各ＷＳ２ａ〜２ｃに対して制御を行ない、これらのＷＳ２ａ〜２ｃから分散コンピューティング環境に関する情報すなわちシステム管理情報を収集する。
統合管理部６は、システム管理部４とネットワーク管理部５に対してインストラクションを発行し、システム管理部４およびネットワーク管理部５のそれぞれが持つ情報を関連付けて、システム管理情報とネットワーク管理情報とを統合した管理を行なう。
【００１３】
以下、ネットワークコンピュータ管理システム１の動作説明を行なう。
ネットワーク管理部５は、ネットワーク機器に定期的にポーリングし、通信ネットワーク３に関する情報を収集し、蓄積する。あるいは、ネットワーク機器が発行するイベント報告により、通信ネットワーク３に関する情報を収集し、蓄積してもよい。
システム管理部４は、ＷＳ２ａ〜２ｃに定期的にポーリングするか、ＷＳ２ａ〜２ｃが発行するイベント報告により、分散システムに関する情報を収集する。統合管理部６は、ネットワークに関する情報をネットワーク管理部５から取得し、分散システムに関する情報をシステム管理部４から取得する。あるいは、ネットワーク管理部５やシステム管理部４が、統合管理部６に対して、それぞれ、ネットワークに関する情報や分散システムに関する情報を報告する。
【００１４】
統合管理部６は、報告された情報を処理して以下の動作のいづれかを行なう。（Ａ）グラフィカル・ユーザ・インタフェースを通して、管理者に通知する。
（Ｂ）システム管理部４またはネットワーク管理部５に詳細情報を問い合せる。（Ｃ）何もしない。
（Ｂ）の動作を行なう場合、以下の動作例（Ｂ）に従う。
すなわち、統合管理部６は、ネットワークに関する情報をネットワーク管理部５に、分散システムに関する情報をシステム管理部４に問い合わせる。
ネットワーク管理部５またはシステム管理部４は、問い合わされた情報に対する解答を、蓄積された情報から見つけ出し、統合管理部６に返す。あるいは、さらにそれぞれ、ネットワーク機器やＷＳ２ａ〜２ｃに問い合わせてもよい。
【００１５】
そして、解答を得た統合管理部６は、さらに次のいづれかの動作を行なう。
（ａ）グラフィカル・ユーザ・インタフェースを通して、管理者に通知する。
（ｂ）システム管理部４またはネットワーク管理部５に詳細情報を問い合せる。
（ｃ）何もしない。
尚、（ｂ）の動作を行なう場合、上述の動作例（Ｂ）に従う。
このようにして、通信ネットワーク３と、この通信ネットワーク３に接続されたＷＳおよび分散システムを統合管理することができる。
次に、ネットワークや分散システムの構成や、ネットワークの利用形態、利用状況等に応じてＷＳを最適に配置する例を説明する。
【００１６】
図３は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第２の実施例を示すブロック図である。
本第２の実施例では、コンピュータネットワーク管理システム１ａは、ネットワーク構成データベース１０およびトラフィック・モニタ９を有するネットワーク管理部５ａと、リモート・インストーラ８を有するシステム管理部４ａと、統合管理部６ａとから構成される。
ネットワーク構成データベース１０には、ネットワークの構成に関する情報として、管理されるＷＳの一覧と、当該ＷＳが通信のために使用する通信回線の一覧と、ＷＳと通信回線の接続関係の一覧が蓄積されている。通信回線の一覧には、各通信回線毎に、当該通信回線を識別するための識別情報と、当該通信回線の回線容量が含まれる。
【００１７】
以下、図４を用いて、コンピュータネットワーク管理システム１ａの本発明に係る動作説明を行なう。
図４は、図３におけるコンピュータネットワーク管理システムの本発明に係るボトルネックの検出手順例を示すＰＡＤ図である。
図３の統合管理部６ａは、図３のトラフィック・モニタ９により、各ＷＳにポーリングを行ない（ステップ４０１）、各ＷＳの通信統計情報から、各ＷＳの持つ通信インタフェース毎の入力オクテット数または出力オクテット数と（ステップ４０２）、通信が不可能であった回数または時間を得る（ステップ４０３）。ここで、入力オクテット数のかわりに入力パケット数でも良い。ただし、入力パケットの（オクテット単位での）平均サイズが得られるか、明示的に与えられなければならない。出力オクテット数に関しても同様である。
【００１８】
また、ネットワークがティー・シー・ピー／アイ・ピー（ＴＣＰ／ＩＰ）をベースに構築されており、トラフィック・モニタがエス・エヌ・エム・ピー（ＳＮＭＰ）を使用して通信統計情報を得るのであれば、全ＷＳに対してポーリングするのではなく、例えば、アール・エフ・シー１２７１“リモート・ネットワーク・モニタリング・マネージメント・インフォメーション・ベース”（ＲＦＣ１２７１ ”ＲｅｍｏｔｅＮｅｔｗｏｒｋＭｏｎｉｔｏｒｉｎｇＭａｎａｇｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎＢａｓｅ”）、あるいは、アール・エフ・シー１５１３“トークン・リング・エクステンションズ・トゥ・ザ・リモート・ネットワーク・モニタリング・エム・アイ・ビー”（ＲＦＣ１５１３ ”ＴｏｋｅｎＲｉｎｇＥｘｔｅｎｓｉｏｎｓｔｏｔｈｅＲｅｍｏｔｅＮｅｔｗｏｒｋＭｏｎｉｔｏｒｉｎｇＭＩＢ”）に準拠した管理情報を持つＷＳだけにポーリングして、各通信回線毎の回線使用量を得ることも可能である。
【００１９】
また、前述した全ＷＳにポーリングにすることにより、ファイル・サーバやプリンタ・サーバ等のサーバとして動作しているＷＳを発見し（ステップ４０４）、当該サーバから、クライアントの一覧と（ステップ４０５）、クライアント・サーバ負荷に関する情報を得る（ステップ４０６）。
さらに、ルータ、ゲートウェイとなっているＷＳに対しては（ステップ４０７）、送信待ちキューの（オクテット単位での）キュー長と（ステップ４０８）、ＷＳ負荷に関する情報を得る（ステップ４０９）。
そして、このようにして取得した情報をデータベース等に保存する（ステップ４１０）。
【００２０】
各ＷＳより収集した情報にもとづき、各サーバとクライアント間の通信路でボトルネックとなっている場所を検出する（ステップ４１１、４１２）。ボトルネックとなっている場所が検出されたならば（ステップ４１３）、当該ボトルネックを回避するように、適当なＷＳにサーバ機能をインストールし（ステップ４１４、４１５）、必要ならば（ステップ４１６）、前記サーバを選択するようにクライアント・システムの再構築を行なう（ステップ４１７）。
このようにして、ネットワークの構成やネットワークの利用形態／利用状況に応じたボトルネックを検出し、分散システムを最適に配置することができる。
次に、図５を用いて、上述のボトルネック検出について説明する。
【００２１】
図５は、図３におけるコンピュータネットワーク管理システムの本発明に係るボトルネック検出手順を示すＰＡＤ図である。
各ＷＳにポーリングを行なって、各通信インタフェース毎の入力オクテット数または出力オクテットを得る場合、図３におけるネットワーク構成データベース１０中のＷＳと通信回線との接続関係を利用して、各通信回線毎の回線使用量を導出する。本例では、通信回線、ルータ／ゲートウェイ、サーバの順にボトルネックであるかを判断する。
【００２２】
始めに、各通信回線毎に（ステップ５０１）、回線容量に対する回線使用量の割合が、予め規定された閾値を超過しているか評価し（ステップ５０２）、閾値を超過しているならば、当該通信回線がボトルネックであると判断する（ステップ５０３）。
次に、各ルータ／ゲートウェイ毎に（ステップ５０４）、システム（ＷＳ）負荷と送信待ちキュー長と入力オクテット数と出力オクテット数が予め規定された閾値を超過しているか評価し（ステップ５０５、５０７、５０９）、いずれかが閾値を超過しているならば、当該ルータ／ゲートウェイがボトルネックであると判断する（ステップ５０６、５０８、５１０）。
最後に、各サーバ毎に（ステップ５１１）、システム（ＷＳ）負荷と入力オクテット数と出力オクテット数が予め規定された閾値を超過しているか評価し（ステップ５１２、５１４）、いずれかが閾値を超過しているならば、当該サーバがボトルネックであると判断する（ステップ５１３、５１５）。
【００２３】
このようにして検出したボトルネックの回避技術を、以下に説明する。
通信回線がボトルネックである場合、コンピュータネットワーク管理システムにおける図３の統合管理部６ａは、当該通信回線を通信経路に含むサーバとクライアントの組を一つ選ぶ。当該サーバとクライアントの組が、ボトルネックとなっている通信回線を含まない通信経路（新通信経路と呼ぶ）を選択することができるならば、図３の統合管理部６ａは、当該サーバとクライアント間の通信経路を新通信経路とするように経路制御を行なう。新通信経路を選択できないならば、図３の統合管理部６ａは、ボトルネックとなっている通信回線によってネットワークを２分割し、クライアントが存在する部分から、適当なＷＳをサーバ機能をインストールする対象として選択する。
【００２４】
ただし、同機能のサーバが２分割されたネットワークのクライアントが存在する部分に存在しており、当該サーバがボトルネックとなっていないならば、図３の統合管理部６ａは、当該サーバを選択してもよい。その場合は、サーバ機能のインストールは終了しているものとみなす。
図３の統合管理部６ａは、サーバ機能をインストールするＷＳを選択するとき、ＣＰＵとディスクとメモリに、当該サーバ機能をインストールし、動作させる余裕があることをチェックし、前記条件を満足するＷＳを前記サーバ機能をインストールする対象として選択する。
【００２５】
ルータ／ゲートウェイがボトルネックである場合のボトルネック回避も同様にして行なう。相違点は、ボトルネックとなるルータ／ゲートウェイを含まない通信経路を新通信経路として選択することと、ボトルネックとなるルータ／ゲートウェイでネットワークを２分割することである。
サーバがボトルネックである場合、図３の統合管理部６ａは、適当なＷＳをサーバ機能をインストールする対象として選択する。ただし、ボトルネックとなっていない同機能のサーバが別に存在しているならば、図３の統合管理部６ａは、当該サーバを選択してもよい。その場合は、サーバ機能のインストールは終了しているものとみなす。また、サーバ機能をインストールするＷＳを選択するとき、ＣＰＵとディスクとメモリに、当該サーバ機能をインストールし、動作させる余裕があることをチェックし、前記条件を満足するＷＳを前記サーバ機能をインストールする対象として選択する。
【００２６】
次にサーバ機能のインストール手順を説明する。
図３の統合管理部６ａは、図３のリモート・インストーラ８を使用して、選択したサーバにサーバ機能をインストールし、インストール完了後、当該サーバ機能を動作させる。
サーバ機能のインストール手順としては、図３のコンピュータネットワーク管理システム１ａ内に蓄積されたサーバ機能実行プログラムをインストールする技術と、サーバ機能実行プログラムを、ボトルネックを発生させているサーバから、サーバ機能をインストールするように選択されたシステムにコピーする技術がある。
【００２７】
また、サーバ機能をインストールする前に、ネットワークとＷＳ（クライアント・サーバ・システム）を管理しているアドミニストレータ（保守管理者）にサーバのインストールの可否を訊ね、アドミニストレータの許可を得てからサーバのインストールを開始することもできる。
さらに、必要であれば、ボトルネックを発生させているクライアント・システムの再構築を行なう。すなわち、クライアント・システムがサーバ指定情報により、ボトルネックを発生させているサーバを指定されているならば、当該サーバ指定情報を変更し、ボトルネックを回避する新しいサーバを指定させる。
このように本実施例によれば、ボトルネックを回避したクライアント・サーバ・システムを自動的に再構築することができる。
【００２８】
次の実施例を、図６を用いて説明する。
図６は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第３の実施例を示すブロック図である。
本実施例では、コンピュータネットワーク管理システム１ｂは、ネットワーク構成データベース１０を具備したネットワーク管理部５ｂと、リモート・インストーラ８、リモート・デインストーラ１１、サーバ・モニタ１２を具備したシステム管理部４ｂから構成される。
【００２９】
ネットワーク構成データベース１０とリモート・インストーラ８は、図３におけるものと同じであり、リモート・デインストーラ１１は、サーバ（ＷＳ）よりサーバ機能を削除する機能を有する。サーバ・モニタ１２は、各サーバにポーリングを行ない、当該サーバがクライアントからどれだけ利用されているかを表す情報（サーバ利用度と呼ぶ）を収集する。例えば、当該サーバが提供するサービスを利用したクライアントの数や、クライアントが当該サーバが提供するサービスを利用したのべ時間の和を当該サーバのサーバ利用度とする。トラフィック・モニタ９が各ＷＳにポーリングを行なう場合には、このサーバ・モニタ１２は、図３における第２の実施例で説明したトラフィック・モニタ９でも良い。
【００３０】
統合管理部６ｂは、各サーバのサーバ利用度が、予め指定してある閾値を下回っているサーバを発見する。
サーバ利用度が閾値を下回るサーバが存在しているならば、統合管理部６ｂは、同種類のサーバを探し出す。同種類のサーバが探し出せたならば、当該サーバを、サーバ利用度が閾値を下回っているサーバのクライアントの、新しいサーバとする。もし必要であるならば、前記クライアントの再構築も行なう。
【００３１】
また、同種類のサーバが複数存在しているならば、それらのうち任意の一台を新しいサーバとして良い。あるいは、各クライアント毎に、当該クライアントに最も近いサーバを、当該クライアントの新しいサーバとすることもできる。また、サーバ利用度が閾値を下回るサーバのクライアント群の重心に最も近いサーバを、新しいサーバとすることでも良い。ここで、クライアント群の重心に最も近いサーバは、クライアント群に属するクライアントとサーバの距離の総和が最小となるサーバのことである。数式で表すと、以下の式を最小とするサーバである。
Σ ｄｃ
ｃ∈Ｃ
ここで、Ｃはクライアント群、ｄｃはクライアントｃとサーバの距離をあらわす。このクライアントとサーバ間の距離は、例えば、クライアントとサーバ間の通信回線の長さでもよいし、クライアントとサーバ間に存在するルータやゲートウェイの数でもよい。
【００３２】
最後に、統合管理部６ｂは、サーバ利用度が閾値を下回るサーバから、サーバ機能を削除する。
尚、サーバ利用度のかわりに、システム（ＷＳ）の負荷を用いることも可能である。
このようにして、サーバの利用度やシステム負荷がアドミニストレータが指定した範囲内に収まる最適なクライアン・サーバ・システムを構築することができる。
【００３３】
次の実施例を、図７を用いて説明する。
図７は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第４の実施例を示すブロック図であ
本実施例のコンピュータネットワーク管理システム１ｃは、ネットワーク・イベント・ログ１４とネットワーク構成データベース１０を有するネットワーク管理部５ｃと、システム・イベント・ログ１３を有するシステム管理部４ｃと、統合管理部６ｃから構成される。
ネットワーク管理部５ｃは、ネットワーク上に発生した障害などの事象をネットワーク・イベント・ログ１４に登録する。
システム管理部４ｃも同様に、分散システムで発生した事象をシステム・イベント・ログ１３に登録する。
ネットワーク・イベント・ログ１４とシステム・イベント・ログ１３それぞれには、各事象の発生時刻と事象の内容がログされる。
【００３４】
統合管理部６ｃは、ネットワーク構成データベース１０と、ネットワーク・イベント・ログ１４とシステム・イベント・ログ１３を利用して、事象の関連を付ける。
例えば、図８に示す構成で、同一時間帯にイベントＡ、イベントＢ、イベントＣが発生している場合、イベントＢがイベントＡ、イベントＣを引き起こしたと判断する。ここで、イベントＡはＷＳ２ｄで発生した事象であり、イベントＣはＷＳ２ｅで発生した事象であり、イベントＢはＷＳ２ｄとＷＳ２ｅ間の通信回線で発生した事象である。
このように、本実施例のよれば、ＷＳ２ｄ、２ｅやネットワークで発生したイベントを関連付けることができる。
【００３５】
次の実施例を、図９を用いて説明する。
図９は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第５の実施例を示すブロック図であ
本実施例のコンピュータネットワーク管理システム１ｄは、図７におけるコンピュータネットワーク管理システム１ｃに、システム発見部１５とシステム情報検索部１６を新たに設けたものであり、ネットワーク管理部５ｄは、システム発見部１５により、ネットワークに接続されている各ＷＳを識別して、ネットワーク構成を表現する情報として生成し、ネットワーク構成データベース１０に登録する。また、システム管理部４ｄは、システム情報検索部１６により、ネットワーク構成データベース１０を検索し、ネットワーク構成データベース１０に登録されているＷＳに対して問い合わせを行なうことにより、当該ＷＳが有するファイル／ディレクトリや、また、プリンタや２次記憶装置などのリソース情報／構成情報を取得する。
このことにより、ネットワークに接続されている全ＷＳの構成を知ることができる。
【００３６】
以上、図１〜図９を用いて説明したように、本実施例のコンピュータネットワーク管理システムでは、分散システムとネットワークを統合管理する。このことにより、ネットワークの構成やネットワークの利用形態／利用状況に応じたボトルネックを検出して、分散システムを構成する各ＷＳを最適に配置することができる。また、ネットワークや分散システムを構成するＷＳのどちらかに障害が発生した場合、両者の障害ログを比較することにより、障害の主因が分散システムにあるのか、ネットワークにあるのかを容易に切り分けることができる。
【００３７】
尚、本発明は、図１〜図９を用いて説明した実施例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本第１〜第５の実施例においては、トラフィック・モニタや、ネットワーク構成データベース、ネットワークイベントログ等をネットワーク管理部に、また、リモート・インストーラや、リモート・デインスーラ、サーバ・モニタ、システムイベントログ等をシステム管理部に、それぞれ設けた構成としているが、それぞれを、ネットワーク管理部、システム管理部外に設ける構成でも良い。
【００３８】
【発明の効果】
本発明によれば、システム管理をネットワーク管理と共に行なうことができ、システム管理とネットワーク管理を統合した管理を一つの場所で集中的に行なうことができ、コンピュータネットワークの維持管理を高効率に行なうことが可能である。
【図面の簡単な説明】
【図１】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第１の実施例を示すブロック図である。
【図２】図１におけるコンピュータネットワーク管理システムによって管理されるコンピュータネットワークの一構成例を示すブロック図である。
【図３】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第２の実施例を示すブロック図である。
【図４】図３におけるコンピュータネットワーク管理システムの本発明に係るボトルネックの検出手順例を示すＰＡＤ図である。
【図５】図３におけるコンピュータネットワーク管理システムの本発明に係るボトルネック検出手順を示すＰＡＤ図である。
【図６】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第３の実施例を示すブロック図である。
【図７】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第４の実施例を示すブロック図である。
【図８】同一時間帯に発生した各イベントの関連を示す説明図である。
【図９】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第５の実施例を示すブロック図である。
【符号の説明】
１ａ〜１ｃコンピュータネットワーク管理システム
２ａ〜２ｄワークステーション（ＷＳ）
３通信ネットワーク
４ａ〜４ｃシステム管理部
５ａ〜５ｃネットワーク管理部５
６ａ〜６ｃ統合管理部
８リモート・インストーラ
９トラフィック・モニタ
１０ネットワーク構成データベース
１１リモート・デインストーラ
１２サーバ・モニタ
１３システム・イベント・ログ
１４ネットワーク・イベント・ログ
１５システム発見部
１６システム情報検索部

Claims

複数のコンピュータがネットワークを介して接続されるネットワークシステムを管理するコンピュータネットワーク管理システムであって、
ネットワークに接続される複数の機器から、該複数の機器のインタフェース毎の入力データ量もしくは出力データ量を取得するトラフィックモニタと、
前記複数の機器の一覧と該複数の機器が通信のために使用する通信回線の一覧および該通信回線と前記複数の機器との接続関係の一覧を蓄積するネットワーク構成データベースと、
前記ネットワークに接続される機器に、サーバ機能実行プログラムをインストールするリモートインストーラと、
前記トラヒックモニタが取得したインタフェース毎の入力データ量もしくは出力データ量と、前記ネットワーク構成データベースが蓄積している複数の機器と通信回線との接続関係とを利用して、通信回線毎の回線使用量を導出し、回線容量に対する前記回線使用量の割合が予め定められた閾値を超過している通信回線を含む通信経路を使用して通信する前記ネットワークに接続される複数の機器としてのサーバとクライアントを選択すると共に、前記回線使用量の割合が予め定められた閾値を超過している通信回線を含まない通信経路を介して前記クライアントと接続される機器を選択し、該選択した機器に、前記選択したサーバのサーバ機能実行プログラムをインストールするよう前記リモートインストーラを制御し、前記選択したクライアントが前記選択した機器と、前記回線使用量の割合が予め定められた閾値を超過している通信回線を含まない通信経路を介して通信するよう経路制御を行う総合管理手段と
を有することを特徴とするコンピュータネットワーク管理システム。
請求項１に記載のコンピュータネットワーク管理システムであって、
前記トラフィックモニタは、前記ネットワーク上の機器としてのルータもしくはゲートウェイの負荷と送信待ちキュー長と入力オクテット数と出力オクテット数を取得し、
前記統合管理手段は、前記トラヒックモニタが取得した負荷と送信待ちキュー長と入力オクテット数と出力オクテット数のいずれかが予め定められた閾値を超過しているルータもしくはゲートウェイが存在する場合、該ルータもしくはゲートウェイをサーバとの通信経路に含むクライアントが前記ルータもしくはゲートウェイを含まない通信経路を介して接続される機器に、前記サーバのサーバ機能実行プログラムをインストールするよう前記リモートインストーラを制御し、該サーバ機能実行プログラムをインストールした機器に前記クライアントを接続させることを特徴とするコンピュータネットワーク管理システム。
請求項１または請求項２のいずれかに記載のコンピュータネットワーク管理システムであって、
前記トラフィックモニタは、前記サーバの前記クライアントからの利用度情報を取得し、
前記統合管理手段は、前記トラフィックモニタが取得した利用度情報が予め定められた閾値を下回っている第１のサーバと、該第１のサーバと同種類の第２のサーバとを選出し、該第２のサーバを、前記第１のサーバを利用しているクライアントの新しいサーバとすることを特徴とするコンピュータネットワーク管理システム。