JP3693184B2 - コンピュータネットワーク管理システム - Google Patents
コンピュータネットワーク管理システム Download PDFInfo
- Publication number
- JP3693184B2 JP3693184B2 JP27881294A JP27881294A JP3693184B2 JP 3693184 B2 JP3693184 B2 JP 3693184B2 JP 27881294 A JP27881294 A JP 27881294A JP 27881294 A JP27881294 A JP 27881294A JP 3693184 B2 JP3693184 B2 JP 3693184B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- network
- management unit
- communication
- client
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
【0001】
【産業上の利用分野】
本発明は、クライアント・サーバ・モデルに代表される分散コンピューティング環境のように、複数のコンピュータを相互に接続して利用するコンピュータネットワークに係り、特に、コンピュータネットワークの維持管理を効率良く行なうのに好敵なコンピュータネットワーク管理システムに関するものである。
【0002】
【従来の技術】
分散コンピューティング環境等、大規模なコンピュータネットワークにおいては、例えば、「日経エレクトロニクス 1990 6−11(no.502)」(1990年、日経BP社発行)の第132頁〜第133頁、あるいは、「日経エレクトロニクス 1990 8−20(no.507)」(1990年、日経BP社発行)の第116頁〜第137頁に記載のように、ネットワークの運用を高信頼に維持することを目的として、SNMP(Simple NetworkManagement Protocol)等を用いた、一つの場所での集中的なネットワーク管理が行なわれている。
【0003】
一方、分散コンピューティングの代表であるクライアント・サーバ・モデル等においては、例えば、上記「日経エレクトロニクス 1990 6−11(no.502)」(1990年、日経BP社発行)の第130頁〜第132頁に記載のように、ネットワーク内のユーザやプログラムの「名前」を集中管理するネームサーバ等を用いたシステム管理が行なわれている。この「ネームサーバ」により、サーバは、ネットワーク内で「分散コンピューティング環境」を形成することができる。この「ネームサーバ」がないと、システム管理者がマシンごとに管理作業をしなければならず、例えば、新たにユーザが加わった場合や、マシンを追加した場合には、ネットワーク内の全マシンの管理ファイルの更新作業を、マシンの数分行なう必要があるが、ネームサーバを使うと1回の作業ですむ。
また、このシステム管理には、各コンピュータに格納されているファイルやディレクトリを集中管理するものや、各コンピュータで個別に、各コンピュータで発生した障害の履歴情報を格納管理するものがある。
【0004】
従来、これらのシステム管理を行なう機能は、ネットワーク管理を行なう機能とは異なり、サーバやクライアント等の各コンピュータ内に設けられている。
そのために、システム管理手段からは、ネットワークの構成や、当該ネットワークを各システムがどのように利用しているかを知ることができなかった。
システム管理手段がネットワーク構成を知らないと、例えば、トータル・システムとしての性能が上がらない理由が、サーバの性能(CPUや、ディスク・アクセスの性能)にあるのか、途中に通信速度の遅い通信回線が存在しており、サーバの配置やネットワークの構成に問題があるのか、区別をつけることができない。また、第一種通信事業者によって課金される通信回線を頻繁に使用していることが分からない。
【0005】
一方、ネットワーク管理手段としては、ネットワークに関する情報だけでは、ネットワークの特定の部分がボトルネックとなっている理由を得ることができない。
その結果、分散コンピュータ・システムのどこかに障害が発生しても、その主因がネットワークを構成する要素にあるのか、システムにあるのかがわからない。例えば、ルータなどのネットワーク構成機器に障害が発生し、クライアントとサーバ間の通信ができない場合、従来は、システム管理手段を利用しても、ルータの障害を検出することはできない。逆に、サーバの構成情報に不具合があって、クライアントとサーバ間の通信ができない場合、ネットワーク管理手段だけを利用しても、サーバの構成情報の不具合を検出することはできない。
【0006】
【発明が解決しようとする課題】
解決しようとする問題点は、従来の技術では、システム管理を一つの場所で集中的に行なうことができない点である。
本発明の目的は、これら従来技術の課題を解決し、システム管理をネットワーク管理と共に行なうことができ、システム管理とネットワーク管理を統合した管理を可能とし、コンピュータネットワークの維持管理を高効率に行なうことを可能とするコンピュータネットワーク管理システムを提供することである。
【0007】
【課題を解決するための手段】
上記目的を達成するため、本発明のコンピュータネットワーク管理システムは、(1)少なくとも障害情報を含む通信ネットワーク3に関する情報を収集してネットワーク管理を行なうネットワーク管理部5と、各コンピュータ(WS2a〜2c)が保持するシステムに関するシステム管理情報を収集してシステム管理を行なうシステム管理部4と、ネットワーク管理部5およびシステム管理部4で収集した各々の情報を関連付けた統合情報を生成してネットワーク管理とシステム管理を統合した管理を行なう統合管理部6とを有し、システム管理を含むネットワークの集中管理を行なうことを特徴とする。
また、(2)上記(1)に記載のコンピュータネットワーク管理システムにおいて、システム管理部4と各WS2a〜2c間でのシステム管理情報のやりとりを行なう機能を、システム管理部4と各WS2a〜2cのそれぞれに設け、システム管理部4は、定期的なポーリングにより各WS2a〜2cからシステム管理情報を収集することを特徴とする。
また、(3)上記(1)に記載のコンピュータネットワーク管理システムにおいて、システム管理部4と各WS2a〜2c間でのシステム管理情報のやりとりを行なう機能を、システム管理部4と各WS2a〜2cのそれぞれに設け、システム管理部4は、各WS2a〜2cが発行するイベント報告によりシステム管理情報を収集することを特徴とする。
また、(4)上記(1)から(3)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース10と、ネットワーク上のトラフィックをモニタするトラフィック・モニタ9と、クライアント・サーバシステムのサーバを構築するリモート・インストーラ8とを設け、統合管理部6aは、トラフィック・モニタ9によるサーバに関するモニタ結果に基づき、ネットワーク構成データベース10を検索して、トラフィックのボトルネックを検出し、この検出したボトルネックを解消するようにリモート・インストーラ8によって新たなサーバを構築することを特徴とする。
また、(5)上記(1)から(3)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース10と、クライアント・サーバシステムのサーバを構築するリモート・インスト−ラ8と、サーバを削除するリモート・デインストーラ11と、各サーバをモニタして各サーバの利用度を検出するサーバ・モニタ12とを設け、統合管理部6bは、サーバ・モニタ12が検出した利用度の低いサーバ群の統合の可否を、ネットワーク構成データベース10中のネットワーク構成に基づいて判断し、リモート・インストーラ8とリモート・デインストーラ11を介して、利用度の低いサーバ群を一つのサーバに統合することを特徴とする。また、(6)上記(4)に記載のコンピュータネットワーク管理システムにおいて、クライアント・サーバシステムのサーバを削除するリモート・デインストーラ11と、各サーバをモニタして、各サーバの利用度を検出するサーバ・モニタ12とを設け、統合管理部6bは、サーバ・モニタ12が検出した利用度の低いサーバ群の統合の可否を、ネットワーク構成データベース10中のネットワーク構成に基づいて判断し、リモート・インストーラ8とリモート・デインストーラ11を介して、利用度の低いサーバ群を一つのサーバに統合することを特徴とする。
また、(7)上記(1)から(3)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース10と、ネットワークで発生した障害の履歴をネットワーク障害ログに蓄積する手段(ネットワークイベントログ14)と、システム障害の履歴をシステム障害ログに蓄積する手段(システムイベントログ13)とを設け、統合管理部cは、ネットワーク構成データベース10中のネットワーク構成に基づいて、ネットワークイベントログ14中の障害情報レコードとシステムイベントログ13中の障害情報レコ−ドを関連付け、障害の主因である障害情報レコードを生成することを特徴とする。
また、(8)上記(4)から(6)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワークで発生した障害の履歴をネットワーク障害ログに蓄積する手段(ネットワークイベントログ14)と、システム障害の履歴をシステム障害ログに蓄積する手段(システムイベントログ13)とを設け、統合管理部cは、ネットワーク構成データベース10中のネットワーク構成に基づいて、ネットワークイベントログ14中の障害情報レコードとシステムイベントログ13中の障害情報レコ−ドを関連付け、障害の主因である障害情報レコードを生成することを特徴とする。
また、(9)上記(4)から(8)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク内の複数のシステムの各々を識別し、ネットワーク構成データベース10に格納するネットワーク構成を表現する情報を生成するシステム発見部15と、各システムのファイル/ディレクトリ、リソース、構成情報を少なくとも含むシステム情報を、ネットワーク構成データベース10から検索するシステム情報検索部16とを設け、統合管理部6a〜6dは、システム情報検索部16がネットワーク構成データベース10から検索した、各システムのファイル/ディレクトリやリソースや構成情報を少なくとも含むシステム情報に基づき、ネットワークに接続されている全システムの構成を判別することを特徴とする。
【0008】
【作用】
本発明においては、ネットワーク管理部により、ネットワークを構成するネットワーク機器に対しての制御を行ない、また、ネットワーク機器から情報を収集し、システム管理部により、各コンピュータに対しての制御を行ない、各コンピュータから情報を収集する。そして、統合管理部により、ネットワーク管理部とシステム管理部に対してインストラクションを発行し、ネットワーク管理部およびシステム管理部のそれぞれが持つ情報を関連付けて統合する。
すなわち、ネットワーク管理部は、ネットワーク機器に定期的にポーリングするか、ネットワーク機器が発行するイベント報告により、このネットワークに関する情報を収集し、蓄積する。
システム管理部は、各コンピュータに定期的にポーリングするか、各コンピュータが発行するイベント報告により、システムに関する情報を収集する。
そして、統合管理部は、ネットワークに関する情報をネットワーク管理部から取得し、システムに関する情報をシステム管理部から取得する。あるいは、ネットワーク管理部やシステム管理部が、統合管理部に対して、それぞれ、ネットワークに関する情報やシステムに関する情報を報告する。
統合管理部は、これらの情報に基づき、グラフィカル・ユーザ・インタフェースによる管理者への通知や、システム管理部またはネットワーク管理部への詳細情報の問い合せ等を行なう。
【0009】
【実施例】
以下、本発明の実施例を、図面により詳細に説明する。
図1は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第1の実施例を示すブロック図であり、図2は、図1におけるコンピュータネットワーク管理システムによって管理されるコンピュータネットワークの一構成例を示すブロック図である。
図2に示すように、本実施例のコンピュータネットワーク管理システム1で集中管理する対象のネットワークは、それぞれ複数のワークステーション(図中、WSと記載)からなるラン(LAN:Local Area Network)が、ブリッジやルータ、WAN(Wide Area Network)、専用線網、TDM(Time Division Multiplexer、時分割多重化装置)等で接続された分散コンピューティング環境を構築している。
【0010】
そして、図1に示すように、本発明のコンピュータネットワーク管理システム1は、各ワークステーション(以下、WSと記載)2a〜2cから分散システムに関する情報を収集するシステム管理部4と、通信ネットワーク3を集中管理するネットワーク管理部5と、システム管理部4とネットワーク管理部5で収集したそれぞれの情報に基づきシステム管理とネットワーク管理を統合して行なう統合管理部6により構成されている。
【0011】
ネットワーク管理部5は、通信ネットワーク3を構成するネットワーク機器に対して制御を行ない、これらのネットワーク機器からネットワーク管理情報を収集する。ネットワーク管理部4で行なうネットワーク管理には、構成管理、障害管理、性能管理、セキュリティ管理、アカウント管理が主なものとしてあり、構成管理は、ネットワーク構成の表示や各ノードに関する情報の収集、また障害管理は、障害情報の収集、障害箇所の特定、障害原因の診断、また性能管理は、トラヒック量の監視、各ノードのCPUにかかる負荷の監視、各ノードのメモリ利用率の監視、さらにセキュリティ管理は、ネットワークにおけるアクセス制御、認証サービスの適用、暗号キーの管理、そしてアカウント管理は、ネットワークのリソースを使用した場合のアカウント情報の管理を行なう。例えば、構成管理と障害管理により、障害箇所を特定することができ、ネットワーク迅速な回復が可能となる。
【0012】
システム管理部4は、各WS2a〜2cに対して制御を行ない、これらのWS2a〜2cから分散コンピューティング環境に関する情報すなわちシステム管理情報を収集する。
統合管理部6は、システム管理部4とネットワーク管理部5に対してインストラクションを発行し、システム管理部4およびネットワーク管理部5のそれぞれが持つ情報を関連付けて、システム管理情報とネットワーク管理情報とを統合した管理を行なう。
【0013】
以下、ネットワークコンピュータ管理システム1の動作説明を行なう。
ネットワーク管理部5は、ネットワーク機器に定期的にポーリングし、通信ネットワーク3に関する情報を収集し、蓄積する。あるいは、ネットワーク機器が発行するイベント報告により、通信ネットワーク3に関する情報を収集し、蓄積してもよい。
システム管理部4は、WS2a〜2cに定期的にポーリングするか、WS2a〜2cが発行するイベント報告により、分散システムに関する情報を収集する。統合管理部6は、ネットワークに関する情報をネットワーク管理部5から取得し、分散システムに関する情報をシステム管理部4から取得する。あるいは、ネットワーク管理部5やシステム管理部4が、統合管理部6に対して、それぞれ、ネットワークに関する情報や分散システムに関する情報を報告する。
【0014】
統合管理部6は、報告された情報を処理して以下の動作のいづれかを行なう。(A)グラフィカル・ユーザ・インタフェースを通して、管理者に通知する。
(B)システム管理部4またはネットワーク管理部5に詳細情報を問い合せる。(C)何もしない。
(B)の動作を行なう場合、以下の動作例(B)に従う。
すなわち、統合管理部6は、ネットワークに関する情報をネットワーク管理部5に、分散システムに関する情報をシステム管理部4に問い合わせる。
ネットワーク管理部5またはシステム管理部4は、問い合わされた情報に対する解答を、蓄積された情報から見つけ出し、統合管理部6に返す。あるいは、さらにそれぞれ、ネットワーク機器やWS2a〜2cに問い合わせてもよい。
【0015】
そして、解答を得た統合管理部6は、さらに次のいづれかの動作を行なう。
(a)グラフィカル・ユーザ・インタフェースを通して、管理者に通知する。
(b)システム管理部4またはネットワーク管理部5に詳細情報を問い合せる。
(c)何もしない。
尚、(b)の動作を行なう場合、上述の動作例(B)に従う。
このようにして、通信ネットワーク3と、この通信ネットワーク3に接続されたWSおよび分散システムを統合管理することができる。
次に、ネットワークや分散システムの構成や、ネットワークの利用形態、利用状況等に応じてWSを最適に配置する例を説明する。
【0016】
図3は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第2の実施例を示すブロック図である。
本第2の実施例では、コンピュータネットワーク管理システム1aは、ネットワーク構成データベース10およびトラフィック・モニタ9を有するネットワーク管理部5aと、リモート・インストーラ8を有するシステム管理部4aと、統合管理部6aとから構成される。
ネットワーク構成データベース10には、ネットワークの構成に関する情報として、管理されるWSの一覧と、当該WSが通信のために使用する通信回線の一覧と、WSと通信回線の接続関係の一覧が蓄積されている。通信回線の一覧には、各通信回線毎に、当該通信回線を識別するための識別情報と、当該通信回線の回線容量が含まれる。
【0017】
以下、図4を用いて、コンピュータネットワーク管理システム1aの本発明に係る動作説明を行なう。
図4は、図3におけるコンピュータネットワーク管理システムの本発明に係るボトルネックの検出手順例を示すPAD図である。
図3の統合管理部6aは、図3のトラフィック・モニタ9により、各WSにポーリングを行ない(ステップ401)、各WSの通信統計情報から、各WSの持つ通信インタフェース毎の入力オクテット数または出力オクテット数と(ステップ402)、通信が不可能であった回数または時間を得る(ステップ403)。ここで、入力オクテット数のかわりに入力パケット数でも良い。ただし、入力パケットの(オクテット単位での)平均サイズが得られるか、明示的に与えられなければならない。出力オクテット数に関しても同様である。
【0018】
また、ネットワークがティー・シー・ピー/アイ・ピー(TCP/IP)をベースに構築されており、トラフィック・モニタがエス・エヌ・エム・ピー(SNMP)を使用して通信統計情報を得るのであれば、全WSに対してポーリングするのではなく、例えば、アール・エフ・シー1271“リモート・ネットワーク・モニタリング・マネージメント・インフォメーション・ベース”(RFC1271 ”Remote Network Monitoring Management Information Base”)、あるいは、アール・エフ・シー1513“トークン・リング・エクステンションズ・トゥ・ザ・リモート・ネットワーク・モニタリング・エム・アイ・ビー”(RFC1513 ”Token Ring Extensions to the Remote Network Monitoring MIB”)に準拠した管理情報を持つWSだけにポーリングして、各通信回線毎の回線使用量を得ることも可能である。
【0019】
また、前述した全WSにポーリングにすることにより、ファイル・サーバやプリンタ・サーバ等のサーバとして動作しているWSを発見し(ステップ404)、当該サーバから、クライアントの一覧と(ステップ405)、クライアント・サーバ負荷に関する情報を得る(ステップ406)。
さらに、ルータ、ゲートウェイとなっているWSに対しては(ステップ407)、送信待ちキューの(オクテット単位での)キュー長と(ステップ408)、WS負荷に関する情報を得る(ステップ409)。
そして、このようにして取得した情報をデータベース等に保存する(ステップ410)。
【0020】
各WSより収集した情報にもとづき、各サーバとクライアント間の通信路でボトルネックとなっている場所を検出する(ステップ411、412)。ボトルネックとなっている場所が検出されたならば(ステップ413)、当該ボトルネックを回避するように、適当なWSにサーバ機能をインストールし(ステップ414、415)、必要ならば(ステップ416)、前記サーバを選択するようにクライアント・システムの再構築を行なう(ステップ417)。
このようにして、ネットワークの構成やネットワークの利用形態/利用状況に応じたボトルネックを検出し、分散システムを最適に配置することができる。
次に、図5を用いて、上述のボトルネック検出について説明する。
【0021】
図5は、図3におけるコンピュータネットワーク管理システムの本発明に係るボトルネック検出手順を示すPAD図である。
各WSにポーリングを行なって、各通信インタフェース毎の入力オクテット数または出力オクテットを得る場合、図3におけるネットワーク構成データベース10中のWSと通信回線との接続関係を利用して、各通信回線毎の回線使用量を導出する。本例では、通信回線、ルータ/ゲートウェイ、サーバの順にボトルネックであるかを判断する。
【0022】
始めに、各通信回線毎に(ステップ501)、回線容量に対する回線使用量の割合が、予め規定された閾値を超過しているか評価し(ステップ502)、閾値を超過しているならば、当該通信回線がボトルネックであると判断する(ステップ503)。
次に、各ルータ/ゲートウェイ毎に(ステップ504)、システム(WS)負荷と送信待ちキュー長と入力オクテット数と出力オクテット数が予め規定された閾値を超過しているか評価し(ステップ505、507、509)、いずれかが閾値を超過しているならば、当該ルータ/ゲートウェイがボトルネックであると判断する(ステップ506、508、510)。
最後に、各サーバ毎に(ステップ511)、システム(WS)負荷と入力オクテット数と出力オクテット数が予め規定された閾値を超過しているか評価し(ステップ512、514)、いずれかが閾値を超過しているならば、当該サーバがボトルネックであると判断する(ステップ513、515)。
【0023】
このようにして検出したボトルネックの回避技術を、以下に説明する。
通信回線がボトルネックである場合、コンピュータネットワーク管理システムにおける図3の統合管理部6aは、当該通信回線を通信経路に含むサーバとクライアントの組を一つ選ぶ。当該サーバとクライアントの組が、ボトルネックとなっている通信回線を含まない通信経路(新通信経路と呼ぶ)を選択することができるならば、図3の統合管理部6aは、当該サーバとクライアント間の通信経路を新通信経路とするように経路制御を行なう。新通信経路を選択できないならば、図3の統合管理部6aは、ボトルネックとなっている通信回線によってネットワークを2分割し、クライアントが存在する部分から、適当なWSをサーバ機能をインストールする対象として選択する。
【0024】
ただし、同機能のサーバが2分割されたネットワークのクライアントが存在する部分に存在しており、当該サーバがボトルネックとなっていないならば、図3の統合管理部6aは、当該サーバを選択してもよい。その場合は、サーバ機能のインストールは終了しているものとみなす。
図3の統合管理部6aは、サーバ機能をインストールするWSを選択するとき、CPUとディスクとメモリに、当該サーバ機能をインストールし、動作させる余裕があることをチェックし、前記条件を満足するWSを前記サーバ機能をインストールする対象として選択する。
【0025】
ルータ/ゲートウェイがボトルネックである場合のボトルネック回避も同様にして行なう。相違点は、ボトルネックとなるルータ/ゲートウェイを含まない通信経路を新通信経路として選択することと、ボトルネックとなるルータ/ゲートウェイでネットワークを2分割することである。
サーバがボトルネックである場合、図3の統合管理部6aは、適当なWSをサーバ機能をインストールする対象として選択する。ただし、ボトルネックとなっていない同機能のサーバが別に存在しているならば、図3の統合管理部6aは、当該サーバを選択してもよい。その場合は、サーバ機能のインストールは終了しているものとみなす。また、サーバ機能をインストールするWSを選択するとき、CPUとディスクとメモリに、当該サーバ機能をインストールし、動作させる余裕があることをチェックし、前記条件を満足するWSを前記サーバ機能をインストールする対象として選択する。
【0026】
次にサーバ機能のインストール手順を説明する。
図3の統合管理部6aは、図3のリモート・インストーラ8を使用して、選択したサーバにサーバ機能をインストールし、インストール完了後、当該サーバ機能を動作させる。
サーバ機能のインストール手順としては、図3のコンピュータネットワーク管理システム1a内に蓄積されたサーバ機能実行プログラムをインストールする技術と、サーバ機能実行プログラムを、ボトルネックを発生させているサーバから、サーバ機能をインストールするように選択されたシステムにコピーする技術がある。
【0027】
また、サーバ機能をインストールする前に、ネットワークとWS(クライアント・サーバ・システム)を管理しているアドミニストレータ(保守管理者)にサーバのインストールの可否を訊ね、アドミニストレータの許可を得てからサーバのインストールを開始することもできる。
さらに、必要であれば、ボトルネックを発生させているクライアント・システムの再構築を行なう。すなわち、クライアント・システムがサーバ指定情報により、ボトルネックを発生させているサーバを指定されているならば、当該サーバ指定情報を変更し、ボトルネックを回避する新しいサーバを指定させる。
このように本実施例によれば、ボトルネックを回避したクライアント・サーバ・システムを自動的に再構築することができる。
【0028】
次の実施例を、図6を用いて説明する。
図6は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第3の実施例を示すブロック図である。
本実施例では、コンピュータネットワーク管理システム1bは、ネットワーク構成データベース10を具備したネットワーク管理部5bと、リモート・インストーラ8、リモート・デインストーラ11、サーバ・モニタ12を具備したシステム管理部4bから構成される。
【0029】
ネットワーク構成データベース10とリモート・インストーラ8は、図3におけるものと同じであり、リモート・デインストーラ11は、サーバ(WS)よりサーバ機能を削除する機能を有する。サーバ・モニタ12は、各サーバにポーリングを行ない、当該サーバがクライアントからどれだけ利用されているかを表す情報(サーバ利用度と呼ぶ)を収集する。例えば、当該サーバが提供するサービスを利用したクライアントの数や、クライアントが当該サーバが提供するサービスを利用したのべ時間の和を当該サーバのサーバ利用度とする。トラフィック・モニタ9が各WSにポーリングを行なう場合には、このサーバ・モニタ12は、図3における第2の実施例で説明したトラフィック・モニタ9でも良い。
【0030】
統合管理部6bは、各サーバのサーバ利用度が、予め指定してある閾値を下回っているサーバを発見する。
サーバ利用度が閾値を下回るサーバが存在しているならば、統合管理部6bは、同種類のサーバを探し出す。同種類のサーバが探し出せたならば、当該サーバを、サーバ利用度が閾値を下回っているサーバのクライアントの、新しいサーバとする。もし必要であるならば、前記クライアントの再構築も行なう。
【0031】
また、同種類のサーバが複数存在しているならば、それらのうち任意の一台を新しいサーバとして良い。あるいは、各クライアント毎に、当該クライアントに最も近いサーバを、当該クライアントの新しいサーバとすることもできる。また、サーバ利用度が閾値を下回るサーバのクライアント群の重心に最も近いサーバを、新しいサーバとすることでも良い。ここで、クライアント群の重心に最も近いサーバは、クライアント群に属するクライアントとサーバの距離の総和が最小となるサーバのことである。数式で表すと、以下の式を最小とするサーバである。
Σ dc
c∈C
ここで、Cはクライアント群、dcはクライアントcとサーバの距離をあらわす。このクライアントとサーバ間の距離は、例えば、クライアントとサーバ間の通信回線の長さでもよいし、クライアントとサーバ間に存在するルータやゲートウェイの数でもよい。
【0032】
最後に、統合管理部6bは、サーバ利用度が閾値を下回るサーバから、サーバ機能を削除する。
尚、サーバ利用度のかわりに、システム(WS)の負荷を用いることも可能である。
このようにして、サーバの利用度やシステム負荷がアドミニストレータが指定した範囲内に収まる最適なクライアン・サーバ・システムを構築することができる。
【0033】
次の実施例を、図7を用いて説明する。
図7は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第4の実施例を示すブロック図であ
本実施例のコンピュータネットワーク管理システム1cは、ネットワーク・イベント・ログ14とネットワーク構成データベース10を有するネットワーク管理部5cと、システム・イベント・ログ13を有するシステム管理部4cと、統合管理部6cから構成される。
ネットワーク管理部5cは、ネットワーク上に発生した障害などの事象をネットワーク・イベント・ログ14に登録する。
システム管理部4cも同様に、分散システムで発生した事象をシステム・イベント・ログ13に登録する。
ネットワーク・イベント・ログ14とシステム・イベント・ログ13それぞれには、各事象の発生時刻と事象の内容がログされる。
【0034】
統合管理部6cは、ネットワーク構成データベース10と、ネットワーク・イベント・ログ14とシステム・イベント・ログ13を利用して、事象の関連を付ける。
例えば、図8に示す構成で、同一時間帯にイベントA、イベントB、イベントCが発生している場合、イベントBがイベントA、イベントCを引き起こしたと判断する。ここで、イベントAはWS2dで発生した事象であり、イベントCはWS2eで発生した事象であり、イベントBはWS2dとWS2e間の通信回線で発生した事象である。
このように、本実施例のよれば、WS2d、2eやネットワークで発生したイベントを関連付けることができる。
【0035】
次の実施例を、図9を用いて説明する。
図9は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第5の実施例を示すブロック図であ
本実施例のコンピュータネットワーク管理システム1dは、図7におけるコンピュータネットワーク管理システム1cに、システム発見部15とシステム情報検索部16を新たに設けたものであり、ネットワーク管理部5dは、システム発見部15により、ネットワークに接続されている各WSを識別して、ネットワーク構成を表現する情報として生成し、ネットワーク構成データベース10に登録する。また、システム管理部4dは、システム情報検索部16により、ネットワーク構成データベース10を検索し、ネットワーク構成データベース10に登録されているWSに対して問い合わせを行なうことにより、当該WSが有するファイル/ディレクトリや、また、プリンタや2次記憶装置などのリソース情報/構成情報を取得する。
このことにより、ネットワークに接続されている全WSの構成を知ることができる。
【0036】
以上、図1〜図9を用いて説明したように、本実施例のコンピュータネットワーク管理システムでは、分散システムとネットワークを統合管理する。このことにより、ネットワークの構成やネットワークの利用形態/利用状況に応じたボトルネックを検出して、分散システムを構成する各WSを最適に配置することができる。また、ネットワークや分散システムを構成するWSのどちらかに障害が発生した場合、両者の障害ログを比較することにより、障害の主因が分散システムにあるのか、ネットワークにあるのかを容易に切り分けることができる。
【0037】
尚、本発明は、図1〜図9を用いて説明した実施例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本第1〜第5の実施例においては、トラフィック・モニタや、ネットワーク構成データベース、ネットワークイベントログ等をネットワーク管理部に、また、リモート・インストーラや、リモート・デインスーラ、サーバ・モニタ、システムイベントログ等をシステム管理部に、それぞれ設けた構成としているが、それぞれを、ネットワーク管理部、システム管理部外に設ける構成でも良い。
【0038】
【発明の効果】
本発明によれば、システム管理をネットワーク管理と共に行なうことができ、システム管理とネットワーク管理を統合した管理を一つの場所で集中的に行なうことができ、コンピュータネットワークの維持管理を高効率に行なうことが可能である。
【図面の簡単な説明】
【図1】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第1の実施例を示すブロック図である。
【図2】図1におけるコンピュータネットワーク管理システムによって管理されるコンピュータネットワークの一構成例を示すブロック図である。
【図3】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第2の実施例を示すブロック図である。
【図4】図3におけるコンピュータネットワーク管理システムの本発明に係るボトルネックの検出手順例を示すPAD図である。
【図5】図3におけるコンピュータネットワーク管理システムの本発明に係るボトルネック検出手順を示すPAD図である。
【図6】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第3の実施例を示すブロック図である。
【図7】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第4の実施例を示すブロック図である。
【図8】同一時間帯に発生した各イベントの関連を示す説明図である。
【図9】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第5の実施例を示すブロック図である。
【符号の説明】
1a〜1c コンピュータネットワーク管理システム
2a〜2d ワークステーション(WS)
3 通信ネットワーク
4a〜4c システム管理部
5a〜5c ネットワーク管理部5
6a〜6c 統合管理部
8 リモート・インストーラ
9 トラフィック・モニタ
10 ネットワーク構成データベース
11 リモート・デインストーラ
12 サーバ・モニタ
13 システム・イベント・ログ
14 ネットワーク・イベント・ログ
15 システム発見部
16 システム情報検索部
【産業上の利用分野】
本発明は、クライアント・サーバ・モデルに代表される分散コンピューティング環境のように、複数のコンピュータを相互に接続して利用するコンピュータネットワークに係り、特に、コンピュータネットワークの維持管理を効率良く行なうのに好敵なコンピュータネットワーク管理システムに関するものである。
【0002】
【従来の技術】
分散コンピューティング環境等、大規模なコンピュータネットワークにおいては、例えば、「日経エレクトロニクス 1990 6−11(no.502)」(1990年、日経BP社発行)の第132頁〜第133頁、あるいは、「日経エレクトロニクス 1990 8−20(no.507)」(1990年、日経BP社発行)の第116頁〜第137頁に記載のように、ネットワークの運用を高信頼に維持することを目的として、SNMP(Simple NetworkManagement Protocol)等を用いた、一つの場所での集中的なネットワーク管理が行なわれている。
【0003】
一方、分散コンピューティングの代表であるクライアント・サーバ・モデル等においては、例えば、上記「日経エレクトロニクス 1990 6−11(no.502)」(1990年、日経BP社発行)の第130頁〜第132頁に記載のように、ネットワーク内のユーザやプログラムの「名前」を集中管理するネームサーバ等を用いたシステム管理が行なわれている。この「ネームサーバ」により、サーバは、ネットワーク内で「分散コンピューティング環境」を形成することができる。この「ネームサーバ」がないと、システム管理者がマシンごとに管理作業をしなければならず、例えば、新たにユーザが加わった場合や、マシンを追加した場合には、ネットワーク内の全マシンの管理ファイルの更新作業を、マシンの数分行なう必要があるが、ネームサーバを使うと1回の作業ですむ。
また、このシステム管理には、各コンピュータに格納されているファイルやディレクトリを集中管理するものや、各コンピュータで個別に、各コンピュータで発生した障害の履歴情報を格納管理するものがある。
【0004】
従来、これらのシステム管理を行なう機能は、ネットワーク管理を行なう機能とは異なり、サーバやクライアント等の各コンピュータ内に設けられている。
そのために、システム管理手段からは、ネットワークの構成や、当該ネットワークを各システムがどのように利用しているかを知ることができなかった。
システム管理手段がネットワーク構成を知らないと、例えば、トータル・システムとしての性能が上がらない理由が、サーバの性能(CPUや、ディスク・アクセスの性能)にあるのか、途中に通信速度の遅い通信回線が存在しており、サーバの配置やネットワークの構成に問題があるのか、区別をつけることができない。また、第一種通信事業者によって課金される通信回線を頻繁に使用していることが分からない。
【0005】
一方、ネットワーク管理手段としては、ネットワークに関する情報だけでは、ネットワークの特定の部分がボトルネックとなっている理由を得ることができない。
その結果、分散コンピュータ・システムのどこかに障害が発生しても、その主因がネットワークを構成する要素にあるのか、システムにあるのかがわからない。例えば、ルータなどのネットワーク構成機器に障害が発生し、クライアントとサーバ間の通信ができない場合、従来は、システム管理手段を利用しても、ルータの障害を検出することはできない。逆に、サーバの構成情報に不具合があって、クライアントとサーバ間の通信ができない場合、ネットワーク管理手段だけを利用しても、サーバの構成情報の不具合を検出することはできない。
【0006】
【発明が解決しようとする課題】
解決しようとする問題点は、従来の技術では、システム管理を一つの場所で集中的に行なうことができない点である。
本発明の目的は、これら従来技術の課題を解決し、システム管理をネットワーク管理と共に行なうことができ、システム管理とネットワーク管理を統合した管理を可能とし、コンピュータネットワークの維持管理を高効率に行なうことを可能とするコンピュータネットワーク管理システムを提供することである。
【0007】
【課題を解決するための手段】
上記目的を達成するため、本発明のコンピュータネットワーク管理システムは、(1)少なくとも障害情報を含む通信ネットワーク3に関する情報を収集してネットワーク管理を行なうネットワーク管理部5と、各コンピュータ(WS2a〜2c)が保持するシステムに関するシステム管理情報を収集してシステム管理を行なうシステム管理部4と、ネットワーク管理部5およびシステム管理部4で収集した各々の情報を関連付けた統合情報を生成してネットワーク管理とシステム管理を統合した管理を行なう統合管理部6とを有し、システム管理を含むネットワークの集中管理を行なうことを特徴とする。
また、(2)上記(1)に記載のコンピュータネットワーク管理システムにおいて、システム管理部4と各WS2a〜2c間でのシステム管理情報のやりとりを行なう機能を、システム管理部4と各WS2a〜2cのそれぞれに設け、システム管理部4は、定期的なポーリングにより各WS2a〜2cからシステム管理情報を収集することを特徴とする。
また、(3)上記(1)に記載のコンピュータネットワーク管理システムにおいて、システム管理部4と各WS2a〜2c間でのシステム管理情報のやりとりを行なう機能を、システム管理部4と各WS2a〜2cのそれぞれに設け、システム管理部4は、各WS2a〜2cが発行するイベント報告によりシステム管理情報を収集することを特徴とする。
また、(4)上記(1)から(3)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース10と、ネットワーク上のトラフィックをモニタするトラフィック・モニタ9と、クライアント・サーバシステムのサーバを構築するリモート・インストーラ8とを設け、統合管理部6aは、トラフィック・モニタ9によるサーバに関するモニタ結果に基づき、ネットワーク構成データベース10を検索して、トラフィックのボトルネックを検出し、この検出したボトルネックを解消するようにリモート・インストーラ8によって新たなサーバを構築することを特徴とする。
また、(5)上記(1)から(3)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース10と、クライアント・サーバシステムのサーバを構築するリモート・インスト−ラ8と、サーバを削除するリモート・デインストーラ11と、各サーバをモニタして各サーバの利用度を検出するサーバ・モニタ12とを設け、統合管理部6bは、サーバ・モニタ12が検出した利用度の低いサーバ群の統合の可否を、ネットワーク構成データベース10中のネットワーク構成に基づいて判断し、リモート・インストーラ8とリモート・デインストーラ11を介して、利用度の低いサーバ群を一つのサーバに統合することを特徴とする。また、(6)上記(4)に記載のコンピュータネットワーク管理システムにおいて、クライアント・サーバシステムのサーバを削除するリモート・デインストーラ11と、各サーバをモニタして、各サーバの利用度を検出するサーバ・モニタ12とを設け、統合管理部6bは、サーバ・モニタ12が検出した利用度の低いサーバ群の統合の可否を、ネットワーク構成データベース10中のネットワーク構成に基づいて判断し、リモート・インストーラ8とリモート・デインストーラ11を介して、利用度の低いサーバ群を一つのサーバに統合することを特徴とする。
また、(7)上記(1)から(3)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク構成を表現する情報を格納するネットワーク構成データベース10と、ネットワークで発生した障害の履歴をネットワーク障害ログに蓄積する手段(ネットワークイベントログ14)と、システム障害の履歴をシステム障害ログに蓄積する手段(システムイベントログ13)とを設け、統合管理部cは、ネットワーク構成データベース10中のネットワーク構成に基づいて、ネットワークイベントログ14中の障害情報レコードとシステムイベントログ13中の障害情報レコ−ドを関連付け、障害の主因である障害情報レコードを生成することを特徴とする。
また、(8)上記(4)から(6)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワークで発生した障害の履歴をネットワーク障害ログに蓄積する手段(ネットワークイベントログ14)と、システム障害の履歴をシステム障害ログに蓄積する手段(システムイベントログ13)とを設け、統合管理部cは、ネットワーク構成データベース10中のネットワーク構成に基づいて、ネットワークイベントログ14中の障害情報レコードとシステムイベントログ13中の障害情報レコ−ドを関連付け、障害の主因である障害情報レコードを生成することを特徴とする。
また、(9)上記(4)から(8)のいずれかに記載のコンピュータネットワーク管理システムにおいて、ネットワーク内の複数のシステムの各々を識別し、ネットワーク構成データベース10に格納するネットワーク構成を表現する情報を生成するシステム発見部15と、各システムのファイル/ディレクトリ、リソース、構成情報を少なくとも含むシステム情報を、ネットワーク構成データベース10から検索するシステム情報検索部16とを設け、統合管理部6a〜6dは、システム情報検索部16がネットワーク構成データベース10から検索した、各システムのファイル/ディレクトリやリソースや構成情報を少なくとも含むシステム情報に基づき、ネットワークに接続されている全システムの構成を判別することを特徴とする。
【0008】
【作用】
本発明においては、ネットワーク管理部により、ネットワークを構成するネットワーク機器に対しての制御を行ない、また、ネットワーク機器から情報を収集し、システム管理部により、各コンピュータに対しての制御を行ない、各コンピュータから情報を収集する。そして、統合管理部により、ネットワーク管理部とシステム管理部に対してインストラクションを発行し、ネットワーク管理部およびシステム管理部のそれぞれが持つ情報を関連付けて統合する。
すなわち、ネットワーク管理部は、ネットワーク機器に定期的にポーリングするか、ネットワーク機器が発行するイベント報告により、このネットワークに関する情報を収集し、蓄積する。
システム管理部は、各コンピュータに定期的にポーリングするか、各コンピュータが発行するイベント報告により、システムに関する情報を収集する。
そして、統合管理部は、ネットワークに関する情報をネットワーク管理部から取得し、システムに関する情報をシステム管理部から取得する。あるいは、ネットワーク管理部やシステム管理部が、統合管理部に対して、それぞれ、ネットワークに関する情報やシステムに関する情報を報告する。
統合管理部は、これらの情報に基づき、グラフィカル・ユーザ・インタフェースによる管理者への通知や、システム管理部またはネットワーク管理部への詳細情報の問い合せ等を行なう。
【0009】
【実施例】
以下、本発明の実施例を、図面により詳細に説明する。
図1は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第1の実施例を示すブロック図であり、図2は、図1におけるコンピュータネットワーク管理システムによって管理されるコンピュータネットワークの一構成例を示すブロック図である。
図2に示すように、本実施例のコンピュータネットワーク管理システム1で集中管理する対象のネットワークは、それぞれ複数のワークステーション(図中、WSと記載)からなるラン(LAN:Local Area Network)が、ブリッジやルータ、WAN(Wide Area Network)、専用線網、TDM(Time Division Multiplexer、時分割多重化装置)等で接続された分散コンピューティング環境を構築している。
【0010】
そして、図1に示すように、本発明のコンピュータネットワーク管理システム1は、各ワークステーション(以下、WSと記載)2a〜2cから分散システムに関する情報を収集するシステム管理部4と、通信ネットワーク3を集中管理するネットワーク管理部5と、システム管理部4とネットワーク管理部5で収集したそれぞれの情報に基づきシステム管理とネットワーク管理を統合して行なう統合管理部6により構成されている。
【0011】
ネットワーク管理部5は、通信ネットワーク3を構成するネットワーク機器に対して制御を行ない、これらのネットワーク機器からネットワーク管理情報を収集する。ネットワーク管理部4で行なうネットワーク管理には、構成管理、障害管理、性能管理、セキュリティ管理、アカウント管理が主なものとしてあり、構成管理は、ネットワーク構成の表示や各ノードに関する情報の収集、また障害管理は、障害情報の収集、障害箇所の特定、障害原因の診断、また性能管理は、トラヒック量の監視、各ノードのCPUにかかる負荷の監視、各ノードのメモリ利用率の監視、さらにセキュリティ管理は、ネットワークにおけるアクセス制御、認証サービスの適用、暗号キーの管理、そしてアカウント管理は、ネットワークのリソースを使用した場合のアカウント情報の管理を行なう。例えば、構成管理と障害管理により、障害箇所を特定することができ、ネットワーク迅速な回復が可能となる。
【0012】
システム管理部4は、各WS2a〜2cに対して制御を行ない、これらのWS2a〜2cから分散コンピューティング環境に関する情報すなわちシステム管理情報を収集する。
統合管理部6は、システム管理部4とネットワーク管理部5に対してインストラクションを発行し、システム管理部4およびネットワーク管理部5のそれぞれが持つ情報を関連付けて、システム管理情報とネットワーク管理情報とを統合した管理を行なう。
【0013】
以下、ネットワークコンピュータ管理システム1の動作説明を行なう。
ネットワーク管理部5は、ネットワーク機器に定期的にポーリングし、通信ネットワーク3に関する情報を収集し、蓄積する。あるいは、ネットワーク機器が発行するイベント報告により、通信ネットワーク3に関する情報を収集し、蓄積してもよい。
システム管理部4は、WS2a〜2cに定期的にポーリングするか、WS2a〜2cが発行するイベント報告により、分散システムに関する情報を収集する。統合管理部6は、ネットワークに関する情報をネットワーク管理部5から取得し、分散システムに関する情報をシステム管理部4から取得する。あるいは、ネットワーク管理部5やシステム管理部4が、統合管理部6に対して、それぞれ、ネットワークに関する情報や分散システムに関する情報を報告する。
【0014】
統合管理部6は、報告された情報を処理して以下の動作のいづれかを行なう。(A)グラフィカル・ユーザ・インタフェースを通して、管理者に通知する。
(B)システム管理部4またはネットワーク管理部5に詳細情報を問い合せる。(C)何もしない。
(B)の動作を行なう場合、以下の動作例(B)に従う。
すなわち、統合管理部6は、ネットワークに関する情報をネットワーク管理部5に、分散システムに関する情報をシステム管理部4に問い合わせる。
ネットワーク管理部5またはシステム管理部4は、問い合わされた情報に対する解答を、蓄積された情報から見つけ出し、統合管理部6に返す。あるいは、さらにそれぞれ、ネットワーク機器やWS2a〜2cに問い合わせてもよい。
【0015】
そして、解答を得た統合管理部6は、さらに次のいづれかの動作を行なう。
(a)グラフィカル・ユーザ・インタフェースを通して、管理者に通知する。
(b)システム管理部4またはネットワーク管理部5に詳細情報を問い合せる。
(c)何もしない。
尚、(b)の動作を行なう場合、上述の動作例(B)に従う。
このようにして、通信ネットワーク3と、この通信ネットワーク3に接続されたWSおよび分散システムを統合管理することができる。
次に、ネットワークや分散システムの構成や、ネットワークの利用形態、利用状況等に応じてWSを最適に配置する例を説明する。
【0016】
図3は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第2の実施例を示すブロック図である。
本第2の実施例では、コンピュータネットワーク管理システム1aは、ネットワーク構成データベース10およびトラフィック・モニタ9を有するネットワーク管理部5aと、リモート・インストーラ8を有するシステム管理部4aと、統合管理部6aとから構成される。
ネットワーク構成データベース10には、ネットワークの構成に関する情報として、管理されるWSの一覧と、当該WSが通信のために使用する通信回線の一覧と、WSと通信回線の接続関係の一覧が蓄積されている。通信回線の一覧には、各通信回線毎に、当該通信回線を識別するための識別情報と、当該通信回線の回線容量が含まれる。
【0017】
以下、図4を用いて、コンピュータネットワーク管理システム1aの本発明に係る動作説明を行なう。
図4は、図3におけるコンピュータネットワーク管理システムの本発明に係るボトルネックの検出手順例を示すPAD図である。
図3の統合管理部6aは、図3のトラフィック・モニタ9により、各WSにポーリングを行ない(ステップ401)、各WSの通信統計情報から、各WSの持つ通信インタフェース毎の入力オクテット数または出力オクテット数と(ステップ402)、通信が不可能であった回数または時間を得る(ステップ403)。ここで、入力オクテット数のかわりに入力パケット数でも良い。ただし、入力パケットの(オクテット単位での)平均サイズが得られるか、明示的に与えられなければならない。出力オクテット数に関しても同様である。
【0018】
また、ネットワークがティー・シー・ピー/アイ・ピー(TCP/IP)をベースに構築されており、トラフィック・モニタがエス・エヌ・エム・ピー(SNMP)を使用して通信統計情報を得るのであれば、全WSに対してポーリングするのではなく、例えば、アール・エフ・シー1271“リモート・ネットワーク・モニタリング・マネージメント・インフォメーション・ベース”(RFC1271 ”Remote Network Monitoring Management Information Base”)、あるいは、アール・エフ・シー1513“トークン・リング・エクステンションズ・トゥ・ザ・リモート・ネットワーク・モニタリング・エム・アイ・ビー”(RFC1513 ”Token Ring Extensions to the Remote Network Monitoring MIB”)に準拠した管理情報を持つWSだけにポーリングして、各通信回線毎の回線使用量を得ることも可能である。
【0019】
また、前述した全WSにポーリングにすることにより、ファイル・サーバやプリンタ・サーバ等のサーバとして動作しているWSを発見し(ステップ404)、当該サーバから、クライアントの一覧と(ステップ405)、クライアント・サーバ負荷に関する情報を得る(ステップ406)。
さらに、ルータ、ゲートウェイとなっているWSに対しては(ステップ407)、送信待ちキューの(オクテット単位での)キュー長と(ステップ408)、WS負荷に関する情報を得る(ステップ409)。
そして、このようにして取得した情報をデータベース等に保存する(ステップ410)。
【0020】
各WSより収集した情報にもとづき、各サーバとクライアント間の通信路でボトルネックとなっている場所を検出する(ステップ411、412)。ボトルネックとなっている場所が検出されたならば(ステップ413)、当該ボトルネックを回避するように、適当なWSにサーバ機能をインストールし(ステップ414、415)、必要ならば(ステップ416)、前記サーバを選択するようにクライアント・システムの再構築を行なう(ステップ417)。
このようにして、ネットワークの構成やネットワークの利用形態/利用状況に応じたボトルネックを検出し、分散システムを最適に配置することができる。
次に、図5を用いて、上述のボトルネック検出について説明する。
【0021】
図5は、図3におけるコンピュータネットワーク管理システムの本発明に係るボトルネック検出手順を示すPAD図である。
各WSにポーリングを行なって、各通信インタフェース毎の入力オクテット数または出力オクテットを得る場合、図3におけるネットワーク構成データベース10中のWSと通信回線との接続関係を利用して、各通信回線毎の回線使用量を導出する。本例では、通信回線、ルータ/ゲートウェイ、サーバの順にボトルネックであるかを判断する。
【0022】
始めに、各通信回線毎に(ステップ501)、回線容量に対する回線使用量の割合が、予め規定された閾値を超過しているか評価し(ステップ502)、閾値を超過しているならば、当該通信回線がボトルネックであると判断する(ステップ503)。
次に、各ルータ/ゲートウェイ毎に(ステップ504)、システム(WS)負荷と送信待ちキュー長と入力オクテット数と出力オクテット数が予め規定された閾値を超過しているか評価し(ステップ505、507、509)、いずれかが閾値を超過しているならば、当該ルータ/ゲートウェイがボトルネックであると判断する(ステップ506、508、510)。
最後に、各サーバ毎に(ステップ511)、システム(WS)負荷と入力オクテット数と出力オクテット数が予め規定された閾値を超過しているか評価し(ステップ512、514)、いずれかが閾値を超過しているならば、当該サーバがボトルネックであると判断する(ステップ513、515)。
【0023】
このようにして検出したボトルネックの回避技術を、以下に説明する。
通信回線がボトルネックである場合、コンピュータネットワーク管理システムにおける図3の統合管理部6aは、当該通信回線を通信経路に含むサーバとクライアントの組を一つ選ぶ。当該サーバとクライアントの組が、ボトルネックとなっている通信回線を含まない通信経路(新通信経路と呼ぶ)を選択することができるならば、図3の統合管理部6aは、当該サーバとクライアント間の通信経路を新通信経路とするように経路制御を行なう。新通信経路を選択できないならば、図3の統合管理部6aは、ボトルネックとなっている通信回線によってネットワークを2分割し、クライアントが存在する部分から、適当なWSをサーバ機能をインストールする対象として選択する。
【0024】
ただし、同機能のサーバが2分割されたネットワークのクライアントが存在する部分に存在しており、当該サーバがボトルネックとなっていないならば、図3の統合管理部6aは、当該サーバを選択してもよい。その場合は、サーバ機能のインストールは終了しているものとみなす。
図3の統合管理部6aは、サーバ機能をインストールするWSを選択するとき、CPUとディスクとメモリに、当該サーバ機能をインストールし、動作させる余裕があることをチェックし、前記条件を満足するWSを前記サーバ機能をインストールする対象として選択する。
【0025】
ルータ/ゲートウェイがボトルネックである場合のボトルネック回避も同様にして行なう。相違点は、ボトルネックとなるルータ/ゲートウェイを含まない通信経路を新通信経路として選択することと、ボトルネックとなるルータ/ゲートウェイでネットワークを2分割することである。
サーバがボトルネックである場合、図3の統合管理部6aは、適当なWSをサーバ機能をインストールする対象として選択する。ただし、ボトルネックとなっていない同機能のサーバが別に存在しているならば、図3の統合管理部6aは、当該サーバを選択してもよい。その場合は、サーバ機能のインストールは終了しているものとみなす。また、サーバ機能をインストールするWSを選択するとき、CPUとディスクとメモリに、当該サーバ機能をインストールし、動作させる余裕があることをチェックし、前記条件を満足するWSを前記サーバ機能をインストールする対象として選択する。
【0026】
次にサーバ機能のインストール手順を説明する。
図3の統合管理部6aは、図3のリモート・インストーラ8を使用して、選択したサーバにサーバ機能をインストールし、インストール完了後、当該サーバ機能を動作させる。
サーバ機能のインストール手順としては、図3のコンピュータネットワーク管理システム1a内に蓄積されたサーバ機能実行プログラムをインストールする技術と、サーバ機能実行プログラムを、ボトルネックを発生させているサーバから、サーバ機能をインストールするように選択されたシステムにコピーする技術がある。
【0027】
また、サーバ機能をインストールする前に、ネットワークとWS(クライアント・サーバ・システム)を管理しているアドミニストレータ(保守管理者)にサーバのインストールの可否を訊ね、アドミニストレータの許可を得てからサーバのインストールを開始することもできる。
さらに、必要であれば、ボトルネックを発生させているクライアント・システムの再構築を行なう。すなわち、クライアント・システムがサーバ指定情報により、ボトルネックを発生させているサーバを指定されているならば、当該サーバ指定情報を変更し、ボトルネックを回避する新しいサーバを指定させる。
このように本実施例によれば、ボトルネックを回避したクライアント・サーバ・システムを自動的に再構築することができる。
【0028】
次の実施例を、図6を用いて説明する。
図6は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第3の実施例を示すブロック図である。
本実施例では、コンピュータネットワーク管理システム1bは、ネットワーク構成データベース10を具備したネットワーク管理部5bと、リモート・インストーラ8、リモート・デインストーラ11、サーバ・モニタ12を具備したシステム管理部4bから構成される。
【0029】
ネットワーク構成データベース10とリモート・インストーラ8は、図3におけるものと同じであり、リモート・デインストーラ11は、サーバ(WS)よりサーバ機能を削除する機能を有する。サーバ・モニタ12は、各サーバにポーリングを行ない、当該サーバがクライアントからどれだけ利用されているかを表す情報(サーバ利用度と呼ぶ)を収集する。例えば、当該サーバが提供するサービスを利用したクライアントの数や、クライアントが当該サーバが提供するサービスを利用したのべ時間の和を当該サーバのサーバ利用度とする。トラフィック・モニタ9が各WSにポーリングを行なう場合には、このサーバ・モニタ12は、図3における第2の実施例で説明したトラフィック・モニタ9でも良い。
【0030】
統合管理部6bは、各サーバのサーバ利用度が、予め指定してある閾値を下回っているサーバを発見する。
サーバ利用度が閾値を下回るサーバが存在しているならば、統合管理部6bは、同種類のサーバを探し出す。同種類のサーバが探し出せたならば、当該サーバを、サーバ利用度が閾値を下回っているサーバのクライアントの、新しいサーバとする。もし必要であるならば、前記クライアントの再構築も行なう。
【0031】
また、同種類のサーバが複数存在しているならば、それらのうち任意の一台を新しいサーバとして良い。あるいは、各クライアント毎に、当該クライアントに最も近いサーバを、当該クライアントの新しいサーバとすることもできる。また、サーバ利用度が閾値を下回るサーバのクライアント群の重心に最も近いサーバを、新しいサーバとすることでも良い。ここで、クライアント群の重心に最も近いサーバは、クライアント群に属するクライアントとサーバの距離の総和が最小となるサーバのことである。数式で表すと、以下の式を最小とするサーバである。
Σ dc
c∈C
ここで、Cはクライアント群、dcはクライアントcとサーバの距離をあらわす。このクライアントとサーバ間の距離は、例えば、クライアントとサーバ間の通信回線の長さでもよいし、クライアントとサーバ間に存在するルータやゲートウェイの数でもよい。
【0032】
最後に、統合管理部6bは、サーバ利用度が閾値を下回るサーバから、サーバ機能を削除する。
尚、サーバ利用度のかわりに、システム(WS)の負荷を用いることも可能である。
このようにして、サーバの利用度やシステム負荷がアドミニストレータが指定した範囲内に収まる最適なクライアン・サーバ・システムを構築することができる。
【0033】
次の実施例を、図7を用いて説明する。
図7は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第4の実施例を示すブロック図であ
本実施例のコンピュータネットワーク管理システム1cは、ネットワーク・イベント・ログ14とネットワーク構成データベース10を有するネットワーク管理部5cと、システム・イベント・ログ13を有するシステム管理部4cと、統合管理部6cから構成される。
ネットワーク管理部5cは、ネットワーク上に発生した障害などの事象をネットワーク・イベント・ログ14に登録する。
システム管理部4cも同様に、分散システムで発生した事象をシステム・イベント・ログ13に登録する。
ネットワーク・イベント・ログ14とシステム・イベント・ログ13それぞれには、各事象の発生時刻と事象の内容がログされる。
【0034】
統合管理部6cは、ネットワーク構成データベース10と、ネットワーク・イベント・ログ14とシステム・イベント・ログ13を利用して、事象の関連を付ける。
例えば、図8に示す構成で、同一時間帯にイベントA、イベントB、イベントCが発生している場合、イベントBがイベントA、イベントCを引き起こしたと判断する。ここで、イベントAはWS2dで発生した事象であり、イベントCはWS2eで発生した事象であり、イベントBはWS2dとWS2e間の通信回線で発生した事象である。
このように、本実施例のよれば、WS2d、2eやネットワークで発生したイベントを関連付けることができる。
【0035】
次の実施例を、図9を用いて説明する。
図9は、本発明のコンピュータネットワーク管理システムの本発明に係る構成の第5の実施例を示すブロック図であ
本実施例のコンピュータネットワーク管理システム1dは、図7におけるコンピュータネットワーク管理システム1cに、システム発見部15とシステム情報検索部16を新たに設けたものであり、ネットワーク管理部5dは、システム発見部15により、ネットワークに接続されている各WSを識別して、ネットワーク構成を表現する情報として生成し、ネットワーク構成データベース10に登録する。また、システム管理部4dは、システム情報検索部16により、ネットワーク構成データベース10を検索し、ネットワーク構成データベース10に登録されているWSに対して問い合わせを行なうことにより、当該WSが有するファイル/ディレクトリや、また、プリンタや2次記憶装置などのリソース情報/構成情報を取得する。
このことにより、ネットワークに接続されている全WSの構成を知ることができる。
【0036】
以上、図1〜図9を用いて説明したように、本実施例のコンピュータネットワーク管理システムでは、分散システムとネットワークを統合管理する。このことにより、ネットワークの構成やネットワークの利用形態/利用状況に応じたボトルネックを検出して、分散システムを構成する各WSを最適に配置することができる。また、ネットワークや分散システムを構成するWSのどちらかに障害が発生した場合、両者の障害ログを比較することにより、障害の主因が分散システムにあるのか、ネットワークにあるのかを容易に切り分けることができる。
【0037】
尚、本発明は、図1〜図9を用いて説明した実施例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本第1〜第5の実施例においては、トラフィック・モニタや、ネットワーク構成データベース、ネットワークイベントログ等をネットワーク管理部に、また、リモート・インストーラや、リモート・デインスーラ、サーバ・モニタ、システムイベントログ等をシステム管理部に、それぞれ設けた構成としているが、それぞれを、ネットワーク管理部、システム管理部外に設ける構成でも良い。
【0038】
【発明の効果】
本発明によれば、システム管理をネットワーク管理と共に行なうことができ、システム管理とネットワーク管理を統合した管理を一つの場所で集中的に行なうことができ、コンピュータネットワークの維持管理を高効率に行なうことが可能である。
【図面の簡単な説明】
【図1】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第1の実施例を示すブロック図である。
【図2】図1におけるコンピュータネットワーク管理システムによって管理されるコンピュータネットワークの一構成例を示すブロック図である。
【図3】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第2の実施例を示すブロック図である。
【図4】図3におけるコンピュータネットワーク管理システムの本発明に係るボトルネックの検出手順例を示すPAD図である。
【図5】図3におけるコンピュータネットワーク管理システムの本発明に係るボトルネック検出手順を示すPAD図である。
【図6】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第3の実施例を示すブロック図である。
【図7】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第4の実施例を示すブロック図である。
【図8】同一時間帯に発生した各イベントの関連を示す説明図である。
【図9】本発明のコンピュータネットワーク管理システムの本発明に係る構成の第5の実施例を示すブロック図である。
【符号の説明】
1a〜1c コンピュータネットワーク管理システム
2a〜2d ワークステーション(WS)
3 通信ネットワーク
4a〜4c システム管理部
5a〜5c ネットワーク管理部5
6a〜6c 統合管理部
8 リモート・インストーラ
9 トラフィック・モニタ
10 ネットワーク構成データベース
11 リモート・デインストーラ
12 サーバ・モニタ
13 システム・イベント・ログ
14 ネットワーク・イベント・ログ
15 システム発見部
16 システム情報検索部
Claims (3)
- 複数のコンピュータがネットワークを介して接続されるネットワークシステムを管理するコンピュータネットワーク管理システムであって、
ネットワークに接続される複数の機器から、該複数の機器のインタフェース毎の入力データ量もしくは出力データ量を取得するトラフィックモニタと、
前記複数の機器の一覧と該複数の機器が通信のために使用する通信回線の一覧および該通信回線と前記複数の機器との接続関係の一覧を蓄積するネットワーク構成データベースと、
前記ネットワークに接続される機器に、サーバ機能実行プログラムをインストールするリモートインストーラと、
前記トラヒックモニタが取得したインタフェース毎の入力データ量もしくは出力データ量と、前記ネットワーク構成データベースが蓄積している複数の機器と通信回線との接続関係とを利用して、通信回線毎の回線使用量を導出し、回線容量に対する前記回線使用量の割合が予め定められた閾値を超過している通信回線を含む通信経路を使用して通信する前記ネットワークに接続される複数の機器としてのサーバとクライアントを選択すると共に、前記回線使用量の割合が予め定められた閾値を超過している通信回線を含まない通信経路を介して前記クライアントと接続される機器を選択し、該選択した機器に、前記選択したサーバのサーバ機能実行プログラムをインストールするよう前記リモートインストーラを制御し、前記選択したクライアントが前記選択した機器と、前記回線使用量の割合が予め定められた閾値を超過している通信回線を含まない通信経路を介して通信するよう経路制御を行う総合管理手段と
を有することを特徴とするコンピュータネットワーク管理システム。 - 請求項1に記載のコンピュータネットワーク管理システムであって、
前記トラフィックモニタは、前記ネットワーク上の機器としてのルータもしくはゲートウェイの負荷と送信待ちキュー長と入力オクテット数と出力オクテット数を取得し、
前記統合管理手段は、前記トラヒックモニタが取得した負荷と送信待ちキュー長と入力オクテット数と出力オクテット数のいずれかが予め定められた閾値を超過しているルータもしくはゲートウェイが存在する場合、該ルータもしくはゲートウェイをサーバとの通信経路に含むクライアントが前記ルータもしくはゲートウェイを含まない通信経路を介して接続される機器に、前記サーバのサーバ機能実行プログラムをインストールするよう前記リモートインストーラを制御し、該サーバ機能実行プログラムをインストールした機器に前記クライアントを接続させることを特徴とするコンピュータネットワーク管理システム。 - 請求項1または請求項2のいずれかに記載のコンピュータネットワーク管理システムであって、
前記トラフィックモニタは、前記サーバの前記クライアントからの利用度情報を取得し、
前記統合管理手段は、前記トラフィックモニタが取得した利用度情報が予め定められた閾値を下回っている第1のサーバと、該第1のサーバと同種類の第2のサーバとを選出し、該第2のサーバを、前記第1のサーバを利用しているクライアントの新しいサーバとすることを特徴とするコンピュータネットワーク管理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27881294A JP3693184B2 (ja) | 1994-11-14 | 1994-11-14 | コンピュータネットワーク管理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27881294A JP3693184B2 (ja) | 1994-11-14 | 1994-11-14 | コンピュータネットワーク管理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08137810A JPH08137810A (ja) | 1996-05-31 |
JP3693184B2 true JP3693184B2 (ja) | 2005-09-07 |
Family
ID=17602514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27881294A Expired - Fee Related JP3693184B2 (ja) | 1994-11-14 | 1994-11-14 | コンピュータネットワーク管理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3693184B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1093626A (ja) * | 1996-09-11 | 1998-04-10 | Nippon Telegr & Teleph Corp <Ntt> | データ通信網における通信状態に依存したホストのトラヒック負荷分散制御方法 |
JP3624063B2 (ja) * | 1996-11-29 | 2005-02-23 | キヤノン株式会社 | 実時間データ配送制御方法 |
JPH11282818A (ja) * | 1998-03-31 | 1999-10-15 | Nec Corp | クライアント構成情報管理システムおよびクライアント構成情報管理方式 |
JP3786328B2 (ja) * | 1998-07-27 | 2006-06-14 | 株式会社日立製作所 | サーバおよび通信制御方法 |
JP3537356B2 (ja) | 1998-12-09 | 2004-06-14 | 株式会社日立製作所 | ジョブシステムにおける遅延要因解析方法 |
KR100510068B1 (ko) * | 1999-06-22 | 2005-08-26 | 주식회사 하이닉스반도체 | 반도체 라인관리용 통합 자동화시스템의 감시 시스템 및 방법 |
JP2002217887A (ja) * | 2001-01-18 | 2002-08-02 | Nec Corp | San暗号化制御方式 |
JP3945297B2 (ja) | 2001-04-24 | 2007-07-18 | 株式会社日立製作所 | システム及び管理システム |
US7099912B2 (en) | 2001-04-24 | 2006-08-29 | Hitachi, Ltd. | Integrated service management system |
JP2003141055A (ja) | 2001-11-07 | 2003-05-16 | Hitachi Ltd | 計算機システムの接続設定方法 |
AU2004222930A1 (en) * | 2003-03-19 | 2004-10-07 | Unisys Corporation | Server consolidation data model |
JP2006221400A (ja) * | 2005-02-10 | 2006-08-24 | Yokogawa Electric Corp | 構成管理方法及びこれを用いた管理装置 |
US8531953B2 (en) | 2006-02-21 | 2013-09-10 | Barclays Capital Inc. | System and method for network traffic splitting |
US8806273B2 (en) * | 2008-10-30 | 2014-08-12 | International Business Machines Corporation | Supporting detection of failure event |
JP5423427B2 (ja) | 2010-01-26 | 2014-02-19 | 富士通株式会社 | 情報管理プログラム、情報管理装置、および情報管理方法 |
CN113518003A (zh) * | 2021-05-31 | 2021-10-19 | 广州市侏罗纪科技有限公司 | 一种计算机网络运行管理系统 |
-
1994
- 1994-11-14 JP JP27881294A patent/JP3693184B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08137810A (ja) | 1996-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3693184B2 (ja) | コンピュータネットワーク管理システム | |
KR100491541B1 (ko) | 네트웍 환경에서의 컨텐츠 동기화 시스템 및 동기화 방법 | |
US7185366B2 (en) | Security administration server and its host server | |
US7174557B2 (en) | Method and apparatus for event distribution and event handling in an enterprise | |
US20030135611A1 (en) | Self-monitoring service system with improved user administration and user access control | |
US8145742B1 (en) | Method of and apparatus for network administration | |
US7836187B2 (en) | Method to identify transactions and manage the capacity to support the transaction | |
US9450700B1 (en) | Efficient network fleet monitoring | |
CN100536417C (zh) | 网格许可服务器和容错网格系统及使用方法 | |
JP4689683B2 (ja) | テクノロジー管理ポータル | |
JP2004295811A (ja) | ジョブ管理機能を有するストレージ系障害管理方法及び装置 | |
JP4308086B2 (ja) | 自律制御プログラム及びその記録媒体、自律制御装置並びに自律制御方法 | |
US7209968B1 (en) | System and method for recovering management of network element(s) responsive to failure of a distributed gateway | |
US20020188568A1 (en) | Systems and methods of containing and accessing generic policy | |
US20090070425A1 (en) | Data processing system, method of updating a configuration file and computer program product | |
US20060120384A1 (en) | Method and system for information gathering and aggregation in dynamic distributed environments | |
KR20000012194A (ko) | 통합관리시스템과보안시스템을통합하기위한시스템 | |
US9082089B2 (en) | System and method for managing bandwidth utilization | |
EP3306471B1 (en) | Automatic server cluster discovery | |
US20050125314A1 (en) | Resource usage metering of network services | |
CA2476330A1 (en) | System and method for managing resource sharing between computer nodes of a network | |
US11914495B1 (en) | Evaluating machine and process performance in distributed system | |
JPH0969083A (ja) | 分散運用管理方式及び障害管理方式 | |
US7133912B1 (en) | System and method for measuring usage of gateway processes utilized in managing network elements | |
JP6364203B2 (ja) | システムの稼働状態を監視する監視サーバ及び監視サーバの制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040903 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050603 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050616 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |