JP4616020B2 - ネットワーク監視プログラム及びネットワークシステム - Google Patents

ネットワーク監視プログラム及びネットワークシステム Download PDF

Info

Publication number
JP4616020B2
JP4616020B2 JP2005019146A JP2005019146A JP4616020B2 JP 4616020 B2 JP4616020 B2 JP 4616020B2 JP 2005019146 A JP2005019146 A JP 2005019146A JP 2005019146 A JP2005019146 A JP 2005019146A JP 4616020 B2 JP4616020 B2 JP 4616020B2
Authority
JP
Japan
Prior art keywords
abnormal phenomenon
notification message
function
information
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005019146A
Other languages
English (en)
Other versions
JP2006211173A (ja
Inventor
隆 山本
貴大 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005019146A priority Critical patent/JP4616020B2/ja
Priority to US11/117,776 priority patent/US7623465B2/en
Publication of JP2006211173A publication Critical patent/JP2006211173A/ja
Application granted granted Critical
Publication of JP4616020B2 publication Critical patent/JP4616020B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0847Transmission error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、システム内での通信状況を監視可能なネットワークシステムと、そのようなネットワークシステムを構築するために使用されるネットワーク監視プログラムとに、関する。
周知のように、比較的に大規模なネットワークシステム(コンピュータ、ルータ等がネットワーク接続されたシステム)では、通信異常に即座に対処できるようにするために、何台かの(通常、1台)コンピュータで、システム内の各ノードの動作状態に関する情報を監視することが行われている(例えば、特許文献1参照)。
ただし、既存のネットワークシステムにおいて監視されている各ノードの動作状態に関する情報は、各ノードに物理的な障害が発生しているか否かを判断することしかできないものとなっている。このため、既存のネットワークシステムは、コンピュータの内部的なリソース不足等に因る通信異常(アプリケーションレベルでの通信異常)が発生した場合、その発生原因の特定に時間がかかるシステムとなっている。
特開2004−86522号公報
そこで、本発明の課題は、アプリケーションレベルでの通信異常が発生した場合にも、その発生原因を簡単に特定できるネットワーク監視プログラム,ネットワークシステムを提供することにある。
上記課題を解決するために、本発明では、複数台の被監視コンピュータと、TCP通信を中継するための複数台のネットワーク機器とを含むネットワークシステム内のコンピュータ上で実行されるネットワーク監視プログラムを、コンピュータを、前記複数台のネットワーク機器のそれぞれが正常に動作しているか否かを検出するための動作状態検出機能,前記動作状態検出機能による検出結果をディスプレイ上に表示する検出結果表示機能,実行中のTCP通信における異常現象の出現頻度が規定値よりも大きくなった場合に,各被監視コンピュータが送信する異常現象発生通知メッセージを受信し、管理する異常現象発生通知メッセージ管理機能であってTCP通信による情報の授受を行っている2台の被監視コンピュータのそれぞれから所定時間内に前記異常現象発生通知メッセージが送信されてきた場合に、それら2つの異常現象発生通知メッセージを集約した異常現象発生通知メッセージを生成して管理する異常現象発生通知メッセージ管理機能,前記異常現象発生
通知メッセージ管理機能によって管理されている異常現象発生通知メッセージ毎に、少なくとも当該異常現象発生通知メッセージの送信元がいずれの被監視コンピュータであるかを示す情報が含まれる発生異常現象提示情報をディスプレイ上に表示する発生異常現象提示情報表示機能、及び、前記異常現象発生通知メッセージ管理機能によって集約された2つの異常現象発生通知メッセージを送信した2台の被監視コンピュータ間のTCP通信に利用されている各ネットワーク機器を特定し、特定結果をディスプレイ上に表示する経路情報表示機能を有する装置として動作させるものしておく。
すなわち、本発明のネットワーク監視プログラムが或るコンピュータで実行されているネットワークシステムでは、或る被監視コンピュータが行っているTCP通信に問題が生じた場合(当該TCP通信における異常現象(例えば、パケットの破棄や再送)の出現頻度が規定値を上回った場合)、ディスプレイ上に、当該被監視コンピュータで問題が生じたことが分かる発生異常現象提示情報が表示されることになる。また、各ネットワーク機器のそれぞれが正常に動作しているか否かがディスプレイ上で確認できることにもなるので、本発明のネットワーク監視プログラムを用いれば、アプリケーションレベルでの通信異常が発生した場合にも、その発生原因を簡単に特定可能な環境を実現できることになる。
なお、本発明のネットワーク監視プログラムを実現(作成)するに際しては、各種情報が表示されるディスプレイを、ネットワーク監視プログラムを実行しているコンピュータと直結されていないディスプレイとすることが、出来る。
また、本発明のネットワーク監視プログラムがコンピュータに付与する異常現象発生通知メッセージ管理機能は、TCP通信による情報の授受を行っている2台の被監視コンピュータのそれぞれから所定時間内に異常現象発生通知メッセージが送信されてきた場合に、それら2つの異常現象発生通知メッセージを集約した異常現象発生通知メッセージを生成して管理する機能である。従って、本発明のネットワーク監視プログラムを用いれば、ディスプレイ上に表示される発生異常現象提示情報の数が減ることになる(受信された各異常現象発生通知メッセージについてディスプレイ上に発生異常現象提示情報が表示されないことになる)ので、発生している障害の内容を、ネットワーク管理者が簡単に把握できるネットワークシステムが実現できることになる。
また、本発明のネットワークシステムは、TCP通信を中継するための複数台のネットワーク機器と、他の被監視コンピュータとTCP通信を行うための通信機能,及び,通信機能によって行われている各TCP通信における異常現象の出現頻度を監視し、異常現象の出現頻度が規定値よりも大きくなった場合に、ネットワーク監視装置に対して、異常現象が発生した旨を示す異常現象発生通知メッセージを送信する異常現象発生通知メッセージ送信機能を有する複数台の被監視コンピュータと、複数台のネットワーク機器のそれぞれが正常に動作しているか否かを検出するための動作状態検出機能,動作状態検出機能による検出結果をディスプレイ上に表示する検出結果表示機能,送信されてきた異常現象発生通知メッセージを管理する異常現象発生通知メッセージ管理機能であって TCP通信による情報の授受を行っている2台の被監視コンピュータのそれぞれから所定時間内に前記異常現象発生通知メッセージが送信されてきた場合に、それら2つの異常現象発生通知メッセージを集約した異常現象発生通知メッセージを生成して管理する異常現象発生通知メッセージ管理機能,異常現象発生通知メッセージ管理機能によって管理されている異常現象発生通知メッセージ毎に、少なくとも当該異常現象発生通知メッセージの送信元がいずれの被監視コンピュータであるかを示す情報が含まれる発生異常現象提示情報をディスプレイ上に表示する発生異常現象提示情報表示機能、及び、前記異常現象発生通知メッセージ管理機能によって集約された2つの異常現象発生通知メッセージを送信した2台の被監視コンピュータ間のTCP通信に利用されている各ネットワーク機器を特定し、特定結果をディスプレイ上に表示する経路情報表示機能を有するネットワーク監視装置とを含むシステムとなっている。
すなわち、本発明のネットワークシステムは、本発明のネットワーク監視プログラムが実行されているコンピュータ相当の装置(ネットワーク監視装置)を含むシステムとなっている。従って、このネットワークシステムを用いれば、アプリケーションレベルでの通信異常が発生した場合にも、その発生原因を簡単に特定できることになる。
本発明のネットワーク監視プログラム,ネットワークシステムを用いれば、被監視コンピュータにてアプリケーションレベルでの通信異常が発生した場合にも、その発生原因を簡単に特定できることになる。
以下、本発明を実施するための最良の形態を、図面を参照して詳細に説明する。
《第1実施形態》
まず、図1を用いて、本発明の第1実施形態に係るネットワークシステムの概要を説明する。
図示してあるように、本発明の第1実施形態に係るネットワークシステムは、複数台の被監視コンピュータ10,ネットワーク監視装置20,運用端末30及び複数台のルータ50によって構成されたシステムである。
このネットワークシステムを構成している各ルータ50(本発明のネットワーク機器に相当)は、一般的なIPネットワークシステムで用いられているものと同機能の装置(ルータ)である。各被監視コンピュータ10は、TCP/IP通信機能を有するコンピュータに、本システム用に開発した被監視コンピュータ用プログラム(詳細は後述)をインストールした装置である。
ネットワーク監視装置20は、通信経路上の物理障害(被監視コンピュータ10,ルータ50のノード障害,ポート障害等)を検出する機能、被監視コンピュータ10で生じた物理障害ではない障害(被監視コンピュータ10におけるパケット破棄数の異常等;以下、TCP通信障害と表記する)を検出する機能、運用端末30のディスプレイ上に、各種障害の検出結果等を表示する機能等を有する装置である。なお、運用端末30とは、ネットワーク監視装置20のコンソールとして機能するコンピュータ(ディスプレイが接続されているもの)のことである。また、ネットワーク監視装置20は、コンピュータに、本システム用に開発したネットワーク監視プログラムをインストールすることによって実現された装置となっている。
次に、図2〜図6を用いて、被監視コンピュータ10の構成及び動作(被監視コンピュータ用プログラムの機能)を説明する。
被監視コンピュータ用プログラムは、被監視コンピュータ10(自プログラムがインストールされたコンピュータ)を、図2に示した構成の装置、すなわち、処理実行部11と通信制御部12と通信状態管理部13と通信状態テーブル14とを備えた装置として動作させるプログラムである。
通信制御部12は、TCP/IP通信を制御する(パケットの送受信を実際に行う)コンポーネントである。この通信制御部12は、自側IPアドレス,相手側IPアドレス,自側ポート番号及び相手側ポート番号で特定されるTCP通信毎に、TCP再送回数及びパケット破棄数を管理する機能を有している。また、通信制御部12は、自側IPアドレス,相手側IPアドレス,自側ポート番号,相手側ポート番号,TCP再送回数及びパケット破棄数からなる情報(以下、通信状態データと表記する)を、外部コンポーネント(通信状態管理部13)に対して出力する機能も有している。
処理実行部11は、通信制御部12を利用する各種処理を行うコンポーネント(TCP/IP通信を行うアプリケーションプログラム等に従って動作するコンポーネント)である。なお、この処理実行部11と上記した通信制御部12は、被監視コンピュータ10が元々備えているコンポーネント(被監視コンピュータ用プログラムのインストールによって生じたものではないコンポーネント)となっている。
通信状態テーブル14は、被監視コンピュータ用プログラムのインストールによって被監視コンピュータ10内に生成されるテーブルである。この通信状態テーブル14は、図3に模式的に示したように、No,自側IPアドレス,相手側IPアドレス,自側ポート番号,相手側ポート番号,TCP再送回数及びパケット破棄数を含むデータを複数個記憶可能な構成のテーブルとなっている。以下、この通信状態テーブル14に記憶される各データ(No,自側IPアドレス等からなるデータ)のことも、通信状態データと表記する。
通信状態管理部13(図1)も、被監視コンピュータ用プログラムのインストールによって生ずるコンポーネントである。
この通信状態管理部13は、図4に示した構成の監視対象指定情報テーブルを備えている。詳細については後述するが、この監視対象指定情報テーブルは、監視対象とするTCP通信を限定する場合に、情報が設定されるテーブルとなっている。
そして、通信状態管理部13は、図5に示した手順の状態監視処理を周期的に実行するコンポーネントとなっている。
すなわち、通信状態管理部13は、所定時間(例えば、1分)が経過する度に、この状態監視処理を開始する。そして、状態監視処理を開始した通信状態管理部13は、まず、監視対象とされている各TCP通信に関する通信状態データを通信制御部12から取得する(ステップS101)。ここで、監視対象とされている各TCP通信とは、監視対象指定情報テーブル(図4参照)内に設定されているいずれかの条件を満たすTCP通信(監視対象指定情報テーブルが空の場合は、全てのTCP通信)のことである。なお、図4の監視対象指定情報テーブル内に示してある"*"は、anyを示す記号である。すなわち、監視対象指定情報テーブルの内容が図4に示したものであった場合、通信状態管理部13は、ステップS101において、相手側IPアドレスが"10.1.3.1"であるTCP通信,及び,自側ポート番号が"80"であるTCP通信(自コンピュータに対するHTTP通信)に関する各通信状態データを通信制御部12から取得する。
以下、説明の便宜上、このステップS101の処理で取得された幾つかの通信状態データからなる情報のことを、通信状態情報と表記する。また、自側IPアドレスと相手側IPアドレスと自側ポート番号と相手側ポート番号とからなるデータのことを、セッション識別データと表記する。
ステップS101の処理を終えた通信状態管理部13は、通信状態テーブル14(図3参照)を、既に切断されている通信セッションに関する通信状態データを記憶していない状態とするための処理(ステップS102〜S106)を、行う。
具体的には、通信状態管理部13は、まず、通信状態テーブル14の先頭に記憶されているデータを操作対象データとして特定する(ステップS102)。次いで、通信状態管理部13は、操作対象データに対応する通信状態データ(図では、対応通信状態データ)が通信状態情報に含まれているか否かを判断する(ステップS103)。なお、操作対象データに対応する通信状態データとは、操作対象データに含まれるセッション識別データ(自側IPアドレス,相手側IPアドレス,自側ポート番号及び相手側ポート番号)と同じセッション識別データを含む通信状態データのことである。
操作対象データに対応する通信状態データが通信状態情報に含まれていた場合(ステップS103;YES)、通信状態管理部13は、通信状態テーブル14上に次データが存在しているか否かを判断する(ステップS105)。一方、操作対象データに対応する通信状態データが通信状態情報に含まれていなかった場合(ステップS103;NO)、通信状態管理部13は、通信状態テーブル14から操作対象データを削除する処理(ステップS104)を行ってから、通信状態テーブル14上に次データが存在しているか否かを判断する(ステップS105)。
そして、通信状態管理部13は、次データが存在していた場合(ステップS105;YES)には、次データを操作対象データとして特定(ステップS106)してから、ステップ103以降の処理を開始する。
通信状態管理部13は、通信状態テーブル14上の各通信状態データに対する上記処理が終了したとき(ステップS105;NO)に、ステップS103〜S106の処理ループを抜けだす。そして、通信状態管理部13は、通信状態情報の先頭データ(通信状態情報の先頭に含まれる通信状態データ)を操作対象データとして特定する(ステップS111)。
その後、通信状態管理部13は、操作対象データに対応する通信状態データ(操作対象データとセッション識別データが一致する通信状態データ:図では、対応通信状態データ)が通信状態テーブル14に記憶されているか否かを判断する(ステップS112)。
操作対象データに対応する通信状態データが通信状態テーブル14に記憶されていなかった場合(ステップS112;NO)、通信状態管理部13は、通信状態テーブル14に操作対象データを追加(ステップS115)してから、通信状態情報中に次データが存在しているか否かを判断する(ステップS116)。そして、通信状態管理部13は、次データが存在していた場合(ステップS116;YES)には、次データを操作対象データとして特定(ステップS117)した後に、ステップ112以降の処理を開始する。
一方、操作対象データに対応する通信状態データが通信状態テーブル14に記憶されていた場合(ステップS112;YES)、通信状態管理部13は、図6に示した手順の状態判定処理を実行する。
すなわち、通信状態管理部13は、まず、注目TCP通信に関する単位時間当たりのパケット破棄数増加量を算出し、算出結果をCとして記憶する(ステップS201)。ここで、注目TCP通信とは、操作対象データがその状態を表しているTCP通信のことである。なお、ステップS201の具体的な処理内容は、([操作対象データ中のパケット破棄数]−[操作対象データに対応する通信状態データ中のパケット破棄数])/[状態監視処理の実行周期]を算出し、Cとして記憶するといったものである。
ステップS201の処理を終えた通信状態管理部13は、Cの値が、予め設定されている破棄数エラー閾値(例えば、10〔回/分〕)を超えているか否かを判断する(ステップS202)。
そして、通信状態管理部13は、Cの値が破棄数エラー閾値を超えていた場合(ステップS202;YES)には、パケット破棄数エラーの発生を示す障害通知メッセージをネットワーク監視装置20に対して送信する(ステップS203)。なお、このステップの処理や後述するステップS205の処理等で送信される障害通知メッセージ(本発明の異常現象発生通知メッセージに相当)は、図7に示してあるように、自側IPアドレスと,相手側IPアドレスと,自側ポート番号と,相手側ポート番号と、発生した障害(エラー/ワーニング)の内容を示す障害内容メッセージ番号(10010:パケット破棄数エラー、10011:パケット破棄数ワーニング、10020:TCP再送回数エラー、10021:TCP再送回数ワーニング)を含むものである。
一方、Cの値が破棄数エラー閾値以下であった場合(ステップS202;NO)、通信状態管理部13は、Cの値が、予め定められているパケット破棄数ワーニング閾値(例えば、5〔回/分〕)を超えているか否かを判断する(ステップS204)。
そして、通信状態管理部13は、Cの値が破棄数ワーニング閾値を超えていた場合(ステップS204;YES)には、パケット破棄数ワーニングの発生を示す障害通知メッセージ(障害内容メッセージ番号を10011とした障害通知メッセージ)をネットワーク監視装置20に対して送信する(ステップS205)。
ステップS203或いはS205の処理を行った通信状態管理部13,Cの値が破棄数ワーニング閾値以下であると判断(ステップS204;NO)した通信状態管理部13は、注目TCP通信に関する単位時間当たりのTCP再送回数増加量を算出し、算出結果をCとして記憶する(ステップS211)。すなわち、このステップS211において、通信状態管理部13は、([操作対象データ中のTCP再送回数]−[操作対象データに対応する通信状態データ中のTCP再送回数])/[状態監視処理の実行周期]を算出してCとして記憶する処理を行う。
その後、通信状態管理部13は、Cの値が,予め定められているTCP再送回数エラー閾値(例えば、2〔回/分〕)を超えているか否かを判断する(ステップS212)。そして、Cの値がTCP再送回数エラー閾値を超えていた場合(ステップS212;YES)、通信状態管理部13は、TCP再送回数エラーの発生を示す障害通知メッセージ(障害内容メッセージ番号を10020とした障害通知メッセージ)をネットワーク監視装置20に送信(ステップS213)してから、この状態判定処理を終了する。
また、Cの値がTCP再送回数エラー閾値以下であった場合(ステップS212;NO)、通信状態管理部13は、Cの値が,予め定められているTCP再送回数ワーニング閾値(例えば、1〔回/分〕)を超えているか否かを判断する(ステップS214)。そして、通信状態管理部13は、Cの値がTCP再送回数ワーニング閾値を超えていた場合(ステップS214;YES)には、TCP再送回数ワーニングの発生を示す障害通知メッセージ(障害内容メッセージ番号を10021とした障害通知メッセージ)をネットワーク監視装置20に対して送信(ステップS215)してから、この状態判定処理を終了する。また、Cの値がTCP再送回数ワーニング閾値以下であった場合(ステップS214;NO)、通信状態管理部13は、TCP再送回数に関する障害通知メッセージを送信することなく、この状態判定処理を終了する。
状態判定処理(図5:ステップS113)を終了した通信状態管理部13は、通信状態テーブル14上の対応通信状態データ中のTCP再送回数,パケット破棄数を、操作対象データ中のTCP再送回数,パケット破棄数に変更(ステップS114)してから、通信状態情報中に次データが存在しているか否かを判断する(ステップS116)。そして、通信状態管理部13は、次データが存在していた場合(ステップS116;YES)には、次データを操作対象データとして特定(ステップS117)した後に、ステップ112以降の処理を開始する。また、次データが存在していなかった場合(ステップS116;NO)、通信状態管理部13は、この状態監視処理を終了して、所定時間(状態監視処理の実行周期として定められている時間)が経過するのを待機する状態となる。
次に、ネットワーク監視装置20及び操作端末30の構成及び動作を、説明する。
図8に、ネットワーク監視装置20の機能ブロック図を示す。図示してあるように、ネットワーク監視装置20は、ネットワーク構成データ管理部21,TCP通信障害管理部22,障害情報管理部23,機器監視部24,通信制御部25を備えた装置として機能するコンピュータとなっている。
このネットワーク監視装置20が備える通信制御部25は、各種プロトコルによる通信を制御する(パケットの送受信を実際に行う)コンポーネントである。ネットワーク構成データ管理部21は、ネットワークシステムの構成に関する各種情報(ノード情報,ポート情報,リンク情報等)を管理するコンポーネントである。このネットワーク構成データ管理部21は、図9に示したような構成のノード情報テーブルによって、各ノード(被監視コンピュータ10、ルータ50)に関するノード情報(図9における1行分の情報)を管理するコンポーネントとなっている。
障害情報管理部23(図8)は、機器監視部24やTCP通信障害管理部22が通知してくる障害通知データ(詳細は後述)を管理する機能や、操作端末30からの各種要求に応答して、操作端末30のディスプレイ上に、図10に示したような障害情報一覧画面や図11に示したようなネットワーク構成図画面(TCP通信障害が発生している被監視コンピュータ10を示すアイコンの背景が赤色となっているネットワーク構成図画面)を表示する機能を有するコンポーネントである。
機器監視部24は、通信制御部25を利用することにより、ノード障害、ポート障害等の物理障害(一般的なネットワーク監視装置によって監視されている障害)の発生を監視するコンポーネントである。また、この機器監視部24は、或る物理障害が発生したことを検出した場合には、その物理障害の種類等を示す障害通知データを生成して障害情報管理部23に対して出力するコンポーネントとなっている。
TCP通信障害管理部22は、被監視コンピュータ10から送信されてきた障害通知メッセージ(通信制御部25によって受信された障害通知メッセージ)を処理するコンポーネントである。
このTCP通信障害管理部22は、障害通知メッセージが送信されてきた場合(障害通知メッセージが通信制御部25によって受信された場合)、図12に示した手順の処理を実行するコンポーネントとなっている。
すなわち、障害通知メッセージが送信されてきた場合、TCP通信障害管理部22は、まず、ネットワーク構成データ管理部21から、当該障害通知メッセージに含まれる自側IPアドレスの値とノード管理アドレスの値が一致しているノード情報(図9参照)を取得する(ステップS301)。次いで、TCP通信障害管理部22は、取得したノード情報中のノードID,障害通知メッセージ中の各種データ,障害通知メッセージの受信時刻から、図13に示したような内容の障害通知データを生成する(ステップS302)。すなわち、TCP通信障害管理部22は、障害発生時刻,障害種別,オブジェクトID,障害内容メッセージ番号,付加情報として、それぞれ、障害通知メッセージの受信時刻,“TCP通信障害”,取得したノード情報中のノードID,障害通知メッセージに含まれていた障害内容メッセージ番号,障害通知メッセージに含まれていたセッション識別データを設定した障害通知データを生成する。なお、上記した障害情報管理部23が生成する障害通知データは、図13に示してある障害通知データと同じフォーマットのデータとなっている。
障害通知データを生成したTCP通信障害管理部22は、当該障害通知データを障害情報管理部23に対して出力(ステップS303)してから、図12の処理を終了する。
そして、上記した障害情報管理部23は、操作端末30のディスプレイ上に障害情報一覧画面(図10)やネットワーク構成図画面(図11)を表示する処理を、図12の処理によって出力された障害通知データ(TCP通信障害管理部22からの障害通知データ)、機器監視部24からの障害通知データ、ネットワーク構成データ管理部21が管理している情報を用いて行うコンポーネントとなっている。
以上、説明したように、本発明の第1実施形態に係るネットワークシステムは、或る被監視コンピュータ50が行っているTCP通信に問題が生じた場合(当該TCP通信におけるパケットの破棄数や再送回数が予め定められている値(破棄数ワーニング閾値等)を上回った場合、操作端末30のディスプレイ上に、当該被監視コンピュータ50で問題が生じたことが分かる情報(図10、図11)が表示される状態で動作させることが可能なシステムとなっている。また、第1実施形態に係るネットワークシステムは、各ルータ50が正常に動作しているか否かを検出し、その検出結果を操作端末30のディスプレイ上に表示する機能(機器監視部24及び障害情報管理部25の機能)も有している。従って、このネットワークシステムを用いれば、被監視コンピュータ10にてアプリケーションレベルでの通信異常が発生した場合にも、その発生原因を簡単に特定できることになる。
《第2実施形態》
本発明の第2実施形態に係るネットワークシステムは、第1実施形態に係るネットワークシステム(図1)と基本的には同じ構成のシステムである。ただし、第2実施形態に係るネットワークシステムは、ネットワーク監視装置20の代わりに、図14に示した構成のネットワーク監視装置20bを用いたシステムとなっている。
すなわち、第2実施形態に係るネットワークシステムに用いられているネットワーク監視装置20bは、ネットワーク構成データ管理部21,TCP通信障害管理部22b,障害情報管理部23b,機器監視部24及び通信制御部25を、備えている。
このネットワーク監視装置20bが備えるネットワーク構成データ管理部21,機器監視部24,通信制御部25は、それぞれ、ネットワーク監視装置20が備える同名のコンポーネントと同じものである。
TCP通信障害管理部22bは、TCP通信障害管理部22と同様に、各被監視コンピュータ10から送信されてきた障害通知メッセージ(図7参照)を処理するコンポーネントである。
ただし、TCP通信障害管理部22bは、図15に示した構成の障害通知メッセージバッファを備えたコンポーネントであると共に、通信制御部25によって障害通知メッセージが受信された際に,図16に示した手順の処理を実行するコンポーネントとなっている。
すなわち、TCP通信障害管理部22bは、障害通知メッセージ(図7参照)と通知時刻(障害通知メッセージの受信時刻)とからなる情報(以下、障害通知メッセージ情報と表記する)を複数個記憶可能な障害通知メッセージバッファ(図15)を備えている。
そして、TCP通信障害管理部22bは、通信制御部25によって障害通知メッセージが受信された場合には、図16に示してあるように、まず、その障害通知メッセージ(以下、受信障害通知メッセージと表記する)中の自側IPアドレス,相手側IPアドレス,自側ポート番号,相手側ポート番号が,それぞれ、相手側IPアドレス,自側IPアドレス,相手側ポート番号,自側ポート番号となっている障害通知メッセージ情報を,障害通知メッセージバッファから検索する(ステップS401)。
そのような障害通知メッセージ情報の検索に失敗した場合(ステップS402;NO)、TCP通信障害管理部22bは、受信障害通知メッセージと通知時刻(現在時刻)とからなる障害通知メッセージ情報を障害通知メッセージバッファに追加する(ステップS403)。そして、TCP通信障害管理部22bは、この図16の処理を終了する。
一方、上記のような障害通知メッセージ情報の検索に成功した場合(ステップS402;YES)、TCP通信障害管理部22bは、受信障害通知メッセージに含まれる自側IPアドレスの値とノード管理アドレスの値が一致しているノード情報(図9参照)を、ネットワーク構成データ管理部21から取得する処理(ステップS404)と、障害通知メッセージバッファから検索した障害通知メッセージ情報に含まれる自側IPアドレスの値とノード管理アドレスの値が一致しているノード情報を、ネットワーク構成データ管理部21から取得する処理(ステップS405)とを行う。
次いで、TCP通信障害管理部22bは、ネットワーク構成データ管理部21から取得した2つのノード情報及び受信障害通知メッセージに基づき、図17に示したような構成の障害通知データを生成する(ステップS406)。すなわち、TCP通信障害管理部22bは、TCP通信障害管理部22が生成する障害通知データ(図13参照)と基本的な構成は等しく、付加情報が、集約フラグ(この場合、“1”),自側IPアドレス,相手側IPアドレス,自側ポート番号,相手側ポート番号,自側のノードID,相手側のノードIDを,この順で並べた情報となっている障害通知データを生成する。なお、集約フラグとは、障害通知データが、図16の処理により生成されたデータ(2つの障害通知メッセージを集約したデータ)であるか、後述する障害通知データ出力処理により生成されたデータ(1つの障害通知メッセージから生成されたデータ)であるかを、“1/0”で示す情報のことである。
そして、障害通知データを生成したTCP通信障害管理部22bは、その障害通知データを障害情報管理部23bに出力する処理(ステップS407)と、検索した障害通知メッセージ情報を障害通知メッセージバッファから削除する処理(ステップS408)とを行ってから、この図16の処理を終了する。
さらに、TCP通信障害管理部22bは、図18に示した手順の障害通知データ出力処理を周期的に実行するコンポーネントともなっている。
すなわち、TCP通信障害管理部22bは、所定時間(例えば、1分)が経過する度に、この障害通知データ出力処理を開始する。そして、障害通知データ出力処理を開始したTCP通信障害管理部22は、まず、障害通知メッセージバッファ(図15参照)上の先頭データ(障害通知メッセージバッファの先頭に記憶されている障害通知メッセージ情報)を操作対象データとして特定する(ステップS501)。次いで、TCP通信障害管理部22bは、操作対象データ中の通知時刻と現在時刻とから、障害通知メッセージ情報の元となった障害通知メッセージの受信時刻からの経過時間tを算出する(ステップS502)。
そして、TCP通信障害管理部22bは、算出したtの値が、予め定められている規定時間(例えば、1分)以下であるか否かを判断(ステップS503)し、tの値が規定時間以下であった場合(ステップS503;YES)には、障害通知メッセージバッファに次データが存在しているか否かを判断する(ステップS508)。
一方、tの値が規定時間を超えていた場合(ステップS503;NO)、TCP通信障害管理部22bは、操作対象データに含まれる自側IPアドレスの値とノード管理アドレスの値が一致しているノード情報(図9参照)を、ネットワーク構成データ管理部21から取得する(ステップS504)。次いで、TCP通信障害管理部22bは、ネットワーク構成データ管理部21から取得したノード情報及び操作対象データに基づき、付加情報中の集約フラグを“0”とした障害通知データ(図17参照)を生成する(ステップS505)。
その後、TCP通信障害管理部22bは、生成した障害通知データを障害情報管理部23bに出力する処理(ステップS506)と、操作対象データを障害通知メッセージバッファから削除する処理(ステップS507)とを行う。
そして、TCP通信障害管理部22bは、障害通知メッセージバッファに次データが存在しているか否かを判断(ステップS508)し、次データが存在していた場合(ステップS508;YES)には、当該次データを操作対象データとして特定(ステップS509)した後に、ステップS502以降の処理を開始する。また、障害通知メッセージバッファ上に次データが存在していなかった場合(ステップS508;NO)、TCP通信障害管理部22bは、この障害通知データ出力処理を終了して、所定時間(障害通知データ出力処理の実行周期として定められている時間)の経過及び障害通知メッセージの受信を待機する状態となる。
要するに、第2実施形態に係るネットワーク監視装置20bが備えるTCP通信障害管理部22bは、以下のように動作するコンポーネントとなっている。
例えば、障害通知メッセージバッファの内容が図19(A)に示したものとなっている状況下、図20に示した内容の障害通知メッセージが通信制御部25によって受信された場合を考える。なお、障害通知メッセージの受信時刻は、"10:54:10"であるものとする。
この場合、受信された障害通知メッセージと自側/相手側のIPアドレス/ポート番号が逆になっている障害通知メッセージ情報が障害通知メッセージバッファ内に記憶されていないので、TCP通信障害管理部22bは、ステップS403(図16)の処理を実行する。従って、障害通知メッセージバッファは、図19(B)に示した内容のものとなる。
そして、この状況下、図21に示した内容の障害通知メッセージが受信された場合には、当該障害通知メッセージと自側/相手側のIPアドレス/ポート番号が逆になっている障害通知メッセージ情報が障害通知メッセージバッファに記憶されているので、TCP通信障害管理部22bは、ステップS404〜S407の処理を実行する。従って、図18に示したような障害通知データが通信障害管理部22bに対して出力され、障害通知メッセージバッファの内容が、図19(C)に示したものに変更されることになる。
そして、TCP通信障害管理部22bは、障害通知データ出力処理(図18)を周期的に行うコンポーネントとなっている。このため、障害通知メッセージバッファの内容が図19(C)に示したものに変更された後、障害通知メッセージが受信されることなく或る程度の時間が経過した場合には、障害通知データ出力処理が実行されることによって、図19(C)に示されている障害通知メッセージ情報等に応じた内容の障害通知データが通信障害管理部22bに対して出力されることになる。また、障害通知メッセージバッファの内容は、図19(D)に示したものに変更されることになる。
そして、本実施形態に係るネットワーク監視装置20bが備える障害情報管理部23bは、TCP障害情報管理部22bからの上記構成の障害通知データに基づき、図22に示したような障害情報一覧画面を操作端末30のディスプレイ上に表示できるように、障害情報管理部23を改良したコンポーネントとなっている。
第2実施形態に係るネットワークシステムには、上記のように動作するネットワーク監視装置20bが用いられている。そして、第1実施形態に係るネットワークシステムでは、コンピュータAとコンピュータCとにTCP通信障害(パケット破棄数エラー)が発生した場合(第2実施形態に係るネットワークシステムにて図22に示した障害情報一覧画面が操作端末30のディスプレイ上に表示される状況相当の状況となった場合)、図23に示した障害情報一覧画面が表示されるのであるから、この第2実施形態に係るネットワークシステムを用いれば、第1実施形態に係るネットワークシステムを用いた場合よりも、システム内でどのようなTCP通信障害が発生しているかを簡単に把握できることになる。
《第3実施形態》
本発明の第3実施形態に係るネットワークシステムは、ネットワーク監視装置20の代わりに、図24に示した構成のネットワーク監視装置20cを用いたシステムである。
すなわち、第3実施形態に係るネットワークシステムに用いられているネットワーク監視装置20cは、ネットワーク構成データ管理部21,TCP通信障害管理部22c,障害情報管理部23c,機器監視部24及び通信制御部25を、備えている。
このネットワーク監視装置20cが備えるネットワーク構成データ管理部21,機器監視部24,通信制御部25は、それぞれ、ネットワーク監視装置20が備える同名のコンポーネントと同じものである。
TCP通信障害管理部22cは、TCP通信障害管理部22bと、受信された障害通知メッセージが集約可能なものであった場合に実行する処理(図16のステップS404〜S408の処理に相当する処理)の内容のみが異なっているコンポーネントである。
具体的には、TCP通信障害管理部22cは、受信された障害通知メッセージが集約可能なものであった場合、図25に示した手順の処理を実行するコンポーネントとなっている。
すなわち、受信された障害通知メッセージが集約可能なものであった場合、TCP通信障害管理部22cは、まず、受信障害通知メッセージに含まれる自側IPアドレスの値とノード管理アドレスの値が一致しているノード情報Nを、ネットワーク構成データ管理部21から取得する(ステップS601)。また、TCP通信障害管理部22cは、障害通知メッセージバッファから検索した障害通知メッセージ情報に含まれる自側IPアドレスの値とノード管理アドレスの値が一致しているノード情報N′も、ネットワーク構成データ管理部21から取得する(ステップS602)。
次いで、TCP通信障害管理部22cは、ノード情報N′中のTelnetユーザアカウント,パスワードを用いて、被監視コンピュータN′(ノード情報N′にて特定される被監視コンピュータ10)へログイン(ステップS603)した後、ICMPプロトコルのtracerouteを使用することにより、被監視コンピュータN′から被監視コンピュータN(ノード情報Nにて特定される被監視コンピュータ10)への通信経路上の各ルータ50のポートIPアドレスのリスト(以下、IPアドレスリストと表記する)を取得する(ステップS604)。
要するに、TCP通信障害管理部22cは、被監視コンピュータN′を遠隔操作することにより,図26に示したような内容のIPアドレスリストを取得するための処理を、ステップS603及びS604にて行う。
そして、IPアドレスリストを取得したTCP通信障害管理部22cは、図27に示した手順のリンクIDリスト生成処理をステップS605にて実行する。なお、以下の説明において、ポート情報とは、ネットワーク構成データ管理部21が、図28に示したような構成のポート情報テーブルによって管理している情報(ポートID、IPアドレス等からなる情報)のことである。また、リンク情報とは、ネットワーク構成データ管理部21が、図29に示したような構成のリンク情報テーブルによって管理している情報(リンクID、ポートID1,ポートID2等からなる情報)のことである。
すなわち、リンクIDリスト生成処理(図27)を開始したTCP通信障害管理部22cは、まず、IPアドレスリストの先頭のIPアドレスを操作対象アドレスとして特定する(ステップS701)。次いで、TCP通信障害管理部22cは、ネットワーク構成データ管理部21から、操作対象IPアドレスと一致するIPアドレスを含むポート情報を取得する処理(ステップS702)と、取得したポート情報に含まれるポートIDと、ポートID1或いはポートID2が一致しているリンク情報をネットワーク構成データ管理部21から取得する処理(ステップS703)とを、行う。
リンク情報を取得したTCP通信障害管理部22cは、当該リンク情報中のリンクIDをリンクIDリストに追加(ステップS704)した後、IPアドレスリストに次IPアドレス(未処理のIPアドレス)が存在しているか否かを判断する(ステップS705)。IPアドレスリストに次IPアドレス(未処理のIPアドレス)が存在していた場合(ステップS705;YES)、TCP通信障害管理部22cは、IPアドレスリスト中の次IPアドレスを操作対象IPアドレスとして特定(ステップS706)してから、ステップS702以降の処理を開始する。
そして、TCP通信障害管理部22cは、IPアドレスリスト中の全IPアドレスに対する処理が完了したとき(ステップS705;NO)に、このリンクIDリスト生成処理を終了する。
リンクIDリスト生成処理を終了したTCP通信障害管理部22cは、取得済みの2つのノード情報N,N′等から障害通知データを生成する処理(ステップS706)を行う。このステップで行われる処理は、ステップS406(図16)で行われるものと同じものである。
そして、障害通知データを生成したTCP通信障害管理部22cは、その障害通知データ、及び、リンクIDリスト生成処理で生成したリンクIDリストを、障害情報管理部23cに対して出力する処理(ステップS707)と、検索した障害通知メッセージ情報を障害通知メッセージバッファから削除する処理(ステップS708)とを行ってから、この図の処理を終了する。
要するに、TCP通信障害管理部22cは、TCP通信を行っていた2台の被監視コンピュータ10のそれぞれから、障害通知メッセージが送信されてきた場合、障害通知データと共に、そのTCP通信に用いられている経路を示す情報(リンクIDリスト)を、障害情報管理部23cに供給するコンポーネントとなっている。
そして、障害情報管理部23cは、TCP障害情報管理部22cからの障害通知データ,リンクIDリスト等に基づき、図30に示したような障害情報一覧画面、すなわち、TCP通信障害が発生している2台の被監視コンピュータ10(図では、コンピュータAとコンピュータC)間の通信に用いられているリンクが特殊な形(本実施形態では、色と太さが異なる形)で示される障害情報一覧画面を、操作端末30のディスプレイ上に表示させることができるように、障害情報管理部22bを改良したコンポーネントとなっている。
第3実施形態に係るネットワークシステムは、上記のように動作するネットワーク監視装置20bが用いられたものとなっている。従って、このネットワークシステムは、システム内で発生した各種異常の原因究明がより容易に行えるシステムとして機能することになる。
《第4実施形態》
本発明の第4実施形態に係るネットワークシステムは、ネットワーク監視装置20の代わりに、図31に示した構成のネットワーク監視装置20dを用いたシステムである。
すなわち、第4実施形態に係るネットワークシステムに用いられているネットワーク監視装置20dは、ネットワーク構成データ管理部21,TCP通信障害管理部22d,障害情報管理部23c,機器監視部24,通信制御部25及び性能監視部26を、備えている。
このネットワーク監視装置20dが備えるネットワーク構成データ管理部21,障害情報管理部23c,機器監視部24,通信制御部25は、それぞれ、ネットワーク監視装置20c(図24)が備える同名のコンポーネントと同じものである。
性能監視部26は、監視対象として指定されている各オブジェクト(ノード/ポート)の性能情報(機器のCPU使用率、ポートのトラフック情報〔パケットの送受信レート、廃棄パケットレート,コリジョンレート等〕)を収集・管理する機能や、操作端末30からの各種要求に応答して、操作端末30のディスプレイ上に、収集・管理している情報を表示する機能を有するコンポーネントである。また、性能監視部26は、操作端末30のディスプレイ上に、監視対象とするオブジェクトをオペレータに指定させるための性能監視対象設定画面を表示する機能も有するコンポーネントとなっている。なお、詳細説明は省略するが、この機能により表示される性能監視対象設定画面は,図32に例示したように、監視対象とすることが指定されているオブジェクト(情報収集対象オブジェクト)のアイコンが、通常とは異なる表示形態で表示されるものとなっている。
TCP通信障害管理部22dは、リンクIDリスト生成処理(図25:ステップS605,図27)の代わりに、図33に示した手順のリンクIDリスト生成・性能情報収集対象指定処理を実行するように、TCP通信障害管理部22cを改良したコンポーネントである。
すなわち、TCP通信障害管理部22dは、通信制御部25によって受信された障害通知メッセージが集約可能なものであった場合に、このリンクIDリスト生成・性能情報収集対象指定処理を開始する。そして、リンクIDリスト生成・性能情報収集対象指定処理を開始したTCP通信障害管理部22dは、まず、IPアドレスリストの先頭のIPアドレスを操作対象アドレスとして特定する(ステップS801)。次いで、TCP通信障害管理部22dは、ネットワーク構成データ管理部21から、操作対象IPアドレスと一致するIPアドレスを含むポート情報を取得する処理(ステップS802)と、取得したポート情報中のノードIDで識別されるノードを性能情報の収集対象とすることを,性能監視部26に対して指示する処理(ステップS803)とを行う。
さらに、TCP通信障害管理部22dは、取得したポート情報に含まれるポートIDと、ポートID1或いはポートID2が一致しているリンク情報(図19参照)をネットワーク構成データ管理部21から取得する処理(ステップS804)と、取得したリンク情報中のリンクIDで識別されるリンクを性能情報の収集対象とすることを性能監視部26に指示する処理(ステップS805)とを行う。
このような処理を行ったTCP通信障害管理部22dは、取得したリンク情報中のリンクIDをリンクIDリストに追加(ステップS806)してから、IPアドレスリストに次IPアドレス(未処理のIPアドレス)が存在しているか否かを判断する(ステップS807)。
そして、TCP通信障害管理部22dは、IPアドレスリストに次IPアドレス(未処理のIPアドレス)が存在していた場合(ステップS807;YES)、IPアドレスリスト中の次IPアドレスを操作対象IPアドレスとして特定(ステップS808)してから、ステップS802以降の処理を開始し、次IPアドレスが存在していなかった場合(ステップS807;NO)には、このリンクIDリスト生成・性能情報収集対象指定処理を終了する。
以上の説明から明らかなように、この第4実施形態に係るネットワークシステムは、或る2台の被監視コンピュータ10からネットワーク監視装置20に対して集約可能な障害通知メッセージが送信された場合、それら2台の被監視コンピュータ10のTCP通信に使用されている各種オブジェクト(ポート,リンク)が、自動的に、性能監視部26による性能情報の監視対象とされるシステムとなっている。従って、このネットワークシステムは、詳細なネットワークの状況解析が、簡単に(性能監視部26に監視させるオブジェクトを指定する作業を行う必要がない形で)、行えるシステムとなっていると言うことが出来る。
《変形形態》
上記した各実施形態のネットワークシステムは、各種の変形を行うことが出来る。例えば、各ネットワークシステムに含まれるネットワーク監視装置20,20b,20c或いは20d、及び、操作端末30の代わりに、それらの装置として機能する1台の装置/コンピュータを用いることも出来る。また、ネットワーク監視装置20,20b,20c或いは20dを、障害通知データを処理するコンピュータと、通常の物理障害を検出するコンピュータとからなる装置としておくことも出来る。
(付記1) 複数台の被監視コンピュータと、TCP通信を中継するための複数台のネットワーク機器とを含むネットワークシステム内のコンピュータ上で実行されるネットワーク監視プログラムであって、
コンピュータを、
前記複数台のネットワーク機器のそれぞれが正常に動作しているか否かを検出するための動作状態検出機能,
前記動作状態検出機能による検出結果をディスプレイ上に表示する検出結果表示機能、
実行中のTCP通信における異常現象の出現頻度が規定値よりも大きくなった場合に,各被監視コンピュータが送信する異常現象発生通知メッセージを受信し、管理する異常現象発生通知メッセージ管理機能,及び,
前記異常現象発生通知メッセージ管理機能によって管理されている異常現象発生通知メッセージ毎に、少なくとも当該異常現象発生通知メッセージの送信元がいずれの被監視コンピュータであるかを示す情報が含まれる発生異常現象提示情報をディスプレイ上に表示する発生異常現象提示情報表示機能
を有する装置として動作させることを特徴とするネットワーク監視プログラム。
(付記2) 前記異常現象発生通知メッセージ管理機能が、
TCP通信による情報の授受を行っている2台の被監視コンピュータのそれぞれから所定時間内に前記異常現象発生通知メッセージが送信されてきた場合に、それら2つの異常現象発生通知メッセージを集約した異常現象発生通知メッセージを生成して管理する機能である
ことを特徴とする付記1記載のネットワーク監視プログラム。
(付記3) 前記コンピュータを、
前記異常現象発生通知メッセージ管理機能によって集約された2つの異常現象発生通知メッセージを送信した2台の被監視コンピュータ間のTCP通信に利用されている各ネットワーク機器を特定し、特定結果をディスプレイ上に表示する経路情報表示機能を、さらに、有する装置として動作させる
ことを特徴とする付記2記載のネットワーク監視プログラム。
(付記4) 前記コンピュータを、
動作状態の検出対象として指定された各ネットワーク機器の,前記動作状態検出機能よりも詳細な動作状態を検出すること、及び、各ネットワーク機器の動作状態の検出結果をディスプレイ上に表示することが可能な第2動作状態検出機能を、さらに有し、
前記経路情報表示機能が、
前記2台の被監視コンピュータ間のTCP通信に利用されているものとして特定した各ネットワーク機器を、前記第2動作状態検出機能による動作状態の検出対象として指定する機能である
装置として動作させる
ことを特徴とする付記3記載のネットワーク監視プログラム。
(付記5) 複数台の被監視コンピュータと、ネットワーク監視装置と、TCP通信を中継するための複数台のネットワーク機器とを含むネットワークシステムであって、
前記複数台の被監視コンピュータのそれぞれが、
他の被監視コンピュータとTCP通信を行うための通信機能,及び,
前記通信機能によって行われている各TCP通信における異常現象の出現頻度を監視し、異常現象の出現頻度が規定値よりも大きくなった場合に、前記ネットワーク監視装置に対して、異常現象が発生した旨を示す異常現象発生通知メッセージを送信する異常現象発生通知メッセージ送信機能
を有し、
前記ネットワーク監視装置が、
前記複数台のネットワーク機器のそれぞれが正常に動作しているか否かを検出するための動作状態検出機能,
前記動作状態検出機能による検出結果をディスプレイ上に表示する検出結果表示機能、
送信されてきた前記異常現象発生通知メッセージを管理する異常現象発生通知メッセージ管理機能,及び,
前記異常現象発生通知メッセージ管理機能によって管理されている異常現象発生通知メッセージ毎に、少なくとも当該異常現象発生通知メッセージの送信元がいずれの被監視コンピュータであるかを示す情報が含まれる発生異常現象提示情報をディスプレイ上に表示する発生異常現象提示情報表示機能
を有する
ことを特徴とするネットワークシステム。
(付記6) 前記ネットワーク監視装置の異常現象発生通知メッセージ管理機能が、
TCP通信による情報の授受を行っている2台の被監視コンピュータのそれぞれから所定時間内に前記異常現象発生通知メッセージが送信されてきた場合に、それら2つの異常現象発生通知メッセージを集約した異常現象発生通知メッセージを生成して管理する機能である
ことを特徴とする付記5記載のネットワークシステム。
(付記7) 前記ネットワーク監視装置が、
前記異常現象発生通知メッセージ管理機能によって集約された2つの異常現象発生通知メッセージを送信した2台の被監視コンピュータ間のTCP通信に利用されている各ネットワーク機器を特定し、特定結果をディスプレイ上に表示する経路情報表示機能を、さらに、有する
ことを特徴とする付記6記載のネットワークシステム。
(付記8) 前記ネットワーク監視装置が、
動作状態の検出対象として指定された各ネットワーク機器の,前記動作状態検出機能よりも詳細な動作状態を検出すること、及び、各ネットワーク機器の動作状態の検出結果をディスプレイ上に表示することが可能な第2動作状態検出機能を、さらに有し、
前記ネットワーク監視装置の前記経路情報表示機能が、
前記2台の被監視コンピュータ間のTCP通信に利用されているものとして特定した各ネットワーク機器を、前記第2動作状態検出機能による動作状態の検出対象として指定する機能である
ことを特徴とする付記7記載のネットワークシステム。
(付記9) 前記ディスプレイが、
前記ネットワーク監視装置とは異なるコンピュータと接続されたディスプレイである
ことを特徴とする付記5乃至付記8のいずれかに記載のネットワークシステム。
本発明の第1実施形態に係るネットワークシステムの全体構成図。 第1実施形態に係るネットワークシステムを構成している被監視コンピュータの機能ブロック図。 被監視コンピュータが備える通信状態テーブルの説明図。 被監視コンピュータ内のTCP通信障害管理部が備える監視対象指定情報テーブルの説明図。 被監視コンピュータにて実行される状態監視処理の流れ図。 状態監視処理中で実行される状態判定処理の流れ図。 被監視コンピュータ内のTCP通信障害管理部が出力する障害通知メッセージの説明図。 第1実施形態に係るネットワークシステムを構成しているネットワーク監視装置の機能ブロック図。 ノード情報テーブルの説明図。 操作端末のディスプレイ上に表示される障害情報一覧画面の説明図。 操作端末のディスプレイ上に表示されるネットワーク構成図画面の説明図。 TCP通信障害管理部が、障害通知メッセージが送信されてきた場合に実行する処理の流れ図。 TCP通信障害管理部が出力する障害通知データの説明図。 第2実施形態に係るネットワークシステムを構成しているネットワーク監視装置の機能ブロック図。 ネットワーク監視装置内のTCP通信障害管理部が備える障害通知メッセージバッファの説明図。 障害通知メッセージ受信時におけるTCP通信障害管理部の動作手順を示した流れ図。 TCP通信障害管理部が出力する障害通知データの説明図。 TCP通信障害管理部が周期的に実行する障害通知データ出力処理の流れ図。 TCP通信障害管理部の動作を説明するための図。 TCP通信障害管理部の動作を説明するための図。 TCP通信障害管理部の動作を説明するための図。 第2実施形態に係るネットワークシステム内の操作端末のディスプレイ上に表示される障害情報一覧画面の説明図。 第1実施形態に係るネットワークシステム内の操作端末のディスプレイ上に表示される、図22に相当する内容の障害情報一覧画面の説明図。 第3実施形態に係るネットワークシステムを構成しているネットワーク監視装置の機能ブロック図。 第3実施形態に係るネットワーク監視装置内のTCP通信障害管理部の動作手順を示した流れ図。 図25の処理によって生成されるIPアドレスリストの説明図。 図25の処理中で実行されるリンクIDリスト生成処理の流れ図。 ポート情報テーブルの説明図。 リンク情報テーブルの説明図。 第3実施形態に係るネットワークシステム内の操作端末のディスプレイ上に表示されるネットワーク構成図画面の説明図。 第4実施形態に係るネットワークシステムを構成しているネットワーク監視装置の機能ブロック図。 第4実施形態に係るネットワークシステム内の操作端末のディスプレイ上に表示される性能監視対象設定画面の説明図。 第4実施形態に係るネットワーク監視装置にて実行されるリンクIDリスト生成・性能情報収集対象指定処理の流れ図。
符号の説明
10 被監視コンピュータ
20,20b,20c,20d ネットワーク監視装置
30 操作端末
50 ルータ

Claims (3)

  1. 複数台の被監視コンピュータと、TCP通信を中継するための複数台のネットワーク機器とを含むネットワークシステム内のコンピュータ上で実行されるネットワーク監視プログラムであって、
    コンピュータを、
    前記複数台のネットワーク機器のそれぞれが正常に動作しているか否かを検出するための動作状態検出機能,
    前記動作状態検出機能による検出結果をディスプレイ上に表示する検出結果表示機能、
    実行中のTCP通信における異常現象の出現頻度が規定値よりも大きくなった場合に,各被監視コンピュータが送信する異常現象発生通知メッセージを受信し、管理する異常現象発生通知メッセージ管理機能であって、TCP通信による情報の授受を行っている2台の被監視コンピュータのそれぞれから所定時間内に前記異常現象発生通知メッセージが送信されてきた場合に、それら2つの異常現象発生通知メッセージを集約した異常現象発生通知メッセージを生成して管理する異常現象発生通知メッセージ管理機能、
    前記異常現象発生通知メッセージ管理機能によって管理されている異常現象発生通知メッセージ毎に、少なくとも当該異常現象発生通知メッセージの送信元がいずれの被監視コンピュータであるかを示す情報が含まれる発生異常現象提示情報をディスプレイ上に表示する発生異常現象提示情報表示機能、及び、
    前記異常現象発生通知メッセージ管理機能によって集約された2つの異常現象発生通知メッセージを送信した2台の被監視コンピュータ間のTCP通信に利用されている各ネットワーク機器を特定し、特定結果をディスプレイ上に表示する経路情報表示機能
    を有する装置として動作させることを特徴とするネットワーク監視プログラム。
  2. 前記コンピュータを、
    動作状態の検出対象として指定された各ネットワーク機器の,前記動作状態検出機能よりも詳細な動作状態を検出すること、及び、各ネットワーク機器の動作状態の検出結果をディスプレイ上に表示することが可能な第2動作状態検出機能を、さらに有し、
    前記経路情報表示機能が、
    前記2台の被監視コンピュータ間のTCP通信に利用されているものとして特定した各
    ネットワーク機器を、前記第2動作状態検出機能による動作状態の検出対象として指定する機能である
    装置として動作させる
    ことを特徴とする請求項1記載のネットワーク監視プログラム。
  3. 複数台の被監視コンピュータと、ネットワーク監視装置と、TCP通信を中継するための複数台のネットワーク機器とを含むネットワークシステムであって、
    前記複数台の被監視コンピュータのそれぞれが、
    他の被監視コンピュータとTCP通信を行うための通信機能,及び,
    前記通信機能によって行われている各TCP通信における異常現象の出現頻度を監視し、異常現象の出現頻度が規定値よりも大きくなった場合に、前記ネットワーク監視装置に対して、異常現象が発生した旨を示す異常現象発生通知メッセージを送信する異常現象発生通知メッセージ送信機能
    を有し、
    前記ネットワーク監視装置が、
    前記複数台のネットワーク機器のそれぞれが正常に動作しているか否かを検出するための動作状態検出機能,
    前記動作状態検出機能による検出結果をディスプレイ上に表示する検出結果表示機能、
    送信されてきた前記異常現象発生通知メッセージを管理する異常現象発生通知メッセージ管理機能であって TCP通信による情報の授受を行っている2台の被監視コンピュータのそれぞれから所定時間内に前記異常現象発生通知メッセージが送信されてきた場合に、それら2つの異常現象発生通知メッセージを集約した異常現象発生通知メッセージを生成して管理する異常現象発生通知メッセージ管理機能,
    前記異常現象発生通知メッセージ管理機能によって管理されている異常現象発生通知メッセージ毎に、少なくとも当該異常現象発生通知メッセージの送信元がいずれの被監視コンピュータであるかを示す情報が含まれる発生異常現象提示情報をディスプレイ上に表示する発生異常現象提示情報表示機能、及び、
    前記異常現象発生通知メッセージ管理機能によって集約された2つの異常現象発生通知メッセージを送信した2台の被監視コンピュータ間のTCP通信に利用されている各ネットワーク機器を特定し、特定結果をディスプレイ上に表示する経路情報表示機能
    を有する
    ことを特徴とするネットワークシステム。
JP2005019146A 2005-01-27 2005-01-27 ネットワーク監視プログラム及びネットワークシステム Expired - Fee Related JP4616020B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005019146A JP4616020B2 (ja) 2005-01-27 2005-01-27 ネットワーク監視プログラム及びネットワークシステム
US11/117,776 US7623465B2 (en) 2005-01-27 2005-04-29 Network monitoring program, network system and network monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005019146A JP4616020B2 (ja) 2005-01-27 2005-01-27 ネットワーク監視プログラム及びネットワークシステム

Publications (2)

Publication Number Publication Date
JP2006211173A JP2006211173A (ja) 2006-08-10
JP4616020B2 true JP4616020B2 (ja) 2011-01-19

Family

ID=36696643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005019146A Expired - Fee Related JP4616020B2 (ja) 2005-01-27 2005-01-27 ネットワーク監視プログラム及びネットワークシステム

Country Status (2)

Country Link
US (1) US7623465B2 (ja)
JP (1) JP4616020B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005055148B4 (de) * 2005-11-18 2008-04-10 Siemens Ag Verfahren, Detektionseinrichtung und Servereinrichtung zur Auswertung einer eingehenden Kommunikation an einer Kommunikationseinrichtung
US7843842B2 (en) * 2006-08-04 2010-11-30 Cisco Technology, Inc. Method and system for initiating a remote trace route
JP4769970B2 (ja) * 2007-10-03 2011-09-07 Necフィールディング株式会社 メールサーバ網、サーバ装置、メールシステム及びそれらに用いる障害箇所調査方法
JP5158600B2 (ja) * 2008-10-15 2013-03-06 国立大学法人名古屋大学 通信装置、通信システム及び通信方法
JP5195294B2 (ja) * 2008-10-30 2013-05-08 富士通株式会社 ネットワークシステム、ネットワーク監視装置、統合監視装置及び方法並びに異常検出処理方法
JP5361750B2 (ja) * 2009-02-06 2013-12-04 株式会社東芝 医用情報通信接続管理装置及び医用情報通信接続管理方法
US9614767B2 (en) * 2011-12-02 2017-04-04 Autonetworks Technologies, Ltd. Transmission message generating device and vehicle-mounted communication system
JP5943047B2 (ja) 2014-09-10 2016-06-29 日本電気株式会社 表示装置、表示方法、及び、表示プログラム
JP7287157B2 (ja) * 2019-07-12 2023-06-06 日本電気株式会社 通信装置、障害通知システム、障害通知方法および障害通知プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002094507A (ja) * 2000-09-12 2002-03-29 Kddi Research & Development Laboratories Inc インターネットの障害推定方法
JP2002271328A (ja) * 2001-03-09 2002-09-20 Mitsubishi Electric Corp ネットワーク障害解析装置およびネットワーク障害解析方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6046988A (en) * 1995-11-16 2000-04-04 Loran Network Systems Llc Method of determining the topology of a network of objects
GB9930618D0 (en) * 1999-12-24 2000-02-16 Agilent Technologies Inc Measuring efficiency of data transmission
AU2001233127A1 (en) 2000-02-24 2001-09-03 Numerex Investment Corporation Non-invasive remote monitoring and reporting of digital communications systems
US6990616B1 (en) * 2000-04-24 2006-01-24 Attune Networks Ltd. Analysis of network performance
US20020095498A1 (en) * 2000-06-05 2002-07-18 Accordion Networks Network architecture for multi-client units
US6909693B1 (en) * 2000-08-21 2005-06-21 Nortel Networks Limited Performance evaluation and traffic engineering in IP networks
US7600014B2 (en) * 2000-11-16 2009-10-06 Symantec Corporation Method and system for monitoring the performance of a distributed application
US7760737B2 (en) * 2000-11-30 2010-07-20 Audiocodes, Inc. Method for reordering and reassembling data packets in a network
JP2002319941A (ja) 2001-04-23 2002-10-31 Hitachi Ltd ネットワーク障害判定方法及びその装置
US7197559B2 (en) * 2001-05-09 2007-03-27 Mercury Interactive Corporation Transaction breakdown feature to facilitate analysis of end user performance of a server system
US7065482B2 (en) * 2001-05-17 2006-06-20 International Business Machines Corporation Internet traffic analysis tool
US20050102382A1 (en) * 2001-06-04 2005-05-12 Macgregor Glenn System and method for network management using instant messaging
US20040015579A1 (en) * 2001-06-14 2004-01-22 Geoffrey Cooper Method and apparatus for enterprise management
US20030115319A1 (en) * 2001-12-17 2003-06-19 Dawson Jeffrey L. Network paths
US7085236B2 (en) * 2002-05-20 2006-08-01 University Of Massachusetts, Amherst Active queue management for differentiated services
JP2004086522A (ja) 2002-08-27 2004-03-18 Fujitsu Access Ltd 通信ネットワーク監視システム
US7996544B2 (en) * 2003-07-08 2011-08-09 International Business Machines Corporation Technique of detecting denial of service attacks
US7551922B2 (en) * 2004-07-08 2009-06-23 Carrier Iq, Inc. Rule based data collection and management in a wireless communications network
US20060168274A1 (en) * 2004-11-08 2006-07-27 Eliezer Aloni Method and system for high availability when utilizing a multi-stream tunneled marker-based protocol data unit aligned protocol

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002094507A (ja) * 2000-09-12 2002-03-29 Kddi Research & Development Laboratories Inc インターネットの障害推定方法
JP2002271328A (ja) * 2001-03-09 2002-09-20 Mitsubishi Electric Corp ネットワーク障害解析装置およびネットワーク障害解析方法

Also Published As

Publication number Publication date
JP2006211173A (ja) 2006-08-10
US7623465B2 (en) 2009-11-24
US20060164999A1 (en) 2006-07-27

Similar Documents

Publication Publication Date Title
JP4616020B2 (ja) ネットワーク監視プログラム及びネットワークシステム
EP2486706B1 (en) Network path discovery and analysis
CN104796298B (zh) 一种sdn网络故障分析的方法及装置
EP3241311A1 (en) Systems and methods for mapping and visualizing wireless mesh network
JP4988674B2 (ja) ネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラム
EP2933954A1 (en) Network anomaly notification method and apparatus
JP2006352259A (ja) ネットワーク障害検出装置及びネットワーク障害検出方法
US10728260B2 (en) Slow protocol packet processing method and related apparatus
JP2010198491A (ja) 仮想メシンサーバおよびこれを用いた仮想マシンネットワーク監視システム
CN110932921B (zh) 一种路由震荡信息确定方法及其相关设备
JP5501278B2 (ja) フィルタリング装置、フィルタリング方法、フィルタリングプログラム
WO2012070274A1 (ja) 通信システムおよびネットワーク障害検出方法
CN103001832B (zh) 分布式文件系统中节点的检测方法和装置
KR101829881B1 (ko) 플로우 관제 시스템, 컨트롤러 및 장애 검출 방법
CN107623607B (zh) Bfd会话连接建立方法及装置
KR101207219B1 (ko) 데이터 분산 서비스 네트워크 과부하 방지 방법
JP6476853B2 (ja) ネットワーク監視システム及び方法
US20120039184A1 (en) Network system, layer 2 switch, and method of detecting occurrence of a fault in a network
JP6269004B2 (ja) 監視支援プログラム、監視支援方法および監視支援装置
JP4437416B2 (ja) ネットワーク保守システム
CN106603334B (zh) 一种ip地址监测方法及装置
CN105591837B (zh) 一种链路监控方法和装置
US11637739B2 (en) Direct memory access (DMA) engine for diagnostic data
KR102362077B1 (ko) 트래픽 누수 자동 탐지 방법 및 그 장치
TWI255617B (en) Network status monitoring and alarming method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071114

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071116

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100310

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100825

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100928

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101021

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees