JP2017069897A - ネットワーク監視装置、ネットワーク監視システムおよびネットワーク監視方法 - Google Patents

ネットワーク監視装置、ネットワーク監視システムおよびネットワーク監視方法 Download PDF

Info

Publication number
JP2017069897A
JP2017069897A JP2015196603A JP2015196603A JP2017069897A JP 2017069897 A JP2017069897 A JP 2017069897A JP 2015196603 A JP2015196603 A JP 2015196603A JP 2015196603 A JP2015196603 A JP 2015196603A JP 2017069897 A JP2017069897 A JP 2017069897A
Authority
JP
Japan
Prior art keywords
port
node
alarm
unit
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015196603A
Other languages
English (en)
Inventor
毅 石田
Takeshi Ishida
毅 石田
小川 浩二
Koji Ogawa
浩二 小川
興通 孫
Xingtong Sun
興通 孫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015196603A priority Critical patent/JP2017069897A/ja
Publication of JP2017069897A publication Critical patent/JP2017069897A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】受信ポートを開放する適切な時期を判定することができるネットワーク監視装置を提供する。【解決手段】本ネットワーク監視装置は、受信ポートと、閉塞部と、監視部と、開放部とを備える。受信ポートは、ネットワーク上のノードに対応付けられ、ノードからのメッセージを受信する。閉塞部は、単位時間当たりの受信メッセージ数が第1の閾値以上の場合、対応する受信ポートをメッセージを受信しない閉塞状態にする。監視部は、ノードにおけるメッセージの単位時間当たりの発生数を受信ポートとは異なるポートである監視ポートを介して受信する。開放部は、監視部によって受信された単位時間当たりの発生数が第2の閾値未満である場合、受信ポートを、メッセージを受信する開放状態にする。【選択図】図1B

Description

本発明は、ネットワーク監視装置、ネットワーク監視システムおよびネットワーク監視方法に関する。
ネットワークの運用状況を監視するネットワーク監視システムが利用されている。ネットワーク監視システムでは、ネットワークの運用状況を監視するネットワーク監視装置が、ネットワークに接続される各ノードから当該ノードの運用状況報告や障害報告を含む各種メッセージを受信する。ネットワーク監視装置は、ノード毎に用意される受信ポートによってノードからのメッセージを受信する。受信ポートは、例えば、Transmission Control Protocol(TCP)/Internet Protocol(IP)のトランスポート層における論理的なポートとして用意される。
特開2011−146989号公報 特開2002−57666号公報
大量のメッセージ受信によりネットワーク監視装置の負荷が過大になる場合、ネットワーク監視装置はメッセージを受信する受信ポートを閉塞する。受信ポートが閉塞されることで、ネットワーク監視装置の負荷が低減される。また、閉塞した受信ポートは、ネットワーク監視装置の負荷が再び高い状態に遷移しないように、ノードにおけるメッセージ発生数が減少してから開放されることが好ましい。
しかしながら、受信ポートを閉塞したネットワーク監視装置は、ノードにおいて発生するメッセージ発生数の増減を検知できない。そのため、ネットワーク監視装置は、閉塞した受信ポートを開放する適切なタイミングを判定できない。その結果として、ネットワーク監視装置は、ノードにおいて多数のメッセージが発生している状態で受信ポートを開放する可能性がある。このような場合、ネットワーク監視装置の負荷が再び高い状態に遷移する虞がある。
そこで、開示の技術の1つの側面は、閉塞した受信ポートを適切な時期に開放できるネットワーク監視装置を提供することを課題とする。
開示の技術の1つの側面は、次のようなネットワーク監視装置によって例示される。本ネットワーク監視装置は、受信ポートと、閉塞部と、監視部と、開放部とを備える。受信ポートは、ネットワーク上のノードに対応付けられ、ノードからのメッセージを受信する。閉塞部は、単位時間当たりの受信メッセージ数が第1の閾値以上の場合、対応する受信ポートを、メッセージを受信しない閉塞状態にする。監視部は、ノードにおけるメッセージの単位時間当たりの発生数を、受信ポートとは異なるポートである監視ポートを介して受信する。開放部は、監視部によって受信された単位時間当たりの発生数が第2の閾値未満である場合、受信ポートを、メッセージを受信する開放状態にする。
本ネットワーク監視装置は、閉塞した受信ポートを適切な時期に開放できる。
図1Aは、警報監視サーバを有するネットワークの一例を示す図である。 図1Bは、警報監視システムの処理の概略を示す図の一例である。 図2は、情報処理装置のハードウェア構成の一例を示す図である。 図3は、警報監視サーバの論理ポートの一例を示す図である。 図4は、警報監視サーバの処理ブロックの一例を示す図である。 図5は、ポート開放中警報数管理テーブルの一例を示す図である。 図6は、ポート閉塞中警報数管理テーブルの一例を示す図である。 図7は、ポート閉塞優先順番表の一例を示す図である。 図8は、ポート開放優先順番表の一例を示す図である。 図9は、ポート状況管理表の一例を示す図である。 図10は、警報履歴バッファ管理表の一例を示す図である。 図11は、ノードの論理ポートの一例を示す図である。 図12は、ノードの処理ブロックの一例を示す図である。 図13は、警報監視システムの処理の流れの一例を示す図である。 図14は、図13のT110からT112における処理のシーケンス図の一例である。 図15は、実施例における警報履歴バッファ管理表の一例を示す図である。 図16は、警報監視システムが運用開始された時点でのポート状況管理表の一例を示す図である。 図17は、直近10秒間で警報を受信していない場合のポート開放中警報数管理テーブルの一例を示す図である。 図18は、特定のノードから大量の警報を受信した場合のポート開放中警報数管理テーブルの一例を示す図である。 図19は、閉塞対象として決定された受信ポートの状況を「閉塞予定」としたポート状況管理表の一例を示す図である。 図20は、「閉塞予定」とされた受信ポートを閉塞した場合のポート状況管理表の一例を示す図である。 図21は、更新されたポート閉塞中警報数管理テーブルの一例を示す図である。 図22は、更新されたポート開放中警報数管理テーブルの一例を示す図である。 図23は、開放対象として決定された受信ポートの状況を「開放予定」としたポート状況管理表の一例を示す図である。 図24は、「開放予定」とされた受信ポートを開放した場合のポート状況管理表の一例を示す図である。
以下、図面を参照して、一実施形態に係る警報監視システムについて説明する。以下に示す実施形態の構成は例示であり、開示の技術は実施形態の構成に限定されない。
≪第1実施形態≫
図1Aは、警報監視システム1の一例を示す図である。警報監視システム1は、警報監視サーバ200およびノード300を含む。警報監視システム1では、警報監視サーバ200と複数のノード300とが相互にコンピュータネットワークによって接続されている。
警報監視サーバ200は、コンピュータネットワークに接続された各ノード300から当該ノード300で発生した障害等を伝える警報を受信する情報処理装置である。警報監視サーバ200は、ノード300および警報の重要度毎に用意された論理的なポートである受信ポートによってノード300からのメッセージを受信する。メッセージの重要度は、図1Aでは、重要度の高いものから順に、Critical、Major、MinorおよびWarningの4
段階が例示されている。稼働状況を伝えるメッセージは、ノード300において発生した障害等を伝える警報を含む。警報監視サーバ200は、例えば、単位時間当たり所定数以上のメッセージをあるノード300から受信すると、当該ノード300からのメッセージを受信する受信ポートを閉塞する。警報監視サーバ200は、受信ポートを閉塞することで、警報監視サーバ200の負荷を軽減する。警報監視サーバ200は、「ネットワーク監視装置」の一例である。警報は、「メッセージ」の一例である。
ノード300は、各種情報処理を行う情報処理装置である。ノード300は、自装置に障害等が発生すると、警報管理サーバ200に当該障害等を通知する警報を送信する。ノード300は、警報管理サーバ200が警報を受信できないときは、ノード300が備える警報履歴バッファに当該警報を蓄積する。蓄積された警報は、警報管理サーバ200からの要求に応じて警報管理サーバ200に送信される。図1Aでは、ノード#1からノード#4までの4台のノード300が例示されているが、ノード300の台数が4台に限定されるわけではない。
図1Bは、警報監視システム1の処理の概略を示す図の一例である。図1Bを参照して、警報監視システム1の処理の概略について説明する。警報監視サーバ200は、ノード300から所定の閾値を超える数の警報を受信すると、警報を受信する受信ポートを閉塞する。警報監視サーバ200は、受信ポートを閉塞することで、警報監視サーバ200の処理負荷を低減できる。ノード300は、警報監視サーバ200の受信ポート閉塞により警報の送信ができない場合、ノード300が備える警報履歴バッファに送信できなかった警報を蓄積する。ここで、受信ポートを閉塞すると、警報監視サーバ200は、ノード300で発生する警報の数を監視することは難しい。そのため、警報監視サーバ200は、閉塞した受信ポートを開放する適切な時期を判定する事が難しくなる。そこで、警報監視サーバ200は、ノード300において発生する警報数を監視するため、受信ポートとは別に制御ポートを備える。警報監視サーバ200は、制御ポートによってノード300で発生する警報数を受信できる。警報監視サーバ200は、制御ポートを介して受信するノード300の警報数の変動を基に、閉塞した受信ポートを開放する時期を判定する。
<ハードウェア構成>
図2は、情報処理装置100のハードウェア構成の一例を示す図である。情報処理装置100は、Central Processing Unit(CPU)101、メモリ102、ディスク103
、Network Interface Card(NIC)104および接続バスB1を含む。CPU101、メモリ102、ディスク103およびNIC104は、接続バスB1によって相互に接続されている。情報処理装置100は、警報監視サーバ200またはノード300として利用できる。
情報処理装置100では、CPU101がディスク103に記憶されたプログラムをメモリ102の作業領域に展開し、プログラムの実行を通じて周辺装置の制御を行う。これにより、情報処理装置100は、所定の目的に合致した処理を実行することができる。メモリ102およびディスク103は、情報処理装置100が読み取り可能な記録媒体である。
メモリ102は、CPU101から直接アクセスされる記憶部として例示される。メモ
リ102は、Random Access Memory(RAM)およびRead Only Memory(ROM)を含む。
ディスク103は、各種のプログラムおよび各種のデータを読み書き自在に記録媒体に格納する。ディスク103は外部記憶装置とも呼ばれる。ディスク103には、オペレーティングシステム(Operating System、OS)、各種プログラム、各種テーブル等が格納される。OSは、NIC104を介して接続される外部装置等とのデータの受け渡しを行う通信インターフェースプログラムを含む。外部装置等には、例えば、コンピュータネットワーク等で接続された、他の情報処理装置および外部記憶装置が含まれる。なお、ディスク103は、例えば、ネットワーク上のコンピュータ群であるクラウドシステムの一部であってもよい。
ディスク103は、例えば、Erasable Programmable ROM(EPROM)、ソリッドス
テートドライブ(Solid State Drive、SSD)、ハードディスクドライブ(Hard Disk Drive、HDD)等である。また、ディスク103は、例えば、Compact Disc(CD)ドライブ装置、Digital Versatile Disc(DVD)ドライブ装置、Blu-ray(登録商標)Disc
(BD)ドライブ装置等である。また、ディスク103は、Network Attached Storage(NAS)あるいはStorage Area Network(SAN)によって提供されてもよい。
情報処理装置100が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、情報処理装置100から読み取ることができる記録媒体をいう。このような記録媒体のうち情報処理装置100から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD−ROM、CD−R/W、DVD、ブルーレイディスク、DAT、8mmテープ、フラッシュメモリなどのメモリカード等がある。また、情報処理装置100に固定された記録媒体としてハードディスク、SSDあるいはROM等がある。
NIC104は、例えば、コンピュータネットワークとのインターフェースである。NIC104は、コンピュータネットワークを介して外部の装置と通信を行う。
情報処理装置100は、例えば、ユーザ等からの操作指示等を受け付ける入力部をさらに備えてもよい。このような入力部として、キーボード、ポインティングデバイス、タッチパネル、加速度センサーあるいは音声入力装置といった入力デバイスを例示できる。
情報処理装置100は、例えば、プロセッサ101で処理されるデータや主記憶部102に記憶されるデータを出力する出力部を備えるものとしてもよい。このような、出力部として、Cathode Ray Tube(CRT)ディスプレイ、Liquid Crystal Display(LCD)、Plasma Display Panel(PDP)、Electroluminescence(EL)パネル、有機ELパ
ネルあるいはプリンタといった出力デバイスを例示できる。
<警報監視サーバ200の論理ポート>
図3は、警報監視サーバ200の論理ポートの一例を示す図である。論理ポートは、例えば、TCP/IPのトランスポート層における論理的なポートとして用意される。論理ポートの各々には、例えば、ポート番号が割り当てられる。以下、図3を参照して、警報監視サーバ200の論理ポートについて説明する。
警報監視サーバ200は、論理ポートとして受信ポート201および制御ポート202を有する。受信ポート201および制御ポート202は、ノード300毎に用意される。受信ポート201は、ノード300からの警報を受信するポートである。受信ポート201は、警報の重要度毎に用意される。図3の例では、4つの受信ポート201a〜201
dが例示され、受信ポート201aは重要度Criticalの警報用受信ポートであり、受信ポート201bは重要度Majorの警報用受信ポートであり、受信ポート201cは重要度Minorの警報用受信ポートであり、受信ポート201dは重要度Warningの警報用受信ポート
である。
制御ポート202は、ノード300で発生している警報数を監視する。警報数の監視は、例えば、制御ポート202からノード300に制御信号を送信して行う。制御ポート202は、例えば、受信ポート201の閉塞により受信ポート201に警報を送信できなくなったノード300において発生する警報数を受信する。制御ポート202は、「監視ポート」の一例である。
<警報監視サーバ200の処理ブロック>
図4は、警報監視サーバ200の処理ブロックの一例を示す図である。図4では、処理ブロックとして、受信ポート管理部210が例示されている。また、図4では、記憶部として、ポート開放中警報数管理テーブル220、ポート閉塞中警報数管理テーブル230、警報受信数閾値240、ポート閉塞優先順番表250、ポート開放優先順番表260、ポート状況管理表270および警報履歴バッファ管理表280が例示されている。例えば、図2のCPU101が図4の処理ブロックとしてメモリ102に実行可能に展開されたコンピュータプログラムを実行する。ただし、図4のいずれかのブロックの少なくとも一部はハードウェア回路、専用のプロセッサまたはデジタルシグナルプロセッサ(Digital Signal Processor、DSP)を含んでもよい。
CPU101は、受信ポート管理部210として、受信ポート201の開放および閉塞を行う。受信ポート管理部210は、閾値判定部211、ポート閉塞部212、ポート開放部213およびノード警報数読出部214を含む。
受信ポート管理部210は、受信ポート201が受信している警報数を、例えば、10秒周期で取得する。受信ポート管理部210は、取得した警報数をポート開放中警報数管理テーブル220に登録する。ポート開放中警報数管理テーブル220に登録された情報は、受信ポート管理部210が警報数を取得するたびに更新される。受信ポート管理部210は、前回取得時の警報数と今回取得時の警報数とから単位時間あたりの警報受信数を算出する。
閾値判定部211は、ノード300から受信する単位時間当たりの警報受信数と警報受信数閾値240に記憶されている閾値とを比較する。閾値判定部211は、受信する単位時間当たりの警報数が閾値以上の場合、ポート閉塞部212に受信ポート201の閉塞を指示する。閾値判定部211は、受信する単位時間当たりの警報数が閾値未満の場合、ポート開放部213に受信ポート201の開放を指示する。
ポート閉塞部212は、閾値判定部211からの指示により、受信ポート201を閉塞する。ポート閉塞部212は、ポート閉塞優先順番表250に登録された情報にしたがって、受信ポート201を閉塞する。ポート閉塞部212は、「閉塞部」の一例である。
ノード警報数読出部214は、制御ポート202を介して、閉塞した受信ポート201に対応付けられたノード300において発生している警報数を取得する。ノード警報数読出部214は、例えば、10秒周期で警報数を取得する。ノード警報数読出部214は、例えば、10秒周期でノード300において発生している警報数を取得する。ノード警報数読出部214は、取得した警報数をポート閉塞中警報数管理テーブル230に登録する。ポート閉塞中警報数管理テーブル230に登録される情報は、ノード警報数読出部214がノード300の警報数を取得するたびに更新される。ポート閉塞中警報数管理テーブ
ルに登録される情報は、例えば、10秒周期で更新される。ノード警報数読出部214は、「監視部」の一例である。
ポート開放部213は、閾値判定部211からの指示により、閉塞された受信ポート201を開放する。ポート開放部213は、ポート開放優先順番表260に登録された情報にしたがって、受信ポート201を開放する。ポート開放部213は、「開放部」の一例である。
ポート開放中警報数管理テーブル220は、警報監視サーバ200がノード300から受信する警報数を管理する。すなわち、ポート開放中警報数管理テーブル220は、開放されている受信ポート201において受信される各ノード300からの警報の数を管理する。
図5はポート開放中警報数管理テーブル220の一例を示す図である。以下、図5を参照して、ポート開放中警報数管理テーブル220について説明する。ポート開放中警報数管理テーブル220の1列目には、ノード300の名称が例示される。図5では、ノード1、ノード2およびノード3の各名称が例示されている。ポート開放中警報数管理テーブル220では、重要度毎に警報数が例示される。図5では、例えば、図5の左から順に、警報Critical、警報Major、警報Minorおよび警報Warningの各重要度が例示されている。
また、ポート開放中警報数管理テーブル220では、各重要度毎に前回値(件数)、今回値(件数)および受信数(件/秒)が集計される。本実施形態では、ポート開放中警報数管理テーブル220は、上述の通り、10秒周期で更新される。すなわち、前回値(件数)は前回更新時の警報数の例示であり、今回値(件数)は今回更新時の警報の件数の例示である。受信数(件/秒)は、ノード300から1秒あたりに受信する警報の件数である。受信数(件/秒)は、例えば、今回値(件数)の警報数と前回値(件数)の警報数の差を、ポート開放中警報数管理テーブル220の更新間隔である10秒で割ることで算出される。ポート開放中警報数管理テーブル220の下から2行目の小計(件/秒)は、受信数(件/秒)の各ノード300毎の小計の例示である。ポート開放中警報数管理テーブル220の最下行の合計(件/秒)は、受信数(件/秒)の合計値の例示である。すなわち、合計(件/秒)は、警報監視サーバ200が各ノード300から1秒あたりに受信する警報数の例示である。
図4に戻り、ポート閉塞中警報数管理テーブル230は、閉塞された受信ポート201に対応するノード300において発生する警報数を管理する。図6は、ポート閉塞中警報数管理テーブル230の一例を示す図である。以下、図6を参照して、ポート閉塞中警報数管理テーブル230について説明する。図5と図6とを比較すると理解できるように、ポート閉塞中警報数管理テーブル230では、ポート開放中警報数管理テーブル220とほぼ同一の構成が採用されている。そこで、ポート閉塞中警報数管理テーブル230の説明では、ポート開放中警報数管理テーブル220と異なる点について説明を行い、同様な点については説明を省略する。
ポート閉塞中警報数管理テーブル230では、閉塞した受信ポート201に対応するノード300において発生する警報の件数が管理される。そのため、図6の前回値(件数)および今回値(件数)は、警報監視サーバ200が受信した警報数ではなく、閉塞した受信ポート201に対応するノード300で発生した警報数が管理される。履歴数(件/秒)は、図6の前回値(件数)と今回値(件数)との差を、ポート閉塞中警報数管理テーブル230の更新周期である10秒で割ることで算出される。ポート閉塞中警報数管理テーブル230では、開放されている受信ポート201において検出される警報数は、例えば、0件と記録される。
図4に戻り、警報受信数閾値240には、警報監視サーバ200が受信可能な警報数の閾値が設定される。この閾値は、例えば、受信ポート201の開放または閉塞の際の判断基準として用いられる。警報受信数閾値240は、初期設定時に適宜定められる。警報受信数閾値240は、「所定の閾値」の一例である。
ポート閉塞優先順番表250は、受信ポート201を閉塞する際に、その順番を例示するテーブルである。また、ポート開放優先順番表260は、閉塞した受信ポート201を下方する際に、その順番を例示するテーブルである。図7は、ポート閉塞優先順番表250の一例を示す図である。図8は、ポート開放優先順番表260の一例を示す図である。以下、図7および図8を参照して、ポート閉塞優先順番表250およびポート開放優先順番表260について説明する。
ポート閉塞優先順番表250およびポート開放優先順番表260では、優先順番と受信ポート201とが対応付けられる。優先順番は、ポートの閉塞または開放の優先度を例示するものであり、図7および図8では、最も優先度が高い優先1から最も優先度が低い優先4までの4段階の優先順番が例示されている。ポート閉塞優先順番表250およびポート開放優先順番表260において、受信ポート201は、当該受信ポート201が受信する警報の優先度によって記載される。例えば、図7を参照すると、優先度Warningの警報
を受信する受信ポート201dは、最も高い優先度で閉塞される。ポート閉塞優先順番表250は、「閉塞優先度管理部」の一例である。ポート開放優先順番表260は、「開放優先度管理部」の一例である。
図4に戻り、ポート状況管理表270は、各受信ポート201の開放または閉塞状況を管理する。図9は、ポート状況管理表270の一例を示す図である。以下、図9を参照して、ポート状況管理表270について説明する。
ポート状況管理表270では、各ノード300からの警報の重要度毎に設けられた各受信ポート201毎に、当該受信ポート201の状況が管理される。ポート状況管理表270の1行目では、ポート状況管理表270で管理される情報の種別が例示される。すなわち、ポート状況管理表270の左から1列目ではノード300のノード名が管理される。ポート状況管理表270の左から2列目では、重要度Critical用の受信ポート201の状況が管理される。以下、左から3列目では重要度Major用の受信ポート201の状況が、
左から4列目では重要度Minor用の受信ポート201の状況が、左から5列目では重要度Warning用の受信ポート201の状況が、それぞれ管理される。例えば、図9を参照すると、ノード名「ノード1」であるノード300では、重要度Critical用の受信ポート201および重要度Major用の受信ポート201が開放中であり、重要度Minor用の受信ポート201および重要度Warning用の受信ポート201が閉塞中であることがわかる。
図4に戻り、警報履歴バッファ管理表280は、ノード300が蓄積できる警報数を管理する。図10は、警報履歴バッファ管理表280の一例を示す図である。以下、図10を参照して、警報履歴バッファ管理表280について説明する。
警報履歴バッファ管理表280では、ノード300毎に当該ノード300が蓄積可能な警報数がノード300のノード名と対応付けて管理される。警報履歴バッファ管理表280の左から1列目では、ノード300のノード名が管理される。警報履歴バッファ管理表280の左から2列目では、ノード300がバッファに蓄積可能な警告数が管理される。例えば、図10を参照すると、ノード名「ノード1」であるノード300では、10万件の警報をバッファに蓄積可能であることがわかる。警報履歴バッファ管理表280は、「蓄積可能件数管理部」の一例である。
<ノード300の論理ポート>
図11は、ノード300の論理ポートの一例を示す図である。ノード300の論理ポートは、警報管理サーバ200の論理ポートと同様に、例えば、TCP/IP参照モデルのトランスポート層における論理的なポートとして用意される。以下、図11を参照して、ノード300の論理ポートについて説明する。
ノード300は、論理ポートとして送信ポート301および制御ポート302を有する。送信ポート301は、ノード300から警報管理サーバ200に警報を送信するポートである。送信ポート301は、警報の重要度毎に用意される。図11の例では、4つの送信ポート301a〜301dが例示され、送信ポート301aは重要度Criticalの警報用送信ポートであり、送信ポート301bは重要度Majorの警報用送信ポートであり、送信
ポート301cは重要度Minorの警報用送信ポートであり、送信ポート301dは重要度Warningの警報用送信ポートである。
制御ポート302は、警報管理サーバ200の制御ポート202からの制御信号を受信する。ノード300は、制御ポート302を介して受信した制御信号に応じた各種処理を行う。
<ノード300の処理ブロック>
図12は、ノード300の処理ブロックの一例を示す図である。図12では、処理ブロックとして、警報送信部320、履歴警報数応答部330、履歴警報詳細応答部340および警報履歴バッファクリア処理部350が例示されている。また、図12では、記憶部として、警報履歴バッファ310が例示されている。例えば、図2のCPU101が図12の各ブロックとしてメモリ102に実行可能に展開されたコンピュータプログラムを実行する。ただし、図12のいずれかのブロックの少なくとも一部はハードウェア回路、専用のプロセッサまたはデジタルシグナルプロセッサ(Digital Signal Processor、DSP)を含んでもよい。
警報履歴バッファ310には、ノード300で発生した障害等を通知する警報が蓄積される。ノード300は、例えば、何らかの事象によって警報監視サーバ200に対して警報を送信できない場合に、当該送信できなかった警報を警報履歴バッファ310に蓄積する。警報監視サーバ200に対して警報を送信できない場合とは、例えば、警報監視サーバ200が、当該ノード300の当該警報の送信先となる受信ポート201を閉塞している場合である。警報履歴バッファ310は、例えば、ノード300のメモリ102またはディスク103上に構築される。警報履歴バッファ310は、「蓄積部」の一例である。
ノード300のプロセッサ101は、警報送信部320として、ノード300で発生した障害等を伝える警報を警報監視サーバ200に送信する。
ノード300のプロセッサ101は、履歴警報数応答部330として、警報監視サーバ200からの要求に応じて、警報履歴バッファ310に蓄積された警報の数を警報監視サーバ200に送信する。履歴警報数応答部330は、「応答部」の一例である。
ノード300のプロセッサ101は、履歴警報詳細応答部340として、警報監視サーバ200からの要求に応じて、警報履歴バッファ310に蓄積された警報を警報監視サーバ200に送信する。
ノード300のプロセッサ101は、警報履歴バッファクリア処理部350として、警報監視サーバ200からの要求に応じて、警報履歴バッファ310に蓄積された警報を消去する。
<警報監視システム1の処理の流れ>
図13は、警報監視システム1の処理の流れの一例を示す図である。図14は、図13のT110からT112における処理のシーケンス図の一例である。以下、図13および図14を参照して、警報監視システム1の処理の流れについて説明する。
T101では、警報監視サーバ200およびノード300が起動される。T102では、起動された警報監視サーバ200は、受信ポート201を開放する。また、警報監視サーバ200は、制御ポート202からノード300の警報履歴バッファ310に蓄積された警報を消去する制御信号を送信する。ノード300は、警報監視サーバ200からの制御信号を制御ポート302によって受信する。制御信号を受信したノード300の警報履歴バッファクリア部350は、警報履歴バッファ310に蓄積された警報を消去する。
T103では、警報監視サーバ200の受信ポート管理部210は、図9に例示されるポート状況管理表270を参照し、「開放中」となっている受信ポート201を抽出する。受信ポート管理部210は、抽出した受信ポート201によって受信される警報数を基に、図5に例示されるポート開放中警報数管理テーブル220を更新する。さらに、受信ポート管理部210は、更新されたポート開放中警報数管理テーブル220を基に、1秒間あたりに受信する警報数を各ノード300毎に算出する。
T104では、警報監視サーバ200の閾値判定部211は、T103で更新したポート開放中警報数管理テーブル220を参照し、受信している警報数の合計件数を取得する。閾値判定部211は、取得した警報数の1秒間あたりの件数と警報受信数閾値240とを比較する。1秒間あたりの件数が警報受信数閾値240を超えている場合(T105でYES)、処理は、TT106に進められる。1秒間あたりの件数が警報受信数閾値240以下の場合(T105でNO)、処理は、T113に進められる。
T106では、警報監視サーバ200のポート閉塞部213は、ポート閉塞優先順番表250にしたがって閉塞対象とする受信ポート201を決定する。優先度が同じであれば、受信する警報数の多い受信ポート201を優先して閉塞対象の受信ポート201として決定する。この決定は、決定された受信ポート201が閉塞されることで、警報監視サーバ200が受信する警報数の1秒間あたりの合計件数が警報受信数閾値240未満となるように行われる。なお、警報を受信していない受信ポート201は、閉塞対象とはされない。
T107では、ポート閉塞部213は、ポート状況管理表270におけるT106で決定された受信ポート201の状況を「開放中」から「閉塞予定」に変更する。
T108では、ポート閉塞部213は、ポート状況管理表270において「閉塞予定」とされている受信ポート201を閉塞するとともに、当該受信ポート201の状況を「閉塞中」に更新する。
T109では、警報監視サーバ200は、10秒のウェイト処理を行う。なお、警報監視サーバ200は、ウェイト中であっても、ポート状況管理表270において「開放中」とされている受信ポート201では、ノード300からの警報を受信する。
T110では、警報監視サーバ200のノード警報数読出部214は、ポート状況管理表270を参照して、「閉塞中」となっている受信ポート201を抽出する。ノード警報数読出部214は、図14のB101に例示されるように、抽出された受信ポート201に対応するノード300に対し、警報履歴バッファ310に蓄積された警報数を問い合わ
せる。この問い合わせは、制御ポート202を介して行われる。ノード300は、警報監視サーバ200からの問い合わせを制御ポート302を介して受信する。問い合わせを受信したノード300の履歴警報数応答部330は、警報履歴バッファ310に蓄積された警報数を取得する。履歴警報数応答部330は、図14のB102に例示されるように、取得した警報数を制御ポート320を介して警報監視サーバ200に応答する。警報監視サーバ200は、ノード300からの応答を制御ポート202を介して受信する。
T111では、ノード警報数読出部214は、T110で取得したノード300の警報数を基に、図6に例示されるポート閉塞中警報数管理テーブル230を更新する。
T112では、ノード警報数読出部214は、図14のB103に例示されるように、今後1分以内に警報履歴バッファ310に蓄積可能な警報数を超えると予測されるノード300を決定する。当該決定は、ノード警報読出部214が、図10に例示される警報履歴バッファ管理表280とT111で更新したポート閉塞中警報数管理テーブル230を基に行われる。警報監視サーバ200は、決定されたノード300に対し、図14のB104およびB105に例示されるように、当該ノード300の警報履歴バッファ310に蓄積された警報を制御ポート202を介して読み出す。警報監視サーバ200は、警報の読出し後、図14のB106に例示されるように、ノード300の警報履歴バッファ310の消去を行う。ノード300は、図14のB107に例示されるように、警報履歴バッファ310の消去が正常終了したか否かを警報監視サーバ200に応答する。また、警報監視サーバ200は、ノード300の警報履歴バッファ310を消去した場合、ポート閉塞中警報数管理テーブル230の更新を行う。すなわち、警報監視サーバ200は、ポート閉塞中警報数管理テーブル230において、消去対象となったノード300の警報数を0にする。
T113では、警報監視サーバ200のポート開放部213は、ポート開放優先順番表260にしたがって、開放する受信ポート201を決定する。優先度が同じであれば、受信する警報数の少ない受信ポート201を優先して開放対象の受信ポート201として決定する。この決定は、決定された受信ポート201が開放されても、警報監視サーバ200が受信する警報数の1秒間あたりの合計件数が警報受信数閾値240未満となるように行われる。
T114では、ポート開放部213は、ポート状況管理表270におけるT113で決定された受信ポート201の状況を「閉塞中」から「開放予定」に変更する。
T115では、ポート開放部213は、ポート状況管理表270において「開放予定」とされている受信ポート201を開放するとともに、当該受信ポート201の状況を「開放中」に更新する。
<実施例>
以上で説明した警報監視システム1について、より具体的な実施例を取り上げて説明する。実施例では、1台の警報監視サーバ200に10万台のノード300が接続されている。警報監視サーバ200の警報受信数閾値240は、1秒間あたり100件とする。図15は、実施例における警報履歴バッファ管理表280の一例を示す図である。図15に例示されるように、実施例のノード300は、警報履歴バッファ310に1000件の警報を蓄積可能である。
図16は、警報監視システム1が運用開始された時点でのポート状況管理表270の一例を示す図である。図16を参照すると、運用開始時点の警報監視サーバ200では、全ての受信ポート201が開放されていることがわかる。この処理は、例えば、図13のT
102に例示される処理である。
図17は、直近10秒間で警報を受信していない場合のポート開放中警報数管理テーブル220の一例を示す図である。図17を参照すると、前回値と今回値の警報数が同じである。そのため、1秒当たりの受信数を示す受信数(件/秒)の値が0となっている。このことから、直近10秒間においてノード300から警報を受信していないことがわかる。この処理は、例えば、図13のT103に例示される処理である。
ここで、警報監視システム1において、特定のノード300から大量の警報が送信された場合を考える。図18は、特定のノード300から大量の警報を受信した場合のポート開放中警報数管理テーブル220の一例を示す図である。図18を参照すると、警報監視サーバ200は、ノード名「ノード11」のノード300からノード名「ノード20」のノード300までの、10台のノード300から警報を受信していることがわかる。これらのノード300からは、重要度Minorの警報と重要度Warningの警報を受信しており、1秒間あたりの警報受信数は、120件となっている。そのため、本実施例で警報受信数閾値240として設定した「1秒あたり100件」の閾値を超えている。すなわち、図13のT105でYESに分岐する処理に例示される場合である。
そこで、警報監視サーバ200のポート閉塞部212は、ポート閉塞優先順番表250を参照して閉塞対象とする受信ポート201を決定する。ここで、ポート閉塞優先順番表250を参照すると、重要度Warningの受信ポート201の優先度が最も高い。また、図
18を参照すると、ノード名「ノード19」のノード300およびノード名「ノード20」のノード300から受信する重要度Warningの警報は、1秒間あたり約24件である。
そのため、この2台のノード300の重要度Warning用の受信ポート201である受信ポ
ート201dを閉塞することで、警報監視サーバ200が1秒間に受信する警報の警報数は、警報受信数閾値240を下回る。そこで、ポート閉塞部212は、ノード名「ノード19」のノード300およびノード名「ノード20」のノード300からの重要度Warningの警報を受信する受信ポート201を閉塞対象のポートとして決定する。この処理は、
例えば、図13のT106に例示される処理である。
図19は、閉塞対象として決定された受信ポート201dの状況を「閉塞予定」としたポート状況管理表270の一例を示す図である。図19を参照すると、ノード名「ノード19」のノード300およびノード名「ノード20」のノード300からの重要度Warningの警報を受信する受信ポート201dの状況が「閉塞予定」に変更されていることがわ
かる。この処理は、例えば、図13のT107に例示される処理である。
ポート閉塞部212は、ポート状況管理表270において、「閉塞予定」とされている受信ポート201dを閉塞する。図20は、「閉塞予定」とされた受信ポート201dを閉塞した場合のポート状況管理表270の一例を示す図である。図20を参照すると、ノード名「ノード19」のノード300およびノード名「ノード20」のノード300からの重要度Warningの警報を受信する受信ポート201dの状況が「閉塞中」に変更されて
いることがわかる。この処理は、例えば、図13のT108に例示される処理である。
ここまでの処理を行った警報監視サーバ200は、図13のT109に例示されるように、10秒間ウェイトを行う。
警報監視サーバ200のノード警報数読出部214は、ポート状況管理表270において「閉塞中」となっている受信ポート201に対応するノード300に対して、警報数の読出しを行う。本実施例では、ノード警報数読出部214は、ノード名「ノード19」のノード300およびノード名「ノード20」のノード300における重要度Warningの警
報数を読み出す。この処理は、例えば、図13のT110に例示される処理である。
警報数を読み出したノード警報数読出部214は、ポート閉塞中警報数管理テーブル230を更新する。図21は、更新されたポート閉塞中警報数管理テーブル230の一例を示す図である。図21を参照すると、ノード名「ノード19」のノード300とノード名「ノード20」のノード300とで、重要度Warningの警報がそれぞれ118件、119
件発生している。この処理は、例えば、図13のT111に例示される処理である。
続いて、警報監視サーバ200は、ノード名「ノード19」のノード300とノード名「ノード20」のノード300それぞれの警報履歴バッファ310に蓄積される警報数が、1分以内に当該警報履歴バッファ310に蓄積可能な数を超えるか否か判定する。図21を参照すると、ノード名「ノード19」のノード300では、1秒当たり11.80件の警報が発生している。また、ノード名「ノード20」のノード300では、1秒当たり11.90件の警報が発生している。そのため、1分後に警報履歴バッファ310に蓄積される警報数は、ノード名「ノード19」のノード300では708件、ノード名「ノード20」のノード300では714件となると予測される。そのため、いずれのノード300においても、1分後に蓄積される警報数は、警報履歴バッファ310に蓄積可能な1000件を超えないと判定される。そこで、警報監視サーバ200は、ノード名「ノード19」のノード300およびノード名「ノード20」の警報履歴バッファ310の消去処理を実行しない。この処理は、例えば、図13のT112に例示される処理である。
警報監視サーバ200の閾値判定部211は、ポート開放中警報数管理テーブル220を更新する。図22は、更新されたポート開放中警報数管理テーブル220の一例を示す図である。この処理は、例えば、図13のT102に例示される処理である。
ここでは、警報監視サーバ200が各ノード300から受信する警報数が減少したものとする。図18と図22とを比較すると、警報監視サーバ200が1秒当たりに受信する警報受信数が120件から42.3件に減少していることがわかる。
閾値判定部211は、図22に例示される警報監視サーバ200が1秒あたりに受信する警報数と警報受信数閾値240とを比較する。上述の通り、図22では、警報監視サーバ200が1秒あたりに受信する警報数は42.3件であるため、警報監視サーバ200が1秒あたり受信する警報数は、警報受信数閾値240である1秒あたり100件を下回っている。さらに、閾値判定部211は、図21に例示されるポート閉塞中警報数管理テーブル230を参照し、閉塞した受信ポート201を開放しても、警報監視サーバ200が1秒あたりに受信する警報数が警報受信数閾値240を超過するか否か判定する。図22を参照すると、閉塞されている受信ポート201に対応するノード300、すなわち、ノード名「ノード19」のノード300とノード名「ノード20」のノード300とで発生している警報数は、1秒あたり22.3件である。そのため、これらの受信ポート201を開放しても、警報監視サーバ200が1秒あたりに受信する警報数は64.6件となる。したがって、閾値判定部211は、閉塞した受信ポート201を開放しても、警報監視サーバ200が1秒あたりに受信する警報数が警報受信数閾値240を超えないと判定できる。この処理は、例えば、図13のT105の処理に例示される処理である。
警報監視サーバ200のポート開放部213は、ポート開放優先順番表260に従い、開放対象とする受信ポート201を決定する。この処理は、例えば、図13のT113に例示される処理である。
ポート開放部213は、ポート状況管理表270において、決定した受信ポート201の状況を「閉塞中」から「開放予定」に変更する。図23は、開放対象として決定された
受信ポート201の状況を「開放予定」としたポート状況管理表270の一例を示す図である。図23を参照すると、ノード名「ノード19」のノード300およびノード名「ノード20」のノード300各々について、重要度Warningの受信ポート201dが「開放
予定」とされている。この処理は、例えば、図13のT114に例示される処理である。
ポート開放部213は、ポート状況管理表270で「開放予定」とされている受信ポート201を開放する。受信ポート201を開放したポート開放部213は、ポート状況管理表270において、開放した受信ポート201の状況を「開放中」に更新する。図24は、「開放予定」とされた受信ポート201を開放した場合のポート状況管理表270の一例を示す図である。図24を参照すると、ノード名「ノード19」のノード300およびノード名「ノード20」のノード300各々について、重要度Warningの受信ポート2
01が「開放中」とされている。この処理は、例えば、図13のT115の処理に例示される処理である。
ここまでの処理を行った警報監視サーバ200は、図13のT109に例示されるように、10秒間ウェイトを行う。
この段階では、警報監視サーバ200は、閉塞中の受信ポート201が存在しないため、ノード300に対する警報数の読出し処理は実行されない。
<実施形態の効果>
第1実施形態の警報監視サーバ200では、警報受信数閾値240を超える数の警報を受信すると、受信ポート201を閉塞した。その結果、警報監視サーバ200は、警報監視サーバ200の処理負荷の増大を抑制できる。
第1実施形態の警報監視サーバ200は、受信ポート201を各ノード300毎および各警報の重要度毎に用意した。そのため、警報監視サーバ200は、例えば、受信する警報数に応じて、各受信ポート201を段階的に開放または閉塞できる。
第1実施形態の警報監視サーバ200は、閉塞する受信ポート201をポート閉塞優先順番表250に基づいて決定した。ここで、ポート閉塞優先順番表250では、重要度の高い警報を受信する受信ポート201ほど優先度が低く設定されている。そのため、警報監視サーバ200は、重要度の高い警報を受信する受信ポート201をより遅いタイミングで閉塞できる。すなわち、警報監視サーバ200は、優先度の低い警報を受信する受信ポート201から優先度の高い警報を受信する受信ポート201まで、閉塞する受信ポート201を段階的に決定できる。
警報監視サーバ200は、開放する受信ポート201をポート開放優先順番表260に基づいて決定した。また、ポート開放優先順番表260では、重要度のより高い警報を受信する受信ポート201の優先度が高く設定されている。その結果、高い優先度の警報を受信する受信ポート201をより早いタイミングで開放できる。すなわち、警報監視サーバ200は、優先度の高い警報を受信する受信ポート201から優先度の低い警報を受信する受信ポート201まで、開放する受信ポート201を段階的に決定できる。
第1実施形態に係る警報監視サーバ200では、受信ポート201以外に制御ポート202を備えた。警報監視サーバ200は、閉塞した受信ポート201に対応するノード300において発生する警報数を制御ポート202を介して受信できる。
第1実施形態に係る警報監視サーバ200は、受信ポート201の他に制御ポート202を備えた。そのため、警報監視サーバ200は、受信ポート201を閉塞した状態であ
っても、制御ポートを介することで、閉塞した受信ポート201に対応するノード300の警報数を受信できる。その結果、警報監視サーバ200は、閉塞した受信ポート201に対応するノード300で発生する警報数が減少し、当該受信ポート201を開放しても、警報受信数閾値240を超えない時期を判定できる。すなわち、警報監視サーバ200は、閉塞した受信ポート201を開放する適切な時期を判定できる。
第1実施形態に係る警報監視サーバ200は、各ノード300が警報履歴バッファ310に蓄積可能な警報数を警報履歴バッファ管理表280で管理した。上述の通り、警報監視サーバ200は、制御ポート202を介してノード300で発生する警報数を受信できる。そのため、警報監視サーバ200は、警報履歴バッファ310に蓄積される警報数が当該警報履歴バッファ310に蓄積可能な数を超えるか否かを判定できる。さらに、警報監視サーバ200は、制御ポート202を介して警報履歴バッファ310に蓄積された警報を取得できる。そのため、警報監視サーバ200は、警報履歴バッファ310に蓄積された警報の取得漏れを低減できる。
<実施形態の変形例>
第1実施形態では、警報履歴バッファ310に蓄積される警報数が当該警報履歴バッファ310に蓄積可能な数を超える前に警報履歴バッファ310の消去が実行された。しかしながら、警報履歴バッファ310として、例えば、自動的に古い警報が消去されるバッファが採用された場合、この消去処理を省略できる。自動的に古い警報を消去するバッファとして、例えば、リングバッファが挙げられる。
第1実施形態の警報監視サーバ200では、受信ポート201をノード300および警報の重要度毎に個別に用意した。しかしながら、警報監視サーバ200は、ひとつの受信ポート201を用意し、全てのノード300からの全ての警報をこのひとつの受信ポート201で受信してもよい。
第1実施形態の警報監視サーバ200は、警報受信数閾値240に基づいて、受信ポート201の開放及び閉塞を制御した。警報監視サーバ200は、警報受信数閾値240よりも低い閾値である第2警報受信数閾値を有してもよい。この場合、警報監視サーバ200は、警報監視数閾値240を超える警報を受信した場合に受信ポート201の閉塞を決定する。また、警報監視サーバ200は、制御ポート202によって監視されたノード300における警報の発生数が第2警報監視数閾値未満である場合に、閉塞した受信ポート201の開放を決定する。警報監視サーバ200は、警報受信数閾値240よりも低い閾値である第2警報受信数閾値を有することで、受信ポート201が開放と閉塞を短時間の間に繰り返す事象を抑制できる。第2警報受信数閾値は、「第2の閾値」の一例である。
第1実施形態の警報監視サーバ200は、ノード300から当該ノード300で発生した障害等を伝える警報を受信した。しかしながら、警報監視サーバ200がノード300から受信する情報が警報に限定されるわけではない。警報監視サーバ200は、ノード300から当該ノード300の様々な状況を伝えるメッセージを受信してもよい。
第1実施形態の警報監視サーバ200は、受信ポート201および制御ポート202をTCP/IPのトランスポート層における論理的なポートとして実装した。しかしながら、受信ポート201および制御ポート202は論理的なポートに限定されるわけではない。警報監視サーバ200は、例えば、受信ポート201および制御ポート202を物理的なポートとして実装してもよい。警報監視サーバ200は、例えば、受信ポート201用のNIC104および制御ポート202用のNIC104を実装してもよい。
以上で開示した実施形態や変形例はそれぞれ組み合わせる事ができる。
1・・・警報監視システム
100・・・情報処理装置
101・・・CPU
102・・・メモリ
103・・・ディスク
104・・・NIC
B1・・・接続バス
200・・・警報監視サーバ
201・・・受信ポート
201a・・・重要度Criticalの警報用受信ポート
201b・・・重要度Majorの警報用受信ポート
201c・・・重要度Minorの警報用受信ポート
201d・・・重要度Warningの警報用受信ポート
202・・・制御ポート
210・・・受信ポート管理部
211・・・閾値判定部
212・・・ポート閉塞部
213・・・ポート開放部
214・・・ノード警報数読出部
220・・・ポート開放中警報数管理テーブル
230・・・ポート閉塞中警報数管理テーブル
240・・・警報受信数閾値
250・・・ポート閉塞優先順番表
260・・・ポート開放優先順番表
270・・・ポート状況管理表
280・・・警報履歴バッファ管理表
300・・・ノード
301・・・送信ポート
301a・・・重要度Criticalの警報用送信ポート
301b・・・重要度Majorの警報用送信ポート
301c・・・重要度Minorの警報用送信ポート
301d・・・重要度Warningの警報用送信ポート
302・・・制御ポート

Claims (10)

  1. ネットワーク上のノードに対応付けられ、前記ノードからのメッセージを受信する受信ポートと、
    単位時間当たりの受信メッセージ数が第1の閾値以上の場合、対応する前記受信ポートを、前記メッセージを受信しない閉塞状態にする閉塞部と、
    前記ノードにおけるメッセージの単位時間当たりの発生数を、前記受信ポートとは異なるポートである監視ポートを介して受信する監視部と、
    前記監視部によって受信された単位時間当たりの前記発生数が第2の閾値未満である場合、前記受信ポートを、前記メッセージを受信する開放状態にする開放部と、を備える、
    ネットワーク監視装置。
  2. 前記第2の閾値は、前記第1の閾値より低い値である、
    請求項1に記載のネットワーク監視装置。
  3. 前記メッセージは、所定の重要度のいずれかに分類されており、
    前記受信ポートは、前記メッセージの前記重要度毎に用意される、
    請求項1または2に記載のネットワーク監視装置。
  4. 前記受信ポートが受信するメッセージの前記重要度と前記受信ポートを閉塞する優先度とを対応付ける閉塞優先度管理部をさらに備え、
    前記閉塞部は、前記閉塞優先度管理部に規定される優先度にしたがって閉塞する受信ポートを決定する、
    請求項3に記載のネットワーク監視装置。
  5. 前記閉塞優先度管理部では、前記重要度の低いメッセージを受信する受信ポートほど閉塞する優先度が高く設定される、
    請求項4に記載のネットワーク監視装置。
  6. 前記受信ポートが受信するメッセージの前記重要度と前記受信ポートを開放する優先度とを対応付ける開放優先度管理部をさらに備え、
    前記開放部は、前記開放優先度管理部に規定される優先度にしたがって開放する受信ポートを決定する、
    請求項3から5のいずれか一項に記載のネットワーク監視装置。
  7. 前記開放優先度管理部では、前記重要度の高いメッセージを受信する受信ポートほど開放する優先度が高く設定される、
    請求項6に記載のネットワーク監視装置。
  8. 前記ノードは、前記ネットワーク監視装置に前記メッセージを送信できない場合、送信できなかった前記メッセージを所定件数蓄積可能な蓄積部を備え、
    前記ネットワーク監視装置は、前記蓄積部に蓄積可能な前記所定件数をノード毎に管理する蓄積可能件数管理部をさらに備え、
    前記監視部は、前記監視ポートを介して前記ノードの前記蓄積部に蓄積されたメッセージ件数を取得し、取得したメッセージの件数と前記蓄積可能件数管理部によって管理される前記所定件数とが所定条件を満たす場合、前記蓄積部に蓄積されたメッセージを取得する処理をさらに実行する、
    請求項1から7のいずれか一項に記載のネットワーク監視装置。
  9. ノードと前記ノードを監視するネットワーク監視装置とが互いにネットワークによって
    接続されたネットワーク監視システムであって、
    前記ノードは、
    自ノードの状況を通知するメッセージを前記ネットワーク監視装置に送信する送信部と、
    前記ネットワーク監視装置からの要求に応じて、自ノードで発生するメッセージ数を応答する応答部と、を備え、
    前記ネットワーク監視装置は、
    前記ノードに対応付けられ、前記ノードの前記送信部からのメッセージを受信する受信ポートと、
    単位時間当たりの受信メッセージ数が第1の閾値以上の場合、対応する前記受信ポートを、前記メッセージを受信しない閉塞状態にする閉塞部と、
    前記ノードにおけるメッセージ数を、前記受信ポートとは異なるポートである監視ポートを介して前記ノードの前記応答部から取得して、前記ノードにおけるメッセージの単位時間当たりの発生数を受信する監視部と、
    前記監視部によって受信された単位時間当たりの前記発生数が前記閾値未満である場合、閉塞状態した前記受信ポートを前記メッセージを受信する開放状態にする開放部と、を備える、
    ネットワーク監視システム。
  10. ネットワーク上のノードに対応付けられた受信ポート及び前記受信ポートとは異なるポートである監視ポートを備えるコンピュータが、
    前記ノードからのメッセージを前記受信ポートで受信し、
    単位時間当たりの受信メッセージ数が第1の閾値以上の場合、前記受信ポートを、前記メッセージを受信しない閉塞状態にし、
    前記ノードにおけるメッセージの単位時間当たりの発生数を、前記監視ポートを介して受信し、
    前記監視ポートを介して受信された単位時間当たりの前記発生数が第2の閾値未満である場合、前記受信ポートを、前記メッセージを受信する開放状態にする、
    ネットワーク監視方法。
JP2015196603A 2015-10-02 2015-10-02 ネットワーク監視装置、ネットワーク監視システムおよびネットワーク監視方法 Pending JP2017069897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015196603A JP2017069897A (ja) 2015-10-02 2015-10-02 ネットワーク監視装置、ネットワーク監視システムおよびネットワーク監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015196603A JP2017069897A (ja) 2015-10-02 2015-10-02 ネットワーク監視装置、ネットワーク監視システムおよびネットワーク監視方法

Publications (1)

Publication Number Publication Date
JP2017069897A true JP2017069897A (ja) 2017-04-06

Family

ID=58495487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015196603A Pending JP2017069897A (ja) 2015-10-02 2015-10-02 ネットワーク監視装置、ネットワーク監視システムおよびネットワーク監視方法

Country Status (1)

Country Link
JP (1) JP2017069897A (ja)

Similar Documents

Publication Publication Date Title
US9489135B2 (en) Systems and methods for highly scalable system log analysis, deduplication and management
US9806955B2 (en) Network service incident prediction
JP6917175B2 (ja) 分散システムにおける一意キーの確実な生成
JP5440273B2 (ja) スナップショット管理方法、スナップショット管理装置、及びプログラム
JP6356599B2 (ja) 監視支援システム、監視支援方法、および監視支援プログラム
EP3226471B1 (en) Method and system to improve correlation between overlay and underlay networks in data centers
US20150189033A1 (en) Distributed Cache System
JP4811830B1 (ja) コンピュータリソース制御システム
US11656928B2 (en) Detecting datacenter mass outage with near real-time/offline using ml models
US9948520B2 (en) Efficiently determining network topology
JP2014186624A (ja) マイグレーション処理方法及び処理装置
US10897512B2 (en) Generating push notifications
TW201640351A (zh) 資源監控系統與其方法
JP5766346B2 (ja) ソフトウェア・オブジェクトをバックグラウンドで移動させる方法及び装置
JP6089954B2 (ja) 交換時間算出プログラム、情報処理装置、および交換時間算出方法
JP6068296B2 (ja) 制御装置、計算資源管理方法及び計算資源管理プログラム
US9043274B1 (en) Updating local database and central database
JP2016076072A (ja) 障害通報装置、障害通報方法及び障害通報プログラム
JP2017069897A (ja) ネットワーク監視装置、ネットワーク監視システムおよびネットワーク監視方法
US10904324B2 (en) Computer system and method of controlling data processing
CN111897626A (zh) 一种面向云计算场景的虚拟机高可靠系统和实现方法
WO2012102727A1 (en) Distributing information
JP2020021432A (ja) 制御方法、制御装置および制御プログラム
JP2014229135A (ja) 制御装置、計算資源管理方法及び計算資源管理プログラム
US20210183529A1 (en) Method and system for managing operation associated with an object on iot enabled devices