JP2011259032A - 監視システム - Google Patents

監視システム Download PDF

Info

Publication number
JP2011259032A
JP2011259032A JP2010129260A JP2010129260A JP2011259032A JP 2011259032 A JP2011259032 A JP 2011259032A JP 2010129260 A JP2010129260 A JP 2010129260A JP 2010129260 A JP2010129260 A JP 2010129260A JP 2011259032 A JP2011259032 A JP 2011259032A
Authority
JP
Japan
Prior art keywords
monitoring
state change
change history
synchronization
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010129260A
Other languages
English (en)
Inventor
Hiromasa Shibuya
弘征 澁谷
Tetsuya Kimura
哲也 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2010129260A priority Critical patent/JP2011259032A/ja
Publication of JP2011259032A publication Critical patent/JP2011259032A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Small-Scale Networks (AREA)

Abstract

【課題】監視者のユーザの負担が少ないネットワーク監視システムを提供する。
【解決手段】ネットワーク上に接続された監視対象機器の監視を行うネットワーク監視システムを用いる。このネットワーク監視システムは、複数の監視サーバを備える。この複数の監視サーバは、監視対象機器から、それぞれが別々に状態情報を取得する。また、この監視サーバのいずれかは、取得した状態情報をすべて記憶する履歴発生テーブルを備え、さらに、履歴発生テーブルから、同一のイベントを選択する同期プロセス部を備える。この同一のイベントは、別途、履歴テーブルに記憶される。
【選択図】図2

Description

本発明は、監視装置を多重化し、監視対象装置の状態変化履歴情報を管理するネットワーク監視システムに関する。
従来から、ネットワークシステムを構成する機器の状態監視を実現する際には、ICMP(Internet Control Message Protocol)やSNMP(Simple Network Management Protcol)プロトコルを用いることが一般的である(例えば、特許文献1を参照)。
具体的には、一般的な名称でNMS(Network Management Station)と呼ばれる監視サーバが、ICMPプロトコルによるPingコマンドやSNMPプロトコルによるGetコマンドを、各監視対象機器に対して送信し、その応答を得ることで監視対象機器の各種状態情報を取得、管理する。
監視サーバから監視対象機器に対し状態情報を問い合わせる方式を、ポーリング方式と呼ぶ。
SNMPプロトコルによる監視では、監視サーバ側にSNMPマネージャ機能、監視対象機器側にSNMPエージェント機能が必要となる。
後者はL3SW、L2SWなどのネットワーク中継機器やWindows(登録商標)系OS、Linux(登録商標)などの一般的なOSに実装されていることが多い。
SNMPプロトコルによる監視においては、監視対象機器側があらかじめ設定された状態変化の検出により、自発的に監視サーバに対して状態情報を送信することもできる。
これをトラップ方式と呼ぶ。
ポーリング方式、トラップ方式の何れも、監視サーバ側で管理する監視対象機器の状態変化検出日時としては、新しい状態情報を得たタイミングで監視サーバ自体のシステム時刻を元に付与することが一般的である。
特開2000−22714号公報
ここで、監視サーバ自体の障害に備え、監視サーバを冗長化することが行われている。以下、冗長化された監視サーバのそれぞれを「系」と呼ぶ。
このような監視サーバの冗長化構成においては、複数の系が同時に稼働状態となるアクティブ−アクティブ方式をとることができる。
この場合、監視サーバが管理する監視対象機器の状態変化検出日時が、系毎に異なってしまう問題が発生する。
これは、各系が非同期で行うポーリング動作や、監視対象機器から取得するトラップ情報の処理タイミングのずれに起因する。
検出時間が異なる同一検出結果が複数あることは、システム運用上好ましくない。すなわち、監視者などのユーザはどちらの検出結果が適切であるのか分からず混乱の原因となるという問題があった。
本発明は、このような状況に鑑みてなされたものであり、上述の課題を解消することを課題とする。
本発明の監視システムは、ネットワークに接続された監視対象機器の監視を行う監視システムであって、前記監視対象機器からそれぞれ別々に状態変化履歴情報を取得する複数の監視装置を備え、前記複数の監視装置のいずれかは、前記複数の監視装置が取得したすべての状態変化履歴情報を記憶する記憶部と、前記記憶部に記憶された状態変化履歴情報うち、同一の状態変化を示す状態変化履歴情報が複数ある場合には、それら複数の状態変化履歴情報の中から一つの状態変化履歴情報を選択し、同一の状態変化を示す状態変化履歴情報がない場合には、当該状態変化履歴情報を選択して、状態変化履歴管理情報を生成する同期処理を行う同期処理部とを備えたことを特徴とする。
本発明によれば、ネットワーク監視システムのユーザが得る状態変化履歴情報が単一化されるため、システム運用に悪影響を及ぼすことがない監視システムを提供することができる。
本発明の実施の形態に係るネットワーク監視システムYのシステム構成図である。 本発明の実施の形態に係る監視サーバ11、12の制御構成を示すブロック図である。 本発明の実施の形態に係る監視プロセス部111の処理(自系が監視情報を取得した際の処理)のフローチャートである。 本発明の実施の形態に係る監視プロセス部111の処理(他系から状態変化通知を取得した際の処理)のフローチャートである。 本発明の実施の形態に係る同期処理のフローチャートである。 本発明の実施の形態に係るテーブル記憶例を示す概念図である。
<実施の形態>
〔ネットワーク監視システムYの制御構成〕
以下で、本発明の実施の形態に係るネットワーク監視システムYの制御構成について、図面を参照して詳しく説明する。
図1を参照すると、本実施形態のネットワーク監視システムYは、監視サーバ群10と、監視モニタ20、21と、時刻サーバ30と、監視対象機器40−1〜40−nとが、ネットワーク1にて接続されて構成されている。
このうち、監視サーバ群10は、監視サーバ11、12のように、二重化されたネットワーク監視装置により構成されている。
ネットワーク1は、インターネットや専用線ネットワーク等のIPネットワークである。また、ネットワーク1は、LAN(Local Area Network)/WAN(Wide Area Network)を問わない。なお、ネットワーク1は、必要に応じてネットワーク経路が冗長化されていても良い。
このネットワーク1を介して、各装置は、TCP/IPやUDP等の各種のプロトコルのデータをパケット単位で送受信可能である。
監視サーバ11、12は、PC/AT互換機や専用機等の汎用コンピュータに専用ソフトウェアを実装したサーバである。具体的には、監視サーバ11、12は、CPU(Central Processing Unit)やDSP(Digital Signal Processor)やGPU(Graphics Processing Unit)等の制御部、RAM(Random Access Memory)やROM(Read Only Memory)やHDD(Hard Disk Drive)やフラッシュメモリ等の記憶部、ネットワーク1に接続するLANカードや無線LANカード等のネットワーク接続部を備えている。更に、監視サーバ11、12は、キーボードやポインティングデバイス等の入力部、液晶ディスプレイやPDPやプロジェクタ等の表示部等を備えることもできる。
また、監視サーバ11、12は、Windows(登録商標)サーバやLinux(登録商標)等のOS(Operating System)等を備えており、ネットワーク1のようなIPネットワークに各種プロトコルで接続・通信可能である。
この上で、監視サーバ11、12上では、監視対象機器40−1〜40−nを監視し、記憶部に記憶された監視状態を報知するためのネットワーク監視プログラムを制御部がハードウェア資源を用いて実行している。
監視サーバ11、12は、監視対象機器40−1〜40−nの状態を監視する機能および状態変化(イベント)の履歴を管理する機能等を備える。
また、監視サーバ11、12は、監視サーバ11が第1の系統(1系)のネットワーク監視装置であり、監視サーバ12が第2の系統(2系)のネットワーク監視装置である。
図1においては、監視サーバ群10は、監視サーバ11、12の障害を想定した冗長化構成を示している。
監視サーバ群10を構成する監視サーバ11、12のそれぞれを系と呼び、これらはアクティブ−アクティブ方式で動作する。一部の系が障害のために非稼働となっても残りの系でネットワーク監視を可能とする。
なお、監視サーバ11、12以外にも、同様の構成の監視サーバを備えるような構成も可能である。すなわち、監視サーバは3台以上でもよい。
また、監視サーバ11、12を接続するネットワーク自体も二重化し、2系統にて接続することもできる。
監視モニタ20、21は、ネットワーク監視の状況を示す、例えば、汎用コンピュータに専用ソフトウェアを実装した、ネットワーク監視モニタ装置である。監視モニタ20、21は、大型の液晶ディスプレイ、LED(Light Emitting Diode)プロジェクタ等の表示部を複数実装してもよい。
具体的には、監視モニタ20、21は、監視対象機器の現在状態を画面に表示する機能を備える。ここでは、監視モニタ20は監視サーバ11にネットワーク1を介して接続され、監視モニタ21は監視サーバ12にネットワーク1を介して接続されている。なお、本実施形態では、後述するように、このような場合であっても監視モニタ20、21において同一の状態変化の履歴を表示させることができる。
監視モニタ20、21は、監視サーバ11、12が検出した監視対象機器40−1〜40−nの状態変化をリアルタイムで表示に反映する。これを現在状態表示機能と呼ぶ。
たとえば、監視モニタ20、21は、すべての監視対象機器40−1〜40−nを表す図面などが表示された状態で、状態変化が検出された監視対象機器の表示色を変更したり、あるいは、表示を点滅させたりするなど、強調表示を行う。
さらに、監視モニタ20、21は、ユーザ操作により、接続された監視サーバ11、12の後述する同期済み状態変化履歴管理テーブル134に保持された監視対象機器40−1〜40−nの状態変化履歴管理情報を時系列で画面に表示する機能を備える。これを状態変化履歴表示機能と呼ぶ。たとえば、監視モニタ20、21は状態変化履歴情報を画面に一覧表示させる。
なお、監視モニタ20、21は、監視サーバ群10の何れかの系と通信を行って動作すればよく、通信確立中の系に対して定期的なヘルスチェックを行って、障害を検出する。
また、監視モニタ20、21は、通信確立中の系の障害発生時には、当該系との接続を切断の上、自動的に別の系との通信確立を試みる。
監視モニタ20、21と監視サーバ11、12との通信は、ネットワーク1の環境下で可能な範囲内であれば方式を問わない。ただし、現在状態表示機能でリアルタイム性を重視する場合、通信の起点は監視サーバ側とするのが好適である。
状態変化履歴表示機能は、ユーザ操作がトリガ(動作誘因)となることから、通信の起点は監視モニタ20、21側となる。
監視対象機器40−1〜40−nのヘルス(状態)チェックについては、その目的上、通信の起点は監視モニタ20、21側となる。
また、監視モニタ20、21は、状態変化の履歴表示を、ユーザの操作に基づかず、自動的に表示してもよい。
時刻サーバ30は、NTP(Network Time Protcol)プロトコル等による時刻配信機能を持つサーバである。
時刻サーバ30は、監視サーバ11および監視サーバ12のシステム時刻同期のための時刻データの供給元として機能する。
これにより、監視サーバ11、12間の設定時刻のずれを、例えば1秒以内に抑えることが可能である。
監視対象機器40−1〜40−nは、ネットワーク監視システムYの監視サーバ11、12の監視対象を示す。これらは、ネットワーク1に接続されている(以下、監視対象機器を特定しない場合は監視対象機器40という。)。
監視対象機器40は、ICMP、SNMPプロトコルに対応する、例えば、L(Layer)2スイッチ、L(Layer)3スイッチ、パーソナルコンピュータ、通信機器、各種センサ、ネットワークカメラ等である。また、各監視対象機器には、1つ以上の監視項目が存在し、例えば、死活状態や接続状態などがある。
死活状態は、ネットワーク監視により得られる、当該監視対象機器40が稼働しているか否かを示す状態である。また、接続状態は、当該監視対象機器40が接続されているか否かを示す状態である。
〔監視サーバ11、12の構成〕
次に、図2を参照して、監視サーバ11、12の構成について説明する。
監視サーバ11、12は、処理を実行する処理プロセス部110、情報を保存・管理する共有メモリ部120、データベース部130を含んで構成される。
このうち、データベース部130は、監視モニタ20、21や他系の監視サーバから直接アクセスが可能である。
処理プロセス部110は、専用ソフトウェアのプログラム、ルーチン、オブジェクト、クラス、プロセス、スレッド等(以下、プロセス等と呼ぶ。)の部位である。
処理プロセス部110は、監視プロセス部111、同期プロセス部112、監視モニタインターフェース部113、及び他系監視サーバインターフェース部114を含んで構成される。
監視プロセス部111は、監視対象機器40−1〜40−nに対するICMPやSNMPを用いた定期的なポーリング動作や状態変化発生時のトラップ取得により、これらの状態監視を行うプロセス等である。
また、処理プロセス部110は自系が接続された監視モニタ20、21に対して状態変化の通知を行う。
これにより、監視モニタ20、21は、現在状態を表示することができ、監視モニタ20、21は、現在状態表示機能を発揮する。
同期プロセス部112は、監視プロセス部111が取得した監視対象機器40−1〜40−nの状態変化履歴情報と、他系の監視プロセス部111が取得する同情報にそれぞれ付与された状態変化検出日時のずれを解決すべく、後述する図5に示す同期処理を行うプロセス等である。
なお、監視モニタ20、21の状態変化履歴表示機能は、同期処理後の状態変化履歴情報に基づいて実行される。
監視モニタインターフェース部113は、監視プロセス部111が検出した監視対象機器40−1〜40−nの状態変化を、自系に接続された監視モニタ20、21に通知するプロセス等である。
他系監視サーバインターフェース部114は、自系の監視プロセス部111が検出した監視対象機器40−1〜40−nの状態変化を、他系監視サーバに通知するプロセス等である。
共有メモリ部120は、監視サーバ11、12からアクセスするRAM、フラッシュメモリ、HDD等の記憶媒体である。
共有メモリ部120は、現在状態管理テーブル121を備えている。
現在状態管理テーブル121は、監視対象機器40−1〜40−nの全ての監視項目について、監視サーバが保持している最新の状態情報を保持するものである。
データベース部130は、状態情報や各種データを記憶するデータベースである。データベース部130は、MySQL(登録商標)やPostgre SQL等のSQLサーバを備えている。データベース部130は、履歴データ等のデータベースのテーブルを記憶して備え、また履歴データを同期させるための設定値等も記憶して備えている。
データベース部130は、同期処理設定管理テーブル131、同期期間算出情報管理テーブル132、状態変化履歴保存テーブル133、及び同期済み状態変化履歴管理テーブル134を含んで構成される。
同期処理設定管理テーブル131は、同期プロセス部112の処理に関わる各種設定情報を保持、記憶するテーブルである。
同期期間算出情報管理テーブル132は、同期プロセス部112が処理対象とする状態変化履歴情報の期間範囲を決定するための同期期間算出情報(時間情報)を保持、記憶するテーブルである。
具体的に、同期期間算出情報管理テーブル132は、同期プロセス部112による同期処理の対象期間の始点となる時刻情報(前回の対象期間の末尾決定情報)を、同期期間算出情報として保持、記憶する。
データベース部130の状態変化履歴保存テーブル133は、監視対象機器40−1〜40−nの全ての監視項目について、自系および他系が検出した状態変化履歴情報を保持、記憶するテーブルである。
データベース部130の同期済み状態変化履歴管理テーブル134は、状態変化履歴保存テーブル133が保持する監視対象機器40−1〜40−nの全ての監視項目について、同期プロセス部112の処理後の状態変化履歴情報を管理、記憶するテーブルである。
監視モニタ20、21は、状態変化履歴表示機能において、同期済み状態変化履歴管理テーブル134を参照する。
〔本発明の実施の形態に係る監視プロセス部111の処理〕
次に、図3と図4とを参照して、監視サーバ11又は12の監視プロセス部111の処理を説明する。この処理は、監視サーバ11又は12において、同様に行う。
なお、図3の処理は自系が監視情報を取得した際の処理であり、図4の処理は他系から状態変化通知を取得した際の処理である。
まず、ステップS201において、監視プロセス部111は、ICMPやSNMPによる監視処理により、監視対象機器40−1〜40−nのいずれかの監視項目の最新状態を、当該監視対象機器40からネットワーク1を介して取得する。
次に、ステップS202において、監視プロセス部111は、現在状態参照処理を行う。ここでは、現在状態管理テーブル121を参照し、ステップS201で取得した最新状態と同一の監視項目の直前の状態を取得する。
次に、ステップS203において、監視プロセス部111は、ステップS201で取得した最新状態とS202で取得した直前の状態を比較して、状態変化の有無を判定する。監視プロセス部111は、取得した監視対象機器の死活状態や接続状態の変化があった場合に、Yes、すなわち状態変化があると判定する。それ以外の場合、Noと判定する。
Yes、すなわち状態変化がある場合、監視プロセス部111は、ステップS204に処理を進める。
No、すなわち状態変化がない場合、監視プロセス部111は、自系が監視情報を取得した際の処理を終了する。
状態変化がある場合、ステップS204において、監視プロセス部111は、現在状態更新処理を行う。
具体的には、監視プロセス部111は、現在状態管理テーブル121の当該監視項目の状態を、ステップS201で取得した最新状態に更新して記憶する。
次に、ステップS205において、監視プロセス部111は、状態変化履歴保存(自系)処理を行う。
ここでは、ステップS203で検出した状態変化に、自系のシステム時刻に基づいた時刻データを付与し、状態変化履歴情報として自系のデータベース部130の状態変化履歴保存テーブル133に追加、記憶する。
次に、ステップS206において、監視プロセス部111は、状態変化履歴保存(他系)処理を行う。
ここでは、ステップS205と同様に、自系のシステム時刻に基づいた時刻を付与した状態変化履歴情報を、他系のデータベース部130の状態変化履歴保存テーブル133に送信して保持、記憶させる。
すなわち、監視プロセス部111は、自系のデータベース部130の状態変化履歴保存テーブル133と、他系のデータベース部130の状態変化履歴保存テーブル133には、同一の状態変化履歴情報を記憶する。
次に、ステップS207において、監視プロセス部111は、他系監視サーバ状態変化通知処理を行う。
具体的には、監視プロセス部111は、ステップS203で検出した状態変化の情報を、他系の監視サーバ11又は12に対して通知する。この通知は、他系監視サーバインターフェース部114を介して行う。
他系の監視サーバ11又は12は、この通知を受信すると、図4の他系から通知された状態変化の情報を取得した場合の処理を開始する。
次に、ステップS208において、監視プロセス部111は、監視モニタ状態変化通知処理を行う。
具体的には、監視プロセス部111は、ステップS203で検出した状態変化の情報を、自系と通信確立中の監視モニタ20、21に対して通知する。
この際、監視モニタインターフェース部113が介在する。監視モニタ20、21は、ここで得た通知に基づいて現在状態表示機能を動作させる。
以上により、自系の監視プロセス部111が監視情報を取得した際の処理を終了する。
次に、図4を参照して、監視サーバ11又は12の監視プロセス部111が他系から通知された状態変化の情報を取得した際の処理について説明する。
まず、ステップS211において、監視プロセス部111は、他系監視サーバ状態変化通知取得処理を行う。
具体的に、監視プロセス部111は、上述のステップS207で他系となる監視サーバが検出して通知した監視対象機器40−1〜40−nのいずれかの監視項目の状態変化の情報を取得し、その後、以下の処理を開始する。
次に、ステップS212において、監視プロセス部111は、現在状態参照処理を行う。
具体的には、監視プロセス部111は、現在状態管理テーブル121を参照し、ステップS211で最新状態を取得した監視項目の直前の状態を取得する。
この処理は、図3のステップS202と同様である。
次に、ステップS213において、監視プロセス部111は、上述のステップS211で取得した最新状態と、ステップS212で取得した直前の状態を比較して、状態変化の有無を判定する。この処理は、図3のステップS203と同様である。
Yes、すなわち状態変化がある場合は、監視プロセス部111は、ステップS214に処理を進める。
No、すなわち状態変化がない場合は、監視プロセス部111は、他系から通知された状態変化の情報を取得した際の処理を終了する。
状態変化がある場合は、ステップS214において、監視プロセス部111は、現在状態更新処理を行う。
具体的には、現在状態管理テーブル121の当該監視項目の状態を、ステップS211で取得した最新状態に更新する。この処理は、図3のステップS204と同様である。
次に、ステップS215において、監視プロセス部111は、監視モニタへの状態変化通知処理を行う。
具体的には、ステップS213で検出した状態変化の情報を、自系と通信確立中の監視モニタ20、21に対して通知する。
この際、監視プロセス部111は、監視モニタインターフェース部113を介して行う。なお、この処理は、図3のステップS208と同様である。
監視モニタ20は、この通知から得た状態変化の情報用いて、現在状態表示を行う。
以上により、自系の監視プロセス部111が他系から通知された状態変化の情報を取得した際の処理を終了する。
〔本発明の実施の形態に係る同期プロセス部112の同期処理〕
次に、図5と図6とを参照して、監視サーバ11又は12の同期プロセス部112の同期処理について説明する。この同期処理は、監視サーバ11又は12において、同様に行う。
まず、ステップS301において、同期プロセス部112は、定期実行開始処理を行う。
具体的に、同期プロセス部112は、タイマを用いて、定期実行タイミングを判断する。
このタイマに設定する時間間隔は、データベース部130の同期処理設定管理テーブル131に設定情報として格納、記憶しておく。また、この時間間隔は、例えば数秒間隔であり、監視サーバ11、12の負荷を考慮して設定変更することができる。
この上で、同期プロセス部112は、同期処理設定管理テーブル131の情報に基づいて定期実行を開始する。
次に、ステップS302において、同期プロセス部112は、同期期間算出情報参照処理を行う。
ここでは、同期プロセス部112は、同期期間算出情報管理テーブル132から、同期期間算出情報を参照する。
次に、ステップS303において、同期プロセス部112は、同期処理対象期間決定処理を行う。
ここでは、同期プロセス部112は、同期期間算出情報管理テーブル132を参照して得られた同期期間算出情報と、自系内の現在のシステム時刻および同期処理設定管理テーブル131に保持された所定時間Tとに基づいて、同期処理対象期間Xを決定する。
同期処理算出情報は、前回の処理で下記の式(2)により算出された前回の同期処理対象期間X−1の末尾の時刻(前回の現在時刻から所定時間Tを引いた時間)である。
ここで、具体的に、同期処理対象期間Xの算出について説明する。
同期プロセス部112は、具体的には、下記の式(1)及び式(2)を満たす期間を同期処理対象期間Xとする。

同期処理算出情報 ≦ 同期処理対象期間X ・・・ 式(1)
同期処理対象期間X <(現在時刻 − 所定時間T)・・・ 式(2)
上述の式(2)の所定時間Tは、誤差原因時間に基づいて決定されることが好ましい。
この誤差原因時間は、監視サーバ11、12間のシステム時間のずれや、監視サーバ11または12の監視プロセス部111によってイベントが検出されてから、それぞれの状態変化履歴保存テーブル133に保存されるまでの処理時間差(タイムラグ)等から求めることができる。また、この誤差原因時間は、各種設定情報や各種テストにより得ることができる。
これにより、同期処理対象期間内のタイムスタンプを有するデータが同期処理から漏れることを防止することができる。また、一方の監視サーバ11、12(例えば自系)によって検出されたイベントが状態変化履歴保存テーブル133に保存されているが、他方の監視サーバ11、12(例えば他系)によって検出されるべき同イベントが未だ当該状態変化履歴保存テーブル133に保存されておらず、一方のイベント情報だけが同期処理の対象となり、同期処理すべきイベント情報を取りこぼしてしまう、といった事態を防止することができる。
その結果、タイムスタンプが異なる同一イベントが表示され、監視者(ユーザ)が混乱することを抑止できる。
さらに、所定時間Tは、定期実行するためにタイマに設定する時間間隔よりも長いことが好ましい。
これにより、上述の効果がより確実となる。たとえば、同期処理を実行するための上述の時間間隔が1〜5秒程度であれば、所定時間Tはそれ以上とする。
これら時間間隔と所定時間Tとはシステムの運用状態やサーバの負荷状態を見ながらユーザが設定変更可能である。これにより、上述した効果をより確実に得ることができる。
なお、同期処理算出情報の初期値は、例えば0時でもよいし、初期動作時の現在時刻から所定時間T以上前の時刻でもよい。
次に、ステップS304において、同期プロセス部112は、同期期間算出情報更新処理を行う。
具体的には、同期プロセス部112は、同期期間算出情報管理テーブル132の同期期間算出情報を、上記ステップS303において上述の式(2)で算出された「現在時刻−所定時間T」の時刻に更新する。
次に、ステップS305において、同期プロセス部112は、同期処理対象データ検索処理を行う。
具体的には、同期プロセス部112は、上記ステップS303において決定した同期処理対象期間内の同期処理対象データを、状態変化履歴保存テーブル133から検索する。
次に、ステップS306において、同期プロセス部112は、同期処理対象データがあるか否かを判断する。
Yes、すなわち同期処理対象データが存在した場合、同期プロセス部112は、監視項目毎に同期処理を実施(ステップS400)するため、処理をステップS307に進める。
No、すなわち同期処理対象データがなければ、同期プロセス部112は、同期処理を終了する。
ここで、図6を参照して、ステップS400の監視項目毎の同期処理の説明を行う。
同期プロセス部112は、監視項目毎に、以下のステップS307及びステップS308の処理を、ステップS400の監視項目毎に実行する。
ここで、図6(a)、(b)のテーブル記憶例401、402は、状態変化履歴保存テーブル133から取得した同期処理対象データの例を示す。
このテーブル記憶例401、402は、それぞれ、イベント情報として、イベント番号(No.)、状態変化の検出元の系統がシステム時刻に基づいて付与した時刻データ(状態変化の検出日時)、状態変化の検出元の監視サーバの系統(状態変化の検出元)、状態変化の情報である状態変化後の状態(状態変化後の状態)を記憶する例を示している。
同期処理対象データが存在した場合、まず、ステップS307において、同期プロセス部112は、重複データ排除処理を行う。
この処理において、例えば、図6(a)のテーブル記憶例401に示すように、状態Aへの変化を示す状態変化履歴情報(イベント情報)が複数(ここではNo.1および2)存在する場合、同期プロセス部112は、検出時間が遅いNo.2を排除する。
次に、ステップS308において、同期プロセス部112は、同期済み状態変化履歴保存処理を行う。
この処理では、例えば、図6のテーブル記憶例402に示すように、検出時間が最も早いNo.1のみを同期済み状態変化履歴管理テーブル134に保存することで、履歴の同期を行う。
また、例えば、図6のテーブル記憶例401に示すように、状態Bへの変化を示すイベント情報が複数(ここではNo.3および4)存在する場合、同期プロセス部112は、検出時間が最も早いNo.3のみを同期済み状態変化履歴管理テーブル134に保存する履歴の同期を行う。
さらに、同期プロセス部112は監視項目毎に上述した処理を行う。
その後、同期プロセス部112は、処理を上述のステップS306に戻し、他にも同期処理対象データがある場合には、監視項目毎処理を実行する。
また、同期プロセス部112は、同期処理対象データなしと判定すると(ステップS306のNoルート)、同期処理を終了する。
以上のように本発明の実施の形態に係るネットワーク監視システムYによれば、冗長化された監視サーバが独自に取得、管理する監視対象機器の状態変化履歴情報を合成し、一定のルールに基づいて重複情報を排除の上、参照等の用途に使用することで、上述の課題を解決することができる。
すなわち、ネットワーク1に接続された監視対象機器40の監視のために、監視サーバ11、12を二重化し、アクティブ−アクティブ方式で運用した場合に、各監視サーバ11、12にて検出されたイベントの検出時間に差が生じても、処理プロセス部110の同期プロセス部112は、検出時間が最も早い状態変化履歴情報のみをデータベースに保存し、その他の検出時間が遅い状態変化履歴情報は排除する。
このため、検出時間が異なる同一の検出イベントが複数存在することが防止され、ユーザが混乱することがなくなる。
また、同期プロセス部112は、上記式(1)(2)により、同期処理対象期間を算出するので、同期処理対象期間内のタイムスタンプを有するデータが同期処理から漏れることを防止することができる。
しかも、所定時間Tは誤差原因時間に基づいて設定されるので、上述の効果はより確実なものとなる。
また、所定時間Tは、同期処理の実行時間間隔(実行周期)よりも大きく設定されることにより、上記効果をさらに確実に得ることができる。
さらに、本発明の実施の形態に係るネットワーク監視システムYによれば、監視サーバ11、12は、同期処理に先がけて状態変化を自系に接続された監視モニタ20、21に通知する。
このため、各監視モニタ20、21では、監視サーバ11、12により状態変化が検出されると、状態変化履歴表示前に、すぐに現在状態表示を行うことができる。
よって、ユーザは監視対象機器40に状態変化があったことを即座に知ることができ、その後、同期処理により同期されたより詳細な状態変化履歴情報を確認することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、種々変更して行うことができる。
たとえば、上述した実施の形態では、監視プロセス部111は図3のステップS205において、ステップS203で検出した状態変化に自系のシステム時刻に基づいた時刻を付与する場合を例に挙げた。
しかしながら、ステップS203で状態変化を検出した際に、状態変化履歴情報に自系のシステム時刻に基づいて時刻を付与してもよいし、ステップS201で状態情報を取得した時点で自系のシステム時刻に基づいて時刻を付与してもよい。
また、本発明の実施の形態において、図3におけるステップS205の処理とステップS206の処理のタイミングは前後同時を問わない。
また、本発明の実施の形態において、図3のステップS207の処理とステップS208の処理のタイミングも前後同時を問わない。
また、本発明の実施の形態において、図5のステップS304の処理とステップS305の処理のタイミングは前後同時問わない。
なお、上述した図5の同期処理において、同一の状態変化で同時刻の状態変化履歴情報が複数あった場合には、予め設定された系または自系を採用するように構成すればよい。
また、同一の状態変化を示す状態変化履歴情報が複数なければ、同期処理はなされず、その状態変化履歴情報はそのまま同期済み状態変化履歴管理テーブル134に保存されることは言うまでもない。
また、上述した図5のステップS306における同期処理対象データがあるか否かの判断処理は、同一イベントで検出時刻が異なる状態変化履歴情報が状態変化履歴保存テーブル133に存在するか否かの判断をしてもよいし、状態変化履歴保存テーブル133に監視項目の状態変化履歴情報が存在するか否かだけの判断でもよい。
また、上述した実施の形態では、状態変化履歴保存テーブル133と同期済み状態変化履歴管理テーブル134とを別テーブルで構成した例を示した。しかし、これらテーブル133及び134は一つのテーブルで構成されていてもよい。つまり、同期処理プロセス112により同期処理が実施されると同一イベントの検出時刻が遅い方の情報が、かかるテーブルから削除されるように構成してもよい。この場合、監視モニタ20、21が同期済みの状態変化履歴情報を参照、表示するために、かかるテーブルに同期済みの情報を判別させるためのポインタを設け、監視モニタ20、21がそのポインタに基づいて同期済み状態変化履歴を表示するように構成してもよい。あるいは、監視サーバ11、12が監視モニタ20、21に同期済み期間を通知し、監視モニタ20、21がその情報に基づいてかかるテーブル上の参照領域を決定してもよい。
さらに、上述した実施の形態では、IPネットワークのICNP、SNMPを用いたシステムを例に挙げた。
しかしながら、本発明の実施の形態として、IP(ICNP、SNMP)に限定されず、被監視装置からの監視結果に基づく状態変化履歴情報の時刻を監視装置が決定(付与)するものに広く適用することができる。
なお、上述した実施の形態では、共有メモリ部120に現在状態管理テーブル121を備え、データベース部130に同期処理設定管理テーブル131、同期期間算出情報管理テーブル132、状態変化履歴保存テーブル133、同期済み状態変化履歴管理テーブル134を備えた。
しかしながら、本発明の実施の形態においては、どのテーブルを、どのサーバや構成部位に配置して備えるかは限定されない。
なお、上記実施の形態の構成及び動作は例であって、本発明の趣旨を逸脱しない範囲で適宜変更して実行することができることは言うまでもない。
1 ネットワーク
10 監視サーバ群
11 監視サーバ (1系)
12 監視サーバ (2系)
20、21 監視モニタ
30 時刻サーバ
40−1〜40−n 監視対象機器
110 処理プロセス部
111 監視プロセス部
112 同期プロセス部
113 監視モニタインターフェース部
114 他系監視サーバインターフェース部
120 共有メモリ部
121 現在状態管理テーブル
130 データベース部
131 同期処理設定管理テーブル
132 同期期間算出情報管理テーブル
133 状態変化履歴保存テーブル
134 同期済み状態変化履歴管理テーブル
401、402 テーブル記憶例
Y ネットワーク監視システム

Claims (1)

  1. ネットワークに接続された監視対象機器の監視を行う監視システムであって、
    前記監視対象機器からそれぞれ別々に状態変化履歴情報を取得する複数の監視装置を備え、
    前記複数の監視装置のいずれかは、
    前記複数の監視装置が取得したすべての状態変化履歴情報を記憶する記憶部と、
    前記記憶部に記憶された状態変化履歴情報うち、同一の状態変化を示す状態変化履歴情報が複数ある場合には、それら複数の状態変化履歴情報の中から一つの状態変化履歴情報を選択し、同一の状態変化を示す状態変化履歴情報がない場合には、当該状態変化履歴情報を選択して、状態変化履歴管理情報を生成する同期処理を行う同期処理部とを備えた
    ことを特徴とする監視システム。
JP2010129260A 2010-06-04 2010-06-04 監視システム Pending JP2011259032A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010129260A JP2011259032A (ja) 2010-06-04 2010-06-04 監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010129260A JP2011259032A (ja) 2010-06-04 2010-06-04 監視システム

Publications (1)

Publication Number Publication Date
JP2011259032A true JP2011259032A (ja) 2011-12-22

Family

ID=45474773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010129260A Pending JP2011259032A (ja) 2010-06-04 2010-06-04 監視システム

Country Status (1)

Country Link
JP (1) JP2011259032A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014178842A (ja) * 2013-03-14 2014-09-25 Mitsubishi Electric Corp ネットワーク装置及び状態変化通知方法
JP2016095428A (ja) * 2014-11-14 2016-05-26 京セラドキュメントソリューションズ株式会社 画像形成装置の検査用設定値取得方法、及び画像形成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014178842A (ja) * 2013-03-14 2014-09-25 Mitsubishi Electric Corp ネットワーク装置及び状態変化通知方法
JP2016095428A (ja) * 2014-11-14 2016-05-26 京セラドキュメントソリューションズ株式会社 画像形成装置の検査用設定値取得方法、及び画像形成装置

Similar Documents

Publication Publication Date Title
US10122605B2 (en) Annotation of network activity through different phases of execution
US9246777B2 (en) Computer program and monitoring apparatus
CN105653425B (zh) 基于复杂事件处理引擎的监控系统
US20160013990A1 (en) Network traffic management using heat maps with actual and planned /estimated metrics
CN112416581B (zh) 定时任务的分布式调用系统
CN105099763B (zh) 设备掉线提醒方法和装置
CN114996085A (zh) 一种基于Prometheus的实时业务监控方法和系统
JP2023503736A (ja) シーン検出方法及び装置、電子機器、コンピュータ記憶媒体
JP2011259032A (ja) 監視システム
US9697067B2 (en) Monitoring system and monitoring method
CN105975384B (zh) 分布式进程的监控方法和装置
US10334017B2 (en) Tracking a status of a file transfer using feedback files corresponding to file transfer events
CN114553867A (zh) 一种云原生的跨云网络监控方法、装置及存储介质
JP2010231293A (ja) 監視装置
US20230244579A1 (en) Event-driven system failover and failback
JP5501278B2 (ja) フィルタリング装置、フィルタリング方法、フィルタリングプログラム
JP2012059193A (ja) 監視制御システム、およびこれに利用する監視制御装置、監視制御方法
JP2015210737A (ja) 監視方法、監視装置および監視制御プログラム
JP2015082131A (ja) 監視システム、監視方法、監視プログラム及び監視装置
CN116405376A (zh) 一种服务器管理方法、装置、设备及机器可读存储介质
JP6513001B2 (ja) 故障検知装置、故障検知方法、及びプログラム
CN114422396A (zh) 一种dns服务器管理方法、装置、电子设备及存储介质
JP6275542B2 (ja) 分析装置およびコンピュータプログラム
JP6752744B2 (ja) 監視装置および監視プログラム
JP2015114991A (ja) データ処理装置、データ処理装置監視方法およびデータ処理システム