JP5364600B2 - 監視制御システム、被監視制御装置およびサーバ - Google Patents

監視制御システム、被監視制御装置およびサーバ Download PDF

Info

Publication number
JP5364600B2
JP5364600B2 JP2010006985A JP2010006985A JP5364600B2 JP 5364600 B2 JP5364600 B2 JP 5364600B2 JP 2010006985 A JP2010006985 A JP 2010006985A JP 2010006985 A JP2010006985 A JP 2010006985A JP 5364600 B2 JP5364600 B2 JP 5364600B2
Authority
JP
Japan
Prior art keywords
unit
server
monitoring
alarm information
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010006985A
Other languages
English (en)
Other versions
JP2011146989A (ja
Inventor
晶彦 槙
大輔 秋山
芳保 須藤
美江 前原
武志 森谷
昌士 相馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Telecom Networks Ltd
Original Assignee
Fujitsu Telecom Networks Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Telecom Networks Ltd filed Critical Fujitsu Telecom Networks Ltd
Priority to JP2010006985A priority Critical patent/JP5364600B2/ja
Publication of JP2011146989A publication Critical patent/JP2011146989A/ja
Application granted granted Critical
Publication of JP5364600B2 publication Critical patent/JP5364600B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ネットワークの輻輳を抑制できる監視制御システム、被監視制御装置およびサーバに関する。
従来、ネットワークを輻輳させることなく、サーバなどによる被監視制御装置の監視制御を行う様々な技術が開発されている。
例えば、特許文献1は、被監視装置は、アラームが大量に発生した場合、集中監視装置からのポーリング信号によるアラームメッセージの送信処理および未送信分のアラームメッセージの蓄積処理を行うことにより、集中監視装置のアラームメッセージ収集処理が輻輳しない技術を開示している。
特開2001−223722号公報
しかしながら、従来技術では、例えば、被監視制御装置の電源投入時や障害からの復旧時等において、やり取りされるポーリング信号やアラームメッセージが大量に送受信されネットワークが輻輳し易い。
また、特許文献1では、ネットワークの輻輳状態が長く続く場合、アラームメッセージはメモリ等の記憶装置に蓄積され記憶装置の容量を超過して、アラームメッセージの一部が欠損してしまう。
上記従来技術が有する問題に鑑み、本発明の目的は、ネットワークの輻輳を抑制し、被監視制御装置に発生した障害の警報情報を欠損なく送受信できる技術を提供することにある。
上記課題を解決するために、本発明の監視制御システムは、複数の被監視制御装置と複数の被監視制御装置を監視制御するサーバとを有する監視制御システムであって、被監視制御装置は、サーバへ生成されたコマンドを送信する送信部と、コマンドに対するサーバからの応答を受信する受信部と、コマンドを送信してから応答を受信するまでの応答時間を計測しネットワークの輻輳状態を監視し、応答時間に基づいてネットワークの輻輳の度合いを示す負荷レベルを決定するネットワーク監視部と、自身に発生する障害を監視し、発生した障害の情報を警報情報として、警報情報の重要性の度合いを示す警報レベルを設定し、負荷レベルおよび警報レベルに応じて、警報情報のサーバへの送信を制御する制御部と、記憶部と、記憶部に記憶された警報情報の容量を監視し、容量が所定の閾値以上になった場合、制御部に通知する容量監視部と、を備え、制御部は、負荷レベルおよび警報レベルに応じて、サーバへの警報情報の送信を見合わせて警報情報を記憶部に記憶するとともに、容量監視部からの通知に基づいて、警報情報を統括して送信し、統括して送信された警報情報を削除する。
また、ネットワーク監視部は、コマンドに対するサーバからの応答が受信された応答確率を算出して、応答時間と応答確率とに基づいてネットワークの輻輳の度合いを示す負荷レベルを決定し、制御部は、警報情報を負荷レベルに応じてサーバへ送信してもよい。
また、制御部は、ネットワーク監視部により負荷レベルが更新された場合、更新された負荷レベルおよび警報レベルに応じて、記憶部に記憶された警報情報をサーバへ送信してもよい。
また、制御部は、負荷レベルおよび警報レベルに応じた送信手順に基づいて、記憶された警報情報をサーバへ送信してもよい。
また、被監視制御装置は、ユーザからの設定指示を受け付ける操作部を備え、送信手順は、ユーザからの設定指示に基づいて設定されてもよい。
本発明の監視制御システムは、複数の被監視制御装置と複数の被監視制御装置を監視制御するサーバとを有する監視制御システムであって、サーバは、被監視制御装置へ生成されたコマンドを送信する送信部と、コマンドに対する被監視制御装置からの応答を受信する受信部と、コマンドを送信してから応答を受信するまでの応答時間を計測しネットワークの輻輳状態を監視するネットワーク監視部と、ネットワークの輻輳状態に応じて被監視制御装置に発生した障害の情報を警報情報としてサーバに送信させるための設定を被監視制御装置に対して行う制御部と、を備える。さらに、サーバは、障害によって影響を受ける他の被監視制御装置に関する影響情報を有し、制御部は、警報情報および影響情報に基づいて、障害による影響を回避するための設定を他の被監視制御装置に対して行う。
本発明の被監視制御装置は、サーバにより監視制御する監視制御システムの被監視制御装置であって、サーバへ生成されたコマンドを送信する送信部と、コマンドに対するサーバからの応答を受信する受信部と、コマンドを送信してから応答を受信するまでの応答時間を計測しネットワークの輻輳状態を監視し、応答時間に基づいてネットワークの輻輳の度合いを示す負荷レベルを決定するネットワーク監視部と、自身に発生する障害を監視し、発生した障害の情報を警報情報として、警報情報の重要性の度合いを示す警報レベルを設定し、負荷レベルおよび警報レベルに応じて、警報情報のサーバへの送信を制御する制御部と、記憶部と、記憶部に記憶された警報情報の容量を監視し、容量が所定の閾値以上になった場合、制御部に通知する容量監視部と、を備え、制御部は、負荷レベルおよび警報レベルに応じて、サーバへの警報情報の送信を見合わせて警報情報を記憶部に記憶するとともに、容量監視部からの通知に基づいて、警報情報を統括して送信し、統括して送信された警報情報を削除する。
本発明のサーバは、複数の被監視制御装置を監視制御する監視制御システムのサーバであって、被監視制御装置へ生成されたコマンドを送信する送信部と、コマンドに対する被監視制御装置からの応答を受信する受信部と、コマンドを送信してから応答を受信するまでの応答時間を計測しネットワークの輻輳状態を監視するネットワーク監視部と、ネットワークの輻輳状態に応じて被監視制御装置に発生した障害の情報を警報情報としてサーバに送信させるための設定を被監視制御装置に対して行う制御部と、を備える。さらに、サーバは、障害によって影響を受ける他の被監視制御装置に関する影響情報を有し、制御部は、警報情報および影響情報に基づいて、障害による影響を回避するための設定を他の被監視制御装置に対して行う。
本発明によれば、ネットワークの輻輳を抑制し、被監視制御装置に発生した障害の警報情報を欠損なく送受信できる。
本発明の一の実施形態に係る監視制御システム100の構成を示すブロック図 一の実施形態の被監視制御装置1およびサーバ2の構成を示すブロック図 一の実施形態に係る監視制御システム100による監視制御処理の流れ図 他の実施形態の被監視制御装置1およびサーバ2の構成を示すブロック図 ネットワーク3の負荷レベルが上がる場合の他の実施形態に係る監視制御システム100による監視制御処理の流れ図 ネットワーク3の負荷レベルが下がる場合の他の実施形態に係る監視制御システム100による監視制御処理の流れ図 他の実施形態の被監視制御装置1の処理動作の流れ図 本発明の他の実施形態の変形例に係る監視制御システム200の構成を示すブロック図 影響情報データの一例を示す図
《一の実施形態の説明》
図1は、本発明の一の実施形態に係る監視制御システム100の構成を示すブロック図である。
本実施形態に係る監視制御システム100は、被監視制御装置1aおよび1b、それら被監視制御装置を監視制御するサーバ2から構成され、ネットワーク3を介して互いに情報伝達可能に接続される。
被監視制御装置1aおよび1bは、ネットワーク3に接続されて動作するデータサーバやルータ等のネットワーク機器である。被監視制御装置1aおよび1bは、図2(a)に示すように、送信部10、受信部11、ネットワーク監視部12、制御部13、記憶部14、容量監視部15を備え、バス16を介して情報伝達可能に接続される。
送信部10は、制御部13の制御指示に基づいて、生成されたコマンドや自装置で発生した障害に関する警報情報等をサーバ2へ送信する。本実施形態では、後述するネットワーク監視部12がネットワーク3の輻輳状態を監視するために、送信部10は、所定の時間間隔で、生成されたコマンドとしてPINGコマンドをサーバ2に送信する。なお、PINGコマンドの代わりに、tracerouteなどの他のコマンドを用いてもよい。
受信部11は、サーバ2からの制御信号やデータとともに、送信部10によって送信されたコマンドに対するサーバ2からの応答信号を受信する。
ネットワーク監視部12は、ネットワーク3の輻輳状態を監視する。具体的には、ネットワーク監視部12は、送信部10がPINGコマンドをサーバ2へ送信し、受信部11がその応答信号を受信するまでの時間を計測する。ネットワーク監視部12は、直近のN回のPINGコマンド送信に対する応答時間の計測に基づいて平均応答時間を算出する(N=2以上の自然数)。同時に、ネットワーク監視部12は、サーバ2からの応答信号を受信部11が受信した受信回数を求め平均到達確率を算出する。例えば、N=5回のPINGコマンド送信に対して、受信部11がサーバ2から応答信号を4回受信した場合、平均到達確率は90%となる。ネットワーク監視部12は、負荷テーブルに基づいて、平均応答時間および平均到達確率からネットワーク3における輻輳の度合いを示す負荷レベルを決定する。
ここで、本実施形態の負荷テーブルとは、負荷レベルの定義を一覧にしたものである。なお、本実施形態における負荷レベルは1から3の3段階とし、平均応答時間が20ミリ秒以下且つ平均到達確率が90%以上の場合を負荷レベル1、平均応答時間が20ミリ秒より長く50ミリ秒以下且つ平均到達確率が50%以上90%より小さい場合を負荷レベル2、直近の応答時間が50ミリ秒より長く且つ直近の到達確率が50%より小さい場合を負荷レベル3と定義する。その負荷テーブルは、記憶部14に記憶される。なお、負荷レベルの定義やレベル数は、監視制御システム100の被監視制御装置1の構成等に応じて適宜決められることが好ましい。
制御部13は、被監視制御装置1aまたは1bの各部を統括的に制御するプロセッサである。制御部13は、例えば、記憶部14に記憶されている制御プログラムに基づいて、被監視制御装置1に発生する障害を監視し、負荷レベルに応じて、その障害の警報情報をサーバ2へ送信したり記憶部14に記憶したりする。例えば、負荷レベルが低い場合、制御部13は、全ての警報情報をサーバ2へ送信する。一方、負荷レベルが高い場合、制御部13は、重大な警報情報をサーバ2へ送信し、軽微な警報情報は記憶部14に記憶する。
また、制御部13は、記憶部14に記憶された警報情報を、負荷レベルおよび警報レベルに応じた送信手順に基づいてサーバ2へ送信する。負荷レベルおよび警報レベルに応じた送信手順は、公知の手法を適宜選択または組み合わせて決定される。公知の手法には、警報レベル等の優先順位に基づいて送信するStrict Priority、各警報レベルの警報情報を所定の数ずつ順次送信するラウンドロビンや加重ラウンドロビン等がある。いずれの手法を用いるかは、ユーザからの設定指示に基づいて決定される。
記憶部14は、ハードディスクや半導体メモリ等から形成され、制御部13によって実行される制御プログラム、負荷テーブル、警報情報およびその発生時刻等を記憶する。さらに、本実施形態の記憶部14は警報テーブルも記憶する。この警報テーブルとは、被監視制御装置1に発生した障害の警報情報を、その障害が与える影響の大きさに応じてレベル分けし一覧にしたテーブルである。本実施形態では、警報情報を警報レベル1〜3の3段階に分けられる。なお、警報レベルの数や各警報レベルに含まれる警報情報等は、被監視制御装置1の構成等に応じて適宜決められる。
容量監視部15は、記憶部14に記憶される警報情報数に基づいて監視する。容量監視部15は、警報情報数が閾値α以上となった場合、記憶部14に記憶されている警報情報が溢れると判定し制御部13に通知する。制御部13は、記憶されている警報情報を統括してサーバ2へ送信する。制御部13は、送信した警報情報を記憶部14から削除する。なお、閾値αは、ユーザからの設定指示に基づいて適宜設定変更される。
次に、本実施形態のサーバ2について説明する。図2(b)は、本実施形態のサーバ2の構成を示すブロック図である。サーバ2は、ネットワーク3を介して、各被監視制御装置1からの警報情報を受信し各被監視制御装置1を監視制御する。サーバ2には、一般的なコンピュータを用いることができる。図2(b)に示すように、サーバ2は、送信部20、受信部21、入出力インタフェース(入出力IF)22、制御部23を備え、バス26を介して情報伝達可能に接続される。さらに、サーバ2には、入出力IF22を介して、キーボード、ポインティングデバイス等の入力装置24、および、モニタなどの出力装置25が接続されている。入出力IF22は、入力装置24から各種入力を受け付けるとともに、出力装置25に対して表示用のデータを出力する。
送信部20は、制御部23の制御指示や入力装置24で受け付けた指示等に基づいて、生成されたコマンドやデータを被監視制御装置1へ送信する。また、送信部20は、受信部21が被監視制御装置1からPINGコマンド等を受信した場合、その応答信号を送信する。
受信部21は、被監視制御装置1からのデータや警報情報、PINGコマンド等を受信する。
制御部23は、サーバ2の各部動作を統括的に制御するプロセッサである。この制御部23は、監視制御プログラムの実行によって、被監視制御装置1を監視制御する。
次に、図3の流れ図を参照しつつ、本実施形態の監視制御システム100による監視制御処理について説明する。なお、以下において、被監視制御装置1aとサーバ2との間の処理を例に説明するが、被監視制御装置1bとサーバ2との間についても同様の処理が行われる。また、本実施形態の被監視制御装置1aおよび1bのネットワーク監視部12は、あらかじめN回のPINGコマンドの送信に対する平均応答時間<ta>および<tb>、平均到達確率<Pa>および<Pb>をそれぞれ有することを前提とする。
ステップS10:送信部10は、制御部13の制御指示に基づいて、生成されたPINGコマンドをサーバ2へ送信する。
ステップS11:ネットワーク監視部12は、送信されたPINGコマンドに対するサーバ2からの応答信号を、受信部11が受信したか否かを判定する。受信部11が応答信号を受信した場合、ネットワーク監視部12は、送信されたPINGコマンドに対する応答時間を計測する。ネットワーク監視部12は、例えば、今回の応答時間を含めたN回のPINGコマンドの送信に対する平均応答時間<ta>および平均到達確率<Pa>を算出し更新する。
一方、受信部11が応答信号を受信できなかった場合、ネットワーク監視部12は、応答時間を不定とする。ネットワーク監視部12は、例えば、今回を含めない(N−1)回のPINGコマンドの送信に対する平均応答時間<ta>および平均到達確率<Pa>を算出し更新する。
ステップS12:ネットワーク監視部12は、負荷テーブルに基づいて、算出した平均応答時間<ta>および平均到達確率<Pa>から、ネットワーク3の負荷レベルを決定する。
ステップS13:制御部13は、自身の被監視制御装置1aに障害が発生したか否かを判定する。被監視制御装置1aに障害が発生した場合、制御部13は、発生時刻を取得しステップS17(YES側)へ移行する。障害が発生していない場合、制御部13は、ステップS14(NO側)へ移行する。
ステップS14:制御部13は、ステップS12で決定された負荷レベルが、前回の負荷レベルと比べて更新されたか否かを判定する。負荷レベルが更新された場合、制御部13は、ステップS15(YES側)へ移行する。一方、更新されなかった場合、制御部13は、ステップS10(NO側)へ移行し、送信部10に次のPINGコマンドをサーバ2へ送信させる。
ステップS15:制御部13は、通知レベルが負荷レベル以上か否かを判定する。ここで、通知レベルとは、警報情報を記憶部14に記憶するよりもサーバ2へ送信することを優先させる度合いであり、通知設定に応じて警報レベルと次式(1)〜(3)のように関係付けられる。
通知レベル=警報レベル (デフォルト) …(1)
通知レベル=警報レベル+1 (負荷優先) …(2)
通知レベル=警報レベル−1 (通知優先) …(3)
なお、本実施形態における通知設定には、デフォルト、負荷優先、通知優先の3つある。式(1)は、通知設定がデフォルトで通常の設定である。式(2)は、通知設定が負荷優先の場合で、ネットワーク3の負荷を軽減するために、警報情報を記憶部14に記憶させることを優先する設定である。式(3)は、通知設定が通知優先の場合で、警報情報をサーバ2へ送信することを優先する設定である。被監視制御装置1aは、ユーザの設定指示に基づいて、いずれかの通知設定に設定される。なお、通知設定の数や、通知レベルと警報レベルとの関係は、監視制御システム100や被監視制御装置1の構成等に応じて適宜決められることが好ましい。
そして、通知レベルが負荷レベル以上の場合、制御部13は、ステップS16(YES側)へ移行する。通知レベルが負荷レベルより小さい場合、ステップS10(NO側)へ移行し、送信部10に次のPINGコマンドをサーバ2へ送信させる。
ステップS16:制御部13は、負荷レベルおよび警報レベルに応じた送信手順に基づいて、送信部10に、記憶された警報情報を発生時刻とともにサーバ2へ送信させる。制御部13は、ステップS10へ移行し、送信部10に次のPINGコマンドをサーバ2へ送信させる。
ステップS17:制御部13は、発生した障害の警報情報を生成する。制御部13は、例えば、被監視制御装置1aのポート1の開閉に関する障害の場合、ポート1開放警報やポート1閉塞警報を生成し、被監視制御装置1aの冷却用のファン1が停止した場合、ファン1故障警報を生成する。制御部13は、警報テーブルに基づいて、生成された警報情報のレベル分けを行い設定する。すなわち、制御部13は、例えば、ポート1開放警報やポート1閉塞警報のような軽微な故障の場合、警報テーブルに基づいて警報レベル1または2に設定する。一方、ファン1故障警報等のような重大な故障の場合。制御部13は、警報テーブルに基づいて警報レベル3に設定する。
ステップS18:制御部13は、通知設定および式(1)〜(3)に基づいて、通知レベルを算出し、通知レベルが負荷レベル以上か否かを判定する。通知レベルが負荷レベル以上の場合、制御部13は、ステップS19(YES側)へ移行する。通知レベルが負荷レベルより小さい場合、ステップS20(NO側)へ移行する。
ステップS19:制御部13は、負荷レベルに応じて、送信部10に警報情報を発生時刻とともにサーバ2へ送信したり、記憶部14に記憶する。例えば、負荷レベルが1の場合、制御部13は、警報レベルが1〜3全ての警報情報をサーバ2へ送信する。また、負荷レベルが2の場合、制御部13は、警報レベルが2および3の警報情報を送信し、報レベルが1の警報情報は記憶部14に記憶する。制御部13は、一連の処理を終了する。
ステップS20:容量監視部15は、記憶部14に記憶されている警報情報数が閾値α以上か否かを判定する。警報情報数が閾値α以上の場合、容量監視部15は、制御部13にその旨の通知をする。制御部13は、その旨の通知を受信するとステップS22(YES側)へ移行する。一方、警報情報数は閾値αより少ない場合、制御部13は、ステップS21(NO側)へ移行する。
ステップS21:制御部13は、警報情報を記憶部14に記憶し一連の処理を終了する。
ステップS22:制御部13は、記憶されている複数の警報情報および発生時刻を統括してサーバ2へ送信する。例えば、被監視制御装置1aは、記憶部14に警報情報として、(1)ポート1開放警報、(2)ポート2閉塞警報、(3)ポート1閉塞警報、(4)ファン1故障警報、(5)ポート1設定変更警報、(6)ポート2設定変更警報、(7)ポート4開放警報の7つの警報情報を記憶しているとする。1,2,3,7の各警報情報は、ポートの開放・閉塞に関する警報情報である。制御部13は、「(1,2,3,7)ポートの開放閉塞警報」として1つに括った統括警報を生成する。同様に、5,6の各警報情報は、設定変更に関する警報情報である。制御部13は、「(5,6)ポートの設定変更警報」として1つに括った統括警報を生成する。また、制御部13は、「(4)ファン1故障警報」それ自身で1つに括った統括警報を生成する。制御部13は、送信部10に生成した3つの統括警報をサーバ2へ送信させる。制御部13は、統括警報として送信した7つの警報情報および発生時刻を記憶部14から削除し、今回の警報情報および発生時刻を記憶部14に記憶する。制御部13は、一連の処理を終了する。
このように、本実施形態では、被監視制御装置1自身が、ネットワーク3の輻輳状態を監視し、その輻輳状態に応じて警報情報の送信を制御することにより、ネットワーク3の輻輳を抑制し警報情報を欠損なく送受信できる。
また、被監視制御装置1は、負荷レベルおよび警報レベルに応じた送信手順に基づいて、警報情報をサーバ2へ送信したり記憶部14に記憶し、重要性の低い警報情報の送信を見合わせることにより、ネットワーク3の輻輳を回避することができる。
また、被監視制御装置1は、記憶部14に記憶されている警報情報を、その警報情報の容量が閾値α以上になった場合、警報情報を統括して送信することから、ネットワーク3の輻輳を回避することができる。
《他の実施形態の説明》
本発明の他の実施形態に係る監視制御システムは、一の実施形態に係る監視制御システム100の構成と同一である。図1の一の実施形態に係る監視制御システム100を、本実施形態に係る監視制御システムとして説明する。
図4は、本実施形態に係る監視制御システム100を構成する(a)被監視制御装置1、(b)サーバ2それぞれのブロック図を示す。なお、本実施形態の被監視制御装置1およびサーバ2それぞれにおいて、一の実施形態のものと同じ動作をするものについては同一の符号を付し詳細な説明は省略する。
本実施形態の監視制御システム100と一の実施形態のものと異なる点は、1)ネットワーク3の輻輳状態を監視するネットワーク監視部27がサーバ2に配置される、2)制御部23は、被監視制御装置1を制御するコマンドとしてポーリング信号を生成し、送信部20に被監視制御装置1a−1eに順次送信させる。ネットワーク監視部27は、そのポーリング信号に対する応答信号を受信するまでの時間を応答時間として計測し、平均応答時間を算出する、3)ネットワーク監視部27は、負荷テーブルを用いず、平均応答時間のみに基づいて負荷レベルを決定する。サーバ2は、負荷レベルが更新された場合、負荷レベルの更新通知を被監視制御装置1に対して行う。
次に、図5および図6の流れ図を参照し、本実施形態に係る監視制御システム100による監視制御処理について、A)ネットワーク3の負荷レベルが上がる場合、B)ネットワーク3の負荷レベルが下がる場合のそれぞれについて説明する。
なお、以下において、サーバ2と被監視制御装置1aとの間の処理を例にして説明するが、サーバ2と被監視制御装置1bとの間についても同様の処理が行われる。また、本実施形態では、サーバ2のネットワーク監視部27が、あらかじめN回のポーリング信号送信に基づいて求めた各被監視制御装置1aおよび1bの平均応答時間<ta>および<tb>を有する。また、ネットワーク監視部27は、閾値Ths=β×<ta>を算出し保持している。ここで、βは閾値係数で2などの任意の値であり、監視制御システム100の構成やサーバ2の処理能力等に応じて設定される。
A)ネットワーク3の負荷レベルが上がる場合
ステップS30:送信部20は、制御部23の制御指示に基づいて、ポーリング信号を被監視制御装置1aへ送信する。
ステップS31:ネットワーク監視部27は、送信されたポーリング信号に対する被監視制御装置1aからの応答信号を、受信部21が受信したか否かを判定する。受信部21が応答信号を受信した場合、ネットワーク監視部27は、送信されたポーリング信号に対する応答時間tを計測する。一方、受信部21が応答信号を受信できなかった場合、ネットワーク監視部27は、応答時間を不定とする。
ステップS32:ネットワーク監視部27は、計測された応答時間tが閾値Thsより小さいか否かを判定する。応答時間tが閾値Thsより小さい場合、ネットワーク監視部27は、ネットワーク3は輻輳状態にないと判定して、ステップS33(YES側)へ移行する。一方、応答時間tが閾値Ths以上または応答時間tが不定の場合、ネットワーク監視部27は、ネットワーク3は輻輳状態であると判定して、ステップS35(NO側)へ移行する。
ステップS33:ネットワーク監視部27は、今回の応答時間tを含めた平均応答時間<ta>を前回の平均応答時間<ta>’を用いて、次式(4)のように算出し更新する。
<ta>=(<ta>’×(N−1)+t)/N …(4)
また、ネットワーク監視部27は、式(4)で求めた平均応答時間<ta>に閾値係数βをかけて閾値Thsを算出し更新する。
ステップS34:ネットワーク監視部27は、輻輳状態と判定する回数を数えるパラメータgを0にリセットする。なお、パラメータgの初期値は0とする。
ステップS35:ネットワーク監視部27は、平均応答時間<ta>および閾値Thsを更新せず保持する。ネットワーク監視部27は、パラメータgを1加算して更新する。
ステップS36:ネットワーク監視部27は、パラメータgが所定値G以上か否かを判定する。パラメータgが所定値G以上の場合、ネットワーク監視部27はステップS37(YES側)へ移行する。一方、パラメータgが所定値Gより小さい場合、ネットワーク監視部27はステップS30(NO側)へ移行し、送信部20は、制御部23の制御指示に応じて、次のポーリング信号を被監視制御装置1aへ送信する。なお、所定値Gは、5などの任意の値であり、監視制御システム100の構成やサーバ2の処理能力等に応じて設定されることが好ましい。
ステップS37:ネットワーク監視部27は、ネットワーク3が輻輳状態になったと判定し負荷レベルを1つ上げる。ネットワーク監視部27は、パラメータg=Gと設定する。制御部23は、被監視制御装置1aおよび1bに負荷レベルの更新を通知する。被監視制御装置1aおよび1bは、負荷レベルの更新通知を受信し設定する。制御部23は一連の処理を終了する。
B)ネットワーク3の負荷レベルが下がる場合
ステップS40:送信部20は、制御部23の制御指示に基づいて、被監視制御装置1aにポーリング信号を被監視制御装置1aへ送信する。なお、パラメータg=Gに設定されているとする。
ステップS41:ネットワーク監視部27は、送信されたポーリング信号に対する被監視制御装置1aからの応答信号を、受信部21が受信したか否かを判定する。受信部21が応答信号を受信した場合、ネットワーク監視部27は、送信されたポーリング信号に対する応答時間tを計測する。一方、受信部21が応答信号を受信できなかった場合、ネットワーク監視部27は、応答時間を不定とする。
ステップS42:ネットワーク監視部27は、計測された応答時間tが閾値Thsより小さいか否かを判定する。応答時間tが閾値Thsより小さい場合、ネットワーク監視部27は、ネットワーク3は輻輳状態にないと判定して、ステップS45(YES側)へ移行する。一方、応答時間tが閾値Ths以上または応答時間tが不定の場合、ネットワーク監視部27は、ネットワーク3は輻輳状態であると判定して、ステップS45(NO側)へ移行する。
ステップS43:ネットワーク監視部27は、式(4)を用いて、今回の応答時間tを含めた平均応答時間<ta>および閾値Thsを算出し更新する。
ステップS44:ネットワーク監視部27は、パラメータgを所定値Gにリセットする。
ステップS45:ネットワーク監視部27は、平均応答時間<ta>および閾値Thsを更新せず保持する。ネットワーク監視部27は、パラメータgを1減算して更新する。
ステップS46:ネットワーク監視部27は、パラメータgが0以下か否かを判定する。パラメータgが0以下の場合、ネットワーク監視部27はステップS47(YES側)へ移行する。一方、パラメータgが0より大きい場合、ネットワーク監視部27はステップS40(NO側)へ移行し、送信部20は、制御部23の制御指示に応じて、次のポーリング信号を被監視制御装置1aへ送信する。
ステップS47:ネットワーク監視部27は、ネットワーク3が輻輳状態が解消されたと判定し負荷レベルを1つ下げる。ネットワーク監視部27は、パラメータg=0と設定する。制御部23は、被監視制御装置1aおよび1bに負荷レベルの更新を通知する。被監視制御装置1aおよび1bは、負荷レベルの更新通知を受信し設定する。制御部23は一連の処理を終了する。
次に、図7の流れ図を参照し、上記AまたはBの場合において、サーバ2から負荷レベルの更新通知を受信した被監視制御装置1aおよび1bの処理動作について説明する。なお、以下において、被監視制御装置1aとサーバ2との間の処理を例にして説明するが、被監視制御装置1bとサーバ2との間についても同様の処理が行われる。
ステップS50:制御部13は、受信部11がサーバ2から負荷レベルの更新通知を受信したか否かを判定する。負荷レベルの更新通知を受信した場合、制御部13はステップS51(YES側)へ移行する。一方、受信しなかった場合、制御部13はステップS52(NO側)へ移行する。
ステップS51:制御部13は、負荷レベルを更新し設定する。
なお、以下のステップS52〜ステップS61の処理は、図3に示す一の実施形態のステップS13〜ステップS22と同一であるから詳細な説明は省略する。
このように、本実施形態では、サーバ2がネットワーク3の輻輳状態を監視しその輻輳状態を被監視制御装置1に通知設定して、被監視制御装置1がその輻輳状態に応じて警報情報の送信を制御することにより、ネットワーク3の輻輳を抑制し警報情報を欠損なく送受信できる。
《他の実施形態の変形例の説明》
図8は、本発明の他の実施形態に係る監視制御システム100の変形例として、監視制御システム200の構成を示すブロック図である。
本実施形態に係る監視制御システム200において、他の実施形態に係る監視制御システム100の構成要素と同じ動作をするものは、同一の符号を付し詳細な説明は省略する。また、被監視制御装置1a〜1eおよびサーバ2の構成は、図5に示す他の実施形態のものと同一であり詳細な説明は省略する。
本実施形態の監視制御システム200と他の実施形態の監視制御システム100と異なる点は、サーバ2が、各被監視制御装置1a〜1eのいずれかで障害が発生した場合、その障害によって影響を受ける他の被監視制御装置1a〜1eを、警報レベルに応じて一覧にした影響情報データを不図示の記憶部に有する(図9)。図9は、影響情報データの一例を示す。すなわち、図9に示すように、影響情報データは、1列目に示す各被監視制御装置1a〜1eに障害が発生した場合、障害の警報レベルに応じて、サーバ2とのデータの送受信に影響を受ける他の被監視制御装置1を2列目〜4列目にそれぞれ示す。なお、本実施形態のサーバ2は、記憶部(不図示)に各被監視制御装置1a〜1eが有する警報テーブルも有することを前提とする。
これにより、例えば、被監視制御装置1aに障害が発生した場合、サーバ2の受信部21は、被監視制御装置1aから警報情報を受信する。制御部23は、警報テーブルに基づいて受信した警報情報の警報レベルを決定する。制御部23は、影響情報データに基づいて、被監視制御装置1aで発生した上記障害によって、サーバ2に対する警報情報の送信に影響を受ける他の被監視制御装置1を特定する。制御部23は、特定された他の被監視制御装置1に対して、上記影響を回避するための設定(例えば、他の被監視制御装置1に警報情報の送信を見合わせさせるために、一時的に負荷レベルを上げる等)を行う。上記被監視制御装置1aが障害から復旧した場合、制御部23は、他の被監視制御装置1に対して元の設定に戻す。
このように、本実施形態では、サーバ2がネットワーク3の輻輳状態を監視しその輻輳状態を被監視制御装置1に通知設定して、被監視制御装置1がその輻輳状態に応じて警報情報の送信を制御することにより、ネットワーク3の輻輳を抑制し警報情報を欠損なく送受信できる。
また、サーバ2が、一の被監視制御装置1で障害が発生した場合、その障害によって影響を受ける他の被監視制御装置1に対して、その影響を回避する設定を行うことで、より効果的にネットワークの輻輳を抑制することができる。
《実施形態の補足事項》
(1)上記実施形態では、被監視制御装置1またはサーバ2が、ネットワーク3の輻輳状態を監視したが、本発明はこれに限定されず、被監視制御装置1およびサーバ2の双方がネットワーク3の輻輳状態を監視してもよい。これにより、より効率的にネットワーク3の輻輳を抑制し警報情報を欠損なく確実に送受信できる。
(2)上記実施形態では、各種設定変更をユーザからの設定指示に基づいて行うとしたが、そのユーザからの設定指示は、例えば、被監視制御装置1に接続されるキーボード等のコマンドラインインタフェース(CLI)や、サーバ2のSNMP(Simple Network Management Protocol)や、WEBベース等から受け付けるのが好ましい。これにより、用途や環境に応じた設定や変更が可能となる。
(3)上記実施形態では、容量監視部15が警報情報数に基づいて記憶部14の容量を監視したが、本発明はこれに限定されず、警報情報の記憶容量に基づいて監視してもよい。
(4)上記一の実施形態では、ネットワーク監視部12が、負荷テーブルに基づいて、算出した平均応答時間および平均到達確率からネットワーク3の負荷レベルを決定したが、本発明はこれに限定されない。例えば、ネットワーク監視部12は、今回の応答時間を含めたN回のPINGコマンドの送信に対する平均応答時間<ta>および平均到達確率<Pa>を算出すると同時に、今回の応答時間を含めた直近のM(<N)回のPINGコマンドの送信に対する直近の応答時間taおよび到達確率Paを算出する。ネットワーク監視部12は、平均応答時間<ta>と直近の応答時間taとの比較、および、平均到達確率<Pa>と直近の到達確率Paとの比較に基づいて、ネットワーク3の負荷レベルを決定してもよい。
(5)上記他の実施形態では、制御部23が、被監視制御装置1を制御するコマンドとしてポーリング信号を生成したが、本発明これに限定されず、一般的な制御コマンドを生成し被監視制御装置1に送信してもよい。
(6)上記他の実施形態では、ネットワーク監視部27は、平均応答時間のみに基づいてネットワーク3の輻輳状態を監視したが、本発明はこれに限定されない。例えば、ネットワーク監視部27は、平均応答時間とともに平均到達確率に基づいてネットワーク3の輻輳状態を監視してもよい。
以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲が、その精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図する。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずであり、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物によることも可能である。
1a〜1e 被監視制御装置、2 サーバ、3 ネットワーク、10、20 送信部、11、21 受信部、12、27 ネットワーク監視部、13、23 制御部、14 記憶部、15 容量監視部、22入出力IF、24 入力装置、25 出力装置、100、200 監視制御システム

Claims (8)

  1. 複数の被監視制御装置と前記複数の被監視制御装置を監視制御するサーバとを有する監視制御システムであって、
    前記被監視制御装置は、
    前記サーバへ生成されたコマンドを送信する送信部と、
    前記コマンドに対する前記サーバからの応答を受信する受信部と、
    前記コマンドを送信してから前記応答を受信するまでの応答時間を計測し前記ネットワークの輻輳状態を監視し、前記応答時間に基づいて前記ネットワークの輻輳の度合いを示す負荷レベルを決定するネットワーク監視部と、
    自身に発生する障害を監視し、発生した前記障害の情報を警報情報として、前記警報情報の重要性の度合いを示す警報レベルを設定し、前記負荷レベルおよび前記警報レベルに応じて、前記警報情報の前記サーバへの送信を制御する制御部と
    記憶部と、
    前記記憶部に記憶された警報情報の容量を監視し、前記容量が所定の閾値以上になった場合、前記制御部に通知する容量監視部と、を備え、
    前記制御部は、前記負荷レベルおよび前記警報レベルに応じて、前記サーバへの前記警報情報の送信を見合わせて前記警報情報を前記記憶部に記憶するとともに、前記容量監視部からの前記通知に基づいて、前記警報情報を統括して送信し、統括して送信された前記警報情報を削除する
    ことを特徴とする監視制御システム。
  2. 請求項1に記載の監視制御システムにおいて、
    前記ネットワーク監視部は、前記コマンドに対する前記サーバからの応答が受信された応答確率を算出して、前記応答時間と前記応答確率とに基づいて前記ネットワークの輻輳の度合いを示す負荷レベルを決定し、
    前記制御部は、前記警報情報を前記負荷レベルに応じて前記サーバへ送信する
    ことを特徴とする監視制御システム。
  3. 請求項1または請求項2に記載の監視制御システムにおいて
    前記制御部は、前記ネットワーク監視部により前記負荷レベルが更新された場合、更新された前記負荷レベルおよび前記警報レベルに応じて、前記記憶部に記憶された前記警報情報前記サーバへ送信するとを特徴とする監視制御システム。
  4. 請求項1ないし請求項3のいずれか1項に記載の監視制御システムにおいて、
    前記制御部は前記負荷レベルおよび前記警報レベルに応じた送信手順に基づいて、前記記憶された警報情報を前記サーバへ送信することを特徴とする監視制御システム。
  5. 請求項4に記載の監視制御システムにおいて、
    前記被監視制御装置は、ユーザからの設定指示を受け付ける操作部を備え、
    前記送信手順は、前記ユーザからの設定指示に基づいて設定され
    ことを特徴とする監視制御システム。
  6. 複数の被監視制御装置と前記複数の被監視制御装置を監視制御するサーバとを有する監視制御システムであって、
    前記サーバは、
    前記被監視制御装置へ生成されたコマンドを送信する送信部と、
    前記コマンドに対する前記被監視制御装置からの応答を受信する受信部と、
    前記コマンドを送信してから前記応答を受信するまでの応答時間を計測し前記ネットワークの輻輳状態を監視するネットワーク監視部と、
    前記ネットワークの輻輳状態に応じて前記被監視制御装置に発生した障害の情報を警報情報として前記サーバに送信させるための設定を前記被監視制御装置に対して行う制御部と、を備え、
    前記サーバは、前記障害によって影響を受ける他の前記被監視制御装置に関する影響情報を有し、
    前記制御部は、前警報情報および前記影響情報に基づいて、前記障害による影響を回避するための設定を前記他の被監視制御装置に対して行う
    とを特徴とする監視制御システム。
  7. サーバにより監視制御する監視制御システムの被監視制御装置であって、
    前記サーバへ生成されたコマンドを送信する送信部と、
    前記コマンドに対する前記サーバからの応答を受信する受信部と、
    前記コマンドを送信してから前記応答を受信するまでの応答時間を計測して前記ネットワークの輻輳状態を監視し、前記応答時間に基づいて前記ネットワークの輻輳の度合いを示す負荷レベルを決定するネットワーク監視部と、
    自身に発生する障害を監視し、発生した前記障害の情報を警報情報として、前記警報情報の重要性の度合いを示す警報レベルを設定し、前記負荷レベルおよび前記警報レベルに応じて、前記警報情報の前記サーバへの送信を制御する制御部と、
    記憶部と、
    前記記憶部に記憶された警報情報の容量を監視し、前記容量が所定の閾値以上になった場合、前記制御部に通知する容量監視部と、を備え、
    前記制御部は、前記負荷レベルおよび前記警報レベルに応じて、前記サーバへの前記警報情報の送信を見合わせて前記警報情報を前記記憶部に記憶するとともに、前記容量監視部からの前記通知に基づいて、前記警報情報を統括して送信し、統括して送信された前記警報情報を削除
    とを特徴とする監視制御装置
  8. 複数の被監視制御装置を監視制御する監視制御システムのサーバであって、
    前記被監視制御装置へ生成されたコマンドを送信する送信部と
    前記コマンドに対する前記被監視制御装置からの応答を受信する受信部と、
    前記コマンドを送信してから前記応答を受信するまでの応答時間を計測し前記ネットワークの輻輳状態を監視するネットワーク監視部と、
    前記ネットワークの輻輳状態に応じて前記被監視制御装置に発生した障害の情報を警報情報として前記サーバに送信させるための設定を前記被監視制御装置に対して行う制御部と、を備え、
    前記サーバは、前記障害によって影響を受ける他の前記被監視制御装置に関する影響情報を有し、
    前記制御部は、前記警報情報および前記影響情報に基づいて、前記障害による影響を回避するための設定を前記他の被監視制御装置に対して行う
    ことを特徴とするサーバ
JP2010006985A 2010-01-15 2010-01-15 監視制御システム、被監視制御装置およびサーバ Expired - Fee Related JP5364600B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010006985A JP5364600B2 (ja) 2010-01-15 2010-01-15 監視制御システム、被監視制御装置およびサーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010006985A JP5364600B2 (ja) 2010-01-15 2010-01-15 監視制御システム、被監視制御装置およびサーバ

Publications (2)

Publication Number Publication Date
JP2011146989A JP2011146989A (ja) 2011-07-28
JP5364600B2 true JP5364600B2 (ja) 2013-12-11

Family

ID=44461438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010006985A Expired - Fee Related JP5364600B2 (ja) 2010-01-15 2010-01-15 監視制御システム、被監視制御装置およびサーバ

Country Status (1)

Country Link
JP (1) JP5364600B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6244816B2 (ja) * 2013-03-26 2017-12-13 日本電気株式会社 データ収集管理システム、データ収集管理方法、端末及び管理装置
KR101646029B1 (ko) * 2016-03-28 2016-08-23 주식회사 비알인포텍 Cctv 전원제어장치
US10423500B2 (en) 2016-06-01 2019-09-24 Seagate Technology Llc Technologies for limiting performance variation in a storage device

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0746240A (ja) * 1993-08-03 1995-02-14 Nippon Telegr & Teleph Corp <Ntt> 通信網管理システム
JP2870469B2 (ja) * 1996-01-31 1999-03-17 日本電気株式会社 ネットワーク監視システム及び輻輳回避方法
JPH1028151A (ja) * 1996-07-10 1998-01-27 Matsushita Electric Ind Co Ltd ネットワーク負荷適応型イベント報告装置
JPH10336276A (ja) * 1997-06-05 1998-12-18 Nec Corp ネットワーク管理システム
JPH11308271A (ja) * 1998-04-21 1999-11-05 Canon Inc データ通信装置及び受信装置及び制御方法及び記憶媒体及びデータ通信システム
JPH1196091A (ja) * 1997-09-22 1999-04-09 Nippon Telegr & Teleph Corp <Ntt> 通信制御方法、通信制御装置及び通信制御プログラムを記録した記録媒体
JP3608972B2 (ja) * 1999-04-02 2005-01-12 富士通株式会社 オペレーションシステムの輻輳制御装置
JP4101993B2 (ja) * 1999-12-03 2008-06-18 三菱電機株式会社 有線無線混在網データ配信装置及び有線無線混在網データ配信方法
JP2001223694A (ja) * 2000-02-07 2001-08-17 Fujitsu Ltd ネットワーク監視システム
JP4869160B2 (ja) * 2007-06-07 2012-02-08 アラクサラネットワークス株式会社 パケット中継装置
JP4455658B2 (ja) * 2008-09-03 2010-04-21 株式会社東芝 ネットワーク監視システムとそのノード装置および監視装置

Also Published As

Publication number Publication date
JP2011146989A (ja) 2011-07-28

Similar Documents

Publication Publication Date Title
JP5418250B2 (ja) 異常検出装置、プログラム、及び異常検出方法
US20160013990A1 (en) Network traffic management using heat maps with actual and planned /estimated metrics
US20160011925A1 (en) Annotation of network activity through different phases of execution
US8171134B2 (en) Methods and apparatus to characterize and predict network health status
US20110239226A1 (en) Controlling congestion in message-oriented middleware
JP2009171265A (ja) 監視制御方法および監視制御装置
JP5364600B2 (ja) 監視制御システム、被監視制御装置およびサーバ
US11374851B2 (en) Methods and apparatus for controlling and making link bundle advertisements to support routing decisions
JP4423104B2 (ja) リソース負荷測定方法、ネットワーク制御装置、通信ノード及び記憶媒体
JP5229007B2 (ja) 監視システム、ネットワーク機器、監視情報提供方法およびプログラム
JP2010231293A (ja) 監視装置
JP2014041404A (ja) ターミナルサービス監視装置
JP5207326B2 (ja) 通信装置、経路選択方法及びプログラム
JP5483784B1 (ja) 制御装置、計算資源管理方法及び計算資源管理プログラム
JP4968568B2 (ja) 障害監視方法、障害監視システムおよびプログラム
Hsieh et al. A Simulated Annealing-based Efficient Failover Mechanism for Hierarchical SDN Controllers
JP5418184B2 (ja) 宅内機器管理システムおよび宅内機器管理方法
US7908546B2 (en) Methods and apparatus for detection of performance conditions in processing system
JP5884918B2 (ja) ネットワーク管理装置、システム、および方法
US20240073156A1 (en) Detecting shortfalls in an agreement between a publisher and a subscriber
JP2010231292A (ja) 監視装置
JP5964762B2 (ja) オペレーションシステム、警報監視方法及び警報監視方法をオペレーションシステムのコンピュータに実行させるプログラム
JP5552929B2 (ja) 電文送信制御プログラム、通信装置及び電文送信制御方法
KR101614223B1 (ko) Sdn 환경에서 플로우를 모니터링하는 방법
JP5603836B2 (ja) 保守管理装置、保守管理方法、および保守管理用プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120329

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees