JP6752744B2 - 監視装置および監視プログラム - Google Patents

監視装置および監視プログラム Download PDF

Info

Publication number
JP6752744B2
JP6752744B2 JP2017056373A JP2017056373A JP6752744B2 JP 6752744 B2 JP6752744 B2 JP 6752744B2 JP 2017056373 A JP2017056373 A JP 2017056373A JP 2017056373 A JP2017056373 A JP 2017056373A JP 6752744 B2 JP6752744 B2 JP 6752744B2
Authority
JP
Japan
Prior art keywords
response
observation
value
memory
recorded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017056373A
Other languages
English (en)
Other versions
JP2018160773A (ja
Inventor
健太郎 ▲高▼村
健太郎 ▲高▼村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Information Network Corp
Original Assignee
Mitsubishi Electric Information Network Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Information Network Corp filed Critical Mitsubishi Electric Information Network Corp
Priority to JP2017056373A priority Critical patent/JP6752744B2/ja
Publication of JP2018160773A publication Critical patent/JP2018160773A/ja
Application granted granted Critical
Publication of JP6752744B2 publication Critical patent/JP6752744B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Selective Calling Equipment (AREA)

Description

本発明は、監視装置および監視プログラムに関するものである。
特許文献1に記載の技術では、拠点ごとにルータおよびスイッチ等の監視対象機器の監視および制御を可能とする管理エージェントが配置され、ネットワーク管理システムは管理エージェントのみを監視する。各監視対象機器の制御を行う場合には、ネットワーク管理システムは、管理エージェントに対して指示を行い、管理エージェントが各監視対象機器に対して制御コマンドを実行し、結果のみをネットワーク管理システムに通知する。
特開2008−117096号公報
特許文献1に記載の技術では、一部の監視対象機器が応答できない状態であっても、管理エージェントが応答できる状態であれば、残りの監視対象機器の監視に影響は生じないが、管理エージェントの設置によるコスト増が課題となる。
本発明は、管理エージェントの設置を不要とし、かつ、一部の監視対象機器が応答できない状態であっても、残りの監視対象機器の監視に影響が生じないようにすることを目的とする。
本発明の一態様に係る監視装置は、
周期ごとに起動され、要求を発信して、設定時間内に応答があれば応答の内容に応じた値を観測値としてメモリに記録し、前記設定時間内に応答がなければ仮値を観測値として前記メモリに記録する観測処理を、各周期内で複数の監視対象機器に対して順番に実行する観測処理部と、
周期ごとに起動され、同じ周期内で前記メモリに記録された観測値を用いて演算を行い、演算結果を前記メモリに記録する後処理を、各周期内で前記観測処理の後に実行する後処理部と、
前記観測処理で前記仮値が前記メモリに記録されたときに起動され、前記設定時間よりも長い応答待ち時間内に応答があれば応答に応じた値を確定値として前記メモリに記録し、前記応答待ち時間内に応答がなければ応答なしの状態に応じた値を確定値として前記メモリに記録する個別処理を、前記観測処理で応答がなかった監視対象機器に対して実行し、前記メモリに記録された確定値を用いて、前記メモリに記録された演算結果を更新する個別処理部とを備える。
前記観測処理部は、前記個別処理が実行されている監視対象機器に対しては前記観測処理を省略する。
前記観測処理部は、応答なしの状態に応じた値を前記仮値に設定する。
前記観測処理部は、過去の応答の内容に応じた値を用いて前記仮値を算出する。
前記後処理部は、前記観測値を閾値と比較し、比較結果に応じて前記演算を行い、
前記観測処理部は、前記閾値を前記仮値に設定する。
前記観測処理部は、過去の応答にかかった時間に応じて前記設定時間を設定する。
前記観測処理部は、前記後処理が起動される時刻から前記設定時間を逆算する。
前記後処理部は、前記観測値を表示するグラフを作成し、作成したグラフを前記演算結果として前記メモリに記録する。
本発明の一態様に係る監視プログラムは、
コンピュータに、
周期ごとに起動され、要求を発信して、設定時間内に応答があれば応答の内容に応じた値を観測値としてメモリに記録し、前記設定時間内に応答がなければ仮値を観測値として前記メモリに記録する観測処理を、各周期内で複数の監視対象機器に対して順番に実行させ、
周期ごとに起動され、同じ周期内で前記メモリに記録された観測値を用いて演算を行い、演算結果を前記メモリに記録する後処理を、各周期内で前記観測処理の後に実行させ、
前記観測処理で前記仮値が前記メモリに記録されたときに起動され、前記設定時間よりも長い応答待ち時間内に応答があれば応答に応じた値を確定値として前記メモリに記録し、前記応答待ち時間内に応答がなければ応答なしの状態に応じた値を確定値として前記メモリに記録する個別処理を、前記観測処理で応答がなかった監視対象機器に対して実行させ、
前記メモリに記録された確定値を用いて、前記メモリに記録された演算結果を更新する。
本発明では、観測処理で応答がない監視対象機器については仮値を観測値として用いて後処理を実行しておき、個別処理で応答があれば応答に応じた値を確定値として用いて後処理の演算結果を更新する。このため、従来技術のような管理エージェントの設置を不要とし、かつ、一部の監視対象機器が応答できない状態であっても、残りの監視対象機器の監視に影響が生じないようにすることができる。
実施の形態1に係る監視装置による観測の例を示す図。 実施の形態1に係る監視装置の構成を示すブロック図。 観測プロセスの例を示す図。 比較例における観測プロセスの例を示す図。 比較例における観測プロセスの例を示す図。 比較例の処理フローと実施の形態1の処理フローとを示す図。 実施の形態1に係る監視装置の観測プロセスの例を示す図。 実施の形態1に係る監視装置の動作を示すフローチャート。 実施の形態1に係る監視装置の観測手順を示すフローチャート。 実施の形態1に係る監視装置の個別観測手順を示すフローチャート。 実施の形態1に係る監視装置により作成されるグラフの例を示す図。 実施の形態1に係る監視装置の監視状況を表示する画面の例を示す図。
以下、本発明の実施の形態について、図を用いて説明する。各図中、同一または相当する部分には、同一符号を付している。実施の形態の説明において、同一または相当する部分については、説明を適宜省略または簡略化する。なお、本発明は、以下に説明する実施の形態に限定されるものではなく、必要に応じて種々の変更が可能である。例えば、以下に説明する実施の形態は、部分的に実施されても構わない。
実施の形態1.
本実施の形態について、図1から図12を用いて説明する。
図1に示すように、監視装置10は、PingまたはSNMPによる観測を一定周期で繰り返して複数の監視対象機器20の死活監視および性能監視の少なくともいずれかを行う。「SNMP」は、Simple Network Management Protocolの略語である。Pingに用いられるプロトコルは、ICMPである。「ICMP」は、Internet Control Message Protocolの略語である。なお、観測に用いられるプロトコルは、本実施の形態のために独自に規定されたプロトコル等、ICMPおよびSNMP以外のプロトコルでもよい。
図示していないが、監視装置10は、インターネット等のネットワークを介して各監視対象機器20と接続される。各監視対象機器20は、任意の機器でよいが、本実施の形態ではサーバまたはネットワーク機器である。
***構成の説明***
図2を参照して、本実施の形態に係る監視装置10の構成を説明する。
監視装置10は、コンピュータである。監視装置10は、プロセッサ11を備えるとともに、メモリ12、入力装置13、ディスプレイ14および通信装置15といった他のハードウェアを備える。プロセッサ11は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。
監視装置10は、機能要素として、観測処理部31と、後処理部32と、個別処理部33とを備える。観測処理部31、後処理部32および個別処理部33の機能は、ソフトウェアにより実現される。
プロセッサ11は、各種処理を行うICである。「IC」は、Integrated Circuitの略語である。プロセッサ11は、例えば、CPUである。「CPU」は、Central Processing Unitの略語である。
メモリ12には、観測の周期ごとに記録される複数の観測値41と、観測の周期ごとに演算結果として作成されるグラフ42と、必要に応じて記録される確定値43とが記憶される。メモリ12は、例えば、フラッシュメモリまたはRAMである。「RAM」は、Random Access Memoryの略語である。
入力装置13は、例えば、マウス、キーボードまたはタッチパネルである。
ディスプレイ14は、例えば、LCDである。「LCD」は、Liquid Crystal Displayの略語である。
通信装置15は、データを受信するレシーバおよびデータを送信するトランスミッタを含む。通信装置15は、例えば、通信チップまたはNICである。「NIC」は、Network Interface Cardの略語である。
メモリ12には、観測処理部31、後処理部32および個別処理部33の機能を実現するプログラムである監視プログラムが記憶されている。監視プログラムは、プロセッサ11に読み込まれ、プロセッサ11によって実行される。メモリ12には、OSも記憶されている。「OS」は、Operating Systemの略語である。プロセッサ11は、OSを実行しながら、監視プログラムを実行する。なお、監視プログラムの一部または全部がOSに組み込まれていてもよい。
監視プログラムおよびOSは、補助記憶装置に記憶されていてもよい。補助記憶装置は、例えば、フラッシュメモリまたはHDDである。「HDD」は、Hard Disk Driveの略語である。補助記憶装置に記憶されている監視プログラムおよびOSは、メモリ12にロードされ、プロセッサ11によって実行される。
監視装置10は、プロセッサ11を代替する複数のプロセッサを備えていてもよい。これら複数のプロセッサは、監視プログラムの実行を分担する。それぞれのプロセッサは、プロセッサ11と同じように、各種処理を行うICである。
観測処理部31、後処理部32および個別処理部33の処理の結果を示す情報、データ、信号値および変数値は、メモリ12、補助記憶装置、または、プロセッサ11内のレジスタまたはキャッシュメモリに記憶される。
監視プログラムは、観測処理部31、後処理部32および個別処理部33により実行される処理をコンピュータに実行させるプログラムである。監視プログラムは、コンピュータ読取可能な媒体に記録されて提供されてもよいし、プログラムプロダクトとして提供されてもよい。
***動作の説明***
図3から図5を参照して、比較例における監視の動作を説明する。その後、図6および図7を参照して、本実施の形態に係る監視装置10の動作に関し、主に比較例との差を説明する。
比較例においても、PingまたはSNMPによる観測が周期的に繰り返されて複数の監視対象機器20の死活監視および性能監視の少なくともいずれかが行われる。具体的には、各監視対象機器20に周期的にPingまたはSNMPによる要求が送信され、その要求に対する応答の有無または応答の内容によって各監視対象機器20の生死判定または負荷状況が把握される。
多数の監視対象機器20に対して観測を効率的に行うために、複数の観測プロセスが並列に実行され、観測を分担する仕組みが用いられる。
図3は、観測プロセスの例を示している。全監視対象機器20の観測が複数のプロセスで分担して行われる。図3の例では、AからFの6つの監視対象機器20に対して2プロセスで並行して観測が行われる。1プロセスでは、3つの監視対象機器20に対して直列に観測が行われる。具体的には、それぞれA→C→E、B→D→Fの順で観測が行われる。すべてのプロセスの観測が終わると、後処理が実施される。後処理は、観測結果に基づくグラフ作成である。図3の例では、観測の周期が5分であるため、0時0分の観測の後は、0時5分で再び観測が開始され、以降、23時55分まで5分ごとに同様の観測が行われる。
個々の観測において、監視対象機器20の応答速度は、監視対象機器20の性能、ネットワーク経路上の他の機器の性能、および、負荷状況によって変動するため、応答の有無の誤判断が生じないよう余剰にバッファを持ったタイムアウト時間とリトライ回数とが設定される。このような仕組みが用いられているため、同時期に大量にネットワーク障害が発生した場合、多数の監視対象機器20について応答待ち時間が発生し、後続周期の観測ができなくなったり、監視対象機器20からの応答の取りこぼしが発生したりする。その結果、監視品質および開示情報品質の低下が発生してしまう。ここでいう応答待ち時間とは、タイムアウト時間とリトライ回数との積のことである。
図4は、応答待ち時間の発生により、後続周期の観測ができなくなる例を示している。0時0分の観測において、Cが障害発生等の理由により応答不能となっている。応答がないため、タイムアウト時間分の待ちC1が発生する。リトライ回数が2回に設定されていたとすると、その後、Cに対し、観測が2回実施されるが、同様にタイムアウト時間分の待ちC2,C3が発生する。タイムアウト時間分の待ちC3の後、Cについては応答不能状態であると判定され、残された観測対象であるEに対する観測と、その後の後処理とが行われる。図4の例では、0時0分の観測に対応する後処理の完了が0時10分を過ぎているため、0時5分の観測と0時10分の観測がスキップされる。スキップされた周期については観測結果が存在しないため、グラフ上では、すべての監視対象機器20について0時5分および0時10分のプロットが欠けることとなる。すなわち、開示情報品質の低下が生じる。
図5は、応答待ち時間の発生により、監視対象機器20からの応答の取りこぼしが発生する例を示している。図4の例と同様に、0時0分の観測において、Cが応答不能となっている。応答がないため、タイムアウト時間分の待ちC1が発生する。図5の例では、リトライ回数が2回に設定されている点は図4の例と同じであるが、観測が終了していなくても後処理が周期内で強制的に実行される。よって、タイムアウト時間分の待ちC1の後、タイムアウト時間分の待ちC2の途中で後処理が強制的に実行される。これにより、0時5分の観測の開始までに0時0分の観測に対応する後処理が完了する。しかし、タイムアウト時間分の待ちC2の途中でCの観測が中止され、その後に行われるべきCの2回目のリトライとEの観測とがスキップされる。スキップされた観測対象については観測結果が存在しないため、グラフ上では、CおよびEについて0時0分のプロットが欠けることとなる。すなわち、開示情報品質の低下が生じる。
本実施の形態では、上記のような開示情報品質の低下が生じないように、「一次応答待ち」と「仮値」とを用いて処理の効率化が行われる。
図6を参照して、比較例の処理フローと本実施の形態の処理フローとを対比する。
比較例の処理フローでは、障害発生時にタイムアウト時間とリトライ回数とに応じた応答待ちが実施された後で、後処理が実施される。本実施の形態では、障害発生により監視対象機器20が無応答状態となっていた場合、観測の際に指定の待ち時間まで応答を待つ「一次応答待ち」が実施され、その間に応答があれば実測値を用いた後処理が実施される。応答がなければ、「仮値」を用いた後処理と、タイムアウト時間とリトライ回数とに応じた二次応答待ちとが並行して実施される。二次応答待ちで応答があれば実測値を用いたフォロー処理が実施される。
比較例において、すべての監視対象機器20の観測を別々のプロセスで行うことも考えられるが、それではCPU負荷およびネットワーク負荷が過大となる。本実施の形態では、「一次応答待ち」を行うことで、監視装置10のプロセッサ11の負荷、および、ネットワーク回線への負荷を分散させることができ、これによってシステム全体の負荷を正常時と同等に抑えることができる。また、「仮値」を用いることで、リトライによる応答待ちと後処理とを並列に行うことができ、周期内の観測の完了および後処理の実行を達成し、監視品質および開示情報品質の低下を防止することができる。
図7は、監視装置10の観測プロセスの例を示している。図4および図5の例と同様に、0時0分の観測において、Cが障害発生等の理由により応答不能となっている。応答がないため、タイムアウト時間分の待ちC1が発生するが、図7の例では、その途中、一次応答待ちの設定時間を超過した時点でCの観測結果に仮値が設定され、Eの観測が開始される。すべての監視対象機器20の観測が終わると、後処理が開始され、0時0分の周期の観測が一旦終了する。Cの観測については、二次応答待ちとして、タイムアウト時間分の待ちC1の続きと、その後のタイムアウト時間分の待ちC2,C3とが継続する。0時5分の時点でCの応答待ちが継続しているため、0時5分の観測では、Cが観測対象から除外され、その他の観測対象のみに対して観測が実施される。Cについては、二次応答待ちにおいても応答がないため、0時0分の観測結果を、応答不能状態を示す「N/A」としてフォロー処理が行われる。これにより、0時0分のCの観測結果を、十分な応答待ち時間の経過後に「N/A」と判断することができるため、監視品質を維持することができる。また、Cの後に観測が予定されているEについて同周期内に観測を終えることができるため、グラフ42のプロット欠けが起こらず、開示情報品質の低下を防止することができる。
実測値を用いたフォロー処理は、二次応答待ちにおいて応答がありしだい実施されることが望ましいが、応答が得られた後、直近の後処理とまとめて行う等、別のタイミングで実施されてもよい。
図7の例では、二次応答待ちにおいて、あらかじめ設定されたリトライ回数分応答待ちを行っても応答がない場合は、観測結果が「N/A」に確定されるが、後述するように、別の値に確定されてもよい。
上記のように、仮値を用いて処理フローを改善することで、管理エージェントを追加せずに、大量ネットワーク障害発生時の監視装置10の監視品質および開示情報品質の低下を防止することができる。
図8から図11を参照して、本実施の形態に係る監視装置10の動作の詳細を説明する。監視装置10の動作は、本実施の形態に係る監視方法に相当する。
図8のステップS101からステップS104の処理は、観測の周期ごとに起動される観測プロセスにより実行される。
図7の例であれば、0時0分の周期で並列に動作する2つの観測プロセスのそれぞれによって、ステップS101からステップS104の処理が実行される。0時5分の周期以降も同様に、各周期で並列に動作する2つの観測プロセスのそれぞれによって、ステップS101からステップS104の処理が実行される。
ステップS101において、観測プロセスは、他の観測プロセスが観測を継続しているかどうかを判定する。他の観測プロセスとは、直前の周期の観測プロセスまたはそれよりも前の周期の観測プロセスのことである。直前の周期またはそれよりも前の周期で二次応答待ちが発生し、その二次応答待ちが完了していない場合は、他の観測プロセスが観測を継続していることになる。観測を継続している他の観測プロセスがあれば、ステップS102の処理が行われる。観測を継続している他の観測プロセスがなければ、ステップS103の処理が行われる。
ステップS102において、観測プロセスは、観測を継続している観測プロセスの観測対象になっている監視対象機器20を観測対象から除外する。
ステップS103において、観測プロセスは、図9に示す観測を実施する。
図9のステップS201からステップS204の処理は、観測プロセスにより起動される子プロセスにより実行される。子プロセスは、ステップS203の処理を実行したときに解放されるが、ステップS204の処理を実行した場合は継続される。
図7の例であれば、0時0分の周期で並列に動作する2つの観測プロセスの一方によって、Aの観測を行う子プロセス、Cの観測を行う子プロセス、および、Eの観測を行う子プロセスが順番に起動され、それぞれの子プロセスによって、ステップS201からステップS204の処理が実行される。また、0時0分の周期で並列に動作する2つの観測プロセスの他方によって、Bの観測を行う子プロセス、Dの観測を行う子プロセス、および、Fの観測を行う子プロセスが順番に起動され、それぞれの子プロセスによって、ステップS201からステップS204の処理が実行される。0時5分の周期以降も同様に、各周期で並列に動作する2つの観測プロセスの一方によって、Aの観測を行う子プロセス、Cの観測を行う子プロセス、および、Eの観測を行う子プロセスが順番に起動され、それぞれの子プロセスによって、ステップS201からステップS204の処理が実行される。また、各周期で並列に動作する2つの観測プロセスの他方によって、Bの観測を行う子プロセス、Dの観測を行う子プロセス、および、Fの観測を行う子プロセスが順番に起動され、それぞれの子プロセスによって、ステップS201からステップS204の処理が実行される。
図9のステップS205およびステップS206の処理は、ステップS204の処理を実行した子プロセスにより実行される。子プロセスは、ステップS206の処理を実行したときに解放される。
図7の例であれば、0時0分の周期でCの観測を行う子プロセスによって、ステップS205およびステップS206の処理が実行される。
ステップS201において、子プロセスは、SNMPによる要求を発信する。
ステップS202において、子プロセスは、一次応答待ちの設定時間内に応答を受信したかどうかを判定する。設定時間内に応答を受信していれば、ステップS203の処理が行われる。設定時間内に応答を受信していなければ、ステップS204の処理が行われる。
ステップS203において、子プロセスは、受信した応答の内容を観測値41として確定する。すなわち、子プロセスは、実測値を観測値41としてメモリ12に記録する。
ステップS204において、子プロセスは、仮値を観測値41として設定する。すなわち、子プロセスは、仮値を観測値41としてメモリ12に記録する。
ステップS103の処理が実行された後、ステップS104において、観測プロセスは、後処理を実施する。
ステップS204の処理が実行された場合、ステップS104の処理と並行して、ステップS205の処理が実行される。
ステップS205において、ステップS204の処理を実行した子プロセスは、図10に示す個別観測を実施する。
図10のステップS301からステップS304の処理は、ステップS204の処理を実行した子プロセスにより実行される。
図7の例であれば、0時0分の周期でCの観測を行う子プロセスによって、ステップS301からステップS304の処理が実行される。
ステップS301において、子プロセスは、タイムアウト時間内に応答を受信したかどうかを判定する。タイムアウト時間内に応答を受信していなければ、ステップS302の処理が行われる。タイムアウト時間内に応答を受信していれば、ステップS303の処理が行われる。
ステップS302において、子プロセスは、ステップS301の処理があらかじめ設定されたリトライ回数分行われたかどうかを判定する。ステップS301の処理がリトライ回数分行われていなければ、ステップS301の処理が再び行われる。ステップS301の処理がリトライ回数分行われていれば、ステップS304の処理が行われる。なお、ステップS301の処理が再び行われる際には、ステップS201の処理と同じ要求が再び発信されてもよい。
ステップS303において、子プロセスは、受信した応答の内容を確定値43として設定する。すなわち、子プロセスは、実測値を確定値43としてメモリ12に記録する。
ステップS304において、子プロセスは、「N/A」を確定値43として設定する。すなわち、子プロセスは、「N/A」を確定値43としてメモリ12に記録する。
ステップS205の処理が実行された後、ステップS206において、子プロセスは、フォロー処理を実施する。
図2に示した観測処理部31は、ステップS103の処理を実行する観測プロセスによって実現される。観測処理部31は、周期ごとに起動される観測処理を、各周期内で複数の監視対象機器20に対して順番に実行する。観測処理は、ステップS201で要求を発信して、設定時間内に応答があればステップS203で応答の内容に応じた値を観測値41としてメモリ12に記録し、設定時間内に応答がなければステップS204で仮値を観測値41としてメモリ12に記録する処理である。
図2に示した後処理部32は、ステップS104の処理を実行する観測プロセスによって実現される。後処理部32は、周期ごとに起動される後処理を、各周期内で観測処理の後に実行する。後処理は、同じ周期内でメモリ12に記録された観測値41を用いて演算を行い、演算結果をメモリ12に記録する処理である。本実施の形態では、後処理は、観測値41を表示するグラフ42を作成し、作成したグラフ42を演算結果としてメモリ12に記録する処理である。
図11に、グラフ42の例を示す。この例では、実測値と仮値とが、それぞれ実線と点線とでグラフ42上に表示されている。このように、実測値と仮値とを区別できる形式でグラフ42が作成されることが望ましい。グラフ42には、時間、値、および、実測値と仮値との区別方法のほか、該当する計測対象である監視対象機器20を識別する情報が表示されることが望ましい。
図2に示した個別処理部33は、ステップS205およびステップS206の処理を実行する子プロセスによって実現される。個別処理部33は、観測処理で仮値がメモリ12に記録されたときに起動される個別処理を、観測処理で応答がなかった監視対象機器20に対して実行し、その後、フォロー処理を実行する。個別処理は、設定時間よりも長い応答待ち時間内に応答があればステップS303で応答に応じた値を確定値43としてメモリ12に記録し、応答待ち時間内に応答がなければステップS304で応答なしの状態に応じた値を確定値43としてメモリ12に記録する処理である。フォロー処理は、個別処理でメモリ12に記録された確定値43を用いて、メモリ12に記録された演算結果を更新する処理である。図11の例では、仮値が表示されている部分に対応する実測値が得られた場合、フォロー処理によって当該部分にも実測値が表示される。一方、仮値が表示されている部分に対応する実測値が得られなかった場合、フォロー処理によって当該部分が空白に変更される。
なお、複数の監視対象機器20の死活監視が行われる場合、後処理では、図12に示すように、各監視対象機器20が正常であるかどうかを表示する画面がディスプレイ14に出力されてもよい。観測処理で応答があった監視対象機器20については、「正常」が表示される。観測処理で応答がなかった監視対象機器20については、個別処理の実行中は「観測中」が表示される。個別処理で応答があった監視対象機器20については、フォロー処理によって「観測中」の表示が「正常」の表示に変更される。一方、個別処理で応答がなかった監視対象機器20については、フォロー処理によって「観測中」の表示が「異常」の表示に変更される。図12の例によれば、応答待ちを行っている監視対象機器20については、その状況を正確に把握することができる。すなわち、ある監視対象機器20が正常であるかどうかの判定中に、その監視対象機器20が要注意状態であることをいち早く把握することができる。
本実施の形態において、観測処理部31は、ステップS101およびステップS102の処理により、個別処理が実行されている監視対象機器20に対しては観測処理を省略する。このため、処理効率をより一層高めることができる。
本実施の形態において、観測処理部31は、応答なしの状態に応じた値を仮値に設定する。すなわち、本実施の形態では、仮値として、無応答前提の「N/A」が指定される。
なお、観測処理部31は、過去の応答の内容に応じた値を用いて仮値を算出してもよい。すなわち、仮値としては、過去の計測結果の平均値あるいは最大値等が指定されてもよい。
あるいは、後処理が、観測値41を閾値と比較し、比較結果に応じて演算を行う処理であるとしたとき、観測処理部31は、その閾値を仮値に設定してもよい。すなわち、仮値としては、後処理で用いられる閾値が指定されてもよい。
あるいは、観測処理部31は、ユーザによって指定された値を仮値に設定してもよい。
本実施の形態において、一次応答待ちの設定時間は、ユーザによって指定された時間である。
なお、観測処理部31は、過去の応答にかかった時間に応じて設定時間を設定してもよい。すなわち、一次応答待ちの設定時間は、過去の計測結果の平均値あるいは最大値等でもよい。
あるいは、観測処理部31は、後処理が起動される時刻から設定時間を逆算してもよい。すなわち、一次応答待ちの設定時間は、周期ごとに適宜算出された時間でもよい。
***実施の形態の効果の説明***
本実施の形態では、観測処理で応答がない監視対象機器20については仮値を観測値として用いて後処理を実行しておき、個別処理で応答があれば応答に応じた値を確定値として用いて後処理の演算結果を更新する。このため、従来技術のような管理エージェントの設置を不要とし、かつ、一部の監視対象機器20が応答できない状態であっても、残りの監視対象機器20の監視に影響が生じないようにすることができる。
本実施の形態によれば、コストを抑えながら大量ネットワーク障害発生時の監視装置10の監視品質および開示情報品質の低下を防止することができる。
特に、本実施の形態では、ステップS201からステップS204の、「一次応答待ち」と「仮値」とを用いたフローにより、障害発生時の観測時間の増加を防止することができる。また、ステップS205の「個別観測」を実施することで、監視品質の低下を防止することができる。
***他の構成***
本実施の形態では、観測処理部31、後処理部32および個別処理部33の機能がソフトウェアにより実現されるが、変形例として、観測処理部31、後処理部32および個別処理部33の機能がソフトウェアとハードウェアとの組み合わせにより実現されてもよい。すなわち、観測処理部31、後処理部32および個別処理部33の機能の一部が専用の電子回路により実現され、残りがソフトウェアにより実現されてもよい。
専用の電子回路は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックIC、GA、FPGAまたはASICである。「GA」は、Gate Arrayの略語である。「FPGA」は、Field−Programmable Gate Arrayの略語である。「ASIC」は、Application Specific Integrated Circuitの略語である。
プロセッサ11、メモリ12および専用の電子回路を、総称して「プロセッシングサーキットリ」という。つまり、観測処理部31、後処理部32および個別処理部33の機能がソフトウェアにより実現されるか、ソフトウェアとハードウェアとの組み合わせにより実現されるかに関わらず、観測処理部31、後処理部32および個別処理部33の機能は、プロセッシングサーキットリにより実現される。
10 監視装置、11 プロセッサ、12 メモリ、13 入力装置、14 ディスプレイ、15 通信装置、20 監視対象機器、31 観測処理部、32 後処理部、33 個別処理部、41 観測値、42 グラフ、43 確定値。

Claims (9)

  1. 周期ごとに起動され、要求を発信して、設定時間内に応答があれば応答の内容に応じた値を観測値としてメモリに記録し、前記設定時間内に応答がなければ仮値を観測値として前記メモリに記録する観測処理を、各周期内で複数の監視対象機器に対して順番に実行する観測処理部と、
    周期ごとに起動され、同じ周期内で前記メモリに記録された観測値を用いて演算を行い、演算結果を前記メモリに記録する後処理を、各周期内で前記観測処理の後に実行する後処理部と、
    前記観測処理で前記仮値が前記メモリに記録されたときに起動され、前記設定時間よりも長い応答待ち時間内に応答があれば応答に応じた値を確定値として前記メモリに記録し、前記応答待ち時間内に応答がなければ応答なしの状態に応じた値を確定値として前記メモリに記録する個別処理を、前記観測処理で応答がなかった監視対象機器に対して実行し、前記メモリに記録された確定値を用いて、前記メモリに記録された演算結果を更新する個別処理部と
    を備える監視装置。
  2. 前記観測処理部は、前記個別処理が実行されている監視対象機器に対しては前記観測処理を省略する請求項1に記載の監視装置。
  3. 前記観測処理部は、応答なしの状態に応じた値を前記仮値に設定する請求項1または2に記載の監視装置。
  4. 前記観測処理部は、過去の応答の内容に応じた値を用いて前記仮値を算出する請求項1または2に記載の監視装置。
  5. 前記後処理部は、前記観測値を閾値と比較し、比較結果に応じて前記演算を行い、
    前記観測処理部は、前記閾値を前記仮値に設定する請求項1または2に記載の監視装置。
  6. 前記観測処理部は、過去の応答にかかった時間に応じて前記設定時間を設定する請求項1から5のいずれか1項に記載の監視装置。
  7. 前記観測処理部は、前記後処理が起動される時刻から前記設定時間を逆算する請求項1から5のいずれか1項に記載の監視装置。
  8. 前記後処理部は、前記観測値を表示するグラフを作成し、作成したグラフを前記演算結果として前記メモリに記録する請求項1から7のいずれか1項に記載の監視装置。
  9. コンピュータに、
    周期ごとに起動され、要求を発信して、設定時間内に応答があれば応答の内容に応じた値を観測値としてメモリに記録し、前記設定時間内に応答がなければ仮値を観測値として前記メモリに記録する観測処理を、各周期内で複数の監視対象機器に対して順番に実行させ、
    周期ごとに起動され、同じ周期内で前記メモリに記録された観測値を用いて演算を行い、演算結果を前記メモリに記録する後処理を、各周期内で前記観測処理の後に実行させ、
    前記観測処理で前記仮値が前記メモリに記録されたときに起動され、前記設定時間よりも長い応答待ち時間内に応答があれば応答に応じた値を確定値として前記メモリに記録し、前記応答待ち時間内に応答がなければ応答なしの状態に応じた値を確定値として前記メモリに記録する個別処理を、前記観測処理で応答がなかった監視対象機器に対して実行させ、
    前記メモリに記録された確定値を用いて、前記メモリに記録された演算結果を更新する監視プログラム。
JP2017056373A 2017-03-22 2017-03-22 監視装置および監視プログラム Active JP6752744B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017056373A JP6752744B2 (ja) 2017-03-22 2017-03-22 監視装置および監視プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017056373A JP6752744B2 (ja) 2017-03-22 2017-03-22 監視装置および監視プログラム

Publications (2)

Publication Number Publication Date
JP2018160773A JP2018160773A (ja) 2018-10-11
JP6752744B2 true JP6752744B2 (ja) 2020-09-09

Family

ID=63796833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017056373A Active JP6752744B2 (ja) 2017-03-22 2017-03-22 監視装置および監視プログラム

Country Status (1)

Country Link
JP (1) JP6752744B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220003027U (ko) 2021-06-20 2022-12-27 김수빈 앞치마로 변형 가능한 방수 에코백

Also Published As

Publication number Publication date
JP2018160773A (ja) 2018-10-11

Similar Documents

Publication Publication Date Title
US9294338B2 (en) Management computer and method for root cause analysis
JP5851503B2 (ja) 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
US20120144021A1 (en) Administering Event Reporting Rules In A Distributed Processing System
JP2011186783A (ja) スナップショット管理方法、スナップショット管理装置、及びプログラム
EP3338191B1 (en) Diagnostic framework in computing systems
CN108369544B (zh) 计算系统中延期的服务器恢复方法和设备
US20130097215A1 (en) Selected Alert Delivery In A Distributed Processing System
US20140122931A1 (en) Performing diagnostic tests in a data center
JP6160171B2 (ja) 情報処理装置、制御方法、プログラム、及び情報処理システム
JP2012234336A (ja) 監視対象プロセスを実行する装置及び方法
US7672247B2 (en) Evaluating data processing system health using an I/O device
US20100211950A1 (en) Automated Termination of Selected Software Applications in Response to System Events
AU2014376751B2 (en) Redundant system and method for managing redundant system
US11288164B2 (en) Dynamic distributed tracing instrumentation in a microservice architecture
US20150363252A1 (en) Determining and correcting software server error conditions
WO2018134939A1 (ja) 攻撃検知装置、攻撃検知方法および攻撃検知プログラム
US20150355976A1 (en) Selecting During A System Shutdown Procedure, A Restart Incident Checkpoint Of An Incident Analyzer In A Distributed Processing System
JP6752744B2 (ja) 監視装置および監視プログラム
JP5014179B2 (ja) Os優先度変更装置及びos優先度変更プログラム
US20150067139A1 (en) Agentless monitoring of computer systems
US9411666B2 (en) Anticipatory protection of critical jobs in a computing system
US11487623B2 (en) Information processing system
US9880855B2 (en) Start-up control program, device, and method
WO2015194651A1 (ja) 障害通知装置、障害通知方法及びプログラム
US11093346B2 (en) Uninterrupted backup operation using a time based approach

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200819

R150 Certificate of patent or registration of utility model

Ref document number: 6752744

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250