JP2013178850A - 監視システム、監視方法、及びプログラム - Google Patents

監視システム、監視方法、及びプログラム Download PDF

Info

Publication number
JP2013178850A
JP2013178850A JP2013130281A JP2013130281A JP2013178850A JP 2013178850 A JP2013178850 A JP 2013178850A JP 2013130281 A JP2013130281 A JP 2013130281A JP 2013130281 A JP2013130281 A JP 2013130281A JP 2013178850 A JP2013178850 A JP 2013178850A
Authority
JP
Japan
Prior art keywords
monitoring
group
monitoring device
devices
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013130281A
Other languages
English (en)
Inventor
Taeko Osawa
妙子 大沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC System Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC System Technologies Ltd filed Critical NEC System Technologies Ltd
Priority to JP2013130281A priority Critical patent/JP2013178850A/ja
Publication of JP2013178850A publication Critical patent/JP2013178850A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】安定性の向上を図り、且つ、監視対象となるシステムが複雑化した場合であっても漏れなく異常を検出し得る、監視システム、監視方法、及びプログラムを提供する。
【解決手段】複数のサーバ装置10−1〜10−5を備えるコンピュータシステムを監視する監視システムを用いる。監視システムは、サーバ装置10−1〜10−5それぞれ毎に、各サーバ装置によって構築された、複数の監視装置1を備えている。複数の監視装置10−1〜10−5それぞれは、2以上のグループにグループ分けされ、当該監視装置1が属するグループ以外のグループに属している別グループの他の監視装置1及びそれを構築しているサーバ装置を監視する。
【選択図】図1

Description

本発明は、監視システム、特には、24時間稼動が求められるオンラインシステムの異常を検出するための監視システム、監視方法、及びプログラムに関する。
近年、ホテルの予約はインターネット予約サイト等を介して行われることが多くなっている。このため、多くのホテルは、インターネット予約サイト等を経由した各旅行会社からの予約情報を取り込むための予約取込システムを導入している。
予約取込システムは、オンラインシステムであり、24時間稼働する必要がある。よって、予約取込システムが停止すると、予約情報の取り込みに漏れが生じてしまうことから、予約取込システムに生じた異常を早急に発見するべく、通常、予約取込システムと共に、監視システムが設置されている。
但し、監視システムが停止や、ダウンすると、予約取込システムの監視が不可能な状態となる。この場合、予約取込システムに異常が生じても、異常を発見できないため、ホテル等において業務に支障が生じてしまう。このため、監視システム自体の安定性を高めることが求められる。
監視システムの安定性の向上を図るため、例えば、二つの監視装置が設置されたシステムが提案されている(特許文献1参照)。特許文献1に開示された監視システムでは、二つの監視装置は、互いに監視を行い、相手の監視装置の異常を検出している。この監視システムによれば、安定性の向上が図られると考えられる。
特開昭58−107978号公報
しかしながら、特許文献1に開示の監視システムでは、両方の監視装置に異常が生じた場合に対処できないという問題がある。また、近年、監視システムが監視対象とするシステムは複数台のサーバ装置で構成される場合もある。この場合、二つの監視装置だけでは、各監視装置にかかる負荷が過大となり、全てのサーバ装置を漏れなく監視することが困難となる。
本発明の目的は、上記問題を解消し、安定性の向上を図り、且つ、監視対象となるシステムが複雑化した場合であっても漏れなく異常を検出し得る、監視システム、監視方法、及びプログラムを提供することにある。
上記目的を達成するため、本発明における監視システムは、複数のサーバ装置を備えるコンピュータシステムを監視する監視システムであって、
前記複数のサーバ装置それぞれ毎に、各サーバ装置によって構築された、複数の監視装置を備え、
前記複数の監視装置それぞれは、2以上のグループにグループ分けされ、当該監視装置が属するグループ以外のグループに属している別グループの他の監視装置及びそれを構築しているサーバ装置を監視する、ことを特徴とする。
また、上記目的を達成するため、本発明における監視方法は、複数のサーバ装置を備えるコンピュータシステムを監視するための監視方法であって、
(a)予め、前記複数のサーバ装置それぞれ毎に構築された監視装置を2以上のグループにグループ分けするステップと、
(b)各監視装置によって、当該監視装置が属するグループ以外のグループに属している別グループの他の監視装置及びそれを構築しているサーバ装置を監視するステップと、
を有することを特徴とする。
更に、上記目的を達成するため、本発明におけるプログラムは、2以上のグループにグループ分けされた複数のコンピュータを備えるシステムの監視を、前記複数のコンピュータによって行うためのプログラムであって、
前記複数のコンピュータの一つに、
(a)当該コンピュータが属するグループ以外のグループに属している別グループの他のコンピュータを監視するステップを実行させる、ことを特徴とする。
以上の特徴により、本発明における、監視システム、監視方法、及びプログラムによれば、安定性の向上を図り、且つ、監視対象となるシステムが複雑化した場合であっても漏れなく異常を検出することができる。
図1は、本発明の実施の形態における監視システムの構成の一例を示すブロック図である。 図2は、本発明の実施の形態における監視システムの監視動作1を説明する説明図である。 図3は、本発明の実施の形態における監視システムの監視動作2を説明する説明図である。 図4は、本発明の実施の形態における各監視装置の動作を示す流れ図である。
(実施の形態)
以下、本発明の実施の形態における監視システム、監視方法、及びプログラムについて、図1〜図4を参照しながら説明する。最初に、本実施の形態における監視システムの構成について図1を用いて説明する。図1は、本発明の実施の形態における監視システムの構成の一例を示すブロック図である。
図1に示す本実施の形態における監視システムは、複数のサーバ装置10−1〜10−5を備えるコンピュータシステムを監視するシステムである。図1に示すように、監視システムは、サーバ装置10−1〜10−5それぞれ毎に、各サーバ装置によって構築された、複数の監視装置1を備えている。
また、図1に示すように、複数の監視装置1それぞれは、2以上のグループ(グループA及びB)にグループ分けされている。そして、各監視装置1は、自身が属するグループ以外のグループに属している別グループの他の監視装置1及びそれを構築しているサーバ装置を監視している。
つまり、グループAに属する各監視装置1は、グループBに属する監視装置1と、この監視装置を構築しているサーバ装置10−4及び10−5を監視する。また、グループBに属する各監視装置1は、グループAに属する監視装置1と、この監視装置を構築しているサーバ装置10−1〜10−3を監視する。
このように、図1に示す監視システムでは、各監視装置1は、それが属するグループとは別のグループに属する複数の監視装置1によって監視される。よって、図1に示す監視システムによれば、特許文献1に開示の監視システムに比べて、安定性の向上を図ることができ、更に、監視対象となるコンピュータシステムが複雑化した場合であっても漏れなく異常を検出することができる。
また、本実施の形態では、各監視装置1は、それが属するグループに属している同グループの他の監視装置と、同グループの他の監視装置を構築しているサーバ装置とを監視することもできる。例えば、グループAにおいてサーバ装置10−1に構築されている監視装置1は、グループBのサーバ装置及び監視装置1に加え、サーバ装置10−2及び10−3と、それぞれに構築されている監視装置1とを監視することができる。
そして、本実施の形態では、各監視装置1は、別グループの他の監視装置1及びそれを構築しているサーバ装置の監視と、同グループの他の監視装置1及びそれを構築しているサーバ装置の監視とを交互に実行することができる。この点については、図2及び図3を用いて後述する。
ここで、本実施の形態における監視システムの構成について更に具体的に説明する。本実施の形態において、監視対象となるコンピュータシステムは、サーバ装置10−1〜10−5それぞれ毎に、各サーバ装置によって構築された処理装置3を備えている。各監視装置1は、処理装置3を監視することによって、上述したサーバ装置の監視を行っている。また、本実施の形態では、コンピュータシステムは、Webサイトからの予約情報を取り込むための予約取込システムとして機能している。このため、各処理装置3は予約取込処理を分散処理している。
具体的には、各処理装置3は、Webサイトからデータを受信するデータ受信部4と、受信されたデータから予約情報を抽出する予約情報抽出部5と、データベース(DB)6とを備えている。このうち、各処理装置3を構成するデータ受信部4及び予約情報抽出部5は、サーバ装置10−1〜10−5それぞれにインストールされたプログラムを実行することによって、構築されている。また、データベース6は、データ受信部4及び予約情報抽出部5それぞれ毎に設けられ、具体的には、サーバ装置が備える記憶装置(図示せず)の記憶領域に構築されている。
各監視装置1は、各サーバ装置に、後述する本実施の形態におけるプログラムをインストールし、これを実行することによって構築されている。また、本実施の形態では、監視装置1毎にデータベース2が設けられている。データベース2も、サーバ装置が備える記憶装置(図示せず)の記憶領域に構築されている。
また、本実施の形態においては、各処理装置3を構成するデータ受信部4及び予約情報抽出部5それぞれは、対応するデータベース6に、一定間隔で時刻を記録している。同様に、各監視装置1も、対応するデータベース2に、一定間隔で時刻を記録している。データベース2及び6に記録された時刻は、監視装置1による監視に用いられる。ここで、監視装置1による監視処理について説明する。
本実施の形態では、各監視装置1は、他の監視装置1とそれを構築しているサーバ装置の処理装置3とを監視する際、他の監視装置1及び処理装置3それぞれのデータベースにアクセスし、そこから記録されている時刻を抽出する。そして、各監視装置1は、抽出した時刻と抽出した時点の時刻(現在時刻)とを対比して、これらの差が設定された閾値を超えているかどうかを判断する。閾値を超えている場合は、一定時間、更新が行われていないため、閾値を超えた監視装置1及び処理装置3は、異常が発生していると判断される。
更に、本実施の形態では、各監視装置1は、いずれかの監視装置1及び処理装置3に異常が発生していると判断する場合は、設定されている管理者の電子メールアドレスに電子メールを送信することができる。この場合、コンピュータシステムの管理者は、迅速に異常に対応することができる。
なお、本実施の形態において、サーバ装置の数は複数であれば良く、特に限定されるものではないが、少なくとも一つのグループが複数のサーバ装置を含むように設定されているのが好ましい。この場合は、監視装置1による監視の確実性が向上するからである。
次に、図1に示した本実施の形態における監視システムの全体の動作について図2及び図3を用いて説明する。図2は、本発明の実施の形態における監視システムの監視動作1を説明する説明図である。図3は、本発明の実施の形態における監視システムの監視動作2を説明する説明図である。なお、本実施の形態における監視方法は、図1に示した監視システムを動作させることによって実施される。このため、本実施の形態における監視方法の説明は、以下の監視システムの動作の説明に代える。また、以下の説明では、適宜図1を参酌する。
図2及び図3に示すように、本実施の形態では、各監視装置1は、別グループの他の監視装置1及び処理装置3の監視(監視動作1)と、同グループの他の監視装置1及び処理装置3の監視(監視動作2)とを交互に実行する。
具体的には、図2に示すように、監視動作1では、Aグループの監視装置1は、Bグループの各サーバ装置の処理装置3と監視装置1とを監視する。また、Bグループの監視装置1は、Aグループの各サーバ装置の処理装置3と監視装置1とを監視する。図2において、Aグループの監視装置1による監視は実線の矢印で示され、Bグループの監視装置1による監視は破線の矢印で示されている。
また、図3に示すように、監視動作2では、Aグループの監視装置1は、それを構築しているサーバ装置以外のAグループのサーバ装置の処理装置3と監視装置1とを監視する。また、Bグループの監視装置1は、それを構築しているサーバ装置以外のBグループのサーバ装置の処理装置3と監視装置1とを監視する。図3において、Aグループの監視装置1による監視は実線の矢印で示され、Bグループの監視装置1による監視は破線の矢印で示されている。
このように、本実施の形態では、各監視装置1は、グループ外への監視とグループ内への監視とを一定時間毎に交互に繰り返すので、監視対象となるサーバ装置が、一定時間毎に変化することとなる。このため、監視装置1及び処理装置3における異常検出の確実性が向上することとなる。また、本実施の形態では、グループの設定の仕方により、特定の監視装置1における監視負担の軽減を図ることができる。例えば、図2及び図3に示すように、グループBに属する監視装置1の監視対象は、同一グループ内の監視を行う場合においては、別のグループの監視を行う場合よりも減少している。この場合、グループBに属する監視装置1の監視負担は軽減されている。
次に、本発明の実施の形態における各監視装置の動作について図4を用いて説明する。図4は、本発明の実施の形態における各監視装置の動作を示す流れ図である。なお、以下の説明では、グループAに属し、且つ、サーバ装置10−1に構築されている監視装置1を例に挙げて説明する。
図1に示すように、監視装置1は、自身が属するグループ以外のグループに属する監視装置1と処理装置3との監視を行う(ステップS1)。例えば、監視装置1が、サーバ装置10−1に構築されている場合は、監視装置1によって、グループBに属するサーバ装置10−4及び10−5それぞれに構築されている監視装置1及び処理装置3が監視される。
具体的には、ステップS1では、監視装置1は、監視対象となっている監視装置1のデータベース2と、処理装置3のデータベース6とにアクセスし、それぞれに記録されている時刻を抽出する。
次に、監視装置1は、監視対象となっている別のグループの監視装置1および処理装置3について、異常が発生しているかどうかを判定する(ステップS2)。具体的には、監視装置1は、ステップS1で抽出した時刻と現在の時刻との差分を求め、得られた値が閾値を超えているかどうかを判定する。なお、閾値は、サーバ装置10−1〜10−5それぞれの処理速度等を考慮して適宜設定される。
ステップS2の判定の結果、いずれかの監視装置1又は処理装置3に異常が発生している場合は、後述するステップS5が実行される。一方、ステップS2の判定の結果、監視対象となる監視装置1及び処理装置3のいずれにおいても異常が発生していない場合は、ステップS3が実行される。
ステップS3では、監視装置1は、自身のグループに属する他の監視装置1及び処理装置3の監視を行う。例えば、例えば、監視装置1が、サーバ装置10−1に構築されている場合は、監視装置1によって、グループAに属するサーバ装置10−2及び10−3それぞれに構築されている監視装置1及び処理装置3が監視される。
なお、ステップS3においても、ステップS1と同様に、監視装置1は、監視対象となっている監視装置1のデータベース2と、処理装置3のデータベース6とにアクセスし、それぞれに記録されている時刻を抽出する。
次に、監視装置1は、監視対象となっている同グループの監視装置1および処理装置3について、異常が発生しているかどうかを判定する(ステップS4)。ステップS4においても、ステップS2と同様に、監視装置1は、ステップS3で抽出した時刻と現在の時刻との差分を求め、得られた値が閾値を超えているかどうかを判定する。この場合も、閾値は、サーバ装置10−1〜10−5それぞれの処理速度等を考慮して適宜設定される。
ステップS4の判定の結果、いずれかの監視装置1又は処理装置3に異常が発生している場合は、監視装置1は、ステップS5を実行する。ステップS5では、監視装置1は、異常が発生していることを管理者に通知するため、設定された電子メールのアドレスに電子メールを送信する。
一方、ステップS4の判定の結果、監視対象となる監視装置1及び処理装置3のいずれにおいても異常が発生していない場合は、監視装置1は、再度ステップS1〜ステップS4を実行する。
各監視装置1が、互いに同期しながら、上述したステップS1〜S5を実行することにより、本実施の形態における監視システムにおいて、図2に示した監視動作1と図3に示した監視動作2とが交互に実施されることとなる。
なお、本実施の形態において、監視装置1のグループ分けは、ステップS1の実行前に行われていれば良い。また、本実施の形態では、グループを構成する監視装置1の組み合わせを変更するグループ分けが、ステップS1〜S5の実行の度に、又はステップS1〜S5を複数回実行する度に行われていても良い。
また、本実施の形態におけるプログラムは、コンピュータ(サーバ装置)に、図4に示すステップS1〜S5を実行させるプログラムであれば良い。この場合、このプログラムをコンピュータにインストールし、実行することによって、監視装置1を実現することができる。このとき、コンピュータのCPU(central processing unit)は、監視装置1として機能し、処理を行なう。
以上のように、本発明は、複数台のサーバ装置で構成されるコンピュータシステムを監視する監視システムに有用である。このようなコンピュータシステムとしては、ホテル等の宿泊施設で導入されている予約取込システムが挙げられる。本発明は産業上の利用可能性を有している。
1 監視装置
2 監視装置のデータベース
3 処理装置
4 データ受信部
5 予約情報抽出部
6 データ受信部又は予約情報抽出部のデータベース
10−1〜10−5 サーバ装置

Claims (3)

  1. 2以上のグループにグループ分けされた複数のコンピュータを備えるシステムの監視を、前記複数のコンピュータによって行うためのプログラムであって、
    前記複数のコンピュータの一つに、
    (a)当該コンピュータが属するグループ以外のグループに属している別グループの他のコンピュータを監視するステップと、
    (b)当該コンピュータが属するグループに属している同グループの他のコンピュータを監視するステップと、
    を交互に実行させる、ことを特徴とするプログラム。
  2. 前記2以上のグループそれぞれが、2以上の前記コンピュータを含むようにグループ分けが行われている、請求項1に記載のプログラム。
  3. 前記複数のコンピュータそれぞれが、一定間隔で時刻を記録しており、
    前記(b)のステップおよび前記(c)のステップにおいて、
    前記複数のコンピュータの一つによって、前記他のコンピュータを監視する際に、前記他のコンピュータが記録している時刻を抽出し、抽出した時刻と抽出した時点の時刻とを対比して、前記他のコンピュータに異常が発生しているかどうかを判断する、請求項2に記載のプログラム。
JP2013130281A 2013-06-21 2013-06-21 監視システム、監視方法、及びプログラム Pending JP2013178850A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013130281A JP2013178850A (ja) 2013-06-21 2013-06-21 監視システム、監視方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013130281A JP2013178850A (ja) 2013-06-21 2013-06-21 監視システム、監視方法、及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009105044A Division JP5371096B2 (ja) 2009-04-23 2009-04-23 監視システム、監視方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2013178850A true JP2013178850A (ja) 2013-09-09

Family

ID=49270341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013130281A Pending JP2013178850A (ja) 2013-06-21 2013-06-21 監視システム、監視方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2013178850A (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06180690A (ja) * 1992-12-11 1994-06-28 Mitsubishi Electric Corp 多重計算機システム制御方式
JPH0895931A (ja) * 1994-09-26 1996-04-12 Mitsubishi Electric Corp 分散計算機システムの故障検出方法
JPH1131136A (ja) * 1997-07-11 1999-02-02 Meidensha Corp 分散処理システムの異常監視方式
JP2000148539A (ja) * 1998-11-04 2000-05-30 Ntt Data Corp 障害検知方法、コンピュータシステム及び構成装置、記録媒体
JP2002312189A (ja) * 2001-01-12 2002-10-25 Hitachi Ltd クラスターシステムにおける遠隔ミラーを使用した障害通知方法及びシステム
JP2006268310A (ja) * 2005-03-23 2006-10-05 Nec Corp 障害監視装置および方法およびプログラム
JP2007126127A (ja) * 2005-10-03 2007-05-24 Hitachi Ltd 車両制御システム
JP2007221522A (ja) * 2006-02-17 2007-08-30 Mitsubishi Electric Corp ポーリング装置及び端末装置及びポーリング方法及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06180690A (ja) * 1992-12-11 1994-06-28 Mitsubishi Electric Corp 多重計算機システム制御方式
JPH0895931A (ja) * 1994-09-26 1996-04-12 Mitsubishi Electric Corp 分散計算機システムの故障検出方法
JPH1131136A (ja) * 1997-07-11 1999-02-02 Meidensha Corp 分散処理システムの異常監視方式
JP2000148539A (ja) * 1998-11-04 2000-05-30 Ntt Data Corp 障害検知方法、コンピュータシステム及び構成装置、記録媒体
JP2002312189A (ja) * 2001-01-12 2002-10-25 Hitachi Ltd クラスターシステムにおける遠隔ミラーを使用した障害通知方法及びシステム
JP2006268310A (ja) * 2005-03-23 2006-10-05 Nec Corp 障害監視装置および方法およびプログラム
JP2007126127A (ja) * 2005-10-03 2007-05-24 Hitachi Ltd 車両制御システム
JP2007221522A (ja) * 2006-02-17 2007-08-30 Mitsubishi Electric Corp ポーリング装置及び端末装置及びポーリング方法及びプログラム

Similar Documents

Publication Publication Date Title
US8645769B2 (en) Operation management apparatus, operation management method, and program storage medium
US9294338B2 (en) Management computer and method for root cause analysis
JP5736881B2 (ja) ログ収集システム、装置、方法及びプログラム
JP6638644B2 (ja) 情報処理装置及び異常検知方法
US10291630B2 (en) Monitoring apparatus and method
JP4458493B2 (ja) ログ通知条件定義支援装置とログ監視システムおよびプログラムとログ通知条件定義支援方法
JP2012123694A (ja) 管理装置、管理方法および管理用プログラム
JP6201670B2 (ja) 判定装置、判定プログラム、及び判定方法
JP6413537B2 (ja) 障害予兆通報装置および予兆通報方法、予兆通報プログラム
JP2015028700A (ja) 障害検知装置、障害検知方法、障害検知プログラム及び記録媒体
JP6280862B2 (ja) イベント分析システムおよび方法
JP5371096B2 (ja) 監視システム、監視方法、及びプログラム
JP6223380B2 (ja) 中継装置及びプログラム
JP6294145B2 (ja) 監視方法、監視装置および監視制御プログラム
JP2017211806A (ja) 通信の監視方法、セキュリティ管理システム及びプログラム
JP2010244137A (ja) 障害情報収集装置
KR101608221B1 (ko) 과거 db 접근 패턴에 기반한 이상 징후 감지 방법 및 시스템
JP2004348640A (ja) ネットワーク管理システム及びネットワーク管理方法
JP2020038525A (ja) 異常検知装置
JP2013178850A (ja) 監視システム、監視方法、及びプログラム
JP6541903B2 (ja) 攻撃・異常検知装置、攻撃・異常検知方法、および攻撃・異常検知プログラム
JP6775452B2 (ja) 監視システム、プログラムおよび監視方法
JP5586322B2 (ja) プラント監視システムおよびプラント監視方法
JP5724145B2 (ja) 被疑装置の判定装置、判定方法及び被疑装置の判定プログラム
JP2012118800A (ja) 運用管理障害対応システム及び運用管理障害対応方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130911

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131127