JP7375312B2 - コンピュータシステム、異常検知方法及び異常検知プログラム - Google Patents

コンピュータシステム、異常検知方法及び異常検知プログラム Download PDF

Info

Publication number
JP7375312B2
JP7375312B2 JP2019050761A JP2019050761A JP7375312B2 JP 7375312 B2 JP7375312 B2 JP 7375312B2 JP 2019050761 A JP2019050761 A JP 2019050761A JP 2019050761 A JP2019050761 A JP 2019050761A JP 7375312 B2 JP7375312 B2 JP 7375312B2
Authority
JP
Japan
Prior art keywords
server
monitoring
monitoring device
signal
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019050761A
Other languages
English (en)
Other versions
JP2020154501A (ja
Inventor
剛 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2019050761A priority Critical patent/JP7375312B2/ja
Publication of JP2020154501A publication Critical patent/JP2020154501A/ja
Application granted granted Critical
Publication of JP7375312B2 publication Critical patent/JP7375312B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Maintenance And Management Of Digital Transmission (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、コンピュータシステム、異常検知方法及び異常検知プログラムに関し、例えば、サーバの異常を検知することができるコンピュータシステム、異常検知方法及び異常検知プログラムに関する。
関連技術では、サービスを提供しているサーバが稼働しているか否かは、外部から当該サーバに対する通信によって定期的に応答を要求し、一定時間内に応答があるか否かで判断している。
また、別の関連技術では、サービスを提供しているサーバ自身が、稼働している間、常に外部に対して通信を行っている。
国際公開第2015/041249号 国際公開第2012/133395号 特開2018-107850号公報
関連技術では、応答が遅れているのか、サーバが稼働していないのか、を即座に判断できず、一定時間、応答を待つ必要がある。その結果、サーバが稼働していない場合には、少なくとも応答待ちの時間において、サービス提供が停止してしまい、迅速なサービス復旧を行うことができない。
また、別の関連技術では、監視装置側がサーバからの通信を常時受け付ける必要があり、サーバが停止したことを即時検知するためには、監視装置側がある程度の性能を有していることが必要である。また、サーバの台数が増加した場合に、監視装置側に求められる性能も上がっていくという問題がある。
本開示の目的は、上述した課題に鑑み、監視対象のサーバの異常を即時検知することができるコンピュータシステム、異常検知方法及び異常検知プログラムを提供することにある。
一実施の形態に係るコンピュータシステムは、監視信号を送信する第1監視装置と、前記第1監視装置から送信された前記監視信号を受信可能な第2監視装置と、前記第2監視装置による前記監視信号の受信を妨害する妨害信号の発信を行う発信装置を有したサーバと、を備える。
一実施の形態によれば、監視対象のサーバの異常を即時検知することができるコンピュータシステム、異常検知方法及び異常検知プログラムを提供することができる。
実施形態1に係るコンピュータシステムを例示した構成図である。 実施形態1に係るコンピュータシステムにおいて、群監視装置が動作を開始してからの処理を例示した図である。 実施形態1に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。 実施形態2に係るコンピュータシステムを例示した構成図である。 実施形態2に係るコンピュータシステムにおいて、有線接続の場合における一方の群監視装置の動作を例示した図である。 実施形態2に係るコンピュータシステムにおいて、有線接続の場合における他方の群監視装置の動作を例示した図である。 実施形態3に係るコンピュータシステムを例示した構成図である。 実施形態3に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。 実施形態4に係るコンピュータシステムを例示した構成図である。 実施形態4に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。
(実施形態1)
実施形態1に係るコンピュータシステムを説明する。本実施形態のコンピュータシステムは、何らかの処理結果(サービス)を提供するコンピュータシステムである。本実施形態のコンピュータシステムは、単数または複数のコンピュータを含んでいる。図1は、実施形態1に係るコンピュータシステムを例示した構成図である。図1に示すように、コンピュータシステム100は、例えば、サーバ1、サーバ11、群監視装置5、群監視装置6、群監視装置15、群監視装置16、振分装置7、ストレージ9を備えている。
サーバ1は、発信装置2、制御機構3、AP監視機構4、アプリケーション10を有している。コンピュータであるサーバ1において、処理を行うソフトウェア等のアプリケーション10が動作している。AP監視機構4は、アプリケーション10が正常動作していること、及び、サーバ1において、ハードウェアの異常が発生していないことを監視している。発信装置2は、後述するように、妨害信号を発信する装置である。制御機構3は、サーバ1に関する動作を制御する装置である。また、制御機構3は、発信装置2における妨害信号の発信を制御する。
コンピュータシステム100は、サーバ1と同種のサービスを提供するサーバを、一台以上有してもよい。図1では、コンピュータシステム100は、サーバ1を含むサーバ群Aを有している。図1では、各サーバ、及び、それぞれの接続ネットワークに関する描画を簡略化している。
サーバ11は、サーバ1に対する予備である。サーバ11の内部構成は、サーバ1と同様である。すなわち、サーバ11は、発信装置12、制御機構13、AP監視機構14を有している。通常時にサービスを提供するサーバ群Aと同様に、サーバ群Bは、サーバ11を含む1台以上のサーバで構成されている。サーバ群B全体は、サーバ群Aの予備系である。コンピュータシステム100は、現用系サーバ群A、及び、待機系サーバ群Bで構成されるシステムである。
クライアント8は、振分装置7を介して、コンピュータシステム100に接続されている。クライアント8は、コンピュータシステム100で提供されるサービスを受けるコンピュータである。クライアント8は、振分装置7を経由し、サーバ1またはサーバ11にアクセスする。
振分装置7は、クライアント8をサーバ群Aのサーバに接続させるか、サーバ群Bのサーバに接続させるかを振り分ける。振分装置7は、制御機構3の制御によって、クライアント8をサーバ群Aまたはサーバ群Bのサーバに振り分ける。
群監視装置5及び群監視装置6は、監視信号の通信を行う装置である。群監視装置5及び群監視装置6は、相互に監視信号を送受信する通信を行ってもよいし、一方から他方へのみ監視信号を送信する通信を行ってもよい。少なくとも、一方の群監視装置から送信された監視信号を、他方の群監視装置は受信可能である。群監視装置5及び群監視装置6は、監視信号を常時通信してもよいし、パルス状の信号をごく短い間隔で発した監視信号により通信を行ってもよい。群監視装置5及び群監視装置6は、無線による通信を行ってもよいし、有線による通信を行ってもよい。したがって、監視信号は、無線電波にのせた信号でもよいし、有線通信にのせた信号でもよい。サーバ群Aを監視する意味で、群監視装置5及び群監視装置6と呼ぶが、少なくとも1つのサーバ1を監視するので、監視装置5及び監視装置6と呼んでもよい。
サーバ1の発信装置2は、群監視装置5及び群監視装置6における監視信号の受信を妨害する妨害信号の発信を行う。発信装置2は、すくなくとも一方の群監視装置による監視信号の受信を妨害する妨害信号を発信する。監視信号が無線電波にのせた信号の場合には、妨害信号も無線電波にのせた信号を含む妨害電波である。例えば、監視信号が無線電波の場合には、妨害信号は、監視信号と逆位相の電波であってもよい。また、妨害信号は、群監視装置間で情報を送っている場合に、それが正常に受け取れないような電波的雑音(ノイズ)でもよい。また、監視信号が有線通信にのせた信号の場合には、妨害信号も有線通信にのせた信号である。例えば、一例として、監視信号がCSMA/CD方式の通信路上で送られる送信データである場合には、妨害信号は送出信号(キャリア)でもよい。
群監視装置5及び群監視装置6は、発信装置2が妨害信号を発信する間は、監視信号を受信することができない。または、群監視装置5及び群監視装置6は、発信装置2が妨害信号を発信する間は、正常な監視信号を受信できず、受信した信号は異常なものである。
一方、発信装置2が妨害信号の発信を停止した場合には、群監視装置5及び群監視装置6は、監視信号を受信する。この場合には、群監視装置5及び群監視装置6は、サーバ1の異常を検知する。このように、群監視装置5及び群監視装置6は、監視信号を受信することによって、サーバ1の異常を検知する。具体的には、群監視装置5及び群監視装置6は、正常な監視信号を受信することによって、サーバ1の異常を検知する。
発信装置2が妨害信号の発信を停止した場合とは、例えば、電源の供給によって動作するサーバに対して、供給される電源が切断した場合である。また、サーバ1の制御機構3が、発信装置2における妨害信号の発信を停止させた場合である。
群監視装置15及び群監視装置16は、群監視装置5及び群監視装置6と同様の機能を有している。群監視装置15及び群監視装置16は、サーバ群Bに対する監視を行う。
ストレージ9は、サーバ群A内の各サーバ、及び、サーバ群B内の各サーバに接続されている。ストレージ9は、サーバ群A内の各サーバ、及び、サーバ群B内の各サーバの処理結果を保存する。
次に、実施形態1のコンピュータシステム100の動作を説明する。群監視装置5及び群監視装置6は、サーバ群Aの監視に対応している。群監視装置5と群監視装置6との間は、例えば、無線による、ごく短い間隔で発せられた監視信号によって、通信を行っている。図1の例では、群監視装置5、群監視装置6ともに信号を発し、それを相互に相手が受信する。しかしながら、どちらか一方が監視信号を発し、他方がそれを受信する構成でもよい。
サーバ群Aの中にあるサーバ1をはじめとしたサーバでは、ソフトウェアプログラムであるアプリケーション10が動作している。ネットワーク経由でアクセスしたクライアント8は、アプリケーション10による処理結果を受け取ることができる。AP監視機構4は、アプリケーション10が正常に動作を続けていること、及び、サーバ1においてハードウェア的な異常が発生していないことを監視する。
発信装置2は、AP監視機構4が異常を検知しない限り、群監視装置5と群監視装置6との間の監視信号の通信を妨害する妨害信号を発信している。妨害信号は、例えば、妨害電波である。本実施形態の以下では、妨害信号を妨害電波として説明する。妨害電波は、例えば、少なくとも群監視装置5と群監視装置6との間で発信された監視信号が正常に受信できない程度のごく短い間隔で、連続して発信され続ける。
AP監視機構4は、サーバ1におけるアプリケーション10の動作に異常を検知すると、制御機構3に対して、アプリケーション10の動作の異常を通知する。制御機構3は、異常検知の通知を受けて、発信装置2による妨害電波の発信を停止させる。また、発信装置2を含むサーバ1が電源断によって異常停止した場合には、電力供給を断たれて発信装置2による妨害電波の発信が停止する。
発信装置2による妨害電波の発信が停止すると、群監視装置5と群監視装置6との間で正常に監視信号の通信が行えるようになる。これにより、群監視装置5または群監視装置6は、サーバ1で異常が発生したことを検知する。
発信装置2からの妨害電波の発信が停止することにより、異常を検知した群監視装置5及び群監視装置6は、予備系(待機系)であるサーバ群B内サーバ11において、制御機構13にアプリケーションの起動を指示する。サーバ1に対する予備系がサーバ11であること、または、サーバ群Aに対する予備系がサーバ群Bであることは、予め、システム構成情報として、各サーバ内に記録されている。
サーバ11において起動したアプリケーション(図中省略)は、サーバ1で起動していたアプリケーションの処理結果をストレージ9から引き継いで、処理を開始する。制御機構13は、アプリケーションがサーバ11で起動したことを振分装置7に通知する。このとき、群監視装置15及び群監視装置16は、監視信号の通信を行う。そこで、制御機構13は、発信装置12に対して妨害電波の発信を指示する。これによって、発信装置12は、群監視装置15及び群監視装置16の間の監視信号の通信妨害を開始する。
サーバ群Bに対応する群監視装置15及び群監視装置16は、監視信号の通信を妨害されることにより、サーバ群B内のサーバ、及び、アプリケーションが正常動作していることを検知する。サービスを受けるべく振分装置7へアクセスしたクライアント8は、アプリケーションが動作しているサーバ11へ誘導され、アプリケーションによる処理結果を得る。
次に、実施形態1に係るコンピュータシステム100において、群監視装置5の動作を説明する。ここでは、群監視装置5を例にとるが、群監視装置6、群監視装置15、群監視装置16の動作も基本的には同一である。群監視装置5は、通信を行う相手として、予め決められた群監視装置6と対になって構成されている。群監視装置15の場合は、群監視装置16と対になっており、両者の間で監視信号の通信を行う。
図2は、実施形態1に係るコンピュータシステムにおいて、群監視装置が動作を開始してからの処理を例示した図である。図2に示すように、群監視装置5が動作を開始すると、大きく分けて、2つの処理が実行される。一つは、ステップS11に示すように、群監視装置6への監視信号の送信処理である。これは、群監視装置5から、監視信号を受信可能な群監視装置6に対して監視信号を送信する処理である。具体的には、対になる群監視装置6に対して、例えば、ごく短い間隔で監視信号を送信し続ける。もう一つは、ステップS12に示すように、群監視装置6からの監視信号の受信処理である。これは、対になる群監視装置6から送られた監視信号を受信し続ける。
監視信号の受信処理においては、ステップS13に示すように、正常な監視信号が受信できたか判断する。監視信号が異常、または、監視信号が受信できない等の正常な監視信号がない場合には、ステップS12に戻り、再度、監視信号の受信処理の試行を繰り返す。これは、サーバ1の発信装置2から、群監視装置5による監視信号の受信を妨害する妨害電波が発信されていることに相当する。すなわち、サーバ1が正常である場合に相当する。
ステップS13において、正常な監視信号がある場合には、サーバ1に異常が発生している。すなわち、群監視装置5は、監視信号を受信することによって、サーバ1の異常を検知する。よって、ステップS14及びステップS15に示すように、群監視装置5は、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。さらに、ステップS16及びステップS17に示すように、群監視装置5は、監視対象であるサーバ1の制御を担当している制御機構3に対して、サーバ1の再起動を指示する。その後、ステップS12に戻り、群監視装置5は、再度、監視信号の受信処理を開始する。
なお、群監視装置5と群監視装置6との間で監視信号の一方向の通信を行っている場合には、群監視装置5は、ステップS11、または、ステップS12~S17のうちのいずれか一方を行う。そして、群監視装置6は、ステップS11、または、ステップS12~S17の他方を行う。
次に、実施形態1に係るコンピュータシステム100において、サーバ1から見た各構成との連係動作を説明する。図3は、実施形態1に係るコンピュータシステム100において、サーバの動作を例示したシーケンス図である。
図3に示すように、サーバ1が起動すると、ステップS21に示すように、制御機構3は、発信装置2に対して、妨害電波の発信を指示する。発信装置2は、妨害信号発信の指示を受けると、ステップS22に示すように、例えば、ごく短い間隔で妨害電波を発信する。
次に、ステップS23に示すように、制御機構3は、さらに、アプリケーション10の起動を指示する。そうすると、ステップS24に示すように、起動したアプリケーション10は、処理を開始する。そして、ステップS25に示すように、データ処理を行う。
次に、ステップS26に示すように、制御機構3は、AP監視機構4に対して、アプリケーション監視指示を行う。AP監視機構4は、ステップS27に示すように、アプリケーション10、及び、サーバ1内で異常が発生していないか、監視を開始する。
次に、ステップS28に示すように、制御機構3は、振分装置7に対して、サーバ1上でアプリケーションが起動したことを通知する。振分装置7は、ステップS29に示すように、アプリケーションが起動しているサーバがどれかというアプリケーション起動サーバ情報を更新し、振分装置7にアクセスしてきたクライアントをサーバ1へ誘導する。
群監視装置5または群監視装置6がサーバ1の異常を検知した場合には、群監視装置5または群監視装置6は、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。この場合におけるサーバ2の動作は、制御機構3、AP監視機構4、発信装置2が、制御機構13、AP監視機構14、発信装置12になる以外は、図3と同様である。
次に、本実施形態の効果を説明する。本実施形態のコンピュータシステム100は、監視信号を受信可能な群監視装置5及び群監視装置6と、監視信号の受信を妨害する妨害電波の発信を行う発信装置2とを備えている。よって、発信装置2による妨害電波の停止により、監視対象のサーバ1の異常を即時検知することができる。本実施形態のコンピュータシステム100は、監視対象の各サーバにメッセージを送って応答を求めるのではなく、各サーバの自発的動作を異常検知に利用しているので、サーバ1の状態を素早く調べることができる。
また、各監視対象サーバ1の異常を即時検知することで、コンピュータシステム100としてのサービス停止時間を短縮することができる。
また、本実施形態のコンピュータシステム100は、複数の監視対象サーバを共通手段で一括して監視するため、サーバ群内の少なくとも1台が起動しているということの監視に、高機能な装置を必要としない。よって、複数のサーバに対する監視を、安価に行うことができる。
また、監視信号及び妨害電波は、無線電波にのせた信号でもよい。これにより、有線を必要とせず、群監視装置5及び群監視装置6を配置する制限を低減させることができる。
(実施形態2)
次に、実施形態2に係るコンピュータシステムを説明する。図4は、実施形態2に係るコンピュータシステムを例示した構成図である。図4に示すように、本実施形態のコンピュータシステム200は、群監視装置5と群監視装置6との間、群監視装置5及び群監視装置6と発信装置2との間、群監視装置15と群監視装置16との間、並びに、群監視装置15及び群監視装置16と発信装置12の間は、通信ケーブルCCで接続されている。通信ケーブルCCは、例えば、CSMA/CD方式で通信を行うことのできるものである。CSMA/CD方式で通信を行うことのできる通信ケーブルCCは、例えば、10BASE-T等である。図4では、サーバ群A内のサーバ1以外のサーバにある発信装置との有線接続は、図示を省略している。サーバ群B内のサーバ11以外のサーバにある発信装置についても同様である。
本実施形態でも、現用系サーバ群A、及び、待機系サーバ群Bで構成されるシステムである。群監視装置5及び群監視装置6は、サーバ群Aの監視に対応している。群監視装置5から群監視装置6に対しては、例えば、ごく短い間隔で監視信号の送出を行っている。監視信号は、例えば、送信データである。サーバ群Aの中にあるサーバ1をはじめとしたサーバでは、ソフトウェアプログラムであるアプリケーション10が動作している。ネットワーク経由でアクセスしてきたクライアント8は、アプリケーション10による処理結果を受け取ることができる。
AP監視機構4は、アプリケーション10が動作を正常に続けていること、及び、サーバ1においてハードウェア的な異常が発生していないことを監視している。発信装置2は、AP監視機構4が異常を検知しない限り、群監視装置5と群監視装置6との間の通信ケーブルCCに対して、妨害信号を発信している。妨害信号は、例えば、送出信号(キャリア)である。
AP監視機構4は、サーバ1等の異常を検知すると、制御機構3にサーバ1等の異常の発生を通知する。制御機構3は、異常検知の通知を受けて、発信装置2による送出信号の発信を停止させる。また、発信装置2を含むサーバ1が電源断によって異常停止した場合には、電力供給を断たれて発信装置2による送出信号の発信が停止する。発信装置2による送出信号の発信が停止すると、群監視装置5から群監視装置6に対して正常にデータ送信が行えることとなり、群監視装置6は、サーバ1で異常が発生したことを検知する。
異常を検知した群監視装置6は、予備系(待機系)であるサーバ群B内サーバ11において、制御機構13にアプリケーションの起動を指示する。サーバ1に対する予備系がサーバ11であること、または、サーバ群Aに対する予備系がサーバ群Bであることは、予め、システム構成情報として各サーバ内に記録されている。
サーバ11において起動したアプリケーション(図中省略)は、サーバ1で起動していたアプリケーションの処理結果をストレージ9から引き継いで、処理を開始する。制御機構13は、アプリケーションがサーバ11で起動したことを振分装置7に通知する。このとき、群監視装置15から群監視装置16に対しては、例えば、ごく短い間隔でデータ送出を行う。そこで、制御機構13は、発信装置12に対して送出信号の発信を指示する。これによって、発信装置12は、群監視装置15から群監視装置16へのデータ送出の妨害を開始する。
サーバ群Bに対応する群監視装置16は、群監視装置15からのデータ送出を妨害されることにより、サーバ群B内のサーバ、及び、アプリケーションが正常動作していることを知る。サービスを受けるべく振分装置7へアクセスしたクライアント8は、アプリケーションが動作しているサーバ11へ誘導され、アプリケーションによる処理結果を得る。
次に、実施形態2に係るコンピュータシステム200において、有線接続の場合の群監視装置5の動作を説明する。
図5は、実施形態2に係るコンピュータシステムにおいて、有線接続の場合における一方の群監視装置の動作を例示した図である。群監視装置5は、動作開始後、データ送信を試行するが、データ送信に先立ち、図5のステップS31に示すように、群監視装置5は、データ通信ケーブルCC上に送出信号を発信する。
次に、ステップS32に示すように、群監視装置5は、発信装置2から発信された送出信号との競合があるか判断する。送出信号の競合がある場合には、ステップS33に示すように、ごく短時間の待ち合わせの後で、ステップS31に戻り、通信ケーブルCC上に再び送出信号を発信する。送出信号の競合がある場合は、サーバ1の発信装置2から送出信号が発信されていることに相当する。すなわち、サーバ1が正常である場合に相当する。
一方、ステップS32において、送出信号の競合がない場合には、ステップS34に示すように、群監視装置6に対してデータ送信を行う。送出信号の競合がない場合は、サーバ1に異常が発生している。すなわち、群監視装置6は、監視信号を受信することによって、サーバ1の異常を検知する。この場合の動作については、以下のステップS37~ステップS40で説明する。
図6は、実施形態2に係るコンピュータシステムにおいて、有線接続の場合における他方の群監視装置の動作を例示した図である。図6のステップS35に示すように、他方の群監視装置6は、データ受信処理を行う。群監視装置6は、対になる一方の群監視装置5から送られたデータを受信し続ける。
次に、ステップS36に示すように、群監視装置6は、正常な受信データがあるか判断する。受信データが異常、または、受信データを受信できないならば、ステップS35に戻り、再度、データ受信処理を繰り返す。これは、サーバ1の発信装置2から群監視装置6による受信データを妨害する送出信号が発信されていることに相当する。すなわち、サーバ1が正常である場合に相当する。
一方、ステップS36において、正常な受信データがあるならば、サーバ1に異常が発生している。すなわち、群監視装置6は、受信データを受信することによって、サーバ1の異常を検知する。よって、ステップS37及びステップS38に示すように、群監視装置6は、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。さらに、ステップS39及びステップS40に示すように、群監視装置6は、監視対象であるサーバ1の制御を担当している制御機構3に対して、サーバ1の再起動を指示する。その後、ステップS35に戻り、群監視装置6は、再度、データ受信処理を開始する。
本実施形態では、監視信号として、有線通信にのせたデータを用いている。このように、監視信号及び妨害信号は無線に限らず、有線通信でも用いることができる。よって、発信装置2は無線を発生させる部材を不要とすることができる。また、有線通信は、妨害電波以外の他の電磁波の影響を除外することができる。よって、コンピュータシステム200の設置場所の制限を低減させることができる。これ以外の構成及び効果は、実施形態1の記載に含まれている。
(実施形態3)
次に、実施形態3を説明する。本実施形態は、実施形態1及び2の構成に加えて、外部との通信経路の監視を行う構成を含んでいる。図7は、実施形態3に係るコンピュータシステムを例示した構成図である。
図7に示すように、実施形態3に係るコンピュータシステム300は、サーバ1内にNW監視機構17及びNIC18を有している。また、コンピュータシステム300は、サーバ11内にNW監視機構19及びNIC20を有している。さらに、コンピュータシステム300の振分装置7は、通信経路を通じた状態確認に対して、応答を返す機能を有している。
NW監視機構17は、NIC18を通じて振分装置7に対して、クライアント8とサーバ1との間の通信経路が正常かどうか確認する。そして、NW監視機構17は、サーバ1とクライアント8との間の通信が正常かを判断する。NW監視機構19は、NIC20を通じて振分装置7に対して、クライアント8とサーバ11との間の通信経路が正常かどうか確認する。そして、NW監視機構19は、サーバ11とクライアント8との間の通信が正常かを判断する。
図8は、実施形態3に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。図8のステップS41に示すように、制御機構3は、発信装置2に対して、妨害信号として、妨害電波の発信を指示する。これを受けて、ステップS42に示すように、発信装置2は、妨害電波を発信する。
次に、ステップS43に示すように、制御機構3は、NW監視機構17に対して、振分装置7及びクライアント8に到る通信経路の状態確認を指示する。これを受けて、ステップS44に示すように、アプリケーション10が稼働しているサーバ1内のNW監視機構17は、クライアント8とサーバ1との間の通信経路が正常に維持されていることを確認するため、NIC18を通じて、定期的に振分装置7に対する状態確認の応答要求を行う。
次に、ステップS45に示すように、応答要求待ちしていた振分装置7は、ステップS46に示すように、NW監視機構17に対して、応答を行う。ステップS47に示すように、応答待ちをしていたNW監視機構17は、振分装置7からの応答を受け取る。NW監視機構17からの状態確認後、一定時間内に振分装置7からの応答が返れば、NW監視機構17は、クライアント8とサーバ1との間の通信経路が正常に維持されていると判断する。
次に、ステップS48に示すように、制御機構3は、アプリケーション10を起動させる。ステップS48~ステップS54は、前述の図3のステップS23~ステップS29と同様である。
一方、ステップS43において、NW監視機構17からの状態確認後、一定時間内に振分装置7からの応答が返らなければ、NW監視機構17は、クライアント8とサーバ1の間の通信経路を含めて、サーバ1は正常にサービスを提供できないと判断する。そして、NW監視機構17は、制御機構3に対して異常を通知する。NW監視機構17がサーバ1とクライアント8との間の通信を異常と判断した場合には、制御機構3は、異常検知の通知を受けて、発信装置2に妨害電波の発信を停止させる。これにより、群監視装置5または群監視装置6は、サーバ1の異常を検知し、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。この場合におけるサーバ2の動作は、制御機構3、NW監視機構17、AP監視機構4、発信装置2が、制御機構13、NW監視機構19、AP監視機構14、発信装置12になる以外は、図8と同様である。
そして、アプリケーション10がサーバ11上で稼働を開始する。サーバ11内のNW監視機構19が、クライアント8とサーバ2との間の通信経路が正常に維持されていることを確認するため、NIC20を通じ、定期的に振分装置7に対する状態確認の通信を開始する。
本実施形態のコンピュータシステム300は、サーバ1にNW監視機構17及びNIC18を有し、サーバ11にNW監視機構19及びNIC20を有している。よって、クライアント8とサーバ1との間の通信経路の異常を即時に検知することができる。これ以外の構成及び効果は、実施形態1及び2の記載に含まれている。
(実施形態4)
次に、実施形態4を説明する。実施形態4のコンピュータシステムは、サーバ1及びサーバ11の外部環境の監視を行う例である。図9は、実施形態4に係るコンピュータシステムを例示した構成図である。図9に示すように、本実施形態のコンピュータシステム400は、サーバ1を含むサーバ群Aが地点PAに、サーバ11を含むサーバ群Bが地点PBに設置されている。また、サーバ1は、温度センサ27を、サーバ11は温度センサ28を有している。温度センサ27は、サーバ1が設置された地点PAの温度を検知する。温度センサ28は、サーバ11が設置された地点PBの温度を検知する。
図10は、実施形態4に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。図10のステップS61に示すように、制御機構3は、発信装置2に対して、妨害電波の発信を指示する。これを受けて、ステップS62に示すように、発信装置2は、妨害電波の発信を行う。
次に、ステップS63に示すように、制御機構3は、温度センサ27に対して、地点PAの温度を監視させる。これを受けて、ステップS64に示すように、アプリケーション10が稼働しているサーバ1内の温度センサ27は、地点PAが、サーバ1にとって正常稼働できる適正な温度に保たれているか否かを監視する。温度センサ27は、地点PAの温度を常時監視してもよいし、所定の間隔で監視してもよい。
制御機構3は、温度センサ27が確認した地点PAの温度が適正の場合には、ステップS65に示すように、アプリケーション10を起動させる。ステップS65~ステップS71は、前述の図3のステップS23~ステップS29と同様である。
一方、温度センサ27は、地点PAの温度が適正な範囲を超えた場合には、サーバ1がそのまま稼働を継続すると異常をきたす可能性が高いと判断する。そして、温度センサ27は、制御機構3に対して、異常を通知する。制御機構3は異常検知の通知を受けて、発信装置2による妨害電波の発信を停止させる。
このように、制御機構3は、温度センサ27が検知した温度に基づいて、発信装置2に妨害信号の発信を停止させる。これにより、群監視装置5または群監視装置6は、サーバ1の異常を検知し、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。この場合におけるサーバ2の動作は、制御機構3、温度センサ27、AP監視機構4、発信装置2が、制御機構13、温度センサ28、AP監視機構14、発信装置12になる以外は、図10と同様である。これ以降は、アプリケーション10がサーバ11上で稼働を開始し、サーバ11内の温度センサ28は、地点PBが、サーバ2が正常稼働できる適正な温度に保たれているか否か、監視を開始する。
次に、本実施形態の効果を説明する。本実施形態のコンピュータシステム400は、サーバ1を含むサーバ群A及びサーバ11を含むサーバ群Bの外部環境、例えば、温度の監視を行うことができる。よって、サーバ1がそのまま稼働を継続すると異常をきたす可能性が高い外部環境への変化を即時検知することができる。なお、検知する外部環境は、温度に限らず、例えば、湿度、電磁波等の外部環境でもよい。これ以外の構成及び効果は、実施形態1~3の記載に含まれている。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、実施形態1~4の各構成を組み合わせた実施形態も技術的思想の範囲である。また、本実施形態における異常検知方法をコンピュータに実行させる以下の異常検知プログラムも、実施形態の技術的思想の範囲に含まれる。
第1監視装置から監視信号を受信可能な第2監視装置に対して、前記監視信号を送信させ、
サーバの発信装置から前記第2監視装置による前記監視信号の受信を妨害する妨害信号を発信させ、
前記第2監視装置が前記監視信号を受信することによって、前記サーバの異常を検知させる、
ことをコンピュータに実行させる異常検知プログラム。
1、11 サーバ
2、12 発信装置
3、13 制御機構
4、14 AP監視機構
5、6、15、16 群監視装置
7 振分装置
8 クライアント
9 ストレージ
10 アプリケーション
17、19 NW監視機構
18、20 NIC
27、28 温度センサ
100、200、300、400 コンピュータシステム
A、B サーバ群
CC 通信ケーブル
PA、PB 地点

Claims (8)

  1. 監視信号を送信する第1監視装置と、
    前記第1監視装置から送信された前記監視信号を受信可能な第2監視装置と、
    前記第2監視装置による前記監視信号の受信を妨害する妨害信号の発信を行う発信装置を有したサーバと、
    を備え
    前記第2監視装置は、前記監視信号を受信することによって、前記サーバの異常を検知する、
    コンピュータシステム。
  2. 前記サーバは、電源の供給によって動作し、
    前記発信装置は、前記サーバに供給される前記電源が切断した場合に前記妨害信号の発信を停止する、
    請求項に記載のコンピュータシステム。
  3. 前記監視信号及び前記妨害信号は、無線電波にのせた信号である、
    請求項1または2に記載のコンピュータシステム。
  4. 前記監視信号及び前記妨害信号は、有線通信にのせた信号である、
    請求項1または2に記載のコンピュータシステム。
  5. 前記サーバとクライアントとの間の通信が正常かを判断するNW監視機構と、
    前記発信装置における前記妨害信号の発信を制御する制御機構と、
    をさらに備え、
    前記NW監視機構が前記サーバと前記クライアントとの間の通信を異常と判断した場合には、前記制御機構は、前記発信装置に前記妨害信号の発信を停止させる、
    請求項1~のいずれか1項に記載のコンピュータシステム。
  6. 前記サーバが設置された地点の温度を検知する温度センサと、
    前記発信装置における前記妨害信号の発信を制御する制御機構と、
    をさらに備え、
    前記温度センサが検知した温度に基づいて、前記制御機構は、前記発信装置に前記妨害信号の発信を停止させる、
    請求項1~のいずれか1項に記載のコンピュータシステム。
  7. 第1監視装置から監視信号を受信可能な第2監視装置に対して、前記監視信号を送信するステップと、
    サーバの発信装置から前記第2監視装置による前記監視信号の受信を妨害する妨害信号を発信するステップと、
    前記第2監視装置は、前記監視信号を受信することによって、前記サーバの異常を検知するステップと、
    を備えた異常検知方法。
  8. 第1監視装置から監視信号を受信可能な第2監視装置に対して、前記監視信号を送信させ、
    サーバの発信装置から前記第2監視装置による前記監視信号の受信を妨害する妨害信号を発信させ、
    前記第2監視装置が前記監視信号を受信することによって、前記サーバの異常を検知させる、
    ことをコンピュータに実行させる異常検知プログラム。
JP2019050761A 2019-03-19 2019-03-19 コンピュータシステム、異常検知方法及び異常検知プログラム Active JP7375312B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019050761A JP7375312B2 (ja) 2019-03-19 2019-03-19 コンピュータシステム、異常検知方法及び異常検知プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019050761A JP7375312B2 (ja) 2019-03-19 2019-03-19 コンピュータシステム、異常検知方法及び異常検知プログラム

Publications (2)

Publication Number Publication Date
JP2020154501A JP2020154501A (ja) 2020-09-24
JP7375312B2 true JP7375312B2 (ja) 2023-11-08

Family

ID=72559045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019050761A Active JP7375312B2 (ja) 2019-03-19 2019-03-19 コンピュータシステム、異常検知方法及び異常検知プログラム

Country Status (1)

Country Link
JP (1) JP7375312B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075837A (ja) 1999-09-02 2001-03-23 Hitachi Ltd コンピュータ機器の障害監視システム
JP2010124167A (ja) 2008-11-19 2010-06-03 Oki Electric Ind Co Ltd 携帯電話抑止方法及び携帯電話抑止装置
JP2010147846A (ja) 2008-12-19 2010-07-01 Ten Rise Techno:Kk 携帯電話の通話抑制を行う無線icタグ

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075837A (ja) 1999-09-02 2001-03-23 Hitachi Ltd コンピュータ機器の障害監視システム
JP2010124167A (ja) 2008-11-19 2010-06-03 Oki Electric Ind Co Ltd 携帯電話抑止方法及び携帯電話抑止装置
JP2010147846A (ja) 2008-12-19 2010-07-01 Ten Rise Techno:Kk 携帯電話の通話抑制を行う無線icタグ

Also Published As

Publication number Publication date
JP2020154501A (ja) 2020-09-24

Similar Documents

Publication Publication Date Title
EP2883329B1 (en) Computer information system and dynamic disaster recovery method therefor
JP4509545B2 (ja) 設定変更可能な信頼性の高いメッセージ通信システム
US20100274885A1 (en) Proactive load balancing
JP4695705B2 (ja) クラスタシステムおよびノード切り替え方法
CN111176873B (zh) 一种微服务自动下线方法、装置、计算机设备及存储介质
US20070270984A1 (en) Method and Device for Redundancy Control of Electrical Devices
US11656609B2 (en) Detecting component degradation in industrial process plants based on loop component responsiveness
CN114207682B (zh) 用于运行作为无线网络中的用户的移动系统和报警网关的方法
EP3640187B1 (en) Method and system for monitoring elevator communication module fault and elevator
JP4478686B2 (ja) バックアップセルコントローラ
JP7375312B2 (ja) コンピュータシステム、異常検知方法及び異常検知プログラム
KR20120124003A (ko) 원격 장치 감시 시스템 및 감시 방법
WO2019167256A1 (ja) エレベーター遠隔監視システム
JP4798286B2 (ja) 通信装置、通信システムおよびアクセス制御方法
JP6452905B1 (ja) エレベーター遠隔監視システム
KR102204366B1 (ko) 무선환경에서 유해트래픽 제어를 위한 솔루션시스템
KR102696539B1 (ko) 클라이언트 전자 장치, 차량 및 그 제어 방법
US20170322521A1 (en) Redundant ethernet-based control apparatus and method
JP2008204113A (ja) ネットワーク監視システム
JP2008103872A (ja) 無線通信システム
US11620137B2 (en) Autonomous server protection system
US20240272929A1 (en) Information processing device, job execution system, and control method
JP2004062246A (ja) 負荷分散装置
KR101015251B1 (ko) 통신망시스템의 관리시스템 및 그 관리방법
WO2015155996A1 (ja) 通信制御装置、通信制御方法及び通信制御プログラムを記憶する記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230627

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231009

R151 Written notification of patent or utility model registration

Ref document number: 7375312

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151