JP2020154501A - Computer system, abnormality detection method and abnormality detection program - Google Patents

Computer system, abnormality detection method and abnormality detection program Download PDF

Info

Publication number
JP2020154501A
JP2020154501A JP2019050761A JP2019050761A JP2020154501A JP 2020154501 A JP2020154501 A JP 2020154501A JP 2019050761 A JP2019050761 A JP 2019050761A JP 2019050761 A JP2019050761 A JP 2019050761A JP 2020154501 A JP2020154501 A JP 2020154501A
Authority
JP
Japan
Prior art keywords
server
monitoring
signal
monitoring device
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019050761A
Other languages
Japanese (ja)
Other versions
JP7375312B2 (en
Inventor
剛 宮田
Takeshi Miyata
剛 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2019050761A priority Critical patent/JP7375312B2/en
Publication of JP2020154501A publication Critical patent/JP2020154501A/en
Application granted granted Critical
Publication of JP7375312B2 publication Critical patent/JP7375312B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

To provide a computer system, an abnormality detection method, and an abnormality detection program capable of immediately detecting an abnormality of a server to be monitored.SOLUTION: A computer system 100 according to one embodiment comprises: a monitoring device 5 for transmitting monitoring signals; a monitoring device 6 capable of receiving a monitoring signal transmitted from the monitoring device 5; and a server 1 having an emitting device 2 for emitting an interfering signal that interferes with the reception of the monitoring signal by the monitoring device 6. The monitoring device 6 detects an abnormality in the server 1 by receiving the monitoring signal.SELECTED DRAWING: Figure 1

Description

本発明は、コンピュータシステム、異常検知方法及び異常検知プログラムに関し、例えば、サーバの異常を検知することができるコンピュータシステム、異常検知方法及び異常検知プログラムに関する。 The present invention relates to a computer system, an abnormality detection method and an abnormality detection program, for example, a computer system capable of detecting an abnormality in a server, an abnormality detection method and an abnormality detection program.

関連技術では、サービスを提供しているサーバが稼働しているか否かは、外部から当該サーバに対する通信によって定期的に応答を要求し、一定時間内に応答があるか否かで判断している。 In related technology, whether or not the server providing the service is operating is determined by periodically requesting a response from the outside by communicating with the server and determining whether or not there is a response within a certain period of time. ..

また、別の関連技術では、サービスを提供しているサーバ自身が、稼働している間、常に外部に対して通信を行っている。 In another related technology, the server itself that provides the service always communicates with the outside while it is operating.

国際公開第2015/041249号International Publication No. 2015/041249 国際公開第2012/133395号International Publication No. 2012/133395 特開2018−107850号公報JP-A-2018-107850

関連技術では、応答が遅れているのか、サーバが稼働していないのか、を即座に判断できず、一定時間、応答を待つ必要がある。その結果、サーバが稼働していない場合には、少なくとも応答待ちの時間において、サービス提供が停止してしまい、迅速なサービス復旧を行うことができない。 With related technology, it is not possible to immediately determine whether the response is delayed or the server is not running, and it is necessary to wait for the response for a certain period of time. As a result, when the server is not running, the service provision is stopped at least during the response waiting time, and the service cannot be restored quickly.

また、別の関連技術では、監視装置側がサーバからの通信を常時受け付ける必要があり、サーバが停止したことを即時検知するためには、監視装置側がある程度の性能を有していることが必要である。また、サーバの台数が増加した場合に、監視装置側に求められる性能も上がっていくという問題がある。 In another related technology, the monitoring device side needs to always accept communication from the server, and the monitoring device side needs to have some performance in order to immediately detect that the server has stopped. is there. Further, when the number of servers increases, there is a problem that the performance required on the monitoring device side also increases.

本開示の目的は、上述した課題に鑑み、監視対象のサーバの異常を即時検知することができるコンピュータシステム、異常検知方法及び異常検知プログラムを提供することにある。 An object of the present disclosure is to provide a computer system, an abnormality detection method, and an abnormality detection program capable of immediately detecting an abnormality of a server to be monitored in view of the above-mentioned problems.

一実施の形態に係るコンピュータシステムは、監視信号を送信する第1監視装置と、前記第1監視装置から送信された前記監視信号を受信可能な第2監視装置と、前記第2監視装置による前記監視信号の受信を妨害する妨害信号の発信を行う発信装置を有したサーバと、を備える。 The computer system according to the embodiment includes a first monitoring device that transmits a monitoring signal, a second monitoring device that can receive the monitoring signal transmitted from the first monitoring device, and the second monitoring device. It includes a server having a transmission device that transmits an interference signal that interferes with the reception of the monitoring signal.

一実施の形態によれば、監視対象のサーバの異常を即時検知することができるコンピュータシステム、異常検知方法及び異常検知プログラムを提供することができる。 According to one embodiment, it is possible to provide a computer system, an abnormality detection method, and an abnormality detection program capable of immediately detecting an abnormality of a server to be monitored.

実施形態1に係るコンピュータシステムを例示した構成図である。It is a block diagram which exemplifies the computer system which concerns on Embodiment 1. 実施形態1に係るコンピュータシステムにおいて、群監視装置が動作を開始してからの処理を例示した図である。It is a figure which illustrated the process after the group monitoring apparatus started operation in the computer system which concerns on Embodiment 1. FIG. 実施形態1に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。It is a sequence diagram which illustrates the operation of the server in the computer system which concerns on Embodiment 1. FIG. 実施形態2に係るコンピュータシステムを例示した構成図である。It is a block diagram which exemplifies the computer system which concerns on Embodiment 2. 実施形態2に係るコンピュータシステムにおいて、有線接続の場合における一方の群監視装置の動作を例示した図である。FIG. 5 is a diagram illustrating the operation of one group monitoring device in the case of a wired connection in the computer system according to the second embodiment. 実施形態2に係るコンピュータシステムにおいて、有線接続の場合における他方の群監視装置の動作を例示した図である。FIG. 5 is a diagram illustrating the operation of the other group monitoring device in the case of a wired connection in the computer system according to the second embodiment. 実施形態3に係るコンピュータシステムを例示した構成図である。It is a block diagram which exemplifies the computer system which concerns on Embodiment 3. 実施形態3に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。It is a sequence diagram which illustrates the operation of the server in the computer system which concerns on Embodiment 3. 実施形態4に係るコンピュータシステムを例示した構成図である。It is a block diagram which exemplifies the computer system which concerns on Embodiment 4. 実施形態4に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。It is a sequence diagram which illustrates the operation of the server in the computer system which concerns on Embodiment 4.

(実施形態1)
実施形態1に係るコンピュータシステムを説明する。本実施形態のコンピュータシステムは、何らかの処理結果(サービス)を提供するコンピュータシステムである。本実施形態のコンピュータシステムは、単数または複数のコンピュータを含んでいる。図1は、実施形態1に係るコンピュータシステムを例示した構成図である。図1に示すように、コンピュータシステム100は、例えば、サーバ1、サーバ11、群監視装置5、群監視装置6、群監視装置15、群監視装置16、振分装置7、ストレージ9を備えている。
(Embodiment 1)
The computer system according to the first embodiment will be described. The computer system of the present embodiment is a computer system that provides some processing result (service). The computer system of this embodiment includes one or more computers. FIG. 1 is a configuration diagram illustrating a computer system according to the first embodiment. As shown in FIG. 1, the computer system 100 includes, for example, a server 1, a server 11, a group monitoring device 5, a group monitoring device 6, a group monitoring device 15, a group monitoring device 16, a distribution device 7, and a storage 9. There is.

サーバ1は、発信装置2、制御機構3、AP監視機構4、アプリケーション10を有している。コンピュータであるサーバ1において、処理を行うソフトウェア等のアプリケーション10が動作している。AP監視機構4は、アプリケーション10が正常動作していること、及び、サーバ1において、ハードウェアの異常が発生していないことを監視している。発信装置2は、後述するように、妨害信号を発信する装置である。制御機構3は、サーバ1に関する動作を制御する装置である。また、制御機構3は、発信装置2における妨害信号の発信を制御する。 The server 1 has a transmission device 2, a control mechanism 3, an AP monitoring mechanism 4, and an application 10. An application 10 such as software for processing is running on the server 1 which is a computer. The AP monitoring mechanism 4 monitors that the application 10 is operating normally and that no hardware abnormality has occurred in the server 1. The transmission device 2 is a device that transmits an interference signal, as will be described later. The control mechanism 3 is a device that controls the operation of the server 1. Further, the control mechanism 3 controls the transmission of the interference signal in the transmission device 2.

コンピュータシステム100は、サーバ1と同種のサービスを提供するサーバを、一台以上有してもよい。図1では、コンピュータシステム100は、サーバ1を含むサーバ群Aを有している。図1では、各サーバ、及び、それぞれの接続ネットワークに関する描画を簡略化している。 The computer system 100 may have one or more servers that provide the same type of service as the server 1. In FIG. 1, the computer system 100 has a server group A including a server 1. In FIG. 1, the drawing regarding each server and each connection network is simplified.

サーバ11は、サーバ1に対する予備である。サーバ11の内部構成は、サーバ1と同様である。すなわち、サーバ11は、発信装置12、制御機構13、AP監視機構14を有している。通常時にサービスを提供するサーバ群Aと同様に、サーバ群Bは、サーバ11を含む1台以上のサーバで構成されている。サーバ群B全体は、サーバ群Aの予備系である。コンピュータシステム100は、現用系サーバ群A、及び、待機系サーバ群Bで構成されるシステムである。 The server 11 is a spare for the server 1. The internal configuration of the server 11 is the same as that of the server 1. That is, the server 11 has a transmission device 12, a control mechanism 13, and an AP monitoring mechanism 14. Similar to the server group A that provides services at normal times, the server group B is composed of one or more servers including the server 11. The entire server group B is a backup system of the server group A. The computer system 100 is a system composed of a working server group A and a standby server group B.

クライアント8は、振分装置7を介して、コンピュータシステム100に接続されている。クライアント8は、コンピュータシステム100で提供されるサービスを受けるコンピュータである。クライアント8は、振分装置7を経由し、サーバ1またはサーバ11にアクセスする。 The client 8 is connected to the computer system 100 via the distribution device 7. The client 8 is a computer that receives services provided by the computer system 100. The client 8 accesses the server 1 or the server 11 via the distribution device 7.

振分装置7は、クライアント8をサーバ群Aのサーバに接続させるか、サーバ群Bのサーバに接続させるかを振り分ける。振分装置7は、制御機構3の制御によって、クライアント8をサーバ群Aまたはサーバ群Bのサーバに振り分ける。 The distribution device 7 distributes whether the client 8 is connected to the server of the server group A or the server of the server group B. The distribution device 7 distributes the client 8 to the servers of the server group A or the server group B under the control of the control mechanism 3.

群監視装置5及び群監視装置6は、監視信号の通信を行う装置である。群監視装置5及び群監視装置6は、相互に監視信号を送受信する通信を行ってもよいし、一方から他方へのみ監視信号を送信する通信を行ってもよい。少なくとも、一方の群監視装置から送信された監視信号を、他方の群監視装置は受信可能である。群監視装置5及び群監視装置6は、監視信号を常時通信してもよいし、パルス状の信号をごく短い間隔で発した監視信号により通信を行ってもよい。群監視装置5及び群監視装置6は、無線による通信を行ってもよいし、有線による通信を行ってもよい。したがって、監視信号は、無線電波にのせた信号でもよいし、有線通信にのせた信号でもよい。サーバ群Aを監視する意味で、群監視装置5及び群監視装置6と呼ぶが、少なくとも1つのサーバ1を監視するので、監視装置5及び監視装置6と呼んでもよい。 The group monitoring device 5 and the group monitoring device 6 are devices that communicate monitoring signals. The group monitoring device 5 and the group monitoring device 6 may perform communication for transmitting and receiving monitoring signals to each other, or may perform communication for transmitting monitoring signals from one to the other. At least, the monitoring signal transmitted from one group monitoring device can be received by the other group monitoring device. The group monitoring device 5 and the group monitoring device 6 may constantly communicate the monitoring signals, or may perform communication by the monitoring signals that emit the pulsed signals at very short intervals. The group monitoring device 5 and the group monitoring device 6 may perform wireless communication or wired communication. Therefore, the monitoring signal may be a signal carried on a radio wave or a signal carried on a wired communication. In the sense of monitoring the server group A, they are called the group monitoring device 5 and the group monitoring device 6, but since they monitor at least one server 1, they may be called the monitoring device 5 and the monitoring device 6.

サーバ1の発信装置2は、群監視装置5及び群監視装置6における監視信号の受信を妨害する妨害信号の発信を行う。発信装置2は、すくなくとも一方の群監視装置による監視信号の受信を妨害する妨害信号を発信する。監視信号が無線電波にのせた信号の場合には、妨害信号も無線電波にのせた信号を含む妨害電波である。例えば、監視信号が無線電波の場合には、妨害信号は、監視信号と逆位相の電波であってもよい。また、妨害信号は、群監視装置間で情報を送っている場合に、それが正常に受け取れないような電波的雑音(ノイズ)でもよい。また、監視信号が有線通信にのせた信号の場合には、妨害信号も有線通信にのせた信号である。例えば、一例として、監視信号がCSMA/CD方式の通信路上で送られる送信データである場合には、妨害信号は送出信号(キャリア)でもよい。 The transmission device 2 of the server 1 transmits an interference signal that interferes with the reception of the monitoring signal in the group monitoring device 5 and the group monitoring device 6. The transmitting device 2 transmits an interfering signal that interferes with the reception of the monitoring signal by at least one group monitoring device. When the monitoring signal is a signal placed on a radio wave, the jamming signal is also a jamming radio wave including the signal placed on the radio wave. For example, when the monitoring signal is a radio wave, the interfering signal may be a radio wave having a phase opposite to that of the monitoring signal. Further, the jamming signal may be radio wave noise (noise) that cannot be normally received when information is transmitted between the group monitoring devices. Further, when the monitoring signal is a signal put on the wired communication, the interference signal is also a signal put on the wired communication. For example, when the monitoring signal is transmission data transmitted on a CSMA / CD communication path, the interference signal may be a transmission signal (carrier).

群監視装置5及び群監視装置6は、発信装置2が妨害信号を発信する間は、監視信号を受信することができない。または、群監視装置5及び群監視装置6は、発信装置2が妨害信号を発信する間は、正常な監視信号を受信できず、受信した信号は異常なものである。 The group monitoring device 5 and the group monitoring device 6 cannot receive the monitoring signal while the transmitting device 2 transmits the interference signal. Alternatively, the group monitoring device 5 and the group monitoring device 6 cannot receive a normal monitoring signal while the transmitting device 2 transmits a jamming signal, and the received signal is abnormal.

一方、発信装置2が妨害信号の発信を停止した場合には、群監視装置5及び群監視装置6は、監視信号を受信する。この場合には、群監視装置5及び群監視装置6は、サーバ1の異常を検知する。このように、群監視装置5及び群監視装置6は、監視信号を受信することによって、サーバ1の異常を検知する。具体的には、群監視装置5及び群監視装置6は、正常な監視信号を受信することによって、サーバ1の異常を検知する。 On the other hand, when the transmitting device 2 stops transmitting the interference signal, the group monitoring device 5 and the group monitoring device 6 receive the monitoring signal. In this case, the group monitoring device 5 and the group monitoring device 6 detect an abnormality in the server 1. In this way, the group monitoring device 5 and the group monitoring device 6 detect the abnormality of the server 1 by receiving the monitoring signal. Specifically, the group monitoring device 5 and the group monitoring device 6 detect an abnormality in the server 1 by receiving a normal monitoring signal.

発信装置2が妨害信号の発信を停止した場合とは、例えば、電源の供給によって動作するサーバに対して、供給される電源が切断した場合である。また、サーバ1の制御機構3が、発信装置2における妨害信号の発信を停止させた場合である。 The case where the transmitting device 2 stops transmitting the interference signal is, for example, a case where the power supplied to the server operated by supplying the power is cut off. Further, the control mechanism 3 of the server 1 stops the transmission of the interference signal in the transmission device 2.

群監視装置15及び群監視装置16は、群監視装置5及び群監視装置6と同様の機能を有している。群監視装置15及び群監視装置16は、サーバ群Bに対する監視を行う。 The group monitoring device 15 and the group monitoring device 16 have the same functions as the group monitoring device 5 and the group monitoring device 6. The group monitoring device 15 and the group monitoring device 16 monitor the server group B.

ストレージ9は、サーバ群A内の各サーバ、及び、サーバ群B内の各サーバに接続されている。ストレージ9は、サーバ群A内の各サーバ、及び、サーバ群B内の各サーバの処理結果を保存する。 The storage 9 is connected to each server in the server group A and each server in the server group B. The storage 9 stores the processing results of each server in the server group A and each server in the server group B.

次に、実施形態1のコンピュータシステム100の動作を説明する。群監視装置5及び群監視装置6は、サーバ群Aの監視に対応している。群監視装置5と群監視装置6との間は、例えば、無線による、ごく短い間隔で発せられた監視信号によって、通信を行っている。図1の例では、群監視装置5、群監視装置6ともに信号を発し、それを相互に相手が受信する。しかしながら、どちらか一方が監視信号を発し、他方がそれを受信する構成でもよい。 Next, the operation of the computer system 100 of the first embodiment will be described. The group monitoring device 5 and the group monitoring device 6 correspond to the monitoring of the server group A. Communication is performed between the group monitoring device 5 and the group monitoring device 6 by, for example, a wireless monitoring signal emitted at a very short interval. In the example of FIG. 1, both the group monitoring device 5 and the group monitoring device 6 emit a signal, and the other party receives the signal from each other. However, one of them may emit a monitoring signal and the other may receive it.

サーバ群Aの中にあるサーバ1をはじめとしたサーバでは、ソフトウェアプログラムであるアプリケーション10が動作している。ネットワーク経由でアクセスしたクライアント8は、アプリケーション10による処理結果を受け取ることができる。AP監視機構4は、アプリケーション10が正常に動作を続けていること、及び、サーバ1においてハードウェア的な異常が発生していないことを監視する。 The application 10 which is a software program is running on the server including the server 1 in the server group A. The client 8 accessed via the network can receive the processing result by the application 10. The AP monitoring mechanism 4 monitors that the application 10 continues to operate normally and that no hardware abnormality has occurred in the server 1.

発信装置2は、AP監視機構4が異常を検知しない限り、群監視装置5と群監視装置6との間の監視信号の通信を妨害する妨害信号を発信している。妨害信号は、例えば、妨害電波である。本実施形態の以下では、妨害信号を妨害電波として説明する。妨害電波は、例えば、少なくとも群監視装置5と群監視装置6との間で発信された監視信号が正常に受信できない程度のごく短い間隔で、連続して発信され続ける。 The transmitting device 2 transmits an interfering signal that interferes with the communication of the monitoring signal between the group monitoring device 5 and the group monitoring device 6 unless the AP monitoring mechanism 4 detects an abnormality. The jamming signal is, for example, a jamming radio wave. In the following of this embodiment, the jamming signal will be described as a jamming radio wave. The jamming radio waves continue to be transmitted continuously, for example, at a very short interval such that the monitoring signal transmitted between the group monitoring device 5 and the group monitoring device 6 cannot be normally received.

AP監視機構4は、サーバ1におけるアプリケーション10の動作に異常を検知すると、制御機構3に対して、アプリケーション10の動作の異常を通知する。制御機構3は、異常検知の通知を受けて、発信装置2による妨害電波の発信を停止させる。また、発信装置2を含むサーバ1が電源断によって異常停止した場合には、電力供給を断たれて発信装置2による妨害電波の発信が停止する。 When the AP monitoring mechanism 4 detects an abnormality in the operation of the application 10 on the server 1, it notifies the control mechanism 3 of the abnormality in the operation of the application 10. Upon receiving the notification of abnormality detection, the control mechanism 3 stops the transmission of the jamming radio wave by the transmitting device 2. Further, when the server 1 including the transmitter 2 is abnormally stopped due to the power failure, the power supply is cut off and the transmission of the jamming radio wave by the transmitter 2 is stopped.

発信装置2による妨害電波の発信が停止すると、群監視装置5と群監視装置6との間で正常に監視信号の通信が行えるようになる。これにより、群監視装置5または群監視装置6は、サーバ1で異常が発生したことを検知する。 When the transmission of the jamming radio wave by the transmitting device 2 is stopped, the monitoring signal can be normally communicated between the group monitoring device 5 and the group monitoring device 6. As a result, the group monitoring device 5 or the group monitoring device 6 detects that an abnormality has occurred in the server 1.

発信装置2からの妨害電波の発信が停止することにより、異常を検知した群監視装置5及び群監視装置6は、予備系(待機系)であるサーバ群B内サーバ11において、制御機構13にアプリケーションの起動を指示する。サーバ1に対する予備系がサーバ11であること、または、サーバ群Aに対する予備系がサーバ群Bであることは、予め、システム構成情報として、各サーバ内に記録されている。 The group monitoring device 5 and the group monitoring device 6 that have detected an abnormality by stopping the transmission of the jamming radio wave from the transmitting device 2 are sent to the control mechanism 13 in the server 11 in the server group B which is a standby system (standby system). Instruct to start the application. The fact that the backup system for the server 1 is the server 11 or that the backup system for the server group A is the server group B is recorded in advance in each server as system configuration information.

サーバ11において起動したアプリケーション(図中省略)は、サーバ1で起動していたアプリケーションの処理結果をストレージ9から引き継いで、処理を開始する。制御機構13は、アプリケーションがサーバ11で起動したことを振分装置7に通知する。このとき、群監視装置15及び群監視装置16は、監視信号の通信を行う。そこで、制御機構13は、発信装置12に対して妨害電波の発信を指示する。これによって、発信装置12は、群監視装置15及び群監視装置16の間の監視信号の通信妨害を開始する。 The application started on the server 11 (omitted in the figure) takes over the processing result of the application started on the server 1 from the storage 9 and starts the processing. The control mechanism 13 notifies the distribution device 7 that the application has been started on the server 11. At this time, the group monitoring device 15 and the group monitoring device 16 communicate the monitoring signals. Therefore, the control mechanism 13 instructs the transmitting device 12 to transmit a jamming radio wave. As a result, the transmitting device 12 starts jamming the monitoring signal between the group monitoring device 15 and the group monitoring device 16.

サーバ群Bに対応する群監視装置15及び群監視装置16は、監視信号の通信を妨害されることにより、サーバ群B内のサーバ、及び、アプリケーションが正常動作していることを検知する。サービスを受けるべく振分装置7へアクセスしたクライアント8は、アプリケーションが動作しているサーバ11へ誘導され、アプリケーションによる処理結果を得る。 The group monitoring device 15 and the group monitoring device 16 corresponding to the server group B detect that the servers and applications in the server group B are operating normally by interfering with the communication of the monitoring signal. The client 8 that has accessed the distribution device 7 to receive the service is guided to the server 11 on which the application is running, and obtains the processing result by the application.

次に、実施形態1に係るコンピュータシステム100において、群監視装置5の動作を説明する。ここでは、群監視装置5を例にとるが、群監視装置6、群監視装置15、群監視装置16の動作も基本的には同一である。群監視装置5は、通信を行う相手として、予め決められた群監視装置6と対になって構成されている。群監視装置15の場合は、群監視装置16と対になっており、両者の間で監視信号の通信を行う。 Next, in the computer system 100 according to the first embodiment, the operation of the group monitoring device 5 will be described. Here, the group monitoring device 5 is taken as an example, but the operations of the group monitoring device 6, the group monitoring device 15, and the group monitoring device 16 are basically the same. The group monitoring device 5 is configured as a pair with a predetermined group monitoring device 6 as a communication partner. In the case of the group monitoring device 15, the group monitoring device 16 is paired with the group monitoring device 16, and the monitoring signal is communicated between the two.

図2は、実施形態1に係るコンピュータシステムにおいて、群監視装置が動作を開始してからの処理を例示した図である。図2に示すように、群監視装置5が動作を開始すると、大きく分けて、2つの処理が実行される。一つは、ステップS11に示すように、群監視装置6への監視信号の送信処理である。これは、群監視装置5から、監視信号を受信可能な群監視装置6に対して監視信号を送信する処理である。具体的には、対になる群監視装置6に対して、例えば、ごく短い間隔で監視信号を送信し続ける。もう一つは、ステップS12に示すように、群監視装置6からの監視信号の受信処理である。これは、対になる群監視装置6から送られた監視信号を受信し続ける。 FIG. 2 is a diagram illustrating processing after the group monitoring device starts operation in the computer system according to the first embodiment. As shown in FIG. 2, when the group monitoring device 5 starts operating, roughly divided into two processes are executed. One is a process of transmitting a monitoring signal to the group monitoring device 6 as shown in step S11. This is a process of transmitting a monitoring signal from the group monitoring device 5 to the group monitoring device 6 that can receive the monitoring signal. Specifically, for example, the monitoring signal is continuously transmitted to the paired group monitoring device 6 at very short intervals. The other is, as shown in step S12, the process of receiving the monitoring signal from the group monitoring device 6. It continues to receive the monitoring signal sent from the paired group monitoring device 6.

監視信号の受信処理においては、ステップS13に示すように、正常な監視信号が受信できたか判断する。監視信号が異常、または、監視信号が受信できない等の正常な監視信号がない場合には、ステップS12に戻り、再度、監視信号の受信処理の試行を繰り返す。これは、サーバ1の発信装置2から、群監視装置5による監視信号の受信を妨害する妨害電波が発信されていることに相当する。すなわち、サーバ1が正常である場合に相当する。 In the monitoring signal reception process, as shown in step S13, it is determined whether or not a normal monitoring signal has been received. If the monitoring signal is abnormal or there is no normal monitoring signal such as the monitoring signal cannot be received, the process returns to step S12, and the trial of the monitoring signal reception process is repeated again. This corresponds to a jamming radio wave transmitted from the transmitting device 2 of the server 1 that interferes with the reception of the monitoring signal by the group monitoring device 5. That is, it corresponds to the case where the server 1 is normal.

ステップS13において、正常な監視信号がある場合には、サーバ1に異常が発生している。すなわち、群監視装置5は、監視信号を受信することによって、サーバ1の異常を検知する。よって、ステップS14及びステップS15に示すように、群監視装置5は、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。さらに、ステップS16及びステップS17に示すように、群監視装置5は、監視対象であるサーバ1の制御を担当している制御機構3に対して、サーバ1の再起動を指示する。その後、ステップS12に戻り、群監視装置5は、再度、監視信号の受信処理を開始する。 If there is a normal monitoring signal in step S13, an abnormality has occurred in the server 1. That is, the group monitoring device 5 detects the abnormality of the server 1 by receiving the monitoring signal. Therefore, as shown in steps S14 and S15, the group monitoring device 5 instructs the control mechanism 13 in charge of controlling the backup system to start the application 10. Further, as shown in steps S16 and S17, the group monitoring device 5 instructs the control mechanism 3 in charge of controlling the server 1 to be monitored to restart the server 1. After that, the process returns to step S12, and the group monitoring device 5 starts the monitoring signal reception process again.

なお、群監視装置5と群監視装置6との間で監視信号の一方向の通信を行っている場合には、群監視装置5は、ステップS11、または、ステップS12〜S17のうちのいずれか一方を行う。そして、群監視装置6は、ステップS11、または、ステップS12〜S17の他方を行う。 When the group monitoring device 5 and the group monitoring device 6 are communicating in one direction with the monitoring signal, the group monitoring device 5 is in either step S11 or steps S12 to S17. Do one. Then, the group monitoring device 6 performs the other of steps S11 or S12 to S17.

次に、実施形態1に係るコンピュータシステム100において、サーバ1から見た各構成との連係動作を説明する。図3は、実施形態1に係るコンピュータシステム100において、サーバの動作を例示したシーケンス図である。 Next, in the computer system 100 according to the first embodiment, the operation of linking with each configuration as seen from the server 1 will be described. FIG. 3 is a sequence diagram illustrating the operation of the server in the computer system 100 according to the first embodiment.

図3に示すように、サーバ1が起動すると、ステップS21に示すように、制御機構3は、発信装置2に対して、妨害電波の発信を指示する。発信装置2は、妨害信号発信の指示を受けると、ステップS22に示すように、例えば、ごく短い間隔で妨害電波を発信する。 As shown in FIG. 3, when the server 1 is started, the control mechanism 3 instructs the transmitting device 2 to transmit a jamming radio wave as shown in step S21. Upon receiving the instruction to transmit the jamming signal, the transmitting device 2 transmits the jamming radio wave at very short intervals, for example, as shown in step S22.

次に、ステップS23に示すように、制御機構3は、さらに、アプリケーション10の起動を指示する。そうすると、ステップS24に示すように、起動したアプリケーション10は、処理を開始する。そして、ステップS25に示すように、データ処理を行う。 Next, as shown in step S23, the control mechanism 3 further instructs the start of the application 10. Then, as shown in step S24, the started application 10 starts processing. Then, as shown in step S25, data processing is performed.

次に、ステップS26に示すように、制御機構3は、AP監視機構4に対して、アプリケーション監視指示を行う。AP監視機構4は、ステップS27に示すように、アプリケーション10、及び、サーバ1内で異常が発生していないか、監視を開始する。 Next, as shown in step S26, the control mechanism 3 issues an application monitoring instruction to the AP monitoring mechanism 4. As shown in step S27, the AP monitoring mechanism 4 starts monitoring whether or not an abnormality has occurred in the application 10 and the server 1.

次に、ステップS28に示すように、制御機構3は、振分装置7に対して、サーバ1上でアプリケーションが起動したことを通知する。振分装置7は、ステップS29に示すように、アプリケーションが起動しているサーバがどれかというアプリケーション起動サーバ情報を更新し、振分装置7にアクセスしてきたクライアントをサーバ1へ誘導する。 Next, as shown in step S28, the control mechanism 3 notifies the distribution device 7 that the application has been started on the server 1. As shown in step S29, the distribution device 7 updates the application startup server information indicating which server the application is running on, and guides the client accessing the distribution device 7 to the server 1.

群監視装置5または群監視装置6がサーバ1の異常を検知した場合には、群監視装置5または群監視装置6は、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。この場合におけるサーバ2の動作は、制御機構3、AP監視機構4、発信装置2が、制御機構13、AP監視機構14、発信装置12になる以外は、図3と同様である。 When the group monitoring device 5 or the group monitoring device 6 detects an abnormality in the server 1, the group monitoring device 5 or the group monitoring device 6 applies the application 10 to the control mechanism 13 in charge of controlling the backup system. Instruct to start. The operation of the server 2 in this case is the same as that of FIG. 3 except that the control mechanism 3, the AP monitoring mechanism 4, and the transmitting device 2 become the control mechanism 13, the AP monitoring mechanism 14, and the transmitting device 12.

次に、本実施形態の効果を説明する。本実施形態のコンピュータシステム100は、監視信号を受信可能な群監視装置5及び群監視装置6と、監視信号の受信を妨害する妨害電波の発信を行う発信装置2とを備えている。よって、発信装置2による妨害電波の停止により、監視対象のサーバ1の異常を即時検知することができる。本実施形態のコンピュータシステム100は、監視対象の各サーバにメッセージを送って応答を求めるのではなく、各サーバの自発的動作を異常検知に利用しているので、サーバ1の状態を素早く調べることができる。 Next, the effect of this embodiment will be described. The computer system 100 of the present embodiment includes a group monitoring device 5 and a group monitoring device 6 capable of receiving a monitoring signal, and a transmitting device 2 for transmitting a jamming radio wave that interferes with the reception of the monitoring signal. Therefore, by stopping the jamming radio wave by the transmitting device 2, it is possible to immediately detect the abnormality of the server 1 to be monitored. Since the computer system 100 of the present embodiment uses the spontaneous operation of each server for abnormality detection instead of sending a message to each server to be monitored and requesting a response, the state of the server 1 can be quickly checked. Can be done.

また、各監視対象サーバ1の異常を即時検知することで、コンピュータシステム100としてのサービス停止時間を短縮することができる。 Further, by immediately detecting the abnormality of each monitored server 1, the service stop time of the computer system 100 can be shortened.

また、本実施形態のコンピュータシステム100は、複数の監視対象サーバを共通手段で一括して監視するため、サーバ群内の少なくとも1台が起動しているということの監視に、高機能な装置を必要としない。よって、複数のサーバに対する監視を、安価に行うことができる。 Further, since the computer system 100 of the present embodiment collectively monitors a plurality of monitored servers by a common means, a high-performance device is used for monitoring that at least one of the servers in the server group is running. do not need. Therefore, monitoring of a plurality of servers can be performed at low cost.

また、監視信号及び妨害電波は、無線電波にのせた信号でもよい。これにより、有線を必要とせず、群監視装置5及び群監視装置6を配置する制限を低減させることができる。 Further, the monitoring signal and the jamming radio wave may be a signal placed on the radio wave. As a result, it is possible to reduce the limitation of arranging the group monitoring device 5 and the group monitoring device 6 without requiring a wired connection.

(実施形態2)
次に、実施形態2に係るコンピュータシステムを説明する。図4は、実施形態2に係るコンピュータシステムを例示した構成図である。図4に示すように、本実施形態のコンピュータシステム200は、群監視装置5と群監視装置6との間、群監視装置5及び群監視装置6と発信装置2との間、群監視装置15と群監視装置16との間、並びに、群監視装置15及び群監視装置16と発信装置12の間は、通信ケーブルCCで接続されている。通信ケーブルCCは、例えば、CSMA/CD方式で通信を行うことのできるものである。CSMA/CD方式で通信を行うことのできる通信ケーブルCCは、例えば、10BASE−T等である。図4では、サーバ群A内のサーバ1以外のサーバにある発信装置との有線接続は、図示を省略している。サーバ群B内のサーバ11以外のサーバにある発信装置についても同様である。
(Embodiment 2)
Next, the computer system according to the second embodiment will be described. FIG. 4 is a configuration diagram illustrating the computer system according to the second embodiment. As shown in FIG. 4, the computer system 200 of the present embodiment has a group monitoring device 15 between the group monitoring device 5 and the group monitoring device 6, the group monitoring device 5 and the group monitoring device 6 and the transmission device 2. And the group monitoring device 16, and between the group monitoring device 15, the group monitoring device 16, and the transmission device 12, are connected by a communication cable CC. The communication cable CC can perform communication in the CSMA / CD system, for example. The communication cable CC capable of communicating in the CSMA / CD system is, for example, 10BASE-T or the like. In FIG. 4, the wired connection with the transmission device in the server other than the server 1 in the server group A is not shown. The same applies to the transmitting device in the server other than the server 11 in the server group B.

本実施形態でも、現用系サーバ群A、及び、待機系サーバ群Bで構成されるシステムである。群監視装置5及び群監視装置6は、サーバ群Aの監視に対応している。群監視装置5から群監視装置6に対しては、例えば、ごく短い間隔で監視信号の送出を行っている。監視信号は、例えば、送信データである。サーバ群Aの中にあるサーバ1をはじめとしたサーバでは、ソフトウェアプログラムであるアプリケーション10が動作している。ネットワーク経由でアクセスしてきたクライアント8は、アプリケーション10による処理結果を受け取ることができる。 Also in this embodiment, the system is composed of the active server group A and the standby server group B. The group monitoring device 5 and the group monitoring device 6 correspond to the monitoring of the server group A. For example, monitoring signals are sent from the group monitoring device 5 to the group monitoring device 6 at very short intervals. The monitoring signal is, for example, transmission data. The application 10 which is a software program is running on the server including the server 1 in the server group A. The client 8 accessing via the network can receive the processing result by the application 10.

AP監視機構4は、アプリケーション10が動作を正常に続けていること、及び、サーバ1においてハードウェア的な異常が発生していないことを監視している。発信装置2は、AP監視機構4が異常を検知しない限り、群監視装置5と群監視装置6との間の通信ケーブルCCに対して、妨害信号を発信している。妨害信号は、例えば、送出信号(キャリア)である。 The AP monitoring mechanism 4 monitors that the application 10 continues to operate normally and that no hardware abnormality has occurred in the server 1. The transmitting device 2 transmits an interference signal to the communication cable CC between the group monitoring device 5 and the group monitoring device 6 unless the AP monitoring mechanism 4 detects an abnormality. The interfering signal is, for example, a transmission signal (carrier).

AP監視機構4は、サーバ1等の異常を検知すると、制御機構3にサーバ1等の異常の発生を通知する。制御機構3は、異常検知の通知を受けて、発信装置2による送出信号の発信を停止させる。また、発信装置2を含むサーバ1が電源断によって異常停止した場合には、電力供給を断たれて発信装置2による送出信号の発信が停止する。発信装置2による送出信号の発信が停止すると、群監視装置5から群監視装置6に対して正常にデータ送信が行えることとなり、群監視装置6は、サーバ1で異常が発生したことを検知する。 When the AP monitoring mechanism 4 detects an abnormality in the server 1 or the like, it notifies the control mechanism 3 of the occurrence of the abnormality in the server 1 or the like. Upon receiving the notification of abnormality detection, the control mechanism 3 stops the transmission of the transmission signal by the transmission device 2. Further, when the server 1 including the transmission device 2 is abnormally stopped due to the power failure, the power supply is cut off and the transmission of the transmission signal by the transmission device 2 is stopped. When the transmission of the transmission signal by the transmission device 2 is stopped, data can be normally transmitted from the group monitoring device 5 to the group monitoring device 6, and the group monitoring device 6 detects that an abnormality has occurred in the server 1. ..

異常を検知した群監視装置6は、予備系(待機系)であるサーバ群B内サーバ11において、制御機構13にアプリケーションの起動を指示する。サーバ1に対する予備系がサーバ11であること、または、サーバ群Aに対する予備系がサーバ群Bであることは、予め、システム構成情報として各サーバ内に記録されている。 The group monitoring device 6 that has detected an abnormality instructs the control mechanism 13 to start the application in the server 11 in the server group B, which is a backup system (standby system). It is recorded in each server in advance that the backup system for the server 1 is the server 11 or the backup system for the server group A is the server group B as system configuration information.

サーバ11において起動したアプリケーション(図中省略)は、サーバ1で起動していたアプリケーションの処理結果をストレージ9から引き継いで、処理を開始する。制御機構13は、アプリケーションがサーバ11で起動したことを振分装置7に通知する。このとき、群監視装置15から群監視装置16に対しては、例えば、ごく短い間隔でデータ送出を行う。そこで、制御機構13は、発信装置12に対して送出信号の発信を指示する。これによって、発信装置12は、群監視装置15から群監視装置16へのデータ送出の妨害を開始する。 The application started on the server 11 (omitted in the figure) takes over the processing result of the application started on the server 1 from the storage 9 and starts the processing. The control mechanism 13 notifies the distribution device 7 that the application has been started on the server 11. At this time, data is transmitted from the group monitoring device 15 to the group monitoring device 16 at very short intervals, for example. Therefore, the control mechanism 13 instructs the transmission device 12 to transmit the transmission signal. As a result, the transmitting device 12 starts interfering with data transmission from the group monitoring device 15 to the group monitoring device 16.

サーバ群Bに対応する群監視装置16は、群監視装置15からのデータ送出を妨害されることにより、サーバ群B内のサーバ、及び、アプリケーションが正常動作していることを知る。サービスを受けるべく振分装置7へアクセスしたクライアント8は、アプリケーションが動作しているサーバ11へ誘導され、アプリケーションによる処理結果を得る。 The group monitoring device 16 corresponding to the server group B knows that the servers and applications in the server group B are operating normally by interfering with the data transmission from the group monitoring device 15. The client 8 that has accessed the distribution device 7 to receive the service is guided to the server 11 on which the application is running, and obtains the processing result by the application.

次に、実施形態2に係るコンピュータシステム200において、有線接続の場合の群監視装置5の動作を説明する。 Next, in the computer system 200 according to the second embodiment, the operation of the group monitoring device 5 in the case of a wired connection will be described.

図5は、実施形態2に係るコンピュータシステムにおいて、有線接続の場合における一方の群監視装置の動作を例示した図である。群監視装置5は、動作開始後、データ送信を試行するが、データ送信に先立ち、図5のステップS31に示すように、群監視装置5は、データ通信ケーブルCC上に送出信号を発信する。 FIG. 5 is a diagram illustrating the operation of one group monitoring device in the case of a wired connection in the computer system according to the second embodiment. The group monitoring device 5 attempts to transmit data after the start of operation, but prior to the data transmission, the group monitoring device 5 transmits a transmission signal on the data communication cable CC as shown in step S31 of FIG.

次に、ステップS32に示すように、群監視装置5は、発信装置2から発信された送出信号との競合があるか判断する。送出信号の競合がある場合には、ステップS33に示すように、ごく短時間の待ち合わせの後で、ステップS31に戻り、通信ケーブルCC上に再び送出信号を発信する。送出信号の競合がある場合は、サーバ1の発信装置2から送出信号が発信されていることに相当する。すなわち、サーバ1が正常である場合に相当する。 Next, as shown in step S32, the group monitoring device 5 determines whether there is a conflict with the transmission signal transmitted from the transmission device 2. If there is a conflict in the transmission signal, as shown in step S33, after waiting for a very short time, the process returns to step S31 and the transmission signal is transmitted again on the communication cable CC. When there is a conflict in the transmission signal, it corresponds to the transmission signal being transmitted from the transmission device 2 of the server 1. That is, it corresponds to the case where the server 1 is normal.

一方、ステップS32において、送出信号の競合がない場合には、ステップS34に示すように、群監視装置6に対してデータ送信を行う。送出信号の競合がない場合は、サーバ1に異常が発生している。すなわち、群監視装置6は、監視信号を受信することによって、サーバ1の異常を検知する。この場合の動作については、以下のステップS37〜ステップS40で説明する。 On the other hand, in step S32, when there is no conflict of transmission signals, data is transmitted to the group monitoring device 6 as shown in step S34. If there is no conflict in the transmission signal, an error has occurred in the server 1. That is, the group monitoring device 6 detects the abnormality of the server 1 by receiving the monitoring signal. The operation in this case will be described in steps S37 to S40 below.

図6は、実施形態2に係るコンピュータシステムにおいて、有線接続の場合における他方の群監視装置の動作を例示した図である。図6のステップS35に示すように、他方の群監視装置6は、データ受信処理を行う。群監視装置6は、対になる一方の群監視装置5から送られたデータを受信し続ける。 FIG. 6 is a diagram illustrating the operation of the other group monitoring device in the case of a wired connection in the computer system according to the second embodiment. As shown in step S35 of FIG. 6, the other group monitoring device 6 performs data reception processing. The group monitoring device 6 continues to receive data sent from one of the paired group monitoring devices 5.

次に、ステップS36に示すように、群監視装置6は、正常な受信データがあるか判断する。受信データが異常、または、受信データを受信できないならば、ステップS35に戻り、再度、データ受信処理を繰り返す。これは、サーバ1の発信装置2から群監視装置6による受信データを妨害する送出信号が発信されていることに相当する。すなわち、サーバ1が正常である場合に相当する。 Next, as shown in step S36, the group monitoring device 6 determines whether or not there is normal received data. If the received data is abnormal or the received data cannot be received, the process returns to step S35, and the data reception process is repeated again. This corresponds to the transmission signal interfering with the received data by the group monitoring device 6 being transmitted from the transmission device 2 of the server 1. That is, it corresponds to the case where the server 1 is normal.

一方、ステップS36において、正常な受信データがあるならば、サーバ1に異常が発生している。すなわち、群監視装置6は、受信データを受信することによって、サーバ1の異常を検知する。よって、ステップS37及びステップS38に示すように、群監視装置6は、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。さらに、ステップS39及びステップS40に示すように、群監視装置6は、監視対象であるサーバ1の制御を担当している制御機構3に対して、サーバ1の再起動を指示する。その後、ステップS35に戻り、群監視装置6は、再度、データ受信処理を開始する。 On the other hand, in step S36, if there is normal received data, an abnormality has occurred in the server 1. That is, the group monitoring device 6 detects the abnormality of the server 1 by receiving the received data. Therefore, as shown in step S37 and step S38, the group monitoring device 6 instructs the control mechanism 13 in charge of controlling the backup system to start the application 10. Further, as shown in steps S39 and S40, the group monitoring device 6 instructs the control mechanism 3 in charge of controlling the server 1 to be monitored to restart the server 1. After that, the process returns to step S35, and the group monitoring device 6 starts the data reception process again.

本実施形態では、監視信号として、有線通信にのせたデータを用いている。このように、監視信号及び妨害信号は無線に限らず、有線通信でも用いることができる。よって、発信装置2は無線を発生させる部材を不要とすることができる。また、有線通信は、妨害電波以外の他の電磁波の影響を除外することができる。よって、コンピュータシステム200の設置場所の制限を低減させることができる。これ以外の構成及び効果は、実施形態1の記載に含まれている。 In the present embodiment, data carried on the wired communication is used as the monitoring signal. As described above, the monitoring signal and the interference signal can be used not only for wireless communication but also for wired communication. Therefore, the transmitting device 2 can eliminate the need for a member that generates radio waves. In addition, wired communication can exclude the influence of electromagnetic waves other than jamming radio waves. Therefore, it is possible to reduce the limitation of the installation location of the computer system 200. Other configurations and effects are included in the description of Embodiment 1.

(実施形態3)
次に、実施形態3を説明する。本実施形態は、実施形態1及び2の構成に加えて、外部との通信経路の監視を行う構成を含んでいる。図7は、実施形態3に係るコンピュータシステムを例示した構成図である。
(Embodiment 3)
Next, the third embodiment will be described. In addition to the configurations of the first and second embodiments, the present embodiment includes a configuration for monitoring a communication path with the outside. FIG. 7 is a configuration diagram illustrating the computer system according to the third embodiment.

図7に示すように、実施形態3に係るコンピュータシステム300は、サーバ1内にNW監視機構17及びNIC18を有している。また、コンピュータシステム300は、サーバ11内にNW監視機構19及びNIC20を有している。さらに、コンピュータシステム300の振分装置7は、通信経路を通じた状態確認に対して、応答を返す機能を有している。 As shown in FIG. 7, the computer system 300 according to the third embodiment has a NW monitoring mechanism 17 and a NIC 18 in the server 1. Further, the computer system 300 has a NW monitoring mechanism 19 and a NIC 20 in the server 11. Further, the distribution device 7 of the computer system 300 has a function of returning a response to the status confirmation through the communication path.

NW監視機構17は、NIC18を通じて振分装置7に対して、クライアント8とサーバ1との間の通信経路が正常かどうか確認する。そして、NW監視機構17は、サーバ1とクライアント8との間の通信が正常かを判断する。NW監視機構19は、NIC20を通じて振分装置7に対して、クライアント8とサーバ11との間の通信経路が正常かどうか確認する。そして、NW監視機構19は、サーバ11とクライアント8との間の通信が正常かを判断する。 The NW monitoring mechanism 17 confirms with the distribution device 7 whether the communication path between the client 8 and the server 1 is normal through the NIC 18. Then, the NW monitoring mechanism 17 determines whether the communication between the server 1 and the client 8 is normal. The NW monitoring mechanism 19 confirms with the distribution device 7 whether the communication path between the client 8 and the server 11 is normal through the NIC 20. Then, the NW monitoring mechanism 19 determines whether the communication between the server 11 and the client 8 is normal.

図8は、実施形態3に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。図8のステップS41に示すように、制御機構3は、発信装置2に対して、妨害信号として、妨害電波の発信を指示する。これを受けて、ステップS42に示すように、発信装置2は、妨害電波を発信する。 FIG. 8 is a sequence diagram illustrating the operation of the server in the computer system according to the third embodiment. As shown in step S41 of FIG. 8, the control mechanism 3 instructs the transmitting device 2 to transmit a jamming radio wave as a jamming signal. In response to this, as shown in step S42, the transmitting device 2 transmits a jamming radio wave.

次に、ステップS43に示すように、制御機構3は、NW監視機構17に対して、振分装置7及びクライアント8に到る通信経路の状態確認を指示する。これを受けて、ステップS44に示すように、アプリケーション10が稼働しているサーバ1内のNW監視機構17は、クライアント8とサーバ1との間の通信経路が正常に維持されていることを確認するため、NIC18を通じて、定期的に振分装置7に対する状態確認の応答要求を行う。 Next, as shown in step S43, the control mechanism 3 instructs the NW monitoring mechanism 17 to confirm the state of the communication path reaching the distribution device 7 and the client 8. In response to this, as shown in step S44, the NW monitoring mechanism 17 in the server 1 in which the application 10 is running confirms that the communication path between the client 8 and the server 1 is normally maintained. Therefore, a response request for status confirmation to the sorting device 7 is periodically made through the NIC 18.

次に、ステップS45に示すように、応答要求待ちしていた振分装置7は、ステップS46に示すように、NW監視機構17に対して、応答を行う。ステップS47に示すように、応答待ちをしていたNW監視機構17は、振分装置7からの応答を受け取る。NW監視機構17からの状態確認後、一定時間内に振分装置7からの応答が返れば、NW監視機構17は、クライアント8とサーバ1との間の通信経路が正常に維持されていると判断する。 Next, as shown in step S45, the distribution device 7 waiting for the response request responds to the NW monitoring mechanism 17 as shown in step S46. As shown in step S47, the NW monitoring mechanism 17 waiting for a response receives the response from the sorting device 7. If a response from the distribution device 7 is returned within a certain period of time after the status is confirmed from the NW monitoring mechanism 17, the NW monitoring mechanism 17 indicates that the communication path between the client 8 and the server 1 is normally maintained. to decide.

次に、ステップS48に示すように、制御機構3は、アプリケーション10を起動させる。ステップS48〜ステップS54は、前述の図3のステップS23〜ステップS29と同様である。 Next, as shown in step S48, the control mechanism 3 activates the application 10. Steps S48 to S54 are the same as steps S23 to S29 of FIG. 3 described above.

一方、ステップS43において、NW監視機構17からの状態確認後、一定時間内に振分装置7からの応答が返らなければ、NW監視機構17は、クライアント8とサーバ1の間の通信経路を含めて、サーバ1は正常にサービスを提供できないと判断する。そして、NW監視機構17は、制御機構3に対して異常を通知する。NW監視機構17がサーバ1とクライアント8との間の通信を異常と判断した場合には、制御機構3は、異常検知の通知を受けて、発信装置2に妨害電波の発信を停止させる。これにより、群監視装置5または群監視装置6は、サーバ1の異常を検知し、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。この場合におけるサーバ2の動作は、制御機構3、NW監視機構17、AP監視機構4、発信装置2が、制御機構13、NW監視機構19、AP監視機構14、発信装置12になる以外は、図8と同様である。 On the other hand, in step S43, if no response from the distribution device 7 is returned within a certain period of time after the status is confirmed from the NW monitoring mechanism 17, the NW monitoring mechanism 17 includes the communication path between the client 8 and the server 1. Therefore, the server 1 determines that the service cannot be provided normally. Then, the NW monitoring mechanism 17 notifies the control mechanism 3 of the abnormality. When the NW monitoring mechanism 17 determines that the communication between the server 1 and the client 8 is abnormal, the control mechanism 3 receives the notification of the abnormality detection and causes the transmitting device 2 to stop the transmission of the jamming radio wave. As a result, the group monitoring device 5 or the group monitoring device 6 detects an abnormality in the server 1 and instructs the control mechanism 13 in charge of controlling the backup system to start the application 10. In this case, the operation of the server 2 is such that the control mechanism 3, the NW monitoring mechanism 17, the AP monitoring mechanism 4, and the transmitting device 2 become the control mechanism 13, the NW monitoring mechanism 19, the AP monitoring mechanism 14, and the transmitting device 12. It is the same as FIG.

そして、アプリケーション10がサーバ11上で稼働を開始する。サーバ11内のNW監視機構19が、クライアント8とサーバ2との間の通信経路が正常に維持されていることを確認するため、NIC20を通じ、定期的に振分装置7に対する状態確認の通信を開始する。 Then, the application 10 starts running on the server 11. In order to confirm that the communication path between the client 8 and the server 2 is normally maintained, the NW monitoring mechanism 19 in the server 11 periodically transmits a status confirmation communication to the distribution device 7 through the NIC 20. Start.

本実施形態のコンピュータシステム300は、サーバ1にNW監視機構17及びNIC18を有し、サーバ11にNW監視機構19及びNIC20を有している。よって、クライアント8とサーバ1との間の通信経路の異常を即時に検知することができる。これ以外の構成及び効果は、実施形態1及び2の記載に含まれている。 The computer system 300 of the present embodiment has the NW monitoring mechanism 17 and the NIC 18 in the server 1, and the NW monitoring mechanism 19 and the NIC 20 in the server 11. Therefore, it is possible to immediately detect an abnormality in the communication path between the client 8 and the server 1. Other configurations and effects are included in the description of embodiments 1 and 2.

(実施形態4)
次に、実施形態4を説明する。実施形態4のコンピュータシステムは、サーバ1及びサーバ11の外部環境の監視を行う例である。図9は、実施形態4に係るコンピュータシステムを例示した構成図である。図9に示すように、本実施形態のコンピュータシステム400は、サーバ1を含むサーバ群Aが地点PAに、サーバ11を含むサーバ群Bが地点PBに設置されている。また、サーバ1は、温度センサ27を、サーバ11は温度センサ28を有している。温度センサ27は、サーバ1が設置された地点PAの温度を検知する。温度センサ28は、サーバ11が設置された地点PBの温度を検知する。
(Embodiment 4)
Next, the fourth embodiment will be described. The computer system of the fourth embodiment is an example of monitoring the external environment of the server 1 and the server 11. FIG. 9 is a configuration diagram illustrating the computer system according to the fourth embodiment. As shown in FIG. 9, in the computer system 400 of the present embodiment, the server group A including the server 1 is installed at the point PA, and the server group B including the server 11 is installed at the point PB. Further, the server 1 has a temperature sensor 27, and the server 11 has a temperature sensor 28. The temperature sensor 27 detects the temperature of the point PA where the server 1 is installed. The temperature sensor 28 detects the temperature of the point PB where the server 11 is installed.

図10は、実施形態4に係るコンピュータシステムにおいて、サーバの動作を例示したシーケンス図である。図10のステップS61に示すように、制御機構3は、発信装置2に対して、妨害電波の発信を指示する。これを受けて、ステップS62に示すように、発信装置2は、妨害電波の発信を行う。 FIG. 10 is a sequence diagram illustrating the operation of the server in the computer system according to the fourth embodiment. As shown in step S61 of FIG. 10, the control mechanism 3 instructs the transmitting device 2 to transmit a jamming radio wave. In response to this, as shown in step S62, the transmitting device 2 transmits the jamming radio wave.

次に、ステップS63に示すように、制御機構3は、温度センサ27に対して、地点PAの温度を監視させる。これを受けて、ステップS64に示すように、アプリケーション10が稼働しているサーバ1内の温度センサ27は、地点PAが、サーバ1にとって正常稼働できる適正な温度に保たれているか否かを監視する。温度センサ27は、地点PAの温度を常時監視してもよいし、所定の間隔で監視してもよい。 Next, as shown in step S63, the control mechanism 3 causes the temperature sensor 27 to monitor the temperature at the point PA. In response to this, as shown in step S64, the temperature sensor 27 in the server 1 in which the application 10 is running monitors whether or not the point PA is maintained at an appropriate temperature for the server 1 to operate normally. To do. The temperature sensor 27 may constantly monitor the temperature of the point PA, or may monitor the temperature at predetermined intervals.

制御機構3は、温度センサ27が確認した地点PAの温度が適正の場合には、ステップS65に示すように、アプリケーション10を起動させる。ステップS65〜ステップS71は、前述の図3のステップS23〜ステップS29と同様である。 When the temperature of the point PA confirmed by the temperature sensor 27 is appropriate, the control mechanism 3 activates the application 10 as shown in step S65. Steps S65 to S71 are the same as steps S23 to S29 of FIG. 3 described above.

一方、温度センサ27は、地点PAの温度が適正な範囲を超えた場合には、サーバ1がそのまま稼働を継続すると異常をきたす可能性が高いと判断する。そして、温度センサ27は、制御機構3に対して、異常を通知する。制御機構3は異常検知の通知を受けて、発信装置2による妨害電波の発信を停止させる。 On the other hand, the temperature sensor 27 determines that when the temperature at the point PA exceeds an appropriate range, there is a high possibility that an abnormality will occur if the server 1 continues to operate as it is. Then, the temperature sensor 27 notifies the control mechanism 3 of the abnormality. Upon receiving the notification of abnormality detection, the control mechanism 3 stops the transmission of the jamming radio wave by the transmitting device 2.

このように、制御機構3は、温度センサ27が検知した温度に基づいて、発信装置2に妨害信号の発信を停止させる。これにより、群監視装置5または群監視装置6は、サーバ1の異常を検知し、予備系の制御を担当している制御機構13に対してアプリケーション10の起動を指示する。この場合におけるサーバ2の動作は、制御機構3、温度センサ27、AP監視機構4、発信装置2が、制御機構13、温度センサ28、AP監視機構14、発信装置12になる以外は、図10と同様である。これ以降は、アプリケーション10がサーバ11上で稼働を開始し、サーバ11内の温度センサ28は、地点PBが、サーバ2が正常稼働できる適正な温度に保たれているか否か、監視を開始する。 In this way, the control mechanism 3 causes the transmitting device 2 to stop transmitting the interference signal based on the temperature detected by the temperature sensor 27. As a result, the group monitoring device 5 or the group monitoring device 6 detects an abnormality in the server 1 and instructs the control mechanism 13 in charge of controlling the backup system to start the application 10. The operation of the server 2 in this case is FIG. 10 except that the control mechanism 3, the temperature sensor 27, the AP monitoring mechanism 4, and the transmitting device 2 become the control mechanism 13, the temperature sensor 28, the AP monitoring mechanism 14, and the transmitting device 12. Is similar to. After that, the application 10 starts operating on the server 11, and the temperature sensor 28 in the server 11 starts monitoring whether or not the point PB is maintained at an appropriate temperature at which the server 2 can operate normally. ..

次に、本実施形態の効果を説明する。本実施形態のコンピュータシステム400は、サーバ1を含むサーバ群A及びサーバ11を含むサーバ群Bの外部環境、例えば、温度の監視を行うことができる。よって、サーバ1がそのまま稼働を継続すると異常をきたす可能性が高い外部環境への変化を即時検知することができる。なお、検知する外部環境は、温度に限らず、例えば、湿度、電磁波等の外部環境でもよい。これ以外の構成及び効果は、実施形態1〜3の記載に含まれている。 Next, the effect of this embodiment will be described. The computer system 400 of the present embodiment can monitor the external environment of the server group A including the server 1 and the server group B including the server 11, for example, the temperature. Therefore, if the server 1 continues to operate as it is, it is possible to immediately detect a change to the external environment that is likely to cause an abnormality. The external environment to be detected is not limited to temperature, and may be, for example, an external environment such as humidity or electromagnetic waves. Other configurations and effects are included in the description of Embodiments 1-3.

なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、実施形態1〜4の各構成を組み合わせた実施形態も技術的思想の範囲である。また、本実施形態における異常検知方法をコンピュータに実行させる以下の異常検知プログラムも、実施形態の技術的思想の範囲に含まれる。 The present invention is not limited to the above embodiment, and can be appropriately modified without departing from the spirit. For example, an embodiment in which each configuration of the first to fourth embodiments is combined is also within the scope of the technical idea. Further, the following abnormality detection program for causing the computer to execute the abnormality detection method in the present embodiment is also included in the scope of the technical idea of the embodiment.

第1監視装置から監視信号を受信可能な第2監視装置に対して、前記監視信号を送信させ、
サーバの発信装置から前記第2監視装置による前記監視信号の受信を妨害する妨害信号を発信させ、
前記第2監視装置が前記監視信号を受信することによって、前記サーバの異常を検知させる、
ことをコンピュータに実行させる異常検知プログラム。
The monitoring signal is transmitted to the second monitoring device that can receive the monitoring signal from the first monitoring device.
A jamming signal that interferes with the reception of the monitoring signal by the second monitoring device is transmitted from the transmitting device of the server.
When the second monitoring device receives the monitoring signal, the abnormality of the server is detected.
An anomaly detection program that lets a computer do things.

1、11 サーバ
2、12 発信装置
3、13 制御機構
4、14 AP監視機構
5、6、15、16 群監視装置
7 振分装置
8 クライアント
9 ストレージ
10 アプリケーション
17、19 NW監視機構
18、20 NIC
27、28 温度センサ
100、200、300、400 コンピュータシステム
A、B サーバ群
CC 通信ケーブル
PA、PB 地点
1, 11 Server 2, 12 Transmitter 3, 13 Control mechanism 4, 14 AP monitoring mechanism 5, 6, 15, 16 Group monitoring device 7 Distribution device 8 Client 9 Storage 10 Application 17, 19 NW monitoring mechanism 18, 20 NIC
27, 28 Temperature sensor 100, 200, 300, 400 Computer system A, B Server group CC communication cable PA, PB point

Claims (9)

監視信号を送信する第1監視装置と、
前記第1監視装置から送信された前記監視信号を受信可能な第2監視装置と、
前記第2監視装置による前記監視信号の受信を妨害する妨害信号の発信を行う発信装置を有したサーバと、
を備えたコンピュータシステム。
The first monitoring device that transmits the monitoring signal,
A second monitoring device capable of receiving the monitoring signal transmitted from the first monitoring device, and
A server having a transmission device that transmits an interference signal that interferes with the reception of the monitoring signal by the second monitoring device, and
A computer system equipped with.
前記第2監視装置は、前記監視信号を受信することによって、前記サーバの異常を検知する、
請求項1に記載のコンピュータシステム。
The second monitoring device detects an abnormality in the server by receiving the monitoring signal.
The computer system according to claim 1.
前記サーバは、電源の供給によって動作し、
前記発信装置は、前記サーバに供給される前記電源が切断した場合に前記妨害信号の発信を停止する、
請求項1または2に記載のコンピュータシステム。
The server operates by supplying power and
The transmitting device stops transmitting the interfering signal when the power supplied to the server is cut off.
The computer system according to claim 1 or 2.
前記監視信号及び前記妨害信号は、無線電波にのせた信号である、
請求項1〜3のいずれか1項に記載のコンピュータシステム。
The monitoring signal and the interfering signal are signals placed on radio waves.
The computer system according to any one of claims 1 to 3.
前記監視信号及び前記妨害信号は、有線通信にのせた信号である、
請求項1〜3のいずれか1項に記載のコンピュータシステム。
The monitoring signal and the interfering signal are signals placed on the wired communication.
The computer system according to any one of claims 1 to 3.
前記サーバとクライアントとの間の通信が正常かを判断するNW監視機構と、
前記発信装置における前記妨害信号の発信を制御する制御機構と、
をさらに備え、
前記NW監視機構が前記サーバと前記クライアントとの間の通信を異常と判断した場合には、前記制御機構は、前記発信装置に前記妨害信号の発信を停止させる、
請求項1〜5のいずれか1項に記載のコンピュータシステム。
A NW monitoring mechanism that determines whether the communication between the server and the client is normal,
A control mechanism that controls the transmission of the interference signal in the transmitter,
With more
When the NW monitoring mechanism determines that the communication between the server and the client is abnormal, the control mechanism causes the transmitting device to stop transmitting the disturbing signal.
The computer system according to any one of claims 1 to 5.
前記サーバが設置された地点の温度を検知する温度センサと、
前記発信装置における前記妨害信号の発信を制御する制御機構と、
をさらに備え、
前記温度センサが検知した温度に基づいて、前記制御機構は、前記発信装置に前記妨害信号の発信を停止させる、
請求項1〜5のいずれか1項に記載のコンピュータシステム。
A temperature sensor that detects the temperature at the point where the server is installed, and
A control mechanism that controls the transmission of the interference signal in the transmitter,
With more
Based on the temperature detected by the temperature sensor, the control mechanism causes the transmitter to stop transmitting the jamming signal.
The computer system according to any one of claims 1 to 5.
第1監視装置から監視信号を受信可能な第2監視装置に対して、前記監視信号を送信するステップと、
サーバの発信装置から前記第2監視装置による前記監視信号の受信を妨害する妨害信号を発信するステップと、
前記第2監視装置は、前記監視信号を受信することによって、前記サーバの異常を検知するステップと、
を備えた異常検知方法。
A step of transmitting the monitoring signal to the second monitoring device capable of receiving the monitoring signal from the first monitoring device, and
A step of transmitting an interference signal that interferes with the reception of the monitoring signal by the second monitoring device from the transmission device of the server, and
The second monitoring device includes a step of detecting an abnormality in the server by receiving the monitoring signal.
Anomaly detection method equipped with.
第1監視装置から監視信号を受信可能な第2監視装置に対して、前記監視信号を送信させ、
サーバの発信装置から前記第2監視装置による前記監視信号の受信を妨害する妨害信号を発信させ、
前記第2監視装置が前記監視信号を受信することによって、前記サーバの異常を検知させる、
ことをコンピュータに実行させる異常検知プログラム。
The monitoring signal is transmitted to the second monitoring device that can receive the monitoring signal from the first monitoring device.
A jamming signal that interferes with the reception of the monitoring signal by the second monitoring device is transmitted from the transmitting device of the server.
When the second monitoring device receives the monitoring signal, the abnormality of the server is detected.
An anomaly detection program that lets a computer do things.
JP2019050761A 2019-03-19 2019-03-19 Computer system, anomaly detection method and anomaly detection program Active JP7375312B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019050761A JP7375312B2 (en) 2019-03-19 2019-03-19 Computer system, anomaly detection method and anomaly detection program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019050761A JP7375312B2 (en) 2019-03-19 2019-03-19 Computer system, anomaly detection method and anomaly detection program

Publications (2)

Publication Number Publication Date
JP2020154501A true JP2020154501A (en) 2020-09-24
JP7375312B2 JP7375312B2 (en) 2023-11-08

Family

ID=72559045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019050761A Active JP7375312B2 (en) 2019-03-19 2019-03-19 Computer system, anomaly detection method and anomaly detection program

Country Status (1)

Country Link
JP (1) JP7375312B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075837A (en) * 1999-09-02 2001-03-23 Hitachi Ltd Failure monitoring system for computer system
JP2010124167A (en) * 2008-11-19 2010-06-03 Oki Electric Ind Co Ltd Method and device for preventing use of mobile phone
JP2010147846A (en) * 2008-12-19 2010-07-01 Ten Rise Techno:Kk Wireless ic tag for phone call suppression of mobile phone

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075837A (en) * 1999-09-02 2001-03-23 Hitachi Ltd Failure monitoring system for computer system
JP2010124167A (en) * 2008-11-19 2010-06-03 Oki Electric Ind Co Ltd Method and device for preventing use of mobile phone
JP2010147846A (en) * 2008-12-19 2010-07-01 Ten Rise Techno:Kk Wireless ic tag for phone call suppression of mobile phone

Also Published As

Publication number Publication date
JP7375312B2 (en) 2023-11-08

Similar Documents

Publication Publication Date Title
KR101891365B1 (en) Providing a witness service
CN115486053A (en) Method and apparatus for managing information related to edge computing services
WO2009026025A2 (en) Remote health monitoring and control
JP2004302512A (en) Cluster computing system and fail-over method for the same
JP2019500800A (en) Method and apparatus for environmental isolation
US11848889B2 (en) Systems and methods for improved uptime for network devices
JP2001306350A (en) Field equipment control system and computer readable storage medium
US11983522B2 (en) Edge-based intelligence for over the air update
JP4478686B2 (en) Backup cell controller
US11656609B2 (en) Detecting component degradation in industrial process plants based on loop component responsiveness
JP7375312B2 (en) Computer system, anomaly detection method and anomaly detection program
JP2012059193A (en) Monitoring control system, monitoring control method used therefor, and monitoring control method
JP2018056633A (en) Cluster system, server, operation method for server, and program
US20170322521A1 (en) Redundant ethernet-based control apparatus and method
KR20120124003A (en) A system for monitoring remote terminal unit and a method thereof
JP4798286B2 (en) COMMUNICATION DEVICE, COMMUNICATION SYSTEM, AND ACCESS CONTROL METHOD
CN111064618B (en) Method, device, equipment and storage medium for realizing high availability of server
JP6452905B1 (en) Elevator remote monitoring system
JP2004070393A (en) Remote shutdown method
JP2019211836A (en) Facility monitoring system, and communication method in facility monitoring system
KR102204366B1 (en) A Solution System for Controlling Harmful Traffic in Wireless Network
WO2016070585A1 (en) Optical link fault locating method, device, processing component and storage medium
US11799944B1 (en) Intelligent multi-path call home
JP2013156963A (en) Control program, control method, information processing apparatus, and control system
US11620137B2 (en) Autonomous server protection system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230627

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231009

R151 Written notification of patent or utility model registration

Ref document number: 7375312

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151