JP2016148973A - Life-and-death monitoring device, life-and-death monitoring system, life-and-death monitoring method, and life-and-death monitoring method program - Google Patents
Life-and-death monitoring device, life-and-death monitoring system, life-and-death monitoring method, and life-and-death monitoring method program Download PDFInfo
- Publication number
- JP2016148973A JP2016148973A JP2015025017A JP2015025017A JP2016148973A JP 2016148973 A JP2016148973 A JP 2016148973A JP 2015025017 A JP2015025017 A JP 2015025017A JP 2015025017 A JP2015025017 A JP 2015025017A JP 2016148973 A JP2016148973 A JP 2016148973A
- Authority
- JP
- Japan
- Prior art keywords
- life
- death monitoring
- server
- death
- servers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 143
- 238000012806 monitoring device Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims description 28
- 230000004044 response Effects 0.000 claims abstract description 66
- 230000006870 function Effects 0.000 claims abstract description 25
- 230000005540 biological transmission Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 description 9
- 238000012790 confirmation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
Description
本発明は、システムを構成する複数のサーバの死活を監視する死活監視装置、死活監視システム、死活監視方法、及び死活監視方法プログラムに関する。 The present invention relates to a life and death monitoring apparatus, a life and death monitoring system, a life and death monitoring method, and a life and death monitoring method program for monitoring the life and death of a plurality of servers constituting the system.
複数の異なる機能を持つサーバを組み合わせることでサービスを提供しているシステムにおいて、サービスの提供に利用する全てのサーバのパフォーマンスや動作の正常性を管理することは、サービス提供の維持や、ダウンタイムの最小化のために重要である。 In a system that provides services by combining multiple servers with different functions, managing the performance and normality of all servers used to provide services is important in maintaining service provision and downtime. It is important for minimization.
アプリケーションサーバ(以降、サーバ)の正常あるいは故障を、他のサーバから信号を送って確認するサーバの死活監視方法が知られている(非特許文献1)。従来の死活監視方法は、ネットワークで接続された外部から死活監視信号を各サーバに送信する。そして死活監視信号を受信したサーバは、自サーバが正しく動作しているかを判断し、その判断結果を返すことでサーバの死活を監視する方法である。 A server alive monitoring method is known in which a normal or failure of an application server (hereinafter referred to as a server) is confirmed by sending a signal from another server (Non-Patent Document 1). A conventional alive monitoring method transmits a alive monitoring signal to each server from the outside connected via a network. The server that has received the alive monitoring signal determines whether or not the server is operating correctly, and returns the determination result to monitor the server alive activity.
従来の死活監視方法は、死活活監視信号を受信したサーバが自サーバのアプリケーションの動作のみを診断する方法であり、同等の機能を持つ複数サーバで構成されるシステムに用いられている。その特徴は、自サーバのアプリケーションの動作の正常性のみを判断するものである。 A conventional alive monitoring method is a method in which a server that has received a alive monitoring signal diagnoses only the operation of an application of its own server, and is used in a system including a plurality of servers having equivalent functions. The feature is to judge only the normality of the operation of the application of the own server.
よって、異なる機能のサーバを組み合わせてサービスを提供するシステムに用いることができない。つまり、従来の方法は、死活を監視するサーバに、各サーバが正常であることを判断した結果を応答する方法であり、各サーバが正常であるか故障であるかが分かるだけである。 Therefore, it cannot be used for a system that provides a service by combining servers having different functions. That is, the conventional method is a method of responding to the server that monitors life and death with the result of determining that each server is normal, and only knows whether each server is normal or malfunctioning.
したがって、複数の異なる機能を持つサーバを組み合わせることでサービスを提供しているマルチサーバシステムのサーバ間の連携動作を含めた正常性については監視することができない課題がある。 Therefore, there is a problem that normality including cooperation between servers of a multi-server system that provides a service by combining a plurality of servers having different functions cannot be monitored.
この発明は、この課題に鑑みてなされたものであり、複数の異なる機能を持つサーバを組み合わせることでサービスを提供するマルチサーバシステムの死活監視を行う死活監視装置、死活監視システム、死活監視方法、及び死活監視方法プログラムを提供することを目的とする。 The present invention has been made in view of this problem, and is a life / death monitoring apparatus, a life / death monitoring system, a life / death monitoring method for performing life / death monitoring of a multi-server system that provides a service by combining servers having a plurality of different functions, It is another object of the present invention to provide a life and death monitoring method program.
本発明の死活監視装置は、異なる機能を持つ複数のサーバを組み合わせてサービスを提供するマルチサーバシステムの死活監視用の信号として、前記マルチサーバシステムが提供するサービスの要求信号を前記複数のサーバの何れかに送信する死活監視要求送信部と、前記要求信号に対するレスポンス信号を受信し、当該レスポンス信号に含まれる前記要求信号の送信先サーバのステータスと前記送信先サーバと連携する連携先サーバのステータスとを用いて、複数の前記サーバの死活監視を行う死活監視部とを具備することを要旨とする。 The life and death monitoring apparatus of the present invention uses a service request signal provided by the multi-server system as a signal for life and death monitoring of a multi-server system that provides a service by combining a plurality of servers having different functions. A life / death monitoring request transmission unit for transmitting to any one of them, a response signal for the request signal, and a status of the transmission destination server of the request signal included in the response signal and a status of the cooperation destination server in cooperation with the transmission destination server And a life / death monitoring unit that performs life / death monitoring of the plurality of servers.
また、本発明の死活監視システムは、異なる機能を持つ複数のサーバを組み合わせてサービスを提供するマルチサーバシステムと、死活監視装置とを具備する死活監視システムであって、前記死活監視装置は、前記マルチサーバシステムの死活監視用の信号として、前記マルチサーバシステムが提供するサービスの要求信号を前記複数のサーバの何れかに送信する死活監視要求送信部と、前記要求信号に対するレスポンス信号を受信し、当該レスポンス信号に含まれる前記要求信号の送信先サーバのステータスと前記送信先サーバと連携する連携先サーバのステータと故障情報とを用いて、複数の前記サーバの死活監視を行う死活監視部とを具備し、前記サーバは、前記サービスの要求信号に対する前記レスポンス信号に前記故障情報を付加する故障情報付加部を具備することを要旨とする。 In addition, the life and death monitoring system of the present invention is a life and death monitoring system comprising a multi-server system that provides a service by combining a plurality of servers having different functions, and a life and death monitoring device, As a life and death monitoring signal of the multi-server system, a life and death monitoring request transmission unit that transmits a request signal of a service provided by the multi-server system to any of the plurality of servers, and a response signal to the request signal, Using a status of the destination server of the request signal included in the response signal, a status of the cooperation destination server in cooperation with the destination server, and failure information, and a life / death monitoring unit that performs life / death monitoring of the plurality of servers And the server adds the failure information to the response signal for the service request signal. And summarized in that it includes the failure information adding unit that.
また、本発明の死活監視方法は、死活監視装置が行う死活監視方法であって、異なる機能を持つ複数のサーバを組み合わせてサービスを提供するマルチサーバシステムの死活監視用の信号として、前記マルチサーバシステムが提供するサービスの要求信号を前記複数のサーバの何れかに送信する死活監視要求送信ステップと、前記要求信号に対するレスポンス信号を受信し、当該レスポンス信号に含まれる前記要求信号の送信先サーバのステータスと前記送信先サーバと連携する連携先サーバのステータスとを用いて、複数の前記サーバの死活監視を行う死活監視ステップとを行うことを要旨とする。 In addition, the life and death monitoring method of the present invention is a life and death monitoring method performed by the life and death monitoring device, and the multi-server is used as a life and death monitoring signal of a multi-server system that provides a service by combining a plurality of servers having different functions. A life / death monitoring request transmission step for transmitting a request signal of a service provided by the system to any of the plurality of servers, a response signal for the request signal, and a transmission destination server of the request signal included in the response signal The gist is to perform a life and death monitoring step of performing life and death monitoring of the plurality of servers using the status and the status of the cooperation destination server that cooperates with the transmission destination server.
また、本発明の他の死活監視方法は、異なる機能を持つ複数のサーバを組み合わせてサービスを提供するマルチサーバシステムと、死活監視装置とを具備する死活監視システムが行う死活監視方法であって、前記死活監視装置が、前記マルチサーバシステムの死活監視用の信号として前記サービスの要求信号を送信する死活監視要求送信ステップを行い、前記サーバが、前記要求信号に対するレスポンス信号に故障情報を付加する故障情報付加ステップを行い、前記死活監視装置が、前記要求信号に対するレスポンス信号を受信し、当該レスポンス信号に含まれる前記要求信号の送信先サーバのステータスと前記送信先サーバと連携する連携先サーバのステータと故障情報とを用いて、複数の前記サーバの死活監視を行う死活監視ステップとを行うことを要旨とする。 Another life and death monitoring method of the present invention is a life and death monitoring method performed by a life and death monitoring system comprising a multi-server system that provides a service by combining a plurality of servers having different functions, and a life and death monitoring device, A failure in which the life and death monitoring device performs a life and death monitoring request transmission step of transmitting a request signal for the service as a life and death monitoring signal of the multi-server system, and the server adds failure information to a response signal to the request signal Performing an information addition step, wherein the alive monitoring device receives a response signal to the request signal, and the status of the transmission destination server of the request signal included in the response signal and the status of the cooperation destination server that cooperates with the transmission destination server A life / death monitoring step for performing life / death monitoring of a plurality of the servers using the failure information The gist that you do.
また、本発明の死活監視方法プログラムは、上記の死活監視方法をコンピュータ又はコンピュータシステムに実行させるためのプログラムである。 The life and death monitoring method program of the present invention is a program for causing a computer or a computer system to execute the above life and death monitoring method.
この発明の死活監視装置と死活監視方法によれば、複数の異なる機能を持つサーバを組み合わせることでサービスを提供しているマルチサーバシステムのサーバ間の連携動作の正常性について監視することができる。 According to the life and death monitoring apparatus and life and death monitoring method of the present invention, it is possible to monitor the normality of the cooperative operation between servers of a multi-server system providing a service by combining a plurality of servers having different functions.
また、この発明の死活監視システムによれば、更に、故障しているサーバを特定する等、より詳しく死活監視を行うことができる。また、この発明の死活監視方法プログラムによれば、この発明の死活監視方法を、コンピュータ又はコンピュータシステムに実行させることができる。 In addition, according to the life and death monitoring system of the present invention, life and death monitoring can be performed in more detail, for example, by specifying a failed server. Further, according to the life and death monitoring method program of the present invention, the computer or computer system can execute the life and death monitoring method of the present invention.
以下、本発明の実施の形態について図面を用いて説明する。複数の図面中同一のものに
は同じ参照符号を付し、説明は繰り返さない。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.
〔第1実施形態〕
図1に、本発明の第1実施形態の死活監視システム1の構成例を示す。本実施形態の死活監視システム1は、マルチサーバシステム100と、死活監視装置30とを具備する。
[First Embodiment]
In FIG. 1, the example of a structure of the alive monitoring system 1 of 1st Embodiment of this invention is shown. The life and death monitoring system 1 of this embodiment includes a
マルチサーバシステム100は、異なる機能を持つ複数のサーバ101〜10nを具備する。サーバ101〜10nの中には、同じ機能を持つサーバが複数含まれていてもよい。同じ機能を持つサーバが複数ある場合は、各サーバに処理を分散させる目的でロードバランサ20が設けられる。なお、ロードバランサ20は必須の構成ではない。
The
死活監視装置30は、マルチサーバシステム100の死活監視を、当該マルチサーバシステム100が提供するサービスの要求信号を複数のサーバの何れかに送信して要求する装置である。死活監視装置30は、死活監視要求送信部31と死活監視部32とを具備する。
The
死活監視要求送信部31は、異なる機能を持つ複数のサーバを組み合わせてサービスを提供するマルチサーバシステム100の死活監視用の信号として、マルチサーバシステム100が提供するサービスの要求信号を送信する。この要求信号は、マルチサーバシステム100が用いている通常のサービスを要求する信号と同じである。以降、要求信号をサービス要求信号と称する。
The life / death monitoring
死活監視部32は、サービス要求信号に対するレスポンス信号を受信して、当該レスポンス信号に含まれる要求信号の送信先サーバのステータスと送信先サーバと連携する連携先サーバのステータスとを用いて、複数のサーバの死活監視を行う。
The
レスポンス信号とは、サーバへの処理要求に対する応答信号のことである。例えばWebブラウザとWebサーバの間でHTMLなどのコンテンツの送受信に用いられる通信プロトコル(HTTP)のレスポンス信号は、ヘッダー部分とボディ部分とからなる信号である。そのヘッダー部分とボディ部分とには、サーバの状態を表すステータスコードが含まれる。なお、レスポンス信号とステータス信号について詳しくは後述する。 The response signal is a response signal for a processing request to the server. For example, a response signal of a communication protocol (HTTP) used for transmission / reception of content such as HTML between a web browser and a web server is a signal including a header portion and a body portion. The header part and the body part include a status code indicating the state of the server. Details of the response signal and the status signal will be described later.
死活監視システム1の死活監視装置30によれば、マルチサーバシステム100が通常用いているサービス要求信号を、死活監視を実行するための要求信号として利用する。そして、サービス要求信号に対するレスポンス信号のステータスコードに基づいてマルチサーバシステム100を構成する各々のサーバの正常性を監視する。したがって、マルチサーバシステム100側の構成を一切変更せずに、異なる機能を持つ複数のサーバの連携動作を含めた正常性を監視することができる。
According to the
更に具体的に説明する。図2に、本実施形態の死活監視システム1のマルチサーバシステム100を、安否確認システムとした場合の機能構成例を示す。安否確認システム(以降、マルチサーバシステム100)は、地震や噴火などの災害の発生により、被災地への安否確認の通信が増加し、通信がつながり難い状況になった場合にサービスを提供するシステムである。
This will be described more specifically. FIG. 2 shows a functional configuration example when the
伝言を確認したい利用者が、マルチサーバシステム100に被災地の電話番号を入力することで、被災者が音声又はテキストで登録した伝言を、音声で取得することができる。なお、本来の安否確認の目的でマルチサーバシステム100を利用する場合は、マルチサーバシステム100には図示しないサーバ(メディアサーバ)や、利用者が操作する端末が接続される。
A user who wants to check a message inputs the telephone number of the disaster area in the
マルチサーバシステム100は、音声APサーバ101、音声DBサーバ102、ストレージ103、Web−APサーバ104、及び音声変換サーバ105を具備する。マルチサーバシステム100を構成する各サーバは、ネットワークを介して接続される。図2において、各サーバを接続するネットワークと、マルチサーバシステム100と死活監視装置30とを接続するネットワークの表記は省略している。
The
音声APサーバ101は、利用者からの伝言確認要求があると音声DBサーバ102にデータ取得要求を行う。登録された伝言が音声の場合は音声DBサーバ102にデータ取得要求を行う。また、登録された伝言がテキストの場合はWeb−APサーバ104へデータ取得要求を行う。 Voice AP server 10 1 performs data acquisition request to the voice DB server 10 2 If there is a message confirmation request from the user. If registered message is voice perform data acquisition request to the voice DB server 10 2. Further, if the message that has been registered in the text perform data acquisition request to the Web-AP server 10 4.
音声DBサーバ102は、音声APサーバ101からのデータ取得要求に対してストレージ103に蓄積された音声データを検索する。ストレージ103は、被災者が登録した音声による伝言データを蓄積する。 Voice DB server 10 2 searches the audio data stored in the storage 10 3 to the data acquisition request from the voice AP server 10 1. Storage 10 3 accumulates the message data by voice victims has registered.
Web−APサーバ104は、被災者が登録したテキストによる伝言データを蓄積する。音声変換サーバ105は、音声APサーバ101の要求に従ってテキストによる伝言データを音声に変換する。 Web-AP server 10 4 stores the message data by the text that victims have registered. Voice conversion server 105 converts the message data by the text-to-speech in accordance with the requirements of the voice AP server 10 1.
マルチサーバシステム100は、利用者からの伝言取得要求に対応する伝言が音声で登録されている場合、音声APサーバ101、音声DBサーバ102、及びストレージ103が連携して動作することで伝言を再生する。また、伝言がテキストで登録されている場合は、音声APサーバ101、Web−APサーバ104、及び音声変換サーバ105が連携して動作することで伝言を再生する。
When the message corresponding to the message acquisition request from the user is registered by voice, the
このようにマルチサーバシステム100は、異なる機能を持つ複数のサーバを組み合わせることでサービスを提供するシステムである。なお、登録される伝言の数が多い場合は、複数の音声APサーバ101を設け、各々の音声APサーバ101に負荷を分散させることがある。複数の音声APサーバ101を具備する場合は、ロードバランサ20が設けられる。ロードバランサ20は、利用者からの伝言取得要求を各音声APサーバ101に振り分ける。
Thus, the
本実施形態の死活監視要求送信部31は、複数の音声APサーバ101の何れか(図2に破線で示す音声APサーバの何れか)にサービス要求信号を送信する。サービス要求信号は、安否確認システム以外のマルチサーバシステムの死活監視を行うときは、そのマルチサーバシステムが提供するサービスを実現するために最初に処理を開始する何れかのサーバに送信される。
The life and death monitoring
以降、伝言が音声で登録された場合を例に死活監視システム1の動作を説明する。 Hereinafter, the operation of the alive monitoring system 1 will be described by taking as an example a case where a message is registered by voice.
〔正常時〕
図3を参照して、マルチサーバシステム100が正常時の死活監視システム1の動作を説明する。死活監視装置30は、音声APサーバ101に対して死活監視要求を行う(ステップS1)。この死活監視要求は、例えば被災地の特定の固定電話番号を入力することで行う。この固定電話番号は、被災地の任意の固定電話番号でよい。このように、マルチサーバシステム100が提供するサービスのサービス要求信号を用いることで死活監視が行える。
〔Normal〕
The operation of the alive monitoring system 1 when the
なお、試験信号であることを区別する目的で、試験用の電話番号(例えば、9999999999を入力するようにしてもよい。試験用の電話番号を設定し、試験用の伝言を登録しておけば、他の伝言情報に影響を与えずに死活監視を行うことができる。 For the purpose of discriminating between test signals, a test telephone number (for example, 9999999999 may be input. If a test telephone number is set and a test message is registered, Life and death monitoring can be performed without affecting other message information.
音声APサーバ101は、死活監視要求(サービス要求信号)を受信すると、音声DBサーバ102に対して音声データ取得要求を送信する(ステップS2)。音声DBサーバ102は、音声データ取得要求を受信するとストレージ103に対して音声データ取得要求を送信する(ステップS3)。 Voice AP server 10 1 receives the life-and-death monitoring request (service request signal), and transmits the audio data acquisition request to the voice DB server 10 2 (step S2). Voice DB server 10 2 sends the audio data acquisition request to the storage 10 3 receives the audio data acquisition request (step S3).
音声DBサーバ102は、ストレージ103から音声データを取得(ステップS4)して、音声APサーバ101に音声データを送信する(ステップS5)。音声APサーバ101は、受信した音声データをレスポンス信号のボディ部分に格納して死活監視装置30に送信する(ステップS6)。ステップS6で音声APサーバ101から死活監視装置30に送信されるレスポンス信号は、ステップS1のサービス要求信号に対するレスポンス信号である。
Voice DB server 10 2, acquires the audio data from the storage 10 3 (step S4), and transmits the voice data to the voice AP server 10 1 (step S5). Voice AP server 10 1 may store received audio data in the body portion of the response signal and transmits the life-and-death monitoring device 30 (step S6). Response signal transmitted to the life-and-
図4に、レスポンス信号の例を示す。図4の例は、HTTPのレスポンス信号である。レスポンス信号は、ヘッダー部分とボディ部分とから構成される。ヘッダー部分とボディ部分には、ステータスコードが含まれる。 FIG. 4 shows an example of the response signal. The example of FIG. 4 is an HTTP response signal. The response signal is composed of a header part and a body part. A status code is included in the header part and the body part.
ヘッダー部分の1行目は、HTTPのバージョン情報である「HTTP/1.1」と音声APサーバ101の状態を表すステータスコード「200」が記載されている。ステータスコードの「200」は、ステップS1の死活監視要求が音声APサーバ101で正常に処理(OK)されたことを意味している。 The first line of the header portion describes a status code "200" as an HTTP version information as "HTTP / 1.1" indicating the state of the voice AP server 10 1. "200" of the status code, alive monitoring request in step S1 is meant that it has been successfully processed (OK) voice AP server 10 1.
ボディ部分の3行目は、音声DBサーバ102の状態を表すステータスコードである。この例では正常時であるので「200」が記載されている。 The third line of the body part is a status code indicating the status of the voice DB server 10 2. In this example, “200” is described because it is normal.
このようにレスポンス信号のヘッダー部分には、死活監視装置30がサービス要求信号を送信した送信先サーバのステータスコードが記載される。また、ボディ部分には、音声APサーバ101が音声データ取得要求を送信する音声DBサーバ102のステータスコードが記載される。つまり、ヘッダー部分にはサービス要求信号を送信した送信先サーバのステータスコード、ボディ部分には送信先サーバと連携する連携先サーバのステータスコードが記載される。
Thus, in the header part of the response signal, the status code of the destination server to which the
死活監視装置30は、レスポンス信号のヘッダー部分とボディ部分のステータスコードに基づいてマルチサーバシステム100の死活監視処理を行う(ステップS20)。
The
〔故障時〕
図5に、音声DBサーバ102が故障している場合の動作シーケンスを示す。音声DBサーバ102が故障している場合は、音声DBサーバ102からストレージ103に対して音声データ取得要求(ステップS3)は送信されない。当然、ステップS3に対する反応もない(ステップS4)。
[In case of failure]
Figure 5 shows an operation sequence when the voice DB server 10 2 is faulty. When voice DB server 10 2 is faulty, the audio data acquisition request to the storage 10 3 from the voice DB server 10 2 (step S3) is not transmitted. Of course, there is no response to step S3 (step S4).
この場合の音声DBサーバ102は、レスポンス信号のボディ部分にサーバーエラーを表すステータスコード、例えば「500」を付加して音声APサーバ101に送信する(ステップS7)。図6に、この場合のレスポンス信号の例を示す。ボディ部分の3行目に「500」が記載されている。「500」は、サーバ内部のエラー(Internal Server Error)を意味するステータスコードである。 Voice DB server 10 2 in this case, sends a status code representing the server error in the body portion of the response signal, for example by adding "500" to the voice AP server 10 1 (step S7). FIG. 6 shows an example of the response signal in this case. “500” is described in the third line of the body part. “500” is a status code indicating an internal server error.
音声DBサーバ102が故障している場合は、音声APサーバ101から例えば図6に示したレスポンス信号が、死活監視装置30に送信される(ステップS8)。死活監視装置30は、レスポンス信号のヘッダー部分とボディ部分のステータスコードとによってマルチサーバシステム100を構成する各サーバが正常であるか故障であるかを監視することができる。
When voice DB server 10 2 is faulty, the response signal shown in FIG. 6, for example from speech AP server 10 1 is transmitted to the life-and-death monitoring device 30 (step S8). The
サーバーエラーを表すステータスコードには、400番台と500番台とがある。4XXは、処理を要求した側(クライアント)にエラーの原因がある場合に付加されるステータスコードである。また、5XXは、処理を要求された側(サーバ)にエラーの原因がある場合に付加されるステータスコードである。 Status codes representing server errors include the 400s and 500s. 4XX is a status code added when there is a cause of error on the side (client) that requested processing. Further, 5XX is a status code added when there is a cause of error on the side (server) requested to process.
図7に、ストレージ103が故障している場合の動作シーケンスを示す。この場合、ストレージ103は、レスポンス信号のボディ部分にサーバーエラーを表すステータスコード、例えば「500」を付加して音声DBサーバ102に送信する(ステップS7)。そのレスポンス信号は、そのまま死活監視装置30に送信される(ステップS8)。この場合のレスポンス信号は、図6に示した例と同じである。このように音声APサーバ101と連携する音声DBサーバ102とストレージ103のどちらかが故障している場合に、レスポンス信号のボディ部分にサーバーエラーを表すステータスコードが付加される。
Figure 7 shows an operation sequence in a case where the storage 10 3 is faulty. In this case, the storage 10 3 transmits to the body portion of the response signal status codes representing a server error, for example by adding "500" to the voice DB server 10 2 (step S7). The response signal is transmitted as it is to the alive monitoring device 30 (step S8). The response signal in this case is the same as the example shown in FIG. As described above, when one of the voice DB server 10 2 and the storage 10 3 linked with the
図8に、死活監視部32が行う死活監視処理(ステップS20)の動作フローを示す。死活監視部32は、ステータスコードを用いて死活監視を行う。
FIG. 8 shows an operation flow of the life and death monitoring process (step S20) performed by the life and
死活監視部32は、ヘッダー部分のステータスコードが200番台(2XX)(ステップS21のYES)、ボディ部分のステータスコードが200番台(2XX)(ステップS21のYES)で、マルチサーバシステム100は正常であると判断して処理を終了する(ステップS25)。200番台のステータスコードは成功を意味する。例えば201は作成完了(Created)、202は受理(Accepted)を意味する。
In the life and
ヘッダー部分のステータスコードが200番台でない場合は、音声APサーバ101が故障していると判断して処理を終了する(ステップS22)。ヘッダー部分のステータスコードが200番台で、且つ、ボディ部分のステータスコードが200番台でない場合は、音声DPサーバ102が故障、又は、ストレージ103が故障していると判断して処理を終了する(ステップS24)。
If the status code of the header part is not 200s, and ends the process determines that the voice AP server 10 1 is faulty (Step S22).
以上説明したように本実施形態の死活監視システム1によれば、複数の異なる機能を持つサーバを組み合わせることでサービスを提供しているマルチサーバシステム100のサーバ間の連携動作の正常性について監視することができる。
As described above, according to the life and death monitoring system 1 of the present embodiment, the normality of the cooperative operation between servers of the
〔第2実施形態〕
次に、故障箇所を特定できるようにした本発明の第2実施形態の死活監視システム2について説明する。本実施形態の死活監視システム2は、死活監視システム1に対してマルチサーバシステム100を構成する各サーバが、サービス要求信号に対するレスポンス信号に故障情報を付加するようにした点で異なる。
[Second Embodiment]
Next, the life and death monitoring system 2 according to the second embodiment of the present invention in which the failure location can be specified will be described. The life and death monitoring system 2 according to the present embodiment is different from the life and death monitoring system 1 in that each server constituting the
死活監視システム2は、死活監視装置230と、音声APサーバ2101と、音声DBサーバ2102と、ストレージ2103とで構成される。音声APサーバ2101と、音声DBサーバ2102と、ストレージ2103とでマルチサーバシステム200を構成する。
Life-and-death monitoring system 2 is comprised of a life-and-
音声APサーバ2101と音声DBサーバ2102とストレージ2103とは、それぞれ故障情報付加部2111,2112,2113を具備する点で、上記(図3)の各サーバと異なる。故障情報付加部2111,2112,2113は、サービス要求信号に対するレスポンス信号のボディ部分に故障情報を付加する。なお、死活監視システム2の機能構成は、死活監視システム1の機能構成と同じであるので、その図示は省略する。 The voice AP server 210 1 , the voice DB server 210 2, and the storage 210 3 are different from the servers described above (FIG. 3) in that they include failure information addition units 211 1 , 211 2 , and 211 3 , respectively. The failure information addition units 211 1 , 211 2 , 211 3 add failure information to the body part of the response signal to the service request signal. Since the functional configuration of the life and death monitoring system 2 is the same as the functional configuration of the life and death monitoring system 1, the illustration thereof is omitted.
図9に、音声DBサーバ2102が故障した場合の死活監視システム2の動作シーケンスを示す。音声DBサーバ2102が故障した場合の動作シーケンスは、上記の例(図5)と同じであり、音声DBサーバ2102からストレージ2103に対する音声データ取得要求(ステップS3)は実行されない。当然、ステップS3に対する反応もない(ステップS4)。 9 shows an operation sequence of the life-and-death monitoring system 2 when the voice DB server 2102 has failed. Operation sequence when the voice DB server 2102 has failed, the same as the above example (FIG. 5), the audio data acquisition request to the storage 210 3 from the voice DB server 2102 (step S3) is not executed. Of course, there is no response to step S3 (step S4).
この場合、音声DBサーバ2102の故障情報付加部2112は、サービス要求信号(ステップS1)に対するレスポンス信号のボディ部分に故障情報を付加する(ステップS11)。故障情報が付加されたレスポンス信号は、音声APサーバ2101に送信される(ステップS12)。 In this case, the failure information addition unit 211 2 of the voice DB server 2102 adds the failure information in the body portion of the response signal to the service request signal (step S1) (step S11). Response signal failure information is added is transmitted to the voice AP server 210 1 (step S12).
図10に、故障情報を付加したレスポンス信号の例を示す。ボディ部分の11行目、timestampの後に故障したサーバを識別する故障サーバID「voice-db-xxx」が付加されている。このレスポンス信号は、音声APサーバ2101からサービス要求信号(ステップS1)のレスポンス信号として、死活監視装置230に送信される(ステップS13)。 FIG. 10 shows an example of a response signal to which failure information is added. On the eleventh line of the body part, a failure server ID “voice-db-xxx” for identifying the failed server is added after timestamp. The response signal as a response signal of a service request signal from the voice AP server 210 1 (step S1), the sent to the life-and-death monitoring device 230 (step S13).
このように、レスポンス信号に故障情報として故障サーバIDを含ませる。なお、故障情報としては、サーバを識別する識別子の他に、故障内容を表す情報を含めてもよい。例えば、「メモリが不足」等の故障情報を付加することで、より詳細にマルチサーバシステム100の状態を監視することが可能になる。
In this way, the failure server ID is included as failure information in the response signal. The failure information may include information indicating the failure content in addition to the identifier for identifying the server. For example, it is possible to monitor the state of the
なお、音声DBサーバ2102の故障情報は、音声APサーバ2101で付加してもよい。例えば、音声APサーバ2101と音声DBサーバ2102との間を接続するネットワークの障害が原因で、音声DBサーバ2102からのレスポンス信号が得られない場合がある。その場合は、音声APサーバ2101でタイムアウトを検出し、音声APサーバ2101の故障情報付加部2111で、音声DBサーバ2102の故障情報を付加するようにしてもよい(ステップS14)。 Further, the malfunction information of the voice DB server 2102 may be added by the speech AP server 210 1. For example, due to failure of the network that connects the speech AP server 210 1 and the voice DB server 2102, there are cases where the response signal from the voice DB server 2102 can not be obtained. In that case, the timeout is detected in the voice AP server 210 1, a failure information adding unit 211 1 of the voice AP server 210 1, may be added to the failure information of the voice DB server 2102 (step S14).
図11に、ストレージ2103が故障した場合の死活監視システム2の動作シーケンスを示す。この場合、ストレージ2103は、音声データ取得要求に対するレスポンス信号のボディ部分に故障情報を付加(ステップS15)して音声DBサーバ2102に送信する(ステップS16)。 11 shows an operation sequence of the life-and-death monitoring system 2 when the storage 210 3 fails. In this case, the storage 210 3, additional failure information in the body portion of the response signal for the speech data acquisition request (step S15) and sends to the voice DB server 2102 (step S16).
図12に、ステップS15で付加した故障情報を含むレスポンス信号の例を示す。ボディ部分の11行目に故障サーバID「strage-xxx」が付加されている。このレスポンス信号は、音声DBサーバ2102と音声APサーバ2101とを介して、死活監視装置230に送信される(ステップS17,S18)。ストレージ2103の故障情報は、音声DBサーバ2102の故障情報と同様に、音声DBサーバ2102の故障情報付加部2112で付加するようにしてもよい(ステップS18)。故障情報が付加されたレスポンス信号を受信した死活監視装置230は、より詳しく死活監視処理(ステップS30)を行うことができる。
FIG. 12 shows an example of a response signal including the failure information added in step S15. The failure server ID “strage-xxx” is added to the 11th line of the body part. The response signal, via the voice DB server 2102 and the speech AP server 210 1, are sent to the life-and-death monitoring device 230 (step S17, S18). Failure information in the storage 210 3, as well as the failure information of the voice DB server 2102 may be added by the error information adding unit 211 and second sound DB server 2102 (step S18). The
図13を参照してその死活監視処理(ステップS30)を説明する。レスポンス信号のヘッダー部分のステータスコードが200番台(ステップS21のYES)で、ボディ部分のステータスコードが200番台でない場合(ステップS23のNO)の処理が上記の動作フロー(図8)と異なる。 The life and death monitoring process (step S30) will be described with reference to FIG. Processing when the status code of the header portion of the response signal is in the 200s (YES in step S21) and the status code of the body part is not in the 200s (NO in step S23) is different from the above operation flow (FIG. 8).
死活監視装置230は、レスポンス信号のボディ部分の故障情報を参照する(ステップS31)。故障情報を表す故障サーバIDが「voice-db」の場合、死活監視装置230は音声DBサーバ2102が故障していると判断して処理を終了する(ステップS32)。故障サーバIDが「strage」の場合、死活監視装置230はストレージ2103が故障していると判断して処理を終了する(ステップS33)。
The
以上説明したように本実施形態の死活監視システム2によれば、マルチサーバシステム100の故障箇所を特定することができる。なお、本発明は上記の実施形態に限定されない。本実施形態のマルチサーバシステム100は、安否確認システムを例に説明したが、複数の異なる機能を持つサーバを組み合わせてサービスを提供するものであれば、他のマルチサーバシステムであってもよい。
As described above, according to the life and death monitoring system 2 of the present embodiment, the failure location of the
また、HTTPレスポンス信号を例にして説明したが、他のプロトコルの例えばSIP(Session Initiation Protocol)に基づく通信に、本発明を適用することも可能である。このように本発明は、上記の実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。 Although the HTTP response signal has been described as an example, the present invention can also be applied to communication based on other protocols such as SIP (Session Initiation Protocol). As described above, the present invention is not limited to the above-described embodiment, and various modifications are possible within the scope of the gist.
なお、上記装置(サーバ)をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理部がコンピュータ上で実現される。 When the above device (server) is realized by a computer, the processing contents of functions that each device should have are described by a program. Then, by executing this program on the computer, the processing unit in each device is realized on the computer.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としても良い。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a recording device of the server computer and transferring the program from the server computer to another computer via a network.
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしても良い。 Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.
1:死活監視システム
101〜10n:サーバ
20 :ロードバランサ
30 :死活監視装置
31 :死活監視要求送信部
32 :死活監視部
100:マルチサーバシステム
1: Life and death monitoring system 10 1 to 10 n : Server 20: Load balancer 30: Life and death monitoring device 31: Life and death monitoring request transmission unit 32: Life and death monitoring unit 100: Multi-server system
Claims (8)
前記要求信号に対するレスポンス信号を受信し、当該レスポンス信号に含まれる前記要求信号の送信先サーバのステータスと前記送信先サーバと連携する連携先サーバのステータスとを用いて、前記複数のサーバの死活監視を行う死活監視部と
を具備することを特徴とする死活監視装置。 A life / death monitoring request for transmitting a service request signal provided by the multi-server system to any of the plurality of servers as a life / death monitoring signal for a multi-server system that provides a service by combining a plurality of servers having different functions. A transmission unit;
A response signal to the request signal is received, and the status of the request server included in the response signal and the status of the cooperation destination server that cooperates with the destination server are used to monitor the aliveness of the plurality of servers A life / death monitoring apparatus comprising:
前記死活監視装置は、
前記マルチサーバシステムの死活監視用の信号として、前記マルチサーバシステムが提供するサービスの要求信号を前記複数のサーバの何れかに送信する死活監視要求送信部と、
前記要求信号に対するレスポンス信号を受信し、当該レスポンス信号に含まれる前記要求信号の送信先サーバのステータスと前記送信先サーバと連携する連携先サーバのステータと故障情報とを用いて、前記複数のサーバの死活監視を行う死活監視部とを具備し、
前記サーバは、
前記サービスの前記要求信号に対する前記レスポンス信号に前記故障情報を付加する故障情報付加部を具備する
ことを特徴とする死活監視システム。 A life and death monitoring system comprising a multi-server system that provides a service by combining a plurality of servers having different functions, and a life and death monitoring device,
The alive monitoring device is:
As a life and death monitoring signal of the multi-server system, a life and death monitoring request transmission unit that transmits a service request signal provided by the multi-server system to any of the plurality of servers,
A plurality of servers that receive a response signal to the request signal and use the status of the destination server of the request signal included in the response signal, the status of the cooperation destination server that cooperates with the destination server, and failure information A life and death monitoring unit that performs life and death monitoring of
The server
A life and death monitoring system comprising: a failure information adding unit that adds the failure information to the response signal to the request signal of the service.
前記故障情報には、前記連携先サーバを識別する識別子が含まれることを特徴とする死活監視システム。 In the life and death monitoring system according to claim 2,
The life and death monitoring system, wherein the failure information includes an identifier for identifying the cooperation destination server.
異なる機能を持つ複数のサーバを組み合わせてサービスを提供するマルチサーバシステムの死活監視用の信号として、前記マルチサーバシステムが提供するサービスの要求信号を前記複数のサーバの何れかに送信する死活監視要求送信ステップと、
前記要求信号に対するレスポンス信号を受信し、当該レスポンス信号に含まれる前記要求信号の送信先サーバのステータスと前記送信先サーバと連携する連携先サーバのステータスとを用いて、前記複数のサーバの死活監視を行う死活監視ステップと
を行うことを特徴とする死活監視方法。 A life and death monitoring method performed by a life and death monitoring device,
A life / death monitoring request for transmitting a service request signal provided by the multi-server system to any of the plurality of servers as a life / death monitoring signal for a multi-server system that provides a service by combining a plurality of servers having different functions. Sending step;
A response signal to the request signal is received, and the status of the request server included in the response signal and the status of the cooperation destination server that cooperates with the destination server are used to monitor the aliveness of the plurality of servers A life and death monitoring method comprising: performing a life and death monitoring step.
前記死活監視装置が、前記マルチサーバシステムの死活監視用の信号として前記サービスの要求信号を送信する死活監視要求送信ステップを行い、
前記サーバが、前記要求信号に対するレスポンス信号に故障情報を付加する故障情報付加ステップを行い、
前記死活監視装置が、前記要求信号に対するレスポンス信号を受信し、当該レスポンス信号に含まれる前記要求信号の送信先サーバのステータスと前記送信先サーバと連携する連携先サーバのステータと故障情報とを用いて、複数の前記サーバの死活監視を行う死活監視ステップとを行う
ことを特徴とする死活監視方法。 A life / death monitoring method performed by a life / death monitoring system including a multi-server system that provides a service by combining a plurality of servers having different functions, and a life / death monitoring apparatus,
The life and death monitoring device performs a life and death monitoring request transmission step of transmitting the service request signal as a signal for life and death monitoring of the multi-server system,
The server performs a failure information addition step of adding failure information to a response signal to the request signal,
The alive monitoring device receives a response signal to the request signal, and uses the status of the transmission destination server of the request signal included in the response signal, the status of the cooperation destination server linked with the transmission destination server, and failure information A life / death monitoring step for performing life / death monitoring of a plurality of the servers.
前記故障情報には、前記連携先サーバを識別する識別子が含まれることを特徴とする死活監視方法。 In the life and death monitoring method according to claim 5,
The life and death monitoring method, wherein the failure information includes an identifier for identifying the cooperation destination server.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015025017A JP2016148973A (en) | 2015-02-12 | 2015-02-12 | Life-and-death monitoring device, life-and-death monitoring system, life-and-death monitoring method, and life-and-death monitoring method program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015025017A JP2016148973A (en) | 2015-02-12 | 2015-02-12 | Life-and-death monitoring device, life-and-death monitoring system, life-and-death monitoring method, and life-and-death monitoring method program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016148973A true JP2016148973A (en) | 2016-08-18 |
Family
ID=56691272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015025017A Pending JP2016148973A (en) | 2015-02-12 | 2015-02-12 | Life-and-death monitoring device, life-and-death monitoring system, life-and-death monitoring method, and life-and-death monitoring method program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016148973A (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139585A (en) * | 2004-11-12 | 2006-06-01 | Seiko Epson Corp | Control for network device corresponding to network type plug-and-play |
JP2008107896A (en) * | 2006-10-23 | 2008-05-08 | Nec Corp | Physical resource control management system, physical resource control management method and physical resource control management program |
JP2010072952A (en) * | 2008-09-18 | 2010-04-02 | Bank Of Tokyo-Mitsubishi Ufj Ltd | Service processor, system, program, and recording medium |
JP2012253554A (en) * | 2011-06-02 | 2012-12-20 | Mitsubishi Electric Corp | Communication system and automatic meter reading system |
JP2014534491A (en) * | 2011-09-27 | 2014-12-18 | オラクル・インターナショナル・コーポレイション | System, method and configuration for dynamic discovery of resource servers in a traffic director environment |
WO2015011827A1 (en) * | 2013-07-26 | 2015-01-29 | 富士通株式会社 | Information processing device, filtering system, filtering method, and filtering program |
-
2015
- 2015-02-12 JP JP2015025017A patent/JP2016148973A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139585A (en) * | 2004-11-12 | 2006-06-01 | Seiko Epson Corp | Control for network device corresponding to network type plug-and-play |
JP2008107896A (en) * | 2006-10-23 | 2008-05-08 | Nec Corp | Physical resource control management system, physical resource control management method and physical resource control management program |
JP2010072952A (en) * | 2008-09-18 | 2010-04-02 | Bank Of Tokyo-Mitsubishi Ufj Ltd | Service processor, system, program, and recording medium |
JP2012253554A (en) * | 2011-06-02 | 2012-12-20 | Mitsubishi Electric Corp | Communication system and automatic meter reading system |
JP2014534491A (en) * | 2011-09-27 | 2014-12-18 | オラクル・インターナショナル・コーポレイション | System, method and configuration for dynamic discovery of resource servers in a traffic director environment |
WO2015011827A1 (en) * | 2013-07-26 | 2015-01-29 | 富士通株式会社 | Information processing device, filtering system, filtering method, and filtering program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11848967B2 (en) | Method for processing telephony sessions of a network | |
JP4616159B2 (en) | Cluster system, load balancer, node transfer method, and node transfer program | |
US8219697B2 (en) | Diameter protocol and SH interface support for SIP server architecture | |
US9954690B2 (en) | Transferring a conference session between conference servers due to failure | |
US8239705B2 (en) | Method and apparatus for managing communication services for user endpoint devices | |
US20060179150A1 (en) | Client server model | |
CN102546773A (en) | Providing resilient services | |
CN109547524B (en) | User behavior storage method, device, equipment and storage medium based on Internet of things | |
EP1987657A1 (en) | Scalable wireless messaging system | |
CN101848114A (en) | Fault detection method and device | |
JP5255035B2 (en) | Failover system, storage processing apparatus, and failover control method | |
CN108141440A (en) | Sip server with multiple identifiers | |
CN112671554A (en) | Node fault processing method and related device | |
CN116781564B (en) | Network detection method, system, medium and electronic equipment of container cloud platform | |
JP2016148973A (en) | Life-and-death monitoring device, life-and-death monitoring system, life-and-death monitoring method, and life-and-death monitoring method program | |
JP4499757B2 (en) | Communication connection server and communication connection method | |
JP6048573B2 (en) | Information processing system | |
JP2010198317A (en) | Registration request system, registration request server device, and registration request control method for server device | |
JP4905325B2 (en) | Content providing system and monitoring server | |
JP5658621B2 (en) | Signal distribution duplication destination determination system, signal distribution duplication destination determination method and program | |
JP5017391B2 (en) | Subscriber accommodation changing method, migration destination session control server device and management server | |
US20230262164A1 (en) | Emergency call system, emergency call method, and program | |
JP5947149B2 (en) | Call relief system and call relief method | |
JP2008129981A (en) | Connection destination determiniation server and load distribution method | |
JP2007102626A (en) | Information processor and network system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171031 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180626 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20181127 |