JP6421516B2 - Server device, redundant server system, information takeover program, and information takeover method - Google Patents

Server device, redundant server system, information takeover program, and information takeover method Download PDF

Info

Publication number
JP6421516B2
JP6421516B2 JP2014195618A JP2014195618A JP6421516B2 JP 6421516 B2 JP6421516 B2 JP 6421516B2 JP 2014195618 A JP2014195618 A JP 2014195618A JP 2014195618 A JP2014195618 A JP 2014195618A JP 6421516 B2 JP6421516 B2 JP 6421516B2
Authority
JP
Japan
Prior art keywords
call control
server device
control server
information
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014195618A
Other languages
Japanese (ja)
Other versions
JP2016066303A (en
Inventor
貴司 水上
貴司 水上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2014195618A priority Critical patent/JP6421516B2/en
Publication of JP2016066303A publication Critical patent/JP2016066303A/en
Application granted granted Critical
Publication of JP6421516B2 publication Critical patent/JP6421516B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、冗長構成サーバシステムに用いられるサーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法に関する。   The present invention relates to a server device used in a redundant configuration server system, a redundant configuration server system, an information takeover program, and an information takeover method.

ネットワーク管理プロトコルとして、SNMP(Simple Network Management Protcol)が知られている。例えば、複数のSIP(Session Initiation Protocol)サーバで構成されるような冗長構成のサーバシステムにおいては、当該複数のSIPサーバをSNMPで監視する装置監視システムが用いられている。   As a network management protocol, SNMP (Simple Network Management Protocol) is known. For example, in a redundant server system configured by a plurality of SIP (Session Initiation Protocol) servers, an apparatus monitoring system that monitors the plurality of SIP servers by SNMP is used.

一例として、特許文献1には、冗長構成サーバシステムにおいて、あるサーバで障害が発生した場合に、トラップ(Trap)メッセージを当該障害があったサーバから送信したり、当該障害があったサーバと引継サーバとの間のメモリ同期化をすることにより、障害情報が引き継がれる冗長構成サーバシステムが開示されている。   As an example, in Patent Document 1, when a failure occurs in a server in a redundant server system, a trap message is transmitted from the server having the failure, or taken over with the server having the failure. A redundant configuration server system is disclosed in which failure information is inherited by performing memory synchronization with a server.

特開2008−305159号公報JP 2008-305159 A

特許文献1に開示されているシステム構成においては、アプリケーションの再起動等によって、障害発生時点のアプリケーション動作の統計情報が消滅してしまい、障害発生時点の統計情報を引き継ぐことが困難であった。また、障害が発生したことを待機系サーバに通知することにより当該統計情報の引き継ぎを行う場合に、ネットワークインタフェースカード(NIC:Network Interface Card)、PCI(Peripheral Components Interconnect)バス等の一時的な故障が発生し、OSの再起動等が必要になる場合には、障害発生時点のアプリケーション動作の統計情報を引き継ぐことができないという問題があった。   In the system configuration disclosed in Patent Document 1, the statistical information of the application operation at the time of the failure disappears due to the restart of the application, and it is difficult to take over the statistical information at the time of the failure. In addition, when taking over the statistical information by notifying the standby server that a failure has occurred, a temporary failure such as a network interface card (NIC) or a peripheral component interconnect (PCI) bus When the OS occurs and it is necessary to restart the OS, there is a problem that the statistical information of the application operation at the time of the failure cannot be taken over.

本発明は、上記した点に鑑みてなされたものであり、障害発生時点のアプリケーション動作の統計情報を確実に取得することが可能なサーバ、冗長構成サーバシステム、情報引継プログラム及び情報引継方法を提供することを目的とする。   The present invention has been made in view of the above points, and provides a server, a redundantly configured server system, an information takeover program, and an information takeover method capable of reliably obtaining statistical information of application operations at the time of failure. The purpose is to do.

本発明の呼制御サーバ装置は、冗長構成サーバシステム内で用いられ、第1のアプリケーションを実行する呼制御サーバ装置であって、前記第1のアプリケーションの実行状態を監視し、前記第1のアプリケーションの異常を検出した際に前記第1のアプリケーションの異常発生時における呼制御処理の実行状態を示す情報である自サーバ異常時情報を収集して保存する情報収集手段と、前記冗長構成サーバシステム内の他の呼制御サーバ装置で実行されている第2のアプリケーションの実行状態を監視する他サーバ監視手段と、前記他サーバ監視手段が前記他の呼制御サーバ装置における前記第2のアプリケーションの異常発生を検出し、前記呼制御サーバ装置が待機系から運用系に切り替わって動作を開始した後に、前記第2のアプリケーションの異常発生時における呼制御処理の実行状態を示す情報である他サーバ異常時情報を回収する情報回収手段と、を有し、前記自サーバ異常時情報は、前記第1のアプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくともいずれかの情報を含み、前記他サーバ異常時情報は、前記第2のアプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくともいずれかの情報を含むことを特徴とする。 Call control server device of the present invention is used in a redundant configuration server system, a call control server device that executes a first application, to monitor the execution status of the first application, the first application Information collecting means for collecting and storing information on the own server abnormality, which is information indicating an execution state of the call control process when the first application abnormality occurs when an abnormality of the first application is detected, and in the redundant configuration server system and other server monitoring means for monitoring the execution state of the second application in other call control server is running, the other server monitoring means abnormality occurrence of the second application in the other call control server device detects, after the call session control device starts operating switches to the operation system from the standby system, the second applique Has an information collecting means for collecting the other servers abnormal information indicating the execution state of the call control process in the abnormality occurrence of Deployment, wherein the local server abnormality information, abnormality of the first application Information on at least one of the number of call connections at the time, the number of accepted calls, the number of completed calls, and the number of incomplete calls, and the information on when the other server is abnormal is the number of call connections when an abnormality occurs in the second application Including at least one of the number of accepted calls, the number of completed calls, and the number of incomplete calls .

また、本発明の冗長構成サーバシステムは、第1の呼制御サーバ装置及び第2の呼制御サーバ装置を有する冗長構成サーバシステムであって、前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されているアプリケーションの実行状態を監視し、前記第1の呼制御サーバ装置で実行されているアプリケーションの異常発生を検出した際に、前記第1の呼制御サーバ装置で実行されているアプリケーションの異常発生時における呼制御処理の実行状態を示す情報である異常時情報を収集して保存する情報収集手段、を有し、前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されているアプリケーションの実行状態を監視する監視手段と、前記第1の呼制御サーバ装置で実行されているアプリケーションの異常を検出し、前記第2の呼制御サーバ装置が待機系から運用系に切り替わって動作を開始した後に、前記第1の呼制御サーバ装置の前記情報収集手段から前記異常時情報を回収する情報回収手段と、を有し、前記異常時情報は、前記アプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくとも何れかの情報を含むことを特徴とする。 The redundant configuration server system of the present invention is a redundant configuration server system having a first call control server device and a second call control server device, wherein the first call control server device is the first call control server device. Monitor the execution state of the application running on the call control server device, and execute it on the first call control server device when it detects an abnormality in the application running on the first call control server device Information collecting means for collecting and storing abnormal information, which is information indicating an execution state of the call control process when an abnormal application occurs, wherein the second call control server device includes the first call control server device. A monitoring means for monitoring an execution state of an application executed on the call control server device, and a difference between the application executed on the first call control server device. Information recovery for recovering the abnormal time information from the information collecting means of the first call control server device after the second call control server device is switched from the standby system to the active system and starts operating And the abnormal time information includes information on at least one of the number of call connections, the number of accepted calls, the number of completed calls, and the number of incomplete calls when an abnormality occurs in the application. To do.

また、本発明の情報引継プログラムは、アプリケーションを実行する第1の呼制御サーバ装置及び第2の呼制御サーバ装置からなる冗長構成サーバシステム内で、前記アプリケーションの異常発生時における呼制御処理の実行状態を示す情報である異常時情報を前記第1の呼制御サーバ装置から前記第2の呼制御サーバ装置へ引き継ぐ処理を呼制御サーバ装置に実行させる情報引継プログラムであって、前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの実行状態を監視する処理と、前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常発生を検出した際に前記アプリケーションの異常発生時における情報である異常時情報を収集して保存する処理と、前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常を監視する処理と、 前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常を検出し、待機系から運用系に切り替わって動作を開始した後に、前記第1の呼制御サーバ装置の前記異常時情報を回収する処理と、を実行させ、前記異常時情報は、前記アプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくとも何れかの情報を含むことを特徴とする。 The information takeover program of the present invention, in the first call control server and a redundant configuration server system consisting of the second call control server device that executes an application, execution of the call control process at the time of occurrence of abnormality in said application an information takeover program for executing processing to take over abnormal information is information indicating the state from the first call control server to said second call control server to the call control server device, the first call control server apparatus, the process of monitoring the execution state of the first of the application running on the call control server device, the first call control server device, is executed in the first call control server device When abnormal occurrence of the application is detected, abnormal time information that is information at the time of abnormal occurrence of the application is collected. A process of storing, the second call control server device, and a process of monitoring an abnormality of the first of the application running on the call control server device, the second call control server device, wherein the Processing for recovering the abnormality information of the first call control server device after detecting an abnormality of the application being executed in one call control server device, switching from the standby system to the active system and starting the operation The abnormal time information includes information on at least one of the number of call connections, the number of accepted calls, the number of completed calls, and the number of incomplete calls when the abnormality of the application occurs. .

また、本発明の情報引継方法は、アプリケーションを実行する第1の呼制御サーバ装置及び第2の呼制御サーバ装置からなる冗長構成サーバシステム内で、前記アプリケーションの異常発生時における呼制御処理の実行状態を示す情報である異常時情報を前記第1の呼制御サーバ装置から前記第2の呼制御サーバ装置へ引き継ぐ情報引継方法であって、前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの実行状態を監視するステップと、前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常発生を検出した際に前記第1の呼制御サーバ装置の異常時情報を収集して保存するステップと、前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションまたは前記第1の呼制御サーバ装置の異常を監視するステップと、前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常を検出し、待機系から運用系に切り替わって動作を開始した後に、前記第1の呼制御サーバ装置の前記異常時情報を回収するステップと、を含み、前記異常時情報は、前記アプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくともいずれかの情報を含むことを特徴とする。


The information transfer method according to the present invention executes call control processing when an abnormality occurs in the application in a redundant server system comprising a first call control server device and a second call control server device that execute the application. An information takeover method for taking over abnormal time information, which is information indicating a state, from the first call control server device to the second call control server device, wherein the first call control server device includes the first call control server device. A step of monitoring an execution state of the application executed on the call control server device, and the first call control server device detects occurrence of an abnormality in the application executed on the first call control server device. a step of collecting and storing the abnormality information of the first call control server device when the said second call control server device, the first call A step of monitoring an abnormality of the application or the first call control server device being executed on the control server device, and the second call control server device being executed on the first call control server device Recovering the abnormality information of the first call control server device after detecting an abnormality of the application and switching from the standby system to the active system to start operation, and the abnormality information includes: It includes at least one of information on the number of call connections, the number of accepted calls, the number of completed calls, and the number of incomplete calls when an abnormality occurs in the application.


本発明の実施例である冗長構成サーバシステムを示すブロック図である。1 is a block diagram showing a redundantly configured server system that is an embodiment of the present invention. 統計情報のテーブルの一例を示す図である。It is a figure which shows an example of the table of statistical information. 図1の冗長構成サーバシステムの動作の一例を示す図である。It is a figure which shows an example of operation | movement of the redundantly configured server system of FIG. 統計情報のテーブルの一例を示す図である。It is a figure which shows an example of the table of statistical information. 図1の冗長構成サーバシステムの一のサーバの情報保管部の動作の一例を示すフローチャートである。It is a flowchart which shows an example of operation | movement of the information storage part of the server of the redundantly configured server system of FIG. 図1の冗長構成サーバシステムの一のサーバの他サーバ監視部及び情報回収部の動作の一例を示すフローチャートである。It is a flowchart which shows an example of operation | movement of the other server monitoring part and information collection | recovery part of the server of the redundantly configured server system of FIG. 本発明の変形例である冗長構成サーバシステムを示すブロック図である。It is a block diagram which shows the redundant structure server system which is a modification of this invention.

以下に、本発明の1つの実施例であるサーバ装置及び冗長構成サーバシステムについて、添付図面を参照しつつ説明する。図1は、本発明の1つの実施例のサーバ装置及びそれを用いた冗長構成サーバシステムを示すブロック図である。なお、以下の説明においては、一組の運用系(ACT系)サーバ及び待機系(SBY系)サーバからなる冗長構成サーバシステムを例に説明する。   Hereinafter, a server apparatus and a redundantly configured server system according to an embodiment of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a block diagram showing a server apparatus and a redundant server system using the same according to one embodiment of the present invention. In the following description, a redundant configuration server system composed of a set of active (ACT) servers and standby (SBY) servers will be described as an example.

冗長構成サーバシステム100は、ACT系サーバ200、SBY系サーバ300及びサーバ管理システム400を含んでいる。ACT系サーバ200及びSBY系サーバ300は、例えば、OS(Operating System)としてLinux(登録商標)を備え、Linux上でSIPアプリケーションを実行するSIPサーバ(呼制御サーバ)である。ACT系サーバ200とSBY系サーバ300とは、互いに同様の構成を有しているサーバ装置である。   The redundant configuration server system 100 includes an ACT server 200, an SBY server 300, and a server management system 400. The ACT server 200 and the SBY server 300 are, for example, SIP servers (call control servers) that include Linux (registered trademark) as an OS (Operating System) and execute a SIP application on Linux. The ACT server 200 and the SBY server 300 are server devices having the same configuration.

ACT系サーバ200は、通信部210、アプリケーション実行部220、情報保管部230、他サーバ監視部240及び情報回収部250を含んでいる。SBY系サーバ300は、同様に、通信部310、アプリケーション実行部320、情報保管部330、他サーバ監視部340及び情報回収部350を含んでいる。   The ACT server 200 includes a communication unit 210, an application execution unit 220, an information storage unit 230, another server monitoring unit 240, and an information collection unit 250. Similarly, the SBY system server 300 includes a communication unit 310, an application execution unit 320, an information storage unit 330, another server monitoring unit 340, and an information collection unit 350.

通信部210、310は、互いに通信可能に接続されており、かつそれぞれがサーバ管理システム400と通信可能に接続されている。通信部210、310は、それぞれ情報保管部230、330、他サーバ監視部240、340、情報回収部250、350と通信可能に接続されている。   The communication units 210 and 310 are connected to be communicable with each other, and are connected to be able to communicate with the server management system 400. The communication units 210 and 310 are communicably connected to the information storage units 230 and 330, the other server monitoring units 240 and 340, and the information collection units 250 and 350, respectively.

すなわち、ACT系サーバ200の情報保管部230、他サーバ監視部240、情報回収部250とSBY系サーバ300の情報保管部330、他サーバ監視部340及び情報回収部350とは、通信部210、310を介して互いに通信可能に接続されている。通信部210,310は、例えば、互いに対してFTP(File Transfer Protocol)接続することによりサーバ200、300間の通信を行い得る。   That is, the information storage unit 230, the other server monitoring unit 240, the information collection unit 250, the information storage unit 330, the other server monitoring unit 340, and the information collection unit 350 of the ACT server 200 are the communication unit 210, They are connected to each other via 310. The communication units 210 and 310 can perform communication between the servers 200 and 300 by, for example, connecting to each other by FTP (File Transfer Protocol).

アプリケーション実行部220、320は、例えば、SIPアプリケーションを実行する処理部である。アプリケーション実行部220、320は、SIPに関する統計情報、例えば、図2に示す統計情報テーブルのように、接続数(通話状態の接続数)、受付呼数(サーバ起動後に受け付けた呼数)、完了呼数(通話が正常に完了した呼数)及び不完了呼数(通話が正常に完了しなかった呼数)等の情報を含む機器管理プロトコル(SNMP)管理情報ベース(MIB:Management Information Base)(以下、単にMIBと称する)225、325をそれぞれ有している。   The application execution units 220 and 320 are, for example, processing units that execute SIP applications. The application execution units 220 and 320 are statistical information about SIP, for example, as in the statistical information table shown in FIG. 2, the number of connections (number of connections in a call state), the number of calls accepted (number of calls accepted after server activation), completion Device management protocol (SNMP) management information base (MIB) including information such as the number of calls (calls that have been successfully completed) and the number of calls that have not been completed (number of calls that have not been completed) (Hereinafter simply referred to as MIB) 225 and 325, respectively.

情報保管部230、330は、それぞれ自サーバのアプリケーション実行部220、320において実行されているアプリケーションの実行状態(動作状態)を監視する。情報保管部230、330は、アプリケーションの実行状態に異常が生じると、その時点で自サーバがACT系であった場合には、MIB225、325の統計情報を読み出して保存した後に、自サーバを再起動させる、すなわちOS及びアプリケーションの再起動を行う。なお、アプリケーション以外に異常が無い場合には、アプリケーションのみを再起動することとしてもよい。   The information storage units 230 and 330 monitor the execution states (operation states) of the applications executed in the application execution units 220 and 320 of the own server, respectively. When an abnormality occurs in the execution state of the application, the information storage units 230 and 330 read and save the statistics information of the MIBs 225 and 325 and re-establish the server when the server is an ACT system at that time. Start up, that is, restart the OS and applications. If there is no abnormality other than the application, only the application may be restarted.

他サーバ監視部240、340は、通信部210、310を介して、他サーバのアプリケーション実行部220、320で実行されているアプリケーション(APP)の実行状態を監視する。他サーバ監視部240、340は、他サーバの異常発生、または他サーバで実行されているアプリケーションの異常発生を検出すると、アプリケーション実行部220、320、情報回収部250、350及びサーバ管理システム400に他サーバのアプリケーションの実行状態に異常が起きた旨を通知する異常通知を送信する。   The other server monitoring units 240 and 340 monitor the execution state of the application (APP) executed by the application execution units 220 and 320 of the other server via the communication units 210 and 310. When the other server monitoring units 240 and 340 detect the occurrence of an abnormality in the other server or the abnormality of the application being executed on the other server, the other server monitoring units 240 and 340 An abnormality notification is sent to notify that an abnormality has occurred in the execution state of the application on the other server.

情報回収部250、350は、OS等の再起動が行われてもデータが保持される、不揮発性記憶装置(図示せず)を有している。情報回収部250、350は、他サーバ監視部240、340からの異常通知を受信すると、他サーバの情報保管部230、330に保存されているMIB225、325の統計情報を読み出し、当該読み出した統計情報を自サーバのMIB225、325に設定する。   The information collection units 250 and 350 have a nonvolatile storage device (not shown) that retains data even when the OS or the like is restarted. When the information collection units 250 and 350 receive the abnormality notification from the other server monitoring units 240 and 340, the information collection units 250 and 350 read the statistical information of the MIBs 225 and 325 stored in the information storage units 230 and 330 of the other servers, and the read statistics Information is set in the MIBs 225 and 325 of its own server.

サーバ管理システム400は、例えば、SNMP等を用いて、ACT系のサーバのMIB225、325の統計情報を定期的に収集する。   The server management system 400 periodically collects statistical information of the MIBs 225 and 325 of the ACT servers using, for example, SNMP.

以下に、図1及び図3を参照しつつ各部の動作の一例について、ACT系サーバ200において異常が発生した場合を例に説明する。   Hereinafter, an example of the operation of each unit will be described with reference to FIGS. 1 and 3, taking as an example a case where an abnormality has occurred in the ACT server 200.

上述のように、異常が発生する以前において、サーバ管理システム400は、現在ACT系であるサーバ200のMIB225の統計情報を定期的に収集している。   As described above, before the occurrence of an abnormality, the server management system 400 periodically collects statistical information of the MIB 225 of the server 200 that is currently an ACT system.

SBY系サーバ300の他サーバ監視部340は、通信部210、310を介して、ACT系サーバ200の状態及びACT系サーバ200のアプリケーション実行部220で実行されているアプリケーション(APP)の実行状態を監視している。   The other server monitoring unit 340 of the SBY server 300 indicates the state of the ACT server 200 and the execution state of the application (APP) executed by the application execution unit 220 of the ACT server 200 via the communication units 210 and 310. Monitoring.

ACT系サーバ200において異常が発生すると、ACT系サーバ200の情報保管部230は、自サーバのアプリケーション実行部220のMIB225の統計情報を読み出して保存し(S31)、自サーバを再起動させる、すなわちOS及びアプリケーションの再起動を行う(S32)。なお、アプリケーション以外に異常が無い場合には、アプリケーションのみを再起動することとしてもよい。   When an abnormality occurs in the ACT server 200, the information storage unit 230 of the ACT server 200 reads and stores the statistical information of the MIB 225 of the application execution unit 220 of the own server (S31), and restarts the own server. The OS and application are restarted (S32). If there is no abnormality other than the application, only the application may be restarted.

再起動の後、ACT系サーバ200はSBY系サーバとして動作し、新ACTサーバとしてのSBYサーバ300のアプリケーション実行状態の監視を開始する。   After the restart, the ACT server 200 operates as an SBY server and starts monitoring the application execution state of the SBY server 300 as a new ACT server.

SBY系サーバ300の他サーバ監視部340は、他サーバの異常発生、または他サーバで実行されているアプリケーションの異常発生を検出し、アプリケーション実行部320、情報回収部350及びサーバ管理システム400に他ACT系サーバのアプリケーションの実行状態に異常が起きた旨を通知する異常通知を送信する(S33)。   The other server monitoring unit 340 of the SBY server 300 detects the occurrence of an abnormality in the other server or the abnormality of the application being executed on the other server, and sends the other to the application execution unit 320, the information collection unit 350, and the server management system 400. An abnormality notification for notifying that an abnormality has occurred in the execution state of the application of the ACT server is transmitted (S33).

SBY系サーバ300のアプリケーション実行部320は、異常通知を受信すると、即時に仮想IPの設定を行い、新ACT系サーバとしてのアプリケーションの実行を開始する(S34)。   Upon receiving the abnormality notification, the application execution unit 320 of the SBY server 300 immediately sets the virtual IP and starts executing the application as the new ACT server (S34).

SBY系サーバ300の情報回収部350は、異常通知を受信すると、ACT系サーバ200の情報保管部230に保存されているMIB225の統計情報を読み出し(回収し)、当該読み出した統計情報を自サーバのMIB325に設定する(S35)。なお、この読み出し及び設定動作は、ACT系サーバ200がOSの再起動をする場合には、ACT系サーバ200の状態を監視し、ACT系サーバ200のOSの再起動を待って行うこととしてもよい。   Upon receipt of the abnormality notification, the information collection unit 350 of the SBY server 300 reads (collects) the statistical information of the MIB 225 stored in the information storage unit 230 of the ACT server 200, and uses the read statistical information as its own server. The MIB 325 is set (S35). Note that when the ACT server 200 restarts the OS, the reading and setting operations may be performed by monitoring the state of the ACT server 200 and waiting for the OS of the ACT server 200 to restart. Good.

上記S35における統計情報の設定の後において、SBY系サーバ300のMIB325には、例えば、図4に示す統計情報テーブルのような、新ACT系サーバとしてのアプリケーションの実行の後のアプリケーションの統計情報及びACT系サーバ200における異常発生時のアプリケーションの統計情報を含むテーブルが保存されることとなる。   After the setting of the statistical information in S35, the MIB 325 of the SBY server 300 includes, for example, statistical information on the application after execution of the application as the new ACT server, such as the statistical information table shown in FIG. A table including application statistical information at the time of occurrence of an abnormality in the ACT server 200 is stored.

サーバ管理システム400は、異常通知を受信すると、統計情報の収集先を、新ACT系サーバ(異常発生前のSBY系サーバ300)に変更し(S36)、統計情報の収集を開始する。すなわち、サーバ管理システム400によって、新ACT系サーバとしてのアプリケーションの実行の後のアプリケーションの統計情報及びACT系サーバ200における異常発生時のアプリケーションの統計情報を含む情報が収集される。   Upon receiving the abnormality notification, the server management system 400 changes the collection destination of statistical information to the new ACT server (SBY server 300 before the occurrence of abnormality) (S36), and starts collecting statistical information. That is, the server management system 400 collects information including application statistical information after the execution of the application as the new ACT server and application statistical information when an abnormality occurs in the ACT server 200.

なお、S34におけるSBY系サーバ300のアプリケーション実行部320による仮想IPの設定及び新ACT系サーバとしてのアプリケーションの実行の開始は、S35における統計情報の読み出し及び設定を待たずに行われ得る。   Note that the setting of the virtual IP and the start of execution of the application as the new ACT server by the application execution unit 320 of the SBY server 300 in S34 can be performed without waiting for the reading and setting of the statistical information in S35.

以下に、図5を用いて、情報保管部230、330の動作ルーチンの一例について説明する。   Hereinafter, an example of an operation routine of the information storage units 230 and 330 will be described with reference to FIG.

まず、S51において、自サーバがACT系であるか否かが判定される。S51において、自サーバがACT系であると判定された場合(S51:YES)には、処理はS52に進み、情報保管部230、330内に以前に保存されたMIB225、325の統計情報が削除される。その後、処理ステップS53に進み、自サーバのアプリケーションが正常に起動しているか否かが判定される。   First, in S51, it is determined whether or not the own server is an ACT system. If it is determined in S51 that the own server is an ACT system (S51: YES), the process proceeds to S52, and the statistical information of MIBs 225 and 325 previously stored in the information storage units 230 and 330 is deleted. Is done. Then, it progresses to process step S53 and it is determined whether the application of the own server has started normally.

自サーバがACT系ではないと判定された場合(S51:NO)、すなわち自サーバがSBY系である場合には、処理はS53に進み、自サーバのアプリケーションが正常に起動しているか否かが判定される。   If it is determined that the local server is not an ACT system (S51: NO), that is, if the local server is an SBY system, the process proceeds to S53, and whether or not the application of the local server is normally activated. Determined.

S53において、アプリケーションが正常に起動していると判定された場合(S53:YES)、処理はS54に進み、一定時間ウェイトが行われた後に、処理はS51に進む。S53において、アプリケーションが正常に起動していないと判定された場合(S53:NO)、処理はS55に進み、自サーバがアプリケーションの異常発生前にACT系だったか否かが判定される。   If it is determined in S53 that the application is normally activated (S53: YES), the process proceeds to S54, and after waiting for a fixed time, the process proceeds to S51. In S53, when it is determined that the application is not normally started (S53: NO), the process proceeds to S55, and it is determined whether or not the local server is an ACT system before the occurrence of the application abnormality.

自サーバがアプリケーションの異常発生前にACT系であったと判定された場合(S55:YES)、処理はS56に進み、MIB225、325の統計情報が情報保管部230、330の不揮発性記憶装置内に保存され、その後処理はS57に進む。自サーバがアプリケーションの異常発生前にACT系ではなかったと判定された場合(S55:NO)、すなわちSBY系であったと判定された場合、処理はS57に進む。   If it is determined that the local server is an ACT system before the occurrence of an application abnormality (S55: YES), the process proceeds to S56, and the statistical information of the MIBs 225 and 325 is stored in the nonvolatile storage devices of the information storage units 230 and 330. After that, the process proceeds to S57. If it is determined that the local server is not an ACT system before the occurrence of an application abnormality (S55: NO), that is, if it is determined that the server is an SBY system, the process proceeds to S57.

S57において、OS及びアプリケーションが再起動され、ルーチンが終了する。   In S57, the OS and application are restarted, and the routine ends.

以下に、図6を用いて、情報回収部250、350の動作ルーチンの一例について説明する。   Hereinafter, an example of an operation routine of the information collection units 250 and 350 will be described with reference to FIG.

まず、S61において、他サーバ監視部から異常通知を受信したか否かが判定される。S61において、異常通知を受信したと判定された場合(S61:YES)、処理はS62に進み自サーバがACT系であるか否かが判定される。   First, in S61, it is determined whether or not an abnormality notification is received from another server monitoring unit. If it is determined in S61 that an abnormality notification has been received (S61: YES), the process proceeds to S62 to determine whether or not the server is an ACT system.

S61において、異常通知を受信していないと判定された場合(S61:NO)、処理はS63に進み一定時間のウェイトの後に処理はS61に進む。   If it is determined in S61 that an abnormality notification has not been received (S61: NO), the process proceeds to S63, and the process proceeds to S61 after waiting for a fixed time.

S62において、自サーバがACT系であるか否かが判定される。S62において、自サーバがACT系であると判定された場合(S62:YES)、すなわちACT系であった他サーバの異常が検出されて異常通知がなされた結果として系切換が行われた場合、処理はS64に進み、他サーバの情報保管部230、330への接続が試行され、処理はS65に進む。   In S62, it is determined whether or not the own server is an ACT system. In S62, when it is determined that the local server is an ACT system (S62: YES), that is, when system switching is performed as a result of detecting an abnormality of another server that was an ACT system and notifying the abnormality, The process proceeds to S64, an attempt is made to connect to the information storage units 230 and 330 of other servers, and the process proceeds to S65.

S62において、自サーバがACT系ではないと判定された場合(S62:NO)、すなわちSBY系であった他サーバに異常が検出されて異常通知がなされた場合には、処理はS63に進み、一定時間のウェイトの後に処理はS61に進む。   If it is determined in S62 that the local server is not an ACT system (S62: NO), that is, if an abnormality is detected in another server that is an SBY system and an abnormality is notified, the process proceeds to S63. After a predetermined time wait, the process proceeds to S61.

S65において、他サーバの情報保管部230、330への接続が成功したか否かが判定される。他サーバの情報保管部230、330への接続が成功したと判定された場合(S65:YES)、ステップはS66に進む。S65において、他サーバの情報保管部230、330への接続が成功しなかったと判定された場合(S65:NO)、ステップはS63に進み、一定時間のウェイトの後に処理はS61に進む。   In S65, it is determined whether or not the connection to the information storage units 230 and 330 of the other servers has been successful. When it is determined that the connection to the information storage units 230 and 330 of the other servers is successful (S65: YES), the step proceeds to S66. In S65, when it is determined that the connection to the information storage units 230 and 330 of the other server has not been successful (S65: NO), the process proceeds to S63, and after waiting for a certain time, the process proceeds to S61.

S66において、他サーバの情報保管部230、330から、他サーバにおいて図5に示したルーチンのS56において保存されたMIBの統計情報を取得し、当該統計情報を自サーバのMIB225、325に設定し、すなわち引継ぎ処理を行った後、処理はS67に進む。なお、S66において、統計情報の取得は、統計情報を保有しているサーバがOSの再起動をする場合には、当該サーバの状態を監視し、当該サーバのOSの再起動を待って行うこととしてもよい。   In S66, the MIB statistical information stored in S56 of the routine shown in FIG. 5 in the other server is acquired from the information storage units 230 and 330 of the other server, and the statistical information is set in the MIBs 225 and 325 of the own server. That is, after performing the takeover process, the process proceeds to S67. In S66, when the server holding the statistical information restarts the OS, the statistical information is acquired by monitoring the state of the server and waiting for the server OS to restart. It is good.

S67において、自サーバがACT系か否かが判断される。自サーバがACT系と判断された場合(S67:YES)、処理はS68に進み、一定時間のウェイトの後に処理は再度S67に進む。S67において、自サーバがACT系ではないと判断された場合(S67:NO)、処理はS63に進み、一定時間のウェイトの後に処理はS61に進む。すなわち、他サーバからの情報引継ぎ処理の後に自サーバにおいて異常が発生せず自サーバがACT系である限りS67の処理が繰り返されることとなる。   In S67, it is determined whether or not the server is an ACT system. If it is determined that the local server is an ACT system (S67: YES), the process proceeds to S68, and after waiting for a predetermined time, the process proceeds to S67 again. In S67, when it is determined that the local server is not an ACT system (S67: NO), the process proceeds to S63, and after waiting for a predetermined time, the process proceeds to S61. That is, after the information takeover process from another server, the process of S67 is repeated as long as no abnormality occurs in the own server and the own server is an ACT system.

本実施例の冗長構成サーバシステムによれば、ACT系サーバにおいてアプリケーションの異常が発生した際に、当該異常発生時における当該アプリケーションの情報が当該ACT系サーバ内の不揮発性記憶装置に一旦保存される。そして、その後に当該異常発生時までSBYサーバであった新ACT系サーバによって、当該異常発生時における当該アプリケーションの情報が回収される。このような構成により、当該異常が発生したアプリケーションの再起動が行われた後であっても、新ACT系サーバに当該アプリケーションの異常発生時の情報を確実に引き継ぐことが可能である。   According to the redundant configuration server system of the present embodiment, when an application abnormality occurs in the ACT server, information on the application at the time of the abnormality is temporarily stored in the nonvolatile storage device in the ACT server. . Then, the information on the application at the time of the abnormality is collected by the new ACT server that was the SBY server until the time of the abnormality. With such a configuration, even when the application in which the abnormality has occurred is restarted, it is possible to reliably take over the information when the abnormality of the application has occurred in the new ACT server.

また、当該異常発生時における当該アプリケーションの情報が当該ACT系サーバ内の不揮発性記憶装置内に一旦保存されているので、ネットワークインタフェースカード(NIC)等のハードウェアの間欠的な故障のために、OSを再起動する必要がある場合でも、当該異常発生時における当該アプリケーションの情報が失われることなく、新ACT系サーバに確実に引き継ぐことが可能である。   In addition, since information on the application at the time of the occurrence of the abnormality is temporarily stored in the nonvolatile storage device in the ACT server, due to an intermittent failure of hardware such as a network interface card (NIC), Even when the OS needs to be restarted, it is possible to reliably take over to the new ACT server without losing information on the application when the abnormality occurs.

また、本実施例の冗長構成サーバシステムによれば、ACT系サーバにおいてアプリケーションの異常が発生した際に、SBY系サーバが当該異常を検出するとすぐに、すなわちACT系サーバからの統計情報の引き継ぎを待たずにACT系への切換が行われる。従って、本実施例の冗長構成サーバシステムは、切れ目のないシームレスなサービスを提供することが可能である。   Further, according to the redundant configuration server system of the present embodiment, when an application abnormality occurs in the ACT server, immediately after the SBY server detects the abnormality, that is, taking over the statistical information from the ACT server. Switching to the ACT system is performed without waiting. Therefore, the redundantly configured server system according to the present embodiment can provide a seamless service without a break.

また、本実施例の冗長構成サーバシステムによれば、上述のように、異常が発生したサーバのOSの再起動を待って統計情報を回収することにより、従来の冗長構成サーバシステムにおける統計情報の引き継ぎに係る通信を行うことなく効率よく統計情報を引き継ぐことが可能である。   Further, according to the redundant configuration server system of the present embodiment, as described above, the statistical information in the conventional redundant configuration server system is collected by waiting for the restart of the OS of the server in which an abnormality has occurred and collecting the statistical information. It is possible to efficiently take over statistical information without performing communication related to takeover.

上記実施例においては、同一の構成を有する一組のサーバ装置からなる冗長構成サーバシステムを例に説明したが、異なった構成を有するサーバ装置で冗長構成サーバシステムを構成してもよい。   In the above embodiment, the redundant configuration server system including a pair of server devices having the same configuration has been described as an example. However, the redundant configuration server system may be configured by server devices having different configurations.

例えば、本発明の冗長構成サーバシステムの必要最低限の構成として、図7に示す冗長構成サーバシステム100のように、ACT系サーバ装置200が、通信部210、アプリケーション実行部220、情報保管部230を含み、SBY系サーバ300が、通信部310、アプリケーション実行部320、他サーバ監視部340及び情報回収部350を含んでいることとしてもよい。すなわち、異常発生時に自サーバのアプリケーションの異常発生時の情報を保存する機能のみを有するACT系専用サーバと当該異常発生時の情報を他サーバから回収する機能のみを有するSBY系専用サーバからなるシステム構成としてもよい。   For example, as the minimum required configuration of the redundant configuration server system of the present invention, as in the redundant configuration server system 100 shown in FIG. 7, the ACT server device 200 includes a communication unit 210, an application execution unit 220, and an information storage unit 230. The SBY server 300 may include a communication unit 310, an application execution unit 320, another server monitoring unit 340, and an information collection unit 350. That is, a system comprising an ACT dedicated server having only a function of storing information when an abnormality of the application of the own server occurs when an abnormality occurs, and an SBY dedicated server having only a function of collecting information at the time of occurrence of the abnormality from another server It is good also as a structure.

なお、この構成の場合、ACT系サーバ200は、図3に示す動作説明におけるACT系サーバ200の再起動の後の、SBY系サーバ300で実行されているアプリケーションの実行状態を監視は行わないこととなる。   In the case of this configuration, the ACT server 200 does not monitor the execution state of the application executed on the SBY server 300 after the restart of the ACT server 200 in the operation description shown in FIG. It becomes.

このような構成を最低限有することで、図3に関して説明した動作により、上記実施例と同様に異常発生時のアプリケーションの情報を新ACT系サーバに確実に引き継ぐことが可能となる。   By having such a configuration as a minimum, the operation described with reference to FIG. 3 makes it possible to reliably transfer the application information at the time of occurrence of an abnormality to the new ACT server as in the above embodiment.

また、上記実施例においては、一組のサーバ装置からなる冗長構成サーバシステムを例に説明をしたが、本発明の冗長構成サーバシステムは当該構成限定されるものではない。例えば、複数のACT系サーバ200及びSBY系を有するサーバシステムであってもよい。その際、上述のACT系専用サーバとSBY系専用サーバを組み合わせてもよい。   Moreover, in the said Example, although the redundantly configured server system which consists of a set of server apparatus was demonstrated to the example, the redundantly configured server system of this invention is not limited to the said structure. For example, a server system having a plurality of ACT servers 200 and SBY systems may be used. In that case, you may combine the above-mentioned ACT system dedicated server and SBY system dedicated server.

また、ACT系専用サーバとSBY系専用サーバの数は同数でなくともよい。例えば、複数のACT系専用サーバに対して1のSBY専用サーバを有するシステム構成としてもよい。   Further, the number of ACT system dedicated servers and SBY system dedicated servers may not be the same. For example, a system configuration having one SBY dedicated server for a plurality of ACT system dedicated servers may be employed.

また、上記実施例においては、SIPサーバを例として説明したが、VoIPサーバ等の他の種類のサーバ装置を用いることとしてもよい。   In the above embodiment, the SIP server has been described as an example, but other types of server devices such as a VoIP server may be used.

また、上記実施例においては、SIPの統計情報が接続数、受付呼数、完了呼数及び不完了呼数を含むとして説明したが、SIPの統計情報は、接続数、受付呼数、完了呼数及び不完了呼数のうちの、少なくともいずれかひとつの情報を含めば足りる。   In the above-described embodiment, the SIP statistical information includes the number of connections, the number of accepted calls, the number of completed calls, and the number of incomplete calls. However, the SIP statistical information includes the number of connections, the number of accepted calls, and the number of completed calls. It is sufficient to include at least one of the number and the number of incomplete calls.

また、上記実施例においては、情報保管部230、330は、自サーバのアプリケーションの実行状態を監視して、アプリケーションの実行状態に異常が発生した際に、当該異常発生時の統計情報を保存することとしたが、これに限られない。例えば、情報保管部230、330は、アプリケーションの実行状態に加えて自サーバのハードウェアの状態を監視し、当該状態に異常が発生した際に、当該異常発生時の統計情報を保存することとしてもよい。この場合、情報保管部230、330は、さらに当該異常発生時のハードウェアの実行状態を含む情報を保存することとしてもよい。   Further, in the above embodiment, the information storage units 230 and 330 monitor the execution state of the application of the own server, and store the statistical information when the abnormality occurs when an abnormality occurs in the execution state of the application. However, it is not limited to this. For example, the information storage units 230 and 330 monitor the hardware state of the server in addition to the execution state of the application, and store the statistical information at the time of the abnormality when the abnormality occurs in the state. Also good. In this case, the information storage units 230 and 330 may further store information including the execution state of the hardware when the abnormality occurs.

また、上記実施例においては、情報回収部250、350は、他サーバのアプリケーションの実行状態を監視して、アプリケーションの実行状態に異常が発生した際に、当該異常発生時の統計情報を回収することとしたが、これに限られない。例えば、他サーバ監視部240、340は、アプリケーションの実行状態に加えて他サーバのハードウェアの状態を監視し、当該状態に異常が発生したことを検知した際に、情報回収部250、350が当該異常発生時の統計情報を保存することとしてもよい。この場合、情報回収部250、350は、さらに当該異常発生時のハードウェアの実行状態を含む情報を回収することとしてもよい。   In the above embodiment, the information collection units 250 and 350 monitor the execution state of the application of the other server, and collect the statistical information at the time of occurrence of the abnormality when the abnormality occurs in the execution state of the application. However, it is not limited to this. For example, the other server monitoring units 240 and 340 monitor the hardware state of the other server in addition to the application execution state, and when the information collection units 250 and 350 detect that an abnormality has occurred in the state, Statistical information at the time of occurrence of the abnormality may be stored. In this case, the information collection units 250 and 350 may further collect information including the execution state of the hardware when the abnormality occurs.

上述のように、異常発生時の情報としてアプリケーションの実行状態だけではなくハードウェアの状態も引き継ぐことで、異常発生時のさらに詳細な情報を引き継いで残すことが可能となる。   As described above, by taking over not only the application execution state but also the hardware state as information at the time of occurrence of an abnormality, it becomes possible to take over more detailed information at the time of occurrence of an abnormality.

上述した実施例における種々の構成は、例示に過ぎず、用途等に応じて、適宜選択することができる。   The various configurations in the above-described embodiments are merely examples, and can be appropriately selected according to the application and the like.

100 冗長構成サーバシステム
200 ACT系サーバ
300 SBY系サーバ
210、310 通信部
220、320 アプリケーション実行部
230、330 情報保管部
240、340 他サーバ監視部
250、350 情報回収部
100 redundant server system 200 ACT server 300 SBY server 210, 310 communication unit 220, 320 application execution unit 230, 330 information storage unit 240, 340 other server monitoring unit 250, 350 information collection unit

Claims (13)

冗長構成サーバシステム内で用いられ、第1のアプリケーションを実行する呼制御サーバ装置であって、
前記第1のアプリケーションの実行状態を監視し、前記第1のアプリケーションの異常を検出した際に前記第1のアプリケーションの異常発生時における呼制御処理の実行状態を示す情報である自サーバ異常時情報を収集して保存する情報収集手段と、
前記冗長構成サーバシステム内の他の呼制御サーバ装置で実行されている第2のアプリケーションの実行状態を監視する他サーバ監視手段と、
前記他サーバ監視手段が前記他の呼制御サーバ装置における前記第2のアプリケーションの異常発生を検出し、前記呼制御サーバ装置が待機系から運用系に切り替わって動作を開始した後に、前記第2のアプリケーションの異常発生時における呼制御処理の実行状態を示す情報である他サーバ異常時情報を回収する情報回収手段と、
を有し、
前記自サーバ異常時情報は、前記第1のアプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくともいずれかの情報を含み、
前記他サーバ異常時情報は、前記第2のアプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくともいずれかの情報を含む、
ことを特徴とする呼制御サーバ装置。
A call control server device that is used in a redundantly configured server system and executes a first application,
The own server abnormality time information which is information indicating the execution state of the call control process when the first application abnormality occurs when the execution state of the first application is monitored and the abnormality of the first application is detected. Information collecting means for collecting and storing
Other server monitoring means for monitoring the execution state of the second application being executed by another call control server device in the redundant server system;
After the other server monitoring means detects an abnormality of the second application in the other call control server device and the call control server device is switched from the standby system to the active system and starts operating, Information collecting means for collecting other server abnormality information, which is information indicating an execution state of the call control process when an application abnormality occurs;
Have
The own server abnormality time information includes information on at least one of the number of call connections, the number of accepted calls, the number of completed calls, and the number of uncompleted calls when an abnormality occurs in the first application,
The other server abnormal time information includes information on at least one of the number of call connections, the number of accepted calls, the number of completed calls, and the number of incomplete calls when an abnormality occurs in the second application.
A call control server device.
前記情報収集手段による前記自サーバ異常時情報の収集、保存は、前記呼制御サーバ装置が運用系の状態において行われることを特徴とする請求項1に記載の呼制御サーバ装置。   The call control server apparatus according to claim 1, wherein the information collection means collects and stores the information when the own server is abnormal while the call control server apparatus is in an active state. 前記情報回収手段は、前記他の呼制御サーバ装置の再起動を待って前記他サーバ異常時情報を回収することを特徴とする請求項1または2に記載の呼制御サーバ装置。   The call control server device according to claim 1 or 2, wherein the information collection unit collects the information when the other server is abnormal after waiting for the other call control server device to restart. 前記呼制御サーバ装置が待機系サーバとして動作している際に、前記他サーバ監視手段が前記他の呼制御サーバ装置で実行されている前記第2のアプリケーションの異常発生を検出すると、前記情報回収手段が前記他サーバ異常時情報を回収するのを待たずして前記呼制御サーバ装置の動作が運用系サーバとしての動作に切り替わることを特徴とする請求項1乃至3のいずれか1つに記載の呼制御サーバ装置。   When the call control server device is operating as a standby server and the other server monitoring unit detects an abnormality in the second application being executed on the other call control server device, the information collection is performed. 4. The operation of the call control server device is switched to an operation as an active server without waiting for the means to collect the information when the other server is abnormal. Call control server device. 第1の呼制御サーバ装置及び第2の呼制御サーバ装置を有する冗長構成サーバシステムであって、
前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されているアプリケーションの実行状態を監視し、前記第1の呼制御サーバ装置で実行されているアプリケーションの異常発生を検出した際に、前記第1の呼制御サーバ装置で実行されているアプリケーションの異常発生時における呼制御処理の実行状態を示す情報である異常時情報を収集して保存する情報収集手段、を有し、
前記第2の呼制御サーバ装置が、
前記第1の呼制御サーバ装置で実行されているアプリケーションの実行状態を監視する監視手段と、
前記第1の呼制御サーバ装置で実行されているアプリケーションの異常を検出し、前記第2の呼制御サーバ装置が待機系から運用系に切り替わって動作を開始した後に、前記第1の呼制御サーバ装置の前記情報収集手段から前記異常時情報を回収する情報回収手段と、を有し、
前記異常時情報は、前記アプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくとも何れかの情報を含むことを特徴とする冗長構成サーバシステム。
A redundantly configured server system having a first call control server device and a second call control server device,
The first call control server device monitors an execution state of an application executed on the first call control server device, and detects an abnormality of the application executed on the first call control server device. Information collecting means for collecting and storing abnormal time information, which is information indicating an execution state of the call control processing when an abnormality occurs in the application executed on the first call control server device ,
The second call control server device is
Monitoring means for monitoring an execution state of an application executed on the first call control server device;
After detecting an abnormality of an application being executed in the first call control server device and the second call control server device is switched from a standby system to an active system and starts operating, the first call control server Information collecting means for collecting the abnormal information from the information collecting means of the apparatus,
The redundant configuration server system, wherein the abnormal time information includes at least one of the number of call connections, the number of accepted calls, the number of completed calls, and the number of incomplete calls when an abnormality occurs in the application.
前記情報回収手段は、前記第1の呼制御サーバ装置の再起動を待って前記異常時情報を回収することを特徴とする請求項5に記載の冗長構成サーバシステム。   6. The redundantly configured server system according to claim 5, wherein the information collecting unit collects the abnormal time information after the first call control server device is restarted. 前記第2の呼制御サーバ装置が待機系サーバとして動作している際に、前記監視手段が前記第1の呼制御サーバ装置で実行されているアプリケーションの異常発生を検出すると、前記情報回収手段が前記異常時情報を回収するのを待たずして前記第2の呼制御サーバ装置の動作が運用系サーバとしての動作に切り替わることを特徴とする請求項5または6に記載の冗長構成サーバシステム。   When the second call control server device is operating as a standby server and the monitoring means detects an abnormality of an application being executed on the first call control server device, the information collecting means 7. The redundant configuration server system according to claim 5, wherein the operation of the second call control server device is switched to the operation as an active server without waiting for the recovery of the abnormal time information. アプリケーションを実行する第1の呼制御サーバ装置及び第2の呼制御サーバ装置からなる冗長構成サーバシステム内で、前記アプリケーションの異常発生時における呼制御処理の実行状態を示す情報である異常時情報を前記第1の呼制御サーバ装置から前記第2の呼制御サーバ装置へ引き継ぐ処理を呼制御サーバ装置に実行させる情報引継プログラムであって、
前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの実行状態を監視する処理と、
前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常発生を検出した際に前記アプリケーションの異常発生時における情報である異常時情報を収集して保存する処理と、
前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常を監視する処理と、
前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常を検出し、待機系から運用系に切り替わって動作を開始した後に、前記第1の呼制御サーバ装置の前記異常時情報を回収する処理と、を実行させ、
前記異常時情報は、前記アプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくとも何れかの情報を含むことを特徴とする情報引継プログラム。
In the redundant configuration server system comprising the first call control server device and the second call control server device that execute the application, the abnormal time information that is the information indicating the execution state of the call control process when the application abnormality occurs An information takeover program that causes a call control server device to execute a process of taking over from the first call control server device to the second call control server device,
A process in which the first call control server device monitors an execution state of the application being executed in the first call control server device;
When the first call control server device detects an abnormality of the application being executed on the first call control server device, it collects abnormal time information that is information at the time of the abnormality of the application. Processing to save,
A process in which the second call control server device monitors an abnormality of the application being executed in the first call control server device;
After the second call control server device detects an abnormality of the application being executed in the first call control server device and starts operation by switching from the standby system to the active system, the first call control server device Collecting the abnormal information of the control server device, and
The information at the time of abnormality includes information on at least one of the number of call connections, the number of accepted calls, the number of completed calls, and the number of incomplete calls when an abnormality occurs in the application.
前記回収する処理は、前記第1の呼制御サーバ装置の再起動を待って前記第2の呼制御サーバ装置に実行させることを特徴とする請求項8に記載の情報引継プログラム。   9. The information transfer program according to claim 8, wherein the collecting process causes the second call control server device to execute after the first call control server device is restarted. 前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常を検出した際に、前記第2の呼制御サーバ装置が前記第1の呼制御サーバ装置の前記異常時情報を回収するのを待たずして、前記第2の呼制御サーバ装置の動作を運用系サーバとしての動作に切り替える処理を前記第2の呼制御サーバ装置に実行させることを特徴とする請求項8または9に記載の情報引継プログラム。   When the second call control server device detects an abnormality in the application being executed on the first call control server device, the second call control server device detects the first call control server device. The second call control server device is caused to execute a process of switching the operation of the second call control server device to an operation as an active server without waiting for the recovery of the abnormal time information. The information transfer program according to claim 8 or 9. アプリケーションを実行する第1の呼制御サーバ装置及び第2の呼制御サーバ装置からなる冗長構成サーバシステム内で、前記アプリケーションの異常発生時における呼制御処理の実行状態を示す情報である異常時情報を前記第1の呼制御サーバ装置から前記第2の呼制御サーバ装置へ引き継ぐ情報引継方法であって、
前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの実行状態を監視するステップと、
前記第1の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常発生を検出した際に前記第1の呼制御サーバ装置の異常時情報を収集して保存するステップと、
前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションまたは前記第1の呼制御サーバ装置の異常を監視するステップと、
前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常を検出し、待機系から運用系に切り替わって動作を開始した後に、前記第1の呼制御サーバ装置の前記異常時情報を回収するステップと、を含み、
前記異常時情報は、前記アプリケーションの異常発生時の呼接続数、受付呼数、完了呼数及び不完了呼数のうちの少なくともいずれかの情報を含むことを特徴とする情報引継方法。
In the redundant configuration server system comprising the first call control server device and the second call control server device that execute the application, the abnormal time information that is the information indicating the execution state of the call control process when the application abnormality occurs An information takeover method for taking over from the first call control server device to the second call control server device,
The first call control server device monitoring an execution state of the application being executed by the first call control server device;
When the first call control server device detects the occurrence of an abnormality in the application being executed on the first call control server device , it collects and stores information on the abnormality of the first call control server device And steps to
The second call control server device monitoring the application being executed on the first call control server device or an abnormality of the first call control server device;
After the second call control server device detects an abnormality of the application being executed in the first call control server device and starts operation by switching from the standby system to the active system, the first call control server device Collecting the abnormal time information of the control server device,
The information at the time of abnormality includes information on at least one of the number of call connections, the number of accepted calls, the number of completed calls, and the number of incomplete calls when an abnormality occurs in the application.
前記回収するステップは、前記第1の呼制御サーバ装置の再起動を待って行われることを特徴とする請求項11に記載の情報引継方法。   12. The information transfer method according to claim 11, wherein the collecting step is performed after the first call control server device is restarted. 前記第2の呼制御サーバ装置が、前記第1の呼制御サーバ装置で実行されている前記アプリケーションの異常を検出した際に、前記第2の呼制御サーバ装置が前記第1の呼制御サーバ装置の前記異常時情報を回収するのを待たずして、前記第2の呼制御サーバ装置の動作を運用系サーバとしての動作に切り替えるステップを含むことを特徴とする請求項11または12に記載の情報引継方法。   When the second call control server device detects an abnormality in the application being executed on the first call control server device, the second call control server device detects the first call control server device. The method according to claim 11, further comprising a step of switching the operation of the second call control server device to an operation as an active server without waiting for the recovery of the abnormal time information. Information transfer method.
JP2014195618A 2014-09-25 2014-09-25 Server device, redundant server system, information takeover program, and information takeover method Active JP6421516B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014195618A JP6421516B2 (en) 2014-09-25 2014-09-25 Server device, redundant server system, information takeover program, and information takeover method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014195618A JP6421516B2 (en) 2014-09-25 2014-09-25 Server device, redundant server system, information takeover program, and information takeover method

Publications (2)

Publication Number Publication Date
JP2016066303A JP2016066303A (en) 2016-04-28
JP6421516B2 true JP6421516B2 (en) 2018-11-14

Family

ID=55804185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014195618A Active JP6421516B2 (en) 2014-09-25 2014-09-25 Server device, redundant server system, information takeover program, and information takeover method

Country Status (1)

Country Link
JP (1) JP6421516B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018028842A (en) 2016-08-19 2018-02-22 株式会社リコー Information processing apparatus, information processing method, and information processing program
JP7157315B2 (en) * 2018-08-29 2022-10-20 アイコム株式会社 Data setting system and data setting method
CN110716876A (en) * 2019-09-30 2020-01-21 国核自仪系统工程有限公司 Test platform and test method for automatically verifying programmable logic code
CN112612676A (en) * 2020-12-25 2021-04-06 深圳市裕展精密科技有限公司 Equipment monitoring method and device

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06177972A (en) * 1992-12-03 1994-06-24 Nippon Telegr & Teleph Corp <Ntt> Traffic collection device
JP2000022820A (en) * 1998-07-07 2000-01-21 Fujitsu Ltd Traffic collection system
JP2001147828A (en) * 1999-11-24 2001-05-29 Nec Corp System and method for controlling duplex constitution device
JP2010020697A (en) * 2008-07-14 2010-01-28 Nec Corp Redundant configuration system and switching control method thereof
JP4572250B2 (en) * 2008-09-11 2010-11-04 株式会社日立製作所 Computer switching method, computer switching program, and computer system
JP5285044B2 (en) * 2010-06-04 2013-09-11 日本電信電話株式会社 Cluster system recovery method, server, and program
JP5376058B2 (en) * 2010-06-30 2013-12-25 富士通株式会社 System control device, information processing system, and data saving and restoring method for information processing system
JP2013254354A (en) * 2012-06-07 2013-12-19 Mitsubishi Electric Corp Computer device, software management method and program
JP2014120123A (en) * 2012-12-19 2014-06-30 Hitachi Ltd Information processor and information processing method
JP6136305B2 (en) * 2013-01-30 2017-05-31 沖電気工業株式会社 Redundant VoIP system

Also Published As

Publication number Publication date
JP2016066303A (en) 2016-04-28

Similar Documents

Publication Publication Date Title
US10491671B2 (en) Method and apparatus for switching between servers in server cluster
CN108847982B (en) Distributed storage cluster and node fault switching method and device thereof
CN102708018B (en) Method and system for exception handling, proxy equipment and control device
US9348706B2 (en) Maintaining a cluster of virtual machines
TW201944236A (en) Task processing method, apparatus, and system
CN110830283B (en) Fault detection method, device, equipment and system
EP1697843B1 (en) System and method for managing protocol network failures in a cluster system
CN105933407B (en) method and system for realizing high availability of Redis cluster
EP3472971B1 (en) Technique for resolving a link failure
WO2018095414A1 (en) Method and apparatus for detecting and recovering fault of virtual machine
CN106161109B (en) Network abnormity self-recovery method
JP6421516B2 (en) Server device, redundant server system, information takeover program, and information takeover method
CN112506702B (en) Disaster recovery method, device, equipment and storage medium for data center
CN102394914A (en) Cluster brain-split processing method and device
JP6354901B2 (en) Virtual machine failure detection and recovery management system
CN110618864A (en) Interrupt task recovery method and device
CN110933142A (en) ICFS cluster network card monitoring method, device and equipment and medium
CN108243031B (en) Method and device for realizing dual-computer hot standby
CN104503861A (en) Abnormality handling method and system, agency device and control device
CN111752488B (en) Management method and device of storage cluster, management node and storage medium
CN107491344B (en) Method and device for realizing high availability of virtual machine
WO2024083259A1 (en) Master/backup database cluster and master selection method therefor, computing device, and storage medium
JP2015176168A (en) Administration server, fault restoration method, and computer program
CN115001956A (en) Server cluster operation method, device, equipment and storage medium
US11954509B2 (en) Service continuation system and service continuation method between active and standby virtual servers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180529

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180814

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180918

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181001

R150 Certificate of patent or registration of utility model

Ref document number: 6421516

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150