JP5936260B2 - Operation site switching system, operation site switching device, operation site switching method, and operation site switching program - Google Patents

Operation site switching system, operation site switching device, operation site switching method, and operation site switching program Download PDF

Info

Publication number
JP5936260B2
JP5936260B2 JP2012073789A JP2012073789A JP5936260B2 JP 5936260 B2 JP5936260 B2 JP 5936260B2 JP 2012073789 A JP2012073789 A JP 2012073789A JP 2012073789 A JP2012073789 A JP 2012073789A JP 5936260 B2 JP5936260 B2 JP 5936260B2
Authority
JP
Japan
Prior art keywords
site
operation site
switching
switching command
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012073789A
Other languages
Japanese (ja)
Other versions
JP2013206083A (en
Inventor
英樹 高部
英樹 高部
裕 鍋島
裕 鍋島
博哉 井田
博哉 井田
吉村 健
健 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone East Corp
Original Assignee
Nippon Telegraph and Telephone East Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone East Corp filed Critical Nippon Telegraph and Telephone East Corp
Priority to JP2012073789A priority Critical patent/JP5936260B2/en
Publication of JP2013206083A publication Critical patent/JP2013206083A/en
Application granted granted Critical
Publication of JP5936260B2 publication Critical patent/JP5936260B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、接続先のシステムに故障が発生した場合に、自動的に接続先を切り替えることができる運用サイト切り替えシステム、運用サイト切り替え装置、運用サイト切り替え方法及び運用サイト切り替えプログラムに関する。   The present invention relates to an operation site switching system, an operation site switching device, an operation site switching method, and an operation site switching program that can automatically switch a connection destination when a failure occurs in a connection destination system.

従来から、ノードサーバが正常に動作しなくなった場合にも効率よく複数のロードバランサからのメッセージを処理することが可能なクラスタシステムが知られている(例えば、特許文献1参照)。特許文献1に記載された発明では、2台のロードバランサに接続されたクラスタシステムが有する3台のノードサーバのそれぞれは、セッションIDと担当ノードサーバとを対応付けるセッション担当ノード情報と、ノード生死情報とを記憶する記憶部を備えている。クラスタシステムは、いずれか1つのロードバランサから送信されたメッセージを受け取った場合、メッセージのセッションを担当するノードサーバの機能が正常に動作しているか否かを判断し、セッションの担当ノードサーバを代替ノードサーバに変更するようにセッション担当ノード情報を更新する。そして、メッセージを送信したロードバランサ以外のロードバランサに、代替ノードサーバを示すデータを送信する。   Conventionally, a cluster system is known that can efficiently process messages from a plurality of load balancers even when a node server does not operate normally (see, for example, Patent Document 1). In the invention described in Patent Document 1, each of the three node servers included in the cluster system connected to the two load balancers includes session node information that associates the session ID with the node server in charge, and node life / death information. Is stored. When the cluster system receives a message sent from any one of the load balancers, it determines whether the function of the node server responsible for the message session is operating normally and replaces the node server responsible for the session. Update session node information to change to a node server. Then, data indicating the alternative node server is transmitted to a load balancer other than the load balancer that transmitted the message.

複数のロードバランサを介するデータ通信において、ノードサーバが正常に動作しなくなった場合にも複数のロードバランサが、同一のセッションまたは関連する複数のセッションに属するメッセージを同一のクラスタノードに分配することを可能とし、効率よくメッセージを処理することができる。   In data communication via multiple load balancers, even if a node server does not operate normally, multiple load balancers can distribute messages belonging to the same session or related sessions to the same cluster node. And can process messages efficiently.

特開2007−156569号公報JP 2007-15669 A

ところで、サーバ・クライアント方式を用いたシステム構成においては、2系統のサーバを用意しておき、一方の系統のサーバが故障した際に、他方の系統のサーバに切り替えて運用を継続することが行われている。このようなシステム構成においては、サーバとクライアントの間にロードバランサを設けて、故障が発生した際に、ロードバランサが故障していない系統のサーバにクライアントを接続することにより、クライアントは、サーバに故障が発生しても作業を継続することができる。   By the way, in a system configuration using the server / client system, two systems of servers are prepared, and when one system server fails, the operation can be continued by switching to the other system server. It has been broken. In such a system configuration, a load balancer is provided between the server and the client, and when a failure occurs, the client is connected to the server of the system where the load balancer is not broken, so that the client is connected to the server. Work can continue even if a failure occurs.

しかしながら、サーバとクライアントの間のロードバランサを設ける構成では、ロードバランサを導入するためのコストが必要であるとともに、ロードバランサを保守するためのコストが必要であるという問題がある。また、ロードバランサがサーバを切り替える構成にあっては、ロードバランサが故障した場合には、2系統のサーバを設けた利点を活かすことができないという問題もある。   However, in the configuration in which a load balancer is provided between the server and the client, there is a problem that a cost for introducing the load balancer is necessary and a cost for maintaining the load balancer is necessary. Further, in the configuration in which the load balancer switches the servers, there is a problem that the advantage of providing two systems of servers cannot be utilized when the load balancer fails.

本発明は、このような事情に鑑みてなされたもので、複数系統のサーバを備えたサーバ・クライアント方式において、ロードバランサを必要としない接続切り替えを行うことができる運用サイト切り替えシステム、運用サイト切り替え装置、運用サイト切り替え方法及び運用サイト切り替えプログラムを提供することを目的とする。   The present invention has been made in view of such circumstances. In a server-client system including a plurality of servers, an operation site switching system and an operation site switching that can perform connection switching that does not require a load balancer. An object is to provide an apparatus, an operation site switching method, and an operation site switching program.

本発明は、所定の運用サイトのシステムに接続する端末と、前記運用サイトのシステムの故障を検知する故障検知手段と、前記故障検知手段により故障を検知した際に、接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信手段とを備え、前記端末は、前記自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる前記接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替えることを特徴とする。   The present invention switches a terminal to be connected to a system at a predetermined operation site, a failure detection means for detecting a failure of the system at the operation site, and a system to be connected when a failure is detected by the failure detection means. Switching command transmission means for transmitting to the terminal connected to the operation site an automatic switching command including information necessary for the terminal, and the terminal receives the automatic switching command when the terminal receives the automatic switching command. The system to be connected is switched by referring to the information necessary for switching the system to be connected included in the automatic switching command.

本発明は、所定の運用サイトのシステムに接続し、自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替える端末に対して、前記自動切り替え命令を送信する運用サイト切り替え装置であって、前記運用サイトのシステムの故障を検知する故障検知手段と、前記故障検知手段により故障を検知した際に、接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信手段とを備えることを特徴とする。   The present invention connects to a system of a predetermined operation site, and when receiving an automatic switching command, refers to information necessary for switching a system to be connected included in the received automatic switching command, and An operation site switching device that transmits the automatic switching command to a terminal that switches a system to be executed, wherein a failure detection unit that detects a failure of the system at the operation site and a failure detected by the failure detection unit And switching command transmission means for transmitting an automatic switching command including information necessary for switching the system to be connected to the terminal connected to the operation site.

本発明は、所定の運用サイトのシステムに接続する端末と、故障検知手段と、切り替え命令送信手段とを備える運用サイト切り替えシステムが行う運用サイト切り替え方法であって、前記故障検知手段が、前記運用サイトのシステムの故障を検知する故障検知ステップと、前記切り替え命令送信手段が、前記故障検知ステップにより故障を検知した際に、接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信ステップと、前記端末が、前記自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる前記接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替える切り替えステップとを有することを特徴とする。   The present invention is an operation site switching method performed by an operation site switching system including a terminal connected to a system at a predetermined operation site, a failure detection unit, and a switching command transmission unit, wherein the failure detection unit includes the operation A failure detection step for detecting a failure of a system at a site; and an automatic switching command including information necessary for switching a system to be connected when the switching command transmission means detects a failure in the failure detection step. A switching command transmission step for transmitting to the terminal connected to the operation site, and when the terminal receives the automatic switching command, the system to be connected included in the received automatic switching command is switched. Switching step for switching the system to be connected with reference to the information necessary for Characterized in that it has and.

本発明は、所定の運用サイトのシステムに接続し、自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替える端末に対して、前記自動切り替え命令を送信する運用サイト切り替え装置が行う運用サイト切り替え方法であって、前記運用サイトのシステムの故障を検知する故障検知ステップと、前記故障検知手段により故障を検知した際に、接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信ステップとを有することを特徴とする。   The present invention connects to a system of a predetermined operation site, and when receiving an automatic switching command, refers to information necessary for switching a system to be connected included in the received automatic switching command, and An operation site switching method performed by an operation site switching device that transmits the automatic switching command to a terminal that switches a system to be performed, a failure detection step for detecting a system failure in the operation site, and the failure detection means A switching command transmission step of transmitting an automatic switching command including information necessary for switching a system to be connected to the terminal connected to the operation site when a failure is detected by And

本発明は、所定の運用サイトのシステムに接続し、自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替える端末に対して、前記自動切り替え命令を送信する運用サイト切り替え装置上のコンピュータに、前記運用サイトのシステムの故障を検知する故障検知ステップと、前記故障検知手段により故障を検知した際に、接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信ステップとを行わせることを特徴とする。   The present invention connects to a system of a predetermined operation site, and when receiving an automatic switching command, refers to information necessary for switching a system to be connected included in the received automatic switching command, and A failure detection step for detecting a failure of the system at the operation site is detected in the computer on the operation site switching device that transmits the automatic switching command to a terminal for switching the system to be detected, and the failure is detected by the failure detection means. In this case, a switching command transmission step of transmitting an automatic switching command including information necessary for switching a system to be connected to the terminal connected to the operation site is performed.

本発明によれば、端末から装置管理システムに対してログインした際に、システム管理サーバは、運用するサイトの装置管理システムを構成するサーバを定期的に監視して、サーバに故障等の異常が発生した場合には、切り替え先サイトにログイン可能とした後に、Webサーバからログイン中の端末に対して切り替え命令を出し、端末は、この命令を受けて、この命令に含まれる自動切り替えに必要な情報に基づき、自動切り替えを実施することができる。これにより従来のように、ロードバランサ等のログイン先を切り替えるための装置が不要となり導入コストや保守コスト等を削減することが可能となるという効果が得られる。   According to the present invention, when logging in to the device management system from the terminal, the system management server periodically monitors the servers constituting the device management system of the site to be operated, and the server has an abnormality such as a failure. If this occurs, after the login to the switching destination site is enabled, a switching command is issued from the Web server to the logged-in terminal, and the terminal receives this command and is necessary for automatic switching included in this command. Automatic switching can be performed based on the information. This eliminates the need for a device for switching login destinations such as a load balancer as in the prior art, and can reduce the introduction cost, maintenance cost, and the like.

本発明の一実施形態の構成を示すブロック図である。It is a block diagram which shows the structure of one Embodiment of this invention. 図1に示す装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the apparatus shown in FIG. 図1に示す状態ファイルの構成を示す説明図である。It is explanatory drawing which shows the structure of the state file shown in FIG.

以下、図面を参照して、本発明の一実施形態による運用サイト切り替えシステムを説明する。図1は同実施形態の構成を示すブロック図である。この図において、符号1、2、3、4は、サーバ・クライアント方式のクライアント端末(以下、端末と称する)であり、例えば、パソコンによって構成する。符号5は、ネットワークである。   Hereinafter, an operation site switching system according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the embodiment. In this figure, reference numerals 1, 2, 3 and 4 denote server / client type client terminals (hereinafter referred to as terminals), which are constituted by personal computers, for example. Reference numeral 5 denotes a network.

符号6は、管理対象装置である波長多重伝送装置の管理・運用を行う装置管理システムであり、4つのサーバから構成する。符号61は、ネットワーク5に接続されるWebサーバであり、端末1〜4のそれぞれと情報通信を行う。符号62は、アプリケーションを実行するアプリケーションサーバである。符号63は、データベースを備え、データの読み書きを行うデータベースサーバである。符号64は、各サーバの運用を管理するシステム管理サーバである。符号65は、システムの状態情報を記憶する状態ファイルである。   Reference numeral 6 denotes an apparatus management system that manages and operates a wavelength division multiplexing transmission apparatus that is a management target apparatus, and includes four servers. Reference numeral 61 denotes a Web server connected to the network 5 and performs information communication with each of the terminals 1 to 4. Reference numeral 62 denotes an application server that executes an application. Reference numeral 63 denotes a database server that includes a database and reads and writes data. Reference numeral 64 denotes a system management server that manages the operation of each server. Reference numeral 65 denotes a state file that stores system state information.

符号7は、管理対象装置である波長多重伝送装置の管理・運用を行う装置管理システムであり、4つのサーバから構成する。装置管理システム7は、装置管理システム6と同様の構成を備えており、装置管理システム6が故障した際に装置管理システム6に代わって、装置管理業務を行う。符号71は、ネットワーク5に接続されるWebサーバであり、端末1〜4のそれぞれと情報通信を行う。符号72は、アプリケーションを実行するアプリケーションサーバである。符号73は、データベースを備え、データの読み書きを行うデータベースサーバである。符号74は、各サーバの運用を管理するシステム管理サーバである。符号75は、システムの状態情報を記憶する状態ファイルである。   Reference numeral 7 denotes an apparatus management system that manages and operates a wavelength division multiplexing transmission apparatus that is a management target apparatus, and includes four servers. The device management system 7 has the same configuration as the device management system 6 and performs device management work in place of the device management system 6 when the device management system 6 fails. Reference numeral 71 denotes a Web server connected to the network 5 and performs information communication with each of the terminals 1 to 4. Reference numeral 72 denotes an application server that executes an application. Reference numeral 73 denotes a database server that includes a database and reads and writes data. Reference numeral 74 denotes a system management server that manages the operation of each server. Reference numeral 75 denotes a state file that stores system state information.

装置管理システム6は、端末1〜4に対して、Webサイトとして動作する。端末1〜4は、装置管理システム6が提供するWebサイトを用いて、装置情報の登録やパス開通を行うための操作を行う。端末1〜4では、その他に、波長多重伝送装置で構成するリンクネットワークの一元的な監視及び制御も行う。また、端末1〜4は、図示しない他のシステムと連携してサービスノード情報を含めたパスの構成や光芯線等の線路情報を把握することで、端末1〜4のユーザ(伝送路運用者)が運用する伝送路の故障対応措置を迅速化するために用いる。ここでは、装置管理システム6が通常提供するサイトを運用サイトと称する。また、装置管理システム7が提供するサイトを予備サイトと称する。   The device management system 6 operates as a Web site for the terminals 1 to 4. The terminals 1 to 4 use the Web site provided by the device management system 6 to perform operations for registering device information and opening paths. In addition, the terminals 1 to 4 also perform centralized monitoring and control of the link network configured by the wavelength multiplexing transmission apparatus. The terminals 1 to 4 cooperate with other systems (not shown) to grasp the path configuration including the service node information and the line information such as optical cores, thereby allowing the users of the terminals 1 to 4 (transmission line operators). ) Is used to speed up the failure countermeasures for the transmission line operated by Here, the site normally provided by the device management system 6 is referred to as an operation site. A site provided by the device management system 7 is referred to as a backup site.

システム管理サーバ64は、装置管理システム6を構成するサーバ(Webサーバ61、アプリケーションサーバ62、データベースサーバ63)の処理動作を監視するとともに、装置管理システム7を構成するサーバ(Webサーバ71、アプリケーションサーバ72、データベースサーバ73)の処理動作も監視する。同様に、システム管理サーバ74は、装置管理システム7を構成するサーバ(Webサーバ71、アプリケーションサーバ72、データベースサーバ73)の処理動作を監視するとともに、装置管理システム6を構成するサーバ(Webサーバ61、アプリケーションサーバ62、データベースサーバ63)の処理動作も監視する。   The system management server 64 monitors the processing operations of the servers (Web server 61, application server 62, and database server 63) that constitute the device management system 6, and at the same time the servers (Web server 71, application server) that constitute the device management system 7. 72, the processing operation of the database server 73) is also monitored. Similarly, the system management server 74 monitors the processing operations of the servers (Web server 71, application server 72, database server 73) constituting the device management system 7, and also servers (Web server 61) constituting the device management system 6. The processing operations of the application server 62 and the database server 63) are also monitored.

また、端末1〜4は、装置管理システム6、7の運用者が提供する端末であり、端末1〜4それぞれには、所定のソフトウェアが記憶装置に記憶されている。図1においては、4つの端末をそれぞれ異なるユーザ(伝送路運用者)が使用する例を示したが、端末の数は、4つに限るものではなく、5つ以上の端末をそれぞれ異なるユーザが運用するようにしてもよい。また、1ユーザが複数の端末を使用するようにしてもよい。ただし、各端末の記憶装置には、少なくとも装置管理システム6、7の運用者が提供する同一のソフトウェアが記憶されている。   The terminals 1 to 4 are terminals provided by the operators of the device management systems 6 and 7, and predetermined software is stored in the storage device in each of the terminals 1 to 4. FIG. 1 shows an example in which different users (transmission channel operators) use four terminals, but the number of terminals is not limited to four, and five or more terminals can be used by different users. You may make it operate. One user may use a plurality of terminals. However, at least the same software provided by the operators of the device management systems 6 and 7 is stored in the storage device of each terminal.

次に、図2を参照して、図1に示す端末及び各サーバの処理動作を説明する。図2は、図1に示す端末及び各サーバの処理動作を示すフローチャートである。ここでは、端末1を使用するものとして説明するが、他の端末の処理動作も同様である。まず、システム管理サーバ64は、状態確認(正常性確認と故障検知)を実行する(ステップS1)。正常性確認は、データベースサーバ63への操作(select文)が実行可能であること、ログイン先のサイトの状態がログイン可能なことを確認することである。故障検知は、Webサーバ61、アプリケーションサーバ62、データベースサーバ63のプロセスダウンとOS(Operating System)ダウンと、Webサーバ61、アプリケーションサーバ62、データベースサーバ63間のネットワーク故障、データベースサーバ63の検索エンジンの故障等である。   Next, processing operations of the terminal and each server shown in FIG. 1 will be described with reference to FIG. FIG. 2 is a flowchart showing processing operations of the terminal and each server shown in FIG. Here, although it demonstrates as what uses the terminal 1, the processing operation of another terminal is also the same. First, the system management server 64 performs state confirmation (normality confirmation and failure detection) (step S1). The normality confirmation is confirmation that an operation (select statement) to the database server 63 can be executed and that the state of the login destination site can be logged in. Failure detection includes process down and OS (Operating System) down of Web server 61, application server 62, and database server 63, network failure between Web server 61, application server 62, and database server 63, search engine of database server 63. Failure.

ログイン先のサイトの状態確認は、状態ファイル65を参照して行う。ここで、状態ファイル65について説明する。図3は、図1に示す状態ファイル65、75のテーブル構造を示す図である。図3に示すように、現状のサイト状態別に、運用サイト故障時において遷移後のサイト状態とログイン先が関係付けられている。この状態ファイルを参照することにより、現状のサイト状態を特定すれば、その後にログインするべきログイン先を特定することができる。このとき、ログイン先が「エラー」である場合は、ログインができない状態を示している。図3において、通常運用とは、全ての業務が実施可能な運用状態である。更新規制とは、更新系の業務が実施できず、監視系の業務が実施可能な運用状態である。接続規制とは、ログイン不可の運用状態である。ログイン規制とは、ログイン不可であるが、特定ユーザのみ全ての業務を実施可能な状態である。特定ユーザは、故障が回復したときの正常性の確認を行うユーザである。   The status of the login destination site is checked with reference to the status file 65. Here, the state file 65 will be described. FIG. 3 is a diagram showing a table structure of the status files 65 and 75 shown in FIG. As shown in FIG. 3, the site state after the transition and the login destination are associated with each other at the current site state when the operation site fails. By referring to this state file, if the current site state is specified, a login destination to be subsequently logged in can be specified. At this time, if the login destination is “error”, this indicates that login is not possible. In FIG. 3, the normal operation is an operation state in which all operations can be performed. The update regulation is an operation state in which an update-type job cannot be executed and a monitoring-type job can be executed. The connection restriction is an operation state in which login is not possible. The login restriction is a state in which login is impossible, but only a specific user can perform all operations. The specific user is a user who confirms normality when the failure is recovered.

次に、システム管理サーバ64は、データベースサーバ63の正常性を確認する(ステップS2)。このとき、システム管理サーバ64は、Webサーバ61、アプリケーションサーバ62を経由して、データベースサーバ63の正常性を確認する。これにより、Webサーバ61、アプリケーションサーバ62の正常性も同時に確認されることになる。続いて、システム管理サーバ64は、対象サイト(運用サイト)の状態を確認する(ステップS3)。この確認の結果、正常であれば、システム管理サーバ64は、ステップS1に戻って確認処理を定期的に行う。   Next, the system management server 64 confirms the normality of the database server 63 (step S2). At this time, the system management server 64 confirms the normality of the database server 63 via the Web server 61 and the application server 62. Thereby, the normality of the Web server 61 and the application server 62 is also confirmed at the same time. Subsequently, the system management server 64 confirms the state of the target site (operation site) (step S3). If the result of this confirmation is normal, the system management server 64 returns to step S1 and periodically performs confirmation processing.

一方、対象サイトが異常であった場合、システム管理サーバ64は、状態ファイル65を参照して切り替え先サイトの状態を変更する(ステップS4)。この状態変更処理において異常があった場合、システム管理サーバ64は、状態変更処理のリトライを所定回数繰り返す(ステップS5)。状態変更処理のリトライを行ったにもかかわらず、異常状態が継続する場合は、異常終了する(ステップS6)。   On the other hand, if the target site is abnormal, the system management server 64 refers to the status file 65 and changes the status of the switching destination site (step S4). If there is an abnormality in this state change process, the system management server 64 repeats the retry of the state change process a predetermined number of times (step S5). If the abnormal state continues despite the retry of the state change process, the process ends abnormally (step S6).

次に、状態変更処理が成功した場合、システム管理サーバ64は、端末1〜4がログイン中サイト状態を変更する(ステップS7)。この状態変更処理において異常があった場合、システム管理サーバ64は、状態変更処理のリトライを所定回数繰り返す(ステップS8)。このとき、運用の継続性を優先するため、ログイン中のサイトの状態変更に失敗しても自動切り替えを実行する。そして、システム管理サーバ64は、Webサーバ61に対してサイトの自動切り替えを命令する(ステップS9)。これを受けて、Webサーバ61は、端末1〜4に対して、サイトの自動切り替えを命令する(ステップS10)。この命令には、ログインしようとするサイト(運用サイトまたは予備サイト)の識別情報、運用サイトまたは予備サイトのIPアドレス、ログインしようとするユーザ名とパスワードで構成する自動切り替えに必要な情報が含まれる。このとき、Webサーバ61は、システム管理サーバ64から命令を受け取り、端末1〜4に対して命令を出力する機能だけは動作している必要がある。Webサーバ61において命令のやり取りができない場合は、異常終了となる。   Next, when the state change process is successful, the system management server 64 changes the site state during which the terminals 1 to 4 are logged in (step S7). If there is an abnormality in this state change process, the system management server 64 repeats the retry of the state change process a predetermined number of times (step S8). At this time, in order to prioritize continuity of operation, automatic switching is executed even if the status change of the logged-in site fails. Then, the system management server 64 instructs the Web server 61 to automatically switch sites (step S9). In response to this, the Web server 61 instructs the terminals 1 to 4 to automatically switch the site (step S10). This command includes information necessary for automatic switching consisting of identification information of a site (operation site or backup site) to be logged in, an IP address of the operation site or backup site, and a user name and password to be logged in. . At this time, the Web server 61 needs to operate only the function of receiving an instruction from the system management server 64 and outputting the instruction to the terminals 1 to 4. If the Web server 61 cannot exchange commands, the process ends abnormally.

Webサーバ61からサイトの自動切り替えを命令を受けた端末1は、対向するシステム(現状が運用サイトの装置管理システム6であれば予備サイトの装置管理システム7)の正常性を確認する(ステップS11)。ここで、端末1は、Webサーバ71を介してデータベースサーバ73への操作(例えば、select文)が実行可能であり、かつ、状態ファイル75を参照して、ログインが可能であるか否かに基づき正常性の確認を行う。この確認の結果、異常であれば、正常性確認のリトライを行う(ステップS12)。このとき、リトライ回数は予め決められた回数である。このリトライの結果、正常性が確認できない(異常)場合、異常終了する(ステップS13)。   The terminal 1 that has received a command for automatic site switching from the Web server 61 confirms the normality of the opposing system (the device management system 7 at the standby site if the current state is the device management system 6 at the operation site) (step S11). ). Here, the terminal 1 can execute an operation (for example, a select statement) to the database server 73 via the Web server 71 and can log in by referring to the state file 75. Check normality based on this. If the result of this confirmation is abnormal, normality confirmation is retried (step S12). At this time, the number of retries is a predetermined number. As a result of this retry, if normality cannot be confirmed (abnormal), the process ends abnormally (step S13).

一方、対向システムの正常性が確認できた場合、端末1は、自動切り替えに必要な情報を参照して、対向システム(ここでは、予備サイトの装置管理システム7)へログインを行い(ステップS14)、業務を継続する(ステップS15)。   On the other hand, when the normality of the opposing system is confirmed, the terminal 1 refers to the information necessary for automatic switching and logs in to the opposing system (here, the device management system 7 at the spare site) (step S14). The business is continued (step S15).

以上説明したように、端末から装置管理システムに対してログインした際に、システム管理サーバは、運用するサイトの装置管理システムを構成するサーバを定期的に監視して、サーバに故障等の異常が発生した場合には、切り替え先サイトにログイン可能とした後に、Webサーバからログイン中の端末に対して切り替え命令を出すようにした。端末は、この命令を受けて、この命令に含まれる自動切り替えに必要な情報に基づき、自動切り替えを実施する。これにより従来のように、ロードバランサ等のログイン先を切り替えるための装置が不要となり導入コストや保守コスト等を削減することが可能となる。また、任意にサイトを切り替えることが可能であり、パッチリリースなどでサーバの停止が必要な場合でも常に正常なサイトにシームレスに切り替えて業務を継続することができる。   As described above, when logging in to the device management system from a terminal, the system management server periodically monitors the servers that make up the device management system at the operating site, and the server has an abnormality such as a failure. When this occurs, after the login to the switching destination site is enabled, a switching command is issued from the Web server to the logged-in terminal. Upon receiving this command, the terminal performs automatic switching based on information necessary for automatic switching included in this command. This eliminates the need for an apparatus for switching a login destination such as a load balancer as in the prior art, and can reduce the introduction cost, the maintenance cost, and the like. In addition, it is possible to arbitrarily switch sites, and even when a server stop is necessary for patch release or the like, it is always possible to seamlessly switch to a normal site and continue operations.

なお、図1における端末及び各サーバの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりサイト自動切り替え処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。   1 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed, thereby executing site automatic processing. Switching processing may be performed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。   The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.

接続先のシステムに故障が発生した場合に、端末側で自動的に接続先を切り替えることが不可欠な用途に適用できる。   When a failure occurs in the connection destination system, it can be applied to an application in which it is essential to automatically switch the connection destination on the terminal side.

1、2、3、4・・・端末、5・・・ネットワーク、6・・・装置管理システム(運用サイト)、7・・・装置管理システム(予備サイト)、65、75・・・状態ファイル   1, 2, 3, 4 ... terminal, 5 ... network, 6 ... device management system (operation site), 7 ... device management system (preliminary site), 65, 75 ... status file

Claims (5)

所定の運用サイトのシステムに接続する端末と、
前記運用サイトを構成するWebサーバ、アプリケーションサーバ、データベースサーバのプロセスダウンとOS(Operating System)ダウンと、Webサーバ、アプリケーションサーバ、データベースサーバそれぞれを接続するネットワークの故障、データベースサーバの検索エンジンの故障を検知する故障検知手段と、
前記運用サイトと予備サイトとの現状のサイト状態別に、前記運用サイトの故障時にログインするべきログイン先の情報が関係付けられて記憶された状態ファイルと、
前記故障検知手段により故障を検知した際に、前記運用サイトと前記予備サイトとの現状のサイト状態を特定し、前記状態ファイルを参照して、前記現状のサイト状態に関係付けられているログイン先の情報を取得し、前記ログイン先である前記予備サイトに接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信手段と
を備え、
前記端末は、前記自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる前記接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替えることを特徴とする運用サイト切り替えシステム。
A terminal connected to the system of the predetermined operation site;
Web server, application server, database server process down and OS (Operating System) down, network server connecting each of the web server, application server, database server, database server search engine failure Failure detection means to detect;
According to the current site status of the operation site and the standby site, a status file in which information on login destinations to be logged in when the operation site fails is related and stored;
When a failure is detected by the failure detection unit, the current site state of the operation site and the backup site is identified, and the login destination associated with the current site state is referred to by referring to the state file Switching command transmission for transmitting to the terminal connected to the operation site an automatic switching command including information necessary for switching the system to be connected to the spare site that is the login destination Means and
When the terminal receives the automatic switching command, the terminal switches the system to be connected with reference to information necessary for switching the system to be connected included in the received automatic switching command. Operation site switching system.
所定の運用サイトのシステムに接続し、自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替える端末に対して、前記自動切り替え命令を送信する運用サイト切り替え装置であって、
前記運用サイトを構成するWebサーバ、アプリケーションサーバ、データベースサーバのプロセスダウンとOS(Operating System)ダウンと、Webサーバ、アプリケーションサーバ、データベースサーバそれぞれを接続するネットワークの故障、データベースサーバの検索エンジンの故障を検知する故障検知手段と、
前記運用サイトと予備サイトとの現状のサイト状態別に、前記運用サイトの故障時にログインするべきログイン先の情報が関係付けられて記憶された状態ファイルと、
前記故障検知手段により故障を検知した際に、前記運用サイトと前記予備サイトとの現状のサイト状態を特定し、前記状態ファイルを参照して、前記現状のサイト状態に関係付けられているログイン先の情報を取得し、前記ログイン先である前記予備サイトに接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信手段と
を備えることを特徴とする運用サイト切り替え装置。
When connecting to a system at a predetermined operation site and receiving an automatic switching command, the system to be connected is referred to by referring to information necessary for switching the system to be connected included in the received automatic switching command. An operation site switching device that transmits the automatic switching command to a switching terminal,
Web server, application server, database server process down and OS (Operating System) down, network server connecting each of the web server, application server, database server, database server search engine failure Failure detection means to detect;
According to the current site status of the operation site and the standby site, a status file in which information on login destinations to be logged in when the operation site fails is related and stored;
When a failure is detected by the failure detection unit, the current site state of the operation site and the backup site is identified, and the login destination associated with the current site state is referred to by referring to the state file Switching command transmission for transmitting to the terminal connected to the operation site an automatic switching command including information necessary for switching the system to be connected to the spare site that is the login destination An operation site switching device comprising: means.
所定の運用サイトのシステムに接続する端末と、故障検知手段と、前記運用サイトと予備サイトとの現状のサイト状態別に、前記運用サイトの故障時にログインするべきログイン先の情報が関係付けられて記憶された状態ファイルと、切り替え命令送信手段とを備える運用サイト切り替えシステムが行う運用サイト切り替え方法であって、
前記故障検知手段が、前記運用サイトを構成するWebサーバ、アプリケーションサーバ、データベースサーバのプロセスダウンとOS(Operating System)ダウンと、Webサーバ、アプリケーションサーバ、データベースサーバそれぞれを接続するネットワークの故障、データベースサーバの検索エンジンの故障を検知する故障検知ステップと、
前記切り替え命令送信手段が、前記故障検知ステップにより故障を検知した際に、前記運用サイトと前記予備サイトとの現状のサイト状態を特定し、前記状態ファイルを参照して、前記現状のサイト状態に関係付けられているログイン先の情報を取得し、前記ログイン先である前記予備サイトに接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信ステップと、
前記端末が、前記自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる前記接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替える切り替えステップと
を有することを特徴とする運用サイト切り替え方法。
Information related to login destinations to be logged in at the time of failure of the operation site is stored in association with a terminal connected to a system at a predetermined operation site, failure detection means, and current site states of the operation site and the standby site. An operation site switching method performed by an operation site switching system comprising a state file and a switching command transmission means,
The failure detection means includes a process failure and an OS (Operating System) failure of a Web server, an application server, and a database server that constitute the operation site , a failure of a network connecting the Web server, the application server, and the database server, and a database server A failure detection step for detecting a failure of the search engine of
When the switching command transmission means detects a failure in the failure detection step, it identifies the current site state between the operation site and the backup site, refers to the state file, and enters the current site state. The terminal that is connected to the operation site is provided with an automatic switching command that includes information necessary to switch the system to be connected to the backup site that is the login destination, and obtains information about the login destination that is associated A switching command transmission step to transmit to
A switching step of switching the system to be connected with reference to information necessary for switching the system to be connected included in the received automatic switching command when the terminal receives the automatic switching command; An operation site switching method characterized by comprising:
運用サイトと予備サイトとの現状のサイト状態別に、前記運用サイトの故障時にログインするべきログイン先の情報が関係付けられて記憶された状態ファイルを備え、所定の運用サイトのシステムに接続し、自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替える端末に対して、前記自動切り替え命令を送信する運用サイト切り替え装置が行う運用サイト切り替え方法であって、
前記運用サイトを構成するWebサーバ、アプリケーションサーバ、データベースサーバのプロセスダウンとOS(Operating System)ダウンと、Webサーバ、アプリケーションサーバ、データベースサーバそれぞれを接続するネットワークの故障、データベースサーバの検索エンジンの故障を検知する故障検知ステップと、
前記故障検知ステップにより故障を検知した際に、前記運用サイトと前記予備サイトとの現状のサイト状態を特定し、前記状態ファイルを参照して、前記現状のサイト状態に関係付けられているログイン先の情報を取得し、前記ログイン先である前記予備サイトに接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信ステップと
を有することを特徴とする運用サイト切り替え方法。
It is equipped with a status file that stores information related to login destinations that should be logged in when the primary site fails, according to the current site status of the primary site and backup site. When the switching command is received, the automatic switching command is transmitted to the terminal that switches the system to be connected with reference to information necessary for switching the system to be connected included in the received automatic switching command. An operation site switching method performed by the operation site switching device to transmit,
Web server, application server, database server process down and OS (Operating System) down, network server connecting each of the web server, application server, database server, database server search engine failure A failure detection step to detect;
When a failure is detected by the failure detection step, the current site state of the operation site and the backup site is identified, and the login destination associated with the current site state is referenced with reference to the state file Switching command transmission for transmitting to the terminal connected to the operation site an automatic switching command including information necessary for switching the system to be connected to the spare site that is the login destination An operation site switching method comprising the steps of:
運用サイトと予備サイトとの現状のサイト状態別に、前記運用サイトの故障時にログインするべきログイン先の情報が関係付けられて記憶された状態ファイルを備え、所定の運用サイトのシステムに接続し、自動切り替え命令を受信した際に、受信した前記自動切り替え命令に含まれる接続するべきシステムを切り替えるのに必要な情報を参照して、前記接続するべきシステムを切り替える端末に対して、前記自動切り替え命令を送信する運用サイト切り替え装置上のコンピュータに、
前記運用サイトを構成するWebサーバ、アプリケーションサーバ、データベースサーバのプロセスダウンとOS(Operating System)ダウンと、Webサーバ、アプリケーションサーバ、データベースサーバそれぞれを接続するネットワークの故障、データベースサーバの検索エンジンの故障を検知する故障検知ステップと、
前記故障検知ステップにより故障を検知した際に、前記運用サイトと前記予備サイトとの現状のサイト状態を特定し、前記状態ファイルを参照して、前記現状のサイト状態に関係付けられているログイン先の情報を取得し、前記ログイン先である前記予備サイトに接続するべきシステムを切り替えるのに必要な情報を含む自動切り替え命令を前記運用サイトに接続している前記端末に対して送信する切り替え命令送信ステップと
を行わせることを特徴とする運用サイト切り替えプログラム。
It is equipped with a status file that stores information related to login destinations that should be logged in when the primary site fails, according to the current site status of the primary site and backup site. When the switching command is received, the automatic switching command is transmitted to the terminal that switches the system to be connected with reference to information necessary for switching the system to be connected included in the received automatic switching command. To the computer on the operation site switching device to send,
Web server, application server, database server process down and OS (Operating System) down, network server connecting each of the web server, application server, database server, database server search engine failure A failure detection step to detect;
When a failure is detected by the failure detection step, the current site state of the operation site and the backup site is identified, and the login destination associated with the current site state is referenced with reference to the state file Switching command transmission for transmitting to the terminal connected to the operation site an automatic switching command including information necessary for switching the system to be connected to the spare site that is the login destination An operation site switching program characterized by causing steps to be performed.
JP2012073789A 2012-03-28 2012-03-28 Operation site switching system, operation site switching device, operation site switching method, and operation site switching program Active JP5936260B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012073789A JP5936260B2 (en) 2012-03-28 2012-03-28 Operation site switching system, operation site switching device, operation site switching method, and operation site switching program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012073789A JP5936260B2 (en) 2012-03-28 2012-03-28 Operation site switching system, operation site switching device, operation site switching method, and operation site switching program

Publications (2)

Publication Number Publication Date
JP2013206083A JP2013206083A (en) 2013-10-07
JP5936260B2 true JP5936260B2 (en) 2016-06-22

Family

ID=49525110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012073789A Active JP5936260B2 (en) 2012-03-28 2012-03-28 Operation site switching system, operation site switching device, operation site switching method, and operation site switching program

Country Status (1)

Country Link
JP (1) JP5936260B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086887A (en) * 1994-06-17 1996-01-12 Hitachi Ltd Server connection switching method
JPH09293059A (en) * 1996-04-25 1997-11-11 Hitachi Ltd Decentralized system and its operation management method
WO2004061681A1 (en) * 2002-12-26 2004-07-22 Fujitsu Limited Operation managing method and operation managing server
JP4616159B2 (en) * 2005-11-30 2011-01-19 富士通株式会社 Cluster system, load balancer, node transfer method, and node transfer program

Also Published As

Publication number Publication date
JP2013206083A (en) 2013-10-07

Similar Documents

Publication Publication Date Title
EP3288269B1 (en) Method and system for cloud storage of video, and method and system for previewing cloud-stored video
EP3210367B1 (en) System and method for disaster recovery of cloud applications
JP4695705B2 (en) Cluster system and node switching method
US8112518B2 (en) Redundant systems management frameworks for network environments
US20070270984A1 (en) Method and Device for Redundancy Control of Electrical Devices
EP2637102B1 (en) Cluster system with network node failover
US10491504B2 (en) System for support in the event of intermittent connectivity, a corresponding local device and a corresponding cloud computing platform
JP3957065B2 (en) Network computer system and management device
US20150381498A1 (en) Network system and its load distribution method
CN111049668A (en) Three-network redundant high-availability network system
CN111988347A (en) Data processing method of board jumper system and board jumper system
CN111385134A (en) Access device dynamic migration method and device access platform
JP5613119B2 (en) Master / slave system, control device, master / slave switching method, and master / slave switching program
JP5936260B2 (en) Operation site switching system, operation site switching device, operation site switching method, and operation site switching program
CN109104319B (en) Data storage device and method
JP2018056633A (en) Cluster system, server, operation method for server, and program
CN113824595B (en) Link switching control method and device and gateway equipment
JP5836177B2 (en) Operation system switching device, operation system switching method, and operation system switching program
JP5050014B2 (en) Network monitoring system
JP2007141129A (en) System switching method, computer system and program
JP5005425B2 (en) Control device return system
KR20140140719A (en) Apparatus and system for synchronizing virtual machine and method for handling fault using the same
CN109510725B (en) Communication equipment fault detection system and method
CN103023697B (en) A kind of management method, Apparatus and system of array multipath
JP2012075009A (en) Redundancy device and redundancy program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160509

R150 Certificate of patent or registration of utility model

Ref document number: 5936260

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250