JP2018018328A - Cluster system and server control program - Google Patents

Cluster system and server control program Download PDF

Info

Publication number
JP2018018328A
JP2018018328A JP2016148525A JP2016148525A JP2018018328A JP 2018018328 A JP2018018328 A JP 2018018328A JP 2016148525 A JP2016148525 A JP 2016148525A JP 2016148525 A JP2016148525 A JP 2016148525A JP 2018018328 A JP2018018328 A JP 2018018328A
Authority
JP
Japan
Prior art keywords
server
file
control unit
update
switching control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016148525A
Other languages
Japanese (ja)
Other versions
JP6702060B2 (en
Inventor
厚 大堀
Atsushi Ohori
厚 大堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2016148525A priority Critical patent/JP6702060B2/en
Publication of JP2018018328A publication Critical patent/JP2018018328A/en
Application granted granted Critical
Publication of JP6702060B2 publication Critical patent/JP6702060B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a cluster system which performs file update of an OS while suppressing influences upon services to a minimum and can be easily recovered when any problem occurs.SOLUTION: A cluster system is characterized in that, when performing file update of an OS of each server, a first server or a second server of a standby system at present uses an OS switching control part to switch a first OS or a second OS that is an OS of a stop system in the previous generation, to an active system, uses a file update control part to perform the file update of the first OS or the second OS that is switched to the active system by a previously acquired update file and, after the file update of the first OS or the second OS, uses a server switching control part to perform control for switching an operation system and the standby system of the first server and the second server. The other first server or the other second server switched to the standby system performs the file update of the OS in accordance with similar procedures.SELECTED DRAWING: Figure 1

Description

本発明は、クラスタシステム及びサーバ制御プログラムに関し、例えば、例えば、2重化冗長構成(運用系(ACT系)/待機系(SBY系))のサーバを有するクラスタシステムに適用し得るものである。   The present invention relates to a cluster system and a server control program, and can be applied to, for example, a cluster system having a server with a dual redundant configuration (active system (ACT system) / standby system (SBY system)).

近年、継続的にサービスを提供するためにクラスタシステムが広く普及している。クラスタシステムの方式としては種々の方式があるが、複数のサーバを使用して冗長化し、システムの停止時間を最小限に抑え、業務の可用性を向上させる方式としてHA(High Availability)クラスタシステムが存在する。   In recent years, cluster systems have become widespread in order to provide services continuously. There are various cluster system methods, but HA (High Availability) cluster system exists as a method to improve redundancy by using multiple servers to minimize system downtime and improve business availability. To do.

このHAクラスタシステムは、サービス提供中(以下、「ACT」系と呼ぶ)サーバで障害を検知すると、サービス未提供サーバ(以下、「SBY」系と呼ぶ)に切り替え、業務のダウンタイムを短くすることでサーバの信頼性を向上させるシステムである。   When this HA cluster system detects a failure in a service-providing server (hereinafter referred to as an “ACT” system), it switches to a service non-providing server (hereinafter referred to as an “SBY” system) and shortens the downtime of work. This is a system that improves the reliability of the server.

ところで、HAクラスタシステムのサーバは、サービスの提供中に、サーバ上のプログラムに問題(不具合等)が発生した場合は、サーバ上にインストールされているソフトウェアの更新(以下、「ファイル更新」と呼ぶ)が必要となる(例えば、特許文献1参照)。   By the way, the server of the HA cluster system updates the software installed on the server (hereinafter referred to as “file update”) when a problem (problem or the like) occurs in the program on the server while providing the service. ) Is required (see, for example, Patent Document 1).

また、通信機器等のサーバは、提供中のサービスを停止することなく、ファイル更新を行う必要がある。通常、HAクラスタシステムでファイル更新を行う場合は、まずSBY系のサーバをファイル更新した後に、ACT系のサーバとSBY系のサーバの切り替えを行い、切り替えた後にSBY系(元はACT系)のサーバのファイル更新を再度行う。このような手順を取ることで、サービスの停止時間を最小限に抑えることが可能となる。   Further, a server such as a communication device needs to update a file without stopping a service being provided. Normally, when updating a file in an HA cluster system, first update the file of the SBY server, then switch between the ACT server and the SBY server, and then switch to the SBY system (originally the ACT system). Update the server file again. By taking such a procedure, the service stop time can be minimized.

また、ファイル更新を行うサーバは、更新前に更新対象のファイルをバックアップしておくことで、もしファイル更新後に、更新したファイルのどこかで不具合が発生してしまい、ファイル更新前の状態に戻したい場合に、このバックアップしたファイルを使用して、ファイル更新前の状態に戻すことが可能である。   In addition, the server that updates the file backs up the file to be updated before the update, so if a problem occurs somewhere in the updated file after the file update, the server returns to the state before the file update. If you want, you can use this backed up file to return to the state before the file was updated.

特開2008−242679号公報JP 2008-242679 A

ところで、サーバ上のOS(Operating System)やカーネル関連のファイルについては、通常はRPM等のファイル形式でパッケージ管理されていることが多い。   By the way, the OS (Operating System) and kernel related files on the server are usually package-managed in a file format such as RPM.

しかしながら、RPMパッケージは、パッケージ単位で他のパッケージとの依存関係を持っているため、インストールは容易に行えても、アンインストールするときに、対象のパッケージが他のパッケージと依存関係にある場合には、アンインストール出来ない制限がある。この場合、サーバは、他の依存関係にあるパッケージを全てアンインストールした後に、対象のパッケージをアンインストールする必要が生じる。   However, RPM packages have dependencies with other packages on a package-by-package basis, so if the target package has dependencies with other packages when uninstalling, it can be installed easily. There is a restriction that cannot be uninstalled. In this case, the server needs to uninstall the target package after uninstalling all the other packages having the dependency relationship.

そのため、サーバは、RPMパッケージをファイル更新した後に、ファイル更新前の状態に戻す場合には、RPMパッケージの依存関係のチェックが必要となる。よって、パッケージの管理が必要となり、更新するRPMパッケージ量が膨大となった場合には、管理が非常に煩雑となってしまう懸念がある。また、サーバは、誤ったRPMファイルをインストールしてしまった場合など、場合によっては対象装置のOSの再インストールが必要になってしまう可能性もあり、容易に元の状態に戻すことが難しいという課題がある。   Therefore, when the server updates the RPM package and returns it to the state before the file update, it is necessary to check the dependency relationship of the RPM package. Therefore, when package management is required and the amount of RPM packages to be updated becomes enormous, there is a concern that management becomes very complicated. In addition, the server may need to reinstall the OS of the target device in some cases, such as when an incorrect RPM file is installed, and it is difficult to easily return to the original state. There are challenges.

そのため、サービスへの影響を最小限に抑えてOSのファイル更新を行い、更新したファイルに問題が生じた場合には容易に復旧作業を行うことができるクラスタシステム及びサーバ制御プログラムが望まれている。   Therefore, there is a demand for a cluster system and a server control program that can update the OS file while minimizing the impact on the service, and can easily perform recovery work when a problem occurs in the updated file. .

第1の本発明は、第1のサーバ及び第2のサーバを有し、前記第1のサーバ及び第2のサーバの内、いずれか一方のサーバが運用系として動作し、他方のサーバが待機系として待機するクラスタシステムにおいて、前記各サーバは、(1)運用系と待機系を切り替える制御を行うサーバ切り替え制御部と、(2)第1のOS及び第2のOSを別々の記憶領域に保持する記憶部と、(3)前記第1のOS及び第2のOSの内、いずれか一方のOSをサーバとしての基本的な機能を発揮するための起動系のOSとして起動し、もう一方のOSを停止系のOSとして停止させる制御を行うOS切り替え制御部と、(4)前記第1のOS及び第2のOSの内、いずれか一方のOSのみを最新の状態にファイル更新し、他方のOSを一世代前の状態のまま保持するファイル更新制御部とを備え、(5)前記各サーバのOSのファイル更新を行う場合に、現在待機系の第1のサーバ又は第2のサーバは、前記OS切り替え制御部を用いて、一世代前の停止系のOSである前記第1のOS又は第2のOSを、起動系に切り替え、前記ファイル更新制御部を用いて、予め取得した更新ファイルにより、起動系に切り替えた前記第1のOS又は第2のOSのファイル更新を行い、前記第1のOS又は第2のOSのファイル更新後、前記サーバ切り替え制御部を用いて、前記第1のサーバ及び第2のサーバの運用系と待機系を切り替える制御を行い、待機系に切り替わったもう一方の第1のサーバ又は第2のサーバは、切り替え前に待機系であった第1のサーバ又は第2のサーバと同様の手順により、OSのファイル更新を行うことを特徴とする。   The first aspect of the present invention includes a first server and a second server, and one of the first server and the second server operates as an active system, and the other server waits. In the cluster system that stands by as a system, each of the servers includes (1) a server switching control unit that controls switching between the active system and the standby system, and (2) the first OS and the second OS in separate storage areas. (3) one of the first OS and the second OS is booted as a booting OS for performing basic functions as a server, and the other An OS switching control unit that performs control to stop the OS of the OS as a stop OS, and (4) update only one of the first OS and the second OS to the latest state, Leave the other OS the previous generation And (5) when updating the OS file of each server, the first server or the second server currently in the standby system uses the OS switching control unit, The first OS or the second OS, which is the OS of the stop system one generation before, is switched to the boot system, and the file update control unit is used to switch to the boot system using the update file acquired in advance. Update the file of the first OS or the second OS, update the file of the first OS or the second OS, and then operate the first server and the second server using the server switching control unit The other first server or second server that has switched to the standby system is controlled in the same manner as the first server or the second server that was the standby system before switching. O And performing a file update.

第2の本発明のサーバ制御プログラムは、第1のOS及び第2のOSを別々の記憶領域に保持する記憶部を備える第1のサーバ及び第2のサーバを有し、前記第1のサーバ及び第2のサーバの内、いずれか一方のサーバが運用系として動作し、他方のサーバが待機系として待機するクラスタシステムを構成する各サーバに搭載されるコンピュータを、(1)運用系と待機系を切り替える制御を行うサーバ切り替え制御部と、(2)前記第1のOS及び第2のOSの内、いずれか一方のOSをサーバとしての基本的な機能を発揮するための起動系のOSとして起動し、もう一方のOSを停止系のOSとして停止させる制御を行うOS切り替え制御部と、(3)前記第1のOS及び第2のOSの内、いずれか一方のOSのみを最新の状態にファイル更新し、他方のOSを一世代前の状態のまま保持するファイル更新制御部として機能させ、(4)前記各サーバのOSのファイル更新を行う場合に、現在待機系の第1のサーバ又は第2のサーバは、前記OS切り替え制御部を用いて、一世代前の停止系のOSである前記第1のOS又は第2のOSを、起動系に切り替え、前記ファイル更新制御部を用いて、予め取得した更新ファイルにより、起動系に切り替えた前記第1のOS又は第2のOSのファイル更新を行い、前記第1のOS又は第2のOSのファイル更新後、前記サーバ切り替え制御部を用いて、前記第1のサーバ及び第2のサーバの運用系と待機系を切り替える制御を行い、待機系に切り替わったもう一方の第1のサーバ又は第2のサーバは、切り替え前に待機系であった第1のサーバ又は第2のサーバと同様の手順により、OSのファイル更新を行うことを特徴とする。   A server control program according to a second aspect of the present invention includes a first server and a second server each having a storage unit that holds the first OS and the second OS in separate storage areas, and the first server And the second server, one of the servers operates as an active system, and the other server stands by as a standby system. A server switching control unit that performs switching control of the system; and (2) a booting-system OS for demonstrating the basic function of either one of the first OS and the second OS as a server. And an OS switching control unit that performs control to stop the other OS as a stop OS, and (3) only one of the first OS and the second OS is the latest Phi to state Update and function as a file update control unit that keeps the other OS in the state of the previous generation, and (4) when updating the file of the OS of each server, The server of 2 uses the OS switching control unit to switch the first OS or the second OS, which is the stop system OS one generation before, to the startup system, and uses the file update control unit. Update the file of the first OS or the second OS switched to the active system using the update file acquired in advance, and use the server switching control unit after updating the file of the first OS or the second OS. Thus, control is performed to switch the active system and the standby system of the first server and the second server, and the other first server or second server that has switched to the standby system is a standby system before switching. First By a procedure similar to the server or the second server, and performs the file update of the OS.

本発明によれば、サービスへの影響を最小限に抑えてOSのファイル更新を行い、更新したファイルに問題が生じた場合には容易に復旧作業を行うことができる。   According to the present invention, it is possible to update an OS file while minimizing the influence on the service, and to easily perform a recovery operation when a problem occurs in the updated file.

実施形態の記憶部の詳細構成を示すブロック図である。It is a block diagram which shows the detailed structure of the memory | storage part of embodiment. 実施形態のクラスタシステムの構成及びサーバの内部構成を示すブロック図である。It is a block diagram which shows the structure of the cluster system of embodiment, and the internal structure of a server. 実施形態のサーバの制御系の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the control system of the server of embodiment. 実施形態のクラスタシステムを構成する各サーバのOS関連ファイルの更新動作を示す説明図である。It is explanatory drawing which shows the update operation | movement of the OS related file of each server which comprises the cluster system of embodiment. 実施形態のクラスタシステムを構成する各サーバのOS関連ファイルの戻し動作を示す説明図であるIt is explanatory drawing which shows return operation | movement of the OS related file of each server which comprises the cluster system of embodiment. 実施形態のクラスタシステムの各サーバのOSの版(バージョン)が、ファイル更新(アップデート)、及びファイル戻し(ダウングレード)を実行する毎に変化する様子をイメージ化した説明図である。It is explanatory drawing which imaged a mode that the version (version) of each server of the cluster system of embodiment changed whenever file update (update) and file return (downgrade) were performed.

(A)主たる実施形態
以下、本発明によるクラスタシステム及びサーバ制御プログラムの実施形態を、図面を参照しながら詳述する。
(A) Main Embodiments Hereinafter, embodiments of a cluster system and a server control program according to the present invention will be described in detail with reference to the drawings.

(A−1)実施形態の構成
(A−1−1)全体構成
図2は、この実施形態のクラスタシステムの構成及びサーバの内部構成を示すブロック図である。
(A-1) Configuration of Embodiment (A-1-1) Overall Configuration FIG. 2 is a block diagram showing the configuration of the cluster system and the internal configuration of the server according to this embodiment.

図2において、クラスタシステム1は、2台のサーバ10(サーバ10−1及びサーバ10−2)を有して構成されるものである。以下、サーバ10−1を、単に「第1サーバ」と呼ぶときもある。同様に、サーバ10−2を、「第2サーバ」と呼ぶときもある。   In FIG. 2, the cluster system 1 includes two servers 10 (server 10-1 and server 10-2). Hereinafter, the server 10-1 may be simply referred to as a “first server”. Similarly, the server 10-2 is sometimes referred to as a “second server”.

第1サーバ及び第2サーバは、様々なサービスを提供するものであり、例えばIP電話サービスの管理、制御を行うSIPサーバ等の種々の業務サービスを提供するサーバが該当する。また、第1サーバ及び第2サーバのハードウェア構成は、一般的な情報処理装置と同じ構成を有しており、ソフトウェア構成としては、例えば、Linux(登録商標)、UNIX(登録商標)、Windows(登録商標)等をOSとするものが該当する。   The first server and the second server provide various services. For example, a server that provides various business services such as an SIP server that manages and controls an IP telephone service is applicable. The hardware configuration of the first server and the second server has the same configuration as that of a general information processing apparatus. Examples of software configurations include Linux (registered trademark), UNIX (registered trademark), and Windows. Applicable to those using (registered trademark) as an OS.

さらに、第1サーバ及び第2サーバは、HAクラスタシステムの構成サーバであるから、双方とも同じ機能を備えるものであり、相互に死活監視を行っている。運用系(ACT系)サーバに障害が生じた場合には、待機系(SBY系)サーバへの切り替え処理が行われる。   Furthermore, since the first server and the second server are constituent servers of the HA cluster system, both have the same function, and perform alive monitoring with each other. When a failure occurs in the active system (ACT system) server, a switching process to the standby system (SBY system) server is performed.

(A−1−2)サーバの詳細な構成
図2に示すように、本実施形態に係るサーバ10(10−1、10−2)は、CPU11(11−1、11−2)、メモリ12(12−1、12−2)、記憶部13(13−1、13−2)、及び通信部14(14−1、14−2)を少なくとも備える。なお、以下では、2台のサーバ10(10−1、10−2)の共通する処理を説明する場合においては、符号の枝番を省略して説明する。
(A-1-2) Detailed Configuration of Server As shown in FIG. 2, the server 10 (10-1, 10-2) according to the present embodiment includes a CPU 11 (11-1, 11-2), a memory 12 (12-1, 12-2), storage unit 13 (13-1, 13-2), and communication unit 14 (14-1, 14-2). In the following description, in the case of explaining a process common to the two servers 10 (10-1, 10-2), the branch number of the code is omitted.

CPU11は、サーバ10の演算処理装置である。   The CPU 11 is an arithmetic processing device of the server 10.

メモリ12は、サーバ10のメインメモリ(揮発性メモリ)である。メモリ12は、記憶部13から読み込んだプログラムが展開され、CPU11により実行される領域である。   The memory 12 is a main memory (volatile memory) of the server 10. The memory 12 is an area where the program read from the storage unit 13 is expanded and executed by the CPU 11.

通信部14は、例えば、図示しないIPネットワークに接続するインタフェースであり、パケットの送受信をして通信する部分である。   The communication unit 14 is, for example, an interface connected to an IP network (not shown), and is a part that communicates by transmitting and receiving packets.

記憶部13は、CPU11により実行される処理プログラムや、情報処理に必要な各種情報等を記憶するものである。記憶部13は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及びフラッシュメモリ等の不揮発性の記憶装置を適用することができる。   The storage unit 13 stores a processing program executed by the CPU 11, various information necessary for information processing, and the like. As the storage unit 13, for example, a nonvolatile storage device such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), or a flash memory can be applied.

図1は、記憶部の詳細構成を示すブロック図である。図1において、記憶部13は、5つのパーティションに分割されており、第1のパーティションから順に、ブートローダ131、第1のサーバOS132、第2のサーバOS133、アプリケーション134、及びその他135が格納されている。なお、図1の構成例は、一例であって、記憶部13内のパーティション分割方法、及び各パーティションに格納されるプログラムについてはこれに限定されるものではない。   FIG. 1 is a block diagram illustrating a detailed configuration of the storage unit. In FIG. 1, the storage unit 13 is divided into five partitions, and a boot loader 131, a first server OS 132, a second server OS 133, an application 134, and others 135 are stored in order from the first partition. Yes. The configuration example of FIG. 1 is an example, and the partition division method in the storage unit 13 and the program stored in each partition are not limited thereto.

ブートローダ131は、サーバ10の電源投入時(再起動時を含む)に最初に起動されるものであり、第1のサーバOS132、又は第2のサーバOS133のいずれかを選択してOSを起動させる。例えば、ブートローダ131は、grub等に相当するプログラムである。   The boot loader 131 is activated first when the server 10 is powered on (including when it is restarted), and selects either the first server OS 132 or the second server OS 133 to activate the OS. . For example, the boot loader 131 is a program corresponding to grub or the like.

第1のサーバOS132及び第2のサーバOS133は、サーバ本来としての基本的な機能を発揮させるためのプログラムである。第1のサーバOS132及び第2のサーバOS133は、Linux、UNIX、及びWindows等が該当する。なお、この実施形態では、ブートローダ131により選択されて起動しているサーバ10のOS(第1のサーバOS132、又は第2のサーバOS133のいずれか)を「起動系」と呼び、もう一方の起動していないOSを「停止系」と呼ぶものとする。また、OS関連のファイルは、RPM等のパッケージ形式で管理されていても良いし、個別に管理されていても良い(この実施形態では、OS関連のファイルは、パッケージ形式で管理されているものとする)。   The first server OS 132 and the second server OS 133 are programs for demonstrating the basic functions inherent to the server. The first server OS 132 and the second server OS 133 correspond to Linux, UNIX, Windows, and the like. In this embodiment, the OS (either the first server OS 132 or the second server OS 133) of the server 10 that is selected and started by the boot loader 131 is referred to as a “boot system”, and the other boot An OS that has not been executed is referred to as a “stop system”. Further, the OS-related file may be managed in a package format such as RPM, or may be managed individually (in this embodiment, the OS-related file is managed in the package format). And).

アプリケーション134は、第1のサーバOS132、又は第2のサーバOS133が共通に使用するアプリケーションプログラムである。例えば、アプリケーション134は、サーバ10が、SIPサーバとして機能する場合には、SIPサーバとして機能させるプログラムが該当する。また、サーバ10が、データベースサーバとして機能する場合には、データベースサーバとして機能させるプログラムが該当する。   The application 134 is an application program that is commonly used by the first server OS 132 or the second server OS 133. For example, the application 134 corresponds to a program that causes the server 10 to function as a SIP server when the server 10 functions as a SIP server. Further, when the server 10 functions as a database server, a program for causing the server 10 to function as a database server is applicable.

その他135は、第1のサーバOS132、又は第2のサーバOS133が共通に使用する領域であって、例えば、第1のサーバOS132、及び第2のサーバOS133のログを記憶させる領域である。例えば、第1のサーバOS132、及び第2のサーバOS133が、Linuxであれば、tmpディレクトリが該当する。   The other 135 is an area used in common by the first server OS 132 or the second server OS 133, and is an area for storing, for example, logs of the first server OS 132 and the second server OS 133. For example, if the first server OS 132 and the second server OS 133 are Linux, the tmp directory is applicable.

図3は、サーバ10の制御系の機能的構成を示すブロック図である。   FIG. 3 is a block diagram illustrating a functional configuration of the control system of the server 10.

図3において、サーバ10は、制御部100を有する。この実施形態では、制御部100は、記憶部13に記憶されたOSを含む種々のプログラムをメモリ12に展開し、CPU11により各プログラムを実行することにより実現されるが、実現方法はこれに限らず、サーバ10のソフトウェア構成部の一部をハードウェアで実現しても良い(又はその逆でも良い)。いずれの手法で実現したとしても、サーバ10の制御系の構成は、図3で示すものである。   In FIG. 3, the server 10 includes a control unit 100. In this embodiment, the control unit 100 is realized by developing various programs including the OS stored in the storage unit 13 in the memory 12 and executing each program by the CPU 11, but the implementation method is not limited thereto. Instead, a part of the software configuration unit of the server 10 may be realized by hardware (or vice versa). Regardless of which method is used, the configuration of the control system of the server 10 is as shown in FIG.

制御部100は、サーバ10の機能を制御するものであり、本実施形態の特徴部分として、サーバ切り替え制御部101、OS切り替え制御部102、及びファイル更新制御部103を備える。   The control unit 100 controls the function of the server 10, and includes a server switching control unit 101, an OS switching control unit 102, and a file update control unit 103 as characteristic parts of the present embodiment.

サーバ切り替え制御部101は、サーバ10(10−1、10−2)をSBY系からACT系(又はその逆)に切り替える制御を行う。例えば、サーバ10−2(SBY系)のサーバ切り替え制御部101は、サーバ10−1(ACT系)の障害を検知した場合には、サーバ10−2をSBY系からACT系に切り替える制御を行う。また、サーバ切り替え制御部101は、第1のサーバOS132、又は第2のサーバOS133のファイル更新を行う場合にも実行される(詳しい動作は、後述する)。   The server switching control unit 101 performs control to switch the server 10 (10-1, 10-2) from the SBY system to the ACT system (or vice versa). For example, when the server switching control unit 101 of the server 10-2 (SBY system) detects a failure of the server 10-1 (ACT system), the server 10-2 performs control to switch the server 10-2 from the SBY system to the ACT system. . The server switching control unit 101 is also executed when updating the file of the first server OS 132 or the second server OS 133 (detailed operation will be described later).

OS切り替え制御部102は、サーバ10のOSを、第1のサーバOS132、又は第2のサーバOS133に切り替える制御を行うもの(先述のブートローダ131に相当するもの)である。この実施形態では、OS切り替え制御部102は、第1のサーバOS132及び第2のサーバOS133のファイル更新(アップデート)に伴い実行される(詳しい動作は、後述する)。   The OS switching control unit 102 performs control to switch the OS of the server 10 to the first server OS 132 or the second server OS 133 (corresponding to the boot loader 131 described above). In this embodiment, the OS switching control unit 102 is executed along with file update (update) of the first server OS 132 and the second server OS 133 (detailed operations will be described later).

ファイル更新制御部103は、OS(第1のサーバOS132及び第2のサーバOS133)及びアプリケーションのファイル更新(アップデート)の制御を行うものである。例えば、ファイル更新制御部103は、通信部14を介して、アプリケーション134のファイル更新の要求を外部から受信した場合には、図示しないファイル配信サーバから更新ファイルをダウンロードし、アプリケーション134のアップデートを行う。なお、更新ファイルは、例えば、USBを介してサーバ10へ提供されても良い。   The file update control unit 103 controls file update (update) of the OS (first server OS 132 and second server OS 133) and applications. For example, when a file update request for the application 134 is received from the outside via the communication unit 14, the file update control unit 103 downloads an update file from a file distribution server (not shown) and updates the application 134. . The update file may be provided to the server 10 via USB, for example.

次に、本実施形態の特徴部分であるOSのファイル更新手順の説明を行う。   Next, the OS file update procedure, which is a characteristic part of the present embodiment, will be described.

OSのファイル更新は、クラスタシステム1の2台のサーバ10(第1サーバ、第2サーバ)の内、SBY系のサーバ10から実行される。例えば、第1サーバがACT系で、第2サーバがSBY系の場合には、第2サーバからOSのファイル更新が実行される。   The OS file update is executed from the SBY server 10 out of the two servers 10 (first server and second server) of the cluster system 1. For example, when the first server is an ACT system and the second server is an SBY system, OS file update is executed from the second server.

また、この実施形態では、第1サーバ及び第2サーバは、各々、二つのOS(第1のサーバOS132及び第2のサーバOS133)を備える構成であり、いずれかのOSが起動系として動作し、もう一方のOSが停止系の状態となっている。SBY系の第2サーバは、停止系のOS(停止系のOSを起動系に切り替えて)からファイル更新を行う。例えば、第1のサーバOS132が起動系で、第2のサーバOS133が停止系であるものとする。この場合、SBY系の第2サーバのOS切り替え制御部102は、第2のサーバOS133を起動系(第1のサーバOS132を停止系)に切り替える。切り替え後、ファイル更新制御部103は、通信部を介して、図示しない配信サーバから予め取得したOS関連のファイルを用いて、第2のサーバOS133(起動系)のアップデートを行う。   In this embodiment, each of the first server and the second server is configured to include two OSs (a first server OS 132 and a second server OS 133), and one of the OSs operates as a startup system. The other OS is in a stopped state. The second SBY server updates the file from the stop OS (switching the stop OS to the start OS). For example, it is assumed that the first server OS 132 is a start system and the second server OS 133 is a stop system. In this case, the OS switching control unit 102 of the SBY second server switches the second server OS 133 to the start system (the first server OS 132 is the stop system). After the switching, the file update control unit 103 updates the second server OS 133 (boot system) using an OS-related file acquired in advance from a distribution server (not shown) via the communication unit.

ここまでの処理により、SBY系の第2サーバの第2のサーバOS133(起動系)は、最新のバージョンとなる。一方、第1のサーバOS132は、最新から一世代前のバージョンのままである。このように、サーバ10は、OSのファイル更新が実行されるごとに、第1のサーバOS132又は第2のサーバOS133のいずれかを更新することになるために、言い換えれば、異なるOSのバージョンを常に保持することになる。一般的に、最新のバージョンは、不具合を伴う可能性も高い。よって、これ以前に起動系として動作していた1世代前のOSを保持(バックアップ)することは、不具合を治癒する手段として有効である。この実施形態では、最新のバージョンのOSに不具合が見つかった場合には、1世代前のOSである停止系のOS(第1のサーバOS132又は第2のサーバOS133のいずれか)を、OS切り替え制御部102の切り替え制御により起動系に切り替えるだけで、不具合の存在しないOS(1世代前のOS)に戻すことが可能である。   By the processing so far, the second server OS 133 (boot system) of the SBY second server becomes the latest version. On the other hand, the first server OS 132 remains the version one generation before the latest. As described above, the server 10 updates either the first server OS 132 or the second server OS 133 every time the OS file update is executed. Will always hold. In general, the latest version is likely to be defective. Therefore, maintaining (backup) the previous generation OS that had been operating as the boot system before this is effective as a means for healing the problem. In this embodiment, when a problem is found in the latest version of the OS, the OS of the stopped system (either the first server OS 132 or the second server OS 133) that is the previous generation OS is switched to OS. It is possible to return to an OS that does not have a problem (an OS before one generation) by simply switching to the startup system by switching control of the control unit 102.

SBY系の第2サーバのOSファイル更新が終了した後、サーバ切り替え制御部101の制御により、第2サーバをACT系として、第1サーバをSBY系とする。   After the OS file update of the second SBY server is completed, the second server is set as the ACT system and the first server is set as the SBY system under the control of the server switching control unit 101.

そして、ACT系からSBY系となった第1サーバについても、上記第2サーバで示した同様の手順により、第1のサーバOS132又は第2のサーバOS133のいずれかのファイル更新を行う。   Then, for the first server that is changed from the ACT system to the SBY system, the file update of either the first server OS 132 or the second server OS 133 is performed according to the same procedure shown for the second server.

(A−2)実施形態の動作
次に、以上のような構成を有する実施形態のクラスタシステム1の動作を説明する。
(A-2) Operation | movement of embodiment Next, operation | movement of the cluster system 1 of embodiment which has the above structures is demonstrated.

(A−2−1)OSファイルの更新動作(アップデート)
図4は、クラスタシステムを構成する各サーバのOS関連ファイルの更新動作を示す説明図である。図4において、左半分のステップS1、S4、S6、S7は、第1サーバ(サーバ10−1)の状態を示している。また、図4において、右半分のステップS2、S3、S5、S8は、第2サーバ(サーバ10−2)の状態を示している。なお、ステップS1及びS2は、第1サーバ及び第2サーバの初期状態を示しており、実際のファイル更新の動作はステップS3から開始される。なお、この実施形態では、OSをアップデートする更新ファイルは、予め配信サーバからダウンロードし、記憶部13内(例えば、その他135−1、135−2)に保持されているものとする。
(A-2-1) OS file update operation (update)
FIG. 4 is an explanatory diagram showing the update operation of the OS related file of each server constituting the cluster system. In FIG. 4, steps S1, S4, S6, and S7 on the left half indicate the state of the first server (server 10-1). In FIG. 4, steps S2, S3, S5, and S8 in the right half indicate the state of the second server (server 10-2). Steps S1 and S2 indicate the initial states of the first server and the second server, and the actual file update operation starts from step S3. In this embodiment, it is assumed that an update file for updating the OS is downloaded in advance from the distribution server and held in the storage unit 13 (for example, the other 135-1, 135-2).

クラスタシステム1において、第1サーバがACT系であって、第2サーバがSBY系である(S1、S2)。また、第1サーバは、第1のサーバOS132−1が起動系として起動している。同様に、第2サーバは、第1のサーバOS132−2が起動系として起動している。   In the cluster system 1, the first server is an ACT system and the second server is an SBY system (S1, S2). In addition, the first server is activated by the first server OS 132-1 as the activation system. Similarly, in the second server, the first server OS 132-2 is activated as the activation system.

第2サーバ(SBY系)のOS切り替え制御部102は、OSを第1のサーバOS132−2から第2のサーバOS133−2へ切り替える制御(リブート)を行う(S3)。切り替え後、第2サーバ(SBY系)のファイル更新制御部103は、予め所得した更新ファイルを用いて、OSのアップデートを行う。   The OS switching control unit 102 of the second server (SBY system) performs control (reboot) to switch the OS from the first server OS 132-2 to the second server OS 133-2 (S3). After the switching, the file update control unit 103 of the second server (SBY system) updates the OS using the update file that has been obtained in advance.

一方、第2サーバ(SBY系)がOSをアップデータしている間、第1サーバ(ACT系)は、運用サーバとして稼働している(S4)。   On the other hand, while the second server (SBY system) updates the OS, the first server (ACT system) operates as an operation server (S4).

先述のステップS3の処理の後(第2のサーバOS133−2のファイル更新後)、第2サーバ(SBY系)のサーバ切り替え制御部101は、第2サーバをACT系として、第1サーバをSBY系とするサーバの切り替え制御を行う(S5、S6)。   After the processing in step S3 described above (after updating the file of the second server OS 133-2), the server switching control unit 101 of the second server (SBY system) sets the second server as the ACT system and the first server as the SBY. Switching control of servers to be used is performed (S5, S6).

ACT系からSBY系に切り替わった第1サーバは、先述のステップS3と同様の手順によりファイル更新を行う(S7)。具体的には、第1サーバ(SBY系)のOS切り替え制御部102は、OSを第1のサーバOS132−1から第2のサーバOS133−1へ切り替える制御(リブート)を行う。切り替え後、第1サーバ(SBY系)のファイル更新制御部103は、予め所得した更新ファイルを用いて、OSのアップデートを行う。   The first server switched from the ACT system to the SBY system updates the file by the same procedure as in step S3 described above (S7). Specifically, the OS switching control unit 102 of the first server (SBY system) performs control (reboot) to switch the OS from the first server OS 132-1 to the second server OS 133-1. After the switching, the file update control unit 103 of the first server (SBY system) updates the OS using the update file that has been obtained in advance.

一方、第1サーバ(SBY系)がOSをアップデータしている間、第2サーバ(ACT系)は、運用サーバとして稼働している(S8)。   On the other hand, while the first server (SBY system) updates the OS, the second server (ACT system) operates as an operation server (S8).

(A−2−2)OSファイルの戻し動作(ダウングレード)
次に、クラスタシステム1の各サーバ(第1サーバ、第2サーバ)OS更新後、更新したファイルの不具合(バグ)により、各サーバのOSを更新前の状態に復旧させる処理について説明する。
(A-2-2) OS file return operation (downgrade)
Next, a process for restoring the OS of each server to the pre-update state due to a defect (bug) of the updated file after updating each server (first server, second server) OS of the cluster system 1 will be described.

図5は、クラスタシステムを構成する各サーバのOS関連ファイルの戻し動作を示す説明図である。図5において、左半分のステップS9、S11、S14は、第1サーバ(サーバ10−1)の状態を示している。また、図5において、右半分のステップS10、S12、S13は、第2サーバ(サーバ10−2)の状態を示している。なお、図5のステップS9からの処理は、先述のステップS8から続く処理である。すなわち、S9の直前のクラスタシステムは、第1サーバがSBY系であって、第2サーバがACT系である。また、第1サーバは、ファイル更新済み(最新版)の第2のサーバOS133−1が、起動系として動作している。同様に、第2サーバは、ファイル更新済み(最新版)の第2のサーバOS133−2が起動系として動作している。なお、第1サーバの停止系の第1のサーバOS132−1は、不具合の最新版から1世代前のOS(言い換えれば、不具合の無い安定した版)である。第2サーバの停止系の第1のサーバOS132−2も同様である。   FIG. 5 is an explanatory diagram showing the return operation of the OS-related file of each server constituting the cluster system. In FIG. 5, steps S9, S11, and S14 on the left half indicate the state of the first server (server 10-1). In FIG. 5, steps S10, S12, and S13 in the right half indicate the state of the second server (server 10-2). The process from step S9 in FIG. 5 is a process that continues from step S8 described above. That is, in the cluster system immediately before S9, the first server is the SBY system and the second server is the ACT system. In the first server, the file updated (latest version) second server OS 133-1 is operating as a startup system. Similarly, in the second server, the file updated (latest version) second server OS 133-2 operates as a startup system. The first server OS 132-1 of the stop system of the first server is an OS one generation before the latest version of the problem (in other words, a stable version without a problem). The same applies to the first server OS 132-2 in the stop system of the second server.

第1サーバ(SBY系)のOS切り替え制御部102は、OSを第2のサーバOS133−1から、第1のサーバOS132−1へ切り替える制御(リブート)を行う(S9)。このOS切り替え処理により、第2サーバ(SBY系)のOSは、安定的な一世代前のOS(ダウングレードしたOS)となる。   The OS switching control unit 102 of the first server (SBY system) performs control (reboot) to switch the OS from the second server OS 133-1 to the first server OS 132-1 (S9). By this OS switching process, the OS of the second server (SBY system) becomes a stable previous generation OS (downgraded OS).

一方、第1サーバ(SBY系)がOSをダウングレードしている間、第2サーバ(ACT系)は、運用サーバとして稼働している(S10)。   On the other hand, while the first server (SBY system) is downgrading the OS, the second server (ACT system) is operating as an operation server (S10).

先述のステップS9の処理の後、第1サーバ(SBY系)のサーバ切り替え制御部101は、第1サーバをACT系として、第2サーバをSBY系とするサーバの切り替え制御を行う(S11、S12)。   After the processing in step S9 described above, the server switching control unit 101 of the first server (SBY system) performs switching control of the server in which the first server is the ACT system and the second server is the SBY system (S11, S12). ).

ACT系からSBY系に切り替わった第2サーバは、先述のステップS9と同様の手順によりダウングレードを行う(S13)。具体的には、第2サーバ(SBY系)のOS切り替え制御部102は、OSを第2のサーバOS133−2から、第1のサーバOS132−2へ切り替える制御(リブート)を行う。   The second server that has been switched from the ACT system to the SBY system performs the downgrade by the same procedure as in step S9 described above (S13). Specifically, the OS switching control unit 102 of the second server (SBY system) performs control (reboot) to switch the OS from the second server OS 133-2 to the first server OS 132-2.

一方、第2サーバ(SBY系)がOSをダウングレードしている間、第1サーバ(ACT系)は、運用サーバとして稼働している(S14)。   On the other hand, while the second server (SBY system) downgrades the OS, the first server (ACT system) operates as an operation server (S14).

以上により、クラスタシステム1の第1サーバ及び第2サーバは、1世代前の安定的なOSで起動している状態となる。   As described above, the first server and the second server of the cluster system 1 are in a state of being started up by a stable OS one generation before.

なお、復旧完了後、バグの存在する第2のサーバOS133(OS133−1、OS133−2)について、第1サーバ及び第2サーバは、第1のサーバOS132(OS132−1、OS132−2)内容に書き換える処理(例えば、ディスクコピー)を行っても良い。   In addition, about the 2nd server OS133 (OS133-1, OS133-2) where a bug exists after the restoration is completed, the first server and the second server are the contents of the first server OS132 (OS132-1, OS132-2). Rewriting (for example, disk copy) may be performed.

(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
(A-3) Effects of Embodiment According to this embodiment, the following effects can be achieved.

クラスタシステム1の各サーバ10は、記憶部13内の各パーティションに2個のOS(第1のサーバOS132、第2のサーバOS133)を設けることにより、一方のOSをファイル更新により最新版とし、他方のOSを1世代前の状態で保持することが可能となった。   Each server 10 of the cluster system 1 is provided with two OSs (first server OS 132 and second server OS 133) in each partition in the storage unit 13, so that one OS is updated to the latest version by file update, It became possible to hold the other OS in a state one generation before.

これにより、例えば、最新版としたOSのファイルに不具合が生じた場合には、各サーバ10は、OS切り替え制御部102により、1世代前のOSに切り替える(リブート)ことにより、容易に復旧できる。つまり、サーバ10は、OSのファイルをパッケージ単位で管理していた場合においても、不具合のあるパッケージ(ファイル)と他のパッケージとの依存関係を考慮する必要無く(また、再インストールする必要も無く)容易に復旧することができる。以下、図6を挙げて説明する。   Thereby, for example, when a problem occurs in the latest OS file, each server 10 can be easily recovered by switching (rebooting) the OS to the previous generation by the OS switching control unit 102. . That is, even when the OS 10 manages OS files in units of packages, the server 10 does not need to consider the dependency between a defective package (file) and another package (and does not need to be reinstalled). ) Can be recovered easily. Hereinafter, a description will be given with reference to FIG.

図6は、クラスタシステムの各サーバのOSの版(バージョン)が、ファイル更新(アップデート)、及びファイル戻し(ダウングレード)を実行する毎に変化する様子をイメージ化した説明図である。なお、図6では、サーバ10の記憶部13内の第1のサーバOS132及び第2のサーバOS133のみ図示している。   FIG. 6 is an explanatory diagram showing an image of how the OS version of each server in the cluster system changes each time file update (update) and file return (downgrade) are executed. In FIG. 6, only the first server OS 132 and the second server OS 133 in the storage unit 13 of the server 10 are illustrated.

図6(A)では、初期状態であるため、各サーバ10の第1のサーバOS132及び第2のサーバOS133のOSのバージョンは、「V1」で同一である。   In FIG. 6A, since it is an initial state, the OS versions of the first server OS 132 and the second server OS 133 of each server 10 are the same as “V1”.

図6(B)では、第2のサーバOS133を更新したために、起動している第2のサーバOS133のOSのバージョンは、「V2」となる。一方、停止した第1のサーバOS132のOSのバージョンは、「V1」のままである。   In FIG. 6B, since the second server OS 133 is updated, the OS version of the activated second server OS 133 is “V2”. On the other hand, the OS version of the stopped first server OS 132 remains “V1”.

図6(C)では、第1のサーバOS132を更新したために、起動している第1のサーバOS132のOSのバージョンは、「V3」となる。一方、停止した第2のサーバOS133のOSのバージョンは、「V2」のままである。   In FIG. 6C, since the first server OS 132 is updated, the OS version of the activated first server OS 132 is “V3”. On the other hand, the OS version of the stopped second server OS 133 remains “V2”.

ここで、第1のサーバOS132のOS(V3)に不具合の混入が認められると、起動しているOSを切り替えることになる。そうすると、図6(D)では、起動している第2のサーバOS133のOSのバージョンは、「V2」である。一方、停止した第1のサーバOS132のOSのバージョンは、不具合のある「V3」のままである。   Here, when a trouble is recognized in the OS (V3) of the first server OS 132, the operating OS is switched. Then, in FIG. 6D, the OS version of the activated second server OS 133 is “V2”. On the other hand, the OS version of the stopped first server OS 132 remains “V3” having a problem.

図6(E)では、不具合のあるV3を除去するために、停止している第1のサーバOS132のOSのバージョンを、「V3→V2」とする(V2の第2のサーバOS133をコピーする)。これにより、サーバ10は、通常通りアップデータすることが可能となる。   In FIG. 6E, in order to remove the defective V3, the OS version of the stopped first server OS 132 is changed to “V3 → V2” (the second server OS 133 of V2 is copied). ). As a result, the server 10 can update data as usual.

図6(F)では、第1のサーバOS132を更新したために、起動している第1のサーバOS132のOSのバージョンは、「V4」となる。一方、停止した第2のサーバOS133のOSのバージョンは、「V2」のままである。   In FIG. 6F, since the first server OS 132 is updated, the OS version of the activated first server OS 132 is “V4”. On the other hand, the OS version of the stopped second server OS 133 remains “V2”.

以上、本実施形態のクラスタシステム1は、更新したOSに不具合が生じたとしても、容易に不具合の存在しない状態に短時間に復旧することができ、サービスに影響を与えること無くシステムを運用することができる。   As described above, the cluster system 1 according to the present embodiment can easily recover to a state in which a defect does not exist even if a problem occurs in the updated OS, and operates the system without affecting the service. be able to.

(B)他の実施形態
本発明は、上記実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(B) Other Embodiments The present invention is not limited to the above-described embodiments, and may include modified embodiments as exemplified below.

(B−1)上記実施形態では、ファイル更新制御部103によりOSのファイル更新を行う際、各サーバ10は、OS切り替え制御部102を用いて、現在停止系のOS(第1のサーバOS132又は第2のサーバOS133)を起動系に切り替えた後、ファイル更新する処理を行っていた(図4のステップS3、S7)。変形例として、ファイル更新制御部103が、現在起動しているOSだけでは無く、現在停止しているOSのファイル更新も実行できる場合には、各サーバ10は、停止系のOS(第1のサーバOS132又は第2のサーバOS133)のファイル更新を実行した後、OS切り替え制御部102を用いて、現在停止系のOS(第1のサーバOS132又は第2のサーバOS133)を起動系に切り替ても良い。   (B-1) In the above embodiment, when OS file update is performed by the file update control unit 103, each server 10 uses the OS switching control unit 102 to use the currently stopped OS (first server OS 132 or After switching the second server OS 133) to the active system, a file update process was performed (steps S3 and S7 in FIG. 4). As a modified example, when the file update control unit 103 can execute not only the currently activated OS but also the file update of the currently stopped OS, each server 10 is configured as a stopped OS (first After executing the file update of the server OS 132 or the second server OS 133), the OS switching control unit 102 is used to switch the currently stopped OS (the first server OS 132 or the second server OS 133) to the active system. Also good.

(B−2)上記実施形態では、各サーバ10は、2個のOS(第1のサーバOS132及び第2のサーバOS133)を用いてファイル更新を行う例を示した。変形例として、各サーバ10は、3個以上のOSを用いてファイル更新を行っても良い。例えば、3個のOSを所持している場合には、ファイル更新を行うと、起動系のOSと、第1の停止系OS、及び第2の停止系OSについて、それぞれ異なるバージョンのOSを所持することになる。つまり、起動系のOSに不具合が生じた場合には、最新の不具合の存在するバージョンから1世代前だけでなく、2世代前のOSに切り替えることができる。   (B-2) In the above-described embodiment, each server 10 performs the file update using two OSs (the first server OS 132 and the second server OS 133). As a modification, each server 10 may perform file update using three or more OSs. For example, if you have three OSs, when you update a file, you have different versions of the operating system, the first operating system, and the second operating system. Will do. That is, when a problem occurs in the booting OS, it is possible to switch from the version in which the latest defect exists to the OS two generations before as well as one generation before.

1…クラスタシステム、10(10−1、10−2)…サーバ、11(11−1、11−2)…CPU、12(12−1、12−2)…メモリ、13(13−1、13−2)…記憶部、14(14−1、14−2)…通信部、100…制御部、101…サーバ切り替え制御部、102…OS切り替え制御部、103…ファイル更新制御部、131(131−1、131−2)…ブートローダ、132(132−1、132−2)…第1のサーバOS、133(133−1、133−2)…第2のサーバOS、134(134−1、134−2)…アプリケーション、135(135−1、135−2)…その他。
DESCRIPTION OF SYMBOLS 1 ... Cluster system, 10 (10-1, 10-2) ... Server, 11 (11-1, 11-2) ... CPU, 12 (12-1, 12-2) ... Memory, 13 (13-1, 13-2) ... storage unit, 14 (14-1, 14-2) ... communication unit, 100 ... control unit, 101 ... server switching control unit, 102 ... OS switching control unit, 103 ... file update control unit, 131 ( 131-1, 131-2) ... boot loader, 132 (132-1, 132-2) ... first server OS, 133 (133-1, 133-2) ... second server OS, 134 (134-1) , 134-2)... Application, 135 (135-1, 135-2).

Claims (5)

第1のサーバ及び第2のサーバを有し、前記第1のサーバ及び第2のサーバの内、いずれか一方のサーバが運用系として動作し、他方のサーバが待機系として待機するクラスタシステムにおいて、
前記各サーバは、
運用系と待機系を切り替える制御を行うサーバ切り替え制御部と、
第1のOS及び第2のOSを別々の記憶領域に保持する記憶部と、
前記第1のOS及び第2のOSの内、いずれか一方のOSをサーバとしての基本的な機能を発揮するための起動系のOSとして起動し、もう一方のOSを停止系のOSとして停止させる制御を行うOS切り替え制御部と、
前記第1のOS及び第2のOSの内、いずれか一方のOSのみを最新の状態にファイル更新し、他方のOSを一世代前の状態のまま保持するファイル更新制御部とを備え、
前記各サーバのOSのファイル更新を行う場合に、
現在待機系の第1のサーバ又は第2のサーバは、
前記OS切り替え制御部を用いて、一世代前の停止系のOSである前記第1のOS又は第2のOSを、起動系に切り替え、
前記ファイル更新制御部を用いて、予め取得した更新ファイルにより、起動系に切り替えた前記第1のOS又は第2のOSのファイル更新を行い、
前記第1のOS又は第2のOSのファイル更新後、前記サーバ切り替え制御部を用いて、前記第1のサーバ及び第2のサーバの運用系と待機系を切り替える制御を行い、
待機系に切り替わったもう一方の第1のサーバ又は第2のサーバは、切り替え前に待機系であった第1のサーバ又は第2のサーバと同様の手順により、OSのファイル更新を行う
ことを特徴とするクラスタシステム。
In a cluster system having a first server and a second server, one of the first server and the second server operating as an active system and the other server standing by as a standby system ,
Each of the servers
A server switching control unit that performs control to switch between the active system and the standby system;
A storage unit for holding the first OS and the second OS in separate storage areas;
Either one of the first OS and the second OS is started as a booting OS for performing a basic function as a server, and the other OS is stopped as a stopping OS. An OS switching control unit for performing control,
A file update control unit that updates the file of only one of the first OS and the second OS to the latest state and holds the other OS in the state of the previous generation;
When updating the OS file of each server,
The first server or the second server of the current standby system
Using the OS switching control unit, the first OS or the second OS, which is a stop system OS one generation before, is switched to a boot system,
The file update control unit is used to update the file of the first OS or the second OS that has been switched to the boot system using an update file acquired in advance.
After updating the file of the first OS or the second OS, the server switching control unit is used to perform control to switch between the active system and the standby system of the first server and the second server,
The other first server or second server that has switched to the standby system updates the OS file in the same procedure as the first server or second server that was the standby system before switching. Feature cluster system.
前記各サーバのOSのファイル更新を行う場合に、
現在待機系の第1のサーバ又は第2のサーバは、
前記ファイル更新制御部を用いて、予め取得した更新ファイルにより、一世代前の停止系のOSである前記第1のOS又は第2のOSのファイル更新を行い、
前記OS切り替え制御部を用いて、ファイル更新した前記第1のOS又は第2のOSを、起動系に切り替える制御を行う
ことを特徴とする請求項1に記載のクラスタシステム。
When updating the OS file of each server,
The first server or the second server of the current standby system
Using the file update control unit, update the file of the first OS or the second OS, which is the OS of the previous stop system, with the update file acquired in advance,
2. The cluster system according to claim 1, wherein the OS switching control unit is used to perform control for switching the first OS or the second OS that has been updated to a boot system. 3.
前記各サーバは、ネットワークを介して、前記第1のOS又は第2のOSの更新ファイルを取得する通信部を有することを特徴とする請求項1又は2に記載のクラスタシステム。   The cluster system according to claim 1, wherein each of the servers includes a communication unit that acquires an update file of the first OS or the second OS via a network. 前記各サーバの起動系のOSに不具合が発見された場合には、
現在待機系の第1のサーバ又は第2のサーバは、
前記OS切り替え制御部を用いて、一世代前の停止系のOSである前記第1のOS又は第2のOSを、起動系に切り替え、
前記サーバ切り替え制御部を用いて、前記第1のサーバ及び第2のサーバの運用系と待機系を切り替える制御を行い、
待機系に切り替わったもう一方の第1のサーバ又は第2のサーバは、
前記OS切り替え制御部を用いて、一世代前の停止系のOSである前記第1のOS又は第2のOSを、起動系に切り替える
ことを特徴とする請求項1〜3のいずれかに記載のクラスタシステム。
If a problem is found in the boot OS of each server,
The first server or the second server of the current standby system
Using the OS switching control unit, the first OS or the second OS, which is a stop system OS one generation before, is switched to a boot system,
Using the server switching control unit, control to switch between the active system and the standby system of the first server and the second server,
The other first server or the second server switched to the standby system,
The first OS or the second OS, which is a stop system OS one generation before, is switched to a boot system using the OS switching control unit. Cluster system.
第1のOS及び第2のOSを別々の記憶領域に保持する記憶部を備える第1のサーバ及び第2のサーバを有し、前記第1のサーバ及び第2のサーバの内、いずれか一方のサーバが運用系として動作し、他方のサーバが待機系として待機するクラスタシステムを構成する各サーバに搭載されるコンピュータを、
運用系と待機系を切り替える制御を行うサーバ切り替え制御部と、
前記第1のOS及び第2のOSの内、いずれか一方のOSをサーバとしての基本的な機能を発揮するための起動系のOSとして起動し、もう一方のOSを停止系のOSとして停止させる制御を行うOS切り替え制御部と、
前記第1のOS及び第2のOSの内、いずれか一方のOSのみを最新の状態にファイル更新し、他方のOSを一世代前の状態のまま保持するファイル更新制御部として機能させ、
前記各サーバのOSのファイル更新を行う場合に、
現在待機系の第1のサーバ又は第2のサーバは、
前記OS切り替え制御部を用いて、一世代前の停止系のOSである前記第1のOS又は第2のOSを、起動系に切り替え、
前記ファイル更新制御部を用いて、予め取得した更新ファイルにより、起動系に切り替えた前記第1のOS又は第2のOSのファイル更新を行い、
前記第1のOS又は第2のOSのファイル更新後、前記サーバ切り替え制御部を用いて、前記第1のサーバ及び第2のサーバの運用系と待機系を切り替える制御を行い、
待機系に切り替わったもう一方の第1のサーバ又は第2のサーバは、切り替え前に待機系であった第1のサーバ又は第2のサーバと同様の手順により、OSのファイル更新を行う
ことを特徴とするサーバ制御プログラム。
1st server and 2nd server provided with the memory | storage part which hold | maintains 1st OS and 2nd OS in a separate storage area, and either one of said 1st server and 2nd server The computer installed in each server that constitutes the cluster system in which the server of the server operates as the active system and the other server stands by as the standby system,
A server switching control unit that performs control to switch between the active system and the standby system;
Either one of the first OS and the second OS is started as a booting OS for performing a basic function as a server, and the other OS is stopped as a stopping OS. An OS switching control unit for performing control,
Updating one of the first OS and the second OS to the latest state, and causing the other OS to function as a file update control unit that retains the previous generation state;
When updating the OS file of each server,
The first server or the second server of the current standby system
Using the OS switching control unit, the first OS or the second OS, which is a stop system OS one generation before, is switched to a boot system,
The file update control unit is used to update the file of the first OS or the second OS that has been switched to the boot system using an update file acquired in advance.
After updating the file of the first OS or the second OS, the server switching control unit is used to perform control to switch between the active system and the standby system of the first server and the second server,
The other first server or second server that has switched to the standby system updates the OS file in the same procedure as the first server or second server that was the standby system before switching. A server control program characterized.
JP2016148525A 2016-07-28 2016-07-28 Cluster system and server control program Active JP6702060B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016148525A JP6702060B2 (en) 2016-07-28 2016-07-28 Cluster system and server control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016148525A JP6702060B2 (en) 2016-07-28 2016-07-28 Cluster system and server control program

Publications (2)

Publication Number Publication Date
JP2018018328A true JP2018018328A (en) 2018-02-01
JP6702060B2 JP6702060B2 (en) 2020-05-27

Family

ID=61075321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016148525A Active JP6702060B2 (en) 2016-07-28 2016-07-28 Cluster system and server control program

Country Status (1)

Country Link
JP (1) JP6702060B2 (en)

Also Published As

Publication number Publication date
JP6702060B2 (en) 2020-05-27

Similar Documents

Publication Publication Date Title
US9471365B2 (en) Techniques for performing virtual machine software upgrades using virtual disk swapping
JP5113700B2 (en) Firmware update apparatus and method
US6681389B1 (en) Method for providing scaleable restart and backout of software upgrades for clustered computing
US8495609B2 (en) Methods, systems, and computer program products for taking a snapshot of installed software on a data processing system as part of a software update process
US8302091B2 (en) Installation of a bootable image for modifying the operational environment of a computing system
JP5984918B2 (en) Replaying the job at the second location of the service
JP4359609B2 (en) Computer system, system software update method, and first server device
JP5319685B2 (en) Software deployment in large networked systems
US20220350716A1 (en) System and method for booting servers in a distributed storage to improve fault tolerance
US20030005037A1 (en) Crash recovery system
US8347140B1 (en) Method and system for providing coordinated checkpointing to a group of independent computer applications
US10795688B2 (en) System and method for performing an image-based update
EP2817725B1 (en) Maintaining system firmware images remotely using a distribute file system protocol
US9846621B1 (en) Disaster recovery—multiple restore options and automatic management of restored computing devices
US6523103B2 (en) Disablement of a write filter stored on a write-protected partition
JP5683088B2 (en) Recovery system, recovery method, and backup control system
JP2008171241A (en) Backup device and restoration method
JP6702060B2 (en) Cluster system and server control program
KR102423056B1 (en) Method and system for swapping booting disk
JP2008217202A (en) Disk array device and firmware update method
US20230273799A1 (en) Storage system with boot volume rollback points
RU2751215C1 (en) Software deployment and management system and method for its work
US10185574B2 (en) Live imaging of a device
JP2009123082A (en) Information processor and method and program for restarting system
JP2012008640A (en) Firmware update method, information device, and firmware update system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200420

R150 Certificate of patent or registration of utility model

Ref document number: 6702060

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150